编程语言
首页 > 编程语言> > 【人工智能导论:模型与算法】7.2.5 基于策略:策略梯度 | REINFORCE | Actor-Critic

【人工智能导论:模型与算法】7.2.5 基于策略:策略梯度 | REINFORCE | Actor-Critic

作者:互联网

 

标签:策略,导论,REINFORCE,Actor,7.2,Critic
来源: https://www.cnblogs.com/hbuwyg/p/15905904.html