其他分享
首页 > 其他分享> > 强化深度学习(actor-critic)

强化深度学习(actor-critic)

作者:互联网

模型步骤:

 

 

神经网络Q梯度:

 

 神经网络Π:

 

标签:梯度,深度,神经网络,actor,critic,步骤
来源: https://www.cnblogs.com/cxhzy/p/15514749.html