首页 > 其他分享> > 百度PARL初探

百度PARL初探

2020-06-25 09:57:03 作者：互联网

强化学习是近些年最火，最接近“真实情况”的深度学习方式。对比其他学习注重的是决策问题，通过智能体与周边环境的交互学会了如何能获得更多的奖励。

百度的paddle团队开源了强化学习PARL项目，该项目有几大特性：

这些特性是在实际开发中真实需要的，PARL库内置了很多强化学习算法，可以对轻量级问题进行很好的测试，找寻basseline。

PARL的多线程也是令人兴奋的特性，这可以使python原有的多线程起到真正的作用。

附录：课表

一、强化学习(RL)初印象

二、基于表格型方法求解RL

三、基于神经网络方法求解RL

四、基于策略梯度求解RL

五、连续动作空间上求解RL

标签：PARL,学习,课后,初探,RL,强化,多线程,百度
来源： https://www.cnblogs.com/MyBlog-MrY/p/13190594.html