其他分享
首页 > 其他分享> > lec-1-Deep Reinforcement Learning, Decision Making, and Control

lec-1-Deep Reinforcement Learning, Decision Making, and Control

作者:互联网

What is RL

基于学习的决策的数学形式
从经验中学习决策和控制的方法

Why should we study this now

我们还需要解决哪些其他问题才能实现现实世界的顺序决策?

1.如何学习

Learning from reward

基本的强化学习处理的是最大化奖励,这并不是影响顺序决策的唯一问题!

更高级的方法.

1.从示例example中学习奖励函数(反向强化学习)
2.领域间的知识转移(迁移学习、元学习)
3.学习预测并利用预测来行动

2.other forms of supervision

①Learning from demonstrations(从演示中学习)

②Learning from observing the world(从观察世界中学习)

③Learning from other tasks(从其他任务中学习)

为什么需要DRL

深度Deep可以处理复杂的感官输入,也可以计算非常复杂的函数
强化学习RL可以选择复杂的行为

DRL目前取得well的方面

挑战

标签:Control,lec,Decision,学习,奖励,Learning,深度,RL,强化
来源: https://www.cnblogs.com/yunshalee/p/16244858.html