其他分享
首页 > 其他分享> > 从RL角度看MDP过程

从RL角度看MDP过程

作者:互联网

Markov Reward Processes

任何部分可观测问题都可以转化为马尔可夫过程 MDP化

Reward

Action空间

Best policy

标签:概率,policy,tuple,角度看,state,RL,MDP,action
来源: https://blog.csdn.net/weixin_43977768/article/details/100667266