首页 > TAG信息列表 > MAPPO

MAPPO学习笔记(1):从PPO算法开始

由于这段时间的学习内容涉及到MAPPO算法,并且我对MAPPO算法这种多智能体算法的信息交互机制不甚了解,于是写了这个系列的笔记,目的是巩固知识,并且进行一些粗浅又滑稽的总结。   1.PPO算法的介绍 1.1.PG算法 如果要分类的话,根据学习方法的不同,可以将强化学习分为Value-based方法、Pol