首页 > TAG信息列表 > Coordinated
Coordinated Proximal Policy Optimization (CoPPO)
Coordinated Proximal Policy Optimization (CoPPO) 2111.04051 摘要: 提出了CoPPO。关键想法是,在对不同智能体进行策略更新时,对步长进行coordinated adaptation。证明了策略提升的单调性。基于一些近似,推导出了简化的优化目标。这样的一个优化目标,会实现智能体之间的Coordinated Proximal Policy Optimization (CoPPO)
Coordinated Proximal Policy Optimization (CoPPO) 2111.04051 摘要: 提出了CoPPO。关键想法是,在对不同智能体进行策略更新时,对步长进行coordinated adaptation。证明了策略提升的单调性。基于一些近似,推导出了简化的优化目标。这样的一个优化目标,会实现智能体之间的