首页 > TAG信息列表 > Dueling

强化学习-学习笔记12 | Dueling Network

这是价值学习高级技巧第三篇,前两篇主要是针对 TD 算法的改进,而Dueling Network 对 DQN 的结构进行改进,能够大幅度改进DQN的效果。 Dueling Network 的应用范围不限于 DQN,本文只介绍其在 DQN上的应用。 12. Dueling Network 12.1 优势函数 Advantage Function. 回顾一些基础概念