周博磊

首页 > TAG信息列表 > 周博磊

强化学习笔记（周博磊）

# Lecture 1：概括与基础和 supervised learning 的区别： * 强化学习是Sequential data作为input，每次输入并不是独立同分布 * 没有ground truth, learner不会被告知什么action是正确的。需要不断去尝试 * Trail-and-error exploration（balance between explioration and exploita