MCTS

首页 > TAG信息列表 > MCTS

蒙特卡洛树搜索 MCTS 入门

参考文献：全称 Monte Carlo Tree Search，是一种人工智能问题中做出最优决策的方法，一般是在组合博弈中的行动（move）规划形式。它结合了随机模拟的一般性和树搜索的准确性。 MCTS 受到快速关注主要是由计算机围棋程序的成功以及其潜在的在众多难题上的应用所致。超越博弈游戏

Neural Architecture Search using Deep Neural Networks and Monte Carlo Tree Search

发表时间：2019（AAAI2020）文章要点：一篇做NAS的文章，主要想法就是用MCTS来做NAS，相对random，Q-learning，Hill Climbing这些更能平衡探索与利用。主要方法是把NAS的问题定义好，比如动作是什么，就是每次搭建神经网络这一层用什么结构，什么参数。状态是什么，就是当前建成网络的信息。这些东西定

Learning and Planning in Complex Action Spaces

发表时间：2021 文章要点：文章想说，在动作空间很大或者连续的时候，想要枚举所有动作来做MCTS是不现实的。作者提出了sample-based policy iteration framework，通过采用的方式来做MCTS（Sampled MuZero）。大概思路就是说，在MCTS里面扩展动作的时候，并不枚举所有动作，而是取一个动作子集来作为