improvement

首页 > TAG信息列表 > improvement

生活小细节

社会科学 v.s. 工程类科学怎么差距就这么明显呢？社会科学（经济，社科，社会）就是回归分析，但是重点在于分析mechanism and heterogenrity, influcting factors, differences,(analysis phenomenons, policy impliation, limitation) 工程类：pay attention to methodology? improvement

Reinforcement Learning as One Big Sequence Modeling Problem

发表时间：2021 文章要点：这篇文章把RL看作序列建模问题（sequence modeling problem），直接用transformer来拟合整个序列（reats states, actions, and rewards as simply a stream of data，其实还拟合了reward-to-to return），拟合完了后就直接用这个transformer来做预测，中间还用了beam sea

Decision Transformer: Reinforcement Learning via Sequence Modeling

发表时间：2021 文章要点：这篇文章提出了一个Decision Transformer的模型，在offline RL的设定下，不直接去拟合数据，不需要做policy improvement，就可以达到甚至超过offline RL baseline。具体做法很简单，就是用transformer去拟合数据，数据结构如下这里的R不是reward，是return，具体来说应该

YOLOv3: An Incremental Improvement

摘要在论文YOLO v3中作者借鉴了很多好的方案融合到了YOLO里面，并且分享了很多经验（尝试），从结果来说结果也是不错的在保持速度优势的前提下，提升了预测精度，尤其是加强了对小物体的识别能力。论文地址：YOLOv3: An Incremental Improvement 网络结构 backbone：Darknet-53，如图1。