首页 > TAG信息列表 > improvement
生活小细节
社会科学 v.s. 工程类科学 怎么差距就这么明显呢?社会科学(经济,社科,社会)就是回归分析,但是重点在于分析mechanism and heterogenrity, influcting factors, differences,(analysis phenomenons, policy impliation, limitation) 工程类:pay attention to methodology? improvementReinforcement Learning as One Big Sequence Modeling Problem
发表时间:2021 文章要点:这篇文章把RL看作序列建模问题(sequence modeling problem),直接用transformer来拟合整个序列 (reats states, actions, and rewards as simply a stream of data,其实还拟合了reward-to-to return),拟合完了后就直接用这个transformer来做预测,中间还用了beam seaDecision Transformer: Reinforcement Learning via Sequence Modeling
发表时间:2021 文章要点:这篇文章提出了一个Decision Transformer的模型,在offline RL的设定下,不直接去拟合数据,不需要做policy improvement,就可以达到甚至超过offline RL baseline。具体做法很简单,就是用transformer去拟合数据,数据结构如下 这里的R不是reward,是return,具体来说应该YOLOv3: An Incremental Improvement
摘要 在论文YOLO v3中作者借鉴了很多好的方案融合到了YOLO里面,并且分享了很多经验(尝试),从结果来说结果也是不错的在保持速度优势的前提下,提升了预测精度,尤其是加强了对小物体的识别能力。 论文地址:YOLOv3: An Incremental Improvement 网络结构 backbone:Darknet-53,如图1。