其他分享
首页 > 其他分享> > Hinton平滑标签

Hinton平滑标签

作者:互联网

1.提要

  1. soft target:是通过计算hard target 的加权平均和标签的均匀分布得到的,而这一步骤称为标签平滑。
  2. 作用:模型过拟合,且在很多最新的模型中都得到了应用,比如图片分类、机器翻译和语音识别
  3. 论文目的:标签平滑不仅能够提升模型的泛化能力,还能够提升模型的修正能力,并进一步提高模型的集束搜索能力。但在本文的实验中还发现,如果在teacher model 中进行标签平滑,对student model 的知识蒸馏效果会出现下降

2.论文介绍

标签平滑技术在图片分类、语音识别、机器翻译等多个领域的深度学习模型中都取得了很好的效果

文章主要有以下工作:

        基于对网络倒数第二层激活情况的线性映射提出了一个全新的可视化方法;

数学描述:

hard target 

 

soft target

 

 

使用参数 a 对网络进行标签平滑后的神经网络,其正确和错误分类的 logit 值之间的差会增大,改变程度与 a 的值相关

标签平滑技术在提升模型效果的同时,也可能对知识蒸馏带来负面的影响。

 

 

标签:蒸馏,标签,平滑,机器翻译,Hinton,模型,target
来源: https://blog.csdn.net/wangyi4422/article/details/100504206