其他分享
首页 > 其他分享> > 【总结向】Curriculum Learning课程学习

【总结向】Curriculum Learning课程学习

作者:互联网

Curriculum Learning课程学习

课程学习 目录



论文速览

课程式学习(Curriculum Learning)

主张让模型先从容易的样本开始学习,并逐渐进阶到复杂的样本和知识。

意义:

课程Curriculum

Curriculum Learning会根据样本的难易程度,给不同难度的训练样本分配不同的权重。初始阶段,给简单样本的权重最高,随着训练过程的持续,较难样本的权重将会逐渐被调高。这样一个对样本进行权重动态分配的过程被论文称之为课程(Curriculum),课程初始阶段简易样本居多,课程末尾阶段样本难度增加。

实验

实验结论:仅用简单样本训练得到的SVM分类器所实现的分类错误率为16.3%,而用所有样本训练得到的SVM分类器错误率则有17.3%。

实验结论:按照样本简单程度由简单到复杂依次进行训练,可以在有限的迭代步数下能达到更好的性能

实验结论:先用简单的知识训练对模型的提高会有帮助,并且简单的知识学得越好(即switch epoch越大),则对模型最终的泛化性能越有利

实验结论:这种Curriculum Learning的策略在测试集上的错误率在学习过程的后阶段会超过不采用Curriculum策略的学习方法,说明Curriculum能让模型更快地达到更好的泛化能力。

数学解释

课程学习的主要思想:根据训练样本训练的难易程度,给不同难度的样本不同的权重,一开始给简单的样本最高权重,他们有着较高的概率,接着将较难训练的样本权重调高,最后样本权重统一化了,直接在目标训练集上训练。

背后的数学解释如下
在这里插入图片描述
对于一个优化问题 C λ C_\lambda Cλ​, λ \lambda λ参数反映了优化问题难易程度( 0 ≤ λ ≤ 1 0 \le \lambda \le 1 0≤λ≤1)

设z是一个随机变量,表示训练过程中的样本集(如有监督学习的一对(x, y)或多对)。设 P ( z ) P(z) P(z)为目标训练分布,模型最终应该学习出的一个映射函数。 W λ ( z ) W_\lambda(z) Wλ​(z)代表在第 λ \lambda λ步时,分配给样本z的权重。
那么,在第 λ \lambda λ步时例子z的训练样本分布值
Q λ ( z ) = W λ ( z ) P ( z ) Q_\lambda(z) = W_\lambda(z) P(z) Qλ​(z)=Wλ​(z)P(z)
且在第 λ = 1 \lambda=1 λ=1步时,即最后一步, W λ = 1 ( z ) = 1 W_{\lambda=1}(z)=1 Wλ=1​(z)=1代表了越往后训练时其权重越大, Q λ = 1 ( z ) = 1 Q_{\lambda=1}(z) =1 Qλ=1​(z)=1代表了该样本z全部加入到训练过程中

若训练时的样本分布 Q λ Q_\lambda Qλ​ 的熵和用于重新分配分布的权重 W λ ( z ) W_\lambda(z) Wλ​(z)是递增的,那么 Q λ Q_\lambda Qλ​ 就是一个课程,即满足以下两个条件:

一个简单的理解就是利用课程改变训练样本中的分布,一开始简单的样本数量很多,出现的概率大,随着λ增大,分布与原始数据集越来越接近,最终和原始数据一致。

最后给出很多人提出的原理解释:(课程学习有效的解释)

参考:

Curriculum learning

论文导读:机器学习之课程式学习(Curriculum Learning)

【论文精读】Curriculum Learning


标签:Curriculum,训练,样本,课程,Learning,lambda
来源: https://blog.51cto.com/u_15273918/2917734