迁移学习专栏——开篇:迁移学习发展分析
作者:互联网
一、迁移学习发文趋势
图1可以看出,迁移学习、深度学习、图像识别、卷积神经网络和深度迁移学习都是在2016年开始受到学者们的广大关注,发文量也开始大幅度上涨。
二、 迁移学习概念
迁移学习是指利用旧知识来学习新知识,主要目标是将已经学会的知识很快地迁移到一个新的领域中。举例说明:一个程序员在掌握了C语言的前提下,能够更快地理解和学习 Python 语言。迁移学习主要解决的一个问题是小样本问题,基于模型微调的方法在源数据集和目标数据集分布大致相同时有效,分布不相似时会导致过拟合问题。迁移学习则解决了这个问题,迁移学习只需要源领域和目标领域存在一定关联,使得在源领域和数据中学习到的知识和特征能够帮助在目标领域训练分类模型,从而实现知识在不同领域之间的迁移。一般来说,源领域和目标领域之间的关联性越强,那么迁移学习的效果就会越好。
三、迁移学习实现方法
从小样本分类的流程来看,迁移学习是在特征提取阶段实现的,如图1所示。
图1 迁移学习示意图
具体的迁移方式可以分为基于特征的迁移、基于共享参数的迁移和基于关系的迁移。
如果将基类作为源域数据,将新类作为目标域数据, 以基类数据到新类数据的知识迁移为例,基于特征的迁移是找出基类数据和新类数据之间共同的特征,通过特征变换的方式将基类数据的知识进行迁移, 用于新类数据分类。该方法存在的难点在于:一是寻找基类数据和新类数据的共同特征,二是采用何种方式对特征进行迁移;基于关系的迁移是建立基类数据和新类数据之间相关知识的映射, 通过这种关系映射来进行学习。该方法的难点在于:一是如何确定映射关系, 二是如何建立映射关系;基于共享参数的迁移需要找到基于基类数据模型和基于新类数据模型之间的共享参数或者相同的先验分布, 利用这些参数或者先验分布进行知识迁移。该方法的难点在于如何寻找共享参数和确定先验分布。在寻找源域数据和目标域数据的共同特征、知识映射关系以及模型的共享参数和先验分布时,重要的是搭建能够有效提取图像特征的网络结构以及适用的知识迁移方式。需要建立可持续学习的模型时, 小样本迁移学习不仅需要保证模型对目标域数据有效, 而且还要确保模型在源域数据和目标域数据都有不错的分类效果。
3.1 基于特征的迁移学习
3.2 基于关系的迁移
3.3 基于共享参数的迁移
标签:基于,开篇,新类,学习,基类,迁移,数据 来源: https://blog.csdn.net/m0_61363749/article/details/120948606