首页 > 其他分享> > 03 什么是预训练（Transformer 前奏）

03 什么是预训练（Transformer 前奏）

2022-07-12 16:37:21 作者：互联网

预训练有什么用

机器学习：偏数学（《统计学习方法》-李航）

深度学习（人工智能）的项目：大数据支持（主流）

我们很多项目没有大数据支持（小数据）

猫狗分类任务：100 张猫和狗的图片 --》给你一张图片，分出是猫还是狗（无法解决的一个问题，精度很低）

100000 张鹅和鸭的图片（已知，有人做过的，通过这10w 张图片做了一个模型 A）

有人发现，浅层通用的（横竖撇捺）

我通过10w个鹅和鸭训练了一个模型 A，100 层的 CNN

任务 B：100 张猫和狗的图片，分类 --》训练处 100层的 CNN，不可能实现的

尝试使用 A 的前 50 层，使用 100 层去完成任务 B

通过一个已经训练好的模型 A，去完成一个小数据量的任务 B（使用了模型 A 的浅层参数）

任务 A 和任务 B 极其相似

fairseq 、transformers 库

一个任务 A，一个任务 B，两者极其相似，任务 A 已经训练处一个模型 A，使用模型 A 的浅层参数去训练任务 B，得到模型 B，1.

标签：03,Transformer,训练,前奏,浅层,任务,100,com,模型
来源： https://www.cnblogs.com/nickchen121/p/16470574.html