其他分享
首页 > 其他分享> > 【2021.07】datawhale组队学习李宏毅 总结

【2021.07】datawhale组队学习李宏毅 总结

作者:互联网

文章目录


对这一期的组队学习内容进行总结梳理。

01机器学习介绍

【2021.07】datawhale组队学习李宏毅task01
这一节关于机器学习的介绍可以直接用下面这张图概括。
在这里插入图片描述
蓝色的方块指的是学习的场景,红色的指的是你的task,你要解决的问题,不同的task又可以使用不同的method来完成。

02 回归

【2021.07】datawhale组队学习李宏毅task02
以宝可梦cp值预测为例,分别介绍了单个特征和多个特征的模型假设,模型评价集模型优化。
在这里插入图片描述

step1:model

在这里插入图片描述

step2:评价一个模型的好坏

在这里插入图片描述
在这里插入图片描述

step3:使用gradient descent进行优化

计算方法:

1.随机选取一个w;
2.计算w=w0时L对w的微分,也就是当前的斜率;
如果斜率为负,则说明该点左侧的loss值更高,需要增加w的值;
3.根据学习率移动;
如何确定移动多少步长?1.微分的大小,2.learning rate。

优化

更多的input & 正则化

03 误差

03、04、05的内容都在【2021.07】datawhale组队学习李宏毅task03
误差的主要来源有bias和variance
在这里插入图片描述

估测方差和偏差

在这里插入图片描述
在这里插入图片描述

偏差 v.s. 方差

04 训练集划分

交叉验证

将验证集分为training set(训练集)和validation set(验证集)两个部分,用训练集来构造每个model最好的function,使用验证集来选择model
在这里插入图片描述

N-fold cross validation

将训练集分成N份,比如分成3份。一次使用一份当作验证集,另外两份当作训练集,分别计算每次的average error,得到model1最佳,再用完整的training data重新训练参数。
在这里插入图片描述

05 gradient descent

这里是对之前介绍的内容进一步的扩展,主要包括一些自动调参的方法
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

06 深度学习

深度学习也可以分为三个步骤:

step1:神经网络

在这里插入图片描述

step2:模型评估

在这里插入图片描述
我们仍然用损失函数来反应模型的好坏,对于神经网络,我们采用交叉熵(cross entropy)函数来对y和 y ^ \hat y y^​的损失进行计算,接下来我们就是调整参数,让交叉熵越小越好。

step3:选择最优函数

在这里插入图片描述

07

【2021.07】datawhale组队学习李宏毅task05
这一部分的内容还没有补完,先空着。

08 卷积神经网络

CNN特征

CNN架构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

标签:function,2021.07,训练,李宏毅,模型,datawhale,学习,组队,神经网络
来源: https://blog.csdn.net/Mounvo/article/details/119088431