其他分享
首页 > 其他分享> > 机器学习概念

机器学习概念

作者:互联网

正则化平滑

在这里插入图片描述

相当于对模型参数施加惩罚,压缩了参数的范围,限制了模型的复杂度,从而有助于缓解模型过拟合问题

误差、偏差、方差

在这里插入图片描述
在这里插入图片描述
准:bias描述的是根据样本拟合出的模型的输出预测结果的期望与样本真实结果的差距,简单讲,就是在样本上拟合的好不好。要想在bias上表现好,low bias,就得复杂化模型,增加模型的参数,但这样容易过拟合 (overfitting),过拟合对应上图是high variance,点很分散。low bias对应就是点都打在靶心附近,所以瞄的是准的,但手不一定稳

确:varience描述的是样本上训练出来的模型在测试集上的表现,要想在variance上表现好,low varience,就要简化模型,减少模型的参数,但这样容易欠拟合(unfitting),欠拟合对应上图是high bias,点偏离中心。low variance对应就是点都打的很集中,但不一定是靶心附近,手很稳,但是瞄的不准

模型方差较高时,增加样本会有帮助
模型偏差较高时,增加样本帮助不大

在这里插入图片描述
偏差很大,代表欠拟合;方差很大,代表过拟合

在这里插入图片描述

Accuracy(精度)、Precision(精准度)和Recall(召回率)

分类模型评估中常见的性能度量指标(performance measure):Accuracy(精度)、Precision(精准度)和Recall(召回率)

Precision(精准度)和Recall(召回率),它们仅适用于二分类问题。

第一个字母表示预测的对不对、第二个字母表示预测的是正、负

在这里插入图片描述

一般来说,Precision越高时,Recall往往越低。

以Recall作为横轴,Precision作为纵轴可以得到Precision-Recall曲线图,简称为P-R图

在这里插入图片描述

F1就是这两者的调和均值
在这里插入图片描述

ROC曲线 AUC面积

TPR 从真实情况出发 就是recall

在这里插入图片描述

在这里插入图片描述

生成 判别

判别模型:直接预测Y,大多数模型都是;直面预测,学习准确率更高,可以对数据定义、抽象使用特征,因此可以简化学习问题。

标签:正例,分类器,机器,Recall,模型,Precision,学习,概念,拟合
来源: https://blog.csdn.net/weixin_45880764/article/details/118072106