其他分享
首页 > 其他分享> > 0.机器学习

0.机器学习

作者:互联网

1.交叉验证测量准确率

在模型训练中,若使用全部的训练数据进行一次训练,可能会出现预测精度非常高的情况,此时应警惕出现了过拟合。因为在对模型效果进行评估时,可以考虑使用K折交叉验证。

采用分层抽样的方法将数据集分为k份,其中k-1份用于训练,剩余1份用于测试,共训练k次,使用k个测试结果的均值。

2.混淆矩阵

交叉验证方法虽然通过求均值的方式避免了因为数据过拟合产生的准确率虚高的假象,但对于一个有偏数据集而言(比如90%数据都是0,只有10%数据是1,此时若预测结果恒为1,仍有90%的准确率但模型没有意义),因此考虑引入混淆矩阵来多维度衡量模型。

 矩阵的行表示真实值,列表示预测值。对于一个完美的分类器而言,只会有True的结果,所以只会在对角线上有值。

根据混淆矩阵可以定义精度和召回率来综合衡量模型

$精度=\frac{TP}{TP+FP}$

标签:准确率,机器,训练,混淆,模型,矩阵,学习,数据
来源: https://www.cnblogs.com/maysblog/p/15853732.html