其他分享
首页 > 其他分享> > 数据挖掘之混淆矩阵简单介绍

数据挖掘之混淆矩阵简单介绍

作者:互联网

混淆矩阵简单介绍

介绍

混淆矩阵:可以理解为就是一张表格,用n行n列的矩阵形式来表示。每一列代表了预测类别,每一行代表了数据的真实归属类别。

真阳性(True Positive,TP):样本的真实类别是正例,并且模型预测的结果也是正例
真阴性(True Negative,TN):样本的真实类别是负例,并且模型将其预测成为负例
假阳性(False Positive,FP):样本的真实类别是负例,但是模型将其预测成为正例
假阴性(False Negative,FN):样本的真实类别是正例,但是模型将其预测成为负例

实例

例如: 有66只动物,其中13只猫,53只不是猫,分类器判断时这13只猫只有10只预测对了,其他动物也只预测对了45只。
在这里插入图片描述在这里插入图片描述
Accuracy:在总共66个动物中,我们一共预测对了10 + 45=55个样本,所以准确率(Accuracy)=55/66 = 83.33%。
Precision(猫)= 10/13 = 76.9%
Recall(猫)= 10/18 = 55.6%
Specificity(猫)= 45/48 = 93.8%
F1分数(F1 Score),F1分数( Score),又称平衡F1分数(balanced F Score),它被定义为精确率和召回率的调和平均数。
F1分数( Score),又称平衡F1分数(balanced F Score),它被定义为精确率和召回率的调和平均数。
在这里插入图片描述
除了F1分数之外, F2 分数和F0.5 分数在统计学中也得到大量的应用。
在这里插入图片描述
对猫而言,
F1-Score=(2 * 0.769 * 0.556)/( 0.769 + 0.556) = 64.54%

标签:分数,混淆,F1,矩阵,类别,Score,负例,正例,数据挖掘
来源: https://blog.csdn.net/weixin_43752106/article/details/112314839