True(False) Positives (Negatives) 的理解记忆
作者:互联网
一、True(False) Positives (Negatives) 的理解
Positives:observation 为 正样本;
Negatives:observation 为 负样本;
True:事实 与 observation 相符;
False:事实 与 observation 不符;
归根结底是我们如何定义 正样本(Positives),一定要结合具体的实际。一般来讲,模型要做的事情就是正样本。
二、举例
现在我们有一个静态分析器,和一堆程序。静态分析器旨在检测出有bug的程序。能够检测出有bug的程序是静态分析器的成就。
所以在静态分析器这个问题中,有bug的程序是正样本,没有bug的程序是负样本。
好,请听题:
-
一个深度静态分析器不会产生false negatives,什么意思?
该静态分析器没有报警的程序一定是没有bug的程序。言外之意,报警了的程序也有可能是没有bug的。“宁可错杀一千,不会放过一个,所有有bug的程序肯定都被我检测出来了。我没有报警的肯定是一点bug都没有的程序”这样的分析器称为sound analysis tool,(深度分析工具),深挖,坚决不放过任何一个有bug的程序。
-
一个静态分析器不会产生false positives, 什么意思?
该分析器报警的程序一定是有bug的程序。言外之意,该分析器没有报警的程序可能有bug。“宁可放过一个,不要错杀一个,所有我报警的程序肯定是有bug的,我从来不会冤枉好人”这样的分析器称之为complete analysis tool(广度分析工具,照顾到最广大人民的根本利益,一定不会对人才下手。)
三、相关指标的定义
True Positive (真正, TP)被模型预测为正的正样本;
True Negative(真负 , TN)被模型预测为负的负样本 ;
False Positive (假正, FP)被模型预测为正的负样本;
False Negative(假负 , FN)被模型预测为负的正样本;
True Positive Rate(真正率 , TPR)或灵敏度(sensitivity)
TPR = TP /(TP + FN)
正样本预测结果数 / 正样本实际数
True Negative Rate(真负率 , TNR)或特指度(specificity)
TNR = TN /(TN + FP)
负样本预测结果数 / 负样本实际数
False Positive Rate (假正率, FPR)
FPR = FP /(FP + TN)
被预测为正的负样本结果数 /负样本实际数
False Negative Rate(假负率 , FNR)
FNR = FN /(TP + FN)
被预测为负的正样本结果数 / 正样本实际数
召回率和精度:
- 系统检索到的相关文档(A)
- 系统检索到的不相关文档(B)
- 相关但是系统没有检索到的文档(C)
- 不相关但是被系统检索到的文档(D)
直观的说,一个好的检索系统检索到的相关文档越多越好,不相关文档越少越好.
召回率和精度是衡量信息检索系统性能最重要的参数.
召回率R:用检索到相关文档数作为分子,所有相关文档总数作为分母,即 R=A/(A+C)
精度P: 用检索到相关文档数作为分子,所有检索到的文档总数作为分母.即 P=A/(A+B).
转载自:
标签:False,样本,程序,分析器,文档,Negatives,Positives,bug 来源: https://blog.csdn.net/u013766416/article/details/110684646