其他分享
首页 > 其他分享> > True(False) Positives (Negatives) 的理解记忆

True(False) Positives (Negatives) 的理解记忆

作者:互联网

一、True(False) Positives (Negatives) 的理解

Positives:observation 为 正样本;

Negatives:observation 为 负样本;

True:事实 与 observation 相符;

False:事实 与 observation 不符;

归根结底是我们如何定义 正样本(Positives),一定要结合具体的实际。一般来讲,模型要做的事情就是正样本。

二、举例

       现在我们有一个静态分析器,和一堆程序。静态分析器旨在检测出有bug的程序。能够检测出有bug的程序是静态分析器的成就。
所以在静态分析器这个问题中,有bug的程序是正样本,没有bug的程序是负样本。

好,请听题:

三、相关指标的定义

True Positive (真正, TP)被模型预测为正的正样本;

True Negative(真负 , TN)被模型预测为负的负样本 ;

False Positive (假正, FP)被模型预测为正的负样本;

False Negative(假负 , FN)被模型预测为负的正样本;

 

True Positive Rate(真正率 , TPR)或灵敏度(sensitivity) 
   TPR = TP /(TP + FN) 
   正样本预测结果数 / 正样本实际数

True Negative Rate(真负率 , TNR)或特指度(specificity) 
   TNR = TN /(TN + FP) 
   负样本预测结果数 / 负样本实际数 

False Positive Rate (假正率, FPR) 
   FPR = FP /(FP + TN) 
   被预测为正的负样本结果数 /负样本实际数 

False Negative Rate(假负率 , FNR) 
   FNR = FN /(TP + FN) 
   被预测为负的正样本结果数 / 正样本实际数

召回率和精度:

- 系统检索到的相关文档(A)

- 系统检索到的不相关文档(B)

- 相关但是系统没有检索到的文档(C)

- 不相关但是被系统检索到的文档(D)

 

直观的说,一个好的检索系统检索到的相关文档越多越好,不相关文档越少越好.

召回率和精度是衡量信息检索系统性能最重要的参数.

召回率R:用检索到相关文档数作为分子,所有相关文档总数作为分母,即 R=A/(A+C)

精度P 用检索到相关文档数作为分子,所有检索到的文档总数作为分母.即  P=A/(A+B).

 

转载自:

https://blog.csdn.net/chenglinben/article/details/94358258?utm_medium=distribute.pc_relevant.none-task-blog-title-2&spm=1001.2101.3001.4242

https://blog.csdn.net/luckydongbin/article/details/1548763?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control

标签:False,样本,程序,分析器,文档,Negatives,Positives,bug
来源: https://blog.csdn.net/u013766416/article/details/110684646