其他分享
首页 > 其他分享> > Outlier Analysis(part1)

Outlier Analysis(part1)

作者:互联网

学习笔记,仅供参考,有错必纠
机翻,建议看英文原著



An Introduction to Outlier Analysis


Introduction


离群点是与剩余数据显著不同的数据点。霍金斯定义[249]一个异常值如下:“离群值是一种与其他观察值偏差太大的观察值,以至于让人怀疑它是由不同的机制产生的。”

在数据挖掘和统计文献中,异常值也被称为异常、不协调、异常或异常。在大多数应用程序中,数据是由一个或多个生成过程创建的,这些流程可以反映系统中的活动或收集到的关于实体的观察结果。当生成过程的行为异常时,它会导致异常值的产生。因此,离群值通常包含有关影响数据生成过程的系统和实体的异常特征的有用信息。对这些不寻常特征的识别提供了有用的应用特定的见解。

举例如下:

标签:信用卡,Outlier,数据,Analysis,part1,离群,异常
来源: https://blog.csdn.net/m0_37422217/article/details/115815748