其他分享
首页 > 其他分享> > 数据挖掘(Data Mining):基础导论

数据挖掘(Data Mining):基础导论

作者:互联网

目录

数据挖掘基础

定义

数据挖掘的特征

学科挑战

数据挖掘的五大任务

1. 聚类(Clustering)

2. 关系规则挖掘(Association Rule Mining)

3. 分类(Classification)

4. 回归(Regression)

5. 异常检测(Anomaly detection)

总结


数据挖掘基础

定义

数据挖掘涉及从数据中提取隐含的、以前未知的和潜在有用的信息(Frawley, 1991)。

数据挖掘的特征

学科挑战

数据挖掘延伸领域:

定向市场营销、欺诈检测、库存管理、个性化医疗、基因与疾病之间的关联等。

数据挖掘的五大任务

1. 聚类(Clustering)

给定一组对象,将它们分组,使一组中的对象彼此更相似,而不同组中的对象彼此不太相似。

应用 

2. 关系规则挖掘(Association Rule Mining)

给定一组记录,每个记录都包含来自给定集合的一定数量的项目,生成依赖规则,该规则将根据其他项目的出现来预测一个项目的出现。

应用

3. 分类(Classification)

给定由某些特征描述的对象集合并具有类属性,对新的对象赋予对应的类属性。

应用

4. 回归(Regression)

根据其他变量的值预测给定连续值变量的值。

应用

5. 异常检测(Anomaly detection)

识别特征与其余数据显着不同的观测值。

应用

总结

  1. 监督方法(未涵盖,但可在项目中使用):分类,回归。
  2. 无监督方法:聚类,关联规则挖掘,异常检测。
  3. 上面的分类法是对现实的简化。有的方法介于两者之间,可以使用一类中的方法来解决另一类中的部分问题。
  4. 监督方法和非监督方法也分别称为预测和描述。

 

 

 

标签:Mining,预测,数据,检测,给定,聚类,数据挖掘,Data
来源: https://blog.csdn.net/Night__owl/article/details/120552991