编程语言
首页 > 编程语言> > 数据挖掘十大算法--K-均值聚类算法

数据挖掘十大算法--K-均值聚类算法

作者:互联网

一、相异度计算 

在正式讨论聚类前,我们要先弄清楚一个问题:怎样定量计算两个可比較元素间的相异度。用通俗的话说。相异度就是两个东西区别有多大。比如人类与章鱼的相异度明显大于人类与黑猩猩的相异度,这是能我们直观感受到的。

可是,计算机没有这样的直观感受能力,我们必须对相异度在数学上进行定量定义。
      设 ,当中X。Y是两个元素项,各自具有n个可度量特征属性,那么X和Y的相异度定义为:

标签:定量,定义,相异,算法,聚类,数据挖掘,直观
来源: https://www.cnblogs.com/mqxnongmin/p/10489049.html