编程语言
首页 > 编程语言> > OPTICS聚类算法原理

OPTICS聚类算法原理

作者:互联网

OPTICS聚类算法原理

基础

OPTICS聚类算法是基于密度的聚类算法,全称是Ordering points to identify the clustering structure,目标是将空间中的数据按照密度分布进行聚类,其思想和DBSCAN非常类似,但是和DBSCAN不同的是,OPTICS算法可以获得不同密度的聚类,直接说就是经过OPTICS算法的处理,理论上可以获得任意密度的聚类。因为OPTICS算法输出的是样本的一个有序队列,从这个队列里面可以获得任意密度的聚类。

定义

OPTICS算法的基础有两点,

一个是输入的参数,包括:半径 ε ,和最少点数 MinPts 。

另一个是相关概念的定义:
核心点的定义,如果一个点的半径内包含点的数量不少于最少点数,则该点为核心点,数学描述即

Nε(P)>=MinPts

在这个基础上可以引出核心距离的定义,即对于核心点,距离其第 MinPtsth 近的点与之的距离

 

coreDist(P)={UNDIFED, MinPtsth Distance in N(P),if N(P)<=MinPtselse

可达距离,对于核心点P,O到P的可达距离定义为O到P的距离或者P的核心距离,即公式

 

reachDist(O,P)={UNDIFED, max(coreDist(P), dist(O,P)),if N(P)<=MinPtselse

O到P直接密度可达,即P为核心点,且P到O的距离小于半径。

算法

OPTICS算法的难点在于维护核心点的直接可达点的有序列表。算法的计算过程如下:

输出结果

给定半径 ε ,和最少点数 MinPts ,就可以输出所有的聚类。

计算过程为:

给定结果队列

转载自:http://ddrv.cn/a/66368?unapproved=169375&moderation-hash=d65a76d583bc337cf8ee514ce3049cf6#comment-169375

标签:队列,核心,距离,算法,该点,聚类,OPTICS
来源: https://www.cnblogs.com/tttzqf/p/12890292.html