聚类--KMeans
作者:互联网
1、什么是K均值聚类
-
k均值聚类是最简单也是最常用的聚类算法之一。它试图找到代表数据特定区域的簇中心(Cluster Center)
-
K-means算法过程
1.随机布置K个特征空间内的点作为初始的聚类中心
2.对于根据每个数据的特征向量,从K个聚类中心中寻找距离最近的一个,并且把该数据标记为从属这个聚类中心
3.在所有的数据都被标记过聚类中心之后,根据这些数据新分配的类簇,重新对K个聚类中心做计算
4.如果一轮下来,所有的数据点从属的聚类中心与上一次的分配的类簇没有变化,那么可以迭代停止,否者回到第2步继续循环mglearn.plots.plot_kmeans_algorithm()
mglearn.plots.plot_kmeans_boundaries()
2、KMeans应用于模拟数据
#获取数据集
X, y = make_blobs(n_samples=100,n_features=2,random_state=42)
#Kmeans模型实例化
kmeans = KMeans(n_clusters=3,random_state=0)
kmeans=kmeans.fit(X)
#打印kmeans.labels_属性
print("labels:{}".format(kmeans.labels_))
标签:axes,people,--,random,kmeans,KMeans,state,聚类 来源: https://www.cnblogs.com/caolanying/p/16225057.html