机器学习—最近邻算法
作者:互联网
kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数数以一个类型别,则该样本也属于这个类别,并具有该类别上样本的特征。该方法在确定分类决策上,只依据最近邻的一个或者几个样本的类别来决定待分样本所属的类别。
1.鸢尾花分类问题
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
iris=load_iris()
data_tr,data_te,label_tr,label_te=train_test_split(iris.data,iris.target,test_size=0.2) #拆分专家样本集
model=KNeighborsClassifier(n_neighbors=50) #构建模型
model.fit(data_tr,label_tr) #模型训练
pre=model.predict(data_te) #模型预测
acc=model.score(data_te,label_te) #模型在测试集上的精度
print(acc)
2.参考文章
【创作不易,望点赞收藏,若有疑问,请留言,谢谢】
标签:iris,机器,样本,tr,学习,算法,model,te,data 来源: https://www.cnblogs.com/dongxuelove/p/16434217.html