编程语言
首页 > 编程语言> > 构建第一个模型:KNN算法(Iris_dataset)

构建第一个模型:KNN算法(Iris_dataset)

作者:互联网

利用鸢尾花数据集完成一个简单的机器学习应用~万丈高楼平地起,虽然很基础,但是还是跟着书敲了一遍代码。

一、模型构建流程

1、获取数据

from sklearn.datasets import load_iris
iris_dataset = load_iris()

2、数据预处理

3、特征工程

#划分训练集,测试集
X_train,X_test,y_trian,y_test = train_test_split(irs_dataset['data'],irs_dataset['target'],random_state = 0)

#利用pd,画散点图,观察数据是否有异常值
irs_dataframe = pd.DataFrame(X_train,columns=irs_dataset.feature_names)
grr = pd.plotting.scatter_matrix(irs_dataframe,c=y_trian,figsize=(8,8),marker='o',
                                hist_kwds={'bins':20},s=60,alpha=.8)

4、(机器学习)构建模型

#建立模型:KNN算法

knn = KNeighborsClassifier(n_neighbors=2)  #把k值设为2
knn.fit(X_train, y_trian) #基于训练集构建模型,两个参数都是Numpy 数组

5、模型评估

#评估模型
y_pred = knn.predict(X_test)
print(y_pred)
print("precision={:.2f}".format(np.mean(y_pred==y_test)))
print(knn.score(X_test, y_test))

二、遇到的问题

三、参考文献

《python机器学习基础教程》--【德】Adreas C.Muller

标签:KNN,Iris,pandas,irs,dataset,test,数据,scatter
来源: https://www.cnblogs.com/caolanying/p/16125316.html