Python机器学习(基础篇---监督学习(支持向量机))
作者:互联网
支持向量机(分类)
支持向量机分类器根据训练样本的分布,搜索所有可能的线性分类器中最佳的那个。我们会发现决定其直线位置的样本并不是所有训练数据,而是其中的两个空间间隔最小的两个不同类别的数据点,而我们把这种可以用来真正帮助决策最优线性分类模型的数据点叫做‘支持向量’。逻辑斯蒂回归模型在训练过程中由于考虑了所有训练样本对参数的影响,因此不一定获得最佳分类器。
代码1:手写体数据读取代码样例
====================》
#从sklearn.datasets里导入手写体数字加载器from sklearn.datasets import load_digits
#从通过数据加载器获得手写体数字的数码图像数据并存储在digits变量中。
digits=load_digits()
#检视数据规模和特征维度
print(digits.data.shape)
# (1797, 64)
#该书写体数字的图像数据共有1797条,并且每幅图片是由8x8=64的像素矩阵表示。
#手写字体数据分割代码
from sklearn.cross_validation import train_test_split
#随机采样25%的数据用于测试,剩下的75%用于构建训练集合
X_train,X_test,y_train,y_test=train_test_split(digits.data,digits.target,test_size=0.25,random_state=33)
print(y_train.shape)#(1347,)
print(y_test.shape)#(450,)
#使用支持向量机(分类)对手写数字图像进行识别
#从sklearn.preprocessing里导入StandardScaler数据标准化模块
from sklearn.preprocessing import StandardScaler
#从sklearn.svm导入基于线性假设的支持向量机分类LinearSVC
from sklearn.svm import LinearSVC
#标准化数据,保证每个维度的特征数据方差为1,均值为0。使得预测结果不会被某些维度过大的特征值而主导
ss=StandardScaler()
X_train=ss.fit_transform(X_train)
X_test=ss.fit_transform(X_test)
#初始化线性假设的支持向量机分类器LinearSVC
lsvc=LinearSVC()
#进行模型训练
lsvc.fit(X_train,y_train)
#利用训练好的模型对测试样本的数字类别进行预测,预测结果存储在变量y_predict中
y_predict=lsvc.predict(X_test)
#支持向量机(分类)模型对手写体数字图像识别能力的评估
#使用模型自带的评估函数进行准确性测评
print('The Accuracy of Linear SVC is',lsvc.score(X_test,y_test))
#从sklearn.metrics里导入classification_report模块
from sklearn.metrics import classification_report
print(classification_report(y_test,y_predict,target_names=digits.target_names.astype(str))) =================》 The Accuracy of Linear SVC is 0.9488888888888889
precision recall f1-score support
0 0.92 0.97 0.94 35
1 0.95 0.98 0.96 54
2 0.98 1.00 0.99 44
3 0.93 0.93 0.93 46
4 0.97 1.00 0.99 35
5 0.94 0.94 0.94 48
6 0.96 0.98 0.97 51
7 0.90 1.00 0.95 35
8 0.98 0.83 0.90 58
9 0.95 0.91 0.93 44
avg / total 0.95 0.95 0.95 450
标签:digits,Python,学习,0.95,train,test,向量,sklearn 来源: https://www.cnblogs.com/yxllfl/p/10529539.html