银行贷款的分类和预测
作者:互联网
改进此代码:
import pandas as pd
from sklearn.linear_model import LogisticRegression as LR
# 参数初始化
filename = '../data/bankloan.xls'
data = pd.read_excel(filename)
x = data.iloc[:,:8].as_matrix()
y = data.iloc[:,8].as_matrix()
print(x,y)
print(x.shape,y.shape)
lr = LR() # 建立逻辑回归模型
lr.fit(x, y) # 用筛选后的特征数据来训练模型
print('模型的平均准确度为:%s' % lr.score(x, y))
- 将数据划分为训练集和测试集
- 训练集和测试集可以随机取样
- 利用训练集和测试集可以随机取样,验证模型的稳定性。(需要至少10次不同的取样,绘制不同取样训练精度和测试精度图形)
思路:
将数据划分为训练集和测试集,即用x_train,x_test,y_train,y_test = train_test_split ()来划分
训练集与测试集随机取样即该方法中的rand_stage的值为随机的。至少取十次,则可以用循环来实现。绘制图形通过plt来绘制。
代码如下:
运行结果:
标签:预测,训练,随机取样,分类,银行贷款,test,测试,print,data 来源: https://blog.csdn.net/m0_55845652/article/details/121080295