ID3决策树和BP神经网络建立银行分控模型
作者:互联网
数据来源:bankloan.xls
下面不做决策树和神经网络的分析了,直接上代码了结果。
一、ID3决策树建立银行分控模型
代码:
# -*- coding: utf-8 -*- '''用决策树建立银行分控模型''' #导入库 import pandas as pd from sklearn.tree import DecisionTreeClassifier as DTC from sklearn.tree import export_graphviz from IPython.display import Image from sklearn import tree import pydotplus #导入数据 filename = 'data/bankloan.xls' data = pd.read_excel(filename) #读取数据 x = data.iloc[:,:8] y = data.iloc[:,8] #建立模型 dtc = DTC(criterion='entropy') #建立决策树模型,基于信息熵 dtc.fit(x, y) #训练模型 x = pd.DataFrame(x) #决策树 with open("data/tree.dot", 'w') as f: export_graphviz(dtc, feature_names = x.columns, out_file = f) f.close() #分类 dot_data = tree.export_graphviz(dtc, out_file=None, #regr_1 是对应分类器 feature_names=data.columns[:8], #对应特征的名字 class_names=data.columns[8], #对应类别的名字 filled=True, rounded=True, special_characters=True) #画出树的结构 dot_data = dot_data.replace('helvetica', 'MicrosoftYaHei') #树结构的字体类型 graph = pydotplus.graph_from_dot_data(dot_data) graph.write_png('myTree.png') #保存图像 Image(graph.create_png())
结果:
二、BP神经网络建立银行分控模型
代码:
# -*- coding: utf-8 -*- '''用神经网络建立银行分控模型''' #导入库 import pandas as pd from keras.models import Sequential from keras.layers.core import Dense, Activation import numpy as np #读取数据 data = data = pd.read_excel('data/bankloan.xls') x = data.iloc[:,:8].values y = data.iloc[:,8].values #建立模型 model = Sequential() model.add(Dense(input_dim = 8, units = 16)) model.add(Activation('relu')) #用relu函数作为激活函数,能够大幅提供准确度 model.add(Dense(input_dim = 16, units = 1)) model.add(Activation('sigmoid')) #由于是0-1输出,用sigmoid函数作为激活函数 model.compile(loss = 'mean_squared_error', optimizer = 'adam') #编译模型。由于我们做的是二元分类,所以我们指定损失函数为binary_crossentropy,以及模式为binary #另外常见的损失函数还有mean_squared_error、categorical_crossentropy等,请阅读帮助文件。 #求解方法我们指定用adam,还有sgd、rmsprop等可选 model.fit(x, y, epochs = 100, batch_size = 10) #训练模型 #分类 yp = model.predict(x).reshape(len(y)) # 分类预测 yp = yp.astype(np.int32) #画出混淆矩阵图 print("混淆矩阵图:\n") import cm_plot as cp # 导入自行编写的混淆矩阵可视化函数 cp.cm_plot(y,yp).show() # 显示混淆矩阵可视化结果 #损失值 score = model.evaluate(x,y,batch_size=128) #模型评估 print("分类预测损失值:",score)
结果:
标签:模型,ID3,BP,分控,import,model,data,dot,决策树 来源: https://www.cnblogs.com/ssh-4016/p/16063144.html