大数据应用与管理3:分类分析
作者:互联网
3、分类分析
3.1实验说明
对给定数据集《电信客户流失预测.xlsx》利用SPSS Modeler软件进行数据处理,分别利用决策树与KNN两种方法对数据进行分析.分析不同因素对于分类的重要性,并能对给定的用户A(与2中用户A相同)利用决策树或者KNN判断其是否会流失。
3.2实验步骤
请附SPSS Modeler所建模型截图以及模型输出结果截图。
模型截图:
模型输出结果截图:
3.3结果分析
(1)请分析决策树结果中各个变量的重要性,决策树模型的准确度,并保存模型形成的决策规则以及决策树图。对于用户A(与2相同),根据决策规则,判断其是或否为流失用户。
答:
重要性变量从大到小依次为InternetService,Tenure,TotalCharges.在训练集上正确率为80.84%,在测试集上为79.37%。
决策规则
InternetService = 0.000 [ 模式:0 ] => 0.0
InternetService = 1.000 [ 模式:0 ]
TotalCharges <= 141.600 [ 模式:1 ] => 1.0
TotalCharges > 141.600 [ 模式:0 ] => 0.0
InternetService = 2.000 [ 模式:0 ]
tenure <= 19 [ 模式:1 ] => 1.0
tenure > 19 [ 模式:0 ] => 0.0
A用户为流失客户。
(2)请分析KNN模型分类时对于K的选择,对比KNN模型与决策树模型在训练集和测试集上的准确度。
答:K=5时,训练集上效果最好。训练集在KNN模型中正确率高,测试集在决策树模型中正确率高。
标签:分析,KNN,截图,模型,分类,应用,集上,InternetService,决策树 来源: https://www.cnblogs.com/joeni/p/15089923.html