其他分享
首页 > 其他分享> > 大数据应用与管理3:分类分析

大数据应用与管理3:分类分析

作者:互联网

3、分类分析

3.1实验说明

对给定数据集《电信客户流失预测.xlsx》利用SPSS Modeler软件进行数据处理,分别利用决策树与KNN两种方法对数据进行分析.分析不同因素对于分类的重要性,并能对给定的用户A(与2中用户A相同)利用决策树或者KNN判断其是否会流失。

3.2实验步骤

 请附SPSS Modeler所建模型截图以及模型输出结果截图。

模型截图:

 

模型输出结果截图:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3.3结果分析

(1)请分析决策树结果中各个变量的重要性,决策树模型的准确度,并保存模型形成的决策规则以及决策树图。对于用户A(与2相同),根据决策规则,判断其是或否为流失用户。

答:

重要性变量从大到小依次为InternetService,Tenure,TotalCharges.在训练集上正确率为80.84%,在测试集上为79.37%。

 决策规则

InternetService = 0.000 [ 模式:0 ] => 0.0

InternetService = 1.000 [ 模式:0 ]

      TotalCharges <= 141.600 [ 模式:1 ] => 1.0

      TotalCharges > 141.600 [ 模式:0 ] => 0.0

InternetService = 2.000 [ 模式:0 ]

      tenure <= 19 [ 模式:1 ] => 1.0

      tenure > 19 [ 模式:0 ] => 0.0

A用户为流失客户。

(2)请分析KNN模型分类时对于K的选择,对比KNN模型与决策树模型在训练集和测试集上的准确度。

答:K=5时,训练集上效果最好。训练集在KNN模型中正确率高,测试集在决策树模型中正确率高。

标签:分析,KNN,截图,模型,分类,应用,集上,InternetService,决策树
来源: https://www.cnblogs.com/joeni/p/15089923.html