其他分享
首页 > 其他分享> > 【Clemetine】基于判别分析的电信客户分类

【Clemetine】基于判别分析的电信客户分类

作者:互联网

一、实验目的及要求、
实验目的:1、用判别分析对于电信客户完成分类。
2、通过本次实验加深对判别分析的理解,为以后熟练的使用判别分析打好基础。
实验要求:1、熟练地了解判别分析的原理。
2、深入分析数据从中挖掘获取更有价值的客户信息。
3、实验结论必须符合事实。

二、实验仪器设备
计算机,打印机。
三、实验内容
(一)实验背景
该示例主要关注于使用人口统计数据预测使用模式。目标字段客户类别具有四个可能的值,分别对应四个客户组,如下所示:
在这里插入图片描述
电信业是典型的数据密集型行业,长期积累的大量客户行为数据是运营商的重要资源和财富。然而,电信业务数据量庞大,业务系统众多,在电信业中引入数据挖掘技术,以帮助理解商业行为、识别电信模式、更好地利用资源和提高服务质量,具有重要的应用价值。假设某个电信提供商根据服务使用模式对它的客户群进行了分段,将这些客户分为了四个组。如果人口统计数据可用于预测组成员,则您可以为不同的准客户定制产品。
(二)实验的相关知识点
1、判别分析常见方法:(1)距离判别法(2)Bayes判别(3)Fisher判别(4)二次判别
2、作判别分析时,样品分为几类已经事先明确,需要做的主要工作是利用训练样本建立判别准则,对新样品所属的类别进行判定。
(三)实验原理
判别分析是一项根据输入字段值对记录进行分类的统计技术。它与线性回归相似,但它采用的是分类目标字段,而不是数字目标字段。根据观察和测量到的若干变量值判断研究对象如何分类。已知一定数量案例的一个分组变量和这些案例的一些特征变量,确定分组变量和特征变量之间的数据关系,建立判别函数,然后便可以利用这一数量关系对其他已知特征变量信息、但未知分组类型所属的案例进行判别分析。

四、实验实施步骤
(一)实验调试步骤
创建数据流:
在这里插入图片描述
类型节点设置,将gender类型更改为集合,multline,voice,pager,internet,called,callwait,forward,confer,ebill的类型改为标志,custcat的方向改为输出:在这里插入图片描述
添加过滤节点,过滤节点以选取相关字段(地区、年龄、婚姻状况、地址、收入、教育程度、行业、退休、性别、居住地和客户类别)。其他字段可以排除在此分析之外。42个已输入,31个已过滤,0个已重命名,11个已输出:
在这里插入图片描述
建立判别式模型,将方法改为逐步法,众数选择专家,先验概率选择所有组都相等,使用组内协方差矩阵,在“高级输出”对话框中,选择汇总表、区域图和步骤汇总在这里插入图片描述
在这里插入图片描述

表1:各组统计量的描述在这里插入图片描述
由表1可以看出,各组的均值差异较大,且各组的方差也有所差异。
表2:检验判别函数的显著水平在这里插入图片描述
表2中第一栏表示每步中判别函数被移去后的的数值。原假设为各组中所有判别函数的总体均值相等。如果显著,表示第二个判别函数也显著。本例中该判别函数对不同的两组有贡献。因为它的概率值远小于0.05。
表3:标准典型判别函数系数在这里插入图片描述
标准化判别函数系数可以看出预测变量在组成判别函数时的贡献率
本例中的判别函数时:Level of education(x1)Years with current employer(x2),Number of people in household(x3)。
由此得到典型判别函数:
Y1=0.958x1+0.066x2+0.261x3
Y1=0.136x1+1.026x2+0.239x3
Y1=-0.250x1-0.119x2+0.947x3
如下,当存在多个判别式函数时,用星号来标记每个变量与某典范函数的最大绝对相关度。在每个函数内部,这些标记星号 (*) 的变量将按相关度大小排序。
区域图有助于研究组与判别式函数之间的关系。结合结构矩阵的结果,区域图能够对预测变量和组之间的关系提供图形化的解释。

添加数据审核字段:
在这里插入图片描述
在这里插入图片描述
创建矩阵节点:在这里插入图片描述
在这里插入图片描述
(二)实验原始数据记录在这里插入图片描述
(三)实验调试过程中存在的问题、解决问题的思路及办法
可能出现的问题:数据类型设置不合理影响判别结果
解决办法:区分并明确集合、连续、标志等不同数据类型适用的数据

五、实验总结

利用结构矩阵和区域图,能够鉴别出那些最有助于分割客户群的变量。最后,分类结果显示模型对电子服务用户进行分类时表现欠佳。需要进一步研究来确定另一个预测变量,以便更好地对这些用户进行分类,但该模型是否可以完全能够满足我们的需求,取决于希望预测的内容。

标签:客户,变量,判别函数,判别分析,Clemetine,实验,电信,判别
来源: https://blog.csdn.net/qq_44762986/article/details/120661206