因子分析

2019-12-13 17:53:05 作者：互联网

学习目标：熟练使用主成分分析法对自变量进行降维，了解因子旋转的作用，能够对新生成的自变量进行合理解释，进而纳入线性回归模型比较拟合效果。

一、作用

因子分析，通过提取主成分的方式来减少自变量的数量，达到消除多重共线性的效果。

例如，某个餐厅的营业额（y）受到“x1.公交站点广告”、“x2.电台广告”、“x3.电台广告”、“x4.顾客满意度”、“x5.员工满意度”、“x6.天气”、“x7.温度”等多方面的影响。但是，我们发现x1、x2、x3、都与广告有关，x4、x5与‘’满意度‘’有关，x6、x7与气候有关。因而，通过提取主成分，原有的7个变量，有可能就压缩为三个变量，达到了降维效果。

因子分析和相关分析类似，都属于过度性分析，主要为其他分析模型做准备（尤其是线性回归模型）

二、适用条件

在因子分析模型中，公因子的有效提取数量、是否可以得到合理解释都与原有的自变量息息相关。

1、变量的数量

由于因子分析属于降维的一种方法，因此，需要有较多的变量，尤其越多越好。

2、变量间有相关性，并非指线性相关，而是指两个或多个变量同属于某种范畴，往往容易存在多重共线性的现象。

为了检验变量间是否存在相关性，我们可以通过KMO系数及巴特利特球形度检验来完成。

（1）KMO系数

KMO统计量的值在0—1之间（即0<KMO<1）,越接近于1，变量间的相关性越强，做因子分析的效果越好。当KMO>0.7时，效果比较明显；当KMO<0.5时，则不适合进行因子分析。

(2)巴特利特球形度检验

原假设H0:变量间不存在显著性相关

备择假设H1：变量间存在显著性相关

当显著性水平p<0.05时，接受H1,说明变量间存在显著相关

标签：显著性,变量,KMO,降维,因子分析,自变量
来源： https://www.cnblogs.com/LWH999/p/12036532.html