相关性分析(清风数学建模)
作者:互联网
一、皮尔逊person相关系数
(一)、概念
皮尔逊相关系数可以看作为X和Y标准化后的协方差
(二)、使用条件
1.两个变量线性相关
(三)、易错点
1. 非线性相关也会导致线性相关系数很大
2. 离群点对相关系数的影响很大
3. 如果两个变量的相关系数很大也不能说明二者相关(可能是受到了异常值的影响)
4. 相关系数计算结果为0,只能说不是线性相关,但说不定会有更复杂的相关关系(非线性关系)
(四)、总结
1. 如果两个变量本身就是线性的关系,那么皮尔逊相关系数绝对值大的就是相关性强,小的就是相关性弱。
2. 在不确定两个变量是什么关系的情况下,即时算出皮尔逊相关系数,发现很大,也不能说明那两个变量线性相关,甚至不能说明它们相关,一定要画出散点图来观察。
(五)、对皮尔逊相关系数进行假设检验
(六)、对皮尔逊相关系数进行假设检验的条件
(七)、如何检验数据是否是正态分布?
1.正态分布JB检验
2.Shapiro-wilk夏皮洛-威尔克(3<=n<=50)
3Q-Q图(n较大)
二、斯皮尔曼spearman等级相关系数
三、两个相关系数的比较
标签:清风,两个,变量,相关系数,建模,皮尔逊,线性相关,相关性 来源: https://blog.csdn.net/qq_52268805/article/details/122839129