数学建模(NO.5总体皮尔逊Pearson相关系数)
作者:互联网
总体皮尔逊Pearson相关系数
一. 应用
两种最为常用的相关系数:皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数。它们可用来衡量两个变量之间的相关性的大小,
二.样本与总体
总体——所要考察对象的全部个体叫做总体.
我们总是希望得到总体数据的一些特征(例如均值方差等)
样本——从总体中所抽取的一部分个体叫做总体的一个样本.
计算这些抽取的样本的统计量来估计总体的统计量:
例如:
使用样本均值、样本标准差来估计总体的均值(平均水平)和总体的标准差(偏离程度)
三.总体皮尔逊Pearson相关系数
四.样本皮尔逊Pearson相关系数
五.总结
-
只用来衡量线性的相关系数,所以要先画出散点图确定线性相关
-
离群点对相关系数影响很大
-
两个变量的相关系数很大也不能说明两者相关
-
相关系数为0 ,只能说明不存在线性相关,还可以有其他相关
-
解释:
上表所定的标准从某种意义上说是武断的和不严格的。
对相关系数的解释是依赖于具体的应用背景和目的的。
事实上,比起相关系数的大小,我们往往更关注的是显著性。(假设检验) -
如果两个变量本身就是线性的关系,那么皮尔逊相关系数绝对值大的就是相关性强,小的就是相关性弱;
-
在不确定两个变量是什么关系的情况下,即使算出皮尔逊相关系数,发现很大,也不能说明那两个变量线性相关,甚至不能说他们相关,我们一定要画出散点图来看才行
六.一个例子
【1】题目
现有某中学八年级所有女学生的体测样本数据,请见下表,试计算各变量之间的皮尔逊相关系数。
【2】先算出描述性统计量
方法一:使用Matlab内置函数
MIN = min(Test); % 每一列的最小值
MAX = max(Test); % 每一列的最大值
MEAN = mean(Test); % 每一列的均值
MEDIAN = median(Test); %每一列的中位数
SKEWNESS = skewness(Test); %每一列的偏度
KURTOSIS = kurtosis(Test); %每一列的峰度
STD = std(Test); % 每一列的标准差
RESULT = [MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD]
%将这些统计量放到一个矩阵中表示
得到的结果:
方法二:EXCEL的数据分析工具
EXCEL描述性统计结果:
方法三:SPSS描述性统计结果
【2】矩阵散点图
在计算皮尔逊相关系数之前,一定要做出散点图来看两组变量之间是否有线性关系
这里使用Spss比较方便: 图形 ‐ 旧对话框 ‐ 散点图/点图 ‐ 矩阵散点图
【4】皮尔逊相关系数的计算
corrcoef函数: correlation coefficient相关系数
R = corrcoef(A)
返回 A 的相关系数的矩阵,其中 A 的列表示随机变量(指标),行表示观测值(样本)。
R = corrcoef(A,B)
返回两个随机变量 A 和 B (两个向量)之间的系数。
我们要计算体测的六个指标之间的相关系数,只需要使用下面这个语句:
R = corrcoef(Test);
##【5】美化相关系数表
标签:总体,Pearson,相关系数,样本,散点图,NO.5,皮尔逊,Test 来源: https://blog.csdn.net/qq_46126118/article/details/112398833