其他分享
首页 > 其他分享> > 相关性分析

相关性分析

作者:互联网

 

 

工具:tableau

数据源:tableau自带示例超市数据

1.数据处理:订单表自连接,如图(mysql数据库连接时需进行数据提取,才能调用corr函数)

2.创建计算字段

 

 

 3.制图

 

 

 4.线性回归分析

 

 

 在相关系数图中,用具和标签二者销量相关的皮尔森相关系数为0.881,通过散点图线性分析我们发现主要是受3个离散值影响的。 剔除后(见下图)R方值调整为0.0038,非常弱的模型拟合。所以用具和标签销售连带相关性非常弱。

注:R方也叫决定系数,它的主要作用是衡量数据中的因变量有多准确可以被某一模型所计算解释。R方可以衡量模型拟合数据的好坏程度;R方的取值范围<=1,R方越大,模型对数据的拟合程度越好。

R方/调整R方值区间经验判断:

0.3>非常弱的模型拟合

0.3-0.5>弱的模型拟合

0.5-0.7>适度的模型拟合

>0.7较好的模型拟合

 

 

 

常见的相关系数有:

皮尔森相关系数      每个变量呈正态分布

斯皮尔曼相关系数   每个变量呈非正态分布

一般默认使用皮尔逊相关系数,SPSS二者结果相差不大

相关分析后需进行散点图线性回归分析进一步验证

皮尔森相关系数反映的是一种线性相关系数。x、y的协方差除以x、y的标准差

相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。

参考 皮尔逊Person相关系数

https://liangyan.blog.csdn.net/article/details/111033499?spm=1001.2101.3001.6650.16&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7Edefault-16-111033499-blog-82527400.pc_relevant_aa&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7Edefault-16-111033499-blog-82527400.pc_relevant_aa&utm_relevant_index=17

 

标签:分析,relevant,相关系数,blog,pc,相关性,拟合,模型
来源: https://www.cnblogs.com/haibai/p/16388922.html