线性回归练习————线性回归和Anscombe四重奏
作者:互联网
文章目录
一、线性回练习
1. 一元线性回归练习
高尔顿数据集进行线性回归分析
父母身高平均值和其中一个子女身高进行回归分析
- 数据整理,一般获得的数据都会比较多,必须先分析整理数据,以下图为例。
每个家庭中父亲母亲身高肯定一定,所以不用去求平均值,针对每个家庭中子女性别的不同,我分为了两个表
子表
女表
2.因为这两个表中或多或少都会存在家庭编号重复的问题
所以分别对两个表的子女身高求平均值可得新表
对上述数据分析之后得出结果
父子身高线性表
母子身高线性表
两张表得R^2=1,由此可见,取得点太过巧合,结果不对。
二、四重奏数据集分析
2.1 表一
有图看出线性并不是很能够表现原始数据的一个变化趋势,所有该线性回归方程不成立。通过采用其他的回归曲线来测试,发现对于6次的多项式的回归方程来说,会比线性回归方程更好表现数据的变化趋势。
2.2 表二
图中可以看出线性并不是很能够表现原始数据的一个变化趋势,所有该线性回归方程不成立。通过采用其他的回归曲线来测试,发现对于2次的多项式的回归方程来说,会比线性回归方程更好表现数据的变化趋势。
2.3 表三
从图中可以看出线性基本能够表现原始数据的一个变化趋势,只存在极少的极端数据,所有该线性回归方程基本能够体现该数据集的一个变化情况。
2.4 表四
从图中可以看出线性并不能表现原始数据的一个变化趋势,所有该线性回归方程不成立。可以发现数据基本上不能够用线性来描述,应该将数据自变量和因变量交换位置来进行分析,可能能够用回归数据进行分析。
三、小结
熟悉Excel得使用会使得数据处理变得很简单,我这里得R^2一直等于1有问题,我还在找问题原因。
标签:变化趋势,回归,回归方程,Anscombe,线性,身高,数据 来源: https://blog.csdn.net/MrKaj/article/details/115033273