其他分享
首页 > 其他分享> > 线性回归练习————线性回归和Anscombe四重奏

线性回归练习————线性回归和Anscombe四重奏

作者:互联网

文章目录

一、线性回练习

1. 一元线性回归练习

高尔顿数据集进行线性回归分析
父母身高平均值和其中一个子女身高进行回归分析

  1. 数据整理,一般获得的数据都会比较多,必须先分析整理数据,以下图为例。
    在这里插入图片描述
    每个家庭中父亲母亲身高肯定一定,所以不用去求平均值,针对每个家庭中子女性别的不同,我分为了两个表
    子表
    在这里插入图片描述

女表
在这里插入图片描述

2.因为这两个表中或多或少都会存在家庭编号重复的问题
所以分别对两个表的子女身高求平均值可得新表
在这里插入图片描述
对上述数据分析之后得出结果
在这里插入图片描述
父子身高线性表
在这里插入图片描述
母子身高线性表
在这里插入图片描述
在这里插入图片描述
两张表得R^2=1,由此可见,取得点太过巧合,结果不对。

二、四重奏数据集分析

2.1 表一
有图看出线性并不是很能够表现原始数据的一个变化趋势,所有该线性回归方程不成立。通过采用其他的回归曲线来测试,发现对于6次的多项式的回归方程来说,会比线性回归方程更好表现数据的变化趋势。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2.2 表二
图中可以看出线性并不是很能够表现原始数据的一个变化趋势,所有该线性回归方程不成立。通过采用其他的回归曲线来测试,发现对于2次的多项式的回归方程来说,会比线性回归方程更好表现数据的变化趋势。
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
2.3 表三
从图中可以看出线性基本能够表现原始数据的一个变化趋势,只存在极少的极端数据,所有该线性回归方程基本能够体现该数据集的一个变化情况。在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
2.4 表四
从图中可以看出线性并不能表现原始数据的一个变化趋势,所有该线性回归方程不成立。可以发现数据基本上不能够用线性来描述,应该将数据自变量和因变量交换位置来进行分析,可能能够用回归数据进行分析。

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

三、小结

熟悉Excel得使用会使得数据处理变得很简单,我这里得R^2一直等于1有问题,我还在找问题原因。

标签:变化趋势,回归,回归方程,Anscombe,线性,身高,数据
来源: https://blog.csdn.net/MrKaj/article/details/115033273