回归方法的概述和数据的收集
作者:互联网
目录标题
回归概念介绍
回归分析是数据分析中最基础也是最重要的分析工具,绝大多数的
数据分析问题,都可以使用回归的思想来解决。
回归分析的任务就是,通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。
常见的回归分析有五类:线性回归、0‐1回归、定序回归、计数回归
和生存回归,其划分的依据是因变量Y的类型。
三个核心:X,Y,相关性
回归分析的使命
- 使命1:回归分析要去识别并判断:哪些X变量是同Y真的相关,哪些不是。统计学中有一个非常重要的领域,叫做“变量选择”。(逐步回归法)
- 使命2:去除了那些同Y不相关的X变量,那么剩下的,就都是重要的、有用的X变量了。接下来回归分析要回答的问题是:这些有用的X变量同Y的相关关系是正的呢,还是负的?
- 使命3:在确定了重要的X变量的前提下,我们还想赋予不同X不同的权重,也就是不同的回归系数,进而我们可以知道不同变量之间的相对重要性。这就是回归分析要完成的三个使命:
第一、识别重要变量;
第二、判断相关性的方向;
第三、要估计权重(回归系数)
回归的分类
数据的分类
- 横截面数据
在某一时点收集的不同对象的数据 - 时间序列数据
对同一对象在不同时间连续观察所取得的数据 - 面板数据
横截面数据与时间序列数据综合起来的一种数据资源
不同数据类型的处理方法
数据的收集
【简道云汇总】110+数据网站
https://link.jiandaoyun.com/f/5cc652cc2cf3b22fb7819189
虫部落数据搜索
http://data.chongbuluo.com/
【汇总】数据来源/大数据平台
https://link.jiandaoyun.com/f/5b35d05ff7f6ef2604d39a93
大数据工具导航工具
http://hao.199it.com/
数据平台
http://www.hippter.com/data.html
上面的数据多半都是宏观数据,微观数据市面上很少
大家可以在人大经济论坛搜索
https://bbs.pinggu.org/
另外也可以自己学习爬虫
Python等软件爬取(需要编程基础,实际学习起来不困难)
网易云课堂:零基础21天搞定Python分布爬虫
标签:分析,使命,变量,收集,com,回归,概述,数据 来源: https://blog.csdn.net/david2000999/article/details/115800560