深入浅出统计学01
作者:互联网
深入浅出统计学
框架
- 第一印象
- 集中趋势的度量
- 分散性与变异度的度量
- 概率计算
- 离散概率分布的运用
- 排列与组合
- 几何分布、二项分布及泊松分布
- 正态分布的运用
- 再谈正态分布的运用
- 统计抽样的运用
- 总体和样本的估计
- 置信区间的构建
- 假设检验的运用
- x^2分布
- 相关与回归
01 第一印象
基本概念
- 频数:频数是一种统计方法,用来描述一个类别中有多少个项。
- 频数密度:长方形高度用于度量一个特定组的频数的集中程度,是对频数密集度的一种度量,是用于说明数字到底是“稠密”还是“稀薄”的一种方法。长方形的高度称为频数密度。
- 累积频数:累加到某个特定数值为止的总频数。即频数的累计总和。通过累计频数可知到该数值点为止的总频数。例如,假设你有一些人的年龄数据。数值27的累积频数表示到27岁(包括27岁在内)为止的人有多少。
图形种类
- 饼图
- 条形图 - 条形图中的每一个长方形代表一个特定类,长方形的长度代表某种数值。长方形越长,数值越大。所有长方形的宽度都相等。
-
- 垂直条形图
-
- 水平条形图
标度
- 百分数标度
- 频数标度
处理多批数据
- 堆积条形图
- 分段条形图
数据的分类
- 类别数据(定性数据)
- 数据值数据(定量数据)
直方图和条形图的区别
-
- 每个长方形的面积与频数成正比
-
- 图上的长方形之间没有间隔
绘制区间相同的直方图
- 查看每个区间,求出每个区间的宽度,以及每个区间涵盖的数据范围。同时要确保直方图的各个长方形之间没有间隔。
- 为了保证各个长方形之间没有间隔,要适当的扩大第一个区间的结束范围,减少第二个区间的开始范围,从而形成一条唯一边界(一般是从中间会合)。扩大和缩小的点,对应的另一个端点也要一起调整从而保证区间范围不变。
- 比如(0-99)、(200-399)在直方图中要用(-0.5-199.5)、(199.5-399.5)表示。
绘制区间不相等的直方图
- 求长方形的宽度 - 长方形所覆盖的数值范围就是长方形的宽度。
- 求长方形的高度
-
- 长方形面积 = 每组频数
-
- 长方形高度 = 频数 / 长方形宽度
长方形高度用于度量一个特定组的频数的集中程度,是对频数密集度的一种度量,是用于说明数字到底是“稠密”还是“稀薄”的一种方法。长方形的高度称为频数密度。
- 画出直方图
- 纵坐标为频数密度
累计频数图(折线图)
累积频数:累加到某个特定数值为止的总频数。即频数的累计总和。通过累计频数可知到该数值点为止的总频数。例如,假设你有一些人的年龄数据。数值27的累积频数表示到27岁(包括27岁在内)为止的人有多少。
总结
- 使用哪种图形归根结底在于你要传递的信息,以及你要提炼的主要事实。
标签:频数,01,深入浅出,长方形,数值,统计学,直方图,27,条形图 来源: https://www.cnblogs.com/xiaoheng2020/p/13307025.html