[极简统计学]-01 整理数据的基础知识
作者:互联网
前言
统计就是将收集到的数据进行整理并加以分析的学问
图表的选择应和想呈现的数据内容相匹配
平均数
=总数/个数
除法的两种意义:
- 将一个整体平分:等分除
- 将整体平均分成数个等份:包含除
比例
=比较量/基准量
将不同单位的比例思考为等分除
图表
柱状图:表示大小
折线图:表示变化
图表绘制者可以改变读者对于数据变化程度的印象
-
通过调整纵轴区间大小改变读者对于数据的认识
-
拉长横轴间隔会使数据看起来更平缓
-
将变动较大的数据单独提出,以显示巨大的位置变化
饼图:表示比例
表示在一个整体中每个项目各占多少比例
带状图:比较比例
若整体数值不同,则无法从占比的增减来判断绝对数值的增减
数据与变量
实质性数据:也称为“分类数据”,无法用数字来衡量的变量所组成的数据,如血型、食物
量化数据:做加减运算有意义的数据
- 离散型数据:两相邻项之间没有可取的数据
- 连续型数据:可以取连续数值的数据,如身高、体重、时间等
整理数据的步骤:
1-整理频数分布表
2-制作矩形图
矩形图
- 做图时,在最开始的组之前和最后组之后各空出一组的距离,为了让最大值和最小值看起来更加明了
- 一般来说,矩形图中相邻的两组数柱之间没有空格
代表值
- 平均值
- 中位数
- 数据存在偏离(存在较大或较小的数),适合使用中位数作为数据的代表值
- 众数
研究数据的离散型
方差
标准差
最大值和最小值
四分位数:第一四分位数、第二四分位数(中位数)、第三四分位数
箱型图
五大要数:最大值、最小值、第一四分位数、第二四分位数(中位数)、第三四分位数
箱型图切分后的区间长度均匀,则数据的离散性是均匀的
矩形图中显示频数高的部分,在箱型图中的长度则比较短
标签:极简,01,中位数,基础知识,位数,箱型,矩形,数据,四分 来源: https://www.cnblogs.com/albert-liu/p/16542277.html