可汗学院公开课:统计学笔记——中心极限定理、置信区间
作者:互联网
中心极限定理(central limit theorem):无论离散还是连续
样本均值的抽样分布:随着样本增多,样本均值的频率图会越来越接近正态分布,标准差也越来越小。原本的总体可以是任意分布,抽样分布的均值与原本总体的均值相差不大,且标准差更小。
偏度:左尾较长-负偏态,右尾较长-正偏态
峰度:峰度为正-尾部较肥峰值会尖,峰度为负-尾部较小峰值平滑
均值:样本均值的抽样分布均值:真正的总体均值,真正的随机变量均值
方差:原分布的方差,样本数目n,则抽样分布的方差(估计值,当n 很大时,估计值才会很好)
标准差:样本均值抽样分布的标准差被称作均值标准差或者均值标准误差,,而最好的总体标准差估计是样本标准差(区别样本标准差和抽样分布标准差)
伯努利分布:
二项分布的最简单情况,只有两种结果0-1。
假设成功的概率是p,失败的概率是1-p
均值:
方差:
标准差:
置信区间:
例:表示43%的人支持B,57%的人支持A,误差范围是10%,95%的置信区间
之所以称之置信区间而非概率区间,是因为其中的标准差是我们的估计值。
置信区间在z表格中找到对应的z分数,从而找到误差范围。
t分布:当n较小时,样本抽样分布就不是正态分布,也就不能很好的估计标准差,而t分布就是为了小样本容量时置信区间的更好估计所设计的,所以在根据置信区间查误差范围时,查询的是t表格而不是z表格。它的分布图像与正态相似,不过有更肥的尾部。
t表格:自由度代表n-1
标签:置信区间,抽样,统计学,均值,样本均值,公开课,分布,标准差 来源: https://blog.csdn.net/qq_39421074/article/details/98479132