其他分享
首页 > 其他分享> > 可汗学院公开课:统计学笔记——中心极限定理、置信区间

可汗学院公开课:统计学笔记——中心极限定理、置信区间

作者:互联网

中心极限定理(central limit theorem):无论离散还是连续

样本均值的抽样分布:随着样本增多,样本均值的频率图会越来越接近正态分布,标准差也越来越小。原本的总体可以是任意分布,抽样分布的均值与原本总体的均值相差不大,且标准差更小。

偏度:左尾较长-负偏态,右尾较长-正偏态 

峰度:峰度为正-尾部较肥峰值会尖,峰度为负-尾部较小峰值平滑

均值:样本均值的抽样分布均值\mu _{\bar{x}}=\mu:真正的总体均值,真正的随机变量均值

方差:原分布的方差\sigma ^{2},样本数目n,则抽样分布的方差\sigma _{\bar{x}}^{2}=\frac{\sigma ^{2}}{n}(估计值,当n 很大时,估计值才会很好)

标准差:样本均值抽样分布的标准差被称作均值标准差或者均值标准误差,\sigma _{\bar{x}}=\frac{\sigma }{\sqrt{n}}\approx \frac{S}{\sqrt{n}},而最好的总体标准差估计是样本标准差(区别样本标准差和抽样分布标准差)

伯努利分布:

二项分布的最简单情况,只有两种结果0-1。

假设成功的概率是p,失败的概率是1-p

均值:\mu =0\cdot \left ( 1-p \right )+1\cdot p=p

方差:\sigma ^{2}=\left ( 1-p \right )\left ( 0-p \right )^{2}+p\cdot \left ( 1-p \right )^{2}=p-p^{2}=p\left ( 1-p \right )

标准差:\sigma =\sqrt{p\left ( 1-p\right )}

置信区间:

p\left ( \bar{x} \right is\, within \, 2\sigma _{\bar{x}} \, of \, \mu _{\bar{x}})=95.4\%

p\left ( \mu _{\bar{x}}\, is\,within\, 2\sigma _{\bar{x}}\, of\, \bar{x} \right )=95.4\%

例:p\left ( p\, is\,within\, 0.43\pm 0.1\right )\approx 95\%表示43%的人支持B,57%的人支持A,误差范围是10%,95%的置信区间

之所以称之置信区间而非概率区间,是因为其中的标准差是我们的估计值。

置信区间在z表格中找到对应的z分数,从而找到误差范围。

t分布:当n较小时,样本抽样分布就不是正态分布,\sigma _{\bar{x}}=\frac{\sigma }{\sqrt{n}}也就不能很好的估计标准差,而t分布就是为了小样本容量时置信区间的更好估计所设计的,所以在根据置信区间查误差范围时,查询的是t表格而不是z表格。它的分布图像与正态相似,不过有更肥的尾部。

t表格:自由度代表n-1

 

标签:置信区间,抽样,统计学,均值,样本均值,公开课,分布,标准差
来源: https://blog.csdn.net/qq_39421074/article/details/98479132