白话假设检验
作者:互联网
目录
所需基础知识
高斯分布、中心极限定理、参数估计
什么是假设检验
假设检验,从名称上来看有假设、检验两个关键字。顾名思义就是提出一个假设,然后来检验这个假设是否正确。
我们知道参数估计是用抽样样本,来估计总体样本的特征,假设检验呢,就是对样本特征提出一个假设,然后来检验这个假设是否正确,怎么检验呢,自然肯定是利用正太分布之类的统计理论了。
本质上来说,假设检验就是根据构造的统计量所符合的统计学理论分布,采用小概率理论来推断假设是否正确,如果原假设发生的概率较大则接受原假设,如果原假设发生的概率为小概率事件则抛弃原假设,接受除原假设以外的其他情况。
参数估计可参考我的另一篇博文:白话参数估计
假设检验例子
我们还是举个例子来说明假设检验吧
例子:
假设某门户网站大约每天的用户访问量为1000人,公司领导为提高门户的访问量,特意让某产品经理对其功能进行迭代升级,在功能迭代升级完毕后试运行了三个月,随机抽取了其后30天的用户访问量,计算了下平均每天为1050人,然后又计算了下标准差为200,请问产品经理的功能迭代是否有成效?
解答:
要回答这个问题,如果用假设检验的思路,那么就是先提
改版前门户网站每天的用户访问量符合均值为1000的高斯分布,改版后,仍然也是符合高斯分布的。
我们假设一个命题,产品的功能迭代升级实际上没有成效,所统计出来的1050看似比原来的1000高50,我们假定这个是抽样的随机误差导致的。
好了,假设一个命题:
H0 =改版后用户访问量均值小于等于1000(意思就是分布仍然符合均值为1000的高斯分布)
H1 =改版后用户访问量均值大于1000
注意H1命题是H0命题的备择假设,也就是包含了除H0以外的其他信息。
既然我们假设了H0命题,那么便可以计算一下他的置信区间,当前前提需要指定置信度(假定为0.05)
如图所示,当我们假设改版后均值为1000,也就是求以1000为均值的高斯分布的置信度边界,H0所对的区间就是置信区间,我们把这个叫做理论置信区间吧。
如果我们计算出来的置信区间边界比理论置信区间大,那么就拒绝H0命题,接受H1命题
如果我们计算出来的置信区间边界比理论置信区间小,那么就接受H0命题,拒绝H1命题
怎么计算理论置信区间边界、和实际置信区间边界呢?
理论置信区间边界就是根据置信度,结合高斯分布表就可以查询出来了,比如置信度为0.05时,查表可知置信区间边界为
然后
我们根据z表达式(转换过程属于高斯分布的标准化正太分布过程)即:
根据表达式计算出z值为1.37,小于1.645,故接受原假设H0,即边界落入到了H0范围内。
那么我们可以得出结论,这个产品经理的功能改版95%的可能性来说,是没有提升用户访问量的。
以上就是假设检验的过程了。理解了以上的过程,那么假设检验的基本原理就明白了。
假设检验的分类
假设检验的一般过程:
- 提出假设
- 构造统计量
- 证明、接收原假设
同参数估计一样,其核心就是个根据统计量所遵循的分布,依据分布的理论通过小概率事件的规则判断原假设是否成立的一种方法。
目前一般分为一个总体的假设检验、和两个总体的假设检验。
一个总体的假设检验包括了总体均值、总体比例、总体方差三类总体参数的假设检验
两个总体的假设检验包括了两个总体均值之差、两个总体比例之差、两个总体方差比三类假设检验。
不同的参数检验,根据其是否知道原始总体方法、大小样本群体,采用不同的统计量进行假设检验。
标签:置信区间,白话,假设,H0,假设检验,高斯分布,1000 来源: https://blog.csdn.net/walking_visitor/article/details/118463820