大数据与建模全线条就业实战班【视频代码齐全】
作者:互联网
样本量
如果减少第一类、第二类错误,需要我们控制样本量。所以牵涉到样本量的计算。样本量的计算公式比较复杂,但是一个通俗的理解是:如果实验组大大提升了效果,那么我们需要的样本就越少,如果样本波动小,那么需要的样本量也就越少。所以样本量和实验组与控制组之间的差额(也就是预期提升)、标准差(波动)相关。
显著性校验
我们一般用p-value来判断是否显著,p-value用来度量样本所能提供的证据对原假设的支持程度。p越小,越能拒绝原假设,说明我们的实验组有效果。
p的计算步骤:
-
计算两个样本的标准误差(使用到中心极限定理,指标的均值服从正太分布;均值和率值的计算方式稍有不同)
-
计算z值:(两样本均值差 - D0)/ 标准误差 注:D0是原假设中的两均值之差
-
根据z值,查表得到p-value,如果是双侧,需要乘以2.
-
用p-value和显著性水平对比,看是否显著
标签:实战,视频,均值,实验组,样本,建模,value,计算,样本量 来源: https://blog.csdn.net/weixin_A1883029/article/details/120753892