数理统计:假设检验
作者:互联网
learning why, thinking what, then forgetting how.
随着时间的流逝,知识总会被遗忘和被沉淀,我们无法选择去遗忘那一部分,但是我们可以选择去沉淀那一部分。
教材为:《数理统计(孙海燕等)》
第三章 假设检验
统计推断主要分为参数估计和假设检验。假设检验是先假设总体的分布形式或总体的参数具有某种特征,然后利用样本提供的信息来推断所提出的假设的正确性。
3.1 基本概念
- 参数假设检验问题:总体分布形式已知,对总体的分布中的参数所提出的假设检验问题。
- 非参数假设检验问题:总体的分布形式未知,对其分布类型提出的假设检验问题。
3.1.1 原假设和备择假设
检验一个假设,就是根据某一法则在原假设和备择假设之间做出选择,而基于样本 x 做出拒绝 H0 或接受 H0 所依赖的法则称为检验。
H 0 : θ ∈ θ 0 , H 1 : θ ∈ θ 1 H_0: θ ∈ θ_0, H_1: θ ∈ θ_1 H0:θ∈θ0,H1:θ∈θ1
如果假设中仅包含一个参数,则为简单假设,否则为复合假设。
3.1.2 拒绝域、接受域、检验统计量和检验函数
为了拒绝原假设,需要选择符合已知分布的一个合适的检验统计量,当原假设成立时应满足某种趋势,而当其偏差过大时,可以求出一个临界值,即出现了不符合趋势的小概率事件,则可以拒绝原假设。
其中拒绝原假设的情况下,检验统计量所在的集合称为拒绝域,反之则为接受域。如下为一个理应偏小的检验统计量的拒绝域:
W = { ( x 1 , x 2 , … … , x n ) : T ( x ) ≥ c } W = \{ (x_1, x_2, ……, x_n) : T(x) ≥ c \} W={(x1,x2,……,xn):T(x)≥c}
给定一个检验,其实等价于给定其拒绝域。其统计量和临界值可以不同,但只要拒绝域相同,就是相同的检验。
引入拒绝域上的示性函数,称为检验函数:
φ ( x ) = { 1 , x ∈ W 0 , x ∉ W φ(x)= \left\lbrace \begin{array}{c} 1, x ∈ W \\ 0, x ∉ W \end{array} \right. φ(x)={1,x∈W0,x∈/W
这种检验称为非随机化检验。随机化检验是指以检验函数 φ(x) 的函数值为拒绝的概率。
3.1.3 两类错误、势和势函数
原假设成立,却检验拒绝,称为第一类错误:弃真
α ( θ ) = P θ { x ∈ W } , θ ∈ θ 0 α(θ) = P_θ \{ x ∈ W\}, θ ∈ θ_0 α(θ)=Pθ{x∈W},θ∈θ0
原假设不成立,却检验不拒绝,称为第二类错误:取伪
β ( θ ) = P θ { x ∉ W } = 1 − P θ { x ∈ W } , θ ∈ θ 1 β(θ) = P_θ \{ x ∉ W\} = 1 - P_θ \{ x ∈ W\}, θ ∈ θ_1 β(θ)=Pθ{x∈/W}=1−Pθ{x∈W},θ∈θ1
原假设不成立,检验拒绝,即应该拒绝且检验拒绝的概率,称为检验的势或功效
γ ( θ ) = P θ { x ∈ W } = 1 − β ( θ ) , θ ∈ θ 1 γ(θ) = P_θ \{ x ∈ W\} = 1 - β(θ), θ ∈ θ_1 γ(θ)=Pθ{x∈W}=1−β(θ),θ∈θ1
势函数或功效函数:
g ( θ ) = P θ { x ∈ W } = E θ ( φ ( x ) ) , θ ∈ θ g(θ) = P_θ \{ x ∈ W\} = E_θ(φ(x)), θ ∈ θ g(θ)=Pθ{x∈W}=Eθ(φ(x)),θ∈θ
当 θ ∈ θ 0 θ ∈ θ_0 θ∈θ0 时, g ( θ ) = α ( θ ) g(θ) = α(θ) g(θ)=α(θ),当 θ ∈ θ 1 θ ∈ θ_1 θ∈θ1 时, g ( θ ) = γ ( θ ) g(θ) = γ(θ) g(θ)=γ(θ)
- (原假设成立,备择假设成立) X (检验拒绝,检验接受) 表
θ ∈ θ 0 θ ∈ θ_0 θ∈θ0,即原假设成立 | θ ∈ θ 1 θ ∈ θ_1 θ∈θ1,即备择假设成立 | |
---|---|---|
x ∈ W x ∈ W x∈W | α ( θ ) = P θ { x ∈ W } α(θ) = P_θ \{ x ∈ W\} α(θ)=Pθ{x∈W} | 1 − β ( θ ) = γ ( θ ) = P θ { x ∈ W } 1 - β(θ) = γ(θ) = P_θ \{ x ∈ W\} 1−β(θ)=γ(θ)=Pθ{x∈W} |
x ∉ W x ∉ W x∈/W | 1 − α ( θ ) 1 - α(θ) 1−α(θ),委婉接受原假设 | β ( θ ) = P θ { x ∉ W } β(θ) = P_θ \{ x ∉ W\} β(θ)=Pθ{x∈/W} |
3.1.4 检验水平
犯第一类错误和第二类错误的概率很难同时控制,除非增加样本容量。
Neyman-Pearson 假设检验原理是:控制犯第一类错误的概率在给定的范围内,寻找检验使得犯第二类错误的概率尽可能小,就是使检验的势尽可能大。
显著性水平 α:控制犯第一类错误的概率不超过给定的水平 α,即
α ( θ ) = P θ { x ∈ W } ≤ α , θ ∈ θ 0 α(θ) = P_θ \{ x ∈ W\} ≤ α, θ ∈ θ_0 α(θ)=Pθ{x∈W}≤α,θ∈θ0
由于决定检验拒绝域的临界值随着显著性水平的变化而变化,需要一个客观标准来避免因显著性水平的不同而结论相反。提出显著性概率,即p-值
显著性概率,p-值:基于给出的观察数据能作出拒绝原假设决定的最小显著性水平。既可以对任何大于 p 的显著性水平 α,作出拒绝原假设的决定。
假设检验的统计推断的基本原理本质上是一种带有概率性质的反证法。如果小概率事件发生,则在概率意义下与原假设矛盾,可以拒绝原假设。但如果小概率时间没有发生,接受原假设只能说没有拒绝原假设的理由,而并没有充分的理由断定原假设一定是成立的。
3.2 正态总体参数的假设检验
选择多种检验统计量,及其在原假设成立的条件下的趋势,确定拒绝域,从而进行假设检验。可用 z-检验、 χ 2 χ^2 χ2-检验、t-检验、F-检验。
- 单个正态总体方差已知时总体均值的检验:z-检验
- 单个正态总体方差未知时总体均值的检验:t-检验
- 单个正态总体方差的检验: χ 2 χ^2 χ2-检验
- 两个正态总体均值相等的检验
- 两个正态总体方差相等的检验
求解:forgetting how
3.3 Pearson 检验法
根据抽取的样本所提供的信息,对总体分布的各种假设进行检验。常用 Pearson 检验法,也称为 χ 2 χ^2 χ2 拟合检验法。
- 经验分布类型的检验
- 列联表独立性的检验
求解:forgetting how
3.4 似然比检验
前面针对具体的假设检验问题给出了不同的检验方法,这里提出一种一般的构造检验的方法:似然比检验方法。
定义似然比统计量:
λ ( x ) = s u p θ ∈ θ { p ( x 1 , x 2 , … … , x n ; θ ) } s u p θ ∈ θ 0 { p ( x 1 , x 2 , … … , x n ; θ ) } λ(x) = \frac { sup_{θ ∈ θ} \{ p(x_1, x_2, ……, x_n; θ) \} } { sup_{θ ∈ θ_0} \{ p(x_1, x_2, ……, x_n; θ) \} } λ(x)=supθ∈θ0{p(x1,x2,……,xn;θ)}supθ∈θ{p(x1,x2,……,xn;θ)}
当原假设成立时,λ(x) 应有偏小的趋势。
- 拒绝域: W = { ( x 1 , x 2 , … … , x n ) : λ ( x ) ≥ c } W = \{ (x_1, x_2, ……, x_n) : λ(x) ≥ c \} W={(x1,x2,……,xn):λ(x)≥c}
- 显著性水平: P θ 0 ( λ ( x ) ≥ c ) ≤ α P_{θ_0}(λ(x) ≥ c) ≤ α Pθ0(λ(x)≥c)≤α
- 若有未知参数:求其极大似然估计
似然比检验方法适用面广,且构造的检验具有一些优良性质。
3.5 检验的优良性
3.5.1 Neyman-Pearson 引理
其下为 λ(x) 是检验统计量的严格单增函数的最优势检验(MPT)的检验函数的形式,当其为严格单减时,不等式应改变方向。
连续型随机变量的最优势检验函数的形式:
φ ( x ) = { 1 , λ ( x ) ≥ k 0 , λ ( x ) < k φ(x)= \left\lbrace \begin{array}{c} 1, λ(x) ≥ k \\ 0, λ(x) < k \end{array} \right. φ(x)={1,λ(x)≥k0,λ(x)<k
离散型随机变量的最优势检验函数的形式:
φ ( x ) = { 1 , λ ( x ) > k α − P θ 0 { λ ( x ) > k } P θ 0 { λ ( x ) = k } , λ ( x ) = k 0 , λ ( x ) < k φ(x)= \left\lbrace \begin{array}{c} 1, λ(x) > k \\ \frac {α - P_{θ_0}\{ λ(x) > k \}} {P_{θ_0}\{ λ(x) = k \}}, λ(x) = k \\ 0, λ(x) < k \end{array} \right. φ(x)=⎩⎪⎨⎪⎧1,λ(x)>kPθ0{λ(x)=k}α−Pθ0{λ(x)>k},λ(x)=k0,λ(x)<k
3.5.2 一致最优势检验
对单侧假设检验问题, H 0 : θ ≤ θ 0 , H 1 : θ > θ 0 H_0: θ ≤ θ_0, H_1: θ > θ_0 H0:θ≤θ0,H1:θ>θ0,分解其联合密度函数或联合分布列为:
p ( x ; θ ) = d ( θ ) h ( x ) e x p { c ( θ ) T ( x ) } p(x; θ) = d(θ)h(x)exp\{c(θ)T(x)\} p(x;θ)=d(θ)h(x)exp{c(θ)T(x)}
若 c(θ) 严格单增,则一致最优势检验的形式如下,否则不等式应改变方向。
φ ( x ) = { 1 , T ( x ) > c r , T ( x ) = c 0 , T ( x ) < k φ(x)= \left\lbrace \begin{array}{c} 1, T(x) > c \\ r, T(x) = c \\ 0, T(x) < k \end{array} \right. φ(x)=⎩⎨⎧1,T(x)>cr,T(x)=c0,T(x)<k
其中 c 和 r 由 N-P 引理确定。
对假设检验问题, H 0 : θ ≥ θ 0 , H 1 : θ < θ 0 H_0: θ ≥ θ_0, H_1: θ < θ_0 H0:θ≥θ0,H1:θ<θ0,应先做转化为, H 0 : − θ ≤ − θ 0 , H 1 : − θ > − θ 0 H_0: -θ ≤ -θ_0, H_1: -θ > -θ_0 H0:−θ≤−θ0,H1:−θ>−θ0
3.5.3 一致最优势无偏检验
若一致最优势检验不存在,则可以添加无偏要求,求一致最优势无偏检验。显然,一致最优势检验一定是一致最优势无偏检验。
求解:forgetting how
考试题型
- 求似然比检验
- 求一致最优势检验
- 求犯第二类错误的概率
- 求势函数
标签:显著性,假设,假设检验,检验,数理统计,拒绝,拒绝域 来源: https://blog.csdn.net/qq_39384184/article/details/111938890