非参数统计:第四章 多样本数据
作者:互联网
完全随机区组设计
Kruskal-Wallis秩和检验
基本思想
将多个样本数据混合,得到样本平均秩应与总平均秩差异不大。
检验步骤
第一步:提出原假设
\(H_0:\theta_1=\theta_2=...=\theta_n\);\(H_1:\theta\)不全相等;
第二步:构造检验统计量
- 将多个样本混合后并排序
- 按照每个样本求样本秩和\(R_i\),并计算样本平均秩\(\overline{R_i}=R_i/n_i\)
- 构造K-W统计量:\(H=\dfrac{12}{N(N+1)}\sum_{i=1}^kn_i(\overline{R_i}-\overline{R})^2=\dfrac{12}{N(N+1)}\sum_{i=1}^k\dfrac{R_i^2}{n_i}-3(N+1)\)
第三步:计算伴随概率
\(k=3\),\(n_i\leq 5\)时,可查表确定临界值。
第四步:做出统计推断
略
大样本近似检验
\(F^*=\dfrac{(N-k)H}{(k-1)(N-1-H)}\sim F(k-1,N-k)\)
Jonckheere-Terpstra检验
基本思想
通过混合秩检验样本趋势,思路类似Mann-Whitney统计量。
检验步骤
第一步:提出原假设
\(H_0:\theta_1=...=\theta_k\),\(H_1:\theta_1\leq ... \leq\theta_k\);
第二步:构造检验统计量
\(U_{ij}=\)样本\(i\)中观测值小于样本\(j\)中观测值的个数
\(J=\sum_{i\leq j}U_{ij}\)
第三步:计算伴随概率
查表确定临界值。
第四步:做出统计推断
略
大样本近似检验
在大样本条件下,\(J\)统计量近似服从正态分布:
\(J\sim N((N^2-\sum_{i=1}^{k}n_i^2)/4,[N^2(2N+3)-\sum_{i=1}^{k}n_i^2(2n_i+3)]/72)\)
检验时需注意按照备择假设调整数据顺序
完全区组设计
Friedman秩和检验
基本思想
首先在\(j\)个区组内求秩,再按\(i\)个处理求和。即在K-W检验的基础上先进行区组排序。
检验步骤
第一步:提出原假设
\(H_0:\theta_1=\theta_2=...=\theta_k\);\(H_1:\theta\)不全相等;
第二步:构造检验统计量
- 将多个样本混合后并按区组排序\(R_{ij}\)
- 按照每个处理求样本秩和\(R_i=\sum_{j=1}^{b}R_{ij}\)
- 构造Friedman统计量:\(Q=\dfrac{12}{bk(k+1)}\sum_{i=1}^k(R_i-\dfrac{b(k+1)}{2})^2=\dfrac{12}{bk(k+1)}\sum_{i=1}^k R_i^2-3b(k+1)\)
第三步:计算伴随概率
查表确定临界值。
第四步:做出统计推断
略
大样本近似检验
对于固定\(k\),当\(b\rightarrow \infty\)时,在零假设下有:\(Q\rightarrow \chi^2(k-1)\)
Kendall协同系数检验
基本思想
对不同个体的评价进行一致性/随机性检验,与Friedman秩和检验排序方式不同,但统计量的构造思路相似。
检验步骤
第一步:提出原假设
\(H_0\):对不同个体的评价不相关/是随机的;\(H_1\):对不同个体的评价非随机/是一致的;
第二步:构造检验统计量
- 将多个样本混合后并按j评价排序\(R_{ij}\)(第\(i\)个个体在第\(j\)个评价中的排序)
- 按照每个评价求样本秩和\(R_i=\sum_{j=1}^{m}R_{ij}\)
- 构造Kendall统计量:\(W = \dfrac{12S}{m^2(n^3-n)}=\sum_{i=1}^{n}(R_i-\dfrac{m(n+1)}{2})^2/m^2(n^3-n)\)
第三步:计算伴随概率
查表确定临界值。
第四步:做出统计推断
略
大样本近似检验
对于固定\(m\),当\(n\rightarrow \infty\)时,在零假设下有:\(m(n-1)W\rightarrow \chi^2(k-1)\)
二元数据检验(Cochran检验)
基本思想
认为区组观测值的和固定为\(L_i\),而这些观测值在各个处理之间等概率随机分配。通过比较各个处理观测值的和与总观测值的平均值,检验各个处理之间的一致性。
检验步骤
第一步:提出原假设
\(H_0:\theta_1=\theta_2=...=\theta_k\);\(H_1:\theta\)不全相等;
第二步:构造检验统计量
\(Q=\dfrac{k(k-1)\sum_{i=1}{k}(N_i-\overline{N})^2}{kN-\sum_{j=1}{b}L_j^2}\)
其中\(L_j\)为区组观测值求和,\(N_i\)为处理观测值求和,\(\overline{N}=\dfrac{1}{k}\sum_{i=1}^{k}{N_i}\)
第三步:计算伴随概率
第四步:做出统计推断
略
大样本近似检验
对于固定\(k\),当\(b\rightarrow \infty\)时,在零假设下有:\(Q\rightarrow \chi^2(k-1)\)
Page检验
基本思想
首先在\(j\)个区组内求秩,再按\(i\)个处理求和。思路类似Friedman秩和检验。
检验步骤
第一步:提出原假设
\(H_0:\theta_1=...=\theta_k\),\(H_1:\theta_1\leq ... \leq\theta_k\);
第二步:构造检验统计量
- 将多个样本混合后并按区组排序\(R_{ij}\)
- 按照每个处理求样本秩和\(R_i=\sum_{j=1}^{b}R_{ij}\)
- 构造统计量:\(L=\sum_{i=1}^{k}iR_i\)
第三步:计算伴随概率
查表确定临界值。
第四步:做出统计推断
略
大样本近似检验
在大样本条件下,统计量近似服从正态分布:
\(L\sim N(\dfrac{bk(k+1)^2}{4},\dfrac{b(k^3-k)^2}{144(k-1)})\)
检验时需注意按照备择假设调整数据顺序
标签:dfrac,sum,样本,检验,参数,统计,theta,多样,第四章 来源: https://www.cnblogs.com/Easterlin/p/16376939.html