【数据科学基础复习 - 4】区间估计
作者:互联网
本文旨在熟练运用区间估计而不去探究其背后的原理
0. 区间估计思想
置信系数的理解: 区间\(U\)置信系数为\(95\%\)并不是说一个由给定样本确定的\(U\)包含待估计参数\(\theta\)的概率为\(95\%\), 因为样本确定后\(U\)是否包含\(\theta\)二者必居其一,是一个确定性的事件. 确切地说是反复抽样得到不同的\(U\), 其中有\(95\%\)的\(U\)包含\(\theta\)
这牵扯到对概率的理解, 日后进一步探究. 此处先暂且略过
1. 枢轴变量法
步骤:
- 找出一个与要估计参数\(g(\theta)\)有关的统计量\(T\),一般是良好的点估计(如正态中的\(\overline{X}\))
- 找出含\(T\)和\(g(\theta)\)的某一统计量\(S\),\(S\)的分布\(F\)应当与\(\theta\)无关
- 对于任何常数\(a<b,a\leq S\leq b\)要能改写为等价的形式\(A\leq g(\theta)\leq B\). 且\(A,B\)只与\(a,b\)有关而与\(\theta\)无关
- 取\(F\)的\(\alpha/2\)上分位点和\(1-\alpha/2\)上分位点即可
有关指数分布的一个有趣性质
若\(X\sim E(\lambda)\), 则\(2\lambda X\sim E(2)\). 因为\(E(2\lambda X)=2\lambda*\frac{1}{\lambda}=2\). 亦可通过随机变量的函数关系推得.
利用这一点则可采用枢轴变量法给出\(\lambda\)的参数估计区间
2. 大样本法
对于离散变量或分布未知的随机变量,无法直接求出一个枢轴变量. 如果样本量很大(\(n\geq 50\))此时就利用中心极限定理求解:
设\(X=\sum X_i\)
\[\frac{X-n\mu}{\sqrt{n\sigma^2}}\sim N(0,1) \]必要时还可用样本方差\(S^2\)代替\(\sigma^2\)
对于二项分布和泊松分布需要解一个一元二次方程
3. 贝叶斯法
待考试完后补充...
标签:复习,样本,枢轴,估计,区间,theta,95,sim,lambda 来源: https://www.cnblogs.com/heiyan/p/15755521.html