首页 > 其他分享> > 【数据科学基础复习 - 4】区间估计

【数据科学基础复习 - 4】区间估计

2022-01-01 16:05:55 作者：互联网

本文旨在熟练运用区间估计而不去探究其背后的原理

0. 区间估计思想

置信系数的理解: 区间\(U\)置信系数为\(95\%\)并不是说一个由给定样本确定的\(U\)包含待估计参数\(\theta\)的概率为\(95\%\), 因为样本确定后\(U\)是否包含\(\theta\)二者必居其一,是一个确定性的事件. 确切地说是反复抽样得到不同的\(U\), 其中有\(95\%\)的\(U\)包含\(\theta\)

这牵扯到对概率的理解, 日后进一步探究. 此处先暂且略过

1. 枢轴变量法

步骤：

找出一个与要估计参数\(g(\theta)\)有关的统计量\(T\),一般是良好的点估计(如正态中的\(\overline{X}\))
找出含\(T\)和\(g(\theta)\)的某一统计量\(S\),\(S\)的分布\(F\)应当与\(\theta\)无关
对于任何常数\(a<b,a\leq S\leq b\)要能改写为等价的形式\(A\leq g(\theta)\leq B\). 且\(A,B\)只与\(a,b\)有关而与\(\theta\)无关
取\(F\)的\(\alpha/2\)上分位点和\(1-\alpha/2\)上分位点即可

有关指数分布的一个有趣性质

若\(X\sim E(\lambda)\), 则\(2\lambda X\sim E(2)\). 因为\(E(2\lambda X)=2\lambda*\frac{1}{\lambda}=2\). 亦可通过随机变量的函数关系推得.

利用这一点则可采用枢轴变量法给出\(\lambda\)的参数估计区间

2. 大样本法

对于离散变量或分布未知的随机变量，无法直接求出一个枢轴变量. 如果样本量很大(\(n\geq 50\))此时就利用中心极限定理求解:

设\(X=\sum X_i\)

\[\frac{X-n\mu}{\sqrt{n\sigma^2}}\sim N(0,1) \]

必要时还可用样本方差\(S^2\)代替\(\sigma^2\)

对于二项分布和泊松分布需要解一个一元二次方程

3. 贝叶斯法

待考试完后补充...

标签：复习,样本,枢轴,估计,区间,theta,95,sim,lambda
来源： https://www.cnblogs.com/heiyan/p/15755521.html