概率论与数理统计
作者:互联网
概率论:研究如何定量描述随机现象的发生可能性及其规律
数理统计:通过样本来对总体进行估计或者检验某个假设是否成立
对于随机现象的规律总结
概率:随机事件发生的可能性
概率模型
离散型:二项分布(多次放回重复试验,成功次数的分布概率)、泊松分布、几何分布(独立重复试验,首次成功为止试验次数的分布规律)、超几何分布(不放回抽样,抽中的次品次数的分布规律)
连续型:均匀分布、正态分布、指数分布(分布函数求导=密度函数(密度函数就相当于每个点的概率函数,但是连续型变量一个点的概率是没有意义的))
分析样本,了解总体
卡方分布:n个标准正态分布相加得到自由度为n的卡方分布
t分布:(X服从标准正态分布,Y服从自由度为n的卡方分布)
F分布:设X服从自由度为n1的卡方分布, Y服从自由度为n2的卡方分布,且X,Y独立,则称随机变量F=(X⁄n1 )/(Y⁄n2 )服从自由度为(n1,n2)的F分布,记为F~F(n1,n2)
大数定理
切比雪夫不等式:P(|X-E(X)|<a)>D(X)/a^2
二阶样本中心矩依概率收敛于总体方差
样本均值依概率收敛于总体均值
中心极限定理
当大量同分布的样本相加所得到的和分布近似正态分布,可以将其标准化,然后通过标准正态分布的分布函数图像来求解
参数估计:
有时候已知总体的分布类型或者分布函数但是其中有些未知量,就可以通过样本来对这些未知量进行估计
- 点估计:1.利用样本均值或方差(已知)估计总体均值或方差(包含未知参数),得到对未知参数的估计值。2.构造样本发生的似然函数(每个样本发生的概率乘积),既然样本发生了,就认为其概率为1,求出使其概率最大未知参数的值,这就是未知参数的估计量。
- 对于估计值好坏的评价:1.均方误差准则 E((估计值-真实值)^2)2.是否满足无偏性(E(估计值)=真实值),系统误差为0。(样本均值、方差是总体均值、方差的无偏估计)
- 区间估计:在某个给定的概率下,给出未知变量的一个估计区间。根据总体方差、均值的已知未知情况,构造不同的轴变量(正态(n),t(n-1),卡方(n-1)),由于轴变量的分布已知,根据给出的概率(置信水平1-α)求出对应的分位点,再由分位点求出区间值
假设检验(类似区间估计的思路)
依据样本,可以对总体的情况提出一些假设,而检验假设就是用于检验这些假设的可信度。
总的思路就是根据假设构造一个对假设的拒绝域,再根据总体方差、均值的已知未知情况,构造不同的轴变量(正态(n),t(n-1),卡方(n-1)),由于轴变量的分布已知,根据给出的拒绝域的概率(也就是显著性水平α),求出对应的分位点,再由分位点求出区间值,给出拒绝域,判断假设是否在拒绝域内,如果假设不在拒绝域内就认为在显著性水平α下原假设是正确的。
标签:概率,方差,样本,数理统计,分布,卡方,概率论,拒绝域 来源: https://blog.csdn.net/justgo3/article/details/122483149