概率论_十 统计量一
作者:互联网
前言:
目录:
1: 总体和样本
2: 统计量和常用统计量
3: 分布(卡方分部 )
4: t 分布和 F分布
一 总体和样本
例:
要研究某校5000个学生的身高
目的: 用部分的数据推断出总体未知参数
总体: 研究的对象全体,5000个学生
个体: 总体中的成员。 例如某个学生的身高,
总体容量: 总体中包含的个体数,如上是5000
有限总体: 容量有限
无限总体: 容量无限
样本:总体中抽取一部分个体,根据这部分个体的数据,并利用概率论知识作出分析和腿短,被抽取的部分个体叫做样本。
抽样方式:
放回抽样, 总体容量有限
不放回抽样: 总体容量很大,或者无限大
样本性质:
与X 同分布,独立且为随机变量
总体的某个指标X,可以看作一个随机变量, 也简称X为总体。
分布函数 : F(X)
二 统计量 常用统计量
从样本中提取有用信息来研究总体的分布以及各种特征数
统计量:
样本总不含有任何未知参数的函数
设为样本,若不含有任何未知参数,则称 为统计量
2.1 常用样本统计量
样本均值:
样本方差:
样本标准差:
样本k阶矩 :
样本k阶中心矩
例子:
总体为 88,75,70,63 ,总体的均值为74, 方差为83.5
从中随机抽样两个数据,求样本均值,样本方差,样本k阶矩
import numpy as np
#获取样本特征
def GetSample(data):
m= len(data)
for i in range(m):
for j in range(m):
a = data[i]
b = data[j]
sample = [a,b]
u = np.mean(sample)
c = np.power(a-u,2)+np.power(b-u,2)
var = c
kMartrix = c/2
print("\n 样本: ",sample,"\t 样本均值 ",u,"\t 样本方差 ",var,"\t 样本2阶中心矩 ",kMartrix)
#获取总体特征
def GetTotal(data):
u = np.mean(data)
var = np.var(data)
print("\n 总体均值 x: ",u,"\t 总体方差: ",var)
data= [88,75,70,63]
GetTotal(data)
GetSample(data)
===============================
总体均值 x: 74.0 总体方差: 83.5
样本: [88, 88] 样本均值 88.0 样本方差 0.0 样本2阶中心矩 0.0
样本: [88, 75] 样本均值 81.5 样本方差 84.5 样本2阶中心矩 42.25
样本: [88, 70] 样本均值 79.0 样本方差 162.0 样本2阶中心矩 81.0
样本: [88, 63] 样本均值 75.5 样本方差 312.5 样本2阶中心矩 156.25
样本: [75, 88] 样本均值 81.5 样本方差 84.5 样本2阶中心矩 42.25
样本: [75, 75] 样本均值 75.0 样本方差 0.0 样本2阶中心矩 0.0
样本: [75, 70] 样本均值 72.5 样本方差 12.5 样本2阶中心矩 6.25
样本: [75, 63] 样本均值 69.0 样本方差 72.0 样本2阶中心矩 36.0
样本: [70, 88] 样本均值 79.0 样本方差 162.0 样本2阶中心矩 81.0
样本: [70, 75] 样本均值 72.5 样本方差 12.5 样本2阶中心矩 6.25
样本: [70, 70] 样本均值 70.0 样本方差 0.0 样本2阶中心矩 0.0
样本: [70, 63] 样本均值 66.5 样本方差 24.5 样本2阶中心矩 12.25
样本: [63, 88] 样本均值 75.5 样本方差 312.5 样本2阶中心矩 156.25
样本: [63, 75] 样本均值 69.0 样本方差 72.0 样本2阶中心矩 36.0
样本: [63, 70] 样本均值 66.5 样本方差 24.5 样本2阶中心矩 12.25
样本: [63, 63] 样本均值 63.0 样本方差 0.0 样本2阶中心矩 0.0
二 卡方分布
2.1 定义
设随机变量相互独立,都服从N(0,1)分布
服从自由度为n的卡方分布,记作
自由度: 右端包含独立变量的个数n
2.1 Gamma 函数
性质
证明: 使用分部积分和洛必达法则可得:
其他的同理: 前半部分为0(洛必达法则),后半部分前一部分*n(分部积分)
第二类Gamma 函数
所以
2.3 卡方函数的概率密度
要证明上式:
主要分为两步证明:
--------------------------step1 ---------------------------------------
a: , ,求Y得概率密度
证明:
求导后
带入正态分布后
----------------step2 伽玛函数的可加性性质 -------------------------------------------
单个密度函数定义如下:
记作 , 可以看出 服从 的分布
再证明 下面两个卡方分布的性质
其X,Y复杂伽玛分布
,记作
, 记作
则 的伽玛分布
证明:
令
令 为一个常数
根据
令
所以
2.3 卡方概率密度函数的图形(自由度1,4,10,20)
随着自由度增大,峰值右移动
2.5 卡方函数的性质
1 E(X)=1
证明:
因为
所以
2 D(X) = 2
证明:
其中:
则:
所以
3: ,且相互独立,则
,可以推广到m个随机变量
2.6 上分位数
给定 ,,称满足
的点 为卡方分布的上分位数,如下图其实就是阴影部分的面积。后面假设检验里面,一般取值很小0.05左右
2.6 应用例子
例1: , 为随机采样的样本
求
令:
则: 服从自由度为n的卡方分布
例子2: 手上有5个手机,每个手机开机时间都符合正态分布,则
每个手机开机时间标准化后,其和也符合卡方分布
例3: 一个病人,有5个指标,每次检验结果都不一样,都符合正态分布,则
每个指标标准化后,其和符合卡方分布
标签:总体,7D%,中心矩,方差,样本,样本均值,概率论,统计 来源: https://blog.csdn.net/chengxf2/article/details/114287236