概率统计基础及其R语言实现-2
作者:互联网
二、典型概率分布
2.1 离散型随机变量分布
- 伯努利分布(Bernouli)
- 二项分布(Binomial)
- 几何分布(Geometric)
- 负二项分布(Negative binomial)
- 泊松分布(poisson)
2.1.1 二项分布
二项分布可用来描述由n次随机试验组成的随机结果,它满足以下条件:
- 重复进行n次随机试验
- n次试验相互独立,即一次试验结果不对其他试验结果产生影响
- 每次试验结果仅有两种可能
- 每次试验成功概率为p,失败概率为1-p
假设我们重复某事件n次,每次试验只有A或B两种结果,A的概率为p,B的概率为1-p,则这n次试验的记录可能为:ABABAABBBAABB...BBAA,其中A有i个,则B有n-i个。因此每个这样的序列产生的可能性为:, 又因为这样的序列共有
由此可以得出:,i=0,1,2,...,n
X服从二项分布就记为X~B(n,p),二项分布是最重要的离散型概率分布之一。
均值:E(x)=np
方差:Var(X)=np(1-p)
标准差:(X)=[np(1-p)]
2.1.2 泊松分布
泊松分布可以用来描述以下随机变量:
- 在一定时间内,电话总站接错电话的次数
- 在一定时间内,其操作系统发生故障的次数
- 一个铸件上的缺陷数
- 一平方米玻璃上的气泡个数
- 一件产品因擦伤留下的痕迹数
- 一页书上的错字个数
由这些例子可以看出,泊松分布与计点过程相关联,并且是在一定时间范围内或一定区域内、一特定单位的前提下进行的,若用表示特定单位内的平均点数( >0),又令i表示某特定单位内实际出现的点数,则X取i值的概率为:
常记为X~P()。
均值:E(X)=
方差:Var(X)=
标准差:
2.1.3 特殊规律
泊松分布可作为二项分布的极限而推导得到,一般来说,若X~B(n,p)其中n很大,p很小,而=n p不太大时,X的分布接近于泊松分布,这个事实可以将有些较难计算的二项分布转化为泊松分布来计算。
2.2 连续型随机变量分布
- 均匀分布(uniform)
- 正态分布(Normal)
- 指数分布(exponential)
- 威布尔分布
2.2.1 正态分布
如果随机变量X的密度函数为:
则称随机变量X服从正态分布,记为X~N()。
正态分布的曲线是对称的钟形曲线,称为正态曲线。
正态分布含有两个参数,其中为正态分布的均值,它是正态分布的中心,X在附近取值的概率是最大的;是正态分布的方差,越大,分布越分散,反之分布越集中。由上图也可以发现,当越大是,函数图像越宽,分布越散。
决定正态曲线的位置,决定正态曲线的形状。
当我们固定标准差时,不同的均值,如<,对应的正态曲线完全相同,只有位置不同。固定均值时,不同的标准差,如<,对应的正态分布曲线位置相同,但形状(高矮胖瘦)不同。
且的正态分布较标准正态分布。
标签:泊松,概率,语言,试验,分布,二项分布,随机变量,正态分布,统计 来源: https://blog.csdn.net/BlancheXX/article/details/121662102