首页 > 其他分享> > 随机变量、分布函数

随机变量、分布函数

2022-02-06 23:02:34 作者：互联网

随机变量

定义：对样本空间，有一个实值函数X=X(w)，使每个实验结果关联一个特定的数，这种实验结果与数的对应关系形成随机变量。我们将实验结果所对应的数称为随机变量的取值。（简单的说每个实验结果用一个数来表示，这样在数学上比较方便）

对随机变量进行分类有：离散型随机变量、非离散型随机变量。
所谓离散型随机变量就是这个实值函数的取值范围是有限多个，或者无限可列个（如0，1，-1，2，-2……）；而非离散型随机变量则主要关注连续型，取值为一个或多个区间。

离散型随机变量及其概率分布

对X的所有可列个取值 xk (k=1,2,3...)

\[P(X=xk)=pk \]

称为X的概率函数（分布律、分布列）
将其表格形式称为概率分布表
如：

X	0	1
P	1/2	1/2

画成图像称为概率分布图
See the source image
图中所有线段的长度相加为1（全集)

连续型随机变量及其概率密度函数

和离散型类似，但是此时是在连续区间上进行讨论
通常用频率分布直方图来表示：

频率分布直方图(统计学图形)_搜狗百科

注意纵坐标为频率/组距
1）每个矩形的面积为该组的频率
2）所有矩形的面积和为1
3）介于x=a,x=b之间矩形的面积近似于(a,b]的频率

随着组距越来越小，图像越来越像光滑曲线，设曲线解析式为y=f(x)，则将f称为概率分布密度函数

See the source image

严谨定义：若非负可积函数f(x)，且f(x)>=0（因为频率肯定大于等于0），对任何a<=b，P{a<x<=b}等于f(x)从a到b的积分，则称f(x)为x的概率分布密度函数

1）f(x)>=0
2）f(x)从负无穷大到正无穷大积分和为1
3）连续变量取个别值的概率为0

由3）可知，连续型随机变量区间端点有没有无所谓
由此观之：
概率为0的事件未必是不可能事件
概率为1的事件未必是必然事件

因为f(x)可积，所有用积分的方式求区间的概率，注意f(x)和所求区间之间的关系，避免求错
例如：求

\[f(x)=-0.5x+1(0<x<=2)\\0(其余部分) \]

从1.5到2.5的积分，要注意到2到2.5的概率为0，不要用-0.5x+1带入。

前文提到过，连续变量取个别值的概率为0，那么概率函数的值的意义究竟是什么呢？
f(x)的值为X取x附近值的概率大小

分布函数

在离散型随机变量的连续区间上，定义F(x)，使得

\[F(x)=P(X<=x) \]

即X取值不超过x的概率
则称F(x)为X的分布函数

性质：
1）0<=F(x)<=1，-∞<x<+∞
2）F(x)是一个不减函数，即若x1<x2则F(x1)<=F(x2)
F(+∞)=1,F(-∞)=0,这个性质用于求参数

例如：

\[F(x)=a-e^{-x} \]
F(+∞)=a=1，得a=1

3）F(x)右连续
离散型为右连续，连续型不仅右连续而且连续

注：右连续是指函数在一点右侧连续，若一元函数f在x0处的右极限为f(x0)，即f(x0+0)=f(x0)，则称f在x0处右连续。函数f在x0处右连续是函数f在x0处连续的必要不充分条件。当函数f在x0处既左连续又右连续时，函数f在x0处连续。

由此观之，有：
1）P{x<=a}=F(a)
2）P{x>a}=1-P{x<=a}=1-F(a)
3）P{a<x<=b}=P{x<=b}-P{x<=a}=F(b)-F(a)
4）P{x=a}=F(a)-F(a-0) (注：F(a)相当于x≤a，也就是-∞到a的长度，而点的长度是0，F（a-0）相当于把a的长度减去，即x<a)
5）P{a<=x<=b}=F(b)-F(a-0)
6）P{x<a}=F(a-0)
7）P{x>=a}=1-P{x<a}=1-F(a-0)
前文提到连续变量的取个别值的概率为0，取不取端点无所谓，以上七个公式针对的是离散型随机变量

离散型随机变量的分布函数

《概率论与数理统计》教学视频全集（宋浩）：16m~32m
这是一个概率逐步累积的过程

已知分布函数求概率函数

间断点xk（即区间端点）是X的取值
P{X=xk}=F(xk)-F(xk-0)

连续型随机变量的分布函数

对于连续型随机变量，F(x)等于从负无穷到x对随机变量函数f(x)求积分
即F'(x)=f(x)
前文提到连续变量的取个别值的概率为0，取不取端点无所谓，给计算带来很大便利

标签：概率,函数,离散,分布,连续,x0,随机变量
来源： https://www.cnblogs.com/exungsh/p/15866565.html