其他分享
首页 > 其他分享> > 一维随机变量及其分布

一维随机变量及其分布

作者:互联网

随机变量及其分布

随机变量及其分布

离散化

将任意样本空间 Ω \Omega Ω的元素离散化,用实数 x 1 , x 2 . . . , x n x_1,x_2...,x_n x1​,x2​...,xn​代表这个n元素 ω 1 , ω , . . . , ω n \omega_1,\omega_,...,\omega_n ω1​,ω,​...,ωn​,其中 x i = X ( ω i ) x_i=X(\omega_i) xi​=X(ωi​), X X X为样本空间到实数域的单质实值函数
X : Ω → N X:\Omega\rightarrow \N X:Ω→N
X = X ( ω ) X=X(\omega) X=X(ω)即为随机变量

为什么引入随机变量这个概念?
我的理解:
设人群为 Ω \Omega Ω,任意 ω 0 ∈ Ω \omega_0\in\Omega ω0​∈Ω表示人群中的任意一个人 ω 0 \omega_0 ω0​,人群可能有很多属性值得研究,比如收入问题,年龄问题,但是现在只对人群的身高问题感兴趣,那么对每个人,多富多胖我都不关心,我只看他的身高,记 X = X ( ω ) X=X(\omega) X=X(ω)为对 ω \omega ω这个人取身高的函数. X 1 = X ( ω 1 ) X_1=X(\omega_1) X1​=X(ω1​)即表示第一个人的身高,以后的研究就 { X n } \{X_n\} {Xn​}这个集合上展开了

本章就建立在此之上

随机变量分布函数

定义 F ( x ) = P ( X ≤ x ) , x ∈ R F(x)=P(X≤x),x\in \R F(x)=P(X≤x),x∈R

一群人中随机挑选一个,求其身高在 180 c m 180cm 180cm以下的概率:
设人群为 Ω \Omega Ω,任意 ω ∈ Ω \omega\in\Omega ω∈Ω表示人群中的任意一个人 ω \omega ω,记 X = X ( ω ) X=X(\omega) X=X(ω)为对 ω \omega ω这个人取身高的函数
设样本空间为 Ω = { ω 1 , ω 2 , . . . , ω n } \Omega=\{\omega_1,\omega_2,...,\omega_n\} Ω={ω1​,ω2​,...,ωn​}通过取身高函数 X X X映射为 { X 1 , X 2 , . . . , X n } \{X_1,X_2,...,X_n\} {X1​,X2​,...,Xn​},问题转化为 { X 1 , X 2 , . . . , X n } \{X_1,X_2,...,X_n\} {X1​,X2​,...,Xn​}集合中小于180的个数占总个数n的比例

性质:

P ( x 1 < X ≤ x 2 ) = F ( x 2 ) − F ( x 1 ) P(x_1<X≤x_2)=F(x_2)-F(x_1) P(x1​<X≤x2​)=F(x2​)−F(x1​)
0 ≤ F ( x ) ≤ 1 , F ( − ∞ ) = 0 , F ( + ∞ ) = 1 0≤F(x)≤1,F(-\infin)=0,F(+\infin)=1 0≤F(x)≤1,F(−∞)=0,F(+∞)=1
F ( x ) F(x) F(x)单调不减
F ( x ) F(x) F(x)右连续

离散型随机变量及其分布律

离散型随机变量:有限或者可列无限

随机变量 X X X有有限多个或者可列无限多个时称为离散型随机变量

可列就是这个集合可以找到与自然数集N的双射函数。//可列
自然数集有无穷个元素,所以如果一个集合可以与N一一对应,自然也有无穷个元素。//无穷

研究离散型随机变量 X X X的统计规律就是要掌握 X X X所有可能的取值以及对应的概率

分布律 P ( X = x i ) = p i P(X=x_i)=p_i P(X=xi​)=pi​

分布律的两种表示:
1.表达式形式 P ( X = x i ) = p i , i = 1 , 2 , . . . P(X=x_i)=p_i,i=1,2,... P(X=xi​)=pi​,i=1,2,...
2.表格形式

X X X x 1 x_1 x1​ x 2 x_2 x2​
P P P p 1 p_1 p1​ p 2 p_2 p2​

性质:

∀ p i ≥ 0 , i = 1 , 2 , . . . \forall p_i≥0,i=1,2,... ∀pi​≥0,i=1,2,...
∑ i p i = 1 \sum_i p_i=1 ∑i​pi​=1

分布函数 F ( x ) = ∑ x i ≤ x P ( X = x i ) F(x)=\sum_{x_i≤x}P(X=x_i) F(x)=∑xi​≤x​P(X=xi​)

F ( x ) = P ( X ≤ x ) = ∑ x i ≤ x P ( X = x i ) F(x)=P(X≤x)=\sum_{x_i≤x}P(X=x_i) F(x)=P(X≤x)=xi​≤x∑​P(X=xi​)

分布模型

1.两点分布 P ( X = k ) = p k ( 1 − p ) 1 − k , k = 0 , 1 P(X=k)=p^k(1-p)^{1-k},k=0,1 P(X=k)=pk(1−p)1−k,k=0,1

X ∼ B ( 1 , p ) : X\sim B(1,p): X∼B(1,p):离散型随机变量X服从参数为p的两点分布

X X X取值要么0要么1只有这两种情况,取值为1的概率为p,由 ∑ p i = 1 \sum p_i=1 ∑pi​=1知取值为0的概率为1-p

2.二项分布 P ( X = k ) = C n k p k q n − k , q + p = 1 , k = 0 , 1 , 2 , . . . P(X=k)=C_n^kp^kq^{n-k},q+p=1,k=0,1,2,... P(X=k)=Cnk​pkqn−k,q+p=1,k=0,1,2,...

X ∼ B ( n , p ) : X\sim B(n,p): X∼B(n,p):离散型随机变量X服从参数为n,p的二项分布

当n=1时退化为两点分布 X ∼ B ( 1 , p ) X\sim B(1,p) X∼B(1,p)

参数意义:
n : n: n:n次独立重复试验
p : p: p:每次的成功概率都是p
分布律意义:n次试验中有k次试验是成功的概率

3.泊松分布

泊松定理 lim ⁡ n → ∞ C n k p k ( 1 − p ) n − k = λ k k ! e − λ \lim_{n\rightarrow \infin}C^k_np^k(1-p)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda} limn→∞​Cnk​pk(1−p)n−k=k!λk​e−λ

泊松定理在n很大时具有很好的拟合效果
设 λ > 0 \lambda>0 λ>0是一常数, n n n为任意正整数,满足 n p = λ np=\lambda np=λ,对任意非负常数 k k k,有:
lim ⁡ n → ∞ C n k p k ( 1 − p ) n − k = λ k k ! e − λ \lim_{n\rightarrow \infin}C^k_np^k(1-p)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda} n→∞lim​Cnk​pk(1−p)n−k=k!λk​e−λ

左 侧 = lim ⁡ n → ∞ n ( n − 1 ) ( n − 2 ) . . . ( n − k + 1 ) k ! ( λ n ) k ( 1 − λ n ) n ( 1 − λ n ) − k = lim ⁡ n → ∞ n k 1 ( 1 − 1 n ) ( 1 − 2 n ) . . . ( 1 − k − 1 n ) k ! ( λ n ) k ( 1 − λ n ) − n λ × ( − λ ) ( 1 − λ n ) − k = lim ⁡ n → ∞ λ k k ! e − λ = 右 侧 \begin{aligned} 左侧&= \lim_{n\rightarrow \infin}\frac{n(n-1)(n-2)...(n-k+1)}{k!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^n(1-\frac{\lambda}{n})^{-k}\\ &=\lim_{n\rightarrow \infin}\frac{n^k1(1-\frac{1}{n})(1-\frac{2}{n})...(1-\frac{k-1}{n})}{k!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{-\frac{n}{\lambda}\times{(-\lambda)}}(1-\frac{\lambda}{n})^{-k}\\ &=\lim_{n\rightarrow \infin}\frac{\lambda^k}{k!}e^{-\lambda}\\ &=右侧 \end{aligned} 左侧​=n→∞lim​k!n(n−1)(n−2)...(n−k+1)​(nλ​)k(1−nλ​)n(1−nλ​)−k=n→∞lim​k!nk1(1−n1​)(1−n2​)...(1−nk−1​)​(nλ​)k(1−nλ​)−λn​×(−λ)(1−nλ​)−k=n→∞lim​k!λk​e−λ=右侧​

泊松分布 P ( X = k ) = λ k k ! e − λ , λ > 0 , k = 0 , 1 , 2 , . . . P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda},\lambda>0,k=0,1,2,... P(X=k)=k!λk​e−λ,λ>0,k=0,1,2,...

根据泊松定理的形式,泊松分布可以看做二项分布时试验次数无穷大时的情形
X ∼ P ( λ ) : X\sim P(\lambda): X∼P(λ):离散型随机变量X服从参数为 λ \lambda λ的泊松分布

证明泊松分布满足离散型随机变量分布律的性质:
1.显然 λ k k ! e − λ > 0 \frac{\lambda^k}{k!}e^{-\lambda}>0 k!λk​e−λ>0
2.
∑ k = 0 ∞ λ k k ! e − λ = e − λ ∑ k = 0 ∞ λ k k ! \sum_{k=0}^\infin \frac{\lambda^k}{k!}e^{-\lambda}=e^{-\lambda}\sum_{k=0}^\infin \frac{\lambda^k}{k!} k=0∑∞​k!λk​e−λ=e−λk=0∑∞​k!λk​

g k ( x ) = ∑ k = 1 x k k ! , x > 0 , k ∈ N g_k(x)=\sum_{k=1}\frac{x^k}{k!},x>0,k\in N gk​(x)=k=1∑​k!xk​,x>0,k∈N
恰好为 e x e^x ex的麦克劳林展开式
g k ( x ) = ∑ k = 1 x k k ! = e x g_k(x)=\sum_{k=1}\frac{x^k}{k!}=e^x gk​(x)=k=1∑​k!xk​=ex
g k ( λ ) = e λ g_k(\lambda)=e^{\lambda} gk​(λ)=eλ
∑ k = 0 ∞ λ k k ! e − λ = e − λ ∑ k = 0 ∞ λ k k ! = e − λ e λ = 1 \sum_{k=0}^\infin \frac{\lambda^k}{k!}e^{-\lambda}=e^{-\lambda}\sum_{k=0}^\infin \frac{\lambda^k}{k!}=e^{-\lambda}e^\lambda=1 k=0∑∞​k!λk​e−λ=e−λk=0∑∞​k!λk​=e−λeλ=1

4.几何分布 P ( X = k ) = ( 1 − p ) k − 1 p      ( k = 1 , 2 , . . . ) P(X=k)=(1-p)^{k-1}p\ \ \ \ (k=1,2,...) P(X=k)=(1−p)k−1p    (k=1,2,...)

X ∼ G E ( p ) : X\sim GE(p): X∼GE(p):离散型随机变量X服从参数为p的几何分布

参数意义:
独立重复试验的成功概率为p,恰好在第k次试验成功,前k-1次均失败的概率

5.超几何分布 P ( X = k ) = C M k C N − M n − k C N n , k = 0 , 1 , . . . , m i n ( M , n ) P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},k=0,1,...,min(M,n) P(X=k)=CNn​CMk​CN−Mn−k​​,k=0,1,...,min(M,n)

X ∼ H ( n , M , N ) : X\sim H(n,M,N): X∼H(n,M,N):离散型随机变量 X X X服从参数为 n , M , N n,M,N n,M,N的超几何分布

参数意义:
一共有N件产品,其中有M件次品,从中任取n件取到次品数为X的概率为:
从 M 个 次 品 中 挑 出 k 个 的 组 合 数 × 从 N − M 个 正 品 中 挑 出 n − k 个 的 组 合 数 从 N 个 物 品 总 任 意 挑 出 n 个 的 组 合 数 \frac{从M个次品中挑出k个的组合数\times 从N-M个正品中挑出n-k个的组合数}{从N个物品总任意挑出n个的组合数} 从N个物品总任意挑出n个的组合数从M个次品中挑出k个的组合数×从N−M个正品中挑出n−k个的组合数​

超几何分布与二项分布的关系:

超几何分布实际上可以看做如下情形:

N个大小形状一模一样的球,其中有M个红球,N-M个黑球,从中任意不放回摸出n个球,求摸到的红球个数为k的概率

二项分布可以看做如下情形:

N个大小形状一模一样的球,其中有M个红球,N-M个黑球,从中任意放回摸出n个球,求摸到的红球个数为k的概率

两者的区别在于放回与否
如果不放回则每次试验相互独立,成功概率相同
如果放回则上一次试验一定会影响下一次试验的概率

因此分布律公式给出的时候二项分布的参数直接写的是固定的概率,
而超几何分布给出的是个数(没有固定概率)

但是当N趋向于无穷大时,也就是摸出来的n个球对于总数N来说稀松时,可以认为两种分布是等价的

在求取出的红球数的数学期望的时候两种分布情况的相同的:
将所有N个球不管颜色都打成粉末,摇匀,
二项分布模型每次取出一勺记下勺子中红黑粉量之后将这勺"球"倒回去
超几何分布模型每次取出一勺记下勺子中红黑粉量之后将这勺"球"吃了
显然已经摇匀的球粉倒不倒回去不会影响下一勺中红黑粉末的比重
那么摸出k个球相当于舀出k勺,其中红球数量的期望就是 k × M N k\times \frac{M}{N} k×NM​,黑球数量的期望就是 k × N − M N k\times \frac{N-M}{N} k×NN−M​

连续型随机变量及其概率密度

连续型随机变量

定义: F ( x ) = ∫ − ∞ x f ( t )   d t F(x)=\int_{-\infin}^xf(t)\,dt F(x)=∫−∞x​f(t)dt

其中 f ( t ) f(t) f(t)为 ( − ∞ , ∞ ) (-\infin,\infin) (−∞,∞)上的非负可积函数,称为X的概率密度函数,简称概率密度

概率密度的性质:

设 f ( x ) f(x) f(x)为连续型随机变量 X X X的概率密度

1.非负
2. ∫ − ∞ + ∞ f ( t )   d t = 1 \int_{-\infin}^{+\infin}f(t)\,dt=1 ∫−∞+∞​f(t)dt=1
3. P ( a < x ≤ b ) = ∫ a b f ( t )   d t P(a<x≤b)=\int_{a}^{b}f(t)\,dt P(a<x≤b)=∫ab​f(t)dt
4. f ( x ) f(x) f(x)的连续点处有 F ′ ( x ) = f ( x ) F'(x)=f(x) F′(x)=f(x)
5.有概率密度的离散型随机变量的分布函数一定连续
6.单点处概率为0, P ( x = x 0 ) = ∫ x 0 x 0 f ( t )   d t = 0 P(x=x_0)=\int_{x_0}^{x_0}f(t)\,dt=0 P(x=x0​)=∫x0​x0​​f(t)dt=0

不可能事件概率一定为0,但是概率为0的不一定是不可能事件

分布模型

1.均匀分布 X ∼ U ( a , b ) X\sim U(a,b) X∼U(a,b)

概 率 密 度 f ( x ) = { 1 b − a , a < x ≤ b 0 , x ≤ a 或 x > b 概率密度f(x)= \begin{cases} \frac{1}{b-a},a<x≤b\\ 0,x≤a或x>b \end{cases} 概率密度f(x)={b−a1​,a<x≤b0,x≤a或x>b​
分 布 函 数 F ( x ) = ∫ f ( x )   d x = { 0 , x < a x − a b − a , a < x ≤ b 1 , x > b 分布函数F(x)=\int f(x)\,dx=\begin{cases}0,x<a\\ \frac{x-a}{b-a},a<x≤b\\ 1,x>b \end{cases} 分布函数F(x)=∫f(x)dx=⎩⎪⎨⎪⎧​0,x<ab−ax−a​,a<x≤b1,x>b​

2.正态分布 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2)

概 率 密 度 f ( x ) = 1 2 π e − ( x − μ ) 2 2 σ 2 , − ∞ < x < + ∞ 概率密度f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}},-\infin<x<+\infin 概率密度f(x)=2π ​1​e−2σ2(x−μ)2​,−∞<x<+∞
分 布 函 数 F ( x ) = ∫ f ( x )   d x 分布函数F(x)=\int f(x)\,dx 分布函数F(x)=∫f(x)dx

标准正态分布 X ∼ N ( 0 , 1 ) X\sim N(0,1) X∼N(0,1)

概 率 密 度 ϕ ( x ) = 1 2 π e − x 2 2 概率密度\phi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} 概率密度ϕ(x)=2π ​1​e−2x2​
分 布 函 数 Φ ( x ) = ∫ ϕ ( x )   d x 分布函数\Phi(x)=\int \phi(x)\,dx 分布函数Φ(x)=∫ϕ(x)dx

Φ ( − x ) = 1 − Φ ( x ) \Phi(-x)=1-\Phi(x) Φ(−x)=1−Φ(x)
标准化 Z = X − μ σ Z=\frac{X-\mu}{\sigma} Z=σX−μ​

正态分布转化为标准正态分布:
设 X ∼ N ( μ , σ ) X\sim N(\mu,\sigma) X∼N(μ,σ),
则 Z = X − μ σ ∼ N ( 0 , 1 ) Z=\frac{X-\mu}{\sigma}\sim N(0,1) Z=σX−μ​∼N(0,1)称Z为X的标准化

3 σ \sigma σ规则
X范围概率
( μ − σ , μ + σ ) (\mu-\sigma,\mu+\sigma) (μ−σ,μ+σ)0.6526
( μ − 2 σ , μ + 2 σ ) (\mu-2\sigma,\mu+2\sigma) (μ−2σ,μ+2σ)0.9544
( μ − 3 σ , μ + 3 σ ) (\mu-3\sigma,\mu+3\sigma) (μ−3σ,μ+3σ)0.9974

3.指数分布 X ∼ E ( λ ) X\sim E(\lambda) X∼E(λ)

概 率 密 度 f ( x ) = { λ e − λ x , x ≥ 0 0 , x < 0 概率密度f(x)=\begin{cases} \lambda e^{-\lambda x},x≥0\\ 0,x<0 \end{cases} 概率密度f(x)={λe−λx,x≥00,x<0​
分 布 函 数 F ( x ) = ∫ f ( x ) d x = { 1 − e − λ x , x ≥ 0 0 , x < 0 分布函数F(x)=\int f(x)dx=\begin{cases} 1-e^{-\lambda x},x≥0 \\0,x<0 \end{cases} 分布函数F(x)=∫f(x)dx={1−e−λx,x≥00,x<0​

无记忆性 P ( X > ( s + t ) ∣ X > s ) = P ( X > t ) P(X>(s+t)|X>s)=P(X>t) P(X>(s+t)∣X>s)=P(X>t)

标签:...,frac,及其,infin,分布,一维,随机变量,lambda
来源: https://blog.csdn.net/qq_26131031/article/details/120677329