一维随机变量及其分布
作者:互联网
随机变量及其分布
随机变量及其分布
- 随机变量及其分布
- 离散化
- 离散型随机变量及其分布律
- 离散型随机变量:有限或者可列无限
- 分布律 P ( X = x i ) = p i P(X=x_i)=p_i P(X=xi)=pi
- 分布函数 F ( x ) = ∑ x i ≤ x P ( X = x i ) F(x)=\sum_{x_i≤x}P(X=x_i) F(x)=∑xi≤xP(X=xi)
- 分布模型
- 1.两点分布 P ( X = k ) = p k ( 1 − p ) 1 − k , k = 0 , 1 P(X=k)=p^k(1-p)^{1-k},k=0,1 P(X=k)=pk(1−p)1−k,k=0,1
- 2.二项分布 P ( X = k ) = C n k p k q n − k , q + p = 1 , k = 0 , 1 , 2 , . . . P(X=k)=C_n^kp^kq^{n-k},q+p=1,k=0,1,2,... P(X=k)=Cnkpkqn−k,q+p=1,k=0,1,2,...
- **3.泊松分布**
- 泊松定理 lim n → ∞ C n k p k ( 1 − p ) n − k = λ k k ! e − λ \lim_{n\rightarrow \infin}C^k_np^k(1-p)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda} limn→∞Cnkpk(1−p)n−k=k!λke−λ
- 泊松分布 P ( X = k ) = λ k k ! e − λ , λ > 0 , k = 0 , 1 , 2 , . . . P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda},\lambda>0,k=0,1,2,... P(X=k)=k!λke−λ,λ>0,k=0,1,2,...
- 4.几何分布 P ( X = k ) = ( 1 − p ) k − 1 p ( k = 1 , 2 , . . . ) P(X=k)=(1-p)^{k-1}p\ \ \ \ (k=1,2,...) P(X=k)=(1−p)k−1p (k=1,2,...)
- 5.超几何分布 P ( X = k ) = C M k C N − M n − k C N n , k = 0 , 1 , . . . , m i n ( M , n ) P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},k=0,1,...,min(M,n) P(X=k)=CNnCMkCN−Mn−k,k=0,1,...,min(M,n)
- 连续型随机变量及其概率密度
- 连续型随机变量
- 定义: F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infin}^xf(t)\,dt F(x)=∫−∞xf(t)dt
- 概率密度的性质:
- 1.非负
- 2. ∫ − ∞ + ∞ f ( t ) d t = 1 \int_{-\infin}^{+\infin}f(t)\,dt=1 ∫−∞+∞f(t)dt=1
- 3. P ( a < x ≤ b ) = ∫ a b f ( t ) d t P(a<x≤b)=\int_{a}^{b}f(t)\,dt P(a<x≤b)=∫abf(t)dt
- 4. f ( x ) f(x) f(x)的连续点处有 F ′ ( x ) = f ( x ) F'(x)=f(x) F′(x)=f(x)
- 5.有概率密度的离散型随机变量的分布函数一定连续
- ==6.单点处概率为0, P ( x = x 0 ) = ∫ x 0 x 0 f ( t ) d t = 0 P(x=x_0)=\int_{x_0}^{x_0}f(t)\,dt=0 P(x=x0)=∫x0x0f(t)dt=0==
- 分布模型
离散化
将任意样本空间
Ω
\Omega
Ω的元素离散化,用实数
x
1
,
x
2
.
.
.
,
x
n
x_1,x_2...,x_n
x1,x2...,xn代表这个n元素
ω
1
,
ω
,
.
.
.
,
ω
n
\omega_1,\omega_,...,\omega_n
ω1,ω,...,ωn,其中
x
i
=
X
(
ω
i
)
x_i=X(\omega_i)
xi=X(ωi),
X
X
X为样本空间到实数域的单质实值函数
X
:
Ω
→
N
X:\Omega\rightarrow \N
X:Ω→N
X
=
X
(
ω
)
X=X(\omega)
X=X(ω)即为随机变量
为什么引入随机变量这个概念?
我的理解:
设人群为 Ω \Omega Ω,任意 ω 0 ∈ Ω \omega_0\in\Omega ω0∈Ω表示人群中的任意一个人 ω 0 \omega_0 ω0,人群可能有很多属性值得研究,比如收入问题,年龄问题,但是现在只对人群的身高问题感兴趣,那么对每个人,多富多胖我都不关心,我只看他的身高,记 X = X ( ω ) X=X(\omega) X=X(ω)为对 ω \omega ω这个人取身高的函数. X 1 = X ( ω 1 ) X_1=X(\omega_1) X1=X(ω1)即表示第一个人的身高,以后的研究就 { X n } \{X_n\} {Xn}这个集合上展开了
本章就建立在此之上
随机变量分布函数
定义 F ( x ) = P ( X ≤ x ) , x ∈ R F(x)=P(X≤x),x\in \R F(x)=P(X≤x),x∈R
一群人中随机挑选一个,求其身高在 180 c m 180cm 180cm以下的概率:
设人群为 Ω \Omega Ω,任意 ω ∈ Ω \omega\in\Omega ω∈Ω表示人群中的任意一个人 ω \omega ω,记 X = X ( ω ) X=X(\omega) X=X(ω)为对 ω \omega ω这个人取身高的函数
设样本空间为 Ω = { ω 1 , ω 2 , . . . , ω n } \Omega=\{\omega_1,\omega_2,...,\omega_n\} Ω={ω1,ω2,...,ωn}通过取身高函数 X X X映射为 { X 1 , X 2 , . . . , X n } \{X_1,X_2,...,X_n\} {X1,X2,...,Xn},问题转化为 { X 1 , X 2 , . . . , X n } \{X_1,X_2,...,X_n\} {X1,X2,...,Xn}集合中小于180的个数占总个数n的比例
性质:
P ( x 1 < X ≤ x 2 ) = F ( x 2 ) − F ( x 1 ) P(x_1<X≤x_2)=F(x_2)-F(x_1) P(x1<X≤x2)=F(x2)−F(x1)
0 ≤ F ( x ) ≤ 1 , F ( − ∞ ) = 0 , F ( + ∞ ) = 1 0≤F(x)≤1,F(-\infin)=0,F(+\infin)=1 0≤F(x)≤1,F(−∞)=0,F(+∞)=1
F ( x ) F(x) F(x)单调不减
F ( x ) F(x) F(x)右连续
离散型随机变量及其分布律
离散型随机变量:有限或者可列无限
随机变量 X X X有有限多个或者可列无限多个时称为离散型随机变量
可列就是这个集合可以找到与自然数集N的双射函数。//可列
自然数集有无穷个元素,所以如果一个集合可以与N一一对应,自然也有无穷个元素。//无穷
研究离散型随机变量 X X X的统计规律就是要掌握 X X X所有可能的取值以及对应的概率
分布律 P ( X = x i ) = p i P(X=x_i)=p_i P(X=xi)=pi
分布律的两种表示:
1.表达式形式
P
(
X
=
x
i
)
=
p
i
,
i
=
1
,
2
,
.
.
.
P(X=x_i)=p_i,i=1,2,...
P(X=xi)=pi,i=1,2,...
2.表格形式
X X X | x 1 x_1 x1 | x 2 x_2 x2 | … |
---|---|---|---|
P P P | p 1 p_1 p1 | p 2 p_2 p2 | … |
性质:
∀ p i ≥ 0 , i = 1 , 2 , . . . \forall p_i≥0,i=1,2,... ∀pi≥0,i=1,2,...
∑ i p i = 1 \sum_i p_i=1 ∑ipi=1
分布函数 F ( x ) = ∑ x i ≤ x P ( X = x i ) F(x)=\sum_{x_i≤x}P(X=x_i) F(x)=∑xi≤xP(X=xi)
F ( x ) = P ( X ≤ x ) = ∑ x i ≤ x P ( X = x i ) F(x)=P(X≤x)=\sum_{x_i≤x}P(X=x_i) F(x)=P(X≤x)=xi≤x∑P(X=xi)
分布模型
1.两点分布 P ( X = k ) = p k ( 1 − p ) 1 − k , k = 0 , 1 P(X=k)=p^k(1-p)^{1-k},k=0,1 P(X=k)=pk(1−p)1−k,k=0,1
X ∼ B ( 1 , p ) : X\sim B(1,p): X∼B(1,p):离散型随机变量X服从参数为p的两点分布
X X X取值要么0要么1只有这两种情况,取值为1的概率为p,由 ∑ p i = 1 \sum p_i=1 ∑pi=1知取值为0的概率为1-p
2.二项分布 P ( X = k ) = C n k p k q n − k , q + p = 1 , k = 0 , 1 , 2 , . . . P(X=k)=C_n^kp^kq^{n-k},q+p=1,k=0,1,2,... P(X=k)=Cnkpkqn−k,q+p=1,k=0,1,2,...
X ∼ B ( n , p ) : X\sim B(n,p): X∼B(n,p):离散型随机变量X服从参数为n,p的二项分布
当n=1时退化为两点分布 X ∼ B ( 1 , p ) X\sim B(1,p) X∼B(1,p)
参数意义:
n : n: n:n次独立重复试验
p : p: p:每次的成功概率都是p
分布律意义:n次试验中有k次试验是成功的概率
3.泊松分布
泊松定理 lim n → ∞ C n k p k ( 1 − p ) n − k = λ k k ! e − λ \lim_{n\rightarrow \infin}C^k_np^k(1-p)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda} limn→∞Cnkpk(1−p)n−k=k!λke−λ
泊松定理在n很大时具有很好的拟合效果
设
λ
>
0
\lambda>0
λ>0是一常数,
n
n
n为任意正整数,满足
n
p
=
λ
np=\lambda
np=λ,对任意非负常数
k
k
k,有:
lim
n
→
∞
C
n
k
p
k
(
1
−
p
)
n
−
k
=
λ
k
k
!
e
−
λ
\lim_{n\rightarrow \infin}C^k_np^k(1-p)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda}
n→∞limCnkpk(1−p)n−k=k!λke−λ
左 侧 = lim n → ∞ n ( n − 1 ) ( n − 2 ) . . . ( n − k + 1 ) k ! ( λ n ) k ( 1 − λ n ) n ( 1 − λ n ) − k = lim n → ∞ n k 1 ( 1 − 1 n ) ( 1 − 2 n ) . . . ( 1 − k − 1 n ) k ! ( λ n ) k ( 1 − λ n ) − n λ × ( − λ ) ( 1 − λ n ) − k = lim n → ∞ λ k k ! e − λ = 右 侧 \begin{aligned} 左侧&= \lim_{n\rightarrow \infin}\frac{n(n-1)(n-2)...(n-k+1)}{k!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^n(1-\frac{\lambda}{n})^{-k}\\ &=\lim_{n\rightarrow \infin}\frac{n^k1(1-\frac{1}{n})(1-\frac{2}{n})...(1-\frac{k-1}{n})}{k!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{-\frac{n}{\lambda}\times{(-\lambda)}}(1-\frac{\lambda}{n})^{-k}\\ &=\lim_{n\rightarrow \infin}\frac{\lambda^k}{k!}e^{-\lambda}\\ &=右侧 \end{aligned} 左侧=n→∞limk!n(n−1)(n−2)...(n−k+1)(nλ)k(1−nλ)n(1−nλ)−k=n→∞limk!nk1(1−n1)(1−n2)...(1−nk−1)(nλ)k(1−nλ)−λn×(−λ)(1−nλ)−k=n→∞limk!λke−λ=右侧
泊松分布 P ( X = k ) = λ k k ! e − λ , λ > 0 , k = 0 , 1 , 2 , . . . P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda},\lambda>0,k=0,1,2,... P(X=k)=k!λke−λ,λ>0,k=0,1,2,...
根据泊松定理的形式,泊松分布可以看做二项分布时试验次数无穷大时的情形
X
∼
P
(
λ
)
:
X\sim P(\lambda):
X∼P(λ):离散型随机变量X服从参数为
λ
\lambda
λ的泊松分布
证明泊松分布满足离散型随机变量分布律的性质:
1.显然 λ k k ! e − λ > 0 \frac{\lambda^k}{k!}e^{-\lambda}>0 k!λke−λ>0
2.
∑ k = 0 ∞ λ k k ! e − λ = e − λ ∑ k = 0 ∞ λ k k ! \sum_{k=0}^\infin \frac{\lambda^k}{k!}e^{-\lambda}=e^{-\lambda}\sum_{k=0}^\infin \frac{\lambda^k}{k!} k=0∑∞k!λke−λ=e−λk=0∑∞k!λk
令
g k ( x ) = ∑ k = 1 x k k ! , x > 0 , k ∈ N g_k(x)=\sum_{k=1}\frac{x^k}{k!},x>0,k\in N gk(x)=k=1∑k!xk,x>0,k∈N
恰好为 e x e^x ex的麦克劳林展开式
g k ( x ) = ∑ k = 1 x k k ! = e x g_k(x)=\sum_{k=1}\frac{x^k}{k!}=e^x gk(x)=k=1∑k!xk=ex
g k ( λ ) = e λ g_k(\lambda)=e^{\lambda} gk(λ)=eλ
∑ k = 0 ∞ λ k k ! e − λ = e − λ ∑ k = 0 ∞ λ k k ! = e − λ e λ = 1 \sum_{k=0}^\infin \frac{\lambda^k}{k!}e^{-\lambda}=e^{-\lambda}\sum_{k=0}^\infin \frac{\lambda^k}{k!}=e^{-\lambda}e^\lambda=1 k=0∑∞k!λke−λ=e−λk=0∑∞k!λk=e−λeλ=1
4.几何分布 P ( X = k ) = ( 1 − p ) k − 1 p ( k = 1 , 2 , . . . ) P(X=k)=(1-p)^{k-1}p\ \ \ \ (k=1,2,...) P(X=k)=(1−p)k−1p (k=1,2,...)
X ∼ G E ( p ) : X\sim GE(p): X∼GE(p):离散型随机变量X服从参数为p的几何分布
参数意义:
独立重复试验的成功概率为p,恰好在第k次试验成功,前k-1次均失败的概率
5.超几何分布 P ( X = k ) = C M k C N − M n − k C N n , k = 0 , 1 , . . . , m i n ( M , n ) P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},k=0,1,...,min(M,n) P(X=k)=CNnCMkCN−Mn−k,k=0,1,...,min(M,n)
X ∼ H ( n , M , N ) : X\sim H(n,M,N): X∼H(n,M,N):离散型随机变量 X X X服从参数为 n , M , N n,M,N n,M,N的超几何分布
参数意义:
一共有N件产品,其中有M件次品,从中任取n件取到次品数为X的概率为:
从 M 个 次 品 中 挑 出 k 个 的 组 合 数 × 从 N − M 个 正 品 中 挑 出 n − k 个 的 组 合 数 从 N 个 物 品 总 任 意 挑 出 n 个 的 组 合 数 \frac{从M个次品中挑出k个的组合数\times 从N-M个正品中挑出n-k个的组合数}{从N个物品总任意挑出n个的组合数} 从N个物品总任意挑出n个的组合数从M个次品中挑出k个的组合数×从N−M个正品中挑出n−k个的组合数
超几何分布与二项分布的关系:
超几何分布实际上可以看做如下情形:
N个大小形状一模一样的球,其中有M个红球,N-M个黑球,从中任意不放回摸出n个球,求摸到的红球个数为k的概率
二项分布可以看做如下情形:
N个大小形状一模一样的球,其中有M个红球,N-M个黑球,从中任意放回摸出n个球,求摸到的红球个数为k的概率
两者的区别在于放回与否
如果不放回则每次试验相互独立,成功概率相同
如果放回则上一次试验一定会影响下一次试验的概率
因此分布律公式给出的时候二项分布的参数直接写的是固定的概率,
而超几何分布给出的是个数(没有固定概率)
但是当N趋向于无穷大时,也就是摸出来的n个球对于总数N来说稀松时,可以认为两种分布是等价的
在求取出的红球数的数学期望的时候两种分布情况的相同的:
将所有N个球不管颜色都打成粉末,摇匀,
二项分布模型每次取出一勺记下勺子中红黑粉量之后将这勺"球"倒回去
超几何分布模型每次取出一勺记下勺子中红黑粉量之后将这勺"球"吃了
显然已经摇匀的球粉倒不倒回去不会影响下一勺中红黑粉末的比重
那么摸出k个球相当于舀出k勺,其中红球数量的期望就是 k × M N k\times \frac{M}{N} k×NM,黑球数量的期望就是 k × N − M N k\times \frac{N-M}{N} k×NN−M
连续型随机变量及其概率密度
连续型随机变量
定义: F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infin}^xf(t)\,dt F(x)=∫−∞xf(t)dt
其中 f ( t ) f(t) f(t)为 ( − ∞ , ∞ ) (-\infin,\infin) (−∞,∞)上的非负可积函数,称为X的概率密度函数,简称概率密度
概率密度的性质:
设 f ( x ) f(x) f(x)为连续型随机变量 X X X的概率密度
1.非负
2. ∫ − ∞ + ∞ f ( t ) d t = 1 \int_{-\infin}^{+\infin}f(t)\,dt=1 ∫−∞+∞f(t)dt=1
3. P ( a < x ≤ b ) = ∫ a b f ( t ) d t P(a<x≤b)=\int_{a}^{b}f(t)\,dt P(a<x≤b)=∫abf(t)dt
4. f ( x ) f(x) f(x)的连续点处有 F ′ ( x ) = f ( x ) F'(x)=f(x) F′(x)=f(x)
5.有概率密度的离散型随机变量的分布函数一定连续
6.单点处概率为0, P ( x = x 0 ) = ∫ x 0 x 0 f ( t ) d t = 0 P(x=x_0)=\int_{x_0}^{x_0}f(t)\,dt=0 P(x=x0)=∫x0x0f(t)dt=0
不可能事件概率一定为0,但是概率为0的不一定是不可能事件
分布模型
1.均匀分布 X ∼ U ( a , b ) X\sim U(a,b) X∼U(a,b)
概
率
密
度
f
(
x
)
=
{
1
b
−
a
,
a
<
x
≤
b
0
,
x
≤
a
或
x
>
b
概率密度f(x)= \begin{cases} \frac{1}{b-a},a<x≤b\\ 0,x≤a或x>b \end{cases}
概率密度f(x)={b−a1,a<x≤b0,x≤a或x>b
分
布
函
数
F
(
x
)
=
∫
f
(
x
)
d
x
=
{
0
,
x
<
a
x
−
a
b
−
a
,
a
<
x
≤
b
1
,
x
>
b
分布函数F(x)=\int f(x)\,dx=\begin{cases}0,x<a\\ \frac{x-a}{b-a},a<x≤b\\ 1,x>b \end{cases}
分布函数F(x)=∫f(x)dx=⎩⎪⎨⎪⎧0,x<ab−ax−a,a<x≤b1,x>b
2.正态分布 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2)
概
率
密
度
f
(
x
)
=
1
2
π
e
−
(
x
−
μ
)
2
2
σ
2
,
−
∞
<
x
<
+
∞
概率密度f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}},-\infin<x<+\infin
概率密度f(x)=2π
1e−2σ2(x−μ)2,−∞<x<+∞
分
布
函
数
F
(
x
)
=
∫
f
(
x
)
d
x
分布函数F(x)=\int f(x)\,dx
分布函数F(x)=∫f(x)dx
标准正态分布 X ∼ N ( 0 , 1 ) X\sim N(0,1) X∼N(0,1)
概
率
密
度
ϕ
(
x
)
=
1
2
π
e
−
x
2
2
概率密度\phi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}
概率密度ϕ(x)=2π
1e−2x2
分
布
函
数
Φ
(
x
)
=
∫
ϕ
(
x
)
d
x
分布函数\Phi(x)=\int \phi(x)\,dx
分布函数Φ(x)=∫ϕ(x)dx
Φ ( − x ) = 1 − Φ ( x ) \Phi(-x)=1-\Phi(x) Φ(−x)=1−Φ(x)
标准化 Z = X − μ σ Z=\frac{X-\mu}{\sigma} Z=σX−μ
正态分布转化为标准正态分布:
设
X
∼
N
(
μ
,
σ
)
X\sim N(\mu,\sigma)
X∼N(μ,σ),
则
Z
=
X
−
μ
σ
∼
N
(
0
,
1
)
Z=\frac{X-\mu}{\sigma}\sim N(0,1)
Z=σX−μ∼N(0,1)称Z为X的标准化
3 σ \sigma σ规则
X范围 | 概率 |
---|---|
( μ − σ , μ + σ ) (\mu-\sigma,\mu+\sigma) (μ−σ,μ+σ) | 0.6526 |
( μ − 2 σ , μ + 2 σ ) (\mu-2\sigma,\mu+2\sigma) (μ−2σ,μ+2σ) | 0.9544 |
( μ − 3 σ , μ + 3 σ ) (\mu-3\sigma,\mu+3\sigma) (μ−3σ,μ+3σ) | 0.9974 |
3.指数分布 X ∼ E ( λ ) X\sim E(\lambda) X∼E(λ)
概
率
密
度
f
(
x
)
=
{
λ
e
−
λ
x
,
x
≥
0
0
,
x
<
0
概率密度f(x)=\begin{cases} \lambda e^{-\lambda x},x≥0\\ 0,x<0 \end{cases}
概率密度f(x)={λe−λx,x≥00,x<0
分
布
函
数
F
(
x
)
=
∫
f
(
x
)
d
x
=
{
1
−
e
−
λ
x
,
x
≥
0
0
,
x
<
0
分布函数F(x)=\int f(x)dx=\begin{cases} 1-e^{-\lambda x},x≥0 \\0,x<0 \end{cases}
分布函数F(x)=∫f(x)dx={1−e−λx,x≥00,x<0
无记忆性 P ( X > ( s + t ) ∣ X > s ) = P ( X > t ) P(X>(s+t)|X>s)=P(X>t) P(X>(s+t)∣X>s)=P(X>t)
标签:...,frac,及其,infin,分布,一维,随机变量,lambda 来源: https://blog.csdn.net/qq_26131031/article/details/120677329