本文介绍指数分布,及其推导原理。
Ref: 指数分布
开始之前,先看个概率密度函数的小问题:
问题描述:你于上午10点到达车站,车在10点到10:30 之间到达的时刻 X 的概率密度函数如图:
则使用分段积分,可以求出等车时间超过 12 分钟的概率:
P { X ≥ 12 } = 0.65 P\{ X \geq 12 \} = 0.65 P{X≥12}=0.65
如果10点12分车还没有来,那么你还要至少等待12分钟的概率:(条件概率)
P { X > 24 ∣ X > 12 } = P { X > 24 } P { X > 12 } = 0.15 0.65 = 0.23 P\{X \gt 24 \mid X \gt 12\} = \frac{P\{X \gt 24\}}{P\{X \gt 12\}} = \frac{0.15}{0.65}=0.23 P{X>24∣X>12}=P{X>12}P{X>24}=0.650.15=0.23
有了上述开胃示例后,那么我们来看看指数分布吧。
指数分布
场景:美国西部发生地震的强度 λ \lambda λ(以一周为单位时间),求以现在开始直到下次发生地震的间隔时间的概率分布。
在 t t t 周内发生地震的次数 X X X 的概率分布:(泊松分布)
X ∼ Poisson ( λ t ) X \sim \text{Poisson}(\lambda t) X∼Poisson(λt)
即:
P { X = k } = ( λ t ) k ⋅ e − λ t k ! , 其中 k = 0 , 1 , … P\{ X = k\} = \frac{(\lambda t)^k \cdot e^{-\lambda t}}{k!}, 其中 k=0,1, \dots P{X=k}=k!(λt)k⋅e−λt,其中k=0,1,…
那么在 t t t 周内没有发生地震的概率:
P { X = 0 } = e − λ t (1) P\{ X = 0\} = e^{-\lambda t}\tag1 P{X=0}=e−λt(1)
重点来了~
(刚刚发生了一次地震开始) 从现在开始直到下次发生地震的间隔时间为 T T T
T T T 的分布函数:
F ( t ) = P ( T ≤ t ) = 1 − P ( T > t ) (2) F(t) = P(T \leq t) = 1 - P(T \gt t)\tag2 F(t)=P(T≤t)=1−P(T>t)(2)
其中 P ( T > t ) P(T \gt t) P(T>t) 表示从现在开始,未来的 t 周内没有发生地震。
很容易理解, P ( T > t ) P(T \gt t) P(T>t)等同于式子(1) 描述的 P ( X = 0 ) P(X=0) P(X=0).
结合式子(1),式子(2),可得:
F ( t ) = { 1 − e − λ t , t ≥ 0 0 t < 0 F(t) = \begin{cases} 1 - e^{-\lambda t}, \qquad t \geq 0 \\ 0 \qquad \qquad \quad t \lt 0 \end{cases} F(t)={1−e−λt,t≥00t<0
对分布函数进行求导,可得概率密度函数:
f ( t ) = { λ e λ t , t ≥ 0 0 t < 0 f(t) = \begin{cases} \lambda e^{\lambda t}, \qquad t \geq 0 \\ 0 \qquad \qquad t \lt 0 \end{cases} f(t)={λeλt,t≥00t<0
将上述 T 替换为变量 X X X 则可以得到 X X X分布函数于概率密度函数:
F ( x ) = { 1 − e − λ x , x ≥ 0 0 x < 0 F(x) = \begin{cases} 1 - e^{-\lambda x}, \qquad x \geq 0 \\ 0 \qquad \qquad \quad x \lt 0 \end{cases} F(x)={1−e−λx,x≥00x<0
f ( x ) = { λ e λ x , x ≥ 0 0 x < 0 f(x) = \begin{cases} \lambda e^{\lambda x}, \qquad x \geq 0 \\ 0 \qquad \qquad x \lt 0 \end{cases} f(x)={λeλx,x≥00x<0
称 X X X 服从参数为 λ \lambda λ 的指数分布,记作 X ∼ E x p ( λ ) X \sim Exp(\lambda) X∼Exp(λ)
指数分布常用来描述某个事件发生的等待时间,比如电子产品的使用寿命,排队等待服务的时间,地震发生的时间间隔。
有了指数分布的理解了,我们回到一开始的(开胃问题)上,修改问题描述为:
问题描述(修改版) 你于上午10点到达车站,车在10点之后到达的时刻 X X X 服从参数是 0.1 的指数分布, X X X 即你的等待时间。
那么,
等车超过10分钟的概率:
P { X > 10 } = 1 − P { X ≤ 10 } = 1 − F ( 10 ) = e − 1 P\{X \gt 10\} = 1 - P\{ X \leq 10 \} = 1 - F(10) = e^{-1} P{X>10}=1−P{X≤10}=1−F(10)=e−1
如果10点12分车还没有来,那么你还要至少等待10分钟的概率:(条件概率)
P { X > 22 ∣ X > 12 } = P { X > 22 } P { X > 12 } = e − 2.2 e − 1.2 = e − 1 P\{ X \gt 22 \mid X \gt 12 \} = \frac{P\{ X \gt 22 \}}{P\{ X \gt 12 \}} = \frac{e^{-2.2}}{e^{-1.2}} = e^{-1} P{X>22∣X>12}=P{X>12}P{X>22}=e−1.2e−2.2=e−1
发现上述两个事件的概率相同,可以通过公式推导,上述事件概率必然相等,该特点我们可以描述为指数分布的无记忆性.
至此结束。