在機率論 和統計學 中,指數分布 (英語:Exponential distribution )是一種連續機率分佈 。指數分布可以用來建模平均發生率恆定、連續、獨立的事件發生的間隔,比如旅客進入機場的時間間隔、電話打進客服中心的時間間隔、中文維基百科 新條目出現的時間間隔、機器的壽命等。
指數分配
機率密度函數
累積分布函數
參數
λ
>
0
{\displaystyle \lambda >0\,}
率 值域
x
∈
[
0
;
∞
)
{\displaystyle x\in [0;\infty )\!}
機率密度函數
λ
e
−
λ
x
{\displaystyle \,\lambda e^{-\lambda x}}
累積分布函數
1
−
e
−
λ
x
{\displaystyle 1-e^{-\lambda x}}
期望值
λ
−
1
{\displaystyle \lambda ^{-1}\,}
中位數
ln
(
2
)
/
λ
{\displaystyle \ln(2)/\lambda \,}
眾數
0
{\displaystyle 0\,}
變異數
λ
−
2
{\displaystyle \lambda ^{-2}\,}
偏度
2
{\displaystyle 2\,}
峰度
6
{\displaystyle 6\,}
熵
1
−
ln
(
λ
)
{\displaystyle 1-\ln(\lambda )\,}
動差母函數
(
1
−
t
λ
)
−
1
{\displaystyle \left(1-{\frac {t}{\lambda }}\right)^{-1}\,}
特徵函數
(
1
−
i
t
λ
)
−
1
{\displaystyle \left(1-{\frac {it}{\lambda }}\right)^{-1}\,}
記號
指數分布即形狀母數 α為1的伽瑪分布 。
若隨機變數
X
{\displaystyle X}
服從母數為
λ
{\displaystyle \lambda }
或
β
{\displaystyle \beta }
的指數分布,則記作
X
∼
Exp
(
λ
)
{\displaystyle X\sim {\text{Exp}}(\lambda )}
或
X
∼
Exp
(
β
)
{\displaystyle X\sim {\text{Exp}}(\beta )}
兩者意義相同,只是
λ
{\displaystyle \lambda }
與
β
{\displaystyle \beta }
互為倒數關係。只要將以下式子做
λ
=
1
β
{\displaystyle {\color {Red}\lambda ={\frac {1}{\beta }}}}
的替換即可,即,指數分布之機率密度函數 為:
f
(
x
;
λ
)
=
{
λ
e
−
λ
x
x
≥
0
,
0
,
x
<
0.
{\displaystyle f(x;{\color {Red}\lambda })=\left\{{\begin{matrix}{\color {Red}\lambda }e^{-{\color {Red}\lambda }x}&x\geq 0,\\0&,\;x<0.\end{matrix}}\right.}
或
f
(
x
;
β
)
=
{
1
β
e
−
1
β
x
x
≥
0
,
0
,
x
<
0.
{\displaystyle f(x;{\color {Red}\beta })=\left\{{\begin{matrix}{\color {Red}{\frac {1}{\beta }}}e^{-{\color {Red}{\frac {1}{\beta }}}x}&x\geq 0,\\0&,\;x<0.\end{matrix}}\right.}
累積分布函數 為:
F
(
x
;
λ
)
=
{
1
−
e
−
λ
x
,
x
≥
0
,
0
,
x
<
0.
{\displaystyle F(x;{\color {Red}\lambda })=\left\{{\begin{matrix}1-e^{-\color {Red}{\lambda }x}&,\;x\geq 0,\\0&,\;x<0.\end{matrix}}\right.}
或
F
(
x
;
β
)
=
{
1
−
e
−
1
β
x
,
x
≥
0
,
0
,
x
<
0.
{\displaystyle F(x;{\color {Red}\beta })=\left\{{\begin{matrix}1-e^{-{\color {Red}{\frac {1}{\beta }}}x}&,\;x\geq 0,\\0&,\;x<0.\end{matrix}}\right.}
其中
λ
>
0
{\displaystyle \lambda >0}
是分布的母數,即每單位時間發生該事件的次數;
β
{\displaystyle \beta }
為比例母數,即該事件在每單位時間內的發生率。兩者常被稱為率參數(rate parameter)。指數分布的區間是[0,∞)。
特性
期望值與變異數
隨機變量 X (X 的母數 為λ或β) 的期望值 是:
E
(
X
)
=
1
λ
=
β
{\displaystyle \mathbf {E} (X)={\frac {1}{\color {Red}{\lambda }}}={\color {Red}\beta }}
例如:如果你平均每個小時接到2次電話,那麼你預期等待每一次電話的時間是半個小時。
X 的方差 是:
V
a
r
(
X
)
=
1
λ
2
=
β
2
{\displaystyle \mathbf {Var} (X)={\frac {1}{\color {Red}{\lambda ^{2}}}}={\color {Red}\beta ^{2}}}
X 的偏態係數 是:
V [X] = 1
無記憶性
指數函數的一個重要特徵是無記憶性(Memoryless Property,又稱遺失記憶性 )。這表示如果一個隨機變量 呈指數分布,它的條件概率遵循:
P
(
T
>
s
+
t
|
T
>
t
)
=
P
(
T
>
s
)
for all
s
,
t
≥
0.
{\displaystyle P(T>s+t\;|\;T>t)=P(T>s)\;\;{\hbox{for all}}\ s,t\geq 0.}
與泊松過程的關係
泊松過程 是一種重要的隨機過程。泊松過程中,第k次隨機事件與第k+1次隨機事件出現的時間間隔服從指數分布。而根據泊松過程的定義,長度為t的時間段內沒有隨機事件出現的概率等於
e
−
λ
t
(
λ
t
)
0
0
!
=
e
−
λ
t
{\displaystyle {\frac {e^{-\lambda t}(\lambda t)^{0}}{0!}}=e^{-\lambda t}}
,
長度為t的時間段內隨機事件發生一次的概率等於
e
−
λ
t
(
λ
t
)
1
1
!
=
e
−
λ
t
λ
t
{\displaystyle {\frac {e^{-\lambda t}(\lambda t)^{1}}{1!}}=e^{-\lambda t}\lambda t}
,
所以第k次隨機事件之後長度為t的時間段內,第k+n次 (n=1, 2, 3,...)隨機事件出現的概率等於
1
−
e
−
λ
t
{\displaystyle 1-e^{-\lambda t}}
。這是指數分布。這還表明了泊松過程的無記憶性。
四分位數
率參數λ的四分位數 函數(Quartile function)是:
F
−
1
(
p
;
λ
)
=
−
ln
(
1
−
p
)
λ
,
0
≤
p
<
1
{\displaystyle F^{-1}(p;\lambda )={\frac {-\ln(1-p)}{\lambda }},\qquad 0\leq p<1}
第一四分位數:
ln
(
4
/
3
)
/
λ
{\displaystyle \ln(4/3)/\lambda \,}
中位數 :
ln
(
2
)
/
λ
{\displaystyle \ln(2)/\lambda \,}
第三四分位數:
ln
(
4
)
/
λ
{\displaystyle \ln(4)/\lambda \,}
因此,四分位距 為ln(3)/λ 。
參數估計
最大概似法
給定獨立同分布 樣本x = (x 1 , ..., x n ),λ的似然函數 (Likelihood function)是:
L
(
λ
)
=
∏
i
=
1
n
λ
exp
(
−
λ
x
i
)
=
λ
n
exp
(
−
λ
∑
i
=
1
n
x
i
)
=
λ
n
exp
(
−
λ
n
x
¯
)
{\displaystyle L(\lambda )=\prod _{i=1}^{n}\lambda \,\exp(-\lambda x_{i})=\lambda ^{n}\,\exp \!\left(\!-\lambda \sum _{i=1}^{n}x_{i}\right)=\lambda ^{n}\exp \left(-\lambda n{\overline {x}}\right)}
其中:
x
¯
=
1
n
∑
i
=
1
n
x
i
{\displaystyle {\overline {x}}={1 \over n}\sum _{i=1}^{n}x_{i}}
是樣本期望値。
似然函數對數 的導數 是:
d
d
λ
ln
L
(
λ
)
=
d
d
λ
(
n
ln
(
λ
)
−
λ
n
x
¯
)
=
n
λ
−
n
x
¯
{
>
0
if
0
<
λ
<
1
/
x
¯
,
=
0
if
λ
=
1
/
x
¯
,
<
0
if
λ
>
1
/
x
¯
.
{\displaystyle {\frac {\mathrm {d} }{\mathrm {d} \lambda }}\ln L(\lambda )={\frac {\mathrm {d} }{\mathrm {d} \lambda }}\left(n\ln(\lambda )-\lambda n{\overline {x}}\right)={n \over \lambda }-n{\overline {x}}\ \left\{{\begin{matrix}>0&{\mbox{if}}\ 0<\lambda <1/{\overline {x}},\\\\=0&{\mbox{if}}\ \lambda =1/{\overline {x}},\\\\<0&{\mbox{if}}\ \lambda >1/{\overline {x}}.\end{matrix}}\right.}
參數λ的最大概似估計 (Maximum likelihood)值是:
λ
^
=
1
x
¯
{\displaystyle {\widehat {\lambda }}={\frac {1}{\overline {x}}}}
參見
參考文獻
Donald E. Knuth (1998). The Art of Computer Programming, volume 2: Seminumerical Algorithms, 3rd edn. Boston: Addison-Wesley. ISBN 0-201-89684-2 . pp. 133
Luc Devroye (1986). Non-Uniform Random Variate Generation. New York: Springer-Verlag. ISBN 0-387-96305-7 . pp. 392–401
外部連結