二項式分布

二項分布
	機率質量函數
	累積分布函數
記號
母數	;
值域
機率質量函數
累積分布函數
期望值
中位數	或
眾數
變異數
偏度
峰度
熵
動差母函數
特徵函數
機率母函數

在機率論和統計學中，二項式分布（英語：binomial distribution）是一種離散機率分布，描述在進行獨立隨機試驗時，每次試驗都有相同機率「成功」的情況下，獲得成功的總次數。擲硬幣十次出現五次正面的機率、產品合格率 $\,99\%\,$ 時抽出一百件樣本沒有發現一件次品的機率等等，都可以由二項式分布給出。

只有「成功」和「失敗」兩種可能結果，每次重複時成功機率不變的獨立隨機試驗稱作伯努利試驗，例如上述的擲硬幣出現正面或反面、對產品進行抽樣檢查時抽到正品或次品。伯努利試驗作為理論模型，其前提在現實中無法完全得到滿足，比如生產線會磨損，因此每件產品合格的機率並非固定^[1]。儘管如此，二項式分布給出的機率通常足以用於提供有用的推斷；即使在已知前提沒有滿足的場合，二項式分布也能用於參考和比較。二項式分布的應用出現在遺傳學、質量控制等領域之中。^[2]

定義

若隨機變數 $\,X\,$ 有機率質量函數

\Pr(X=k)={n \choose k}p^{k}(1-p)^{n-k}\quad (k=0,1,\ldots ,n),

其中 $\,n\,$ 為正整數、 $\,0\leq p\leq 1\,$ ，則稱 $\,X\,$ 服從母數為 $\,n,p\,$ 的二項式分布^[3]，記為 $\,X\sim \operatorname {B} (n,p)\,$ 或 $\,X\sim \operatorname {Bin} (n,p)\,$ 。習慣上 $\,1-p\,$ 也用 $\,q\,$ 表示。^[1]

推導

進行 $\,n\,$ 次獨立伯努利試驗的結果可以由 $\,n\,$ 個字母表示，例如用 $\,S\,$ 表示成功， $\,F\,$ 表示失敗，則

SSFSF

表示五次試驗中第一、二、四次的結果為成功，其餘為失敗。設每次試驗成功的機率為 $\,p\,$ ，失敗的機率為 $\,1-p\,$ 。因為試驗相互獨立，每一種排列 $\,k\,$ 個 $\,S\,$ 、 $\,n-k\,$ 個 $\,F\,$ 的方式對應的機率為 $\,p^{k}(1-p)^{n-k}\,$ 。^[1]

從 $\,n\,$ 個不同元素中選出含 $\,k\,$ 個元素的子集的方法數量等於二項式係數

{n \choose k}={\frac {n!}{k!(n-k)!}}.

^[4]

而每種對 $\,k\,$ 個 $\,S\,$ 、 $\,n-k\,$ 個 $\,F\,$ 的排列都可理解為從 $\,n\,$ 個位置中選出 $\,k\,$ 個作為字母 $\,S\,$ 的位置的方法，這種方法的數量即為 $\,{n \choose k}\,$ 。與每種排列方式對應的機率相乘，便得到定義中的機率

{n \choose k}p^{k}(1-p)^{n-k}.

^[5]

歷史

二項式分布是最早得到研究的機率分布之一^[6]。丹麥統計學家安德斯·哈爾德認為其歷史可以追溯至布萊茲·帕斯卡與皮埃爾·德·費馬於1654年對點數分配問題的討論：兩名玩家贏得每局遊戲的機會相同，贏得一定局數的勝者可獲得獎金，但比賽僅進行了數局，尚未分出勝負就被迫中斷，則獎金該如何分配？帕斯卡認為，獎金的分配應當基於玩家距離勝利所差的局數：若一名玩家還需 $\,r\,$ 局獲勝，另一名玩家還需 $\,s\,$ 局獲勝，則應考慮在 $\,r+s-1\,$ 局比賽的 $\,2^{r+s-1}\,$ 種結果中，兩名玩家分別在多少種情況中獲勝。兩人的討論限於這一問題本身，並未推導出二項式分布的機率，但這一解法可被視作基於母數 $\,p=1/2\,$ 的二項式分布。^[7]

對二項式分布機率的推導為雅各布·伯努利於《猜度術（英語：Ars Conjectandi）》中作出。該著作在他去世後，於1713年得到出版，被視作機率論的奠基性作品。伯努利還在其中首次給出了弱大數法則的嚴格證明^[8]^[9]。對二項式分布的常態近似則是由亞伯拉罕·棣美弗發現，這一工作於1733年完成，於1738年出版在其著作《機遇論（英語：The Doctrine of Chances）》的第二版中。^[10]

性質

母數為 $\,n,p\,$ 的二項式分布的期望值為 $\,np\,$ ，變異數為 $\,np(1-p)\,$ 。其機率母函數為

G(z)=(1-p+pz)^{n},

動差母函數為

M_{X}(t)=(1-p+pe^{t})^{n},

特徵函數為

\varphi _{X}(t)=(1-p+pe^{it})^{n}.

^[3]^[11]

母數 $\,n=1\,$ 的二項式分布稱作伯努利分布^[3]。多項分布（英語：Multinomial distribution）是二項式分布的拓展，描述重複進行不限於兩種結果、可能有多種可能結果的隨機試驗時的機率^[12]。二項式分布本身是超幾何分布的極限形式。^[13]

二項式分布的和

若 $\,X_{1},X_{2}\,$ 兩個隨機變數獨立，分別服從母數為 $\,n_{1},p\,$ 和 $\,n_{2},p\,$ 的二項式分布，則 $\,X_{1}+X_{2}\,$ 即是在 $\,n_{1}+n_{2}\,$ 次獨立伯努利試驗中取得成功的次數，所以 $\,X_{1}+X_{2}\,$ 服從母數為 $\,n_{1}+n_{2},p\,$ 的二項式分布。這一結論亦可通過將兩者的機率母函數相乘而得出。在條件 $\,X_{1}+X_{2}=k\,$ 之下，隨機變數 $\,X_{1}\,$ 的條件機率分布是母數為 $\,k,n_{1},n_{1}+n_{2}\,$ 的超幾何分布。^[14]

眾數

計算 $\,\Pr(X=k)\,$ 和 $\,\Pr(X=k+1)\,$ 的比值可以得到

{\frac {\Pr(X=k+1)}{\Pr(X=k)}}={\frac {(n-k)p}{(k+1)(1-p)}}\quad (k=0,1,\ldots ,n-1),

因此，當 $\,k<(n+1)p-1\,$ 時， $\,\Pr(X=k)\,$ 隨 $\,k\,$ 增加而上升；當 $\,k>(n+1)p-1\,$ 時， $\,\Pr(X=k)\,$ 隨 $\,k\,$ 增加而下降。故二項式分布的眾數為 $\,(n+1)p\,$ 的下取整 $\,\lfloor (n+1)p\rfloor \,$ 。若 $\,(n+1)p\,$ 本身是整數，則 $\,(n+1)p\,$ 和 $\,(n+1)p-1\,$ 均是眾數。若 $\,p<(n+1)^{-1}\,$ ，則眾數為 $\,0\,$ 。^[15]

中位數

二項式分布的中位數 $\,m\,$ 位於 $\,np\,$ 的上下取整之間，即 $\,\lfloor np\rfloor \leq m\leq \lceil np\rceil \,$ ；若 $\,np\,$ 為整數，則中位數 $\,m=np\,$ 。中位數 $\,m\,$ 和期望值 $\,np\,$ 之間的差滿足

|m-np|<\max\{p,1-p\}.

若 $\,p>\ln 2\,$ 或 $\,p<1-\ln 2\,$ ，則該上界可進一步縮減為

|m-np|<\ln 2.

若 $\,n\,$ 為奇數、 $\,p=1/2\,$ ，則 $\,(n-1)/2\,$ 和 $\,(n+1)/2\,$ 均為中位數。^[16]^[17]

累積分布函數

二項式分布的累積分布函數和尾機率可以用正則化不完全貝塔函數表示為

\Pr(X\leq k)=I_{1-p}(n-\lfloor k\rfloor ,\lfloor k\rfloor +1),

\Pr(X\geq k)=I_{p}(\lceil k\rceil ,n-\lceil k\rceil +1).

^[18]

動差

二項式分布的 $\,r\,$ 階原動差滿足

\mu '_{r}=E[X^{r}]=\sum _{j=0}^{r}{\frac {S(r,j)n!p^{j}}{(n-j)!}},

其中 $\,S(r,j)\,$ 表示第二類（英語：Stirling numbers of the second kind）史特靈數。具體而言，

\mu '_{1}=np,

\mu '_{2}=np+n(n-1)p^{2},

\mu '_{3}=np+3n(n-1)p^{2}+n(n-1)(n-2)p^{3},

\mu '_{4}=np+7n(n-1)p^{2}+6n(n-1)(n-2)p^{3}+n(n-1)(n-2)(n-3)p^{4}.

其低階主動差為

\mu _{2}=np(1-p),

\mu _{3}=np(1-p)(1-2p),

\mu _{4}=3[np(1-p)]^{2}+np(1-p)[1-6p(1-p)].

^[19]

近似

常態近似

n=6

、

p=0.5

時的二項式分布及其常態近似

標準二項式分布

X'={\frac {X-np}{\sqrt {np(1-p)}}}

在 $\,n\to \infty \,$ 時趨近於標準常態分布。這一結果稱作棣美弗-拉普拉斯定理（英語：De Moivre–Laplace theorem），為中央極限定理的特殊形式。基於這一定理可以得到

\Pr(\alpha <{\frac {X-np}{\sqrt {np(1-p)}}}<\beta )\to \Phi (\beta )-\Phi (\alpha ),

其中 $\,\Phi \,$ 為標準常態分布的累積分布函數。^[20]

常態分布為連續機率分布，在近似二項式分布這類離散機率分布時，可將端點向外偏移 $\,0.5\,$ 得到

\Pr(X\leq k)\approx \Phi \left({\frac {k+0.5-np}{\sqrt {np(1-p)}}}\right),

從而提升近似的準確性，這種技巧稱作連續性校正（英語：Continuity correction）^[21]。何時能採用這一近似依賴於使用經驗法則，例如要求 $\,np(1-p)>9\,$ ，或是在 $\,p\leq 0.5\,$ 時要求 $\,np>5\,$ 、在 $\,p>0.5\,$ 時要求 $\,n(1-p)>5\,$ 。^[22]^[23]

卜瓦松近似

當 $\,n\to \infty ,p\to 0\,$ ，而 $\,np\,$ 保持不變時，二項式分布趨近於母數為 $\,np\,$ 的卜瓦松分布。以此為基礎可以得到

\Pr(X\leq k)\approx e^{-np}\sum _{j=0}^{k}{\frac {(np)^{j}}{j!}}.

^[24]

二項式分布與其卜瓦松近似之間的絕對誤差存在上界。若隨機變數 $\,X\,$ 服從母數為 $\,n,p\,$ 的二項式分布，隨機變數 $\,Y\,$ 服從母數為 $\,np\,$ 的卜瓦松分布，則

\sum _{k=0}^{\infty }\|\Pr(X=k)-\Pr(Y=k)\|\leq \min\{2np^{2},3p\}.

^[25]

母數估計

點估計

通常母數 $\,n\,$ 為已知。假設隨機變數 $\,X\,$ 服從二項式分布，其母數 $\,p\,$ 未知。若觀測到 $\,X\,$ 的值為 $\,x\,$ ，採用動差估計和最大概似估計對母數 $\,p\,$ 的估計量均為 $\,{\frac {x}{n}}\,$ ，這一估計量為不偏的。^[26]

母數 $\,p\,$ 的貝氏估計量（英語：Bayes estimator）取決於使用的事前分布。若使用連續型均勻分布作為事前分布，即假設 $\,0\,$ 和 $\,1\,$ 之間任意等長的區間包含 $\,p\,$ 的機率都相同，則後驗均值估計量為

{\widehat {p}}={\frac {x+1}{n+2}}.

這被稱作拉普拉斯–貝氏估計量（英語：Laplace–Bayes estimator），曾被皮埃爾-西蒙·拉普拉斯用於估計在太陽連續升起 $\,n\,$ 天之後，太陽明天還會升起的機率。由於人類知道太陽在過去五千年，即1,826,213天都正常升起，拉普拉斯願意以1,826,214比1的賠率賭太陽明天繼續升起。^[27]

若使用母數為 $\,\alpha ,\beta \,$ 的貝塔分布作為事前分布，則後驗均值估計量為

{\widehat {p}}={\frac {\alpha +x+1}{\alpha +\beta +n+2}}.

採用貝塔分布作為事前分布時，事後分布亦是貝塔分布，即貝塔分布為二項式分布的共軛先驗。^[28]

區間估計

若要對母數 $\,p\,$ 以區間形式給出估計，通過求解

\sum _{j=x}^{n}{n \choose j}p_{L}^{j}(1-p_{L})^{n-j}={\frac {\alpha }{2}},

\sum _{j=0}^{x}{n \choose j}p_{U}^{j}(1-p_{U})^{n-j}={\frac {\alpha }{2}},

所得的區間 $\,(p_{L},p_{U})\,$ 為一個信心水準近似為 $\,1-\alpha \,$ 的信賴區間，稱作克洛珀-皮爾森區間（Clopper-Pearson interval）。^[29]

常態分布可以用於推導近似的信賴區間。若用 $\,\lambda _{\alpha /2}\,$ 表示標準常態分布的第 $\,1-{\frac {\alpha }{2}}\,$ 分位數，即 $\,\Phi (\lambda _{\alpha /2})=1-{\frac {\alpha }{2}}\,$ ，則區間兩端的近似值為

{\frac {x}{n}}\pm {\frac {\lambda _{\alpha /2}}{\sqrt {n}}}{\sqrt {{\frac {x}{n}}\left(1-{\frac {x}{n}}\right)}}.

^[30]^[31]

參見

注釋

^ ^1.0 ^1.1 ^1.2 Feller 1968，第146–147頁.
^ Johnson, Kemp & Kotz 2005，第135–136頁.
^ ^3.0 ^3.1 ^3.2 Johnson, Kemp & Kotz 2005，第108頁.
^ Feller 1968，第34頁.
^ Feller 1968，第147–150頁.
^ Johnson, Kemp & Kotz 2005，第109頁.
^ Hald 2003，第54–63頁.
^ Hald 2003，第223–228頁.
^ Stigler 1986，第62–70頁.
^ Stigler 1986，第70–85頁.
^ Johnson, Kemp & Kotz 2005，第109–112頁.
^ Feller 1968，第167–169頁.
^ Johnson, Kemp & Kotz 2005，第140頁.
^ Johnson, Kemp & Kotz 2005，第115頁.
^ Johnson, Kemp & Kotz 2005，第112頁.
^ Kaas & Buhrman 1980.
^ Hamza 1995.
^ Johnson, Kemp & Kotz 2005，第119頁.
^ Johnson, Kemp & Kotz 2005，第110頁.
^ Feller 1968，第182–185頁.
^ Feller 1968，第185–186頁.
^ Schader & Schmid 1989.
^ Johnson, Kemp & Kotz 2005，第116–117頁.
^ Feller 1968，第153–154頁.
^ Sheu 1984.
^ Johnson, Kemp & Kotz 2005，第126頁.
^ Feller 1968，第123–124頁.
^ Chew 1971.
^ Johnson, Kemp & Kotz 2005，第130–131頁.
^ Johnson, Kemp & Kotz 2005，第132頁.
^ Blyth 1986.

參考文獻

Blyth, C. R. Approximate Binomial Confidence Limits. Journal of the American Statistical Association. 1986, 81: 843–855. doi:10.1080/01621459.1986.10478343 （英語）.
Chew, V. Point Estimation of the Parameter of the Binomial Distribution. The American Statistician. 1971, 25 (5): 47–50. doi:10.1080/00031305.1971.10477305 （英語）.
Feller, W. An Introduction to Probability Theory and Its Applications, Volume 1, Third Edition. Wiley. 1968. ISBN 0-471-25708-7 （英語）.
Hald, A. A History of Probability and Statistics and Their Applications before 1750. Wiley. 2003. ISBN 0-471-47129-1 （英語）.
Hamza, K. The Smallest Uniform Upper Bound on the Distance Between the Mean and the Median of the Binomial and Poisson Distributions. Statistics and Probability Letters. 1995, 23: 21–25. doi:10.1016/0167-7152(94)00090-U （英語）.
Johnson, N. L.; Kemp, A. W.; Kotz, S. Univariate Discrete Distributions, Third Edition. Wiley. 2005. ISBN 0-471-27246-9 （英語）.
Kaas, R.; Buhrman, J. M. Mean, Median and Mode in Binomial Distributions. Statistica Neerlandica. 1980, 34 (1): 13–18. doi:10.1111/j.1467-9574.1980.tb00681.x （英語）.
Schader, M.; Schmid, F. Two Rules of Thumb for the Approximation of the Binomial Distribution by the Normal Distribution. The American Statistician. 1989, 43 (1): 23–24. doi:10.1080/00031305.1989.10475601 （英語）.
Sheu, S. S. The Poisson Approximation to the Binomial Distribution. The American Statistician. 1984, 38 (3): 206–207. doi:10.1080/00031305.1984.10483202 （英語）.
Stigler, S. M. The History of Statistics: The Measurement of Uncertainty before 1900. Harvard University Press. 1986. ISBN 0-674-40340-1 （英語）.

[FOOTNOTEFeller1968146&ndash;147-1] 1.0 ^1.1 ^1.2 Feller 1968，第146–147頁.

[FOOTNOTEJohnsonKempKotz2005135&ndash;136-2] Johnson, Kemp & Kotz 2005，第135–136頁.

[FOOTNOTEJohnsonKempKotz2005108-3] 3.0 ^3.1 ^3.2 Johnson, Kemp & Kotz 2005，第108頁.

[FOOTNOTEFeller196834-4] Feller 1968，第34頁.

[FOOTNOTEFeller1968147&ndash;150-5] Feller 1968，第147–150頁.

[FOOTNOTEJohnsonKempKotz2005109-6] Johnson, Kemp & Kotz 2005，第109頁.

[FOOTNOTEHald200354&ndash;63-7] Hald 2003，第54–63頁.

[FOOTNOTEHald2003223&ndash;228-8] Hald 2003，第223–228頁.

[FOOTNOTEStigler198662&ndash;70-9] Stigler 1986，第62–70頁.

[FOOTNOTEStigler198670&ndash;85-10] Stigler 1986，第70–85頁.

[FOOTNOTEJohnsonKempKotz2005109&ndash;112-11] Johnson, Kemp & Kotz 2005，第109–112頁.

[FOOTNOTEFeller1968167&ndash;169-12] Feller 1968，第167–169頁.

[FOOTNOTEJohnsonKempKotz2005140-13] Johnson, Kemp & Kotz 2005，第140頁.

[FOOTNOTEJohnsonKempKotz2005115-14] Johnson, Kemp & Kotz 2005，第115頁.

[FOOTNOTEJohnsonKempKotz2005112-15] Johnson, Kemp & Kotz 2005，第112頁.

[FOOTNOTEKaasBuhrman1980-16] Kaas & Buhrman 1980.

[FOOTNOTEHamza1995-17] Hamza 1995.

[FOOTNOTEJohnsonKempKotz2005119-18] Johnson, Kemp & Kotz 2005，第119頁.

[FOOTNOTEJohnsonKempKotz2005110-19] Johnson, Kemp & Kotz 2005，第110頁.

[FOOTNOTEFeller1968182&ndash;185-20] Feller 1968，第182–185頁.

[FOOTNOTEFeller1968185&ndash;186-21] Feller 1968，第185–186頁.

[FOOTNOTESchaderSchmid1989-22] Schader & Schmid 1989.

[FOOTNOTEJohnsonKempKotz2005116&ndash;117-23] Johnson, Kemp & Kotz 2005，第116–117頁.

[FOOTNOTEFeller1968153&ndash;154-24] Feller 1968，第153–154頁.

[FOOTNOTESheu1984-25] Sheu 1984.

[FOOTNOTEJohnsonKempKotz2005126-26] Johnson, Kemp & Kotz 2005，第126頁.

[FOOTNOTEFeller1968123&ndash;124-27] Feller 1968，第123–124頁.

[FOOTNOTEChew1971-28] Chew 1971.

[FOOTNOTEJohnsonKempKotz2005130&ndash;131-29] Johnson, Kemp & Kotz 2005，第130–131頁.

[FOOTNOTEJohnsonKempKotz2005132-30] Johnson, Kemp & Kotz 2005，第132頁.

[FOOTNOTEBlyth1986-31] Blyth 1986.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

二項分布
機率質量函數
累積分布函數
記號	$\operatorname {B} (n,p)$
母數	$n>0$ $0\leq p\leq 1$
值域	$k\in \{0,\dots ,n\}$
機率質量函數	${n \choose k}p^{k}(1-p)^{n-k}$
累積分布函數	$I_{1-p}(n-\lfloor k\rfloor ,\lfloor k\rfloor +1)$
期望值	$np$
中位數	$\lfloor np\rfloor$ 或 $\lceil np\rceil$
眾數	$\lfloor (n+1)p\rfloor$
變異數	$np(1-p)$
偏度	${\frac {1-2p}{\sqrt {np(1-p)}}}$
峰度	${\frac {1-6p(1-p)}{np(1-p)}}$
熵	${\frac {1}{2}}\ln \left(2\pi nep(1-p)\right)+O\left({\frac {1}{n}}\right)$
動差母函數	$(1-p+pe^{t})^{n}$
特徵函數	$(1-p+pe^{it})^{n}$
機率母函數	$(1-p+pz)^{n}$