生志榮
負二項分布的兩種近似分布及其比較
生志榮
(南京師范大學(xué)泰州學(xué)院,江蘇泰州225300)
負二項分布是一個重要的離散型隨機變量的分布,可以用泊松分布和正態(tài)分布作為其近似分布,通過對兩種近似分布進行比較分析,結(jié)果表明:在參數(shù)q很小時,泊松近似的精度好于正態(tài)近似,而且在參數(shù)q很小時,即便r不是很大,用泊松分布也能獲得負二項分布較好的近似;當參數(shù)q較大時,泊松近似效果不好,相比之下,正態(tài)近似的結(jié)果不錯。
負二項分布;泊松分布;正態(tài)分布;近似計算
負二項分布是一個重要的離散型隨機變量的分布,具有比較優(yōu)良的統(tǒng)計特性,在風(fēng)險管理、排隊論等問題中有著廣泛的應(yīng)用。近年來,很多文獻對負二項分布進行了研究,內(nèi)容涉及負二項分布的統(tǒng)計性質(zhì)及其應(yīng)用[1-2]以及負二項分布的參數(shù)估計問題[3],對負二項分布的近似計算問題還未見討論。本文通過建立負二項分布與二項分布在概率值上的關(guān)系式,利用常用統(tǒng)計軟件中二項分布的計算功能來獲得負二項分布的概率精確值;給出并證明了負二項分布的泊松近似定理;利用負二項分布隨機變量的和式分解以及獨立同分布中心極限定理,給出了負二項分布的正態(tài)近似;最后對兩種近似分布進行了比較分析。
負二項分布亦稱為帕斯卡(Pascal)分布,它可以由下列兩種模型來描述:
定義1 設(shè)p(0
定義2 設(shè)p(0
負二項分布的這兩種定義是一致的,由定義1中的變量Y與定義2中的變量X各自的含義可得
其中NB(r,p;k)表示參數(shù)為r,p的負二項分布在k處的概率值,B(k,p;r)表示參數(shù)為k,p的二項分布在r處的概率取值,利用這個關(guān)系式,可以通過常用統(tǒng)計軟件中二項分布的計算功能來獲得負二項分布的概率精確值。
定理1 設(shè)在貝努利試驗中每次試驗成功的概率為p(0
證明 由負二項分布的實際背景可知,Y為在一系列貝努利試驗(每次試驗成功的概率為p)成功r次時試驗的次數(shù),設(shè)Y1為第一次試驗成功的試驗次數(shù),Y2為第二次試驗成功的試驗次數(shù)(從第一次試驗成功之后算起),…,Yr為第r次試驗成功的試驗次數(shù)(從第r-1次試驗成功之后算起),則Y1,Y2,…,Yr相互獨立,且Yi(i=1,2,…,r)服從幾何分布G(p),此時有Y=Y1+Y2+…+Yr,即Y可以分解為r個獨立同服從幾何分布的隨機變量之和,由幾何分布的期望和方差得到負二項分布的期望與方差分別為EY=r/p,DY=r(1-p)/p2,根據(jù)獨立同分布中心極限定理可得負二項分布的正態(tài)近似分布N(r/p,r(1-p)/p2),標準化之后得到式(5)。
注:因為負二項分布是離散分布,而正態(tài)分布是連續(xù)分布,所以用正態(tài)分布作為負二項分布的近似計算時,作些修正可以提高精度。若k1 定理2 設(shè)在貝努利試驗中每次試驗成功的概率為pr(與r有關(guān)),X表示試驗進行到第r次成功為止已經(jīng)失敗的試驗次數(shù),令qr=1-pr。如果當r→+∞時,rqr→λ,則有 證明 記rqr=λr,即qr=λr/r,由式(2)可得: 對于固定的k有: 從而 下面對負二項分布的泊松近似與正態(tài)近似進行比較,其中負二項分布的概率精確值根據(jù)式(4)轉(zhuǎn)化為二項分布概率值計算得到,負二項分布的泊松近似利用式(3)和式(6)得到: 負二項分布的正態(tài)近似為: 不同參數(shù)的負二項分布、泊松分布以及正態(tài)分布的概率值比較見表1~4。所有數(shù)值均由Minitab軟件算得。 由表1可知:對于負二項分布的概率取值,在成功概率p很大(接近于1時),隨著k-r的增大,概率值將很快趨向于0,這與負二項分布的實際背景是一致的,因為在成功概率p很大(接近于1)時,成功r次所需的試驗次數(shù)k一般不會比r大很多。同時也看到,在q(=1-p)很小,r很大時,用泊松分布作為負二項分布的近似分布是合理的,q越小r越大時,近似程度越高。 表1 負二項分布NB(100,0.99)、NB(200,0.995)與泊松分布P(1)的部分概率值比較表 表2 負二項分布NB(20,0.99)與泊松分布P(0.2)的部分概率值比較表 由表2可知:對于負二項分布的概率取值,在q很小時,即便r不是很大,用泊松分布也能獲得負二項分布較好的近似。 表3 負二項分布NB(200,0.995)、正態(tài)分布N(201, 1/0.9952)與泊松分布P(1)的部分累積概率值比較表 由表3可知:當負二項分布的參數(shù)q很小時,泊松分布對負二項分布的近似要好于正態(tài)分布對負二項分布的近似。 表4 負二項分布N(200,0.8)、正態(tài)分布N(250,40/0.64)與泊松分布P(40)的部分累積概率值比較表 由表4可知:當負二項分布q較大時,用泊松分布去逼近負二項分布的效果不好,相比之下,用正態(tài)分布來近似計算負二項分布的值所得結(jié)果不錯。 [1] 孫道德.關(guān)于負二項分布的性質(zhì)及其應(yīng)用[J].阜陽師范學(xué)院學(xué)報:自然科學(xué)版,2000,17(2). [2] 孟生旺.負二項分布的優(yōu)良特性及其在風(fēng)險管理中的應(yīng)用[J].數(shù)理統(tǒng)計與管理,1998,17(2). [3] 程維虎,王莉麗.負二項分布兩種參數(shù)估計及其比較[J].數(shù)理統(tǒng)計與管理,2004,23(5). [4] 茆詩松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計教程[M].北京:高等教育出版社,2004. Two kind of Approximate Distributions of Negative Binomial Distribution and It’s Comparison SHENG Zhi2rong The negative binomial distribution is an important discrete random variable distribution and may use the poisson distribution and the normal distribution as its approximate distribution.The comparative analysis to two kind of approximate distributions has been carried on and the results indicated: When parameter q is very small,poisson approximation has better accuracy than normal approximation, moreover,even if r is not very big,good approximation can also been obtained with the poisson distribution.When parameter q is big,the poisson approximation is not good,the normal approximate result is comparatively good. negative binomial distribution;poisson distribution;normal distribution;approximate calculation O211 A 1007-3116(2011)01-0020-03 (責(zé)任編輯:馬 慧) 2010-09-06 生志榮,男,江蘇泰興人,講師,碩士,研究方向:概率統(tǒng)計。三、兩種近似分布的比較研究
(Taizhou College,Nanjing Normal University,Taizhou 225300,China)