顧蓓青,王蓉華,徐曉嶺
(1.上海對外經(jīng)貿(mào)大學(xué) 統(tǒng)計與信息學(xué)院,上海 201620;2.上海師范大學(xué) 數(shù)理學(xué)院,上海 200234)
Cauchy分布的統(tǒng)計分析方法研究
顧蓓青1,王蓉華2,徐曉嶺1
(1.上海對外經(jīng)貿(mào)大學(xué) 統(tǒng)計與信息學(xué)院,上海 201620;2.上海師范大學(xué) 數(shù)理學(xué)院,上海 200234)
文章在刻度參數(shù)λ已知的情形下,給出了位置參數(shù)μ的分位數(shù)估計與逆矩估計,通過模擬比較發(fā)現(xiàn)分位數(shù)估計更加精確。同時還給出了參數(shù)μ的區(qū)間估計,考察了區(qū)間估計的精度;在位置參數(shù)μ已知的情形下,給出了刻度參數(shù)λ的極大似然估計,考察了點估計的精度;在參數(shù)μ,λ都未知的情形下,給出了參數(shù)μ,λ的點估計,通過模擬認為位置參數(shù)μ的點估計取樣本中位數(shù),而刻度參數(shù)λ的點估計取極大似然估計(依賴于μ的估計)較為精確。
Cauchy分布;位置參數(shù);刻度參數(shù);逆矩估計;極大似然估計;分位數(shù)估計
設(shè)隨機變量X服從位置參數(shù)μ、刻度參數(shù)λ的兩參數(shù)Cauchy分布(記為C(μ,λ)),其密度函數(shù)f(x)和分布函數(shù)F(x)分別為:
特別地,(1)取μ=0 ,此時,
(2)取λ=1,此時,
(3)若取μ=0,λ=1,此時X~C(0,1),即稱X服從標準Cauchy分布或t(1),其密度函數(shù)f(x)和分布函數(shù)為:
由于Cauchy分布的數(shù)學(xué)期望不存在,使得它在分布理論中占有特殊的地位,在幾乎所有的教科書中,Cauchy分布均作為不存在矩的反例而出現(xiàn),從而使人們誤認為它是人為杜撰出來的,并沒有其他的實際意義。實際上,文獻[1]中曾指出,Cauchy分布在力學(xué)、電學(xué)、心理生物學(xué)、人類學(xué)和計量學(xué)中都有許多應(yīng)用。
關(guān)于Cauchy分布的參數(shù)估計,有一些學(xué)者做了研究,取得了一些成果。郭彥在文獻[2]中利用特征函數(shù)討論了Cauchy分布的結(jié)構(gòu)、可加性、無窮可分性等概率性質(zhì),針對C(μ,1)的參數(shù)估計問題,說明了矩法、均方誤差最小、極大似然估計法等常用的估計方法均不合適,并利用Cauchy分布的中位數(shù)給出了參數(shù)μ的點估計。王志祥在文獻[3]中針對C(0,λ)通過引入新的隨機變量,利用局部矩估計方法給出了參數(shù)λ的點估計與區(qū)間估計,但局部矩估計依賴于C的取值,影響了該方法的應(yīng)用。吳慶波等在文獻[4]中針對兩參數(shù)Cauchy分布C(μ,λ),給出了位置參數(shù)μ和刻度參數(shù)λ的分位數(shù)估計。
本文在刻度參數(shù)λ已知的情形下,給出了位置參數(shù)μ的分位數(shù)估計、逆矩估計及區(qū)間估計,通過模擬考察了點估計和區(qū)間估計的精度,并發(fā)現(xiàn)分位數(shù)估計更加精確。其次,在位置參數(shù)μ已知的情形下,給出了刻度參數(shù)λ的極大似然估計,通過模擬考察了點估計的精度。最后,在參數(shù)μ,λ都未知的情形下,給出了參數(shù)μ,λ的點估計,通過模擬認為位置參數(shù)μ的點估計取樣本中位數(shù)較為精確,而刻度參數(shù)λ的點估計取極大似然估計(依賴于μ的估計)較為精確。
設(shè)X1,X2,…,Xn為來自總體X~C(μ,λ0)的一個容量為n的簡單隨機樣本,其中刻度參數(shù)λ0已知,而位置參數(shù)μ未知時,下面求參數(shù)μ的點估計與區(qū)間估計。
如果次序統(tǒng)計量記為X(1)≤X(2)≤…≤X(n),給定0<p<1,樣本的p分位數(shù)X*(p)可定義為:
其中上式中的<pn>為pn的整數(shù)部分。
由于F(μ)=0.5,則位置參數(shù)μ的分位數(shù)估計為:1=X*(0.5)
化簡得:
引理1:(1)μ的方程有唯一實根。(2)對正常數(shù)a,μ的方程有唯一實根。
易見,方程(1)的根即為參數(shù)μ的逆矩估計2。
再者易知:
于是,給定置信水平1-α下,參數(shù)μ的區(qū)間估計為:
其中,21,22分別為如下方程的根:
給定樣本容量n,參數(shù)真值取μ=1,λ0=1,通過1000次Monte-Carlo模擬得到參數(shù)μ的點估計的均值與均方差,結(jié)果列于表1,從中可以看到不論是小樣本還是大樣本,方法一都優(yōu)于方法二。
表1 參數(shù)μ的點估計模擬比較
給定樣本容量n,參數(shù)真值取μ=1,λ0=1,置信水平1-α=0.95,通過1000次Monte-Carlo模擬得到參數(shù)μ的區(qū)間估計的平均下限、平均上限、平均區(qū)間長度,以及區(qū)間估計包含參數(shù)真值的次數(shù),結(jié)果列于表2,從中可以看到0.95的置信水平基本達到,同時隨著樣本容量n的增加,區(qū)間估計的平均長度呈減小趨勢,也就是區(qū)間估計越精確。
表2 參數(shù)μ的區(qū)間估計
設(shè)X1,X2,…,Xn為來自總體X~C(μ0,λ)的一個容量為n的簡單隨機樣本,其中位置參數(shù)μ0已知,而刻度參數(shù)λ未知時,下面求參數(shù)λ的點估計。
表3 參數(shù)λ的0.25分位數(shù)估計和0.75分位數(shù)估計大于0的次數(shù)
記樣本觀察值為x1,x2,…,xn,則似然函數(shù)為:
注:文獻[4]中所給出的關(guān)于刻度參數(shù)λ的似然方程是錯誤的。
引理 2:λ的方程有唯一正實根。
易見,方程(4)的根即為參數(shù)λ的極大似然估計2。
給定樣本容量n,參數(shù)真值取μ0=1,λ=1,通過1000次Monte-Carlo模擬得到參數(shù)λ的點估計的均值與均方差,結(jié)果列于表4,從中看到其精度還是令人滿意的。
表4 參數(shù)λ的點估計
設(shè)X1,X2,…,Xn為來自總體X~C(μ,λ)的一個容量為n的簡單隨機樣本,次序統(tǒng)計量記為X(1)≤X(2)≤…≤X(n),其次序觀察值記為x(1)≤x(2)≤…≤x(n)。
則參數(shù)μ,λ的點估計為:=X*(0.5),1=X*(0.5)-X*(0.25)
則參數(shù)μ,λ的點估計為:=X*(0.5),2=X*(0.75)-X*(0.5)
位置參數(shù)的點估計取為=X*(0.5),而刻度參數(shù)的點估計3可取為如下方程的根:
給定樣本容量n,參數(shù)真值取μ=1,λ=1,通過1000次模擬得到參數(shù)λ的點估計的均值與均方差,結(jié)果列于表5,從中可以看到方法三更優(yōu)。
例1:文獻[3]提供了如下算例,取樣本容量n=10,刻度參數(shù)λ的真值取為5,通過Monte-Carlo模擬產(chǎn)生10個服從C(0,λ)分布的隨機數(shù)如下:
2.3008,3.9756,-6.4165,11.9341,16.4812,-0.2428,-7.9044,-6.3136,14.5784,-1.9155
文獻[3]得到了參數(shù)λ的局部矩估計為:=5.0953
(1)當參數(shù)λ=5已知時,參數(shù)μ的點估計為1=X*(0.5)=1.029,=1.6879,給定置信水平0.95下,參數(shù)μ的區(qū)間估計為:
(2)當參數(shù)μ=0已知時,參數(shù)λ的0.25分位數(shù)估計為1(0.25)=μ0-X*(0.25)=6.3136 ,0.75 分位數(shù)估計為1(0.75)=X*(0.75)-μ0=11.9341,極大似然估計2=5.5386 ;
(3)當參數(shù)μ,λ都未知時,μ的點估計為=X*(0.5)=1.029 ,λ的 點 估 計 為1=X*(0.5)-X*(0.25)=7.3426 ,2=X*(0.75)-X*(0.5)=10.9051 ,3=5.6939
例2:取樣本容量n=30,通過Monte-Carlo模擬產(chǎn)生一組服從C(2,3)分布的隨機數(shù)如下:
5.11597, -0.232211, 6.7509, 5.26303, 2.80716,1.96063,-0.943453,-0.754331,3.11886,5.40918,-6.09775,2.3691,0.499949,1.11528,2.4189,0.284043,-2.20647,11.5716,284.604,22.5808,5.52263,7.28462,-4.86067,4.58242,-21.4326,4.87815,3.84585,2.19667,-0.332737,-42.9647
(1)當參數(shù)λ=3已知時,參數(shù)μ的點估計為1=X*(0.5)=2.394 ,2=2.4367 ,給定置信水平0.95下,參數(shù)μ的區(qū)間估計為:
(2)當參數(shù)μ=2已知時,參數(shù)λ的0.25分位數(shù)估計為1(0.25)=μ0-X*(0.25)=2.3327 ,0.75 分位數(shù)估計為1(0.75)=X*(0.75)-μ0=3.2630,極大似然估計2=2.8423;
(3)當參數(shù)μ,λ都未知時,μ的點估計為=X*(0.5)=2.394 ,λ的點估計為1=X*(0.5)-X*(0.25)=2.7267 ,2=X*(0.75)-X*(0.5)=2.8690 ,3=2.8081
考慮到Cauchy分布C(μ,λ)其數(shù)學(xué)期望不存在的特殊性及其在眾多領(lǐng)域的重要應(yīng)用,本文在已有研究成果的基礎(chǔ)上,進一步討論了它的參數(shù)估計問題。在參數(shù)λ已知的情形下,給出了參數(shù)μ的分位數(shù)估計、逆矩估計及區(qū)間估計;另外,在參數(shù)μ已知的情形下,給出了參數(shù)λ的分位數(shù)估計和極大似然估計;并且分別通過Monte-Carlo模擬考察了點估計和區(qū)間估計的精度,發(fā)現(xiàn)參數(shù)μ的分位數(shù)估計較優(yōu),參數(shù)λ的極大似然估計較優(yōu)。最后,在兩個參數(shù)μ,λ都未知的情形下,給出了參數(shù)μ,λ的幾種點估計方法,通過大量Monte-Carlo模擬發(fā)現(xiàn)參數(shù)μ的點估計取樣本中位數(shù)較為精確,而刻度參數(shù)λ的點估計取極大似然估計(依賴于μ的估計)較為精確。
[1]方開泰,許建倫.統(tǒng)計分布[M].北京:科學(xué)出版社,1987.
[2]郭彥.對柯西分布性質(zhì)的進一步討論[J].淮陰工學(xué)院學(xué)報,2005,(5).
[3]王志祥.Cauchy分布刻度參數(shù)的矩估計與區(qū)間估計[J].統(tǒng)計與決策,2008,(23).
[4]吳慶波,李再興,景平.一元Cauchy分布族中兩參數(shù)的分位數(shù)估計及其性質(zhì)[J].廊坊師范學(xué)院,2010,(1).
[5]徐曉嶺,王蓉華.概率論與數(shù)理統(tǒng)計[M].北京:人民郵電出版社,2014.
Study on Statistical Analysis Method of Cauchy Distribution
Gu Beiqing1,Wang Ronghua2,Xu Xiaoling1
(1.School of Statistics and Information,Shanghai University of International Business and Economics,Shanghai 201620,China;2.College of Mathematics and Science,Shanghai Normal University,Shanghai 200234,China)
This paper gives the quantile estimate and inverse moment estimate of location parameterμin the case of known scale parameterλ,and finds that quantile estimate is more accurate through simulation comparison.At the same time,the interval estimate of parameterμis given and the precision of interval estimate investigated;the maximum likelihood estimate of scale parameterλalso given in the case of known location parameterμ,and the precision of point estimate investigated;the point estimates of parametersμ,λis provided in the case of unknown parametersμ,λ;the paper finds that sample median is more accurate for point estimate of location parameterμ,while maximum likelihood estimate depending on estimate ofμis more accurate for point estimate of scale parameterλ.
Cauchy distribution;location parameter;scale parameter;inverse moment estimate;maximum likelihood estimate;quantile estimate
O212
A
1002-6487(2017)20-0019-04
國家自然科學(xué)基金資助項目(11671264)
顧蓓青(1984—),女,上海人,博士,講師,研究方向:應(yīng)用統(tǒng)計。
(責任編輯/亦 民)