白 雪,龍 兵
(荊楚理工學(xué)院 數(shù)理學(xué)院,湖北 荊門 448000)
冪分布是貝塔分布的一種特殊情形,在貝葉斯統(tǒng)計(jì)分析中常被用于產(chǎn)品合格率的先驗(yàn)分布。冪分布的概率密度函數(shù)和累積分布函數(shù)分別為
其中參數(shù)θ>0,0<x<1。
在文獻(xiàn)[1-4]中取冪分布作為幾何分布參數(shù)的先驗(yàn)分布,討論了未知參數(shù)的貝葉斯估計(jì)問題。文獻(xiàn)[5]在抽樣總體服從冪分布的情況下,研究了次序統(tǒng)計(jì)量的性質(zhì)。文獻(xiàn)[6-7]在部分缺失數(shù)據(jù)樣本下討論了兩個(gè)冪分布總體參數(shù)的極大似然估計(jì)、參數(shù)之差的置信區(qū)間和假設(shè)檢驗(yàn),并通過隨機(jī)模擬驗(yàn)證估計(jì)的精度。
在許多情況下,我們需要估計(jì)概率密度函數(shù)和累積分布函數(shù)。例如,我們使用概率密度函數(shù)來估計(jì)微分熵、Kullback-Leibler散度和Fisher信息量;我們使用分布函數(shù)估計(jì)分位數(shù)函數(shù)和累積剩余熵等。因此文獻(xiàn)[8-14]討論了多個(gè)總體分布的概率密度函數(shù)和分布函數(shù)的估計(jì),計(jì)算了估計(jì)的均方誤差并對多種估計(jì)進(jìn)行比較。然而,對冪分布的概率密度函數(shù)和分布函數(shù)進(jìn)行統(tǒng)計(jì)分析的文獻(xiàn)到目前為止還沒有見到,本文將對這一問題進(jìn)行探討。
假設(shè)X1,X2,…,X n是從冪分布(1)和(2)中抽取的獨(dú)立同分布隨機(jī)樣本,由極大似然法可以得到參數(shù)θ的極大似然估計(jì)(MLE)為
根據(jù)極大似然估計(jì)的不變性,可以得到密度函數(shù)和分布函數(shù)的極大似然估計(jì)分別為
由于-2θlnX i~χ2(2),因此,則Y的概率密度函數(shù)為
定理1概率密度函數(shù)和累積分布函數(shù)極大似然估計(jì)的r階矩分別為
其中K v(·)表示第二類v的修正貝塞爾函數(shù)。
證明:根據(jù)(4)式,可以得到
利用文獻(xiàn)[15]中的公式(3.471.9),則
因此
注記:從定理1可以看到,當(dāng)取r=1時(shí)因此分別是f(x),F(xiàn)(x)的有偏估計(jì)。
定理2和的均方誤差分別為
證明:根據(jù)均方誤差公式可得
在定理1中分別取r=2和r=1,可以得到
下面將得到f(x)和F(x)的一致最小方差無偏估計(jì)(UMVUE),進(jìn)而得到這些估計(jì)的均方誤差。
設(shè)X1,X2,…,X n是從冪分布(1)中抽取的獨(dú)立同分布隨機(jī)樣本,則是關(guān)于θ的一個(gè)完備充分統(tǒng)計(jì)量。設(shè)f·(x)是f(x)的一致最小方差無偏估計(jì),根據(jù)Lehmann-Scheffe定理
其中f·(t)=f X1|T(x1|t)是當(dāng)給定T=t時(shí)X1的條件概率密度函數(shù),f X1,T(x1,t)是X1和T的聯(lián)合概率密度函數(shù)。
定理3當(dāng)給定T=t時(shí)X1的條件概率密度函數(shù)為
證明:設(shè)Z i=-lnX i,i=1,2,…,n,則,根據(jù)(3)式可以得到T的概率密度函數(shù)為
因此當(dāng)給定T=t時(shí)X1的條件概率密度函數(shù)為
因此
定理4當(dāng)T=t時(shí),f(x)和F(x)的一致最小方差無偏估計(jì)分別為
其中-lnx<t<+∞。
證明:根據(jù)(8)式和定理3,我們立即可以得到(x)是f(x)的一致最小方差無偏估計(jì)。對~(x)積分就可以得到F(x)的一致最小方差無偏估計(jì)(x)。
定理5和的均方誤差分別為
利用(9)式,可得
由于
因此
令θt=u,則
因此
由于
因此
利用均方誤差的公式則定理5得證。
基于分位數(shù)的估計(jì)由Kao[16]在1958年提出,當(dāng)某個(gè)概率分布的分位數(shù)函數(shù)具有較簡單的形式時(shí)可以考慮使用這種方法來估計(jì)分布的未知參數(shù)。
設(shè)X1,X2,…,X n是從冪分布(1)中抽取的獨(dú)立同分布隨機(jī)樣本,又設(shè)X(1),X(2),…,X(n)為次序統(tǒng)計(jì)量。記θ~PC為參數(shù)θ基于分位數(shù)的估計(jì)。通過極小化
利用最小二乘法,可得
因此f(x)和F(x)的估計(jì)分別為
在這一部分通過Mathematica和Matlab軟件進(jìn)行模擬計(jì)算。當(dāng)未知參數(shù)θ的值分別取1.5,2,2.5,3時(shí),利用逆變換法X i=(i=1,2,…,n),其中U i是(0,1)上獨(dú)立均勻分布隨機(jī)數(shù),則X i就是服從參數(shù)θ的冪分布隨機(jī)數(shù),樣本量分別取n=10,20,30,40。對于產(chǎn)生的每一個(gè)隨機(jī)樣本計(jì)算出估計(jì)量的值,經(jīng)過1000次重復(fù)模擬計(jì)算出各種估計(jì)的均方誤差。
從表1中的數(shù)據(jù)可以看出,隨著樣本量n的增大,估計(jì)量的均方誤差變小。基于分位數(shù)的估計(jì)的均方誤差比極大似然估計(jì)和一致最小方差無偏估計(jì)的均方誤差都要大。概率密度函數(shù)的極大似然估計(jì)的均方誤差要小于一致最小方差無偏估計(jì)的均方誤差,對于分布函數(shù)而言兩者的均方誤差比較接近。