李云飛
(西華師范大學(xué) 數(shù)學(xué)與信息學(xué)院,四川 南充 637002)
在某些產(chǎn)品的壽命試驗中,經(jīng)常會產(chǎn)生不完全的觀測數(shù)據(jù)。比如,在一些特殊的壽命試驗(如可靠性試驗)中,由于實驗設(shè)備、觀測方法、特殊要求或其他方面的原因,可能造成某些實驗數(shù)據(jù)丟失或有些實驗數(shù)據(jù)不能觀測到的現(xiàn)象。基于這些不完全的數(shù)據(jù),如何對總體參數(shù)進行估計是一個重要而且實際的問題。一些學(xué)者針對可靠性理論中常用的正態(tài)分布、對數(shù)正態(tài)分布和Weibull分布,在不完全觀測數(shù)據(jù)情況下研究了這些分布的參數(shù)估計問題[1~3]。
然而,針對可靠性理論中的另一種重要分布——極值分布在不完全數(shù)據(jù)場合下的參數(shù)估計問題,相關(guān)研究較少。極值分布是一種常見的壽命分布,在工程實踐中,許多產(chǎn)品、部件或系統(tǒng)的應(yīng)力強度、負載強度等都服從極值分布。Mann&Schafer et al.[4]討論了極值分布可靠壽命的估計問題,他們給出了可靠壽命的最佳線性不變估計量(BLIE)及其分位數(shù)表,并進一步求出了可靠度的置信限。費鶴良和陸向薇[5]在對兩參數(shù)威布爾分布的研究中,也討論了基于極值分布參數(shù)的最佳線性不變估計量以及最佳線性無偏估計量(BLUE)所得到的可靠度的點估計和極大似然估計,并比較了它們的偏性和均方誤差。費鶴良和倪中新[6]基于定數(shù)截尾樣本場合,給出了極值分布位置參數(shù)和尺度參數(shù)的最佳線性無偏估計量。程維虎[7]利用樣本分位數(shù),構(gòu)建了極值分布參數(shù)的線性回歸模型,得到了相關(guān)參數(shù)的漸進正態(tài)無偏估計,并給出了相應(yīng)的漸進置信區(qū)間。段忠東和周道成[8]針對三種常用極值分布的參數(shù)估計方法進行了總結(jié),并對這些估計方法的優(yōu)缺點進行了比較分析,進而得到了不同極值分布的優(yōu)選參數(shù)估計方法。雷剛和劉次華[9]討論了定數(shù)截尾情況下極值分布總體參數(shù)的估計問題,并針對參數(shù)估計值的求解提出了一種迭代算法。吳香華、秦偉良等[10]將最小絕對偏差法與非線性回歸模型相結(jié)合,給出了一種極值分布參數(shù)的估計方法,并將其應(yīng)用于相關(guān)氣象要素的預(yù)測、預(yù)報研究中。李曉康[11]分別利用門限峰值法和Dehaan矩估計法,對極值分布的閾值和總體參數(shù)進行了估計,并將其研究成果應(yīng)用于金融市場的預(yù)測。
總體看來,現(xiàn)有研究大都是在完全樣本場合或是在截尾樣本場合,針對極值分布的參數(shù)估計問題進行討論,并不適用于一般的不完全樣本場合。因此,本文將針對已有研究的不足,討論極值分布總體參數(shù)基于不完全數(shù)據(jù)的區(qū)間估計問題,給出構(gòu)造置信區(qū)間的一種方法,該方法還適用于樣本數(shù)據(jù)中可能存在異常值的情形,具有穩(wěn)健性。
當(dāng)樣本觀測數(shù)據(jù)中存在異常值時,這些異常值反映為樣本極值,它們將會對統(tǒng)計推斷造成不良影響[13]。樣本分位數(shù)能夠較好抵抗異常值的干擾[14],而且樣本p分位數(shù)是總體 p分位數(shù)的漸近無偏,相合估計[15]。因此,本文將選擇對異常數(shù)據(jù)具有較強抵抗力的樣本分位數(shù)構(gòu)造樞軸量。
假設(shè) X1,X2,…,Xn是來自Ⅰ型極小值分布總體的獨立同分布樣本,X(1),X(2),…,X(n)是相應(yīng)的次序統(tǒng)計量。注意到:FX(μ)=0.632,F(xiàn)X(μ+σ)=0.934,即 μ是總體0.632分位數(shù),μ+σ是總體 0.934分位數(shù),記p1=0.632, p2=0.934,則樣本分位數(shù) X([np1]+1)是μ的漸近無偏相合估計,X([np2]+1)-X([np1]+1)是σ的漸近無偏相合估計。由此,定義
因此,無論總體參數(shù)μ和σ取何值,S和H的概率分布與參數(shù)μ=0,σ=1時相同,即說明S和H的概率分布與總體參數(shù)μ,σ的取值無關(guān)。
定理1表明,在不完全數(shù)據(jù)場合下,當(dāng)Ⅰ型極小值分布的參數(shù)σ未知時,可以利用S作為樞軸量對參數(shù)μ進行區(qū)間估計;當(dāng)Ⅰ型極小值分布的參數(shù)μ未知時,可以利用H作為樞軸量對參數(shù)σ進行區(qū)間估計。
沿用以上記號,下面將分別討論樞軸量S和H的精確概率分布。
引理1[15](X(n1),X(n2))的聯(lián)合概率密度函數(shù)為
證明 由定理1知,僅需討論總體參數(shù) μ=0, σ=1的情形。由引理1,(X(n1),X(n2))的聯(lián)合概率密度函數(shù)為
由定理2和定理3可知樞軸量S和H精確的概率分布形式比較復(fù)雜,不易計算出構(gòu)造置信區(qū)間所需的分位數(shù)值(當(dāng)然,可以通過數(shù)值計算得到近似值),因此,下面將討論樞軸量S和H的大樣本近似分布。
引理2[12,15]假設(shè)總體X的分布函數(shù)FX(x)絕對連續(xù),X1,X2,…,Xn為 X 的簡單隨機樣本,X(1),X(2),…,X(n)為其次序統(tǒng)計量,對任意的 p1,p2(0<p1<p2<1),記 ξp1,ξp2分別為總體 p1,p2分位數(shù),n1=[np1]+1, n2=[np2]+1,fX(x)=F′X(x)在點 ξp1,ξp2處連續(xù)且不為 0 ,則當(dāng) n→+∞ 時,有
由此可以得到尺度參數(shù)σ相應(yīng)的大樣本近似置信區(qū)間為
由于樞軸量S和H只涉及兩個次序統(tǒng)計量X([np1]+1)和X([np2]+1),因此,對于Ⅰ型極小值分布各種情形的不完全樣本數(shù)據(jù),都可以通過上述方法得到位置參數(shù)μ和尺度參數(shù)σ的置信區(qū)間。當(dāng)樣本觀測數(shù)據(jù)中存在異常值時,它們一定反映為樣本極值,而樣本分位數(shù)能夠較好地抵抗異常值對統(tǒng)計推斷的干擾,因此,本文基于樣本分位數(shù)構(gòu)造的置信區(qū)間不但適用于不完全樣本數(shù)據(jù),而且還適用于樣本數(shù)據(jù)中有異常值的情形,具有較好的穩(wěn)健性。
[1]徐曉嶺.三參數(shù)Weibull分布位置參數(shù)的置信限[J].數(shù)理統(tǒng)計與應(yīng)用概率,1989,4(4).
[2]徐曉嶺.三參數(shù)對數(shù)正態(tài)分布位置參數(shù)的置信限[J].數(shù)理統(tǒng)計與應(yīng)用概率,1991,6(3).
[3]朱宏,呂恕.正態(tài)分布位置參數(shù)基于不完全數(shù)據(jù)的區(qū)間估計[J].應(yīng)用科學(xué)學(xué)報,1996,14(2).
[4]Mann N R,Schafer R E,Singpurwalla N D.Methods For Statistical Analysis of Reliability and Life Date[M].New York:John Wiley&Sons,1981.
[5]費鶴良,陸向薇.兩參數(shù)威布爾分布可靠度和可靠壽命的精確置信限[J].高校應(yīng)用數(shù)學(xué)學(xué)報,1986,1(2).
[6]費鶴良,倪中新.威布爾分布或極值分布可靠度置信下限的回歸表示[J].運籌學(xué)學(xué)報,2002,6(3).
[7]程維虎.利用樣本分位數(shù)的極值分布的參數(shù)估計[J].北京工業(yè)大學(xué)學(xué)報,2002,28(3).
[8]段忠東,周道成.極值概率分布參數(shù)估計方法的比較研究[J].哈爾濱工業(yè)大學(xué)學(xué)報,2004,36(12).
[9]雷剛,劉次華.定數(shù)截尾下極值分布的參數(shù)估計[J].應(yīng)用數(shù)學(xué),2005,18(1).
[10]吳香華,秦偉良,王新蕾.用最小絕對偏差方法(LAD)估計極值分布參數(shù)的探討[J].氣象科學(xué),2006,26(3).
[11]李曉康.極值分布參數(shù)的Dehaan矩估計[J].陜西理工學(xué)院學(xué)報,2011,27(3).
[12]陳希孺.數(shù)理統(tǒng)計引論[M].北京:科學(xué)出版社,1997.
[13]李云飛,黃繼偉,朱宏.雙參數(shù)指數(shù)分布異常數(shù)據(jù)的檢驗[J].電子科技大學(xué)學(xué)報,2005,34(1).
[14]Hubber P J.Robust Statistics[M].New York:John Wiley,1981.
[15]茆詩松.高等數(shù)理統(tǒng)計[M].北京:高等教育出版社,1998.