劉蓮花 (海南醫(yī)學(xué)院公共衛(wèi)生學(xué)院,海南 海口 571199)
羅文強 (中國地質(zhì)大學(xué)(武漢)數(shù)理學(xué)院,湖北 武漢 430074)
擬合優(yōu)度檢驗功效比較
劉蓮花 (海南醫(yī)學(xué)院公共衛(wèi)生學(xué)院,海南 ???571199)
羅文強 (中國地質(zhì)大學(xué)(武漢)數(shù)理學(xué)院,湖北 武漢 430074)
采用統(tǒng)計模擬的方法對6種正態(tài)性擬合優(yōu)度檢驗方法的功效進行了模擬比較,模擬中分別采用Beta分布、Gamma分布、T分布和Lognormal分布4種不同的偏正態(tài)分布函數(shù)進行抽樣,最終得出6種檢驗方法功效上的總體排序。
擬合優(yōu)度檢驗;檢驗功效;統(tǒng)計模擬
擬合優(yōu)度檢驗是統(tǒng)計理論的重要內(nèi)容,其與實際應(yīng)用有密切的聯(lián)系?,F(xiàn)實生活中常常需要根據(jù)給定的樣本數(shù)據(jù)來檢驗樣本是否來自某個特定的分布,以便進一步的獲取樣本的某些信息,如疲勞壽命、可靠度等。但是實際應(yīng)用中常常出現(xiàn)這種問題:同一樣本數(shù)據(jù)在相同的原假設(shè)分布下,有的擬合優(yōu)度檢驗方法得出的結(jié)論是拒絕原假設(shè),而有的擬合優(yōu)度檢驗方法得到的結(jié)論是接受原假設(shè)。出現(xiàn)這種問題的原因是進行擬合優(yōu)度檢驗時很容易犯“拒真”和“納偽”2類錯誤。任何一種檢驗方法,犯2類錯誤都是不可避免的,然而對于同一樣本,不同的擬合優(yōu)度檢驗方法犯錯誤的概率卻是不同的。一個好的檢驗,要求在控制第1類錯誤的前提下,第2類錯誤盡可能的小,也就是檢驗的功效盡可能的高,因此出現(xiàn)上述問題時,應(yīng)以功效較高的檢驗方法得出的結(jié)論為主,且在進行擬合優(yōu)度檢驗時,應(yīng)盡量選擇功效高的擬合優(yōu)度檢驗方法。為此,筆者對不同的擬合優(yōu)度檢驗方法的功效進行了模擬比較。
目前擬合優(yōu)度檢驗的方法很多,因為正態(tài)分布是最重要的分布,也是實際應(yīng)用最為廣泛的分布,所以筆者主要針對正態(tài)性檢驗方法進行討論。討論的統(tǒng)計量有D、W2、A2、Zc、Za和Zk,其數(shù)值計算公式[1-3]如下:
按照Neyman-Pearson原則[4],在所有水平為α的擬合優(yōu)度檢驗中,功效函數(shù)[4]在備擇假設(shè)H1為真時越大,表明該檢驗越好,也即檢驗的功效越高,然而想求擬合優(yōu)度檢驗的功效,其檢驗問題的備擇假設(shè),必須是具體的分布,所以筆者針對如下的具體問題進行討論:
H0:F(x)=F1(x)H1:F(x)=F2(x)
擬合優(yōu)度檢驗的功效一般不易直接求出,為此筆者采用統(tǒng)計模擬[5]的方法,模擬的具體步驟如下:
步2 計算用某種檢驗方法進行擬合優(yōu)度檢驗時統(tǒng)計量的值,并記m次重復(fù)模擬中統(tǒng)計量的值落于拒絕域的次數(shù)為t;
因為對于不同的偏正態(tài)分布以及不同的樣本容量擬合優(yōu)度檢驗的功效會有很大的差別,所以筆者主要選擇Beta分布、Gamma分布、T分布、Lognormal分布作為備擇分布進行抽樣模擬[6-7],所抽取的樣本容量分別為10、30、50、60、70、80、100、150、200、250,模擬中的檢驗水平α=0.05,并在模擬中不斷改變各分布的參數(shù),以便得到在不同的偏度和峰度時的功效模擬值,表1~4分別列出了4種備擇分布的參數(shù)取不同值時所對應(yīng)的偏度及峰度值,圖1~圖4是分別從4種不同的備擇分布中進行抽樣模擬時的功效比較圖形,最后通過分析圖形對6種正態(tài)性檢驗方法的功效進行了總體的評價和排序。
3.1備擇假設(shè)為Beta分布
從功效模擬圖形1可得如下結(jié)論:①當(dāng)備擇分布Beta的偏度為零時,D統(tǒng)計量的功效是最高的,但是若偏度非零則D統(tǒng)計量的功效最低,這說明D統(tǒng)計量在檢驗時對峰度比較靈敏而對偏度不靈敏。②當(dāng)備擇分布偏度非零時,D統(tǒng)計量的功效隨樣本變化很小。③除D以外的其他5種統(tǒng)計量的功效隨著備擇分布偏度偏離于零的程度的增大而增加。④當(dāng)偏度非零時,W2統(tǒng)計量的功效僅高于D統(tǒng)計量。⑤當(dāng)偏度非零時,幾種統(tǒng)計量的功效排序大致為:Za>Zc>Zk>A2>W2>D。
表1 Beta分布中參數(shù)取不同值時的偏度及峰度
圖1 Normal VS Beta(原假設(shè)是Normal分布,備擇假設(shè)為Beta分布) 功效模擬比較圖
圖2 Normal VS T功效模擬比較圖
圖3 Gamma 功效模擬比較圖
3.2備擇假設(shè)為T分布
從功效模擬圖形2可得如下結(jié)論:①因為T分布是對稱分布,即偏度為0,從圖中可發(fā)現(xiàn)D統(tǒng)計量的檢驗功效是最高的,進一步說明了D統(tǒng)計量對峰度靈敏。②T分布中參數(shù)為3時偏離正態(tài)的程度大于參數(shù)為9時偏離正態(tài)的程度,相應(yīng)的各統(tǒng)計量的功效也較高,這說明當(dāng)備擇分布偏離正態(tài)越嚴(yán)重,各檢驗統(tǒng)計量的功效越高。
3.3備擇假設(shè)為Gamma分布
從功效模擬圖形3可得如下結(jié)論:①2個圖形中的備擇分布的偏度都是非零的,所對應(yīng)的D統(tǒng)計量的功效最低,進一步說明D統(tǒng)計量對偏度不靈敏。②當(dāng)備擇分布偏度非零時,W2統(tǒng)計量僅優(yōu)于D統(tǒng)計量,而Za,Zc功效是最高的。
表2 T分布中參數(shù)取不同值時的偏度及峰度
表3 Gamma分布中參數(shù)取不同值時的偏度及峰度
3.4備擇假設(shè)為Lognormal分布
表4 Lognormal分布中參數(shù)取不同值時的偏度及峰度
圖4(b)的備擇分布偏離正態(tài)分布的程度較圖4(a)備擇分布嚴(yán)重,所對應(yīng)的各統(tǒng)計量的功效也較高,進一步說明備擇分布偏離正態(tài)分布越嚴(yán)重,各統(tǒng)計量的檢驗功效就越高。
圖4 Lognormal 功效模擬比較圖
整體上觀察上述4種備擇假設(shè)下的功效模擬圖形,可得到如下的總體結(jié)論:①D不是很好的檢驗正態(tài)性的方法,因為它只對峰度的偏差靈敏,而對偏度的偏差不靈敏。②當(dāng)備擇分布偏離正態(tài)的程度越嚴(yán)重,各檢驗統(tǒng)計量的功效就越高。③統(tǒng)計量Za、Zc、Zk對各種偏正態(tài)的分布都很有效且是穩(wěn)健的。④在備擇分布偏度非零的情況下,W2的功效僅高于D的功效。⑤從功效的角度看,6種統(tǒng)計量的總體排序為:Za>Zc>Zk>A2>W2>D。
采用統(tǒng)計模擬的方法比較了D、W2、A2、Zc、Za、Zk這6種統(tǒng)計量在檢驗正態(tài)性時的功效差異,通過對Beta分布、Gamma分布、T分布、Lognormal分布這4種分布進行抽樣模擬,得出了6種統(tǒng)計量各自的優(yōu)缺點,并對6種統(tǒng)計量在功效上進行了總體的排序。在進行擬合優(yōu)度檢驗時,應(yīng)該結(jié)合具體的原假設(shè)和備擇假設(shè),盡量選擇合適的功效較高的檢驗方法,從而提高檢驗的可靠度。
[1]楊振海.擬合優(yōu)度檢驗[M].合肥:安徽教育出版社,1994.
[2]Zhang J. Powerful goodness-of-fit tests based on the likelihood ratio[J]. J Roy Statist Soc,2002,64:281-294.
[3]Zhang J, Wu Y h. Likelihood-ration tests for normality[J]. Computational Statistics & Data Analysis, 2005,49: 709-721.
[4]茆詩松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計[M].北京:高等教育出版社,1998.
[5]楊振海,程維虎.統(tǒng)計模擬[J].數(shù)理統(tǒng)計與管理,2006,25(1):117-126.
[6]Surucu B.A power comparison and simulation study of goodness-of-fit tests[J].Computers and Mathematics with Applications, 2008, 56:1617-1625.
[7]Zhang Z Z. Some comments on the EDF Statistics of Goodness-of-Fit Tests[J]. Chinese Journal of Applied Probability and Statistics, 1996, 12(4):361-368.
2012-11-24
海南省自然科學(xué)基金項目(112006)。
劉蓮花(1983-),女,碩士,講師,現(xiàn)主要從事擬合優(yōu)度檢驗方面的教學(xué)與研究工作。
O212
A
1673-1409(2013)04-0014-03
[編輯] 洪云飛