朱坤平 江雷 劉劍平
[摘要]精度和信度是描述一個參數(shù)區(qū)間估計優(yōu)劣的兩個指標,而區(qū)間估計的精度又可以用置信區(qū)間的長度或區(qū)間包含非真值的概率來表示. 本文討論了區(qū)間估計精度的兩種不同表示及與之相關的雙邊檢驗問題的關系,證明了當選定的樞軸量是待估計參數(shù)的線性函數(shù)時求解平均長度最小的置信區(qū)間問題可簡化為確定最小接受域的優(yōu)化問題,并通過實例說明了用數(shù)值算法求解最短置信區(qū)間的基本思想.
[關鍵詞]區(qū)間估計的精度 樞軸量 UMAU
[中圖分類號]O212.1 [文獻標志碼]A
引言
基于統(tǒng)計數(shù)據(jù)對未知的參數(shù)進行統(tǒng)計推斷在實踐中有著廣泛的應用,其理論基礎就是數(shù)理統(tǒng)計的兩個重要分支,即參數(shù)估計和假設檢驗。參數(shù)估計問題又包括點估計和區(qū)間估計,其中區(qū)間估計問題相對于點估計而言有著獨特的優(yōu)勢,它不僅給出了參數(shù)的存在范圍,而且還給出了該范圍包含參數(shù)的可信度。區(qū)間估計問題不僅和參數(shù)的假設檢驗密切相關,而且,當參數(shù)的置信區(qū)間收縮為一個點時區(qū)間估計就退化成了點估計,即區(qū)間估計問題也可以視為點估計的推廣。眾所周知,刻畫一個參數(shù)的區(qū)間估計優(yōu)劣的指標是精度和信度,信度是指置信區(qū)間包含參數(shù)真值的概率,而區(qū)間估計的精度可通過置信區(qū)間的長度(長度越小精度越高)或置信區(qū)間包含參數(shù)非真值的概率(概率越小精度越高)來表示。人們自然希望參數(shù)區(qū)間估計的精度和信度都越高越好。然而,一定條件下,提高了區(qū)間估計的精度就會降低區(qū)間估計的信度,反之亦然。所謂最優(yōu)置信區(qū)間,就是在一定的置信水平下,精度最高的置信區(qū)間,然而這樣的區(qū)間一般并不存在。于是,人們轉而探求在選定樞軸量或附加無偏性等前提下的最優(yōu)區(qū)間估計問題。文獻中對參數(shù)區(qū)間估計的精度問題已有許多的討論,提出了不同的算法。比如,對均勻分布中參數(shù)最優(yōu)置信區(qū)間的討論[1],[2],伽馬分布中參數(shù)的最優(yōu)區(qū)間估計的研究[3],正態(tài)總體方差最優(yōu)置信區(qū)間的算法[4],[5],對非對稱分布參數(shù)置信區(qū)間的討論[6],對參數(shù)區(qū)間估計問題與假設檢驗的關系的研究[7],以及關于最優(yōu)風險無偏區(qū)間估計的討論[8]等。本文基于樞軸量方法討論了區(qū)間估計精度的兩種不同表示,及其與對應的雙邊檢驗問題的關系問題,證明了當選定的樞軸量為參數(shù)的線性函數(shù)時求解平均長度最小的置信區(qū)間問題可簡化為確定最小接受域的優(yōu)化問題,最后,通過實例說明了用數(shù)值算法求解最短置信區(qū)間的基本思想。
置信區(qū)間精度的討論
參數(shù)的區(qū)間估計問題和參數(shù)的假設檢驗問題密切相關。一般說來,參數(shù)的假設檢驗問題也可以通過區(qū)間估計的方法來處理。然而,這兩個問題又不完全等價。為了說明區(qū)間估計的精度以及區(qū)間估計與對應假設檢驗問題的關系,我們首先引入幾個相關的基本概念。
求解參數(shù)的區(qū)間估計問題有樞軸量方法,信仰分布方法,似然比方法,漸進分布方法,Bootstrap自助法等許多的方法。其中,樞軸量方法是求解參數(shù)區(qū)間估計問題最常用的一個方法。借助樞軸量方法來求解正態(tài)總體參數(shù)的區(qū)間估計問題時,涉及到的樞軸量的分布可能是標準正態(tài)分布,卡方分布,F(xiàn)分布,或T分布,這些分布的密度函數(shù)有一個共同的特點,就是他們都是單峰函數(shù)。事實上,當所選取的樞軸量的分布具有單峰密度函數(shù)形態(tài)時,可以證明,一定置信水平下置信區(qū)間長度最小的置信區(qū)間一定是存在的而且是唯一的。
引理[11]設,x1,x2,…,xn是來自總體ξ的樣本,總體ξ的分布函數(shù)為F(x,θ),θ,為未知參數(shù),樞軸量T=(T1,…,Tn;θ)的分布密度函數(shù)為p(x),假定p(x)與θ無關,且是單峰一階可微函數(shù),則θ的最優(yōu)置信區(qū)間存在而且是唯一的。
參數(shù)的區(qū)間估計問題與參數(shù)雙邊假設檢驗問題密切相關,如果區(qū)間估計的精度用包含非真值的概率最小為標準,那么與參數(shù)θ的置信水平為1-α的一致最優(yōu)無偏(UMAU)區(qū)間估計問題對應的就是關于原假設H0∶θ=θ0的水平為α的雙邊一致最優(yōu)勢無偏檢驗(UMPU)問題。即參數(shù)θ的置信水平為1-α的所有無偏區(qū)間估計中,包含非真值概率最小的置信區(qū)間可以由對應的UMPU檢驗問題導出。盡管這個導出的置信區(qū)間的長度不一定是最短的,但在θ所有無偏置信區(qū)間中它一定是平均長度(置信區(qū)間長度的數(shù)學期望)最小的。
若選取的樞軸量不是或不能變換成參數(shù)θ的線性函數(shù),此時要尋找一定置信水平下長度最短的置信區(qū)間,可借助數(shù)值算法來實現(xiàn)。其基本思想是若a≤T(X,θ)≤b等價于
最后,我們用一個正態(tài)總體方差區(qū)間估計的例子來對比說明,優(yōu)化算法與教材中傳統(tǒng)的等尾截取方法得到的置信區(qū)間長度的差異。設已知正態(tài)總體容量為n的一個樣本,樣本方差S2=0.5419。對于不同的樣本容量n(5~20),分別用傳統(tǒng)等尾截取方法和黃金分割優(yōu)化算法求得的總體方差置信水平為95%的置信區(qū)間,結果如表2所示(Text_Chi2表示運用傳統(tǒng)方法的解,New_Chi2表示優(yōu)化算法的解):
如表所示,樣本容量越大,優(yōu)化算法對σ2置信區(qū)間的精度提高的就越小。這是因為隨著樣本容量的增加根據(jù)中心極限定理,樞軸量的分布越來越趨近于正態(tài)分布。但當樣本容量較小時,相比于優(yōu)化算法用傳統(tǒng)的等尾截取的方法得到的置信區(qū)間精度較低,即教材中一般采用的等尾截取的方法只適用于樣本容量較大的情形。
結論
圍繞提高參數(shù)區(qū)間估計的精度問題,討論了區(qū)間估計精度的兩種不同表示及與之相關的雙邊檢驗問題的關系。 證明了基于參數(shù)的線性樞軸量求解平均長度最小置信區(qū)間的問題可簡化為最小接受域的優(yōu)化問題。 最后,通過一個實例說明了用數(shù)值算法求解總體方差最短置信區(qū)間的基本思路,揭示了傳統(tǒng)等尾截取方法的使用范圍。
[參考文獻]
[1]曾艷.均勻分布參數(shù)的最短置信區(qū)間[J].赤峰學院學報(自然科學版),2011,9.
[2]潘高田,胡軍峰.小樣本的均勻分布參數(shù)的區(qū)間估計和假設檢驗[J].數(shù)學的實踐與認識,2002,32(4).
[3]姜培華.伽瑪分布參數(shù)的最優(yōu)區(qū)間估計和最佳雙邊檢驗[J].安慶師范學院學報,2010,16(2).
[4]王建華,張來成.正太總體方差的最短區(qū)間估計和最佳雙邊檢驗[J].數(shù)學實踐與認識,2003,33(2).
[5]姜培華.兩正太總體方差比的最優(yōu)區(qū)間估計和最佳雙邊檢驗[J].菏澤學院學報,2011,33(2).
[6]張慶平.非對稱分布置信區(qū)間的分析[J].統(tǒng)計與決策,2007(9).
[7]陳乃輝.關于區(qū)間估計與假設檢驗的最優(yōu)性[J].工科數(shù)學,2002,02.
[8]崔雅莉.最優(yōu)風險無偏區(qū)間估計探究[J].時代教育,2011,8.
[9]劉劍平,朱坤平,陸元鴻.應用數(shù)理統(tǒng)計[M].上海.華東理工大學出版社,2012.
[10]茆詩松,王靜龍.高等數(shù)理統(tǒng)計.第二版[M].北京:高等教育出版社,2006.271-300.
[11]孫慧玲.用非線性規(guī)劃證明最短置信區(qū)間存在性與唯一性[J].北京聯(lián)合大學學報,2008,22(4).
[12]E. Rozeta, S. Rudazb, R.D. Marini, E. Ziémons, B. Boulanger, Ph. Hubert. Models to estimate overall analytical measurements uncertainty:Assumptions, comparisons and applications[J]. Analytica Chimica Acta,2011,702,160-171
[13]Albert Vexler , Sergey Tarima. An optimal approach for hypothesis testing in the presence of incomplete data[J]. Ann Inst Stat Math,2011,63,1141-1163.
[14]Blaise Hanczar , EdwardR.Dougherty. The reliability of estimated confidence intervals for classification error rates when only a single sample is available[J]. Pattern Recognition, 2013,46,1067-1077.
(作者單位:華東理工大學理學院 上海)