王克林 ,劉建平
(1.廣東商學院 經(jīng)濟貿(mào)易與統(tǒng)計學院,廣州 510320;2.暨南大學 經(jīng)濟學院,廣州 510632)
無回答誤差是非抽樣誤差的一個重要來源。它普遍存在于各種類型的統(tǒng)計調(diào)查中,且能對調(diào)查結(jié)果產(chǎn)生嚴重影響。當無回答誤差比較嚴重時,也就是當某次統(tǒng)計調(diào)查中落入到某一區(qū)域的樣本量很小甚至為零時,對該區(qū)域的估計問題稱為小域估計。小域問題在國內(nèi)外的大型抽樣調(diào)查中都是存在的,是一個世界性的難題。無回答會使總體目標估計量產(chǎn)生偏倚,方差增大。因此,無回答也是國內(nèi)外非抽樣誤差研究中一個長盛不衰的課題。在我國,政府統(tǒng)計往往都采用多階段抽樣調(diào)查的方式。這種抽樣調(diào)查方式中所產(chǎn)生的非抽樣誤差是非常值得關(guān)注和研究的[1]。其中一個方面,這種抽樣調(diào)查在抽樣方案設計時考慮的多數(shù)都是總體或子總體估計的需要,因而統(tǒng)計調(diào)查所獲得的數(shù)據(jù)往往只能滿足較大區(qū)域估計的需要。有時即使某區(qū)域樣本量不小但無回答誤差嚴重時,該區(qū)域的樣本量往往很難保證利用傳統(tǒng)的推斷估計方法達到所要求的可靠性。因而,探索有效解決分層抽樣中由于無回答等原因?qū)е履承訕颖玖科《鵁o法估計的問題是滿足我國政府統(tǒng)計多層次推斷的迫切需要。
對小域估計問題,趙雪慧在其博士論文(2005)[2]中已經(jīng)對國內(nèi)外關(guān)于小域估計的理論進展和實際應用做了全面研究;對于無回答的影響、調(diào)整和降低措施,在一般的抽樣調(diào)查著作中都有介紹。馮士雍等(1997)[3]的研究都比較全面。本文對此不再做詳細介紹和綜述,本文嘗試將多階模型中的空模型和經(jīng)驗加權(quán)方法應用于研究無回答問題。
多階模型分析通常是從空模型,又稱截距模型,或無條件均值模型開始的。 根據(jù) Goldstein(1996),[5]王濟川等(2008)[4]的研究,空模型的基本格式可表示如下:
將式(1)、式(2)和式(3)所示空模型記為模型 1。 式(1)表示微觀層面的變量關(guān)系。其中,yij表示第j組第i個個體的取值水平;β0j和eij分別代表第j組因變量均值和圍繞該均值的個體隨機差異。式(2)表示宏觀層面的變量關(guān)系,總截距γ00代表的是yij的總(平)均值;u0j代表第j組的因變量均值(β0j)與總均值(γ00)之間的差異。 式(3)是式(1)和式(2)的組合,包括了固定效應(γ00)和隨機效應(u0j和 eij)兩部分。該模型的微觀層(水平1)和宏觀層(水平2)公式中均沒有解釋變量。若在式(1)中納入水平1解釋變量并將其系數(shù)設為隨機的,則模型就變?yōu)殡S機系數(shù)回歸模型;若在式(2)中納入水平2解釋變量(即場景變量),模型就變?yōu)橛袟l件約束的回歸。Goldstein(1988)介紹了多階模型的一般形式。由式(2)可見,分層抽樣中第j層研究變量Yij的均值估計值可以表示為:
采用Goldstein(1996)介紹的多階模型估計方法很容易得到式(4)中各層均值的估計值估計多階模型采用的方法是(有約束的)極大似然估計。因此,根據(jù)式(4)得到的各層均值的估計不僅具有小樣本估計的優(yōu)良性質(zhì),還具有大樣本性質(zhì),如一致性、漸近正態(tài)性等。
經(jīng)驗加權(quán)方法是多階模型估計方法的一種。按照經(jīng)驗加權(quán)方法,分層抽樣中第j層均值的參數(shù)估計是利用第j層子樣本和整體樣本數(shù)據(jù)估計出來的最佳加權(quán)平均參數(shù)估計值。有很多學者, 如 Lindley&Smith (1972)[6]、Raudenbush&Bryk(2002)[7]、王濟川等(2008)[4]、趙雪慧(2005)[2]也將其稱為經(jīng)驗貝耶斯方法。本文依其原意,稱其為經(jīng)驗加權(quán)估計方法,且不詳細討論其估計原理,僅就其在無回答估計中的應用進行研究。
在式(1)~(3)所表示的多階模型中,β0j的經(jīng)驗加權(quán)估計值可以表達為和的加權(quán)線性組合:
由式(5)可見,在經(jīng)驗加權(quán)中,起關(guān)鍵作用的是權(quán)重系數(shù)ρj。經(jīng)典文獻中將ρj稱為可靠性,它度量了參數(shù)估計值的可靠性。根據(jù)王濟川等(2008)的研究,在不存在測量誤差的假設下,空模型中β0j估計值的可靠性可以表示為:
其中,nj表示第j層樣本量。式(6)揭示了可靠性ρj是nj的函數(shù)。顯然,ρj的取值范圍在區(qū)間[0,1]之內(nèi)。第j層的權(quán)重ρj越大,說明 β0,j的估計值的可靠性越大,則在的經(jīng)驗加權(quán)估計值中所占比重就越大;否則總均值所占比重就會較大。從式(6)還可以看出,ρj的大小與第j層的樣本容量nj成正比。當?shù)趈層存在無回答時,或者其樣本量nj較小時,由式(6)可見,權(quán)重系數(shù) ρj就比較小,對的估計就會收縮,多階模型的參數(shù)估計值就會被“拉”向用整個樣本計算出的參數(shù)估計值。因此,該方法也被稱為“收縮估計法”。
上文介紹了兩種解決統(tǒng)計調(diào)查中某些層(組)樣本數(shù)據(jù)稀少的情況:直接利用多階模型中的空模型進行估計的式(4),我們將其稱為多階模型方法(MLM);利用經(jīng)驗加權(quán)法估計參數(shù)的式(5),將其記為經(jīng)驗加權(quán)方法(EW)。下面運用2007年廣東城鎮(zhèn)住戶調(diào)查資料對這兩種方法進行比較驗證。數(shù)據(jù)來源可參閱王克林等和劉建平(2010)的研究。
由表1可見,不同估計方法的估計結(jié)果差異很大。首先,從整體上看,所有的可靠性估計值(ρj)均高于0.90,說明樣本均值對總體均值的估計是可靠的。其次,從估計效果來看,經(jīng)驗加權(quán)方法(EW)的估計效果要優(yōu)于多階模型(MLM)的估計效果。EW方法估計誤差率的均值為0.16%,遠低于MLM估計的2.00%。MLM估計結(jié)果中誤差率超過5.0%的地區(qū)有五個;而EW估計結(jié)果中誤差率除了14號地區(qū)為1.64%外,其余地區(qū)誤差率均低于1%。另外,EW估計誤差率的方差為0.5443,遠低于MLM估計的3.7978。由此可見,EW估計誤差率不僅低,而且穩(wěn)定。
最后,再從小樣本的估計結(jié)果看,EW對小樣本的估計效果要遠遠優(yōu)于MLM估計。EW估計中,樣本量為50的地區(qū)估計誤差合計為1.51%,遠低于MLM估計的24.46%。MLM估計中誤差率超過5%的五個樣本單元中,有四個來自小樣本;而EW估計中誤差率超過1%的樣本單元僅有一個,也來自小樣本。這說明EM估計方法更適合存在無回答時小樣本層的估計。這里,不妨稍微討論一下為什么EW估計的效果會是最好的。從式(6)可見,對應于的權(quán)數(shù)ρj實際上是與的可靠性成比例的。如果β0j的估計值方差較小,說明β0j圍繞總體均值估計值的波動程度較小,此時β0j的估計就會更多地被“拉向”總均值的估計,即這就是EW方法也被稱為條件收縮估計的原因。因為可靠性ρj的估計值與層樣本量nj呈正相關(guān)。因此,當樣本量較小時,利用整個樣本進行的參數(shù)估計值(總均值的估計)在EW估計中就占有較大比重。也就是說,EW估計在層樣本數(shù)稀少時“借助”了全部樣本的信息而MLM估計僅依靠層內(nèi)稀有數(shù)據(jù)的信息。這就是為什么EM估計方法相對于MLM方法更適合存在無回答時小樣本層的估計的原因。
表1 多階模型(MLM)估計結(jié)果與經(jīng)驗加權(quán)法(EW)估計結(jié)果的比較
[1]王克林,劉建平.調(diào)查員誤差的計量模型與測度方法[J].統(tǒng)計與決策,2009,(10).
[2]趙雪慧.域估計與方法研究[D].北京:中國人民大學,2005.
[3]馮士雍,倪加勛,鄒國華.抽樣調(diào)查理論與方法[M].北京:中國統(tǒng)計出版社,1997.
[4]王濟川等.多層統(tǒng)計分析模型——方法與應用[M].北京:高等教育出版社,2008.
[5]Goldstein.Multilevel Statistics Models[EB/OL].1996.http://www.soziologie.uni-halle.de/langer/multilevel/books/goldstein.pdf.
[6]Lindley,D.V.,Smith,A.EM.Bayes Estimates for the Linear Model[J].Journal of the Royal Statistical Society,Series B,1972,34.
[7]Raudenbush,S.W.,Bryk,A.S.Hierarchical Linear Models:Applications and Data Analysis Methods (2ndEdition)[M].Newbury Park,CA:Sage,2002.