• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      不可忽略的無(wú)回答機(jī)制下的校準(zhǔn)研究

      2020-08-24 05:42:10金勇進(jìn)劉曉宇
      統(tǒng)計(jì)與信息論壇 2020年8期
      關(guān)鍵詞:權(quán)數(shù)樣本量總體

      金勇進(jìn),劉曉宇

      (中國(guó)人民大學(xué) a.應(yīng)用統(tǒng)計(jì)科學(xué)研究中心;b.統(tǒng)計(jì)學(xué)院;c.調(diào)查技術(shù)研究所,北京 100872)

      一、引言

      在抽樣調(diào)查中,出于現(xiàn)實(shí)條件的限制,難免會(huì)產(chǎn)生一定數(shù)量的無(wú)回答。調(diào)查中的無(wú)回答是指由于種種原因沒(méi)有能夠?qū)Ρ怀槌龅臉颖締卧M(jìn)行計(jì)量,從而沒(méi)有獲得有關(guān)這些單元的數(shù)據(jù)。無(wú)回答是造成缺失數(shù)據(jù)的基本原因,它不僅使有效樣本量減少、樣本信息難以真實(shí)反映總體情況,還導(dǎo)致估計(jì)量有偏且方差增大,從而影響了統(tǒng)計(jì)數(shù)據(jù)質(zhì)量。

      在不同的缺失數(shù)據(jù)機(jī)制下,回答單元與無(wú)回答單元之間的相似程度和相互關(guān)系不同,需根據(jù)不同情況選擇相應(yīng)的處理方法。Rubin將缺失數(shù)據(jù)機(jī)制分為完全隨機(jī)缺失、隨機(jī)缺失和非隨機(jī)缺失,可忽略的無(wú)回答機(jī)制對(duì)應(yīng)的缺失數(shù)據(jù)機(jī)制為完全隨機(jī)缺失和隨機(jī)缺失,目標(biāo)變量y是否作答與缺失的y值無(wú)關(guān);不可忽略的無(wú)回答機(jī)制對(duì)應(yīng)的缺失數(shù)據(jù)機(jī)制為非隨機(jī)缺失,目標(biāo)變量y是否作答與y值有關(guān),無(wú)論其是否被觀測(cè)到[1]。當(dāng)缺失數(shù)據(jù)是完全隨機(jī)缺失時(shí),可直接利用觀測(cè)數(shù)據(jù)進(jìn)行推斷,文中不予討論,后文提及的可忽略缺失數(shù)據(jù)機(jī)制僅指隨機(jī)缺失。

      已有研究多在可忽略的缺失數(shù)據(jù)機(jī)制假定下討論,通常以插補(bǔ)法和加權(quán)法為基礎(chǔ)[2]。插補(bǔ)法根據(jù)觀測(cè)數(shù)據(jù)構(gòu)造預(yù)測(cè)分布,再根據(jù)插補(bǔ)值對(duì)完整數(shù)據(jù)集進(jìn)行分析,其效果取決于預(yù)測(cè)分布的擬合情況。加權(quán)法通過(guò)增大回答樣本的權(quán)數(shù)以代表無(wú)回答樣本,其效果取決于對(duì)回答概率的估計(jì)優(yōu)劣。對(duì)可忽略的缺失數(shù)據(jù)機(jī)制的討論很有必要,但不夠完整,忽略了現(xiàn)實(shí)中更一般的“不可忽略的無(wú)回答”,此時(shí)基于隨機(jī)缺失假定的處理方法不再適用。對(duì)于不可忽略的無(wú)回答機(jī)制,現(xiàn)有研究較少,主要基于模型進(jìn)行,將缺失數(shù)據(jù)的條件分布轉(zhuǎn)化為完整數(shù)據(jù)和響應(yīng)模型的乘積[3],此類(lèi)方法的缺陷主要表現(xiàn)在以下兩方面,一是該方法屬于參數(shù)方法,模型假設(shè)較強(qiáng)、對(duì)模型的錯(cuò)誤識(shí)別非常敏感;二是由于數(shù)據(jù)缺失,無(wú)法評(píng)估模型的好壞、驗(yàn)證模型是否適用。

      隨著抽樣調(diào)查的發(fā)展,輔助信息起著愈發(fā)重要的作用[4]。校準(zhǔn)法就是一種系統(tǒng)利用輔助信息進(jìn)行權(quán)數(shù)調(diào)整的方法,最早由Deville和S?rndal提出,校準(zhǔn)估計(jì)量具有漸進(jìn)無(wú)偏性和設(shè)計(jì)一致性[5-6]。Lundstr?m和S?rndal首先將校準(zhǔn)法用于無(wú)回答問(wèn)題[7]。金勇進(jìn)等人對(duì)項(xiàng)目無(wú)回答問(wèn)題中的校準(zhǔn)估計(jì)進(jìn)行了研究。已有研究表明,校準(zhǔn)法不僅可以減小估計(jì)標(biāo)準(zhǔn)誤,還可以校正由樣本無(wú)回答、抽樣框覆蓋不全或重復(fù)而導(dǎo)致的誤差[8]。Oh和Scheuren提出的準(zhǔn)隨機(jī)化方法,將樣本是否回答看作概率抽樣的一個(gè)階段,并假定回答概率服從某一響應(yīng)模型,在此基礎(chǔ)上,有學(xué)者將不同形式的響應(yīng)模型用于校準(zhǔn)估計(jì),以降低對(duì)模型識(shí)別的敏感度[9]。然而,現(xiàn)有研究并未區(qū)分缺失數(shù)據(jù)機(jī)制,缺少不可忽略的無(wú)回答機(jī)制下的針對(duì)性研究。

      本文聚焦不可忽略機(jī)制下的無(wú)回答,基本思路是將校準(zhǔn)法和響應(yīng)模型結(jié)合,在保持校準(zhǔn)估計(jì)量?jī)?yōu)良性質(zhì)的基礎(chǔ)上,解決前文提出的現(xiàn)有無(wú)回答處理方法所存在的問(wèn)題,該方法稱(chēng)為RGRG法。本文的創(chuàng)新之處在于統(tǒng)一理論和應(yīng)用,理論方面:從模型形式上直觀體現(xiàn)無(wú)回答機(jī)制的不可忽略性;應(yīng)用方面:在實(shí)證分析中直接利用目標(biāo)變量進(jìn)行響應(yīng)模型的建模。研究表明,RGRG法規(guī)避了已有方法的不足,解決了不可忽略的無(wú)回答機(jī)制下的權(quán)數(shù)調(diào)整和估計(jì)問(wèn)題,同時(shí)放松了對(duì)模型識(shí)別和模型假設(shè)的要求。

      二、模型校準(zhǔn)法與準(zhǔn)隨機(jī)化的響應(yīng)模型

      模型校準(zhǔn)法利用超總體模型刻畫(huà)總體分布,根據(jù)輔助信息調(diào)整權(quán)數(shù)。準(zhǔn)隨機(jī)化方法的響應(yīng)模型是根據(jù)對(duì)單元回答概率的估計(jì)調(diào)整權(quán)數(shù)。二者均可用于權(quán)數(shù)的調(diào)整,將其結(jié)合,響應(yīng)模型可以體現(xiàn)缺失數(shù)據(jù)機(jī)制,校準(zhǔn)法作為估計(jì)途徑,可以保證估計(jì)量的優(yōu)良性質(zhì)。

      (一)基于模型的校準(zhǔn)法

      假設(shè)已知樣本單元p維輔助變量xk(k∈S)和p維工具向量zk(k∈S)、已知輔助變量xk的總體總值Tx。根據(jù)變量x建立校準(zhǔn)方程為:

      線性超總體模型由式(1)、(2)、(3)組成:

      (1)

      E{εk|(xj,zj;j∈U}=0

      (2)

      f(yk|[xj,zj,Ij;j∈U])

      =f(yk|[xj,zj;j∈U])(k∈U)

      (3)

      (二)準(zhǔn)隨機(jī)化方法下的響應(yīng)模型

      準(zhǔn)隨機(jī)化方法最早由Oh和Scheuren提出,它在抽樣設(shè)計(jì)原有隨機(jī)性基礎(chǔ)上,將樣本單元是否作答看作概率抽樣的一個(gè)階段,增加了一層隨機(jī)性[9]。用示性變量體現(xiàn)這兩部分隨機(jī)性,令I(lǐng)j=IjsIjr,若單元j在原始樣本中,則Ijs=1,否則為0;若單元j作答,則Ijr=1,否則為0。單元的入樣情況和回答情況相獨(dú)立,即Ijs和Ijr關(guān)于j獨(dú)立。準(zhǔn)隨機(jī)化的方法下的響應(yīng)模型為:

      pk=Pr(Ikr=1|[xj,zj,Ijs;j∈U],

      (4)

      其中γ是未知參數(shù),h(η)是一個(gè)單調(diào)、二階可微函數(shù)。響應(yīng)模型刻畫(huà)了第k個(gè)單元回答的概率,其中函數(shù)h(η)可采取不同形式,如h(η)=1+η、h(η)=1+exp(-η)、h(η)=exp(η)等。Folsom和Singh對(duì)不同函數(shù)h(η)進(jìn)行了總結(jié)[13]。

      (三)模型校準(zhǔn)法與準(zhǔn)隨機(jī)化響應(yīng)模型的結(jié)合

      通過(guò)校準(zhǔn)法可實(shí)現(xiàn)對(duì)響應(yīng)模型的參數(shù)估計(jì),校準(zhǔn)方程對(duì)參數(shù)g加以限制,通過(guò)超總體模型尋得最優(yōu)參數(shù),最后根據(jù)響應(yīng)模型調(diào)整權(quán)數(shù)。

      在超總體模型(1)、(2)、(3)基礎(chǔ)上,結(jié)合響應(yīng)模型(4)進(jìn)行校準(zhǔn),校準(zhǔn)方程為:

      (5)

      超總體模型下可得到目標(biāo)變量總值Ty的無(wú)偏估計(jì),響應(yīng)模型下的校準(zhǔn)估計(jì)是Ty的一致估計(jì)。兩個(gè)模型只要有一個(gè)成立即可得到Ty的良好估計(jì),這就是校準(zhǔn)估計(jì)對(duì)無(wú)回答的雙重保護(hù)機(jī)制。

      三、RGRG法:不可忽略的無(wú)回答機(jī)制下的處理方法

      前文將模型校準(zhǔn)法與準(zhǔn)隨機(jī)化的響應(yīng)模型相結(jié)合,用于無(wú)回答情況下的權(quán)數(shù)調(diào)整和參數(shù)估計(jì),但并未區(qū)分無(wú)回答機(jī)制?,F(xiàn)在對(duì)前述模型進(jìn)行適當(dāng)修改,以區(qū)分不同類(lèi)型的缺失數(shù)據(jù)機(jī)制,由此得到RGRG法。此部分主要對(duì)RGRG法的模型假設(shè)、模型形式和估計(jì)量性質(zhì)進(jìn)行分析。

      為區(qū)分不同協(xié)變量的用途,我們稱(chēng)用于響應(yīng)模型建模的協(xié)變量為模型變量,用于構(gòu)建校準(zhǔn)方程的變量為背景變量。校準(zhǔn)法要求已知樣本單元的背景變量和背景變量的總體總值,響應(yīng)模型要求已知回答者的模型變量。在進(jìn)行不可忽略無(wú)回答機(jī)制下的權(quán)數(shù)校準(zhǔn)時(shí),根據(jù)不同變量的用途可知,目標(biāo)變量本身也可以作為模型變量,即變量y可以作為變量z的一部分,因?yàn)樗鼘?duì)于回答者而言是已知的。

      (一)模型推導(dǎo)

      回顧線性超總體模型(1)、(2)、(3),為便于分析再次列出:

      (6)

      E{εk|(xj,zj;j∈U}=0

      (7)

      f(yk|[xj,zj,Ij;j∈U])

      =f(yk|[xj,zj;j∈U])(k∈U)

      (8)

      模型在給定變量x、z的情況下,樣本選擇機(jī)制和回答機(jī)制可忽略,只有控制了變量x、z才能利用超總體模型進(jìn)行分析?,F(xiàn)有模型無(wú)法體現(xiàn)非隨機(jī)的數(shù)據(jù)缺失機(jī)制:在公式(8)的作用下,對(duì)于單元k∈S和k?S均有公式(6)、(7)成立,回答樣本和無(wú)回答樣本的目標(biāo)變量y分布相同。對(duì)于不可忽略機(jī)制下的無(wú)回答,回答機(jī)制與目標(biāo)變量y有關(guān),選擇機(jī)制卻沒(méi)有這樣的相關(guān)關(guān)系。因此,需對(duì)式(7)、式(8)進(jìn)行修改。

      首先將式(7)簡(jiǎn)化為E{εk|(xj;j∈U)}=0,再將式(8)變?yōu)閒(yk|[zj,Ij;j∈U])=f(yk|[zj;j∈U])。修改后的模型假定回答機(jī)制關(guān)于變量z可忽略,對(duì)于誤差項(xiàng)而言,有E{εk|(xj;j∈U)}=0成立,此時(shí)E{εk|(xj,Ij;j∈U)}=0不一定成立,也就是說(shuō),樣本中回答者與無(wú)回答者的目標(biāo)變量分布不一定相同,無(wú)回答機(jī)制可以是不可忽略的。至此,經(jīng)過(guò)對(duì)式(7)、(8)的修改,為不可忽略的無(wú)回答機(jī)制下的分析提供了可能。由此得到的RGRG法,完整模型由式(9)、(10)、(11)組成:

      假定目標(biāo)變量y與協(xié)變量x的關(guān)系為:

      (9)

      E{εk|(xj;j∈U)}=0

      (10)

      f(yk|[zj,Ij;j∈U])=f(yk|[zj;j∈U])

      (11)

      假定單元k的回答概率為如下響應(yīng)模型:

      pk=Pr(Ikr=1|[xj,zj,Ijs;j∈U],

      校準(zhǔn)方程為:

      (13)

      其中示性變量Ij=IjsIjr,Ijs表示單元j的入樣情況,Ijr表示單元j是否作答;γ是未知參數(shù),估計(jì)值為g;h(η)是一個(gè)單調(diào)、二階可微函數(shù)。

      根據(jù)Kott的研究,估計(jì)量方差的漸進(jìn)無(wú)偏估計(jì)為[6]:

      (14)

      (二)模型擴(kuò)展

      考慮模型(9)、(10)、(11)的另一種表達(dá)形式,將其轉(zhuǎn)化為式(15)、(16)構(gòu)成的模型。假設(shè)目標(biāo)變量y與模型變量z具有線性關(guān)系,背景變量x可以通過(guò)多元測(cè)量誤差模型擬合:

      (15)

      (16)

      前述分析均假定背景變量x的維數(shù)p和模型變量z的維數(shù)q相同,而二者的功能不同,如何取消維數(shù)限制仍缺乏研究[15]。Chang和Kott對(duì)q

      (三)方法評(píng)價(jià)

      RGRG法在非隨機(jī)缺失機(jī)制下,將校準(zhǔn)法與響應(yīng)模型相結(jié)合,校準(zhǔn)法在超總體模型的假定下進(jìn)行,旨在估計(jì)響應(yīng)模型的參數(shù)。響應(yīng)模型在準(zhǔn)隨機(jī)化方法下進(jìn)行,用于設(shè)計(jì)權(quán)數(shù)的調(diào)整。校準(zhǔn)法可以根據(jù)輔助變量調(diào)整權(quán)數(shù),為每個(gè)設(shè)計(jì)權(quán)數(shù)生成一個(gè)調(diào)整因子,當(dāng)調(diào)查中出現(xiàn)的無(wú)回答不可忽略時(shí),權(quán)數(shù)調(diào)整因子可以隱式估計(jì)在假定的響應(yīng)模型下每個(gè)單元回答概率的倒數(shù)。因此,校準(zhǔn)加權(quán)可以消除或大大減少無(wú)回答偏差。假定目標(biāo)變量與校準(zhǔn)變量具有線性關(guān)系,并且不受樣本選擇機(jī)制和回答機(jī)制的影響,那么無(wú)論響應(yīng)模型是否成立,目標(biāo)變量的校準(zhǔn)估計(jì)都是總體參數(shù)的優(yōu)良估計(jì)。

      RGRG法為不可忽略無(wú)回答機(jī)制下的權(quán)數(shù)調(diào)整與總體估計(jì)提供了有效途徑,估計(jì)量具有良好的統(tǒng)計(jì)性質(zhì),是漸進(jìn)無(wú)偏和漸近一致的。同時(shí),RGRG法對(duì)無(wú)回答具有雙重保護(hù)作用,模型假設(shè)較簡(jiǎn)單,并降低了對(duì)模型識(shí)別的敏感度。

      四、實(shí)證研究

      (一)數(shù)據(jù)來(lái)源與整理

      本文采用2015年CGSS(China General Social Survey)調(diào)查數(shù)據(jù),進(jìn)行不可忽略的無(wú)回答機(jī)制下的校準(zhǔn)研究。CGSS調(diào)查始于2003年,是中國(guó)最早的全國(guó)性、綜合性、連續(xù)性學(xué)術(shù)調(diào)查項(xiàng)目,全面收集了社會(huì)、社區(qū)、家庭、個(gè)人多個(gè)層次的數(shù)據(jù),由中國(guó)人民大學(xué)調(diào)查與數(shù)據(jù)中心組織實(shí)施。調(diào)查的目標(biāo)總體范圍涵蓋了全國(guó)31個(gè)省份(不含港澳臺(tái))的所有城市、農(nóng)村家庭戶(hù),并通過(guò)分層三階段抽樣的方式獲取了全國(guó)層面的代表性樣本。

      由于收入屬于個(gè)人隱私問(wèn)題,在面訪調(diào)查中,受訪者可能由于自身收入水平導(dǎo)致無(wú)回答情況的產(chǎn)生,故個(gè)人年收入符合不可忽略機(jī)制的條件。經(jīng)濟(jì)學(xué)中的人力資本理論將勞動(dòng)者收入差異主要?dú)w結(jié)為勞動(dòng)者人力資本的不同,教育水平和性別是影響人力資本的重要因素。其中,教育可以提高人的知識(shí)和技能,進(jìn)而提高生產(chǎn)能力,增加個(gè)人收入,并進(jìn)一步使個(gè)人工資和薪金結(jié)構(gòu)發(fā)生變化;在人力資本視角下,女性勞動(dòng)者和雇主的雙向理性選擇,導(dǎo)致了勞動(dòng)力市場(chǎng)普遍存在著性別收入不平等現(xiàn)象。因此,本文選取個(gè)人年收入作為目標(biāo)變量進(jìn)行均值估計(jì),將個(gè)人年收入的均值簡(jiǎn)稱(chēng)為人均年收入,選取教育水平和性別作為輔助信息,模型構(gòu)建詳見(jiàn)下文。

      表1 樣本構(gòu)成(n=8 675)

      根據(jù)受教育程度和性別進(jìn)行交叉分類(lèi),樣本分布如表2。

      表2 交叉分布:受教育程度×性別(n=8 675)

      (二)無(wú)回答的構(gòu)造與模型設(shè)定

      事后分層法是校準(zhǔn)法的特殊情況,進(jìn)行校準(zhǔn)的輔助變量為事后層的總體規(guī)模,是處理無(wú)回答問(wèn)題的常用方法之一。為說(shuō)明RGRG法在不可忽略的無(wú)回答機(jī)制下的估計(jì)優(yōu)勢(shì),分別使用事后分層法和RGRG法進(jìn)行校準(zhǔn)估計(jì)?,F(xiàn)從以下三方面對(duì)實(shí)證過(guò)程進(jìn)行說(shuō)明:無(wú)回答樣本的構(gòu)造、輔助信息的選擇和響應(yīng)模型的擬合函數(shù)選擇。

      個(gè)人年收入為目標(biāo)變量,其回答情況與收入本身密切相關(guān)。假定收入越高回答率越低,無(wú)回答單元的生成方法如下:以個(gè)人年收入的上、下五分位數(shù)為截點(diǎn),將樣本分為低收入、中等收入和高收入人群,設(shè)定這三類(lèi)人群的無(wú)回答率為p=(0.2,0.3,0.6),計(jì)算可知總體無(wú)回答率為0.2×0.2+0.6×0.3+0.2×0.6=0.34。為研究樣本量對(duì)RGRG法的影響,分別從原樣本(樣本量為n=8 675)中隨機(jī)抽取樣本量為0.8n、0.5n和0.3n的樣本進(jìn)行估計(jì)。

      事后分層的輔助變量采用受教育程度和性別,具體信息見(jiàn)表2。RGRG法的背景變量采用受教育程度和性別,為說(shuō)明RGRG法在模型變量選取上的優(yōu)勢(shì),分別采用受教育程度和個(gè)人年收入、受教育程度和性別兩種組合;受教育程度分為五類(lèi)、性別分為兩類(lèi)、個(gè)人年收入根據(jù)人均年收入劃分為兩類(lèi)。據(jù)此得到10維背景變量和10維模型變量。

      不同估計(jì)方法的標(biāo)識(shí)及模型設(shè)置詳見(jiàn)表3。

      表3 模型設(shè)置

      (三)結(jié)果與分析

      本文共進(jìn)行500次重復(fù)試驗(yàn),按照上文所述的構(gòu)造方式隨機(jī)生成無(wú)回答單元,在n、0.8n、0.5n和0.3n的樣本量下,分別采用事后分層法、RGRG法進(jìn)行估計(jì)。估計(jì)方法的評(píng)價(jià)準(zhǔn)則采用相對(duì)偏差、均方誤差根(RMSE)、估計(jì)均方誤差根(估計(jì)RMSE)和權(quán)效應(yīng)(deff)的平均值①,結(jié)果見(jiàn)表4。

      表4 不同模型的估計(jì)結(jié)果

      1.RGRG法與事后分層法的對(duì)比

      根據(jù)表4,對(duì)比方法1和模型(1)~(4)、方法2和模型(5)~(6)、方法3和模型(7)~(8)、方法4和模型(9)~(10),可得到事后分層法和RGRG法的相對(duì)優(yōu)劣。

      以方法1和模型(1)~(4)的估計(jì)效果為例,可以看到,模型(1)~(4)的相對(duì)偏差、均方誤差根和估計(jì)均方誤差根顯著小于方法1的相對(duì)偏差、均方誤差根和估計(jì)均方誤差根,RGRG法的估計(jì)效果優(yōu)于事后分層法。其中,方法1與模型(3)~(4)的比較結(jié)論與Kott的研究結(jié)果相同,其估計(jì)效果良好,但由于其響應(yīng)模型沒(méi)有體現(xiàn)無(wú)回答機(jī)制的不可忽略性,此處僅作為歷史研究的驗(yàn)證,不作詳細(xì)討論[14]。對(duì)比方法2和模型(5)~(6)、方法3與模型(7)~(8),與方法1和模型(1)~(4)的相對(duì)優(yōu)劣相同,RGRG法的效果均明顯優(yōu)于事后分層法。對(duì)比方法4和模型(9)~(10),當(dāng)樣本量較小時(shí),RGRG法的偏差和估計(jì)RMSE小于方法4,但RMSE較大,RGRG法的估計(jì)優(yōu)勢(shì)并不明顯。

      權(quán)效應(yīng)(deff)可以反映相同抽樣方法下權(quán)數(shù)對(duì)估計(jì)量方差的影響。根據(jù)表4可知,雖然RGRG法的權(quán)效應(yīng)與事后分層法相比較大,但均在1.5以下,從權(quán)效應(yīng)的角度考慮,根據(jù)RGRG法對(duì)設(shè)計(jì)權(quán)數(shù)進(jìn)行調(diào)整,有效控制了調(diào)整后權(quán)數(shù)的波動(dòng)性、估計(jì)效果良好。

      總體而言,無(wú)論模型變量如何選擇、響應(yīng)模型如何構(gòu)造,與傳統(tǒng)基于設(shè)計(jì)的事后分層法相比,RGRG法具有明顯優(yōu)勢(shì),估計(jì)效果更優(yōu)、估計(jì)結(jié)果更精確。

      2.樣本量、響應(yīng)模型對(duì)RGRG法的影響

      對(duì)比模型(1)~(2)、模型(5)~(6)、模型(7)~(8)和模型(9)~(10),可得到樣本量對(duì)RGRG法估計(jì)效果的影響。對(duì)比模型(1)與(2)、模型(3)與(4)、模型(5)與(6)、模型(7)與(8)以及模型(9)與(10)可得到不同響應(yīng)模型對(duì)RGRG法估計(jì)效果的影響。

      對(duì)比模型(1)~(2)、模型(5)~(6)、模型(7)~(8)和模型(9)~(10),當(dāng)樣本量由n(模型(1)~(2))減小到0.8n(模型((5)~(6))、再減小到0.5n時(shí)(模型(7)~(8)),RGRG法估計(jì)的相對(duì)偏差、均方誤差根、估計(jì)均方誤差根和權(quán)效應(yīng)沒(méi)有明顯變化,估計(jì)效果相當(dāng);當(dāng)樣本量減小到0.3n時(shí),相對(duì)偏差變化不大,但均方誤差根顯著增加,這是由于進(jìn)行模型擬合的樣本量相應(yīng)減少,從而造成了模型擬合的效果降低。綜上所述,隨著樣本量的減少,RGRG法的估計(jì)效果略微有所下降,但總體而言,無(wú)論樣本量大小如何變化,RGRG法與事后分層法相比均具有明顯優(yōu)勢(shì)。

      分別將函數(shù)h1(η)下的模型(1)、(3)、(5)、(7)和模型(9),與函數(shù)h2(η)下的模型(2)、(4)、(6)、(8)和模型(10)進(jìn)行比較,相對(duì)優(yōu)劣沒(méi)有統(tǒng)一結(jié)論,即無(wú)論響應(yīng)模型的形式如何,均能得到目標(biāo)變量的優(yōu)良估計(jì),不同響應(yīng)模型對(duì)RGRG法估計(jì)效果的影響可以忽略。

      3.結(jié)論

      在不可忽略的無(wú)回答機(jī)制下,與傳統(tǒng)事后分層法相比,RGRG法具有更小的偏差、標(biāo)準(zhǔn)誤和均方誤差根,估計(jì)效果更好。RGRG法允許選擇目標(biāo)變量作為模型變量,可以更好地體現(xiàn)無(wú)回答機(jī)制的不可忽略性。該方法在不同響應(yīng)模型下的估計(jì)效果穩(wěn)定,與傳統(tǒng)方法相比仍具有明顯優(yōu)勢(shì)。樣本中無(wú)回答單元數(shù)量對(duì)RGRG法的效果有輕微影響,無(wú)回答單元數(shù)量越多,進(jìn)行模型擬合的樣本量越少,估計(jì)效果有所下降。

      實(shí)證中采用的超總體模型并未很好擬合總體,一方面未考慮個(gè)人年收入的其他影響因素,另一方面可能存在其他的函數(shù)形式優(yōu)于線性模型。即便沒(méi)有采用最優(yōu)超總體模型,RGRG法仍能得到人均年收入的優(yōu)良估計(jì)。

      通過(guò)RGRG法進(jìn)行總體均值估計(jì),估計(jì)量具有漸進(jìn)無(wú)偏性和漸近一致性。該方法對(duì)不可忽略機(jī)制下的無(wú)回答情況實(shí)現(xiàn)了雙重保護(hù),且允許超總體模型和響應(yīng)模型僅在一定程度上反映總體情況。

      五、總結(jié)與討論

      當(dāng)樣本存在無(wú)回答時(shí),直接利用回答樣本進(jìn)行推斷勢(shì)必是有偏且效率低的,尤其在遇到非隨機(jī)缺失情況時(shí),樣本是否作答與目標(biāo)變量有關(guān),潛在的無(wú)回答偏差不容忽視。目前常用方法大多基于隨機(jī)缺失的假設(shè),不適用于不可忽略機(jī)制下的無(wú)回答。少數(shù)非隨機(jī)缺失下的方法對(duì)模型假設(shè)和模型識(shí)別具有較強(qiáng)的要求,造成其在實(shí)際應(yīng)用時(shí)的效果并不理想。

      本文采用2015年CGSS調(diào)查數(shù)據(jù)進(jìn)行了實(shí)證研究。結(jié)果表明,在不可忽略的無(wú)回答機(jī)制下,與傳統(tǒng)事后分層校準(zhǔn)法相比,使用RGRG法可以得到變異性更小的最終權(quán)數(shù),有效降低了估計(jì)偏差和均方誤差根,得到的加權(quán)估計(jì)量是漸進(jìn)無(wú)偏和漸近一致的。即使響應(yīng)模型和超總體模型都沒(méi)有很好擬合總體的真實(shí)情況,RGRG法得到的估計(jì)量仍具有優(yōu)越性。

      本文通過(guò)RGRG法有效解決了不可忽略無(wú)回答機(jī)制下的權(quán)數(shù)調(diào)整和目標(biāo)變量的估計(jì)問(wèn)題。進(jìn)一步研究考慮在通過(guò)回答樣本推斷總體時(shí),先將回答樣本還原到樣本全體、再還原到總體,兩種還原方法的實(shí)際效果如何需專(zhuān)門(mén)討論。

      猜你喜歡
      權(quán)數(shù)樣本量總體
      醫(yī)學(xué)研究中樣本量的選擇
      用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
      2020年秋糧收購(gòu)總體進(jìn)度快于上年
      微觀調(diào)查數(shù)據(jù)抽樣權(quán)數(shù)的可忽略性檢驗(yàn)及實(shí)證研究
      豬肉在CPI中的權(quán)數(shù)被調(diào)低了嗎?
      豬肉在CPI中的權(quán)數(shù)被調(diào)低了嗎?
      外匯市場(chǎng)運(yùn)行有望延續(xù)總體平穩(wěn)發(fā)展趨勢(shì)
      權(quán)數(shù)可靠性的假設(shè)檢驗(yàn)探討
      航空裝備測(cè)試性試驗(yàn)樣本量確定方法
      Sample Size Calculations for Comparing Groups with Binary Outcomes
      铁岭市| 拉萨市| 龙海市| 苍溪县| 茶陵县| 山阳县| 长汀县| 永春县| 通道| 科技| 涟源市| 天台县| 伊川县| 囊谦县| 潞城市| 福清市| 冕宁县| 滦平县| 武冈市| 清丰县| 岳池县| 英吉沙县| 诏安县| 衡南县| 宁津县| 正阳县| 沙坪坝区| 台中县| 东方市| 合江县| 聂拉木县| 武平县| 拉孜县| 华容县| 重庆市| 汕头市| 麻栗坡县| 绩溪县| 抚州市| 柳河县| 汉寿县|