蔣耀萱
【摘要】對(duì)于準(zhǔn)確的人口普查的重要性不能被過分強(qiáng)調(diào)。隨著人口在測(cè)量過程中遇到持續(xù)不斷的問題,更多的創(chuàng)新技術(shù)被用于調(diào)整初始人口普查中的不完全統(tǒng)計(jì)。本文借助國(guó)外學(xué)者相關(guān)文獻(xiàn),回顧了捕獲-再捕獲方法在人口普查中的歷史發(fā)展,以期對(duì)國(guó)內(nèi)傳統(tǒng)的人口普查質(zhì)量的提高提供策略。
【關(guān)鍵詞】人口普查;捕獲-再捕獲;質(zhì)量
引言
世界上大多數(shù)國(guó)家通過直接登記的人口調(diào)查,行政系統(tǒng)或者結(jié)合上述方法的部分或全部的混合方案,進(jìn)行定期的人口普查。人口普查的質(zhì)量取決于對(duì)人口調(diào)查的覆蓋面。然而歷史的經(jīng)驗(yàn)表明,實(shí)現(xiàn)高覆蓋率是相當(dāng)困難的。當(dāng)調(diào)查和普查存在相對(duì)較低的覆蓋水平時(shí),捕獲-再捕獲方法的估計(jì)精度面臨著人口漏報(bào)的困難。近幾十年來,許多國(guó)家在進(jìn)行傳統(tǒng)的人口普查時(shí)遇到了過少登記的問題,這也成為西方國(guó)家一直以來面臨的挑戰(zhàn)。
本文希望借助國(guó)外學(xué)者相關(guān)文獻(xiàn),將其對(duì)捕獲-再捕獲方法在人口普查中歷史發(fā)展的研究引入到國(guó)內(nèi),以期對(duì)國(guó)內(nèi)傳統(tǒng)的人口普查計(jì)數(shù)提供經(jīng)驗(yàn),進(jìn)一步提高人口普查的質(zhì)量。
一、捕獲—再捕獲方法的起源
捕獲-再捕獲估計(jì)的模型和方法起源于人口數(shù)量的測(cè)量,最早可以追溯至18世紀(jì)拉普拉斯試圖測(cè)量1786年法國(guó)的人口。但是由于其直觀的吸引力,始終在生態(tài)學(xué)上有著堅(jiān)實(shí)的基礎(chǔ)。捕獲-再捕獲方法主要用于估計(jì)生態(tài)種群,Petersen(1896)和Lincoln(1930)的工作集中在用此方法估計(jì)生活在自然和野生棲息地的魚類和水禽種群的規(guī)模。1949年,Chandrasekar和Deming利用人口登記和調(diào)查將該方法應(yīng)用于出生率和死亡率的估計(jì)中,對(duì)于將捕獲-再捕獲方法用于人口測(cè)量,后來被證明是一個(gè)重大的進(jìn)步,人們將其方法定名為雙系統(tǒng)估計(jì),應(yīng)用于人口普查估計(jì)中,來調(diào)整從人口普查和事后調(diào)查中獲得的總數(shù)。
1950年美國(guó)人口普查局在人口普查中已經(jīng)開始使用一項(xiàng)特別的調(diào)查來測(cè)量人口普查中的誤差。但是,雙系統(tǒng)估計(jì)方法被明確使用是在1980年。通過產(chǎn)生一組事后可以被組合起來的數(shù)據(jù)得到過少登記人數(shù)的估計(jì)量,這也是第一次指出人口普查過少登記是非隨機(jī)的,并因社會(huì)階層和種族不成比例而變化。然而1980年人口普查估計(jì)量沒有調(diào)整。因?yàn)檫^少登記變得在政治上很重要并且不可避免,一些對(duì)普查結(jié)果存在質(zhì)疑的州政府把美國(guó)人口普查局告上法院,最初的判決有利于原告。不管怎樣,必須承認(rèn)的是盡管人口普查局設(shè)置了詳細(xì)的程序,但是在大城市登記人口方面存在一些問題,這既需要統(tǒng)計(jì)上可靠,也使其成為“政治上穩(wěn)健”的要求。
二、捕獲—再捕獲方法的發(fā)展
1980年后,學(xué)者們開始意識(shí)到實(shí)現(xiàn)完全覆蓋幾乎是一項(xiàng)不可能的任務(wù)。他們主張用一個(gè)統(tǒng)計(jì)上更加可靠的調(diào)整方法,將實(shí)現(xiàn)“完全覆蓋”變?yōu)椤敖咏采w”。1990年的評(píng)估方案是基于人口估計(jì)和事后登記調(diào)查(PES)。PES是按照類似于以前的人口普查方式設(shè)計(jì)的,但是更加具體側(cè)重于取樣。根據(jù)1980年人口普查過少登記的分布對(duì)國(guó)家層面上的區(qū)域種族和年齡以及性別分層后,選取了國(guó)家的樣本群。Hogan(1993)認(rèn)為操作上1990年事后抽樣調(diào)查是成功的且切實(shí)可行的,因?yàn)樗谝?guī)定的時(shí)限內(nèi)完成了數(shù)據(jù)處理。但是,各州的同質(zhì)性假設(shè)還存在爭(zhēng)議。例如在加州,州登記人口數(shù)是根據(jù)對(duì)國(guó)家中不同事后抽樣層的綜合估計(jì),但是相同的事后抽樣層可以適用于一個(gè)完全不同的州,如北卡羅萊納州。因此,發(fā)現(xiàn)該綜合調(diào)整具有的一些缺點(diǎn)歸因于PES沒有一個(gè)足夠大的樣本以促進(jìn)對(duì)國(guó)家總量的直接估計(jì)。1990年人口普查后,人口普查進(jìn)一步改進(jìn)了普查估計(jì)方法。因?yàn)樵u(píng)估1990年人口普查時(shí)發(fā)現(xiàn)某些人口次級(jí)組更容易錯(cuò)過人口普查,這就是被稱為有偏的或有差異的不完全統(tǒng)計(jì)。Hogan(1993)表明測(cè)量有差異的不完全統(tǒng)計(jì)量的唯一方法是大規(guī)模事后抽樣調(diào)查后再進(jìn)行雙系統(tǒng)估計(jì)。因此,2000年的人口普查涉及一個(gè)初始的人口普查登記,緊隨其后的是一個(gè)獨(dú)立的覆蓋率測(cè)量調(diào)查。在考慮了有差異的過少登記同時(shí)也產(chǎn)生了小范圍人口估計(jì)量是相對(duì)無偏的。
據(jù)美國(guó)人口普查局在以往經(jīng)驗(yàn)表明,人口普查過少登記的估計(jì)是完全可行的。一個(gè)被設(shè)計(jì)過的大規(guī)模事后調(diào)查應(yīng)該獨(dú)立于初始人口普查,這使得初始人口普查可以根據(jù)過少登記的估計(jì)進(jìn)行調(diào)整,因?yàn)檎{(diào)查的樣本不僅有利于人口普查中漏報(bào)的估計(jì),也有利于人口普查錯(cuò)誤登記的估計(jì)。
三、總結(jié)
目前,雙系統(tǒng)估計(jì)方法,使用初始的人口統(tǒng)普查和一個(gè)事后登記調(diào)查(普查覆蓋調(diào)查)。這個(gè)調(diào)查基本上是對(duì)一個(gè)小樣本地區(qū)的人口的密集重復(fù)登記。調(diào)查的目的是為了評(píng)估普查中人口登記的優(yōu)劣,并告知過少登記、過多登記以及響應(yīng)準(zhǔn)確性的程度。雙系統(tǒng)方法的一個(gè)基本假設(shè)是,人口普查和調(diào)查過程是獨(dú)立的,當(dāng)缺乏獨(dú)立性時(shí),將偏差引入到人口估計(jì)中。然而,沒有辦法確定偏差的程度,除非通過一些附加信息。此外,通過人為重復(fù)或錯(cuò)誤發(fā)生的過多登記被認(rèn)為是微不足道的。因此,一個(gè)來自三方資源(一個(gè)管理記錄系統(tǒng))的數(shù)據(jù)被提出,作為一種增大這種偏差的方式,這也是的三系統(tǒng)估計(jì)的定義,相當(dāng)于在生物種群應(yīng)用的一個(gè)三系統(tǒng)捕獲-再捕獲方法。
參考文獻(xiàn):
[1]Baffour-Awuah B.Estimation of population totals from imperfect census,survey and administrative records[J].University of Southampton.2009
[2]Hogan,H.The 1990 Post-Enumeration Survey:Operations and Results[J].Journal of the American Statistical Association.1993,88:1047-1060endprint