胡桂華 吳笛 劉譽(yù)環(huán)
摘 要: 戶籍登記系統(tǒng)存在登記誤差,為發(fā)揮其作用,應(yīng)估計(jì)其凈誤差。我國尚未估計(jì)戶籍登記系統(tǒng)的凈誤差,這一狀況應(yīng)該改變。雙系統(tǒng)估計(jì)量是目前估計(jì)凈誤差的重要方法。
本研究的目的是,用組合式三系統(tǒng)估計(jì)量替代雙系統(tǒng)估計(jì)量來估計(jì)我國戶籍登記系統(tǒng)的凈誤差,即目標(biāo)總體的未知實(shí)際人口數(shù)與已知的戶籍登記系統(tǒng)人口數(shù)之差,為相關(guān)部門或有關(guān)人員科學(xué)使用戶籍資料提供依據(jù)。采用抽樣理論和數(shù)理模型方法構(gòu)造組合式三系統(tǒng)估計(jì)量,利用樣本普查小區(qū)的三份人口名單演示其計(jì)算過程。研究發(fā)現(xiàn):雖然戶籍登記系統(tǒng)是獲得人口統(tǒng)計(jì)數(shù)據(jù)的重要來源,但由于它內(nèi)含錯誤登記或漏登人口的登記誤差,因此它所提供的人口數(shù)偏離實(shí)際人口數(shù),需要采取恰當(dāng)?shù)姆椒ü烙?jì)這種偏離程度;抽樣登記的組合式三系統(tǒng)估計(jì)量適合于凈誤差估計(jì);為使估計(jì)的戶籍登記系統(tǒng)凈誤差符合統(tǒng)計(jì)口徑的一致性要求,樣本普查小區(qū)的普查人口名單、事后計(jì)數(shù)調(diào)查人口名單和戶籍人口名單中的每一個人必須具有本地戶籍,否則從名單中剔除;組合式三系統(tǒng)估計(jì)量須在同質(zhì)人口層建立,否則內(nèi)含異質(zhì)性偏差,低估總體實(shí)際人口數(shù);在分層二重抽樣下,組合式三系統(tǒng)估計(jì)量各個元素的估計(jì)量采用雙重?cái)U(kuò)張估計(jì)量構(gòu)造,抽樣方差采用分層刀切法近似計(jì)算;凈誤差估計(jì)既可以在普查年進(jìn)行,也可以在非普查年進(jìn)行。本研究的意義在于,組合式三系統(tǒng)估計(jì)量有望被國家統(tǒng)計(jì)局采納,用于未來戶籍登記系統(tǒng)的凈誤差率估計(jì)。此外,還可以用來估計(jì)人口普查、農(nóng)業(yè)普查及經(jīng)濟(jì)普查的凈誤差率。
關(guān)鍵詞:抽樣調(diào)查;政府統(tǒng)計(jì);人口行政記錄;組合式三系統(tǒng)估計(jì)量;分層刀切法
中圖分類號: C921.2
文獻(xiàn)標(biāo)識碼:A
文章編號:1000-4149(2023)04-0056-19
DOI:10.3969/j.issn.1000-4149.2023.00.028
一、引言
國民經(jīng)濟(jì)發(fā)展中迫切需要解決的一個關(guān)鍵問題是人口數(shù)目的準(zhǔn)確性問題。對作為世界第一人口大國的中國尤其如此【 聯(lián)合國發(fā)布的《世界人口展望2022》報(bào)告顯示,中國2022年7月1日總?cè)丝跀?shù)為14.25887億人?!?。人口統(tǒng)計(jì)調(diào)查和人口行政記錄是我國國家統(tǒng)計(jì)局獲得人口統(tǒng)計(jì)數(shù)據(jù)的兩大來源。人口統(tǒng)計(jì)調(diào)查包括每隔10年進(jìn)行一次的人口普查及非普查年進(jìn)行的人口抽樣調(diào)查。戶籍登記系統(tǒng)、常住人口登記系統(tǒng)、出生人口登記系統(tǒng)、死亡人口登記系統(tǒng)和人口遷移登記系統(tǒng),是我國常見的人口行政記錄。從對總體人口登記的范圍和準(zhǔn)確性等來看,戶籍登記系統(tǒng)是最重要的。中國公安部每年向國家統(tǒng)計(jì)局提供戶籍登記系統(tǒng)人口數(shù)。
相關(guān)信息表明,我國的戶籍登記系統(tǒng)人口數(shù)存在誤差,因而有必要研究或估計(jì)它,其必要性具體體現(xiàn)在兩個方面:
一方面,作為我國人口行政記錄中最重要的戶籍登記系統(tǒng),在登記目標(biāo)總體人口的過程中,通常會發(fā)生兩種誤差,一種是應(yīng)該登記卻未登記而引起的漏登誤差[1],另外一種是無效登記引起的錯誤登記誤差[2-3],包括重復(fù)登記、目標(biāo)總體外登記和地址錯誤登記。漏登誤差使戶籍登記系統(tǒng)不適當(dāng)減少人口數(shù),而錯誤登記誤差導(dǎo)致戶籍登記系統(tǒng)虛增人口數(shù)。漏登誤差和錯誤登記誤差相抵后的結(jié)果,即為凈誤差【 凈誤差可定義為漏登誤差與錯誤登記誤差之差,或者定義為目標(biāo)總體實(shí)際人口數(shù)與戶籍登記系統(tǒng)人口數(shù)之差。各國政府統(tǒng)計(jì)部門在人口普查凈誤差中使用第二種定義。本文也采用第二種定義計(jì)算戶籍登記系統(tǒng)的凈誤差?!?。另一方面,為確定能否使用及在多大程度上使用戶籍登記系統(tǒng)人口數(shù)提供依據(jù),因?yàn)槭褂幂^大凈誤差的戶籍登記系統(tǒng)人口數(shù)可能會影響決策的科學(xué)性。
本文擬用組合式三系統(tǒng)估計(jì)量來估計(jì)中國戶籍登記系統(tǒng)的凈誤差[4],即目標(biāo)總體未知的實(shí)際人口數(shù)【 目標(biāo)總體實(shí)際人口數(shù)為全國各個普查小區(qū)的應(yīng)該有本地戶口的無重復(fù)的人口數(shù)之和,其中包括應(yīng)該且實(shí)際擁有本地戶口的人口數(shù)和應(yīng)該有但實(shí)際上沒有本地戶口的人口數(shù)?!颗c已知的戶籍登記系統(tǒng)人口數(shù)【 戶籍登記系統(tǒng)人口數(shù)為全國所有公安部門派出所戶籍底冊所顯示的某一指定時點(diǎn)的人口數(shù)之和,或者是全國各個普查小區(qū)的擁有本地戶口的人口數(shù)之和。】之差。實(shí)際人口數(shù)可以采用雙系統(tǒng)估計(jì)量、普通三系統(tǒng)估計(jì)量和組合式三系統(tǒng)估計(jì)量【 雙系統(tǒng)估計(jì)量依據(jù)普查人口名單和在它之后進(jìn)行的事后計(jì)數(shù)調(diào)查人口名單建立,普通三系統(tǒng)估計(jì)量依據(jù)這兩份調(diào)查人口名單和戶籍人口名單構(gòu)造,組合式三系統(tǒng)估計(jì)量的缺失單元估計(jì)量依據(jù)多個普通三系統(tǒng)估計(jì)量的缺失單元估計(jì)量建立。】估計(jì)[5-10]。組合式三系統(tǒng)估計(jì)量相對較優(yōu),首先它比普通三系統(tǒng)估計(jì)量利用的信息更多,其次它不像雙系統(tǒng)估計(jì)量那樣要求系統(tǒng)之間獨(dú)立。
與已有相關(guān)論文和其他研究成果相比,本文具有一定的學(xué)術(shù)價值和應(yīng)用價值。
學(xué)術(shù)價值體現(xiàn)在四個方面。
第一,提出抽樣登記的組合式三系統(tǒng)估計(jì)量,使其應(yīng)用于戶籍登記系統(tǒng)凈誤差估計(jì)成為可能。
第二,利用不完整三維列聯(lián)表單元數(shù)據(jù)構(gòu)造的組合式三系統(tǒng)估計(jì)量的缺失單元估計(jì)量的分子和分母,分別是若干個普通三系統(tǒng)估計(jì)量的缺失單元估計(jì)量的分子和分母之和,其中每個子總體指標(biāo)使用線性估計(jì)量構(gòu)造。
第三,研究不同抽樣方法下的刀切抽樣方差估計(jì)量及復(fù)制權(quán)數(shù)計(jì)算公式,為相關(guān)人員提供更多選擇。
第四,利用樣本普查小區(qū)的三份人口名單和公式,計(jì)算戶籍登記系統(tǒng)的凈誤差及抽樣方差估計(jì)值,使相關(guān)人員可以正確使用組合式三系統(tǒng)估計(jì)量。
應(yīng)用價值體現(xiàn)在三個方面。第一,為政府統(tǒng)計(jì)部門制定戶籍登記系統(tǒng)凈誤差估計(jì)方案提供參考,提高方案的科學(xué)性和可操作性,對戶籍登記系統(tǒng)的質(zhì)量作出客觀科學(xué)評價。第二,為相關(guān)
工作者正確認(rèn)識和使用戶籍登記系統(tǒng)數(shù)據(jù)提供依據(jù)。第三,開發(fā)利用包括戶籍登記系統(tǒng)在內(nèi)的行政記錄資料,從而為實(shí)施以戶籍登記系統(tǒng)為核心的行政記錄式人口普查創(chuàng)造更好的條件。
二、文獻(xiàn)綜述
包括美國、北歐在內(nèi)的許多西方發(fā)達(dá)國家,以及部分非洲國家已經(jīng)建立起類似于中國、朝鮮和貝寧的戶籍登記系統(tǒng)的民事登記系統(tǒng)和人口動態(tài)統(tǒng)計(jì)系統(tǒng)[11]。民事登記系統(tǒng)是確立一國個人權(quán)利和特權(quán)的法律基礎(chǔ),是對活產(chǎn)、胎兒死亡、死亡、結(jié)婚、離婚、收養(yǎng)等重要民事事件進(jìn)行強(qiáng)制性、連續(xù)性記錄的系統(tǒng)。人口動態(tài)統(tǒng)計(jì)系統(tǒng)依據(jù)民事登記系統(tǒng)的人口動態(tài)記錄,人口普查、抽樣調(diào)查和行政記錄的人口記錄,樣本登記區(qū)的人口動態(tài)記錄和保健服務(wù)部門的記錄建立。只要堅(jiān)持詳細(xì)登記,民事登記系統(tǒng)就可以成為人口動態(tài)統(tǒng)計(jì)系統(tǒng)的主要來源。戶籍登記系統(tǒng)是登記自然人的姓名、出生日期、戶主或與戶主關(guān)系、住址、性別、籍貫、居民身份證號碼、文化程度、婚姻狀況、民族、死亡和收養(yǎng)等的系統(tǒng)。我國《戶口登記條例》規(guī)定,出生者和死亡者應(yīng)該攜帶有關(guān)證件在規(guī)定時間內(nèi)到常住地辦理入戶、注銷戶口,每個人都有資格上戶口,而且只能有一個戶口。這三個系統(tǒng)的共同點(diǎn)都是對總體人口的登記,存在登記誤差和需要估計(jì)凈誤差。不同點(diǎn)是:建立戶籍登記系統(tǒng)的目的是限制人口的無序流動,減少人口管理的社會成本,提供人口數(shù)不是其主要功能,而是其副產(chǎn)品;構(gòu)建民事登記系統(tǒng)有雙重目的,即行政和法律目的及統(tǒng)計(jì)、人口和流行病學(xué)目的;建立人口動態(tài)統(tǒng)計(jì)系統(tǒng)的主要目的是為政府統(tǒng)計(jì)部門和其他相關(guān)部門提供準(zhǔn)確的人口數(shù)。由于這三個系統(tǒng)的登記人口數(shù)已知,所以凈誤差估計(jì)只與總體實(shí)際人口數(shù)的估計(jì)有關(guān),與這三個系統(tǒng)的功能和登記對象無關(guān),組合式三系統(tǒng)估計(jì)量適合于它們的凈誤差估計(jì)。
相關(guān)文獻(xiàn)資料顯示,關(guān)于民事登記系統(tǒng)、人口動態(tài)統(tǒng)計(jì)系統(tǒng)和戶籍登記系統(tǒng)的研究主要集中在系統(tǒng)的建立、資料來源及用于政策或計(jì)劃的制定方面[12-15]。有關(guān)估計(jì)這三個系統(tǒng)凈誤差的研究成果并不多見[16]。因此,本文研究中國戶籍登記系統(tǒng)的凈誤差估計(jì)。
為提高中國戶籍登記系統(tǒng)凈誤差估計(jì)精度,了解其發(fā)生登記誤差的三個原因是很有必要的。
第一,雖然戶籍管理?xiàng)l例明確規(guī)定為出生者或戶口遷移者及時入戶,為死亡者及時銷戶,但實(shí)際上從出生到入戶,從遷出地到遷入地入戶,從死亡到銷戶有一個時間差。如果這個時間差發(fā)生在估計(jì)戶籍登記系統(tǒng)凈誤差時,就會發(fā)生漏登誤差和錯誤登記誤差。
第二,我國曾經(jīng)實(shí)施過嚴(yán)格的計(jì)劃生育政策【 1971年到2015年,為控制人口增長,我國實(shí)行計(jì)劃生育政策。在這一政策背景下,超生嬰兒是無法入戶的。如果不能入戶,就失去讀書和享受福利等權(quán)利?!?,禁止為超生嬰兒入戶,或只有繳納足額罰款才讓超生嬰兒入戶,導(dǎo)致較為嚴(yán)重的漏登誤差。隨著二孩或三孩政策的實(shí)施【 為鼓勵生育,解決勞動力不足問題,我國于2015年起開始實(shí)施二孩或三孩政策,所有活產(chǎn)嬰兒都有資格入戶,戶籍登記系統(tǒng)漏登人口的幅度減少?!浚m然所有出生時的活產(chǎn)嬰兒目前都有資格入戶,但仍然沒有做到一旦出生便及時入戶。
第三,
在實(shí)行農(nóng)村養(yǎng)老保險(xiǎn)政策之前,有些農(nóng)村老年人一輩子都沒有上戶口,導(dǎo)致漏登誤差。隨著新型農(nóng)村社會養(yǎng)老保險(xiǎn)試點(diǎn)指導(dǎo)意見的實(shí)施(有戶籍的年滿60周歲的農(nóng)村老人可以按月領(lǐng)取養(yǎng)老金),漏登戶口的情況顯著減少,盡管這樣,及時入戶并未做到。第六次人口普查前的戶籍整頓結(jié)果顯示,全國有1300萬凈無戶籍人口,占總?cè)丝诘?%【 數(shù)據(jù)來源于國家統(tǒng)計(jì)局《馬建堂解讀中國第六次全國人口普查》,stats.gov.cn/zt_18555/zdtjgz/zgrkpc/d6crkpc/dcrkpcyw/202303/t20230306_1935378.htm
】。凈無戶籍人口數(shù)就是凈誤差,為無戶籍人口數(shù)與重復(fù)登記戶籍人口數(shù)和死亡未注銷戶籍人口數(shù)之差。從以上三方面的原因分析可知,我國戶籍登記系統(tǒng)確實(shí)存在登記誤差,應(yīng)該采取恰當(dāng)方法估計(jì)其凈誤差。
聯(lián)合國經(jīng)濟(jì)及社會事務(wù)部和統(tǒng)計(jì)司在關(guān)于《人口動態(tài)統(tǒng)計(jì)系統(tǒng)的原則和建議(修訂版2)》報(bào)告
中,使用雙系統(tǒng)估計(jì)量來估計(jì)民事登記系統(tǒng)或人口動態(tài)登記系統(tǒng)的凈誤差。該報(bào)告未提及戶籍登記系統(tǒng)有兩個原因,一是世界上只有三個國家實(shí)施戶籍登記制度,二是這兩個系統(tǒng)的凈誤差率估計(jì)方法同樣適合于戶籍登記系統(tǒng)。這里的雙系統(tǒng)估計(jì)量中的兩個系統(tǒng)包括民事登記系統(tǒng)和人口統(tǒng)計(jì)調(diào)查系統(tǒng)。使用雙系統(tǒng)估計(jì)量的前提條件是,民事登記系統(tǒng)對總體人口的覆蓋率不得低于既定標(biāo)準(zhǔn)(如80%)。美國全國衛(wèi)生統(tǒng)計(jì)中心建立的民事登記系統(tǒng)的覆蓋率在1960年以后接近100%。美國人口普查局構(gòu)造人口統(tǒng)計(jì)分析模型所需要的出生人口數(shù)和死亡人口數(shù)可以直接從該系統(tǒng)獲得。美國對民事登記系統(tǒng)的凈誤差率每年或每隔2—3年估計(jì)一次。然而,一些非洲國家的民事登記系統(tǒng)的覆蓋率往往達(dá)不到標(biāo)準(zhǔn),不具備使用雙系統(tǒng)估計(jì)量的條件。我國戶籍登記系統(tǒng)的覆蓋率超過標(biāo)準(zhǔn),可以使用雙系統(tǒng)估計(jì)量來估計(jì)其凈誤差率。使用雙系統(tǒng)估計(jì)量還要滿足另外一個條件,即兩個系統(tǒng)必須獨(dú)立,否則會低估或高估總體實(shí)際人口數(shù)[17]。相比依據(jù)人口普查資料和人口抽樣調(diào)查資料構(gòu)造的雙系統(tǒng)估計(jì)量,根據(jù)民事登記系統(tǒng)和人口統(tǒng)計(jì)調(diào)查資料建立的雙系統(tǒng)估計(jì)量,能比較好地滿足獨(dú)立性條件。這是因?yàn)?,人口普查資料和人口抽樣調(diào)查資料均來源于政府統(tǒng)計(jì)部門,獨(dú)立性自然難以保證,而民事登記系統(tǒng)數(shù)據(jù)和人口統(tǒng)計(jì)調(diào)查資料分別來源于行政管理部門和統(tǒng)計(jì)部門,獨(dú)立性應(yīng)該能夠滿足。也就是說,在民事登記系統(tǒng)凈誤差估計(jì)中,構(gòu)造和使用依據(jù)民事登記系統(tǒng)和人口統(tǒng)計(jì)調(diào)查資料的雙系統(tǒng)估計(jì)量是合適和可行的。盡管如此,我們還是認(rèn)為用三系統(tǒng)估計(jì)量取代雙系統(tǒng)估計(jì)量更為合適。一方面,雙系統(tǒng)估計(jì)量只利用了兩種資料,而三系統(tǒng)估計(jì)量利用了三種資料。抽樣理論指出,在構(gòu)造估計(jì)量的時候,利用的有效信息越多,估計(jì)量的精度也會越高。另一方面,三系統(tǒng)估計(jì)量不要求三個系統(tǒng)相互獨(dú)立,既可以在它們獨(dú)立,也可以在它們非獨(dú)立的情況下構(gòu)造。按照缺失單元估計(jì)量構(gòu)造方法的不同,三系統(tǒng)估計(jì)量包括普通和組合式兩種。對我國來說,在人口普查年,三系統(tǒng)估計(jì)量的三個系統(tǒng)分別是人口普查、人口普查之后組織的事后計(jì)數(shù)調(diào)查和戶籍登記系統(tǒng);在非人口普查年,三個系統(tǒng)分別是人口抽樣調(diào)查、人口抽樣調(diào)查的事后計(jì)數(shù)調(diào)查和戶籍登記系統(tǒng)?;谌到y(tǒng)估計(jì)量的戶籍登記系統(tǒng)凈誤差估計(jì)工作,既可以在人口普查年進(jìn)行,也可以在非人口普查年實(shí)施。
我國國家統(tǒng)計(jì)局尚未開展戶籍登記系統(tǒng)凈誤差估計(jì)工作,這一狀況應(yīng)該改變。使戶籍登記系統(tǒng)在人口統(tǒng)計(jì)中發(fā)揮應(yīng)有作用,應(yīng)加強(qiáng)戶籍登記系統(tǒng)凈誤差估計(jì)基礎(chǔ)理論研究,尤其是組合式三系統(tǒng)估計(jì)量的研究工作,逐步建立起符合我國國情的以組合式三系統(tǒng)估計(jì)量為核心的戶籍登記系統(tǒng)凈誤差(率)估計(jì)體系。
三、理論
使用組合式三系統(tǒng)估計(jì)量估計(jì)人口普查年中國戶籍登記系統(tǒng)的凈誤差,需要建立相應(yīng)的理論,包括普通和組合式三系統(tǒng)估計(jì)量、戶籍登記系統(tǒng)凈誤差及其抽樣方差估計(jì),以及對三份人口名單的必要說明。
1. 普通三系統(tǒng)估計(jì)量
為了更好地理解和運(yùn)用組合式三系統(tǒng)估計(jì)量,有必要對其進(jìn)行簡要介紹。這個估計(jì)量的理論基礎(chǔ)是三次捕獲模型。“出現(xiàn)在本次捕獲結(jié)果之中”和“未出現(xiàn)在本次捕獲結(jié)果之中”是每一次捕獲結(jié)果的兩種取值。用來構(gòu)造普通三系統(tǒng)估計(jì)量的普查人口名單、事后計(jì)數(shù)調(diào)查人口名單和戶籍人口名單分別對應(yīng)于三次捕獲模型的第一次、第二次和第三次捕獲。
三次捕獲模型要求總體中的個體同質(zhì),而人類總體中的人不具有同質(zhì)性,這樣在構(gòu)造基于三次捕獲模型的普通三系統(tǒng)估計(jì)量之前,需要對總體中的人進(jìn)行同質(zhì)性分層。我們將總體劃分為V個同質(zhì)人口層,并且將同質(zhì)人口層v(v=1,2,…,V)中的人在三份人口名單的登記結(jié)果指定到不完整三維列聯(lián)表的相應(yīng)單元,其中七個單元的人口數(shù)是已知的,其和用xv表示,一個缺失單元的人口數(shù)未知,其估計(jì)量使用 m︿000,v表示。普通三系統(tǒng)估計(jì)量(General Triple System Estimator,GTSE)由這兩部分組成。七個單元中的每個單元的實(shí)際人口數(shù)使用xijk,v表示,右下標(biāo)i,j,k分別為同質(zhì)人口層v的人是否
在普查人口名單、
事后計(jì)數(shù)調(diào)查人口名單和戶籍人口名單的登記結(jié)果的
變量。i=1表示該人登記在普查人口名單,i=0表示該人未登記在普查人口名單;j=1表示該人登記在事后計(jì)數(shù)調(diào)查人口名單,j=0表示該人未登記在事后計(jì)數(shù)調(diào)查人口名單;k=1表示該人登記在戶籍人口名單,k=0表示該人未登記在戶籍人口名單。將這些符號及其人口數(shù)填寫在表1中。注意,表1假設(shè)事后計(jì)數(shù)調(diào)查為全面調(diào)查。
4. 對三份人口名單的必要說明或規(guī)定
為了正確地、合乎邏輯地使用式(12)到式(35),有必要對用來構(gòu)造組合式三系統(tǒng)估計(jì)量的普查人口名單、事后計(jì)數(shù)調(diào)查人口名單和戶籍人口名單做必要說明或規(guī)定。前兩份調(diào)查人口名單依據(jù)普查表和事后計(jì)數(shù)調(diào)查表編制而成,戶籍人口名單依據(jù)派出所提供的戶籍登記底冊編制。組合式三系統(tǒng)估計(jì)量的使用須符合我國人口口徑、統(tǒng)計(jì)調(diào)查及估計(jì)理論的要求。
我國戶籍登記系統(tǒng)凈誤差為目標(biāo)總體實(shí)際人口數(shù)與戶籍登記系統(tǒng)人口數(shù)之差。按照國家統(tǒng)計(jì)局人口口徑的劃分,目標(biāo)總體實(shí)際人口數(shù)有三種口徑,即常住人口數(shù)、現(xiàn)有人口數(shù)和戶籍人口數(shù)。依據(jù)統(tǒng)計(jì)指標(biāo)計(jì)算要求,目標(biāo)總體實(shí)際人口數(shù)與戶籍登記系統(tǒng)人口數(shù)在口徑上需一致。對于實(shí)際人口數(shù)估計(jì),就是要估計(jì)目標(biāo)總體有戶口且只有一個戶口的戶籍人口數(shù)。按照統(tǒng)計(jì)調(diào)查要求,對發(fā)生的人口動態(tài)事件要及時登記或處理,所估計(jì)的戶籍人口數(shù)就應(yīng)該包括在普查標(biāo)準(zhǔn)時點(diǎn)前出生但未入戶的嬰兒,但不包括該時點(diǎn)前死亡但未注銷戶口者,也不包括重復(fù)戶口者。按照戶籍登記條例及現(xiàn)實(shí)做法,公安部門公布的戶籍登記系統(tǒng)人口數(shù)包括了死亡未注銷戶口者和重復(fù)戶口者人數(shù),但未包括應(yīng)該及時入戶的嬰兒人數(shù)??梢?,估計(jì)的目標(biāo)總體戶籍人口數(shù)不同于戶籍登記系統(tǒng)人口數(shù)。
為了獲得與戶籍登記系統(tǒng)人口數(shù)在口徑上一致的目標(biāo)總體戶籍人口數(shù)的估計(jì)值,在確定三份人口名單的戶籍人口時,要堅(jiān)持三項(xiàng)原則。
一是研究范圍原則。如果研究范圍是重慶市,只要這個人在該市的任何地方上了戶口,就可作為本樣本普查小區(qū)的戶籍人口,而不要求這個人的戶口登記在本樣本普查小區(qū)的所在地。如果研究范圍是全國,只要這個人在全國的任何地方有戶口,即可視為本樣本小區(qū)的戶籍人口。例如,某人是重慶市的常住人口,但其戶口登記在武漢市,也可以算作是本樣本普查小區(qū)的戶籍人口。這是可以理解的,因?yàn)槭褂媒M合式三系統(tǒng)估計(jì)量估計(jì)的是研究范圍內(nèi)擁有戶籍的人口數(shù),而不是估計(jì)所有樣本普查小區(qū)本身有戶口的人口數(shù)。
二是登記范圍原則。普查標(biāo)準(zhǔn)時點(diǎn)居住在本樣本普查小區(qū)的人,不管其戶籍登記在何處,以及戶口登記在本樣本普查小區(qū)但在該時點(diǎn)未居住在本樣本普查小區(qū)的人,無論其外出時間多長、外出原因如何,都要進(jìn)行登記。對于出差、旅游、走親訪友等原因臨時外出的人口,也要進(jìn)行登記。為避免重復(fù)登記,臨時來訪的人不登記。標(biāo)準(zhǔn)時點(diǎn)后出生的人和該時點(diǎn)前死亡的人、港澳臺和外籍人員以及現(xiàn)役軍人不登記。使用出生醫(yī)學(xué)證明、死亡醫(yī)學(xué)證明、居民身份證號碼或現(xiàn)場調(diào)查法,核對樣本普查小區(qū)的三份人口名單,判斷它們是否登記了普查標(biāo)準(zhǔn)時點(diǎn)之前出生的嬰兒及死亡者或重復(fù)戶口者。如果未登記該時點(diǎn)前出生的嬰兒,則添補(bǔ)到這三份人口名單,這是因?yàn)檫@類嬰兒在該時點(diǎn)具備了上戶口資格,未上戶口是因?yàn)槠渌y以抗拒的原因,因此應(yīng)該視為戶籍人口。如果三份名單登記了該時點(diǎn)之前死亡者或重復(fù)戶口,或者登記了標(biāo)準(zhǔn)時點(diǎn)之后出生的嬰兒,則從中剔除。
三是分割指定原則。組合式三系統(tǒng)估計(jì)量對總體戶籍人口數(shù)的估計(jì)依據(jù)的是樣本普查小區(qū)的三份人口名單,因而須獲得這樣的三份人口名單,可是我國的戶籍登記系統(tǒng)并不是按普查小區(qū)劃分的,而是以街道為范圍登記的,街道建立了分建筑物的普查小區(qū)戶籍登記系統(tǒng)。這樣一來,為了獲得本樣本普查小區(qū)的戶籍人口信息,需要在街道的戶籍登記系統(tǒng)搜索本樣本普查小區(qū)的戶籍人口,或者比對本樣本普查小區(qū)三份人口名單的人口地址和街道戶籍登記系統(tǒng)的人口地址。
四、實(shí)證研究
按理應(yīng)該以全國為實(shí)證范圍估計(jì)全國戶籍登記系統(tǒng)的凈誤差率,但是因?yàn)闊o法獲得估計(jì)全國戶籍登記系統(tǒng)凈誤差的原始數(shù)據(jù),所以從數(shù)據(jù)可獲得性及數(shù)據(jù)處理難度兩個方面考慮,選擇重慶市某行政區(qū)為研究范圍,估計(jì)其2010年11月1日戶籍登記系統(tǒng)的凈誤差率(沒有獲得該行政區(qū)2020年戶籍登記系統(tǒng)凈誤差率估計(jì)所需要的原始數(shù)據(jù))。
1. 抽樣方法
采用分層二重抽樣方法。在抽取第一重樣本之前,為提高樣本對總體的代表性及便于編制抽樣框,按照住房單元數(shù)將該行政區(qū)的總共2200個普查小區(qū)分為兩層(H=2)。h=1表示含80個及以上住房單元的普查小區(qū)層,h=2表示含80個以下住房單元的普查小區(qū)層。以普查小區(qū)為抽樣單位,在每層采用簡單隨機(jī)不重復(fù)抽樣方式抽取樣本普查小區(qū)。Nh表示層h的普查小區(qū)總數(shù),nh表示從層h抽取的樣本小區(qū)數(shù)。對抽取的第一重樣本普查小區(qū),了解每一樣本普查小區(qū)的戶籍人口數(shù),并作為第二重抽樣的輔助變量。依據(jù)戶籍人口占全部人口數(shù)比例將第一重樣本普查小區(qū)重新分為兩層(G=2)。g=1表示戶籍人口比例不足50%的普查小區(qū)層,g=2表示戶籍人口比例大于等于50%的普查小區(qū)層。Mhg表示交叉層hg的普查小區(qū)總數(shù),mhg表示從交叉層hg抽取的樣本小區(qū)數(shù)。表2和表3為樣本形成過程及抽樣權(quán)數(shù),其中,第一重樣本含普查小區(qū)13個,第二重樣本含普查小區(qū)8個。
2. 數(shù)據(jù)采集與處理
估計(jì)該行政區(qū)戶籍登記系統(tǒng)的凈誤差,所需要的是表2中帶有“*”號和“**”的8個樣本普查小區(qū)的三份人口名單。通過比較,得到了每個樣本普查小區(qū)人口在三份人口名單的登記結(jié)果。為簡化計(jì)算,按照性別對樣本普查小區(qū)的人口同質(zhì)分層(V=2),v=1表示男性層,v=2表示女性層。比較結(jié)果見表4和表5。
3. 估計(jì)結(jié)果
(1)戶籍登記系統(tǒng)凈誤差(率)估計(jì)值。使用表1到表4數(shù)據(jù)和式(12)到式(16)得到男性層、女性層和總體的實(shí)際人口數(shù)及戶籍登記系統(tǒng)的凈誤差(率)估計(jì)值,見表6。
從表6可以看出以下三點(diǎn)重要信息。
第一,總體的戶籍登記系統(tǒng)的凈誤差估計(jì)值5657人,并不是漏登人口數(shù),而是凈漏登人口數(shù),即從漏登人口數(shù)中剔除錯誤地登記后的剩余人口數(shù)。有學(xué)者將國家統(tǒng)計(jì)局人口和就業(yè)統(tǒng)計(jì)司估計(jì)的2020年人口普查凈誤差率0.05%錯誤地解讀為漏登率0.05%。戶籍登記系統(tǒng)凈誤差可以表現(xiàn)為該系統(tǒng)的漏登誤差與錯誤登記誤差之差,也可以表現(xiàn)為估計(jì)的目標(biāo)總體戶籍人口數(shù)與該系統(tǒng)人口數(shù)之差,所以凈誤差既不是漏登誤差,也不是錯誤登記誤差。
第二,從總?cè)丝跀?shù)來看,采用組合式三系統(tǒng)估計(jì)量估計(jì)的重慶市某行政區(qū)2010年的戶籍人口數(shù)為563227人,總體的戶籍登記系統(tǒng)人口數(shù)為557570人。這表明總體的戶籍登記系統(tǒng)凈漏登人口數(shù)5657人,凈誤差率為1.004%?!吨袊y(tǒng)計(jì)年鑒》上提供的是戶籍登記系統(tǒng)人口數(shù),而不是估計(jì)的戶籍人口數(shù)。如果估計(jì)的凈漏登人數(shù)多,那么依據(jù)戶籍登記系統(tǒng)人口數(shù)進(jìn)行人口統(tǒng)計(jì)研究工作就有可能得出錯誤的結(jié)論。所估計(jì)的凈誤差率1.004%與公安部門組織的同年戶籍整頓得到的凈誤差率很接近。
戶籍整頓采用的是全面調(diào)查,即對每個住戶進(jìn)行調(diào)查,登記其無戶籍人口、重復(fù)登記戶口者和死亡未注銷戶口者,而全面調(diào)查得到的結(jié)果受到研究人員和實(shí)際工作者的廣泛認(rèn)可。我們估計(jì)的結(jié)果與全面調(diào)查得到的結(jié)果接近,一定程度上說明我們提出的組合式三系統(tǒng)估計(jì)量適合于戶籍登記系統(tǒng)的凈誤差率估計(jì)。
第三,從類別人口數(shù)來看,男性的凈誤差估計(jì)值為3453人,凈誤差率為1.2%,而女性的凈誤差估計(jì)值為2204人,凈誤差率為0.799%。這表明,無論從絕對數(shù)還是從相對數(shù)來看,戶籍登記系統(tǒng)漏登男性的情況比女性要嚴(yán)重。這主要源于我國在2015年前實(shí)行計(jì)劃生育政策,在這一政策背景下,對于超生人口需要按規(guī)定繳納社會撫養(yǎng)費(fèi)才能入戶,而很多家庭無力足額繳納社會撫養(yǎng)費(fèi),因而超生人口實(shí)際上沒有申報(bào)戶口的資格或機(jī)會,而在超生人口中,男性所占比率大于女性,這是因?yàn)樵谥袊r(nóng)村,養(yǎng)兒防老思想在一些人的頭腦中根深蒂固,即便無力繳納社會撫養(yǎng)費(fèi),在沒有兒子之前,也要冒著無法入戶的風(fēng)險(xiǎn)超生男嬰。戶籍登記系統(tǒng)漏登人口,除了超生人口之外,還有申報(bào)戶口手續(xù)不全者(出生證明不全、抱養(yǎng)手續(xù)不全)、正在申報(bào)戶口但未入戶者、戶口待定人口。
(2)戶籍登記系統(tǒng)凈誤差(率)估計(jì)值的抽樣標(biāo)準(zhǔn)誤差估計(jì)值。首先,使用式(22)和表2到表3數(shù)據(jù),得到逐一剔除第一重樣本普查小區(qū)后,進(jìn)入第二重樣本的普查小區(qū)的復(fù)制權(quán)數(shù)(見表7)。然后,使用表2到表7數(shù)據(jù)和式(23)到式(31),計(jì)算男性層、女性層的抽樣方差,以及它們之間的協(xié)方差,見表8到表10。
表7中的第二重樣本普查小區(qū)的復(fù)制權(quán)數(shù)是構(gòu)造復(fù)制組合式三系統(tǒng)估計(jì)量及戶籍登記系統(tǒng)復(fù)制凈誤差估計(jì)量的基礎(chǔ)數(shù)據(jù)。復(fù)制組合式三系統(tǒng)估計(jì)量不同于組合式三系統(tǒng)估計(jì)量,前者依據(jù)復(fù)制權(quán)數(shù)構(gòu)造,后者依據(jù)抽樣權(quán)數(shù)構(gòu)造。
在表8中,CTSEB(st)男性
=1∑Hh=1nh∑Hh=1∑nht=1
CTSEB(st)男性
。
表8中的合計(jì)數(shù)5619324.20為男性層戶籍登記系統(tǒng)凈誤差的抽樣方差,其抽樣標(biāo)準(zhǔn)誤差約為2371人,這表明男性估計(jì)的戶籍人口數(shù)和戶籍登記系統(tǒng)凈誤差的估計(jì)值與其實(shí)際值平均相差2371人。抽樣標(biāo)準(zhǔn)誤差越小,估計(jì)值的精度越高。
在表9中,CTSEB(st)女性
=1∑Hh=1nh∑Hh=1∑nht=1
CTSEB(st)女性
。
表9中的合計(jì)數(shù)1914029.94為女性層戶籍登記系統(tǒng)凈誤差的抽樣方差,其抽樣標(biāo)準(zhǔn)誤差約為1383人,這表明估計(jì)的女性戶籍人口數(shù)和戶籍登記系統(tǒng)凈誤差的估計(jì)值與其實(shí)際
值平均相差1383人。與表8中男性抽樣標(biāo)準(zhǔn)誤差相比,表9女性的抽樣標(biāo)準(zhǔn)誤差要小許多,因此使用組合式三系統(tǒng)估計(jì)量估計(jì)的女性實(shí)際人口數(shù)的精度高于男性。
在表10中,CTSEB(st)男性
=
1∑Hh=1nh∑Hh=1∑nht=1
CTSEB(st)男性,CTSEB(st)女性
=
1∑Hh=1nh∑Hh=1∑nht=1
CTSEB(st)女性
。
與表8和表9中的抽樣方差所不同的是,表10提供的是男性層和女性層戶籍人口數(shù)估計(jì)
值的協(xié)方差,為-1747676.22。協(xié)方差可能為正、負(fù)和零。若為零,表示這兩個同質(zhì)人口層無關(guān),對總體抽樣方差無影響;若為正,表示正相關(guān),增大總體抽樣方差;若為負(fù),表示負(fù)相關(guān),減少總體的抽樣方差。
我們最后根據(jù)前面的有關(guān)計(jì)算結(jié)果和式(32)到式(35)給出戶籍登記系統(tǒng)凈誤差和凈誤差率的抽樣標(biāo)準(zhǔn)誤差,見表11。
表11分別提供了重慶市某行政區(qū)戶籍登記系統(tǒng)的凈誤差(率)及其抽樣標(biāo)準(zhǔn)誤差,其中,總體的凈誤差率為1.004%,抽樣標(biāo)準(zhǔn)誤差為0.357%,男性凈誤差率和抽樣標(biāo)準(zhǔn)誤差分別為1.2%和0.824%,而女性凈誤差率和抽樣標(biāo)準(zhǔn)誤差分別為0.799%和0.502%??梢?,總體的凈誤差率介于男性層和女性層之間,其抽樣標(biāo)準(zhǔn)誤差也在它們之間。從數(shù)據(jù)上看,這三個凈誤差率的抽樣標(biāo)準(zhǔn)誤差均較小,估計(jì)精度均較高。
五、結(jié)語
第一,雖然中國建立戶籍登記系統(tǒng)的目的并不是提供人口數(shù)據(jù),但它客觀上成了人口統(tǒng)計(jì)數(shù)據(jù)的重要來源。由于種種原因,該系統(tǒng)可能會重復(fù)登記、漏登、滯后登記目標(biāo)總體人口,從而導(dǎo)致戶籍登記系統(tǒng)人口數(shù)偏離戶籍實(shí)際人口數(shù)。這就需要采取恰當(dāng)?shù)姆椒ü烙?jì)這種偏離的程度,從而更有效地發(fā)揮該戶籍登記系統(tǒng)人口數(shù)在社會經(jīng)濟(jì)發(fā)展與科學(xué)研究中的作用。此外,部門應(yīng)建立起密切的數(shù)據(jù)共享關(guān)系,并制定必要的數(shù)據(jù)共享規(guī)則以保證能夠從公安部門順暢地得到戶籍微觀數(shù)據(jù)。
第二,是否使用估計(jì)的凈誤差率調(diào)整戶籍登記系統(tǒng)人口數(shù)要考慮兩個方面的因素。一是凈誤差率估計(jì)值的大小。如果誤差程度很小,就可以考慮直接使用戶籍登記系統(tǒng)人口數(shù)作決策或開展科學(xué)研究;如果誤差程度較大,就需要根據(jù)估計(jì)的凈誤差率調(diào)整戶籍登記系統(tǒng)人口數(shù),依據(jù)調(diào)整后的戶籍登記系統(tǒng)人口數(shù)進(jìn)行相關(guān)工作。
二是調(diào)整對象的范圍。
在決定調(diào)整時,調(diào)整的對象既可能是全國的戶籍登記系統(tǒng)人口數(shù),也可能是全國以下地區(qū)的省級單位或其下所管轄的行政區(qū)的戶籍登記系統(tǒng)人口數(shù);既可能是對總?cè)丝诘膽艏怯浵到y(tǒng)人口數(shù)調(diào)整,也可能是類別人口的人口數(shù)調(diào)整。本文只估計(jì)了總體的戶籍人口數(shù)。建議國家統(tǒng)計(jì)局使用組合式三系統(tǒng)估計(jì)量估計(jì)全國和全國以下較大范圍的行政區(qū)的戶籍實(shí)際人口數(shù),以及總體全部人口和類別人口(男性和女性等)的戶籍實(shí)際人口數(shù),為戶籍登記系統(tǒng)人口數(shù)的調(diào)整提供數(shù)據(jù)基礎(chǔ)。
第三,估計(jì)戶籍登記系統(tǒng)凈誤差的關(guān)鍵是構(gòu)造估計(jì)目標(biāo)總體戶籍實(shí)際人口數(shù)的估計(jì)量。建議國家統(tǒng)計(jì)局培訓(xùn)人口數(shù)目估計(jì)專門人才,加強(qiáng)組合式三系統(tǒng)估計(jì)量及其抽樣方差估計(jì)量的研究,為戶籍登記系統(tǒng)凈誤差估計(jì)做好理論和人才準(zhǔn)備工作,以提高凈誤差估計(jì)的精度。
第四,使用組合式三系統(tǒng)估計(jì)量估計(jì)戶籍登記系統(tǒng)的凈誤差時,需要解決的一個關(guān)鍵問題是,怎樣對總體中的人進(jìn)行同質(zhì)性分層。如果分層不當(dāng),在同一層內(nèi)出現(xiàn)異質(zhì)情況的,在這樣的層內(nèi)建立組合式三系統(tǒng)估計(jì)量則會導(dǎo)致人口數(shù)估計(jì)值的異質(zhì)性偏差,低估目標(biāo)總體實(shí)際人口數(shù)和戶籍登記系統(tǒng)的凈誤差。為解決這一問題,建議國家統(tǒng)計(jì)局慎重選擇分層變量。
參考文獻(xiàn):
[1]胡桂華, 漆莉, 遲璐婕. 人口普查中遺漏人口數(shù)的估計(jì)[J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究, 2022(1): 132-153.
[2]胡桂華, 劉譽(yù)環(huán), 文婷. 人口普查多報(bào)估計(jì)研究[J]. 人口與經(jīng)濟(jì), 2022(3): 71-85.
[3]張廣宇, 顧寶昌. 人口普查重報(bào): 人口普查面臨的新挑戰(zhàn)[J]. 人口與經(jīng)濟(jì), 2018(3): 1-12.
[4]胡桂華. 人口普查凈誤差估計(jì)綜述[J]. 數(shù)理統(tǒng)計(jì)與管理, 2018(5): 796-814.
[5]胡桂華, 吳迪,遲璐婕. 人口普查覆蓋誤差估計(jì)方法研究[J].
徐州工程學(xué)院學(xué)報(bào)(自然科學(xué)版), 2023(2): 8-16.
[6]胡桂華, 遲璐婕. 基于四系統(tǒng)估計(jì)量的人口普查凈覆蓋誤差估計(jì)[J]. 系統(tǒng)科學(xué)與數(shù)學(xué), 2022(7): 1910-1928.
[7]遲璐婕, 胡桂華. 人口數(shù)目估計(jì)的多來源方法[J]. 徐州工程學(xué)院學(xué)報(bào)(自然科學(xué)版), 2021(2): 84-92.
[8]孟杰, 楊貴軍, 馮國雷, 滑夢珂. 人口總數(shù)估計(jì):基于三系統(tǒng)估計(jì)量與比率估計(jì)量的組合方法[J]. 系統(tǒng)科學(xué)與數(shù)學(xué), 2022(1): 35-49.
[9]ZHANG L C. A note on dual system population size estimation[J]. Journal of Official Statistics, 2019, 35(1): 279-283.
[10]GRIFFIN R. Potential uses of the administrative records for triple system modeling for estimation of census coverage error in 2022[J]. Journal of Official Statistics, 2014, 30(2): 177-189.
[11]聯(lián)合國經(jīng)濟(jì)及社會事務(wù)部, 聯(lián)合國統(tǒng)計(jì)司. 關(guān)于人口動態(tài)系統(tǒng)的原則和建議(修訂本2)[R], 2002.
[12]張慶五, 張?jiān)? 從國外民事登記看我國戶籍制度改革[J]. 人口與計(jì)劃生育, 2002(3): 21-23.
[13]接棟正. 國外民事登記制度及其對我國戶籍制度改革的啟示[D]. 上海:華東師范大學(xué), 2009:95-112.
[14]靳衛(wèi)東, 杜育紅. 農(nóng)民工城鎮(zhèn)居留意愿、自主就業(yè)選擇與戶籍歧視變化[J]. 華中師范大學(xué)學(xué)報(bào)(人文社會科學(xué)版), 2022(4): 25-37.
[15]李五榮, 豐晨宇, 陳華帥. 城市落戶門檻對農(nóng)村流動人口創(chuàng)業(yè)決策的影響——基于新一輪戶籍制度改革的分析[J]. 中南財(cái)經(jīng)政法大學(xué)學(xué)報(bào), 2022(4): 82-95.
[16]胡桂華, 薛婷. 中國戶籍登記系統(tǒng)覆蓋評估研究[J]. 統(tǒng)計(jì)與信息論壇, 2018(7): 34-46.
[17]孟杰. 雙系統(tǒng)估計(jì)量的交互作用偏差研究[J]. 數(shù)理統(tǒng)計(jì)與管理, 2019(5): 858-872.
[18]胡桂華, 吳婷, 范署姍. 人口普查質(zhì)量評估中的三系統(tǒng)估計(jì)量研究[J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究, 2020(8): 159-175.
[19]胡桂華. 人口普查質(zhì)量評估中抽樣后分層變量的選擇[J]. 數(shù)理統(tǒng)計(jì)與管理, 2015(2): 254-263.
[20]胡桂華, 武潔, 丁楊. 人口普查質(zhì)量評估中Logistic回歸模型的應(yīng)用[J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究, 2015(4): 106-122.
[21]金勇進(jìn), 劉曉宇. 大數(shù)據(jù)背景下的抽樣調(diào)查[J]. 系統(tǒng)科學(xué)與數(shù)學(xué), 2022(1): 2-16.
[22]金勇進(jìn), 劉曉宇. 權(quán)數(shù)對基于模型推斷的影響分析[J]. 統(tǒng)計(jì)與信息論壇, 2022(3): 3-13.
[23]王小寧. 權(quán)數(shù)在人口抽樣調(diào)查估計(jì)中的應(yīng)用研究[J]. 統(tǒng)計(jì)與信息論壇, 2019(12): 9-15.
[24]鞏紅禹, 張士琦, 王春枝. 基于分層平衡抽樣的多目標(biāo)代表性樣本設(shè)計(jì)——以住戶調(diào)查為例[J]. 統(tǒng)計(jì)與信息論壇, 2021(2): 36-44.
[25]陳光慧, 劉建平. 構(gòu)建新時代現(xiàn)代化統(tǒng)計(jì)調(diào)查體系的問題研究[J]. 統(tǒng)計(jì)研究, 2018(6): 11-17.
[26]EFRON B, STEIN? C. The jackknife estimate of variance [J]. Annals of Statistics, 1981, 9(3): 586-596.
[27]孟杰, 沈文靜, 楊貴軍, 劉楊. 復(fù)雜抽樣的Bootstrap方差估計(jì)方法及應(yīng)用[J]. 數(shù)理統(tǒng)計(jì)與管理, 2021(2): 266-278.
Estimation of Net Error in Household Registration System
HU? Guihua, WU? Di, LIU Yuhuan
(School of Mathematics and Statistics, Chongqing Technology and Business University,
Chongqing 400067, China)
Abstract: There are registration errors in the registered residence system. In order to play its role, the net error should be estimated. The net error of the registered residence system has not been estimated in China, which requires to be changed. Dual system estimator is an important method to estimate net error at present. The purpose of this study is to estimate the net error of household registration system by using the combined three-system estimator instead of the dual-system estimator. It is the difference between the unknown actual population of the target population and the known population of the registered residence registration system, which? provides the basis for the scientific use of registered residence registration data by relevant departments or personnel.The sampling theory and mathematical model method are used to construct a combined three-system estimator, and the calculation process is demonstrated by using three population lists of sample census districts.
The research finds that:
1) Although the registered residence system is an important source of demographic data, due to the error of misregistration or missing population registration, the population provided by registered residence registration system is different from actual population, where appropriate methods should be adopted to estimate the extent of such deviation.
2) The combined three-system estimator of sampling registration is appropriate for net error estimation.
3) In order to make the estimated net error of the registered residence system meet the consistency requirements of the statistical caliber, each person in the census population list the post-enumeration survey population list and the registered residence population list of the sample census communities must have local registeration, otherwise they must be removed from these lists.
4) The combined three-system estimator must be established in the homogeneous population stratum, otherwise it contains heterogeneity bias and underestimates the actual population size.
5) Under stratified double sampling, the estimators of each element of the combined three-system estimator are constructed by the double expansion estimator, where the sampling variance is approximately calculated by the stratified jack-knife method.
6) Net error estimation can be conducted in either a census year or a non-census year. The research significance is that the combined three-system estimator is expected to be adopted by the National Bureau of Statistics to estimate the net error rate of registered residence system in the future. In addition, it can also be used to estimate the net error rate of population census, agricultural census and economic census.
Keywords:sampling survey;official statistics;population administrative records;combined three-system estimator;stratified cutting method
[責(zé)任編輯 崔子涵,方 志]