• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      人口普查多報及重報估計

      2019-09-20 02:36:20胡桂華廖金盆
      統(tǒng)計與信息論壇 2019年8期
      關(guān)鍵詞:估計量人口數(shù)人口普查

      胡桂華,吳 婷,廖金盆,余 魯

      (重慶工商大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,重慶 400067)

      一、引言

      2020年,中國、美國和其他許多國家將進(jìn)行每隔10年1次的全國人口普查。按照慣例,也將組織質(zhì)量評估抽樣調(diào)查。人口普查質(zhì)量評估的核心任務(wù)是估計人口普查覆蓋誤差[1]。覆蓋誤差進(jìn)一步分為普查凈誤差及普查多報與漏報[2]。普查凈誤差定義為普查登記人口數(shù)與目標(biāo)人口總體實際人口數(shù)之差。普查多報指普查員在普查中登記了不應(yīng)登記的人,使普查登記人口總數(shù)大于實際人口總數(shù),普查重報是普查多報中的一種,指某人在普查中被登記一次以上。普查漏報指普查員在普查中未登記應(yīng)該登記的人口,使普查人口總數(shù)低于總體實際人口總數(shù)。關(guān)于凈誤差估計的研究成果較多,而普查多報的研究成果較少,尤其是很少見到國內(nèi)外學(xué)者發(fā)表普查多報的學(xué)術(shù)性論文。本研究將起到一種示范效應(yīng),吸引更多學(xué)者研究普查多報,為政府統(tǒng)計部門制訂普查多報方案提供決策建議和理論依據(jù)。

      在人口普查質(zhì)量評估的歷史上,世界各國最早只是估計凈誤差。這項工作的關(guān)鍵是構(gòu)造目標(biāo)總體實際人口數(shù)的一個估計量[3],用普查登記人口數(shù)與之相減來求得凈誤差。由于凈誤差提供的人口普查登記質(zhì)量信息有限,為了了解人口普查工作更多、更細(xì)致的信息,人口普查多報與漏報估計問題逐漸被重視。美國普查局在2010年的人口普查質(zhì)量評估工作中,在凈誤差估計之外,增加了普查多報與漏報估計這兩個目標(biāo)[4]。聯(lián)合國統(tǒng)計司也對各國提出了這樣的建議[5]。

      但是,國內(nèi)一些學(xué)者認(rèn)為研究普查多報或重報無太大意義,人口普查的多報與重報問題并不突出,相反人口普查中的漏報問題更值得研究[6]。然而事實并非如此。近10年來,擁有兩套甚至多套住房的中國人越來越多,而在不同地點有住房是重報的主要原因。另外中國養(yǎng)寵物的也人越來越多,其中有些人視寵物為親人,在普查表中登記寵物,造成普查多報。美國2010年普查多報10 042千人,其中重報8 522千人,其他多報1 520千人;普查漏報15 999千人,其中估算的普查人口數(shù)為5 993千人,其他漏報人口數(shù)為10 006千人[7]。這表明,普查多報和漏報都很嚴(yán)重,在剔除估算的普查人口數(shù)外,普查多報人口數(shù)比漏報人口數(shù)還要多。所謂估算的普查登記人口數(shù)是指對拒絕接受普查的家庭根據(jù)其鄰居提供的信息所估計的這類家庭的人口數(shù)。嚴(yán)格意義上來講,估算的普查人口數(shù)并不能當(dāng)作普查漏報,因為它已經(jīng)包括在最終公布的普查登記人口數(shù)中。普查漏報應(yīng)該是指既未被普查員登記又未被估算的那部分人口。除美國外,中國和其他國家的普查登記人口數(shù)中沒有包括估算的普查登記人數(shù)[8]。

      在普查多報估計中,有些國家(如烏干達(dá)、南非)只構(gòu)造覆蓋全部多報的普查多報估計量(聯(lián)合國統(tǒng)計司人口普查質(zhì)量評估指南并未提及普查重報)[9-10],也有些國家(如中國和加拿大)只構(gòu)造重報估計量[11-12]。中國在重報估計做法上尚有若干缺陷,例如,把樣本當(dāng)作總體、把樣本重報率當(dāng)作總體重報率、在統(tǒng)計重報人數(shù)時計數(shù)對象不明確,等等。

      為了全面反映普查多報,除了估計重報外,還要估計其他普查多報,即使其他多報人口數(shù)為零,也要將其納入多報估計范圍,在研究報告中明示其他多報人口為零。

      聯(lián)合國統(tǒng)計司及所有國家的政府統(tǒng)計部門把普查多報認(rèn)定為普查員登記了普查目標(biāo)總體之外的人。實際上,這樣表述不夠嚴(yán)密。應(yīng)該說,普查多報包括對普查目標(biāo)總體之外的人所做的登記,以及對普查目標(biāo)總體的人所做的重復(fù)登記這兩個部分。也就是說,不應(yīng)把對普查目標(biāo)總體的人所做的重復(fù)登記叫做目標(biāo)總體之外的登記。

      關(guān)于普查多報估計,還涉及到一個位置登記錯誤的問題[13]。許多國家在普查多報估計中,要求一個人登記在所屬的普查小區(qū)內(nèi),否則認(rèn)定位置登記不正確,作為普查多報處理。這種處理辦法會導(dǎo)致普查多報數(shù)目虛增。是否把位置登記錯誤視作普查多報,要看登記位置是否在研究范圍內(nèi)。如果研究范圍是全國,那么登記在全國任何一個地方都不應(yīng)記為多報。如果研究范圍是重慶市,那么應(yīng)該在重慶市登記的某人登記在該市任何區(qū)域都不應(yīng)記為多報,但如果該人登記在四川省,則應(yīng)記為重慶市的漏報;如果研究范圍是重慶市和四川省,這個人不應(yīng)記為多報。在2010年普查多報估計中,美國規(guī)定,一個人只要登記在質(zhì)量評估調(diào)查研究范圍內(nèi),即認(rèn)定為位置登記正確,在沒有其他登記錯誤的情況下,認(rèn)定其為普查正確登記。這一規(guī)定避免了登記位置問題導(dǎo)致的多報估計錯誤。

      本文的創(chuàng)新主要有以下三個方面:第一,給出了普查多報及其中的普查重報的明確定義。解決了目前多報、重報統(tǒng)計中由于定義不明、界限不清導(dǎo)致的錯誤。第二,明確規(guī)定了普查重報的兩種估計對象。解決了目前重報統(tǒng)計結(jié)果含義不明確的問題。第三,采用泰勒擴(kuò)張抽樣方差估計量,近似計算多報或重報估計量的抽樣方差,從而規(guī)范了普查多報及重報估計量的抽樣方差計算。

      二、普查多報重報統(tǒng)計一般問題

      (一)普查多報與普查重報的內(nèi)涵與外延

      普查多報包含兩個部分:第一部分,屬于普查目標(biāo)人口總體的人員進(jìn)行了兩次或更多次普查登記,將他們進(jìn)行普查登記的次數(shù)減1所得結(jié)果記作重復(fù)性普查多報(簡稱普查重報);第二部分,不屬于普查目標(biāo)人口總體的個體(例如,普查標(biāo)準(zhǔn)時點之前死亡的人口、普查標(biāo)準(zhǔn)時點之后出生的人口、虛構(gòu)的人口,等等)進(jìn)行了普查登記,將他們進(jìn)行普查登記的次數(shù)記做其他普查多報。這里特別要注意,如果一個不屬于普查目標(biāo)總體的個體進(jìn)行了不止一次普查登記,須將其進(jìn)行普查登記的次數(shù)全部計為其他普查多報,而不應(yīng)計為普查重報。

      (二)普查重報的估計對象

      對普查重報估計問題,有兩種估計對象。一是估計重復(fù)性普查重報人數(shù)。二是估計發(fā)生普查重報人數(shù)。對前者,將屬于普查目標(biāo)總體的某個人在普查中登記的總次數(shù)減1,作為其重復(fù)性普查重報人數(shù)。對后者,只要某人在普查中登記一次以上,就將其作為發(fā)生普查重報人口,重報次數(shù)計為1,而不考慮其實際登記的次數(shù)。目前加拿大在普查重報估計中采用第一種估計對象,其目的是為了修正普查登記總?cè)藬?shù)。

      三、普查多報及重報的抽樣估計理論

      人口普查多報、重報估計理論包括下列四項內(nèi)容:抽樣設(shè)計、樣本數(shù)據(jù)采集、普查多報估計方法、估計量構(gòu)造及估計量方差的估計[14-16]。

      (一)抽取樣本

      在人口普查質(zhì)量評估抽樣調(diào)查中,各國政府統(tǒng)計部門采取的抽樣方法通常是分層整群抽樣、分層多階段抽樣、分層多重抽樣。用于分層的標(biāo)志通常是城鄉(xiāng)或抽樣單位的規(guī)模。以中國為代表的發(fā)展中國家主要采用分層整群抽樣,為更好地服務(wù)于中國政府的需要,本文采用分層整群抽樣方法抽取以普查小區(qū)為抽樣單位的樣本。

      (二)獲取樣本小區(qū)普查多報或重報人口數(shù)據(jù)

      在抽取樣本普查小區(qū)后,收集每個樣本小區(qū)的普查人口登記名單,進(jìn)行入戶現(xiàn)場調(diào)查編制質(zhì)量評估調(diào)查人口登記名單。識別樣本小區(qū)普查多報或重報人口的方法有4種。第一,檢查樣本小區(qū)的普查人口登記名單,看是否存在普查日后出生的人、普查日前死亡的人、狗和其他寵物以及重復(fù)登記的人。第二,在進(jìn)行入戶現(xiàn)場調(diào)查編制質(zhì)量評估調(diào)查人口登記名單時查明是否存在同一人同時在兩個地點進(jìn)行普查登記的情形。第三,對本小區(qū)普查人口登記名單中的每一個人,在全國普查人口登記名單進(jìn)行搜索,看能否找到與其相同的人,即重報人口。第四,比對樣本小區(qū)的普查人口登記名單和質(zhì)量評估調(diào)查人口登記名單,包括在本小區(qū)內(nèi)部及外部比對這兩份名單。比對的內(nèi)容是姓名、性別、年齡、文化程度、婚姻狀況等。如果某人在這兩份名單的姓名及這些特征相同或絕大部分相同,就判斷為匹配,即普查正確登記人口。如果比對結(jié)果是普查人口登記名單的某人為未匹配人口,即未在質(zhì)量評估調(diào)查人口登記名單中找到與其相同的人,就組織個人后續(xù)調(diào)查收集新信息再次比對[17]。如果利用新信息再次比對的結(jié)果仍然是普查人口登記名單的某人為未匹配人口,并且現(xiàn)場核實該人實際上并不存在,就判斷該人為普查多報。如果在個人后續(xù)調(diào)查期間,確認(rèn)普查人口登記名單的某人是虛構(gòu)的人,即普查日后出生的人、普查日前死亡的人,就判斷某人為多報人口。如果普查人口登記名單中的某人在比對后為未匹配,并且個人后續(xù)調(diào)查未收集到任何用于再次比對的信息,就判斷該人為普查多報人口。為便于對比對結(jié)果做出判斷,在人口普查質(zhì)量評估中,通常假設(shè)質(zhì)量評估調(diào)查人口登記名單不存在非抽樣誤差。

      (三)普查多報估計方法

      采用何種方法構(gòu)造普查多報估計量要考慮兩個因素。第一個因素是樣本普查小區(qū)的普查多報人口的數(shù)目。第二個因素是普查登記分類的詳細(xì)程度。發(fā)展中國家和絕大多數(shù)發(fā)達(dá)國家通常將普查登記分為普查正確登記和普查多報登記。美國普查局將普查登記分為普查正確登記、普查多報登記、位置錯誤的普查登記、不足比對信息的普查登記及未數(shù)據(jù)定義人口(最多只登記姓名及一個普查項目)的普查登記?;谏鲜鲆蛩兀x擇構(gòu)造普查多報估計量的方法。如果樣本普查小區(qū)多報人口較多,就直接依據(jù)樣本小區(qū)多報人口及其抽樣權(quán)數(shù)構(gòu)造總體普查多報估計量,即樣本多報人口的加權(quán)和。中國在2010年人口普查多報估計中采用這種方法估計常住人口多報率、現(xiàn)有人口多報率和戶籍人口多報率。美國和其他一些國家也是采用這種方法估計普查多報。如果樣本多報人口很少甚至為零,此時雖然可以算出平均每個樣本小區(qū)的普查多報人口數(shù),但這個數(shù)往往是一個很小的數(shù),用其推斷總體普查多報人口數(shù)可能嚴(yán)重失真。在這種情況下,如果普查登記分類相對簡單,就從普查登記人口數(shù)估計量中剔除普查正確登記人口數(shù)估計量,得到普查多報估計量。本文采用這種方法構(gòu)造普查多報估計量。如果普查登記分類詳細(xì),就從普查登記人口數(shù)估計量中減去普查目標(biāo)總體人口數(shù)估計量,得到普查多報估計量。其中,普查目標(biāo)總體人口數(shù)估計量為“總體普查信息登記完整人口數(shù)”乘以“普查目標(biāo)總體人口數(shù)線性估計量或普查信息登記完整人口數(shù)線性估計量”。普查信息登記完整是指登記了全部普查項目。

      (四)總體或區(qū)域的普查多報率和重報率估計量及方差估計量

      1.總體普查多報率估計量。構(gòu)造總體(全國、省等)普查多報比率估計量的目的是使不同國家或同一國家不同時期的普查多報估計結(jié)果具有可比性。中國和其他國家的政府統(tǒng)計部門出于保密考慮只對外發(fā)布普查多報率(對內(nèi)提供普查多報人數(shù)及多報率),其公式為:

      (1)

      討論式(1)E名單j人的普查正確登記概率Pce,j在不同情形下的計算方法。首先,如果有信息證明一個人在普查中正確登記,那么其正確登記概率為1;其次,如果有證據(jù)顯示一個人是普查錯誤登記,那么其正確登記概率為零;再次,如果沒有收集到證明某人是普查正確登記還是普查錯誤登記的信息,那么其正確登記概率需要估計。如果E名單中的每一個人都是正確登記,那么估計的普查正確登記人數(shù)等于估計的普查登記人數(shù)。

      (2)

      (3)

      (4)

      (5)

      2.總體普查重報率估計量。它為重報人口數(shù)與普查登記人口數(shù)之比:

      (6)

      (7)

      (8)

      4.總體和區(qū)域的普查多報率及重報率的抽樣方差估計量。在構(gòu)造普查多報率或重報率估計量后,還要建立其抽樣方差估計量。式(1)、式(6)、式(7)和式(8)屬于復(fù)雜估計量,抽樣方差通常使用分層刀切估計量或泰勒擴(kuò)張估計量計算[18]。分層刀切估計量優(yōu)勢是容易理解,在西方國家政府統(tǒng)計部門組織的人口普查質(zhì)量評估中應(yīng)用廣泛。中國國家統(tǒng)計局迄今尚未使用分層刀切估計量構(gòu)造重報率的抽樣方差估計量。然而,分層刀切估計量也有明顯的缺陷,即樣本普查小區(qū)復(fù)制權(quán)數(shù)及總體參數(shù)估計量的復(fù)制估計量的計算量大。復(fù)制次數(shù)等于第一重樣本小區(qū)數(shù)目。每復(fù)制1次,就要計算一組第一重樣本普查小區(qū)的復(fù)制權(quán)數(shù),以及據(jù)此計算一組總體參數(shù)復(fù)制估計量。在大規(guī)模人口普查質(zhì)量評估抽樣調(diào)查中,第一重樣本規(guī)模通常很大。泰勒擴(kuò)張方法能夠避免分層刀切估計量的缺陷,計算量減少許多,尤其是對比率估計量的計算量減少更加明顯。采用泰勒擴(kuò)張估計量計算式(1)、式(6)、式(7)和式(8)的抽樣方差為:

      (9)

      (10)

      (11)

      (12)

      (13)

      (14)

      (15)

      (16)

      (17)

      (18)

      (19)

      (20)

      /nh。

      四、實證分析

      1.樣本資料。實證調(diào)查范圍為重慶市南岸區(qū),實證調(diào)查時間為2000年11月1日。數(shù)據(jù)來源于美國明尼蘇達(dá)大學(xué)人口中心于1995年建立的IPUMS普查微觀數(shù)據(jù)庫[19]。從1995年到2017年年底,IPUMS數(shù)據(jù)庫收集了中國、美國、白俄羅斯、印度、英國等85個國家的政府統(tǒng)計部門的約6.77億人在301次人口普查中的微觀個人記錄(迄今117個國家與IPUMS簽訂了合作備忘錄)。該數(shù)據(jù)庫用于科學(xué)研究與教育研究,用戶在簽訂數(shù)據(jù)使用協(xié)議后,可以免費使用數(shù)據(jù)。中國國家統(tǒng)計局在1982年、1990年和2000年向IPUMS提供1%樣本普查微觀數(shù)據(jù)。我們從該數(shù)據(jù)庫獲得了2000年重慶市南岸區(qū)1%街道或鎮(zhèn)(層)小區(qū)的普查個人資料。樣本采取分層整群抽樣法抽取,抽樣單位為普查小區(qū),樣本小區(qū)單位答復(fù)率為100%。樣本資料如表1和表2。

      表1 2000年重慶市南岸區(qū)街道或鎮(zhèn)的普查小區(qū)及其樣本

      表2 樣本小區(qū)普查登記結(jié)果

      2.總體和區(qū)域的普查多報率及重報率計算。根據(jù)式(1)、式(6)、式(7)和式(8)及表2樣本數(shù)據(jù),得到總體及各個區(qū)域(在這里指每一層)普查多報的估計結(jié)果,具體見表3。

      從表3可以看出:第一,估計的總體普查多報人數(shù)為9 795人,即估計的普查登記人口數(shù)589 670人與估計的普查正確登記579 875之差,估計的總體普查多報率為1.66%,即估計的普查多報人數(shù)與估計的普查登記人數(shù)之比,估計的總體重報5 990人,即在普查登記中有5 990人被重復(fù)登記過,估計的總體重報率1.02%,即估計的重報人數(shù)5 990人與估計的普查登記人口數(shù)589 670人之比;第二,從每一層(區(qū)域)來看,海棠溪街道的普查多報率最高(2.17%),說明該街道普查多報問題最為嚴(yán)重,而銅元局街道的重報率最高(1.48%),表明該街道重報最為嚴(yán)重。第三,各層的普查多報率及重報率差異較大,表明各層的普查登記質(zhì)量不同。

      表3 總體及各層普查多報及重報估計值

      3.總體普查多報率及重報率的抽樣方差計算。在得到了普查多報率及重報率估計值后,利用式(17)~式(20),以及表1、表2和表3數(shù)據(jù),計算式(1)、式(6)、式(7)和式(8)的抽樣方差估計值。計算結(jié)果為:總體普查多報率1.66%(即每100人中有1.66個人不應(yīng)該在普查中登記)的抽樣標(biāo)準(zhǔn)誤差為0.000 813 14(0.000 000 661 20的平方根),而總體重報率1.02%(即每100人中有1.02人在普查中重復(fù)登記過)的抽樣標(biāo)準(zhǔn)誤差為0.039 2(0.001 536 641的平方根)。需要了解抽樣誤差計算內(nèi)容的讀者請和作者聯(lián)系。

      4.區(qū)域的普查多報率及重報率及抽樣方差計算。使用式(7)和式(8),以及式(19)和式(20)計算區(qū)域的普查多報率及重報率,以及它們的抽樣標(biāo)準(zhǔn)誤差。計算結(jié)果為:銅元局街道的普查多報率及普查重復(fù)率的估計值分別為1.68%和1.48%,其抽樣標(biāo)準(zhǔn)誤差分別為0.001 184 900和0.003 282 970,即估計的多報率及重報率分別與其實際平均相差0.118%和0.328%。在概率把握程度為95.45%情況下,銅元局街道普查多報率及重報率所在置信區(qū)間分別為1.269%~1.916% 和0.824%~2.136%。無論是銅元局街道,還是南岸區(qū)街道總體,普查多報率的估計精度均高于普查重報率。這表明,在不考慮非抽樣誤差的情況下,樣本對普查多報率指標(biāo)有更好的代表性。所有國家在人口普查質(zhì)量評估中所估計的不同指標(biāo)的估計精度均存在差異。

      五、結(jié)論與建議

      應(yīng)該充分重視普查多報及重報調(diào)查。認(rèn)為普查多報或重報研究意義不大這一觀點不僅與現(xiàn)實相違背,而且會阻礙普查多報估計理論發(fā)展,對人口普查質(zhì)量評估工作造成困擾。

      估計普查多報率及重報率需要解決三個問題。一是普查登記位置與普查多報人口認(rèn)定的關(guān)系;二是重報者正確登記概率的估計;三是重報率的估計。對第一個問題,為了避免普查多報人口虛增,只要某人在普查中登記在質(zhì)量評估調(diào)查研究范圍內(nèi),并且未發(fā)現(xiàn)其他登記錯誤,就當(dāng)作普查正確登記。對第二個問題,如果沒有收集到重報人口的哪個記錄是基本記錄(普查正確登記),哪個記錄是重復(fù)記錄,就采取簡單算術(shù)平均法計算正確登記概率。如果收集了相關(guān)信息,就根據(jù)信息決定重報人口的正確登記概率為1或零。對第三個問題,用估計的在普查中重復(fù)登記過的人數(shù)除以普查登記總?cè)丝跀?shù),得到重報率估計值。建議中國在2020年普查多報估計中將多報認(rèn)定區(qū)域由目前的普查小區(qū)擴(kuò)大到全國各省份,對多報中的重報人口引入正確登記概率變量。

      普查登記中不只會發(fā)生重報,還會發(fā)生其他普查多報。如果普查多報估計量只是包括重報,必然低估普查多報,掩蓋本次普查登記中的其他問題。為了全方位、多角度研究普查多報,應(yīng)當(dāng)分別估計普查多報率、重報率、其他多報率。中國自1982年起只估計重報率,建議中國政府在2020年構(gòu)造普查多報率估計量、重報率估計量和其他多報率估計量。

      普查多報估計的對象既可以是全國的總?cè)丝诩安煌悇e人口,也可以是省、自治區(qū)、直轄市的總?cè)丝诩邦悇e人口。中國在每次人口普查質(zhì)量評估工作中只是估計全國總?cè)丝诘闹貓舐?。建議以后將普查多報估計對象擴(kuò)大到全國各省份的城鄉(xiāng)人口、不同文化程度人口、不同民族人口。為提高不同區(qū)域、不同類別人口普查多報率的估計精度,要確保各個區(qū)域、各類人口的樣本規(guī)模。

      猜你喜歡
      估計量人口數(shù)人口普查
      確定代表名額按戶籍人口數(shù)還是常住人口數(shù)
      人大研究(2022年3期)2022-04-13 00:47:04
      無人機助力人口普查
      人口普查學(xué)問多
      基于BP神經(jīng)網(wǎng)絡(luò)的吉林省GDP預(yù)測研究
      市場周刊(2018年1期)2018-08-15 01:42:44
      淺談估計量的優(yōu)良性標(biāo)準(zhǔn)
      人口普查由誰首創(chuàng)
      樂活老年(2016年10期)2016-02-28 09:30:39
      基于配網(wǎng)先驗信息的諧波狀態(tài)估計量測點最優(yōu)配置
      電測與儀表(2015年6期)2015-04-09 12:00:50
      負(fù)極值指標(biāo)估計量的漸近性質(zhì)
      歷次人口普查中低年齡組人口漏報研究
      使用變異系數(shù)和Kurtosis系數(shù)的雙輔助變量的比估計
      沽源县| 怀来县| 新绛县| 霍州市| 外汇| 延长县| 永兴县| 德兴市| 乌恰县| 新邵县| 巴南区| 德兴市| 会宁县| 桃江县| 呼和浩特市| 临颍县| 黄骅市| 巫溪县| 友谊县| 封开县| 新晃| 诏安县| 文安县| 湘潭县| 兴化市| 封丘县| 广丰县| 舞钢市| 莱州市| 邵武市| 靖安县| 高安市| 岑巩县| 郑州市| 嘉善县| 内乡县| 黄平县| 长寿区| 双柏县| 武安市| 页游|