田少娟??
作者簡(jiǎn)介:田少娟(1993—),女,山西長(zhǎng)治人,山西財(cái)經(jīng)大學(xué)2016級(jí)(統(tǒng)計(jì)學(xué)院)統(tǒng)計(jì)學(xué)
摘 要: 捕獲再捕獲方法早期由野生動(dòng)物學(xué)家提出,應(yīng)用于生態(tài)學(xué)領(lǐng)域,后經(jīng)不斷發(fā)展,目前已被廣泛用于除生物科學(xué)外,社會(huì)科學(xué)、醫(yī)學(xué)和公共衛(wèi)生等調(diào)查研究中以及更廣泛的領(lǐng)域中。本文從理論研究和應(yīng)用領(lǐng)域研究?jī)蓚€(gè)方面評(píng)述捕獲再捕獲抽樣方法的研究進(jìn)展,并提出下一步研究方向。
關(guān)鍵詞: 非概率抽樣;捕獲再捕獲;估計(jì)量
【中圖分類號(hào)】 O212.2 【文獻(xiàn)標(biāo)識(shí)碼】 A 【文章編號(hào)】 2236-1879(2018)11-0170-01
捕獲再捕獲的方法早期由野生動(dòng)物學(xué)家提出,用于估計(jì)限定區(qū)域內(nèi)野生動(dòng)物種群的大小,后經(jīng)不斷發(fā)展目前已被廣泛用于除生物科學(xué)外,社會(huì)科學(xué)、醫(yī)學(xué)和公共衛(wèi)生等調(diào)查研究中,甚至有學(xué)者將捕獲再捕獲方法用于改進(jìn)互聯(lián)網(wǎng)搜索第三方結(jié)果精度以及更廣泛的領(lǐng)域。捕獲再捕獲抽樣是一種常用的非概率抽樣方法,在現(xiàn)有的國(guó)內(nèi)外文獻(xiàn)中,對(duì)捕獲再捕獲方法的研究主要包括理論研究與實(shí)際應(yīng)用。
一、理論研究
理論研究集中于如何提高估計(jì)精度、減小誤差。最初由Lincoln(1930)發(fā)展了Petersen的估計(jì)量(簡(jiǎn)稱P統(tǒng)計(jì)量),提出了LP估計(jì)量。隨后Chapman(1951)對(duì)LP估計(jì)量做了改進(jìn),提出了新估計(jì)量即C統(tǒng)計(jì)量。目前,兩種估計(jì)量廣泛應(yīng)用在實(shí)際領(lǐng)域中,但研究者發(fā)現(xiàn)了這兩種估計(jì)量存在的一些缺陷,在之后的研究中不斷做改進(jìn)。Brittain(2009)主要探討了不同估計(jì)量的性質(zhì),利用捕獲再捕獲方法估計(jì)傳染病的傳播情況,構(gòu)建不同的估計(jì)量及它的修正形式,通過(guò)比較估計(jì)值與真實(shí)值討論不同估計(jì)量的性質(zhì),并提出進(jìn)一步優(yōu)化建議。Jones(2015)等運(yùn)用捕獲再捕獲方法估計(jì)英國(guó)布里斯托爾吸毒(或注射毒品)的發(fā)生率,并說(shuō)明單純地使用捕獲再捕獲方法會(huì)產(chǎn)生錯(cuò)誤的結(jié)果,最后提出了解決問(wèn)題的辦法:要仔細(xì)考慮數(shù)據(jù)來(lái)源是否適合捕獲再捕獲、將列表減少到更少的異構(gòu)子樣本、使用協(xié)變量和納入外部數(shù)據(jù)。國(guó)內(nèi)理論研究的主要貢獻(xiàn)有:文平(2001)介紹了捕獲-再捕獲抽樣的思想方法,提出了一個(gè)復(fù)合估計(jì)量,改進(jìn)P估計(jì)量假定樣本中每個(gè)入樣單元入樣概率相同導(dǎo)致的估計(jì)量方差較大的缺陷,在之后的研究中還提出了一種多元組合估計(jì)量。楊貴軍等(2011)對(duì)捕獲再捕獲抽樣常用的LP估計(jì)量和C估計(jì)量的統(tǒng)計(jì)性質(zhì)進(jìn)行模擬比較,并提出一個(gè)新的估計(jì)量。
二、應(yīng)用領(lǐng)域研究
實(shí)際應(yīng)用領(lǐng)域主要在流行病學(xué)發(fā)病率、吸毒人群等隱形人群規(guī)模的估計(jì)中,隨著方法的不斷成熟,也有學(xué)者應(yīng)用在一些新的領(lǐng)域,如估計(jì)商品總需求量。
在流行病學(xué)研究中的應(yīng)用始于Wittes&Sidel,用捕獲再捕獲方法估計(jì)出生缺陷率,后來(lái)越來(lái)越多被用于傳染病、濫用藥物、腫瘤等流行病研究中,但大多運(yùn)用兩樣本的捕獲再捕獲方法,如程慧健等人運(yùn)用江西省1996-2000年傳染病疫情報(bào)告和醫(yī)院漏報(bào)調(diào)查作為兩次捕獲樣本,利用捕獲再捕獲兩樣本模型估計(jì)地區(qū)的傳染病發(fā)病率。楊茜茹(2017)嘗試使用多樣本捕獲再捕獲方法,利用廣泛使用的對(duì)數(shù)線性模型,通過(guò)擬合各樣本間的相依性,可以不考慮各樣本相互獨(dú)立的假設(shè),從最簡(jiǎn)單的模型開(kāi)始逐步擬合,根據(jù)離差統(tǒng)計(jì)量選擇最優(yōu)模型估計(jì)云南每個(gè)疫情地區(qū)的肺結(jié)核患者數(shù),計(jì)算每個(gè)疫情地區(qū)肺結(jié)核患者的漏報(bào)率與漏失率。在其他領(lǐng)域的研究有:估計(jì)吸毒群體規(guī)模。梁伯衡,欒榮生(2004)以樂(lè)山市進(jìn)入戒毒所戒毒的吸毒人員登記資料為分析數(shù)據(jù),建立捕獲再捕獲使用的分析數(shù)據(jù)模型,估計(jì)當(dāng)?shù)匚救巳夯鶖?shù)。估計(jì)隱藏人口規(guī)模。Coumans(2017)等人研究使用捕獲再捕獲方法估計(jì)荷蘭無(wú)家可歸的人口規(guī)模,使用了2009年-2013年的荷蘭人口登記表、低收入群體收入保障表、國(guó)家煙酒個(gè)體信息登記表三個(gè)數(shù)據(jù)來(lái)源,采用三樣本捕獲再捕獲,建立對(duì)數(shù)線性模型估計(jì)無(wú)家可歸人口規(guī)模。邱泓,高霖琳在對(duì)難以接觸的女性性工作者規(guī)模估計(jì)的研究中對(duì)流動(dòng)群體采用了捕獲再捕獲方法,在昆明市特定區(qū)域18個(gè)調(diào)查點(diǎn)開(kāi)展調(diào)查,利用C統(tǒng)計(jì)量的無(wú)偏移計(jì)算公式估算目標(biāo)人群總體規(guī)模。估計(jì)漏報(bào)率水平。張高輝,郭曉雷(2015)應(yīng)用捕獲再捕獲方法評(píng)價(jià)山東省居民2012-2013年死因登記漏報(bào)率水平,采用分層整群抽樣法,將全省所有縣(市、區(qū))按照2012年死因登記系統(tǒng)報(bào)告死亡率分成5層,以當(dāng)?shù)毓?、民政和村(居委?huì))搜集到的人口死亡情況和死因登記系統(tǒng)已報(bào)告的死亡資料作為捕獲再捕獲模型,利用C提出的計(jì)算公式估算漏報(bào)率水平。
還有一些較新的研究領(lǐng)域:榮國(guó)平(2017)將捕獲再捕獲應(yīng)用于軟件測(cè)試中,用于預(yù)測(cè)軟件評(píng)審后缺陷。智冬曉,許曉娟(2018)以互聯(lián)網(wǎng)電商所銷售的短生命周期商品為特定的實(shí)證分析對(duì)象,使用時(shí)變-行為反應(yīng)模型,結(jié)合ARIMA模型分析捕獲概率,對(duì)商品在整個(gè)生命周期內(nèi)潛在的市場(chǎng)總需求量進(jìn)行估計(jì)。
三、研究評(píng)述
通過(guò)對(duì)國(guó)內(nèi)外捕獲再捕獲抽樣方法的研究現(xiàn)狀評(píng)述得出,捕獲再捕獲抽樣方法在理論研究與實(shí)際應(yīng)用領(lǐng)域都有廣泛應(yīng)用,在下一步的研究中應(yīng)考慮如何優(yōu)化估計(jì)量以及如何設(shè)計(jì)抽樣方案將此方法應(yīng)用于互聯(lián)網(wǎng)大數(shù)據(jù)中。
參考文獻(xiàn)
[1] Brittain. Estimators in capture–recapture studieswith two source[J] Asta Advances in Statistical Analysis, 2009, 93(1)
[2] 文平.捕獲-再捕獲抽樣中的多元組合估計(jì)量[J].生物數(shù)學(xué)學(xué)報(bào),2011,26(04)
[3] 楊貴軍,劉艷玲,王清.捕獲再捕獲抽樣估計(jì)量的模擬研究[J].統(tǒng)計(jì)與信息論壇,2011,26(03)
[4] 楊茜茹.云南省3縣(市)肺結(jié)核病例存量研究[D].昆明醫(yī)科大學(xué),2017.
[5] 梁伯衡,欒榮生.捕獲再捕獲法估計(jì)吸毒人群基數(shù)的數(shù)據(jù)模型研究[J].中國(guó)預(yù)防醫(yī)學(xué)雜志,2004(04).
[6] 張高輝,郭曉雷,鹿子龍,孫建東,徐愛(ài)強(qiáng).應(yīng)用捕獲再捕獲方法評(píng)估山東省死因登記漏報(bào)率水平[J].中國(guó)慢性病預(yù)防與控制,2015,23(05)
[7] 智冬曉,許曉娟.短生命周期商品市場(chǎng)總需求量估計(jì)——基于ARIMA-捕獲再捕獲模型的研究[J].統(tǒng)計(jì)與管理,2018(01)