江蘇省疾病預(yù)防控制中心,南京(210009)
劉文東 胡建利 艾 靜 吳 瑩 戴啟剛 梁 祁 李 媛 湯奮揚△ 朱葉飛△
近年來,早期預(yù)警已成為傳染病防制領(lǐng)域的研究熱點,許多國家廣泛開展了相應(yīng)的理論及應(yīng)用研究,引進了一系列預(yù)警模型,進而建立了早期預(yù)警應(yīng)用系統(tǒng)[1-2]。2003年SARS發(fā)生后,我國也積極開展傳染病預(yù)警應(yīng)用研究[3],2004年實現(xiàn)傳染病網(wǎng)絡(luò)直報之后相繼開發(fā)了國家傳染病自動預(yù)警系統(tǒng)(China infectious diseases automated alert and response system,CIDARS),并在全國范圍內(nèi)推廣運行[4]。但幾年的實踐表明,該系統(tǒng)應(yīng)用的預(yù)警方法過于簡單和單一,預(yù)警分析的靈敏度、特異度及時效性均不夠理想,有必要引入新的方法技術(shù),改善預(yù)警效果,從而提高該系統(tǒng)在傳染病應(yīng)急防制中的應(yīng)用價值[5-6]。
在我國,流行性腮腺炎(以下簡稱腮腺炎)是引發(fā)傳染病突發(fā)公共衛(wèi)生事件最多的病種之一,因此,研究腮腺炎的早期預(yù)警具有典型意義。本文以江蘇省腮腺炎疫情資料為基礎(chǔ),探討累積和控制圖模型(cumulative sum control chart,CUSUM)在腮腺炎早期預(yù)警中的應(yīng)用價值,同時也為其他傳染病的預(yù)警研究提供參考和借鑒。
1.資料來源
2004-2012年江蘇省腮腺炎疫情數(shù)據(jù)來自“中國疾病預(yù)防控制信息系統(tǒng)”子系統(tǒng)——“疾病監(jiān)測信息報告管理系統(tǒng)”(即傳染病網(wǎng)絡(luò)直報系統(tǒng)),2012腮腺炎突發(fā)公共衛(wèi)生事件數(shù)據(jù)來自子系統(tǒng)“突發(fā)公共衛(wèi)生事件報告管理系統(tǒng)”;從另一個子系統(tǒng)“國家傳染病自動預(yù)警系統(tǒng)(CIDARS)”中下載2012年 全省腮腺炎自動預(yù)警數(shù)據(jù)。
2.CUSUM模型及國家傳染病自動預(yù)警系統(tǒng)(CIDARS)簡介
(1) CUSUM模型
CUSUM模型是英國劍橋大學(xué)Page于1954年提出的一種控制圖模型,其原理是通過不斷累積觀察值與基線水平的差值,放大觀察數(shù)據(jù)出現(xiàn)的波動,從而可以更加迅速、靈敏地探測到微小的異常情況。預(yù)警統(tǒng)計量S計算公式如下:
S0=0
Si=max[0,Si-1+zi-k]
其中,k為參考值,是CUMSUM模型的兩個待定參數(shù)之一;Si表示當(dāng)前期的預(yù)警統(tǒng)計量,Si-1為上一期的預(yù)警統(tǒng)計量,zi為當(dāng)前期觀察值相對于歷史基線的偏移量,其計算公式如下:
預(yù)警分析時,首先判斷Si>h是否成立(h為預(yù)警閾值,是CUSUM模型中另一個待定參數(shù)),即當(dāng)前預(yù)警統(tǒng)計量是否超過預(yù)警閾值h,如果超過則發(fā)出預(yù)警信號。
(2) CIDARS
CIDARS是中國疾控中心在傳染病網(wǎng)絡(luò)直報系統(tǒng)基礎(chǔ)上開發(fā)的傳染病早期預(yù)警應(yīng)用系統(tǒng),并于2008年4月開始在全國范圍內(nèi)正式投入運行。該系統(tǒng)對于鼠疫、霍亂、傳染性非典型肺炎、脊髓灰質(zhì)炎、人感染高致病性禽流感、肺炭疽、白喉、絲蟲病、不明原因肺炎等9個低發(fā)或罕見病種采用單病例預(yù)警,即發(fā)現(xiàn)一例即產(chǎn)生預(yù)警;對于包括流行性腮腺炎在內(nèi)的19個常見多發(fā)的病種采用移動百分位數(shù)法進行預(yù)警,其中腮腺炎預(yù)警閾值為P80(第80百分位數(shù))。
3.預(yù)警分析與效果評價
以江蘇省2012年報告的腮腺炎突發(fā)公共衛(wèi)生事件作為目標事件。CUSUM模型統(tǒng)計量的計算采用短基線法,為了消除周末效應(yīng)的影響,根據(jù)當(dāng)前日是工作日或周末建立不同的歷史基線:如果是工作日則向后回溯14個工作日作為歷史基線;如果是周末,則向后回溯14個休息日(周六或周日)作為歷史基線。
分析CUSUM模型及CIDARS的預(yù)警信號,如果一條預(yù)警信號落在某一起突發(fā)共衛(wèi)生事件起止時間范圍內(nèi),則視為對該事件的有效預(yù)警,反之則為錯誤預(yù)警;對于同一個事件的時間區(qū)間內(nèi)產(chǎn)生的多次預(yù)警計為1次有效預(yù)警。用靈敏度、特異度、及時性等3個指標對CUSUM模型以及CIDARS的預(yù)警效果進行評價和比較:
靈敏度=有效預(yù)警事件數(shù)/報告的事件總數(shù)×100%
特異度=無預(yù)警信號產(chǎn)生的天數(shù)/無突發(fā)公共衛(wèi)生事件發(fā)生的天數(shù)×100%
及時性(天)=某事件有效預(yù)警日期-該事件的起始日期
本研究中原始數(shù)據(jù)的整理在Excel 2007中完成,CUSUM模型預(yù)警試驗在Matlab2011b中完成,CUSUM模型與自動預(yù)警系統(tǒng)之間預(yù)警效果的假設(shè)檢驗在SAS8.1中完成。
1.江蘇省腮腺炎流行概況
我省自2004年開始腮腺炎疫情網(wǎng)絡(luò)直報,近10年間全省腮腺炎流行起伏波動較大,有一定的周期性流行的傾向,但由于數(shù)據(jù)積累年份太少無法進行檢驗;2010年報告病例數(shù)最低,全省僅有553例;2012年則是高發(fā)年份,全省報告發(fā)病19104例,較2011年增加115.50%。見圖1。
圖1 2004-2012年江蘇省流行性腮腺炎流行趨勢
我省腮腺炎流行有明顯的季節(jié)性,全年呈雙峰型分布,發(fā)病最高峰出現(xiàn)在5-6月,次高峰出現(xiàn)在11-12月。各地區(qū)發(fā)病數(shù)差異較大,2012年報告發(fā)病數(shù)前3位的地區(qū)依次是蘇州市(3208例)、徐州市(2751例)、連云港市(2207例),計占全省發(fā)病總數(shù)的42.75%;發(fā)病數(shù)后3位依次是鹽城市(400例)、泰州市(471例)、揚州市(705例)。
2012年全省報告腮腺炎突發(fā)公共衛(wèi)生事件14起,其中13起發(fā)生在3-6月,1起在12月;14起事件均為某一個區(qū)縣范圍內(nèi)的局部暴發(fā)疫情,發(fā)生場所均在學(xué)校,發(fā)病數(shù)最多262例、最少12例。所有事件中,從首例病例發(fā)生日期到該事件確認報告日期之間的間隔時間(即事件報告及時性)最短為1天,最長達29天,中位數(shù)為8天。另外值得注意的是,有4起事件的所有病例均集中在同一天報告,占事件總數(shù)的28.57%。
2.CUSUM模型預(yù)警分析與評價
(1) 模型參數(shù)選擇
以2011年11月1日-2012年12月31日全省110個區(qū)縣每日發(fā)病數(shù)為實驗數(shù)據(jù),從2012年1月1日起以CUSUM模型進行前瞻性試驗。模型中的兩個待定參數(shù)h(h=1,2,3,4)、k(k=0.5,1.0,1.5,2.0,2.5)依次選擇不同數(shù)值進行組合試驗,計算每一種組合下的預(yù)警靈敏度、特異度,以靈敏度為縱坐標、1-特異度為橫坐標繪制ROC曲線,最終確定模型參數(shù)為h=3,k=0.5,見圖2。
圖2 ROC曲線
(2) CUSUM模型預(yù)警分析及效果評價
CUSUM模型全年共產(chǎn)生1688條預(yù)警信號,每天信號數(shù)最少0條,最多22條,平均每天4.62條;各區(qū)縣全年產(chǎn)生信號數(shù)最少0條,最多24條,平均15.35條。CIDARS全年發(fā)出預(yù)警信號2609條,每天信號數(shù)最少1條,最多38條,平均每天7.15條;各區(qū)縣全年預(yù)警信號最少0條,最多達67條,平均23.72條。
對于14起目標事件,CUSUM模型均發(fā)出了有效預(yù)警,靈敏度為100%,CIDARS對9起事件發(fā)出了有效預(yù)警,靈敏度為64.29%,CUSUM模型預(yù)警靈敏度顯著高于CIDARS(χ2=6.09,P=0.0136)。CUSUM模型和CIDARS特異度分別為95.84%、94.35%,前者高于后者,差異有統(tǒng)計學(xué)意義(χ2=602.48,P<0.0001)。從事件開始日期到發(fā)出預(yù)警日期之間的時間間隔(即預(yù)警及時性),CUSUM模型最短0天,最長29天,中位數(shù)為3.5天;CIDARS最短2天,最長23天,中位數(shù)為6天;CUSUM模型與CIDARS預(yù)警及時性無統(tǒng)計學(xué)差異(Z=0.9173,P=0.359)。CUSUM模型及CIDARS對目標事件的預(yù)警分析結(jié)果見表1。
CUSUM模型是常見的傳染病突發(fā)公共衛(wèi)生事件早期預(yù)警方法之一,是當(dāng)前國外一些傳染病預(yù)警應(yīng)用系統(tǒng)的核心方法[7-9]。國內(nèi)也有學(xué)者開展CUSUM模型的應(yīng)用研究[10-11]。本文研究中,CUSUM模型對于腮腺炎局部暴發(fā)疫情的早期探測效果良好,預(yù)警分析的靈敏度、特異度均明顯高于CIDARS的移動百分位數(shù)法,并且預(yù)警信號數(shù)比CIDARS減少35.30%,可以極大地降低基層預(yù)警信號核實的工作量,減少傳染病預(yù)警的運行成本,提高可接受性。
表1 CUSUM模型與自動預(yù)警系統(tǒng)預(yù)警結(jié)果統(tǒng)計
本研究中同時也存在一些有待改進和完善之處:
(1)CUSUM模型對于腮腺炎預(yù)警分析的及時性不夠理想,其原因主要在于數(shù)據(jù)質(zhì)量較差。14起目標事件中,普遍存在病例報告延遲的現(xiàn)象,其中近1/3的事件所有病例均在事件確認后在某一天集中進行網(wǎng)絡(luò)直報,致使模型無法在事件萌芽階段及時做出預(yù)警。本研究的所有目標事件均發(fā)生在各級各類學(xué)校,因此加強學(xué)校公共衛(wèi)生管理,建立晨檢制度和傳染病零報告制度,提高學(xué)校傳染病報告及時性,可以從根本上解決這一問題。
(2)本研究中以區(qū)縣為單位進行預(yù)警分析,但當(dāng)前的傳染病突發(fā)公共衛(wèi)生事件多是局部暴發(fā)疫情,疫情波及范圍多局限于某區(qū)縣的一個或幾個鄉(xiāng)鎮(zhèn),由于暴發(fā)規(guī)模小,發(fā)生病例少,必須累積到一定數(shù)量才能在區(qū)縣水平上發(fā)現(xiàn)異常。因此可以考慮將預(yù)警分析的空間尺度進一步縮小,以鄉(xiāng)鎮(zhèn)為單位進行實時預(yù)警將進一步提高模型的靈敏度和特異度、及時性。
(3)當(dāng)前,包括CUSUM模型在內(nèi)的各種控制圖模型在傳染病監(jiān)測預(yù)警中的應(yīng)用都是以現(xiàn)行的行政區(qū)劃為基礎(chǔ)[3,11]。有研究表明,我國傳染病突發(fā)公共衛(wèi)生事件主要發(fā)生在學(xué)校[12-13],如果以學(xué)校為單位開展預(yù)警分析將極大提高模型的預(yù)警效能。但在傳染病網(wǎng)絡(luò)直報系統(tǒng)中學(xué)生所在學(xué)校多填在“患者工作單位一欄”,而且不是必填字段,因此學(xué)生所在學(xué)校信息大多缺失,不能用于學(xué)校突發(fā)事件的早期探測,因此建議在網(wǎng)絡(luò)直報系統(tǒng)中盡量完善所在學(xué)校信息。
(4)當(dāng)前以控制圖模型為基礎(chǔ)的預(yù)警方法多是對各個空間單位獨立進行預(yù)警探測[7,9,11],忽略了空間相關(guān)性的存在,對于跨區(qū)域的局部暴發(fā)事件(即同時波及幾個相鄰空間單位)探測能力降低。因此,如果在CUSUM模型算法中引入空間相關(guān)性將具有突破性意義??梢钥紤]建立空間鄰接矩陣,以此明確各空間單位之間的(一階或多階)鄰接關(guān)系,進而通過不同的權(quán)重將具有鄰接關(guān)系的空間單位合成一個新的空間單位,再對其進行預(yù)警分析。
(5)不同的預(yù)警模型在預(yù)警分析時具有各自的優(yōu)勢,在實際運用中可以考慮將定性方法與定量方法相結(jié)合、將時間預(yù)警技術(shù)與空間預(yù)警技術(shù)相結(jié)合,通過多種預(yù)警技術(shù)的聯(lián)合應(yīng)用提高預(yù)警分析的能力[14]。
參 考 文 獻
1.Tsui FC,Espino JU,Dato VM,et al.Technical description of RODS:a real-time public health surveillance system.Journal of the American informatics association,2003,10(5):399-408.
2.Desenclos JC.RAISIN-a national programme for early warning,investigation and surveillance of healthcare-associated infection in France.Euro surveill,2009,14(46):1-8.
3.楊維中,郉慧嫻,王漢章,等.七種傳染病控制圖法預(yù)警技術(shù)研究.中華流行病學(xué)雜志,2004,25(12):1039-1041.
4.楊維中,蘭亞佳,李中杰,等.國家傳染病自動預(yù)警系統(tǒng)的設(shè)計與應(yīng)用.中華流行病學(xué)雜志,2010,31(11):1240-1244.
5.楊維中,李中杰,賴圣杰,等.國家傳染病自動預(yù)警系統(tǒng)運行狀況分析.中流行病學(xué)雜志,2011,3(5):431-435.
6.梁萬年.加強我國傳染病預(yù)警的研究與應(yīng)用.中華流行病學(xué)雜志,2011,32(5):429-430.
7.Watkins RE,Eagleson S,Bert V,et al.Applying cusum-based methods for the detection of outbreaks of Ross River virus disease in Western Australia.BMC medical informatics and decision making,2008,8:37.
8.Boyle JR,Sparks RS,Keijzers GB,et al.Prediction and surveillance of influenza epidemics.MJA,2011,194(4):S28-S33.
9.Fricker RD,Hegler BL,Dunfee DA.Comparing syndromic surveillance detection methods:EARS’ versus a CUSUM-based methodology.Statist Med,2008,27:3407-3429.
10.張洪龍,賴圣杰,李中杰,等.累積和控制圖法在傳染病暴發(fā)探測中的應(yīng)用.中華流行病學(xué)雜志,2010,31(12):1406-1409.
11.竇相峰,王全意,賈蕾,等.累積和模型在細菌性痢疾早期預(yù)警中的應(yīng)用.首都公共衛(wèi)生,2010,4(5):201-204.
12.魯琴寶,龔震宇,林君芬.浙江省2004-2007年學(xué)校突發(fā)公共衛(wèi)生事件流行病學(xué)分析.中國學(xué)校衛(wèi)生,2008,29(8):718-719.
13.劉文東,吳瑩,梁祁,等.江蘇省2006-2009年突發(fā)公共衛(wèi)生事件流行特征分析.現(xiàn)代預(yù)防醫(yī)學(xué),2012,39(5):1071-1074.
14.楊維中.傳染病預(yù)警理論與實踐.北京:人民衛(wèi)生出版社,2012.