江蘇省疾病預(yù)防控制中心(210009) 戴啟剛
圓分布的平均角及其區(qū)間估計(jì)方法在傳染病發(fā)病高峰評(píng)估中的應(yīng)用探討*
江蘇省疾病預(yù)防控制中心(210009) 戴啟剛
目的探討圓分布在傳染病發(fā)病高峰研究中的應(yīng)用策略。方法以四類傳染病數(shù)據(jù)為基礎(chǔ),圓分布方法分析各病種流行規(guī)律,采用兩種區(qū)間估計(jì)方法計(jì)算發(fā)病高峰期。結(jié)果圓分布方法適用于單峰分布或略呈現(xiàn)雙峰分布的傳染病,對(duì)于雙峰分布傳染病,圓分布的雷氏檢驗(yàn)并不能給出合理的結(jié)果;采用bootstrap計(jì)算發(fā)病高峰期區(qū)間過窄,標(biāo)準(zhǔn)差法結(jié)果較為合理。結(jié)論利用圓分布方法研究傳染病的流行規(guī)律時(shí),應(yīng)當(dāng)先作折線圖以便對(duì)該病種流行規(guī)律有宏觀了解,流行高峰應(yīng)當(dāng)結(jié)合折線圖和雷氏檢驗(yàn)結(jié)果觀察,對(duì)傳染病發(fā)病高峰期的計(jì)算,采用加減標(biāo)準(zhǔn)差法比bootstrap法更具優(yōu)勢(shì)。
傳染病 圓分布 可信區(qū)間 bootstrap
圓分布分析適用于在規(guī)定時(shí)期內(nèi)周期性變化的數(shù)據(jù),檢驗(yàn)數(shù)據(jù)在一個(gè)周期內(nèi)是均勻分布的,還是有集中的傾向,如果有集中于某個(gè)時(shí)間發(fā)生的傾向,則可以通過平均角來表示[1]。近年來,有較多的研究將圓分布方法引入到傳染病發(fā)病時(shí)間的規(guī)律分析中,以探索傳染病的發(fā)病高峰和流行期[2-5]。本文以不同流行特征的傳染病數(shù)據(jù)為基礎(chǔ),探討圓分布的適用情況,比較兩種發(fā)病高峰期計(jì)算方法(加減標(biāo)準(zhǔn)差法和bootstrap法)的合理性。
1.資料來源
為探討圓分布在傳染病發(fā)病高峰中的適用情況,本文選取幾種不同類型的流行特征傳染?。杭?xì)菌性痢疾(單峰分布)、手足口?。p峰分布,兩峰值水平相差較多)、水痘(雙峰分布,兩峰值水平相近)、丙型肝炎(均勻分布)。發(fā)病資料來源于中國疾控中心傳染病報(bào)告信息管理系統(tǒng)。
2.資料整理
從傳染病報(bào)告信息管理系統(tǒng)中導(dǎo)出江蘇省2012年目標(biāo)傳染病報(bào)告卡,整理該傳染病的每日發(fā)病數(shù)。
3.分析方法
(1)采用圓分布方法,求得該病種的發(fā)病高峰日。
采用雷氏檢驗(yàn)(Rayleigh′s test)判斷平均角有無統(tǒng)計(jì)學(xué)意義,以確認(rèn)該傳染病總體分布是否有集中于該高峰日的傾向。
(2)分別采用加減標(biāo)準(zhǔn)差法[5]和bootstrap法[6]估計(jì)發(fā)病高峰日的可信區(qū)間。
加減標(biāo)準(zhǔn)差法:將角度轉(zhuǎn)化為日期,即為發(fā)病高峰期。
Bootstrap法:從現(xiàn)有的傳染病發(fā)病數(shù)據(jù)中,等比例、有放回地重復(fù)抽樣[7](考慮到計(jì)算結(jié)果的穩(wěn)定性和計(jì)算機(jī)運(yùn)算效率,將抽樣次數(shù)定為1000),計(jì)算每一個(gè)抽樣樣本的平均角,取1000個(gè)平均角的Q2.5和Q97.5作為95%可信區(qū)間的上下限[8],并將其轉(zhuǎn)化為相應(yīng)的日期作為發(fā)病高峰期。
(3)評(píng)價(jià)方法
本文目標(biāo)將傳染病按日作發(fā)病數(shù)折線圖,以全年日均發(fā)病數(shù)為界值,當(dāng)某段時(shí)期日發(fā)病數(shù)超出全年日均發(fā)病數(shù)且整體發(fā)病趨勢(shì)持續(xù)向上時(shí),則初步判斷該傳染病發(fā)病可能進(jìn)入高發(fā),并試通過圓分布的統(tǒng)計(jì)量結(jié)合上述直觀的方式,探討圓分布方法以及兩種區(qū)間估計(jì)方法的的適用情況。
本文數(shù)據(jù)整理與分析借助SAS 9.2完成,作圖采用Office 2010軟件。
通過目標(biāo)傳染病的日發(fā)病情況折線圖,以日均發(fā)病數(shù)為輔助線,判斷傳染病進(jìn)入高峰的時(shí)間(僅作為輔助判斷,不作為判定依據(jù))。見圖1。
對(duì)四類傳染病的圓分布分析及兩種可信區(qū)間估計(jì)結(jié)果見表1。
丙型肝炎發(fā)病無季節(jié)性,全年發(fā)病呈均勻分布,此時(shí)利用雷氏檢驗(yàn)可以較敏感地得到圓分布平均角無統(tǒng)計(jì)學(xué)意義的結(jié)論;水痘發(fā)病在一個(gè)自然年內(nèi),呈明顯的雙峰分布,但采用雷氏檢驗(yàn)得到P值有意義的結(jié)論(下文將進(jìn)一步探討);手足口病在夏季出現(xiàn)高峰后下行,至年末又出現(xiàn)流行小高峰,平均角所對(duì)應(yīng)的高峰日與實(shí)際情況較為吻合,經(jīng)雷氏檢驗(yàn)有統(tǒng)計(jì)學(xué)意義;細(xì)菌性痢疾是夏秋季節(jié)高發(fā)的腸道傳染病,呈嚴(yán)格的單峰分布,平均角所對(duì)應(yīng)的發(fā)病高峰日符合實(shí)際發(fā)病情況。
傳染病發(fā)病高峰期的計(jì)算,本文分別采用了非參數(shù)bootstrap再抽樣百分位數(shù)法和加減標(biāo)準(zhǔn)差法,結(jié)合發(fā)病折線圖顯示bootstrap的方法得到的可信區(qū)間過窄,無實(shí)際意義,而加減標(biāo)準(zhǔn)差法得到的結(jié)果較為客觀:手足口病和細(xì)菌性痢疾作為腸道傳染病,其發(fā)病具有明顯的季節(jié)特征,發(fā)病數(shù)一般隨著氣候轉(zhuǎn)暖(3月份左右)而升高,4月至7月為發(fā)病高峰期[9]。這與本文所得到的的結(jié)果一致,因此采用圓分布法時(shí),利用加減標(biāo)準(zhǔn)差法估計(jì)發(fā)病高峰期更具有流行病學(xué)的指導(dǎo)意義。
圖1 四類傳染病日發(fā)病折線圖
表1 四類傳染病圓分布分析及發(fā)病高峰期結(jié)果
上文討論了圓分布方法在四種傳染病發(fā)病集中性以及發(fā)病高峰期中的應(yīng)用,其中對(duì)水痘的平均角檢驗(yàn)具有統(tǒng)計(jì)學(xué)意義,然而從發(fā)病折線圖看,呈典型雙峰分布,觀察加減標(biāo)準(zhǔn)差法得到的高峰期可見,該傳染病的發(fā)病高峰期跨越了一個(gè)自然年,考慮到該現(xiàn)象可能是由于2011年下半年的發(fā)病高峰與2012年上半年的發(fā)病高峰相延續(xù)而產(chǎn)生,結(jié)合表1中的結(jié)果,嘗試以2011/08/01-2012/07/31作為一個(gè)觀察周期,重新計(jì)算平均角及其對(duì)應(yīng)高峰期(采用加減標(biāo)準(zhǔn)差法),計(jì)算得到發(fā)病高峰日為2012/02/15,雷氏檢驗(yàn)P<0.05,高峰期為2011/10/16-2012/6/17,結(jié)合發(fā)病折線圖(圖2)可知在該周期內(nèi)該傳染病仍呈雙峰分布,且計(jì)算所得的發(fā)病高峰與實(shí)際發(fā)病情況不符,發(fā)病高峰出現(xiàn)跨年度的現(xiàn)象并非上文所假設(shè)的原因。
圖2 水痘2011/08/01-2012/07/31日發(fā)病折線圖
圓分布方法被廣泛應(yīng)用于傳染病發(fā)病高峰期的計(jì)算和比較,本文通過對(duì)四種不同流行特征的傳染病的研究證實(shí):圓分布方法適用于單峰分布傳染病(如細(xì)菌性痢疾)或略呈現(xiàn)雙峰分布的傳染?。ㄊ肿憧诓。蝗舭l(fā)病趨勢(shì)平穩(wěn)(如丙型肝炎),雷氏檢驗(yàn)?zāi)軌虻玫綗o集中時(shí)點(diǎn)發(fā)病的結(jié)論;而對(duì)于一個(gè)觀察周期出現(xiàn)兩個(gè)發(fā)病高峰且兩高峰水平相當(dāng)?shù)膫魅静。ㄈ缢唬?,圓分布的雷氏檢驗(yàn)并不能給出合理的結(jié)果。因此,本文建議,利用圓分布方法計(jì)算某傳染病的發(fā)病高峰、比較不同觀察周期和(或)不同類型傳染病發(fā)病高峰時(shí),應(yīng)當(dāng)遵循如下步驟:(1)初步用折線圖觀察傳染病的發(fā)病趨勢(shì);(2)利用圓分布方法分析,采用雷氏檢驗(yàn)分析是否存在平均角;(3)將雷氏檢驗(yàn)統(tǒng)計(jì)量與發(fā)病折線圖相結(jié)合,給出相關(guān)結(jié)論。
對(duì)于傳染病高峰期的計(jì)算,因?yàn)閭魅静∧臧l(fā)病例數(shù)較多,若采用非參數(shù)bootstrap抽樣的百分位數(shù)法,計(jì)算耗時(shí)且得到的可信區(qū)間較窄,本文建議使用將轉(zhuǎn)化為日期的方法,可以簡便、可靠地得到具有流行病學(xué)意義的結(jié)果。
1.金丕煥,陳峰主編.醫(yī)用統(tǒng)計(jì)方法(第3版).上海:復(fù)旦大學(xué)出版社,2009:327-334.
2.石長勝,邵峰,王篤寶.應(yīng)用圓形分布分析泰安市不同時(shí)期麻疹發(fā)病的時(shí)間分布特征.中國衛(wèi)生統(tǒng)計(jì),2006,23(2):155-156.
3.徐紅梅,朱渭萍,費(fèi)怡,等.應(yīng)用圓形分布法分析浦東新區(qū)2005-2010年細(xì)菌性痢疾季節(jié)性分布特征.中華疾病控制雜志,2012,16(5):446-448.
4.甘仰本,廖征.集中度和圓形分布法分析南昌市1985-2007年麻疹季節(jié)性分布.現(xiàn)代預(yù)防醫(yī)學(xué),2009,36(12):2229-2230.
5.聶軼飛.應(yīng)用集中度和圓形分布法探討河南省2010年手足口病流行規(guī)律.中國衛(wèi)生統(tǒng)計(jì),2013,30(3):410-411.
6.朱凱.圓形分布資料平均角置信區(qū)間的Bootstrap方法實(shí)現(xiàn).中國衛(wèi)生統(tǒng)計(jì),2011,28(4):412-413.
7.閆宇翔.Bootstrap再抽樣方法的SAS程序設(shè)計(jì).中國衛(wèi)生統(tǒng)計(jì),2003,20(5):320.
8.Carpenter J,Bithell J.Bootstrap confidence intervals:when,which,what?A practicalguide for medical statisticians.Statisticsin Medicine,2000,19:1141-64.
9.嵇紅,李亮,吳斌,等.江蘇省2008至2010年手足口病流行病學(xué)及病原學(xué)特征分析.中華兒科雜志,2012,50(4):261-266.
(責(zé)任編輯:丁海龍)
江蘇省“十二·五”科教興衛(wèi)工程(ZX201109)