陶芳芳 趙耐青 何 懿 林慶能 毛智盛 孫曉冬
細菌性痢疾是常見的法定報告腸道傳染病,在上海市甲乙類腸道傳染病發(fā)病中居首位。上海市細菌性痢疾發(fā)病有明顯的季節(jié)性,一年四季均有發(fā)病,夏秋季尤為高發(fā)。隨著全球氣溫的變暖,氣象因素對腸道傳染病的影響已受到越來越多學者的關注〔1-3〕。已有文獻證明氣溫、降雨量等對細菌性痢疾發(fā)病影響較大〔4-6〕。
細菌性痢疾是對本市公共衛(wèi)生影響較大的重點傳染病,了解細菌性痢疾的流行趨勢,盡早發(fā)現(xiàn)其流行隱患及爆發(fā)和流行先兆,在疾病爆發(fā)前及時提供準確的疾病動態(tài)及預警預報,以便采取措施進行預防控制,從而降低發(fā)病率和死亡率,達到控制疾病蔓延的目的。
傳染病的準確預警依賴于正確地使用預測方法。本研究將氣象因素作為細菌性痢疾發(fā)病的影響因素,采用非參數(shù)廣義相加模型(generalized additive model,GAM)建立細菌性痢疾預測模型。GAM是廣義線性模型的非參數(shù)擴展,適用范圍更廣,GAM可擬合非參數(shù)回歸,適用于處理應變量和眾多解釋變量間過度復雜的非線性關系,近年來在環(huán)境流行病學中〔7-9〕的應用越來越多,已被廣泛應用于環(huán)境污染對人體健康危害的研究〔10〕。
本研究探討使用此模型進行菌痢發(fā)病預測和預警的可行性,為其防控工作提供科學依據。
1.資料
上海市2004年1月1日至2008年12月31日每日細菌性痢疾發(fā)病數(shù)資料和氣象資料分別來源于國家疾病監(jiān)測信息報告管理系統(tǒng)和上海市氣象局城市環(huán)境氣象中心。氣象因素資料主要包括平均氣溫、最高溫度、最低溫度、濕度、降水量、風速、氣壓等。
2.分析方法
(1)模型擬合
本研究中,假定第t天細菌性痢疾日報告病例數(shù)Yt近似服從Poisson分布,均數(shù)(期望值)為μt,考慮均數(shù)μt可能受氣溫、氣壓、濕度及發(fā)病趨勢的影響,而這些因素與均數(shù)μt的關聯(lián)性不是線性關系,因此采用GAM,其連接函數(shù)(link function)為對數(shù)函數(shù),基本形式如下:
其中Yt是第t天的細菌性痢疾日報告病例數(shù),f1(x1t),f2(x2t),…,fp(xpt)是自然樣條函數(shù)(natural spline,ns),樣條函數(shù)本質上是把自變量范圍分割成若干個互不重合的區(qū)間,在每個區(qū)間函數(shù)表達式為二階或三階多項式(如二階多項式為拋物線),但要求在兩個區(qū)間相鄰點上的函數(shù)曲線是連續(xù)和光滑的,x1t,x2t,…,xpt是氣溫、氣壓、濕度及發(fā)病趨勢等協(xié)變量。
(2)預測應用
由于模型擬合使用2004年1月1日至2008年12月31日每日報告細菌性痢疾病例數(shù)的趨勢較平穩(wěn),未出現(xiàn)暴發(fā)流行,可認為細菌性痢疾發(fā)病處于常態(tài)。在常態(tài)下建立氣象因素與細菌性痢疾發(fā)病的預測模型是可行的。用選定的模型對細菌性痢疾發(fā)病作出預測,利用在不同氣象條件下預測值的95%范圍的上限值作為預警限。
結 果
1.細菌性痢疾日報告病例數(shù)的趨勢分析
2004年1月至2008年12月上海市每日細菌性痢疾報告數(shù)每年均出現(xiàn)較一致的報告高峰,呈明顯的季節(jié)性波動。1~4月一直呈低發(fā)狀態(tài),5月后開始增加,7月份快速上升,到8~9月左右達到最高峰,然后開始下降,到12月回到1月左右水平。
2.模型擬合
經過實際數(shù)據的擬合,最后得到下列模型:
表1 模型參數(shù)估計結果
表1 中的 ns(temp,3)1,ns(temp,3)2 和 ns(temp,3)3是氣溫樣條函數(shù)的三個自然樣條基函數(shù),自由度為 3,ns(lns2s8,14)1,ns(lns2s8,14)2,…,ns(lns2s8,14)14是細菌性痢疾日報告病例數(shù)的7天滑動和的樣條函數(shù)的14個自然樣條基函數(shù)。
選擇研究日前1天的溫度,引入前8天的病例數(shù),分析過去一周里病例數(shù)及氣溫對細菌性痢疾發(fā)病的影響。結合Akaike's信息標準(Akaike's information criterion,AIC)來選擇最優(yōu)模型。模型決定系數(shù) R2=0.9202。
圖1 模型估計發(fā)病數(shù)與實際發(fā)病數(shù)的散點圖
3.預測預警分析
用模型對2009年1月~12月上海市細菌性痢疾每日報告數(shù)進行計算,結果顯示預測值與實際值較吻合,預測的動態(tài)趨勢與實際情況基本一致,模型的擬合效果較好。采用本模型來預測細菌性痢疾發(fā)病水平是可行的。擬合及預測的具體結果見圖2。同時根據預測數(shù)據的可信限,可以判斷實際發(fā)病情況是否在正常范圍波動〔11〕,如果實際病例數(shù)在預測值95%范圍內波動,表明細菌性痢疾疫情基本穩(wěn)定,如果超出模型預測值95%范圍的上限,表明當日細菌性痢疾疫情已不同于以往規(guī)律,如果連續(xù)兩天實際值均超出預測值95%范圍的上限,則發(fā)出提示性預警。圖2可以看到2009年1月1日至12月31日上海市細菌性痢疾日發(fā)病數(shù)基本上在95%范圍內,因此本研究采用基于預測值的預警策略是可行的。
圖2 2009年1月1日至2009年12月31日上海市細菌性痢疾日報告病例數(shù)擬合及預測結果
細菌性痢疾的發(fā)病率受自然因素、社會因素、氣象因素以及病原學特點等影響〔12〕,且存在明顯的季節(jié)差異,利用傳統(tǒng)的時間序列模型并不合適。本研究以廣義相加模型為基本統(tǒng)計模型,運用時間序列格式的資料,盡可能地控制混雜因素的影響。模型中應用趨勢樣條函數(shù)控制了時間的長期趨勢影響,對于可能存在的星期效應,模型中以啞元變量的形式進行控制,在此基礎上擬合溫度、濕度與細菌性痢疾發(fā)病的二次函數(shù)關系。根據擬合模型回歸系數(shù)的檢驗結果發(fā)現(xiàn),由于引入前8天的細菌性痢疾發(fā)病數(shù)作為自變量,而這些自變量與當前的氣溫和濕度都有關聯(lián),以致濕度的效應在模型中的檢驗無統(tǒng)計學意義,因此在模型中剔除濕度指標。最后模型擬合了氣溫與細菌性痢疾發(fā)病的關系,可根據氣溫和前8天細菌性痢疾發(fā)病水平預測發(fā)病數(shù)。
廣義相加模型適用于多種分布資料的分析,模型中既可以包括參數(shù)擬合部分也可包括非參數(shù)擬合部分,甚至可以全部是非參數(shù)擬合,模型的構建靈活,并不拘泥于某一種形式的函數(shù)。當解釋變量的個數(shù)較多或反應量與解釋變量之間的關系不明確,反應變量的分布不易判定或不符合所要求的分布時均可考慮用廣義相加模型。
預測預警研究是一項很復雜的研究,除了傳染病的影響因素較復雜外,預測預警分析的統(tǒng)計方法也有較高要求。本文所建立的細菌性痢疾預測模型只納入了氣溫因素,分析了日均氣溫對細菌性痢疾發(fā)病的影響,但是影響細菌性痢疾發(fā)病和流行的因素還有很多,現(xiàn)階段我們也開展了相應的監(jiān)測,收集了大量的監(jiān)測資料,包括癥狀監(jiān)測、病原學監(jiān)測等,由于監(jiān)測資料之間缺乏統(tǒng)一性,無法納入數(shù)學模型,在以后的工作中,將進一步深入研究。
1.Akari T,Michio Y,Taiichi H,et al.Climate impact on seasonal patterns of diarrhea diseases in Tropical area.www.hyarc.nagoya-u.ac.jp/game/6thconf/html/abs.html/pdfs/T6AT09Aug04093113.pdf.
2.Hayashi T.Impact of meteorological elements on diarrhea diseases in Bangladesh.Preprints.Meteor.Soc,2004,86:257.
3.鄭能雄,林云欽,鄭高,等.福州市主要傳染病與氣象因素關系的研究.中國公共衛(wèi)生管理,2004,20:343-346.
4.孫培源,張德山,韋懿蕓,等.北京市海淀區(qū)細菌性痢疾與氣象因素的關系.首都公共衛(wèi)生,2008,2(3):100-103.
5.黃成鋼,金如鋒,邱宏,等.我國某地區(qū)痢疾發(fā)病率與氣象因素的關系及其預測模型.現(xiàn)代預防醫(yī)學,2009,36(7):1207-1210.
6.廖洪秀,張強,杜長慧,等.主成分回歸分析在細菌性痢疾與氣象因素關系中的應用.現(xiàn)代預防醫(yī)學,2009,36(5):813-815.
7.董英,趙耐青,湯克軍,等.廣義相加模型在氣溫健康效應研究中的應用.中國衛(wèi)生統(tǒng)計,2008,25(2):144-146.
8.Simon N,Wooda,Nicole H,et al.GAMs with integrated model selection using gernalized regression splines and applications to environmental modeling.Ecological Modelling,2002,(157):1572177.
9.Laurent F,Alain LT,Isabelle B,et al.Difference in the relation between daily mortality and air pollution among elderly and all-ages populations in south western France.Environmental Research,2004(94):249-253.
10.余松林,彭曉武.廣義加性模型配合時間序列資料時消除殘差自相關性的一種方法.中國衛(wèi)生統(tǒng)計,2010,27(5):450-454.
11.張文增,冀國強,史繼新,等.ARIMA模型在細菌性痢疾預測預警中的應用.中國衛(wèi)生統(tǒng)計,2009,26(6):636-639.
12.施侶元,李立明,葉冬青,等.流行病學.第5版.北京:人民衛(wèi)生出版社,2003:464-465.