潘 蕾 賀曉新 羅艷俠 高 琦 吳立娟 李 霞△ 郭秀花△
基于Bayes時(shí)空理論探討北京市結(jié)核病演化特征及生態(tài)影響因素分析*
潘 蕾1賀曉新2羅艷俠1高 琦1吳立娟1李 霞1△郭秀花1△
目的 探討北京市結(jié)核病時(shí)空演化特征與生態(tài)影響因素。方法 基于Bayes時(shí)空理論,對(duì)2005-2009年北京市18區(qū)縣結(jié)核病患病數(shù)據(jù)進(jìn)行時(shí)空建模,以DIC值最小為標(biāo)準(zhǔn)找出最優(yōu)模型,并研究協(xié)變量對(duì)模型的影響,結(jié)合ArcGis10.0軟件繪制北京市18區(qū)縣結(jié)核病時(shí)空危險(xiǎn)度的分布圖譜。結(jié)果 全部模型中,含協(xié)變量的時(shí)空交互效應(yīng)模型最優(yōu)(DIC=818.834),生態(tài)分析的結(jié)果表明,除人均地區(qū)生產(chǎn)總值的升高會(huì)降低結(jié)核病危險(xiǎn)度之外,每千人口擁有床位數(shù)、年平均相對(duì)濕度、年平均空氣質(zhì)量指數(shù)和年平均最高溫度的升高會(huì)增高結(jié)核病患病危險(xiǎn)度。結(jié)論 Bayes時(shí)空模型與生態(tài)學(xué)分析技術(shù)結(jié)合,能動(dòng)態(tài)分析結(jié)核病的時(shí)空演化特征和生態(tài)影響因素,有利于發(fā)現(xiàn)重點(diǎn)疫區(qū),為制定適宜的防治措施提供科學(xué)依據(jù)。
結(jié)核病 相對(duì)危險(xiǎn)度 Bayes理論 時(shí)空模型
*:國(guó)家科技部艾滋病和病毒性肝炎等重大傳染病防治重大專(zhuān)項(xiàng)課題(2012ZX10005009-003);國(guó)家科技部973項(xiàng)目(2011CB505404);國(guó)家科技部重大專(zhuān)項(xiàng)中醫(yī)藥防治重大傳染病的臨床科研一體化技術(shù)平臺(tái)課題(2009ZX10005-019)
1.首都醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(100069)
2.北京結(jié)核病控制研究所
△通信作者:郭秀花,E-mail:guoxiuh@ccmu.edu.cn;李霞,E-mail:lixia_new@163.com
結(jié)核病的發(fā)生其影響因素較多并且有明顯的區(qū)域性差異〔1〕,在時(shí)空傳播上具有多尺度效應(yīng)〔2〕。雖然現(xiàn)已建立起較完備的流行病學(xué)監(jiān)測(cè)網(wǎng),但大多數(shù)資料是孤立、分散的,極大地限制了其在指導(dǎo)制定預(yù)防措施方面的作用。近年來(lái),隨著空間掃描統(tǒng)計(jì)分析軟件SaTScan〔3〕、Bayes 統(tǒng)計(jì)分析軟件 WinBUGS〔4,5〕的推廣應(yīng)用,以及地理信息系統(tǒng)(GIS)等技術(shù)的發(fā)展,可動(dòng)態(tài)分析傳染病時(shí)空分布特征。國(guó)內(nèi)雖有應(yīng)用ArcGis中的熱點(diǎn)分析對(duì)北京市結(jié)核病2005-2009年的報(bào)告率進(jìn)行建模,發(fā)現(xiàn)其區(qū)域聚集性明顯〔6〕。但以上分析在時(shí)空上是分離的,本文采用Bayes時(shí)空交互模型,并使用生態(tài)學(xué)分析,研究了協(xié)變量對(duì)模型的貢獻(xiàn),由此可以估計(jì)出各個(gè)區(qū)縣的患病危險(xiǎn)度,該指標(biāo)可以在患病率的基礎(chǔ)上更好的反應(yīng)出每個(gè)區(qū)縣實(shí)際患結(jié)核病的危險(xiǎn)程度,為結(jié)核病的防控提供一定的參考依據(jù)。
數(shù)據(jù)來(lái)自北京市結(jié)核病網(wǎng)絡(luò)直報(bào)系統(tǒng)中的電子病例信息,包含北京市18區(qū)縣從2005年1月1日到2009年12月31日登記的所有結(jié)核病數(shù)據(jù)。北京市18區(qū)縣地圖來(lái)自于北京超圖軟件有限公司。通過(guò)查閱2006-2010年《北京區(qū)域統(tǒng)計(jì)年鑒》獲得2005-2009年北京市18個(gè)區(qū)縣的基本人口及社會(huì)經(jīng)濟(jì)數(shù)據(jù),主要包括常住人口、土地面積、地區(qū)生產(chǎn)總值和平均每千人口擁有醫(yī)院床位數(shù)。常住人口/土地面積整理得到常住人口密度,單位為人/平方公里;地區(qū)生產(chǎn)總值來(lái)自全國(guó)第二次經(jīng)濟(jì)普查后核實(shí)數(shù),以2000年人口普查數(shù)據(jù)為基準(zhǔn),整理得到人均地區(qū)生產(chǎn)總值,單位為萬(wàn)元;每千人口擁有醫(yī)院床位數(shù)由北京市衛(wèi)生局提供,單位為個(gè)。林木綠化資料來(lái)自北京市園林綠化局,單位為%,其中城四區(qū)(東城、西城、崇文、宣武)使用的是2005年普查數(shù)據(jù);氣溫、相對(duì)濕度、空氣質(zhì)量指數(shù)來(lái)自北京市氣象局。
(1)Bayes時(shí)空模型
表1中i表示第i個(gè)區(qū)縣,j表示第j年,yij表示患病人數(shù),eij表示期望發(fā)病人數(shù),θij表示患病危險(xiǎn)度,α0是截距,α1j是第j年的截距,vi表示不相關(guān)空間異質(zhì)效應(yīng),gj表示自回歸時(shí)間效應(yīng),tj表示時(shí)間趨勢(shì)效應(yīng),α1表示時(shí)間效應(yīng)的系數(shù),time1j表示第j年的時(shí)間效應(yīng),di表示距離效應(yīng),psiij表示時(shí)空交互效應(yīng)。
表1 Bayes泊松模型的建立
以上模型均在WinBUGS1.4.3中實(shí)現(xiàn),經(jīng)過(guò)模型的加工、更新進(jìn)而推斷樣本參數(shù),得到后驗(yàn)分布的均值、眾數(shù)、標(biāo)準(zhǔn)差和可信區(qū)間等。此過(guò)程采用蒙特卡洛馬爾可夫算法(MCMC)。UH(uncorrelated heterogeneity models)模型,即空間不相關(guān)異質(zhì)模型,在模型中用vi表示,其先驗(yàn)分布選擇正態(tài)分布。CH(correlated heterogeneity models)模型,即空間相關(guān)異質(zhì)模型,在模型中用ui表示。其先驗(yàn)分布選擇現(xiàn)在最為廣泛使用的CAR模型。CAR(conditional autoregressive model)模型,即條件自回歸模型,區(qū)縣間的空間關(guān)系用簡(jiǎn)單鄰接權(quán)重矩陣(simple adjacency weights matrix)表示,如果兩個(gè)區(qū)縣相鄰,則權(quán)重賦值為1;反之,賦值為0。截距項(xiàng)的先驗(yàn)分布選擇無(wú)信息先驗(yàn)分布dflat(),模型的參數(shù)先驗(yàn)分布選擇正態(tài)分布 dnorm(0,taubeta),其參數(shù)的先驗(yàn)分布即超先驗(yàn)分布選擇均勻分布U(0,10)。
(2)生態(tài)學(xué)分析
生態(tài)學(xué)分析用于疾病結(jié)局變量具有地理信息,并且疾病發(fā)生與協(xié)變量或預(yù)測(cè)因素有關(guān)的數(shù)據(jù)分析〔8〕。這些協(xié)變量可以在空間聚集的不同水平上獲得。
本研究將第一部分中的最優(yōu)模型時(shí)空交互CH模型帶入?yún)f(xié)變量,由于協(xié)變量中存在共線性,所以剔除了最低氣溫、人口密度、綠化率三個(gè)變量,進(jìn)入模型的是人均地區(qū)生產(chǎn)總值、每千人口擁有醫(yī)院床位數(shù)、相對(duì)濕度、空氣質(zhì)量指數(shù)和年平均最高氣溫,模型如下及圖1所示:
式中,β1,…,β5表示協(xié)變量的回歸系數(shù)。
模型的擬合結(jié)果見(jiàn)表2,可以看出UH模型和自回歸時(shí)間效應(yīng)的UH模型的DIC值接近,其差值小于4,可以認(rèn)為這兩個(gè)模型沒(méi)有統(tǒng)計(jì)學(xué)差異,即加入對(duì)模型的貢獻(xiàn)不大,而時(shí)間趨勢(shì)效應(yīng)UH模型的DIC值相比前兩者都增大。從CH模型開(kāi)始,DIC值均下降,說(shuō)明使用相關(guān)空間異質(zhì)性模型的效果要比不相關(guān)空間異質(zhì)性模型好,其中以時(shí)空交互效應(yīng)的CH模型的效果最好(DIC=821.296),因?yàn)槠涫褂昧藭r(shí)空交互項(xiàng),所以DIC值銳減。含有協(xié)變量的模型同不含協(xié)變量的模型相比較,各模型的DIC值均下降,并且從UH各個(gè)模型來(lái)看,gi和tj對(duì)模型的影響不大,使用相關(guān)空間異質(zhì)性模型后,模型DIC值下降,也與不帶協(xié)變量的模型結(jié)果一致。
圖1 有向圖模型結(jié)構(gòu)示意圖
表2 結(jié)核病Bayes時(shí)空模型擬合優(yōu)度比較
Bayes時(shí)空模型的最優(yōu)結(jié)果是CH時(shí)空交互模型,對(duì)模型所計(jì)算出的結(jié)核病的患病危險(xiǎn)度與患病率進(jìn)行比較,點(diǎn)的大小代表患病率的高低,點(diǎn)越大,患病率越高;圖層的顏色代表患病危險(xiǎn)度的大小,圖層顏色越深,患病危險(xiǎn)度越大。從圖2可以看出,患病率高的地方,其患病危險(xiǎn)度不一定也高。如2005年患病率最高的為昌平區(qū),其患病率為7.68/萬(wàn),但從危險(xiǎn)度來(lái)看,順義區(qū)的患病危險(xiǎn)度最高(0.000883)。從地圖上可以看出2005-2009年都存在一定的空間相關(guān)性。
最優(yōu)模型中納入了人均地區(qū)生產(chǎn)總值、每千人口擁有醫(yī)院床位數(shù)、空氣質(zhì)量指數(shù)、年平均相對(duì)濕度和年平均最高氣溫5個(gè)協(xié)變量,見(jiàn)表3。除了人均地區(qū)生產(chǎn)總值的增加會(huì)降低結(jié)核病的相對(duì)危險(xiǎn)度之外,隨著每千人口擁有醫(yī)院床位數(shù)的增加、空氣質(zhì)量指數(shù)的增加、年平均相對(duì)濕度的增加和年平均最高氣溫的增加,患結(jié)核病的相對(duì)危險(xiǎn)度也會(huì)增加。
從表3標(biāo)化系數(shù)也可以看出人均地區(qū)生產(chǎn)總值對(duì)危險(xiǎn)度的影響貢獻(xiàn)是最大的,年平均最高氣溫對(duì)危險(xiǎn)度的影響貢獻(xiàn)最小。
圖2 北京市18區(qū)縣2005-2009年結(jié)核病患病率與患病危險(xiǎn)度的疊加圖
表3 協(xié)變量對(duì)結(jié)核病患病危險(xiǎn)度的影響
貝葉斯時(shí)空模型運(yùn)用了貝葉斯理論,考慮了先驗(yàn)概率和樣本信息,同時(shí)將時(shí)空兩個(gè)維度結(jié)合起來(lái),生態(tài)分析技術(shù)的運(yùn)用,進(jìn)一步完善了貝葉斯時(shí)空模型,使得結(jié)核病患病危險(xiǎn)度的估計(jì)更加準(zhǔn)確。這樣不僅可以從宏觀上更加合理的解釋結(jié)核病的時(shí)空傳播動(dòng)態(tài)演化過(guò)程,并且可以看出這些因素對(duì)患病危險(xiǎn)度的影響,還可以輔助解決公共衛(wèi)生資源的配置等問(wèn)題。
平均年最高氣溫升高,結(jié)核病患病危險(xiǎn)也增高,這與其他研究證實(shí)的結(jié)核病發(fā)病率與平均最高氣溫呈負(fù)相關(guān)相悖〔9〕,造成結(jié)果不一致的原因可能是尺度不一對(duì)結(jié)局的影響不同。平均相對(duì)濕度增大,結(jié)核病患病危險(xiǎn)也增高,這與楊子丹〔10〕等的報(bào)道相符??諝赓|(zhì)量差會(huì)增高患結(jié)核病的風(fēng)險(xiǎn),在其他研究中也有類(lèi)似報(bào)道。人均地區(qū)生產(chǎn)總值增高,結(jié)核病患病相對(duì)危險(xiǎn)度降低,這與以往認(rèn)為的結(jié)核病是“窮病”的研究觀點(diǎn)相一致。每千人口擁有床位數(shù)越多,結(jié)核病的危險(xiǎn)度越高,這也在一定程度上反應(yīng)了醫(yī)療資源的配置合理。各區(qū)縣之間存在一定的空間相關(guān)性和聚集性,患病率高的地區(qū),其患病危險(xiǎn)度不一定也高,反之亦然。其患病危險(xiǎn)度隨著年份也會(huì)發(fā)生改變。從其趨勢(shì)來(lái)看,2005年的高危險(xiǎn)度區(qū)縣包括順義區(qū)、昌平區(qū)、門(mén)頭溝區(qū),中危險(xiǎn)度區(qū)縣:平谷區(qū)、石景山區(qū)、密云縣;低危險(xiǎn)度區(qū)縣:海淀區(qū)、東城區(qū)、朝陽(yáng)區(qū);與2009年相比,高危險(xiǎn)度區(qū)縣:房山區(qū)、豐臺(tái)區(qū),中危險(xiǎn)度區(qū)縣:西城區(qū)、朝陽(yáng)區(qū)、石景山區(qū),低危險(xiǎn)度區(qū)縣:延慶縣、順義區(qū)、昌平區(qū)。提示近年來(lái)結(jié)核病患病危險(xiǎn)區(qū)域已發(fā)生了變化。
1.劉云霞,姜世聞,劉言訓(xùn),等.基于潛變量與空間統(tǒng)計(jì)理論的耐多藥結(jié)核病空間流行病學(xué)模型研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(6):648-653.
2.Liu YN,Wang W,Li X,et al.Geographic distribution and risk factors of the initial adult hospitalized cases of 2009 pandemic influenza A(H1N1)virus infection in mainland China.PLoS One,2011,6(10):e25934.
3.李秀央,陳坤.掃描統(tǒng)計(jì)量的理論及其在空間流行病學(xué)中的應(yīng)用.中華流行病學(xué)雜志,2008,29(8):828-831.
4.Cowles,MK.Review of WinBUGS 1.4.The American Statistician.2004;58(4):330-336.
5.孟海英,劉桂芬,羅天娥.WinBUGS軟件應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì).2006;23(8):375-377.
6.Liu Y,Li X,Wang W,et al.Investigation of space-time clusters and geo-spatial hotspots for the occurrence of tuberculosis in Beijing.International Journal of Tuberculosis and Lung Disease,2012,16(4):486-491.
7.Lawson,AB.Bayes Disease Mapping:Hierarchical Modeling in spatial,2008.
8.Sales CM,F(xiàn)igueiredo TA,Zandonade E,et al.Spatial analysis on childhood tuberculosis in the state of Espirito Santo,Brazil,2000 to 2007.Revista da Sociedade Brasileira de Medicina Tropical,2010,43(4):435-439.
9.霍愛(ài)梅,趙達(dá)生,方立群,等.華北地區(qū)主要呼吸道傳染病與氣象條件的關(guān)系.中國(guó)醫(yī)藥導(dǎo)報(bào),2011,8(32):153-156.
10.楊子丹.五峰縣2005年-2010年結(jié)核病疫情分析.中外健康文摘,2011,8(27):203-204.
Exploration of Tuberculosis Evolution Characteristics and Ecological Factors Based on the Bayes Temporal-Spatial Theory
Pan Lei,He Xiaoxin,Luo Yanxia,et al.School of Public Health and Family Medicine,Capital Medical University(100069),Beijing
ObjectiveTo explore tuberculosis temporal-spatial evolution characteristics and ecological factors.MethodsThe model is based on the tuberculosis data in Beijing 18 districts and counties between 2005 and 2009,find out the optimum model(DIC minimum value),and by using ecology analysis technology,finding out association of tuberculosis risk and covariates,and combined with ArcGis10.0 show the distribution of space and time risk of tuberculosis in Beijing 18 districts and counties.ResultsThe optimization model is Bayes spatial-temporal interactive model(DIC=818.834).The results of ecological analysis shows that the risk of tuberculosis are significantly associated with the number of bed in hospital,annual average relative humidity,annual average air quality index and annual average temperature.ConclusionCombination of Bayes spatial-temporal model and ecological analysis will help for finding key areas of tuberculosis.
Tuberculosis;Relative risk;Bayes theory;Spatial-temporal model
(責(zé)任編輯:劉 壯)