基于ARIMA的傳染病流行趨勢預測及防治對策
桂騰葉1,陳碩2,隗立志2,崔志軍2,周曉琳2
(1.西藏大學 工學院,西藏 拉薩850000;2.西藏大學 藏文信息技術(shù)研究中心,西藏 拉薩850000)
摘要為準確地預測傳染病,根據(jù)傳染病變化特點,提出了一種差分自回歸移動平均模型的傳染病預測模型。模型對原始數(shù)據(jù)進行平穩(wěn)化預處理,消除其突發(fā)性、季節(jié)性和周期性特征,并利用ARIMA對將平穩(wěn)后的數(shù)據(jù)進行建模,采用某市流行性感冒發(fā)病率數(shù)據(jù)進行仿真,實驗結(jié)果表明,ARIMA模型能較好地捕捉傳染病變化規(guī)律,提高了預測精度,是一種有效預測傳染病的方法,同時能為傳染病的預防監(jiān)測措施提供決策依據(jù)。
關(guān)鍵詞傳染病;平穩(wěn)時間序列;預處理;ARIMA
收稿日期:2015-04-28
基金項目:西藏大學自治區(qū)大學生創(chuàng)新性實驗訓練計劃基金資助項目(2014QCX049)
作者簡介:桂騰葉(1991—),男,本科。研究方向:交通運輸規(guī)劃與管理。E-mail:1148195268@qq.com
doi:10.16180/j.cnki.issn1007-7820.2015.12.013
中圖分類號O212;TP274文獻標識碼A
Prediction and Countermeasures of Infectious Diseases Based on ARIMA
GUI Tengye1,CHEN Shuo2,WEI Lizhi2,CUI Zhijun2,ZHOU Xiaolin2
(1.School of Engineering,University of Tibet,Lhasa 850000,China;
2.Tibetan Information Technology Research Center,University of Tibet,Lhasa 850000,China)
AbstractAn autoregressive integrated moving average model (ARIMA) based on the characteristics of infectious diseases’ changes is proposed for accurate prediction of the epidemics.Firstly,the original data is preprocessed smoothly by the model,which is also used to eliminate the abruptness and the characteristics of seasonal and cyclical.Then the ARIMA is used to build a model of data that has been smoothed.We use the data,the morbidity of influenza in a city,to simulate the results of the experiment,which shows that ARIMA can capture the regulation of the variation of infectious diseases well,and improve the accuracy of the prediction.It is an efficient approach to predicting the epidemic,which also provides support for decision-making in epidemic prediction and monitoring.
Keywordsinfectious disease;stationary time series;pretreatment;ARIMA
當前,對傳染病有許多預測方法和模型[1]。而各種方法具有不同優(yōu)缺點。傳染病由于受到各種環(huán)境因素和自身的身體條件的影響,想要對傳染病進行準確的預測,就必須同時考慮這些因素。綜合多方面情況,筆者選擇差分自回歸移動平均模型(ARIMA模型)進行預測[2-3],ARIMA模型在疾病控制[4]、經(jīng)濟預測[5]、交通量預測[6]和生態(tài)環(huán)境模擬與預測[7]等方面都有應(yīng)用。是一種無需了解影響被預測變量的相關(guān)因素,可刻畫具有時間變化特征,能夠根據(jù)一些隨時間變化而又相互關(guān)聯(lián)的動態(tài)數(shù)據(jù)建立的一種效果較好的預測模型[8],從而為傳染病預測提供了新的途徑。
1傳染病模型ARIMA的建立
1.1傳染病的預測原理
傳染病預測是根據(jù)傳染病的發(fā)生、發(fā)展規(guī)律等相關(guān)因素,建立一個傳染病預測模型,通過過去的數(shù)據(jù)對未來可能發(fā)生的事進行預測。設(shè)收集到某傳染病發(fā)生的歷史數(shù)據(jù)為X={x1,x2,…,xi,…,xn},n表示數(shù)據(jù)數(shù)量,xt表示第t時間傳染病的發(fā)生量,傳染病的發(fā)生量可表示為
(1)
式中,預測模型為prediction。
傳染病的發(fā)生涉及的因素較多,簡單的自回歸等之類的模型預測的效果都不理想[9],而ARIMA模型是一種專門用于對隨時間變化而又相互關(guān)聯(lián)的動態(tài)數(shù)據(jù)建立模型的工具。因此,文中采用ARIMA對傳染病進行預測,如圖1所示。
圖1 ARIMA預測流程圖
1.2傳染病的ARIMA預測模型
ARIMA模型是由美國統(tǒng)計學家Geogre等人提出的對時間序列進行分析、預測和控制的方法,根據(jù)過去對數(shù)據(jù)對未來的數(shù)據(jù)進行預測[10]。設(shè)xt表示t時間傳染病的發(fā)生量,進而ARIMA(p,q,d)模型可記為
φ(B)dxt=θ(B)εt
(2)
然后對傳染病時間序列進行差分預處理,得到
(3)
(4)
則一個(p,q,d)×(p,D,Q)s的傳染病預測模型可表示為
(5)
式中,d表示移動平均階數(shù),且有
U(Bs)=1-u1Bs-u2B2s-…-upBps
(6)
V(Bs)=1-v1Bs-v2B2s-…-vqBQs
(7)
1.3傳染病預測的ARIMA建模
(1)數(shù)據(jù)的預處理。對于傳染病數(shù)據(jù):X={x1,x2,…,xi,…,xn} 因其一般未經(jīng)過處理之前,其時間序列不具有平穩(wěn)性,無法直接進行判斷,所以要通過預處理將其轉(zhuǎn)為化平穩(wěn)性時間序列。文中根據(jù)傳染病數(shù)據(jù)構(gòu)造了自相關(guān)函數(shù)進行判斷。若經(jīng)過預處理后的數(shù)據(jù)仍然不具有平穩(wěn)性,則采用取自然對數(shù)或差分進行預處理,然后再進而計算。
(2)模型的識別、定階與參數(shù)估計。于ARIMA建模來說,ARIMA模型的識別、ARIMA模型定階與ARIMA模型參數(shù)估計是其中最為關(guān)鍵的部分。移動平均階數(shù)d可試探的做法或用信息準則進行確定,本文采用AIC準確進行確定,AIC準則定義如下
(8)
然后通過最大似然法和最小二乘法便可確定最佳模型的最小階數(shù)p,從而獲得ARIMA模型的最優(yōu)參數(shù)。
(3)模型的檢驗。傳染病預測模型是否最優(yōu),需要通過對模型的擬合優(yōu)度進行檢驗,文獻[10]指出了一種對擬合值和殘差值進行殘差分析,根據(jù)殘差序列的結(jié)果進行判斷,筆者采用了此種方法,即采用殘差序列的卡方檢驗及樣本逼近預測曲線圖進行模型是否最優(yōu)進行檢驗,即
(9)
(10)
2流行性感冒流行趨勢的預測
流行性感冒簡稱流感,是由流感病毒引起的一種急性呼吸道傳染病,傳染性強、發(fā)病率高,易引起暴發(fā)或大流行。其主要通過含有病毒的飛沫進行傳播,人與人之間的接觸或與被污染物品的接觸傳播。根據(jù)其序列特點采用求和自回歸移動平均ARIMA模型,探索ARIMA模型對常見傳染病疫情預測的可行性,通過預測傳染病的流行趨勢,并對其進行預測,為指導制定相應(yīng)的傳染病防治計劃提供依據(jù)。
2.1流行性感冒發(fā)病資料分析
某市2013年流行性感冒發(fā)病人數(shù)如圖2所示,從圖2可知,流行性感冒發(fā)病人數(shù)具有一定的季節(jié)性和周期,同時也具有非平穩(wěn)性。
圖2 某市2013年流行性感冒發(fā)病人數(shù)變動曲線
2.2預測模型的建立
(1)數(shù)據(jù)平穩(wěn)化處理。從圖2可知,該市2013年流行性感冒發(fā)病人數(shù)數(shù)據(jù)的時間序列圖有不平穩(wěn)趨勢,因此首先對數(shù)據(jù)進行兩次差分運算,消除趨勢性,結(jié)果如圖3所示,對數(shù)據(jù)進行標準化處理后如圖4所示,表示數(shù)據(jù)趨于平穩(wěn)。
圖3 兩次差分后的序列圖和原數(shù)對比圖
圖4 原始數(shù)據(jù)和標準化處理后對比圖
(2)預測模型的識別與定階。ARIMA模型的自相關(guān)和偏相關(guān)函數(shù)如圖5和圖6所示,從圖5和圖6可知,流行性感冒人數(shù)數(shù)據(jù)季節(jié)性波動已被消除,此時可獲得最佳流行性感冒發(fā)病人數(shù)ARIMA的預測模型為ARIMA(0,0,1)。
圖5 自相關(guān)系數(shù)分析圖
圖6 偏相關(guān)函數(shù)
(3)預測模型診斷。利用上述獲得的模型參數(shù)建立模型,得到如圖7所示的AR(5)模型樣本逼近預測曲線和如圖8所示的向前6個時段的預測值與實際值間的對比圖,由圖7和圖8可知,預測圖像與實際圖像很接近,表明得到的ARIMA預測模型是正確的。
圖7 模型樣本逼近預測曲線
圖8 向前6個時段的預測值和實際值對比圖
(4)未來時段的預測。利用ARIMA預測模型預測向前6個時間段的預測值,如圖9所示。
圖9 向前6個時段的預測值
3傳染病的防治策略
對計算機仿真結(jié)果進行分析,預測出傳染病的流行趨勢是隨時間、季節(jié)而推移的。本文研究的傳染病更具季節(jié)性集中趨勢,冬春季呼吸道傳染病的高發(fā)季節(jié)。均在3月~5月和11月至次年1月。根據(jù)預測的數(shù)據(jù),開展有針對性的防治工作,有助于提高防控傳染病的能力。文獻[11]綜合分析了傳染病的危害和防止策略,文中再結(jié)合ARIMA模型進行分析:
(1)正確認識傳染病。傳染病的爆發(fā)與人們對疾病和健康的認識分不開,而傳染病的控制工作是一項長期而漫長的工程。
(2)對患者的管理。在傳染病的控制過程中,首先要注意的是控制傳染源患者是重要的傳染源,對于患者的有效管理是傳染病控制工作是否成功的標準之一首先應(yīng)該做到早發(fā)現(xiàn)、早報告、早隔離和早治療而隔離患者是控制傳染病散播的有效措施。
(3)對接觸者的管理。對接觸者的管理是指對與傳染源有過接觸井有感染可能的人群根據(jù)傳染病防治法的要求采取觀察和隔離的措施,以防傳染病的散發(fā)。
(4)醫(yī)院感染的控制。醫(yī)院是患者最密集的地方,各種病菌存在醫(yī)院,如果殺毒等措施進行不徹底,便可能使患者或工作人員感染其它病菌。
(5)注意傳染病的規(guī)律性。突發(fā)性、季節(jié)性、周期性、非線性的變化。
4結(jié)束語
防止傳染病疫情的發(fā)生,直接關(guān)系到人民健康、經(jīng)濟發(fā)展和社會穩(wěn)定,本文對傳染病發(fā)生的特點進行了分析,利用傳染病過去和當前觀測值構(gòu)成的時間序列,指出具有隨時間變化的運動演變規(guī)律,進而提出一種基于ARIMA的傳染病預測模型,并通過對某市2013年流行性感冒人數(shù)進行了預測,實驗結(jié)果表明,本文提出的傳染病預測模型綜合考慮了傳染病變化趨勢、周期性和突發(fā)生等特點,預測精度高、結(jié)果可靠,結(jié)果說明 ARIMA方法可用于傳染病流行趨勢的預測。本文所研究的傳染病的預測適合用ARIMA模型,ARIMA模型對該傳染病擬合精度和預測效果均較為滿意。根據(jù)預測的數(shù)據(jù),開展有針對性的防治工作,有助于提高防控呼吸道傳染病的能力。
參考文獻
[1]陳田木,劉如春,謝知,等.流行性感冒數(shù)學建模研究進展[J].中國熱帶醫(yī)學,2014(7):890-894.
[2]趙肖肖,朱寧,黃黎平.基于ARIMA模型的時間序列建模算法和實證分析[J].桂林電子科技大學學報,2012(5):410-415.
[3]熊志斌.基于ARIMA與神經(jīng)網(wǎng)絡(luò)集成的GDP時間序列預測研究[J].數(shù)理統(tǒng)計與管理,2011(2):306-314.
[4]張韜,張興裕,劉元元,等.基于ARIMA模型的Kalman濾波算法在淋病發(fā)病率預測的應(yīng)用初探[J].現(xiàn)代預防醫(yī)學,2013,40(16):2958-2961.
[5]龔國勇.ARIMA模型在深圳GDP預測中的應(yīng)用[J].數(shù)學的實踐與認識,2008(4):53-57.
[6]童明榮,薛恒新,林琳.基于季節(jié)ARIMA模型的公路交通量預測[J].公路交通科技,2008(1):124-128.
[7]王耕,王嘉麗,蘇柏靈.基于ARIMA模型的遼河流域生態(tài)足跡動態(tài)模擬與預測[J].生態(tài)環(huán)境學報,2013(4):632-638.
[8]童明榮,薛恒新,林琳.基于季節(jié)ARIMA模型的公路交通量預測[J].公路交通科技,2008(1):124-128.
[9]魏巍,鄒紅文.基于Matlab的傳染病動力學模型仿真平臺[J].微計算機信息,2007(34):198-199,270.
[10]胡樹煜.傳染病預測的建模與計算機仿真研究[J].計算機仿真,2011(12):184-187.
[11]陳啟軍,陳越,杜生明.論傳染病的危害及我國的防治策略[J].中國基礎(chǔ)科學,2005(6):19-30.