李 標 李雪梅 古麗斯
深圳市鹽田區(qū)疾病預防控制中心,深圳鹽田 518000
為增加手足口病防控工作的主動性和預見性,及時、科學地對手足口病的發(fā)病趨勢進行預測是很重要的。[1]時間序列分析法中的自回歸滑動平均混合模型是由博克思(Box)和詹金斯(Jenkins)于70年代初提出的著名時間序列預測方法,近年來由于其在公共衛(wèi)生領(lǐng)域良好的適用性而逐漸被廣大學者重視[2]。
數(shù)據(jù)源于中國法定傳染病報告系統(tǒng)—“中國疾病預防控制信息系統(tǒng)”,選取現(xiàn)住址為深圳市鹽田區(qū),發(fā)病日期為2008年1月1 日—2014年4月30 日的所有臨床診斷和實驗室確診手足口病病例。人口數(shù)來源于每年深圳市鹽田區(qū)統(tǒng)計局公布的人口數(shù)。
AR IMA 模型的基本思想是:將預測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機序列,用一定的數(shù)學模型來近似描述這個序列。這個模型一旦被識別后就可以從時間序列的過去值及現(xiàn)在值來預測未來值。其中ARIMA(p,d,q)稱為差分自回歸移動平均模型,AR 是自回歸,p 為自回歸項;MA 為移動平均,q 為移動平均項數(shù),d 為時間序列成為平穩(wěn)序列所做的差分次數(shù)(階數(shù))。
所有試驗數(shù)據(jù)均使用SPSS 19.0 軟件包處理,并確保準確無誤。組間的差異以P<0.05 表示具有統(tǒng)計學意義。
繪制2008年1月—2014年4月深圳市鹽田區(qū)手足口病發(fā)病率的時間序列圖,時間單位定義為年月型,起始點為2008年1月。結(jié)果顯示,總體線性趨勢不明顯,5~6月,9~10月出現(xiàn)明顯季節(jié)性高峰。提示原始序列非平穩(wěn)序列,進行一階逐期差分和一階季節(jié)差分后,得到一個基本穩(wěn)定的序列。
圖1 深圳市鹽田區(qū)2008年1月—2014年4月手足口病發(fā)病率的時序圖
圖2 原始序列1 階差分,1 階季節(jié)性差分后的自相關(guān)及偏相關(guān)圖
嘗試建立ARIMA (p,d,q) (P,D,Q)模型,經(jīng)過前述對數(shù)據(jù)進行一階差分和一階季節(jié)差分的預處理,獲得較平穩(wěn)數(shù)列,因此,d=D=1。自相關(guān)圖顯示(見圖2 左側(cè)),所有階以后函數(shù)值除周期點處外都落入?yún)^(qū)間內(nèi),所以q 取為0,而12 函數(shù)不為0,可以取Q 為1。
偏自相關(guān)圖(見圖2 右側(cè)),可取p 為0,而12 階函數(shù)不為0,P 可以取0 或1。綜合序列自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì),初步選定ARIMA(0,1,0)(1,1,1)12 或ARIMA(0,1,0)(0,1,1)12。
圖3 殘差自相關(guān)函數(shù)分析
通過比較平穩(wěn)的R2,BIC,LB 檢驗統(tǒng)計量,模型ARIMA(0,1,0)(0,1,1)12 的BIC=6.066,在擬合比較的模型中最小,故選定為最佳模型。模型的參數(shù)估計值有統(tǒng)計學意義。(見表1)殘差白噪聲檢驗,自相關(guān)系數(shù)均在95%可信區(qū)間,提示用該模型進行預測是合理的。(見圖3)4.擬合曲線與預測效果評價
用模型ARIMA (0,1,0)(0,1,1)12 對2013年9月—2014年4月各月發(fā)病率進行擬合,并用實際發(fā)病率進行比較,相對誤差的中位數(shù)為0.71,各月相對誤差以2013年11月最大,為6.09.提示模型雖可用于對深圳鹽田區(qū)手足口病發(fā)病趨勢進行預測,但是個別月份預測的精度仍存在較大誤差。
表1 2013年9月—2014年4月手足口病實際發(fā)病率與預測發(fā)病率比較
以2008年1月—2014年4月深圳鹽田區(qū)手足口病發(fā)病率數(shù)據(jù)為基礎(chǔ),用模型ARIMA (0,1,0)(0,1,1)12 對2014年5~12月該地區(qū)手足口病發(fā)病率進行預測,結(jié)果顯示5~6月會出現(xiàn)高峰,分別為76.48/10 萬和61.25/10 萬。9~10月有個小高峰,分別為45.04/10 萬和44.93/10 萬。(見圖4),見表2。
表2 2014年12月手足口病發(fā)病率預測情況
圖4 深圳鹽田區(qū)2014年5月—2014年12月手足口病發(fā)病率預測情況
ARIMA 模型是目前應(yīng)用較多的時間序列預測方法之一,它綜合考慮到了疾病的季節(jié)性、周期性、隨機性等可能影響序列平穩(wěn)性的因素,提高了模型的擬合和預測效果,同時借助,模型的參數(shù)進行了量化表達,在傳染病預測中具有廣泛的適用性[2]。彭志行,陶 紅等將ARIMA 模型應(yīng)用于麻疹疫情的預測預警,為防控提供了積極的指導作用[3]。陳莉.運用SPSS 軟件建立ARIMA 模型,很好的擬合了海南省細菌性痢疾的發(fā)病趨勢[4-5]。吳孟泉等應(yīng)用ARIMA 模型對山東省2009年3月30 日—8月30 日手足口病發(fā)病時間序列進行擬合,結(jié)果證明該時間段手足口病發(fā)病率預測值符合實際發(fā)病率的變動趨勢[6]。手足口病具有傳染性強,傳播途徑多,病原學復雜,各病原體間無交互免,患者可多次重復感染等特點,容易在短時間造成大面積流行[1]。因此較準確的預測手足口病的發(fā)病趨勢,及時制定防控措施,對于減少聚集性及暴發(fā)疫情的發(fā)生是非常重要的。
本文利用2008年1月—2013年9月深圳市鹽田區(qū)手足口病發(fā)病資料,通過識別、估計、診斷等過程擬合建立了ARIMA(0,1,0)(0,1,1)12 預測模型。利用2013年10月—2014年4月實際發(fā)病數(shù)與預測發(fā)病數(shù)進行比較,實際值與預測值相對誤差的中位數(shù)為71%,實際值均落入95%可信區(qū)間,提示手足口病的發(fā)病無異常增高,且發(fā)病的趨勢與實際情況基本一致。表明利用ARIMA 模型預測深圳市鹽田區(qū)手足口病發(fā)病趨勢的可行性。另一方面也顯示了預測的實用性和應(yīng)用價值,根據(jù)發(fā)病率既往的變化規(guī)律(線性趨勢、季節(jié)性、周期性等),如果實際發(fā)病率在預測值95%可信區(qū)間范圍內(nèi)波動,表明當月疫情基本正常,如果超出預測值95%可信限范圍,應(yīng)提示并警惕傳染病的暴發(fā)或流行的可能,可以為傳染病預警預報及干預提供依據(jù)[6-7]。根據(jù)預測結(jié)果,2014年5~12月深圳市鹽田區(qū)手足口病的發(fā)病率有2 個高峰,分別為5~6月,9~10月,提示在此期間,需重點做好手足口病的防控,尤其是加強與托幼機構(gòu)、醫(yī)療機構(gòu)的聯(lián)防聯(lián)控,較少聚集性或暴發(fā)疫情的發(fā)生。
本次研究所建立的模型只是對深圳市鹽田區(qū)2014年手足口病發(fā)病率的預測模型,而對今后幾年的預測,應(yīng)該在不斷收集新的數(shù)據(jù)基礎(chǔ)上,再對其修訂或重新建模[8-10]。因為手足口病的發(fā)病率受到諸多未知隨機因素的影響,所建立的模型更適合進行短期的預測,
[1]蔡小虹,萬秋萍,吳益生,等ARIMA 模型預測上海市打閘北區(qū)手足口病發(fā)病趨勢[J].實用預防醫(yī)學,2012,19(3):381-384.
[2]彭志行,鮑昌俊,趙揚,等.ARIMA 乘積季節(jié)模型及其在傳染病發(fā)病預測中的應(yīng)用[J].數(shù)理統(tǒng)計與管理,2008,27(2) :365-367.
[3]彭志行,陶紅,賈成梅,等.時間序列分析在麻疹疫情預測預警中的應(yīng)用研究[J].中國衛(wèi)生統(tǒng)計,2010,10(27):459-461.
[4]馮丹,韓曉娜,趙文娟,等.中國內(nèi)地法定報告?zhèn)魅静☆A測和監(jiān)測的ARIMA.模型[J].疾病控制雜志,2007,11(2):140-143.
[5]陳莉.探討ARIMA 模型在細菌性痢疾發(fā)病預測中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計,2011,8(28):417-419.