李桂芹 黃立勇 覃鳳芝
(1.首都醫(yī)科大學附屬北京朝陽醫(yī)院疾病預防控制處, 北京 100020; 2.北京市朝陽區(qū)疾病預防控制中心流行病與地方病控制科,北京 100021; 3.廈門大學公共衛(wèi)生學院, 廈門 361102)
流行性感冒(簡稱流感),是由流行性感冒病毒(簡稱流感病毒)引起的急性呼吸道傳染病,是首個實行全球性監(jiān)測的傳染病。流感的流行期間,因流感或流感樣病例導致的門診就診量和住院率明顯上升,加重醫(yī)療衛(wèi)生服務的壓力,如2009年的甲型H1N1流感大流行導致約180萬人感染,數十萬流感樣病例超額就診[1]。目前,流感樣病例監(jiān)測已成為流感監(jiān)測早期預警的重要方法之一[2]。首都醫(yī)科大學附屬北京朝陽醫(yī)院作為北京市流感樣病例監(jiān)測的哨點醫(yī)院和流感病原學監(jiān)測的國家級哨點醫(yī)院,每年接診的流感樣病例患者及報告的確診流感病例數占北京市朝陽區(qū)26家哨點監(jiān)測醫(yī)院的比例均逐步升高。
北京市疾病預防控制中心張莉等[2]研究流感樣病例和流感病原學監(jiān)測間具有良好的相關性。因此,為研究適用于醫(yī)院的流感樣病例預測模型,有效調整醫(yī)療資源配置,做好流感防控工作,筆者選擇2014至2017年首都醫(yī)科大學附屬北京朝陽醫(yī)院流感樣病例數據開展差分整合移動平均自回歸模型(autoregressive integrated moving average model,ARIMA)研究。
流感樣病例是指發(fā)熱(腋下體溫≥38 ℃),伴咳嗽或咽痛之一者。首都醫(yī)科大學附屬北京朝陽醫(yī)院作為首批國家級流感監(jiān)測哨點醫(yī)院較早地開展了流感樣病例監(jiān)測工作,每日按照監(jiān)測方案分診室(內科門診、急診和小兒內科門診、急診以及發(fā)熱門診)、分年齡組(0~4歲、5~14歲、15~24歲、25~59歲、60歲以上)進行流感樣病例數和門(急)診就診總數的統(tǒng)計,并于每日12∶00時之前報告至中國流感監(jiān)測信息系統(tǒng)。
按日導出2014年1月12日至2017年12月24日間本院報告的流感樣病例、門(急)診就診總數、流感樣病例百分比數據,并按周進行匯總。
ARIMA模型的基本原理是將時間序列視為一組依賴于時間(t)的隨機變量,其中單個序列值的出現(xiàn)具有不確定性,但整個序列的變化卻呈現(xiàn)一定的規(guī)律性[3-5]。 ARIMA包含3種基本模型形式:①移動平均模型MA(q),q為計算移動平均數時包括的歷史數據個數;②自回歸模型AR(p),p為計算自回歸時包括的歷史數據個數;③差分值(d)。模型的識別就是確定這3個參數;參數估計就是確定各過程的內部系數;最后模型診斷就是判斷通過前兩步所建立的模型是否與實際數據相吻合。
模型構建步驟為:①用單位根檢驗[6](unit root test)判斷前194周數據的平穩(wěn)性,確定差分數(d)。ARIMA要建立在平穩(wěn)序列之上,若單位根檢驗拒絕原假設,表明數據平穩(wěn);若單位根檢驗接受原假設,則通過對數據進行差分的方式使數據平穩(wěn);②模型識別與估計。根據自相關函數、偏自相關函數圖、赤池信息準則(akaike information criterion,AIC)和調整決定系數[7]來識別最佳的p、q值;③模型診斷[7]。對殘差進行Q檢驗,檢驗殘差的自相關性,若殘差無自相關,則表示模型擬合較好;④模型擬合與預測。用ARIMA模型對所分析的194周數據進行擬合,并對最后12周的流感樣病例百分比進行預測。
利用Excel 2013匯總流感樣病例數據,并利用Eviews 9.0軟件開展ARIMA模型的擬合預測。
2014年1月12日至2017年12月24日,本院監(jiān)測科室門(急)診就診總數為1 368 676例次,其中流感樣病例數為126 124例(9.22%)。0~4歲為26 312例,5~14歲為26 518例,15~24歲為16 372例,25~59歲為43 441例,60歲以上為13 481例。流感陽性毒株檢出率為8.80%。監(jiān)測結果中5~14歲與25~59歲人群流感樣病例發(fā)病數占有較高比例,分別為21.03%和34.44%。
由表1 可以看出本院報告流感病例的高峰和流感樣病例的就診高峰并不完全一致,需要更加確定的方法來預測,筆者特采用ARIMA模型來進行分析判斷。
繪制2014年至2017年流感樣病例(influenza-like illness, ILI)百分比的時間序列分析圖(圖1),可以看出ILI%在每年的年末和次年的年初有峰值,但是高峰出現(xiàn)的時間和持續(xù)時間并不規(guī)律。
表1 2014年至2017年首都醫(yī)科大學附屬北京朝陽醫(yī)院流感報告及藥物儲備情況Tab.1 Influenza cases report and drug reserve of Beijing Chaoyang Hospital, Capital Medical University during 2014 to 2017
圖1 2014年至2017年首都醫(yī)科大學附屬北京朝陽醫(yī)院ILI的時間序列圖Fig.1 Time series of ILI% of Beijing Chaoyang Hospital, Capital Medical University during 2014 to 2017ILI:influenza-like illness.
用單位根檢驗分析序列的平穩(wěn)性,結果顯示,單位根拒絕原假設,即序列平穩(wěn),確定序列差分值d為0(表2)。
表2 單位根檢驗結果Tab.2 Unit root test results
偏相關函數和自相關函數如圖2所示,偏相關函數在P=2或者P=4時截尾,而自相關函數不截尾,由此建立ARIMA(2,0,0)和ARIMA(4,0,0)模型,根據AIC值和調整決定系數(表3)選擇兩個模型的最優(yōu)值,結果顯示,在將P值增大到4時,AIC值幾乎沒有變化,并且ARIMA(2,0,0)模型的調整決定系數較ARIMA(4,0,0)的大,由此選擇ARIMA(2,0,0)建模。模型可以寫成如下公式:yt=8.25 + 1.13yt-1-0.23yt-2+εt。
根據模型計算表3所示,該模型的一階滯后函數和二階滯后函數的系數差異均有統(tǒng)計學意義。
使用Q統(tǒng)計量(Q-statistics)對模型殘差自相關性進行檢驗,殘差無自相關,說明模型合適(圖3)。
圖4表示用模型對數據進行擬合,結果顯示模型對數據擬合效果較好,真實值與擬合值變化趨勢基本沒有很大差別。
圖5顯示,模型預測的數值比較平穩(wěn),真實值在模型預測值的95%置信區(qū)間內,但是可以注意到隨著預測期數的增加,預測值95%置信區(qū)間也越大,說明預測誤差逐步擴大,從2017年第48周起,真實值迅速升高,51周的真實值已高于95%置信區(qū)間上限,提示進入流感流行高峰期。
表3 ARIMA(2,0,0)模型建模結果Tab.3 ARIMA (2,0,0) model modeling results
圖2 自相關函數與偏相關函數Fig.2 Autocorrelation function and partial correlation function
圖3 殘差自相關檢驗Fig.3 Residual autocorrelation testAC:actocorrelation; PAC:partial correlation.
圖4 首都醫(yī)科大學附屬北京朝陽醫(yī)院ILI%的模型擬合值與真實值對比Fig.4 Comparison of model fit values and true values of ILI% in Beijing Chaoyang Hospital, Capital Medical University ILI: influenza-like illness.
圖5 2017年第41周至52周 模型預測值與真實值Fig.5 Model predictions and real values during 41 to 52 week, 2017ILI:influenza-like illness.
用于預測的模型有很多,包括指數平滑法、線性回歸法、自回歸分析、馬爾可夫模型、ARIMA模型等,ARIMA模型是時間序列分析中最重要的模型之一,目前廣泛應用于流感、猩紅熱、結核病等傳染病發(fā)病率的預測[3-4,8-9]。由于流感診斷多為臨床診斷病例,在高峰季節(jié),流感的臨床診斷很容易受到人為因素的影響,有時監(jiān)測的流感疫情數據短期內呈現(xiàn)出大范圍波動[10]。流感樣病例的定義相對簡單、客觀,更能夠反映出因罹患呼吸道疾病而就診的趨勢變化。此外,Zambon等[11]研究發(fā)現(xiàn),在流行高峰期,流感病毒和呼吸道合胞病毒感染的ILI超過90%。因此利用流感樣病例數據可以很好地預測包括流感在內的多種呼吸道傳染病的流行趨勢。
本研究利用2014年至2017年流感樣病例數據擬合的模型中預測值與實際值在短期內較為吻合,并且可以根據ARIMA模型預測值的95%置信區(qū)間值與真實值的變化確定流感流行期。這對于呼吸道疾病流行期間配置醫(yī)務人員及藥品儲備等方面有很好的實際應用價值[12],2014年至2017年間,首都醫(yī)科大學附屬北京朝陽醫(yī)院有40 d的抗病毒藥物(磷酸奧司他韋)的實時儲備量為0,其中28 d處于流感流行期間,因此可以考慮根據預測值結果,對流感進行分析和判斷,掌握疫情流行特征,指導醫(yī)院制定應對措施更好地進行流感防控工作,同時也可以對醫(yī)院儲備抗病毒藥物的量進行實時調控,保證及時足量的用藥需求。
在實際應用過程中,為了保證和提高預警預測的效果,需要收集最新的流感樣病例數據并對數據重新進行模型擬合,以修正或重新擬合數據,來反映實際情況的流感預測模型。