惠石生 馬瑩 尚成英 杜瑞
摘要:目的:應用自回歸移動平均模型預測全國流行性腮腺炎月發(fā)病數(shù)。方法:運用Eviews 8.0軟件對2013年10月至2018年10月的腮腺炎發(fā)病數(shù)構(gòu)建乘積季節(jié)ARIMA模型,以2018年11月至2019年10月的數(shù)據(jù)作為檢驗樣本,對模型的預測效果進行檢驗,再用所建模型預測2019年11月至2020年10月的全國腮腺炎月發(fā)病數(shù)。結(jié)果:通過對序列的平穩(wěn)化、模型的識別、建立和診斷,建立ARIMA(3,1,2)x(l,1,1)12模型,該模型擬合效果顯示,調(diào)整的R2為0.905,AIC值為-3.920,預測值與實際值的平均絕對誤差為-561例,平均相對誤差為4.59%。結(jié)論:ARIMA(3,1,2)x(1,1,1)12模型能較好地擬合全國腮腺炎月發(fā)病數(shù)的變化趨勢,可用于我國腮腺炎的短期預測和動態(tài)分析。
關(guān)鍵詞:流行性腮腺炎;自回歸移動平均模型;預測
中圖分類號:R512.1
文獻標志碼:A
流行性腮腺炎(Mumps)簡稱腮腺炎,是由腮腺炎病毒感染引起的一種急性呼吸道傳染病,多發(fā)于兒童和青少年,很容易在學校和托幼機構(gòu)中暴發(fā)/流行,會產(chǎn)生較大的社會影響[1,2]。本病患者臨床表現(xiàn)較輕,部分患者可伴隨或單獨發(fā)生腦膜炎、胰腺炎、睪丸炎或卵巢炎等,嚴重者甚至致殘或死亡,發(fā)病后尚無特效的治療藥物,當前對其防控的最有效手段是免疫接種[3]。據(jù)蔣蕊鞠等人研究發(fā)現(xiàn)[4],2004年- 2018年全國共報告腮腺炎病例4 272 368例,年平均報告發(fā)病率為21.44/10萬,且在麻疹一腮腺炎一風疹聯(lián)合減毒活疫苗納入免疫規(guī)劃前后腮腺炎報告發(fā)病率無明顯變化。另外本病暴發(fā)疫情較多,年暴發(fā)疫情事件數(shù)始終排在39種法定傳染病的第1位,腮腺炎暴發(fā)疫情在我國依然較為嚴重[5]。因此對其發(fā)病數(shù)預測便顯得十分重要。本研究采用季節(jié)性差分自回歸移動平均模型( AutoregressiveIntegrated Moving Average Model,ARIMA模型)對全國腮腺炎月發(fā)病數(shù)預測效果進行分析,觀察其預測效果,得出結(jié)論。
1 資料與方法
1.1 資料來源
全國腮腺炎月發(fā)病數(shù)數(shù)據(jù)來源于中國疾病預防控制中心網(wǎng)站中關(guān)于“法定傳染病報告”數(shù)據(jù),收集時間從2013年10月至2019年10月,數(shù)據(jù)收集地區(qū)為全國31個省市自治區(qū)(不含香港、澳門特別行政區(qū)和臺灣地區(qū))。病例類型包括臨床診斷病例和實驗室確診病例。
1.2 ARIMA模型基本思想
自回歸積分滑動平均模型是由Box和Jenkins于20世紀70年代初提出的一種時間序列預測方法。而季節(jié)性ARIMA模型是ARIMA模型中最高級的一種,它充分考慮了時間序列的趨勢性和季節(jié)性變化,并將影響傳染病發(fā)生的社會、醫(yī)學、自然等各種因素的綜合效應統(tǒng)一蘊涵于時間變量中進行分析,短期預測的準確性較好。
1.3 ARIMA模型建模過程
標準的SARIMA模型為ARIMA(p,d,q)X(P,D,Q)s,其中p.d、q分別表示非季節(jié)性自回歸階數(shù)、差分階數(shù)和移動平均階數(shù),P、D、Q分別表示季節(jié)性自回歸階數(shù)、差分階數(shù)和移動平均階數(shù),S表示季節(jié)性周期。乘積季節(jié)ARIMA模型的建立包括序列的平穩(wěn)化處理、模型的識別、參數(shù)估計和檢驗、模型的診斷檢驗和模型預測五步。其中模型平穩(wěn)化處理包括差分和數(shù)據(jù)轉(zhuǎn)換等方式,而參數(shù)估計采用最小二乘法或極大似然法進行,再應用模型決定系數(shù)平穩(wěn)R2、貝葉斯準則(SBC)等對初步選定的模型進行評價,其中R2越大越好,AIC值越小模型越好,采用Box-Ljung Q檢驗法對選定模型殘差是否為白噪聲進行檢驗,若Q值對應的P>0.05,提示是白噪聲序列;模型的預測包括模型的擬合效果驗證和預測。
1.4 統(tǒng)計學分析方法
首先用Excel 2003軟件建立數(shù)據(jù)庫,以月為時間單位匯總2013年10月至2019年10月腮腺炎的發(fā)病數(shù),采用Eviews 8.0軟件進行ARIMA模型的建立和預測,其中以2013年10月到2018年10月的腮腺炎發(fā)病數(shù)建立備選模型,以2018年11月至2019年10月的數(shù)據(jù)作為檢驗樣本,檢驗模型的預測精確度,最后運用最優(yōu)模型預測2019年11月至2020年10月的腮腺炎月發(fā)病數(shù)。
2 結(jié)果
2.1 2013年10月至2018年10月全國腮腺炎月發(fā)病數(shù)趨勢
從圖1可以看出該序列無離群點和缺失值,從2013年10月至2018年10月全國腮腺炎月發(fā)病數(shù)波動較大,具有明顯的季節(jié)性周期,表現(xiàn)為每年的4月~7月和11月~次年1月兩個發(fā)病高峰,說明該序列具有周期性季節(jié)特點,是不平穩(wěn)的時間序列,需要對其進行平穩(wěn)化處理。
2.2 序列的平穩(wěn)化處理與檢驗
首先對數(shù)據(jù)進行了一次自然對數(shù)轉(zhuǎn)換,使該序列的方差平穩(wěn)下來,再進行一次非季節(jié)性差分和一次季節(jié)性差分,之后觀察處理后的序列圖(如圖2所示)。從圖2可以看出,差分后的序列雖然仍有些波動,但其均值基本在0上下擺動,之后又對差分后的數(shù)據(jù)序列采用ADF檢驗法進行單位根檢驗,發(fā)現(xiàn)ADF檢驗的統(tǒng)計量t=-6.493,P=O.OOO,說明經(jīng)過變換后的序列平穩(wěn),可以進行建模。
2.3 模型定階及建立
2.3.1 模型定階
由于本次研究首先對原始數(shù)列進行了一次非季節(jié)性差分和一次季節(jié)性差分,所以初選模型為ARIMA(p,1,q)X(P,l,Q)12,然后對差分后的自相關(guān)函數(shù)(ACF)圖和偏自相關(guān)函數(shù)(PACF)圖(如圖3所示)進行觀察,并根據(jù)簡潔原則,使得所建模型對數(shù)據(jù)的收集、處理及過多參數(shù)帶來的干擾和誤差最不敏感,來確定模型參數(shù)[6]。本次研究選取p和q的取值范圍為1-3,從低階至高階逐一進行試驗。另外根據(jù)《現(xiàn)代醫(yī)學統(tǒng)計學》(方積乾,陸盈,人民衛(wèi)生出版社,2002)的介紹[7],P和Q超過2階的情況很少見,故本研究對P和Q分別取0,1,2進行逐個試驗,根據(jù)模型的參數(shù)及模型總體的顯著性、擬合優(yōu)度等進行比較,選擇最佳模型。
[2]湯健聞,柳智豪,我國流行性腮腺炎流行概況及其免疫預防[J].微生物學免疫學進展,2015,43(3):51-57.
[3]朱洪坤.流行性腮腺炎46例的流行病學及臨床特征分析[J].中華傳染病雜志,2014,32( 11):690-691.
[4]蔣蕊鞠,殷瓊洲,徐明玨,等.2004 - 2018年全國流行性腮腺炎發(fā)病特征及重點防控人群分析[J].中國當代兒科雜志,2019,21(5):441-444.
[5]鐘貴良,林希建,劉姝.2008-2012年長沙市流行性腮腺炎流行病學特征分析[J]中華疾病控制雜志,2014,18(2):120-122.
[6]李欣陽,李素娟,劉曉迪,等,自回歸移動平均乘積季節(jié)模型在甲型肝炎發(fā)病數(shù)中的應用[J].山東大學學報(醫(yī)學版), 2018, 56(12): 103-108.
[7]方積乾,陸盈.現(xiàn)代醫(yī)學統(tǒng)計學[M].北京:人民衛(wèi)生出版社,2002.
[8]費方榮,馮錄召,許真,等.2008-2010年中國流行性腮腺炎流行病學特征分析[J].疾病監(jiān)測,2011,26(9):691- 693.
[9] Zamir CS. Schroeder H,Shoob H,et al.Characteristics of alarge mumps outbreak: clinical severity, Complications andassociation with vaccination status of mumps outbreak cases[J]. Hum Vacc.in Immunother, 2015, 11(6):1413-1417.
[10]惠石生,陳立章,劉富強,等.乘積季節(jié)自回歸積分滑動平均模型在流行性腮腺炎發(fā)病率預測中的應用[J].中華預防醫(yī)學雜志,2015,49(12):1042-1046.
[11]沈忠周,馬帥,曲翌敏,等.ARIMA模型在我國法定傳染病報告數(shù)中的應用[J].中華流行病學雜志,2017,38(12):1708-1712.
[12]胡詠梅,郝利新,王華慶.中國2010 - 2012年流行性腮腺炎流行病學特征分析[J]。中國疫苗和免疫,2014,20(2):127-131.
[13]言晨綺,王瑞白,劉海燦,等.RIMA模型預測2018-2019年我國肺結(jié)核發(fā)病趨勢的應用[J].中華流行病學雜志,2019,40(6):633-637.
[14]楊小兵,汪鵬,江高峰.ARIMA乘積季節(jié)模型在流行性腮腺炎發(fā)病率預測中的應用[J].公共衛(wèi)生與預防醫(yī)學,2013,24(6):39-42.
[15]石雷.細菌性痢疾月發(fā)病率ARIMA季節(jié)模型預測分析[J].中國公共衛(wèi)生,2014,30(9):1234-1235.
作者簡介:惠石生(1987-),男,回族,甘肅平?jīng)鋈?,碩士,講師,主要從事流行病與衛(wèi)生統(tǒng)計學研究。