袁永旭,宋立群,吳文婧,李 黛,尚有為,于 琦
手足口?。╤and-foot-mouth disease,HFMD)是一種兒童常見的傳染性疾病,是由人腸道病毒(human enterovirus,HEV)為主要病原體引起的傳染病,多發(fā)生于5 歲及以下兒童。HEV 類型眾多,同種型的病毒通??梢詫?dǎo)致多種病癥或疾病,其中以柯薩奇病毒A 組16 型(CoxA16 型)和腸道病毒71 型(EV71 型)最為常見[1]。手足口病的主要臨床表現(xiàn)為經(jīng)常性的口痛,手部、足部、口腔等小皰疹感染及潰瘍,絕大多數(shù)患者約1 周即可基本治愈。有報(bào)道個(gè)別重癥兒童病情的進(jìn)展速度快,可致死亡[2]。我國(guó)于2008 年將手足口病納入丙類傳染?。?],2016 年中共中央、國(guó)務(wù)院印發(fā)了《“健康中國(guó)2030”規(guī)劃綱要》[4],要求加強(qiáng)重大傳染病的防控,改革并完善傳染病監(jiān)測(cè)預(yù)警機(jī)制,進(jìn)一步擴(kuò)大國(guó)家免疫規(guī)劃。我國(guó)的首個(gè)腸道病毒71 型(EV71 型)疫苗第1 期的臨床研究試驗(yàn)疫苗已于2016 年春季上市,是我國(guó)唯一的可用于防治兒童手足口病的疫苗[5]。同時(shí),為適應(yīng)社會(huì)對(duì)聯(lián)合疫苗與多價(jià)疫苗研發(fā)的需求,中國(guó)食品藥品檢定研究院完成了柯薩奇病毒A 組16 型(CA16 型)疫苗國(guó)家抗原標(biāo)準(zhǔn)品的研制[5],但就目前情況來(lái)看仍然缺乏有效的臨床治療藥物,各地居民對(duì)腸道病毒71 型(EV71)疫苗的認(rèn)識(shí)也仍然處于較低水平[6]。因此,手足口病防控形勢(shì)嚴(yán)峻,不容小覷[7]。
國(guó)內(nèi)學(xué)者對(duì)各省市手足口病進(jìn)行了不同方向的研究。有學(xué)者通過(guò)采集上海市寶山區(qū)2015-2016年手足口病標(biāo)本進(jìn)行實(shí)驗(yàn)室檢測(cè)和數(shù)據(jù)聚類分析,對(duì)上海市手足口病的發(fā)病時(shí)間與特征進(jìn)行了有依據(jù)的推斷預(yù)測(cè)[8];有學(xué)者根據(jù)沈陽(yáng)市2008-2017年手足口病的流行特點(diǎn)及趨勢(shì),采用描述流行病學(xué)的方法對(duì)沈陽(yáng)市手足口病疫情流行發(fā)病率進(jìn)行了分析[9]。近年來(lái),山西省手足口病發(fā)病率呈平穩(wěn)略下降趨勢(shì),但防控形勢(shì)仍然非常嚴(yán)峻,全省各縣市均出現(xiàn)了不同程度的流行情況。山西省衛(wèi)生和計(jì)劃生育委員會(huì)在防治手足口病新聞通氣會(huì)上表示,本省的手足口病病例主要分布在太原市、晉中市等地,其原因可能為城市人口密度過(guò)大、人群跨地區(qū)流動(dòng)頻繁、國(guó)家三胎政策開放后新生兒數(shù)量增多,但針對(duì)兒童的醫(yī)療衛(wèi)生措施未有效實(shí)施,城市改造建設(shè)發(fā)展增快導(dǎo)致環(huán)境惡化,從而造成手足口病的持續(xù)高發(fā)[10]。因此,對(duì)手足口病發(fā)病率趨勢(shì)的預(yù)測(cè)就顯得尤為重要。本文基于山西省2007-2017年手足口病的月發(fā)病率數(shù)據(jù),利用差分整合移動(dòng)平均自回歸模型(autoregressive integrated moving average model,ARIMA)進(jìn)行匯總分析,預(yù)測(cè)山西省2022-2023 年手足口病的月發(fā)病率和高發(fā)期,為山西省手足口病的早期預(yù)警與防控提供依據(jù)。
從公共衛(wèi)生科學(xué)數(shù)據(jù)中心(www.phsciencedata.cn)收集下載、整理山西省2007-2018 年手足口病的月發(fā)病率相關(guān)數(shù)據(jù)資料。使用Excel 2019 軟件建立樣本數(shù)據(jù)庫(kù)和整合預(yù)測(cè)數(shù)值表,利用R4.0.0 軟件進(jìn)行數(shù)據(jù)處理及繪圖,并查閱山西省疾病預(yù)防控制中心相關(guān)資訊和統(tǒng)計(jì)信息,補(bǔ)充2019-2021 年未公示數(shù)據(jù)帶來(lái)的預(yù)測(cè)缺失部分,所獲得的數(shù)據(jù)一律保留4 位小數(shù),數(shù)據(jù)真實(shí)、可靠。然后,利用山西省2007-2017 年手足口病的月發(fā)病率數(shù)據(jù)建立相關(guān)模型并進(jìn)行擬合外推,以2018 年實(shí)際發(fā)病率數(shù)據(jù)檢驗(yàn)所建立模型的預(yù)測(cè)效果,進(jìn)一步佐證模型精度。
ARIMA 模型為差分集成移動(dòng)(又稱“滑動(dòng)”)平均自回歸模型,也叫“博克斯-詹金斯模型”[11]。其建模過(guò)程可分為4 步:序列平穩(wěn)性檢驗(yàn)及平穩(wěn)化處理、模型識(shí)別、參數(shù)估計(jì)、模型檢驗(yàn)及預(yù)測(cè)。該模型簡(jiǎn)單靈活,被廣泛應(yīng)用于傳染性疾病、呼吸系統(tǒng)疾病等的發(fā)病率預(yù)測(cè)研究[12]。
將用軟件推算出的模型與山西省2007-2018 年手足口病的月發(fā)病率實(shí)際數(shù)據(jù)進(jìn)行對(duì)比,并進(jìn)行擬合圖像分析,根據(jù)對(duì)比結(jié)果,采用平均絕對(duì)誤差評(píng)價(jià)模型精度,誤差數(shù)值越小表示模型預(yù)測(cè)能力越強(qiáng)。
采集2007 年1 月至2017 年12 月共132 個(gè)月的山西省手足口病月發(fā)病率數(shù)據(jù)(表1)。
表1 山西省2007-2017 年手足口病月發(fā)病率(1/10 萬(wàn))
根據(jù)表1 數(shù)據(jù),利用R 軟件建立2007-2017年山西省手足口病月發(fā)病率時(shí)序圖(圖1)。圖1顯示,山西省手足口病月發(fā)病率有明顯的周期性和趨勢(shì)性,且月報(bào)告病例總數(shù)整體呈現(xiàn)上升趨勢(shì),呈現(xiàn)周期性波動(dòng)上升的特點(diǎn),其中2009 年、2012 年、2014 年為高發(fā)年,但上升或下降幅度不大。
圖1 山西省2007-2017 年手足口病月發(fā)病率的時(shí)序圖
2.2.1 序列平穩(wěn)性檢驗(yàn)及平穩(wěn)化處理
為觀察原始數(shù)據(jù)的趨勢(shì),利用代碼df-ts-stl<-decompose(train)plot(df-ts-stl)將時(shí)間序列進(jìn)行季節(jié)性分解。從時(shí)間序列的分解圖上看,山西省手足口病月發(fā)病率的趨勢(shì)性和周期性占比相當(dāng),并且周期性十分明顯(圖1、圖2)。
圖2 山西省2007-2017 年手足口病月發(fā)病率的時(shí)間序列季節(jié)性分解圖
如圖2 所示,山西省手足口病的月發(fā)病率數(shù)據(jù)存在較為明顯的規(guī)律性和周期性,但部分趨勢(shì)呈無(wú)序狀,無(wú)法認(rèn)定其為平穩(wěn)序列,故判定其為非季節(jié)性ARIMA 模型,不能直接進(jìn)行ARIMA 模型的模型識(shí)別與參數(shù)統(tǒng)計(jì)。所以下面要對(duì)原始時(shí)間序列進(jìn)行一階差分,消除對(duì)其不平穩(wěn)規(guī)律性和周期性的影響,實(shí)現(xiàn)序列的平穩(wěn)化處理。
原始時(shí)間序列一階差分后的時(shí)間序列圖、自相關(guān)圖和偏自相關(guān)圖如圖3、圖4、圖5 所示。
圖3 一階差分后的時(shí)間序列圖
圖4 一階差分后的自相關(guān)圖
圖5 一階差分后的偏自相關(guān)圖
可以看出,差分后的序列整體平穩(wěn),自相關(guān)函數(shù)(autocorrelation function,ACF)和偏自相關(guān)函數(shù)(partial autocorrelation function,PACF)的數(shù)值非顯著為零,然后進(jìn)行單位根檢驗(yàn)得到假定值P為0.01,小于0.05,進(jìn)一步判斷出此時(shí)的序列具有了平穩(wěn)性,說(shuō)明接下來(lái)可以對(duì)一階差分后的序列進(jìn)行ARIMA 的建模與分析。
2.2.2 模型識(shí)別與參數(shù)估計(jì)
根據(jù)以上的整理分析,開始進(jìn)行ARIMA 建模。非季節(jié)性 ARIMA 模型的原始形態(tài)為 ARIMA(p,d,q)(P,D,Q)[12],p、d、q 分別代表自回歸、差分和移動(dòng)平均的階次,這里的P、D、Q 分別代表季節(jié)性的自回歸、差分及移動(dòng)平均的階次,以大寫與非季節(jié)性的p、d、q 進(jìn)行區(qū)分[13]。首先在R 軟件中輸入代碼“fic<-auto.arima(train,ic=”aic”,trace=1)”來(lái)確定p、d、q、P、D、Q 等參數(shù)的值,R 軟件自動(dòng)計(jì)算比較所建立模型中最優(yōu)的一個(gè)。
根據(jù)AIC 最小原則,函數(shù)自動(dòng)識(shí)別模型為ARIMA(2,0,0)(2,1,0)[12]模型,根據(jù)此模型對(duì)R 軟件擬合模型的殘差進(jìn)行隨機(jī)性白噪聲檢驗(yàn),求得假定值P為0.9725,明顯大于0.05,說(shuō)明通過(guò)白噪聲檢驗(yàn);當(dāng)P>0.05 時(shí),擬合殘差項(xiàng)中不再蘊(yùn)含任何相關(guān)信息,擬合模型顯著有效[14]。
2.2.3 模型精度評(píng)價(jià)
利用已建立的最優(yōu)ARIMA(2,0,0)(2,1,0)[12]模型“反向預(yù)測(cè)”2018 年1-12 月的手足口病月發(fā)病率,以實(shí)際值與預(yù)測(cè)值進(jìn)行模型精度對(duì)比評(píng)價(jià)。山西省2018 年手足口病月發(fā)病率的預(yù)測(cè)值與實(shí)際值比較及預(yù)測(cè)精度見表2。
表2 山西省2018 年手足口病月發(fā)病率的預(yù)測(cè)值與實(shí)際值比較及預(yù)測(cè)精度
表2 顯示,2018 年5 月、6 月和8 月絕對(duì)誤差分別為4.5759、7.3613 和2.8540,明顯大于1,說(shuō)明預(yù)測(cè)結(jié)果異常;雖然4 月、7 月、11 月的絕對(duì)誤差分別約為1.6、1.9 和1.7,也大于1,但相較于5月、6 月和8 月絕對(duì)誤差偏小,所以可認(rèn)為除5 月、6 月和8 月外其余9 個(gè)月的絕對(duì)誤差均保持在1左右。山西省衛(wèi)生和計(jì)劃生育委員會(huì)2018 年發(fā)布的相關(guān)數(shù)據(jù)顯示[10],當(dāng)年為手足口病高峰年,整體流行強(qiáng)度高于往年,因此2018 年5 月、6 月和8月的預(yù)測(cè)值與實(shí)際數(shù)值存在相對(duì)大的偏差。
利用代碼R2(pred$mean,test)計(jì)算出R2為0.751 1868,R是相關(guān)系數(shù),R2指擬合優(yōu)度。當(dāng)R2>0.75 時(shí),說(shuō)明模型擬合度很好,該預(yù)測(cè)模型精度較高。
再利用已建立的ARIMA(2,0,0)(2,1,0)[12]模型預(yù)測(cè)山西省2007 年1 月至2018 年12 月手足口病的月發(fā)病率,用2007 年1 月至2018 年12 月的實(shí)際月發(fā)病率數(shù)據(jù)與已預(yù)測(cè)的月發(fā)病率數(shù)據(jù)進(jìn)行趨勢(shì)擬合分析,結(jié)果如圖6 所示。
圖6 山西省2007-2018 年手足口病月發(fā)病率實(shí)際值與模型預(yù)測(cè)值的趨勢(shì)擬合
圖6 顯示,本文建立的ARIMA 預(yù)測(cè)模型所預(yù)測(cè)的山西省2007 年1 月至2018 年12 月手足口病的月發(fā)病率趨勢(shì)與實(shí)際發(fā)病率趨勢(shì)走向整體上大致相同,進(jìn)一步肯定了ARIMA(2,0,0)(2,1,0)[12]模型的可用性和準(zhǔn)確性,因此可以使用該模型預(yù)測(cè)山西省2019-2023 年手足口病月發(fā)病率。
2.2.4 模型預(yù)測(cè)
ARIMA 模型的功能之一是預(yù)測(cè)未來(lái)連續(xù)年份的發(fā)病率,目前大量研究者均用該模型預(yù)測(cè)各種疾病未來(lái)5 年的發(fā)病率。同時(shí),本文將2018 年實(shí)際數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)進(jìn)行對(duì)比,驗(yàn)證結(jié)果顯示模型預(yù)測(cè)值與實(shí)際值契合度較高,因此利用該模型進(jìn)行5年趨勢(shì)外推具有可行性。
用選定的ARIMA(2,0,0)(2,1,0)[12]模型對(duì)山西省2019 年1 月至2023 年12 月份手足口病發(fā)病率進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果見表3。表3 顯示每年6-8月份手足口病的月發(fā)病率仍然高于其他月份,需要在這段時(shí)間內(nèi)加大預(yù)防力度。為更加直觀地說(shuō)明問題,將表格中的預(yù)測(cè)數(shù)據(jù)轉(zhuǎn)換成趨勢(shì)圖(圖7)。
表3 山西省2019-2023 年手足口病發(fā)病率預(yù)測(cè)值(1/10 萬(wàn))
圖7 山西省2019-2023 年手足口病月發(fā)病率預(yù)測(cè)趨勢(shì)
ARIMA(2,0,0)(2,1,0)[12]模型預(yù)測(cè)結(jié)果顯示,山西省未來(lái)5 年的手足口病月發(fā)病率仍呈現(xiàn)周期性波動(dòng),波動(dòng)規(guī)律平穩(wěn),或?qū)⒊尸F(xiàn)略微上升趨勢(shì)。
本文通過(guò)建立ARIMA(2,0,0)(2,1,0)[12]模型預(yù)測(cè)了2019-2023 年山西省手足口病的月發(fā)病率,結(jié)果顯示手足口病發(fā)病率呈平穩(wěn)趨勢(shì),且存在周期性,每年4-7 月為春夏季發(fā)病高峰期,10-11月為秋季發(fā)病高峰期。
登錄山西省疾病預(yù)防控制中心官方網(wǎng)站(http://www.sxcdc.cn/index.htm),查閱發(fā)布的傳染病疫情統(tǒng)計(jì)信息,比較實(shí)際數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)的差距。比較結(jié)果顯示,2019-2021 年的4、5、6 月份發(fā)布的丙類傳染病病例當(dāng)中,包含手足口病在內(nèi)的3 種傳染病占報(bào)告發(fā)病數(shù)的90%以上。雖然山西省疾病預(yù)防控制中心提示春季是呼吸道傳染病和手足口病等腸道傳染病的高發(fā)季節(jié)[15],與模型預(yù)測(cè)每年7 月是手足口病發(fā)病率最高的月份有所出入,但究其原因,主要是每年春季手足口病發(fā)病初期疾病防控部門都會(huì)進(jìn)行干預(yù),因而防止了手足口病月發(fā)病率到達(dá)模型預(yù)測(cè)出的最高點(diǎn),側(cè)面驗(yàn)證了模型精度。
針對(duì)山西省手足口病發(fā)病率常年波動(dòng)且緩慢上升的趨勢(shì),建議采取以下手足口病的綜合防治措施。
利用可獲得的數(shù)據(jù)對(duì)山西省手足口病月發(fā)病率進(jìn)行預(yù)測(cè)預(yù)警,可以有效提醒山西省衛(wèi)生健康委員會(huì)、山西省疾病控制中心等有關(guān)部門提前加強(qiáng)流行病宣傳教育,尤其是對(duì)易發(fā)生手足口病的地區(qū)或單位開展重點(diǎn)人群宣傳教育。同時(shí),醫(yī)院與社區(qū)等有關(guān)單位在做好日常宣傳的基礎(chǔ)上,定期舉辦手足口病知識(shí)普及活動(dòng),對(duì)手足口病的傳播途徑和病原寄生方式進(jìn)行科普,使公眾充分了解相關(guān)癥狀、危害及預(yù)防方式,以及更好地了解手足口病的流行規(guī)律,為制定相關(guān)防治策略提供中肯意見及參考依據(jù),以有效應(yīng)對(duì)流感、手足口病等重點(diǎn)傳染病疫情,保證易感人群的健康。
實(shí)施流行病綜合防控戰(zhàn)略,加強(qiáng)省內(nèi)的國(guó)家流行病綜合防控示范區(qū)建設(shè),建立預(yù)防手足口病的專門機(jī)構(gòu),設(shè)立相關(guān)崗位,如手足口病宣傳員、防疫員等,吸納高素質(zhì)前沿人才,建立強(qiáng)大的山西省醫(yī)療人才儲(chǔ)備軍,確保防疫工作順利開展;提高省內(nèi)防治手足口病資金支持力度,加大對(duì)醫(yī)療設(shè)備、藥品、人才的投入,建立健全覆蓋全省的公共衛(wèi)生服務(wù),防治手足口病等重大突發(fā)疫病。
在現(xiàn)有防控措施的基礎(chǔ)上,與相關(guān)機(jī)構(gòu)緊密協(xié)作,規(guī)范病例監(jiān)測(cè)報(bào)告,開展手足口病咨詢服務(wù),進(jìn)行手足口病知識(shí)培訓(xùn),加大宣傳教育的力度,使公眾深入了解手足口病的傳染方式、防治措施等知識(shí),規(guī)范做好疫苗預(yù)防接種。在自愿、自費(fèi)原則的前提下,積極動(dòng)員適齡兒童接種手足口病疫苗,并提供安全、規(guī)范的預(yù)防接種服務(wù),保障人民群眾身體健康。
在傳染病發(fā)病率預(yù)測(cè)研究中,常用的模型預(yù)測(cè)方法有很多,ARIMA 模型因其便捷易行且模型精度較高而被廣泛使用。本文利用山西省2007-2017年手足口病的月發(fā)病率數(shù)據(jù)構(gòu)建ARIMA 模型,經(jīng)過(guò)序列平穩(wěn)化平穩(wěn)性檢驗(yàn)處理、模型定階、參數(shù)估算及模型的檢驗(yàn)等步驟計(jì)算得出最優(yōu)模型ARIMA(2,0,0)(2,1,0)[12],其預(yù)測(cè)值與實(shí)際月發(fā)病率基本在模型擬合的95%置信區(qū)間內(nèi),說(shuō)明當(dāng)月疫情無(wú)異常,該模型精度較高,可用來(lái)對(duì)山西省手足口病月發(fā)病率進(jìn)行短期預(yù)測(cè)。
本研究還存在以下局限。一是ARIMA 模型依賴于數(shù)據(jù)本身且要求時(shí)序數(shù)據(jù)穩(wěn)定,用此模型對(duì)手足口病發(fā)病率進(jìn)行預(yù)測(cè)分析時(shí)難以兼顧外部環(huán)境的變化,如人群的變化、空氣質(zhì)量變化、氣溫異常變化等;二是所能查閱到的官方數(shù)據(jù)資料只更新到2018 年,而2019 年至今的數(shù)據(jù)沒有在正規(guī)的網(wǎng)站上公布,因此存在數(shù)據(jù)滯后的問題;三是判斷模型精度時(shí)只使用了平均絕對(duì)誤差這一種標(biāo)準(zhǔn),沒有采用更多的標(biāo)準(zhǔn)進(jìn)行比較,雖然結(jié)果可靠,但仍沒有達(dá)到最精確的水平。今后的研究將完善模型精確度,以獲得更嚴(yán)謹(jǐn)、更全面的山西省手足口病月發(fā)病率預(yù)測(cè)結(jié)果。