謝小良,王時雨,成佳祺,朱志遠
(湖南工商大學(xué) 理學(xué)院,湖南 長沙 410205)
突發(fā)傳染病不但損害人民群眾的生命健康,而且可能給經(jīng)濟發(fā)展以及社會穩(wěn)定帶來嚴重的影響。因此,突發(fā)傳染病防控一直是各級政府和社會公共衛(wèi)生治理中的重中之重。在人類發(fā)展歷程中,人們一直與突發(fā)傳染病作斗爭,寫下了一幕幕令人辛酸的歷史,如2003年“非典”,2014年埃博拉病毒以及2019年新型冠狀病毒等都給人類造成了嚴重的影響。對傳染病發(fā)病趨勢進行預(yù)測,能夠幫助我們及時有效地采取相應(yīng)措施進行疫情防控,對于人類健康與生命安全保障具有重要的現(xiàn)實意義。
在國內(nèi)外的傳染病疫情預(yù)測研究中,主要是從以下兩個方面進行深度分析:一是基于時間序列預(yù)測模型進行傳染病預(yù)測。目前,預(yù)測研究中ARIMA模型應(yīng)用比較廣泛,其主要針對時間序列數(shù)據(jù)分析其特征并預(yù)測未來走向,如楊霜等(2021)[1]通過ARIMA乘積季節(jié)模型來預(yù)測紅細胞臨床用量,為醫(yī)院中血液管理提供切實可行的依據(jù)。張帆等(2021)[2]基于傳統(tǒng)的ARIMA模型將其與SVM相結(jié)合對道路交通傷害死亡率進行了預(yù)測,預(yù)測結(jié)果發(fā)現(xiàn),相較于ARIMA模型,其模型精度更高,更適用于預(yù)測道路交通傷害死亡率。而在針對傳染病發(fā)病預(yù)測的研究中,ARIMA模型仍發(fā)揮著重要的作用。田慶等(2021)[3]針對山東省結(jié)核病的相關(guān)特征,采用ARIMA模型結(jié)合其季節(jié)性與趨勢性對發(fā)病趨勢進行擬合和預(yù)測。模型擬合情況較好,精度較高,能夠較好地反映出山東省結(jié)核病的發(fā)病走向。彭陽和盧千超(2021)[4]則是在ARIMA模型的基礎(chǔ)上分析河南省南陽市手足口病的特征進而進行季節(jié)性差分,提高了模型預(yù)測精度,從而能夠更好地預(yù)測南陽市手足口病的發(fā)病人數(shù),為疫情防控工作提供依據(jù)。劉繼恒等(2017)[5]選取了季節(jié)趨勢模型與ARIMA乘積季節(jié)模型對丙類傳染病進行了定量分析并以此構(gòu)建丙類傳染病的預(yù)測模型,使得被動預(yù)防變成主動預(yù)防,丙類傳染病的預(yù)防工作能夠更加有效地進行。余艷妮等(2018)[6]研究了目前普遍用于公共衛(wèi)生及傳染病防控的數(shù)學(xué)模型以及統(tǒng)計學(xué)方法。傳統(tǒng)模型主要包含ARIMA模型以及回歸模型,但回歸模型影響因素過多所以一般采用時間序列構(gòu)建模型,其次是以傳染病傳播動力學(xué)為理論的基礎(chǔ)模型構(gòu)建;此外,應(yīng)用以大數(shù)據(jù)、人工智能為工具的傳染病預(yù)測模型也是當今學(xué)界普遍采用的方法。二是基于傳染病動力學(xué)模型進行預(yù)測。如按照傳染病的特點進行劃分的SI、SIS、SIR、SIRS以及SEIR 模型,其中SEIR模型應(yīng)用較為廣泛,其包含的傳染病特征較多,能夠更好地反映傳染病傳播過程中各類人群的變動情況。如Wilfredo等(2021)[7]通過分析早期的冠狀病毒和冠狀病毒類似暴發(fā)的早期階段的特征,對SEIR的參數(shù)進行調(diào)整,使其能夠更加有效地預(yù)測冠狀病毒類傳染病的傳播趨勢。Vinicius(2021)[8]在SEIR模型的基礎(chǔ)上提出了一個非線性算法,能夠更加有效地模擬疫情傳播情況。鐘南山院士團隊利用SEIR模型和機器學(xué)習(xí)法預(yù)測國內(nèi)疫情將于2022年2月底達到頂峰[9]。除了對傳染病進行研究,SEIR如今也在拓展應(yīng)用領(lǐng)域,如曹廣和沈麗寧(2022)[10]結(jié)合網(wǎng)絡(luò)醫(yī)療眾籌傳播的特征在SEIR模型的基礎(chǔ)上進行建模并仿真分析,仿真結(jié)果顯示模型擬合精度較高,能夠有效反映出醫(yī)療眾籌的傳播過程。馬宇彤和胡平(2021)[11]在分析問答社區(qū)的傳播機制后對SEIR模型進行改進,應(yīng)用結(jié)果發(fā)現(xiàn)改進后的SEIR模型更加適用于描述知識傳播規(guī)律。
綜上所述,國內(nèi)外學(xué)者應(yīng)用ARIMA與SEIR模型對突發(fā)傳染病進行預(yù)測研究,目前大部分研究是基于傳染病的相關(guān)特征,分析傳染病的特征信息,進而選取較為合適的預(yù)測模型對傳染病傳播情況進行預(yù)測。在傳統(tǒng)的時間預(yù)測模型中,ARIMA模型在傳染病預(yù)測方面的應(yīng)用較為廣泛,通常是基于傳染病疫情中發(fā)病人數(shù)的時間序列數(shù)據(jù)進行模型擬合并預(yù)測,而在傳染病傳播動力學(xué)預(yù)測研究中,SEIR模型相較于其他模型應(yīng)用廣泛,是在基于傳染病傳播基本要素構(gòu)建相關(guān)指標的基礎(chǔ)上進行數(shù)據(jù)擬合并預(yù)測。目前少有將兩者進行比較分析的,基于此本文選取某市30天突發(fā)傳染病疫情的變動情況,分別基于ARIMA模型和SEIR模型進行數(shù)據(jù)擬合并預(yù)測其發(fā)展動向,將兩者的預(yù)測結(jié)果進行比較分析,為疫情防控工作提供切實可行的依據(jù),并為今后的傳染病監(jiān)測與預(yù)警研究奠定堅實的基礎(chǔ)。
以2018年1月到2020年12月以來某國傳染病發(fā)病數(shù)為樣本,運用統(tǒng)計軟件繪制折線圖,分析結(jié)果如圖1所示。
圖1 某國傳染病發(fā)病數(shù)年度分布圖
從圖1可以看出,傳染病發(fā)病呈現(xiàn)某種波動的形式,有著季節(jié)性的特征,而特別需要注意的是每年的1月與2月,是傳染病高發(fā)時期,春節(jié)期間,人員大量流動,給傳染病傳播提供了有利條件,因此需格外注意1月到2月的傳染病防控[12]。
針對某國2018年1月到2020年12月法定傳染病的發(fā)病數(shù)以及死亡人數(shù),計算得到2018年1月到2020年12月的傳染病發(fā)病死亡率,如圖2所示。從圖中能夠看出,從2018年1月到2020年2月這段時間,傳染病發(fā)病死亡率是在0.3%的上下波動,而2020年2月傳染病發(fā)病死亡率達到最高(1.158%),之后逐漸下降,最終在0.4%的上下波動。根據(jù)目前該國疫情情況來看,2020年2月傳染病發(fā)病死亡率飆升的主要原因是新型冠狀病毒所導(dǎo)致的重大突發(fā)衛(wèi)生事件,疫情防控沒能及時采取措施,疫情規(guī)模迅速擴大,使得該國傳染病死亡人數(shù)迅速增加。
圖2 某國傳染病發(fā)病死亡率年度分布圖
傳染病傳播的過程不僅涉及時間、空間,還波及人群[13],三者的分布情況確定了傳染病疫情的規(guī)模,而要采取及時有效的措施進行疫情防控,最主要的是透析傳染病傳播的本質(zhì)進而可在此基礎(chǔ)上進行針對性的有效監(jiān)管與處理。傳染病傳播是由傳染源、傳播途徑以及易感人群三個環(huán)節(jié)組成的,缺少其中任一環(huán)節(jié)傳染病就無法傳播開來,因此可針對三個傳染病環(huán)節(jié)進行疫情防控管理。分析各個環(huán)節(jié)可以發(fā)現(xiàn)傳染病的傳播不僅會受到自然因素的影響,也會受到社會因素等人為因素影響。如傳染病的傳播途徑通常指的是病原體傳播的方式及過程,通常病原體可以依附在某些介質(zhì)上,其本身不一定能寄生在介質(zhì)上,但可以通過該種介質(zhì)將自身傳導(dǎo)到受感染者,按照介質(zhì)的種類不同可以劃分病原體的傳播途徑,如水、土壤、食物、空氣,抑或者病原體攜帶者,故而常見的傳播途徑有水土傳播、空氣傳播、接觸傳播等,此外,傳染病傳播途徑往往不局限于一種,可以通過多種方式進行傳播擴散。通過對傳染病傳播途徑進行分析,詳細了解并分析病原體傳播過程中的影響及相關(guān)因素,通過對相關(guān)因素進行初步分析有利于傳染病模型的構(gòu)建以及對傳染病傳播的宏觀分析。
常用時間序列模型有七種,分別為樸素法、簡單平均法、移動平均法、簡單指數(shù)平滑法、霍爾特線性趨勢法、霍爾特-溫特斯法以及本次使用的ARIMA預(yù)測模型,ARIMA模型全名為自回歸積分滑動平均模型,于20世紀70年代由Box和Jenkins提出的一種時間預(yù)測模型,故該預(yù)測模型又稱Box-Jenkins模型法,該模型主要基于對發(fā)展趨勢或周期性數(shù)據(jù)的描述,其旨在利用描述數(shù)據(jù)之間的相關(guān)性進行預(yù)測分析,適合疾病發(fā)病率、GDP、市場銷售額等有明顯時間先后變化趨勢的數(shù)據(jù)分析。而以時間順序排列的數(shù)據(jù)序列稱為時間序列(Timeseries,{x,t=1,2,…,n}),模型采用的數(shù)據(jù)序列的主要特點,一是隨時間t變動而改變,二是變量之間并非相互獨立,而這些隨機變量所具備的自相關(guān)性一定程度上代表著發(fā)展的延續(xù)性,將自相關(guān)性以系數(shù)等形式在模型中表述出來就可以通過時間序列的實際值預(yù)測未來值,而ARIMA模型包括自回歸AR模型、移動平均MA模型、自回歸移動平均ARIMA模型以及復(fù)合季節(jié)SARIMA(ARIMA)模型。
ARIMA求和自回歸移動平均模型數(shù)學(xué)表達式簡稱為ARIMA(p,d,q)模型:
(1)
其中Φ(B)=1-φ1B-φ2B2-…-φpBp,Θ(B)=1-θ1B-θ2B2-…-θqBq,
?=1-B表示差分算子,p為時間序列自回歸階數(shù),d為模型差分次數(shù),q為移動平均階數(shù),B為延遲算子。
ARIMA時間序列模型預(yù)測的建模過程[14]有以下4個關(guān)鍵步驟:
(1)時間序列數(shù)據(jù)預(yù)處理:通過觀察時序圖,判斷時間序列的趨勢與周期性是否顯著,同時進一步觀測自相關(guān)系數(shù)與偏自相關(guān)系數(shù)確定結(jié)論,并做單位根檢驗判斷序列是否平穩(wěn);使用BOX檢驗判斷是否為白噪聲序列,確保序列非隨機。
(2)ARIMA模型識別:根據(jù)差分后序列,通過分析其自相關(guān)及偏自相關(guān)圖性質(zhì),為模型確定合適的p、q值,對模型進行初步擬合,對識別階段提供的粗模型進行參數(shù)估計并假設(shè)檢驗。
(3)模型診斷:判斷參數(shù)是否具有統(tǒng)計學(xué)意義,殘差是否為白噪聲序列。
(4)模型預(yù)測:利用擬合模型進行對未來值的預(yù)測,判斷時序圖未來趨勢,對模型效果以及價值做出基本分析。
SEIR模型對指標構(gòu)建按研究對象劃分為S、E、I、R等4種指標[15], 其具體表達式為:
(2)
其中,S為易感群體,易感群體并非直接與N總?cè)藬?shù)等值,其表示潛在的可能受感染群體,該群體代表能夠與感染群體直接接觸或處于易受感染狀態(tài),這種存在被病毒感染的概率并且概率不為0的群體即為易感群體。
E為潛伏群體,病毒攜帶者呈陽性結(jié)果但是沒有出現(xiàn)感染癥狀的群體。
I為感染群體,病毒攜帶者呈陽性結(jié)果并且出現(xiàn)感染癥狀的群體,個體作為傳播源而獨立存在,并有一定概率將病毒傳染給易感群體。
R為治愈群體,治愈群體并非完全由病毒治愈者構(gòu)成,為排除死亡群體與有效隔離群體而將這些因素囊括在內(nèi),作為治愈群體存在。
r為感染者平均接觸的數(shù)量,β為接觸發(fā)病者感染概率,β1為接觸潛伏者感染概率,α為潛伏期到發(fā)病的轉(zhuǎn)化率,m為治愈率。
SEIR傳播過程如圖3所示:
圖3 SEIR傳播過程示意圖
選取2020年暴發(fā)的某突發(fā)傳染病疫情,將該時期突發(fā)傳染病導(dǎo)致的某國疫情作為目標對象,對其發(fā)病狀況進行擬合,進而預(yù)測發(fā)病趨勢。選取2020年2月17日到2020年3月18日這段時間某國所公布的相關(guān)數(shù)據(jù),選取其中某市的累計確診人數(shù)、死亡人數(shù)以及治愈人數(shù),從掌握疫情基本規(guī)律的基點出發(fā),將數(shù)據(jù)可視化,并進行統(tǒng)計分析與模型預(yù)測,以實現(xiàn)對未來疫情發(fā)展的預(yù)測與監(jiān)控。對該市疫情在2020年2月17日到2020年3月18日的概況進行描述性分析,結(jié)果如圖4所示。
圖4 某市傳染病綜合發(fā)病概況統(tǒng)計數(shù)據(jù)
由圖4可知,在2020年2月17日到2020年3月18日期間,該市現(xiàn)存確診人數(shù)逐漸遞減,先緩慢減少,中期遞減速率加快,末期速率減緩。累計確診人數(shù)與死亡人數(shù)趨勢走向較為相似,一直在遞增,但遞增速率在逐漸減緩,而治愈人數(shù)一直在增加,且速率也在逐步加快。
根據(jù)已有研究可知導(dǎo)致疫情發(fā)生的是一種高致病性的冠狀病毒,其不僅潛伏期較長,且其傳染性極高,可通過呼吸道飛沫傳播以及接觸傳播,且接觸病毒污染的物品也有很大概率被病毒寄生,對于無防范措施的人群而言,是極易被感染的,同時經(jīng)過時間的推移其傳染源很難被發(fā)現(xiàn),其暴發(fā)時期正值春節(jié)期間,社會流動頻繁,在政府采取措施積極應(yīng)對的情況下,降低人群流動量,同時進行隔離切斷該類病毒的傳播,有助于降低疫情暴發(fā)的規(guī)模[16]。
結(jié)合以往的傳染病研究, 將“現(xiàn)有疑似/前日觀察”視作被觀察者出現(xiàn)疑似癥狀的概率,而“新增確診/前日疑似”視作疑似癥狀者患病的概率,該市每日觀察人數(shù)是通過該市確診人數(shù)占其所屬省份確診人數(shù)的比例與其所屬省份觀察人數(shù)的乘積計算得到的,基于此計算該市從2月17日到3月28日這段時期觀察者出現(xiàn)疑似癥狀的概率和疑似癥狀者患病的概率,其傳染病發(fā)病指標變化情況如圖5所示。
圖5 發(fā)病指標時間序列變化走勢圖
如圖5所示,觀察群體出現(xiàn)疑似癥狀概率從最初的3.32%逐步降低趨向于0,疑似癥狀者患病的概率也從70.64%開始逐步降低至0,則可知該突發(fā)傳染病感染可能性在不斷減少,而疑似癥狀者患病概率與觀察者出現(xiàn)疑似癥狀概率與實際患病概率相關(guān),由折線圖可以發(fā)現(xiàn),該概率值有較強波動,這說明前日疑似人數(shù)對新增確診的轉(zhuǎn)化率受到其他因素影響,例如疑似患者是否與患病者有過直接接觸等。從2020年3月18日到3月28日這段時間觀察者出現(xiàn)疑似癥狀的概率和疑似癥狀者患病的概率都為0,則這段時期的發(fā)病人數(shù)等于確診人數(shù)。
1.ARIMA預(yù)測模型
假設(shè):傳染病發(fā)病人數(shù)=確診人數(shù)+尚未確診的感染人數(shù),其中尚未確診的感染人數(shù)用“(現(xiàn)有觀察人數(shù)×被觀察者出現(xiàn)疑似癥狀的概率+現(xiàn)有疑似人數(shù))×疑似癥狀者患病的概率”計算得到的結(jié)果近似代替,仍以上述樣本國為例,選取2020年2月17日到2020年3月18日的發(fā)病人數(shù)作為目標變量,以發(fā)病人數(shù)的變動趨勢來反映傳染病疫情規(guī)模,對該時間序列數(shù)據(jù)進行平穩(wěn)性檢驗,檢驗結(jié)果如圖6所示。
圖6 單位根檢驗結(jié)果圖
由圖6可知在1%,5%,10%的顯著水平下,都接受原假設(shè),即發(fā)病人數(shù)時間序列數(shù)據(jù)具有單位根,是非平穩(wěn)時間序列,需要對原始數(shù)據(jù)進行差分,使得處理過后的序列數(shù)據(jù)具有平穩(wěn)性。
二階差分結(jié)果如圖7所示,二階差分后的序列數(shù)據(jù)總體呈現(xiàn)出一種波動性,在0刻度上下波動。且其單位根檢驗得到的p值近似于0,則拒絕原假設(shè),即二階差分后的序列數(shù)據(jù)是平穩(wěn)序列。
圖7 二階差分折線圖
從圖8可以知道二階差分后的序列數(shù)據(jù)的自相關(guān)與偏自相關(guān)均表現(xiàn)為截尾,因此可將預(yù)測模型設(shè)立為ARIMA(p,2,q),經(jīng)過一系列的模型試驗可得p=1,q=1,則針對此突發(fā)傳染病,該市傳染病預(yù)測模型為ARIMA(1,2,1)。對模型參數(shù)進行擬合,結(jié)果如圖9所示。
圖8 自相關(guān)與偏自相關(guān)圖
圖9 ARIMA擬合結(jié)果圖
由圖9可知模型表達式為:
yt=0.9612yt-1+ut+0.7499ut-1。
為驗證所構(gòu)建模型的準確性,根據(jù)殘差的白噪聲檢驗結(jié)果對模型準確度進行檢驗,若檢驗結(jié)果是顯著的,則說明模型擬合精度較低,反之則說明模型擬合情況較好,可對未來情況進行預(yù)測。繪制模型殘差的自相關(guān)與偏自相關(guān)圖進行驗證。采用擬合的ARIMA(1,2,1)模型得到該自回歸移動平均模型的殘差,使用Eviews計算得到殘差序列,通過對殘差平方的自相關(guān)系數(shù)與偏自相關(guān)系數(shù)進行檢測,其自相關(guān)與偏自相關(guān)圖如圖10所示,其自相關(guān)統(tǒng)計量以及偏自相關(guān)統(tǒng)計量檢驗結(jié)果都不顯著,故不存在自相關(guān)性,則該殘差序列為白噪聲。因此可知該模型具有有效性,可以依據(jù)模型做未來值的預(yù)測。
圖10 殘差平方的自相關(guān)與偏自相關(guān)圖
基于ARIMA(1,2,1)預(yù)測模型對后10天的發(fā)病人數(shù)進行預(yù)測,并與實際值進行對比,其綜合測算結(jié)果如表1所示。
從表1中能夠看出實際值與預(yù)測值的誤差具有波動性,最后計算出預(yù)測10期的平均絕對誤差為168.74,平均相對誤差為5.13%,相對較小,可知模型預(yù)測精度較高。由此可知該市發(fā)病人數(shù)預(yù)測模型的擬合效果較好,預(yù)測結(jié)果表明在2020年3月19日到2020年3月28日之間該市現(xiàn)有發(fā)病人數(shù)逐漸遞減,下降速率逐漸趨于平緩,與實際情況相符合。
表1 傳染病發(fā)病人數(shù)預(yù)測表
2.SEIR傳染病預(yù)測模型
此突發(fā)傳染病導(dǎo)致的疫情具備一般傳染病的基本性質(zhì),基于其存在病毒潛伏期的性質(zhì),故在傳統(tǒng)SIS以及SIR模型基礎(chǔ)上添加潛伏期相應(yīng)指標,對潛伏群體進行趨勢刻畫,更準確地展示出疫情發(fā)展動態(tài)。
通過收集2020年1月20日至3月31日某國發(fā)生的該突發(fā)傳染病相關(guān)數(shù)據(jù),包括累計確診人數(shù)、重癥人數(shù)、病故人數(shù)、病愈人數(shù)、現(xiàn)有疑似病例、累計追蹤人數(shù)、當日解除追蹤監(jiān)控數(shù)以及觀察中人數(shù)等,根據(jù)這些基礎(chǔ)指標對其發(fā)病情況圖像化。其中,現(xiàn)有確診數(shù)=累計確診數(shù)-累計病故數(shù)-累計病愈數(shù)。
圖11 某國各群體的發(fā)病情況的變化趨勢
如圖11所示,某國現(xiàn)有重癥人數(shù)以小幅度趨勢上漲,至2月19日左右達到峰值11864人,其后重癥人數(shù)不斷下降,因為政府通過大力建設(shè)醫(yī)療設(shè)施,確?;疾≈匕Y者得到治療,并且病情輕者病情得到控制;而現(xiàn)有確診也是呈上漲趨勢,至2月19日左右達到峰值,說明疫情初期政府對疫情管控從2月19日起初見成效,而2月10日左右由于現(xiàn)有疑似病例的確診,使得實際確診人數(shù)突然上漲。正在觀察人數(shù)是通過大數(shù)據(jù)對疑似病例以及確診患者的接觸人群進行監(jiān)控,該部分群體有較大概率成為疑似病例以及感染者,從1月20日至2月9日左右是返鄉(xiāng)高峰期,由于疫情初期未能及時管控人群流動導(dǎo)致疫情傳播,而各地方發(fā)布的疫情出行禁令使得人口流動降低,正在觀察人數(shù)得到控制并有效降低。
圖12 某國疫情監(jiān)控情況
選取累計確診、累計追蹤以及累計解除指標反映某國疫情監(jiān)控情況,如圖12所示,累計追蹤數(shù)在3月3日前一直大于累計解除數(shù),故在3月3日前累計監(jiān)控人數(shù)在不斷上升,累計追蹤一定程度上可以表示為監(jiān)控強度,累計解除一定程度上可以表示為排查強度,故可以認為3月3日起排除力度高于監(jiān)控強度,疫情得到有效監(jiān)控以及管控,可以看出3月3日拐點處累計確診人數(shù)得到有效控制,增長幅度微不足錄。
圖13 指標時間序列變化走勢圖
為了統(tǒng)計患者的治療情況,根據(jù)病毒潛伏期和重癥患者治療時間以及從確診到病故時間,將“新增病故/前8日重癥”視作重癥患者死亡率,“累計病故/5日前確診”視作患者死亡率,而由于治愈平均周期在13天左右,故將“累計病愈/13日前累計確診”視作實際治愈率,“新增病愈/13日前現(xiàn)有確診”視作疫情治愈率,如圖13所示。通過圖像觀察發(fā)現(xiàn)重癥患者死亡率與患者死亡率基本吻合,說明輕度患者基本上不存在死亡可能性,而死亡率從一開始的20%降低至0值取決于醫(yī)療水平以及病毒得到有效掌控,而實際治愈率由一開始的85%降低至40%左右再后來超過90%,說明對于該突發(fā)傳染病已有有效的治愈方案,同時治愈率穩(wěn)定在5%左右,一方面是醫(yī)療物資的限制,另一方面是患者人數(shù)穩(wěn)定在一定數(shù)量。
通過對以上數(shù)據(jù)分析觀測疫情發(fā)展動態(tài),同時通過收集數(shù)據(jù),根據(jù)現(xiàn)實背景計算SEIR模型所需指標,例如易感群體、感染群體、潛伏群體、治愈群體等基本指標,其次如發(fā)病者傳播病毒概率(接觸發(fā)病者感染概率)、潛伏者傳播病毒概率(接觸潛伏者感染概率)等,方便對SEIR模型的構(gòu)建。
SEIR模型建立的關(guān)鍵在于對各參數(shù)值的設(shè)置,參數(shù)值設(shè)計必須參考實際情況。
通過收集數(shù)據(jù)得知截至2019年末,疫情暴發(fā)初期該市常住人口數(shù)有1121.2萬人,令總?cè)丝跀?shù)N=11212000。
S0參數(shù)為初期易感人群,令S0=N-E0-I0-R0;
I0參數(shù)為初期發(fā)病人數(shù),發(fā)病源由于未知,初期病毒攜帶者人數(shù)未知,故令I(lǐng)0=1;
E0參數(shù)為初期潛伏人數(shù),由于與病毒攜帶者接觸群體數(shù)量未知,故令E0=10;
R0參數(shù)為初期治愈人數(shù),病毒暴發(fā)初期治愈人數(shù)為0,故令R0=0。
rβ代表接觸發(fā)病者感染概率,rβ1代表接觸潛伏者感染概率,r為發(fā)病者接觸的人數(shù),根據(jù)以往研究將疫情發(fā)病情況分為無政府干預(yù)的傳播情況與基于政府干預(yù)后的傳播情況[17],在結(jié)合12月8日至1月13日、1月14日至1月23日,1月24日至2月2日,2月3日至2月12日以及2月13日至3月18日的全國和該市各類人群的變動情況將rβ的值按時間段規(guī)定為0.659、0.487、0.235、0.125以及0.22,rβ1的值分別為0.282、0.243、0.202、0.132以及0.022。r的值分別為20人、15人、10人、5人以及3人。將12月8日至1月13日的參數(shù)賦予無政府干預(yù)狀態(tài),而政府干預(yù)則按時間段進行參數(shù)擬合。
α代表潛伏期到發(fā)病的轉(zhuǎn)化率,而該類病毒的潛伏期最短為7天,最長為14天,故決定將潛伏期設(shè)為10天,則α的取值為潛伏期的倒數(shù),得到α=0.1。
m代表治愈率,計算新增病愈/13日前現(xiàn)有確診的平均數(shù)即為治愈率,m=0.046。
通過Matlab語言構(gòu)建模型進行模擬,可以得到該類病毒傳播過程中各群體隨時間的變化趨勢。如圖14、圖15所示。
圖14 無政府干預(yù)下的SEIR模型擬合結(jié)果圖
在政府干預(yù)的情況下,在不同的時間節(jié)點上對疫情規(guī)模產(chǎn)生了重要的影響,選取重要的干預(yù)措施進行分析,分別于1月13日、1月23日、2月2日以及2月12日時間點對參數(shù)進行調(diào)整。接觸發(fā)病者感染概率在前四個時間段一直在不斷下降,而由于2月12日公布的診斷標準將臨床診斷病例數(shù)納入確診病例數(shù)進行公布,則相對的其接觸發(fā)病者感染概率會上升,而接觸潛伏者感染概率在各項政府措施的實行下不斷減小,其中“四類人群”集中收治與隔離且醫(yī)療條件大大改善,將診斷標準納入臨床診斷確診方法對接觸潛伏者感染概率的影響程度較大。由圖15可知,在政府干預(yù)情況下疫情的規(guī)模下降了兩個數(shù)量級,而潛伏人數(shù)以及發(fā)病人數(shù)都提前到達峰值,且從圖15中各指標發(fā)展趨勢可以看出,在發(fā)病第60天左右(第一名病毒感染者確診于2019年12月8日),潛伏期人數(shù)達到峰值,之后開始驟降,而隨后從第70天左右發(fā)病人數(shù)到達峰值,同時疫情得到控制,發(fā)病人數(shù)不再增長,而是開始降低,治愈人數(shù)不斷上漲,與實際情況相比較為吻合。
圖15 政府干預(yù)下的SEIR模型擬合結(jié)果圖
將SEIR模型擬合的從3月19日至3月28日的發(fā)病人數(shù)與根據(jù)確診人數(shù)以及疑似和觀察人數(shù)計算得到的發(fā)病人數(shù)進行對比,計算實際發(fā)病人數(shù)與預(yù)測發(fā)病人數(shù)的絕對相對誤差,其結(jié)果為476.7,相比ARIMA模型預(yù)測的結(jié)果而言模型預(yù)測精度較低。
從采用數(shù)據(jù)上看:ARIMA模型預(yù)測未來值需要針對某一項指標的時間序列進行預(yù)測,由于疫情中數(shù)據(jù)幾乎都是短期線性變化,故所采用數(shù)據(jù)預(yù)測僅為對感染人數(shù)預(yù)測,不過ARIMA模型對于時間序列數(shù)據(jù)要求嚴謹,必須要平穩(wěn)非白噪聲序列才能使得模型具有統(tǒng)計意義,同時由于構(gòu)建時間序列模型需要一定的數(shù)據(jù)量,故只能在傳染病暴發(fā)一段時間后獲得一定數(shù)據(jù)才能進行預(yù)測。而SEIR模型是對整體趨勢的預(yù)測,并不對周期數(shù)據(jù)作要求,需要收集的是多項指標,是對各個指標數(shù)精確度上作要求,同時所采用數(shù)據(jù)由于是可直接獲取的數(shù)值,故可根據(jù)過往傳染病數(shù)據(jù)以及實時數(shù)據(jù)結(jié)合對指標數(shù)值進行調(diào)整,對于突發(fā)傳染病預(yù)測能起到重要作用。
從模型構(gòu)建上看:ARIMA模型是對現(xiàn)有序列的延續(xù)作預(yù)測,通過研究序列時間變化趨勢,需要針對性地設(shè)計傳染病序列的指標,需要視情況及數(shù)據(jù)來設(shè)計模型的階值A(chǔ)R(p),I(d),MA(q),所以不同傳染病模型階層基本不相同。而SEIR模型是通過對普遍傳染病特性作預(yù)測,設(shè)計的模型算式可以適用于任何傳染病數(shù)據(jù),從易感群體、感染群體、治愈群體、潛伏群體出發(fā),是通過模擬傳染病傳播模式所構(gòu)建的模型,僅需要對指標數(shù)值進行替換,具有通用性,對于分析和預(yù)測傳染病突發(fā)狀況有重要意義。
從預(yù)測結(jié)果上看:ARIMA模型由于是對時間序列未來值的預(yù)測,所以模型本身排除了除時間以外其他因素的干擾,可以獲得未來某天的預(yù)測值,同時對比現(xiàn)實值基本相似,故該模型預(yù)測結(jié)果較精確。SEIR模型是對整體趨勢變化進行預(yù)測,由于指標計算的誤差會導(dǎo)致模擬的傳染病發(fā)展趨勢與現(xiàn)實有略微差距,但對于整體掌控傳染病疫情變化能起到重要作用,例如對拐點與峰值的預(yù)測等。