梅文娟,劉 震*,朱靜怡,杜 立
(1. 電子科技大學(xué)自動(dòng)化工程學(xué)院 成都 611731;2. 電子科技大學(xué)生命科學(xué)與技術(shù)學(xué)院 成都 611731)
自2020 年1 月以來(lái),新型冠狀病毒疫情迅速蔓延,各地確診病例增加。疫情受到各地政府高度關(guān)注,相繼啟動(dòng)重大突發(fā)衛(wèi)生事件I 級(jí)響應(yīng)并采取不同程度的隔離措施。2020 年1 月30 日,國(guó)際衛(wèi)生組織將此次疫情列為“國(guó)際公眾衛(wèi)生緊急事件”。在加強(qiáng)醫(yī)療援助及實(shí)施隔離措施的同時(shí),全球科研人員針對(duì)新冠病毒從流行病學(xué)[1]、病理學(xué)[2]和藥理學(xué)[3]3 個(gè)領(lǐng)域進(jìn)行了分析,為抗擊疫情提供了有力的學(xué)術(shù)支持。其中,從流行病學(xué)角度分析疫情的發(fā)展規(guī)律并預(yù)測(cè)疫情發(fā)展趨勢(shì)對(duì)制定和實(shí)施合理的干預(yù)防控措施具有重要意義。
為評(píng)估疫情發(fā)展,現(xiàn)有的方法可分為統(tǒng)計(jì)學(xué)方法與動(dòng)力學(xué)方法兩種。統(tǒng)計(jì)學(xué)模型在信息不全的情況下通過(guò)某一小樣本的情況對(duì)總體進(jìn)行預(yù)測(cè)。文獻(xiàn)[4]根據(jù)武漢國(guó)際機(jī)場(chǎng)每日人流量、該樣本下的確診人數(shù)以及機(jī)場(chǎng)往日的流量數(shù)據(jù)對(duì)武漢潛在感染人數(shù)進(jìn)行估計(jì)。然而,由于小樣本與總體樣本具有傳播特性差異,該方法的估計(jì)結(jié)果可能存在較大的偏差。同時(shí),統(tǒng)計(jì)學(xué)模型無(wú)法反映疫情傳播的變化趨勢(shì)。考慮人口遷徙因素的影響,文獻(xiàn)[5]根據(jù)武漢遷徙數(shù)據(jù),分析了全國(guó)50 個(gè)城市感染新型冠狀病毒的確診比率,并利用Bootstrap 方法對(duì)確診人數(shù)進(jìn)行了穩(wěn)健性估計(jì)。實(shí)驗(yàn)分析證明了病毒的二代傳播在不同區(qū)域存在一定的差異性,社會(huì)活動(dòng)對(duì)疫情發(fā)展存在一定的影響。
與統(tǒng)計(jì)學(xué)模型不同,動(dòng)力學(xué)模型[6]基于病毒寄生宿主后各個(gè)狀態(tài)間的因果關(guān)系,利用對(duì)該病毒已知的信息與各個(gè)狀態(tài)下人群的歷史數(shù)據(jù)構(gòu)建用于描述傳播機(jī)理的微分方程,從而得出對(duì)有效再生數(shù)、確診人數(shù)等指標(biāo)的預(yù)測(cè)評(píng)估值。根據(jù)對(duì)疫情發(fā)展中不同群體的劃分情況不同,用于描述傳染病傳播的經(jīng)典數(shù)學(xué)模型有SIR 模型和SEIR 模型兩種形式。
SIR 模型[7]假設(shè)易感人群(susceptible)、感染人群(infectious)和康復(fù)人群(recovered)3 部分人群在病毒發(fā)展規(guī)律下以一定概率向其他狀態(tài)轉(zhuǎn)移形成“易感態(tài)?感染態(tài)?康復(fù)態(tài)”的動(dòng)力學(xué)模型,可實(shí)現(xiàn)對(duì)病毒的傳染趨勢(shì)在一定精度內(nèi)的評(píng)估和預(yù)測(cè)。文獻(xiàn)[8]利用機(jī)器學(xué)習(xí)方法估計(jì)SIR 模型,其估計(jì)結(jié)果基本與實(shí)際數(shù)據(jù)吻合。
進(jìn)一步,SEIR 模型[9]在SIR 模型的基礎(chǔ)上考慮到潛伏期導(dǎo)致感染過(guò)程存在遲滯性。因此,SEIR 模型對(duì)動(dòng)力學(xué)系統(tǒng)進(jìn)行細(xì)化,串聯(lián)了潛伏期人群(exposed)?;谠撃P停墨I(xiàn)[10]對(duì)病毒基本再生數(shù)進(jìn)行了初步預(yù)測(cè)。預(yù)測(cè)過(guò)程證明在SEIR模型下基本再生數(shù)的時(shí)間敏感性。此外,文獻(xiàn)[11]基于該疾病的臨床特征、傳染性特征以及政府有關(guān)的干預(yù)措施在SEIR 模型中增加無(wú)癥狀感染人群(pre-symptomatic)和住院人群(hospitalized)兩種狀態(tài),達(dá)到細(xì)化傳播過(guò)程描述的效果,借助蒙特卡洛模擬,認(rèn)為在當(dāng)時(shí)控制下的基本再生數(shù)高達(dá)6.47。文獻(xiàn)[12]就潛伏期長(zhǎng)度對(duì)疫情的影響做了深入分析,得到在不同的潛伏期假設(shè)下,預(yù)測(cè)趨勢(shì)的增長(zhǎng)速度,拐點(diǎn)和峰值都存在差別,潛伏期的不同會(huì)影響疫情趨勢(shì)變化。而從實(shí)際的效果來(lái)看,潛伏期受到人類宿主生理系統(tǒng)的影響存在個(gè)體差異,潛伏期存在的影響呈現(xiàn)出一定的不確定性。
盡管SIR 模型與SEIR 模型對(duì)基本再生數(shù)和疫情早期趨勢(shì)有較好的估計(jì),然而基于動(dòng)力學(xué)的預(yù)測(cè)模型在實(shí)際應(yīng)用中仍存在局限性[13]。首先,倉(cāng)室模型無(wú)法對(duì)開放式流動(dòng)環(huán)境下的病毒傳播做出準(zhǔn)確估計(jì);第二,該類模型對(duì)相關(guān)參數(shù)的評(píng)估缺乏外界環(huán)境應(yīng)力影響的引入;第三,對(duì)于疾病傳播能力及治愈概率的常數(shù)假設(shè)與實(shí)際狀況不符。因此,該類模型無(wú)法對(duì)疫情趨勢(shì)做長(zhǎng)期準(zhǔn)確的分析。
考慮到人為及環(huán)境影響因素,一些學(xué)者基于環(huán)境容納量的概念,引入針對(duì)疾病傳播的Logistic 增長(zhǎng)模型[14]和指數(shù)增長(zhǎng)模型[15]。該類模型反映了醫(yī)療和防控對(duì)于疫情發(fā)展存在一定時(shí)滯性影響[16],并且結(jié)合此類因素給出更符合實(shí)際的估計(jì)。
綜上,本文結(jié)合動(dòng)力學(xué)模型對(duì)傳播機(jī)理描述的準(zhǔn)確性和Logistic 增長(zhǎng)模型對(duì)外界因素估計(jì)的有效性,將基于機(jī)理描述的微分方程與基于數(shù)據(jù)驅(qū)動(dòng)的極限學(xué)習(xí)機(jī)[17]融合,構(gòu)建用于實(shí)時(shí)預(yù)測(cè)的極限IR 模型。在該模型中,對(duì)動(dòng)力學(xué)方程進(jìn)行改進(jìn),突破倉(cāng)室模型下僅考慮密閉環(huán)境的局限性。同時(shí)將傳播最終狀態(tài)進(jìn)一步分化為治愈態(tài)和死亡態(tài),并預(yù)測(cè)從感染態(tài)到這兩種狀態(tài)概率的時(shí)變規(guī)律,用于進(jìn)行更加精確的預(yù)測(cè)。最后,借助極限學(xué)習(xí)機(jī),生成對(duì)確診人數(shù)動(dòng)態(tài)變化的預(yù)測(cè)模型,用于疫情趨勢(shì)的實(shí)時(shí)預(yù)測(cè)和分析。實(shí)驗(yàn)證明,極限IR 算法可實(shí)現(xiàn)準(zhǔn)確的實(shí)時(shí)預(yù)測(cè)。
由實(shí)際的防控情況,新型冠狀肺炎的防控過(guò)程如圖1 所示。不考慮二次感染,每個(gè)感染新型冠狀病毒的個(gè)體需要經(jīng)歷易感態(tài)、潛伏態(tài)、感染態(tài)和移除態(tài)4 種狀態(tài)才能排除其對(duì)倉(cāng)室模型中各個(gè)人群的變化影響。從實(shí)際的防控過(guò)程和病毒的病理特征中可以看出,潛伏態(tài)具有以下特點(diǎn):1) 在實(shí)際的防控過(guò)程中,潛伏態(tài)群體因?yàn)闊o(wú)明顯發(fā)病癥狀難以進(jìn)行準(zhǔn)確的統(tǒng)計(jì);2) 從病理學(xué)角度,病毒在感染宿主后已經(jīng)具備傳染力[18],且潛伏期的個(gè)體差異性較大(中位值為4 天,最長(zhǎng)可達(dá)14 天[19]),在估計(jì)上的不確定度較大;3) 盡管潛伏期傳染能力遠(yuǎn)弱于發(fā)病后的傳染能力,然而由于早期潛伏期人群基數(shù)很大,小概率的傳染仍然會(huì)對(duì)新增患者群體造成較大的影響。綜上,在病毒傳染機(jī)制、環(huán)境中人群個(gè)體機(jī)制等信息尚不明確的情況下,對(duì)于潛伏態(tài)的判定及潛伏態(tài)與感染態(tài)的轉(zhuǎn)換關(guān)系存在分析上的不確定性,不利于定量方法的研究。因此,本文采用SIR 模型作為基礎(chǔ),簡(jiǎn)化了從“易感態(tài)?潛伏態(tài)?感染態(tài)”這一步驟,直接考慮易感態(tài)與感染態(tài)之間的傳遞關(guān)系。
利用SIR 模型可以有效地描述病毒的傳播過(guò)程。根據(jù)SIR 模型的特性,病毒傳播過(guò)程的動(dòng)力學(xué)方程如下:
式中,S 表示為易感態(tài)人群規(guī)模;I 表示為感染態(tài)人群規(guī)模;R 為恢復(fù)態(tài)人群規(guī)模;β 指感染人群將易感人群轉(zhuǎn)換為新增病例的概率;r 表示為現(xiàn)有感染人群轉(zhuǎn)換為死亡人群或治愈人群的概率。3 種狀 態(tài)的變化特征如圖1 所示。
圖1 新冠肺炎的防控過(guò)程
如圖2 所示,鑒于新冠病毒暫時(shí)未發(fā)現(xiàn)有明顯變異,康復(fù)人群不會(huì)發(fā)生第二次感染,因此在SIR模型中認(rèn)為康復(fù)人群不會(huì)再次轉(zhuǎn)變?yōu)橐赘腥巳?,即?0。
圖2 SIR 模型狀態(tài)轉(zhuǎn)移圖
由于實(shí)際的防疫工作中,對(duì)于疫情的通報(bào)要求以及對(duì)于疫情的預(yù)測(cè)需求均具有一定的時(shí)間間隔,因此對(duì)動(dòng)力學(xué)方程進(jìn)行離散化,得到:
式中, ?S(t)、 ?I(t)和 ?R(t)分別為S、I、R 的數(shù)據(jù)差值。根據(jù)實(shí)際情況,對(duì)于數(shù)據(jù)更新的時(shí)間間隔需求為1 天,因此t 取正整數(shù)表示更新的天數(shù)。定義2020 年1 月23 日為第一個(gè)時(shí)間點(diǎn),此時(shí)t=1。
由于病毒的傳播能力和對(duì)于疾病的治療能力受到外界應(yīng)力的影響,相關(guān)指標(biāo)會(huì)隨著疫情發(fā)展變化,本文假設(shè)傳播能力β 與概率r 均為關(guān)于時(shí)間的函數(shù)。由式(5)和式(6),時(shí)變函數(shù)β(t)和r(t)的表達(dá)式如下:
根據(jù)官方數(shù)據(jù),疫情發(fā)生早期14 天時(shí)間間隔下β(t)和r(t)的變化趨勢(shì)如圖3 與圖4 所示。在疫情發(fā)生早期,由于疾病的傳播不受人為干預(yù),傳播能力產(chǎn)生波動(dòng)且由于死亡率偏高引起r(t)較高。隨著防疫力度加大,疾病的傳播能力逐步受到限制。同時(shí),隨著醫(yī)學(xué)對(duì)疾病防治的效果逐漸顯現(xiàn),死亡率降低,治愈率升高,r(t)呈現(xiàn)出下凹的變化趨勢(shì)。
圖3 病毒傳播能力變化趨勢(shì)
圖4 概率r(t)變化趨勢(shì)
綜上,疫情的變化不僅與病毒的固有特性相關(guān),同時(shí)受到外界因素對(duì)疫情變化存在一定的時(shí)滯性影響。為了更好地分析疫情的變化趨勢(shì),需要構(gòu)建更為合適的預(yù)測(cè)模型。在SIR 的基礎(chǔ)上,將恢復(fù)態(tài)分化為死亡態(tài)(R1)和痊愈態(tài)(R2)兩組狀態(tài),并假設(shè)I 態(tài)分別以r1(t)和r2(t)的概率向R1態(tài)和R2態(tài)轉(zhuǎn)移。本文借助極限學(xué)習(xí)機(jī)構(gòu)建關(guān)于感染態(tài)的自循環(huán)函數(shù)并對(duì)由I 狀態(tài)到R1狀態(tài)及R2狀態(tài)的轉(zhuǎn)移概率進(jìn)行預(yù)測(cè),提出可用于疫情趨勢(shì)實(shí)時(shí)預(yù)測(cè)的極限IR 模型,其中各狀態(tài)的傳遞關(guān)系如圖5 所示。
圖5 極限IR 模型總體框架
考慮到外界因素的時(shí)滯性影響和一定程度的不確定性,采用3 組極限學(xué)習(xí)機(jī)分別對(duì)隨時(shí)間變化凈新增感染人數(shù)、死亡率和治愈率進(jìn)行實(shí)時(shí)預(yù)測(cè)評(píng)估。由圖5 給出的傳遞關(guān)系,各個(gè)狀態(tài)的動(dòng)力學(xué)方程如下所示:
式中, r1(t)和 r2(t)分別為t 時(shí)刻下的治愈率和死亡率;F(I(t?1))為根據(jù)極限學(xué)習(xí)機(jī)構(gòu)建的自相關(guān)函數(shù);N(t)為受到突發(fā)事件影響造成的感染人數(shù)變化,具有不可預(yù)測(cè)性,因此在構(gòu)建預(yù)測(cè)模型的過(guò)程中不予考慮。綜上,預(yù)測(cè)模型的構(gòu)建轉(zhuǎn)換為對(duì)r1(t)、 r2(t)和F(I(t?1))的預(yù)測(cè)模型構(gòu)建問(wèn)題。
根據(jù)上一節(jié)的分析,本文方法通過(guò)極限學(xué)習(xí)機(jī)對(duì)疾病的治愈率和死亡率進(jìn)行預(yù)測(cè),其模型結(jié)構(gòu)如圖6 所示。
圖6 極限學(xué)習(xí)機(jī)預(yù)測(cè)模型框圖
該預(yù)測(cè)模型為單隱藏層網(wǎng)絡(luò)結(jié)構(gòu)。為得到時(shí)刻t 較準(zhǔn)確的預(yù)測(cè)估計(jì),利用歷史有效數(shù)據(jù)對(duì)極限學(xué)習(xí)機(jī)進(jìn)行訓(xùn)練??紤]到數(shù)據(jù)的可靠性,假設(shè)有效數(shù)據(jù)起始時(shí)間為t0,則訓(xùn)練數(shù)據(jù)的輸入為:
為確保模型的準(zhǔn)確性,采用單步預(yù)測(cè)的方式,其對(duì)應(yīng)的期望輸出為:
考慮r1(t)受到外界因素的時(shí)滯性影響,采用Sigmoid 函數(shù)作為隱藏層的核函數(shù),其表達(dá)式如下所示:
同時(shí),考慮到多因素影響,假設(shè)概率的變化趨勢(shì)為多組logistic 回歸的加權(quán)和。由極限學(xué)習(xí)機(jī)的性質(zhì),其回歸方程如下:
根據(jù)上式,得到對(duì)于歷史數(shù)據(jù)的模型輸出為:
由最小均方準(zhǔn)則,計(jì)算的到模型的輸出層權(quán)重Λ={λ1,λ2,···,λN}如下所示:
在實(shí)際的疫情趨勢(shì)預(yù)測(cè)中,疫情的相關(guān)數(shù)據(jù)以一天為間隔進(jìn)行更新。故t+1 輸出層可由上一時(shí)刻數(shù)據(jù)更新得出:
式 中, K(t)=(HT(t ?1)H(t ?1))?1; h(r1(t ?1))為t時(shí)刻的隱藏層輸入;r ?1(t)為預(yù)測(cè)模型的輸出。
根據(jù)預(yù)測(cè)模型得到治愈率的預(yù)測(cè)值,進(jìn)而根據(jù)t?1 時(shí)刻的感染人數(shù)給出此時(shí)的治愈人數(shù)預(yù)測(cè)值:
同理,對(duì)死亡率時(shí)間序列建立預(yù)測(cè)模型,進(jìn)而得到死亡人數(shù)的預(yù)測(cè)值:
忽略突發(fā)性因素對(duì)模型的影響,本文對(duì)凈感染增長(zhǎng)人數(shù)定義如下:
由圖5,可以看出 ?I?(t)是僅與I(t)有關(guān)的時(shí)間函數(shù)。從流行病傳播的角度,? I?(t)的變化趨勢(shì)與病毒固有的傳播特性與人為干預(yù)有關(guān),因此本文提出的模型構(gòu)建出第三組極限學(xué)習(xí)機(jī)用于預(yù)測(cè)? I?(t)的變化趨勢(shì),預(yù)測(cè)模型對(duì)應(yīng)的方程如下:
與治愈率和死亡率的變化趨勢(shì)不同,病毒的傳播與人類采取的防疫措施強(qiáng)度高度相關(guān),因此對(duì)于傳播趨勢(shì)的分析具有一定的時(shí)效性,一部分歷史數(shù)據(jù)并不能反映當(dāng)前的傳播能力。因此,在預(yù)測(cè)模型訓(xùn)練過(guò)程中,利用時(shí)間窗對(duì)訓(xùn)練數(shù)據(jù)的規(guī)模限制,確保預(yù)測(cè)模型的準(zhǔn)確性。
利用本文提出的極限IR 預(yù)測(cè)模型,采用自2020 年1 月23 以來(lái)國(guó)家衛(wèi)生健康委員會(huì)公布的全國(guó)累積確診人數(shù)、累積死亡人數(shù)和累積治愈人數(shù)對(duì)模型的實(shí)際預(yù)測(cè)效果進(jìn)行驗(yàn)證。同時(shí),通過(guò)與基于蒙特卡洛方法的SEIR 模型(SEIR-MC)和基于蒙特卡洛馬爾科夫方法的SIR 模型(SIR-MCMC)的預(yù)測(cè)結(jié)果進(jìn)行比較,驗(yàn)證算法的實(shí)時(shí)預(yù)測(cè)效果。
利用極限學(xué)習(xí)機(jī),對(duì)治愈人群的變化趨勢(shì)和死亡人群的變化趨勢(shì)的預(yù)測(cè)結(jié)果如圖7 所示。由圖7a和圖7c 可以看出治愈率總體隨時(shí)間提升,而死亡率隨時(shí)間下降,受到實(shí)際的臨床經(jīng)驗(yàn)進(jìn)展影響變化趨勢(shì)發(fā)生波動(dòng)。通過(guò)預(yù)測(cè)曲線,極限IR 模型能夠有效地對(duì)兩組概率的變化趨勢(shì)進(jìn)行有效地預(yù)測(cè),產(chǎn)生的預(yù)測(cè)時(shí)間曲線與實(shí)際的概率變化大致相同。因此,圖7b 和圖7d 中模型提供了治愈人數(shù)和死亡人數(shù)準(zhǔn)確的估計(jì),預(yù)測(cè)趨勢(shì)與實(shí)際的變化趨勢(shì)基本一致。
圖7 無(wú)風(fēng)險(xiǎn)人群預(yù)測(cè)效果比較
為說(shuō)明極限IR 預(yù)測(cè)模型對(duì)現(xiàn)有確診人數(shù)的預(yù)測(cè)效果,圖8 展示了通過(guò)極限IR 模型進(jìn)行的單步和多步預(yù)測(cè)結(jié)果。
圖8 極限IR 模型單步及多步預(yù)測(cè)結(jié)果
盡管在前10 天時(shí)預(yù)測(cè)結(jié)果發(fā)生了較大波動(dòng),單步預(yù)報(bào)值總體上能夠很好地描述疫情發(fā)展趨勢(shì),且在第10 天后預(yù)測(cè)結(jié)果基本不受早期疫情傳染能力大幅波動(dòng)的影響。尤其在疫情發(fā)展第10 天至第20 天,模型對(duì)現(xiàn)有確診人數(shù)的預(yù)測(cè)值與實(shí)際的確診人數(shù)基本吻合。此外,利用該模型得到的3 步預(yù)測(cè)值與5 步預(yù)測(cè)值也較好地預(yù)測(cè)了感染人數(shù)的變化趨勢(shì)。
為進(jìn)一步說(shuō)明極限IR 算法的效果,表1 比較了SEIR-MC 模型、SIR-MCMC 模型以及極限IR模型在2020 年2 月7 日至2 月16 日間的預(yù)測(cè)效果。由圖1 所示,SEIR-MC 模型在2020 年2 月7 日至2 月9 日的預(yù)測(cè)誤差較小,而在2020 年2 月10 日后疾病防控活動(dòng)對(duì)疫情發(fā)展影響變強(qiáng),利用該方法的預(yù)測(cè)誤差逐漸加大。另一方面,采用蒙特卡洛馬爾科夫方法在一定程度上可以實(shí)現(xiàn)對(duì)參數(shù)的動(dòng)態(tài)評(píng)估,然而伴隨2020 年2 月12 日臨床診斷結(jié)果加入醫(yī)學(xué)診斷中的舉措,該方法對(duì)于參數(shù)的評(píng)估產(chǎn)生誤差。與SEIR-MC 和SIR-MCMC 不同,極限IR 模型利用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)動(dòng)力學(xué)模型中時(shí)變參數(shù)的精確估計(jì),因此從10 天數(shù)據(jù)的總體效果看,該模型能實(shí)現(xiàn)精度更高的實(shí)時(shí)預(yù)測(cè),其誤差可以控制在10%以內(nèi)。
表1 2020 年2 月7 日至2 月16 日各模型的預(yù)測(cè)效果比較
本文針對(duì)冠狀病毒已知的傳播規(guī)律,提出用于疫情趨勢(shì)實(shí)時(shí)預(yù)測(cè)的極限IR 模型。通過(guò)建立時(shí)變假設(shè)下的傳染趨勢(shì),死亡率和治愈率預(yù)測(cè)模型,實(shí)現(xiàn)動(dòng)力學(xué)模型的及時(shí)更新,提供確診人數(shù)、新增死亡人數(shù)和新增治愈人數(shù)等指標(biāo)預(yù)測(cè)值。通過(guò)實(shí)驗(yàn)驗(yàn)證,本文提出方法能夠達(dá)到較高的實(shí)時(shí)預(yù)測(cè)精度,為疫情趨勢(shì)分析提供有效的數(shù)據(jù)分析支持。
盡管模型在實(shí)時(shí)預(yù)測(cè)上存在很好的效果,但針對(duì)傳統(tǒng)的動(dòng)力學(xué)模型做出了如下簡(jiǎn)化:
1)考慮到潛伏期估計(jì)上的不確定性,在模型不將潛伏狀態(tài)作為獨(dú)立分析的狀態(tài)進(jìn)行考慮。
2)對(duì)傳染病模型中的傳染態(tài)界定做出了調(diào)整,理由如下:第一,從疾病發(fā)生機(jī)理角度,將SIR 傳播模型中的感染態(tài)替換為傳染態(tài),可以避免因流感產(chǎn)生相似癥狀對(duì)模型中人群估計(jì)產(chǎn)生的干擾;第二,從防控過(guò)程角度,因確診人數(shù)在疫情防控工程中具有觀測(cè)精確的特征,通過(guò)確診人數(shù)可以為傳染態(tài)基數(shù)估計(jì)提供有力的數(shù)據(jù)依據(jù)。
3)機(jī)器學(xué)習(xí)方法的引入在增加了短期預(yù)測(cè)精度的同時(shí)增加了模型的復(fù)雜性并使擬合參數(shù)的價(jià)值降低。本文提出的方法通過(guò)引入極限學(xué)習(xí)機(jī)對(duì)IR 模型中的相關(guān)時(shí)變參數(shù)做定量趨勢(shì)預(yù)測(cè)。從模型的復(fù)雜性來(lái)看,盡管模型引入了相較于SIR 模型,SEIR 模型更加復(fù)雜的機(jī)器學(xué)習(xí)融合模型,但極限學(xué)習(xí)機(jī)作為單隱層少節(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò)模型,其空間復(fù)雜性能夠滿足實(shí)時(shí)預(yù)測(cè)的應(yīng)用需求,且因訓(xùn)練無(wú)迭代過(guò)程,模型預(yù)測(cè)的快速性得到保證。從擬合參數(shù)價(jià)值角度,機(jī)器學(xué)習(xí)融合的算法在治愈率、死亡率和病毒傳播能力的定性分析上能提供準(zhǔn)確的動(dòng)態(tài)變化信息,存在一定的分析價(jià)值,然而對(duì)于基本再生數(shù)這一類病毒機(jī)理性參數(shù),受到機(jī)器學(xué)習(xí)對(duì)對(duì)象機(jī)理簡(jiǎn)化的影響,其分析需要進(jìn)行進(jìn)一步的研究。
綜上,盡管方法在傳染病機(jī)理傳遞的細(xì)節(jié)量化上不是至善之策,但對(duì)于疫情趨勢(shì)的及時(shí)把控、傳染態(tài)群體的統(tǒng)計(jì)特征變化及疫情發(fā)展的實(shí)施預(yù)測(cè)是現(xiàn)有較好的可取之舉。