周彩霞, 張濤, 滕懿振, 劉加榮
2019冠狀病毒疾病(coronavirus disease 2019,COVID -19)是由嚴(yán)重急性呼吸綜合征冠狀病毒2型(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)引起的。該病毒是一類β-冠狀病毒,有許多潛在的自然宿主、中間宿主和最終宿主,由于其具有較高的傳染性和傳播力,迅速導(dǎo)致了全球大流行,對(duì)公共衛(wèi)生系統(tǒng)構(gòu)成嚴(yán)重威脅[1-3]。為了遏制病毒的傳播,我國(guó)積極開展COVID -19疫情防控工作,包括大規(guī)模隔離、社會(huì)隔離、社區(qū)遏制和交通限制[4]。此外,政府不斷加大對(duì)COVID -19患者醫(yī)療資源的投入[5]。目前我國(guó)的疫情形勢(shì)已得到較好的控制,但無癥狀感染者具有病毒傳播能力,且臨床癥狀隱匿而無法有效識(shí)別,這容易形成防控措施的漏洞[6-9]。截至2020年7月14日24時(shí),據(jù)31個(gè)省(自治區(qū)、直轄市)和新疆生產(chǎn)建設(shè)兵團(tuán)報(bào)告,累計(jì)追蹤到密切接觸者767 432人,尚在醫(yī)學(xué)觀察的密切接觸者3 577人[10]。雖然,目前國(guó)內(nèi)疫情已基本穩(wěn)定,但密切接觸者可能會(huì)造成無癥狀感染者數(shù)量的上升,從而影響高校復(fù)學(xué)。學(xué)生數(shù)量較大的高校何時(shí)復(fù)學(xué),以及采取何種管控措施,降低在校感染的風(fēng)險(xiǎn),成為目前社會(huì)關(guān)注的重點(diǎn)。因此本研究通過建立數(shù)學(xué)模型,對(duì)世界主要國(guó)家的疫情發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),并對(duì)中國(guó)高校復(fù)學(xué)時(shí)間及方式進(jìn)行分析。
根據(jù)國(guó)家衛(wèi)生健康委員會(huì)官網(wǎng)公開的疫情相關(guān)數(shù)據(jù),統(tǒng)計(jì)2020年1月22日—7月14日的中國(guó)內(nèi)地累計(jì)確診人數(shù)、累計(jì)死亡人數(shù)、累計(jì)治愈人數(shù)、累計(jì)密切接觸者數(shù)量、累計(jì)無癥狀感染者數(shù)量以及美國(guó)、意大利累計(jì)確診人數(shù),基于深度學(xué)習(xí)進(jìn)行建模。
1.2.1 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型本文通過Matlab軟件,構(gòu)建了三層BP神經(jīng)網(wǎng)絡(luò)(BPNN):輸入層(x),隱藏層(h),輸出層(y)。如圖1所示,該模型可依據(jù)疫情更新數(shù)據(jù)進(jìn)行自我學(xué)習(xí),調(diào)整內(nèi)部的權(quán)重參數(shù),具有較好的識(shí)別、訓(xùn)練和容錯(cuò)能力。定義的輸入和輸出節(jié)點(diǎn)數(shù)均為1個(gè),時(shí)間作為輸入節(jié)點(diǎn),確診人數(shù)作為輸出節(jié)點(diǎn)。通過經(jīng)驗(yàn)公式設(shè)定隱含層節(jié)點(diǎn)數(shù)量為5個(gè),目標(biāo)誤差設(shè)置在0.000 5,經(jīng)過多次擬合,選取學(xué)習(xí)效率為0.35,模型的預(yù)測(cè)精度較高。利用BP神經(jīng)網(wǎng)絡(luò)在復(fù)雜系統(tǒng)評(píng)價(jià)中具有的評(píng)價(jià)精度較高的優(yōu)點(diǎn),考慮了三個(gè)分別采取了不同程度隔離措施的國(guó)家疫情數(shù)據(jù)樣本,根據(jù)數(shù)據(jù)擬合結(jié)果評(píng)價(jià),中國(guó)隔離措施為嚴(yán)格,意大利隔離措施為一般嚴(yán)格,美國(guó)隔離措施為不嚴(yán)格。在此次建模過程中分別對(duì)2020年1月22日—2020年7月14日三個(gè)國(guó)家的疫情確診數(shù)據(jù)進(jìn)行訓(xùn)練并預(yù)測(cè)了三個(gè)國(guó)家未來180天的疫情數(shù)據(jù)。鑒于數(shù)據(jù)樣本過小,本文訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)保持一致,均為全部數(shù)據(jù)集,以此來驗(yàn)證模型的預(yù)測(cè)精度。
1.2.2 SEIR模型SEIR模型適用于具有一定潛伏期的傳染性疾病,是傳染病預(yù)測(cè)最為常用的模型之一。在SEIR模型中(見圖2),人群被定義為四部分:第一部分為易感者(susceptible),表示人群中易于被病毒感染的人數(shù),用S表示;第二部分為潛伏者(exposed),表示人群中感染未出現(xiàn)癥狀人數(shù),用E表示;第三部分為感染者(infectives),表示人群中患病的人數(shù),用I表示;第四部分為恢復(fù)人群(recovered),表示患病后恢復(fù)的人數(shù),用R表示;即N=S+E+I+R。P為感染系數(shù)1,代表易感人群與感染者接觸后被感染的概率。Pa為感染系數(shù)2,代表易感人群與潛伏者接觸被感染的概率,τ代表潛伏者轉(zhuǎn)化為感染者的概率,γ代表恢復(fù)概率。本文對(duì)各種傳染指標(biāo)進(jìn)行了數(shù)據(jù)擬合,考慮了在采取不同管控措施及不同復(fù)學(xué)規(guī)模下,與感染者和潛伏者接觸的易感人群數(shù)量的變化,通過SEIR模型迭代未來300天的數(shù)據(jù)來分析潛伏者和感染者數(shù)量是否會(huì)存在二次高峰,以此來評(píng)價(jià)不同復(fù)學(xué)時(shí)間及復(fù)學(xué)方式的可行性。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)原理圖
圖2 SEIR模型
本研究利用MatlabR 2018、Python 3.7.0仿真平臺(tái)進(jìn)行分析。
本研究統(tǒng)計(jì)了2020年1月22日-7月14日中國(guó)、意大利和美國(guó)官方報(bào)道的累計(jì)確診病例數(shù)。如圖3(A-C)所示,每個(gè)國(guó)家包含175個(gè)數(shù)據(jù),訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)保持一致,均為全部數(shù)據(jù)集,以此來驗(yàn)證模型的預(yù)測(cè)精度。并進(jìn)行了模型預(yù)測(cè)的相對(duì)誤差分析(見圖3 D-F),在模型訓(xùn)練后期,相對(duì)誤差基本趨于0。結(jié)果表明,利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的COVID -19確診人數(shù)與前期已知階段的實(shí)際確診人數(shù)基本相符。該模型可以對(duì)中國(guó)、美國(guó)和意大利的疫情發(fā)展趨勢(shì)進(jìn)行合理預(yù)測(cè)。因此,本研究對(duì)以上三個(gè)國(guó)家未來半年(180天)累計(jì)確診病例數(shù)進(jìn)行了預(yù)測(cè)。目前,中國(guó)疫情形勢(shì)已趨于穩(wěn)定,將在9月中旬達(dá)到峰值,累計(jì)確診人數(shù)預(yù)測(cè)值約為87 231(見圖 3 G);意大利將在11月初達(dá)到峰值,累計(jì)確診人數(shù)預(yù)測(cè)值約為294 083(見圖3 H);美國(guó)在不加強(qiáng)防控的情況下,峰值的出現(xiàn)將不早于明年1月中旬,累計(jì)確診人數(shù)預(yù)測(cè)值約為6 549 553(見圖3 I)。
注:A為中國(guó)疫情數(shù)據(jù)訓(xùn)練預(yù)測(cè)對(duì)比;B為意大利疫情數(shù)據(jù)訓(xùn)練預(yù)測(cè)對(duì)比;C為美國(guó)疫情數(shù)據(jù)訓(xùn)練預(yù)測(cè)對(duì)比;D為中國(guó)疫情數(shù)據(jù)訓(xùn)練樣本誤差;E為意大利疫情數(shù)據(jù)訓(xùn)練樣本誤差;F為美國(guó)疫情數(shù)據(jù)訓(xùn)練樣本誤差;G為中國(guó)未來180天疫情預(yù)測(cè)結(jié)果;H為意大利未來180天疫情預(yù)測(cè)結(jié)果;I為美國(guó)未來180天疫情預(yù)測(cè)結(jié)果圖3 BP神經(jīng)網(wǎng)絡(luò)模型驗(yàn)證及各國(guó)疫情預(yù)測(cè)結(jié)果
根據(jù)擬合的各參數(shù)值,利用SEIR模型分析高校復(fù)學(xué)情況下COVID -19疫情的發(fā)展趨勢(shì)。假設(shè)某高???cè)藬?shù)(易感者)為10萬,從2020年1月23日起居家隔離,均有采取嚴(yán)格的管控措施,易感者數(shù)量會(huì)顯著降低;潛伏者與感染者數(shù)量會(huì)在達(dá)到峰值后降低,并逐漸趨近為零;康復(fù)者數(shù)量上升并趨于穩(wěn)定。見圖4。
若在疫情發(fā)生120天后(即4月底)采取部分分批復(fù)學(xué)的形式,疫情基本不會(huì)因?qū)W生在校產(chǎn)生二次暴發(fā)。潛伏者與感染者數(shù)量會(huì)在疫情發(fā)生160天后清零。若188天后(兩個(gè)醫(yī)學(xué)觀察期)在無外來病例輸入的情況下,基本不會(huì)出現(xiàn)在校感染。見圖4 A。
若在疫情發(fā)生120天后采取嚴(yán)格管控下的全面復(fù)學(xué),疫情在學(xué)校出現(xiàn)二次暴發(fā)的可能性很小。但潛伏者與感染者數(shù)量清零可能會(huì)推遲到疫情發(fā)生的220天后。若248天后(兩個(gè)醫(yī)學(xué)觀察期)在無外來病例輸入的情況下,基本也不會(huì)出現(xiàn)在校感染。見圖4 B。
若在疫情發(fā)生120天后采取無嚴(yán)格管控下的全面復(fù)學(xué),疫情可能在學(xué)校出現(xiàn)二次暴發(fā)。同時(shí)潛伏者與感染者數(shù)量清零可能會(huì)推遲到疫情發(fā)生的240天后,若268天后(兩個(gè)醫(yī)學(xué)觀察期)在無外來病例輸入的情況下,在校感染可能性較低。見圖4 C。
與SARS和MERS相比,雖然COVID -19的死亡率較低,但其傳染性明顯更強(qiáng)[11]。自日本鉆石公主號(hào)發(fā)現(xiàn)大量COVID -19感染者以來,世界各國(guó)相繼出現(xiàn)確診病例,疫情形勢(shì)日趨嚴(yán)重,這對(duì)各國(guó)衛(wèi)生系統(tǒng)和經(jīng)濟(jì)等造成了重創(chuàng)。自COVID -19疫情暴發(fā)以來,國(guó)內(nèi)外多項(xiàng)研究提出傳染病動(dòng)力學(xué)模型,依托疫情相關(guān)數(shù)據(jù),科學(xué)預(yù)測(cè)疫情發(fā)展趨勢(shì),為公共衛(wèi)生管理者的決策與高效干預(yù)措施的實(shí)施提供了重要依據(jù)[11-16]。范如國(guó)等[13]建立了SEIR傳染病動(dòng)力模型,對(duì)三種不同潛伏期下的武漢疫情拐點(diǎn)和COVID -19確診病例數(shù)的峰值進(jìn)行了預(yù)測(cè);魏鳳英等[14]利用SEIR模型對(duì)全球主要疫情國(guó)家的總體態(tài)勢(shì)進(jìn)行了研判,并針對(duì)復(fù)工復(fù)產(chǎn)對(duì)疫情發(fā)展可能產(chǎn)生的影響進(jìn)行了數(shù)值模擬;Tomar等[11]利用Long-short term memory(LSTM)模型和曲線擬合,評(píng)估了印度未來30天COVID -19確診病例數(shù),并檢驗(yàn)了隔離措施的有效性;Chimmula等[15]利用LSTM模型預(yù)測(cè)加拿大COVID -19傳播的時(shí)間序列,并比較了加拿大、意大利和美國(guó)的傳播率;也有研究采用基于循環(huán)神經(jīng)網(wǎng)絡(luò)的LSTM模型預(yù)測(cè)SARS-CoV-2未來的突變率[16]。但這些研究大都立足于疫情早期的數(shù)據(jù),著重于疫情峰值、拐點(diǎn)、傳播率和防控措施有效性等問題,未在此基礎(chǔ)上進(jìn)一步考慮疫情趨于穩(wěn)定后的具體復(fù)學(xué)方案。本研究利用最新的疫情數(shù)據(jù)建立了BP神經(jīng)網(wǎng)絡(luò)模型,分析三個(gè)采用不同程度隔離措施的國(guó)家(中國(guó)、意大利和美國(guó))的疫情形勢(shì),并預(yù)測(cè)其未來半年累計(jì)確診病例數(shù)。中國(guó)疫情形勢(shì)已趨于穩(wěn)定,不會(huì)出現(xiàn)“二次高峰”。意大利采取了全國(guó)停課、封鎖交通等防控措施,累計(jì)確診人數(shù)預(yù)計(jì)在11月初達(dá)到峰值。而美國(guó)雖然疫情出現(xiàn)較晚,但防控措施不夠嚴(yán)格,預(yù)測(cè)累計(jì)確診人數(shù)峰值不會(huì)早于2021年1月中旬。對(duì)比分析三個(gè)國(guó)家的疫情發(fā)展趨勢(shì),可以看出中國(guó)疫情防控取得了重大戰(zhàn)略成果。在此基礎(chǔ)上企事業(yè)單位也精準(zhǔn)有序復(fù)工復(fù)產(chǎn)。因此現(xiàn)階段國(guó)內(nèi)更關(guān)心的問題在于高校復(fù)學(xué)、大型體育賽事、演唱會(huì)和商業(yè)集會(huì)的重啟。雖然某些高校已采取部分、分批的復(fù)學(xué)形式,但鑒于高校學(xué)生數(shù)量大,管控措施的實(shí)施可能存在諸多困難,還應(yīng)考慮復(fù)學(xué)是否會(huì)造成疫情“二次高峰”。因此,本研究依托國(guó)內(nèi)最新疫情數(shù)據(jù)建立了SEIR模型,分析高校復(fù)學(xué)時(shí)間及復(fù)學(xué)規(guī)模對(duì)高校疫情的影響。結(jié)果顯示,在疫情發(fā)生后188天左右(7月上旬),高??梢圆扇?yán)格管控的部分復(fù)學(xué),這與部分高校和教育部政策基本相符。在疫情發(fā)生后248天左右(9月上旬),高??梢圆扇?yán)格管控的全面復(fù)學(xué)。從理論上分析,在疫情發(fā)生后268天左右(9月底),高??梢圆扇o嚴(yán)格管控的全面復(fù)學(xué)。但鑒于預(yù)測(cè)結(jié)果顯示,在疫情發(fā)生120天后采取無嚴(yán)格管控的全面復(fù)學(xué)將出現(xiàn)疫情二次暴發(fā)、潛伏者及感染者數(shù)量上升。因此,不能排除在9月底采取無嚴(yán)格管控的全面復(fù)學(xué)后潛伏者及感染者數(shù)量上升的可能性。
注:A為采取措施的部分復(fù)學(xué);B為采取措施的全面復(fù)學(xué);C為未采取措施的全面復(fù)學(xué)圖4 基于SEIR模型的高校復(fù)學(xué)分析
本文采取的BP神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性映射能力、自學(xué)習(xí)能力、泛化能力、容錯(cuò)能力。這些優(yōu)點(diǎn)使其廣泛應(yīng)用于傳染病疫情預(yù)測(cè)、疾病的臨床診斷與治療分析等方面。但是隨著應(yīng)用范圍的逐步擴(kuò)大,BP神經(jīng)網(wǎng)絡(luò)也暴露出了一些不足,主要是存在局部極小化問題和樣本依賴性問題[17-18]。SEIR模型加入了人口流動(dòng)和潛伏者兩個(gè)影響因素,相較于SIR考慮更為全面,能夠較好地對(duì)病毒潛伏者乃至整個(gè)疫情的趨勢(shì)進(jìn)行預(yù)測(cè)。但SEIR模型對(duì)人群的分類還不夠細(xì)致,對(duì)數(shù)據(jù)的初值較為敏感,可能會(huì)對(duì)結(jié)果的穩(wěn)健性產(chǎn)生很大影響[12,19]。此外,BP神經(jīng)網(wǎng)絡(luò)和SEIR模型更好的有機(jī)性融合也將是下一步研究的重點(diǎn)。
綜上所述,該模型預(yù)測(cè)的結(jié)果與疫情實(shí)際發(fā)展趨勢(shì)和相關(guān)部門出臺(tái)的政策基本吻合,可為高校下一步復(fù)學(xué)計(jì)劃提供理論參考,同時(shí)可進(jìn)一步推廣至大型體育賽事、演唱會(huì)、商業(yè)集會(huì)等重啟時(shí)間的分析,刺激消費(fèi),推動(dòng)經(jīng)濟(jì)復(fù)蘇。
中國(guó)社會(huì)醫(yī)學(xué)雜志2020年6期