傅家旗,劉 敏,鄧春燕,黃 娟,江明珠,郭 強(qiáng),劉建國
(1. 上海理工大學(xué)復(fù)雜系統(tǒng)科學(xué)研究中心 上海 楊浦區(qū) 200093;2. 北京工商大學(xué)計(jì)算機(jī)與信息工程學(xué)院 北京 海淀區(qū) 100048;3. 上海財(cái)經(jīng)大學(xué)金融科技研究院 上海 楊浦區(qū) 200433)
利用實(shí)證數(shù)據(jù)對(duì)流行病傳播過程進(jìn)行建模分析有助于深入分析流行病傳播的內(nèi)在機(jī)制,預(yù)測傳播范圍,為進(jìn)行有效的流行病防控提供重要依據(jù)[1-3]。由于缺乏對(duì)新型冠狀病毒肺炎(COVID-19)傳播機(jī)制的了解,且沒有針對(duì)新型冠狀病毒(SARS-CoV-2)的疫苗,自COVID-19 確診以來,確診規(guī)模不斷擴(kuò)大[4]。據(jù)國家衛(wèi)生健康委員會(huì)官方網(wǎng)站的疫情通報(bào)數(shù)據(jù)顯示,截止至2020 年3 月2 日24 時(shí),累計(jì)報(bào)告確診病例80 151 例,累計(jì)死亡病例2 943 例。世界衛(wèi)生組織官網(wǎng)宣布,將COVID-19 疫情列為國際關(guān)注突發(fā)公共衛(wèi)生事件。疫情的爆發(fā)不僅給各地醫(yī)療公共衛(wèi)生機(jī)構(gòu)[5-7],以及科學(xué)界帶來了巨大挑戰(zhàn),還使各行各業(yè)直接面臨停工停產(chǎn)的嚴(yán)峻考驗(yàn)。盡管在國家和各地政府的努力下,疫情蔓延的勢頭在一定程度上受到遏制[8],但限于對(duì)COVID-19 傳播機(jī)制的認(rèn)知,有關(guān)疫情可能持續(xù)的期限、近期出現(xiàn)拐點(diǎn)的可能性和可以采取的最有效防控措施等問題仍莫衷一是。因而,在缺乏確切的治愈手段和疫苗的情況下,對(duì)COVID-19 的傳播機(jī)制進(jìn)行解構(gòu)分析,能幫助準(zhǔn)確研判疫情的傳播途徑和擴(kuò)散范圍,以便及時(shí)干預(yù),科學(xué)防治,精準(zhǔn)施策,最大限度降低疫情的影響。
引發(fā)COVID-19 的SARS-CoV-2 是一種新型病毒,各領(lǐng)域的專家學(xué)者在短時(shí)間內(nèi)做了大量的研究工作,為深入分析病毒的特性和COVID-19 的傳播機(jī)制提供了第一手資料。除針對(duì)COVID-19 病理學(xué)及發(fā)病機(jī)理的研究[9-10]外,科研工作者及時(shí)追蹤每天疫情的進(jìn)展及病例動(dòng)態(tài),進(jìn)而對(duì)COVID-19 疫情的發(fā)展態(tài)勢進(jìn)行預(yù)測和分析。研究工作主要集中在預(yù)估新增病例和死亡人數(shù)[11-13]、COVID-19 傳染機(jī)制的研究[14-16]、人員流動(dòng)對(duì)疫情傳播的影響[17-19]、隔離和疑似病例對(duì)疫情的影響[20]、估計(jì)疫情在境外的發(fā)展趨勢[21-22]、未來疫情防控工作中對(duì)醫(yī)療衛(wèi)生服務(wù)的需求[23]等。
目前,學(xué)者們對(duì)COVID-19 的研究已取得了進(jìn)展,然而,對(duì)于病毒傳播過程的模型設(shè)計(jì)還有待完善。本文試圖從實(shí)證數(shù)據(jù)出發(fā),結(jié)合COVID-19 傳播的特點(diǎn),提出了P-SI 模型。該模型考慮了省際流動(dòng)人群對(duì)每天新增感染COVID-19 病例的影響,能夠刻畫一個(gè)省內(nèi)每天新增感染COVID-19 病例的變化趨勢。本文用2019 年12 月31 日?2020 年1月30 日的實(shí)證數(shù)據(jù)擬合出P-SI 模型,該模型可以描述湖北省3 個(gè)階段的COVID-19 傳播情況。此外,本文還發(fā)現(xiàn)用另一個(gè)相同的P-SI 模型可以描述其他4 省的COVID-19 傳播過程。用實(shí)證數(shù)據(jù)檢驗(yàn)擬合的模型能夠描述各省每天新增感染COVID-19 的人數(shù)。在此基礎(chǔ)上,以2020 年1 月23 日為分界點(diǎn),將分界點(diǎn)前的實(shí)證數(shù)據(jù)視為訓(xùn)練集,擬合各省的P-SI 模型。在修正了擬合模型的參數(shù)后,本文發(fā)現(xiàn)擬合模型能夠?qū)Ψ纸琰c(diǎn)后的每天新增病例人數(shù)作輔助預(yù)測,其預(yù)測出各省感染COVID-19 的動(dòng)態(tài)情況與實(shí)證數(shù)據(jù)相符。
本文基于實(shí)證數(shù)據(jù)對(duì)COVID-19 的傳播過程進(jìn)行建模,并運(yùn)用該模型對(duì)每天新增感染人數(shù)作預(yù)測。經(jīng)典SI 模型利用傳播機(jī)制的微分方程模擬傳染病的感染爆發(fā)過程,在地區(qū)總?cè)藬?shù)不變的情況下設(shè)定感染率模擬感染過程[24-26]。本文則在經(jīng)典模型的基礎(chǔ)上,結(jié)合流動(dòng)人口的變化情況構(gòu)建P-SI 模型對(duì)COVID-19 傳播過程進(jìn)行模擬預(yù)測。
根據(jù)COVID-19 傳染性較強(qiáng)的特點(diǎn)[27-28],本文將人群分為兩類:易感人群(S)、感染人群(I)。易感人群為暴露在公共場合下的所有人,感染人群為COVID-19 的確診病例。鑒于COVID-19 隨流動(dòng)人口傳播,導(dǎo)致相關(guān)省份COVID-19 病例在短時(shí)間內(nèi)急劇增加,故在構(gòu)建模型時(shí)加入流動(dòng)人口因素。為構(gòu)建一個(gè)簡單而有效的模型,先作如下假設(shè):
假設(shè)1:其他4 省在傳播初期流動(dòng)到湖北省的人群均視作易感人群(實(shí)證數(shù)據(jù)的信息與此假設(shè)一致)。在湖北省受到感染人群能流動(dòng)到其他省,已流動(dòng)到其他4 省的感染人群不再進(jìn)行省際流動(dòng)。
假設(shè)2:從湖北省流向其他4 省的人員均視作當(dāng)天抵達(dá)所屬省。
將2020 年12 月31 日?1 月23 日的湖北省視為一個(gè)開放系統(tǒng),有客居人口及流動(dòng)人口這兩部分人群。這兩部分人群最終未滯留在湖北省,均于2020 年1 月23 日前回到所屬省。
客居人口是指原本屬于其他4 省,但又長期客居在湖北省的人口。在湖北省(H)COVID-19 傳播期間,定義在第t 天客居人口中易感人群的數(shù)量為SH(t), 感染人群的數(shù)量為 IH(t)。流動(dòng)人口是指從外省經(jīng)過湖北省,短期逗留后又離開湖北省的人口。類似地,定義第t 天流動(dòng)人口中由省i 流動(dòng)到湖北省的易感人群數(shù)量為 SiH(t),由湖北省流動(dòng)到其他省的易感人群數(shù)量為 SHo(t),由湖北省流動(dòng)到其他省的感染人群的數(shù)量為 IHo(t)。
如果引入人口流動(dòng)率 PHo(t)和每天新增感染COVID-19 人數(shù) ?IH(t),便能構(gòu)建如圖1 所示的傳播模型。
圖1 湖北省P-SI 模型示意圖
每天新增感染COVID-19 人數(shù) ?IH(t)主要由前一天的感染人數(shù) IH(t ?1)決定。這是因?yàn)镃OVID-19主要通過人與人之間的接觸傳播[29],COVID-19 的擴(kuò)散范圍主要由病毒攜帶者的生活圈大小決定。鑒于COVID-19 有潛伏期,本文認(rèn)為在COVID-19 傳播早期,某些受到感染的人并不會(huì)馬上發(fā)病。因此,每天新增感染COVID-19 人數(shù) ?IH(t)在早期的增長速度應(yīng)該比較緩慢。此外,湖北省并非是一個(gè)封閉系統(tǒng),人員流動(dòng)也較為頻繁,因而在短期內(nèi),感染人數(shù)的增加并不會(huì)對(duì)湖北省這幾個(gè)城市的易感人群造成顯著影響。基于上述考慮,本文建立每天新增感染COVID-19 人數(shù) ?IH(t)與 感染人數(shù)IH(t ?1)的線性模型:
式中,參數(shù)λH是傳染率,表示由感染人群將病毒通過朋友圈傳給易感人群,并導(dǎo)致該省新增COVID-19的重要參數(shù);εH則是一個(gè)誤差常數(shù)。
本文將浙江、安徽、陜西和廣東這4 省視作半開放系統(tǒng),一旦有人員從湖北省返回其中某個(gè)省,便不再離開。而原本就在4 省的人員也不離開所屬省。因而,這4 省有常駐人口以及流入人口這兩部分人群。常駐人口包含兩部分:一部分是易感人群Si(t) ,另一部分則是感染人群 Ii(t)。同樣地,本文定義的流入人口也包含兩部分:一部分是易感人群SHi(t), 另一部分則是感染人群 IHi(t)。不同省的流入人口總和應(yīng)與湖北流動(dòng)到各省的總?cè)藬?shù)一致:
如果引入人口流動(dòng)率 PiH(t)和每天新增感染COVID-19 人 數(shù) ?Ii(t),便 能 構(gòu) 建 如 圖2 所 示 的COVID-19 模型。
圖2 4 省P-SI 模型示意圖
式中,人口流動(dòng)率 PiH(t)刻畫了COVID-19 感染初期的第t 天由從外省流動(dòng)到湖北人口的比率。
考慮到在COVID-19 傳播中后期,具有傳染性的感染人數(shù) IiC(t ?1)快速增加,式(3)所描述的新增感染人數(shù)緩慢增加的模型已不再適用這一情形。一方面,與感染人員接觸的易感人群很快會(huì)受到傳染;另一方面,易感人群間彼此接觸的社交行為也為間接傳染帶來了可能性。此時(shí),由于省內(nèi)的人員不再向外流動(dòng),如果控制不當(dāng),COVID-19 會(huì)在有限的易感人群中迅速擴(kuò)散。基于上述考慮,本文建立每天新增感染COVID-19 人數(shù) ?Ii(t)與易感人數(shù)Si(t ?1)和 具有傳染性的感染人數(shù) IiC(t ?1)的模型:
式中,參數(shù) λi1和 λi2均 為傳染率; λi1表示該省由感染人群直接傳染給易感人群的傳染率; λi2是指因易感人群之間彼此接觸時(shí)可能發(fā)生傳染的間接傳染率;εi則是一個(gè)誤差常數(shù)。
在進(jìn)行模型擬合前,把實(shí)證數(shù)據(jù)中的573 例感染人員每天的狀態(tài)進(jìn)行分類統(tǒng)計(jì)。把湖北省及其他4 個(gè)省每天的每1 例人員分別歸入到新增感染COVID-19 人數(shù) ?Ii、 具有傳染性的感染人數(shù) IiC、不具有傳染性的感染人數(shù) IiB或易感人數(shù)Si。從而,便可統(tǒng)計(jì)出每天分布在各省的新增感染COVID-19 的總?cè)藬?shù)、已感染的總?cè)藬?shù)以及仍處于易感狀態(tài)的總?cè)藬?shù)?;谏鲜鰵w類,將各省的數(shù)據(jù)分別代入式(3)和式(8),再用Matlab 中的nlinfit 函數(shù)求得對(duì)應(yīng)的參數(shù),完成模型的擬合。
基于構(gòu)建的P-SI 模型,本文利用4 省中早期的感染情況來預(yù)測后期的感染情況。盡管COVID-19的傳播行為可以用式(8)來描述,但由于COVID-19傳播行為的特征在不同時(shí)期并不相同,以中早期的COVID-19 傳播數(shù)據(jù)擬合的P-SI 模型顯然不適合用于預(yù)測后期的COVID-19 傳播行為。于是,本文考慮對(duì)擬合的P-SI 模型加以修正,主要修正模型中的參數(shù),使修正后的P-SI 模型與實(shí)證數(shù)據(jù)反映的真實(shí)情境相符。
本文通過變更方向和設(shè)置步長來修正參數(shù)。首先,將P-SI 模型中的參數(shù)列成1 個(gè)3 維向量的形式: η=(εi, λi1, λi2)T,接著設(shè)置修正的方向和步長。引入1 個(gè)方向矩陣Φ:
方向矩陣Φ 中的任意一行均與參數(shù)向量η 中的元素一一對(duì)應(yīng),任取第i 行元素形成向量 Φi,向量 Φi可視作向量η 的修正方向。如向量η 能依次按照方向矩陣Φ 中的所有行向量 Φi變化,相當(dāng)于對(duì)向量η 的所有可能方向做了遍歷。有了確切的修正方向后,還需設(shè)置修正步長。將步長的設(shè)置分為2 項(xiàng):第1 項(xiàng)是根據(jù)上述參數(shù)向量η 中每個(gè)元素本身的取值大小來定義的1 個(gè)3 維向量κ =(κ1,κ2,κ3)。根據(jù)擬合的結(jié)果,4 個(gè)省擬合得到的參數(shù)εi分布在區(qū)間(?3, 1)內(nèi),參數(shù) λi1和 λi2分布在區(qū)間(0.000 8,0.02)內(nèi)。基于此,定義向量元素κ1=1,κ2和κ3則在區(qū)間[0.001,0.005]之間變化。另1 項(xiàng)為調(diào)節(jié)常數(shù) β, β ∈ (0, 10)。修正的步長便以 βκ來定義。于是,按照式(10)計(jì)算得到調(diào)整后的參數(shù)向量為:
接著,按照更新后的模型來預(yù)測某省后期的感染情況。根據(jù)假設(shè)1,已流動(dòng)到其他省的感染人群不再進(jìn)行省際流動(dòng),這段時(shí)期內(nèi)本省的總?cè)藬?shù)穩(wěn)定,變化的是每個(gè)人處于易感或感染狀態(tài)。所以,可以按照式(6)和式(7)將訓(xùn)練集中最近的感染人數(shù)Ii和易感人數(shù)Si更新為模型所需的初始感染人數(shù)Ii和易感人數(shù)Si。然后,將這兩個(gè)初值和修正后的參數(shù)代入式(11)計(jì)算出每天新增感染人數(shù)為:
本文選取了在浙江、安徽、廣東、陜西4 省發(fā)現(xiàn)的573 例COVID-19 感染人員進(jìn)行研究。數(shù)據(jù)覆蓋 的 時(shí) 間 從2019 年12 月31 日?2020 年1 月30日,包含了感染人員進(jìn)入湖北省的日期,離開湖北省的日期、發(fā)病日期、就診日期和確診日期。其中,有部分人員長期在湖北省居住,并在2020 年1 月30 日前返回上述4 省,累計(jì)163 人。部分人員在返回上述4 省期間,曾在湖北省短期停留,累計(jì)252 人。還有部分人員沒有去過湖北省,一直在上述4 省,累計(jì)158 人。本文對(duì)這3 類人員做了統(tǒng)計(jì),如表1 所示。本文在使用P-SI 模型擬合湖北省和4 省的COVID-19 傳播過程時(shí),用的是2020 年12 月31 日?1 月30 日的完整數(shù)據(jù)。
表1 實(shí)驗(yàn)統(tǒng)計(jì)數(shù)據(jù)
實(shí)證數(shù)據(jù)中每個(gè)病例都有確切的發(fā)病日期,但個(gè)別數(shù)據(jù)缺少確診日期或僅登記了就診日期,這為準(zhǔn)確定義每個(gè)病例發(fā)病后所具備傳染性的有效時(shí)間帶來了不確定性。為準(zhǔn)確估算每個(gè)病例傳染性的有效時(shí)間,對(duì)所有登記了就診日期和確診日期的病例做了統(tǒng)計(jì),發(fā)現(xiàn)從就診日期至確診日期的平均值為3.845 2 天(約為4 天),從發(fā)病日期至確診日期的平均值為6.291 0 天(約為6 天)。本文分2 種情況為缺少確診日期的病例推算確診日期,對(duì)登記了就診日期的病例按延后4 天推算出確診日期,同時(shí)對(duì)沒有登記就診日期記錄的病例按延后6 天推算出確診日期。從而可為每個(gè)病例定義發(fā)病日期至確診日期為具備傳染性的時(shí)間段。
以2020 年1 月23 日湖北武漢“封城”作為分界點(diǎn),對(duì)各省感染的數(shù)據(jù)進(jìn)行劃分,將2019 年12 月31 日?2020 年1 月23 日的4 省數(shù)據(jù)劃分為訓(xùn)練集,將2020 年1 月24 日?1 月30 日的4 省數(shù)據(jù)劃分為測試集。
由于國家衛(wèi)生健康委員會(huì)和各地方政府每天都會(huì)公布有關(guān)疫情和感染情況的實(shí)時(shí)通報(bào),可以掌握實(shí)證數(shù)據(jù)573 例感染人員的實(shí)時(shí)狀態(tài)。在擬合出P-SI 輔助預(yù)測模型后,實(shí)際可以得到大量與2019年12 月31 日?2020 年1 月23 日期間感染情況相符的模型。為了從中選出最符合實(shí)際情況模型,根據(jù)2020 年1 月24 日與1 月25 日2 天的實(shí)時(shí)通報(bào)中公布的新增感染COVID-19 人數(shù),僅保留擬合模型中預(yù)測得到的2020 年1 月24 日與1 月25 日這兩天每天新增感染COVID-19 人數(shù)與實(shí)際最接近的模型。于是,本文便能得到有限個(gè)較為理想的PSI 輔助預(yù)測模型,從而再用這些模型預(yù)測2020 年1 月24 日?1 月30 日4 省感染COVID-19 的總體情況。
本文根據(jù)掌握的573 位感染人員的數(shù)據(jù),分別對(duì)湖北省及其他4 個(gè)省的COVID-19 傳播模型進(jìn)行擬合。由于湖北省武漢市于2020 年1 月23 日當(dāng)日10:00 開始“封城”,湖北省其他城市也采取了嚴(yán)格的措施,大部分客居人員和流動(dòng)人員大都在“封城”前回到自己所屬省。本文便以2019 年12 月31 日?2020 年1 月23 日期間在湖北長期客居和短期停留人員的感染情況數(shù)據(jù)來擬合湖北省的COVID-19 傳播模型。將統(tǒng)計(jì)信息代入式(3),便可求解得出參數(shù)λH=0.526 1 和參數(shù)εH=0.349 9。擬合結(jié)果如圖3 所示。
圖3 湖北省每天新增感染COVID-19 人數(shù)擬合圖
圖3 中空心方塊標(biāo)記的曲線描述了湖北省每天新增感染COVID-19 人數(shù),空心圓圈標(biāo)記的曲線則是根據(jù)擬合的傳播模型計(jì)算得出每天新增感染COVID-19 人數(shù)。從空心方塊標(biāo)記的曲線變化趨勢看,傳播分為3 個(gè)階段:第1 階段是2019 年12 月31 日?2020 年1 月8 日,為病毒傳播的最初期。每天的新增感染人數(shù)在該階段相對(duì)較少。第2 階段是2020 年1 月9 日?1 月15 日,為病毒傳播的平穩(wěn)期。每天的新增感染人數(shù)在該階段有所上升,并伴有微小波動(dòng)。第3 階段是2020 年1 月16 日?1 月23 日,為病毒傳播的爆發(fā)期。每天的新增感染人數(shù)在該階段急劇增加,達(dá)到頂峰。后因所有客居人員或流動(dòng)人員均在湖北省采取嚴(yán)厲措施前回到所屬省,所以湖北省的感染人數(shù)隨人員的離開而降低了。
擬合曲線的變化趨勢與實(shí)際曲線大體相同,能大致地將每天新增感染COVID-19 人數(shù)描繪出來,在圖中能夠明顯區(qū)分出3 個(gè)階段的變化。同時(shí)擬合曲線能將某些日期上新增感染人數(shù)的波動(dòng)體現(xiàn)出來。如空心方塊標(biāo)記的曲線展示出了2020 年1 月4 日、1 月9 日、1 月16 日人數(shù)的上升,以及在1 月18 日先下降,在1 月19 日又上升等變化趨勢??招膱A圈標(biāo)記的曲線也都較好地描繪了類似變化趨勢,只是在日期上可能會(huì)有1~2 天的時(shí)間差。這主要是因?yàn)橛糜跀M合的數(shù)據(jù)量有限,會(huì)帶來一些誤差。
以2019 年12 月31 日?2020 年1 月30 日間在湖北短期停留人員和沒有去過湖北人員的感染情況數(shù)據(jù)來擬合4 個(gè)省的COVID-19 傳播模型。本文將4 組統(tǒng)計(jì)信息代入式(8),便可求解得出對(duì)應(yīng)的4 組參數(shù)。其中浙江省的參數(shù) λi1= 0.003 4, λi2=0.002 3,參數(shù)εi=?1.646 2;安徽省的參數(shù)λi1=0.007 9,λi2=0.000 8,參 數(shù)εi=0.275 7;陜 西 省 的 參 數(shù)λi1= 0.010 2, λi2=0.008 3,參數(shù)εi=?0.726 1;廣東省的參數(shù)λi1= 0.019 0,λi2=0.015 5,參數(shù)εi=?2.517 8,結(jié)果如圖4 所示。
圖4a~4d 中空心方塊標(biāo)記的曲線依次描述浙江、安徽、陜西、廣東4 個(gè)省每天新增COVID-19 實(shí)際感染人數(shù),空心圓圈標(biāo)記的曲線則是根據(jù)擬合的傳播模型計(jì)算得出每天的新增感染人數(shù)。從空心方塊標(biāo)記的曲線的變化趨勢看,傳播的最初期和平穩(wěn)期內(nèi)新增感染人數(shù)并沒有顯著變化,在2020 年1 月16?1 月18 日開始進(jìn)入COVID-19 傳播的爆發(fā)期。前期感染人數(shù)變化不顯著的原因是當(dāng)時(shí)感染源主要在湖北武漢,由少量離開湖北到外省的流動(dòng)人員攜帶SARS-CoV-2 至所屬省,引發(fā)COVID-19 初期傳播。由于從湖北省到這4 個(gè)省乘坐高鐵,只需1 天即可抵達(dá)。在武漢“封城”前,攜帶SARS-CoV-2 的感染人員陸續(xù)返回所屬省,大量輸入病例進(jìn)入該省,COVID-19 也隨之傳播。因而,4 省的爆發(fā)期與湖北省的非常接近。在4 省的爆發(fā)期,新增感染人數(shù)達(dá)到峰值以后曲線陡然下降。一方面是因?yàn)楸疚膬H追蹤了有限的實(shí)證數(shù)據(jù),其中涉及的易感人群已大都受到了感染,將來可能被感染的易感人群成為了極少數(shù),所以新增感染人數(shù)也接近于0。另一方面是因?yàn)楦魇【鸭哟罅朔揽亓Χ?,限制了COVID-19 的傳播渠道和速度,新增感染人數(shù)也相應(yīng)地得到了一定的控制。
圖4 4 個(gè)省每天新增感染COVID-19 人數(shù)擬合圖
空心圓圈標(biāo)記的擬合曲線能夠大致地刻畫每天新增感染人數(shù)的變化趨勢,尤其刻畫了最初期及平穩(wěn)期新增感染人數(shù)保持平穩(wěn)的趨勢,而在爆發(fā)期人數(shù)急劇攀升和人數(shù)陡然下滑的變化趨勢也與實(shí)際情況大體相符。以浙江省為例,可以觀察到,該省的實(shí)際新增感染人數(shù)在2020 年1 月15 日前較為平穩(wěn),在1 月16 日以后便迅速上升,在1 月21 日到達(dá)峰值后,在22 日略有下降,在1 月23 日再次攀升后便立即下降。相應(yīng)地,空心圓圈標(biāo)記的擬合曲線同樣在2020 年1 月16 日以后迅速上升,在1 月23 日到峰值后便立即下降。該擬合曲線較為平滑,盡管沒能刻畫真實(shí)情況中的一些細(xì)微變化,如:局部峰值,先降后升的變化,或在日期上存在1~2 天的偏差等情況,但總體上能夠反映該省每天新增感染COVID-19 情況。其他3 個(gè)省的擬合曲線總體上也比較符合實(shí)際情況??梢?,用同1 個(gè)模型能夠模擬4 個(gè)省的COVID-19 傳播過程。
按1.3、2.1 和2.2 節(jié)的思路將4 個(gè)省的實(shí)證數(shù)據(jù)劃分為訓(xùn)練集和測試集,依次運(yùn)用各省的訓(xùn)練集數(shù)據(jù)擬合出P-SI 模型的相關(guān)參數(shù)。以2020 年1 月23 日的感染人數(shù)Ii和易感人數(shù)Si為初始信息,將其代入式(8)推測出1 月24 日的新增感染人數(shù)?Ii,更新當(dāng)天的感染人數(shù)Ii和易感人數(shù)Si,以此類推,得到1 月25 日的每天新增感染人數(shù) ?Ii,感染人數(shù)Ii和易感人數(shù)Si。
在產(chǎn)生了多組模型后,對(duì)照2020 年1 月24 日?1 月25 日兩天的新增感染COVID-19 實(shí)際人數(shù),按每個(gè)省分別選取了預(yù)測結(jié)果最接近實(shí)際情況的4 個(gè)模型,并以之對(duì)2020 年1 月24 日?1 月30 日感染COVID-19 的情況進(jìn)行了預(yù)測。將預(yù)測結(jié)果展示在圖5 上,可以從圖5 看到預(yù)測得到新增感染人數(shù) ?Ii、感染人數(shù)Ii、易感人數(shù)Si與實(shí)際人數(shù)之間的差異。同時(shí),從上述16 個(gè)模型得到預(yù)測結(jié)果最接近每天新增感染COVID-19 人數(shù)的4 個(gè)模型的參 數(shù),列于表2。
圖5 4 省2020 年1 月24 日以后的預(yù)測結(jié)果趨勢圖
表2 4 省的P-SI 模型修正后的參數(shù)
圖5a~5l 依次展示了模型對(duì)浙江、安徽、陜西和廣東4 省每天新增感染人數(shù) ?Ii、 感染人數(shù)Ii和易感人數(shù)Si的預(yù)測情況。以浙江省為例,圖中由空心方塊標(biāo)記的曲線描述了該省每天實(shí)際新增感染人數(shù)、感染人數(shù)和易感人數(shù),由空心圓圈、空心三角形、空心倒三角形和空心菱形標(biāo)記的曲線則分別對(duì)應(yīng)參數(shù)β 取不同值時(shí)所得到的預(yù)測結(jié)果。根據(jù)圖5a,可以發(fā)現(xiàn)由空心方塊標(biāo)記的曲線描繪的每天實(shí)際新增感染人數(shù) ?Ii在2020 年1 月25 日前和1 月28 日后單調(diào)下降,而在1 月26 日和1 月27 日間有一個(gè)先增后降的過程。P-SI 模型預(yù)測的每天新增感染人數(shù) ?Ii是一條單調(diào)下降的曲線,與實(shí)際情況較為接近,但沒有能預(yù)測出該省在2020 年1 月26 日和1 月27 日間感染人數(shù)的波動(dòng)。圖5b 和圖5c 則是根據(jù)預(yù)測到的每天新增感染人數(shù) ?Ii求得的感染人數(shù)Ii和易感人數(shù)Si變化趨勢。從感染人數(shù)Ii和易感人數(shù)Si的變化趨勢來看,預(yù)測結(jié)果本來與實(shí)際情況略有偏差,只因模型未能預(yù)測到2020 年1 月26 日和1 月27 日新增感染人數(shù)的一個(gè)上升波動(dòng),加大了預(yù)測的易感人數(shù)Si以及感染人數(shù)Ii與實(shí)際人數(shù)的偏差量,但總體的變化趨勢較為一致。
根據(jù)4 個(gè)省的預(yù)測趨勢圖,可以看出盡管預(yù)測模型對(duì)每天新增感染人員的波動(dòng)情況還不能準(zhǔn)確刻畫,而沒有掌握2020 年1 月23 日流動(dòng)人員入省的信息對(duì)感染人數(shù)Ii和易感人數(shù)Si的預(yù)測存在一定影響,如造成了廣東省在2020 年1 月24 日預(yù)測的新增感染人數(shù)與實(shí)際情況出現(xiàn)了些許偏差,且這部分偏差致使后期對(duì)當(dāng)?shù)馗腥救藬?shù)的預(yù)測偏差逐漸加大。但該輔助預(yù)測模型對(duì)每個(gè)省的感染情況的描述還是大致符合實(shí)際的。此外,預(yù)測得到的各省的參數(shù)彼此間存在差異,體現(xiàn)了COVID-19 在各省傳播擴(kuò)散的速度和程度有所不同。
本文以4 省573 例感染COVID-19 的病患信息研究了COVID-19 在湖北省及4 省的傳播特性。基于2019 年12 月31 日?2020 年1 月30 日的實(shí)證數(shù)據(jù),本文以湖北省作為研究區(qū)域構(gòu)建了P-SI 模型。該模型考慮綜合考慮了客居人口及流動(dòng)人口對(duì)COVID-19 傳播的影響。本文還構(gòu)建了另一個(gè)P-SI 模型,可以同時(shí)描述另外4 省人員每天新增感染COVID-19 的實(shí)際情形。本文分別用實(shí)證數(shù)據(jù)對(duì)湖北省及4 省的模型進(jìn)行擬合,擬合的曲線能夠反映各省每天新增感染人數(shù),且能描述各省COVID-19 在不同時(shí)期的情況。在此基礎(chǔ)上,本文還利用2019 年12 月31 日?2020 年1 月23 日的實(shí)證數(shù)據(jù)預(yù)測了4 省2020 年1 月24 日以后每天新增感染人數(shù)及對(duì)應(yīng)省的總體感染情況。實(shí)驗(yàn)結(jié)果說明,PSI 輔助預(yù)測模型能夠預(yù)測出每天新增感染人數(shù),同時(shí),能夠輔助研判各省的總體感染情況。
盡管本文構(gòu)建的P-SI 模型能夠刻畫COVID-19 的傳播過程,但現(xiàn)有的模型還并不完善。該模型沒有考慮病毒在人體內(nèi)有潛伏期的因素。本文沒有深入分析感染的流動(dòng)人員對(duì)傳播過程的影響。此外,在實(shí)際情況下,每天新增感染人數(shù)的變化趨勢并不平滑,該模型對(duì)不平滑的情況難以預(yù)測。本文的研究僅僅局限于一個(gè)小樣本,而各省市的真實(shí)病例情況更加復(fù)雜,需要更加精細(xì)的模型來客觀描述實(shí)際情形。這些問題將在以后的工作中再做專門的研究。
感謝上海理工大學(xué)李仁德老師,浙江師范大學(xué)胡兆龍老師和蘇黎世大學(xué)林堅(jiān)洪博士的交流與討論。