周 濤,蔣 曉
(1. 電子科技大學(xué)大數(shù)據(jù)研究中心 成都 611731;2. 電子科技大學(xué)學(xué)報(bào)編輯部 成都 610054)
這次新型冠狀病毒肺炎(COVID-19)疫情,是新中國成立以來我國遭遇的傳播速度最快、感染范圍最廣、防控難度最大的公共衛(wèi)生事件。為了發(fā)揮科研工作者在疫情防控中的知識貢獻(xiàn),《電子科技大學(xué)學(xué)報(bào)》于2020 年2 月1 日針對“新型冠狀病毒肺炎疫情防控”進(jìn)行了專題征稿,并開辟了快速評審和優(yōu)先發(fā)表的專門通道。本專題短期內(nèi)收到了200 余篇投稿,最終接收發(fā)表了其中的15 篇。這些論文的研究內(nèi)容覆蓋了初期感染人數(shù)的估計(jì)、早期流行病關(guān)鍵參數(shù)的估計(jì)、流行病傳播建模與趨勢預(yù)測、防控措施效果的事先預(yù)估和事后評估、與疫情相關(guān)的社會(huì)經(jīng)濟(jì)問題分析等方面。
一、初期感染人數(shù)的估計(jì)。在疾病爆發(fā)的初期,特別是針對未知流行病,往往缺少成熟有效的檢測和確診的手段,因此準(zhǔn)確估計(jì)感染人數(shù)對于判斷疫情嚴(yán)重程度并做出相應(yīng)重大決策有關(guān)鍵性的作用。一種通常的方法是根據(jù)某區(qū)域外流人口中感染的比例來反向估計(jì)當(dāng)?shù)匾呀?jīng)感染的人數(shù),例如早期廣受關(guān)注的帝國理工大學(xué)[1]和美國東北大學(xué)[2]的報(bào)告。當(dāng)然,出境感染人員數(shù)量非常有限,以此為依據(jù)的感染人數(shù)估計(jì)誤差極大。事實(shí)上,很多研究人員都注意到了,疫情傳播早期我國各地確診人數(shù)和武漢流入當(dāng)?shù)氐娜藬?shù)線性相關(guān)[3-5],因此可以用中國多個(gè)城市早期感染的人數(shù)來反推武漢初期的感染人數(shù),從而估計(jì)武漢實(shí)際感染人數(shù)和已經(jīng)確診人數(shù)之間的差距[6]。
二、早期流行病關(guān)鍵參數(shù)的估計(jì)?;驹偕鷶?shù)是指沒有干預(yù)的情況下,在全部是易感人群的環(huán)境中,平均一個(gè)患者可以傳染的人數(shù)。這是衡量流行病傳播能力最關(guān)鍵的參數(shù)之一。我們假設(shè)COVID-19 早期傳播可以用一個(gè)“易感-潛伏-傳染-移除(SEIR)”動(dòng)力學(xué)模型近似刻畫,且自由傳播時(shí)呈指數(shù)趨勢,估計(jì)基本再生數(shù)為2.8-3.9,后根據(jù)最新的流行病學(xué)特征參數(shù)修正為2.2-3.0[7](更多對基本再生數(shù)的估計(jì)結(jié)果請見文獻(xiàn)[8])。隨著防控措施的實(shí)施,傳染病傳播不再是自由傳播階段,為了評價(jià)防控措施的有效性,通常采用有效再生數(shù)對傳染病的傳播能力進(jìn)行實(shí)時(shí)評估。有效再生數(shù)Rt定義為在某時(shí)刻t,一個(gè)感染者平均而言可以感染其他個(gè)體的數(shù)量。以前的估計(jì)有效再生數(shù)的方法需要知道患者出現(xiàn)癥狀的時(shí)間,陳端兵等人[9]基于蒙特卡洛方法提出了一種依據(jù)少量患者的癥狀出現(xiàn)時(shí)間對有效再生數(shù)進(jìn)行估計(jì)的方法,為及時(shí)對防控措施的效果進(jìn)行定量評估提供了手段。
三、流行病傳播建模與趨勢預(yù)測。在本專題15 篇論文中,有近一半(7 篇)是關(guān)于COVID-19 的建模和預(yù)測。張琳[10]和梁凱豪等人[11]直接從數(shù)據(jù)入手進(jìn)行擬合,沒有考慮COVID-19 的傳播機(jī)制。一般而言,通過直接的數(shù)據(jù)擬合進(jìn)行趨勢預(yù)測,工作水平都不高,預(yù)測結(jié)果也不太靠譜,但是張琳[10]和梁凱豪等人[11]的結(jié)果卻和真實(shí)情況符合度很高,而且能夠處理一大類相近的流行病。其共同的思路是假設(shè)了感染人數(shù)的增長率會(huì)隨著累計(jì)感染人數(shù)變化,然后再把這個(gè)變化的函數(shù)關(guān)系帶入感染人數(shù)增長的微分方程中,并擬和少量參數(shù)。這類方法[10-11]給我們提出了兩個(gè)開放性的問題:一是是否可以通過分析給定感染人數(shù)或者感染人口占比后的再生數(shù)Rp(p 是感染人口占比)得到更好的刻畫流行病傳播的方式,二是如果把感染率隨著感染人數(shù)變化的規(guī)律看成刻畫流行病傳播的某種核函數(shù),是否不同類型的傳播機(jī)制可以用若干對應(yīng)的核函數(shù)進(jìn)行分類和刻畫。張琳[10]和梁凱豪等人[11]的工作也可以看作是假設(shè)了一些關(guān)鍵參數(shù)隨時(shí)間變化的規(guī)律,然后進(jìn)行擬合。喻孜等人[12]和梅文娟等人[13]的工作就是在動(dòng)力學(xué)機(jī)制模型中引入了時(shí)變參數(shù)。這種方法的出發(fā)點(diǎn)是合理的,因?yàn)殡S著疫情防控政策的變化和外界環(huán)境的變化(例如溫度等),流行病的關(guān)鍵動(dòng)力學(xué)參數(shù)可能發(fā)生變化。引入時(shí)變參數(shù),短期內(nèi)進(jìn)行預(yù)測的精度也明顯高于固定參數(shù)或者無機(jī)制模型的擬合方法,但同時(shí)也作出了巨大犧牲,因?yàn)楹茈y用這種方法做長期的預(yù)測。一種可能的辦法是建立多階段模型[14],在不同傳播階段用不同的參數(shù)進(jìn)行擬合,但不是每天一變——這樣得到的模型解釋力更強(qiáng),長期預(yù)測能力更強(qiáng),也許短期預(yù)測精度也差不多。研究人員還通過在通用流行病傳播動(dòng)力學(xué)模型中引入和COVID-19 相關(guān)的細(xì)節(jié),提高模型對真實(shí)傳播過程的刻畫和預(yù)測能力,例如范如國等人[15]考慮了潛伏期對于傳播趨勢和拐點(diǎn)的影響,林俊峰[16]考慮了隱性傳播者的影響,傅家旗等人[17]考慮了人口流動(dòng)的影響,等等。有意思的是,這些基于極早期少量數(shù)據(jù)的預(yù)測結(jié)果是比較準(zhǔn)確的,例如范如國等人[15]預(yù)測2 月19 日是武漢現(xiàn)存確診人數(shù)的拐點(diǎn),結(jié)果中國恰好在2 月19 日出現(xiàn)現(xiàn)在確診人數(shù)第一次下降,只是武漢還要略晚一些;又如林俊峰認(rèn)為4 月底國內(nèi)傳播就基本結(jié)束了,累計(jì)確診人數(shù)在十萬左右,現(xiàn)在看來也是比較準(zhǔn)確的。
四、防控措施效果的事先預(yù)估和事后評估。通過機(jī)制模型,可以模擬一個(gè)政策實(shí)施與否對于傳播范圍的影響,進(jìn)而預(yù)估特定政策可能的效果。例如喻孜等人[12]的時(shí)變參數(shù)模型顯示政府的防控措施帶來了有效傳染率的大幅度下降,與政府沒有出臺(tái)防控措施(參數(shù)保持不變)相比,截至2 月1 日,實(shí)際感染人數(shù)下降超過了50%。汪劍眉和李鋼[18]的研究顯示,降低接觸是抑制疫情所有措施中最關(guān)鍵的,其作用顯著高于其他任何措施。結(jié)合機(jī)制模型和真實(shí)數(shù)據(jù),還可以對微觀具體措施的效果進(jìn)行預(yù)估,例如模擬顯示在流感季關(guān)閉學(xué)校將是的學(xué)生接觸人數(shù)下降一半以上并整體減少流感感染人數(shù)[19]。孫皓宸等人[20]分析了中小學(xué)學(xué)生佩戴RFID 后的接觸記錄,發(fā)現(xiàn)絕大部分接觸都發(fā)生在同班學(xué)生間,進(jìn)一步的仿真結(jié)果顯示,當(dāng)僅出現(xiàn)一例確診學(xué)生時(shí),隔離一個(gè)班對疫情防控的影響與隔離全校幾乎是一致的。數(shù)學(xué)模型和統(tǒng)計(jì)分析工具還可以在事后對防控政策的整體效果進(jìn)行評估,例如李冀鵬等人[5]通過消除輸入病例的影響,給出了比較不同地區(qū)防控效果的定量方法,結(jié)果顯示了在武漢“封城”前兩周流入人口最多的50 個(gè)城市中,防疫效果最佳和最差的城市。陳端兵等人[9,21]通過計(jì)算有效生成數(shù),證實(shí)了中國防疫的巨大成就——除湖北外所有省份有效生成數(shù)都在實(shí)施防控措施一周內(nèi)下降到了1 以下。鄭文等人[22]分析了微博中關(guān)于COVID-19 感染肺炎的求助信息,可以從數(shù)據(jù)中清楚看到哪些時(shí)間和哪些地方醫(yī)療資源缺口最大,并通過求助的數(shù)量反向評估醫(yī)療資源供給的充分程度。
五、與疫情相關(guān)的社會(huì)經(jīng)濟(jì)問題分析。在本次專題的15 篇論文中,有兩篇是我們特別感興趣的“非典型論文”,討論的不是疫情防控本身,而是與疫情有關(guān)的社會(huì)經(jīng)濟(jì)問題。張欣等人[23]基于2018 年版的“中國31 省區(qū)市區(qū)域間投入產(chǎn)出表”,構(gòu)建了我國區(qū)域產(chǎn)業(yè)關(guān)聯(lián)網(wǎng)絡(luò),并引入網(wǎng)絡(luò)級聯(lián)失效模型,模擬了受新冠疫情影響,湖北省產(chǎn)業(yè)供給中斷和需求下滑,以及全國各省市因疫情防控產(chǎn)能受限和需求下降情況下,停產(chǎn)和流動(dòng)性不足風(fēng)險(xiǎn)的網(wǎng)絡(luò)傳導(dǎo)效應(yīng)。有趣的是,四川雖然靠近湖北(人員交流頻繁),但因?yàn)楹秃碑a(chǎn)業(yè)關(guān)聯(lián)弱,竟然是全國受湖北供給中斷和需求下滑沖擊影響最小的省份。廖敬儀等人[24]分析了深圳82 個(gè)家庭聚集性感染案例,共涉及212 例確診患者。基于統(tǒng)計(jì)顯著性檢驗(yàn)和零模型,廖敬儀等人[24]證實(shí)了女性被家人感染的概率顯著高于男性,定量化支持了“女性在家庭環(huán)境中承擔(dān)更多護(hù)理角色”的假設(shè),并建議要在公共衛(wèi)生事件中加強(qiáng)性別視角。
本專題收錄的工作都是疫情發(fā)展早期甚至初期的來稿,部分模型和分析還比較粗糙,但是我們依然能夠從這些早期的研究中看出數(shù)學(xué)模型和基于真實(shí)數(shù)據(jù)的統(tǒng)計(jì)分析對于深入理解COVID-19 本身以及與COVID-19 爆發(fā)相關(guān)的社會(huì)經(jīng)濟(jì)問題的重要作用。未來的相關(guān)研究應(yīng)該更加精細(xì)化,具有更強(qiáng)的解釋力和預(yù)測精度。首先要考慮更廣泛和深入的數(shù)據(jù),包括多個(gè)國家和地區(qū)的數(shù)據(jù)以及記錄了具體人與人之間接觸行為的微觀數(shù)據(jù)[21,25-26]。特別需要強(qiáng)調(diào)的是,了解人口結(jié)構(gòu)、人口流動(dòng)、家庭規(guī)模分布、學(xué)校規(guī)模分布和企業(yè)規(guī)模分布等等數(shù)據(jù),都是為了再現(xiàn)人與人之間真實(shí)的接觸模式[27]——中國的健康碼稍加改造就能記錄這些數(shù)據(jù)。國外有些學(xué)者對此談虎色變,認(rèn)為對個(gè)人隱私是一種侵犯,實(shí)際上有很多辦法可以既保護(hù)隱私,又能記錄接觸行為(這樣的例子和最近的研究很多,例如github 上的DP-3T 項(xiàng)目)。其次是需要考慮COVID-19 傳播動(dòng)力學(xué)特殊的復(fù)雜性,例如可能存在大量隱形的傳播[16,28],又如最近的研究顯示SARS 治愈者可能擁有對COVID-19 的抗體[29],因此有必要考慮多種冠狀病毒傳播之間的交互作用[30],再如醫(yī)療資源的豐度和基于經(jīng)濟(jì)社會(huì)綜合考量的政策選擇也會(huì)對COVID-19 后期的流行程度帶來影響[30-33]。充分考慮這些復(fù)雜因素,才能得到更加準(zhǔn)確且具有參考價(jià)值的結(jié)論。