康觀龍 柳炳祥
摘要:本文利用Python爬蟲技術(shù),獲取國家衛(wèi)健委每日發(fā)布的新冠肺炎相關(guān)病例(確診、疑似、治愈、死亡)數(shù)據(jù),基于疫情初期數(shù)據(jù)用SIR模型建立疫情變化趨勢圖,再結(jié)合政府制定的一系列干預(yù)政策,考慮其他影響疫情發(fā)展的因素,用改進的SIR模型對疫情進行預(yù)測,并對疫情的發(fā)展階段和趨勢進行評估,得出在政府干預(yù)下,新冠肺炎疫情高峰下降及結(jié)束時間提前,肯定了政府干預(yù)措施的必要性,為世界各國建立有效的疫情防控提供參考。
關(guān)鍵詞:Python爬蟲技術(shù);SIR模型;新冠肺炎疫情
中圖分類號:R563.1 ??文獻標識碼:A
收稿日期:2020-06-04
作者簡介:康觀龍(1996-),男,碩士研究生,研究方向:大數(shù)據(jù)分析;柳炳祥(1966-),男,教授,碩士生導(dǎo)師,研究方向:數(shù)據(jù)挖掘與統(tǒng)計分析。
1 引言
2019年新型冠狀病毒肺炎在全國迅速蔓延,極大影響了社會的正常運轉(zhuǎn),在國家的強力有效干預(yù)下,改善衛(wèi)生設(shè)施,提高針對性的醫(yī)療技術(shù)和水平,新冠肺炎在我國已經(jīng)得到有效的控制。新冠肺炎爆發(fā)以來,作者密切關(guān)注疫情發(fā)展并試圖利用已有數(shù)據(jù)對疫情進行預(yù)測分析,現(xiàn)有SIR傳染病預(yù)測模型對疫情進行預(yù)測,并沒有考慮外部因素的影響,文章結(jié)合國家相關(guān)干預(yù)手段,利用改進的SEIR模型對已有疫情數(shù)據(jù)進行預(yù)測分析和評估,對比政府干預(yù)前后的疫情數(shù)據(jù),認識到政府干預(yù)對公共安全事件的積極影響,為今后預(yù)防、控制和治療類似疫情提供參考。
2 SIR模型建立
Kermack等利用參數(shù)優(yōu)化及非線性動力學(xué)方法,建立了研究傳染病傳播的經(jīng)典倉室模型[1]。倉室模型的思想,就是把自然狀態(tài)下的人群分為若干倉室,處于傳染病不同階段的人群代表相應(yīng)的倉室。倉室模型最具代表性的模型是SIR模型,SIR模型中的S、I和R分別代表Susceptible(易感者)、Infectious(感病者)及Recovered(康復(fù)者),易感者就是指存在傳染病的地區(qū)中健康但是會被該傳染病感染的人群,易感者就是指在該地區(qū)因為某些原因不幸得到傳染病且具有將傳染病傳染給他人的人群,康復(fù)者是指該地區(qū)中感病者經(jīng)過治療或者其他原因痊愈的人。
SIR模型提出的前提是:發(fā)生傳染病的地區(qū)在該疾病出現(xiàn)至基本結(jié)束期間,人口數(shù)量沒有變化即出生率和死亡率為零,人口也沒有遷入遷出。所以總?cè)丝贜=S+I+R,另外染病者痊愈后不再被感染。由于傳染病的傳染性,各倉室人群的數(shù)量是不斷變化的,所以用S(t)、I(t)、R(t)分別表示在t時刻各階段人群所處倉室的數(shù)量并建立隨時間變化的SIR模型方程組:
由圖5可知,在加入潛伏者倉室后,新冠肺炎的潛伏者數(shù)量會在爆發(fā)后大約40天達到頂峰,之后逐漸消失,而感病者在潛伏者爆發(fā)后也達到最高值。SEIR模型考慮到了病毒傳染過程中存在的潛伏狀態(tài),同時也考慮到了潛伏者和感病者對易感者的傳染,模型中新冠肺炎的實際傳染性因為兩個倉室都具有傳染性變強了,所以相應(yīng)的潛伏者和感病者增加,完全康復(fù)時間變長。
上述SEIR模型考慮到了易感者接觸感病者感染后變成潛伏者的過程,較完整的表現(xiàn)了一般傳染病從侵入到潛伏再到發(fā)病最終康復(fù)的過程,但是我國新冠肺炎從發(fā)現(xiàn)到控制最后治愈,都離不開政府的干預(yù)和社會大眾的理解支持,所以提出了改進的SEIR模型。
該模型增加了一個新的倉室(隔離倉室),同時考慮了感病者因病死亡的問題,改進的SEIR模型中,感病者被發(fā)現(xiàn)后就被隔離了,由于我國隔離措施做的好,有理由認為潛伏者一有發(fā)病癥狀就被隔離了,所以感病者倉室的人群就相當于是隔離者倉室,因此該傳染病傳播過程中易感者只被潛伏者感染,同時感病者自愈或者治愈系數(shù)代表的是感病者未隔離或已隔離痊愈的概率,另外死亡的患者也不再具備傳染能力。結(jié)合SEIR模型,對每一個倉室的人群隨時間變化建立平衡方程式,得到如下改進的SEIR模型方程組:
相關(guān)參數(shù)利用1stOpt擬合得到,利用python中matplotlib庫得出模型預(yù)測的疫情圖如圖6所示。
圖5、圖6,分別對應(yīng)的是SEIR模型和改進的SEIR模型,在具有隔離倉室后,疫情爆發(fā)的時間延后了,爆發(fā)的規(guī)模和疫情高峰期也相應(yīng)延后了,該傳染病的潛伏者、易感者都顯著減少,在只考慮隔離因素下,疫情的控制都取得了積極的作用,如果考慮政府實施的其他政策,如增加疫苗研發(fā)、媒體對新冠肺炎的宣傳、提高傳染病的治愈率等,就不難解釋我國肺炎疫情從爆發(fā)到控制的短時高效。
4 結(jié)論
對SIR、SEIR及改進的SEIR模型進行比較,發(fā)現(xiàn)改進的SEIR模型考慮到了實際中傳染病的傳播,客觀的表現(xiàn)了隔離對疫情傳播的積極影響。中國能在極短的時間內(nèi)控制疫情,保護人民生命財產(chǎn)安全,政府的干預(yù)調(diào)控起到了巨大的影響,當今新冠肺炎在世界肆虐,其他國家應(yīng)該學(xué)習我國對疫情的方針政策,盡快平息疫情,減少疫情帶來的各種損失。
文中利用已有數(shù)據(jù)和軟件,不能很好的表示疫情實際發(fā)生的時間段和各個人群所處疫情階段的數(shù)量,主要原因有,(1)由于2月13日新冠肺炎確診標準的改變,在擬合數(shù)據(jù)求取參數(shù)時將當日的病例數(shù)據(jù)去除了;(2)武漢交通管制時,雖然有潛伏者和感病者離開,但是絕大部分潛伏者和感病者還在武漢,而在數(shù)據(jù)預(yù)測時,用的是總的人口,沒有考慮人口流出流入的變化,所以造成較大出入;(3)2月12日起,在政府的號召下全國醫(yī)療衛(wèi)生及其他相關(guān)部門奔赴武漢支援,后期的隔離措施力度及治愈率應(yīng)該對比前期更高,而在文中進行數(shù)據(jù)擬合時,沒有將其納入,所以擬合出的參數(shù)可信度不高,也對模型預(yù)測此次疫情趨勢產(chǎn)生了不利影響。如果要精確預(yù)測全國疫情發(fā)展,對武漢封城前后的數(shù)據(jù)應(yīng)該進行區(qū)分,對全國支援武漢前后也要進行區(qū)分,所以疫情的預(yù)測應(yīng)該分成三個階段,另外,此次新冠肺炎起自武漢,湖北其他地區(qū)及其他各省份的預(yù)測應(yīng)該基于轄區(qū)的實時數(shù)據(jù),這些都是今后需要進一步研究的內(nèi)容。
參考文獻:
[1]Kermack?W O,Mckendrick?A G.Contributions to the Mathematical Theory of Epidemics[J].Proceedings of the Royal Society,1927,115 (05):700-721.
[2]Ma Z , Jin Z . The stability of an SIR epidemic model with time delays[J]. Mathematical Biosciences and Engineering (Online), 2005, 3(1):101-109.
[3]?Guan W J,Ni Z Y,Hu Y,et al.Clinical characteristics of 2019 novel coronavirus infection in China[J].New England Journal of Medicine,2020.
[4]邱明悅,胡濤,崔恒建.雙區(qū)間刪失下新冠病毒肺炎潛伏期分布的參數(shù)估計[J].應(yīng)用數(shù)學(xué)學(xué)報,2020,43(02):200-210.
[5]余錦芬,宋玉凱,費菲,等.基于機器學(xué)習和動力學(xué)模型的湖北省新型冠狀病毒肺炎疫情分析[J/OL].生物醫(yī)學(xué)工程研究:1-15[2020-06-04].http://kns.cnki.net/kcms/detail/37.1413.R.20200422.1303.002.html.
[6]朱連華,譚巖,肖惠文,等.基于階段式傳播模型COVID-19防控措施的量化評估分析[J/OL].南京信息工程大學(xué)學(xué)報(自然科學(xué)版):1-13[2020-06-04].http://kns.cnki.net/kcms/detail/32.1801.N.20200521.1428.002.html.
Abstract:?This paper using python crawler technology, access to National Health and Family Planning Commission COVID released daily - 19 related cases (diagnosis, suspected, cured, death) data, research data, builds the epidemic trends, using the SEIR model and improved SEIR model to forecast the outbreak, and combined with the government to formulate a series of interventions, to evaluate epidemic stages of development and trends, and affirmed the necessity of government intervention, as countries around the world to establish effective disease prevention and control to provide the reference.
Key words:?Python crawler technology;SEIR model;New coronary pneumonia epidemic