趙露露,李 星,金新政
(華中科技大學(xué)同濟(jì)醫(yī)學(xué)院醫(yī)藥衛(wèi)生管理學(xué)院,湖北 武漢 430030)
冠狀病毒是一個大型病毒家族,已知可引起感冒、中東呼吸綜合征(MERS)和嚴(yán)重急性呼吸綜合征(SARS)等較嚴(yán)重疾病[1]。新型冠狀病毒是以前從未在人體中發(fā)現(xiàn)的冠狀病毒新毒株,可以在人與人之間傳染,主要的傳播途徑是呼吸道飛沫傳播和接觸傳播,各個年齡段的人均易感。
2019年12月,湖北省武漢市發(fā)現(xiàn)多起新冠肺炎感染者,隨后新冠肺炎開始在武漢市內(nèi)大范圍的傳播、爆發(fā)。隨之,中國其他地區(qū)也出現(xiàn)感染者。截至2020年6月,國內(nèi)新冠肺炎疫情已經(jīng)得到了很好的控制。但是,此次新冠肺炎疫情對我國人民的生活和經(jīng)濟(jì)發(fā)展造成了嚴(yán)重的影響。此類突發(fā)公共衛(wèi)生事件具有波及方式多元、規(guī)模大、危害性嚴(yán)重等特點(diǎn)[2]。數(shù)學(xué)建模對傳染病傳播過程的描述、分析、預(yù)報和控制能起到積極的作用,為降低以后此類突發(fā)公共衛(wèi)生事件對人民生活和社會經(jīng)濟(jì)的影響程度,有必要對新冠肺炎疫情數(shù)據(jù)建模后進(jìn)行回顧性分析。鑒于新冠肺炎是一種新型的傳染病,對它知之甚少,在前期不可能擁有太多的案例的情況下,本研究采用灰色模型的思想來對其數(shù)據(jù)進(jìn)行建模預(yù)測,事實(shí)證明,灰色預(yù)測模型在此類突發(fā)公共衛(wèi)生事件的預(yù)測中具有較高的準(zhǔn)確性,現(xiàn)將具體研究情況報告如下。
從國家衛(wèi)生健康委員會官方網(wǎng)站[3]選取2020年2月6日-4月2日全國(除湖北省外)每日本土新增的新型冠狀病毒感染的肺炎患者數(shù)據(jù),數(shù)據(jù)真實(shí)可靠、可信度高。
本文采用灰色預(yù)測模型中的GM(1,1)模型來預(yù)測傳染病病毒感染的患者人數(shù)的變化[4],主要是預(yù)測該傳染病病毒感染的患者人數(shù)為零的時間點(diǎn),即“勝利日”的具體時間,并與實(shí)際“勝利日”數(shù)據(jù)做對比,以分析GM(1,1)模型在預(yù)測此類突發(fā)公共衛(wèi)生事件受感染患者人數(shù)是否具有科學(xué)性。
GM(1,1)模型中的兩個“1”分別代表的是模型中包含1個變量,且這個變量近似符合1階線性微分方程[5]。建立GM(1,1)模型的具體步驟如下:
首先確定原始的數(shù)據(jù)組,假設(shè)原始數(shù)據(jù)組包括n個數(shù)據(jù),那么數(shù)據(jù)可以表示為:
X(0)={X(0)(1),X(0)(2),X(0)(3)…X(0)(n)}
(1)
然后假設(shè)X(1)為X(0)做1-AGO生成得到的數(shù)據(jù)組,則X(1)表示為:
X(1)={X(1)(1),X(1)(2),X(1)(3)…X(1)(n)}
(2)
接下來用X(0)與X(1)來建立矩陣B和YN矩陣,具體計算方法如下:
(3)
(4)
然后使用最小二乘法,通過B和YN計算出a和b:
(5)
接著將a和b代入時間序列方程之中,這樣就可以得到GM(1,1)模型的方程:
(6)
最后,可以通過下列式子計算出相應(yīng)的模型預(yù)測值:
(7)
為了檢驗(yàn)GM(1,1)模型的精準(zhǔn)性,需要對該模型的精度進(jìn)行測試,主要包括小誤差概率P和后驗(yàn)差比值C,首先計算小誤差概率P。
假設(shè)該模型的殘差為F(K),也就是實(shí)際值與預(yù)測值之差:
(8)
同時,計算出原數(shù)據(jù)組X(0)的方差S0:
(9)
然后根據(jù)殘差的方差S0乘以0.6745確定一個標(biāo)準(zhǔn),小誤差概率P計算的就是殘差與殘差平均值差的絕對值落在這個標(biāo)準(zhǔn)內(nèi)的概率:
(10)
然后計算后驗(yàn)差比值C,根據(jù)數(shù)據(jù)的殘差F(K),計算出殘差的方差S1,再根據(jù)后驗(yàn)差比值等于原數(shù)據(jù)的方差除以殘差的方差,計算出C:
(11)
(12)
計算出來的后驗(yàn)差比值C與小誤差概率P,結(jié)合擬合等級檢驗(yàn)評判表(見表1),可以判斷模型的擬合等級,以此為依據(jù)來檢驗(yàn)該模型是否具有科學(xué)性,以及是否可以外推用于預(yù)測。
表1 GM(1,1)模型擬合程度等級檢驗(yàn)評判表
全國(除湖北省外)2月6-10日新型冠狀病毒感染的肺炎每日新增確診病例數(shù)(見表2)為原始數(shù)據(jù)X(0):X(0)={X(0)(1),X(0)(2) ,X(0)(3),X(0)(4)}=(696, 558, 509, 444, 381);對原始數(shù)據(jù)X(0)處理累加得X(1):X(1)={X(1)(1),X(1)(2) ,X(1)(3),X(1)(4)}=(1254, 1763, 2207, 2588);接下來結(jié)合公式(5)及相應(yīng)數(shù)據(jù)計算出參數(shù)a=-0.1248554,b=687.3141;將X(0)(1)、a、b等帶入公式計算,最終得新型冠狀病毒肺炎感染的患者每日新增確診病例數(shù)GM(1,1)灰色預(yù)測模型X(1)(k+1)=5,504.88-480,888e-0.124855k。根據(jù)所得預(yù)測模型測得2月6-18日全國(除湖北省外)新型冠狀病毒感染的肺炎確診病例數(shù),并與2月6-18日全國(除湖北省外)新型冠狀病毒肺炎病例實(shí)際數(shù)值進(jìn)行比較,計算得出殘差和相對誤差,相關(guān)數(shù)據(jù)見表3。
表3 全國(除湖北省外)2020年2月6-18日
為了檢測模型的精度,根據(jù)GM(1,1)模型精度評判標(biāo)準(zhǔn)計算后驗(yàn)差比值C和小誤差概率P來判斷模型的精度等級。根據(jù)以上數(shù)據(jù)的計算以及公式(10)和公式(12),得到上述模型中的C=0.061965026,P=1,參考擬合等級檢驗(yàn)評判表可知C≤0.35,P≥0.95,該模型的精度等級為優(yōu),平均相對誤差經(jīng)計算結(jié)果為1.19%。因此,可以認(rèn)定本文的GM(1,1)模型可以較為精準(zhǔn)地描述該市傳染病感染者每日新增人數(shù)的變化趨勢,也可以用該模型進(jìn)行未來的傳染病感染者每日新增人數(shù)的預(yù)測,見圖1。
通過表3可以發(fā)現(xiàn),全國(除湖北省外)新型冠狀病毒感染肺炎的新增人數(shù)一直呈現(xiàn)遞減的態(tài)勢,且在2月14-18日新增數(shù)持續(xù)小于模型預(yù)測值,并且差值逐漸增大,說明全國(除湖北省外)居家封閉式管理等措施成果顯著,疫情持續(xù)向好發(fā)展。
利用模型對疫情勝利日進(jìn)行預(yù)測,從圖1可以看出,全國(除湖北省外)新型冠狀病毒感染的肺炎每日新增人數(shù)在4月初趨近于零,即模型預(yù)測的疫情“勝利日”為4月初。而實(shí)際情況是,除湖北外的全國疫情在3月底(除去境外輸入病例)接近結(jié)束。
圖1 全國(除湖北省外)新型冠狀病毒感染的肺炎患者每日新增人數(shù)預(yù)測
如圖2所示,全國(除湖北省外)2月6日到4月2日新型冠狀病毒感染的肺炎患者每日新增人數(shù)預(yù)測值與實(shí)際新增人數(shù)對比,模型預(yù)測時間與實(shí)際時間相差不大,說明灰色預(yù)測模型在類似傳染病等公共衛(wèi)生事件中,能進(jìn)行基于歷史數(shù)據(jù)的分析,通過對數(shù)據(jù)的計算分析出公共衛(wèi)生事件的大致結(jié)束時間。
灰色預(yù)測GM(1,1)模型的成功應(yīng)用,解決了生產(chǎn)、生活和科學(xué)技術(shù)等領(lǐng)域的大量實(shí)際問題,應(yīng)用范圍已經(jīng)擴(kuò)展到設(shè)計、能源、軍事、金融、醫(yī)學(xué)、環(huán)境、體育等領(lǐng)域。近年來,大量研究者對GM(1,1)算法的優(yōu)勢與局限性進(jìn)行深入的研究,使其應(yīng)用于諸多領(lǐng)域。馬寧等[6]用灰色模型GM(1,1)預(yù)測全國及遼寧省2015-2018年手足口病發(fā)病趨勢,與實(shí)際情況較為符合,模型預(yù)測精度為優(yōu),能較好的為手足口病防治工作提供參考和科學(xué)依據(jù)。高凡[7]應(yīng)用灰色系統(tǒng)理論研究高速列車ATO(列車自動駕駛)系統(tǒng)速度控制器模型,建立的GM(1,1)模型通過實(shí)際線路驗(yàn)證了速度控制器的仿真結(jié)果,表明該方法具有較高的預(yù)測精度,生成的策略能有效地控制列車。康永等[8]利用灰色系統(tǒng)建立GM(1,1)預(yù)測模型,將預(yù)測結(jié)果與實(shí)際市場銷售量進(jìn)行對比,發(fā)現(xiàn)預(yù)測結(jié)果與實(shí)際市場銷售量相吻合,利用灰色預(yù)測模型預(yù)測銷售量,從而減少了制定生產(chǎn)計劃中的盲目性,有利于企業(yè)的生產(chǎn)調(diào)控。
圖2 全國(除湖北省外)2月6日-4月2日新型冠狀病毒感染的肺炎患者每日新增人數(shù)預(yù)測與實(shí)際新增人數(shù)對比
自從鄧聚龍教授創(chuàng)立灰色系統(tǒng)理論開始,經(jīng)過20多年的發(fā)展,灰色系統(tǒng)理論已成為研究的前沿?zé)狳c(diǎn),它涉及多個研究領(lǐng)域,基于“小樣本”“貧信息”進(jìn)行預(yù)測的灰色預(yù)測方法與其他預(yù)測方法相比具有自己的優(yōu)勢。在事件發(fā)生初期,信息量有限時,不需要大量數(shù)據(jù),只需4、5個統(tǒng)計數(shù)據(jù),灰色預(yù)測模型就可以預(yù)測某特征量隨著時間推移變化的規(guī)律以及將來的發(fā)展趨勢?;疑A(yù)測模型利用單一的變量建立起來的一階線性微分動態(tài)時間序列模型,可以掌握數(shù)據(jù)之間的規(guī)律,對數(shù)據(jù)未來的變化規(guī)律進(jìn)行預(yù)測[9]。在本文的研究中,基于前期少量的數(shù)據(jù)建立GM(1,1)模型后利用模型預(yù)測疫情的勝利日,與實(shí)際日期非常接近,說明灰色預(yù)測模型的精確性較好。未來灰色預(yù)測模型可以用于醫(yī)學(xué)研究領(lǐng)域,進(jìn)行疾病發(fā)病率、死亡率、新增感染人數(shù)等方面的研究分析。