段班祥 吳兆鑫 蔡丹敏 許梓炫
摘 要:文章探討新型冠狀病毒國(guó)家管控問(wèn)題。查找新型冠狀病毒實(shí)時(shí)數(shù)據(jù),并提取2019年GDP排行前十的國(guó)家的數(shù)據(jù)。對(duì)世界各主要國(guó)家的數(shù)據(jù)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化后,對(duì)數(shù)據(jù)進(jìn)行了主成分分析,構(gòu)建了主成分的方差貢獻(xiàn)率模型。運(yùn)用趨勢(shì)二次移動(dòng)平均法,構(gòu)建了世界主要國(guó)家的發(fā)展趨勢(shì)預(yù)測(cè)模型,得出了2019年GDP排名全球靠前的國(guó)家在疫情期間的管控能力,分析了各國(guó)政府防控措施手段的有效程度。
關(guān)鍵詞:新型冠狀病毒;趨勢(shì)二次移動(dòng)平均法;主成分分析;疫情預(yù)測(cè)
中圖分類(lèi)號(hào):F224 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-1064(2020)08-0001-04
新型冠狀病毒肺炎是近百年來(lái)人類(lèi)遭遇的影響范圍最廣的全球性大流行病,對(duì)全世界是一次嚴(yán)重危機(jī)和嚴(yán)峻考驗(yàn)。人類(lèi)生命安全和健康面臨重大威脅。由于各個(gè)國(guó)家本身的經(jīng)濟(jì)能力、政治體制、文化差異、各國(guó)人民對(duì)疫情重視程度的差異及各國(guó)醫(yī)療水平等因素,導(dǎo)致每個(gè)國(guó)家抗擊疫情的道路各不相同。為此,搜集各國(guó)疫情數(shù)據(jù),進(jìn)行大數(shù)據(jù)分析,建立數(shù)學(xué)模型,最終得到新冠病毒疫情發(fā)展的基本特點(diǎn)和規(guī)律,是文章研究的主要目的。
1 研究思路和方法
為評(píng)價(jià)各主要國(guó)家管控新冠疫情的效果,筆者選取了疫情發(fā)展最為嚴(yán)重且全球GDP排行靠前的國(guó)家,通過(guò)網(wǎng)站“http://hao.199it.com/ncov.html”爬取世界主要國(guó)家的疫情數(shù)據(jù),然后對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化等預(yù)處理,利用主成分分析構(gòu)建方差貢獻(xiàn)率,求出方差貢獻(xiàn)率[1]累計(jì)占比超過(guò)95%的第一、第二主成分,根據(jù)各指標(biāo)數(shù)據(jù)與主成分相關(guān)性得出國(guó)家的綜合得分,最終獲取各主要國(guó)家的管控效果。
為建立主要國(guó)家疫情發(fā)展趨勢(shì)的模型并進(jìn)行預(yù)測(cè),筆者根據(jù)時(shí)間序列模型的二次移動(dòng)平均法[2],改進(jìn)后采用趨勢(shì)移動(dòng)平均法,得到了各主要國(guó)家疫情發(fā)展的趨勢(shì)預(yù)測(cè)模型[3],最后在相關(guān)軟件推演中得到推導(dǎo)和實(shí)證。
2 世界主要國(guó)家疫情發(fā)展特點(diǎn)
筆者在matlab中對(duì)世界GDP靠前的十個(gè)國(guó)家的數(shù)據(jù)進(jìn)行處理并繪制成趨勢(shì)圖,新增確診、新增治愈、新增死亡的趨勢(shì)變化如圖1所示。
其中,紅色曲線(xiàn)為新增確診,綠色曲線(xiàn)為新增治愈,黑色曲線(xiàn)為新增死亡。其中,部分出現(xiàn)負(fù)值的原因?yàn)槿藶楦慕y(tǒng)計(jì)方式導(dǎo)致的,因此將出現(xiàn)負(fù)值的數(shù)據(jù)一并處理為0,這對(duì)結(jié)果并不會(huì)有很大的影響。根據(jù)圖1,可將十個(gè)國(guó)家各自的疫情程度進(jìn)行分類(lèi)。其中,USA(美國(guó))、India(印度)、Brazil(巴西)這三個(gè)國(guó)家新增確診人數(shù)都大致呈現(xiàn)線(xiàn)性上升的趨勢(shì),說(shuō)明疫情程度在一直惡化;而其他國(guó)家都大致呈先上升后下降再趨向于平穩(wěn)的趨勢(shì),說(shuō)明疫情程度得到有效地控制。根據(jù)圖表分析,可以粗略地分為兩類(lèi):USA(美國(guó))、India(印度)、Brazil(巴西)這三個(gè)國(guó)家為一類(lèi);其他國(guó)家為一類(lèi)。
將這十個(gè)國(guó)家的新增確診、新增治愈、新增死亡數(shù)據(jù)進(jìn)行匯總后求平均值,且計(jì)算出累計(jì)的確診人數(shù),如圖2所示。并用Q型聚類(lèi)法[4]中的歐氏距離計(jì)算出各個(gè)國(guó)家之間的距離,如圖3所示。
根據(jù)圖3的聚類(lèi)分析圖可得出最終的分類(lèi)結(jié)論:印度、美國(guó)、巴西各為一類(lèi);剩余國(guó)家為一類(lèi)。
3 世界主要國(guó)家疫情綜合評(píng)價(jià)模型
將GDP排名前十的國(guó)家在疫情期間的各數(shù)據(jù)指標(biāo)取平均值,得到如圖4所示的指標(biāo)平均數(shù)據(jù)。
通過(guò)計(jì)算得出了主成分的方差貢獻(xiàn)率,并對(duì)方差貢獻(xiàn)率進(jìn)行可視化,如圖5所示。
通過(guò)計(jì)算得出,前兩個(gè)主成分的方差貢獻(xiàn)率累計(jì)已達(dá)到96.5%。其中,第一主成分的主要方差貢獻(xiàn)率為87.94%,第二主成分的主要方差貢獻(xiàn)率為8.57%。由于前兩個(gè)主成分分析占比超過(guò)95%,則考慮國(guó)家管控效果時(shí),可只考慮前兩個(gè)主成分分析[5]。圖6為第一主成分和第二主成分各自主要方差貢獻(xiàn)率的各個(gè)指數(shù)。
根據(jù)以上數(shù)據(jù),利用主成分綜合評(píng)價(jià)模型求得:
可得出最終的綜合得分計(jì)算公式:
根據(jù)各個(gè)指數(shù)與兩個(gè)主成分分析的相關(guān)性可發(fā)現(xiàn),綜合得分越低,則代表該國(guó)家對(duì)疫情的管控效果越強(qiáng)。世界主要國(guó)家的綜合得分由低到高排序如表1所示。
因此可得出,在世界主要國(guó)家當(dāng)中,日本、加拿大、中國(guó)是疫情期間管控效果最好的;而印度、巴西、美國(guó)是疫情期間管控效果最差的。
4 基于趨勢(shì)二次移動(dòng)平均法的新冠肺炎疫情的數(shù)學(xué)模型
二次移動(dòng)平均法,是對(duì)一次移動(dòng)平均數(shù)再進(jìn)行第二次移動(dòng)平均,再以一次移動(dòng)平均值和二次移動(dòng)平均值為基礎(chǔ)建立預(yù)測(cè)模型[2],計(jì)算預(yù)測(cè)值的方法。使用一次移動(dòng)平均法的平均數(shù)計(jì)算公式為:
然后再對(duì)一次移動(dòng)平均的數(shù)據(jù)進(jìn)行第二次移動(dòng)平均,即二次移動(dòng)平均的計(jì)算公式為:
其次利用移動(dòng)平均的滯后偏差來(lái)建立趨勢(shì)預(yù)測(cè)模型,因此設(shè)趨勢(shì)模型為:
其中,t為當(dāng)前時(shí)間數(shù);T為由t至預(yù)測(cè)期的時(shí)間數(shù);at為截距;bt為斜率。兩者又稱(chēng)為平滑系數(shù)。
然后根據(jù)移動(dòng)平均值來(lái)確定平滑系數(shù):
所以:
因此:
根據(jù)以上公式推導(dǎo)可得出:
綜上可得,平滑系數(shù)的計(jì)算公式為:
根據(jù)以上二次移動(dòng)平均法對(duì)新冠疫情進(jìn)行了預(yù)測(cè),得出世界各主要國(guó)家新冠疫情的發(fā)展趨勢(shì)預(yù)測(cè)模型,如圖7至圖16所示。
通過(guò)計(jì)算與模型觀(guān)察可以得出各國(guó)的相對(duì)平均誤差,如表2所示。設(shè)相對(duì)平均誤差為f,預(yù)測(cè)值為yhat,根據(jù)相對(duì)平均誤差,對(duì)預(yù)測(cè)值進(jìn)行以下處理,使預(yù)測(cè)值更加接近實(shí)際值。
5 結(jié)語(yǔ)
文章運(yùn)用了趨勢(shì)二次移動(dòng)平均法,構(gòu)建了世界主要國(guó)家的發(fā)展趨勢(shì)預(yù)測(cè)模型,很好地對(duì)世界各國(guó)的疫情及抗疫成效進(jìn)行了分類(lèi)評(píng)價(jià)及預(yù)測(cè)。在建模的過(guò)程中,堅(jiān)持從數(shù)據(jù)本身出發(fā)尋找合適的模型,從而保證模型與數(shù)據(jù)之間具有較好的擬合效果,為后續(xù)的統(tǒng)計(jì)分析提供了便利,也保證了模型的可靠性。
參考文獻(xiàn)
[1] 卓金武,王鴻鈞.MATLAB數(shù)學(xué)建模方法與實(shí)踐(第3版)[M].北京:北京航空航天大學(xué)出版社,2018.
[2] 白曉東.應(yīng)用時(shí)間序列分析[M].北京:清華大學(xué)出版社,2017.
[3] 范晉蓉,白曉東,郭佩汶,等.廣西壯族自治區(qū)病毒性肝炎發(fā)病數(shù)的建模與預(yù)測(cè)分析[J].檢驗(yàn)檢疫學(xué)刊,2019,29(6):1-5.
[4] 胡雷芳.五種常用系統(tǒng)聚類(lèi)分析方法及其比較[J].浙江統(tǒng)計(jì),2007(4):11-13.
[5] 馬知恩.傳染病動(dòng)力學(xué)的數(shù)學(xué)建模與研究[M].北京:北京科學(xué)出版社,2004.