康育慧,郎麗麗,曹文君
傳染病預(yù)測是傳染病防控過程中的關(guān)鍵環(huán)節(jié),意義在于為傳染病防控部門制定應(yīng)對策略提供科學(xué)依據(jù).灰色預(yù)測和馬爾科夫鏈預(yù)測是兩種應(yīng)用較為廣泛的時間序列預(yù)測模型,并在傳染病預(yù)測[1-3]、市場占有率[4]、商品銷量預(yù)測等領(lǐng)域取得了較好的預(yù)測效果[5-6].本文嘗試將上述兩種預(yù)測模型結(jié)合起來,應(yīng)用灰色馬爾科夫模型對我國法定乙類傳染病細菌性和阿米巴性痢疾發(fā)病率進行擬合和預(yù)測,并與GM(1,1)模型進行比較,探討灰色馬爾科夫預(yù)測模型在細菌性和阿米巴性痢疾發(fā)病率預(yù)測中的應(yīng)用價值并為制定干預(yù)措施提供參考.
2005—2018年我國細菌性和阿米巴性痢疾發(fā)病率資料源于國家衛(wèi)生和計劃生育委員會出版的《2019中國衛(wèi)生健康統(tǒng)計年鑒》[7],2019年數(shù)據(jù)資料來源于國家衛(wèi)生健康委員會網(wǎng)站[8].
灰色馬爾科夫模型分灰色GM(1,1)建模和馬爾科夫修正兩個過程.
(1)GM(1,1)建模.①設(shè)原始非負序列為X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),對序列X(0)作1階累加生成,得序列X(1)=(x(1)(1),x(1)(2),…,x(1)(n)),其 中,k=1,2,…,n.②對序列X(1)作緊鄰均值生成,得序列Z(1)=(z(1)(2),z(1)(3),…,z(1)(n)),其中z(1)(k)=,k=2,3,…,n.③根 據(jù)累加序列建立灰色模型的白化微分方程,其中a,b為參數(shù),且可根據(jù)白化方程由最小二乘法估計:(a,b)T=(BTB)-1BTY,其中,…,x(0)(n))T.④求得白化方程的解為:x?(1)(k+,k=1,2,…,n.⑤對作累減還原得灰色模型的預(yù)測值,k=1,2,…,n.⑥模型檢驗.對建立的灰色預(yù)測模型進行精度和擬合度的檢驗.利用后驗差法,計算后驗差比值C和小誤差概率P.其中,S1、S2分別為數(shù)列x(0)(k)和殘差序列ε(k)的標準差.精度檢驗等級如表1所示.
表1 精度檢驗等級表
(2)馬爾科夫修正[9-11].①狀態(tài)劃分.將GM(1,1)模型的相對誤差值劃分為i個狀態(tài),記為E1,E2,…,Es,列出各年份相對誤差對應(yīng)的狀態(tài),構(gòu)建馬爾科夫鏈.狀態(tài)數(shù)與區(qū)間跨度不但與樣本數(shù)量有關(guān),而且與擬合結(jié)果的誤差范圍有關(guān),一般取3~5個為佳,且保證每個區(qū)間都有數(shù)據(jù)[9].②構(gòu)造狀態(tài)轉(zhuǎn)移概率矩陣,其中表示系統(tǒng)由狀態(tài)Ei經(jīng)過m步轉(zhuǎn)移到狀態(tài)Ej的次數(shù).③確定預(yù)測值并修正.根據(jù)建立的狀態(tài)轉(zhuǎn)移概率矩陣確定系統(tǒng)下一時刻轉(zhuǎn)向狀態(tài)Ei,并取狀態(tài)區(qū)間Ei的中位數(shù)作為系統(tǒng)下一時刻預(yù)測值,則馬爾科夫修正值,其中為t時刻灰色預(yù)測值,Ei-和Ei+分別為狀態(tài)Ei的左右端點.
全文數(shù)據(jù)處理與分析使用MATLAB R2014a軟件.
對2005—2017年全國細菌性和阿米巴性痢疾發(fā)病率數(shù)據(jù)進行擬合,對2018年和2019年的發(fā)病率數(shù)據(jù)進行預(yù)測,并與GM(1,1)模型比較以檢驗灰色馬爾科夫模型的精度.發(fā)病率數(shù)據(jù)如表2所示.
(1)建立GM(1,1)模型.2005—2017年全國細菌性和阿米巴性痢疾發(fā)病率呈逐年降低趨勢,采用MATLAB R2014a軟件編程得到GM(1,1)模型的參數(shù)a,b值,a=0.124 6,b=37.811 4,由 此 得 到 預(yù) 測 模 型 為x?(1)(k+1)=-268.587 4e-0.1246k+303.507 4,k=1,2,…,n.利用該模型得到2005—2017年發(fā)病率擬合值及2018年和2019年發(fā)病率預(yù)測值,并計算各年發(fā)病率的相對誤差.結(jié)果如表2所示.
(2)馬爾科夫修正.將表2中2005—2017年GM(1,1)模型相對誤差值分為四個狀態(tài)E1~E4,狀態(tài)的區(qū)間范圍分別為:(-5,-3],(-3,0],(0,3],(3,6],并得到GM(1,1)模型歷年相對誤差值所處狀態(tài)(表2),由此建立1~4步狀態(tài)轉(zhuǎn)移概率矩陣,m=1,2,…,4.
利用1~4步狀態(tài)轉(zhuǎn)移概率矩陣計算2018年和2019年發(fā)病率相對誤差所處狀態(tài)區(qū)間,2018年發(fā)病率相對誤差狀態(tài)預(yù)測如表3所示.
將表3中2014—2017年各狀態(tài)列轉(zhuǎn)移概率相加,得到2018年發(fā)病率預(yù)測相對誤差轉(zhuǎn)向各狀態(tài)的概率分別為1.417 4、0、2.582 6、0.表明2018年發(fā)病率預(yù)測相對誤差轉(zhuǎn)向狀態(tài)E3的概率最大,即相對誤差位于區(qū)間(0,3]內(nèi),故2018年發(fā)病率預(yù)測值為7.06×≈6.95.同理,以2015—2018年數(shù)據(jù)預(yù)測2019年發(fā)病率相對誤差所處狀態(tài)為E3,故發(fā)病率預(yù)測值為≈6.14.結(jié)合模型中2005—2017年各年份相對誤差狀態(tài)可以得到表2中的灰色馬爾科夫模型擬合值及相對誤差情況.
表2 各年份發(fā)病率數(shù)據(jù)及兩種模型預(yù)測結(jié)果
表3 2018年發(fā)病率相對誤差狀態(tài)預(yù)測
根據(jù)表2數(shù)據(jù)對兩種模型的精度進行比較,結(jié)果如表4所示.
表4 兩種模型精度對比
由表4可以看出,經(jīng)馬爾科夫修正后的灰色馬爾科夫模型各項檢驗指標均優(yōu)于GM(1,1)模型,表明灰色馬爾科夫方法預(yù)測更準確,故采用GM(1,1)-Markov模型預(yù)測未來發(fā)病率.
采用灰色馬爾科夫模型,以2005—2019年細菌性和阿米巴性痢疾發(fā)病率數(shù)據(jù)預(yù)測2020年和2021年發(fā)病率.GM(1,1)預(yù) 測 模型為(k+1)=-266.626 1e-0.1260k+301.546 1,k=1,2,…,n,由此得到2005—2019年發(fā)病率相對誤差并分為四個狀態(tài)區(qū)間(-6,-4],(-4,-1],(-1,2],(2,7].計算1~4步狀態(tài)轉(zhuǎn)移概率矩陣,利用狀態(tài)轉(zhuǎn)移概率矩陣推算2020年發(fā)病率相對誤差所處狀態(tài)為E4,得2020年發(fā)病率預(yù)測值為5.17.同理,推算2021年發(fā)病率相對誤差所處狀態(tài)也為E4,得2021年發(fā)病率預(yù)測值為4.56.
本研究構(gòu)建了以GM(1,1)模型為基礎(chǔ)的灰色馬爾科夫模型,并運用該模型對我國2005—2019年細菌性和阿米巴性痢疾發(fā)病率進行擬合和預(yù)測以考察模型的可行性.首先由GM(1,1)模型得到2005—2019年發(fā)病率的發(fā)展趨勢,進一步計算發(fā)現(xiàn)GM(1,1)模型擬合與預(yù)測的相對誤差都較大,且相對誤差序列隨機波動較大,故對相對誤差序列再采用馬爾科夫方法修正.結(jié)果表明,經(jīng)馬爾科夫修正后的灰色馬爾科夫模型兼顧發(fā)展趨勢和隨機波動兩方面因素,因此其擬合值與預(yù)測值都更接近實際值,修正前后的后驗差比也由0.076 7降為0.026 4,修正后模型精度相比傳統(tǒng)GM(1,1)模型有很大提高.因此,本研究采用灰色馬爾科夫模型對我國細菌性和阿米巴性痢疾發(fā)病率的預(yù)測,結(jié)果更加客觀、合理、準確,可供有關(guān)部門參考.