馬 霞,高玉潔,刑青紅,李冬青
(太原工業(yè)學(xué)院 理學(xué)系,山西 太原 030008)
流行性腦脊髓膜炎(簡(jiǎn)稱流腦)是由腦膜炎奈瑟菌引起的呼吸道傳染病.分析流腦流行疫情動(dòng)態(tài)對(duì)預(yù)測(cè)流腦流行有重要意義[1].灰色模型是利用較少的或不確切的表示灰色系統(tǒng)行為特征的原始數(shù)據(jù)序列生成變換后建立起來(lái)的[2].灰色系統(tǒng)理論以“部分信息已知,部分信息未知”的“小樣本”“貧信息”不確定性系統(tǒng)為研究對(duì)象,主要通過(guò)對(duì)“部分”已知信息的生成、開(kāi)發(fā),提取有價(jià)值的信息實(shí)現(xiàn)對(duì)系統(tǒng)運(yùn)行行為、演化規(guī)律的正確描述和有效監(jiān)控[3].灰色模型在預(yù)測(cè)手足口病、肺結(jié)核、梅毒等方面已有較多的應(yīng)用[4-6].
利用灰色系統(tǒng)理論可對(duì)被測(cè)系統(tǒng)的發(fā)展變化進(jìn)行全面的分析觀察和長(zhǎng)期預(yù)測(cè),近幾年來(lái)該理論已廣泛應(yīng)用于生物醫(yī)學(xué)領(lǐng)域,并取得了較好效果[7].本文將利用我國(guó)法定傳染病報(bào)告的2011-2018年流腦年發(fā)病數(shù)據(jù)[8],結(jié)合數(shù)據(jù)預(yù)處理的幾種方法(開(kāi)四次方根,取自然對(duì)數(shù),三點(diǎn)數(shù)據(jù)平滑和二階弱化算子處理),消除數(shù)據(jù)的隨機(jī)波動(dòng),建立GM(1,1)模型進(jìn)行預(yù)測(cè),從中可以看出流腦在我國(guó)未來(lái)幾年的整體流行發(fā)病趨勢(shì),為流腦的防控工作提供一定的依據(jù).
2011-2018年每年流腦的發(fā)病數(shù)數(shù)據(jù)來(lái)源于疾病控制中心網(wǎng)站,見(jiàn)表1.
表1 2011-2018年流腦的發(fā)病數(shù)[8]
將2011-2018各年的發(fā)病人數(shù)設(shè)為原始數(shù)列,即
X(0)=(x(0)(1),x(0)(2),…x(0)(8))=(265,227,227,205,126,117,133,133)
對(duì)X(0)作一次累加,得
X(1)=(x(1)(1),x(1)(2),…,x(1)(8))=(265,492,719,924,1 050,1 167,1 300,1 433)
對(duì)X(1)作緊鄰均值生成,得
于是可得矩陣
及參數(shù)列
YN=(x(0)(2),x(0)(3),…x(0)(8))T=(227,227,205,126,117,133,133)T
利用MATLAB軟件計(jì)算得出:a=0.126 0,b=283.870 4.
可得GM(1,1)模型:
由于a=0.126 0,-a≤0.3,故GM(1,1)模型可用于中長(zhǎng)期預(yù)測(cè);
圖1 模型的預(yù)測(cè)值與法定報(bào)告的流腦發(fā)病數(shù)的對(duì)比
根據(jù)建立的GM(1,1)模型,利用MATLAB求解得模型預(yù)測(cè)值以及模型的精度檢驗(yàn)等級(jí),見(jiàn)表2和3.并將模型的預(yù)測(cè)值與法定報(bào)告的流腦發(fā)病數(shù)呈現(xiàn)在曲線圖1中進(jìn)行比較.由表中數(shù)據(jù)可知,僅有小誤差概率的精度為一級(jí),均方差比的精度為二級(jí),而模型預(yù)測(cè)值的相對(duì)誤差較大,由此可見(jiàn)直接利用原始數(shù)據(jù)建立的灰色模型預(yù)測(cè)精度一般.因此,需要消除數(shù)據(jù)的波動(dòng)變化,減少數(shù)據(jù)的隨機(jī)性以及調(diào)整數(shù)據(jù)的變化態(tài)勢(shì),對(duì)原始數(shù)據(jù)進(jìn)行必要的預(yù)處理,使之建立的灰色GM(1,1)模型預(yù)測(cè)精度較高.
表2 基于2011年~2018年數(shù)據(jù)模型的預(yù)測(cè)值
表3 GM(1,1)模型預(yù)測(cè)我國(guó)流腦每年發(fā)病情況的精度值
下面我們將采用數(shù)據(jù)開(kāi)4次方,數(shù)據(jù)取對(duì)數(shù),數(shù)據(jù)平滑和二階弱化算子4種方法[9]對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,然后在建立相應(yīng)的GM(1,1)模型進(jìn)行預(yù)測(cè)分析.
1)數(shù)據(jù)開(kāi)四次方:即對(duì)我國(guó)流腦發(fā)病人數(shù)原始數(shù)據(jù)列開(kāi)四次方,參照上述建模過(guò)程可得灰色模型為:
2)取自然對(duì)數(shù):對(duì)原始數(shù)據(jù)列取對(duì)數(shù)即對(duì)我國(guó)流腦發(fā)病人數(shù)原始數(shù)據(jù)列取對(duì)數(shù),得GM(1,1)灰色模型為:
3)數(shù)據(jù)平滑法:預(yù)處理的數(shù)據(jù)平滑設(shè)計(jì)為三點(diǎn)平滑,具體按照式下式進(jìn)行:
X(0)(t)=(X(0))(t-1)+2X(0)(t)+X(0)(t+1))/4
序列兩端點(diǎn)分別按照下式處理:
X(0)(1)=(3X(0))(1)+2X(0)(2))/4,X(0)(m)=(X(0)(m-1)+3X(0)(m))/4
參照上述建模過(guò)程可得灰色模型:
4)二階弱化算子處理:序列算子弱化處理方法是將原點(diǎn)數(shù)據(jù)(即最新數(shù)據(jù))不變換,其前面的數(shù)據(jù)則按照下式進(jìn)行變換:
在上式的基礎(chǔ)上,鑒于預(yù)測(cè)精度的影響,文中對(duì)數(shù)據(jù)進(jìn)行了二階弱化算子的預(yù)處理,具體即是在上式所得數(shù)據(jù)的基礎(chǔ)上再按照下式進(jìn)行進(jìn)一步的處理:
參照上述建模過(guò)程可得灰色模型為:
按照上述過(guò)程,利用MATLB軟件分別計(jì)算出用自然對(duì)數(shù)、三點(diǎn)平滑、二階弱化算子處理后的原始序列建立的灰色模型的精度,精度值見(jiàn)表4.基于2011年~2018年的流腦發(fā)病數(shù)據(jù),將2016,2017和2018年的數(shù)據(jù)與四種數(shù)據(jù)預(yù)處理后建立的模型預(yù)測(cè)值進(jìn)行相對(duì)誤差對(duì)比,見(jiàn)表5.在對(duì)原始數(shù)據(jù)進(jìn)行四次方根處理、自然對(duì)數(shù)處理和三次平滑處理所得的灰色模型預(yù)測(cè)值相對(duì)誤差相差不大,精度均為二級(jí),精度一般,預(yù)測(cè)模型的效果并不理想.而二階弱化算子處理所得模型預(yù)測(cè)精度很好,且在近三年來(lái),隨著年份的增加,預(yù)測(cè)精度也相應(yīng)提高.利用MATLAB軟件計(jì)算得出四種方法預(yù)處理后的原始序列建立的模型的預(yù)測(cè)值如表6所示,并將預(yù)測(cè)值與與法定報(bào)告的流腦發(fā)病數(shù)呈現(xiàn)在曲線圖中進(jìn)行比較,如圖2所示.由表6可知,利用二階弱化算子處理原始數(shù)據(jù)得到的預(yù)測(cè)模型預(yù)測(cè)的2019-2023年的流腦發(fā)病數(shù)基本處于穩(wěn)定值,從另一方面說(shuō)明該病在我國(guó)的流行不會(huì)出現(xiàn)大范圍的爆發(fā),但也不會(huì)消失會(huì)一直持續(xù)存在.因此,我們應(yīng)該做好相應(yīng)的預(yù)防控制措施.
表4 我國(guó)流腦2011-2018年發(fā)病情況模型精度值(數(shù)據(jù)預(yù)處理后的GM(1,1)模型)
表5 基于2011年~2018年數(shù)據(jù)的預(yù)測(cè)模型及其相對(duì)誤差比較(誤差%)
表6 數(shù)據(jù)預(yù)處理建立的GM(1,1) 模型預(yù)測(cè)2019-2023年流腦的發(fā)病數(shù)
本文以2011-2018年我國(guó)流行性腦脊髓膜炎每年的發(fā)病數(shù)為例,通過(guò)對(duì)原始數(shù)據(jù)累加以及四種數(shù)據(jù)預(yù)處理的辦法,建立相應(yīng)的灰色模型來(lái)預(yù)測(cè)未來(lái)幾年的流腦發(fā)病數(shù).通過(guò)比較得出采用二階弱化算子的數(shù)據(jù)預(yù)處理方法,所得的灰色模型的預(yù)測(cè)精度較好,且在近三年來(lái),隨著年份的增加,預(yù)測(cè)精度也相應(yīng)提高很多;通過(guò)模型預(yù)測(cè)得出2019-2013年流腦在我國(guó)的發(fā)病數(shù)據(jù)可知,該疾病的發(fā)病狀況基本處于穩(wěn)定狀態(tài),不會(huì)大范圍的爆發(fā).本文不足之處在于沒(méi)有考慮可能會(huì)影響流腦發(fā)病情況的各種因素,如疫苗、溫度,地區(qū),性別、年齡等,只是在數(shù)據(jù)上進(jìn)行處理,這也為未來(lái)我們的工作提供一定的建議.
圖2 我國(guó)流腦年發(fā)病數(shù)與模型預(yù)測(cè)值的擬合曲線圖