馬 霞,陳 娜,刑青紅,原錦濤
(1.太原工業(yè)學(xué)院 理學(xué)系,山西 太原 030008; 2.周口師范學(xué)院 數(shù)學(xué)學(xué)院,河南 周口 466000)
包蟲病又稱棘球蚴病,主要是由細粒棘球絳蟲和多房棘球絳蟲寄生于人、畜體內(nèi)引起的一種嚴(yán)重危害人民身體健康和經(jīng)濟發(fā)展的人畜共患寄生蟲病. 包蟲病在我國新疆、甘肅、寧夏、內(nèi)蒙古及四川等西部省區(qū)屬于高發(fā)傳染病[1]. 每年都會有大量的人和動物感染包蟲病,嚴(yán)重危害人們的生命安全,給國家和人民造成巨大的經(jīng)濟損失.
灰色模型在包蟲病流行預(yù)測的應(yīng)用方面還很少,結(jié)合我國新疆地區(qū)包蟲病流行發(fā)病的數(shù)據(jù),建立灰色模型,求解分析模型.根據(jù)建立的灰色模型對我國新疆地區(qū)包蟲病發(fā)病情況進行預(yù)測顯得尤為重要. 目前,關(guān)于包蟲病的預(yù)測研究較少, 主要預(yù)測模型為灰色模型、ARMIA模型等. 譚恩麗、王正峰等[2]人以全國2007-2015年包蟲病月報告病例數(shù),采用自回歸移動平均模型進行建模預(yù)測,為包蟲病的防控提供科學(xué)參考. 灰色模型基于數(shù)據(jù)本身, 對樣本容量和概率分布沒有嚴(yán)格的要求,一定程度上有助于減少時間序列的隨機性和提高預(yù)測精度[3-6]. 具有所需樣本量小、計算簡便、預(yù)測效果較好等優(yōu)點[7-8]. 本文根據(jù)新疆地區(qū)2010-2015年包蟲病的發(fā)病數(shù)據(jù)建立GM(1,1) 灰色模型,對新疆地區(qū)2016-2020年包蟲病發(fā)病情況進行預(yù)測,為新疆地區(qū)包蟲病防治工作提供依據(jù).
2005-2015年新疆地區(qū)包蟲病發(fā)病數(shù)來源于疾病預(yù)防控制中心網(wǎng)站的公共衛(wèi)生科學(xué)數(shù)據(jù).
表1 模型精度檢驗等級表
總體呈現(xiàn)出先上升后下降的趨勢,利用表2數(shù)據(jù)[9]對新疆地區(qū)2012-2015年包蟲病發(fā)病情況進行預(yù)測,采用年預(yù)測和季度預(yù)測兩種方法,更加精確的預(yù)測未來新疆地區(qū)包蟲病發(fā)病情況,對新疆地區(qū)包蟲病防治工作提供依據(jù).
表2 2005—2015年新疆地區(qū)包蟲病的發(fā)病數(shù)[9]
總體數(shù)據(jù)的波動性較大,2005-2011年的發(fā)病人數(shù)呈遞增趨勢,2012-2015年的發(fā)病人數(shù)呈遞減趨勢,故利用2012-2015年的發(fā)病人數(shù)進行預(yù)測.首先用2012-2015年的年發(fā)病人數(shù)預(yù)測2016-2020年的年發(fā)病情況,然后利用每一季度的發(fā)病人數(shù)對2016-2020年的每個季度的發(fā)病情況進行預(yù)測. 2012-2015年每年的發(fā)病人數(shù)為原始序列,下面采用四種方法(四次方根、自然對數(shù)、三點平滑、二階弱化算子)[8]處理原始序列建立灰色模型并預(yù)測發(fā)病情況.
(1)四次方根處理:對原始數(shù)據(jù)開4次方根處理.
(2)自然對數(shù)處理:對原始數(shù)據(jù)列取以e為底的自然對數(shù).
(3)三點平滑處理:具體按照式(1)進行:
X(0)(t)=(X(0)(t-1)+2X(0)(t)+X(0)(t+1))/4
(1)
序列兩端點分別按照下式處理:
X(0)(1)=(3X(0)(1)+X(0)(2))/4,X(0)(m)=(X(0)(m-1)+3X(0)(m))/4
(2)
(4)二階弱化算子處理:
一階弱化算子將原始數(shù)據(jù)按照式(3)進行變換:
(3)
在上式的基礎(chǔ)上,鑒于預(yù)測精度的影響,文中對數(shù)據(jù)進行了二階弱化算子的預(yù)處理,二階弱化算子具體即是在式(3)所得數(shù)據(jù)的基礎(chǔ)上再按照式(4)進一步的處理:
(4)
對原始數(shù)據(jù)處理后建立相應(yīng)的GM(1,1)模型,利用MATLB軟件得出預(yù)測值見表3. 然后,按照上述過程分別計算出用自然對數(shù)、三點平滑、二階弱化算子處理后的原始序列建立的灰色模型的精度,精度值見表4. 利用MATLAB軟件由上述四種方法處理后的原始序列建立的模型,計算出的預(yù)測值呈現(xiàn)在曲線圖中進行比較,如圖1所示. 用上述四種方法處理原始序列后,建立的模型中,四次方根處理原始序列后建立的模型的平均相對誤差和均方差比值最小,小誤差概率值最大.由表3可知,四次方根處理第一季度的原始序列后計算出的預(yù)測值和原始值相差最小,故用四次方根處理原始序列后建立的灰色模型精度等級最高,適合中長期預(yù)測.
表3 新疆地區(qū)包蟲病年發(fā)病情況預(yù)測值
表4 新疆地區(qū)包蟲病年發(fā)病情況模型精度值
對2012-2015年第一季度的發(fā)病數(shù)據(jù)用四次方根、自然對數(shù)、三點平滑、二階弱化算子四種方法進行處理,利用MATLB軟件按年預(yù)測計算過程預(yù)測出2016-2020年第一季度新疆地區(qū)包蟲病發(fā)病情況,預(yù)測值見表5. 分別計算出用四種方法處理后的第一季度的發(fā)病情況建立的灰色模型的精度值,見表6. 利用模型計算出的預(yù)測值和原始發(fā)病數(shù)在曲線圖中進行對比,如圖2所示. 對比分析得出自然對數(shù)處理第一季度原始序列后建立的模型的平均相對誤差和均方差比值最小,小誤差概率值最大.由表7可知,自然對數(shù)處理第一季度的原始序列后計算出的預(yù)測值和原始值相差最小.綜上所述,用自然對數(shù)處理原始序列后建立的灰色模型精度等級最高,適合中長期預(yù)測.
表5 第一季度新疆地區(qū)包蟲病發(fā)病情況預(yù)測值比較
圖1 新疆地區(qū)包蟲病年發(fā)病人數(shù)及預(yù)測值曲線圖
表6 新疆地區(qū)包蟲病第一季度發(fā)病情況模型精度值
圖2 第一季度新疆地區(qū)包蟲病發(fā)病情況及預(yù)測值曲線
對2012-2015年第二季度的發(fā)病數(shù)據(jù)采用上述四種方法進行處理,利用MATLB軟件得出預(yù)測值和精度值見表7與8. 利用模型計算出的預(yù)測值和原始發(fā)病數(shù)進行對比,如圖3所示. 對比分析得出四次方根和自然對數(shù)處理第二季度原始序列后建立的模型的平均相對誤差和均方差比值最小,小誤差概率值最大.由表7可知,四次方根處理第二季度的原始序列后計算出的預(yù)測值和原始值相差最小.
表7 新疆地區(qū)包蟲病第二季度發(fā)病情況模型精度值
表8 第二季度新疆地區(qū)包蟲病發(fā)病情況預(yù)測值
圖3 第二季度新疆地區(qū)包蟲病發(fā)病情況及預(yù)測值曲線圖
采取同樣的方法對2012-2015年第三、四季度的發(fā)病數(shù)據(jù)進行處理,利用MATLB軟件得出預(yù)測值和精度值. 利用模型計算出的預(yù)測值和原始發(fā)病數(shù)進行對比,得到采用四種方法進行預(yù)測第三季度和第四季度發(fā)病數(shù)的平均相對誤差、均方差比、小誤差概率的精度為三級或者四級,精度偏低,故該模型不適合包蟲病的第三、四季度的發(fā)病預(yù)測.
本文用GM(1,1) 模型對新疆地區(qū)包蟲病的發(fā)病情況按年份和季度分別進行了預(yù)測,并且進行了殘差檢驗、方差比檢驗和小誤差概率檢驗,并做出了精度等級評判. 根據(jù)這幾種檢驗結(jié)果可以得出,經(jīng)典GM( 1,1) 模型對包蟲病按年份的預(yù)測效果好于按季度的預(yù)測效果.