王梓寬,于海雯
(1. 南昌大學前湖學院,330031,南昌;2. 南昌大學信息工程學院,330031,南昌)
隨著社會與經(jīng)濟的發(fā)展,人們的生活水平和生活方式發(fā)生了深刻變化。人口老齡化及城鎮(zhèn)化的加速等,心血管病危險因素流行趨勢越發(fā)明顯,導致了心血管病的發(fā)病人數(shù)持續(xù)增加,且今后10 a心血管病患病人數(shù)仍將繼續(xù)增長[1]。根據(jù)2019年中國衛(wèi)生健康統(tǒng)計年鑒[2]中的數(shù)據(jù),心血管病(心臟病、腦血管病)死亡占城鄉(xiāng)居民總死亡原因的首位,2018年心血管病農(nóng)村死亡率為322.31/(10萬),其中心臟病死亡率為162.12/(10萬),腦血管病死亡率為160.19/(10萬);城市心血管病死亡率為275.22/(10萬),其中心臟病死亡率為146.34/(10萬),腦血管病死亡率為128.88/(10萬);2018年農(nóng)村、城市心血管病死亡占全部死因的比率分別為46.66%和43.8%。心血管病事件的發(fā)生主要歸因于血壓和總膽固醇水平升高等原因,在1958—1959年、1979—1980年、1991年、2002年進行過4次全國范圍內(nèi)的高血壓抽樣調(diào)查[3],≥15歲人群高血壓的患病粗率分別為5.1%、7.7%、13.6%、17.6%,總體呈上升趨勢。心血管病的疾病負擔日漸加重,已成為重大的公共衛(wèi)生問題[1]。能否較準確地預測心血管病死亡率,有利于指導預防心血管病事件的發(fā)生和公共衛(wèi)生事業(yè)的可持續(xù)發(fā)展。因此研究心血管死亡率的預測方法對引導我國公共衛(wèi)生事業(yè)的健康發(fā)展是非常有意義的。
灰色預測理論的核心和基礎(chǔ)是GM(1,1)模型[4-6],它適用于時間短、數(shù)據(jù)少、波動小、具有長期趨勢的預測對象。對隨機波動較大的對象,其預測值就會出現(xiàn)偏高或者偏低,擬合程度較差。馬爾柯夫預測模型則適合于一個隨機變化的動態(tài)系統(tǒng),根據(jù)狀態(tài)間的轉(zhuǎn)移概率來預測系統(tǒng)未來發(fā)展趨勢。目前不少研究者把灰色GM(1,1)模型與馬爾柯夫預測模型相結(jié)合[7-10],即灰色-馬爾柯夫預測模型。本文主要研究灰色-馬爾柯夫的心血管病死亡率預測模型,提出了一種改進的灰色-馬爾柯夫預測模型,并利用1991—2018年統(tǒng)計數(shù)據(jù)[2,11]進行數(shù)值模擬。數(shù)值模擬結(jié)果表明本文提出的改進的灰色-馬爾柯夫預測模型是有效的。
GM(1,1)模型是最簡單的灰色動態(tài)預測模型[4-6],它的建模原理及過程如下所述。
(1)
其中a和u是需由x(1)來確定的參數(shù)。對式(1)中的方程兩邊在[k,k+1]上積分得
(2)
顯然,x(1)(k+1)-x(1)(k)=x(0)(k+1),于是式(2)等價為
(3)
當k取從1到n-1時,則得超定方程組
(4)
(5)
于是,得到GM(1,1)預測模型為
(6)
設{Yn,n=0,1,2,…}是一個離散型隨機變量序列,且Yn所可能取值屬于E,而E是個包含有限個元素的集合,在此即為有限個狀態(tài)的集合。如果Yn+1的條件概率只依賴于Yn的值,即P(Yn+1=in+1|Yn=in,Yn-1=in-1,…,Y0=i0)=P(Yn+1=in+1|Yn=in),則稱該隨機過程是個有限狀態(tài)的馬爾柯夫鏈[7-8]。在描述馬爾柯夫鏈的概率分布時,最重要的是條件概率pij(k)=P(Yk+1=j|Yk=i),它表示在時刻k時Yk取i值的條件下,在下一時刻Yk+1取j值的概率,一般稱pij(k)為k時刻的一步轉(zhuǎn)移概率。若隨機變量從i狀態(tài)轉(zhuǎn)移到j狀態(tài)的條件概率與時刻k無關(guān),即pij(k)=P(Yk+1=j|Yk=i)pij,則稱其為齊次馬爾柯夫鏈。
設P為齊次馬爾柯夫鏈的一步轉(zhuǎn)移概率pij的矩陣,即
(7)
(8)
為進一步提高預測精度,本文提出以下改進的灰色-馬爾柯夫預測模型,即取
(9)
為x(0)(k)的新擬合值和預測值,其中β0,β1,β2,β3,β4,β5為待定參數(shù)。在下面對心血管病死亡率的預測中,利用MATLAB軟件中函數(shù)regress直接計算出β0,β1,β2,β3,β4,β5,使用格式為:
b= regress(y,A,alpha),
其中y為原始數(shù)據(jù)x(0)(k),A為對應于回歸系數(shù)β0,β1,β2,β3,β4,β5的矩陣,alpha為置信水平α(缺省時α=0.05);輸出b是一個六維列向量,它的分量分別是β0,β1,β2,β3,β4,β5的計算值。
為給出灰色-馬爾柯夫預測模型中狀態(tài)劃分,先給出中心趨勢曲線的定義。
成立,則稱F(k)為原始數(shù)據(jù)的中心趨勢曲線。
本文分別選取1991—2018年農(nóng)村與城市心血管死亡率[2,11]作為預測對象,其中1991—2016年的數(shù)據(jù)作為原始數(shù)據(jù)來建立灰色-馬爾柯夫鏈預測模型,2017年、2018年的數(shù)據(jù)作為預測樣本數(shù)據(jù),從而觀察預測效果。
首先,在方程組(4)中代入1991—2016年的數(shù)據(jù),求得方程組(4)的最小二乘解。于是,得到農(nóng)村、城市心血管病死亡率的灰色GM(1,1)預測模型分別為:
改進的灰色-馬爾柯夫模型的預測效果見圖1,其與GM(1,1)模型預測的對比以及精度檢驗見表1。
(a)農(nóng)村心血管病死亡率 (b)城市心血管病死亡率
表1 改進的灰色-馬爾柯夫模型與GM(1,1)模型擬合結(jié)果以及精度檢驗
表1 (續(xù))
根據(jù)表2[5]中的精度檢驗分級標準及表1、表3中的計算結(jié)果,可知本文提出的改進的灰色-馬爾柯夫與模型能很好地對心血管病死亡率進行預測,且對農(nóng)村心血管病死亡率的預測具有更好的結(jié)果,其中原因可能是城市心血管病死亡率在2002年較其他年份非常低而導致模型的精度偏弱。
表2 精度檢驗分級標準
表3 改進的灰色-馬爾柯夫模型與GM(1,1)模型預測結(jié)果
本文針對1991-2018年農(nóng)村與城市心血管病死亡率的統(tǒng)計數(shù)據(jù),選用灰色-馬爾柯夫模型來對其進行預測,提出了一種改進的灰色-馬爾柯夫心血管病死亡率預測模型,數(shù)值模擬結(jié)果表明改進的灰色-馬爾柯夫預測模型是有效的,特別是對當前農(nóng)村心血管病死亡率的預測,這將有利于預防和指導心血管病防治公共衛(wèi)生事業(yè)的發(fā)展。實際上,心血管病與高血壓、血脂異常、空氣污染等許多因素有關(guān),如何建立心血管病事件與重要因素之間因果關(guān)系,從而建立更好的預測模型是需要繼續(xù)深入研究的。