曹 彥 何東進 洪 偉 紀志榮 朱學(xué)平 游巍斌 連素蘭
(福建農(nóng)林大學(xué)林學(xué)院,福建 福州 350002)
福建省地處亞熱帶,自然條件優(yōu)越,十分適合林木生長,森林覆蓋率為60%左右,是我國主要的林區(qū)之一。但由于氣候變化、人類破壞和人為干擾等因素的影響,福建省森林火災(zāi)發(fā)生次數(shù)頻繁且危害損失嚴重,因此,對其森林火災(zāi)發(fā)生規(guī)律及預(yù)測預(yù)報進行研究有著重要的意義。目前,國內(nèi)外學(xué)者已經(jīng)對森林火災(zāi)開展了大量的研究工作,如張典銓[1]以福建省建陽市森林火災(zāi)資料為例建立了森林火災(zāi)的灰色拓撲預(yù)測模型;傅澤強等[2]對內(nèi)蒙古大興安嶺林區(qū)森林火災(zāi)發(fā)生序列建立了灰色災(zāi)變GM(1,1)預(yù)測模型;姜學(xué)鵬等[3]建立了我國火災(zāi)相對變動模糊馬爾科夫預(yù)測模型;李炳華等[4]提出了基于小樣本數(shù)據(jù)信息擴散的重大火災(zāi)頻度估算方法;朱學(xué)平等[5]運用突變級數(shù)法對福建省森林火災(zāi)損失評價指標體系進行研究;譚三清等[6]基于灰色聯(lián)度方法研究分析了森林火災(zāi)危害程度及其相關(guān)影響因子。我國學(xué)者對火災(zāi)預(yù)測的方法主要集中于定性預(yù)測法、灰色預(yù)測法、人工神經(jīng)網(wǎng)絡(luò)預(yù)測法和回歸預(yù)測法等,在對森林火災(zāi)預(yù)測研究中,運用加權(quán)馬爾科夫鏈方法開展預(yù)測預(yù)報的研究則未見報道。為此,本項研究以前人相關(guān)研究為基礎(chǔ),采用加權(quán)馬爾科夫鏈的方法對福建省森林火災(zāi)發(fā)生次數(shù)進行預(yù)測,以期為森林火災(zāi)預(yù)測方法提供新的思路和理論依據(jù)。
研究數(shù)據(jù)來源于《福建省統(tǒng)計年鑒》[7],相關(guān)數(shù)據(jù)資料見表1。從表1數(shù)據(jù)可以看到,福建省1987—2009年發(fā)生森林火災(zāi)總次數(shù)為 12 007 次,其中1987年、1988年和2004年3年發(fā)生次數(shù)均超過 1 000 次,1988年達到最高為 1 344 次,而1998年火災(zāi)發(fā)生次數(shù)最少,僅有156次。
表1 福建省1987—2009年森林火災(zāi)發(fā)生次數(shù)統(tǒng)計
馬爾科夫鏈是一個時間連續(xù)狀態(tài)離散的馬爾可夫過程,它具有“馬氏性”,其轉(zhuǎn)移概率與初始時刻狀態(tài)無關(guān),則稱該馬爾科夫鏈具有齊次性。傳統(tǒng)的馬爾科夫鏈預(yù)測法[8-9],一般默認所研究的馬爾科夫鏈滿足“齊次性”,但實際研究中所論及的隨機變量序列雖然滿足“馬氏性”,但一般都不滿足“齊次性”。另外該方法沒有充分利用已知歷史數(shù)據(jù)的信息,忽略了各階馬爾科夫鏈的絕對分布在預(yù)測中所起的作用。而加權(quán)馬爾科夫鏈[10-11]方法彌補了傳統(tǒng)馬爾科夫鏈方法的不足,根據(jù)各階自相關(guān)系數(shù)能夠刻畫各種滯時狀態(tài)間相關(guān)關(guān)系強弱的原理,先分別依據(jù)前面若干時段的指標值狀態(tài)對該時段指標值的狀態(tài)進行預(yù)測,然后按照各階自相關(guān)系數(shù)進行加權(quán)求和,最后按照“概率最大”原則判斷該時段所屬狀態(tài)。
確定系統(tǒng)狀態(tài)即對指標值進行分級,目前運用最廣泛的是均值-標準差法[12]。
根據(jù)分級標準確定各時段指標值所對應(yīng)的狀態(tài),建立轉(zhuǎn)移概率矩陣。設(shè)所研究的馬爾科夫鏈的一個指標值序列包含了m個狀態(tài),即狀態(tài)空間E={1,2,…,m};用fij表示指標值序列中從狀態(tài)i經(jīng)過一步轉(zhuǎn)移到狀態(tài)j的頻數(shù),i,j∈E,轉(zhuǎn)移的步長為m(m=1,2,…)個時間單位。由fij(i,j∈E)組成的矩陣(fij)i,j∈E稱為轉(zhuǎn)移頻數(shù)矩陣。將轉(zhuǎn)移頻數(shù)矩陣的第i行第j列元素除以各行的總和所得的值稱為轉(zhuǎn)移概率,記為pij(i,j∈E),即
(1)
則轉(zhuǎn)移概率矩陣可以表示為:
檢驗隨機變量序列是否具有馬氏性是應(yīng)用馬爾科夫鏈模型進行預(yù)測的重要前提,通常用χ2統(tǒng)計量進行檢驗。將轉(zhuǎn)移頻數(shù)矩陣的第j列之和除以各行各列的總和所得的值稱為邊際概率,記為p·j,即:
(2)
對各階自相關(guān)系數(shù)進行歸一化,即:
(3)
將Wk作為各種步長的馬爾科夫鏈的權(quán)重(m為按時間需要計算到的最大階數(shù))。
(4)
max(pi,i∈E)所對應(yīng)的i即為該時段指標值的預(yù)測狀態(tài),將預(yù)測結(jié)果加入初始狀態(tài)向量序列得到新的序列,可重復(fù)以上過程預(yù)測較長時間間隔的狀態(tài)。
以福建省1987—2008年森林火災(zāi)數(shù)據(jù)為基礎(chǔ),其變化趨勢見圖1。
從圖1中可以看出,福建省森林火災(zāi)發(fā)生次數(shù)變化很不穩(wěn)定,出現(xiàn)了3個峰值,1988—1999年間林火次數(shù)呈明顯下降趨勢。利用加權(quán)馬爾科夫鏈預(yù)測模型對2009年森林火災(zāi)發(fā)生次數(shù)進行預(yù)測,步驟如下。
1) 根據(jù)均值標準差法將森林火災(zāi)次數(shù)劃分為5個狀態(tài),即確定馬爾科夫鏈的狀態(tài)空間E={1,2,3,4,5}。分級情況見表2,各年所屬狀態(tài)見表3。
2) 根據(jù)(1)式計算得到步長從1到5的一步轉(zhuǎn)移概率矩陣如下:
表2 福建省森林火災(zāi)數(shù)據(jù)分級
表3 福建省1987—2008年森林火災(zāi)發(fā)生次數(shù)序列及其狀態(tài)
3) 利用(3)式和(4)式計算各階自相關(guān)系數(shù)得:
r=(0.320 0,-0.107 1,-0.191 5,0.226 5,-0.045 3)
標準化后可得各步長馬爾科夫鏈的權(quán)重向量為:
W=(0.359 6,0.120 3,0.215 1,0.254 2,0.050 8)
4) 依據(jù)2004、2005、2006、2007、2008年的指標值所屬狀態(tài)及其相對應(yīng)的狀態(tài)轉(zhuǎn)移概率矩陣,對福建省2009年森林火災(zāi)發(fā)生次數(shù)狀態(tài)進行預(yù)測,結(jié)果見表4。
表4 2009年森林火災(zāi)發(fā)生次數(shù)狀態(tài)預(yù)測
由表4可以看出,將同一狀態(tài)各預(yù)測概率加權(quán)求和后max{Pi,i∈E}=0.412 5,即2009年福建省森林火災(zāi)發(fā)生次數(shù)預(yù)測狀態(tài)是3,說明2009年屬于福建省發(fā)生森林火災(zāi)一般災(zāi)年,發(fā)生次數(shù)應(yīng)該落在351.04≤x<687.87范圍內(nèi),取351.04和687.87的平均值得到519.45,即預(yù)計2009年福建省發(fā)生森林火災(zāi)次數(shù)為519.45次。而2009年的實際火災(zāi)發(fā)生次數(shù)為579次,預(yù)測值與真實值的相對誤差為(579-519.45)/579=0.102 8,模型的預(yù)測精度達到90%。
利用該方法對福建省2007和2008年森林火災(zāi)發(fā)生次數(shù)狀態(tài)進行回驗,所得結(jié)果見表5。
表5 2007—2009年福建省森林火災(zāi)發(fā)生次數(shù)狀態(tài)預(yù)測結(jié)果
從表5可以看出,2007—2009年的預(yù)測結(jié)果與真實結(jié)果完全吻合。且經(jīng)計算得到2007、2008年預(yù)測值與真實值的相對誤差分別為|237-272.68|/237=0.150 5 和|520-519.43|/520=0.001 1,預(yù)測精度都大于85%。這不僅說明加權(quán)馬爾科夫鏈模型可以用于對森林火災(zāi)發(fā)生次數(shù)的預(yù)測,而且模型預(yù)測的準確度和精度都較高,預(yù)測效果較好。
根據(jù)森林火災(zāi)發(fā)生次數(shù)序列突變性強、無后效性的特點,對其進行馬爾科夫鏈預(yù)測是一個大膽的嘗試。研究結(jié)果表明,加權(quán)馬爾科夫鏈方法在森林火災(zāi)預(yù)測領(lǐng)域是可行的,且預(yù)測效果較為理想。其中,應(yīng)用均值-標準差法對原序列指標狀態(tài)進行劃分,充分利用了森林火災(zāi)次數(shù)序列的數(shù)據(jù)結(jié)構(gòu),能夠有效刻畫序列的內(nèi)在分布規(guī)律,并且客觀反映每年森林火災(zāi)的嚴重程度,使得劃分的狀態(tài)級別較為科學(xué)合理。預(yù)測結(jié)果從森林火災(zāi)發(fā)生次數(shù)的一個狀態(tài)區(qū)間通過區(qū)間端點的均值轉(zhuǎn)化為一個具體數(shù)值,在保證可靠性程度的情況下使模型的預(yù)測精度得到了提高。
加權(quán)馬爾科夫鏈以各種步長的自相關(guān)系數(shù)為權(quán)重,使相關(guān)分析和馬爾科夫鏈有機的結(jié)合起來進行預(yù)測,與普通馬爾科夫鏈預(yù)測相比更充分合理地利用了相關(guān)信息,所以預(yù)測效果更好。該模型比較適用于短期預(yù)測,且歷史資料數(shù)據(jù)越多,預(yù)測精度越高。若用于長期預(yù)測,則可將預(yù)測年的預(yù)測狀態(tài)和預(yù)測值計入原數(shù)據(jù)序列重新構(gòu)置馬爾科夫轉(zhuǎn)移概率矩陣進行逐年預(yù)測。
鑒于森林火災(zāi)發(fā)生次數(shù)受多方面因素影響,如天氣、氣候等自然因素,以及當?shù)氐牧只鸸芾硭胶驼匾暢潭鹊热藶橐蛩?,因此林火發(fā)生次數(shù)序列波動性較大且極不穩(wěn)定,偶爾會出現(xiàn)極端值或者異常值。而馬爾科夫鏈預(yù)測僅僅是根據(jù)歷史火災(zāi)發(fā)生次數(shù)進行建模,沒有將其他影響因素進行綜合考慮,所以對于一些異常年份火災(zāi)的預(yù)測可能會出現(xiàn)偏差。這也是該方法所存在的局限性,在今后的研究中將繼續(xù)對此方法進行探討與改進。
[1] 張典銓.灰色拓撲預(yù)測方法在森林火災(zāi)預(yù)測中的應(yīng)用[J].福建林學(xué)院學(xué)報,2005,25(1):1-4.
[2] 傅澤強,孫啟宏,蔡運龍,等.基于灰色系統(tǒng)理論的森林火災(zāi)預(yù)測模型研究[J].林業(yè)科學(xué),2002,38(5):95-100.
[3] 姜學(xué)鵬,徐志勝,冷彬.火災(zāi)預(yù)測的模糊馬爾柯夫模型[J].災(zāi)害學(xué),2006,21(3):27-32.
[4] 李炳華,朱霽平,小出治.一種基于小樣本數(shù)據(jù)信息擴散的重大火災(zāi)頻度估算方法[J].火災(zāi)科學(xué),2010,19(2):82-88.
[5] 朱學(xué)平,何東進,丁福利,等.基于突變級數(shù)法的福建省森林火災(zāi)評價分析[J].福建林學(xué)院學(xué)報,2011,31(4):295-299.
[6] 譚三清,張貴,劉大鵬.基于灰色聯(lián)度分析的森林火災(zāi)危害程度及相關(guān)因子研究[J].中南林業(yè)科技大學(xué)學(xué)報,2010,41(7):10-14,51.
[7] 福建省統(tǒng)計局.福建省統(tǒng)計年鑒(2009)[M].北京:中國統(tǒng)計出版社,2009:67-98.
[8] Sen Z. Critical drought analysis by second-order Markov chain[J]. Journal of Hydrology(Amsterdam), 1990, 120(1): 183-202.
[9] Peng Z, Bao C, Zhao Y, et al. Weighted Markov chains for forecasting and analysis in incidence of infectious diseases in Jiangsu Province, China[J]. Journal of Biomedical Research, 2010, 24(3): 207-214.
[10] 錢會,李培月,王濤.基于滑動平均-加權(quán)馬爾科夫鏈的寧夏石嘴山市年降雨量預(yù)測[J].華北水利水電學(xué)院學(xué)報,2010,31(1):6-9.
[11] 仲遠見,李靖,王龍.改進馬爾科夫鏈降雨量預(yù)測模型的應(yīng)用[J].濟南大學(xué)學(xué)報:自然科學(xué)版,2009,23(4):402-405.
[12] 金峻炎,陳進.加權(quán)馬氏鏈在房地產(chǎn)投資回收期預(yù)測中的應(yīng)用[J].湖南科技大學(xué)學(xué)報:自然科學(xué)版,2010,25(2):63-66.
[13] 羅積玉,邢瑛.經(jīng)濟統(tǒng)計分析方法及預(yù)測[M].北京:清華大學(xué)出版社,1987:347-348.