霍鳳嵐,張 茜,阿茹娜,劉曉梅,包曙明,吳云飛,包世超,李樹(shù)森
(1.通遼市防汛抗旱物資供應(yīng)管理站,內(nèi)蒙古 通遼 028000; 2.吉林大學(xué) 環(huán)境與資源學(xué)院,長(zhǎng)春 130021; 3.內(nèi)蒙古電力科學(xué)研究院,呼和浩特 010020; 4.通遼市水利工程建設(shè)質(zhì)量與安全監(jiān)督站,內(nèi)蒙古 通遼 028000; 5.通遼市水利規(guī)劃設(shè)計(jì)研究院,內(nèi)蒙古 通遼 028000)
?
基于隱馬爾可夫模型的安徽省降水特征研究
霍鳳嵐1,張 茜2,阿茹娜3,劉曉梅4,包曙明5,吳云飛5,包世超5,李樹(shù)森5
(1.通遼市防汛抗旱物資供應(yīng)管理站,內(nèi)蒙古 通遼 028000; 2.吉林大學(xué) 環(huán)境與資源學(xué)院,長(zhǎng)春 130021; 3.內(nèi)蒙古電力科學(xué)研究院,呼和浩特 010020; 4.通遼市水利工程建設(shè)質(zhì)量與安全監(jiān)督站,內(nèi)蒙古 通遼 028000; 5.通遼市水利規(guī)劃設(shè)計(jì)研究院,內(nèi)蒙古 通遼 028000)
通過(guò)隱馬爾可夫模型(Hidden Markov Model,HMM)對(duì)安徽省降水規(guī)律及特征進(jìn)行分析模擬,以驗(yàn)證其在區(qū)域性降水方面的適用性。采用包含4個(gè)隱式狀態(tài)的HMM對(duì)省內(nèi)6個(gè)主要城市的多年日降水?dāng)?shù)據(jù)序列進(jìn)行擬合。用貝葉斯信息準(zhǔn)則(Bayesian Information Criterions,BIC)確定模型中隱式狀態(tài)數(shù)量,用Baum-Welch算法訓(xùn)練得到最優(yōu)模型參數(shù),用Viterbi算法確定模型中最優(yōu)狀態(tài)序列。采用上述方法模擬安徽省6個(gè)城市在1960—2009年夏季共50個(gè)時(shí)段的降水情況。前40 a用于模型分析訓(xùn)練,后10 a用于模型驗(yàn)證及評(píng)價(jià),結(jié)果表明HMM能更好地模擬降水特征,具有較高的實(shí)用性。
隱馬爾可夫模型;隱式狀態(tài);降水特征;貝葉斯信息準(zhǔn)則;Baum-Welch算法;Viterbi算法
降水隨機(jī)模型具有很多重要的應(yīng)用,如指導(dǎo)干旱及洪澇災(zāi)害預(yù)防、預(yù)警異常天氣、分析徑流量及規(guī)劃農(nóng)業(yè)用水等。長(zhǎng)期日降水序列是降水隨機(jī)模型的重要組成部分,有助于更好地理解和管理水資源、環(huán)境及生態(tài)系統(tǒng)。由于降水產(chǎn)生機(jī)制具有很多不同形式(如地理位置、大氣環(huán)流等)并且表現(xiàn)出不同特征,因此單一降水隨機(jī)模型難以較好地表現(xiàn)多狀態(tài)條件下的降水序列。隱馬爾可夫模型假設(shè)存在隱含狀態(tài),這些狀態(tài)決定降水產(chǎn)生機(jī)制,控制著降水預(yù)測(cè)中的相關(guān)參數(shù)。
本文基于隱馬爾可夫模型(HMM)在大氣模式、地理位置、人類活動(dòng)等影響因素下模擬未來(lái)降水。HMM最初是在20世紀(jì)60年代由Leonard 等人提出,其最初的應(yīng)用之一是20世紀(jì)70年代中期的語(yǔ)音識(shí)別。在1980年代后半期,HMM開(kāi)始應(yīng)用到生物序列的分析中。
HMM被諸多學(xué)者廣泛應(yīng)用于降水模擬領(lǐng)域。Hughes和Guttorp[1]構(gòu)建了一個(gè)非齊次隱馬爾可夫模型,將多站點(diǎn)降水發(fā)生情況與較大區(qū)域的大氣循環(huán)模式相聯(lián)系,盡管大氣循環(huán)等影響因素在不同時(shí)間段存在變化,模型生成的降水序列與降水序列多年觀察值還是擬合較好;Thyer和Kuczera[2]用基于單站點(diǎn)降水?dāng)?shù)據(jù)的HMM模擬了長(zhǎng)期水文-氣象時(shí)間序列并重新生成較可靠的天氣干濕周期; Thyer等[3]指出了HMM模擬長(zhǎng)時(shí)間降水序列能產(chǎn)生較準(zhǔn)確的作為水文時(shí)間序列重要特征的天氣干、濕周期;Hajo和Axel提出時(shí)間序列的循環(huán)變動(dòng)現(xiàn)象,并在此基礎(chǔ)上構(gòu)建了改進(jìn)的HMM[4];Constantin和Heike等人在統(tǒng)計(jì)降尺度方法的基礎(chǔ)上,將歐洲及大西洋大氣循環(huán)過(guò)程加以分析處理,構(gòu)建了基于19個(gè)站點(diǎn)7個(gè)隱式狀態(tài)的HMM來(lái)預(yù)測(cè)多瑙河盆地春季降水[5]。
隱馬爾可夫模型具有產(chǎn)生長(zhǎng)期天氣干濕狀態(tài)周期的明確機(jī)制,這是許多長(zhǎng)期水文時(shí)間序列的一個(gè)特性。應(yīng)用HMM模擬預(yù)測(cè)日降水的關(guān)鍵在于隱式狀態(tài)與可觀察序列的良好合理對(duì)應(yīng)。充分評(píng)估基于多雨量站點(diǎn)的HMM中參數(shù)的不確定性,這是長(zhǎng)期水文時(shí)間序列隨機(jī)模型的一個(gè)進(jìn)步。本文用貝葉斯方法充分量化HMM中參數(shù)的不確定性,然后基于多站點(diǎn)降水?dāng)?shù)據(jù)模擬長(zhǎng)期降水時(shí)間序列。多站點(diǎn)相對(duì)于單一站點(diǎn)模擬具有諸多優(yōu)勢(shì),比如單一站點(diǎn)模型不足以支持大型水資源管理系統(tǒng),而多站點(diǎn)模型對(duì)大區(qū)域的干旱洪澇風(fēng)險(xiǎn)模擬程度更高。同時(shí)與以前研究中通過(guò)無(wú)偏灰色馬爾可夫模型計(jì)算的結(jié)果進(jìn)行對(duì)比,結(jié)果表明HMM模擬的相對(duì)誤差更小,能更好地模擬降水特征,具有較高的實(shí)用性。
表1 1960—1994年(6—10月份)各站及安徽省主要降水特征
安徽省是位于中國(guó)東部?jī)?nèi)陸的一個(gè)省份,介于東經(jīng)114°54′~119°37′,北緯29°41′~34°38′,地貌以平原、丘陵和低山為主。長(zhǎng)江淮河流經(jīng)省內(nèi),將全省區(qū)域劃分為淮北、江淮之間和江南3個(gè)區(qū)域。安徽省在氣候上屬暖溫帶與亞熱帶的過(guò)渡地區(qū),在淮河以北屬暖溫帶半濕潤(rùn)季風(fēng)氣候,淮河以南屬亞熱帶濕潤(rùn)季風(fēng)氣候。省內(nèi)降水量受地形及氣候的影響,時(shí)空分布不均,豐枯變化懸殊,夏季降雨集中,冬季雨水較少??偟内厔?shì)是由南向北遞減, 西部多于東部, 山區(qū)多于平原, 山地迎風(fēng)坡多于背風(fēng)坡。全年平均降水量為773~1 670 mm,夏季降水豐沛,占年降水量的40%~60%。
本文數(shù)據(jù)選取自安徽省6個(gè)雨量站點(diǎn),分別位于合肥市、淮北市、黃山市、毫州市、滁州市和安慶市,雨量站位置分布見(jiàn)圖1。
圖1 雨量站位置分布
6個(gè)站點(diǎn)分別位于省內(nèi)不同地理位置,由點(diǎn)及面概括全省,通過(guò)泰森多邊形法求得全省面降水量,并對(duì)其進(jìn)行特征分析,這對(duì)全省范圍內(nèi)的降水規(guī)律研究有較好的參考性。
根據(jù)安徽省1960—2009年的降水?dāng)?shù)據(jù)統(tǒng)計(jì),每年的6—10月份為降水最為集中且降雨量較大的時(shí)期,因此選取這段時(shí)間作為模型模擬的時(shí)間序列區(qū)間(153 d/a),每站點(diǎn)各有50個(gè)降雨統(tǒng)計(jì)周期。前40 a(共6 120 d)數(shù)據(jù)用于模型構(gòu)建及參數(shù)訓(xùn)練,后10 a(共1 530 d)數(shù)據(jù)用于模型驗(yàn)證及評(píng)價(jià)。研究區(qū)的降水?dāng)?shù)據(jù)具有完整性及可靠性,可以得到降水序列的內(nèi)部特征概況及時(shí)空持續(xù)性。研究區(qū)各站點(diǎn)及全省多年降水特征概況見(jiàn)表1。
隱馬爾可夫是一個(gè)雙重隨機(jī)過(guò)程,我們不知道具體的狀態(tài)序列,只知道狀態(tài)轉(zhuǎn)移的概率,即模型的狀態(tài)轉(zhuǎn)換過(guò)程是不可觀察的,而可觀察事件的隨機(jī)過(guò)程是隱蔽狀態(tài)轉(zhuǎn)換過(guò)程的隨機(jī)函數(shù)。HMM主要由5個(gè)部分構(gòu)成,分別為模型中狀態(tài)數(shù)量、每個(gè)狀態(tài)對(duì)應(yīng)可能輸出的觀察值、狀態(tài)轉(zhuǎn)移概率矩陣、從狀態(tài)產(chǎn)生觀察值的概率分布矩陣和初始狀態(tài)的概率分布。隱馬爾可夫模型框架見(jiàn)圖2。
圖2 隱馬爾可夫模型框架
如圖2所示,S表示模型中的隱式狀態(tài),即控制輸出觀察值的內(nèi)部狀態(tài);O表示特定隱式狀態(tài)下的觀察值。本文中觀察值解釋為天氣晴雨?duì)顩r,隱式狀態(tài)為決定該地區(qū)天氣晴雨?duì)顩r的內(nèi)部狀態(tài)。隱馬爾可夫模型是在3個(gè)前提下得到的,這3個(gè)假設(shè)條件如下。
(1) 馬爾可夫假設(shè):隱式狀態(tài)構(gòu)成一階馬爾可夫鏈。
(2) 不動(dòng)性假設(shè):當(dāng)前狀態(tài)與時(shí)間無(wú)關(guān),只取決于上一個(gè)狀態(tài)和狀態(tài)轉(zhuǎn)移概率矩陣,表示為
(1)
(3) 輸出獨(dú)立性假設(shè):輸出的觀察值僅與當(dāng)前隱式狀態(tài)有關(guān),與之前其他時(shí)刻狀態(tài)及觀察值無(wú)關(guān),表示為
(2)
在已知觀察序列的前提下,需要確定模型隱式狀態(tài)數(shù)量、訓(xùn)練模型參數(shù),并確定產(chǎn)生觀察序列的最優(yōu)狀態(tài)序列。要完成上述任務(wù),首先要解決2大問(wèn)題,即模型參數(shù)訓(xùn)練問(wèn)題和模型解碼問(wèn)題。參數(shù)訓(xùn)練問(wèn)題是通過(guò)不斷調(diào)整模型參數(shù),使在已知模型下出現(xiàn)觀察值概率最大化,Baum-Welch算法就解決了HMM的訓(xùn)練問(wèn)題,即HMM參數(shù)估計(jì)問(wèn)題。Baum-Welch算法可以得到模型參數(shù),包括狀態(tài)轉(zhuǎn)移概率矩陣和生成觀察值的概率矩陣。解碼問(wèn)題即如何有效地選取一組與觀測(cè)值序列對(duì)應(yīng)的狀態(tài)序列,它能夠?qū)τ^測(cè)值序列作出充分的解釋。解碼問(wèn)題可由Viterbi算法解決,該算法主要解決了在給定模型和觀測(cè)值序列的條件下,在最優(yōu)意義上確定狀態(tài)序列的問(wèn)題。
4.1 模型狀態(tài)數(shù)量的確定
用HMM擬合降水序列時(shí),需要先確定模型中隱式狀態(tài)的數(shù)量,狀態(tài)數(shù)量較少則無(wú)法充分反映降水特征,數(shù)量較多則會(huì)產(chǎn)生狀態(tài)冗余,同時(shí)導(dǎo)致模型運(yùn)行效率的下降[6]。應(yīng)用較多的方法有赤池信息準(zhǔn)則(AIC)(Akaike 1974)和貝葉斯信息準(zhǔn)則(BIC)。兩者都是基于最優(yōu)似然函數(shù)值及相關(guān)參數(shù)來(lái)選擇模型,BIC在計(jì)算中引入樣本數(shù)量,較AIC的使用更有優(yōu)勢(shì),因此,本文作者選擇BIC確定模型中隱式狀態(tài)數(shù)量[1,5,7]。其公式為
BIC=-2lgL+mlgn 。
(3)
式中:L表示模型似然函數(shù)的最大計(jì)算值;m表示參數(shù)的數(shù)量;n表示觀察值的數(shù)量。
參照Hughes和Peter Guttorp在非齊次HMM中應(yīng)用的模型狀態(tài)數(shù)量確定方法,結(jié)合BIC最終確定本文模型中所需的狀態(tài)個(gè)數(shù)為4。
4.2 模型參數(shù)訓(xùn)練
Baum等人(1970年)在綜合考慮隱式狀態(tài)的前提下提出了可以獲得HMM參數(shù)最大化估計(jì)的方法,即Baum-Welch算法,也稱為前向-后向算法。即在給定模型觀察序列時(shí)用來(lái)解決模型參數(shù)訓(xùn)練問(wèn)題,從一系列訓(xùn)練樣本中通過(guò)多次迭代得到模型參數(shù)。
在HMM中,初始化時(shí)根據(jù)經(jīng)驗(yàn)給模型的初始參數(shù)賦值,在遵循假設(shè)前提條件下通過(guò)不斷迭代計(jì)算,使每一次修改得到的矩陣都更加可能產(chǎn)生觀察序列,當(dāng)前后2個(gè)2次迭代矩陣的變化在1個(gè)小的容錯(cuò)范圍內(nèi)時(shí),迭代停止。最終參數(shù)收斂于最大似然估計(jì)值,并得到訓(xùn)練后的HMM參數(shù)(包括初始狀態(tài)概率矩陣,狀態(tài)轉(zhuǎn)移矩陣A,觀察值生成矩陣B),使得該觀察序列出現(xiàn)的可能性最大。根據(jù)以上基本原理并結(jié)合Matlab語(yǔ)言程序得到隱式狀態(tài)的轉(zhuǎn)移概率矩陣,見(jiàn)表2。
表2 HMM隱式狀態(tài)轉(zhuǎn)移概率
從表2可以得到HMM中所含各個(gè)隱式狀態(tài)自身及相互之間轉(zhuǎn)變的可能性。根據(jù)表中狀態(tài)轉(zhuǎn)移概率,狀態(tài)1向自身轉(zhuǎn)變的概率為0.724,占較大比重,說(shuō)明其比較容易保持自身狀態(tài),向其余狀態(tài)的轉(zhuǎn)變概率(0.101,0.120,0.055)很小且相互之間差別不大,可知狀態(tài)1不僅持續(xù)時(shí)間長(zhǎng),而且穩(wěn)定性較高,可能對(duì)應(yīng)著持續(xù)降雨或持續(xù)干燥的天氣狀態(tài);狀態(tài)2向自身轉(zhuǎn)變的概率為0.585,也顯示較高的自身穩(wěn)定性,但與狀態(tài)1相比,狀態(tài)2也有著向狀態(tài)3,狀態(tài)4轉(zhuǎn)變的較大可能;狀態(tài)3的轉(zhuǎn)移概率分布較為平均,向各個(gè)狀態(tài)轉(zhuǎn)變的可能性相差不大,說(shuō)明該狀態(tài)保持自身穩(wěn)定性較低且轉(zhuǎn)變影響因素較為復(fù)雜等;狀態(tài)4與其余狀態(tài)的轉(zhuǎn)移情況相差較大,顯示其向狀態(tài)1轉(zhuǎn)變概率最大(0.642),還有較大可能向狀態(tài)3轉(zhuǎn)變。
根據(jù)Baum-Welch算法同時(shí)得到各狀態(tài)下觀察值生成概率矩陣,據(jù)此整理各城市降水概率,結(jié)果見(jiàn)圖3。狀態(tài)1中6個(gè)研究城市降水概率均在10%以內(nèi),顯示降水可能性較低,整體顯示天氣干燥的狀態(tài);狀態(tài)2與狀態(tài)1呈現(xiàn)相反的情況,降水概率都在85%以上,有個(gè)別地區(qū)超過(guò)90%,降水概率極大,表明整體區(qū)域處于潮濕多雨的狀態(tài),其本質(zhì)很可能是受夏季6—8月份大陸低壓形成來(lái)自海洋的偏南暖濕氣流影響導(dǎo)致雨水充沛;這2個(gè)狀態(tài)可以分別表示全省干燥少雨和潮濕多雨的情況,且這類狀態(tài)穩(wěn)定性高,容易持續(xù)保持自身狀態(tài)。狀態(tài)3與狀態(tài)4對(duì)6個(gè)研究城市降水概率的整體趨勢(shì)影響相近,但狀態(tài)3中各城市整體降水概率總體高于狀態(tài)4下各城市降水概率,而且狀態(tài)4中平均海拔最高的黃山市降水概率較其他城市明顯差距更大,平均海拔最低的淮北市和毫州市卻有相對(duì)最低的降水概率。結(jié)合省內(nèi)地理特征,淮北地區(qū)(淮北市和毫州市)為遼闊的平原,海拔在20~40 m,地勢(shì)低緩;江淮之間地區(qū)(合肥、滁州市和安慶市)多起伏的丘陵,大別山脈蜿蜒于該地區(qū)西南部;江南地區(qū)(黃山市)除沿江一部分為平原外,多數(shù)是山區(qū)地帶,海拔在500~1 000 m,地勢(shì)較高[8],由于山高谷深,氣候呈垂直變化,局部地形對(duì)其氣候起主導(dǎo)作用,形成云霧多、濕度大、降水多的氣候特點(diǎn)。因此我們可以推斷狀態(tài)4的特點(diǎn)主要是由地形特征(海拔、地勢(shì)變化、地表起伏、地貌類型及結(jié)構(gòu)、主要地形、典型地貌等幾個(gè)方面)決定的。在狀態(tài)4的推斷下,狀態(tài)3保留了地形特征的影響但其已被削弱,其降水概率特征顯示很可能是海陸位置的影響占據(jù)了主要地位,同時(shí)受大區(qū)域整體氣壓帶的控制,距離東部海洋位置相對(duì)較近的(合肥市、淮北市、黃山市、滁州市)降水概率相對(duì)較大,相對(duì)位置更加處于內(nèi)陸(毫州市、安慶市)的則降水概率略低,由于前4個(gè)城市位置與后2個(gè)城市地理位置差距并不大,因此這6個(gè)城市降水概率整體平穩(wěn),并無(wú)異常值出現(xiàn)。
5.1 確定模型隱式狀態(tài)序列
HMM中需要解決模型的一個(gè)基本問(wèn)題,即解碼問(wèn)題:已知一個(gè)觀察值序列和模型的各項(xiàng)參數(shù),通過(guò)有效選取一組與觀察值序列對(duì)應(yīng)的狀態(tài)序列,使它能夠?qū)τ^察值序列作出充分的解釋。在本文的實(shí)際應(yīng)用中,要得到?jīng)Q定天氣晴雨?duì)顩r的隱式狀態(tài)序列,需要使用一種最優(yōu)準(zhǔn)則來(lái)解決此問(wèn)題。目前最有效且應(yīng)用較多的是Viterbi算法[2,8-9],其詳細(xì)過(guò)程如下。
定義在時(shí)刻t,沿著狀態(tài)序列路徑q1,q2,…qt,且qt=Si時(shí)產(chǎn)生的觀察序列O1,O2,…,Ot的最大概率為P(i),即
(4)
于是,求解最優(yōu)狀態(tài)序列q的過(guò)程如下。
(1) 初始化:
(5)
(2) 遞歸:
2≤t≤T,1≤j≤N ;
(6)
2≤t≤T,1≤j≤N 。
(7)
(3) 終止,最優(yōu)概率:
(8)
最終待定:
(9)
(4) 狀態(tài)序列求解:
式中:aij為由狀態(tài)i轉(zhuǎn)移到狀態(tài)j的概率;bij為狀態(tài)i下生成觀察值的概率。
由此得到最優(yōu)狀態(tài)序列q=q1,q2,…,qt。
通過(guò)Viterbi算法計(jì)算, 得到每個(gè)站點(diǎn)的最優(yōu)隱式狀態(tài)序列, 選取計(jì)算結(jié)果中合肥市1994年的隱式狀態(tài)序列及各狀態(tài)預(yù)測(cè)降水概率作簡(jiǎn)要說(shuō)明, 見(jiàn)圖3。 圖3(a)部分(狀態(tài)轉(zhuǎn)移時(shí)間序列)顯示隱式狀態(tài)處于不斷變化之中, 狀態(tài)1傾向于保持自身狀態(tài), 同時(shí)有向狀態(tài)2和狀態(tài)4轉(zhuǎn)變的可能, 而狀態(tài)2除了延續(xù)自身狀態(tài), 也較容易向狀態(tài)4轉(zhuǎn)變, 狀態(tài)4保持自身穩(wěn)定性很低, 更容易向狀態(tài)1轉(zhuǎn)變; 圖3(b)部分(各狀態(tài)所占比例及同時(shí)間段內(nèi)實(shí)際降水概率)顯示狀態(tài)1預(yù)測(cè)降水概率最大, 占67.3%, 狀態(tài)2其次,占20.9%, 狀態(tài)3和狀態(tài)4預(yù)測(cè)降水概率較小, 狀態(tài)2預(yù)測(cè)降水概率與真實(shí)觀察值-降雨出現(xiàn)的頻率接近。 上述情況補(bǔ)充說(shuō)明了4.2節(jié)HMM參數(shù)訓(xùn)練中得到的狀態(tài)轉(zhuǎn)移相關(guān)結(jié)論, 再結(jié)合合肥市每年10月份的日狀態(tài)序列數(shù)據(jù)整理(見(jiàn)圖4), 發(fā)現(xiàn)隱式狀態(tài)分布規(guī)律并不明顯,且存在較大年際間變化[6]。
圖4 合肥市1994年的隱式狀態(tài)變化趨勢(shì)及各狀態(tài)預(yù)測(cè)降水概率和實(shí)際降水概率
另外,對(duì)整體狀態(tài)年變化做統(tǒng)計(jì)后發(fā)現(xiàn):在前半時(shí)段內(nèi),狀態(tài)1預(yù)測(cè)降水概率最高,占主導(dǎo)地位;狀態(tài)2其次,在后半時(shí)段內(nèi)狀態(tài)1與狀態(tài)2逐漸接近并且相互交替占主導(dǎo)地位,周期震蕩趨勢(shì)逐漸明顯,表明安徽全省此時(shí)段內(nèi)強(qiáng)降水頻率及極端降水事件有略微上升的趨勢(shì),相互交替出現(xiàn)表明影響降水因素更為復(fù)雜多樣,可能與人類相關(guān)活動(dòng)更為密集有關(guān)[10-12];狀態(tài)3和狀態(tài)4所占比例較低且穩(wěn)定,表明地理位置、地勢(shì)高低、大氣循環(huán)等固定影響因素變化較為穩(wěn)定,符合實(shí)際情況。各狀態(tài)在1960—1999年的整體變化趨勢(shì)見(jiàn)圖5。
圖5 1960—1999年各狀態(tài)年變化概率趨勢(shì)
5.2 模型驗(yàn)證
5.2.1 模擬期模型可行性
根據(jù)模擬期(1960—1999年)共40 a的實(shí)際年降水概率,與上述隱馬爾可夫模型得出的年降水概率結(jié)果比較,發(fā)現(xiàn)模型結(jié)果符合實(shí)際情況,整體趨勢(shì)匹配,而且兩者之間擬合度較好,可見(jiàn)上述構(gòu)造的隱馬爾可夫模型具有較大可信性和可行性。模擬結(jié)果見(jiàn)圖6。
圖6 1960—1999年降水概率的HMM模擬值與實(shí)測(cè)值
5.2.2 驗(yàn)證期模型適用性
使用2000—2009年共10 a的降水?dāng)?shù)據(jù),對(duì)上述構(gòu)建的模型模擬未來(lái)10 a降雨概率進(jìn)行適用性方面的分析。模擬結(jié)果如圖7所示。結(jié)果表明本文構(gòu)建的隱馬爾可夫模型是適用于降水預(yù)測(cè)的,模擬準(zhǔn)確度較高而且對(duì)異常值也有較好的預(yù)報(bào)結(jié)果。
圖7 2000—2009年降水概率的HMM模擬值與實(shí)測(cè)值
5.3 結(jié)果與討論
根據(jù)上述模型的構(gòu)建及分析、驗(yàn)證,我們得到了基于4個(gè)隱式狀態(tài)的隱馬爾可夫模型,對(duì)6個(gè)城市的降雨情況進(jìn)行了模擬。狀態(tài)1和狀態(tài)2分別表示全省干燥少雨和濕潤(rùn)多雨的情況,狀態(tài)3表示海陸位置及大區(qū)域氣壓帶等因素,狀態(tài)4表示各站點(diǎn)所處的地形特征、海拔等因素。隱馬爾可夫模型中各隱式狀態(tài)將大部分降雨的影響因素考慮在內(nèi),并不單獨(dú)分析某一因素的影響,而是將其作為一個(gè)整體綜合考慮,各狀態(tài)在相互交替下影響區(qū)域降水情況[13-15]。模擬結(jié)果說(shuō)明本文所構(gòu)建的模型對(duì)研究區(qū)降水規(guī)律有較好的實(shí)用性。
在前期對(duì)馬爾可夫模型的研究中, 本文作者曾選用灰色無(wú)偏馬爾可夫模型對(duì)吉林省降水量進(jìn)行預(yù)測(cè), 該模型的平均相對(duì)誤差值為0.051; 在本次研究中, 應(yīng)用隱馬爾可夫模型(HMM)進(jìn)行降水概率預(yù)報(bào), 其結(jié)果的平均相對(duì)誤差為0.036。 此2種方法均以馬爾可夫模型為基礎(chǔ)進(jìn)行改進(jìn), 以大量降水?dāng)?shù)據(jù)為樣本開(kāi)展計(jì)算, 同樣對(duì)降水的狀態(tài)變化進(jìn)行預(yù)報(bào), 二者具有可比性, 并且HMM產(chǎn)生的相對(duì)誤差更小, 在數(shù)據(jù)擬合方面更具有優(yōu)越性。
本文應(yīng)用隱馬爾可夫模型HMM對(duì)1960—2009年(共50 a)時(shí)段內(nèi)安徽省6個(gè)水文氣象站點(diǎn)的降水情況進(jìn)行模擬,其中前40 a數(shù)據(jù)用來(lái)創(chuàng)建及訓(xùn)練模型,后10 a數(shù)據(jù)用來(lái)對(duì)模型進(jìn)行驗(yàn)證。6個(gè)站點(diǎn)分別位于省內(nèi)不同位置,模擬結(jié)果對(duì)全省降水預(yù)測(cè)具有代表性。根據(jù)貝葉斯信息準(zhǔn)則BIC確定模型狀態(tài)數(shù)量為4個(gè)。由于各站點(diǎn)的空間分布不均勻,因此4個(gè)狀態(tài)對(duì)決定降水情況有不同的空間特征性。通過(guò)Baum-Welch算法對(duì)模型參數(shù)進(jìn)行訓(xùn)練,使用Viterbi算法來(lái)根據(jù)可觀察序列得到最優(yōu)可能的隱藏狀態(tài)的序列,對(duì)所建模型用模擬期和驗(yàn)證期2個(gè)序列對(duì)模型擬合,最終得到較好的模擬效果。同時(shí)與以前研究中通過(guò)無(wú)偏灰色馬爾科夫模型對(duì)降水序列數(shù)據(jù)進(jìn)行擬合的結(jié)果形成對(duì)比,結(jié)果表明HMM模擬的相對(duì)誤差更小,更具適用性。
由于HMM是基于時(shí)間序列所創(chuàng)建的模擬過(guò)程,因此也可以應(yīng)用于其他水文時(shí)間序列的相關(guān)研究,如地表徑流、洪澇災(zāi)害、潮汐運(yùn)動(dòng)等方面。同時(shí)存在一些不足:例如在解決模型參數(shù)訓(xùn)練這個(gè)問(wèn)題時(shí)使用最多的方法是Baum-Welch算法,但是Baum-Welch算法在解決這一問(wèn)題時(shí)仍然存在缺陷,并不能一定保證求得全局最優(yōu)模型,有時(shí)會(huì)得到一個(gè)局部最優(yōu)結(jié)果,這就需要不斷調(diào)整參數(shù),并給模型賦予較為貼近真實(shí)結(jié)果的初始參數(shù)。因此,該模型還需要在以后的學(xué)習(xí)應(yīng)用中進(jìn)一步完善改進(jìn)。
[1] HUGHES J P, GUTTORP P, CHARLES S P. A Non-homogeneous Hidden Markov Model for Precipitation Occurrence[J]. Applied Statistics, 1999, 48(1): 15-30.
[2] THYER M, KUCZERA G. Modeling Long-term Persistence in Hydro-climatic Time Series Using a Hidden State Markov Model[J]. Water Resources Research, 2000, 36(11): 3301-3310.
[3] THYER M, KUCZERA G. A Hidden Markov Model for Modelling Long-term Persistence in Multi-site Rainfall Time Series 1. Model Calibration Using a Bayesian Approach[J]. Journal of Hydrology, 2003, 275(1/2):12-26.
[4] HOLZMANN H, MUNK A, SUSTER M,etal. Hidden Markov Models for Circular and Linear-circular Time Series[J]. Environmental and Ecological Statistics, 2006, 13(3): 325-347.
[5] MARES C, MARES I, HUEBENER H,etal. A Hidden Markov Model Applied to the Daily Spring Precipitation over the Danube Basin[J]. Advances in Meteorology, 2014: 1-11. http://dx.doi.org/10.1155/2014/237247.
[6] 袁宏永, 張毛磊, 楊 銳,等.基于隱式Markov方法的福建省降水預(yù)測(cè)[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,50(6):887-890.
[7] BELLONE E, HUGHES J P, GUTTORP P. A Hidden Markov Model for Downscaling Synoptic Atmospheric Patterns to Precipitation Amounts[J]. Climate Research, 2000,15(1): 1-12.
[8] 陳 健,杜曉賓,方 茸,等. 安徽省夏季降水區(qū)域特征[J]. 氣象科技,2012,40(5):794-798.
[9] 江俊杰,孫衛(wèi)國(guó).1959—2007年安徽省降水時(shí)空變化特征分析[J].中國(guó)農(nóng)業(yè)氣象,2012, 33(1):27-33.
[10]BETRO B, BODINI A, COSSU Q A. Using a Hidden Markov Model to Analyse Extreme Rainfall Events in Central-East Sardinia[J]. Environmetrics, 2008, 19(7): 702-713.
[11]KEHAGIAS A. A Hidden Markov Model Segmentation Procedure for Hydrological and Environmental Time Series[J]. Stochastic Environmental Research and Risk Assessment, 2004, 18: 117-130.
[12]RAMESH N I, ONOF C. A Class of Hidden Markov Models for Regional Average Rainfall[J]. Hydrological Sciences Journal,2014, 59(9): 23-38.
[13]SANSOM J. Hidden Markov Model for Rainfall Using Breakpoint Data[J]. Journal of Climate, 1997, 11(1): 42-53.
[14]LEROUX B G. Maximum-likelihood Estimation for Hidden Markov Models[J]. Stochastic Processes and Their Applications, 1992, 40(1): 127-143.
[15]張 茜,梁秀娟,杜 川. 基于無(wú)偏灰色馬爾可夫鏈的吉林省降水量預(yù)測(cè)[J]. 吉林大學(xué)學(xué)報(bào)(地球科學(xué)版),2014,(6):1973-1979.
(編輯:劉運(yùn)飛)
Research of Precipitation Characteristics in AnhuiProvince Using Hidden Markov Model
HUO Feng-lan1, ZHANG Qian2, A Ru-na3, LIU Xiao-mei4, BAO Shu-ming5, WU Yun-fei5, BAO Shi-chao5, LI Shu-sen5
(1.Supplies Management Station for Flood Control and Drought Relief of Tongliao City,Tongliao 028000,China;2.College of Environment and Resources, Jilin University, Changchun 130021, China; 3.Inner Mongolia Electric Power Science Research Institute, Hohhot 010020, China; 4.Quality and Safety Surveillance Station for Water Conservancy Project Construction in Tongliao City, Tongliao 028000, China;5.Water Conservancy Planning Design and Research Institute of Tongliao City, Tongliao 028000, China)
The laws and characteristics of precipitation in Anhui Province were analyzed and simulated using the Hidden Markov Model (HMM) to verify its applicability in regional precipitation. HMM with four implicit states was employed to fit the daily precipitation data sequence of many years in six major cities in the province. Bayesian Information Criterion was adopted to determine the implicit state quantity, the Baum-Welch algorithm to train and obtain the optimal model parameters, and the Viterbi algorithm to determine the optimal sequence of the model states. The above methods were adopted to simulate the precipitation in the summer of 1960-2009 in six cities of Anhui Province. The first 4-decade was for model training and analyzing, and the later 1 decade for model validation and evaluation. Results showed that HMM is of high practicability by better simulating rainfall characteristics.
hidden Markov model; implicit state; precipitation characteristics; Bayesian information criterion; Baum-Welch algorithm; Viterbi algorithm
2016-04-26;
2016-07-19
國(guó)家自然科學(xué)基金項(xiàng)目(41072171)
霍鳳嵐(1963-),女,內(nèi)蒙古通遼人,高級(jí)工程師,主要從事水利工程建設(shè)管理,(電話)18747339991(電子信箱)tlsl401@sohu.com。
張 茜(1989-),女,黑龍江哈爾濱人,博士研究生,主要從事水文學(xué)與水資源方面的研究,(電話)15124510766(電子信箱)qianer0403@126.com。
10.11988/ckyyb.20160406
2017,34(1):12-18
P401
A
1001-5485(2017)01-0012-07