周平朱仁義
(巢湖學(xué)院物理與電子科學(xué)系,安徽巢湖238000)
貝葉斯理論在水文不確定性分析中的應(yīng)用
周平朱仁義
(巢湖學(xué)院物理與電子科學(xué)系,安徽巢湖238000)
本文簡(jiǎn)要介紹了貝葉斯理論的基本原理。闡述了貝葉斯理論在水文不確定性分析中的應(yīng)用,包括在模型參數(shù)、模型結(jié)構(gòu)、水文組合預(yù)報(bào)、區(qū)域洪水頻率分析中的應(yīng)用情況。并指出了貝葉斯理論在水文不確定性分析中的應(yīng)用前景。
貝葉斯理論;不確定性;參數(shù)
水文過(guò)程是一個(gè)高度復(fù)雜的非線性過(guò)程,其發(fā)生、發(fā)展過(guò)程中受眾多不確定性因素影響,本身呈現(xiàn)出隨機(jī)、模糊、混沌、灰色和未確知等自然不確定性。而現(xiàn)有的水文模型都是采用數(shù)學(xué)物理方法對(duì)復(fù)雜水文過(guò)程的一種簡(jiǎn)化,使模擬的水文過(guò)程又受到水文輸入、模型結(jié)構(gòu)和模型參數(shù)不確定性的影響。
基于貝葉斯理論的水文不確定性分析,能將認(rèn)知的先驗(yàn)信息和樣本信息有效結(jié)合,以概率分布的形式描述水文不確定性。不僅可以給出水文變量的均值,還能給出其方差和指定概率的置信區(qū)間,描述水文變量發(fā)生的不確定性程度,比確定性水文模型描述水文過(guò)程更具合理性和科學(xué)性?;谪惾~斯理論的水文不確定性分析能使決策者將風(fēng)險(xiǎn)考慮到?jīng)Q策中去,實(shí)現(xiàn)水文分析與決策有機(jī)結(jié)合,更好地實(shí)現(xiàn)水文分析的作用,體現(xiàn)其價(jià)值。本文簡(jiǎn)述貝葉斯理論在水文不確定性分析中的應(yīng)用現(xiàn)狀,并指出其應(yīng)用前景。
貝葉斯公式通常以事件形式或隨機(jī)變量形式表示。
事件形式:設(shè)事件A1,A2,…,An互不相容,并且有(Ω為必然事件),則對(duì)任一事件Ai,有:
若以隨機(jī)變量形式表示,為:
式中,x、y為隨機(jī)變量,f(.)是隨機(jī)變量的先驗(yàn)概率密度函數(shù),一般根據(jù)經(jīng)驗(yàn)知識(shí)確定是隨機(jī)變量x、y間關(guān)系,在x已知的條件下,表示為y的條件概率密度,在y已知的情況下,表示為x的似然函數(shù);已知(作為發(fā)生的樣本)情況下,x的后驗(yàn)密度函數(shù)(又稱(chēng)驗(yàn)后密度函數(shù));X為隨機(jī)變量x的取值范圍。當(dāng)人們對(duì)變量x的先驗(yàn)沒(méi)有任何信息時(shí),認(rèn)為x在它允許取值的范圍內(nèi)機(jī)會(huì)是相等的,即認(rèn)為的先驗(yàn)分布f(.)在其值域上是均勻分布的。
假設(shè)已獲取容量為n的樣本X=(x1,x2,…,xn),需估計(jì)與此樣本有關(guān)的隨機(jī)變量θ的概率密度,且假定在θ已知的情況下,樣本X的出現(xiàn)的概率為。則基于貝葉斯公式(1)和式(2)的貝葉斯統(tǒng)計(jì)推斷θ的后驗(yàn)密度π(θX)主要包括以下2個(gè)步驟[1-4]。
步驟1:根據(jù)參數(shù)θ的先驗(yàn)信息確定其先驗(yàn)分布π(θ)。
步驟2:確定θ的后驗(yàn)密度π(θX)。設(shè)h(θ,X)為θ和X的聯(lián)合概率密度函數(shù),則:
式中,m(X)為X的邊緣密度函數(shù),定義為:
由式(3)和式(4)得:
式中,p(X)為樣本X=(x1,x2,…,xn)的聯(lián)合概率密度函數(shù)。
正態(tài)分布似然函數(shù)表示如:
水文模型參數(shù)反映的是流域水文特征,是一些原則上可以實(shí)測(cè)的物理量,但由于實(shí)際中往往難以做到,通常都是根據(jù)一定的測(cè)站資料,通過(guò)一定的目標(biāo)函數(shù),率定出一組“最佳參數(shù)”。由于資料的代表性、測(cè)量誤差、目標(biāo)函數(shù)的選取、計(jì)算方法的簡(jiǎn)化等局限性,一般只能得到局部最優(yōu)參數(shù),抑或出現(xiàn)“異參同效”現(xiàn)象,致使水文模型參數(shù)具有不確定性,導(dǎo)致根據(jù)此參數(shù)進(jìn)行模擬和預(yù)測(cè)的水文過(guò)程具有不確定性。[5]
水文模型參數(shù)的后驗(yàn)估計(jì),只需將式(5)中的變量θ作為模型參數(shù)即可。式(5)通常情況下難以用解析形式表達(dá)。因此,通常通過(guò)Monte Carlo隨機(jī)模擬方法獲得水文模型參數(shù)θ的后驗(yàn)密度估計(jì)?;隈R爾可夫鏈蒙特卡羅法(MCMC)常被用來(lái)產(chǎn)生后驗(yàn)分布的概率密度函數(shù)。MCMC基本上是一種通過(guò)展開(kāi)馬氏鏈來(lái)獲得相關(guān)樣本的混合型蒙特卡羅方法。MCMC的關(guān)鍵是如何選擇推薦分布(轉(zhuǎn)移密度)使抽樣更加有效。MCMC的性能很大程度上取決其采樣的算法,常用的采樣算法有Metropolis算法、Metropolis-Hastings算法、吉布斯(Gibbs)采樣和Adapative Metropolis算法等[3,6,7]。
將通過(guò)MCMC方法抽樣得到的模型參數(shù)θ帶入模型,即可獲得模擬樣本,通過(guò)對(duì)大量的模擬樣本進(jìn)行統(tǒng)計(jì)分析,就可以得到模擬值或預(yù)報(bào)量的統(tǒng)計(jì)特征[5]。
模型結(jié)構(gòu)不確定性一般表現(xiàn)在兩個(gè)方面,一是同一模型的不同子結(jié)構(gòu)組成對(duì)預(yù)報(bào)結(jié)果產(chǎn)生的不確定性;二是采用不同模型給預(yù)報(bào)結(jié)果帶來(lái)的不確定性。不同模型各具優(yōu)缺點(diǎn),若選擇一個(gè)較優(yōu)模型計(jì)算值的同時(shí)舍棄另外模型的計(jì)算值是不明智的,因?yàn)樯釛壍哪P陀?jì)算值一般都蘊(yùn)含某些有用的獨(dú)立信息。不同的模型組合往往能得到較好的模擬或預(yù)報(bào)計(jì)算值。實(shí)現(xiàn)模型組合的方法有很多種,如以模型計(jì)算與實(shí)測(cè)數(shù)據(jù)的殘差信息作為目標(biāo)函數(shù),采用組合權(quán)重法實(shí)現(xiàn)不同模型的組合;以不同模型的計(jì)算值作為神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn)值,實(shí)測(cè)值作為網(wǎng)絡(luò)的輸出值,基于神經(jīng)網(wǎng)絡(luò)構(gòu)建組合預(yù)測(cè)模型等。假定k個(gè)模型對(duì)實(shí)測(cè)X的組合預(yù)測(cè)值為Y,它們間的關(guān)系為,通常可以通過(guò)線性回歸方法建立關(guān)系L或者將X、Y通過(guò)亞高斯模型實(shí)現(xiàn)正態(tài)分位數(shù)轉(zhuǎn)換后再建立線性回歸關(guān)系[2,8]。
若先驗(yàn)密度函數(shù)g(X)與似然函數(shù)L(X Y)均采用正態(tài)分布函數(shù)表示,即
則f(X Y)也服從正態(tài)分布,其均值E(X Y)和方差D(X Y)分別為[1,9]:
若先驗(yàn)密度和似然函數(shù)形式比較復(fù)雜,也可采用如神經(jīng)網(wǎng)絡(luò)等智能算法建立g(X)、L(XY)的函數(shù)關(guān)系[3]。
水文事件的總體是未知的?,F(xiàn)行的洪水頻率計(jì)算方法,運(yùn)用概率統(tǒng)計(jì)的理論,用單站資料作為樣本,對(duì)假設(shè)總體及參數(shù)進(jìn)行統(tǒng)計(jì)推斷。由于觀測(cè)資料有限,在樣本資料較短的情況下,由單站樣本資料推求總體往往有較大的誤差和任意性。提高洪水頻率分析的精度方法主要有洪水分布線型和改進(jìn)參數(shù)估計(jì)這兩條途徑。其中參數(shù)估計(jì)可以結(jié)合地區(qū)信息,以地區(qū)的區(qū)域化參數(shù)作為單站頻率曲線的先驗(yàn)參數(shù),結(jié)合單站資料進(jìn)行參數(shù)的后驗(yàn)估計(jì),可使推出的參數(shù)既含有單站信息也具有地區(qū)信息,增強(qiáng)估計(jì)參數(shù)的可靠性[1]。
若根據(jù)地區(qū)信息得到水文頻率曲線參數(shù)θ的先驗(yàn)概率密度為g(θ),單站發(fā)生的樣本為X=(x1,x2,…,xn),則參數(shù)θ的后驗(yàn)密度估計(jì)為:
參數(shù)θ的數(shù)學(xué)期望E(θ)為:
單站水文變量x的后驗(yàn)密度函數(shù)f′(x)為:
Roman Krzysztofwicz等人[6,7]基于貝葉斯概率水文預(yù)報(bào)理論(Bayesian Forecasting system),認(rèn)為應(yīng)采用概率分布定量地描述水文預(yù)報(bào)的不確定度;同時(shí),決策者應(yīng)當(dāng)根據(jù)這個(gè)概率分布,而不是直接根據(jù)預(yù)報(bào)來(lái)制定決策。該預(yù)報(bào)理論已經(jīng)獲得廣泛運(yùn)用,其基本思路是:首先根據(jù)其特性和對(duì)水文預(yù)報(bào)的影響大小,將總不確定度分解成兩大部分,即輸入不確定度和水文不確定度,然后采用不同的方法進(jìn)行處理。
以W表示模型輸入,S表示輸出,H表示預(yù)報(bào)變量,并以它們的小寫(xiě)字母w、s和h表示相應(yīng)的現(xiàn)值、觀測(cè)值和估計(jì)量。設(shè)輸入W的不確定度以概率密度表示,V=1表示有雨,V=0表示無(wú)雨。以U表示所有確定性輸入,以Y表示狀態(tài)變量,并假定H過(guò)程是馬爾可夫過(guò)程。在時(shí)刻t,已知量為預(yù)報(bào)變量的前期過(guò)程h0、狀態(tài)變量y、輸入變量u、v。設(shè)模型響應(yīng)為s=γ(u,v),為模型輸入的條件概率密度函數(shù)[3,10-13]。
式中,Φ為水文不確定度,即h的后驗(yàn)密度,定義為:
貝葉斯理論在水文不確定性分析中,已經(jīng)取得一定的進(jìn)展,主要是應(yīng)用方面。未來(lái)在理論方面可以進(jìn)一步研究的方向主要包括以下:
(1)先驗(yàn)分布的確定,特別是一些無(wú)信息的先驗(yàn)分布問(wèn)題。
(2)貝葉斯分析的穩(wěn)健性問(wèn)題。
(3)似然函數(shù)的選擇問(wèn)題。
(4)后驗(yàn)密度函數(shù)的隨機(jī)抽樣算法問(wèn)題。
在應(yīng)用方面,可以進(jìn)一步拓寬其應(yīng)用的領(lǐng)域。并和反映水文系統(tǒng)特性的灰色理論、模糊理論、隨機(jī)理論有機(jī)結(jié)合??梢詫⑾闰?yàn)分布考慮成灰色先驗(yàn)分布,似然函數(shù)表示成模糊似然函數(shù),耦合這些表示水文不確定性的方法,實(shí)現(xiàn)對(duì)水文系統(tǒng)更深層次的認(rèn)識(shí)。
[1]吳伯賢.貝葉斯方法在洪水頻率分析中的應(yīng)用[J].成都科技大學(xué)學(xué)報(bào),1990,(49):69-75.
[2]戴榮.貝葉斯模型平均法在水文模型綜合中的應(yīng)用研究[D].南京:河海大學(xué),2008.
[3]邢貞相.確定性水文模型的貝葉斯概率預(yù)報(bào)方法研究[D].南京:河海大學(xué),2007.
[4]黃偉軍,丁晶.水文水資源系統(tǒng)貝葉斯分析現(xiàn)狀與前景[J].水科學(xué)進(jìn)展,19945,(3):242-247.
[5]梁忠民,戴榮.基于MCMC的水文模型參數(shù)不確定性及其對(duì)預(yù)報(bào)的影響分析[C].南京:中國(guó)水利水電出版社,2008.
[6]R K.Bayesian system for probabilistic river stage forecasting[J].Journal of Hydrology.2002,268(1-4):16-40.
[7]RK,JMC.Hydrologicuncertaintyprocessorforprobabilisticstagetransitionforecasting[J].JournalofHydrology.2004,293(1-4).
[8]黃偉軍,趙永龍,丁晶.徑流的最優(yōu)組合預(yù)測(cè)及其貝葉斯分析[J].成都科技大學(xué)學(xué)報(bào),1996,(94):97-102.
[9]張銘,李承軍,張勇傳.貝葉斯概率水文預(yù)報(bào)系統(tǒng)在中長(zhǎng)期徑流預(yù)報(bào)中的應(yīng)用[J].水科學(xué)進(jìn)展,2009,20(1):40-44.
[10]王善序.貝葉斯概率水文預(yù)報(bào)簡(jiǎn)介[J].水文,2001,21(5):33-34.
[11]錢(qián)名開(kāi),徐時(shí)進(jìn),王善序等.淮河息縣站流量概率預(yù)報(bào)模型研究[J].水文,2004,24(2):23-25.
[12]鄢來(lái)標(biāo),康玲.河道洪水概率預(yù)報(bào)方法研究[J].水力發(fā)電,2008,34(12):40-41.
[13]張洪剛,郭生練,劉攀.基于貝葉斯方法的實(shí)時(shí)洪水校正模型[J].武漢大學(xué)學(xué)報(bào)(工學(xué)版).2005,38(1):58-43.
Abstract:The basic principles of Bayesian analysis was introduced in this paper.Then the application of Bayesian analysis in hydrologic uncertainty was illustrated,including the application to watershed hydrologic forecasting,the application to river flood forecasting,the application to combined hydrologic forecasting,and the application to regionalization flood frequency analysis,etc.Finally,the prospect of the application of Bayesian analysis in hydrologic uncertainty was presented.
Key words:Bayesian analysis;uncertainty;parameter
責(zé)任編輯:宏彬
APPLICATIONS OF BAYESIAN THEOREM FOR HYDROLOGICAL UNCERTAINTY ANALYSIS
ZHOU PingZHU Ren-yi
(Physics Department of Chaohu College,Chaohu Anhui 238000)
O212.8
A
1672-2868(2010)03-0023-05
2010-03-06
周平(1982-),女,安徽巢湖人。巢湖學(xué)院物理與電子科學(xué)系教師,碩士。