王 凱 蔣曉蕾
(淮河水利委員會水文局(信息中心) 蚌埠 233001 河海大學 南京 210098)
水文預報是一種重要的防洪非工程措施,直接為防汛抗旱和水資源管理服務。目前廣泛使用的水文預報模型大多是確定性的,模型以確定預報值的形式輸出給用戶。實際上,由于水文過程的影響因素復雜多變,加之人類認識水平的有限,使得水文預報過程中不可避免地存在著諸多的不確定性。目前,水文預報不確定性量化已逐漸成為了研究熱點,概率預報作為其重要的表現(xiàn)形式,已成為了水文預報的發(fā)展趨勢。
當前國內(nèi)外關于洪水概率預報的研究主要包括兩類途徑:第一類是全要素耦合途徑,分別量化降雨—徑流過程各個環(huán)節(jié)的主要不確定性,如降雨輸入不確定性、模型結構不確定性、模型參數(shù)不確定性等,并進行耦合,實現(xiàn)概率預報。如Kavetski等采用“潛在變量”雨深乘子(stormdepthmultiplier)反映降雨輸入的不確定性,并將模型的敏感性參數(shù)隨機化,應用馬爾可夫鏈蒙特卡洛(Markov Chain Monte Carlo,MCMC)采樣方法求解流量后驗分布,提出貝葉斯總誤差分析(Bayesian total error analysis,BATEA)方法。在國內(nèi),李明亮等基于層次貝葉斯模型(Bayesian hierarchical model),構建聯(lián)合概率密度函數(shù)以考慮模型參數(shù)和降雨輸入不確定性,并采用MCMC方法進行求解。梁忠民等借用抽站法原理推求降雨量的條件概率分布,進而實現(xiàn)考慮輸入不確定性的洪水概率預報。全要素耦合途徑能夠溯源預報不確定性,但計算相對耗時,無法滿足實時預報的需要。
第二類是總誤差分析途徑,即從確定性預報結果入手,直接對預報不確定性進行量化分析,推求預報量的分布函數(shù),實現(xiàn)概率預報。Krzysztofowicz等提出的貝葉斯預報系統(tǒng)(Bayesian forecastingsystem,BFS)最具代表性,其中水文不確定性處理器(hydrologic uncertainty processor,HUP)在正態(tài)空間中對似然函數(shù)進行了線性假定,為推求預報量后驗分布的解析表達提供了可能。王善序詳細介紹了BFS的理論,并指出它可以綜合考慮預報過程的不確定性,不限定預報模型的內(nèi)部結構。近年來,很多研究表明,不同流量量級的預報不確定性存在差異。王晶晶等在原始空間中開展預報誤差規(guī)律研究,發(fā)現(xiàn)不同流量量級的誤差服從不同的分布函數(shù),為此采用極小熵確定各分布線型,采用極大熵進行參數(shù)估計,進而降低了福建池潭水庫管理的風險。Van Steenbergen等針對不同預見期、不同流量量級預報誤差統(tǒng)計規(guī)律的差異,采用頻率學方法,構建了三維誤差矩陣,量化預報不確定性。
本文在第二類研究途徑框架下,結合研究區(qū)域(淮河王家壩斷面)預報誤差的統(tǒng)計特征,假定誤差均值隨流量量級呈分段線性變化,在貝葉斯預報系統(tǒng)(BFS)的基礎上,對其水文不確定性處理器(HUP)進行改進,提出改進的貝葉斯概率預報系統(tǒng)(PCA-HUP),定量評估單個水文模型預報結果的可靠度,實現(xiàn)概率預報。
考慮誤差異分布的洪水概率預報方法不涉及預報的中間環(huán)節(jié),只對預報結果進行分析,定量評估預報結果的不確定性,并在此基礎上實現(xiàn)洪水概率預報。在貝葉斯預報系統(tǒng)(BFS)的基礎上,對其水文不確定性處理器(HUP)進行改進,提出改進的貝葉斯概率預報系統(tǒng)(PCA-HUP),定量評估單個水文模型預報結果的可靠度,實現(xiàn)概率預報。
水文不確定性處理器(Hydrologic UncertaintyProcessor,HUP)是貝葉斯概率預報系統(tǒng)(BFS)的主要組成部分,用以分析除降雨之外的其他所有不確定性。其特點是,不需要直接處理預報模型的結構與參數(shù),而是從預報結果入手,分析其與實測水文過程的誤差,再利用貝葉斯公式估計預報變量的概率分布,從而實現(xiàn)水文模型預報結果的不確定性分析及概率預報。其工作流程如圖1所示。
為推求預報量后驗分布的解析解,傳統(tǒng)HUP模型結合亞高斯模型,在正態(tài)空間中對先驗分布式和似然函數(shù)式進行線性假設,并采用最小二乘法對相關參數(shù)進行估計。
然而,由于似然函數(shù)式的自變量之間存在明確的線性關系,必然導致回歸方程的多重共線性問題。若采用傳統(tǒng)最小二乘法進行參數(shù)估計,會使得估計的回歸系數(shù)不唯一,也使得回歸方程不穩(wěn)定(原始數(shù)據(jù)的極小變化可造成參數(shù)估計值和標準差的明顯變化)。因此,項目研究結合主成分分析技術(Principal components analysis,PCA),對傳統(tǒng) HUP模型進行改進,提出PCA-HUP模型。
主成分回歸的基本思想:對原始回歸變量進行主成分分析,將線性相關的自變量,轉化為線性無關的新的綜合變量,采用新的綜合變量建立模型回歸方程。
(1)主成分分析
設 X=(X1,…Xp)T是 P 維隨機向量,均值 E(X)=μ,協(xié)方差陣 D(X)=Σ。
考慮它的線性變換:
用矩陣表示為:
圖1 水文不確定性處理器工作流程示意圖
由式(2)可以將 P 個 X1,X2,…Xp轉化為 P 個新變量,Z1,Z2,…Zp若新變量 Z1,Z2,…Zp滿足下列條件:
1)Zi和 Zj相互獨立,i≠j,i,j=1,2,…,p;
2)Var(Z1)≥Var(Z2)≥…≥Var(Zp);
則新變量 Z1,Z2,…Zp為 X1,X2,…Xp的 P 個主成分,且Z1,Z2,…Zp線性無關。
(2)主成分回歸
實際問題中不同的變量經(jīng)常具有不同的量綱,變量的量綱不同會使分析結果不合理,將變量進行標準化處理可避免這種不合理的影響。
對數(shù)據(jù)進行標準化首先要得出樣本標準差和樣本均值,記sj為xj樣本標準差,即是 xj的樣本均值,即原始數(shù)據(jù)的標準化變換為:
標準化后的數(shù)據(jù)矩陣為:
標準化后,X的相關系數(shù)陣也就是X的協(xié)方差陣(半正定矩陣):
其中:
采用Lagrange乘子法求解,可以求得:
其中:λ1≥λ2≥…≥λp≥0 為 R 的特征值,a1,a2,…ap是相對應的單位正交特征向量,ap=(a1pa2p,…app)T。
主成分回歸可以得到p個主成分,這p個主成分之間互相獨立,且方差呈遞減趨勢,所包含的自變量的信息也是遞減的。即主成分對因變量的貢獻率是遞減的,第i個主成分Zi的貢獻率可以用來表示。
在實際問題的分析時,由于主成分的貢獻率是遞減的,后面的主成分貢獻率有時會非常小,所以一般不選取P個主成分,而是根據(jù)累計貢獻率來確定主成分個數(shù),即:前m個主成分的累計貢獻率達到0.85時,選取前m個主成分進行回歸。則原始回歸問題轉化為以下回歸問題:
其中:E(εt)=0,Var(εt)=σ2,Cov(εi,εi)=0,(i≠j)
回歸模型的矩陣形式為:
采用最小二乘法估計參數(shù)矩陣B,根據(jù)式(1)和式(3)可以估計因變量矩陣Y與自變量矩陣之間X的回歸系數(shù)矩陣。
由此可見,主成分回歸模型是對普通的最小二乘估計的改進,首先選取主成分,克服自變量間的多重共線性,然后對所選的主成分進行線性回歸,進而得到主成分回歸方程。
王家壩站系淮河上游總控制站,集水面積30630km2。上游干流河長360km,河道比降0.5‰,年平均降水量800~1200mm,且降水年際變化大,時空分布不均勻。年降水量的60%集中在5~8月,以6、7兩月暴雨次數(shù)較多。產(chǎn)生暴雨的主要天氣系統(tǒng)是西南低渦、切變線、低壓槽和臺風等?;锤缮嫌渭盎茨仙絽^(qū)一般是王家壩洪水的主要來源區(qū)。本項目主要針對息縣、潢川、班臺至王家壩區(qū)間(面積為7110km2)開展研究,見圖 2。
本研究以新安江模型為確定性預報模型,在此基礎上,采用PCA-HUP模型分別對上述模型預報的可靠度進行定量,并在淮河干流主要控制斷面王家壩進行了實際應用,采取滾動預報方式實現(xiàn)了洪水概率預報。
將新安江模型的預報結果與實測資料輸入PCA-HUP模型中,其中20場洪水用于相關參數(shù)的率定,8場洪水用于模型驗證。模型相關參數(shù)見表1。以置信度為90%(亦可采用其他置信度值)的預報區(qū)間為例,對概率預報結果進行評估,同時,對流量分布函數(shù)的中位數(shù)Q50進行分位數(shù)評價,率定期模型的模擬精度見表2。
由表2可知,PCA-HUP模型率定期模擬結果:預報區(qū)間(置信度為90%)覆蓋率較高,且離散度在0.2以內(nèi)。此外,將每一時刻預報量概率分布的中位數(shù)預報與實測流量進行比較,確定性系數(shù)接近于1,洪峰誤差在1%以內(nèi),說明中位數(shù)預報的精度非常高,且從不同預見期的模擬過程線中可以看出,隨著預見期的逐漸增大,區(qū)間離散度呈現(xiàn)出遞增的趨勢。
采用驗證期8場洪水對概率預報模型進行檢驗,推求預報流量的概率分布,實現(xiàn)王家壩斷面的洪水概率預報。預報精度統(tǒng)計見表3,預報流量過程線以其中兩場為例,預報流量過程線如圖3~圖4所示。
由表3和2場洪水概率預報過程線可知,PCA-HUP模型(以新安江模型為確定性預報模型)提供的概率預報結果:預報區(qū)間(置信度為90%)覆蓋率在87%以上,且離散度在0.2以內(nèi),說明在相對較小的區(qū)間寬度內(nèi),預報區(qū)間仍然能夠覆蓋絕大多數(shù)實測數(shù)據(jù),說明概率預報精度較高。此外,將每一時刻預報量概率分布的中位數(shù)預報與實測流量進行比較,確定性系數(shù)接近于1,洪峰誤差在1%以內(nèi),說明中位數(shù)預報的精度非常高,明顯高于新安江模型預報結果,充分體現(xiàn)了貝葉斯修正原理。從不同預見期的預報過程線中可以看出,隨著預見期的逐漸增大,區(qū)間寬度呈現(xiàn)出遞增的趨勢。
表2 PCA-HUP模型率定期模擬精度統(tǒng)計表(王家壩,Δt=2h)
圖2 王家壩斷面控制區(qū)域圖
表1 PCA-HUP模型參數(shù)表(王家壩)
圖3 a 19920505號洪水預報過程線圖(王家壩,Δt=2h)
圖3 b 19920505號洪水預報過程線圖(王家壩,Δt=6h)
圖3 c 19920505號洪水預報過程線圖(王家壩,Δt=12h)
圖4 a 19950707號洪水預報過程線圖(王家壩,Δt=2h)
圖4 b 19950707號洪水預報過程線圖(王家壩,Δt=6h)
圖4 c 19950707號洪水預報過程線圖(王家壩,Δt=12h)
表3 PCA-HUP模型驗證期概率預報精度統(tǒng)計表(王家壩,Δt=2h)
本文在貝葉斯預報系統(tǒng)(BFS)的基礎上,對其水文不確定性處理器(HUP)進行改進,提出改進的貝葉斯概率預報系統(tǒng)(PCA-HUP),PCA-HUP模型是在正態(tài)空間中對預報誤差進行分析,構造線性似然函數(shù),推求預報流量的后驗分布,實現(xiàn)洪水概率預報。以淮河王家壩斷面的洪水預報為示例進行了應用研究,表明該方法不僅可以提供不同置信度的區(qū)間預報結果,還可以獲得精度更高的定值預報結果。
該方法可以與任何確定性的水文預報模型相耦合。作為示例,文中對相對誤差進行了正態(tài)假設,但研究方法不局限于此,同樣適用于誤差服從其他分布的情況。限于研究區(qū)的預報誤差特征,本文僅考慮了誤差均值隨流量量級的變化規(guī)律,相同思路亦適用于誤差方差等分布參數(shù)隨流量變化的情況■