顧學志,葉 磊,趙銅鐵鋼,歐陽文宇,張 弛
(1.大連理工大學 水利工程學院,遼寧 大連 116024;2.中山大學 土木工程學院,廣東 珠海 519082)
降水是水循環(huán)過程的關鍵環(huán)節(jié),是維持地球生命的重要淡水來源,是能量循環(huán)的重要載體,也是大氣、海洋和陸地之間水量能量交換的重要過程,并強烈的影響地球的氣候條件[1-2]。然而,降水(尤其是日尺度降水)的觀測資料往往歷史年份較短,且部分地區(qū)存在降水缺測或無資料等問題,導致無法為水和能量循環(huán)及氣候變化等方面的研究提供完備的數(shù)據(jù)支撐[3]。日降水量的概率分布是降水隨機模擬的重要前提與基礎,通過開展日降水量概率分布的研究確定降水變量的統(tǒng)計特征,再利用基于降水統(tǒng)計特征的天氣發(fā)生器可獲得與實測降水統(tǒng)計參數(shù)相同且長度任意的模擬序列[4]。Pumo 等[5]利用基于伽馬(G2)分布的天氣發(fā)生器結合土地利用模型,生成一系列包含長度足夠的日降水序列的情景方案組合用于驅動水文模型,研究水文循環(huán)對氣候變化和人類活動的響應,解釋氣候和土地利用變化是如何相互作用和影響水文過程的。Zhu 等[6]將6 種概率分布生成的日降水序列輸入到新安江模型當中,用于模擬極端洪水事件,評價各概率分布還原洪水真實風險的能力。除了研究降水量全序列的統(tǒng)計特征外,Papalexiou 等[7]的研究結果表明探究日降水序列的最優(yōu)概率分布及其尾部特征,是研究極端降水事件特征、推求設計暴雨的另一條有效的途徑。Koutsoyiannis[8]指出,常用于研究極端降水的年最大值和超閾值抽樣法會遺漏降水序列中隱含的有價值信息,可能會導致低估暴雨設計值,而日降水序列保留了完整的極端降水信息,可以有效地解決低估暴雨設計值的問題。因此,研究日降水概率分布對降水徑流模擬、水庫調度及水資源規(guī)劃配置、農(nóng)業(yè)規(guī)劃、極端事件、氣候變化等方面的研究均具有重要意義[9-14]。
20 世紀50年代開始就有學者對降水量的概率分布選擇進行研究,早期的研究多推薦使用兩參數(shù)的G2 分布來擬合日降水序列。Buishand[15]對不同國家的6 個雨量站的日降水序列進行模擬,指出日降水量序列的變差系數(shù)與偏態(tài)系數(shù)的經(jīng)驗比值與G2 分布的理論比值十分接近,從而認為日降水量的統(tǒng)計特征可由G2 分布描述。Geng 等[16]的研究表明G2 分布函數(shù)的形狀參數(shù)可以較好地描述日降水量的正偏態(tài)性,并與降水量大小密切相關,得出日降水量服從G2 分布,可由G2 分布模擬的結論。除G2 分布外,兩參數(shù)的威布爾(W2)分布也用常于日降水量的擬合與模擬。Duan 等[17]的研究指出由基于W2 和G2 分布的天氣發(fā)生器產(chǎn)生的合成降水與實測的日降水量最為接近。
G2 分布雖然是迄今最為普遍使用的日降水量分布模型,但隨著降水資料的延長、極端降水事件的頻發(fā),結構簡單的G2 分布已經(jīng)很難描述日降水全序列特征,如右尾處的極值特征。因此,日降水的概率分布選擇從最開始結構簡單的二參數(shù)G2、W2 等分布逐步向參數(shù)更多、更加靈活的偏正態(tài)分布、對數(shù)正態(tài)(LN3)分布、皮爾遜-Ⅲ型(P-Ⅲ)分布、卡帕(KAP)分布等方向轉變[18-19]。Shoji 等[18]的研究指出LN3 分布對日本中部地區(qū)不同時間尺度降水序列的擬合效果均很好,適用性要優(yōu)于W2 分布。Ye 等[19]開展了美國點尺度和流域尺度的日降水頻率分析,結果表明G2 已經(jīng)無法完備描述日降水的統(tǒng)計特征,參數(shù)更多P-Ⅲ和KAP 分布優(yōu)勢明顯。除了單分布概率模型外,混合分布模型也常用于日降水序列的擬合,Li 等[20]采用指數(shù)—廣義帕累托(E-GPA)混合分布對美國德克薩斯州日降水序列進行擬合,探究其模擬降水全序列的能力,雖然混合模型可以針對降水序列不同頻段的特征,采用不同的概率分布來“分而治之”,但其在模型結構上復雜度更高、參數(shù)更多、參數(shù)估計方法更復雜,不易于推廣與應用。
國內對日降水概率分布的研究,目前多集中在特定季節(jié)、特定區(qū)域以及降水極值部分,尚未見到對全國范圍且完整的降水量序列開展概率分布的研究。在選擇分布時,并未有通用、普適性的概率分布模型得到驗證,多憑借經(jīng)驗選擇G2 等分布[21-25]。Li 等[21]采用早期研究中推薦使用的指數(shù)(E)、G2、W2 等結構簡單的分布以及混合概率分布擬合日降水量,僅考查了其模擬中國黃土高原地區(qū)日降水統(tǒng)計學特征的能力。劉學華等[22]和梁莉等[23]采用G2 分布分別擬合全國174 個站點夏季逐日降水序列和淮河流域158 個雨量站的夏日降水量序列,分析了無條件雨日和有條件雨日的降水概率特征。趙琳娜等[24]采用G2 分布模擬分析了中國東南地區(qū)臺風小時降水總量的概率分布特征,得到了降水累積概率分布和極端降水閾值。廖要明等[25]采用基于G2 分布的天氣發(fā)生器對中國各地的逐日降水進行模擬,并分析了G2 分布參數(shù)的空間特征。
為此,本文在全國范圍內進行日降水量概率分布的適用性研究,以雨日(>0.1mm)降水量為研究對象,考查不同概率分布描述降水全序列統(tǒng)計特征的能力,并結合不同實際應用需求,給出可全面描述并重現(xiàn)日降水序列統(tǒng)計特征,且結構簡單、參數(shù)少的全國日降水概率分布的空間分布圖,以期為降水頻率分析、隨機模擬、氣候變化等方面的研究工作提供借鑒。
本文研究采用中國氣象數(shù)據(jù)網(wǎng)(http://data.cma.cn/)提供的全國氣象站的日降水數(shù)據(jù),選取日降水數(shù)據(jù)序列的時間長度不小于30年,且缺測率不大于1%的站點數(shù)據(jù)用于研究,最終選定820 個氣象站點,其中數(shù)據(jù)長度范圍為31 ~ 59年,大于55年的站點占比為95%。
針對雨日降水量序列,首先通過線性矩比值圖選定潛在分布;接著采用線性矩法估計各潛在分布的參數(shù)并進行擬合優(yōu)度評價,初步確定各氣象站日降水量的最優(yōu)概率分布;然后基于初步評價結果,對比參數(shù)個數(shù)不同分布的擬合效果,進一步制定不同的最優(yōu)概率選擇策略;再對參數(shù)個數(shù)不同但擬合效果相近的分布,開展基于天氣發(fā)生器的蒙特卡洛模擬,考查評價各分布重現(xiàn)降水量不同分位值以及年際變異的能力;最后根據(jù)隨機模擬值和實測值之間的偏差,選定不同模擬情形下的最優(yōu)概率分布,并給出全國最優(yōu)概率分布函數(shù)的空間分布。本文的研究方法和內容的技術路線流程圖如圖1 所示。
圖1 研究方法及內容技術路線流程圖
2.1 線性矩法及其比值圖線性矩法是由Hosking 于1990年提出[26],定義為次序統(tǒng)計量線性組合的期望值,可以用概率權重矩的線性組合來表示,線性矩的計算公式:
式中:r 為線性矩λ 的階數(shù);k 為正整數(shù); αk和 βk為變量總體的概率權重矩,可由次序樣本Xi:X1≤X2≤…≤XN估算:
式中τ、τ3和τ4分別是統(tǒng)計量離散度(尺度)、偏度(形狀)和峰度的度量。相比于傳統(tǒng)的乘積矩,線性矩比值的重要特點是其變化范圍存在界限。
線性矩及其比值λ1,λ2,τ,τ3,τ4主要用于參數(shù)估計,線性矩參數(shù)估計法相比于乘積矩法具有受樣本長度影響小、對極值敏感度低的特點,因而比乘積矩法更穩(wěn)健,也比極大似然法和概率權重矩法更簡便[27-28]。線性矩的另一個關鍵應用是其比值圖可用來縮小潛在概率分布的選擇范圍,以確定合適的概率分布[19]。將樣本的τ3和τ4與候選潛在分布的理論關系繪制在同一張圖上進行比較,樣本的線性矩比值與概率分布的理論圖形的接近程度可作為潛在概率分布的選擇標準。其中,概率分布的各線性矩比值間的理論關系可通過多項式逼近方法確定[29],樣本序列的線性矩比值可由式(1)(6)(7)計算得到。不同概率分布的τ3和τ4理論關系在線性矩比值圖中表達形式不同:兩參數(shù)的分布為點,三參數(shù)的分布為曲線,四參數(shù)的分布為面域。
2.2 降水量概率分布函數(shù)日降水量序列具有右偏和重尾的特征[20],針對此特征,目前常用于降水頻率分析的概率分布[30]如表1 所示。
表1 常用于降水頻率分析的概率分布函數(shù)
2.3 擬合優(yōu)度評價本文采用均方根誤差(RMSE)為指標對概率分布的理論頻率曲線和經(jīng)驗頻率點據(jù)間的擬合優(yōu)度進行評價,該指標是理論值(模擬值)與實測值偏差程度的一種度量,其值越小表示擬合效果越好,是在各個研究領域中評價概率分布擬合效果或模型性能最常用的指標之一,計算公式如(8)所示。
式中: yi為按升序排列第j 個雨日降水量觀測值;為按升序排列與第j 個雨日同頻率下的降水量理論值; n 為雨日序列長度。
2.4 降水蒙特卡洛隨機模擬RMSE 值衡量的是日降水數(shù)據(jù)全序列的綜合擬合優(yōu)度,但無法體現(xiàn)不同頻段內的具體擬合效果。對于洪水研究更為關注的是日降雨序列中的大暴雨,而對于干旱研究更關注的往往是小雨,為給不同目的的應用提供依據(jù),針對擬合優(yōu)度相近的不同分布,開展蒙特卡洛隨機模擬評價不同概率分布函數(shù)對日降雨序列不同分位點的擬合能力,基于此進行概率分布的優(yōu)選更有針對性。蒙特卡洛模擬可用于分析抽樣誤差對分布擬合的影響,并通過適當?shù)卦黾有蛄虚L度來減少抽樣誤差帶來的影響[32],也是評價概率分布或參數(shù)估計方法適用性和穩(wěn)健性[33]及不確定性[34]的重要手段,如果某概率分布的模擬結果更接近實測值或實測數(shù)據(jù)的統(tǒng)計特征,認為降水序列服從該概率分布[35-36]。模擬內容包括兩部分,其一是采用降水發(fā)生模型來模擬降水的發(fā)生情況,其二是利用概率分布模型來生成符合實測數(shù)據(jù)統(tǒng)計特征的降水量序列[37],即本文的核心研究內容。
2.4.1 降水發(fā)生模型 降水的發(fā)生常用鏈相關的馬爾可夫過程來模擬,馬爾可夫過程的復雜程度由其狀態(tài)數(shù)和階數(shù)決定,狀態(tài)數(shù)和階數(shù)越多,模型就越復雜。研究表明一階的馬爾可夫鏈能夠同高階模型一樣,可很好地描述降水發(fā)生等統(tǒng)計特征,已廣泛應用于降水發(fā)生模擬[38-39]。本文選用一階—兩態(tài)的馬爾可夫鏈來模擬重現(xiàn)降水發(fā)生。在一階馬爾可夫鏈中,第t+1日降水狀態(tài)的概率僅取決于前一日t 的降水狀態(tài),降水的發(fā)生概率有兩種情況:
式中:p01為非雨日之后發(fā)生降水的條件概率,p11為雨日之后發(fā)生降水的條件概率,可用條件概率公式進行計算;Xt為第t日的降水狀態(tài),1 和0 分別代表發(fā)生降水和不發(fā)生降水。
2.4.2 隨機模擬過程 采用一階—兩態(tài)的馬爾可夫模型隨機生成降水發(fā)生過程,通過線性矩法估計實測降水序列對于不同概率分布的參數(shù),用于確定概率分布的分位函數(shù);采用均勻分布函數(shù)在[0,1]區(qū)間產(chǎn)生相應站點雨日長度的隨機數(shù),作為降水量的頻率值;通過概率分布的分位函數(shù)計算相應頻率下的分位數(shù),獲取隨機模擬的降水序列,重復以上步驟1000 次(具體過程詳見參考文獻[38])。以模擬值50%、75%、99%、99.9%的分位點和年降水總量標準差(STD)分別代表日降水量序列的低值、中值、高值、極值以及年際波動情況,最后按照公式(11)計算模擬值和實測值的偏差來評價概率分布模型的性能。
式中: PObs為雨日序列各分位處及年降水量標準差的實測值; PSim為雨日序列各分位點及年降水量標準差的模擬值。
3.1 潛在概率分布理論分布和各氣象站日降水量序列的L-偏度~L-峰度(τ3~τ4),如圖2 所示。大部分氣象站的經(jīng)驗關系點據(jù)落在P-Ⅲ曲線之上及周圍,表明P-Ⅲ分布能夠較好的描述這些站點的日降水統(tǒng)計特征。部分站點落在P-Ⅲ和GPA、LN3 分布之間。KAP 分布的理論區(qū)域是面域,以GLO 分布為上界,下界為分布函數(shù)的理論下限,所有站點的日降水序列數(shù)據(jù)的τ3~τ4的經(jīng)驗關系點據(jù)均在KAP 理論區(qū)域之內。結合國內外文獻[15-25],最終選定G2、P-Ⅲ、GEV、GLO、GPA、LN3 和KAP 分布,為描述日降水量序列統(tǒng)計特征的潛在概率分布。
圖2 線性矩比值
3.2 RMSE 評價結果用7 種潛在概率分布與日降水量序列進行擬合,以RMSE 為擬合優(yōu)度的評價指標,各分布的RMSE 如圖3 所示。KAP、P-Ⅲ和G2 相比于其它分布優(yōu)勢明顯,這三種分布的RMSE和分位數(shù)如圖4 所示。繪制KAP 和P-Ⅲ分布、P-Ⅲ和G2 分布的RMSE 散點圖,重點考查這三種分布的擬合優(yōu)度,部分氣象站KAP 和P-Ⅲ的RMSE 值散點位于的1∶1 線附近,表明這兩種分布描述這些站點日降水序列統(tǒng)計特征的能力很接近,如圖5 所示。圖6 表明對于幾乎所有的氣象站,P-Ⅲ的擬合效果要優(yōu)于G2??傮w上KAP 和P-Ⅲ分布要明顯優(yōu)于其它分布,而被普遍接受的G2 分布的擬合效果并不突出。
圖3 7 種潛在概率分布的RMSE 值箱線圖
圖4 G2、P-Ⅲ和KAP 分布的RMSE 值箱線圖
圖5 P-Ⅲ和KAP 分布的RMSE 值散點圖
圖6 G2 和P-Ⅲ分布的RMSE 值散點圖
基于RMSE 為評價指標,按照越小越優(yōu)的原則,初步確定各氣象站的最優(yōu)概率分布,最優(yōu)概率分布的空間分布如圖7 所示。KAP 和P-Ⅲ分布有絕對的優(yōu)勢,其中以KAP 分布為最優(yōu)分布的站點有605個(73.78%),P-Ⅲ分布191 個(23.29%),G2 分布14 個(1.7%),其余分布10 個。從擬合優(yōu)度的評價結果來看,此前常用的G2 分布在中國的適用性很低,理論上是因G2 分布參數(shù)少,靈活性低于參數(shù)更多的P-Ⅲ和KAP 分布,很難較好地擬合日降水序列,尤其是當前觀測資料不斷延長與極端事件頻發(fā)導致日降水序列呈現(xiàn)出更加復雜的統(tǒng)計特征。
圖7 最優(yōu)概率分布空間分布圖(通過RMSE 值確定)
RMSE 值衡量的是理論頻率曲線和經(jīng)驗頻率點據(jù)之間的總體擬合效果,反映的是日降水數(shù)據(jù)全序列的綜合擬合優(yōu)度。對于總體擬合優(yōu)度很接近的站點,如圖5 中位于1∶1 線附近的氣象站,不權衡概率分布參數(shù)的多少和降水量各分位的擬合效果,僅通過RMSE 值的大小來選擇最優(yōu)分布是不夠充分的,需要深入考察KAP 和P-Ⅲ兩種分布的擬合效果,直觀展示不同的RMSE 值及其差值在擬合效果中呈現(xiàn)的差別,最終確定各氣象站日降水序列的最優(yōu)概率分布。
3.3 最優(yōu)概率分布選擇策略概率分布函數(shù)的結構越復雜、參數(shù)越多,就需要更多的數(shù)據(jù)才能準確估計分布參數(shù)。某些站點KAP 分布的RMSE 值雖然略高于P-Ⅲ分布,但兩種分布因參數(shù)數(shù)量不同,KAP 分布不一定就是該站點最優(yōu)的選擇。因此需要綜合考慮分布函數(shù)參數(shù)個數(shù)和擬合效果,對RMSE值KAP 大于P-Ⅲ的605 個氣象站進行分類,確定兩種分布RMSE 差值的2 個閾值,劃分3 個區(qū)間,針對各區(qū)間制定不同的最優(yōu)概率選擇策略,對于難以直接判定最優(yōu)分布的區(qū)間,開展蒙特卡洛隨機模擬,最后結合實際需求確定最優(yōu)概率分布。KAP 和P-Ⅲ分布的擬合效果分為3 種情形:
(1)對于KAP 和P-Ⅲ分布RMSE 值非常接近的站點,擬合效果的差別非常小,比較分析經(jīng)驗頻率點據(jù)和理論頻率曲線的擬合情況,選定0.035 為兩種分布RMSE 差值的“閾值1”。56444 號氣象站兩種分布的RMSE 差值為0.034,圖8(a)為KAP 和P-Ⅲ分布擬合該站日降水全序列的效果圖,圖8(b)—(d)為擬合效果的局部放大圖。圖8(b)(c)中兩種概率分布的累積頻率曲線幾乎完全重合,僅圖8(d)中有細微差別。按照其他研究中直接根據(jù)擬合優(yōu)度指標的大小來選取最優(yōu)分布的原則,通常會選擇KAP 作為最優(yōu)分布。如果權衡參數(shù)數(shù)量和擬合效果,選擇KAP 作為最優(yōu)分布并不合適。因此當KAP 和P-Ⅲ的RMSE 差值小于“閾值1”時直接選取參數(shù)更少、對數(shù)據(jù)長度要求更低的P-Ⅲ分布作為最優(yōu)分布,有24 個氣象站屬于此類情形。
圖8 KAP 和P-Ⅲ分布擬合56444 號氣象站日降水序列效果
(2)對于KAP 和P-Ⅲ分布RMSE 的差值大于0.64 的站點,KAP 在日降水全序列范圍內的擬合效果幾乎均明顯優(yōu)于P-Ⅲ,參數(shù)少的P-Ⅲ分布不足以描述此類氣象站日降水序列的統(tǒng)計特征。如圖9 所示,53663 號氣象站兩種分布RMSE 的差值為0.651,除了個別分位處P-Ⅲ的擬合效果好些,KAP 分布擬合降水量的其它分位時明顯占優(yōu)。選定0.64 為“閾值2”,當兩種概率分布RMSE 的差值大于“閾值2”時直接選擇KAP 作為最優(yōu)分布,有240 個氣象站屬于此類情形。
圖9 KAP 和P-Ⅲ分布擬合53663 號氣象站日降水序列效果
(3)當KAP 和P-Ⅲ分布RMSE 的差值在兩個閾值區(qū)間0.035 ~ 0.64 時,擬合效果可分兩類:其一,KAP 和P-Ⅲ分布在不同降水量分位點處各有優(yōu)勢;其二,經(jīng)驗頻率點據(jù)介于兩分布的理論頻率曲線之間。54808 號氣象站兩種分布的RMSE 差值為0.037,如圖10 所示,KAP 擬合降水量中低值表現(xiàn)更佳,P-Ⅲ擬合降水量中高值更優(yōu),而在極端降水處,兩種分布的擬合效果相近。54213 號氣象站兩種分布RMSE 的差值為0.63,擬合情況如圖11 所示,與54808 號氣象站相比,P-Ⅲ分布的優(yōu)勢分位區(qū)間逐漸變小。有341 個氣象站屬于此種情形,對于此類氣象站,開展基于天氣發(fā)生器的蒙特卡洛隨機模擬,確定不同降水量分位點的最優(yōu)概率分布,四個代表站KAP 和P-Ⅲ分布的RMSE 值及其差值如表2 所示,開展蒙特卡洛模擬的氣象站的空間分布如圖12 所示。
圖12 開展蒙特卡洛隨機模擬的氣象站空間分布
表2 四個代表站KAP 和P-Ⅲ分布的RMSE 值及其差值(分位值為對應圖4 中箱線圖的分位)
圖10 KAP 和P-Ⅲ分布擬合54808 號氣象站日降水序列效果
圖11 KAP 和P-Ⅲ分布擬合54213 號氣象站日降水序列效果
3.4 蒙特卡洛模擬開展蒙特卡洛模擬,分析KAP 和P-Ⅲ分布模擬341 個氣象站日降水量序列的低值、中值、高值、極值以及年際變化能力(KAP 和P-Ⅲ分布模擬各氣象站年平均降水量的結果非常接近,與實測值的偏差微小,為此本文著重對兩概率分布模擬降水量的年際變化波動能力進行評價),以1000 次模擬結果的均值為最終結果,如圖13 所示:
圖13 KAP和P-Ⅲ分布在日降水序列不同分位點處及年降水量標準差的實測值和模擬值散點
(1)KAP 分布在50%分位處的模擬結果普遍好于P-Ⅲ分布,由于KAP 分布的參數(shù)更多,靈活性更好,可以更好地描述降水序列的低值部分的統(tǒng)計特征。
(2)KAP 和P-Ⅲ分布在75%分位處的模擬結果很接近,均可以很好地描述降水序列的中等值處的統(tǒng)計特征。相較于其它分位,兩種概率分布模擬還原降水中等值部分的能力最強。
(3)KAP 分布在99%分位處的模擬效果總體上略好于P-Ⅲ分布,對于此分位處降水量較小的站點,KAP 和P-Ⅲ分布的模擬結果相當,均可以很好地描述降水序列的高值部分。P-Ⅲ分布由于在右尾處收斂的速度相對快些,隨著降水量的增大,更傾向于低估降水數(shù)值,對于此分位處降水量較大的站點,KAP 的模擬效果要好于P-Ⅲ分布。
(4)KAP 和P-Ⅲ分布在99.9%分位處的模擬結果特征相反,KAP 更易高估極端降水,而P-Ⅲ傾向于低估極端降水,表明KAP 分布的重尾特性,與圖10(d)、11(d)中經(jīng)驗頻率點據(jù)介于兩概率分布理論頻率曲線之間的擬合效果相符。
(5)其相比于模擬不同分位處的降水量,KAP 和P-Ⅲ分布在模擬還原年降水總量的年際波動時,傾向于低估其標準差,尤其是當年降水量較大時,這種低估更加明顯,這種現(xiàn)象可能與選擇一階的馬爾可夫鏈來模擬降水的發(fā)生有關。總體上KAP 的模擬降水量年際波動的能力略強于P-Ⅲ分布。
3.5 最優(yōu)概率分布的確定以1000 次蒙特卡洛隨機模擬結果的均值與觀測值的偏差為評價指標,比較降水量概率分布模擬日降水序列低值、中值、高值以及降水量年際變異的能力,并以此為依據(jù)選擇最優(yōu)概率分布。在開展模擬的341 個氣象站中,以各分位及年降水總量標準差的偏差值為依據(jù)選擇的最優(yōu)概率分布的站點數(shù)量如表3 所示。隨著分位的增加,以P-Ⅲ為最優(yōu)概率分布的站點數(shù)量上升,表明P-Ⅲ分布模擬降水序列中、高值部分的能力要優(yōu)于擬模擬低值部分的能力。
表3 KAP 和P-Ⅲ作為隨機模擬日降水序列不同分位和標準差的最優(yōu)概率分布數(shù)量
根據(jù)RMSE 值和蒙特卡洛隨機模擬的結果,最終確定全國范圍內各氣象站點的最優(yōu)的概率分布,最優(yōu)概率分布的區(qū)域特征按照氣候、地理和流域分區(qū)進行分析總結,如圖14-16 所示。
圖14 最優(yōu)概率分布空間分布圖(氣候分區(qū))
(1)氣候分區(qū)。在季風氣候區(qū)內,KAP 和P-Ⅲ分布有明顯的區(qū)域特征,而在其它氣候區(qū)內兩種概率分布交錯分布。KAP 分布的優(yōu)勢區(qū)域主要集中在亞熱帶季風氣候區(qū)中東部、溫帶季風氣候區(qū)北部,P-Ⅲ分布的優(yōu)勢區(qū)域集中在亞熱帶季風氣候區(qū)西部和溫帶季風氣候區(qū)南部,在亞熱帶季風氣候東部沿海有小范圍聚集現(xiàn)象。對于降水的高值分位點,P-Ⅲ分布的優(yōu)勢區(qū)域在高原高山氣候區(qū)、溫帶大陸性氣候區(qū)、溫帶季風氣候區(qū)和亞熱帶季風氣候區(qū)四種氣候分區(qū)的交界處更加集中,同時P-Ⅲ分布可以更好地模擬高原高山氣候區(qū)內降水量的年際波動。受多種類型氣候的綜合影響,日降水量更傾向于服從P-Ⅲ分布,而受季風影響顯著的區(qū)域,KAP 分布更為適用。
圖15 最優(yōu)概率分布空間分布(地理分區(qū))
圖16 最優(yōu)概率分布空間分布(流域分區(qū))
(2)地理分區(qū)。KAP 分布作為最優(yōu)概率的空間分布范圍廣泛,在東部地區(qū)較西部更為適用,尤其在東北、華中和華東中部地區(qū),KAP 更是占據(jù)主導地位,僅少量P-Ⅲ分布零星散布其間,KAP 分布在這些區(qū)域模擬各個分位點的降水量有顯著優(yōu)勢,同時KAP 分布能夠更好地描述華中、華東和華南大部連片區(qū)域的降水量年際波動;P-Ⅲ分布有4 個集中的優(yōu)勢區(qū)域:華南西部-西南東部-西北東部沿線一帶、西北地區(qū)中部、新疆中部、華北中部-華東北部一帶。P-Ⅲ在華東地區(qū)作為降水中等值分位點處的最優(yōu)分布數(shù)量明顯增多,并可以更好地模擬青藏高原降水量年際波動。對于高值-極值分位點的降水,P-Ⅲ分布的優(yōu)勢區(qū)域在華南西部-西南東部-西北東部沿線一帶更加集中。隨著分位數(shù)的增大,P-Ⅲ分布作為最優(yōu)分布的站點數(shù)量有上升的趨勢,分布范圍擴大。
(3)流域分區(qū)。相比于地理和氣候分區(qū),各流域分區(qū)內的最優(yōu)概率分布呈現(xiàn)出更加明顯的區(qū)域特征。在黃河流域,P-Ⅲ分布作為降水高值分位點的最優(yōu)概率分布的區(qū)域更集中,主要集中在黃河上游及渭河流域內。對于其它分位點,KAP 分布是黃河流域的優(yōu)勢分布。長江流域中下游地區(qū)是KAP分布的集中優(yōu)勢區(qū)域,占據(jù)絕對的優(yōu)勢,而P-Ⅲ分布在長江上游地區(qū)東部分布較集中,總體上,長江流域的最優(yōu)概率分布空間特征由上游至下游呈現(xiàn)出KAP~P-Ⅲ~KAP 的變化規(guī)律?;春恿饔虻膬?yōu)勢分布為KAP,P-Ⅲ僅分布在流域北部一帶。珠江流域西江上游為P-Ⅲ分布的優(yōu)勢區(qū)域,而西江中下游和東江流域為KAP 分布的集中分布區(qū)域。在黑龍江流域內,KAP 分布可以更好地描述降水低值-中值和極值分位點處的統(tǒng)計特征,P-Ⅲ分布零星散布在流域西部一帶。在內陸河流域,隨著降水分位的變大,P-Ⅲ分布的范圍擴展明顯。此外P-Ⅲ分布可以更好地模擬西南諸河流域內降水量的年際波動。
在選擇概率分布開展研究和應用時,可根據(jù)實際需求情形,結合最優(yōu)概率分布的空間分布進行選擇。當對氣象災害、洪澇、水土流失等方面開展研究時,關注的一般是降水序列高分位,即降水高值和極值部分,因此可以按照99%和99.9%分位點的最優(yōu)概率分布進行選擇,以更加準確地模擬還原該頻段內的降水量;對干旱方面的研究時,關注的是降水低值部分,除了研究降水發(fā)生模型外,在選擇模擬量的概率分布模型時,可按照50%分位處的最優(yōu)概率分布進行選擇;在進行中長期徑流模擬、水資源規(guī)劃配置時,關注的是可以形成有效徑流的降水量及其年際波動情況,選擇概率分布時,可以降水中、高值分位數(shù)和反映年降水量真實波動的最優(yōu)概率分布空間分布圖為依據(jù)進行選擇。
本文以覆蓋全國的820 個氣象站的雨日降水數(shù)據(jù)為研究對象,借助線性矩比值圖、擬合優(yōu)度評價、天氣發(fā)生器以及蒙特卡洛模擬等方法,力求在全國范圍內尋求具有普適性的最優(yōu)概率分布,并為概率分布的選擇和評價提供了一套通用的流程,以期為降水模擬、降水頻率分析、氣候變化研究提供基礎支撐。本文的結論如下:
(1)線性矩比值圖和均方根誤差的計算結果表明,在全國范圍內KAP 分布的適用范圍最廣,P-Ⅲ分布次之,G2 分布在中國并不適宜廣泛應用。
(2)通過基于天氣發(fā)生器的蒙特卡洛隨機模擬,深入考察擬合優(yōu)度很相近的KAP 和P-Ⅲ分布模擬不同降水分位點(頻段)及降水量年際變化的能力,以此為依據(jù)進一步確定最優(yōu)概率分布。結果表明在氣候、地理和流域三類分區(qū)內,P-Ⅲ分布作為最優(yōu)分布存在3 ~ 4 個較明顯的集中分布區(qū)域,在這些區(qū)域P-Ⅲ分布足以描述日降水序列的統(tǒng)計特征,并不需要使用更復雜的KAP 分布。
(3)在選擇概率分布模型進行降水模擬、頻率分析、氣候變化等研究時,可以本文的研究結果為依據(jù),結合研究目的和工程應用來確定研究區(qū)的最優(yōu)概率分布,以最大程度減少因選擇概率模型不當而造成的偏差。