文章編號(hào):1671-3559(2024)04-0391-08DOI:10.13349/j.cnki.jdxbn.20240403.001
摘要: 針對(duì)無(wú)資料區(qū)域山洪災(zāi)害臨界雨量計(jì)算的難題,以山東省五蓮縣45個(gè)山丘區(qū)小流域沿河村落為研究對(duì)象,開(kāi)展基于機(jī)器學(xué)習(xí)的山洪災(zāi)害臨界雨量計(jì)算模型研究;基于水文水力學(xué)法結(jié)合現(xiàn)場(chǎng)調(diào)研確定各村落成災(zāi)水位及臨界流量,通過(guò)水文模型計(jì)算產(chǎn)匯流得到洪水過(guò)程,采用試算法計(jì)算臨界雨量;選取水文、 下墊面、 沿河村落等相關(guān)特征參數(shù)及臨界雨量計(jì)算結(jié)果作為訓(xùn)練參數(shù),構(gòu)建基于極端梯度提升算法的不同預(yù)警時(shí)段臨界雨量預(yù)估模型,并采用平均絕對(duì)誤差和決定系數(shù)進(jìn)行模型精度評(píng)估。結(jié)果表明:該模型計(jì)算的各預(yù)警時(shí)段臨界雨量的平均絕對(duì)誤差分別為4.56、 6.68、 7.11,決定系數(shù)分別為0.955、 0.967、 0.973,預(yù)測(cè)精度較高,能夠滿足無(wú)資料地區(qū)山洪預(yù)警工作的應(yīng)用需求。
關(guān)鍵詞: 山洪災(zāi)害; 臨界雨量; 極端梯度提升算法; 預(yù)警指標(biāo); 五蓮縣
中圖分類號(hào): P338
文獻(xiàn)標(biāo)志碼: A
開(kāi)放科學(xué)識(shí)別碼(OSID碼):
Calculation Model of Critical Rainfall of Mountain Flood
Disaster Based on Extreme Gradient Boosting Algorithm
LI Fuchen1, SANG Guoqing1, SUN Yuansen2
(1. School of Water Conservancy and Environment, University of Jinan, Jinan 250022, Shandong, China;
2. Donggang District River Lake Management and Protection Center of Rizhao City, Rizhao 276800, Shandong, China)
Abstract: Addressing the challenge of calculating critical rainfall for flash floods in areas without data, a study was conducted on 45 small watersheds in mountainous and hilly regions along rivers in Wulian County, Shandong Province, to develop a machine learning-based model for calculating critical rainfall for flash floods. The disaster-causing water levels and critical discharges for each village were determined through a combination of hydrological and hydraulic methods along with on-site investigations. Flood processes were then derived through runoff production and concentration calculations using a hydrological model.Thecriticalrainfallwascalculatedusinga trial anderrormethod.Relevantcharacteristicpara-meters such as hydrological data, underlying surface conditions, and villages along the rivers, along with the calculated critical rainfall results, were selected as training parameters. Based on the extreme gradient boosting algorithm, different prediction models for critical rainfall during different warning periods were constructed. The accuracy of these models was evaluated using the mean absolute error and determination coefficient. The results show that the average absolute errors of the critical rainfall calculated by this model for each warning period are 4.56, 6.68, and 7.11, respectively, while the determination coefficients are 0.955, 0.967, and 0.973, respectively. The model exhibits high prediction accuracy, meeting the application requirements for flash flood warning in areas without data.
Keywords: mountain flood disaster; critical rainfall; extreme gradient boosting algrithm; warning index; Wulian County
收稿日期: 2023-05-23""""""""" 網(wǎng)絡(luò)首發(fā)時(shí)間:2024-04-07T12:07:22
基金項(xiàng)目: 山東省自然科學(xué)基金項(xiàng)目(ZR2020ME249)
第一作者簡(jiǎn)介: 李福晨(1999—),男,山東滕州人。碩士研究生,研究方向?yàn)樗募八Y源。E-mail: lfc4560@163.com。
通信作者簡(jiǎn)介: 桑國(guó)慶(1981—),男,山東濟(jì)寧人。教授,博士生導(dǎo)師,研究方向?yàn)樗呐c水資源。E-mail: sangguoqing@163.com。
網(wǎng)絡(luò)首發(fā)地址: https://link.cnki.net/urlid/37.1378.N.20240403.1452.002
山洪災(zāi)害是指在山丘地區(qū)因降雨達(dá)到一定量而引發(fā)的洪水泛濫、 山體滑坡、 泥石流等的自然災(zāi)害,具有突發(fā)性強(qiáng)、 沖刷破壞力大、 危害范圍廣、 預(yù)報(bào)預(yù)警困難等特點(diǎn)。降雨是引發(fā)山洪災(zāi)害的關(guān)鍵因素[1],當(dāng)降雨量超過(guò)某地區(qū)臨界點(diǎn)時(shí),就會(huì)導(dǎo)致山洪災(zāi)害的發(fā)生,這個(gè)臨界點(diǎn)即臨界雨量,獲得準(zhǔn)確的臨界雨量值可以提高山洪災(zāi)害預(yù)警的成功率,減少受災(zāi)損失。臨界雨量計(jì)算方法一般分為兩類:一是水文水力學(xué)法。該方法考慮物理機(jī)制以及各種水文要素之間的相互聯(lián)系,對(duì)水文資料要求較高,存在一定局限性。二是統(tǒng)計(jì)歸納法。該方法基于數(shù)據(jù)驅(qū)動(dòng)機(jī)制,不需要具體的推導(dǎo)過(guò)程,也沒(méi)有明顯的物理機(jī)制,可以直接探索數(shù)據(jù)間的內(nèi)在規(guī)律。
很多學(xué)者在利用水文水力學(xué)方法研究臨界雨量方面取得一系列成果。李磊等[2]采用水位反推法計(jì)算無(wú)資料區(qū)的臨界雨量,與歷史洪水調(diào)查成果以及相似地區(qū)的成果相比,結(jié)果較為精確可靠。龔云柱等[3]綜合區(qū)域臨界雨量法、降雨災(zāi)害同頻率法、 重標(biāo)極差分析法3種計(jì)算方法,建立了多角度融合的雨量預(yù)警指標(biāo)閾值求解模型,確定研究區(qū)最大日降水量時(shí)間序列的閾值并對(duì)變化趨勢(shì)進(jìn)行詳細(xì)分析,預(yù)警驗(yàn)證表明,該模型具有一定的實(shí)效性,預(yù)警效果也比單一模型好。韓俊太等[4]考慮前期土壤含水量構(gòu)建成災(zāi)流量與致災(zāi)因子之間的統(tǒng)計(jì)關(guān)系,提出山洪災(zāi)害分級(jí)預(yù)警方法,獲取無(wú)資料地區(qū)成災(zāi)流量的空間分布,并據(jù)此得出研究區(qū)的臨界雨量,有效地提升了山洪預(yù)警的準(zhǔn)確性。沈煒彬等[5]以總雨量和峰值雨強(qiáng)2個(gè)雨型特征指標(biāo)為影響參數(shù),提出概率雨型設(shè)計(jì)方法,該方法簡(jiǎn)便合理,適用性強(qiáng)。
基于數(shù)據(jù)驅(qū)動(dòng)的臨界雨量研究也取得了一定進(jìn)展。王維林等[6]提出了基于模式識(shí)別算法Fisher的判定模型,識(shí)別特征時(shí)段雨量和前期有效降雨的判定關(guān)系,擬合出臨界雨量值,結(jié)果表明此方法推廣性好,準(zhǔn)確率高。劉元鋒等[7]選取具有代表性的雨量站數(shù)據(jù)和場(chǎng)次洪水峰值數(shù)據(jù),分析確定不同計(jì)算時(shí)段的臨界雨量閾值,同時(shí)構(gòu)建不同空間尺度下的區(qū)域防洪區(qū),得出各區(qū)分時(shí)段的雨量預(yù)警指標(biāo)。盧燕宇等[8]將統(tǒng)計(jì)方法與水文模型相結(jié)合,探究了中小河流致洪臨界雨量的分析方法,此方法具有良好的適用性。
綜上,基于水文水力學(xué)法的臨界雨量確定方法遵從水文學(xué)原理,計(jì)算方法科學(xué)嚴(yán)謹(jǐn),但是對(duì)資料的要求較為嚴(yán)格,難以應(yīng)用在資料匱乏的山丘區(qū)小流域?;跀?shù)據(jù)驅(qū)動(dòng)的統(tǒng)計(jì)歸納法核心在于數(shù)學(xué)層面的歸納總結(jié),方法簡(jiǎn)單,應(yīng)用方便,對(duì)數(shù)據(jù)的需求相對(duì)較少,在我國(guó)應(yīng)用廣泛,但是該方法所關(guān)注的參數(shù)太少,對(duì)臨界雨量數(shù)據(jù)的挖掘并不深入。如樊建勇等[9]選取流域面積、 河道長(zhǎng)度及糙率等參數(shù)構(gòu)建臨界雨量統(tǒng)計(jì)模型,計(jì)算研究區(qū)的臨界雨量,但該統(tǒng)計(jì)模型沒(méi)有深入考慮水文方面的參數(shù)。王燕云等[10]基于支持向量機(jī)回歸擬合(SVR)算法,運(yùn)用比擬法建立模型來(lái)進(jìn)行臨界雨量的確定,但沒(méi)有考慮到沿河村落居民戶的分布情況,且流域下墊面參數(shù)選擇較少。
隨著山洪災(zāi)害防治工作的精準(zhǔn)化,臨界雨量的研究對(duì)象逐漸由流域拓展到沿河村落。對(duì)沿河村落以上小流域采用水文模型進(jìn)行洪水預(yù)報(bào)需要較多水位和下墊面資料,工作量較大,獲取數(shù)據(jù)困難。機(jī)器學(xué)習(xí)算法為高維及多維數(shù)據(jù)的挖掘和處理帶來(lái)了諸多便利,在以數(shù)據(jù)為基礎(chǔ)的研究領(lǐng)域的優(yōu)勢(shì)逐漸顯露出來(lái),解決了諸多算法在臨界雨量計(jì)算過(guò)程中對(duì)資料依賴性大的問(wèn)題。
本文中以山東省五蓮縣45個(gè)山丘區(qū)小流域沿河村落為研究對(duì)象,首先結(jié)合現(xiàn)場(chǎng)調(diào)研,確定各個(gè)村落成災(zāi)水位及臨界流量,構(gòu)建流域水文模型,采用試算法計(jì)算臨界雨量。在考慮前期影響雨量的情況下,選取水文、 下墊面和沿河村落等相關(guān)特征參數(shù),構(gòu)建基于極端梯度提升(XGBoost)算法的臨界雨量預(yù)估模型,并對(duì)模型精度進(jìn)行評(píng)估,為無(wú)資料小流域臨界雨量指標(biāo)的確定提供新的思路。
濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版)第38卷
1" 研究方法
本文中分別采用水文水力學(xué)方法與機(jī)器學(xué)習(xí)算法相結(jié)合的方式進(jìn)行無(wú)資料山丘區(qū)小流域臨界雨量預(yù)測(cè)。 首先結(jié)合現(xiàn)場(chǎng)調(diào)研情況, 確定沿河村落各個(gè)斷面的成災(zāi)水位和沿河村落的臨界流量; 然后通過(guò)試算法反算臨界雨量。 基于搜集到的沿河村落小流域信息(水文、 下墊面等)及水文水力學(xué)方法臨界雨量計(jì)算結(jié)果作為輸入, 進(jìn)行XGBoost算法臨界雨量預(yù)估模型構(gòu)建, 并以平均絕對(duì)誤差(MAE)和決定系數(shù)r2為指標(biāo)進(jìn)行模型精度評(píng)估。 整體流程如圖1所示。
1.1" 水文水力學(xué)方法
臨界雨量的水文水力學(xué)計(jì)算方法有水位流量反推法、 降雨徑流關(guān)系曲線插值法、 暴雨臨界曲線法等。結(jié)合現(xiàn)場(chǎng)調(diào)研,本文中基于一維水動(dòng)力模型確定成災(zāi)水位,計(jì)算設(shè)計(jì)暴雨和產(chǎn)匯流,然后通過(guò)試算法反推降雨量,即為臨界雨量值。
數(shù)據(jù)中心2015年中國(guó)縣級(jí)行政邊界數(shù)據(jù),經(jīng)ArcGIS 10.2軟件數(shù)字化處理。]
1.1.1" 成災(zāi)水位及臨界流量確定
當(dāng)上游洪水到達(dá)沿河村落控制斷面且水位超過(guò)該斷面某個(gè)臨界值時(shí)判定村落受災(zāi)[11]。本文中基于現(xiàn)場(chǎng)調(diào)研情況,采用實(shí)測(cè)斷面數(shù)據(jù)、水工建筑物數(shù)據(jù)等參數(shù)構(gòu)建一維水動(dòng)力模型,通過(guò)沿河村落沿程水面線的結(jié)果,得出村落內(nèi)最薄弱位置處的成災(zāi)水位,并確定成災(zāi)流量,此成災(zāi)流量即為臨界流量。
1.1.2" 水文模型構(gòu)建
提取小流域面積、 流域比降、 平均坡度等參數(shù)構(gòu)建小流域水文模型。 本文基于水文模型系統(tǒng)(HMS)進(jìn)行產(chǎn)匯流計(jì)算。產(chǎn)流計(jì)算選擇初損后損法,匯流模塊選擇斯奈德單位線法,基流計(jì)算采用指數(shù)衰減法,河道匯流采用馬斯京根法,輸入降雨歷時(shí)1、 3、 6 h的設(shè)計(jì)降雨量,最終得到流域出口斷面的設(shè)計(jì)流量過(guò)程。
1.1.3" 臨界雨量確定
考慮山丘區(qū)洪水災(zāi)害的短歷時(shí)強(qiáng)暴雨的特點(diǎn), 選取降雨歷時(shí)1、 3、 6 h為雨量預(yù)警時(shí)段。本文中采用試算法進(jìn)行不同時(shí)段臨界雨量的確定, 具體方法是: 首先確定臨界流量和模擬流量之間允許的誤差閾值, 假定一個(gè)初始雨量, 并按雨量及雨型分析得到相應(yīng)的降雨過(guò)程系列作為最初的輸入, 計(jì)算預(yù)警地點(diǎn)的洪水過(guò)程。其次, 比較計(jì)算所得的洪峰流量與預(yù)警地點(diǎn)的臨界流量, 如果兩者接近, 該雨量即為該時(shí)段的臨界雨量; 如果差異較大, 需重新設(shè)定初始雨量, 反復(fù)進(jìn)行試算, 直至計(jì)算所得的洪峰流量與防災(zāi)對(duì)象的臨界流量差值小于預(yù)定的允許誤差閾值為止。
1.2" XGBoost算法
本文中采用XGBoost算法進(jìn)行無(wú)資料地區(qū)臨界雨量的計(jì)算,根據(jù)提取的沿河村落水文相關(guān)特征、流域下墊面等相關(guān)特征,構(gòu)建機(jī)器學(xué)習(xí)算法模型,預(yù)測(cè)臨界雨量。
1.2.1" 算法原理
XGBoost算法基于樹(shù)集成理論,基分類器包括分類樹(shù)和回歸樹(shù),在分類問(wèn)題上具有很高的精度[12]。XGBoost算法參考了隨機(jī)森林算法,支持特征隨機(jī)性,計(jì)算速度較快,還能有效地防止過(guò)擬合,具有訓(xùn)練效率高、 預(yù)測(cè)效果好、 可控參數(shù)多、 使用方便等特性。
XGBoost算法與梯度提升樹(shù)(GBDT)算法一脈相承,都是“樹(shù)”家族的一員,且兩者都是提升算法(Boosting)。XGBoost算法擁有多個(gè)基學(xué)習(xí)器(base learner),基學(xué)習(xí)器之間相互影響,比單個(gè)學(xué)習(xí)器有更高的泛化能力和魯棒性[13]。
XGBoost算法的目標(biāo)函數(shù)公式為
O=∑ni=1L(yi, y^i)+∑gm=1W(fm),(1)
式中: L為損失函數(shù); W為正則化懲罰函數(shù); yi為實(shí)測(cè)值; y^i為預(yù)測(cè)值; fm為第m棵累加樹(shù); n為樣本數(shù)量; g為樹(shù)的數(shù)量。
損失函數(shù)L的表達(dá)式為
L=∑ni=1l(yi, y^i),(2)
式中l(wèi)為真實(shí)值與預(yù)測(cè)值之間的誤差函數(shù)。
正則化懲罰函數(shù)W的表達(dá)式為
W(ft)=γT+12λ∑Tj=1w2j ,(3)
式中: T為葉子節(jié)點(diǎn)的數(shù)量; γ和λ為懲罰系數(shù); wj為第j個(gè)葉子節(jié)點(diǎn)的權(quán)重; ft表示當(dāng)前迭代中構(gòu)建的第t棵樹(shù)。
當(dāng)生成t棵決策樹(shù)時(shí),最終的預(yù)測(cè)得分是這t棵決策樹(shù)的累加值,即
y^t=y^t-1+ft(xk),(4)
式中: y^t、 y^t-1分別為第t、 t-1棵決策樹(shù)的預(yù)測(cè)值; ft(xk)為第t棵決策樹(shù)對(duì)樣本k的預(yù)測(cè)值。
將y^t代入到目標(biāo)函數(shù)中進(jìn)行泰勒展開(kāi),簡(jiǎn)化目標(biāo)函數(shù),最終得到目標(biāo)函數(shù)最小值w和最優(yōu)目標(biāo)函數(shù)Oz為
w=-GjHj+λ ,(5)
式中Gj、 Hj分別為映射為葉子節(jié)點(diǎn)j的所有輸入樣本的一階導(dǎo)數(shù)、 二階導(dǎo)數(shù)之和。
Oz=-12∑Tj=1G2jHj+λ+γT 。(6)
XGBoost算法是根據(jù)選擇的若干個(gè)特征參數(shù)來(lái)確定決策樹(shù)的數(shù)量[14],累加每棵決策樹(shù)的得分成果即可得到最終的預(yù)測(cè)結(jié)果。該算法的基本流程見(jiàn)圖2,主要包括以下流程:
1)初始化每個(gè)樣本數(shù)據(jù)對(duì)應(yīng)的預(yù)測(cè)值。
2)創(chuàng)建目標(biāo)函數(shù)。
3)簡(jiǎn)化目標(biāo)函數(shù)。
4)循環(huán)創(chuàng)建決策樹(shù),并擬合上一決策樹(shù)的殘差。
5)累加決策樹(shù)預(yù)測(cè)值,得出最終的預(yù)測(cè)結(jié)果。
1.2.2" 模型構(gòu)建
1)數(shù)據(jù)處理。選取臨界雨量影響參數(shù),創(chuàng)建樣本數(shù)據(jù)集。由于臨界雨量結(jié)果是通過(guò)計(jì)算得到,數(shù)據(jù)中可能包含了缺失值以及計(jì)算誤差較大的值,不利于算法模型的訓(xùn)練,自然也會(huì)對(duì)模型的模擬效果產(chǎn)生影響,因此還需要剔除偏差很明顯的數(shù)據(jù),對(duì)參數(shù)進(jìn)行標(biāo)準(zhǔn)化處理。
2)創(chuàng)建XGBoost算法模型。將處理后的數(shù)據(jù)集按照一定的規(guī)則分為訓(xùn)練集和測(cè)試集,借助Python語(yǔ)言提供的Sklearn工具包中的XGBoost回歸模型(XGBRegressor),創(chuàng)建XGBoost算法模型。
3)模型調(diào)參?;诮涌陬怷GBRegressor,將XGBoost的參數(shù)帶入到GridSearchCV進(jìn)行遍歷調(diào)優(yōu)。
1.2.3" 評(píng)價(jià)指標(biāo)
選取平均絕對(duì)誤差RMAE和決定系數(shù)r2進(jìn)行預(yù)測(cè)模型的仿真測(cè)試,檢驗(yàn)?zāi)M結(jié)果與實(shí)際值的擬合程度,RMAE數(shù)值越小,說(shuō)明實(shí)驗(yàn)數(shù)據(jù)與模擬結(jié)果之間差值越小,模型模擬效果越好。r2越接近 1,表明預(yù)測(cè)值與實(shí)測(cè)值的擬合程度越高。
RMAE=1m∑mi=1y^t-yi ,(7)
r2=1-∑ni=1(y^i-yi)2
∑ni=1(yi- y—)2
,(8)
式中: m、 n為樣本數(shù)量; y—為樣本均值。
2" 典型區(qū)域臨界雨量預(yù)估模型構(gòu)建
2.1" 研究區(qū)概況
五蓮縣的地理位置為東經(jīng)119°30′—120°11′、 北緯35°35′—36°08′, 地處山東半島南部, 濰河上游, 境內(nèi)河流眾多, 山嶺起伏, 以山地丘陵地貌為主, 約占其總面積的86%, 僅在西部和北部有小塊平原, 是典型的山丘區(qū)。 五蓮縣屬溫帶季風(fēng)氣候, 降雨充沛, 土壤類型以黃棕壤土為主。 受地形、 地貌及降雨等多種條件的復(fù)雜影響, 五蓮縣易發(fā)生山洪災(zāi)害, 歷史上曾在1988、 1989、 1997、 1998、 1999、 2008、 2016、 2021等年份發(fā)生過(guò)較大洪水災(zāi)害。 本文中選取五蓮縣現(xiàn)狀防洪能力小于百年一遇的45個(gè)防災(zāi)對(duì)象進(jìn)行研究。 防災(zāi)對(duì)象分布見(jiàn)圖3。
2.2" 數(shù)據(jù)處理
2.2.1" 數(shù)據(jù)來(lái)源
數(shù)字高程模型(DEM)數(shù)據(jù)來(lái)源于地理空間數(shù)據(jù)云平臺(tái)(http://www.gscloud.cn/),實(shí)測(cè)斷面、流域和下墊面參數(shù)來(lái)源于山洪災(zāi)害調(diào)查評(píng)價(jià)項(xiàng)目。
2.2.2" 臨界雨量計(jì)算
1)臨界流量確定。對(duì)45個(gè)沿河村落進(jìn)行斷面測(cè)量及現(xiàn)場(chǎng)調(diào)研,將實(shí)測(cè)斷面、 產(chǎn)匯流結(jié)果輸入到一維水動(dòng)力模型中,模擬出水面線成果。當(dāng)水面線到達(dá)該沿河村落控制斷面最低點(diǎn)時(shí),該水位即為成災(zāi)水位,此時(shí)的流量即成災(zāi)流量,也就是臨界流量。
2)在考慮前期影響雨量對(duì)臨界雨量的影響下構(gòu)建水文模型,根據(jù)《山東省水文圖集(1975)》,確定各個(gè)沿河村落土壤最大蓄水量Wmax,考慮土壤狀況為較干(0.2Wmax)、 一般(0.5Wmax)、 較濕(0.8Wmax)3種前期影響雨量, 以降雨歷時(shí)1、 3、 6 h作為預(yù)警時(shí)段,計(jì)算不同頻率的設(shè)計(jì)暴雨,采用HMS模型計(jì)算產(chǎn)匯流,得出沿河村落小流域的設(shè)計(jì)流量。
3)臨界雨量試算。采用試算法對(duì)沿河村落不同預(yù)警時(shí)段的臨界雨量進(jìn)行試算確定,并得到臨界雨量結(jié)果如表1。
2.3" 預(yù)測(cè)模型搭建
臨界雨量的影響因素眾多,本文中借鑒山洪災(zāi)害風(fēng)險(xiǎn)評(píng)價(jià)中的指標(biāo)[15],選擇了水文相關(guān)特征、 流域下墊面相關(guān)特征、 沿河村落相關(guān)特征來(lái)構(gòu)建預(yù)估模型。
1)水文相關(guān)特征參數(shù),包括前期土壤含水量Pa、 匯流時(shí)間Ht,通過(guò)計(jì)算獲得。
2)流域下墊面相關(guān)特征參數(shù),包括流域面積F、 流域平均坡度Savg、 流域最長(zhǎng)匯流路徑了Lmax、 流域最長(zhǎng)匯流路徑比降Jmax,通過(guò)處理DEM數(shù)據(jù)獲得。
3)沿河村落相關(guān)特征參數(shù),包括河道糙率m、 村落河道寬度B、 河道距村落水平距離Lb、 沿河村落河段長(zhǎng)度Lw、 河段比降Jw,采用Arcgis軟件根據(jù)天地圖提取。
臨界雨量預(yù)測(cè)模型參數(shù)選取結(jié)果見(jiàn)表2。
2.4" 模型設(shè)置
基于預(yù)處理后的45個(gè)沿河村落臨界雨量原始數(shù)據(jù),對(duì)各預(yù)警時(shí)段分別建立預(yù)估模型。為了排除偶然性,在每個(gè)預(yù)警時(shí)段中的135條臨界雨量數(shù)據(jù)中隨機(jī)選取80%樣本數(shù)據(jù)為訓(xùn)練集,20%樣本數(shù)據(jù)為測(cè)試集。為了避免結(jié)果產(chǎn)生較大的誤差以及模型可能產(chǎn)生的過(guò)擬合的問(wèn)題,模擬之前舍棄了計(jì)算明顯錯(cuò)誤的結(jié)果,模擬過(guò)程中舍棄了訓(xùn)練集擬合度高而測(cè)試集擬合度不高的運(yùn)行結(jié)果,同時(shí)進(jìn)行算法參數(shù)調(diào)整,確定算法各參數(shù)具體參數(shù)數(shù)值。
3" 結(jié)果與分析
采用基于XGBoost算法的臨界雨量預(yù)估模型進(jìn)行各個(gè)沿河村落不同預(yù)警時(shí)段的臨界雨量預(yù)測(cè), 并得到預(yù)測(cè)結(jié)果與實(shí)測(cè)值之間的偏差絕對(duì)值, 預(yù)測(cè)成果以及偏差絕對(duì)值如圖4所示。由圖可以看出, 測(cè)試集選取的25個(gè)沿河村落預(yù)警時(shí)段1、 3、 6 h臨界雨量偏差絕對(duì)值分別為0.39%~13.56%、 0.29%~13.21%、 0.75%~9.67%, 表明模型模擬效果較好。
由表可知,預(yù)警時(shí)段1、 3、 6 h臨界雨量的MAE分別為4.56、 6.68、 7.11,均小于10,誤差在可接受范圍之內(nèi),r2值分別為0.955、 0.967、 0.973,均大于0.95。結(jié)合研究區(qū)臨界雨量預(yù)測(cè)值與實(shí)測(cè)值的對(duì)比(見(jiàn)圖5)和擬合結(jié)果(見(jiàn)圖6),說(shuō)明XGBoost算法能夠較好地?cái)M合訓(xùn)練數(shù)據(jù);以允許偏差絕對(duì)值10%為判定標(biāo)準(zhǔn),得出3個(gè)預(yù)警時(shí)段的合格率,25個(gè)沿河村落在允許10%誤差范圍內(nèi),預(yù)警時(shí)段1 h的合格率為96%, 3 h的合格率為96%, 6 h的合格率為100%。
4" 結(jié)論
本文中在山丘區(qū)小流域山洪災(zāi)害致災(zāi)因子的前期研究結(jié)果基礎(chǔ)上,選取并量化前期土壤含水量、
流域最長(zhǎng)匯流路徑、 村落河道寬度等影響參數(shù), 參考有資料地區(qū)山洪災(zāi)害發(fā)生與致災(zāi)因子之間的聯(lián)系, 綜合水文水力學(xué)法和機(jī)器學(xué)習(xí)算法, 建立基于XGBoost算法的臨界雨量預(yù)估模型,得到以下結(jié)論:
1)基于XGBoost算法的臨界雨量預(yù)估模型簡(jiǎn)單合理,效果良好。本文中提出的臨界雨量預(yù)測(cè)方法沒(méi)有明顯的物理機(jī)制,跳過(guò)了繁雜的產(chǎn)匯流計(jì)算,但又沒(méi)有完全脫離水文學(xué)理論,且具有一定的數(shù)學(xué)意義。
2)基于模型的訓(xùn)練以及測(cè)試結(jié)果可以看出,各預(yù)警時(shí)段測(cè)試集的r2均大于0.9,表明模型的擬合效果較好,并且測(cè)試集中臨界雨量預(yù)估值與水文水力學(xué)法計(jì)算的臨界雨量值的MAE均小于10,表明模型的預(yù)測(cè)精度較高。該模型可以快速、精確地預(yù)估臨界雨量,能夠滿足山洪預(yù)警工作的應(yīng)用需求。
3)對(duì)于資料難以獲取的山丘區(qū)小流域,減少了繁復(fù)的建模工作,為無(wú)資料山丘區(qū)小流域山洪預(yù)警提供了更為簡(jiǎn)便的思路和方法。
本文中所提出的臨界雨量預(yù)測(cè)模型可以推廣到與研究區(qū)流域特征較為相似的山丘區(qū)小流域。由于本文中僅僅針對(duì)部分沿河村落進(jìn)行研究,樣本數(shù)據(jù)較少,因此模型的性能還有待進(jìn)一步優(yōu)化。
參考文獻(xiàn):
[1]" 程衛(wèi)帥. 山洪災(zāi)害臨界雨量研究綜述[J]. 水科學(xué)進(jìn)展, 2013, 24(6): 901.
[2]" 李磊. 水位反推法在臨界雨量計(jì)算中的應(yīng)用[J]. 人民長(zhǎng)江, 2016, 47(22): 6.
[3]" 龔云柱, 周蘭庭, 柳志坤. 基于降雨資料的雨量預(yù)警指標(biāo)閾值求解模型[J]. 水資源保護(hù), 2021, 37(6): 13.
[4]" 韓俊太, 王政榮, 楊雨亭. 基于動(dòng)態(tài)臨界雨量的小流域山洪災(zāi)害分級(jí)預(yù)警[J]. 水力發(fā)電學(xué)報(bào), 2022, 41(9): 67.
[5]" 沈煒彬, 郝鵬. 基于雨型分析的小流域山洪災(zāi)害臨界雨量計(jì)算[J]. 人民黃河, 2022, 44(1): 52.
[6]" 王維林, 桑國(guó)慶, 曹方晶, 等. 基于Fisher判別算法的山洪災(zāi)害臨界雨量指標(biāo)計(jì)算[J]. 水文,2022, 42(2): 1.
[7]" 劉元鋒, 李書(shū)博. 統(tǒng)計(jì)分析法在遼寧省中小河流致洪暴雨臨界雨量計(jì)算中的應(yīng)用[J]. 中國(guó)防汛抗旱, 2023, 33(1): 61.
[8]" 盧燕宇, 謝五三, 田紅. 基于水文模型與統(tǒng)計(jì)方法的中小河流致洪臨界雨量分析[J]. 自然災(zāi)害學(xué)報(bào), 2016, 25(3): 38.
[9]" 樊建勇, 單九生, 管珉, 等. 江西省小流域山洪災(zāi)害臨界雨量計(jì)算分析[J]. 氣象, 2012, 38(9): 1110.
[10]" 王燕云, 原文林, 龍愛(ài)華, 等. 基于SVR的無(wú)實(shí)測(cè)資料小流域山洪災(zāi)害臨界雨量預(yù)估模型及應(yīng)用: 以河南新縣為例[J]. 水文, 2020, 40(2): 42.
[11]" 王維林, 顧士升, 桑國(guó)慶, 等. 山丘區(qū)沿河村落山洪災(zāi)害受災(zāi)水位及危險(xiǎn)區(qū)劃分方法[J]. 南水北調(diào)與水利科技(中英文), 2020, 18(3): 119.
[12]" 馬良玉, 於世磊, 王佳聰, 等. 基于XGBoost建模及改進(jìn)灰狼優(yōu)化算法的再熱汽溫預(yù)測(cè)優(yōu)化控制[J]. 熱能動(dòng)力工程, 2023, 38(1): 104.
[13]" 蘇鴻, 馬超, 蘇鵬, 等. 基于XGBoost的下肢步態(tài)相位識(shí)別研究[J]. 電子測(cè)量與儀器學(xué)報(bào), 2023, 37(3): 95.
[14]" 李柱, 朱德蘭, 陸麗瓊, 等. 基于XGBoost的溫室環(huán)境預(yù)測(cè)與卷膜決策方法研究[J]. 節(jié)水灌溉, 2023(3):67.
[15]" 孫盈, 桑國(guó)慶, 朱龍騰, 等. 基于DPSIR模型的小流域山洪災(zāi)害風(fēng)險(xiǎn)評(píng)價(jià)[J]. 水電能源科學(xué), 2021, 39(3): 28.
(責(zé)任編輯:于海琴)