關(guān)鍵詞:徑流預(yù)測;長短期記憶網(wǎng)絡(luò);卷積神經(jīng)網(wǎng)絡(luò);小波變換
全球氣候變化和城市化增加了洪水風(fēng)險,給洪水管理帶來新的挑戰(zhàn)[1]。在此背景下,精準(zhǔn)預(yù)測徑流對洪水管理和水資源規(guī)劃至關(guān)重要。降水量的空間異質(zhì)性對洪峰和徑流預(yù)測有顯著影響[2],隨著分布式水文模型的發(fā)展[3-4],水文氣象過程的空間變異性得到了更精確的描述。但許多地區(qū)缺乏足夠的水文、氣象歷史數(shù)據(jù)和精準(zhǔn)的模型參數(shù)[5-7],影響徑流預(yù)測結(jié)果的準(zhǔn)確性。隨著人工智能技術(shù)的發(fā)展,特別是深度學(xué)習(xí)等神經(jīng)網(wǎng)絡(luò)模型用于復(fù)雜非線性水文過程預(yù)測,取得了一定進(jìn)展[8]。此外,一些研究還將傳統(tǒng)水文模型與神經(jīng)網(wǎng)絡(luò)結(jié)合,但這些方法通常是基于模型輸出的后處理,通過提取和整合模擬結(jié)果,進(jìn)一步優(yōu)化預(yù)測精度[9-10]。以上基于神經(jīng)網(wǎng)絡(luò)模型的方法無法提供過程的物理解釋,但它們帶來了包括快速發(fā)展、較低的信息需求和相對準(zhǔn)確的流量預(yù)測等多項優(yōu)勢[11]。然而基于神經(jīng)網(wǎng)絡(luò)模型的輸入特征,如降水量和溫度,通常被視為非空間分布的,而是以聚合值的形式輸入,例如流域或某一區(qū)域的平均值,忽略了降水等氣象因素的空間異質(zhì)性,而這些異質(zhì)性對流域水文響應(yīng),特別是對洪峰流量的影響至關(guān)重要。
為彌補(bǔ)上述方法在識別空間異質(zhì)性方面的局限性,研究者開始嘗試將空間信息直接融入模型中,以提高徑流預(yù)測的精度。鄧超等[12]在針對贛江流域的研究中,通過結(jié)合數(shù)據(jù)同化與機(jī)器學(xué)習(xí),利用主成分分析(PrincipalComponentAnalysis,PCA)降低數(shù)據(jù)維度,提取關(guān)鍵變量,減少了冗余,提高了模型效率和預(yù)測精度;Yang等[13]通過融合神經(jīng)網(wǎng)絡(luò)和計算機(jī)視覺(ComputerVision,CV)技術(shù),捕獲了預(yù)測因子的空間變異性,證明空間信息在提高水文模型魯棒性中的關(guān)鍵作用,特別是在極端流量預(yù)測方面;Deng等[11]、Li等[14]、Hu等[15]使用了結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)和長短期記憶網(wǎng)絡(luò)(LongShort-TermMemory,LSTM)的CNN-LSTM模型,CNN和LSTM的結(jié)合使模型既能捕捉空間信息,又能處理時間動態(tài)變化,從而提高徑流預(yù)測的精度。以上研究表明,使用空間信息的數(shù)據(jù)相對于傳統(tǒng)的流域平均數(shù)據(jù)可以在一定程度上提升模型性能。然而,這些方法在直接處理高維空間數(shù)據(jù)時,主要依賴深度學(xué)習(xí)模型自動提取特征,缺乏從水文學(xué)角度對降水空間異質(zhì)性的提取。
為了更好地表征降水空間異質(zhì)性對水文響應(yīng)的影響,一些研究者開始嘗試在模型輸入層面充分引入水文機(jī)理。Liu等[16]和劉成帥等[17]將地形、土地利用和土壤特性與LSTM模型結(jié)合,量化降水的空間異質(zhì)性,以優(yōu)化洪水預(yù)測;吳垚等[18]通過結(jié)合網(wǎng)格化HBV模型和CNN-LSTM,將降水的空間異質(zhì)性直接融入模型中,從而提高徑流預(yù)測精度;Wang等[19]則通過提取集水區(qū)各水文響應(yīng)單元的降水?dāng)?shù)據(jù),替代傳統(tǒng)的面平均降水?dāng)?shù)據(jù),保留了降水的空間分布信息,提高了LSTM模型的洪水預(yù)測精度;張錦堂等[20]發(fā)現(xiàn),利用包含空間信息的測站數(shù)據(jù)能夠提升通過LSTM模型進(jìn)行降雨徑流模擬的效果。盡管這些方法初步引入了水文機(jī)理,但仍缺乏足夠的水文學(xué)支持,導(dǎo)致模型未能全面反映降水對水文響應(yīng)的復(fù)雜動態(tài)影響,從而限制了預(yù)測精度和適應(yīng)性。
為了有效提取和利用降水的空間信息,同時降低計算復(fù)雜度,本文以贛江流域為研究對象,基于二維降水?dāng)?shù)據(jù),研究不同降水空間特征提取方法對基于LSTM模型的徑流預(yù)測性能的影響,探討尋找兼顧精度和效率的最佳徑流預(yù)測方法。
1研究方案及方法
1.1模型與設(shè)置
本研究基于TensorFlow的Keras框架,采用3種神經(jīng)網(wǎng)絡(luò)模型:CNN[21]、多頭注意力機(jī)制(Multi-HeadAttention,MH)[22]和LSTM[23],并結(jié)合全連接層(FullyConnectedLayer,F(xiàn)C)。采用雙滑動窗口方法,預(yù)測未來1d的徑流量。訓(xùn)練集和驗證集的數(shù)據(jù)選取自2018年5月至2023年4月。每次訓(xùn)練過程中,隨機(jī)選擇其中90%數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),剩余10%作為驗證數(shù)據(jù);測試集的數(shù)據(jù)選取自2023年5月至2024年4月。模型參數(shù)參考Khatun等[24]的研究方法,采用試錯法確保最佳參數(shù)設(shè)置。參考鄧超等[12]的相關(guān)研究,采用納什效率系數(shù)(ENS)、Kling-Gupta效率系數(shù)(EKG)、徑流對數(shù)的納什效率系數(shù)(ENSlnQ)、洪峰相對誤差(DP)和洪量相對誤差(DV)作為評估指標(biāo)。
1.2研究方案
本研究設(shè)計了5種不同的降水?dāng)?shù)據(jù)處理方案:原始圖像方案、小波分解方案、統(tǒng)計學(xué)特征方案、面平均值方案及區(qū)域劃分方案,圖1展示了各方案的模型結(jié)構(gòu)。
1.2.1方案1(原始圖像方案)
直接將時序二維圖像格點(diǎn)降水?dāng)?shù)據(jù)作為輸入,利用二維CNN提取空間特征后,再結(jié)合LSTM模型捕捉時序信息來預(yù)測徑流。
1.2.2方案2(小波分解方案)
對降水?dāng)?shù)據(jù)應(yīng)用Daubechies小波進(jìn)行雙層離散小波變換,將其分解成16個頻段,對每個頻段的數(shù)據(jù)進(jìn)行均值、方差等10個特征提取[25],這些特征作為時間序列輸入,使用LSTM模型預(yù)測徑流。方案2-CL使用CNN-LSTM模型,與張乙鵬等[25]的研究保持一致。作為對比,方案2-L使用LSTM模型,將未經(jīng)過重塑的統(tǒng)計特征向量直接輸入LSTM模型進(jìn)行預(yù)測。
1.2.3方案3(統(tǒng)計學(xué)特征方案)
從原始二維降水?dāng)?shù)據(jù)中提取過去7d面平均降水量、過去30d面平均降水量、標(biāo)準(zhǔn)差、最大值、偏度、峰度、平均梯度[25]以及降水質(zhì)心到流域出口的距離8個統(tǒng)計學(xué)特征,作為LSTM模型的輸入。
1.2.4方案4(面平均值方案)
從時序降水?dāng)?shù)據(jù)中提取整個流域面平均值,得到1個一維的時間序列,直接輸入進(jìn)LSTM模型進(jìn)行徑流預(yù)測。
1.2.5方案5(區(qū)域劃分方案)
方案5為區(qū)域劃分方案,本研究采用4種分區(qū)方法,將二維時序格點(diǎn)降水?dāng)?shù)據(jù)劃分為若干區(qū)域,分別計算每個區(qū)域的降水均值,進(jìn)而輸入到LSTM模型中。這種方法能夠在輸入數(shù)據(jù)中保留更多的空間特征,從而提高模型對降水空間異質(zhì)性和洪水動力學(xué)的捕捉能力。
(1)基于等級河流劃分。提取水文信息,基于Strahler分級法將流域劃分為6級河流(圖2(a))。將6級河流(主干河流)、5級河流、4級河流以及3級及以下河流所控制的集水區(qū)劃分為4個區(qū)域,分別計算這些區(qū)域的降水量面平均值,輸入LSTM模型。
(2)基于距離遠(yuǎn)近劃分。首先確定流域出口斷面的位置和流域的范圍;然后,以出口斷面為圓心,劃分等半徑差的同心圓,將流域分為3個區(qū)(圖2(b)),分別計算每個區(qū)的降水面平均值,輸入LSTM模型。
(3)基于水文響應(yīng)單元(HRU)劃分(包含2種子方式)。使用ArcSWAT工具對流域進(jìn)行水文單元劃分,創(chuàng)建多個HRU。由于HRU是根據(jù)土地利用、土壤類型、地形和坡度等各因素的特征組合定義的,因此每個HRU能夠代表一個在水文響應(yīng)上相對均質(zhì)的區(qū)域。由于不同的土地利用類型(如森林、耕地、城市區(qū)域)和土壤類型(如砂土、黏土等)對降水的滲透、徑流和蒸發(fā)有顯著不同,因此HRU能夠有效反映下墊面對降水的不同響應(yīng)。
本研究采用2種HRU劃分方式,分類標(biāo)準(zhǔn)詳見表1。第1種精細(xì)HRU劃分方法基于土地利用6類、土壤類型3類和坡度2類(以5%坡度百分比為閾值),最終劃分出293個HRUs(圖2(c))。第2種簡易HRU劃分方法,僅將土地利用分為2類、土壤分為2類、坡度不分類,最終劃分出91個HRUs(圖2(d))。
1.2.6SHAP算法
SHAP(ShapleyAdditiveExplanations)是一種基于博弈論的模型解釋方法,用于量化每個特征因子對模型預(yù)測結(jié)果的貢獻(xiàn)[26]。本研究中基于SHAP算法,通過計算各輸入特征對徑流預(yù)測的SHAP值,分析輸入特征包括降水和統(tǒng)計特征等對模型預(yù)測結(jié)果的影響,揭示特征對徑流變化的具體貢獻(xiàn),從而增強(qiáng)模型的可解釋性。
2研究流域與數(shù)據(jù)
2.1研究流域
贛江流域位于長江中下游南岸,是鄱陽湖水系的最大支流,發(fā)源于江西省贛州市石城縣,流域總面積約為8.35萬km2,流域地形復(fù)雜,地勢由上游的崇山峻嶺逐漸過渡到中游的開闊谷地和平原,再至下游的丘陵盆地,高程自然落差達(dá)937m。流域內(nèi)山地和丘陵占比約64.7%,低丘崗地占31.5%,平原和水域面積僅為3.9%;植被以森林和草地為主,主要包括常綠闊葉林和落葉闊葉林,草地多分布于高海拔山區(qū)和盆地[27]。土地利用主要為林地和農(nóng)田,林地覆蓋面積占比超過65%,土壤類型涵蓋紅壤、黃壤等20余種[28]。贛江流域的水文特征具有明顯的季節(jié)性變化,汛期為4—9月,水量約占全年總水量的73%~78%;而枯水期集中在11月至次年1月,此時水量僅占全年總量的9%~11%,徑流的年內(nèi)分布差異顯著[29]。贛江流域范圍及高程見圖3。
2.2數(shù)據(jù)集
降水?dāng)?shù)據(jù)采用中國氣象局(https://data.cma.cn)陸面數(shù)據(jù)同化系統(tǒng)(CLDAS-V2.0)的實(shí)時產(chǎn)品數(shù)據(jù)集中的降水?dāng)?shù)據(jù),時空分辨率分別為1d和0.0625°。徑流數(shù)據(jù)采用外洲水文站1h實(shí)測數(shù)據(jù),對其進(jìn)行時間上的降尺度處理,使得徑流數(shù)據(jù)的時間尺度與降水?dāng)?shù)據(jù)保持一致。訓(xùn)練集和驗證集數(shù)據(jù)選取自2018年5月至2023年4月。訓(xùn)練期和驗證期內(nèi)平均日降雨—徑流過程見圖4。
DEM數(shù)據(jù)采用地理空間數(shù)據(jù)云(https://www.gscloud.cn/)的ASTERGDEMV3數(shù)據(jù),分辨率為30m。土壤類型數(shù)據(jù)采用FoodandAgricultureOrganization(FAO)的全球土壤數(shù)據(jù)庫。土地利用數(shù)據(jù)采用21類IGBP-MODIS土地利用分類。
2.3時間窗口選擇
利用互相關(guān)函數(shù)(CCF),根據(jù)Khatun等[30]的研究方法,以互相關(guān)函數(shù)值FCC>0.5的閾值作為輸入時間序列選擇的標(biāo)準(zhǔn),對降水?dāng)?shù)據(jù)與歷史徑流數(shù)據(jù)進(jìn)行統(tǒng)計分析,以選擇最適合的時間窗口。圖5顯示了降水與歷史徑流對當(dāng)前徑流的互相關(guān)函數(shù)值曲線。根據(jù)該結(jié)果,確定了歷史徑流的時間窗口為11d,降水的時間窗口為3d。
3結(jié)果與分析
3.1不同方案預(yù)測結(jié)果
各方案的徑流預(yù)測結(jié)果如表2所示,整體上方案3、方案4和方案5表現(xiàn)較優(yōu)。方案1因特征維度過大,易造成過擬合,注意力機(jī)制的引入提高了對高流量的模擬精度,但對低流量的模擬效果較差。方案2-L采用的LSTM模型對多特征相互關(guān)系更敏感,能夠有效捕捉小波分解生成的多尺度統(tǒng)計特征;方案2-CL在CNN與小波特征結(jié)合時,盡管也優(yōu)于方案1,但額外的卷積操作在訓(xùn)練中未能充分發(fā)揮其優(yōu)勢,導(dǎo)致其測試期泛化能力低于單一LSTM模型。方案3通過提取全局統(tǒng)計特征簡化輸入,降低了模型復(fù)雜度,泛化能力更強(qiáng)。方案4采用降水格點(diǎn)的面平均值作為輸入,能較好地模擬低流量,但對高流量的捕捉仍有改進(jìn)空間。方案5基于不同方式對降水進(jìn)行空間劃分,整體性能最優(yōu):按河流等級劃分能更準(zhǔn)確地模擬高流量,但對低流量的刻畫略顯不足;按出口斷面距離劃分在低流量情景下表現(xiàn)更好;基于HRU的精細(xì)劃分雖在訓(xùn)練期和驗證期表現(xiàn)突出,但易過擬合,適當(dāng)簡化后可在高流量與低流量預(yù)測中取得更平衡的效果。
種方案測試期徑流預(yù)測結(jié)果見圖6,訓(xùn)練期、驗證期和測試期多個洪水事件的洪峰和洪量相對誤差見圖7,實(shí)測徑流與5種方案的預(yù)測徑流之間的泰勒圖見圖8。
從圖6—圖8可以看出,訓(xùn)練期、驗證期的DP和DV表現(xiàn)出整體穩(wěn)定的趨勢,說明模型的訓(xùn)練過程較為穩(wěn)定。在測試期,5種方案預(yù)測徑流過程與實(shí)測徑流過程都吻合較好。方案1通過多頭注意力機(jī)制能夠較好地捕捉洪峰流量的時序特征,但在低流量情況下經(jīng)常將徑流預(yù)測為零。方案2-CL常出現(xiàn)低估,同時從圖8可以看出,方案2-CL在捕捉流量過程的多樣性方面有所欠缺;而方案2-L則有所改進(jìn),對洪峰流量的預(yù)測也更為精準(zhǔn)。方案3通過統(tǒng)計特征提取,捕捉了降水空間分布與流域特征的關(guān)系,尤其對2023年6月26日降雨—徑流事件的預(yù)測最為精準(zhǔn),事件期間的ENS達(dá)到0.944,表明全局統(tǒng)計特征兼顧了空間信息和簡化輸入,使模型具有較好的穩(wěn)定性,既可以有效降低模型復(fù)雜性,同時保持較高的預(yù)測精度。方案4關(guān)注整體降水對徑流的影響,忽略了空間分布細(xì)節(jié),預(yù)測精度較方案1和方案2更好。方案5的4種方法中,2種基于HRU劃分的方案中,方案5-H2相較于方案5-H1標(biāo)準(zhǔn)差表現(xiàn)更好,表明合理簡化輸入特征能夠提升泛化能力;但方案5-H1和方案5-H2都略遜于基于河流等級的劃分方案5-H和距離出口的劃分方案5-D,尤其是方案5-H,在DP和DV上的表現(xiàn)最優(yōu),在2024年4月6日的降水事件中,洪峰誤差比基于出口距離的方案5-D低9.40%,這種優(yōu)勢可以歸因于河流等級劃分能夠更好地反映流域內(nèi)的匯水路徑和河道調(diào)節(jié)作用。
總體上看,5種方案中方案3和方案5-H、方案5-D表現(xiàn)更好。方案3以降水?dāng)?shù)據(jù)的不同統(tǒng)計學(xué)特征作為輸入,為深入理解這些特征對模型預(yù)測的影響、揭示模型對降水特征的敏感性、為未來的特征選擇和模型優(yōu)化提供依據(jù),需進(jìn)一步分析其優(yōu)異表現(xiàn)背后的原因。為此,將通過SHAP分析方法解釋方案3的各統(tǒng)計特征如何影響徑流預(yù)測,特別是在豐水期和枯水期等不同水文事件中表現(xiàn)的差異。
3.2統(tǒng)計特征解釋性分析
針對2023年6月26日豐水期降水事件、2024年2月6日平水期降水事件及2023年11月至2024年1月枯水期,使用SHAP分析方法量化各輸入特征對徑流預(yù)測的貢獻(xiàn)。3個時間段內(nèi)各統(tǒng)計特征及時間窗口不同天數(shù)的平均SHAP值見圖9。
從圖9可以看出,在2023年豐水期的降水事件中,“過去7d的面平均降水量”特征對模型預(yù)測的貢獻(xiàn)較大,說明前期降水為土壤提供了持續(xù)的補(bǔ)給,使土壤含水量增高;“面平均降水量”在所有特征中貢獻(xiàn)最大,說明徑流主要由中短期的強(qiáng)降水產(chǎn)生。在2024年平水期的降水事件中,“過去7d的面平均降水量”的SHAP值顯著低于2023年豐水期的降水事件的值,且“過去30d的面平均降水量”的SHAP值始終保持在低水平,前期降水對徑流形成的貢獻(xiàn)較小。結(jié)合2月份的水文氣象特征,可以推斷此降水事件發(fā)生前,土壤含水量較低。
在枯水期,降水量相關(guān)特征的SHAP值較低,說明降水總量對徑流形成的貢獻(xiàn)較小,但偏度、峰度以及降水質(zhì)心到流域出口的距離的SHAP值相對較高,反映出降水的空間分布對徑流的影響較為顯著。為進(jìn)一步分析降水質(zhì)心到流域出口的距離對徑流的影響,在枯水期選擇了該特征值較低和較高2個時間段的數(shù)據(jù)進(jìn)行SHAP分析。結(jié)果表明,當(dāng)降水質(zhì)心距離流域出口較近時,該特征的SHAP值更高,水流匯集路徑短,使其對徑流形成的貢獻(xiàn)更大;當(dāng)降水質(zhì)心距離流域出口較遠(yuǎn)時,過去7d面平均降水量的SHAP值顯著增大,表明當(dāng)水流需要更長的時間匯集到出口時,前期降水累積量對徑流形成的影響更為突出。
4結(jié)論
本文基于LSTM模型,結(jié)合不同的降水特征提取與輸入方案開展徑流預(yù)測研究,主要結(jié)論如下:
(1)通過卷積層直接處理二維降水圖像可較好捕捉洪峰流量及峰時特征,但高維數(shù)據(jù)導(dǎo)致模型復(fù)雜、易過擬合,進(jìn)而影響低流量條件下的預(yù)測表現(xiàn)。
(2)利用小波分解提取多尺度統(tǒng)計特征能在一定程度上簡化數(shù)據(jù)結(jié)構(gòu),并提高模型穩(wěn)定性,但當(dāng)結(jié)合卷積層時,效果不如單純利用LSTM模型捕捉小波特征的關(guān)系;相比之下,直接提取全局統(tǒng)計指標(biāo)(如面平均值、標(biāo)準(zhǔn)差、偏度和峰度)不僅降低了模型復(fù)雜度,而且在兼顧空間信息的同時取得了更優(yōu)的綜合預(yù)測效果。
(3)將流域按不同標(biāo)準(zhǔn)進(jìn)行區(qū)域劃分后,分別提取各區(qū)域降水均值,能更充分地反映降水空間異質(zhì)性?;诤拥赖燃壔虺隹诰嚯x的分區(qū)方法分別在高流量和低流量情景下展現(xiàn)出針對性優(yōu)勢。結(jié)合土地利用、土壤類型和地形特征的HRU劃分,在捕捉下墊面條件影響方面具有潛力,但過于細(xì)致的區(qū)域劃分則可能導(dǎo)致模型過擬合,適當(dāng)?shù)暮喕兄谔嵘夯芰Α?/p>
不同的降水空間處理方式對徑流預(yù)測的適用性各有側(cè)重,合理的特征提取和區(qū)域劃分策略能在降低模型復(fù)雜度的同時提升預(yù)測精度和泛化能力,為流域水文預(yù)測提供有益參考。