中圖分類號:P333.1 文獻(xiàn)標(biāo)識碼:A文章編號:0439-8114(2025)05-0070-10DOI:10.14088/j.cnki.issn0439-8114.2025.05.011開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
Application of LSTM and EnKF methods in agricultural soil rainfall-runoff simulation
LINLin 1 ,GAO Zhao-tian1,DINGYi-jia1,HU Xiao-long1,ZHANG Zhong-bin2 (1.Schoolof Water Resources and Hydropower Engineering,Wuhan University,Wuhan 43oo72,China; 2.Instituteof Soil Science,ChineseAcademyof Sciences,Nanjing211135,China)
Abstract:Terelatioshipetwenrainfallandrunoffisofgreatsgnificaceforteallcationofwaterresourcsandtheprotetionof waterandlandresousiagriculuralareas,utitisfult todealwithteainfall-unofprossunderdiferentlndueypes insmall watersheds.Thelongshort-termmemorymodel(LSTM)andtheXin'anjiangmodelcombinedwithensembleKalmanfilter (EnKF)technologywereusedtoexplorethesimulatioefectivenessofdata-drivenmachinelearning(ML)modelonrainfal-runoff processunderdiferentlandusepaterns,andthesimulationefectiveness wascomparedwiththatofSWAThydrological model.The estimationefectivenesofEnKFonhdrologicalparametersensemblesinheXin'njangmodelandthepattsoffilestiated parameters werestudied,andterunoffprocessesfordiferenagriculturallndusetypesbasedonthecalibratedparametersweresimulated.Theresultsshowedthattherunoffvaluewaseasiertolearninthecaseofhighrunoffwithaslightlysmallslopeandthelowrunoffprocess ithalargeslope.ThesimulationaccuracyandstabilityoftheSWATmodelwerenotasgodas thoseoftheLSTMmodel, butSWATmodelcouldreflctthelocalsoilhydrologicalconditionstoacertainextent,whichwasconvenientforgeneticanalyis.The EnKFtechologyhadthefunctionsofparameterupdateandparameterestimation,whchcouldoptimizetheunoffsimulatiofectiveness of the Xin'anjiang model.
KeyWords:ainfallrunofsiulation;datadriven;dataassiilation;LSTM;EnKF;Xinaangmodel;landusepae;ptiie forecasting
中國南方小流域的紅壤區(qū)生態(tài)系統(tǒng)面臨著嚴(yán)重的水土流失、土壤酸化、肥力退化、季節(jié)性干旱及土壤污染等問題[12],是由于該區(qū)域降雨時(shí)空分布不均勻以及不合理的開發(fā)利用,因此研究區(qū)域內(nèi)氣候、植被、土壤等對降雨徑流有影響的因素成為土壤生態(tài)環(huán)境等領(lǐng)域的熱門話題
隨著科技的不斷發(fā)展,數(shù)據(jù)處理與機(jī)器學(xué)習(xí)等技術(shù)提高了各類模型的精度與構(gòu)建效率。SWAT模型作為分布式水文模型,其構(gòu)建基于真實(shí)的物理關(guān)系,較為符合物理水文過程,但需要大量數(shù)據(jù)支持;長短期記憶(LSTM)模型基于數(shù)據(jù)驅(qū)動,采用機(jī)器學(xué)習(xí)方法,建模過程簡便,效率更高[3]。田燁等[4]運(yùn)用LSTM及其幾種變體模型對湘江流域進(jìn)行模擬。江明等5對長江源日徑流進(jìn)行模擬;Kratzert等運(yùn)用LSTM模型對各種集水區(qū)的降雨徑流進(jìn)行模擬。這些研究展示出了將機(jī)器學(xué)習(xí)方法運(yùn)用在水文預(yù)測領(lǐng)域中的巨大潛力。無論是單獨(dú)的水文模型還是機(jī)器學(xué)習(xí)方法在模擬降雨徑流時(shí)都會有一定的局限性。單獨(dú)的水文模型在提升效率與精度時(shí)非常困難,而單獨(dú)的機(jī)器學(xué)習(xí)方法可能會導(dǎo)致建構(gòu)的模型過擬合。因此,對于降雨徑流的模擬一種思路是結(jié)合水文模型與機(jī)器學(xué)習(xí)方法改進(jìn)模型,常見的結(jié)合方法是耦合,如徐嘉遠(yuǎn)等使用時(shí)變增益模型與機(jī)器學(xué)習(xí)結(jié)合即TVGM-LSTM耦合模型達(dá)到了較好的效果;另外一種是將兩種方法進(jìn)行對比研究,這對改進(jìn)模型會有很大的幫助,在Shrestha等8的研究中充分證明了這一點(diǎn)。
在理論價(jià)值層面上,獲得準(zhǔn)確的水文模型參數(shù)可以在洪水預(yù)報(bào)、灌區(qū)管理中高精度地模擬徑流過程。水文模型中,一般認(rèn)為參數(shù)由流域下墊面的性質(zhì)決定,而不是時(shí)間函數(shù)。隨著水文科學(xué)的發(fā)展,一些水文模型對物理過程的描述在變得更準(zhǔn)確的同時(shí),也變得更復(fù)雜且包含更多的參數(shù)。農(nóng)作物生長周期內(nèi)需水量和氣候的變化等可能導(dǎo)致下墊面物理特性的變化,從而給先驗(yàn)的水文模型參數(shù)帶來誤差。同時(shí),水文模型中大部分參數(shù)由下墊面特性直接估計(jì)非常困難,因此為了得到準(zhǔn)確的參數(shù)往往需要利用長時(shí)間序列水文數(shù)據(jù)選擇最優(yōu)化算法進(jìn)行參數(shù)率定。另外,用于參數(shù)率定的數(shù)據(jù)不可避免地存在一定的觀測噪聲[0]。在水文模型中加入?yún)?shù)實(shí)時(shí)更新的功能能較好地解決上述問題[1]。Gong等[2]使用集合卡爾曼濾波(EnKF)將需要估計(jì)的參數(shù)與水文狀態(tài)組成聯(lián)合向量,利用觀測的水文數(shù)據(jù)對參數(shù)進(jìn)行估計(jì),并在預(yù)報(bào)中證明了該方法的適用性和實(shí)用性。Evensen[13]在將擴(kuò)展卡爾曼濾波應(yīng)用于Quasi-Geostrophic模型時(shí)發(fā)現(xiàn)了擴(kuò)展卡爾曼濾波發(fā)散的原因,提出集合卡爾曼濾波,消除了由誤差協(xié)方差方程中過于簡單化的閉包引起的擴(kuò)展卡爾曼濾波中誤差無限增長導(dǎo)致的發(fā)散現(xiàn)象。后續(xù)有研究也認(rèn)為集合卡爾曼濾波在性能上優(yōu)于擴(kuò)展卡爾曼濾波,之后仍不斷有研究者嘗試對集合卡爾曼濾波進(jìn)行改進(jìn)和完善[14]
本研究針對徑流小區(qū)展開,主要包括兩部分,一是運(yùn)用物理模型SWAT與機(jī)器學(xué)習(xí)方法LSTM模型研究徑流小區(qū)不同土地利用方式下的降雨徑流過程,比較單農(nóng)業(yè)區(qū)域與農(nóng)林復(fù)合區(qū)域間降雨徑流的差異,針對性給出具體小區(qū)內(nèi)的降雨徑流;二是構(gòu)建新安江模型,將不同類別的參數(shù)作為整體來研究其在集合卡爾曼濾波參數(shù)估計(jì)過程中的規(guī)律或?qū)δM結(jié)果的影響,并用所建立的模型和集合卡爾曼濾波方法估計(jì)得到的參數(shù)進(jìn)行不同土地利用方式下徑流小區(qū)的降雨徑流過程模擬及參數(shù)估計(jì),以期更精確地對流域內(nèi)各土地利用方式進(jìn)行水資源調(diào)度與水土保護(hù)。
數(shù)據(jù)與方法
1.1 試驗(yàn)地概況
選擇江西鷹潭市劉墾艾家小流域的徑流小區(qū)(圖1),即艾家花生地、余家花生地、橘園農(nóng)林復(fù)合地(以下簡稱橘園地)小區(qū)各兩個(gè)坡位作為研究區(qū)域,其中艾家花生地為 50m2 的小區(qū),其他4個(gè)徑流小區(qū)均為 100m2 的小區(qū)。各土地利用方式的徑流小區(qū)又分為上坡和下坡,其中艾家花生地分為中坡和下坡。
研究區(qū)處于武夷山與鄱陽湖間的過渡區(qū)域,土壤類型為紅壤土。該地區(qū)屬于中亞熱帶溫暖濕潤季風(fēng)氣候,具有降雨充沛、光照充足、四季分明的特點(diǎn)。年均日照時(shí)長 1868h ,多年平均太陽能輻射總量為453.964kJ/cm2 ,年均氣溫 17.6°C ,年均降水量為1786.1mm ,降雨分布不均,7一9月高溫少雨且蒸發(fā)較高。在幾個(gè)徑流小區(qū)內(nèi)坡度大致分布在 4°~6° ,其中上坡和中坡坡度在 4°~5° ,下坡坡度在 5°~6° 。區(qū)域內(nèi)作物主要為水稻、花生與柑橘等。本研究主要研究花生與柑橘對降雨徑流的影響。
1.2 數(shù)據(jù)及來源
數(shù)據(jù)包括艾家小流域2005年1月至2006年8月的降雨數(shù)據(jù)、地表徑流數(shù)據(jù)以及日蒸發(fā)數(shù)據(jù)。降雨數(shù)據(jù)有兩組,一組為通過雨量自動采集器收集,每隔10min 采集一次雨量數(shù)據(jù);另一組為人工記錄氣象數(shù)據(jù),主要用以補(bǔ)充雨量自動采集數(shù)據(jù)中的缺失值。各徑流小區(qū)的徑流數(shù)據(jù)通過翻斗儀記錄,得到的數(shù)據(jù)轉(zhuǎn)換為徑流深。蒸發(fā)數(shù)據(jù)來源于E20蒸發(fā)皿的實(shí)測數(shù)據(jù),在實(shí)際運(yùn)用中將其轉(zhuǎn)化為實(shí)際蒸發(fā)量。
1.3 研究方法
1.3.1SWAT模型土壤水分評估工具SWAT是美國農(nóng)業(yè)部開發(fā)的適用于評估土壤非點(diǎn)源污染的模型[15],在研究水文響應(yīng)過程中有廣泛的運(yùn)用。在SWAT模型中,主要通過徑流曲線(SCS-CN)方法或Green-Ampt入滲曲線法來模擬地表徑流過程。SCS-CN法是20世紀(jì)美國農(nóng)業(yè)部水土保持局根據(jù)大量資料整理概括總結(jié)出的經(jīng)驗(yàn)?zāi)P停撃P徒Y(jié)構(gòu)簡單,參數(shù)較少,被廣泛使用。其徑流曲線數(shù)(CN)反映了土壤類型、土地利用、水文條件以及前期水分條件等對地面徑流有影響的各種流域特征,能很好地模擬不同流域的地面徑流過程。
為了率定和檢驗(yàn)?zāi)P蛥?shù),將每個(gè)徑流小區(qū)的數(shù)據(jù)按照 75% 與 25% 的比例分為模型率定期和檢驗(yàn)期兩組數(shù)據(jù)。本研究采用反推法中的算術(shù)平均值法來推算 CN ,在率定SCS-CN標(biāo)準(zhǔn)曲線的參數(shù)時(shí),將率定期實(shí)測降雨徑流數(shù)據(jù)分別輸入方程(1),計(jì)算出每日降雨徑流關(guān)系中所對應(yīng)的土壤最大儲水量,而后根據(jù)方程(2)求出其對應(yīng)的CN并求平均值,得到率定結(jié)果。在此過程中,初損率(入)假定為0.2。此外,在對各土地利用方式進(jìn)行模擬時(shí)應(yīng)假定初損率,但在不同的土地上初損率可能會有差異,為了優(yōu)化建立的模型,采用試錯法來不斷尋找最優(yōu)入與CN 。在優(yōu)化過程中,將目標(biāo)函數(shù)設(shè)置為使納什效率系數(shù)(Nash-Sutcliffe efficiency coefficient, NSE 最大時(shí)為最優(yōu)參數(shù),其中 CN 取值范圍為 0~100,λ 取值范圍為0.095\~0.300。
式中, s 為土壤最大儲水量, R 為總降雨量, Q 為區(qū)域地表徑流量。
1.3.2LSTM模型LSTM是基于門控的循環(huán)神經(jīng)網(wǎng)絡(luò),基本單元為細(xì)胞,其主要結(jié)構(gòu)是4個(gè)交互的神經(jīng)網(wǎng)絡(luò)層和3個(gè)門控單元[3-6]。這3個(gè)門控單元分別為遺忘門 (ft) 、輸入門 (it) 和輸出門 (ot) ,交互的神經(jīng)網(wǎng)絡(luò)層是向量積與向量和,用以控制數(shù)據(jù)信息的流動,使數(shù)據(jù)有選擇性地通過,LSTM的細(xì)胞結(jié)構(gòu)及門控如圖2所示,其中, Ct-1 和 Ct 為細(xì)胞狀態(tài), ht-1 和 ht 為狀態(tài)矩陣, σ 為映射函數(shù), tanh 為激活函數(shù)。
LSTM模型包含多個(gè)參數(shù),這些參數(shù)的選取會給模擬結(jié)果帶來較大的影響,也被稱為超參數(shù)。在訓(xùn)練模型前,需要確定各個(gè)超參數(shù),才能更好地進(jìn)行模型訓(xùn)練,結(jié)果也相對準(zhǔn)確。在該模型中對模型精度有影響的超參數(shù)有神經(jīng)網(wǎng)絡(luò)層數(shù)、神經(jīng)元數(shù)量、迭代次數(shù)與模型最小訓(xùn)練批次,影響總損失的超參數(shù)有學(xué)習(xí)率、優(yōu)化算法與損失函數(shù),影響模型運(yùn)行時(shí)間的超參數(shù)有迭代次數(shù)與模型最小訓(xùn)練批次。本研究將神經(jīng)網(wǎng)絡(luò)層數(shù)設(shè)置為1,并采用貝葉斯優(yōu)化法對其余幾個(gè)超參數(shù)進(jìn)行尋優(yōu),找到最優(yōu)參數(shù)組合訓(xùn)練模型。同樣將所獲數(shù)據(jù)的 75% 劃分為LSTM模型的訓(xùn)練集, 25% 劃分為LSTM模型的測試集,在進(jìn)行貝葉斯優(yōu)化時(shí),將訓(xùn)練集數(shù)據(jù)作為樣本輸入,選擇高斯分布作為先驗(yàn)?zāi)P停O(shè)定合適的自標(biāo)函數(shù)(式3)得到最佳參數(shù)組合。
式中 ?f 為目標(biāo)函數(shù), Oj 為實(shí)測值中第 j 個(gè)事件, Pj 為第 j 個(gè)事件的模擬值, O?m 為實(shí)測序列的均值, n 為序列長度。
1.3.3新安江模型研究采用改進(jìn)后的三水源新安江模型,其在蒸發(fā)、土壤水分、徑流劃分以及坡面匯流等方面有詳盡的計(jì)算[16]。在下滲方面,采用蓄滿產(chǎn)流概念計(jì)算降雨產(chǎn)生的總徑流,并考慮了流域蓄水曲線對產(chǎn)流面積變化的影響。在土壤水分方面,將土壤中的水分劃分為張力水(田間持水量以下的水)和自由水(田間持水量以上的水),分別考慮二者的調(diào)蓄作用。在蒸發(fā)計(jì)算中,將張力水分為上層、中層和下層,并分別計(jì)算蒸發(fā)量。在徑流劃分方面,采用山坡水文學(xué)產(chǎn)流理論,使用具有有限容積、側(cè)孔和底孔的自由水蓄水庫將總徑流劃分為飽和地面徑流、壤中水徑流和地下水徑流。在匯流計(jì)算中,地面徑流計(jì)算通常采用單位線法,而壤中流和地下徑流的匯流計(jì)算則采用線性水庫法。小流域的降雨、徑流和蒸發(fā)觀測資料時(shí)間長度為577d,研究選取前365d的數(shù)據(jù)作為新安江模型訓(xùn)練集。
1.3.4EnKF技術(shù)為了在非線性模型系統(tǒng)中實(shí)現(xiàn)狀態(tài)向量的實(shí)時(shí)更新功能, EnKF 技術(shù)設(shè)定了一個(gè)隨機(jī)生成的起始狀態(tài)向量集合,其中狀態(tài)向量協(xié)方差矩陣 (Pt) 的計(jì)算式如下。
式中, E 為期望值, 為 Φt 時(shí)刻狀態(tài)向量帶有先驗(yàn)誤差的值,
為
的平均值。下一時(shí)刻的估計(jì)狀態(tài)為:
xt+1=Mxt+Et
式中, xt+1 和 xt 表示 t+1 和 χt 時(shí)刻的狀態(tài)向量, M 表示非線性預(yù)測模型的狀態(tài)轉(zhuǎn)移矩陣, Et 表示 Φt 時(shí)刻的期望值。
在新安江模型中,狀態(tài)向量集合卡爾曼濾波可以實(shí)現(xiàn)隨時(shí)間更新參數(shù)的功能。由于水文模型的大部分參數(shù)隨徑流模擬歷時(shí)的增加變化并不大,因此隨著集合卡爾曼濾波對聯(lián)合狀態(tài)向量的更新、時(shí)間步長的增加,待估參數(shù)將逐漸收斂至某個(gè)值的附近。除了參數(shù)的實(shí)時(shí)更新,狀態(tài)向量集合卡爾曼濾波還具有根據(jù)參數(shù)的先驗(yàn)分布估計(jì)參數(shù)的功能。聯(lián)合狀態(tài)向量集合卡爾曼濾波的計(jì)算式中,預(yù)測后驗(yàn)值計(jì)算式如下。
式中, Z 為將狀態(tài)向量轉(zhuǎn)換為觀測值的轉(zhuǎn)移矩陣; yt 為觀測向量; 為加人觀測信息后的聯(lián)合狀態(tài)向量預(yù)測值;
是聯(lián)合狀態(tài)向量先驗(yàn)預(yù)測值; Kt 為卡爾曼增益矩陣。
和 Kt 的計(jì)算式如下。
Kt=PtZT(ZPtZT+Pt)
式中 Ist 為第 s 個(gè)待估參數(shù)在 Φt 時(shí)刻的向量集合;n 為估計(jì)參數(shù)的總數(shù); Pt 為狀態(tài)向量預(yù)測值誤差和觀測值誤差的協(xié)方差矩陣。
在基于EnKF技術(shù)的新安江模型訓(xùn)練階段,通過計(jì)算 NSE 評估EnKF技術(shù)在參數(shù)更新上的適用性,計(jì)算相關(guān)系數(shù)(COR)判斷參數(shù)和流量的相關(guān)性。參數(shù)率定完成后,利用余下212d的觀測數(shù)據(jù)作為測試集,根據(jù)率定的最優(yōu)參數(shù)計(jì)算每日徑流量,并依據(jù)實(shí)測流量資料計(jì)算NSE,評價(jià)EnKF技術(shù)在參數(shù)估計(jì)上的適用性。
2 結(jié)果與分析
2.1 SWAT模型和LSTM模型的對比結(jié)果
圖3為利用SCS-CN法得到的各徑流小區(qū)降雨量與徑流關(guān)系及徑流預(yù)測情況,表1為降雨量與徑流模擬情況的NSE和RMSE(均方根誤差)。從圖3和表1可以看出,徑流實(shí)測序列與預(yù)測序列變化趨勢大致相同,這表明對于小區(qū)域來講,土壤自身蓄水能力不強(qiáng),降雨量與徑流之間物理對應(yīng)關(guān)系簡單,在使用物理模型時(shí)可以得到較好的模擬結(jié)果。但因?yàn)槟P徒Y(jié)構(gòu)簡單,在對部分極端情況進(jìn)行預(yù)測時(shí)無法考慮各種因素的影響從而產(chǎn)生較大偏差,如高降雨量低徑流以及低降雨量高徑流情況
基于貝葉斯優(yōu)化的LSTM模型在給定的超參數(shù)范圍內(nèi)進(jìn)行尋優(yōu)分別求得適合于每個(gè)徑流小區(qū)的超參數(shù)組合,見表2。該模型學(xué)習(xí)了訓(xùn)練集中的有效信息,并根據(jù)交叉驗(yàn)證使得其能夠有很好的泛化性,使其在測試集中能夠較好地預(yù)測徑流。在測試集中預(yù)測并計(jì)算各評價(jià)指標(biāo),結(jié)果見表3。從模型評價(jià)參數(shù)看,當(dāng)運(yùn)用LSTM對這6個(gè)徑流小區(qū)降雨徑流過程進(jìn)行模擬時(shí),模型預(yù)測徑流的效果均有較好的表現(xiàn)。進(jìn)一步研究發(fā)現(xiàn),雖然模型有一定的泛化性,但是泛化性并不是很強(qiáng),運(yùn)用訓(xùn)練集訓(xùn)練出的模型雖然在測試集上預(yù)測效果尚可,但對比訓(xùn)練集與測試集的NSE可以發(fā)現(xiàn),在測試集上的模擬效果與訓(xùn)練集相比還有一定的差距。
2.2基于EnKF技術(shù)的新安江模型參數(shù)擬合結(jié)果
選取新安江模型中全局敏感度較高的WUM(上層土壤蓄水容量) ??B (蓄水容量曲線指數(shù))和C(深層蒸散發(fā)系數(shù))的不同組合作為率定的目標(biāo)參數(shù)集合,這些參數(shù)體現(xiàn)了土壤不同位置的物理性質(zhì),將決定三水源新安江模型的蒸散發(fā)、線性水庫和匯流的計(jì)算結(jié)果,參數(shù)集合有 (WUM,C),(B,C) 和 (WUM,B,C) 。從圖4、圖5、圖6可以看出,對于 (WUM,C) ,同時(shí)達(dá)到參數(shù)穩(wěn)定的時(shí)間在 200~300d ;對于 (B,C) ,同時(shí)達(dá)到參數(shù)穩(wěn)定的時(shí)間也在 200~300d ;對于(WUM,B,C) ,同時(shí)達(dá)到參數(shù)穩(wěn)定的時(shí)間在 150~300d 。
表4為EnKF率定過程中的納什效率系數(shù)。從濾波角度來看,當(dāng)其中一個(gè)參數(shù)趨于穩(wěn)定狀態(tài)時(shí),另外的參數(shù)仍可能有較大的波動,對趨于穩(wěn)定狀態(tài)的參數(shù)產(chǎn)生影響。某個(gè)參數(shù)的集合卡爾曼增益會隨時(shí)間趨向于0,在這之前較大的波動會影響到其他參數(shù)的集合卡爾曼增益達(dá)到穩(wěn)定的速度。特別是敏感性較高的參數(shù)B,不僅受到WUM集合均值波動的影響,而且受到其他較高敏感性參數(shù)真實(shí)值波動的影響,而其又對徑流量的計(jì)算結(jié)果影響較大。
表5為多參數(shù)率定后測試集的納什效率系數(shù)。從參數(shù)的物理意義來看,WUM主要由土壤顆粒的粒徑、農(nóng)作物根系在土壤上層的分布范圍和發(fā)育程度決定, C 主要取決于農(nóng)作物根系在土壤中的深度和在深層土壤的分布范圍,這兩個(gè)參數(shù)的相關(guān)性較低,因此其中一個(gè)參數(shù)的波動對另外一個(gè)參數(shù)的影響較小。
2.3基于EnKF技術(shù)的新安江模型參數(shù)優(yōu)化后徑流模擬結(jié)果
根據(jù)參數(shù)估計(jì)規(guī)律和率定得到參數(shù) WUM,B 和
C ,構(gòu)建新安江模型對橘園地和花生地兩種不同土地利用類型下的6塊農(nóng)業(yè)小區(qū)徑流過程進(jìn)行模擬,計(jì)算每一歷時(shí)的土壤產(chǎn)流量,對比實(shí)測徑流進(jìn)行徑流模擬效果評價(jià),結(jié)果見表6和圖7。根據(jù)納什效率系數(shù)計(jì)算結(jié)果(表6),認(rèn)為由集合卡爾曼濾波率定得到的參數(shù)具有較好的實(shí)用性。
集合卡爾曼濾波對新安江模型中的參數(shù)WUM、B 和 C 都具有較好的更新和估計(jì)效果,其中選用率定參數(shù)的模型徑流模擬效果優(yōu)于加人參數(shù)隨時(shí)間更新功能的模型。這主要是因?yàn)闉V波的初始分布與真實(shí)值有誤差,參數(shù)收斂至真實(shí)值需要一定的時(shí)間,在這之前參數(shù)集合均值的隨機(jī)波動影響了徑流模擬的精度;另外,新安江模型的參數(shù)隨時(shí)間變化不大,參數(shù)與真實(shí)值誤差較小,可以達(dá)到較好的模擬效果,這也說明參數(shù)更新階段參數(shù)收斂到的數(shù)值接近參數(shù)的真實(shí)值。
3 討論
3.1 SCS-CN法和LSTM模型結(jié)果分析
在同樣的降水條件下,各預(yù)測徑流表現(xiàn)為艾家花生地最大,余家花生地次之,橘園花生地最小。從土地利用方式層面分析,一方面這種差異與種植作物類型有關(guān),花生地中僅種植花生,同樣降雨條件下,作物需水量較少,橘園地中為農(nóng)林復(fù)合型種植方式,柑橘樹與花生共同吸收水分,減少了徑流的產(chǎn)生;同時(shí)艾家花生地遠(yuǎn)離橘園地,受橘園地影響較小,因此兩花生地中艾家花生地相對產(chǎn)流較多;另一方面橘園增加了植被的截流,使得滲入地下補(bǔ)充地下蓄水的水量減少,減緩了產(chǎn)流的時(shí)間,對日徑流產(chǎn)生了一定的影響。從模型預(yù)測效果看,橘園地與余家花生地效果要優(yōu)于艾家花生地,這在一定程度上依賴于林地對土壤水分的保持作用,使土壤條件相對穩(wěn)定,降雨量與徑流的關(guān)系在不同時(shí)期沒有產(chǎn)生變化,使模型在不同日期上泛化性較強(qiáng)。
各土地利用方式在相同降水條件下,上坡(艾家花生地為中坡)預(yù)測徑流高于下坡。由于上坡坡度略低于下坡,以此推斷在坡度較大時(shí)產(chǎn)流較少。對于預(yù)測效果,在上坡的徑流關(guān)系模擬中對產(chǎn)流較大的過程能夠較為精確地預(yù)測,而在下坡中對產(chǎn)流較低的過程能夠給出更為精確的預(yù)測。
從模型評價(jià)指標(biāo)看,二者之間的區(qū)別在于LSTM模型模擬各小區(qū)的結(jié)果穩(wěn)定性較高,SCS-CN方法的泛化性較高,SCS-CN法的精度普遍較低,僅在個(gè)別徑流小區(qū)的模擬上有較高的精度。這體現(xiàn)了LSTM模型在數(shù)據(jù)量較少時(shí)的優(yōu)越性以及在不同條件下的穩(wěn)定性。但LSTM模型也有一定的缺陷,其超參數(shù)無法反映每個(gè)徑流小區(qū)內(nèi)的土壤條件等具體信息。雖然LSTM橫型模擬出了降雨量與徑流的關(guān)系,但對其具體成因的分析仍依賴于物理模型,在構(gòu)建物理模型過程中,率定出的超參數(shù)在一定程度上反映當(dāng)?shù)匾恍┯绊懸蛩丶捌渲g的關(guān)聯(lián)。
3.2基于EnKF技術(shù)的新安江模型模擬結(jié)果分析
集合卡爾曼濾波本質(zhì)上是貝葉斯估計(jì)在水文模型參數(shù)估計(jì)中的應(yīng)用,任意一個(gè)未知的模型參數(shù)可以被視為是服從某個(gè)正態(tài)分布的隨機(jī)變量,基于相似流域的參數(shù)和農(nóng)作物的信息給出這個(gè)分布的參數(shù),這是先驗(yàn)信息。將實(shí)測徑流量和降雨、蒸發(fā)數(shù)據(jù)視作抽樣樣本,在獲得樣本之后,基于貝葉斯公式,由總體分布、樣本和先驗(yàn)分布計(jì)算出模型參數(shù)的后驗(yàn)分布。隨著歷時(shí)增加,后驗(yàn)分布收斂于一個(gè)期望為真實(shí)值的隨機(jī)變量。
對含有多個(gè)參數(shù)的集合而言,分別率定每個(gè)參數(shù)的新安江模型相較于同時(shí)進(jìn)行多參數(shù)更新的模型有更好的徑流模擬效果,特別是當(dāng)集合由敏感性高、參數(shù)之間相關(guān)性強(qiáng)的參數(shù)組成時(shí),參數(shù)都趨于穩(wěn)定之前的徑流模擬效果并不好。達(dá)到收斂之后參數(shù)相對獨(dú)立,而達(dá)到收斂之前參數(shù)可能會互相影響,因此如果在新安江模型中同時(shí)率定多個(gè)參數(shù),選擇由不同下墊面和植被的特性決定的參數(shù)集合會有更好的模擬效果。
4 小結(jié)
本研究選取余家花生地、橘園地和艾家花生地
3塊不同區(qū)域,分別代表了林地附近的農(nóng)業(yè)用地、農(nóng)林復(fù)合地以及遠(yuǎn)離林地的農(nóng)業(yè)用地3種土地利用方式。首先對比了SWAT模型的SCS-CN法與LSTM模型對不同土地利用方式下降雨徑流的模擬預(yù)測效果,然后構(gòu)建了新安江水文模型,將不同類別的參數(shù)作為整體來研究其在EnKF參數(shù)估計(jì)過程中的規(guī)律,并據(jù)此模擬不同土地利用方式下徑流小區(qū)的降雨徑流過程。結(jié)果顯示,各評價(jià)指標(biāo)均在可接受范圍內(nèi),LSTM模型對徑流的預(yù)測效果優(yōu)于SWAT模型,同時(shí)發(fā)現(xiàn)雖然LSTM模型具有一定的泛化性,但是泛化性并不是很強(qiáng);EnKF對新安江模型中的參數(shù)WUM,B 和 C 都具有較好的更新和估計(jì)效果,徑流模擬效果較好,由于濾波的初始分布與真實(shí)值有誤差,參數(shù)收斂至真實(shí)值需要一定的時(shí)間,會波動影響徑流模擬的精度。
LSTM模型的超參數(shù)無法完全反映各徑流小區(qū)內(nèi)的土壤條件,因此仍需依賴物理模型進(jìn)行成因分析,率定的超參數(shù)在一定程度上體現(xiàn)了當(dāng)?shù)赜绊懸蛩丶捌湎嗷リP(guān)系。對于降雨徑流時(shí)間序列的預(yù)測,LSTM模型可以采用延長預(yù)見期的方式增加對徑流的預(yù)測效果?;贓nKF技術(shù)的新安江模型在達(dá)到收斂之后參數(shù)相對獨(dú)立,而達(dá)到收斂之前參數(shù)可能會互相影響,解決方法是同時(shí)率定多個(gè)參數(shù),選擇由不同下墊面和植被特性等所決定的參數(shù)集合會有更好的徑流模擬效果。
參考文獻(xiàn):
[1]翟婷,金鑫,郭攀,等.坡度及作物種類對紅壤坡耕地水土流失的影響研究[J].節(jié)水灌溉,2024(7):119-124.
[2]趙利祥,郭忠錄,聶小飛,等.極端降雨事件對南方紅壤區(qū)徑流和輸沙的影響——基于贛江支流濂江上游流域的長序列分析(1984—2020年)[J].湖泊科學(xué),2023,35(6):2133-2143.
[3」王靈子.基于數(shù)據(jù)驅(qū)動的渭河流域洪水模擬及系統(tǒng)研究[D].西安:西安理工大學(xué),2024.
[4]田燁,譚偉麗,王國慶,等.LSTM變體模型在徑流預(yù)測中的性能及其可解釋性[J].水資源保護(hù),2023,39(3):188-194.
[5]江明,魯帆,于嵩彬,等.基于LSTM深度學(xué)習(xí)方法的長江源日徑流預(yù)報(bào)研究[A].中國水利學(xué)會.2022中國水利學(xué)術(shù)大會論文集(第五分冊)[C].2022.266-273.
[6]KRATZERTF,KLOTZD,BRENNERC,etal.Rainfall-runoffmodelling using Long Short-Term Memory(LSTM) networks[J].Hydrology and earth system sciences,2018,22(11):6005-6022.
[7]徐嘉遠(yuǎn),鄒磊,夏軍,等.基于時(shí)變增益模型與LSTM耦合的白河流域徑流模擬[J].水資源保護(hù),2023,39(3):1-12.
[8]SHRESTHA SG,PRADHANANG SM.Performance of LSTMoverSWAT in rainfall-runoff modeling in a small,forested watershed:Acase studyofCork Brook,RI[J].Water,2023,15(23):4194.
[9]ARNOLD JG,F(xiàn)OHRER N. SWAT2OOO:Current capabilities andresearch opportunities in applied watershed modelling[J]. Hydrolog-ical processes,2005,19(3):563-572.
[10]GHARARI S,SHAFIEI M,HRACHOWITZ M,etal.A con-straint-based search algorithm forparameter identification of envi-ronmental models[J].Hydrology and earth system sciences,2014,18(12):4861-4870.
[11]XIE X,ZHANG D.Data assimilation for distributed hydrologicalcatchment modeling via ensemble Kalman filter[J].Advances inwater resources,2010,33(6):678-690.
[12]GONG J,WEERTS A H,YAO C,et al. State updating in a dis-tributed hydrological modelby ensemble Kalman filtering with er-ror estimation[J]. Journal of hydrology,2023,620:129450.
[13]EVENSEN G. Open boundary-conditions for the extended kalmanfilter with a quasi-geostrophic ocean model[J]. Journal of geophys-ical research,1993,98(9):529-546.
[14]BAUSERHH,BERGD,KLEIN O,et al. Inflation method forensemble kalman filterin soil hydrology[J].Hydrologyand earthsystem sciences,2018,22(9):4921-4934.
[15]ZHAOJ,ZHANGN,LIU ZC,etal. SWAT model applications:From hydrological processes to ecosystem services[J]. Science ofthe total environment,2024,931:172605.
[16]李巧玲,劉興文,李致家,等.多源多層土壤濕度實(shí)時(shí)同化及在實(shí)時(shí)洪水預(yù)報(bào)中的應(yīng)用[J].水科學(xué)進(jìn)展,2024,35(5):773-783.
(責(zé)任編輯 呂海霞)