• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    資料長度對深度學(xué)習(xí)方法日徑流預(yù)報效率的影響

    2023-12-29 00:00:00楊錕張文江宋克超
    人民長江 2023年3期

    摘要:

    長短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)方法具有顯著的時序分析能力,在徑流預(yù)報方面有其獨特的優(yōu)勢,但該模型預(yù)報的最優(yōu)輸入輸出長度組合尚不太明確,探析不同輸入輸出長度對LSTM日徑流預(yù)報效率的影響對相關(guān)應(yīng)用具有實際意義。以四川省西部大渡河、雅礱江、岷江支流以及嘉陵江上游等流域為研究區(qū),選取了20個子/區(qū)間流域,試驗不同長度的前期輸入資料預(yù)報不同預(yù)見期下的徑流,研究了不同資料長度下LSTM模型的日徑流預(yù)報效率,分析了該方法在不同流域的適用性與最優(yōu)輸入輸出長度的特征。結(jié)果表明:①以前期降水、氣溫以及徑流作為輸入,前期資料長度對預(yù)報結(jié)果影響不太明顯,但預(yù)報準(zhǔn)確性會隨預(yù)見期延長而下降,采用該種輸入方案的預(yù)見期不宜超過7 d;②僅以前期降水、氣溫資料作為輸入,預(yù)報準(zhǔn)確性會隨前期資料長度增加而提高,也會隨預(yù)見期的延長而下降,建議該種方案的資料長度大于7 d、預(yù)見期最好為1 d,不宜超過3 d;③徑流變異性是顯著影響預(yù)報效率和最優(yōu)輸入輸出長度組合的重要因子,變異性強,則預(yù)報效果較差,對輸入輸出長度的敏感性偏弱。研究成果可為提高深度學(xué)習(xí)徑流預(yù)報效率提供參考,有助于結(jié)合流域特性確定適用的輸入輸出長度組合方案。

    關(guān) 鍵 詞:

    徑流預(yù)報; 資料長度; 預(yù)見期長度; LSTM; 深度學(xué)習(xí)

    中圖法分類號: TV124

    文獻(xiàn)標(biāo)志碼: A

    DOI:10.16232/j.cnki.1001-4179.2023.03.013

    0 引 言

    徑流預(yù)報是水文水資源分析的重要內(nèi)容,也是洪澇預(yù)警、流域調(diào)度的關(guān)鍵環(huán)節(jié)。神經(jīng)網(wǎng)絡(luò)為徑流預(yù)報提供了一類基于統(tǒng)計的簡單靈活方法[1-4]。其中,長短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)模型,在序列數(shù)據(jù)擬合上有其獨特的優(yōu)勢,已經(jīng)被廣泛應(yīng)用于徑流預(yù)報和模擬中,展現(xiàn)了良好的預(yù)報性能[5-8]。

    LSTM模型能夠?qū)W習(xí)信息之間的長期依賴關(guān)系,在融雪徑流和匯流時間較長的流域,預(yù)報效果比較理想,但在氣候條件極端的流域,預(yù)報效果不太理想[9-13]。Kratzert等[12]采用241個流域檢測了LSTM的預(yù)報潛力,其中只有半數(shù)流域納什效率系數(shù)(NSE)達(dá)到0.65,其余流域大多位于干旱區(qū)域,預(yù)報效果不太理想,低估了徑流峰值。Boulmaiz等[13]采用20個流域來測試訓(xùn)練數(shù)據(jù)長度對預(yù)報效果的影響,表明了日尺度徑流預(yù)報需要9~12 a的訓(xùn)練數(shù)據(jù)才能保證預(yù)報效果。而在其多次測試的結(jié)果中,有3個流域的預(yù)報效果始終不太理想,這是由于輸入數(shù)據(jù)中存在極端事件,使得LSTM模型難以從稀少的極端事件中捕捉到準(zhǔn)確的時序信息??梢?,模型的預(yù)報性能可能會受到流域的地理、氣候等自然特征影響;在模型中拓展體現(xiàn)流域特征的物理模塊或參數(shù),可以提高模型的預(yù)報性能[14-15]。但也有學(xué)者指出,LSTM模型從根本上無法嚴(yán)謹(jǐn)?shù)貙W(xué)習(xí)水量平衡的規(guī)律,因而不太可能模擬完備的實際物理規(guī)律[16]。

    作為數(shù)據(jù)驅(qū)動模型,LSTM模型的預(yù)報效果與輸入數(shù)據(jù)息息相關(guān)。不同長度的前期資料輸入得到的預(yù)報結(jié)果存在差異[17],要使預(yù)報準(zhǔn)確率達(dá)到最優(yōu),需要一定長度的資料來確保模型能夠提取到足夠的信息,如王萌[7]的研究中資料長度為75 d。同時,預(yù)見期也是影響模型預(yù)報效果的重要因子。一般地,預(yù)見期增加,模型預(yù)報效果會下降[5-6,18-19],陶思銘等[18]初步探索了預(yù)見期的影響,表明預(yù)見期在18 d內(nèi),模型預(yù)報的相對誤差絕對值的平均值可維持在20%以下。

    可見,LSTM模型的徑流預(yù)報效率同輸入輸出長度有直接的內(nèi)在聯(lián)系,探究其規(guī)律有助于確定適用的資料輸入方案。為此,本文以大渡河及臨近流域為研究區(qū),探究不同長度前期輸入的日徑流預(yù)報效率及其同預(yù)見期的關(guān)系,分析不同資料組合方案對LSTM模型輸入輸出長度的敏感性,并研究該敏感性的影響因子。

    1 數(shù)據(jù)及研究方法

    1.1 研究區(qū)及資料選取

    本文選取了位于四川省西部的大渡河、雅礱江、岷江的支流,以及嘉陵江上游區(qū)域為研究區(qū),經(jīng)緯度在26.6°N~34.7°N,96.8°E~107.1°E之間(見圖1)。研究區(qū)屬于山區(qū)流域,海拔變化大(1 000~5 000 m),以亞熱帶季風(fēng)氣候為主。徑流主要由降雨形成,部分由融雪、地下水補給;年際變化不大,年內(nèi)變化曲線多呈雙峰,峰值出現(xiàn)在7月和9月。大渡河下游及青衣江流域位于暴雨區(qū),徑流隨暴雨發(fā)生而陡漲陡落;所選嘉陵江上游區(qū)域狀似扇形,汛期徑流陡漲,洪水峰高歷時短。

    本文所用數(shù)據(jù)來自水文站點和氣象站日尺度的實測數(shù)據(jù)。對水文站點的徑流數(shù)據(jù)進(jìn)行篩選整理,剔除缺漏嚴(yán)重或異常較多的站點和年份,最終挑選了20個水文站點中較為可靠的數(shù)據(jù)序列,并依據(jù)站點位置劃分了20 個子流域(流域按站名命名)。所選流域包括典型山區(qū)流域、暴雨山區(qū)流域、亞高山山區(qū)流域幾個類型。站點的具體情況如表1所列。

    氣象數(shù)據(jù)采用了研究區(qū)及其周邊的54個氣象站點的降水和氣溫資料,并以算術(shù)平均法計算子流域日尺度的面平均降水和面平均氣溫。

    此外,為降低不同類數(shù)據(jù)對模型計算權(quán)重的影響,加快模型的收斂速度,還預(yù)先對數(shù)據(jù)進(jìn)行了歸一化處理。

    1.2 模型方法

    長短時記憶網(wǎng)絡(luò)(LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的變體,通過增加的3個“門”,化解了RNN對長序列模擬乏力的問題。在日尺度徑流預(yù)報中,12 a的數(shù)據(jù)訓(xùn)練長度才能保證模型達(dá)到最優(yōu)[13]。本文試驗中各站的數(shù)據(jù)長度雖不同,但基本滿足訓(xùn)練和驗證的數(shù)據(jù)長度要求。

    本文設(shè)計了兩種輸入因子組合方案(見圖2):僅輸入前期面平均降水(P)和面平均氣溫(T)的PT方案,以及在PT方案基礎(chǔ)加上前期徑流(R)的PTR方案。以1,3,5,7,9,12,15,20,25,30 d作為輸入資料長度,預(yù)見期則按1~30 d進(jìn)行取值,得到300個資料長度和預(yù)見期長度組合。對各流域不同輸入因子方案的不同長度組合進(jìn)行訓(xùn)練、模擬,以檢驗LSTM模型在不同流域的適用性,探究資料長度對預(yù)報的影響,并找出不同資料長度下合適的預(yù)見期長度。

    參考其他研究[20-21]以及多次調(diào)試驗證,本文模型超參數(shù)設(shè)定方案如下:隱藏層輸出單元數(shù)(units)為64、批處理量(batch_size)為64、數(shù)據(jù)遍歷次數(shù)(epochs)為100。以均方誤差(MSE)作為模型訓(xùn)練過程中的損失函數(shù)。

    對輸出結(jié)果,本文采用納什效率系數(shù)(NSE)作為評價指標(biāo):

    NSE=1-ni=1(yobs,i-ymod,i)2ni=1(yobs,i-obs)2(1)

    式中:yobs,i為i時刻的觀測值;ymod,i為相應(yīng)的模型預(yù)報值;obs為觀測序列的平均值;n為預(yù)報序列長度。

    為降低由網(wǎng)絡(luò)隨機性帶來的誤差,對每一組合都獨立重復(fù)100次,以100次結(jié)果的均值作為該組合的最終評價指標(biāo)。

    2 結(jié)果與討論

    2.1 模擬結(jié)果

    不同輸入因子的組合方案在不同資料長度與預(yù)見期條件下得到的統(tǒng)計結(jié)果如圖3所示。

    對于PTR方案,前期資料長度對模型預(yù)報效率的影響微弱,以預(yù)見期1 d的情況為例,20個流域中有11個的NSE大于0.800,7個處于0.600~0.800區(qū)間,2個小于0.600,站點的NSE分布情況不受前期資料長度影響;20個站點的NSE平均值隨前期資料長度的延長而輕微下降,從1 d延長至30 d,NSE均值由0.823逐漸下降至0.809。

    相比PTR方案,PT方案下模型的預(yù)報效率整體下降,NSE均值在各輸入輸出長度組合下都更低。在該方案下,預(yù)報效率受資料長度的影響明顯,同樣以預(yù)見期1 d為例,隨著前期資料長度從1 d延長至30 d,20個流域的NSE分布情況逐漸右移,即NSE大于0.600的流域從0個逐漸增加至15個,NSE均值也由0.460逐漸升高至0.713。

    兩種方案,模型受預(yù)見期的影響都十分顯著。對圖3的統(tǒng)計結(jié)果進(jìn)行橫向比較,以前期資料長度30 d為例,預(yù)見期逐漸延長,NSE分布逐漸左移,NSE均值迅速下降,即預(yù)見期從1 d變?yōu)?,7,15,30 d,PTR方案下NSE均值由0.809下降至0.460,PT方案下由0.713 下降至0.458。

    并且,20個流域的預(yù)報效率差異顯著,受輸入輸出長度的影響程度不一。PTR方案,相同的輸入輸出長度條件下,NSE最大的流域與最小的相差值均超過0.5。以輸入資料長度7 d、預(yù)見期1 d的情況為例,NSE最大的是雅江流域為0.982,最小的是馬邊流域為0.460,相差0.522。

    綜合來看,為保證較好的預(yù)報效果,對于PT方案,前期資料長度應(yīng)大于7 d,預(yù)見期最好在3 d以內(nèi);對于PTR方案,預(yù)見期在7 d以內(nèi)仍可以使得的NSE均值在0.600以上。

    2.2 前期資料長度對預(yù)報效率的影響

    模型對不同類型的資料依賴程度不同,使得前期輸入長度對模型的影響因輸入方案而異。

    從產(chǎn)匯流來說,由于流域的調(diào)蓄作用,當(dāng)前時刻的降水在一段時間之后才能匯入河道而形成徑流。因此,某日降水可能會影響未來幾日的徑流;反之,某日的徑流量也會與前一時段的降水相關(guān)。所以,PT方案下,模型需要足夠長度的前期降水資料,才能較為準(zhǔn)確預(yù)報流域徑流,即模型預(yù)報效率會隨前期資料長度的延長而提高,并趨于穩(wěn)定(見圖4(a))。需注意的是,圖4中展示的是20個流域的均值,就單個流域而言,部分流域?qū)η捌谫Y料長度的依賴會稍弱,NSE能更容易達(dá)到0.600,也能更快趨于穩(wěn)定。整體而言,PT方案,前期資料長度達(dá)到7 d,才能保證大部分流域的NSE能達(dá)到0.600。

    輸入因子方案中加入徑流后(PTR方案),由于徑流序列的自相關(guān)性強,且包含的時序信息更豐富,前期徑流取代降水成為影響預(yù)報的主導(dǎo)因子。一般地,大部分流域除了洪水期,日徑流量變化不會太大,所以,僅僅前期1 d的徑流資料,就包含了前期及未來一定時段的水文過程信息(該時段的長短同流域產(chǎn)匯流響應(yīng)時長相關(guān)),繼續(xù)增加前期的徑流數(shù)據(jù),增加的新信息已十分有限。因此,該種方案下前期輸入長度對模型的影響被極大地削弱。如圖3和圖4所示,前期輸入的變化,對NSE的分布和均值的影響十分微弱。

    與預(yù)期結(jié)果不同,PTR方案下,延長前期輸入的長度,還可能會帶來負(fù)效益,如圖4(b)所示:預(yù)見期為1 d,前期輸入延長了29 d的情況下,NSE均值并未提升,反而略有下降(降了0.014)。這種情況的可能原因是:延長前期資料長度,增加的新信息可能有限,同時可能出現(xiàn)過多冗余信息。在深度學(xué)習(xí)方法中,冗余會導(dǎo)致信息權(quán)重的失真;被冗余“強調(diào)”的信息會得到更大權(quán)重,相應(yīng)地導(dǎo)致“其他信息”的權(quán)重在一定程度上降低。如果“其他信息”是有效信息,顯然冗余會給預(yù)報帶來負(fù)效益;反之,若“其他信息”是噪聲,則這種輸入的增加能抑制噪聲[22]。比如,圖4(b)中預(yù)見期為30 d的情況,NSE呈上升趨勢,由0.426升至0.460,輸入的增加對預(yù)報起了正效應(yīng)。一般地,利用相關(guān)系數(shù)、梯度提升決策樹、主成分分析法等方法,進(jìn)行數(shù)據(jù)降維處理和特征選擇,可以解決數(shù)據(jù)冗余的問題,提高運算速度[23-25]。

    整體而言,PTR方案下資料長度對預(yù)報效果的影響不大(對NSE的提升/降低不超0.05),但結(jié)合模型運算速度來看,應(yīng)限制前期輸入長度。

    2.3 預(yù)見期的選擇

    預(yù)見期越長,輸入的數(shù)據(jù)資料與要預(yù)報的徑流之間的相關(guān)性越弱,模型也就越難捕捉到時序的有效信息??傮w而言,延長預(yù)見期,預(yù)報難度加大,預(yù)報準(zhǔn)確性下降。

    PT方案下,LSTM模型獲得的信息偏少,對前期資料長度高度依賴。不同的前期資料長度下,模型的表現(xiàn)差異明顯,不同資料長度下合適的預(yù)見期長度不同,如圖5及表2所示。

    PTR方案下,模型受前期資料長度的制約極小。預(yù)報徑流的NSE與預(yù)見期之間大體滿足對數(shù)關(guān)系:

    NSE=-0.103ln(x)+0.806(2)

    式中:NSE為20個流域納什系數(shù)的平均值;x為預(yù)見期長度。

    綜合考慮下,為保證預(yù)報結(jié)果的準(zhǔn)確性,采用PT方案時,前期資料長度為15 d以內(nèi),預(yù)見期長度不宜超過3 d;30 d以內(nèi)不宜超過4 d。采用PTR方案時,預(yù)見期7 d以內(nèi)都能得到較為準(zhǔn)確的預(yù)報結(jié)果。

    2.4 徑流變異性對預(yù)報效率的影響

    PTR方案下,20個流域中有2個流域的NSE始終無法達(dá)到0.600,分別為馬邊和流沙河;有6個流域的NSE系數(shù)僅在預(yù)見期1 d的情況下,可以達(dá)到0.600,分別為紅旗、三磊壩、涪江橋、多營坪、夾江、略陽。

    圖6 展示了PTR方案資料長度7 d、預(yù)見期1 d下,流沙河流域徑流過程的預(yù)報。模型對徑流峰值部分存在嚴(yán)重的低估;放大圖還顯示,預(yù)報峰值要比實測值滯后1 d。

    流沙河流域徑流陡漲陡落,徑流的日間變化大,變異性強。如圖6所示,流沙河流域?qū)崪y降水與徑流位相是幾乎同步的,這說明流域產(chǎn)匯流速度較快,大部分降水水量在當(dāng)日即可達(dá)到出口斷面,匯流時間小于1 d;而對于日徑流預(yù)報來說,最小預(yù)見期為1 d。與林康聆等的研究結(jié)果類似,當(dāng)預(yù)見期大于匯流時間時,LSTM模型預(yù)報能力顯著變差[19]。

    對一場典型降水-徑流過程,一般地,流量過程線相對降水過程線有一定位相滯后,假設(shè)為1 d,那么LSTM模型學(xué)習(xí)到降水-流量時序規(guī)律后,能根據(jù)前一日的降水峰值,在次日預(yù)報出徑流峰值,得到較為準(zhǔn)確的徑流預(yù)報。但是,在日尺度的粗略時間分辨率下,暴雨小流域流沙河的降水-流量過程位相關(guān)系被掩蓋了,LSTM難以有效提取學(xué)習(xí)降水-徑流時序規(guī)律,導(dǎo)致暴雨洪水期預(yù)報效果不理想。

    可見,這種局限是由于資料的時間分辨率對流域徑流過程刻畫能力不足所致,流沙河日尺度的降雨、徑流資料無法體現(xiàn)流域徑流匯流過程的時序關(guān)聯(lián)規(guī)律,采用更詳盡的時序資料,則可能提高預(yù)報效果。

    不同流域受資料時間分辨率的限制程度不同,與流域徑流相鄰時段變化程度(徑流變異性)相關(guān)。為更好地刻畫流域的徑流變異特征,采用1 d時滯相關(guān)系數(shù)的倒數(shù)Vrunoff進(jìn)行量化:由原始徑流序列(R1,R2,R3,…,Rn)按1 d時滯生成兩列新的序列{R1,R2,R3,…,Rn-1}和{R2,R3,R4,…,Rn};兩個序列相關(guān)系數(shù)的絕對值越接近0,兩個序列的差異越大,Vrunoff也越大。

    Vrunoff=1R2delay,1=n-ji=1(Ri+1-1)2·n-ji=1(Ri-2)2n-ji=1(Ri+1-1)·(Ri-2)2(3)

    式中:Ri為第i時段的徑流量;Ri+1為第i+1時段的徑流量;n為數(shù)據(jù)的總時段數(shù);1為第1天到第n-1天的徑流平均值;2為第2天到第n天的徑流平均值。

    如圖7所示,日徑流預(yù)報的NSE同Vrunoff具有很強的相關(guān)性,PTR和PT兩種輸入方案的相關(guān)系數(shù)(R)分別為-0.858(plt;0.05)和-0.746(plt;0.05),徑流變異性在很大程度上決定了LSTM的模擬難度和效率。

    結(jié)合模擬結(jié)果,可將本文流域按照Vrunoff 分為3類:Vrunoff lt;1.05時,流域變異弱,徑流因子時序自相關(guān)性強,LSTM模型對輸入輸出長度高度敏感,最優(yōu)方案時NSE可達(dá)0.80以上;1.05≤Vrunofflt; 1.40時,流域徑流變異性較強,模型在此類流域的適用性一般,輸入輸出長度的變化會影響模擬效率,NSE可以達(dá)到0.60以上,甚至接近0.80,代表流域為巖潤、三磊壩、略陽、涪江橋、多營坪、紅旗、夾江;Vrunoff≥1.40時,流域徑流變異性強,模型在此類流域的適用性弱,對輸入輸出維度敏感性弱,NSE很難達(dá)到0.60,代表流域為流沙河、馬邊。

    大體上,徑流變異性與流域的匯流速度直接相關(guān)。一般地,流域面積大,匯流時間長,徑流變異性弱,Vrunoff小于1.05的11個流域中,除雜谷腦流域外,其余流域面積不小于10 000 km2;相應(yīng)地,馬邊、流沙河、紅旗3個流域的面積在2 000 km2以下,Vrunoff分別為1.54,1.46,1.34。同時,還受降雨條件影響,處于暴雨區(qū)的流域,徑流變異性更強:青衣江暴雨區(qū)的多營坪、夾江斷面以上雖然面積較大(約為10 000 km2),但變異性不弱,Vrunoff分別為1.29,1.38,大于巖潤流域(面積3 300 km2)的1.15。

    全球氣候的變化以及人類活動對流域的改造,如河流改道、水庫修建等,使得流域的特征發(fā)生變化,影響流域徑流變異性。利用部分站點2007~2013年數(shù)據(jù)對訓(xùn)練好的模型進(jìn)行測試。預(yù)見期5 d以內(nèi),除個別站點外,預(yù)報效果與原來無明顯差異;預(yù)見期大于5 d,預(yù)報效果略有下降,PTR方案NSE下降幅度集中在0.034~0.112,PT方案下集中在0.045~0.154。整體的變化趨勢不變,仍符合前文得到的輸入輸出長度影響LSTM日徑流預(yù)報效率的規(guī)律。

    3 結(jié) 論

    本文采用LSTM深度學(xué)習(xí)模型,由不同長度的前期降水、氣溫以及徑流資料,預(yù)報未來一定時期的日徑流。研究表明:以前期降水、氣溫和徑流作為輸入時,預(yù)報效率幾乎不受前期資料長度的影響,但會隨著預(yù)見期的延長而下降,最后趨于穩(wěn)定;預(yù)見期小于7 d,能夠滿足NSE達(dá)到0.60以上的要求。僅以前期降水、氣溫作為輸入時,預(yù)報效率隨前期輸入延長而提高,隨預(yù)見期延長而降低;前期輸入長度大于7 d、預(yù)見期小于3 d,能保證一半以上流域NSE達(dá)到0.60。

    采用LSTM模型進(jìn)行的日徑流預(yù)報效率及輸入輸出長度特征具有明顯的流域差異,主要影響因素為徑流變異性(Vrunoff),流域的徑流變異性越弱,模型預(yù)報效果越好。以Vrunoff為衡量指標(biāo),可大致將流域類型分為3類:Vrunofflt; 1.05,徑流變異性弱,模型模擬效果好,NSE能達(dá)0.60以上;Vrunoff≥1.40,徑流變異性強,模型模擬效果差,NSE難達(dá)0.60;在兩者之間,模型模擬效果一般,在合適的輸入輸出長度條件下,可以達(dá)到0.60以上。因此,制定徑流輸入輸出方案時,應(yīng)考慮徑流過程的變異性特征,以充分利用模型和資料的有效性。

    參考文獻(xiàn):

    [1] 劉攀,鄭雅蓮,謝康,等.水文水資源領(lǐng)域深度學(xué)習(xí)研究進(jìn)展綜述[J].人民長江,2021,52(10):76-83.

    [2] 陳劍飛,李勇,劉俊江,等.耦合陸面水文模型和機器學(xué)習(xí)方法的水庫徑流量預(yù)報及應(yīng)用[J].氣象研究與應(yīng)用,2022,43(1):1-7.

    [3] 李瑤.基于機器學(xué)習(xí)的黃河源區(qū)月徑流模擬與中長期預(yù)報研究[D].北京:中國地質(zhì)大學(xué),2021.

    [4] 謝智峰.基于深度學(xué)習(xí)的螢火蟲算法研究及在中長期徑流預(yù)報中的應(yīng)用[D].南昌:南昌工程學(xué)院,2019.

    [5] 徐源浩,鄔強,李常青,等.基于長短時記憶(LSTM)神經(jīng)網(wǎng)絡(luò)的黃河中游洪水過程模擬及預(yù)報[J].北京師范大學(xué)學(xué)報(自然科學(xué)版),2020,56(3):387-393.

    [6] 殷兆凱,廖衛(wèi)紅,王若佳,等.基于長短時記憶神經(jīng)網(wǎng)絡(luò)(LSTM)的降雨徑流模擬及預(yù)報[J].南水北調(diào)與水利科技,2019,17(6):1-9,27.

    [7] 王萌.神經(jīng)網(wǎng)絡(luò)算法在徑流模擬中的開發(fā)與應(yīng)用[D].哈爾濱:哈爾濱工業(yè)大學(xué),2019.

    [8] 巫義銳,郭鴻飛,錢程,等.基于特征增強與時序感知的洪水預(yù)報模型[J].人民長江,2021,52(增2):21-26,44.

    [9] HAN H,CHOI C,JUNG J,et al.Deep learning with Long Short Term Memory based sequence-to-sequence model for rainfall-runoff simulation[J].Water,2021,13(4):437.

    [10] HU C,WU Q,LI H,et al.Deep learning with a Long Short-Term Memory networks approach for rainfall-runoff simulation[J].Water,2018,10(11):1543.

    [11] 黃克威,王根緒,宋春林,等.基于LSTM的青藏高原凍土區(qū)典型小流域徑流模擬及預(yù)測[J].冰川凍土,2021,43(4):1144-1156.

    [12] KRATZERT F,KLOTZ D,BRENNER C,et al.Rainfall-runoff modelling using Long Short-Term Memory(LSTM)networks[J].Hydrology and Earth System Sciences,2018,22:6005-6022.

    [13] BOULMAIZ T,GUERMOUI M,BOUTAGHANE H.Impact of training data size on the LSTM performances for rainfall-runoff modeling[J].Modeling Earth Systems and Environment,2020,6:2153-2164.

    [14] KRATZERT F,KLOTZ D,SHALEV G,et al.Towards learning universal,regional,and local hydrological behaviors via machine learning applied to large-sample datasets[J].Hydrology and Earth System Sciences,2019,23(12):5089-5110.

    [15] KHANDELWAL A,XU S M,LI X,et al.Physics guided machine learning methods for hydrology[J].arXiv,2020,2012:02854v1.

    [16] YOKOO K,ISHIDA K,ERCAN A,et al.Capabilities of deep learning models on learning physical relationships:case of rainfall-runoff modeling with LSTM[J].Science of the Total Environment,2022,802:149876.

    [17] 方威,周建中,周超,等.基于G-LSTM 模型的短期徑流預(yù)報:以長江上游寸灘斷面-三峽入庫斷面為例[J].人民長江,2021,52(2):66-71.

    [18] 陶思銘,梁忠民,陳在妮,等.長短期記憶網(wǎng)絡(luò)在中長期徑流預(yù)報中的應(yīng)用[J].武漢大學(xué)學(xué)報(工學(xué)版),2021,54(1):21-27.

    [19] 林康聆,陳華,陳清勇,等.耦合Encoder-Decoder的LSTM徑流預(yù)報模型研究[J].武漢大學(xué)學(xué)報(工學(xué)版),2022,55(8):755-761.

    [20] 黃文峰.長短期記憶模型的超級參數(shù)調(diào)節(jié)在徑流預(yù)測中的效果研究[J].西華大學(xué)學(xué)報(自然科學(xué)版),2020,39(1):23-29.

    [21] XIANG Z,YAN J,DEMIR I.A rainfall-runoff model with LSTM-Based Sequence-to-Sequence Learning[J].Water Resources Research,2020,56(1):e2019WR025326.

    [22] 成軍.同義反復(fù)話語的信息冗余性及其交際功能[J].外國語文,2018,34(6):70-76.

    [23] 何志鵬.基于改進(jìn)CNN-LSTM的光伏發(fā)電功率預(yù)測及仿真研究[D].天津:天津理工大學(xué),2022.

    [24] 李澤文,胡讓,劉湘,等.基于PCA-DBILSTM的多因素短期負(fù)荷預(yù)測模型[J].電力系統(tǒng)及其自動化學(xué)報,2020,32(12):32-39.

    [25] 戴健非,楊鵬,諸利一,等.集成PCA和LSTM神經(jīng)網(wǎng)絡(luò)的浸潤線預(yù)測方法[J].中國安全科學(xué)學(xué)報,2020,30(3):94-101.

    (編輯:謝玲嫻)

    Influences of data length on efficiency of daily runoff forecast by deep learning method

    YANG Kun,ZHANG Wenjiang,SONG Kechao

    (College of Water Resources and Hydropower,Sichuan University,Chengdu 610065,China)

    Abstract:

    Long Short-Term Memory(LSTM) neural network model,a deep learning method with strong capability of temporal series analysis,has unique advantages in runoff prediction.However,the optimal scheme of input and output lengths in this model is still not clear,so it is of practical significance to explore the influence of different input and output lengths on daily runoff prediction efficiency by LSTM.Taking Dadu River,Yalong River,tributaries of Minjiang River and upper reaches of Jialing River in western Sichuan Province as the study area,20 sub-catchments were selected to test the daily runoff in different forecast periods with input data of different lengths and the daily runoff prediction efficiency of LSTM model under different data lengths was studied.The applicability of this method in different river basins and the characteristics of optimal input and output length were analyzed.The results show that:① When the previous precipitation,temperature and runoff are taken as inputs,the input length has little effect on daily runoff prediction,but the accuracy will decrease with the extension of forecast period.Therefore,the forecast period should be set within 7 days to guarantee forecast accuracy.② When only previous precipitation and temperature are taken as inputs,the forecasting accuracy will increase with the extension of previous data and decrease with the extension of forecast period.Therefore,the length of preliminary data should be beyond 7 days,and the forecast period is preferably 1 day,and should not exceed 3 days.③ Runoff variability is an important indicator affecting the prediction efficiency and the optimal combination of input and output lengths.The prediction results in catchments with strong variability show low accuracy and weak sensitivity to input and output lengths.The research results can provide a reference for improving the runoff prediction efficiency by deep learning method,and help to determine the suitable input and output length combination scheme in consideration of watershed characteristics.

    Key words:

    runoff forecast;data length;length of forecast period;LSTM;deep learning

    永川市| 贵港市| 会同县| 海盐县| 湖南省| 嘉义县| 象州县| 云林县| 乐昌市| 六枝特区| 兴义市| 武夷山市| 台江县| 平安县| 临猗县| 鄂尔多斯市| 汶上县| 龙口市| 肥西县| 浦北县| 行唐县| 灵丘县| 海城市| 沙湾县| 工布江达县| 西吉县| 上林县| 讷河市| 安宁市| 怀集县| 苗栗市| 饶平县| 正镶白旗| 贵定县| 乌审旗| 衡阳市| 丰台区| 广宁县| 南通市| 绵阳市| 商洛市|