師小雨 黃強(qiáng)
關(guān)鍵詞:水文變異;深度學(xué)習(xí)模型;預(yù)測性能;交叉驗證
0引言
隨著經(jīng)濟(jì)社會的快速發(fā)展和氣候變化,黃河流域極端氣象事件和水文事件頻發(fā),由此引發(fā)水文序列變異,徑流時間序列呈現(xiàn)出強(qiáng)非線性、非平穩(wěn)性[1-2]。以往相關(guān)研究中采用統(tǒng)計模型預(yù)測長期徑流時均對其進(jìn)行一致性、平穩(wěn)性假設(shè)[3]。然而,實際應(yīng)用中水文序列變異會嚴(yán)重降低統(tǒng)計模型的預(yù)測精度,大多數(shù)研究忽視了此問題。
近年來,隨著計算機(jī)硬件性能的顯著提升,深度學(xué)習(xí)作為新型的數(shù)據(jù)驅(qū)動統(tǒng)計方法,可以從數(shù)據(jù)角度解析氣候水文變量間的非線性關(guān)系[4]。深度學(xué)習(xí)模型結(jié)構(gòu)為逐層堆疊,通過學(xué)習(xí)算法自動學(xué)習(xí)深層、本質(zhì)的特征[5]。Gao等[6]利用LSTM、GRU、ANN這3個神經(jīng)網(wǎng)絡(luò)模型,根據(jù)流量、降水量數(shù)據(jù)對福建省沙溪進(jìn)行了短期徑流預(yù)測,結(jié)果表明,GRU、LSTM模型比ANN模型的預(yù)測精度高,GRU模型與LSTM模型的預(yù)測精度幾乎相同,GRU模型具有結(jié)構(gòu)簡單、參數(shù)少、訓(xùn)練時間短的優(yōu)點。Bai等[7]采用級聯(lián)框架方法構(gòu)建C-LSTM模型,對盧布爾雅尼察河的逐日徑流進(jìn)行預(yù)測,結(jié)果表明,兩層LSTM模型較單層LSTM模型的預(yù)測精度高。然而,深度學(xué)習(xí)在水文預(yù)測中通常對時間序列做出平穩(wěn)性假設(shè),缺乏考慮變化環(huán)境下的水文過程物理機(jī)制,難以獲取更加精準(zhǔn)的水文預(yù)測結(jié)果。
針對上述研究瓶頸,本文對長短時記憶神經(jīng)網(wǎng)絡(luò)(LSTM)模型的k-fold交叉驗證方法進(jìn)行改進(jìn),提出考慮變異點的k-fold交叉驗證方法。選取黃河支流渭河華縣站和黑河祁連山站為研究對象,對比不同變異程度的中長期水文序列的預(yù)測結(jié)果,明晰水文變異對深度學(xué)習(xí)模型訓(xùn)練性能的影響。
1研究區(qū)概況
選取黃河支流渭河流域和黑河流域為研究區(qū)。渭河是黃河最大支流,屬大陸性季風(fēng)氣候區(qū),冬冷夏熱,夏季降雨充沛,年降水量約500~800mm,汛期(6—9月)降水量約占年降水量的60%[8]。黑河流域是中國西北地區(qū)的第二大內(nèi)陸流域,流經(jīng)青海省、甘肅省、內(nèi)蒙古自治區(qū),干旱少雨,年降水量約400mm,多年平均水面蒸發(fā)量約1600mm[9-10]。兩流域的氣溫、降水量、徑流量和水面蒸發(fā)量在時間維度和空間維度上都有顯著變化。采用渭河華縣站和黑河祁連山站1960—2010年徑流資料進(jìn)行深度學(xué)習(xí)模型訓(xùn)練性能分析。
2方法介紹
2.1LSTM模型
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)中對數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的新方法,與其他機(jī)器學(xué)習(xí)方法的不同之處在于其具有“學(xué)習(xí)特征”[11],通過逐層堆疊多個隱藏層增加模型深度,能夠?qū)Ω呔S稀疏的數(shù)據(jù)進(jìn)行處理,具有更高的預(yù)測精度[12]。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是專門用于處理時序數(shù)據(jù)的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),具有自循環(huán)反饋的全連接神經(jīng)網(wǎng)絡(luò),可以處理任意長度的時序數(shù)據(jù)[13]。LSTM模型屬RNN的變種,最早由JuergenSchmidhuber提出。LSTM模型的特點是在RNN的內(nèi)部神經(jīng)元結(jié)構(gòu)的基礎(chǔ)上添加閥門節(jié)點,閥門包括遺忘閥門、輸入閥門和輸出閥門[14-15]。通過閥門的開啟判斷該模型網(wǎng)絡(luò)的記憶態(tài)在當(dāng)前層輸出的結(jié)果是否達(dá)到閾值,再將輸出結(jié)果用于當(dāng)前層的計算。LSTM模型結(jié)構(gòu)見圖1(圖中:C代表記憶細(xì)胞,用來存儲數(shù)據(jù)序列的長期記憶;H代表短期記憶)。
2.2Mann-Kendall檢驗方法
Mann-Kendall(M-K)檢驗方法是基于原始時間序列秩次的一種非參數(shù)統(tǒng)計檢驗方法[16]。采用M-K檢驗方法對華縣站和祁連山站1960—2010年月徑流序列進(jìn)行變異診斷。
2.3考慮變異點的k-fold交叉驗證方法
k-fold交叉驗證方法是一種評估具有有限數(shù)據(jù)樣本的機(jī)器學(xué)習(xí)模型性能的重采樣方法。該方法將數(shù)據(jù)集隨機(jī)劃分為k個訓(xùn)練集和測試集,其中:1個樣本用于測試,k-1個樣本用于訓(xùn)練[17]。模型檢驗過程中每次更換訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),重復(fù)進(jìn)行k次交叉驗證,利用誤差統(tǒng)計工具選擇最佳模型。在訓(xùn)練深度學(xué)習(xí)模型時,通常使用k-fold交叉驗證法增強(qiáng)模型擬合效果,提高模型性能。
為評價水文變異點對深度學(xué)習(xí)模型預(yù)測性能的影響,基于k-fold交叉驗證方法提出考慮變異點的k-fold交叉驗證方法,其流程見圖2。首先將徑流時間序列劃分為訓(xùn)練期和測試期,以2000—2010年作為測試期;再采用M-K檢驗方法對時間序列進(jìn)行變異診斷,得到時間序列的k-1個變異點,將除去測試期外的數(shù)據(jù)序列劃分為k個子集,每個子集作為一個訓(xùn)練期;之后在k個訓(xùn)練期中分別擬合LSTM訓(xùn)練模型,并將擬合好的LSTM在測試期進(jìn)行預(yù)測;最后利用預(yù)測模型評價指標(biāo)對不同訓(xùn)練期的模型訓(xùn)練結(jié)果進(jìn)行分析對比,篩選得到最佳模型。
2.4泰勒圖評估方法
KarlE.Taylor于2001年提出泰勒圖,泰勒圖主要用來比較幾個氣象模式的模擬能力,將模型的相關(guān)系數(shù)、中心均方根誤差和標(biāo)準(zhǔn)差3個評價指標(biāo)整合在一張極坐標(biāo)圖上。
3結(jié)果分析
3.1徑流時間序列變異點識別
運用M-K檢驗法對流域徑流進(jìn)行突變分析,通過繪制徑流前向統(tǒng)計UF曲線和反演統(tǒng)計UB曲線識別徑流時間序列變異點,結(jié)果見圖3。給定顯著性水平α=0.05,統(tǒng)計量UF和UB的臨界值為±1.96,UF值或UB值大于0時序列呈上升趨勢,UF值或UB值小于0時序列呈下降趨勢,當(dāng)UF值或UB值超過臨界值時序列表現(xiàn)出明顯的上升或下降趨勢。由圖3可知,渭河華縣站徑流時間序列變異發(fā)生在1986年和2008年,黑河祁連山站徑流時間序列變異發(fā)生在1988年。
3.2k-fold交叉驗證結(jié)果
采用考慮變異點的k-fold交叉驗證方法評價水文變異對深度學(xué)習(xí)模型預(yù)測性能的影響。上述變異點識別結(jié)果表明渭河華縣站的徑流在1986年發(fā)生突變,以LSTM模型為基底模型,根據(jù)訓(xùn)練期的不同分別建立B、C、D預(yù)測模型,其中:B模型選取徑流序列2000—2010年作為驗證期,選取變異點前的徑流序列1960—1985年作為訓(xùn)練期;C模型選取徑流序列2000—2010年作為驗證期,選取變異點后的徑流序列1985—1999年作為訓(xùn)練期;D模型選取徑流序列2000—2010年作為驗證期,選取徑流序列1960—2000年作為訓(xùn)練期。
引入泰勒圖對基于LSTM深度學(xué)習(xí)模型的以訓(xùn)練期為差異的B、C、D月徑流預(yù)測模型的預(yù)測結(jié)果進(jìn)行展示(見圖4),其中:A點為實測值,藍(lán)色虛線代表相關(guān)系數(shù),綠色虛線代表中心均方根誤差,縱坐標(biāo)代表標(biāo)準(zhǔn)差??梢钥闯觯己尤A縣站和黑河祁連山站的D模型的相關(guān)系數(shù)、中心均方根誤差和標(biāo)準(zhǔn)差最大,說明該模型性能最佳;同時也反映出將未考慮徑流變異點的時間序列作為模型的訓(xùn)練期,所訓(xùn)練的LSTM模型在兩個水文站的數(shù)據(jù)測試中均表現(xiàn)良好??紤]變異點的B、C模型的訓(xùn)練期數(shù)據(jù)長度較D模型短,所訓(xùn)練模型的預(yù)測性能較低,因此訓(xùn)練期數(shù)據(jù)長度對模型性能的影響至關(guān)重要。此外,在兩個水文站的數(shù)據(jù)測試中B模型(將變異點前的時間序列作為模型訓(xùn)練期)的預(yù)測性能與C模型(將變異點后的時間序列作為模型訓(xùn)練期)的性能差異較小。
綜上所述,LSTM模型在中長期徑流預(yù)測中的性能主要受時間序列長度的影響,其次受水文變化趨勢及變異的影響。
4結(jié)論
針對黃河支流渭河、黑河的水文情勢,采用M-K檢驗方法對月徑流水文序列進(jìn)行變異點識別,基于深度學(xué)習(xí)LSTM模型,提出考慮變異點的k-fold交叉驗證方法,探討水文變異對深度學(xué)習(xí)模型預(yù)測精度的影響。深度學(xué)習(xí)模型在中長期徑流預(yù)測中的性能主要受時間序列長度的影響,其次受水文變化趨勢及變異的影響。