王文川,高 暢,徐 雷
(華北水利水電大學(xué)水資源學(xué)院,鄭州450046)
徑流變化受多種因素的影響,主要包括氣候變化、人類活動(dòng)、土地利用變化和植被覆蓋等[1]。正是由于這些不確定因素的影響,徑流序列呈現(xiàn)出非平穩(wěn)性和多頻性的特征,為相關(guān)部門進(jìn)行徑流預(yù)測(cè)帶來了難度[2]。目前,學(xué)者們已經(jīng)提出許多方法用于徑流預(yù)測(cè),其中“分解—預(yù)測(cè)—重構(gòu)”[3]模式的預(yù)測(cè)模型被廣泛應(yīng)用,相比于傳統(tǒng)模型它能有效提高預(yù)測(cè)精度,為水文預(yù)測(cè)提供了一種新思路。該模式的預(yù)測(cè)模型首先將非線性非平穩(wěn)的徑流序列用分解方法進(jìn)行平穩(wěn)化處理,并結(jié)合水文模型構(gòu)成耦合模型進(jìn)行預(yù)測(cè)。如Feng 等[4]將變分模態(tài)分解與基于粒子群優(yōu)化的支持向量機(jī)模型結(jié)合,對(duì)長江流域的三峽水庫和丹江口水庫進(jìn)行月徑流預(yù)測(cè),取得了較好的效果;李繼清等[5]將極點(diǎn)對(duì)稱模態(tài)分解與BP 神經(jīng)網(wǎng)絡(luò)組合,對(duì)黃河上游的唐乃亥站進(jìn)行中長期徑流預(yù)測(cè),有效提高了徑流的預(yù)測(cè)精度;梁浩等[6]提出了將經(jīng)驗(yàn)?zāi)B(tài)分解和集合經(jīng)驗(yàn)?zāi)B(tài)分解分別與不同模型結(jié)合,構(gòu)建多種混合模型,對(duì)水文序列進(jìn)行徑流預(yù)測(cè)研究;席東潔等[7]將EMD(Empirical Mode Decomposition)與Elman 神經(jīng)網(wǎng)絡(luò)模型構(gòu)成月徑流預(yù)測(cè)模型,并驗(yàn)證了模型的可行性。這些研究表明,“分解—預(yù)測(cè)—重構(gòu)”模式的模型在徑流預(yù)測(cè)方面的應(yīng)用能取得較好的效果,它既方便計(jì)算,又具有較高的精度,被廣泛認(rèn)可。該模式中“分解”階段采用的方法有經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)、集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decompo?sition,EEMD)、變分模態(tài)分解(Variational Mode Decomposition,VMD)等,這些方法進(jìn)行分解后,分量存在噪聲和模態(tài)混疊等問題,對(duì)模型精度有較大的影響。EMD[8-9]廣泛應(yīng)用于非線性非平穩(wěn)序列的分解中,但該種方法由于其嚴(yán)格的分頻條件,使分量中存在模態(tài)混疊問題,并不具有較高的頻率分離性能;EEMD[10,11]在EMD 的基礎(chǔ)上有了提高,但在分解過程中添加的白噪聲會(huì)導(dǎo)致重構(gòu)誤差,使得分解后低頻序列同樣存在模態(tài)混疊問題;VMD[12]、CEEMD(Complete Ensemble Empirical Mode Decomposition)[13]和CEEMDAN(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise)[14]對(duì)噪聲具有穩(wěn)健性,但這三種方法需對(duì)參數(shù)適當(dāng)選擇,且由于它們的截止頻率是恒定的,使得序列不具有時(shí)變性。綜上分析可得,現(xiàn)采用的模態(tài)分解方法存在①模態(tài)混疊;②不具有時(shí)變特性;③低采樣率下性能差等問題,在一定程度上會(huì)影響模型預(yù)測(cè)精度。本文采用時(shí)變?yōu)V波(Time Variable Filter,TVF)經(jīng)驗(yàn)?zāi)B(tài)分解(TVF-EMD)利用非均勻B 樣條逼近作為時(shí)變?yōu)V波器,自適應(yīng)地設(shè)計(jì)了局部截止頻率,在解決模態(tài)混疊問題的同時(shí)保留了序列的時(shí)變性。并且在低采樣率下設(shè)置了帶寬閾值,使得序列在低采樣率下也具有較好的性能。因此,TVF-EMD 方法更適用于非平穩(wěn)序列的徑流預(yù)測(cè)。本文將TVF-EMD 方法與長短期記憶神經(jīng)網(wǎng)絡(luò)(Long short-term memory,LSTM)耦合,提出了TVF-EMD-LSTM神經(jīng)網(wǎng)絡(luò)耦合的月徑流預(yù)測(cè)模型,并在洛河流域長水水文站的月徑流預(yù)測(cè)中驗(yàn)證了其效果,結(jié)果表明提出的耦合模型能有效提高月徑流預(yù)測(cè)的精度,為當(dāng)前徑流預(yù)測(cè)提供了一種新的途徑。
TVF-EMD 方法2017年由Li 等[15]人提出,該方法是對(duì)EMD方法的改進(jìn)和提高。TVF-EMD 方法采用時(shí)變?yōu)V波器來解決模態(tài)混疊問題,以保持序列的時(shí)變性。該方法充分利用瞬時(shí)幅值和瞬時(shí)頻率,自適應(yīng)的設(shè)計(jì)了局部截止頻率,對(duì)給定序列進(jìn)行時(shí)變?yōu)V波,并將其分為局部高頻分量和局部低頻分量,以得到固有模態(tài)函數(shù)(Intrinsic Mode Function,IMFs)。
TVF-EMD方法的計(jì)算步驟為:
(1)利用Hilbert 變換計(jì)算徑流序列X(t)的瞬時(shí)幅值A(chǔ)(t)和瞬時(shí)頻率φ’(t);
(2)確定瞬時(shí)幅值A(chǔ)(t)的局部極大值序列和局部極小值序列,分別表示為A({tmax})和A({tmin});
(3)對(duì)A({tmax})進(jìn)行插值得到β1(t),以同樣的方法對(duì)A({tmin})進(jìn)行插值得到β2(t),計(jì)算瞬時(shí)均值a1(t)和瞬時(shí)包絡(luò)a2(t):
(4)分別對(duì)A2({tmin})φ′({tmin})和A2({tmax})φ′({tmax})進(jìn)行插值,得到η1(t)和η2(t)并計(jì)算瞬時(shí)頻率分量φ′1(t)和φ′2(t):
(5)計(jì)算局部截止頻率φ′bis(t):
(6)為解決間歇問題,重新對(duì)局部截止頻率φ′bis進(jìn)行調(diào)整;
(8)計(jì)算停止準(zhǔn)則θ(t),如果θ(t)≤ξ,則可確定X(t)為一個(gè)IMF,不滿足則令x1(t)=xt-m(t),重復(fù)執(zhí)行(1)~(8)步驟:
式中:BLoughlin(t)為兩分量信號(hào)的Loughlin 瞬時(shí)帶寬;φavg(t)為單個(gè)分量瞬時(shí)頻率的加權(quán)平均值;m(t)為瞬時(shí)包絡(luò)局部平均值。
分解后得到的所有模態(tài)分量Xi(t)之和為原徑流序列X(t)的值。
Hochreiter 等[16]人提出的長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM),解決了循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)存在的長期依賴問題,較好地避免了梯度爆炸問題,是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)。LSTM 的基本結(jié)構(gòu)如圖1所示,包括輸入層、循環(huán)層和輸出層,其中Xt為輸入序列,Yt為輸出序列。相比于其他神經(jīng)網(wǎng)絡(luò)模型,LSTM 模型增加了“門”的結(jié)構(gòu),包括遺忘門、輸入門和輸出門。這些“門”用來控制記憶單元中的原信息的保存、丟棄,以及新信息的保存,使得LSTM 神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)跨度相對(duì)較長的依賴關(guān)系,且不會(huì)出現(xiàn)梯度消失和梯度爆炸的問題[17]。
圖1 LSTM基本結(jié)構(gòu)Fig.1 Basic structure of LSTM
由于徑流序列的多頻性和非平穩(wěn)性,采用單一LSTM 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)精度不高,因此,本文提出先采用TVF-EMD 方法對(duì)徑流序列進(jìn)行平穩(wěn)化處理,再用LSTM 神經(jīng)網(wǎng)絡(luò)模型對(duì)經(jīng)過平穩(wěn)化處理的子序列進(jìn)行預(yù)測(cè),最終將每個(gè)子序列的預(yù)測(cè)結(jié)果疊加重構(gòu),構(gòu)成耦合的TVF-EMD-LSTM 預(yù)測(cè)模型。為了驗(yàn)證TVF-EMD-LSTM 耦合模型的有效性,分別與EMD-LSTM 模型和CEEMDAN-LSTM 模型進(jìn)行對(duì)比,各耦合模型結(jié)構(gòu)圖如圖2所示,計(jì)算步驟如下:
圖2 各耦合模型結(jié)構(gòu)圖Fig.2 Structure diagram of each coupling model
(1)對(duì)洛河流域長水水文站的月徑流序列X(t)進(jìn)行TVFEMD、EMD 和CEEMDAN 分解,分別得到不同時(shí)間尺度下的固有模態(tài)函數(shù)(IMFs);
(2)設(shè)置模型參數(shù),采用自相關(guān)系數(shù)(ACF)和偏自相關(guān)系數(shù)(PACF)研究前期流量對(duì)當(dāng)前流量的影響,以確定各模型輸入序列(IMFs)滯時(shí);
(3)將分解后的IMFs 分別輸入LSTM 神經(jīng)網(wǎng)絡(luò)模型中,選取每個(gè)子序列的90%用于訓(xùn)練,10%用于預(yù)測(cè),對(duì)訓(xùn)練和預(yù)測(cè)序列分別進(jìn)行歸一化處理,進(jìn)行正向迭代計(jì)算;
(4)當(dāng)模型達(dá)到最大迭代次數(shù)后,停止迭代,分別輸出IMFs訓(xùn)練序列和預(yù)測(cè)序列;
(5)將IMFs 訓(xùn)練和預(yù)測(cè)輸出序列分別加和重構(gòu),則Y為最終的預(yù)測(cè)徑流序列。
在輸入數(shù)據(jù)前,需先確定LSTM 神經(jīng)網(wǎng)絡(luò)模型的參數(shù)以及輸入模型變量個(gè)數(shù)。為了比較,所采用的耦合模型與LSTM 模型參數(shù)設(shè)置相同。根據(jù)Ding 等[18]的研究設(shè)置隱含層為200 層,迭代次數(shù)為500次時(shí)模型具有較好的性能。學(xué)習(xí)率過大導(dǎo)致不收斂,過小導(dǎo)致收斂速度慢迭代次數(shù)增多[19],經(jīng)測(cè)試采用0.01的學(xué)習(xí)率可獲得較高的精度。由于LSTM 模型是以數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)模型,輸入不相關(guān)的變量對(duì)模型預(yù)測(cè)結(jié)果有較大的影響,因此選擇適當(dāng)?shù)臏r(shí)變量個(gè)數(shù)尤為重要。Sudheer 等[20]建議通過不同滯時(shí)下的相關(guān)性計(jì)算以及考慮流域?qū)嶋H情況,進(jìn)一步分析前期流量對(duì)當(dāng)前流量的影響以確定輸入序列滯時(shí)。
為了能更加直觀地體現(xiàn)各模型預(yù)測(cè)結(jié)果的可靠性和精確性,選取均方根誤差(RMSE)、確定性系數(shù)(DC)、平均絕對(duì)百分比誤差(MAPE)、平均絕對(duì)誤差(MAE)和預(yù)測(cè)精度等級(jí)五項(xiàng)指標(biāo)作為模型評(píng)價(jià)標(biāo)準(zhǔn)。根據(jù)規(guī)范,當(dāng)DC≥0.90時(shí),預(yù)測(cè)精度為甲級(jí),0.70≤DC<0.90 時(shí),預(yù)測(cè)精度為乙級(jí),0.50≤DC<0.70 時(shí),預(yù)測(cè)精度為丙級(jí)。計(jì)算公式如下:
式中:Q0(i)為實(shí)測(cè)徑流量值;Qc(i)為預(yù)測(cè)徑流量值,萬m3。
洛河流域是黃河右岸的重要支流,流域總面積18 881 km2。其發(fā)源于陜西省商洛市洛南縣洛源鎮(zhèn)的龍?zhí)度?,橫穿洛南縣中南部,最后由鞏義東北注入黃河[21]。河道全長477 km,陜西境內(nèi)河長129.8 km,河南境內(nèi)河長366 km,多年平均徑流總量達(dá)6.65 億m3。月徑流數(shù)據(jù)來源于河南省洛河流域的長水水文站,該水文站位于故縣水庫下游,是國家基本水文站。其流域示意圖如圖3所示。
圖3 洛河流域示意圖Fig.3 Schematic diagram of Luohe River Basin
選取長水水文站1987-2016年實(shí)測(cè)月徑流數(shù)據(jù),對(duì)徑流序列進(jìn)行Daniel 平穩(wěn)性檢驗(yàn),由假設(shè)檢驗(yàn)計(jì)算得出統(tǒng)計(jì)量|T|=145.847 7>t0=1.966 6,則可判斷該序列為非平穩(wěn)性序列,對(duì)預(yù)測(cè)結(jié)果有較大的影響。選用能自適應(yīng)序列特征的TVF-EMD 方法進(jìn)行分解,經(jīng)調(diào)試當(dāng)設(shè)置參數(shù)帶寬閾值為0.3,B-樣條階次為26 時(shí),TVF-EMD 具有魯棒性。其分解結(jié)果如圖4所示,由圖4可以看出,TVF-EMD 方法將月徑流序列分解為9 個(gè)IMFs,依次由高頻到低頻排列。IMF1 的頻率最高、波長最短,序列最不穩(wěn)定,隨著分解模態(tài)數(shù)量的增加,模態(tài)分量的振幅逐漸減小,波長增加,序列逐漸趨于穩(wěn)定。原徑流序列振幅變化極不規(guī)律,序列穩(wěn)定性較差,因TVF-EMD 分解能夠自適應(yīng)序列的特征,分解并不要求上下包絡(luò)對(duì)稱,通過分解后,各IMFs的波動(dòng)性降低,且具有一定的周期性。綜上所述,TVF-EMD 進(jìn)行了有效的分解,具有較高的信噪比,且在保持徑流序列時(shí)變性的前提下解決了模態(tài)混疊問題和噪聲問題,是一種有效的序列分解方法。為驗(yàn)證該分解方法的優(yōu)化效果,將該徑流序列分別用EMD 和CEEMDAN 進(jìn)行分解,EMD 分解后得到8 個(gè)IMFs,CEEMDAN 分解后得到9個(gè)IMFs。
圖4 月徑流序列TVF-EMD分解圖Fig.4 Decomposition of monthly runoff series with TVF-EMD method
選取長水水文站1987-2016年共360 個(gè)月的實(shí)測(cè)月徑流數(shù)據(jù),以1987年1月到2013年12月(共324個(gè)月)的數(shù)據(jù)作為訓(xùn)練集,2014年1月到2016年12月(共36個(gè)月)的數(shù)據(jù)作為測(cè)試集。圖5 為原徑流序列ACF 圖和PACF 圖,可以看出,ACF 的估計(jì)值在2 和6 時(shí)達(dá)到峰值,且PACF 的估計(jì)值落在95%的置信帶內(nèi)??紤]徑流受降雨、下墊面等多種因素以及流域的實(shí)際情況的影響,選取滯時(shí)為6 個(gè)時(shí)段。表明在預(yù)測(cè)未來流量時(shí),6 個(gè)前期流量與當(dāng)前流量是相關(guān)的,且包含的信息更為有用,因此以每6個(gè)前期流量為一組作為LSTM 模型輸入,以預(yù)報(bào)下一月流量值,以循環(huán)滾動(dòng)進(jìn)行預(yù)測(cè)。
圖5 原徑流序列ACF圖和PACF圖Fig.5 ACF and PACF of original runoff series
由于徑流序列經(jīng)分解后各IMFs特征各不相同,需考慮不同序列采用不同滯時(shí)。結(jié)合各IMFs 的ACF 圖和PACF 圖,各模型輸入序列滯時(shí)t如下表1所示。輸入時(shí),各模型將序列x1、x2…xN(N表示為序列樣本數(shù))以t個(gè)值為一組,預(yù)測(cè)下一值,循環(huán)滾動(dòng)預(yù)測(cè),輸入模型數(shù)據(jù)集可表示為:
表1 各模型輸入序列滯時(shí)Tab.1 Delay number of input sequence of each model
為了驗(yàn)證該模型預(yù)測(cè)結(jié)果的可靠性和準(zhǔn)確性,選擇與LSTM 模型、EMD-LSTM 耦合模型和CEEMDAN-LSTM 耦合模型3 種模型進(jìn)行對(duì)比,LSTM 模型與其他耦合模型均采用與TVF-EMD-LSTM 模型相同的參數(shù)及變量設(shè)置。圖6 為各模型測(cè)試集的預(yù)測(cè)值對(duì)比圖。
由圖6 可以看出:①單一LSTM 模型預(yù)測(cè)效果較差,只能顯示序列大概趨勢(shì),預(yù)測(cè)值與觀測(cè)值相差較大。②采用不同分解方法的耦合模型預(yù)測(cè)精度有顯著的差別。TVF-EMD-LSTM 耦合模型預(yù)測(cè)精度明顯優(yōu)于EMD-LSTM 耦合模型和CEEMDANLSTM 耦合模型,EMD-LSTM 耦合模型預(yù)測(cè)效果較差。③TVFEMD-LSTM 耦合模型預(yù)測(cè)精度最高,預(yù)測(cè)序列趨勢(shì)與原序列趨勢(shì)基本相同,無相差較大值出現(xiàn),說明TVF-EMD 有效緩解了EMD 和CEEMDAN 存在的模態(tài)混疊問題和噪聲問題,更適合處理非線性非平穩(wěn)的序列,并且能取得較好的預(yù)測(cè)結(jié)果。
圖6 各模型預(yù)測(cè)值與原序列對(duì)比圖Fig.6 Comparison between the predicted values of each model and the original sequence
為了更清晰準(zhǔn)確地體現(xiàn)各模型的預(yù)測(cè)效果,采用五項(xiàng)模型評(píng)價(jià)標(biāo)準(zhǔn)來確定模型預(yù)測(cè)的精度,如表2 所列。由表2 可知:①在訓(xùn)練期,LSTM 模型各項(xiàng)誤差指標(biāo)最大,隨著采用EMD、CEEMDAN 和TVF-EMD 方法后,各模型的MAE、RMSE和MAPE逐漸減少,且DC值均在0.7 以上,預(yù)測(cè)精度達(dá)到乙級(jí)以上;②模型驗(yàn)證期預(yù)測(cè)結(jié)果更能體現(xiàn)性能,TVF-EMD-LSTM 模型的MAE、RMSE和MAPE較LSTM 模型相比分別減少了84%、87%和84%,較EMD-LSTM 模型相比分別減少了72%、73%和80%,較CEEMDAN-LSTM 模型相比分別減少了69%、67%和66%。且TVF-EMD-LSTM 模型的DC值為0.98,預(yù)測(cè)精度為甲級(jí),相比于EMD-LSTM 和CEEMDAN-LSTM 模型精度能有效提高。因此,TVF-EMD-LSTM 模型的預(yù)測(cè)結(jié)果具有更高的精度。③基于徑流序列具有非平穩(wěn)性和多頻性,且序列中多含有噪聲的特征,直接進(jìn)行預(yù)測(cè)會(huì)影響LSTM 模型的擬合效果。EMD 分解存在模態(tài)混疊問題且無法消除序列存在的噪聲,高頻序列可能摻雜低頻序列,對(duì)預(yù)測(cè)結(jié)果影響較大。CEEMDAN 解決了EMD的模態(tài)混疊和存在噪聲問題,有效地提高了模型的預(yù)測(cè)精度,但并不能適應(yīng)序列的特征且對(duì)參數(shù)有較高的要求。從驗(yàn)證期的結(jié)果來看,TVF-EMD 具有較好的分解效果,它既解決了EMD存在的模態(tài)混疊和噪聲的問題,又使序列具有時(shí)變性,更好地將序列分解為高頻序列和低頻序列,使TVF-EMD-LSTM 模型預(yù)測(cè)結(jié)果精度最高。這說明,TVF-EMD-LSTM 模型具有較高的可行性和可信度,適用于預(yù)測(cè)非平穩(wěn)、非線性、復(fù)雜多頻的徑流時(shí)間序列。
表2 各模型評(píng)價(jià)標(biāo)準(zhǔn)計(jì)算結(jié)果Tab.2 Calculation results of each model evaluation standard
綜上所述,可將4 種模型的預(yù)測(cè)精度由高到低排列為:TVF-EMD-LSTM >CEEMDAN-LSTM >EMD-LSTM >LSTM。TVF-EMD-LSTM 模型相比于其他3種模型,在訓(xùn)練期和驗(yàn)證期都具有較高的精度,因此該模型可有效的對(duì)徑流序列進(jìn)行預(yù)測(cè)。
為解決現(xiàn)有模態(tài)分解方法分量中存在噪聲和模態(tài)混疊的問題,提高模型預(yù)測(cè)精度,本文提出了將TVF-EMD方法應(yīng)用于徑流預(yù)測(cè)的數(shù)據(jù)預(yù)處理中,并結(jié)合LSTM神經(jīng)網(wǎng)絡(luò)模型,以洛寧縣長水水文站為例進(jìn)行了月徑流預(yù)測(cè)及對(duì)比驗(yàn)證,主要結(jié)論如下。
(1)TVF-EMD 方法更適用于非線性非平穩(wěn)的徑流序列,該種方法能夠適應(yīng)序列特征,通過時(shí)變?yōu)V波器更好地緩解了模態(tài)混疊問題,且保留了序列的時(shí)變性,能有效提高預(yù)測(cè)精度,為徑流序列的預(yù)處理開辟了新方法。
(2)所采用的耦合模型的預(yù)測(cè)精度遠(yuǎn)遠(yuǎn)大于原模型,證明了對(duì)徑流序列預(yù)處理的必要性,通過“分解—預(yù)測(cè)—重構(gòu)”模式進(jìn)行徑流預(yù)測(cè),可使預(yù)測(cè)精度有效提高。
(3)對(duì)比分析的結(jié)果表示,本文提出的TVF-EMD-LSTM 模型預(yù)測(cè)精度優(yōu)于LSTM 模型、EMD-LSTM 模型和CEEMANLSTM 模型,并且較大誤差出現(xiàn)的概率明顯降低,預(yù)測(cè)精度大幅度提高,驗(yàn)證了所提出耦合模型預(yù)測(cè)的有效性,可為徑流預(yù)測(cè)等相關(guān)工作提供一定的技術(shù)參考。
(4)本文提出的TVF-EMD-LSTM 神經(jīng)網(wǎng)絡(luò)耦合模型,有助于提高徑流預(yù)測(cè)精度,是一種有效和可行的預(yù)測(cè)方法。然而,本文只考慮了月時(shí)間尺度的效果,今后可對(duì)不同時(shí)間尺度的徑流序列進(jìn)行預(yù)測(cè),以驗(yàn)證該耦合模型的普遍適用性?!?/p>