張亞杰
(云南省玉溪市易門縣水利局,云南 玉溪 651100)
徑流時間序列預(yù)測是指依據(jù)已有的歷史監(jiān)測數(shù)據(jù),通過科學(xué)的方法推測將來的徑流變化趨勢。提高徑流時間序列預(yù)測精度對區(qū)域水資源開發(fā)利用、防洪抗旱規(guī)劃、水庫優(yōu)化調(diào)度等具有重要意義。傳統(tǒng)中長期徑流預(yù)測模型有回歸類模型[1]、集對分析模型[2]和灰色模型[3-4]等,這類模型原理簡單、速度快,但由于徑流受氣候變化、人類活動、土地利用變化和植被覆蓋等多種因素的影響,徑流序列呈現(xiàn)出非平穩(wěn)性和多尺度等特征,為提高預(yù)測精度帶來了難度[5]。當(dāng)前,互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMD)、奇異譜分解(SSA)、變分模態(tài)分解(VMD)、極點(diǎn)對稱模態(tài)分解(ESMD)等分解算法是徑流時間預(yù)測前處理的常用和有效方法,通過分解算法可將復(fù)雜的原始徑流序列分解為多個平穩(wěn)子序列進(jìn)行預(yù)測,可大幅提升模型精度,如桑宇婷等[6]利用互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMD)方法和BP神經(jīng)網(wǎng)絡(luò)建立組合預(yù)測模型,將其應(yīng)用于汾河上游月徑流預(yù)測;王麗麗等[7]融合奇異譜分析(SSA)方法、灰狼優(yōu)化算法、回歸支持向量機(jī)模型,提出SSA-GWO-SVR月徑流組合預(yù)測模型;呂晗芳等[8]建立變分模態(tài)分解(VMD)-最小二乘支持向量回歸機(jī)(LSSVM)耦合模型,將其應(yīng)用于上靜游站等多個水文站月徑流預(yù)測;李繼清等[9]融合極點(diǎn)對稱模態(tài)分解(ESMD)與BP神經(jīng)網(wǎng)絡(luò),構(gòu)建ESMD-BP模型對黃河上游唐乃亥站進(jìn)行徑流預(yù)報。
分解算法是月徑流時間預(yù)測前處理的常用方法之一,將復(fù)雜的原始月徑流序列分解為多個平穩(wěn)子序列進(jìn)行預(yù)測,可大幅提升模型精度。目前,CEEMD、SSA、VMD等時間序列分解方法已在月徑流時序數(shù)據(jù)分解中得到應(yīng)用,并取得較好的分解效果;BP、SVM、LSTM等模型是月徑流時間序列預(yù)測的最常用的模型之一,但BP、SVM、LSTM模型存在缺點(diǎn)與不足,如BP神經(jīng)網(wǎng)絡(luò)存在設(shè)置參數(shù)多、易陷入局部最優(yōu)等缺點(diǎn);SVM模型存在對參數(shù)敏感、大容量樣本預(yù)報中表現(xiàn)不佳等不足;LSTM模型預(yù)測性能較好,但存在內(nèi)存資源消耗大、運(yùn)行時間長等缺陷。小波分解(wavelet decomposition,WD)是以傅里葉變換為數(shù)學(xué)基礎(chǔ)的信號預(yù)處理方法,能很好地平衡時間分辨率和頻率分辨率之間的矛盾,由于其較好的時序數(shù)據(jù)分解效果,已在處理各類非平穩(wěn)信號中得到廣泛應(yīng)用。非洲禿鷲優(yōu)化算法(african vultures optimization algorithm,AVOA)是Abdollahzadeh B等[12]于2021年受非洲禿鷲覓食和導(dǎo)航行為啟發(fā)而提出的一種新型元啟發(fā)式優(yōu)化算法,具有尋優(yōu)能力強(qiáng)、收斂速度快等優(yōu)點(diǎn)。深度極限學(xué)習(xí)機(jī)(deep extreme learning machine,DELM)也叫多層極限學(xué)習(xí)機(jī),其采用多個基于極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)的自編碼器(ELM-AE)進(jìn)行無監(jiān)督預(yù)訓(xùn)練,然后利用各ELM-AE的輸出權(quán)重初始化整個DELM,從結(jié)構(gòu)上看DELM相當(dāng)于把多個ELM連接到一起,但它相對于ELM能更全面地捕捉到數(shù)據(jù)之間的映射關(guān)系并提高處理高維度輸入變量的精確度。與傳統(tǒng)ELM相比,具有隨機(jī)參數(shù)少,網(wǎng)絡(luò)復(fù)雜度低,激活函數(shù)類型多樣化等優(yōu)點(diǎn)[13-15]。但在實(shí)際應(yīng)用中,DELM隱含層神經(jīng)元數(shù)對DELM網(wǎng)絡(luò)預(yù)測性能影響較大,目前主要采用人工試算等方法確定,不但費(fèi)時繁瑣,且精度不高。
為提高月徑流時間序列預(yù)測精度,進(jìn)一步拓展徑流預(yù)測組合模型應(yīng)用范疇,基于WD方法、AVOA算法和DELM網(wǎng)絡(luò),提出WD-AVOA-DELM月徑流時間序列組合預(yù)測模型,并構(gòu)建基于支持向量機(jī)(SVM)、BP神經(jīng)網(wǎng)絡(luò)2種預(yù)測器的WD-AVOA-SVM、WD-AVOA-BP、AVOA-DELM、AVOA-SVM、AVOA-BP作分析對比模型,將該6種模型應(yīng)用于云南省丫勒水文站月徑流時間序列預(yù)測,旨在驗(yàn)證WD-AVOA-DELM模型用于月徑流時間序列預(yù)測的可行性。
小波分解(WD)基本思想是利用尺度空間Vj和小波空間Wj來表示平方可積函數(shù)空間L2(R)。定義{Vj}j∈Z是L2(R)上的一列閉子空間,小波空間Wj是Vj+1與Vj之差,即Vj+1=Vj⊕Wj,則可以推得[10-11]:
(1)
在此基礎(chǔ)上,利用Mallat提出的快速小波變換分解方法將非平穩(wěn)時間序列分解為若干不同尺度下的平穩(wěn)時間序列:
cj+1=Hcj,dj+1=Gcj,j=0,1,…,J
(2)
式中H——分解低通濾波器;G——分解高通濾波器;J——尺度數(shù);{cj}、{dj}——原始時間序列c0的低頻、高頻成分。
AVOA是受非洲禿鷲覓食和導(dǎo)航行為啟發(fā)提出的一種元啟發(fā)式優(yōu)化算法。AVOA數(shù)學(xué)描述如下[12]。
a)確定最佳禿鷲。AVOA通過計(jì)算種群所有禿鷲適應(yīng)度,選擇最優(yōu)和次優(yōu)適應(yīng)度對應(yīng)的禿鷲作為最優(yōu)禿鷲和次優(yōu)禿鷲位置,其他禿鷲利用式(3)向最優(yōu)和次優(yōu)禿鷲移動。
(3)
式中Ri(t)——除最優(yōu)、次優(yōu)禿鷲外的其他禿鷲位置;BestV1、BestV2——最優(yōu)禿鷲和次優(yōu)禿鷲位置;L1、L2——介于0和1之間待測量參數(shù),其和為1;pi——選擇最佳禿鷲的概率;fi——其他禿鷲適應(yīng)度;t——當(dāng)前迭代次數(shù);其他參數(shù)意義同上。
b)禿鷲飽食率。禿鷲經(jīng)常覓食,若它們處于飽食狀態(tài),則擁有較高能量,這使得它們可以在更廣闊的區(qū)域覓食;若處于饑餓狀態(tài),則沒有足夠的能量飛行和在更強(qiáng)壯的禿鷹附近覓食。飽食率數(shù)學(xué)描述為:
(4)
式中F——禿鷲飽食率;T——最大迭代次數(shù);z——-1和1之間的隨機(jī)數(shù);h——-2和2之間的隨機(jī)數(shù);rand1——0和1之間的隨機(jī)數(shù);w——控制勘探過程參數(shù),隨著w值增大,算法進(jìn)入勘探階段的概率增大,反知概率減小。
c)探索階段。禿鷲具有很高的視覺能力和較好的覓食能力。在AVOA中,禿鷲通過式(5)隨機(jī)搜尋不同區(qū)域。
(5)
式中Pi(t+1)——第t+1次迭代禿鷲位置;Pi(t)——第t次迭代禿鷲位置;X——禿鷲隨機(jī)移動的地方,以保護(hù)食物免受其他禿鷲奪取,X=2×rand,rand表示0和1之間的隨機(jī)數(shù);P1——探索階段選擇參數(shù);rand2、rand3、randP1——0和1之間的隨機(jī)數(shù);ub、lb——搜索空間上、下限值;其他參數(shù)意義同上。
d)開發(fā)階段。AVOA中,開發(fā)階段分為開發(fā)一階段和開發(fā)二階段2種策略,并通過開發(fā)階段選擇參數(shù)P2、P3決定采用何種策略進(jìn)行位置更新。開發(fā)第一階段禿鷲位置更新描述如下:
Pi(t+1)=
(6)
式中 rand4、rand5、rand6、randP2——0和1之間的隨機(jī)數(shù);P2——開發(fā)第一階段更新策略選擇參數(shù);其他參數(shù)意義同上。
開發(fā)第二階段禿鷲位置更新描述如下:
(7)
式中 BestV1(t)、BestV2(t)——第t次迭代最優(yōu)、次優(yōu)禿鷲位置;randP3——0和1之間的隨機(jī)數(shù);P3——開發(fā)第二階段更新策略選擇參數(shù);Levy(d)——隨即游走,其每一步方向完全隨機(jī)而各向同性,步長為重尾分布;其他參數(shù)意義同上。
深度極限學(xué)習(xí)機(jī)(DELM)從結(jié)構(gòu)上看相當(dāng)于把多個極限學(xué)習(xí)機(jī)(ELM)連接到一起,能更全面地捕捉到數(shù)據(jù)之間的映射關(guān)系,有效提高處理高維度、非線性數(shù)據(jù)的能力。
設(shè)DELM有Q組訓(xùn)練數(shù)據(jù){(xi,yi)|i=1,2,…,Q|}和M個隱含層,將輸入訓(xùn)練數(shù)據(jù)樣本根據(jù)自編碼器極限學(xué)習(xí)機(jī)(ELM-AE)理論得到第一個權(quán)值矩陣β1,接著得到隱含層特征向量H1,…,以此類推,能夠得到M層的輸入層權(quán)重矩陣βM和隱含層特征向量HM。DELM數(shù)學(xué)模型表述式為[16-18]:
(8)
步驟一采用deny小波作為WD的基函數(shù),將丫勒水文站1990年1月至2009年12月共240個月月徑流時序數(shù)據(jù)分解為4個子序列分量S1—S4,見圖1。從圖1可以看出,S1幅值最大,聚集了原始月徑流時序數(shù)據(jù)的大部分能量,描述了徑流序列的趨勢。S4為所有分解分量中的最高頻成分,也是幅值最低的分量,描述了原始月徑流時序數(shù)據(jù)的波動情況。
圖1 丫勒站月徑流時序WD分解結(jié)果
步驟二在延遲時間為1的條件下,采用虛假最鄰近法(FNN)確定各子序列分量及原序列的嵌入維度m,即利用序列前m個月徑流預(yù)測當(dāng)月月徑流量。本文大致按2∶1劃分訓(xùn)練、預(yù)測樣本,即利用實(shí)例1~156個月月徑流數(shù)據(jù)作為訓(xùn)練樣本,157~240月徑流數(shù)據(jù)作為預(yù)測樣本。
步驟三選用3隱層DELM網(wǎng)絡(luò)。針對各子序列分量,通過AVOA優(yōu)化各隱含層神經(jīng)元數(shù),構(gòu)建WD-AVOA-DELM模型目標(biāo)函數(shù):
(9)
步驟四設(shè)置AVOA種群規(guī)模N,最大迭代次數(shù)T,各階段更新策略選擇參數(shù)P1、P2、P3;隨機(jī)初始化禿鷲種群位置Pi(i=1,2,…,N),令當(dāng)前迭代次數(shù)t=0。
步驟五計(jì)算所有禿鷲適應(yīng)度值,確定最優(yōu)、次優(yōu)禿鷲位置BestV1、BestV2。
步驟六對于種群所有禿鷲,利用式(3)其他禿鷲位置;利用式(4)計(jì)算禿鷲飽食率,若|F|≥1,利用式(5)更新禿鷲位置;若0.5≤|F|< 1,利用式(6)更新禿鷲位置;若0≤|F|< 0.5,利用式(7)更新禿鷲位置。
步驟七計(jì)算更新后所有禿鷲種適應(yīng)度,比較并確定最優(yōu)、次優(yōu)禿鷲位置BestV1、BestV2。
步驟八令t=t+1。判斷是否滿足終止條件,若是,輸出BestV1,算法結(jié)束;否則轉(zhuǎn)至步驟六。
步驟九輸出BestV1,即DELM最佳隱含層神經(jīng)元數(shù)。利用AVOA-DELM模型對各子序列分量S1—S4進(jìn)行預(yù)測,預(yù)測結(jié)果疊加重構(gòu)后即得到丫勒站最終月徑流預(yù)測結(jié)果。
丫勒水文站位于云南玉溪市峨山縣,建于1958年12月,1975年撤銷,1990年恢復(fù),屬綠汁江干流控制站,控制徑流面積7 098 km2,為國家重要水文站及省級報汛站。綠汁江發(fā)源于楚雄州武定縣貓街鎮(zhèn)干沙溝西麓,為元江右岸一級支流,屬紅河水系。綠汁江由北向南流經(jīng)祿豐、雙柏、易門、峨山、新平等縣后匯入元江,徑流面積8 613 km2,河流長294 km,自然落差1 651 m,平均比降4.9‰,流域水力資源理論蘊(yùn)藏量為330.7 MW。本文數(shù)據(jù)來源于云南省丫勒水文站1990年1月至2009年12月共240個實(shí)測月徑流序列。從圖2可以看出,丫勒水文站月徑流時序數(shù)據(jù)呈現(xiàn)出典型的多尺度、非線性特征。
圖2 1990—2009年丫勒水文站月徑流變化曲線
WD-AVOA-DELM、WD-AVOA-SVM、WD-AVOA-BP、AVOA-DELM、AVOA-SVM、AVOA-BP模型參數(shù)設(shè)置見表1。
表1 各模型參數(shù)設(shè)置
利用所構(gòu)建的6種模型對實(shí)例月徑流進(jìn)行預(yù)測,結(jié)果見表2,預(yù)測結(jié)果見圖3、4。利用平均相對誤差(MAPE)、平均絕對誤差(MAE)、確定性系數(shù)(DC)、合格率(QR)對各模型進(jìn)行評估,見式(10)。
(10)
表2 丫勒月徑流時間序列訓(xùn)練、預(yù)測結(jié)果對比
圖3 丫勒站月徑流時間序列預(yù)測相對誤差
圖4 丫勒站月徑流時間序列預(yù)測效果
依據(jù)表2及圖3、4可以得出以下結(jié)論。
a)WD-AVOA-DELM模型對丫勒站預(yù)測的MAPE、MAE分別為3.02%、0.411 m3/s,預(yù)測誤差較WD-AVOA-SVM、WD-AVOA-BP模型降低55.1%以上,預(yù)測精度較AVOA-DELM、AVOA-SVM、AVOA-BP模型提高1個數(shù)量級以上,QR為100%,DC達(dá)0.999 7,模型精度評價等級為甲級(合格率大于等于85%、確定性系數(shù)大于等于0.90)??梢姡琖D-AVOA-DELM模型具有更好的預(yù)測精度,將其用于月徑流時間序列預(yù)測是可行的。
b)從表2來看,經(jīng)WD方法分解處理的WD-AVOA-DELM、WD-AVOA-SVM、WD-AVOA-BP模型預(yù)測精度遠(yuǎn)遠(yuǎn)優(yōu)于未經(jīng)分解處理的AVOA-DELM、AVOA-SVM、AVOA-BP模型,可見,采用WD對月徑流時間序列進(jìn)行分解,可達(dá)到弱化復(fù)雜環(huán)境對徑流時間序列影響的目的,從而提高模型預(yù)測精度。
c)依據(jù)GB/T 22482—2008《水文情報預(yù)報規(guī)范》,WD-AVOA-DELM、WD-AVOA-BP模型達(dá)到預(yù)測精度等級甲級;WD-AVOA-SVM模型達(dá)到預(yù)測精度等級乙級;AVOA-DELM、AVOA-SVM、AVOA-BP模型預(yù)測合格率低于30%,已不能滿足徑流預(yù)測精度需求。WD-AVOA-SVM模型僅達(dá)到預(yù)測精度等級乙級,預(yù)測精度低于WD-AVOA-BP模型,表明SVM模型雖然在小樣本預(yù)測中具有優(yōu)勢,但在相對大容量樣本的月徑流中長期預(yù)測中不具優(yōu)勢。
d)從圖4來看,WD-AVOA-DELM模型預(yù)測的絕大多數(shù)月徑流相對誤差在-5%~5%范圍內(nèi)波動,具有較小的預(yù)測誤差;從圖5來看,WD-AVOA-DELM模型預(yù)測結(jié)果能夠很好地逼近實(shí)測徑流,具有較好的預(yù)測效果。通過AVOA優(yōu)化DELM隱含層神經(jīng)元數(shù),有效提高了DELM網(wǎng)絡(luò)的預(yù)測精度和智能優(yōu)水平。
為提高月徑流時間序列預(yù)報精度,提出WD-AVOA-DELM月徑流時間序列預(yù)測模型,并構(gòu)建WD-AVOA-SVM、WD-AVOA-BP、AVOA-DELM、AVOA-SVM、AVOA-BP作對比分析模型,通過云南省丫勒站月徑流時間序列預(yù)測實(shí)例對各模型進(jìn)行檢驗(yàn),得到如下結(jié)論。
a)WD-AVOA-DELM模型對丫勒站月徑流預(yù)測精度遠(yuǎn)優(yōu)于WD-AVOA-SVM、WD-AVOA-BP模型,較AVOA-DELM、AVOA-SVM、AVOA-BP模型提高1個數(shù)量級以上,預(yù)測精度評價等級為甲級,具有較好的預(yù)報精度和實(shí)際應(yīng)用價值。
b)采用WD對月徑流時間序列進(jìn)行分解,可將原月徑流時間序列分解為更簡潔、更具規(guī)律的子序列分量,大大降低預(yù)測器的預(yù)測難度,從而提高預(yù)測精度;通過AVOA優(yōu)化DELM隱含層神經(jīng)元數(shù),有效提高了DELM網(wǎng)絡(luò)的預(yù)測精度和智能優(yōu)水平。
c)WD-AVOA-DELM模型能充分發(fā)揮WD方法、AVOA算法和DELM網(wǎng)絡(luò)優(yōu)勢,表現(xiàn)出較好的預(yù)測精度和穩(wěn)定性能。本文提出的預(yù)測模型及預(yù)測方法可為相關(guān)徑流時間序列預(yù)測研究提供新途徑。