楊瓊波,崔東文
(1.云南省水文水資源局紅河分局,云南紅河661100;2.云南省文山州水務(wù)局,云南文山663000)
月徑流時(shí)間序列預(yù)測研究是水文預(yù)報(bào)研究領(lǐng)域的重要內(nèi)容之一,提高月徑流時(shí)間序列預(yù)測精度對于提高城市防洪抗旱能力、保障下游生態(tài)環(huán)境用水、優(yōu)化配置水資源等具有重要意義。由于受地理位置、地形條件、大氣環(huán)流、人類活動(dòng)等諸多因素影響,其徑流時(shí)間序列呈現(xiàn)出較強(qiáng)的非線性、非平穩(wěn)性和多尺度等特征,當(dāng)前尚無完善的模型可準(zhǔn)確描述其變化過程,只有對徑流時(shí)間序列進(jìn)行細(xì)致分析,才能有效提高徑流預(yù)測精度。當(dāng)前“分解-重構(gòu)”的時(shí)間序列預(yù)測方法已在降水[1]、徑流[2-6]預(yù)測中得到應(yīng)用,并獲得較好的預(yù)測效果。時(shí)間序列分解方法有小波分解(Wavelet Decomposition,WD)、經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)、總體經(jīng)驗(yàn)?zāi)B(tài)分解(En?semble Empircal Mode Decomposition,EEMD)、變分模態(tài)分解(Variational Mode Decomposition,VMD)、奇異譜分析(Singular Spectrum Analysis,SSA)等;預(yù)測模型有ARMA 模型[3]、BP 神經(jīng)網(wǎng)絡(luò)[4-5]、廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Net?work,GRNN)[6]、支持向量機(jī)(Support Vector Machine,SVM)[2]、相關(guān)向量機(jī)(Relevance Vector Machine,RVM)[7]、極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)[8]、LSTM 神經(jīng)網(wǎng)絡(luò)[9]、秩次集對分析法[10]等。
小波包分解(Wavelet Packet Decomposition,WPD)源于小波分解小波分解,它在分解信號低頻子集同時(shí),對高頻子集繼續(xù)分解,具有數(shù)學(xué)釋意明確、使用簡潔、能夠自行設(shè)定分解層數(shù)和分解使用的小波函數(shù)等優(yōu)點(diǎn)[11,12],已在降水[1]時(shí)間序列分解中得到應(yīng)用。奇異譜分析是近年來興起的一種研究非線性時(shí)間序列數(shù)據(jù)的有效方法,它根據(jù)所觀測到的時(shí)間序列構(gòu)造出軌跡矩陣,并對軌跡矩陣進(jìn)行分解、重構(gòu),從而提取出代表原時(shí)間序列不同成分的子序列。研究表明,SSA 對去除噪聲信號效果優(yōu)于經(jīng)驗(yàn)?zāi)B(tài)分解和小波分解,目前SSA 已在徑流時(shí)間序列分解[2]中得到應(yīng)用。鼠群優(yōu)化(Rat Swarm Optimization,RSO)算法是G.Dhiman等人于2020年基于自然界中老鼠追逐和攻擊獵物而提出的一種新型仿生優(yōu)化算法,具有實(shí)現(xiàn)簡單、參數(shù)少、尋優(yōu)精度效果好等特點(diǎn)[13]?;芈暊顟B(tài)網(wǎng)絡(luò)(Echo State Network,ESN)是Jaeger 等提出的一種新型遞歸神經(jīng)網(wǎng)絡(luò),特點(diǎn)是訓(xùn)練過程簡單,擁有動(dòng)態(tài)儲(chǔ)備池,具備短時(shí)記憶功能,在處理時(shí)間序列等非線性系統(tǒng)辨識(shí)問題上表現(xiàn)突出,一般條件下可無限逼近動(dòng)態(tài)系統(tǒng)。在實(shí)際應(yīng)用中,ESN 網(wǎng)絡(luò)的輸出權(quán)值矩陣和儲(chǔ)備池規(guī)模、稀疏度等超參數(shù)對ESN 網(wǎng)絡(luò)性能有著重要影響,目前主要有優(yōu)化輸出權(quán)值矩陣[14-16]和優(yōu)化儲(chǔ)備池規(guī)模等超參數(shù)[17-21]兩種途徑。
為提高月徑流時(shí)間序列預(yù)測精度,本文以云南省江邊街水文站1957-2014年月徑流時(shí)間序列預(yù)測為例,提出小波包分解(WPD)與奇異譜分解(SSA)-鼠群優(yōu)化(RSO)算法-回聲狀態(tài)網(wǎng)絡(luò)(ESN)相混合的徑流時(shí)間序列預(yù)測方法。首先,分別利用WPD、SSA 將實(shí)例月徑流時(shí)間序列數(shù)據(jù)分解為若干子序列,有效降低徑流時(shí)間序列數(shù)據(jù)的復(fù)雜性;其次,介紹RSO 算法,在不同維度條件下選取6 個(gè)典型函數(shù)對RSO 算法進(jìn)行仿真測試;最后,利用RSO 算法優(yōu)化ESN 網(wǎng)絡(luò)儲(chǔ)備池規(guī)模等超參數(shù),建立WPD-RSO-ESN、SSA-RSO-ESN 模型,并分別構(gòu)建WPD-RSOSVM、WPD-ESN、WPD-SVM 和SSA-RSO-SVM、SSA-ESN、SSA-SVM 作對比分析模型,通過實(shí)例對8 種模型預(yù)測效果進(jìn)行檢驗(yàn)及對比分析。
小波包分解(WPD)是在小波分解(WD)的基礎(chǔ)上改進(jìn)和發(fā)展而來的一種有效分解方法,其能同時(shí)解析信號的低頻與高頻部分,已在非平穩(wěn)信號分解中得到廣泛應(yīng)用。根據(jù)分解的信號類別,小波包分解可分為離散小波轉(zhuǎn)換和連續(xù)小波轉(zhuǎn)換。理論上信號被小波包分解為3 層就能夠提取信號中的有效信息,逼近任意非線性函數(shù),從而解決實(shí)際實(shí)測問題[1,11,12]。連續(xù)小波轉(zhuǎn)換數(shù)學(xué)描述見式(1):
式中:x(t)表示原始信號;ψ*表示母小波函數(shù);a表示比例因子;b表示轉(zhuǎn)換參數(shù);t表示原始信號對應(yīng)時(shí)間點(diǎn)。
奇異譜分解(SSA)是根據(jù)所觀測到的時(shí)間序列構(gòu)造出軌跡矩陣,并對軌跡矩陣進(jìn)行分解、重構(gòu),從而提取出代表原時(shí)間序列不同成分子序列[22-24]。SSA包含分解與重構(gòu)兩個(gè)階段:
(1)分解。選取窗口長度L構(gòu)造軌跡矩陣X如下:
式中,M表示時(shí)間序列長度;L表示窗口長度,即嵌入維數(shù),一般為不超過序列長度1/3的整數(shù)。
對矩陣X進(jìn)行SVD(Singular Value Decomposition,SVD)分解:
式中:λi表示第i個(gè)特征值;Ui表示與第i個(gè)特征值對應(yīng)的特征向量;Vi表示第i個(gè)主成分;d= rank(X)= max{i:λi> }0 。
(2)重構(gòu)。根據(jù)給定閾值,取前p個(gè)分量作為原始序列的替代:記其中一個(gè)分量對應(yīng)的矩陣為X*,采用對角平均的方式,將分解矩陣轉(zhuǎn)換為序列,其表示為:
式中:向量數(shù)量K=M-L+ 1;L*= min(L,K);K*= max(L,K)。
1.3.1 RSO算法簡述
鼠群優(yōu)化(RSO)算法是一種尋優(yōu)精度高、全局搜索性能強(qiáng)的新型仿生群體智能算法,主要通過追逐獵物、攻擊獵物兩個(gè)過程實(shí)現(xiàn)待優(yōu)化問題的求解[13]:
(1)追逐獵物。老鼠是群居動(dòng)物,它們通過群居競爭行為來追逐獵物。為從數(shù)學(xué)上定義這種行為,假設(shè)最好老鼠搜索個(gè)體知道獵物的位置,其他老鼠體可以更新當(dāng)前位置來獲得最佳搜索位置。老鼠追逐獵物數(shù)學(xué)描述如下:
式中,表示當(dāng)前獵物位置;表示第i只老鼠第x次迭代位置;A表示勘探參數(shù),,R表示[1,2]范圍內(nèi)隨機(jī)數(shù),T表示最大迭代次數(shù);C表示開發(fā)參數(shù),C= 2 ·rand(),rand()表示[0,1]范圍內(nèi)隨機(jī)數(shù);表示當(dāng)前迭代所處最佳老鼠個(gè)體位置。
(2)攻擊獵物。為從數(shù)學(xué)上定義老鼠攻擊獵物過程,提出以下數(shù)學(xué)表達(dá)式:
勘探和開發(fā)之間良好平衡是評估優(yōu)化算法優(yōu)化性能優(yōu)劣的重要標(biāo)志??碧绞窃诮o定的搜索空間中探索有希望獲得最優(yōu)解的不同區(qū)域;而開發(fā)則是圍繞有希望獲得最優(yōu)解的不同區(qū)域搜索最優(yōu)解。RSO算法主要通過自動(dòng)調(diào)整勘探參數(shù)A和開發(fā)參數(shù)C來獲得勘探和開發(fā)之間的良好平衡,從而獲得算法最優(yōu)解。
1.3.2 RSO算法仿真驗(yàn)證
為測試RSO算法的尋優(yōu)性能,選取Sphere等6個(gè)單、多峰目標(biāo)函數(shù)在不同維度條件下對RSO 算法進(jìn)行仿真測試。單峰目標(biāo)函數(shù)用于評測RSO 算法的尋優(yōu)精度,多峰目標(biāo)函數(shù)用于評測RSO 算法的全局搜索能力。采用20 次尋優(yōu)平均值對RSO 算法的尋優(yōu)性能進(jìn)行評估,見表1。設(shè)置RSO 算法老鼠種群規(guī)模n=50,最大迭代次數(shù)T=1000,其他參數(shù)采用RSO算法默認(rèn)值。
表1 函數(shù)優(yōu)化對比結(jié)果Tab.1 Function optimization comparison results
(1)對于單峰目標(biāo)函數(shù)Sphere、Schwefel 2.22、Schwefel12,RSO 算法在不同維度條件下20 次尋優(yōu)均獲得理論最優(yōu)值0,表現(xiàn)出較好的尋優(yōu)精度。
(2)對于多峰目標(biāo)函數(shù)Griewank、Rastrigin,RSO 算法在不同維度條件下20 次尋優(yōu)均獲得了理論最優(yōu)值0;對于連續(xù)旋轉(zhuǎn)不可分多峰目標(biāo)函數(shù)Ackley,RSO 算法在不同維度條件下20 次尋優(yōu)均獲得相對理論最優(yōu)值8.88e-16,表現(xiàn)出較好的全局搜索性能。
可見,對于上述6個(gè)測評函數(shù),RSO 算法在不同維條件下均具有較好的尋優(yōu)精度和全局搜索能力。
回聲狀態(tài)網(wǎng)絡(luò)(ESN)由輸入層、動(dòng)態(tài)儲(chǔ)備池(Dynamic Res?ervoir,DR)、輸出層組成。其中,動(dòng)態(tài)儲(chǔ)備池是網(wǎng)絡(luò)的核心部分,它是由大量的、隨機(jī)和以稀疏方式連接的隱含層神經(jīng)元組成,故其具有短時(shí)記憶功能[16-18]。ESN網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 ESN 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 ESN neural network structure diagram
設(shè)網(wǎng)絡(luò)輸入為u(n)=[u1(n),u2(n),…,uK(n)]T,狀態(tài)為x(n)=[x1(n),x2(n),…,xN(n)]T,輸出為y(n)=[y1(n),y2(n),…,yL(n)]T,其中K表示輸入維數(shù),N表示內(nèi)部神經(jīng)元個(gè)數(shù),L表示輸出維數(shù)。則[11-13]:
式中:Win表示輸入權(quán)值矩陣;W表示內(nèi)部狀態(tài)權(quán)值矩陣;Wb表示輸出至內(nèi)部狀態(tài)權(quán)值矩陣;Wo表示內(nèi)部狀態(tài)至輸出權(quán)值矩陣;f=(f1,f2,…,fN)表示內(nèi)部神經(jīng)元激活函數(shù),一般采用sigmoid 函數(shù)或tanh 函數(shù);fo表示輸出函數(shù),一般采用線性函數(shù)。ESN 神經(jīng)網(wǎng)絡(luò)參數(shù)中,Win、W和Wb均采用隨機(jī)方式生成,在學(xué)習(xí)過程中保持不變。
RSO 算法優(yōu)化ESN 超參數(shù)的基本思想是:分別將ESN 儲(chǔ)備池規(guī)模S、譜半徑R、稀疏度SD、輸入單元尺度IS映射為RSO 算法老鼠位置,設(shè)計(jì)RSO-ESN模型適應(yīng)度函數(shù),將RSO-ESN模型最優(yōu)問題轉(zhuǎn)化為求解適應(yīng)度函數(shù)全局最小時(shí)對應(yīng)的最佳老鼠個(gè)體位置,即全局最優(yōu)解。根據(jù)最佳老鼠個(gè)體位置與ESN 超參數(shù)的映射關(guān)系,即可得到ESN 超參數(shù)值。預(yù)測實(shí)現(xiàn)流程圖見圖2,實(shí)現(xiàn)步驟如下:
圖2 月徑流時(shí)間序列預(yù)測流程圖Fig.2 Monthly runoff time series forecast flowchart
步驟一:分別利用WPD、SSA 方法將原月徑流序列分解為若干獨(dú)立子序列;通過自相關(guān)函數(shù)法(AFM)確定各子序列輸入向量,劃分訓(xùn)練樣本和預(yù)測樣本。
步驟二:初始化ESN 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、動(dòng)態(tài)儲(chǔ)備池DR 數(shù)量、譜半徑、隨機(jī)生成Win、W和Wb矩陣。構(gòu)建訓(xùn)練樣本相對誤差絕對值之和作為RSO-ESN模型適應(yīng)度函數(shù):
步驟三:設(shè)置老鼠種群規(guī)模n,最大迭代次數(shù)T;初始化老鼠個(gè)體位置Pi,i= 1,2,…,n。
步驟四:計(jì)算每只老鼠適應(yīng)度值,在給定搜索空間中確定最佳老鼠個(gè)體位置。令當(dāng)前迭代次數(shù)x= 0。
步驟五:利用式(6)更新的老鼠個(gè)體位置位置。
步驟六:計(jì)算更新后的每只老鼠適應(yīng)度值。若當(dāng)前最佳位置優(yōu)于前代最佳位置,則保存當(dāng)前最佳位置;否則保存前代最佳位置。
步驟七:令x=x+ 1。判斷x是否等于T,若是,輸出最佳位置,算法結(jié)束;否則重復(fù)步驟五~步驟七。
步驟九:模型評估。利用平均絕對百分比誤差(Mean Abso?lute Percentage Error,MAPE)、平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差RMSE(Root Mean Square Error,RMSE)對各模型進(jìn)行評估,見式(10)。
江邊街水文站位于云南省紅河州彌勒縣江邊鄉(xiāng)江邊村,系南盤江干流控制站,控制徑流面積25 116 km2,為國家重要水文站、中央報(bào)汛站、國家水質(zhì)監(jiān)測站。南盤江發(fā)源于曲靖市沾益馬雄山,為珠江主源,河長2 214 km,徑流面積42 800 km2,云南省境內(nèi)長677 km,落差1 724 m,流經(jīng)14 個(gè)縣市,設(shè)有沾益、西橋、高古馬、小龍?zhí)?、江邊街、發(fā)蒙水文站,主要支流有曲江、瀘江、甸溪河、清水江、黃泥河等。開展江邊街水文站月徑流時(shí)間序列預(yù)測研究,對于提高城市防洪抗旱能力、保障下游生態(tài)環(huán)境用水、優(yōu)化配置水資源等具有重要意義。本文數(shù)據(jù)來源于江邊街水文站1957-2014年55年共660 個(gè)實(shí)測月徑流時(shí)間序列數(shù)據(jù)。
2.1.1 WPD分解
1957-2014年江邊街水文站逐月徑流序列數(shù)據(jù)見圖3。從圖3 可以看出月徑流數(shù)據(jù)為非平穩(wěn)序列,波動(dòng)較大,本文利用db4小波將1957-2014年逐月徑流數(shù)據(jù)進(jìn)行3層小波包分解,得到8 個(gè)分解空間的子序列數(shù)據(jù)[1]。其中,[3,0]、[3,1]、[3,2]、[3,3]低頻空間數(shù)據(jù)和[3,4]、[3,5]、[3,6]、[3,7]高頻空間數(shù)據(jù)波形見圖4。低頻空間數(shù)據(jù)振幅較大、波長較短,大致反映月徑流時(shí)間序列的變化趨勢;高頻空間數(shù)據(jù)振幅逐漸減小、波長逐漸變長,反映月徑流時(shí)間序列的波動(dòng)情況。
圖3 江邊街站月徑流變化曲線Fig.3 Monthly runoff variation curve of Jiangbianjie Station
圖4 江邊街站月徑流WPD時(shí)間序列分解Fig.4 Decomposition of WPD time series of monthly runoff at Jiangbianjie Station
2.1.2 SSA分解
SSA方法是近年來興起的一種研究非線性時(shí)間序列數(shù)據(jù)的有效方法,它根據(jù)所觀測到的時(shí)間序列構(gòu)造出軌跡矩陣,并對軌跡矩陣進(jìn)行分解、重構(gòu),從而提取出代表原時(shí)間序列不同成分的子序列。由于月徑流是以年為周期,因此本文設(shè)置SSA 窗口長度L= 12,即利用SSA 方法將原月徑流時(shí)間序列數(shù)據(jù)分解為12 個(gè)獨(dú)立的子序列IMF1~I(xiàn)MF12。SSA 分解與月徑流隨時(shí)間變化趨勢如圖5所示。從圖5 可以看出,子序列IMF1 振幅最大、頻率最高、波長最短,大致反映了原月徑流時(shí)間序列的變化趨勢;子序列IMF2—子序列IMF12 振幅逐漸減小、頻率逐漸降低、波長逐漸變長,反映了原月徑流時(shí)間序列的波動(dòng)情況。
圖5 江邊街站月徑流SSA時(shí)間序列分解Fig.5 Decomposition of SSA Time Series of Monthly Runoff at Jiangbianjie Station
合理確定經(jīng)分解后的各子序列的輸入、輸出向量是提高月徑流時(shí)間序列預(yù)測精度的關(guān)鍵。本文采用自相關(guān)函數(shù)法(Auto?correlation Function,AFM)確定各子序列的輸入、輸出向量。確定原則:通過SPSS 軟件計(jì)算各子序列的自相關(guān)系數(shù),在滯后數(shù)H≥4 情況下,將自相關(guān)系數(shù)最大時(shí)所對應(yīng)的滯后數(shù)H作為各子序列最優(yōu)嵌入維數(shù),即將預(yù)測月的前H個(gè)月徑流數(shù)據(jù)作為輸入向量,預(yù)測月作為輸出向量,見表2、3。本文利用實(shí)例前533~536個(gè)月實(shí)測數(shù)據(jù)作為訓(xùn)練樣本,后120個(gè)月作為預(yù)測樣本。
表2 WPD分解各子序列自相關(guān)系數(shù)、嵌入維數(shù)及序列長度Tab.2 WPD decomposes the autocorrelation coefficient,embedding dimension and sequence length of each subsequence
2.3.1 參數(shù)設(shè)置
(1)WPD-RSO-ESN、SSA-RSO-ESN 模型:設(shè)置老鼠種群規(guī)模n=50,最大迭代次數(shù)T=100,其他參數(shù)采用算法默認(rèn)值;ESN網(wǎng)絡(luò)儲(chǔ)備池規(guī)模S搜索范圍設(shè)置為[2,20],譜半徑R、稀疏度SD、輸入單元尺度IS搜索范圍均設(shè)置為[0.01,0.99],數(shù)據(jù)采用[0,1]進(jìn)行歸一化處理。
(2)WPD-RSO-SVM、SSA-RSO-SVM 模型:RSO 算法設(shè)置同上;SVM 懲罰因子、核函數(shù)參數(shù)搜索范圍均設(shè)置為[2-10,210],不敏感損失系數(shù)設(shè)置為0.01,交叉驗(yàn)證折數(shù)設(shè)置為3,數(shù)據(jù)采用[0,1]進(jìn)行歸一化處理。
(2)其他模型:通過反復(fù)試湊的方法確定WPD-ESN、SSAESN 模型的儲(chǔ)備池規(guī)模、譜半徑、稀疏度和輸入單元尺度參數(shù)值;同法確定WPD-SVM、SSA-SVM 模型的懲罰因子和核函數(shù)參數(shù)值。
2.3.2 實(shí)例預(yù)測結(jié)果分析
利用所建立的WPD-RSO-ESN、WPD-RSO-SVM、WPDESN、WPD-SVM 模型對表2 中各子序列進(jìn)行預(yù)測,將預(yù)測結(jié)果疊加即得到實(shí)例月徑流最終預(yù)測結(jié)果;同樣利用SSA-RSOESN、SSA-RSO-SVM、SSA-ESN、SSA-SVM模型對表3中各子序列進(jìn)行預(yù)測,將預(yù)測結(jié)果疊加即得到實(shí)例月徑流最終預(yù)測結(jié)果。各模型采用平均絕對百分比誤差MAPE(%)、平均絕對誤差MAE(m3/s)和均方根誤差RMSE(m3/s)進(jìn)行性能評估,結(jié)果見表4;預(yù)測效果見圖6。
表3 SSA分解各子序列自相關(guān)系數(shù)、嵌入維數(shù)及序列長度Tab.3 SSA decomposes the autocorrelation coefficient,embedding dimension and sequence length of each subsequence
表4 實(shí)例120個(gè)月月徑流時(shí)間序列預(yù)測精度對比Tab.4 Comparison of prediction accuracy of 120-month monthly runoff time series
依據(jù)表4及圖6可以得出以下結(jié)論:
圖6 8種模型月徑流時(shí)間序列預(yù)測效果Fig.6 Prediction of monthly runoff time series of 8 models
(1)從小波包分解的4 種模型預(yù)測效果來看,WPD-RSOESN 模型對實(shí)例月徑流時(shí)間序列預(yù)測的MAPE、MAE、RMSE分別為2.73%、2.71 m3/s、3.99 m3/s,MAPE分別較WPD-RSO-SVM、WPD-ESN、WPD-SVM 模型降低27.0%、29.6%、45.6%,MAE分別降低14.8%、21.9%、30.9%,RMSE分別降低4.10%、18.9%、20.4%;從奇異譜分解的4種模型預(yù)測效果來看,SSA-RSO-ESN模型對實(shí)例月徑流時(shí)間序列預(yù)測的MAPE、MAE、RMSE分別為3.90%、4.46 m3/s、6.83 m3/s,MAPE分別較SSA-RSO-SVM、SSAESN、SSA-SVM 模型降低16.7%、20.7%、30.5%,MAE分別降低5.30%、8.40%、9.30%,RMSE分別降低2.70%、9.50%、3.90%。WPD-RSO-ESN、SSA-RSO-ESN 模型均具有較高預(yù)測精度和較好的泛化性能,將其用于月徑流時(shí)間序列預(yù)測是可行的。
(2)從不同分解方法的同一模型預(yù)測效果對比來看,WPDRSO-ESN 預(yù)測精度優(yōu)于SSA-RSO-ESN,WPD-RSO-SVM 優(yōu)于SSA-RSO-SVM,WPD-ESN 優(yōu)于SSA-ESN,WPD-SVM 優(yōu)于SSA-SVM,表明WPD 分解可有效降低時(shí)間序列數(shù)據(jù)的復(fù)雜性,大大提高模型的預(yù)測精度,其對月徑流時(shí)間序列的分解效果要優(yōu)于SSA分解方法。
(3)從同一模型預(yù)測效果對比來看,WPD-RSO-ESN 預(yù)測精度優(yōu)于RSO-ESN,WPD-RSO-SVM 優(yōu)于RSO-SVM,SSARSO-ESN 優(yōu)于SSA-ESN,SSA-RSO-SVM 優(yōu)于SSA-SVM,表明RSO 算法能有效優(yōu)化ESN 網(wǎng)絡(luò)儲(chǔ)備池規(guī)模等超參數(shù)及SVM 懲罰因子和核函數(shù)參數(shù)。
(4)從表4可以看出,WPD-RSO-ESN 模型的預(yù)測精度優(yōu)于WPD-RSO-SVM、WPD-ESN、SSA-RSO-ESN 模型,明顯優(yōu)于WPD-SVM、SSA-RSO-SVM、SSA-ESN、SSA-SVM 模型,具有更佳的預(yù)測效果。
(5)從圖6來看,WPD-RSO-ESN 模型預(yù)測的最大絕對百分比誤差僅為17.9%,最大絕對誤差僅為17.3m3/s,除少數(shù)樣本外,絕大多數(shù)樣本的絕對百分比誤差均在0 值附近波動(dòng),具有更高預(yù)測精度和更好的預(yù)測效果。
本文基于小波包分解(WPD)、奇異譜分解(SSA)與鼠群優(yōu)化(RSO)算法、回聲狀態(tài)網(wǎng)絡(luò)(ESN)建立WPD-RSO-ESN、SSARSO-ESN月徑流時(shí)間序列預(yù)測模型,并分別構(gòu)建WPD-RSOSVM、WPD-ESN、WPD-SVM 和SSA-RSO-SVM、SSA-ESN、SSA-SVM 作對比分析模型,利用云南省江邊街水文站1957-2014年月徑流時(shí)間序列數(shù)據(jù)對8 種模型進(jìn)行驗(yàn)證,得出以下結(jié)論。
(1)鼠群優(yōu)化(RSO)算法在5維、10維、30維、50維和100維條件下均具有較好的尋優(yōu)精度和全局搜索能力,將RSO 算法用于ESN網(wǎng)絡(luò)儲(chǔ)備池規(guī)模、譜半徑等超參數(shù)優(yōu)化是可靠的。
(2)WPD-RSO-ESN、SSA-RSO-ESN 模型對實(shí)例月徑流時(shí)間序列均具有較高預(yù)測精度和較好的泛化性能,將其用于月徑流時(shí)間序列預(yù)測是可行的。模型有效地提高了徑流時(shí)間序列的預(yù)測精度,為水文時(shí)間序列預(yù)測研究提供新的途徑。其中,WPD-RSO-ESN 模型的預(yù)測效果要優(yōu)于SSA-RSO-ESN模型。
(3)實(shí)例驗(yàn)證表明,小波包分解(WPD)可將復(fù)雜的徑流時(shí)間序列分解為更加穩(wěn)定、更具規(guī)律的空間時(shí)間序列,有效降低了時(shí)間序列數(shù)據(jù)的復(fù)雜性,大大提高了模型的預(yù)測精度,分解效果優(yōu)于奇異譜分解(SSA)方法;RSO 算法能有效優(yōu)化ESN 網(wǎng)絡(luò)超參數(shù),大大提高ESN網(wǎng)絡(luò)的預(yù)測性能。□