孔繁苗,高 鷺+,李鵬程,張 飛,2,張曉琳,秦 嶺
(1.內(nèi)蒙古科技大學(xué) 信息工程學(xué)院,內(nèi)蒙古 包頭 014010;2.華北電力大學(xué) 可再生能源學(xué)院,北京 102206)
目前,為了實(shí)現(xiàn)高精度的時(shí)間序列預(yù)測(cè)[1-6],眾多研究者已經(jīng)提出大量預(yù)測(cè)模型,包括傳統(tǒng)的統(tǒng)計(jì)模型、機(jī)器學(xué)習(xí)模型、深度學(xué)習(xí)模型和混合模型。統(tǒng)計(jì)模型對(duì)于時(shí)間序列的突變預(yù)測(cè)性能較差,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)突破了這一問題,然而研究者們更傾向于利用組合預(yù)測(cè)模型,因?yàn)槠淇梢詫⒏鲉我活A(yù)測(cè)模型的優(yōu)勢(shì)結(jié)合起來。比如通過LSTM、CNN等神經(jīng)網(wǎng)絡(luò)與EMD、小波變換(wavelet transform,WT)等數(shù)據(jù)分解處理方法相結(jié)合,對(duì)分解后的各分量分別進(jìn)行預(yù)測(cè),這樣可以把各單一分量信息有效的利用起來,既避免浪費(fèi)有效信息又降低了其波動(dòng)性對(duì)預(yù)測(cè)精度的影響。
現(xiàn)有許多利用分解算法進(jìn)行組合預(yù)測(cè)的模型,大致分為兩種:①采用單一模型對(duì)分解后的子序列進(jìn)行單獨(dú)預(yù)測(cè)[7-10]:如Guoyan Huang等提出一種基于EMD(empirical mode decomposition)與門控遞歸單元神經(jīng)網(wǎng)絡(luò)(gated recurrent unit,GRU)的混合方法用于預(yù)測(cè)PM2.5濃度[10]。首先利用EMD對(duì)PM2.5序列進(jìn)行分解,然后各子序列分別進(jìn)入GRU進(jìn)行訓(xùn)練預(yù)測(cè),最后所有子序列相加得到最終預(yù)測(cè)結(jié)果。這種組合預(yù)測(cè)方法僅采用單一模型預(yù)測(cè),無法精準(zhǔn)擬合波動(dòng)性各不同的全部序列,進(jìn)而使得整體預(yù)測(cè)精度不高。②分解后的子序列分為高低頻,采用線性模型對(duì)平穩(wěn)序列進(jìn)行預(yù)測(cè)、非線性模型對(duì)非平穩(wěn)子序列進(jìn)行預(yù)測(cè)[11-13]:如Guangsheng Dong等提出一種基于小波分解(wavelet decomposition,WD)、支持向量回歸(support vector regression,SVR)和滑動(dòng)平均(moving averag,MA)模型的服務(wù)預(yù)測(cè)時(shí)間序列[12]。WD提取原始數(shù)據(jù)中的非平穩(wěn)高頻與平穩(wěn)低頻子序列,分別進(jìn)入SVR與MA模型中進(jìn)行訓(xùn)練預(yù)測(cè),后將所有子序列進(jìn)行組合。這種預(yù)測(cè)模型分別采用線性模型與非線性模型進(jìn)行預(yù)測(cè),其中線性模型只能預(yù)測(cè)較為線性平穩(wěn)的序列,而多數(shù)情況下,經(jīng)過分解的序列中線性平穩(wěn)序列較少,這導(dǎo)致了計(jì)算成本的增加,尤其是處理劇烈波動(dòng)數(shù)據(jù)。預(yù)測(cè)方法的文獻(xiàn)綜述見表1。
針對(duì)各趨勢(shì)特點(diǎn)將子序列分類,后采用具有不同優(yōu)勢(shì)的模型預(yù)測(cè)是一種很好的解決方法。然而根據(jù)調(diào)查發(fā)現(xiàn),暫無針對(duì)子序列分配問題的研究,大多數(shù)工作僅依據(jù)簡單標(biāo)準(zhǔn)差的分析判斷波動(dòng)性,這無法有效地劃分子序列[14-16]。因此,本文提出一種分配函數(shù)D,其有兩點(diǎn)優(yōu)勢(shì):①能夠提高預(yù)測(cè)的精度;②有效節(jié)約了計(jì)算成本?;诜峙浜瘮?shù)D與EMD、LSTM、LB(littlebit model)組合一種時(shí)間序列預(yù)測(cè)模型,其主要特點(diǎn)如下:
經(jīng)過EMD分解得到的一系列子序列交由LSTM、LB兩種預(yù)測(cè)模型進(jìn)行預(yù)測(cè),解決了文獻(xiàn)[7-10]中單一預(yù)測(cè)模型無法擬合波動(dòng)性不同的全部子序列的問題。
LSTM、LB兩種預(yù)測(cè)模型均可以很好預(yù)測(cè)具有突變性的非線性時(shí)間序列,解決了文獻(xiàn)[11-13]中計(jì)算成本增加的問題。
提出分配函數(shù)D根據(jù)波動(dòng)趨勢(shì)將波動(dòng)性較大的極端波動(dòng)子序列篩選出并交由LSTM訓(xùn)練預(yù)測(cè),剩余子序列由LB進(jìn)行訓(xùn)練預(yù)測(cè),解決了文獻(xiàn)[14-16]無法有效劃分子序列的問題。
時(shí)間序列數(shù)據(jù)大多伴隨著高隨機(jī)性和非平穩(wěn)性的特點(diǎn),增加了預(yù)測(cè)的難度。為了學(xué)習(xí)時(shí)間序列數(shù)據(jù)更多重要的信息,提出一種EMD-LSTM-LB模型。原始時(shí)間序列經(jīng)EMD分解為一系列具有不同特征尺度的子序列,分配函數(shù)D根據(jù)數(shù)據(jù)波動(dòng)性大小決定這些子序列的分配情況。
EMD-LSTM-LB模型設(shè)計(jì)結(jié)構(gòu)如圖1所示。
圖1 所提模型流程
LSTM是一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的算法,會(huì)在長時(shí)間尺度上有選擇性的記憶部分重要特征,所以更擅長處理波動(dòng)性大的時(shí)間序列預(yù)測(cè),但LSTM需要調(diào)參且不能并行處理數(shù)據(jù),處理大量數(shù)據(jù)集會(huì)導(dǎo)致計(jì)算效率低。LB是通過數(shù)據(jù)分析后,進(jìn)行聚類融合去學(xué)習(xí)數(shù)據(jù)的根本性特征。當(dāng)波動(dòng)性大的數(shù)據(jù)且數(shù)據(jù)量相對(duì)較少的情況下,LB的預(yù)測(cè)效果沒有LSTM的預(yù)測(cè)效果好。因此,將分配函數(shù)D篩選出的波動(dòng)性較大的子序列采用LSTM進(jìn)行預(yù)測(cè),剩余波動(dòng)性不是很極端的子序列采用LB進(jìn)行預(yù)測(cè)。
具體細(xì)節(jié)如算法1所示。
算法1:EMD-LSTM-LB
輸入:Xp1=(x1,x2…xt)——時(shí)間序列數(shù)據(jù)訓(xùn)練集
Xp2=(xt+1,xt+2…xt+m)——時(shí)間序列數(shù)據(jù)測(cè)試集
輸出:Yq=(yt+1,yt+2…yt+m)——模型輸出預(yù)測(cè)值
參數(shù):batch_size——批量大小
past_steps——?dú)v史步長
lstm_units——BiLSTM神經(jīng)單元個(gè)數(shù)
lr——學(xué)習(xí)率
epochs——迭代次數(shù)
p——參考范圍
(1) EMD將原始數(shù)據(jù)分解為一系列imfs
(2) 數(shù)據(jù)歸一化
(3)FORiINimfs:
(4) /*分配函數(shù)D(使用式(4)~式(6)選擇合適的預(yù)測(cè)模型)*/
(5)IF(tVn≥p):
(6) /*LSTM預(yù)測(cè)極端波動(dòng)序列*/
(7) lstm= LSTM(xk)
(8) /*激活函數(shù)=‘relu’, 損失函數(shù)=‘mse’, 優(yōu)化器=adam*/
(9) /*lr=0.001,epochs=20,batch_size=64*/
(10)predicts=lstm(xt)
(11)ELSE:
(12) /*LB預(yù)測(cè)平穩(wěn)數(shù)據(jù)*/
(13)predicts=LB(xk,xt)
(14)ENDIF
(15)ENDFOR
(16) 數(shù)據(jù)反歸一化
(17)RETURNpredicts
(18)yt=sum(predicts)
EMD是一種常用的自適應(yīng)處理非線性、非平穩(wěn)性時(shí)間序列的技術(shù),其依據(jù)數(shù)據(jù)自身時(shí)間尺度特征識(shí)別出數(shù)據(jù)的固有模態(tài),然后進(jìn)行分解,無需提前設(shè)置基函數(shù)[17]。故本文采用EMD對(duì)時(shí)間序列進(jìn)行分解,使復(fù)雜的信號(hào)分解為有限個(gè)本征模函數(shù)(intrinsic mode function,IMF)和一個(gè)剩余分量,各IMF包含原始數(shù)據(jù)不同波動(dòng)性的局部特征信號(hào)。
EMD分解公式如式(1)~式(3)所示
(1)
ht=Xt-mt
(2)
(3)
mt為上下包絡(luò)線的均值;ut、lt為所有局部極大值點(diǎn)形成的上、下包絡(luò)線;ht為得到的分量;Xt為待分解序列;imfi為IMF分量;rn為剩余分量。
在經(jīng)過EMD分解后,得到一系列波動(dòng)性不同的子序列。這些子序列中存有波動(dòng)性較為強(qiáng)烈的極端子序列,然而如何區(qū)分極端子序列是一個(gè)重要問題。針對(duì)該問題,本文根據(jù)波動(dòng)性提出一種分配函數(shù)D,相關(guān)公式如式(4)~式(6)所示。
設(shè)
B={T1,T2,T3,…,Tn} (n=1,…,N)
(4)
式中:B是原時(shí)間序列分解后的集合;其中,Tn∈R1×i(n=1,…,N) 為分解后的子序列
(5)
(6)
圖2 平穩(wěn)序列
(7)
(3)本小節(jié)討論P(yáng)值的設(shè)定。采用拐點(diǎn)法對(duì)P值進(jìn)行設(shè)定。數(shù)學(xué)表達(dá)式如式(8)所示
P=1+3loge(n)(n=2,…,N)
(8)
隨著n值遞增,預(yù)測(cè)誤差也隨之遞減。圖3展示了P與n之間的關(guān)系,當(dāng)出現(xiàn)n值遞增且預(yù)測(cè)誤差遞增時(shí),會(huì)出現(xiàn)預(yù)測(cè)誤差的拐點(diǎn),此時(shí)不再存在正相關(guān)關(guān)系,而是負(fù)相關(guān)。換而言之,n遞增導(dǎo)致預(yù)測(cè)誤差增大,則n-1就是P值最優(yōu)的參數(shù)。P與n之間的關(guān)系如圖3所示。
圖3 P與n之間的關(guān)系
區(qū)分極端子序列的P值為一個(gè)超參數(shù)。由圖3建議設(shè)定n值為4,此時(shí)P值為2.8,對(duì)應(yīng)預(yù)測(cè)誤差最小。對(duì)于每個(gè)子序列,當(dāng)tVn大于P值的時(shí)候,該序列交由LSTM進(jìn)行訓(xùn)練預(yù)測(cè);當(dāng)tVn小于P值的時(shí)候,該序列交由LB進(jìn)行訓(xùn)練預(yù)測(cè)。閾值選取驗(yàn)證將在3.3節(jié)進(jìn)行說明。
LSTM解決了長期時(shí)間序列分析中存在的梯度消失與梯度爆炸問題[18],結(jié)構(gòu)包含3個(gè)模塊:遺忘門、輸入門和輸出門。遺忘門和輸入門控制哪部分信息應(yīng)該被移除或保留給網(wǎng)絡(luò),輸出門選擇性的輸出經(jīng)過處理的信息。LSTM還包括一個(gè)單元狀態(tài),用來保存之前的重要信息,保證信息貫穿整個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò),因此LSTM能夠記住長時(shí)間序列中比較重要的部分特征,對(duì)于波動(dòng)性較為強(qiáng)烈的子序列采用LSTM預(yù)測(cè)更為合適。
LSTM公式如式(9)~式(14)所示
ft=σ·(Wf·[ht-1,xt]+bf)
(9)
it=σ·(Wi·[ht-1,xt]+bi)
(10)
(11)
(12)
ot=σ·(Wo·[ht-1,xt]+bo)
(13)
ht=ot*tanh(Ct)
(14)
LB模型是Pengcheng Li等提出的一種新的時(shí)間序列預(yù)測(cè)模型[19],該模型只有一個(gè)超參數(shù),無需進(jìn)行參數(shù)訓(xùn)練,模型性能穩(wěn)定。LB的流程如圖4所示。
圖4 LB Model的流程
模型包含兩個(gè)部分:一部分是相似數(shù)據(jù)的聚類;另一部分是控制中樞,用于控制聚類和預(yù)測(cè)未來。該模型適用于處理數(shù)據(jù)量大的復(fù)雜非線性系統(tǒng):打破時(shí)間序列,收集相似的數(shù)據(jù)到某些聚類中,并融合相似的數(shù)據(jù)以降低數(shù)據(jù)維數(shù);利用時(shí)間序列的本質(zhì),即少量具有代表性的數(shù)據(jù),可以有效地控制復(fù)雜系統(tǒng)。
融合相似數(shù)據(jù)的S-means聚類方法由3個(gè)函數(shù)組成:一是條件函數(shù),計(jì)算趨勢(shì)條件的值。二是聚類函數(shù),對(duì)時(shí)間序列進(jìn)行分解,將相似數(shù)據(jù)聚類成組。該函數(shù)可以根據(jù)數(shù)據(jù)與中心之間的距離估計(jì)輸入數(shù)據(jù)是否符合當(dāng)前聚類。三是數(shù)據(jù)融合功能,對(duì)聚類數(shù)據(jù)進(jìn)行融合,降低數(shù)據(jù)維數(shù),縮短計(jì)算時(shí)間,從而提高預(yù)測(cè)的穩(wěn)定性和準(zhǔn)確性。其數(shù)學(xué)表達(dá)式如式(15)~式(20)所示
(15)
(16)
(17)
(18)
βv={{μ},{TCD}} (v=1,2)
(19)
(20)
S-means聚類流程如圖5所示。
圖5 S-means聚類流程
控制中樞由匹配函數(shù)和預(yù)測(cè)滾動(dòng)優(yōu)化方法組成。匹配函數(shù)用來匹配最適合預(yù)測(cè)的聚類。
滾動(dòng)優(yōu)化算法是根據(jù)預(yù)測(cè)誤差更新權(quán)重值和聚類中的每個(gè)預(yù)測(cè)要素。預(yù)測(cè)模型的數(shù)學(xué)表達(dá)式類似于線性加權(quán)和,通過滾動(dòng)優(yōu)化確定不同的權(quán)重,基于預(yù)測(cè)誤差排名來確定第一個(gè)權(quán)重是最重要的權(quán)重值,第二個(gè)權(quán)重(1-第一個(gè)權(quán)重),等等。其數(shù)學(xué)表達(dá)式如式(21)~式(22)所示
(21)
(22)
在本節(jié)中,提出的模型性能采用5種不同領(lǐng)域的數(shù)據(jù)集進(jìn)行訓(xùn)練驗(yàn)證。數(shù)據(jù)集分別為:風(fēng)電功率數(shù)據(jù);谷歌股票價(jià)格數(shù)據(jù);光伏數(shù)據(jù);美元/加拿大元(USD/CAD)每日匯率數(shù)據(jù)和太陽黑子數(shù)據(jù)。采用keras框架進(jìn)行建模計(jì)算。
3.1.1 風(fēng)電功率數(shù)據(jù)集
采用內(nèi)蒙古自治區(qū)某風(fēng)電場(chǎng)2017年的實(shí)測(cè)歷史風(fēng)電功率數(shù)據(jù),風(fēng)機(jī)裝載容量為1500 kW,數(shù)據(jù)分辨率為1 min。選取4月28日~4月30日共3000個(gè)數(shù)據(jù)點(diǎn),其中前2000個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練數(shù)據(jù),剩余1000個(gè)數(shù)據(jù)點(diǎn)作為測(cè)試數(shù)據(jù)。
3.1.2 谷歌股價(jià)數(shù)據(jù)集
股價(jià)的時(shí)間序列具有高度波動(dòng)性和不確定性。為了評(píng)估所提模型在實(shí)際不確定場(chǎng)景中的財(cái)務(wù)預(yù)測(cè)能力,選取2004-08-19~2010-09-21谷歌股價(jià)數(shù)據(jù),數(shù)據(jù)來自雅虎財(cái)經(jīng)(https://finance.yahoo.com/)。為了與文獻(xiàn)[20]中的結(jié)果進(jìn)行公平比較,選擇了631個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練數(shù)據(jù),剩余900個(gè)數(shù)據(jù)點(diǎn)用作為測(cè)試數(shù)據(jù)。
3.1.3 光伏功率數(shù)據(jù)集
光伏數(shù)據(jù)選取于澳大利亞中部烏魯魯(艾爾斯巖)的分布式 1.8 兆瓦太陽能光伏電站,數(shù)據(jù)來源于DKA太陽能中心 (Home Page|DKA Solar Centre), 2020-01-20~2020-02-08共3000條數(shù)據(jù),時(shí)間分辨率為5 min,數(shù)據(jù)容量為1.8 MW。選擇前2000個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練數(shù)據(jù),剩余1000個(gè)數(shù)據(jù)點(diǎn)作為測(cè)試數(shù)據(jù)。
3.1.4 美元/加拿大元(USD/CAD)匯率數(shù)據(jù)集
所提模型可以用于預(yù)測(cè)美元/加拿大元(USD/CAD)匯率數(shù)據(jù)的每日匯率。數(shù)據(jù)采樣時(shí)間為2008-01-02~2013-12-16,數(shù)據(jù)來源于英為財(cái)情(https://cn.investing.com/),共有1554個(gè)數(shù)據(jù)點(diǎn),其中前1243個(gè)數(shù)據(jù)點(diǎn)用于訓(xùn)練模型,剩余311個(gè)數(shù)據(jù)點(diǎn)用于測(cè)試模型。
3.1.5 太陽黑子數(shù)據(jù)集
太陽黑子月度平滑時(shí)間序列數(shù)據(jù)來自世界太陽黑子指數(shù)數(shù)據(jù)中心(http://sidc.oma.be/silso/datafiles),采樣自1749年1月~2019年12月,總共使用了3252個(gè)樣本。其中前2602個(gè)數(shù)據(jù)點(diǎn)用于訓(xùn)練模型,剩余650個(gè)數(shù)據(jù)點(diǎn)用于測(cè)試所提出模型的性能。
為了合理評(píng)價(jià)不同模型的建模結(jié)果,在相同的條件下,可以采用一定的評(píng)價(jià)標(biāo)準(zhǔn)對(duì)建模結(jié)果進(jìn)行分析。本文采用均方誤差(mean square error,MSE)、均方根誤差(root mean square error,RMSE)、平均絕對(duì)誤差(mean absolute error,MAE)、平均絕對(duì)百分誤差(mean absolute percen-tage error,MAPE)和R的平方(R squared,R2)作為評(píng)估標(biāo)準(zhǔn)來分析不同模型的建模性能,評(píng)價(jià)標(biāo)準(zhǔn)如式(23)~式(27)所示
(23)
(24)
(25)
(26)
(27)
為了驗(yàn)證分配閾值設(shè)定的合理性,隨機(jī)分配極端波動(dòng)子序列進(jìn)行對(duì)比實(shí)驗(yàn)。采用風(fēng)電功率數(shù)據(jù),經(jīng)過EMD處理后得到9個(gè)IMF分量,如圖6所示。
圖6 經(jīng)過EMD分解后的各分量
利用分配函數(shù)D對(duì)各IMF波動(dòng)性進(jìn)行分析,見表2。
表2 各分量的波動(dòng)性閾值
由圖6可以看出,imf1~imf3的波動(dòng)性較強(qiáng)烈,對(duì)應(yīng)表2可看出imf1~imf3的tVn值大于P值,符合分配函數(shù)D的分配原理。隨機(jī)分配子序列與分配函數(shù)D分配子序列的模型預(yù)測(cè)對(duì)比(采用3.2節(jié)所提評(píng)價(jià)標(biāo)準(zhǔn))??梢钥闯?,采用分配函數(shù)D計(jì)算閾值,再使用閾值分配子序列,與其它分配方式相比,模型預(yù)測(cè)效果更好。隨機(jī)分配模型對(duì)比結(jié)果見表3。
表3 隨機(jī)分配模型對(duì)比結(jié)果
3.4.1 風(fēng)電功率時(shí)間序列的預(yù)測(cè)
所提模型在風(fēng)電功率預(yù)測(cè)的計(jì)算流程如圖7所示。
圖7 所提模型在風(fēng)電功率預(yù)測(cè)的計(jì)算流程
所提模型的真實(shí)值與預(yù)測(cè)值對(duì)比結(jié)果如圖8所示。
圖8 風(fēng)電功率預(yù)測(cè)結(jié)果
由圖8中可以看出,預(yù)測(cè)曲線可以很好擬合真實(shí)數(shù)據(jù)曲線。說明在大多數(shù)情況下,盡管風(fēng)能波動(dòng)不確定,所提模型仍能獲得較好的精度。圖9給出了所提模型對(duì)測(cè)試數(shù)據(jù)的預(yù)測(cè)誤差及其直方圖,表明在大多數(shù)情況下,所提模型對(duì)于時(shí)間序列預(yù)測(cè)的性能非常穩(wěn)定。直方圖顯示近似高斯分布,驗(yàn)證所提模型是較為理想的模型。
圖9 風(fēng)電功率數(shù)據(jù)的預(yù)測(cè)誤差及其直方圖
選取CNN-LSTM、Attention-GRU、D-EMD-BPN-LSTM、D-EMD-LSTM-RNN等模型進(jìn)行實(shí)驗(yàn)對(duì)比,使用MAE、RMSE、R2作為評(píng)價(jià)標(biāo)準(zhǔn),并對(duì)訓(xùn)練預(yù)測(cè)時(shí)間進(jìn)行統(tǒng)計(jì)??梢钥闯鲈赗MSE評(píng)價(jià)指標(biāo)中,本文提出的模型比LSTM降低了27.3個(gè)百分點(diǎn);比EMD-LB降低了23.9個(gè)百分點(diǎn),克服了對(duì)比模型存在的波峰誤差大,擬合趨勢(shì)弱等問題。從計(jì)算代價(jià)來看,所提模型與EMD-LB、EMD-LSTM相比,雖然比EMD-LB多5 s,但是要比EMD-LSTM少15 s左右,重要的是預(yù)測(cè)效果要比EMD-LB、EMD-LSTM分別提高了19.7%、40.9%;與其它混合模型作對(duì)比,比D-EMD-LSTM-GR少了很多,而且效果也較為提高,與神經(jīng)網(wǎng)絡(luò)和統(tǒng)計(jì)學(xué)習(xí)模型相比計(jì)算代價(jià)提高,但是同時(shí)預(yù)測(cè)效果也有所提高。對(duì)比結(jié)果見表4。
表4 風(fēng)電功率數(shù)據(jù)預(yù)測(cè)的模型比較
3.4.2 谷歌股價(jià)時(shí)間序列預(yù)測(cè)
測(cè)試數(shù)據(jù)的真實(shí)值和預(yù)測(cè)值的比較結(jié)果如圖10所示,可以明顯看到所提出的模型能夠跟蹤時(shí)間序列的波動(dòng)。盡管數(shù)據(jù)波動(dòng)較大且變化幅度明顯表現(xiàn)出突然的變化(時(shí)間步長200~500為2008年金融危機(jī)期間),所提模型仍能夠很好地適應(yīng)變化并預(yù)測(cè)。特別是在波峰和波谷附近,所提模型的性能優(yōu)于文獻(xiàn)[20]中性能最好的NFIS-DN模型。
圖10 谷歌股價(jià)預(yù)測(cè)結(jié)果
文獻(xiàn)[20]僅采用了評(píng)價(jià)指標(biāo)MSE,且提供了模型訓(xùn)練預(yù)測(cè)所需時(shí)間,為體現(xiàn)結(jié)果一致性,本文也使用MSE并對(duì)訓(xùn)練預(yù)測(cè)時(shí)間進(jìn)行統(tǒng)計(jì),與其進(jìn)行對(duì)比。本文提出的模型與文獻(xiàn)[20]中精度最高的NFIS-DN模型相比,雖然計(jì)算代價(jià)有所提高,但是在MSE評(píng)價(jià)指標(biāo)上誤差降低了78%。因此所提出的模型是一種更好的股票價(jià)格預(yù)測(cè)方法。
本文所提模型的實(shí)驗(yàn)結(jié)果與文獻(xiàn)[20]中提到的模型結(jié)果對(duì)比,見表5。
表5 股票數(shù)據(jù)預(yù)測(cè)的模型比較
3.4.3 光伏時(shí)間序列預(yù)測(cè)
測(cè)試集數(shù)據(jù)的真實(shí)值和預(yù)測(cè)值的比較結(jié)果如圖11所示。
可以看出光伏數(shù)據(jù)呈現(xiàn)周期性波動(dòng),波峰存在的波動(dòng)差異所提模型也可以很好擬合。選取CNN-LSTM、Attention-GRU、EMD-BPN-LSTM、EMD-LSTM-RNN等模型進(jìn)行實(shí)驗(yàn)對(duì)比,使用MAE、RMSE、MAPE、R2作為評(píng)價(jià)標(biāo)準(zhǔn),并對(duì)訓(xùn)練預(yù)測(cè)時(shí)間進(jìn)行統(tǒng)計(jì)。所提模型的計(jì)算代價(jià)雖然不是最低的,但是預(yù)測(cè)精度較其它模型有所提高??梢钥闯鲈赗MSE評(píng)價(jià)指標(biāo)中,本文提出的模型比Attention-GRU降低了24.9個(gè)百分點(diǎn);比CNN-LSTM降低了28.6個(gè)百分點(diǎn)。對(duì)比結(jié)果見表6。
表6 光伏數(shù)據(jù)預(yù)測(cè)的模型比較
3.4.4 外幣匯率時(shí)間序列預(yù)測(cè)
所提模型的真實(shí)值與預(yù)測(cè)值對(duì)比結(jié)果如圖12所示。
圖12 外幣匯率預(yù)測(cè)結(jié)果
所提模型的預(yù)測(cè)結(jié)果與文獻(xiàn)[21]中一些模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,使用MAE、RMSE、MAPE作為評(píng)價(jià)標(biāo)準(zhǔn),并對(duì)訓(xùn)練預(yù)測(cè)時(shí)間進(jìn)行統(tǒng)計(jì)。所提模型的計(jì)算代價(jià)整體相比不是最高的,但是預(yù)測(cè)精度相對(duì)較高。在RMSE評(píng)價(jià)指標(biāo)中,本文提出的模型比文獻(xiàn)[21]中預(yù)測(cè)效果最好的VMD-GRNN降低了88%,故驗(yàn)證本文所提模型更適合外幣匯率的預(yù)測(cè)。對(duì)比結(jié)果見表7。
表7 外幣匯率數(shù)據(jù)預(yù)測(cè)的模型比較
3.4.5 太陽黑子時(shí)間序列預(yù)測(cè)
太陽黑子測(cè)試集數(shù)據(jù)的真實(shí)值與預(yù)測(cè)值的預(yù)測(cè)結(jié)果如圖13所示,可以看出預(yù)測(cè)值很好的擬合了真實(shí)值的趨勢(shì)。
所提模型預(yù)測(cè)效果與文獻(xiàn)[22]提到的模型結(jié)果進(jìn)行實(shí)驗(yàn)對(duì)比,使用RMSE、MAE作為評(píng)價(jià)標(biāo)準(zhǔn),并對(duì)訓(xùn)練預(yù)測(cè)時(shí)間進(jìn)行統(tǒng)計(jì)。所提模型的計(jì)算代價(jià)整體相比不是最高的,但是預(yù)測(cè)精度相對(duì)較高??梢钥闯鲈赗MSE與MAE評(píng)價(jià)指標(biāo)中,本文提出的模型比文獻(xiàn)[22]中精度最高的PHM-MAX-ARIMA-ETS-SVM降低了18.7%與19.1%,驗(yàn)證了本文所提模型的預(yù)測(cè)準(zhǔn)確率更高。對(duì)比結(jié)果見表8。
表8 太陽黑子數(shù)據(jù)預(yù)測(cè)的模型比較
3.4.6 實(shí)驗(yàn)總結(jié)
從圖8~圖13所提模型對(duì)時(shí)間序列的預(yù)測(cè)結(jié)果來看,本文所提模型能夠很好擬合時(shí)間序列波動(dòng)性趨勢(shì),克服了LSTM等模型存在的預(yù)測(cè)滯后現(xiàn)象,減少時(shí)間序列預(yù)測(cè)模型普遍存在的波峰、波谷預(yù)測(cè)偏差大問題。從表4~表8與其它模型的比較結(jié)果來看,所提模型總體平均RMSE降低了45%,其中谷歌股價(jià)與外幣匯率平均降低了83%,風(fēng)電功率、光伏功率、太陽黑子平均降低了24%。綜合比對(duì)之下,雖然預(yù)測(cè)效果提高較大,但本模型的計(jì)算代價(jià)稍高,不適合線上訓(xùn)練。
根據(jù)表4~表8中D-EMD-LSTM-LB與EMD-LSTM-LB的實(shí)驗(yàn)結(jié)果相比,預(yù)測(cè)誤差平均減少了5%左右,訓(xùn)練時(shí)長平均減少了3 s左右。可以看出D函數(shù)進(jìn)一步提高了預(yù)測(cè)精度以及減少了計(jì)算時(shí)間。
LSTM模型訓(xùn)練時(shí)間相對(duì)較長但是預(yù)測(cè)的極端子序列個(gè)數(shù)少,LB模型需要預(yù)測(cè)的非極端子序列個(gè)數(shù)多然而無需訓(xùn)練參數(shù),因此模型穩(wěn)定性相對(duì)較好且預(yù)測(cè)時(shí)間較短。基于各數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果均表明了本文模型具有較強(qiáng)的預(yù)測(cè)能力,因此該模型適用于預(yù)測(cè)一些存在不確定性、波動(dòng)性大的時(shí)間序列。
所提模型中,分配函數(shù)D根據(jù)波動(dòng)性閾值從EMD分解的一系列中劃分出波動(dòng)性強(qiáng)烈的極端波動(dòng)子序列,利用LSTM及LB各自特點(diǎn)對(duì)子序列進(jìn)行預(yù)測(cè)。通過對(duì)5組時(shí)間序列建模對(duì)比的實(shí)驗(yàn)結(jié)果,驗(yàn)證在一般情況下,所提模型擁有更好的精度。
本文做出以下貢獻(xiàn):首次結(jié)合文獻(xiàn)[19]提出的LB模型,且組合模型比LB模型預(yù)測(cè)效果更好。提出分配函數(shù)D從分解后的一系列子序列中選取波動(dòng)性強(qiáng)烈的極端波動(dòng)子序列。采用兩種非線性預(yù)測(cè)模型對(duì)波動(dòng)性強(qiáng)烈的極端波動(dòng)子序列與波動(dòng)性不太強(qiáng)的子序列分別進(jìn)行預(yù)測(cè)。
本文所提方法現(xiàn)有的缺點(diǎn)是LSTM的參數(shù)選取及模型計(jì)算代價(jià)較高問題,今后研究考慮使用優(yōu)化算法進(jìn)行調(diào)參,進(jìn)一步提高模型預(yù)測(cè)精度,減少模型計(jì)算代價(jià)。