摘 要:針對風(fēng)速的波動性和隨機(jī)性等特點(diǎn),提出一種基于二次分解和烏鴉搜索算法優(yōu)化組合模型的超短期風(fēng)速預(yù)測方法。該方法的基本思路是構(gòu)造基于變分模態(tài)分解、樣本熵和奇異譜分析的二次分解的方法,將原始風(fēng)速序列分解為不同的子序列,并對這些子序列分別建立預(yù)測模型,最后重構(gòu)。對變分模態(tài)分解的子序列建立基于長短時記憶網(wǎng)絡(luò)的深度學(xué)習(xí)模型預(yù)測,而殘差序列進(jìn)行二次分解后的子序列建立烏鴉搜索算法優(yōu)化的組合預(yù)測模型預(yù)測。最后,對子序列進(jìn)行重構(gòu)并得到最終的預(yù)測結(jié)果。使用實(shí)際的風(fēng)速觀測資料開展模擬實(shí)驗(yàn),結(jié)果表明:在3個風(fēng)電場中,所提模型與其他模型相比平均相對誤差分別提升了30.07%、37.56%和37.40%,驗(yàn)證了混合模型在超短期風(fēng)速預(yù)測中的有效性和穩(wěn)定性,以及在不同數(shù)據(jù)集上的泛化性能。
關(guān)鍵詞:風(fēng)速;預(yù)測;長短時記憶;二次分解;烏鴉搜索算法;組合預(yù)測模型
中圖分類號:TM614" " " " " " " " " " 文獻(xiàn)標(biāo)志碼:A
0 引 言
風(fēng)力發(fā)電作為一種技術(shù)較為成熟的可再生能源發(fā)電方式,其大規(guī)模開發(fā)利用是應(yīng)對全球變暖和環(huán)境污染問題的有效策略之一。2000年后,風(fēng)電在全球范圍內(nèi)快速發(fā)展,其在電網(wǎng)中的占比不斷提高[1]。然而,風(fēng)電的波動性、隨機(jī)性等特點(diǎn),導(dǎo)致風(fēng)電功率輸出不穩(wěn),增加了調(diào)度難度,給電網(wǎng)的安全穩(wěn)定運(yùn)行帶來嚴(yán)峻挑戰(zhàn)[2]。應(yīng)對這一挑戰(zhàn)的方式之一,是對風(fēng)力發(fā)電的輸出功率進(jìn)行準(zhǔn)確預(yù)測,這其中的關(guān)鍵問題是風(fēng)速的預(yù)測。
根據(jù)文獻(xiàn)[3],確定性短期風(fēng)速預(yù)測模型主要分為物理模型和統(tǒng)計(jì)模型。物理模型模擬大氣的運(yùn)動過程,適用于24~72 h甚至更長時間的預(yù)測問題,例如數(shù)值天氣預(yù)報(bào)(numerical weather prediction,NWP)[4]。統(tǒng)計(jì)模型包含傳統(tǒng)的時間序列預(yù)測模型和近年來快速發(fā)展的人工智能模型。其中,人工智能模型,特別是人工神經(jīng)網(wǎng)絡(luò),具有對非線性數(shù)據(jù)的強(qiáng)大表示能力和學(xué)習(xí)能力,在風(fēng)速預(yù)測領(lǐng)域得到廣泛應(yīng)用,例如徑向基函數(shù)(radial basis function,RBF)網(wǎng)絡(luò)[5]、支持向量機(jī)(support vector machine,SVM)[6]、極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)[7]和多層感知機(jī)(multilayer perceptron,MLP)[8]等。這些網(wǎng)絡(luò)模型易于理解和實(shí)現(xiàn),是風(fēng)速預(yù)測領(lǐng)域的重要方法。但在處理具有復(fù)雜特征的非線性數(shù)據(jù)時,淺層網(wǎng)絡(luò)的特征表示能力有限,影響模型的預(yù)測精度[9]。近年來,深度學(xué)習(xí)備受關(guān)注,已在風(fēng)速預(yù)測中得到應(yīng)用,例如長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)[10]、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[11]和序列到序列模型(sequence-to-sequence, seq2seq)[9]等。其中,LSTM能分析和處理長期信息,在時序數(shù)據(jù)信息的處理方面具有優(yōu)勢,也被應(yīng)用于風(fēng)速預(yù)測。文獻(xiàn)[12]使用遺傳算法優(yōu)化LSTM的網(wǎng)絡(luò)參數(shù),模型的預(yù)測精度得到提高;文獻(xiàn)[13-14]將LSTM與分解算法相結(jié)合,建立了風(fēng)速預(yù)測的混合模型。
由于不同預(yù)測方法具有特定的優(yōu)勢和不足,將多個預(yù)測方法結(jié)合起來建立組合模型,能有效降低單一預(yù)測的誤差風(fēng)險(xiǎn)、增強(qiáng)預(yù)測模型的穩(wěn)定性[15]。其中的關(guān)鍵問題之一,是確定各子模型的組合系數(shù),常用的方法有加權(quán)平均方法、非負(fù)約束方法(no negative constraint theory,NNCT)[16] 等。近年來,人工智能優(yōu)化算法被用于求解最優(yōu)組合系數(shù),例如,粒子群優(yōu)化算法(particle swarm optimization algorithm,PSO)[17]、灰狼優(yōu)化算法(grey wolf optimization algorithm,GWO)[18]等,都在風(fēng)速組合預(yù)測中得到應(yīng)用。
此外,許多研究工作應(yīng)用了信號分解算法,將原始數(shù)據(jù)序列分解成若干具有不同數(shù)據(jù)特征的子序列,并對子序列分別建立預(yù)測模型。常見的有經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)[19]、變分模態(tài)分解(variational mode decomposition,VMD)[20]、奇異譜分析(singular spectrum analysis,SSA)[17]等。相較于對復(fù)雜的原始數(shù)據(jù)序列進(jìn)行建模,子序列的數(shù)據(jù)特征通常能被模型更好地描述。但風(fēng)速數(shù)據(jù)的變化特征十分復(fù)雜,使用一種算法有時難以對其進(jìn)行充分地分解,需對部分子序列進(jìn)行第二次分解[21]。文獻(xiàn)中已提出若干應(yīng)用于風(fēng)速預(yù)測問題的二次分解算法,例如基于小波包分解和快速集成EMD[21]、基于改進(jìn)的集合EMD和局部均值分解[22]、基于完備EMD和VMD的二次分解算法[23]等,其結(jié)果表明,使用二次分解方法能進(jìn)一步提高模型的預(yù)測精度。
本文建立一個基于二次分解的混合模型,用于超短期的風(fēng)速預(yù)測問題。首先,使用VMD對原始風(fēng)速序列進(jìn)行分解,并對殘差序列使用SSA進(jìn)行二次分解。其次,對分解得到的子序列分別進(jìn)行建模和預(yù)測。具體地,對樣本熵較低的VMD分解子序列建立LSTM預(yù)測模型;對二次分解的子序列建立烏鴉算法 (crow search algorithm, CSA) 優(yōu)化的組合預(yù)測模型,其中,組合預(yù)測包含4種不同的神經(jīng)網(wǎng)絡(luò)模型。將所有子序列的預(yù)測結(jié)果進(jìn)行重構(gòu),生成最終的混合預(yù)測結(jié)果。本文使用實(shí)際風(fēng)電場的風(fēng)速觀測資料開展模擬試驗(yàn)和模型比較試驗(yàn),驗(yàn)證了上述模型在超短期風(fēng)速預(yù)測問題中的有效性和適用性。
1 變分模態(tài)-奇異譜分解
1.1 變分模態(tài)分解
VMD是由Dragoiretskiy等[20]在2014年提出的一種完全非遞歸、自適應(yīng)的信號分解算法,它將給定的非平穩(wěn)序列分解成一系列具有不同中心頻率和有限帶寬的子模態(tài)。給定分解階次[K],VMD求解如下的約束變分問題:
[minuk,ωkk=1K?tδt+jπt*ukte-jωtk22s.t.k=1Kuk=υt] (1)
式中:[υt]——待分解序列;[uk]、[ωk]——各子模態(tài)分量和中心頻率[k=1,2,…,K];[δ·]——狄拉克(Dirac)分布函數(shù);*——卷積運(yùn)算符。引入增廣拉格朗日方程:
[Luk,ωk,λ=αk=1K?tδt+jπt*uktejωkt22+" " " " " " " υt-k=1Kukt22+λt,υt-k=1Kukt] (2)
式中:[α]、[λ]——引入的二次懲罰因子參數(shù)和拉格朗日乘子。則式(1)的求解轉(zhuǎn)化為式(2)的鞍點(diǎn)問題。利用交替方向乘子法(alternate direction method of multipliers,ADMM)得到[uk]和[ωk]的迭代公式:
[un+1kω = υω- i≠kuiω+λnω2 1+2αω-ωnk2] (3)
[ωn+1k=0∞ωunkω2dω0∞unkω2dω] (4)
式中:[un+1k]、[υω]、[uω]、[λω]——[un+1k]、[υt]、[ut]和[λt]的傅里葉變換。
VMD計(jì)算步驟如下:
1)初始化,將[u1k]、[ω1k]、[λ1]、[n]均置0,并選取合適的分解階次[K]作為預(yù)設(shè)值;
2)根據(jù)式(3)和式(4)更新[uk]和[ωk];
3)更新[λ],即
[λn+1ω=λnω+τfω-k=1Kun+1kω] (5)
4)當(dāng)滿足以下收斂條件時,停止迭代。
[k=1Kun+1k-unk22unk22lt;ε] (6)
否則,返回步驟2)。
1.2 樣本熵
Richman等[24]于2000年提出樣本熵(sample entropy,SE)[24]的概念,用于衡量時間序列的復(fù)雜性。樣本熵的值越大,時間序列就越復(fù)雜,反之亦然。
樣本熵可用[δSm,r,N]表示:
[δSm,r,N=-lnBm+1rBmr] (7)
式中:[m]——維數(shù);[r]——相似容限(又稱閾值);[N]——長度;[Bmr]——兩個序列在相似容限下匹配[m]個點(diǎn)的概率;[Bm+1r]——兩個序列匹配[m+1]個點(diǎn)的概率。一般情況下,[m=1]或2,[r=(0.1~0.25)RSD],[RSD]為序列的標(biāo)準(zhǔn)差。本文選取[m=2]和[r=0.2RSD]。
使用最小樣本熵準(zhǔn)則,來確定VMD的分解階次[K][25]。具體地,計(jì)算每個子序列的樣本熵,其中樣本熵最小的子序列即為趨勢項(xiàng)。當(dāng)[K]較小時,原始信號中的子模態(tài)不能被充分地分離,導(dǎo)致趨勢項(xiàng)的樣本熵可能很大。隨著[K]的增大,趨勢項(xiàng)的樣本熵逐漸趨于穩(wěn)定。基于此,可將樣本熵趨于穩(wěn)定的轉(zhuǎn)折點(diǎn)作為VMD的分解階次,以避免過度分解。
1.3 奇異譜分析
SSA是一種有效的時間序列分析非參數(shù)算法,可從原始數(shù)據(jù)中識別和提取趨勢、振蕩、周期、準(zhǔn)周期和噪聲分量[26],具體包含以下4個步驟:
1)嵌入。將原始時間序列[X=(x(j)1,...,x(j)N)]轉(zhuǎn)換為如下定義的軌跡矩陣:
[Z= x1x2…xηx2x3…xK+1????xLxL+1…xN] (8)
其中,[η=N-L+1]和[L∈2,N]。
2)奇異值分解(singular value decomposition, SVD)。通過SVD,軌跡矩陣[Z]可表示為:
[Z=Z1+Z2+…+Zd] (9)
式中:[Zi=λiUiViT];[λii=1,…,d]——[Z]的奇異值;[Ui]、[Vi]——矩陣的左特征向量和右特征向量。
3)分組。將區(qū)間[1,…,d]劃分為若干不相交的子集[k1,…,km],則[Z]可表示為:
[Z=Zk1+…+Zkm] (10)
4)對角線平均。對每個[Zki∈RW×Q]令,[W*=minW,Q],[Q*=maxW,Q]。如果[Wlt;Q],有[z*il=zil],否則[z*il=zli]。進(jìn)而,使用對角線平均將[Zki]轉(zhuǎn)換為序列。[X(j)=(x(j)1,…,x(j)N)]則SSA算法得到了原始序列[X]的[m]個分解子序列[X(1),…,X(m)]。
2 預(yù)測模型
針對各個分量的不同特征,本文分別建立LSTM深度網(wǎng)絡(luò)預(yù)測模型和烏鴉算法優(yōu)化的組合預(yù)測模型。
2.1 長短期記憶神經(jīng)網(wǎng)絡(luò)
LSTM是為了避免循環(huán)網(wǎng)絡(luò)在訓(xùn)練過程中存在的梯度爆炸和梯度消失的問題所提出的一種網(wǎng)絡(luò)。由于LSTM網(wǎng)絡(luò)具有較好的解決長期依賴性問題的能力,因此,它在處理時間序列時通常具有令人滿意的性能。LSTM的單元結(jié)構(gòu)如圖1所示,包括輸入門、遺忘門和輸出門等,具體由式(11)定義:
[ft=σWf?ht-1,xt+bfit=σWi?ht-1,xt+bict=tanhWc?ht-1,xt+bcct=ft×ct-1+it×ctot=σWo?ht-1,xt+boht=ot×tanhct] (11)
式中:[ft]、[it]、[ct]、[ot]——[t]時刻的遺忘門、輸入門、細(xì)胞狀態(tài)和輸出門;[σ]——sigmoid函數(shù);[Wf]、[Wi]、[Wc]、[Wo]——遺忘門、輸入門、細(xì)胞狀態(tài)和輸出門的權(quán)重矩陣;[ht]——[t]時刻的隱藏層輸出;[xt]——[t]時刻的輸入;[bf]、[bi]、[bc]、[bo]——遺忘門、輸入門、細(xì)胞狀態(tài)和輸出門的偏置項(xiàng);tanh——雙曲正切函數(shù)。
2.2 烏鴉搜索算法優(yōu)化的組合預(yù)測模型
本文對殘差序列的二次分解子序列建立組合預(yù)測模型,并使用烏鴉優(yōu)化算法求解組合模型的最優(yōu)組合系數(shù)。
2.2.1 烏鴉搜索算法
烏鴉搜索算法由伊朗學(xué)者Askarzadeh[27]在2016年提出,通過模擬烏鴉的覓食策略,求解全局最優(yōu)化問題。CSA算法需設(shè)置的參數(shù)少,收斂能力強(qiáng),是一種新興的元啟發(fā)式算法。CSA的完整工作如下:
1)將優(yōu)化問題及其決策變量和約束公式化,并設(shè)置可調(diào)整參數(shù)的值,即烏鴉數(shù)量([ηc])、最大迭代次數(shù)([Niter])、飛行長度([ηl])和感知概率([γAP])。
2)設(shè)計(jì)一個由[ηc]行和[ηd]列組成的矩陣,其中[ηc],[ηd]分別是烏鴉和決策變量的數(shù)量。每只烏鴉都代表一個可行的解決方案,設(shè)置每只烏鴉的記憶。此外,在一開始,所有烏鴉都無任何經(jīng)驗(yàn),因此假設(shè)每只烏鴉都在隨機(jī)地點(diǎn)隱藏了食物。
3)計(jì)算適應(yīng)度函數(shù)的值。
4)計(jì)算烏鴉的新位置。首先,生成一個隨機(jī)數(shù),并與[γAP]進(jìn)行比較,如果隨機(jī)數(shù)的值小于[γAP],則烏鴉在搜索空間中隨機(jī)移動。否則,烏鴉([xi])隨機(jī)選擇任何群烏鴉([mj]),然后跟隨[mj]確定其隱藏食物的位置。烏鴉([xi])的新位置計(jì)算為:
[xi+1,t+1=xi,t+ri×ηli,t×mj,t-xi,t] (12)
式中:[r]——隨機(jī)數(shù);[t]——迭代次數(shù)。這個過程對所有[ηc]個烏鴉重復(fù)。
5)計(jì)算新位置的適應(yīng)度。
6)基于新位置和記憶位置的適應(yīng)度值來確定烏鴉的記憶是否更新,即如果新占據(jù)位置的適應(yīng)度值優(yōu)于記憶位置的,則烏鴉的記憶將被更新,否則,烏鴉停留在當(dāng)前位置。
7)重復(fù)步驟4)~步驟6),直到滿足最大迭代次數(shù)或終止標(biāo)準(zhǔn)。烏鴉記憶的最佳位置將代表優(yōu)化問題的最終解決方案。
2.2.2 組合預(yù)測模型優(yōu)化
本文選取4種常用的神經(jīng)網(wǎng)絡(luò)模型,作為組合預(yù)測的子模型,分別是RBF神經(jīng)網(wǎng)絡(luò)、SVM、ELM和多層感知機(jī)(MLP)。將4種模型通過式進(jìn)行組合,即:
[Pi=ω1yRBFi" +ω2ySVMi+ω3yELMi+ω4yMLPi] (13)
式中:[Pi]——[i]時刻的組合預(yù)測值;[yRBFi,…,yMLPi]——4個子模型在[i]時刻的預(yù)測值;[ω1,…,ω4]——4個子模型的組合系數(shù)。
使用烏鴉搜索算法求解式(13)中的組合系數(shù),并選擇均方根誤差作為烏鴉算法的適應(yīng)度函數(shù)值,即:
[ffit=1NN=1NPi-Yi2] (14)
式中:[Yi]、[Pi]——[i]時刻的真實(shí)值和預(yù)測值;[N]——序列長度。
烏鴉搜索算法的最優(yōu)解記為:[ω*1,ω*2,ω*3,ω*4],則得到優(yōu)化的組合預(yù)測模型:
[Pi*=ω*1yRBFi" +ω*2ySVMi" +ω*3yELMi" +ω*4yMLPi] (15)
3 基于二次分解的超短期風(fēng)速預(yù)測模型
本文建立一個基于二次分解的超短期風(fēng)速預(yù)測模型,如圖2所示。具體分為以下步驟:
1)使用VMD算法對原始風(fēng)速序列進(jìn)行分解,其分解階次由子序列的樣本熵確定,分解共得到[K]個IMF子序列和一個殘差序列。
2)使用SSA算法對VMD分解的殘差序列進(jìn)行二次分解,得到[M]個SSA子序列。
3)對樣本熵較低的[K]個IMF,分別建立LSTM預(yù)測模型并進(jìn)行預(yù)測。對[M]個SSA子序列建立包含RBF、SVM、ELM和MLP的組合預(yù)測模型并進(jìn)行預(yù)測。
4)將步驟3)中組合模型的組合系數(shù)采用CSA算法進(jìn)行求解。
5)將步驟3)~4)中各個子序列的預(yù)測結(jié)果根據(jù)式(16)進(jìn)行重構(gòu),得到最終的風(fēng)速預(yù)測結(jié)果。
[yi=yResult 1i+yResult 2i+...+yResult K+1i] (16)
式中:[yi]——[i]時刻最終預(yù)測結(jié)果;[yResult 1i,]…, [yResult K+1i]——子序列1,…, [K+1]在[i]時刻的預(yù)測結(jié)果。
4 案例實(shí)驗(yàn)
本文使用實(shí)際風(fēng)電場的風(fēng)速觀測資料開展模擬實(shí)驗(yàn),觀測數(shù)據(jù)來自中國甘肅省3個不同地理位置的風(fēng)電場,分別是甘肅安北第三風(fēng)電場(風(fēng)電場#1),區(qū)間:2019-10-11—2019-03-14、甘肅干河口第五風(fēng)電場(風(fēng)電場#2),區(qū)間:2020-07-14—2020-09-02和甘肅昌馬大壩風(fēng)電場(風(fēng)電場#3),區(qū)間:2019-04-15—2019-06-16。數(shù)據(jù)的分辨率為15 min,每個風(fēng)電場選取6000條數(shù)據(jù)進(jìn)行實(shí)驗(yàn),如圖3所示。
4.1 評價(jià)指標(biāo)
采用平均絕對誤差(mean absolute error,MAE),均方根誤差(root mean square error,RMSE)、殘差平方和(sum of squares due to error,SSE)以及平均相對誤差(mean absolute percentage error,MAPE)作為評價(jià)指標(biāo)對模型的預(yù)測結(jié)果進(jìn)行誤差分析,表達(dá)式為:
[EMAE=1Ni=1Nyi-yi] (17)
[ERMSE=1Ni=1Nyi-yi2] (18)
[EMAPE=1Ni=1Nyi-yiyi×100%] (19)
[ESSE=i=1Nyi-yi2] (20)
式中:[yi]、[yi]——[i]時刻的最終預(yù)測值和真實(shí)值;[N]——序列長度。
4.2 個例分析
選擇風(fēng)電場#1作為個例進(jìn)行分析。首先使用VMD對原始風(fēng)速序列進(jìn)行分解,圖4a給出了趨勢項(xiàng)樣本熵的變化曲線??煽闯?,[K]較小時,趨勢項(xiàng)的樣本熵較大,隨著[K]的增大,樣本熵逐漸減小,當(dāng)[K]≥5時,樣本熵趨于穩(wěn)定。因此,根據(jù)最小樣本熵準(zhǔn)則,選擇樣本熵曲線的轉(zhuǎn)折點(diǎn)[K]=5作為VMD的分解階次,分解結(jié)果見圖5。根據(jù)圖4b可看出分解后的殘差序列仍具有較高的樣本熵,因此采用SSA算法對其進(jìn)行分解,分解階次為[M]。對于階次[M]取值過高會使是訓(xùn)練過程復(fù)雜,太低會導(dǎo)致預(yù)測精度下降,因此本文對殘差序列采用本文提出的組合模型進(jìn)行實(shí)驗(yàn),根據(jù)驗(yàn)證集的均方根誤差[ERMSE]來確定合適的[M],如表1所示,當(dāng)[Mgt;5]時[ERMSE]的降低并不明顯,因此選擇[M=5],做為SSA的分解階次。
對分解后的各個子序列,選擇5400條數(shù)據(jù)作為模型訓(xùn)練集,400條數(shù)據(jù)作為驗(yàn)證集,200條數(shù)據(jù)作為測試集。對于驗(yàn)證集,將其用來確定模型的各個超參數(shù)。將各個子序列的滑動窗口設(shè)置為10,即采用前10個數(shù)據(jù)來預(yù)測下一個點(diǎn)的風(fēng)速,實(shí)現(xiàn)了風(fēng)速的超短期預(yù)測。
對分解得到的各子序列分別建立預(yù)測模型。具體地,對圖5中的每個IMF建立LSTM預(yù)測模型,對于LSTM,根據(jù)模型在驗(yàn)證集的多次試驗(yàn)確定了每個層的維度為:輸入層為10,第一個隱藏層為50,第二個隱藏層是100,輸出層為1。將一些參數(shù)設(shè)置為Activation=“ReLU”,loss=“mean square error”,optimizer=“adam”,epoches=300,batch size=32,verbose=1。對圖6中的子序列建立RBF、SVM、ELM和MLP預(yù)測模型,并使用CSA計(jì)算這4個模型的最優(yōu)組合系數(shù)。
在測試集上,對本文建立的VMD-LSTM-SSA-CRSEM模型進(jìn)行測試,其預(yù)測結(jié)果如圖7所示。能看出,VMD-LSTM-SSA-CRSEM的預(yù)測序列能較好地貼近實(shí)際的風(fēng)速觀測曲線,且預(yù)測誤差較為穩(wěn)定。
4.3 模型比較分析
為進(jìn)一步分析和驗(yàn)證VMD-LSTM-SSA-CRSEM模型在超短期風(fēng)速預(yù)測中的有效性,本文設(shè)計(jì)了兩個模型比較實(shí)驗(yàn)。
實(shí)驗(yàn)1:組合模型對殘差序列預(yù)測的有效性。采用RBF、SVM、ELM和MLP這4種單一模型預(yù)測殘差序列的SSA分量,分別記為VMD-LSTM-SSA-RBF、VMD-LSTM-SSA-SVM、VMD-LSTM-SSA-ELM和VMD-LSTM-SSA-MLP。將這4個混合模型作為比較模型。
圖8給出了各模型在3個風(fēng)電場的對比情況。結(jié)果顯示,不同模型的預(yù)測結(jié)果均能較好地貼近實(shí)際的觀測曲線。但在風(fēng)速序列變化劇烈的數(shù)據(jù)段,4個比較模型的預(yù)測誤差明顯增大,而本文建立的VMD-LSTM-SSA-CRSEM模型表現(xiàn)更加穩(wěn)定。
圖9和表2進(jìn)一步給出了各模型的評價(jià)指標(biāo)對比情況??煽闯觯?dāng)使用單一模型預(yù)測殘差序列的SSA子序列時,很難選擇一個在不同數(shù)據(jù)集上都表現(xiàn)最好的模型。例如,在風(fēng)電場1的預(yù)測中,使用MLP的混合模型表現(xiàn)更好;而在風(fēng)電場2和3的預(yù)測中,基于SVM的混合模型明顯優(yōu)于其他3個比較模型。在此基礎(chǔ)上,對SSA分量的不同預(yù)測結(jié)果進(jìn)行組合,本文建立的VMD-LSTM-SSA-CRSEM模型在3個風(fēng)電場的所有評價(jià)指標(biāo)中都優(yōu)于使用單一預(yù)測的比較模型。以風(fēng)電場#3為例,與采用單一的RBF、SVM、ELM和MLP
注:模型1:VMD-LSTM-SSA-RBF、模型2:VMD-LSTM-SSA-SVM、模型3:VMD-LSTM-SSA-ELM、模型4:VMD-LSTM-SSA-MLP、模型5:VMD -LSTM-SSA-CRSEM。數(shù)字格式加粗表示該模型在對應(yīng)的評分指標(biāo)中優(yōu)于其他模型。
模型相比,組合預(yù)測方法使得模型在風(fēng)速預(yù)測中的[EMAPE]值分別減小了31.21%、7.96%、23.18%、24.19%,預(yù)測精度得到大幅提高。風(fēng)電場1和2的評價(jià)指標(biāo)對比情況是類似的。
一方面,組合模型結(jié)合了不同子模型的預(yù)測結(jié)果,能減輕單一模型在復(fù)雜數(shù)據(jù)下的不穩(wěn)定情況,產(chǎn)生更可靠的預(yù)測。對于具有大樣本熵的VMD殘差序列,組合模型取得了更好的預(yù)測結(jié)果。另一方面,組合系數(shù)是影響組合模型性能的關(guān)鍵因素。本文使用CSA優(yōu)化的組合模型,進(jìn)一步提高了模型對殘差序列分解子序列的表示能力和預(yù)測精度。
實(shí)驗(yàn)2:驗(yàn)證深度學(xué)習(xí)算法LSTM的優(yōu)勢和二次分解方法在風(fēng)速預(yù)測中的有效性。將原始風(fēng)速數(shù)據(jù)采用VMD進(jìn)行分解,對分解后的各個IMF采用LSTM、MLP和SVM分別進(jìn)行建模,對殘差序列不再進(jìn)行分解,直接采用RBF、SVM、ELM和MLP組合模型進(jìn)行建模,組合系數(shù)采用CSA求解,這些模型記為:VMD-LSTM-CRSEM、VMD-MLP-CRSEM、VMD-SVM-CRSEM。
圖10和表3給出了不同模型在3個風(fēng)電場的誤差結(jié)果。對比VMD-LSTM-CRSEM、VMD-MLP-CRSEM和VMD-SVM-CRSEM這3個模型可看出采用LSTM的模型有更高的預(yù)測精度,這表明LSTM對VMD分解后樣本熵較低的子序列列有著更好的擬合性能,顯示出深度學(xué)習(xí)算法LSTM的優(yōu)越性。對比VMD-LSTM-CRSEM和VMD-LSTM-SSA-CRSEM可看出,未進(jìn)行二次分解的VMD-LSTM-CRSEM有更高的誤差。這表明,預(yù)測模型不能較好地描述風(fēng)速序列的變化特征。應(yīng)用二次分解方法后,VMD-LSTM-SSA-CRSEM模型顯
注:數(shù)字格式加粗表示該模型在對應(yīng)的評分指標(biāo)中優(yōu)于其他模型。
著降低了風(fēng)速預(yù)測值和實(shí)際值之間的誤差。且與VMD-LSTM-CRSEM模型相比提出的預(yù)測模型在3個風(fēng)電場的[EMAPE]值分別降低了37.53%、38.28%和31.71%,模型預(yù)測水平得到顯著提高。這是由于,風(fēng)速序列具有復(fù)雜的變化特征,采用VMD分解后的殘差序列仍具有較大的樣本熵。而對殘差序列進(jìn)行二次分解后,各分量的復(fù)雜度降低,有利于建立更加準(zhǔn)確的預(yù)測模型,從而提高模型的預(yù)測精度。
5 結(jié) 論
本文建立一個基于二次分解方法和烏鴉搜索算法的超短期風(fēng)速預(yù)測模型,改善了風(fēng)速的預(yù)測效果,其主要原因是:1)二次分解方法能將原始風(fēng)速序列中的不同數(shù)據(jù)特征更加充分地分離出來,降低數(shù)據(jù)序列的復(fù)雜度;2)在對殘差序列分量的預(yù)測中,優(yōu)化的組合模型比單一模型表現(xiàn)更好,特別是在風(fēng)速序列的波動劇烈時,組合模型提供了更加可靠和穩(wěn)定的預(yù)測結(jié)果。算例分析表明該方法在3個風(fēng)電場的預(yù)測中[EMAPE]均在6%以內(nèi),具有較強(qiáng)的穩(wěn)健性和較高的預(yù)測精度。除此之外,將提出的模型與實(shí)驗(yàn)1和實(shí)驗(yàn)2中的7個模型相比,分別求出MAPE的提升值,然后將每個風(fēng)電場得到7個值進(jìn)行平均可得出在3個風(fēng)電場中所提出模型的平均MAPE分別提升了30.07%、37.56%、37.40%。然而,本文提出的組合模型中組合系數(shù)是靜態(tài)的,當(dāng)新的數(shù)據(jù)需要預(yù)測時需要重新訓(xùn)練模型。因此,本文的下一步工作將研究基于動態(tài)組合系數(shù)的風(fēng)速預(yù)測組合模型。
[參考文獻(xiàn)]
[1] 孫舶皓, 湯涌, 葉林, 等. 基于分層分布式模型預(yù)測控制的多時空尺度協(xié)調(diào)風(fēng)電集群綜合頻率控制策略[J]. 中國電機(jī)工程學(xué)報(bào), 2019, 39(1): 155-167, 330.
SUN B H, TANG Y, YE L, et al. Integrated frequency control strategy for wind power cluster with multiple temporal-spatial scale coordination based on H-DMPC[J]. Proceedings of the CSEE, 2019, 39(1): 155-167, 330.
[2] NAIK J, BISOI R, DASH P K. Prediction interval forecasting of wind speed and wind power using modes decomposition based low rank multi-kernel ridge regression[J]. Renewable energy, 2018, 129: 357-383.
[3] 趙澤妮, 云斯寧, 賈凌云, 等. 基于統(tǒng)計(jì)模型的短期風(fēng)能預(yù)測方法研究進(jìn)展[J]. 太陽能學(xué)報(bào), 2022, 43(11): 224-234.
ZHAO Z N, YUN S N, JIA L Y, et al. Recent progress in short-term forecasting of wind energy based on statistical models[J]. Acta energiae solaris sinica, 2022, 43(11): 224-234.
[4] ALLEN D J, TOMLIN A S, BALE C S E, et al. A boundary layer scaling technique for estimating near-surface wind energy using numerical weather prediction and wind map data[J]. Applied energy, 2017, 208: 1246-1257.
[5] LIANG T, XIE G F, FAN S R, et al. A combined model based on CEEMDAN, permutation entropy, gated recurrent unit network, and an improved bat algorithm for wind" "speed" "forecasting[J]." "IEEE" "access," "2020," 8: 165612-165630.
[6] XIAO L, DONG Y X, DONG Y. An improved combination approach based on Adaboost algorithm for wind speed time series forecasting[J]. Energy conversion and management, 2018, 160: 273-288.
[7] WU C Y, WANG J Z, CHEN X J, et al. A novel hybrid system" based" on" multi-objective" optimization" for" "wind speed forecasting[J]. Renewable energy, 2020, 146: 149-165.
[8] HE X H, NIE Y, GUO H L, et al. Research on a novel combination system on the basis of deep learning and swarm intelligence optimization algorithm for wind speed forecasting[J]. IEEE access, 2020, 8: 51482-51499.
[9] ZHANG Y, LI Y T, ZHANG G Y. Short-term wind power forecasting approach based on Seq2Seq model using NWP data[J]. Energy, 2020, 213: 118371.
[10] 陸冰鑒, 周鵬, 王興, 等. 基于EEMD和LSTM的短期風(fēng)速預(yù)測模型研究[J]. 軟件工程, 2020, 23(3): 43-48.
LU B J, ZHOU P, WANG X, et al. Research on short-term wind speed forecasting model based on EEMD and LSTM[J]. Software engineering, 2020, 23(3): 43-48.
[11] DONG Y X, WANG J, XIAO L, et al. Short-term wind speed time series forecasting based on a hybrid method with multiple objective optimization for non-convex target[J]. Energy, 2021, 215: 119180.
[12] CHEN Y R, DONG Z K, WANG Y, et al. Short-term wind speed predicting framework based on EEMD-GA-LSTM method under large scaled wind history[J]. Energy conversion and management, 2021, 227: 113559.
[13] 向玲, 劉佳寧, 蘇浩, 等. 基于CEEMDAN二次分解和LSTM的風(fēng)速多步預(yù)測研究[J]. 太陽能學(xué)報(bào), 2022, 43(8): 334-339.
XIANG L, LIU J N, SU H, et al. Research on multi-step wind speed forecast based on ceemdan secondary decomposition and lstm[J]. Acta energiae solaris sinica, 2022, 43(8): 334-339.
[14] 趙鑫, 陳臣鵬, 畢貴紅, 等. 基于PAM-SSD-LSTM的短期風(fēng)速預(yù)測[J]. 太陽能學(xué)報(bào), 2023, 44(1): 281-288.
ZHAO X, CHEN C P, BI G H, et al. Short-term wind speed prediction based on PAM-SSD-LSTM[J]. Acta energiae solaris sinica, 2023, 44(1): 281-288.
[15] BATES J M, GRANGER C W J. The combination of forecasts[J]. Journal of the Operational Research Society, 1969, 20(4): 451-468.
[16] XIAO L, WANG J Z, DONG Y, et al. Combined forecasting models for wind energy forecasting: a case study in China[J]. Renewable and sustainable energy reviews, 2015, 44: 271-288.
[17] 林濤, 劉航鵬, 趙參參, 等. 基于SSA-PSO-ANFIS的短期風(fēng)速預(yù)測研究[J]. 太陽能學(xué)報(bào), 2021, 42(3): 128-134.
LIN T, LIU H P, ZHAO S S, et al. Short-term wind speed prediction based on SSA-PSO-ANFIS[J]. Acta energiae solaris sinica, 2021, 42(3): 128-134.
[18] SONG J J, WANG J Z, LU H Y. A novel combined model based on advanced optimization algorithm for short-term wind speed forecasting[J]. Applied energy, 2018, 215: 643-658.
[19] 藺琳, 王萬雄. 基于EMD-GWO-SVR組合模型的短期風(fēng)速預(yù)測[J]. 電子科技, 2023, 36(5): 1-8.
LIN L, WANG W X. Short-term wind speed prediction based on EMD-GWO-SVR combined model[J]. Electronic science and technology, 2023, 36(5): 1-8.
[20] DRAGOMIRETSKIY K, ZOSSO D. Variational mode decomposition[J]. IEEE transactions on signal processing, 2014, 62(3): 531-544.
[21] LIU H, TIAN H Q, LIANG X F, et al. Wind speed forecasting approach using secondary decomposition algorithm and Elman neural networks[J]. Applied energy, 2015, 157: 183-194.
[22] 頡清云, 宋連慶, 何永康. 基于經(jīng)驗(yàn)?zāi)B(tài)二次分解的改進(jìn)門控循環(huán)單元風(fēng)速超短期組合預(yù)測模型[J]. 國外電子測量技術(shù), 2021, 40(6): 6-13.
XIE Q Y, SONG L Q, HE Y K. Ultra-short-term combined forecasting model for wind speed of improved gated recurrent unit based on empirical mode quadratic decomposition[J]." " "Foreign" " "electronic" " "measurement technology, 2021, 40(6): 6-13.
[23] 趙征, 于悅波. 基于二次分解與IGWO-LSSVR模型的超短期風(fēng)速預(yù)測研究[J]. 電力科學(xué)與工程, 2021, 37(5): 18-25.
ZHAO Z, YU Y B. Research on ultra-short-term wind speed prediction based on twice decomposition and IGWO-LSSVR model[J]. Electric power science and engineering, 2021, 37(5): 18-25.
[24] RICHMAN J S, MOORMAN J R. Physiological time-series analysis using approximate entropy and sample entropy[J]. American journal of physiology heart and circulatory physiology, 2000, 278(6): H2039-H2049.
[25] ZHANG Y G, PAN G F. A hybrid prediction model for forecasting" "wind" "energy" " resources[J]." "Environmental science and pollution research, 2020, 27(16): 19428-19446.
[26] DONG Q L, SUN Y H, LI P Z. A novel forecasting model based on a hybrid processing strategy and an optimized local linear fuzzy neural network to make wind power forecasting: a case study of wind farms in China[J]. Renewable energy, 2017, 102: 241-257.
[27] ASKARZADEH A. A novel metaheuristic method for solving constrained engineering optimization problems: crow search algorithm[J]. Computers amp; structures, 2016, 169: 1-12.
ULTRA-SHORT-TERM WIND SPEED FORECASTING BASED ON
OPTIMAL COMBINATION MODEL OF SECONDARY DECOMPOSITION AND
CROW SEARCH ALGORITHM
Qiu Wenzhi1,Zhang Wenyu2,Guo Zhenhai3,Zhao Jing3,Ma Keke1
(1. College of Computer and Artificial Intelligence, Zhengzhou University, Zhengzhou 450052, China;
2. College of Geo-Science and Technology, Zhengzhou University, Zhengzhou 450052, China;
3. State Key Laboratory of Numerical Modeling for Atmospheric Sciences and Geophysical Fluid Dynamics, Institute of Atmospheric Physics,
Chinese Academy of Sciences, Beijing 100029, China)
Abstract:Aiming at the characteristics of wind speed series such as volatility and randomness, this study develops an ultra-short-term wind speed forecasting method based on an optimal combination model of secondary decomposition and crow search algorithm. The basic idea is to construct a secondary decomposition process based on variational mode decomposition, sample entropy and singular spectrum analysis, which is applied to decompose the original wind speed series into a set of subcomponents. After this, establish a prediction model for each subcomponent. Specifically, for the subcomponents of variational mode decomposition, a deep learning model based on long short-term memory network is applied, and for the subcomponents of residual sequence after secondary decomposition, a combination forecasting model optimized by crow search algorithm is designed. The final prediction is obtained by reconstructing the predictions of all subcomponents. Using real observation datasets of wind speed for model simulation, the developed method decreases MAPE by 19.76%, 24.91%, and 26.36% compared with several other models, signifying the effectiveness and stability of the developed method for ultra-short-term wind speed forecasting as well as a good generalization performance on different datasets.
Keywords:wind speed; forecasting; long short-term memory; secondary decomposition; crow search algorithm; combination forecasting model