李春平,張沛,彭春華,尹瑞,時(shí)珉
(1.華東交通大學(xué)電氣與自動(dòng)化學(xué)院,江西省 南昌市 330013;2.國(guó)網(wǎng)河北省電力有限公司,河北省石家莊市 050021)
由于風(fēng)電的波動(dòng)性和間歇性特點(diǎn),并網(wǎng)風(fēng)力發(fā)電在提供清潔能源的同時(shí),給電力系統(tǒng)的安全、穩(wěn)定運(yùn)行帶來(lái)了嚴(yán)峻挑戰(zhàn)[1]。精確的實(shí)時(shí)風(fēng)電功率預(yù)測(cè)能夠幫助調(diào)度滾動(dòng)地修正日出力計(jì)劃曲線,在保證電力系統(tǒng)運(yùn)行的安全性和經(jīng)濟(jì)性的同時(shí),提高風(fēng)電的消納水平[2]。風(fēng)電功率預(yù)測(cè)按預(yù)測(cè)時(shí)間尺度有超短期(0~4 h 內(nèi))、短期(1~3 天內(nèi))、中長(zhǎng)期(數(shù)月/年內(nèi))[3]。而風(fēng)電功率實(shí)時(shí)預(yù)測(cè)是指自預(yù)測(cè)時(shí)刻起對(duì)未來(lái)15 min 至4 h 內(nèi)風(fēng)電功率進(jìn)行預(yù)測(cè),兩個(gè)預(yù)測(cè)值之間間隔為15 min,實(shí)時(shí)滾動(dòng)預(yù)測(cè)各個(gè)時(shí)間點(diǎn)的風(fēng)電功率[4]。因此風(fēng)電功率實(shí)時(shí)預(yù)測(cè)為超短期多步預(yù)測(cè)。
風(fēng)電功率預(yù)測(cè)方法可以分為兩大類(lèi),即物理方法和統(tǒng)計(jì)方法。物理方法一般基于數(shù)值天氣預(yù)報(bào)先對(duì)風(fēng)速進(jìn)行預(yù)測(cè),然后根據(jù)風(fēng)速-功率曲線得到風(fēng)電功率的預(yù)測(cè)值。文獻(xiàn)[5]利用美國(guó)航天局地球觀測(cè)系統(tǒng)的全球風(fēng)速數(shù)據(jù),從而得到中國(guó)某風(fēng)電場(chǎng)未來(lái)風(fēng)速,再根據(jù)風(fēng)機(jī)的風(fēng)速-功率特性曲線預(yù)測(cè)不同時(shí)間尺度下的風(fēng)電功率;文獻(xiàn)[6]采用K 均值聚類(lèi)方法對(duì)預(yù)測(cè)日前20 天的數(shù)值天氣預(yù)報(bào)(Numerical Weather Prediction,NWP)數(shù)據(jù)樣本進(jìn)行聚類(lèi),在各類(lèi)下分別建立模型預(yù)測(cè)短期風(fēng)電功率。由于物理方法高度依賴數(shù)值天氣預(yù)報(bào)的數(shù)據(jù),其精度受數(shù)值天氣預(yù)報(bào)精度的影響較大。統(tǒng)計(jì)方法則是基于功率、氣象歷史數(shù)據(jù)進(jìn)行預(yù)測(cè)。目前比較常用的有時(shí)間序列法、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)法、支持向量機(jī)(Support Vector Machine,SVM)法等,以及這些方法的組合方法[7];文獻(xiàn)[8]考慮風(fēng)電功率時(shí)間序列波動(dòng)性特點(diǎn),建立了多重離群點(diǎn)平滑轉(zhuǎn)換自回歸模型進(jìn)行短期風(fēng)電功率預(yù)測(cè),但未利用NWP時(shí)序序列信息會(huì)導(dǎo)致其精度隨著預(yù)測(cè)時(shí)間增長(zhǎng)而降低;文獻(xiàn)[9]根據(jù)實(shí)測(cè)功率數(shù)據(jù)、不同高度的氣象數(shù)據(jù),建立了基于神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率誤差帶預(yù)測(cè)模型,實(shí)現(xiàn)了誤差帶預(yù)測(cè),與傳統(tǒng)方法相比預(yù)測(cè)精度有提高;文獻(xiàn)[10]根據(jù)風(fēng)速、風(fēng)向、氣溫、氣壓等氣象特征,建立了基于SVM 的短期風(fēng)電功率預(yù)測(cè),與ANN 相比其預(yù)測(cè)精度有所改善;文獻(xiàn)[11]將風(fēng)速分段后在高、低風(fēng)速段使用最小二乘支持向量機(jī)預(yù)測(cè)模型,中風(fēng)速段使用高斯模型預(yù)測(cè),預(yù)測(cè)時(shí)間與精度優(yōu)于單一模型。
對(duì)于如何提高風(fēng)電功率實(shí)時(shí)預(yù)測(cè)精度,大量文獻(xiàn)提出了許多實(shí)時(shí)預(yù)測(cè)模型?;韭肪€是利用歷史實(shí)際風(fēng)電功率(Real Wind Power, RWP)時(shí)間序列和歷史風(fēng)速、風(fēng)向等數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,然后以此模型進(jìn)行功率預(yù)測(cè)。文獻(xiàn)[12]利用灰色關(guān)聯(lián)關(guān)系和標(biāo)準(zhǔn)風(fēng)速功率曲線建立了基于灰色關(guān)聯(lián)決策的風(fēng)電功率實(shí)時(shí)預(yù)測(cè)模型,相較于完全基于歷史風(fēng)速或者完全基于歷史功率的模型,該方法提高了預(yù)測(cè)精度;文獻(xiàn)[13]利用數(shù)據(jù)挖掘和模糊聚類(lèi)技術(shù)將不同的機(jī)組進(jìn)行分類(lèi), 并分別進(jìn)行實(shí)時(shí)預(yù)測(cè),將預(yù)測(cè)結(jié)果進(jìn)行累加得到最終的預(yù)測(cè)結(jié)果;文獻(xiàn)[14]利用經(jīng)驗(yàn)?zāi)B(tài)分解算法將風(fēng)電功率時(shí)間序列分解為若干子序列,以及值點(diǎn)劃分法將若干子序列重構(gòu)為3 個(gè)分量,再在每個(gè)分量上建立基于集對(duì)分析的實(shí)時(shí)預(yù)測(cè)模型,最后將各個(gè)分量預(yù)測(cè)結(jié)果疊加;文獻(xiàn)[15]采用集合經(jīng)驗(yàn)?zāi)B(tài)分解算法將風(fēng)電功率時(shí)間序列分解為各個(gè)子序列,對(duì)各子序列建立相關(guān)向量機(jī)預(yù)測(cè)模型,最后將得到的各子序列預(yù)測(cè)結(jié)果疊加得到最終功率預(yù)測(cè)值。然而這類(lèi)方法的不足在于:①因?yàn)槠漭斎胩卣髦粏渭兝脷v史風(fēng)電功率時(shí)間序列以及歷史氣象數(shù)據(jù)預(yù)測(cè)未來(lái)風(fēng)電功率,而不考慮未來(lái)預(yù)測(cè)時(shí)段的NWP 數(shù)據(jù),然而NWP 對(duì)風(fēng)電功率的影響是根本性的和趨勢(shì)性的,所以其預(yù)測(cè)精度會(huì)隨著預(yù)測(cè)時(shí)間尺度的增長(zhǎng)而快速下降;②風(fēng)電功率時(shí)間序列具有動(dòng)態(tài)特性[16],即系統(tǒng)的輸出不僅與當(dāng)前時(shí)刻的輸入有關(guān),而且與過(guò)去的輸入有關(guān),但現(xiàn)有時(shí)間序列模型(如Auto Regression Moving Average,ARMA)、常用的神經(jīng)網(wǎng)絡(luò)(ANN、SVM 等)結(jié)構(gòu)決定了其并不能學(xué)習(xí)到風(fēng)電功率、風(fēng)速、風(fēng)向等時(shí)間序列間的關(guān)聯(lián)性,因此風(fēng)電功率預(yù)測(cè)的精度難于再提高。
文獻(xiàn)[17]提出一種基于長(zhǎng)短期記憶(long short-term memory, LSTM)網(wǎng)絡(luò)的超短期風(fēng)電功率預(yù)測(cè)模型,因LSTM 網(wǎng)絡(luò)有短期記憶能力,即能反映前面時(shí)刻輸出值對(duì)當(dāng)前時(shí)刻值的影響,與ARMA、ANN、SVM 等模型相比其預(yù)測(cè)精度有顯著提高。但其不足在于:①其輸入特征只單純利用歷史風(fēng)電功率時(shí)間序列以及歷史氣象數(shù)據(jù)預(yù)測(cè)未來(lái)風(fēng)電功率,而不考慮未來(lái)預(yù)測(cè)時(shí)段的 NWP數(shù)據(jù)。所以其難以預(yù)測(cè)由于氣象突變?cè)斐傻墓β释蛔儠r(shí)的功率值,且隨著預(yù)測(cè)時(shí)間尺度的增長(zhǎng)這種問(wèn)題越嚴(yán)重;②其對(duì)如何選定LSTM 的輸入時(shí)間步長(zhǎng),即使用多少個(gè)歷史時(shí)刻來(lái)預(yù)測(cè)下一時(shí)刻的輸出值未給出依據(jù)與方法,而輸入步長(zhǎng)會(huì)直接影響LSTM 預(yù)測(cè)性能;③所用的LSTM 模型為標(biāo)準(zhǔn)的LSTM,未對(duì)其為適合風(fēng)電功率預(yù)測(cè)進(jìn)行優(yōu)化改進(jìn)。而氣象因素或風(fēng)電功率的隨機(jī)性、波動(dòng)性極強(qiáng)且數(shù)值尺度相差極大,因此有必要為風(fēng)電功率預(yù)測(cè)對(duì)標(biāo)準(zhǔn)LSTM 進(jìn)行優(yōu)化改進(jìn)。
因此,本文提出考慮數(shù)值天氣預(yù)報(bào)和風(fēng)電功率時(shí)序間關(guān)聯(lián)關(guān)系的隨差遺忘長(zhǎng)短期記憶風(fēng)電功率滾動(dòng)預(yù)測(cè)方法。首先,采用斯皮爾曼相關(guān)性分析方法,對(duì)預(yù)測(cè)時(shí)刻的風(fēng)電功率與歷史時(shí)刻的風(fēng)電功率,以及預(yù)測(cè)時(shí)刻的風(fēng)電功率與預(yù)測(cè)時(shí)刻的NWP 數(shù)據(jù)(如風(fēng)速,風(fēng)向等)進(jìn)行相關(guān)性分析。篩選出相關(guān)性強(qiáng)的歷史時(shí)刻風(fēng)電功率與數(shù)值天氣預(yù)報(bào)的氣象信息,作為每步隨差遺忘長(zhǎng)短期記憶
(Error Following Forget Gate-based LSTM, EFFGbased LSTM)預(yù)測(cè)模型的多變量輸入特征序列。當(dāng)預(yù)測(cè)t 時(shí)刻時(shí),利用t–1 時(shí)刻風(fēng)電功率預(yù)測(cè)值和實(shí)際值的差值作為EFFG-based LSTM 模型遺忘門(mén)的輸入來(lái)調(diào)整遺忘門(mén)的輸出,以降低t–1 時(shí)刻預(yù)測(cè)誤差對(duì)t 時(shí)刻風(fēng)電功率預(yù)測(cè)精度的影響,從而提高滾動(dòng)預(yù)測(cè)精度。
氣象數(shù)據(jù)與風(fēng)電功率都具有時(shí)序相關(guān)性,即當(dāng)前時(shí)刻氣象數(shù)據(jù)和風(fēng)電功率與歷史時(shí)刻風(fēng)電功率有關(guān)。因此需要量化評(píng)估當(dāng)前t 時(shí)刻風(fēng)電功率與歷史(t–1、t–2 等)時(shí)刻氣象數(shù)據(jù)和風(fēng)電功率的相關(guān)性,以確定EFFG-based LSTM 的輸入變量。
由于氣象因素和風(fēng)電功率不服從某種特定概率分布,因此宜采用斯皮爾曼相關(guān)系數(shù)法來(lái)分析風(fēng)電功率與NWP 特征之間以及風(fēng)電功率時(shí)間序列自相關(guān)性。斯皮爾曼相關(guān)性系數(shù),也即斯皮爾曼秩相關(guān)系數(shù)?!爸取笨梢岳斫獬梢环N順序或者排序,它根據(jù)原始數(shù)據(jù)的排序位置進(jìn)行求解:
式中:n 為樣本數(shù)量;di為兩列第i 個(gè)樣本數(shù)列重新按降序排列后的序號(hào)差。
圖1 實(shí)時(shí)預(yù)測(cè)輸入特征序列數(shù)據(jù)的構(gòu)建Fig.1 Construction of input feature sequence data for real time prediction
如圖1 所示,以斯皮爾曼相關(guān)性方法進(jìn)行風(fēng)電功率與各NWP 特征相關(guān)性量化分析、風(fēng)電功率時(shí)間序列自相關(guān)性量化分析后,重新構(gòu)建了一個(gè)包含歷史時(shí)刻RWP 與預(yù)測(cè)時(shí)刻N(yùn)WP 的特征序列輸入,以此時(shí)間序列作為每步預(yù)測(cè)的輸入進(jìn)行實(shí)時(shí)滾動(dòng)的風(fēng)電功率預(yù)測(cè)。
在任意時(shí)刻(如t 時(shí)刻)每個(gè)LSTM 單元(cell)輸入有3 個(gè):t 時(shí)刻LSTM cell 的輸入變量 x(t)、t–1時(shí)刻 LSTM cell 的輸出量 h(t–1)、以及t–1 時(shí)刻LSTM cell 的狀態(tài)量 c(t–1)。在本文中,x(t)為t時(shí)刻輸入到LSTM 單元中的歷史風(fēng)電功率與t 時(shí)刻的預(yù)報(bào)氣象;h(t–1)為t–1 時(shí)刻LSTM 單元輸出的風(fēng)電功率預(yù)測(cè)值;c(t–1)為保存或遺忘了的前t–1 時(shí)刻LSTM 單元的歷史輸出值。輸出有2 個(gè):t 時(shí)刻 LSTM 輸出值 h(t)和t 時(shí)刻LSTM 單元狀態(tài) c(t),即t 時(shí)刻的風(fēng)電功率預(yù)測(cè)值和歷史風(fēng)電功率預(yù)測(cè)值的保存或遺忘狀態(tài)。在任意時(shí)刻每個(gè)LSTM 都擁有3 個(gè)門(mén),來(lái)保護(hù)和控制LSTM cell 狀態(tài),分別為: 輸入門(mén)、輸出門(mén)和遺忘門(mén)[18]。圖2展示了LSTM 時(shí)序預(yù)測(cè)模型及其內(nèi)部結(jié)構(gòu)。
圖2 LSTM 時(shí)序模式及其內(nèi)部結(jié)構(gòu)Fig.2 LSTM timing mode and its internal structure
遺忘門(mén)f(t):根據(jù)t–1 時(shí)刻輸出h(t–1)和t 時(shí)的輸入x(t),確定了t–1 時(shí)刻c(t–1)信息有多少保存到t 時(shí)刻的單元狀態(tài)c(t)中。因此,遺忘門(mén)的數(shù)學(xué)表達(dá)式:
式中:s 為sigmoid 激活函數(shù);Wf為遺忘門(mén)的權(quán)重矩陣;bf為遺忘門(mén)的偏置項(xiàng)。
在風(fēng)電功率實(shí)時(shí)滾動(dòng)預(yù)測(cè)模式下進(jìn)行t 時(shí)刻預(yù)測(cè)時(shí),t–1 時(shí)刻模型的預(yù)測(cè)值與測(cè)量的實(shí)際值是已經(jīng)可以得到,所以就有了實(shí)際值與預(yù)測(cè)值的偏差(誤差)。此時(shí)的偏差不僅反映了t–1 時(shí)刻模型的預(yù)測(cè)能力也包含了歷史時(shí)刻信息對(duì)預(yù)測(cè)值到底還能有多少積極的作用。如果計(jì)算后發(fā)現(xiàn)偏差巨大,那就說(shuō)明歷史時(shí)刻值對(duì)t 時(shí)刻預(yù)測(cè)已無(wú)太大的支持作用了進(jìn)而要減小歷史時(shí)刻值對(duì)預(yù)測(cè)輸出值的影響。在LSTM 單元中,減小歷史時(shí)刻信息對(duì)當(dāng)前預(yù)測(cè)的作用也即減小t–1 時(shí)刻的LSTM 單元狀態(tài)c(t–1),是通過(guò)遺忘門(mén)來(lái)實(shí)現(xiàn)的。因此,遺忘門(mén)要根據(jù)t–1 時(shí)刻預(yù)測(cè)值與實(shí)際值偏差情況調(diào)整遺忘門(mén)大小,即進(jìn)行隨差遺忘。但是從式(2)可知標(biāo)準(zhǔn)LSTM 的遺忘門(mén)是由t–1 時(shí)刻輸出h(t–1)和t 時(shí)刻的輸入x(t)來(lái)確定的,這種更新方式不能計(jì)及t–1 時(shí)刻預(yù)測(cè)值與實(shí)際值的偏差對(duì)t 時(shí)刻遺忘門(mén)的調(diào)整作用。為此,把t–1 時(shí)刻預(yù)測(cè)值與實(shí)際值兩者的絕對(duì)誤差來(lái)作為遺忘門(mén)更新的輸入量如:
根據(jù)式(3),遺忘門(mén)根據(jù)t–1 時(shí)刻預(yù)測(cè)值與實(shí)際值的誤差反饋來(lái)調(diào)整t 時(shí)刻遺忘門(mén)的大小,即實(shí)現(xiàn)了對(duì)歷史信息的隨差遺忘。在風(fēng)電功率實(shí)時(shí)預(yù)測(cè)模式下,改進(jìn)后的更新規(guī)則更適合于實(shí)時(shí)功率預(yù)測(cè)。
隨差遺忘長(zhǎng)短期記憶網(wǎng)絡(luò)在t 時(shí)刻結(jié)構(gòu)如圖3所示。隨差遺忘長(zhǎng)短期記憶網(wǎng)絡(luò)與標(biāo)準(zhǔn)的長(zhǎng)短期記憶網(wǎng)絡(luò)相比,除了遺忘門(mén)輸入改進(jìn)為預(yù)測(cè)值ht–1與實(shí)際值h’t–1外,其它門(mén)的更新方式與標(biāo)準(zhǔn)的長(zhǎng)短期記憶一樣。隨差遺忘長(zhǎng)短期記憶網(wǎng)絡(luò)輸入門(mén)與輸出門(mén)的更新方式如下:
圖3 隨差遺忘LSTM 單元內(nèi)部結(jié)構(gòu)Fig.3 Unit internal structure of Error Following Forget Gate-based LSTM
輸入門(mén)i(t):根據(jù)t–1 時(shí)刻輸出h(t–1)和t 時(shí)刻的輸入x(t)來(lái)決定將當(dāng)前的信息量保存到t 時(shí)刻單元狀態(tài)c(t)中,也可以避免將當(dāng)前無(wú)關(guān)緊要的信息進(jìn)入到c(t)中。因此,輸入門(mén)的數(shù)學(xué)表達(dá)式為:
式中:Wi為遺忘門(mén)的權(quán)重矩陣;bi為遺忘門(mén)的偏置項(xiàng)。
式中:T 為tanh 激活函數(shù);Wc為輸入門(mén)的權(quán)重矩陣;bc為輸入門(mén)的偏置項(xiàng)。
新單元狀態(tài)C(t):由t–1 時(shí)刻的單元狀態(tài)c(t–1)乘以遺忘門(mén) f(t),再用當(dāng)前輸入的單元狀態(tài)乘以輸入門(mén)i(t),后將兩個(gè)積相加。把當(dāng)前t時(shí)刻的記憶和長(zhǎng)期的記憶c(t–1) 組合在一起,形成了新的單元狀態(tài)c(t)。因此,新單元狀態(tài)C(t)的數(shù)學(xué)表達(dá)式為:
根據(jù)式(6)新單元狀態(tài),C(t)由于遺忘門(mén)的控制,可以保存很久之前的信息,由于輸入門(mén)的控制,又可以避免當(dāng)前無(wú)關(guān)緊要的內(nèi)容進(jìn)入記憶。
輸出門(mén)O(t):根據(jù)上個(gè)時(shí)刻輸出h(t–1)和當(dāng)前的輸入x(t)來(lái)控制最終單元狀態(tài)c(t)有多少輸出到LSTM 最終輸出h(t)中。因此,輸出門(mén)O(t)的數(shù)學(xué)表達(dá)式為:
式中:Wo為輸入門(mén)的權(quán)重矩陣;bo為輸入門(mén)的偏置項(xiàng)。
最后,隨差遺忘長(zhǎng)短期記憶模塊的最終輸出h(t)為:
至此,由公式(3)~(8)構(gòu)成一個(gè)完整EFFGbased LSTM 單元。
基于EFFG-based LSTM 的風(fēng)電功率實(shí)時(shí)預(yù)測(cè)模型動(dòng)態(tài)結(jié)構(gòu)如圖4 所示,假設(shè)歷史的RWP 取t–1,t–2,t–3 時(shí)刻功率;NWP 特征取風(fēng)速與風(fēng)向。在預(yù)測(cè)t 時(shí)刻功率時(shí),將由RWP(t–1 時(shí)刻功率;t–2 時(shí)刻功率;t–3 時(shí)刻功率)與NWP(t時(shí)刻風(fēng)速;t 時(shí)刻風(fēng)向)構(gòu)成的時(shí)間序列輸入數(shù)據(jù)輸入到EFFG-based LSTM 網(wǎng)絡(luò)中。然后EFFGbased LSTM 網(wǎng)絡(luò)模型預(yù)測(cè)出t 時(shí)刻的風(fēng)電功率。在進(jìn)行t+1 時(shí)刻預(yù)測(cè)時(shí),把t 時(shí)刻實(shí)測(cè)功率與t–1,t–2 時(shí)刻功率和t+1 時(shí)刻風(fēng)速、t+1 時(shí)刻風(fēng)向作為輸入數(shù)據(jù);同時(shí)用t 時(shí)刻的預(yù)測(cè)值和功率實(shí)際值作為EFFG-based LSTM 模型遺忘門(mén)的輸入來(lái)更新遺忘門(mén)的大小,再預(yù)測(cè)輸出t+1 時(shí)刻的風(fēng)電功率。如此滾動(dòng)預(yù)測(cè)出未來(lái)每個(gè)時(shí)刻的風(fēng)電功率。
圖4 基于隨差遺忘長(zhǎng)短期記憶風(fēng)電功率預(yù)測(cè)流程圖Fig.4 Flow chart of wind power prediction based on EFFG-based LSTM
基于EFFG-based LSTM 的風(fēng)電功率實(shí)時(shí)預(yù)測(cè)模型在t 時(shí)刻的靜態(tài)網(wǎng)絡(luò)結(jié)構(gòu)如圖5 所示,包含一層輸入層(歷史RWP 與未來(lái)NWP 數(shù)據(jù)及上一時(shí)刻模型預(yù)測(cè)與功率實(shí)際值)、一層隱含層(EFFGbased LSTM 網(wǎng)絡(luò)層)、一層輸出層。
圖5 基于隨差遺忘長(zhǎng)短期記憶風(fēng)電功率預(yù)測(cè)模型網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.5 Network structure diagram of wind power prediction model based on EFFG-based LSTM
輸入層:輸入層即時(shí)間序列模式的輸入特征量,其中X 為當(dāng)前t 時(shí)刻的過(guò)去時(shí)刻(t–1,t–2,t–3等)RWP 與t 時(shí)刻N(yùn)WP(風(fēng)速、風(fēng)向等)組成一組時(shí)間序列及上一時(shí)刻模型預(yù)測(cè)與功率實(shí)際值,輸入層首先把輸入數(shù)據(jù)根據(jù)式(9)進(jìn)行歸一化處理。
式中: xmax為 該變量的極大值; xmin為該變量的極小值。
再把歸一化的數(shù)據(jù)轉(zhuǎn)化為EFFG-based LSTM神經(jīng)元(cell)輸入數(shù)據(jù)的格式,最后數(shù)據(jù)進(jìn)入到隱含層,即EFFG-based LSTM 網(wǎng)絡(luò)中。
隱含層:隱含層即EFFG-based LSTM 網(wǎng)絡(luò),一層隱含層既能保證預(yù)測(cè)模型較快的預(yù)測(cè)計(jì)算速度;另外不需要考慮由于隱含層過(guò)多致使網(wǎng)絡(luò)過(guò)深而可能出現(xiàn)的過(guò)擬合現(xiàn)象。隱含層的神經(jīng)元(cell)即為如圖3 所示的EFFG-based LSTM 單元。
輸出層:f(.)為輸出層激活函數(shù),Y 為下一時(shí)刻t 風(fēng)電功率預(yù)測(cè)值。輸出層把隱含層的輸出進(jìn)行加權(quán)與偏置后,輸出一維的預(yù)測(cè)風(fēng)電功率。因輸入層已經(jīng)把數(shù)據(jù)歸一化,所以在輸出層需要按式(10)進(jìn)行反歸一化計(jì)算。最后得到實(shí)際的風(fēng)電功率預(yù)測(cè)值:
本文樣本數(shù)據(jù)來(lái)自中國(guó)西北某實(shí)際風(fēng)電場(chǎng)的歷史數(shù)據(jù),即2017 年7 月1 日至7 月21 日的NWP數(shù)據(jù)與歷史實(shí)際風(fēng)電功率。此期間風(fēng)電場(chǎng)的開(kāi)機(jī)容量為90 MW,風(fēng)電功率采樣時(shí)間間隔為 15 min,NWP 預(yù)報(bào)間隔為 15 min。NWP 包含有170 m、100 m、30 m 處的風(fēng)速與風(fēng)向。
首先利用斯皮爾曼相關(guān)系數(shù)法進(jìn)行風(fēng)電功率與NWP 各特征相關(guān)性系數(shù)的計(jì)算、當(dāng)前風(fēng)電功率與歷史風(fēng)電功率相關(guān)性系數(shù)的計(jì)算,以此篩選出預(yù)測(cè)模型輸入特征變量。
表1 中數(shù)值為風(fēng)電功率與NWP 各特征量的斯皮爾曼相關(guān)系數(shù),數(shù)值大小反映了風(fēng)電功率與NWP 各特征量相關(guān)性的強(qiáng)弱。從表1 中可知:此風(fēng)電場(chǎng)當(dāng)前t 時(shí)刻風(fēng)電功率與當(dāng)前t 時(shí)刻100 m、30 m 處的風(fēng)速與風(fēng)向最相關(guān)。因此,此風(fēng)電場(chǎng)要預(yù)測(cè)t 時(shí)刻的風(fēng)電功率時(shí)需將t 時(shí)刻100 m、30 m處的風(fēng)速與風(fēng)向計(jì)入到新構(gòu)建的時(shí)間序列中。
表1 風(fēng)電功率與各個(gè)NWP 特征量之間的斯皮爾曼相關(guān)系數(shù)分析結(jié)果Table 1 Analysis results of wind power and Spearman correlation coefficients among NWP characteristic quantities
表2 中數(shù)值為當(dāng)前(t 時(shí)刻)風(fēng)電功率與歷史(t–1、t–2、t–3 等時(shí)刻)風(fēng)電功率的斯皮爾曼相關(guān)系數(shù),數(shù)值大小反映了當(dāng)前時(shí)刻風(fēng)電功率與各歷史時(shí)刻風(fēng)電功率相關(guān)性的強(qiáng)弱。從表2 中可知:此風(fēng)電場(chǎng)當(dāng)前t 時(shí)刻功率與t–1、t–2、t–3 歷史時(shí)刻功率的相關(guān)性較強(qiáng)。因此,要預(yù)測(cè)此風(fēng)電場(chǎng)t 時(shí)刻的功率時(shí)需將t 時(shí)刻前3 個(gè)時(shí)刻功率放入到新構(gòu)建的時(shí)間序列中。
表2 t 時(shí)刻與前t 各時(shí)刻風(fēng)電功率之間的斯皮爾曼相關(guān)系數(shù)分析結(jié)果Table 2 Spearman correlation coefficient between real wind power at t time and at time t before
EFFG-based LSTM 網(wǎng)絡(luò)參數(shù)設(shè)置:由前面的斯皮爾曼相關(guān)性計(jì)算可知輸入步長(zhǎng)為4,即前三個(gè)歷史時(shí)刻RWP 與預(yù)測(cè)時(shí)刻N(yùn)WP。隱含層神經(jīng)元即EFFG-based LSTM 單元(cell)個(gè)數(shù)與預(yù)測(cè)精度(如RMSE)并不是線性關(guān)系,即達(dá)到一定數(shù)目后再增加cell 個(gè)數(shù)預(yù)測(cè)精度反而會(huì)減小。所以,隱含層神經(jīng)元數(shù)目要根據(jù)時(shí)間序列中輸入特征量的多少、模型訓(xùn)練精度高低來(lái)確定,經(jīng)反復(fù)試驗(yàn)驗(yàn)證其設(shè)置為12 時(shí)預(yù)測(cè)精度最好。EFFGbased LSTM 各個(gè)門(mén)激活函數(shù)保持為默認(rèn)值。
最后以2017 年7 月1 日至7 月19 日的數(shù)據(jù)作為模型訓(xùn)練樣本數(shù)據(jù),進(jìn)行兩種時(shí)間尺度的實(shí)時(shí)預(yù)測(cè)。一是預(yù)測(cè)未來(lái)4 h 內(nèi),即從7 月20 日10:00 至14:45 的風(fēng)電功率;二是預(yù)測(cè)未來(lái)24 h 內(nèi),即7 月21 日一天內(nèi)的風(fēng)電功率。
因?yàn)閷?shí)際風(fēng)電功率值存在零值,預(yù)測(cè)效果評(píng)估指標(biāo)中常用的平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)將失去意義[19],所以本文采用均方根誤差(root mean square error,RMSE)和文獻(xiàn)[4]中的準(zhǔn)確率AR、合格率QR 指標(biāo)對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià)。
均方根誤差RMSE 計(jì)算公式:
式中:n 為預(yù)測(cè)結(jié)果個(gè)數(shù);P 為目標(biāo)數(shù)據(jù)的實(shí)際值;P'為目標(biāo)數(shù)據(jù)的預(yù)測(cè)值;i 為實(shí)際值、預(yù)測(cè)值序列編號(hào)。
準(zhǔn)確率AR 計(jì)算公式:
式中:PMK為K 時(shí)間段的實(shí)際功率平均值;PPK為K 時(shí)間段的預(yù)測(cè)功率平均值;Pcap為風(fēng)電場(chǎng)對(duì)應(yīng)時(shí)段的開(kāi)機(jī)容量;N 為預(yù)測(cè)總時(shí)段數(shù)。
合格率QR 計(jì)算公式:
為驗(yàn)證和比較本文預(yù)測(cè)模型的預(yù)測(cè)性能,本文采用基于SVM 和標(biāo)準(zhǔn)的LSTM 風(fēng)電功率實(shí)時(shí)預(yù)測(cè)模型作為對(duì)比模型進(jìn)行預(yù)測(cè)結(jié)果對(duì)比分析。對(duì)比模型同樣以2017 年7 月1 日至7 月19 日的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),進(jìn)行兩種時(shí)間尺度的實(shí)時(shí)預(yù)測(cè),即7 月20 日10:00 至14:45 的風(fēng)電功率以及7 月21 日一天內(nèi)的風(fēng)電功率。各模型預(yù)測(cè)結(jié)果如圖6、7 所示。
圖6 3 種模型實(shí)時(shí)預(yù)測(cè)4 h 內(nèi)的風(fēng)電功率Fig.6 Predicted wind power within 4 hours by three models
圖7 3 種模型實(shí)時(shí)預(yù)測(cè)24 h 內(nèi)的風(fēng)電功率Fig.7 Predicted wind power within 24 hours by three models
從圖6、7 可知:無(wú)論是在4 h 還是24 h 時(shí)間段上的預(yù)測(cè),SVM 預(yù)測(cè)模型是3 個(gè)模型中表現(xiàn)最差的,其大致能預(yù)測(cè)出風(fēng)電功率的變化趨勢(shì),但是具體到單一時(shí)間點(diǎn)時(shí),預(yù)測(cè)值與實(shí)際值的絕對(duì)誤差較大。原因在于SVM 不是適合時(shí)間序列預(yù)測(cè)的模型,無(wú)法處理時(shí)間序列間關(guān)聯(lián)信息和時(shí)間相關(guān)性。而且SVM 也不是基于深度學(xué)習(xí)技術(shù)的模型,對(duì)大量樣本的特征學(xué)習(xí)能力有限;LSTM與EFFG-based LSTM 預(yù)測(cè)模型無(wú)論是4 h 還是24 h時(shí)間段上的預(yù)測(cè)結(jié)果都優(yōu)于SVM 預(yù)測(cè)模型,因?yàn)槠涫紫壤昧松疃葘W(xué)習(xí)技術(shù)來(lái)優(yōu)化網(wǎng)絡(luò)里的各個(gè)參數(shù)以達(dá)到最優(yōu),其次LSTM 與EFFG-based LSTM 網(wǎng)絡(luò)為一種時(shí)間序列網(wǎng)絡(luò)模型,能較好地處理風(fēng)電功率時(shí)間序列間關(guān)聯(lián)信息和時(shí)間相關(guān)性,適合于有時(shí)序關(guān)聯(lián)性的時(shí)間序列的預(yù)測(cè)。但是在風(fēng)電功率波動(dòng)性大的時(shí)段,即功率時(shí)增時(shí)減時(shí)段EFFG-based LSTM 預(yù)測(cè)模型要明顯優(yōu)于LSTM 預(yù)測(cè)模型。原因在于LSTM 遺忘門(mén)的更新僅僅是通過(guò)上一時(shí)刻輸出值與當(dāng)前的所有輸入量,因此不能反映上一時(shí)刻模型預(yù)測(cè)值與功率實(shí)際值之間的誤差對(duì)遺忘門(mén)的影響。而EFFG-based LSTM 遺忘門(mén)的更新是通過(guò)上一時(shí)刻模型預(yù)測(cè)值與功率實(shí)際值之間的誤差來(lái)更新的。所以當(dāng)誤差較大時(shí)遺忘門(mén)也增大,也即模型的遺忘系數(shù)大了,歷史輸出值將遺忘更多,歷史值對(duì)模型的作用就更小了。在風(fēng)電功率突變的時(shí)段,下一時(shí)刻的功率與上幾個(gè)時(shí)刻功率沒(méi)有歷史關(guān)聯(lián)性,即預(yù)測(cè)下一時(shí)刻功率時(shí)其歷史值沒(méi)有支持作用了,所以要減小歷史值的作用。EFFG-based LSTM 遺忘門(mén)的更新正是契合此種情況,所以EFFG-based LSTM 預(yù)測(cè)模型在風(fēng)電功率波動(dòng)性大的時(shí)段的預(yù)測(cè)效果是最好的。
表3、4 分別為3 個(gè)預(yù)測(cè)模型4 h 和24 h 預(yù)測(cè)結(jié)果的RMSE、準(zhǔn)確率AR、合格率QR。
由表3、4 可知:EFFG-based LSTM 測(cè)模型無(wú)論是在4 h 還是24 h 預(yù)測(cè)值的均方根誤差RMSE、準(zhǔn)確率AR、合格率QR 相比于SVM 和LSTM 預(yù)測(cè)模型都是最優(yōu)的。其RMSE 雖然在24 h 時(shí)段預(yù)測(cè)時(shí)有所增大,但僅僅增大了0.65;在4 h 時(shí)段和24 h 時(shí)段的準(zhǔn)確率、合格率都在90%以上。但是SVM 和LSTM 預(yù)測(cè)模型由4 h 時(shí)段到24 h時(shí)段的準(zhǔn)確率、合格率都出現(xiàn)了顯著下降。特別是RMSE 分別增大了3.98 與2.47。表現(xiàn)較好的LSTM 預(yù)測(cè)模型準(zhǔn)確率、合格率也僅能達(dá)到80%左右。因?yàn)殡S著預(yù)測(cè)時(shí)段的增長(zhǎng),包含了更多的風(fēng)電功率劇烈波動(dòng)情況,而SVM 與標(biāo)準(zhǔn)LSTM模型都無(wú)法有效應(yīng)對(duì)功率劇烈變化的時(shí)段的預(yù)測(cè)。對(duì)此問(wèn)題EFFG-based LSTM 通過(guò)改進(jìn)后的遺忘門(mén)得到比較有效的解決,所以無(wú)論在短時(shí)間段還是長(zhǎng)時(shí)間段EFFG-based LSTM 預(yù)測(cè)模型各方面性能都優(yōu)于SVM 與標(biāo)準(zhǔn)LSTM 模型。
表3 各預(yù)測(cè)模型預(yù)測(cè)4 h 風(fēng)電功率結(jié)果的評(píng)價(jià)指標(biāo)Table 3 Evaluation indices of predicted results within 4 hours by different prediction models
表4 各預(yù)測(cè)模型預(yù)測(cè)24 h 風(fēng)電功率結(jié)果的評(píng)價(jià)指標(biāo)Table 4 Evaluation indices of predicted results within 24 hours by different prediction models
本文提出的基于EFFG-based LSTM 風(fēng)電功率實(shí)時(shí)預(yù)測(cè)方法。算例結(jié)果表明:
1)采用斯皮爾曼法計(jì)算分析不同氣象輸入 變量與風(fēng)電功率之間的相關(guān)性以及各個(gè)歷史時(shí)刻風(fēng)電功率序列間的自相關(guān)性,據(jù)此為預(yù)測(cè)模型輸入變量的篩選提供依據(jù),進(jìn)而構(gòu)建了包含歷史實(shí)際功率和預(yù)測(cè)時(shí)刻N(yùn)WP 的輸入時(shí)間序列、為后續(xù)的EFFG-based LSTM 輸入時(shí)間步長(zhǎng)的確定提供依據(jù),進(jìn)而為EFFG-based LSTM 的訓(xùn)練與預(yù)測(cè)設(shè)置合理的輸入時(shí)間步長(zhǎng)。
2)有別于現(xiàn)有的僅利用歷史功率進(jìn)行風(fēng)電功率預(yù)測(cè),本文方法在輸入特征上除了利用歷史功率外還計(jì)及了NWP 數(shù)據(jù),即有效利用了多變量信息;其次NWP 數(shù)據(jù)的加入一定程度上可以使預(yù)測(cè)模型提高在氣象突變引起的風(fēng)電功率突變時(shí)段的預(yù)測(cè)精度。
3)基于標(biāo)準(zhǔn)LSTM 建立的風(fēng)電功率預(yù)測(cè)模型,由于其遺忘門(mén)的更新輸入會(huì)讓其有較大歷史慣性,導(dǎo)致在風(fēng)電功率變化劇烈時(shí)段的預(yù)測(cè)精度大大下降。本文對(duì)標(biāo)準(zhǔn)LSTM 的遺忘門(mén)進(jìn)行了改進(jìn),建立的EFFG-based LSTM 模型優(yōu)于LSTM 預(yù)測(cè)模型,特別是在風(fēng)電功率變化劇烈時(shí)段的預(yù)測(cè)精度。
歷史實(shí)測(cè)氣象數(shù)據(jù)中包含了風(fēng)電場(chǎng)局部性的氣象信息,如何把NWP 與實(shí)測(cè)氣象進(jìn)行有效結(jié)合,以改善NWP 預(yù)報(bào)的精度從而提高風(fēng)電功率實(shí)時(shí)預(yù)測(cè)精度是有待下一步研究的問(wèn)題。