凡 航,張雪敏,梅生偉,楊忠良
(1. 清華大學(xué)電機(jī)工程與應(yīng)用電子技術(shù)系,北京市100084;2. 電力系統(tǒng)及大型發(fā)電設(shè)備安全控制和仿真國(guó)家重點(diǎn)實(shí)驗(yàn)室,清華大學(xué),北京市100084;3. 清華大學(xué)電子工程系,北京市100084)
風(fēng)能具有較強(qiáng)的隨機(jī)性和不確定性。隨著中國(guó)風(fēng)電裝機(jī)容量和比例的不斷增高,風(fēng)電消納的難度逐漸增大,棄風(fēng)問(wèn)題日益凸顯。提高風(fēng)電場(chǎng)風(fēng)電功率超短期預(yù)測(cè)的精度對(duì)電網(wǎng)在線優(yōu)化調(diào)度具有重要的意義[1-2]??紤]“風(fēng)速-功率”轉(zhuǎn)換關(guān)系中的不確定性與風(fēng)速不確定性的機(jī)理不同,因此有必要對(duì)兩者分別進(jìn)行研究。本文重點(diǎn)探討如何提升風(fēng)速超短期預(yù)測(cè)的精度,這也是進(jìn)一步改進(jìn)風(fēng)電場(chǎng)功率預(yù)測(cè)精度的基礎(chǔ)[3]。
超短期風(fēng)電功率預(yù)測(cè)是指預(yù)測(cè)風(fēng)電場(chǎng)未來(lái)0~4 h 的有功功率,時(shí)間分辨率不小于15 min[4]。相應(yīng)的風(fēng)速預(yù)測(cè)的時(shí)間尺度亦是如此。文獻(xiàn)[5]提出了利用修正后自回歸差分移動(dòng)平均-廣義自回歸條件異方差(ARIMA-GARCH)模型進(jìn)行超短期風(fēng)速預(yù)測(cè)。文獻(xiàn)[6]針對(duì)風(fēng)速序列非線性、波動(dòng)性的問(wèn)題,首先利用變分模態(tài)分解將信號(hào)從低頻到高頻逐次分解,并對(duì)每個(gè)分量分別建立ARIMA-GARCH 模型再進(jìn)行疊加。文獻(xiàn)[7]在變分模態(tài)分解的基礎(chǔ)上,分別采用后向傳播的神經(jīng)網(wǎng)絡(luò)(BPNN)、自回歸滑動(dòng)平均(ARMA)模型和最小二乘支持向量機(jī)(LS-SVM)對(duì)高頻、中頻和低頻信號(hào)進(jìn)行預(yù)測(cè)。文獻(xiàn)[8]采用了長(zhǎng)短期記憶(LSTM)單元對(duì)風(fēng)電場(chǎng)的超短期風(fēng)速進(jìn)行了預(yù)測(cè),并在此基礎(chǔ)上進(jìn)行了功率預(yù)測(cè)。文獻(xiàn)[9]在BPNN 中引入了誤差校正環(huán)節(jié)。文獻(xiàn)[10]提出風(fēng)電場(chǎng)的風(fēng)速之間存在較強(qiáng)的空間相關(guān)性,并給出了計(jì)及空間相關(guān)性的風(fēng)速超短期預(yù)測(cè)方法。文獻(xiàn)[11]采用了k 近鄰進(jìn)行空間相關(guān)性的超短期預(yù)測(cè),并對(duì)預(yù)測(cè)模型的階數(shù)、訓(xùn)練模型的樣本容量與預(yù)測(cè)誤差之間的關(guān)系進(jìn)行了研究。文獻(xiàn)[12]采用了最近歷史觀測(cè)值和偏最小二乘回歸(PLSR)進(jìn)行空間相關(guān)性超短期風(fēng)速預(yù)測(cè)。
上述方法表明,風(fēng)速超短期預(yù)測(cè)精度的提升在于獲取更豐富的輸入數(shù)據(jù),并采用合適的方法建立預(yù)測(cè)模型。鑒于同一個(gè)風(fēng)電場(chǎng)不同高度的風(fēng)速和風(fēng)向之間在時(shí)間和空間上都存在較強(qiáng)的相關(guān)性[13],本文將利用這些實(shí)測(cè)數(shù)據(jù)改善風(fēng)速在超短期尺度上的預(yù)測(cè)精度。同時(shí),數(shù)值天氣預(yù)報(bào)(NWP)技術(shù)的預(yù)測(cè)精度和更新時(shí)間的不斷進(jìn)步,將為進(jìn)一步提升風(fēng)速超短期預(yù)測(cè)精度提供便利[14]。文獻(xiàn)[15]結(jié)合多重聚類和分層聚類方法對(duì)風(fēng)電場(chǎng)的氣象類型進(jìn)行分類,并利用NWP 數(shù)據(jù)進(jìn)行了超短期功率預(yù)測(cè)。
為了高效提取同一個(gè)風(fēng)電場(chǎng)在不同高度的風(fēng)速、風(fēng)向歷史數(shù)據(jù)以及NWP 數(shù)據(jù)的時(shí)空特征,本文引入了由卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)組成的時(shí)空神經(jīng)網(wǎng)絡(luò)。CNN 具有局部連接和權(quán)值共享的特點(diǎn),擅于提取數(shù)據(jù)的空間特征。RNN 采取遞歸的結(jié)構(gòu),能夠提取數(shù)據(jù)的時(shí)序特性。由二者組合構(gòu)成的深度時(shí)空神經(jīng)網(wǎng)絡(luò)在處理時(shí)序數(shù)據(jù)等方面取得了較大的突破和廣泛的應(yīng)用[16-18]。文獻(xiàn)[17-18]根據(jù)城市交通流的相應(yīng)物理特征信息設(shè)計(jì)了時(shí)空神經(jīng)網(wǎng)絡(luò)并將其應(yīng)用到城市街道的人流和車流預(yù)測(cè)當(dāng)中,取得了良好的效果。文獻(xiàn)[19]采用CNN 和單向的門(mén)控循環(huán)單元(GRU)線性組合構(gòu)建了時(shí)空網(wǎng)絡(luò),對(duì)風(fēng)電場(chǎng)的功率進(jìn)行了預(yù)測(cè),但沒(méi)有充分利用不同高度的風(fēng)速、風(fēng)向數(shù)據(jù)和NWP 數(shù)據(jù)。
因此,本文設(shè)計(jì)了一種新的時(shí)空神經(jīng)網(wǎng)絡(luò)對(duì)風(fēng)電場(chǎng)的超短期風(fēng)速進(jìn)行了預(yù)測(cè),能夠充分挖掘風(fēng)電場(chǎng)內(nèi)不同高度風(fēng)速、風(fēng)向數(shù)據(jù)之間的時(shí)空相關(guān)性和NWP 的相關(guān)信息,并利用中國(guó)東北某風(fēng)電場(chǎng)的實(shí)際數(shù)據(jù)驗(yàn)證了所提方法的有效性。
傳統(tǒng)單風(fēng)電場(chǎng)的預(yù)測(cè)主要利用的是單風(fēng)電場(chǎng)特定高度風(fēng)速的時(shí)間相關(guān)性,結(jié)合機(jī)器學(xué)習(xí)算法或者深度學(xué)習(xí)算法對(duì)后續(xù)的風(fēng)速進(jìn)行預(yù)測(cè)。而風(fēng)電場(chǎng)不同高度處的風(fēng)速、風(fēng)向受到區(qū)域內(nèi)部大氣運(yùn)動(dòng)的影響,存在較強(qiáng)的關(guān)聯(lián)性[9]。這意味著,當(dāng)前變量在某預(yù)測(cè)時(shí)刻的值,不僅僅與當(dāng)前變量歷史時(shí)刻的值相關(guān),還與其他不同高度風(fēng)速、風(fēng)向的歷史時(shí)刻取值相關(guān)。
風(fēng)電場(chǎng)風(fēng)速預(yù)測(cè)模型利用神經(jīng)網(wǎng)絡(luò)等模型對(duì)預(yù)測(cè)值與給定的歷史信息變量之間的函數(shù)關(guān)系進(jìn)行學(xué)習(xí)。傳統(tǒng)的風(fēng)電場(chǎng)風(fēng)速預(yù)測(cè)只考慮了風(fēng)電場(chǎng)風(fēng)速未來(lái)時(shí)刻的輸出和歷史風(fēng)速之間存在的耦合,具體可用式(1)來(lái)描述。
式中:wi,t+H為待預(yù)測(cè)變量i 在t+H 時(shí)刻的風(fēng)速;wi,t為待預(yù)測(cè)變量i 在t 時(shí)刻的風(fēng)速。
而預(yù)測(cè)算法本身是對(duì)這種變量之間的映射關(guān)系進(jìn)行學(xué)習(xí)??梢钥闯?式(1)中的預(yù)測(cè)只考慮了單個(gè)變量的歷史信息。而考慮了風(fēng)電場(chǎng)時(shí)空相關(guān)性的預(yù)測(cè)指的是當(dāng)前風(fēng)電場(chǎng)的風(fēng)速不僅與當(dāng)前高度處的歷史風(fēng)速、風(fēng)向相關(guān),還與其他高度處的歷史風(fēng)速、風(fēng)向以及NWP 數(shù)據(jù)存在一定的聯(lián)系??捎檬剑?)來(lái)描述。
式中:Wt為t 時(shí)刻不同高度的風(fēng)速、風(fēng)向歷史數(shù)據(jù)向量;Pt為t 時(shí)刻N(yùn)WP 數(shù)據(jù)。
風(fēng)電場(chǎng)的超短期預(yù)測(cè)需要對(duì)未來(lái)0~4 h 以每15 min 為時(shí)間間隔做預(yù)測(cè)??紤]到利用單步預(yù)測(cè)模型滾動(dòng)16 次會(huì)帶來(lái)誤差的疊加,而4 h 內(nèi)需預(yù)測(cè)的時(shí)刻數(shù)量并不太多。因此,本文針對(duì)0~4 h 的超短期預(yù)測(cè)是對(duì)每個(gè)時(shí)刻H 采用同樣的網(wǎng)絡(luò)結(jié)構(gòu)分別訓(xùn)練的預(yù)測(cè),一共可以得到16 個(gè)不同參數(shù)的預(yù)測(cè)模型。
在風(fēng)電場(chǎng)風(fēng)速預(yù)測(cè)時(shí),能夠利用的信息有測(cè)風(fēng)塔提供的不同高度的風(fēng)速和風(fēng)向信息。以東北某風(fēng)電場(chǎng)為例,該風(fēng)電場(chǎng)所能提供的數(shù)據(jù)包括10 m 風(fēng)速、10 m 風(fēng)向、50 m 風(fēng)速、50 m 風(fēng)向、70 m 風(fēng)速和70 m 風(fēng)向,而所需預(yù)測(cè)的是70 m 的風(fēng)速。各高度的風(fēng)速、風(fēng)向之間存在著空間上的聯(lián)系,而不同時(shí)刻的截面數(shù)據(jù)之間又存在著時(shí)間上的聯(lián)系。因此,風(fēng)電場(chǎng)的測(cè)量數(shù)據(jù)可以建模成時(shí)空數(shù)據(jù)。
在每個(gè)時(shí)刻,多高度的風(fēng)速、風(fēng)向數(shù)據(jù)構(gòu)成一個(gè)向量。而隨著時(shí)間的推移,這些按時(shí)間順序采樣得到的向量可構(gòu)成一個(gè)矩陣。在進(jìn)行樣本集劃分時(shí),選取每個(gè)樣本的長(zhǎng)度為n。因?yàn)闅v史風(fēng)速包含6 個(gè)不同的變量,所以每個(gè)樣本為6×n 矩陣。
本文在預(yù)測(cè)中還考慮了NWP 數(shù)據(jù)。該數(shù)據(jù)來(lái)自中國(guó)電力科學(xué)研究院數(shù)值預(yù)報(bào)中心,原始的氣象參數(shù)超過(guò)100 個(gè)。根據(jù)Granger 因果檢驗(yàn),選定了對(duì)風(fēng)速預(yù)測(cè)最有價(jià)值的24 個(gè)變量(溫度、動(dòng)量通量、170 m 風(fēng)速、100 m 風(fēng)速、30 m 風(fēng)速、10 m 風(fēng)速、10 m海上風(fēng)速、170 m 風(fēng)向、100 m 風(fēng)向、30 m 風(fēng)向、10 m風(fēng)向、10 m 海上風(fēng)向、海平面氣壓、云量、潛熱通量、感熱通量、短波輻射、長(zhǎng)波輻射、表面氣壓、總降水、大尺度降水、對(duì)流降水、2 m 溫度和2 m 相對(duì)濕度)。當(dāng)選取的NWP 時(shí)間窗的長(zhǎng)度為m 時(shí),每個(gè)樣本為24×m 矩陣。
在實(shí)際的操作中,風(fēng)速歷史數(shù)據(jù)和NWP 數(shù)據(jù)屬于不同類型的數(shù)據(jù),在采樣的時(shí)間間隔上也存在較大差異,而且狀態(tài)變量之間都存在著時(shí)變的非線性關(guān)系。傳統(tǒng)的統(tǒng)計(jì)和機(jī)器學(xué)習(xí)方法很難對(duì)其進(jìn)行有效的刻畫(huà)。因此,本文設(shè)計(jì)了以下時(shí)空神經(jīng)網(wǎng)絡(luò),對(duì)風(fēng)速和NWP 分別進(jìn)行特征提取和特征融合。
深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個(gè)重要的分支,能夠通過(guò)構(gòu)建更加深層和復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)來(lái)提升對(duì)數(shù)據(jù)特征的提取能力。相較于傳統(tǒng)的淺層神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)通過(guò)一系列非線性的數(shù)學(xué)變換,能夠通過(guò)網(wǎng)狀層級(jí)結(jié)構(gòu)對(duì)數(shù)據(jù)中包含的深層次特征進(jìn)行提取,從而進(jìn)行分類或者預(yù)測(cè)。深度學(xué)習(xí)中通常用到的模塊有CNN 和RNN。CNN 擅長(zhǎng)提取數(shù)據(jù)的空間信息特征,RNN 擅長(zhǎng)提取數(shù)據(jù)的時(shí)序特征信息。
在之前的研究中,有學(xué)者提出了將CNN 和GRU 進(jìn)行拼接,從而搭建一個(gè)復(fù)合的網(wǎng)絡(luò)進(jìn)行研究的方法[16-19]。該網(wǎng)絡(luò)在機(jī)器學(xué)習(xí)領(lǐng)域的研究中被稱為時(shí)空神經(jīng)網(wǎng)絡(luò)。時(shí)空神經(jīng)網(wǎng)絡(luò)首先利用CNN 提取數(shù)據(jù)的空間特征,然后再利用LSTM 單元或者GRU 提取數(shù)據(jù)的時(shí)間維度特征,在人工智能領(lǐng)域的視頻行為檢測(cè)和分類任務(wù)中取得了良好的效果。但文獻(xiàn)[19]采用的GRU 是單向的GRU,其只能提取到單向的特征。而CNN 提取特征并將其傳遞給RNN 之后,特征應(yīng)該具有多維度的屬性,如果只是利用單向GRU 進(jìn)行回歸,會(huì)損失掉部分有用的信息。因此,本文在文獻(xiàn)[19]提出的時(shí)空神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,將單向GRU 替換成了雙向GRU,從而更好地提取了數(shù)據(jù)的時(shí)序特征信息。在此基礎(chǔ)上,提出了考慮NWP 數(shù)據(jù)的預(yù)測(cè)模型,如圖1 所示。
圖1 考慮NWP 數(shù)據(jù)的時(shí)空神經(jīng)網(wǎng)絡(luò)模型Fig.1 Spatiotemporal neural network model considering NWP data
圖1 中,考慮了NWP 數(shù)據(jù)的時(shí)空神經(jīng)網(wǎng)絡(luò)模型分為2 個(gè)部分。第1 個(gè)部分是離線訓(xùn)練部分,能夠分別提取預(yù)處理后的歷史風(fēng)速數(shù)據(jù)和NWP 的空間信息,然后再將提取的空間特征分別傳遞到雙向GRU 模塊,提取時(shí)序信息。最后,再利用深度學(xué)習(xí)中經(jīng)典的數(shù)據(jù)拼接的方式融合歷史風(fēng)速和NWP 的特征信息,并利用全連接層進(jìn)行預(yù)測(cè)。而第2 個(gè)部分是模型的在線應(yīng)用部分,能夠?qū)v史風(fēng)速信息和NWP 數(shù)據(jù)進(jìn)行相應(yīng)的預(yù)處理,然后輸入到訓(xùn)練好的網(wǎng)絡(luò)中,快速給出預(yù)測(cè)的結(jié)果。
本文利用不同大小卷積核的CNN 對(duì)風(fēng)電場(chǎng)多變量之間的空間相關(guān)性進(jìn)行了特征提取。圖2 以歷史風(fēng)速數(shù)據(jù)為例進(jìn)行說(shuō)明。歷史風(fēng)速數(shù)據(jù)包含了10 m 風(fēng)速、10 m 風(fēng)向、50 m 風(fēng)速、50 m 風(fēng)向、70 m 風(fēng)速和70 m 風(fēng)向一共6 個(gè)變量。假設(shè)預(yù)測(cè)選取的樣本時(shí)間長(zhǎng)度為n,那么每個(gè)樣本為6×n 矩陣。本文選取了含有3 組不同大小的卷積核的CNN 對(duì)輸入數(shù)據(jù)的空間進(jìn)行提?。ň矸e核的大小分別為6×k1,6×k2和6×k3),其中每組卷積核的個(gè)數(shù)為N。再經(jīng)過(guò)線性整流函數(shù)(ReLu)單元和1 維的池化(Maxpooling)操作之后,可以得到3 個(gè)相同長(zhǎng)度的向量,通過(guò)對(duì)此進(jìn)行直接的拼接,即為提取出的空間特征向量。在假定CNN 中步長(zhǎng)(stride)等于1 的情況下繪制了示意圖,如圖2 所示。
圖2 空間特征提取模塊示意圖Fig.2 Schematic diagram of spatial feature extraction module
對(duì)于NWP 數(shù)據(jù)也可以進(jìn)行同樣的操作。對(duì)預(yù)測(cè)的wi,t+H,采用當(dāng)前t 時(shí)刻之后的長(zhǎng)度為m 的NWP 數(shù)據(jù)。NWP 數(shù)據(jù)中包含了24 種不同的狀態(tài)變量。因此,對(duì)于卷積核的大小以及池化層的維度也需要分別進(jìn)行相應(yīng)的修改,從而得到N ×3 向量。
RNN 擅長(zhǎng)提取數(shù)據(jù)的時(shí)間信息特征,從而對(duì)序列數(shù)據(jù)進(jìn)行分類或預(yù)測(cè)。在序列過(guò)長(zhǎng)的時(shí)候,RNN在處理時(shí)可能會(huì)出現(xiàn)梯度耗散的問(wèn)題。而且隨著相關(guān)信息和預(yù)測(cè)位置的增長(zhǎng),RNN 很難處理這樣的長(zhǎng)期依賴問(wèn)題。在RNN 的基礎(chǔ)上,有學(xué)者提出了LSTM 單元。LSTM 單元通過(guò)一些“門(mén)”的設(shè)計(jì)能夠有選擇性地影響RNN 中每個(gè)時(shí)刻的狀態(tài)。GRU網(wǎng)絡(luò)是LSTM 網(wǎng)絡(luò)的一種變體,因?yàn)镚RU 網(wǎng)絡(luò)把LSTM 網(wǎng)絡(luò)中的遺忘門(mén)和輸入門(mén)用更新門(mén)代替了,其結(jié)構(gòu)相比于LSTM 網(wǎng)絡(luò)的結(jié)構(gòu)更加簡(jiǎn)單,而且效果也更好。GRU 網(wǎng)絡(luò)中單元狀態(tài)(cell state)和隱藏狀態(tài)(hidden state)進(jìn)行了合并,計(jì)算當(dāng)前時(shí)刻信息的方法和LSTM 網(wǎng)絡(luò)有所不同[19]。GRU 網(wǎng)絡(luò)包含了重置門(mén)、更新門(mén)、候選記憶單元和當(dāng)前時(shí)刻記憶單元4 個(gè)單元,其計(jì)算分別如式(3)—式(6)所示。
式中:xt為輸入向量;rt,zt,ht分別為重置門(mén)、更新門(mén)、候選記憶單元和當(dāng)前時(shí)刻記憶單元向量;Wr和Ur為重置門(mén)參數(shù);Wz和Uz為更新門(mén)參數(shù);Wh?和Uh?為候選記憶單元的參數(shù);σ(?)和τ(?)表示激活函數(shù);“☉”表示向量元素依次相乘。
在經(jīng)典的RNN、LSTM 網(wǎng)絡(luò)和GRU 網(wǎng)絡(luò)當(dāng)中,狀態(tài)的傳輸是從前往后單向的,因此只能提取數(shù)據(jù)在一個(gè)方向上的特征。但是在許多序列的預(yù)測(cè)或者分類任務(wù)中,當(dāng)前時(shí)刻的輸出不僅和之前的數(shù)據(jù)相關(guān),而且和之后的數(shù)據(jù)也緊密關(guān)聯(lián)[20-21]。所以,需要利用雙向的網(wǎng)絡(luò),因此在此基礎(chǔ)上衍生出了雙向RNN、雙向LSTM 網(wǎng)絡(luò)和雙向GRU 網(wǎng)絡(luò)。
文獻(xiàn)[22]提出了在風(fēng)功率預(yù)測(cè)中的雙向預(yù)測(cè)機(jī)制。因?yàn)橛糜陲L(fēng)速預(yù)測(cè)的數(shù)據(jù),在經(jīng)歷了CNN 部分的特征提取之后,傳遞給了RNN,如果只用單向GRU 去提取特征,只能提取到單向的信息,不能準(zhǔn)確地實(shí)現(xiàn)特征提取。而且,本文在進(jìn)行風(fēng)功率預(yù)測(cè)的時(shí)候,利用了未來(lái)時(shí)刻的NWP 信息,數(shù)據(jù)具有相應(yīng)的反向相關(guān)性。因此,本文在提取時(shí)序特征的時(shí)候,采用了雙向GRU 網(wǎng)絡(luò)。一方面,能夠?qū)﹂L(zhǎng)序列的時(shí)序特征進(jìn)行提取,而不出現(xiàn)梯度耗散的問(wèn)題,另一方面,也能夠捕捉到序列的雙向特征,如圖3所示。
圖3 時(shí)序特征提取模塊示意圖Fig.3 Schematic diagram of temporal feature extraction module
特征融合是指把不同數(shù)據(jù)源的特征進(jìn)行合并。利用Concatenate 方法對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行特征融合在機(jī)器學(xué)習(xí)中是一種經(jīng)典的操作,在DenseNet 和U-net 中都采用了相應(yīng)的方式進(jìn)行特征融合[23-24]。文獻(xiàn)[25]采用了時(shí)空網(wǎng)絡(luò)對(duì)出租車的需求量進(jìn)行了預(yù)測(cè),并將地理信息和時(shí)序信息進(jìn)行了Concatenate 融合。本文采用了文獻(xiàn)[25]中的特征融合辦法,對(duì)于分別通過(guò)CNN 和雙向GRU 網(wǎng)絡(luò)提取出的風(fēng)速、風(fēng)向歷史數(shù)據(jù)和NWP 數(shù)據(jù)的2 個(gè)特征向量進(jìn)行拼接,得到1 個(gè)向量,再將其輸入全連接層,即可得到預(yù)測(cè)的結(jié)果。
用神經(jīng)網(wǎng)絡(luò)的方法對(duì)風(fēng)電場(chǎng)的風(fēng)速進(jìn)行訓(xùn)練的過(guò)程本質(zhì)上是對(duì)式(2)中的函數(shù)f 進(jìn)行最優(yōu)的逼近,需要求解優(yōu)化問(wèn)題,而訓(xùn)練過(guò)程也就是對(duì)優(yōu)化問(wèn)題的求解過(guò)程。常見(jiàn)的機(jī)器學(xué)習(xí)優(yōu)化算法包括隨機(jī)梯度下降(stochastic gradient descent,SGD)算法、Momentum 算 法、Nesterov Momentum 算 法 以 及Adam 算法等。因?yàn)锳dam 算法能夠?qū)W(xué)習(xí)率進(jìn)行自適應(yīng)調(diào)節(jié),在眾多深度學(xué)習(xí)的任務(wù)中取得了較好的效果,本文選用Adam 算法進(jìn)行訓(xùn)練,其參數(shù)更新的具體機(jī)制可參見(jiàn)文獻(xiàn)[26]。
本文采用了中國(guó)東北某風(fēng)電場(chǎng)的實(shí)際數(shù)據(jù)作為測(cè)試算例,對(duì)所提方法進(jìn)行了測(cè)試。其中深度學(xué)習(xí)的算例在Linux 系統(tǒng)服務(wù)器集群進(jìn)行測(cè)試,采用了Pytorch 框架。
本文選取了東北某額定容量為45 MW 的風(fēng)電場(chǎng)作為測(cè)試系統(tǒng)。
測(cè)風(fēng)塔測(cè)量數(shù)據(jù)時(shí)間間隔為5 min,包含10 m風(fēng)速、10 m 風(fēng)向、50 m 風(fēng)速、50 m 風(fēng)向、70 m 風(fēng)速和70 m 風(fēng)向。NWP 數(shù)據(jù)的時(shí)間間隔為15 min,包含了溫度、動(dòng)量通量、30 m 風(fēng)向等24 個(gè)變量。采用某年1 月份的數(shù)據(jù)用于訓(xùn)練和測(cè)試,整個(gè)數(shù)據(jù)集中前80%的數(shù)據(jù)作為訓(xùn)練集,后20%的數(shù)據(jù)作為測(cè)試集。例如:測(cè)風(fēng)塔1 個(gè)月的數(shù)據(jù)共8 640 個(gè)樣本。其中前7 000 個(gè)樣本作為訓(xùn)練集,后1 640 個(gè)樣本作為測(cè)試集進(jìn)行試驗(yàn)。
因?yàn)轱L(fēng)電場(chǎng)風(fēng)速的超短期預(yù)測(cè)要求時(shí)間分辨率不低于15 min,本文采用每15 min 一個(gè)點(diǎn)的單步預(yù)測(cè)方式,分別設(shè)計(jì)了16 個(gè)模型對(duì)0~4 h 的超短期風(fēng)速進(jìn)行預(yù)測(cè)。
風(fēng)向數(shù)據(jù)的實(shí)際測(cè)量中,風(fēng)向在360°和0°之間波動(dòng),由此導(dǎo)致風(fēng)向的時(shí)序數(shù)據(jù)呈現(xiàn)出不連續(xù)的特性。因此,對(duì)風(fēng)向角度在50°以下的數(shù)據(jù)認(rèn)為是上一次波動(dòng)的結(jié)果,故在此基礎(chǔ)上增加360°,并將異常值除去。
因?yàn)轱L(fēng)速的測(cè)量具有不同的量綱,為了減少量綱和變量類型不同對(duì)預(yù)測(cè)結(jié)果的影響,采用式(7)對(duì)風(fēng)速、風(fēng)向進(jìn)行歸一化。
式中:xe為標(biāo)準(zhǔn)化之后的模型輸入數(shù)據(jù);xs為原始的輸入數(shù)據(jù);xmax和xmin分別為原始數(shù)據(jù)的最大值和最小值。
為了更加直觀有效地對(duì)預(yù)測(cè)方法進(jìn)行準(zhǔn)確評(píng)估,本文定義了4 種誤差評(píng)估指標(biāo),分別為均方根誤差、平均絕對(duì)誤差、歸一化的均方根誤差和歸一化的平均絕對(duì)誤差,其表達(dá)式分別為:
式 中:xi和? 分 別 為 真 實(shí) 值 和 預(yù) 測(cè) 值;xNi和分 別為歸一化之后的真實(shí)值和預(yù)測(cè)值;IRMSE和IMAE分別為未經(jīng)歸一化的均方根誤差和平均絕對(duì)誤差;INRMSE和INMAE分別為歸一化之后的均方根誤差和平均絕對(duì)誤差。
本部分利用時(shí)空神經(jīng)網(wǎng)絡(luò)對(duì)單個(gè)風(fēng)電場(chǎng)進(jìn)行風(fēng)速預(yù)測(cè)。經(jīng)過(guò)對(duì)模型結(jié)構(gòu)以及參數(shù)的調(diào)整,最終模型的參數(shù)如下。
1)CNN 層:CNN 中包含了3 組不同大小的卷積核。第1 組卷積核大小為3×6 向量,第2 組卷積核大小為5×6 向量,第3 組卷積核大小為7×6 向量。激活函數(shù)都為ReLu,每組包含了60 個(gè)卷積核。
2)雙向GRU 層:采用3 層的雙向GRU 網(wǎng)絡(luò),其中隱藏節(jié)點(diǎn)的數(shù)目為90 個(gè)。
3)Dropout 層:為避免過(guò)擬合,按照一定概率對(duì)網(wǎng)絡(luò)中的隱含神經(jīng)元進(jìn)行隨機(jī)丟棄,本文選用的概率為0.2。
4)全連接層:連續(xù)2 個(gè)單一神經(jīng)網(wǎng)絡(luò)的全連接層作為時(shí)空神經(jīng)網(wǎng)絡(luò)的輸出層,輸出的結(jié)果即為t 時(shí)刻風(fēng)速的預(yù)測(cè)值。
模型訓(xùn)練的時(shí)候迭代次數(shù)為100 次,并采用5 折交叉檢驗(yàn)的方式進(jìn)行驗(yàn)證。
為了驗(yàn)證本文所提方法的有效性,下面對(duì)既采用雙向GRU 網(wǎng)絡(luò)又引入了NWP 數(shù)據(jù)的時(shí)空神經(jīng)網(wǎng)絡(luò)模型(用STNN2 表示)、采用了雙向GRU 網(wǎng)絡(luò)但不考慮NWP 數(shù)據(jù)的時(shí)空神經(jīng)網(wǎng)絡(luò)(用STNN1 表示)與其他比較典型的風(fēng)速超短期預(yù)測(cè)模型的誤差進(jìn)行對(duì)比。以未來(lái)4 h 的風(fēng)速預(yù)測(cè)為例,式(8)—式(11)中定義的4 種誤差指標(biāo)的結(jié)果如表1 所示。
表1 不同預(yù)測(cè)方法的性能比較Table 1 Performance comparison of different prediction methods
表1 中,MLP,SVR,GBR,RF 和C-GRU 分 別表示多層感知器、支持向量回歸、梯度提升回歸、隨機(jī)森林和文獻(xiàn)[19]中設(shè)計(jì)的網(wǎng)絡(luò);Y 和N 分別表示考慮了不同高度、風(fēng)速、風(fēng)向相關(guān)性的模型和不考慮不同高度、風(fēng)速、風(fēng)向相關(guān)性的模型。表1 中的數(shù)據(jù)說(shuō)明,通過(guò)引入不同高度的風(fēng)速、風(fēng)向數(shù)據(jù),能夠提高預(yù)測(cè)的精度。同時(shí),時(shí)空神經(jīng)網(wǎng)絡(luò)(STNN1 和STNN2)相比于傳統(tǒng)的機(jī)器學(xué)習(xí)算法和簡(jiǎn)單的CNN 以及LSTM 網(wǎng)絡(luò)具有更高的預(yù)測(cè)性能。而且通過(guò)在STNN1 中增加NWP 的信息,STNN2 能夠進(jìn)一步地提升預(yù)測(cè)的精度。
在超短期預(yù)測(cè)中,3~4 h 的預(yù)測(cè)精度往往比1 h以內(nèi)的精度更難以提升。 圖4 比較了CNN,LSTM,SVR,GBR,RF,MLP,C-GRU,STNN1,STNN2 在不同預(yù)測(cè)時(shí)間下的性能。
由圖4 可見(jiàn),各方法的預(yù)測(cè)誤差都隨著預(yù)測(cè)時(shí)間的增加而增加。但是,計(jì)及了NWP 信息的時(shí)空神經(jīng)網(wǎng)絡(luò)STNN2 在各個(gè)時(shí)段的預(yù)測(cè)性能均優(yōu)于其他預(yù)測(cè),且誤差增長(zhǎng)較慢,因此可以說(shuō)明本文在對(duì)數(shù)據(jù)的輸入維度和預(yù)測(cè)方法層面進(jìn)行改進(jìn)后,能夠有效提升預(yù)測(cè)精度。本文也對(duì)NWP、實(shí)測(cè)風(fēng)速的誤差以及對(duì)預(yù)測(cè)性能的影響做了分析,詳細(xì)結(jié)果可參見(jiàn)附錄A。當(dāng)前實(shí)驗(yàn)結(jié)果中NWP 與實(shí)測(cè)風(fēng)速誤差在1.9~2.7 m/s 之間??梢?jiàn),本文算法得到的風(fēng)速預(yù)測(cè)誤差比NWP 的誤差降低了大約1 m/s。
圖4 預(yù)測(cè)誤差隨時(shí)間變化圖Fig.4 Variation diagram of prediction error with different time scales
CNN 的預(yù)測(cè)性能和Adam 算法中學(xué)習(xí)率初始值、隱藏層數(shù)目及GRU 層數(shù)等參數(shù)緊密相關(guān)。通過(guò)分析可以發(fā)現(xiàn),學(xué)習(xí)率對(duì)預(yù)測(cè)結(jié)果的影響較大,而隱藏層數(shù)目和GRU 層數(shù)對(duì)預(yù)測(cè)結(jié)果的影響較小。從整體上來(lái)說(shuō),包含了NWP 數(shù)據(jù)的預(yù)測(cè)模型的預(yù)測(cè)性能在各種參數(shù)下的預(yù)測(cè)性能均優(yōu)于不含NWP 數(shù)據(jù)的情形。模型參數(shù)的靈敏度分析結(jié)果見(jiàn)附錄B。
考慮到預(yù)測(cè)精度與輸入數(shù)據(jù)的時(shí)間長(zhǎng)度緊密關(guān)聯(lián),本文選取了不同長(zhǎng)度的數(shù)據(jù)對(duì)風(fēng)電場(chǎng)的風(fēng)速進(jìn)行預(yù)測(cè)。歷史數(shù)據(jù)的輸入數(shù)據(jù)的時(shí)間長(zhǎng)度分別為20、30 和40(即100,150,200 min),NWP 數(shù) 據(jù) 的時(shí)間長(zhǎng)度固定為20(即100 min)。以未來(lái)3 h 的風(fēng)速預(yù)測(cè)為例,表2 給出了輸入數(shù)據(jù)長(zhǎng)度與預(yù)測(cè)誤差的關(guān)系。
由表2 的結(jié)果可以看出,在不同的輸入數(shù)據(jù)長(zhǎng)度下,計(jì)及NWP 信息的時(shí)空神經(jīng)網(wǎng)絡(luò)STNN2 的預(yù)測(cè)模型的精度均高于其他幾種預(yù)測(cè)模型。而且隨著輸入數(shù)據(jù)的長(zhǎng)度增加,預(yù)測(cè)精度逐漸提升。但在實(shí)際操作過(guò)程中,當(dāng)輸入數(shù)據(jù)的長(zhǎng)度為20 時(shí),訓(xùn)練耗時(shí)為839.48 s。當(dāng)輸入數(shù)據(jù)的長(zhǎng)度為40 時(shí),訓(xùn)練耗時(shí)為2 133.10 s。鑒于訓(xùn)練模型并不需要頻繁更新,這一速度基本能滿足要求。
表2 不同預(yù)測(cè)方法在不同輸入數(shù)據(jù)長(zhǎng)度下的性能比較Table 2 Performance comparison of different prediction methods with different lengths of input data
本文提出了一種基于時(shí)空神經(jīng)網(wǎng)絡(luò)的超短期風(fēng)速預(yù)測(cè)方法。算例分析表明,該方法能夠充分利用不同高度的風(fēng)速、風(fēng)向數(shù)據(jù)和NWP 數(shù)據(jù)中的時(shí)空相關(guān)性,有效提升了風(fēng)電場(chǎng)超短期風(fēng)速預(yù)測(cè)的精度。
在后續(xù)的研究中,將把該時(shí)空網(wǎng)絡(luò)拓展到多風(fēng)電場(chǎng)風(fēng)速預(yù)測(cè)的研究中,以進(jìn)一步提升預(yù)測(cè)的精度。
附錄見(jiàn)本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。