王麗杰,唐宏芬,張真真,張路娜
(中國大唐集團新能源科學技術研究院有限公司,北京 100052)
近年來,風力發(fā)電機在全球范圍內得到大量推廣,在滿足電力需求降低電價的同時減少了溫室氣體的排放,極大的推動了全球綠色能源可持續(xù)發(fā)展的進程。預計未來風力發(fā)電量將繼續(xù)增加,以實現(xiàn)2030年可再生能源占總發(fā)電量50%的能源目標[1]。但是如果沒有采取適當?shù)拇胧?,如電力精準預測、建立儲能系統(tǒng)等,那么風力發(fā)電的性能劣化可能會嚴重破壞供電可靠性、安全性和經濟性[2]。建立儲能系統(tǒng)雖然可以起到降低風力發(fā)電性能劣化的作用,但是在處理過程中所需面臨的環(huán)境問題、土地使用問題以及費用問題極大的增加了投入成本。發(fā)電功率預測模型是一種環(huán)保經濟的解決方案,可以協(xié)助管理部門對風電機組的運行狀態(tài)進行評價判斷。當風電機組出現(xiàn)發(fā)電性能劣化時,發(fā)出預警并提醒工作人員關注風電機組運行狀態(tài),同時指導維護人員完成相關設備維護,杜絕發(fā)電性能劣化的持續(xù)發(fā)生,保證風電機組發(fā)電效率,有效提高風電機場的運行水平[3]。
目前,風電機組發(fā)電性能判斷主要依賴發(fā)電功率曲線進行判斷。具體而言,通過設備采集到的運行數(shù)據(jù),建立機組發(fā)電功率曲線模型,并通過該模型實時監(jiān)測風電機組發(fā)電功率變化,準確發(fā)出風電機組性能劣化預警[4]。然而,由于自然環(huán)境中的風速具有非線性特征且有高變化率,且大氣溫度和壓力等也會影響風電機組發(fā)電功率,使得發(fā)電功率預測模型準確性較差[5]?,F(xiàn)階段,還沒有典型的風電功率預測模型。因此如何通過提前調度來提取特征和建立準確預測發(fā)電功率的模型以確保電力系統(tǒng)可靠、安全運行成為國內外專家研究的重點。
預測風電機組發(fā)電功率的預測方法有很多,包括物理模型、統(tǒng)計模型、混合人工神經網(wǎng)絡模型等[6-7]。物理模型方法主要在考慮初始值和邊界條件的基礎上通過物理和大氣的水動力和熱力學模型進行預測,該方法的發(fā)電功率預測性能較差[8-9]。常見的統(tǒng)計學方法如概率自回歸模型和概率質量偏差模型等,可建立風力發(fā)電與解釋變量之間的關系,但該方法存在適應性和學習能力較差的問題,并其性能隨著預測時間段的增加而降低[10-11]。人工神經網(wǎng)絡具有映射非線性關系、自學習能力強等優(yōu)點,在風力發(fā)電預測中得到廣泛的應用[12-14]。該技術的主要優(yōu)點是不需要任何數(shù)學模型來建立輸入和輸出數(shù)據(jù)之間的關系,雖然人工神經網(wǎng)絡在預測風力發(fā)電功率方面表現(xiàn)出了良好的性能,但它也存在著模型過擬合和欠擬合的問題以及在更新隱藏層權重和偏差方面效率低下[15]。針對這些缺點,Lu等提出了一種使用支持向量機(Support Vector Machine,SVM)算法預測短期風電發(fā)電功率的框架,即在支持向量機模型中采用灰狼算法調整核函數(shù)的參數(shù)[16]。Li等提出了一種支持向量機與改進蜻蜓算法相結合的風力發(fā)電預測模型,其中采用自適應學習因子和微分進化方法改進的蜻蜓算法,對支持向量機的參數(shù)進行優(yōu)化選擇[17]。
深度學習模型因其具備較高預測準確性,且能克服傳統(tǒng)神經網(wǎng)絡缺點如訓練時間長和收斂速度慢等而受到國內外學者的廣泛關注。Abedinia 等提出了一種二維卷積神經網(wǎng)絡(Convolutional Neural Network,CNN),用于預測短期和長期風力發(fā)電功率,其中小波變換方法用于分解數(shù)據(jù),粒子群優(yōu)化算法用于調整CNN的權重以提高模型的預測精度[18]。
Li等通過使用梯度下降法訓練LSTM(long short-term memory,LSTM)神經網(wǎng)絡來預測短期風力發(fā)電功率[19]。Sun等提出了一種由LSTM、小波分解和主成分分析法組成的超短期概率預測方法,通過建立正態(tài)分布模型以解釋預測中的不確定誤差[20]。Wang等設計了一種貝葉斯平均和集合學習的混合模型來預測短期風電機組發(fā)電功率[21]。Niu等提出了一種基于注意力的門控循環(huán)單元(Attention-based Gated Recurrent Unit,AGRU),并開發(fā)一種識別基本輸入變量的注意力機制作為功能選擇方法用于預測短期風力發(fā)電功率[22]。
He等通過小波變換分解風速序列,并使用深度置信網(wǎng)絡提取特征,開發(fā)了深度學習和集成學習的組合以預測風力發(fā)電功率。然而,通過機器學習等方法建立的風電機組發(fā)電功率預測模型需要通過大量數(shù)據(jù)進行訓練,其中輸入數(shù)據(jù)為監(jiān)測系統(tǒng)采集到的影響發(fā)電功率和性能的相關因素[23]。郭鵬等基于風電機組的運行原理,分析了環(huán)境因素、變槳系統(tǒng)、偏航系統(tǒng)和控制系統(tǒng)對風電機組性能和發(fā)電功率的影響[24]。謝生清等在上述研究基礎上對風向標、風速儀、葉片機械對零等幾個影響發(fā)電功率的外部因素進行了分析總結[25]。馬東等考慮了風速、槳距角、偏航誤差、葉輪轉速等其他變量對發(fā)電功率的影響[5]。但是上述文獻并沒有將影響風電機組發(fā)電功率的所有因素全部考慮進去,因此構建的發(fā)電功率預測模型存在一定偏差。
綜上所述,現(xiàn)有文獻針對風電機組發(fā)電功率預測模型的研究存在以下問題:預測輸入變量種類多需求量大,同時這些變量需要進行預測,導致附加誤差;通過公式將預測風速轉換為風力發(fā)電功率時會導致累積誤差;由于技術局限性,無法使用數(shù)據(jù)分解技術處理大量數(shù)據(jù)如季節(jié)性影響的數(shù)據(jù);忽略預測模型的參數(shù)調整等。
針對現(xiàn)有預測模型的局限性,本文設計了一種新型混合深度學習預測模型提高對風電機組發(fā)電功率的預測準確性。該預測模型由卷積層(convolution layers),門控循環(huán)單元(gated recurrent units,GRU)和神經網(wǎng)絡(neural network)組成,首先通過卷積層提取復雜數(shù)據(jù)集的高維特征,然后使用這些特征訓練門控循環(huán)單元以獲取基本特征的長期存儲,最后通過神經網(wǎng)絡建立由前一層處理的輸出和輸入數(shù)據(jù)集之間的關系。新型混合深度學習預測模型的參數(shù)通過網(wǎng)格搜索技術進行系統(tǒng)調整,以提高預測準確性。
傳統(tǒng)風力發(fā)電功率預測模型中,首先需要通過其他預測方法對影響風力發(fā)電功率的影響因素如風速,風向,氣溫,氣壓數(shù)據(jù)等進行預測估計,然后依據(jù)這些預測數(shù)據(jù)通過預測模型對發(fā)電功率進行預測,因此會導致更多的預測誤差。本文設計的基于混合深度學習預測模型通過時間序列法預測風力發(fā)電功率,不需要對影響風力發(fā)電功率的影響因素進行先驗預測,只需要通過分析過去數(shù)據(jù)的模式來預測風力發(fā)電量。時間序列法中X=x1,x2,……xt是一段時間范圍內的觀察序列,其中表示在時間t處的觀察數(shù)據(jù)值,X表示觀察數(shù)值的總數(shù)目?;旌仙疃葘W習模型的輸入和輸出數(shù)據(jù)集通過滑動窗口方法從時序數(shù)據(jù)中獲得,如圖1所示。其中,Sw代表滑動窗口,fh代表預測范圍區(qū)間,d(t)代表在時間t處的時間序列,Y代表輸出數(shù)據(jù)。在滑動窗口范圍內的時間序列作為模型的輸入數(shù)據(jù),預測范圍區(qū)間內的數(shù)據(jù)為輸出數(shù)據(jù),滑動窗口每次移動一個單位時間步長。圖1展示了用于訓練和測試模型的數(shù)據(jù)集,其中n代表輸出數(shù)據(jù)集中的時間步長。
圖1 滑動窗口方法獲取數(shù)據(jù)
混合深度學習模型架如圖2所示。
圖2 混合深度學習模型框架
卷積神經網(wǎng)絡CNN由卷積層,池化層和全連接層組成,具有捕獲相同數(shù)據(jù)模式的能力,可以成功用于復雜較高的數(shù)據(jù)格式。CNN主要用于的網(wǎng)格狀拓撲結構,例如視覺圖像的二維或三維數(shù)據(jù),但同時它也可用于一維的數(shù)據(jù),例如作為單變量時間序列數(shù)據(jù)。在本文中,一維CNN用于提取短期風力發(fā)電的非線性輸入和輸出數(shù)據(jù)集之間復雜關系的特征。
卷積層的功能是通過數(shù)學卷積算子和求解交叉相關對輸入數(shù)據(jù)進行特征提取,卷積運算公式如下:
(1)
在卷積層進行特征提取后,輸出的特征圖會被傳遞至池化層(pooling layer)進行特征選擇和信息過濾,通過將混合一層的神經元簇輸出到下一層中的單個神經中來減小數(shù)據(jù)的大小。
池化層包含預設定的池化函數(shù),其功能是將特征圖中單個點的結果替換為其相鄰區(qū)域的特征圖統(tǒng)計量。上一層中每個神經元簇的最大值用于最大池,而神經元簇的平均值用于平均池,在本文基于深度學習模型中使用平均池。每個特征圖都分類為一組子區(qū)域,并且每個子區(qū)域通過下采樣進行組合以生成新元素。通過順序向下采樣可以創(chuàng)建一個新的低維特征圖,其表示如下:
(2)
GRU由Kyunghyun Cho在2014年提出的循環(huán)網(wǎng)絡的門控機制,是LSTM的簡化版本。GRU解決了梯度消失的問題,即長期依賴關系中的梯度傳播失敗,類似于LSTM模型,但參數(shù)較少。GRU網(wǎng)絡的主要思想是利用具有簡單結構的特定神經元在長時間內存儲和傳輸信息,以獲得永久性記憶,減少信息破壞的速度,捕獲長期依賴性。在GRU架構,只有兩個柵極,復位柵極和更新柵極,如圖2中所示。數(shù)學建模可以表示如下:
zt=σ(Wzg[ht-1,xt]+bz)
(3)
rt=σ(Wrg[ht-1,xt]+br)
(4)
(5)
(6)
通過使用輸入和輸出數(shù)據(jù)集訓練網(wǎng)絡來執(zhí)行這些操作,從而建立它們之間的關系。提供輸入數(shù)據(jù)后,將經過訓練的網(wǎng)絡用作預測輸出的模型。在訓練中,網(wǎng)絡會更新其權重以盡可能準確地了解這種關系。為了學習輸入和輸出數(shù)據(jù)之間的復雜關系,本研究使用ReLU激活函數(shù)來簡化訓練并獲得更好的性能。
對于任何大于零的值,ReLU都是線性的,但是對于任何負值,ReLU仍然是非線性的。由于該函數(shù)對于任何正值都是線性的,因此在使用反向傳播訓練網(wǎng)絡期間,可以輕松更新其權重。
本節(jié)通過分析預測風力發(fā)電功率來驗證混合深度學習模型的預測結果以及對風電機組發(fā)電性能劣化的預警情況。首先,對混合深度學習網(wǎng)絡的超參數(shù)調整,以確定最佳預測模型。通過網(wǎng)格搜索方法,從可能的參數(shù)設置中選擇最佳參數(shù)。然后,針對同樣的算例,對比不同預測方法LSTM、SVM、GRU、RNN下的預測結果,通過對比預測結果驗證本文所提模型的有效性。預測模型和算例實驗在處理器Intel Core i7 9th,主頻3.00 GHz,內存16 G的測試平臺上進行,編程語言環(huán)境為Python 3.7。
由于SCADA數(shù)據(jù)取自實際風電場,這些數(shù)據(jù)容易受到噪聲,異常值和丟失數(shù)據(jù)的影響,進而影響到模型的準確度。通信失敗是丟失數(shù)據(jù)的主要原因,數(shù)據(jù)的異常值被簡單地刪除并視為缺失值。
缺失值:風力發(fā)電的缺失值由缺失數(shù)據(jù)的前三個和下一個時間步的平均值填充;
數(shù)據(jù)轉換:由于通過捕獲風電機組發(fā)電記錄的數(shù)據(jù)種類繁多,存在不同種類數(shù)據(jù)描述風電機組同一個屬性特征的情況,首先要將關于風電機組同一屬性特征的不同種類數(shù)據(jù)進行合并,在降低數(shù)據(jù)維度的同時可以得到更為全面的數(shù)據(jù)信息。故首先通過數(shù)據(jù)聚合技術對捕獲的數(shù)據(jù)樣本進行數(shù)據(jù)聚合。然后對聚合后的數(shù)據(jù)進行歸一化處理,以消除參數(shù)間不同數(shù)量級對機器學習模型的差異性影響。
數(shù)據(jù)結構:為了在接下來的步驟中預測風電場的風力發(fā)電功率,通過使用移動窗口方法將輸入時間序列轉換為輸入-輸出對,將數(shù)據(jù)分為輸入和輸出格式,如下所示:
[xt+1,xt+2,…,xt+h]=f(xt,xt-1,…,xt-w)
(8)
式中:w輸入數(shù)據(jù)的窗口大??;xt時間序列數(shù)據(jù);h預測范圍;f通過訓練建立的深度學習模型。
通過網(wǎng)格搜索方法對混合深度學習模型進行的調整,以實現(xiàn)風力發(fā)電預測的最佳預測模型。由于混合深度學習模型是隨機的,需要對模型進行多次評估以獲得在預測方面的可靠配置,本文在校驗參數(shù)時進行10次評估,并選擇樣本結果的中位數(shù)作為參數(shù)的最佳配置的標準。通過算例實驗得出各個超參數(shù)的最佳標準:GRU層2層,神經網(wǎng)絡層2層,卷積層中卷積核大小為3,過濾器尺寸為64。
通過使用平均絕對誤差(Mean Absolute Error,MAE)指標對所提出模型的性能進行不同預測方法對比評價。MAE是指實際值和預測值之間的絕對誤差的平均值,MAE可用作性能指標,可以避免數(shù)據(jù)集中的異常值(極值)的影響,MAE的較小值表示預測的準確性較高。
(9)
收集某地風電機場的1個自然年的數(shù)據(jù)樣本用于訓練和測試預測模型,樣本時間間隔為5min,其中95%的數(shù)據(jù)用于訓練預測模型,剩余5%的數(shù)據(jù)用于測試所提模型的有效性。該預測模型在5%數(shù)據(jù)下的測試結果如圖3所示。
圖3 模型預測結果
其中圖3(a)是整體預測結果,圖3(b)是為進一步清晰展示預測結果,截取第600~1000的樣本數(shù)據(jù)及其預測結果??梢钥闯鲱A測值接近實際值,且在圖所示的預測數(shù)據(jù)中存在幾個峰值之后,預測值的誤差也非常低。在預測測試數(shù)據(jù)時,預測值與實際值之間的平均絕對差為2.48,同時也沒有出現(xiàn)過度擬合和擬合不足的問題。
在本節(jié)中通過預測某地風電場的風力發(fā)電功率,進一步評估了預測模型對風電機組發(fā)電性能劣化判斷的可行性。選取實驗機組為期1年的數(shù)據(jù)并對數(shù)據(jù)進行預處理。其中95%的數(shù)據(jù)用于訓練預測模型,5%的數(shù)據(jù)用于測試驗證。通過與對比預測模型LSTM、SVM、GRU、RNN進行比較,可以得到MAE性能指標的結果,如圖4所示。
從圖4可知,LSTM模型的MAE指數(shù)為2.34,GRU模型的MAE指數(shù)為2.35,SVM模型的MAE指數(shù)為2.37,RNN模型的MAE指數(shù)為2.37,而本文所提預測模型的MAE指數(shù)為2.32,性能最好。
圖4 不同預測模型預測結果比較
圖5展示了本文所提預測模型對該地風電機組發(fā)電功率的預測曲線與實際發(fā)電功率曲線。
圖5 基于混合深度學習預測模型預測結果
通過觀察圖5中(a)圖可得:在統(tǒng)計數(shù)據(jù)時間剛開始時,發(fā)電機組運行正常,預測模型預測發(fā)電功率數(shù)據(jù)與實際發(fā)電功率數(shù)據(jù)高度吻合,但是存在部分時段實際發(fā)電功率數(shù)據(jù)與預測發(fā)電功率數(shù)據(jù)出現(xiàn)偏差,將圖5(a)中虛線框內的偏差數(shù)據(jù)結果放大如圖5中(b)圖所示,此時預測數(shù)值大于實際數(shù)值。
同時對該部分樣本數(shù)據(jù)進行統(tǒng)計指數(shù)加權移動平均值控制圖法(Exponentially Weighted Moving-Average,EWMA)殘差分析[5]可以得出此時超出EWMA控制圖的上下控制限,如圖6所示。
圖6 EWMA殘差分析
WMA統(tǒng)計量在該時間段內出現(xiàn)多次持續(xù)超過控制圖下限,則此時說明發(fā)電機組出現(xiàn)性能劣化情況,系統(tǒng)發(fā)出警報。風電機組維護小組維護后,實際發(fā)電功率數(shù)據(jù)與預測發(fā)電功率數(shù)據(jù)重新高度吻合,此時風電機組性能得到恢復。
(1)提出了一種新型混合深度學習模型預測風電機組發(fā)電功率,該模型由卷積層,門控循環(huán)單元層和神經網(wǎng)絡層組成。卷積層提取數(shù)據(jù)特征,門控循環(huán)單元將信息保留在內存中,提高了預測準確性。通過風電場中實際風力發(fā)電的數(shù)據(jù)樣本對預測模型進行訓練和測試,系統(tǒng)地調整預測模型的參數(shù),確保了預測模型的準確度。最后通過對比其他現(xiàn)有文獻的預測模型,驗證了本文所提預測模型的有效性。
(2)未來將考慮不同的大氣條件的情況下,將短期風電功率預測的準確性與短期風能預測的準確性進行比較,進一步研究混合模型的有效性。