馮惠麗
(中國大唐集團(tuán)科學(xué)技術(shù)研究總院有限公司,北京 100000)
隨著化石能源的枯竭,可再生能源的開發(fā)已經(jīng)引起了全世界的廣泛關(guān)注。由于風(fēng)能無污染、分布廣等優(yōu)點(diǎn),風(fēng)力發(fā)電技術(shù)近年來發(fā)展迅速。然而,風(fēng)能的間歇性和波動(dòng)性將極大地影響電力系統(tǒng)的安全性和穩(wěn)定性。因此,準(zhǔn)確可靠的風(fēng)電功率預(yù)測對(duì)于促進(jìn)合理的電力調(diào)度和安排停機(jī)維護(hù)以保證電力系統(tǒng)的穩(wěn)定運(yùn)行至關(guān)重要[1-2]。
一般來說,根據(jù)預(yù)測范圍,風(fēng)電功率預(yù)測可以分為4 種類型:超短期、短期、中期、長期[3]。超短期風(fēng)電功率預(yù)測旨在保證電網(wǎng)實(shí)時(shí)穩(wěn)定調(diào)度和高質(zhì)量供電。短期預(yù)測的目的是制定發(fā)電計(jì)劃,安排區(qū)域調(diào)度,調(diào)整檢修計(jì)劃。中長期預(yù)測主要服務(wù)于對(duì)預(yù)測精度要求不高的風(fēng)電機(jī)組和輸電線路的維護(hù)計(jì)劃。為了滿足風(fēng)電功率預(yù)測的不同需求,研究開發(fā)了多種預(yù)測模型。一般來說,這些預(yù)測方法可以分為2 類:物理方法、統(tǒng)計(jì)方法。前一類方法主要依靠數(shù)值天氣預(yù)報(bào)(NWP)信息,這通常適用于中長期風(fēng)電功率預(yù)測[4]。相反,統(tǒng)計(jì)方法試圖基于歷史時(shí)間序列數(shù)據(jù)開發(fā)經(jīng)驗(yàn)?zāi)P?,適用于超短期及短期預(yù)測的數(shù)據(jù)驅(qū)動(dòng)模型。其中每種風(fēng)電功率預(yù)測類型又分為點(diǎn)預(yù)測和概率預(yù)測,點(diǎn)預(yù)測常見統(tǒng)計(jì)模型主要基于自回歸綜合移動(dòng)平均法(ARⅠMA)[5]、人工神經(jīng)網(wǎng)絡(luò)(ANN)[6]和卡爾曼濾波器[7]等。但點(diǎn)預(yù)測方法側(cè)重于未來某個(gè)時(shí)間點(diǎn)的預(yù)報(bào),而不考慮預(yù)測不確定性的估計(jì)。而概率預(yù)測模型還可以提供預(yù)測的置信區(qū)間,適用性越來越強(qiáng)[8]。
本文基于貝葉斯神經(jīng)網(wǎng)絡(luò),結(jié)合LSTM 提取時(shí)序數(shù)據(jù)特征的優(yōu)勢,構(gòu)建了貝葉斯LSTM 網(wǎng)絡(luò),通過多種仿真實(shí)驗(yàn)可知,本文所提方法具有較好的概率預(yù)測效果。
對(duì)于依賴于新輸入樣本x及權(quán)重W有輸出y(x;W)的神經(jīng)網(wǎng)絡(luò)模型來進(jìn)行回歸預(yù)測時(shí),其參數(shù)積分如下:
式(2)中:P(W|D)為權(quán)重的后驗(yàn)分布。
設(shè)P(W)是在取得訓(xùn)練數(shù)據(jù)前對(duì)神經(jīng)網(wǎng)絡(luò)權(quán)重W的先驗(yàn)分布,那么定義如下正則化器:
則基于貝葉斯規(guī)則并結(jié)合式(2)(3)可得:
式(4)中:const 為常數(shù)。
另貝葉斯神經(jīng)網(wǎng)絡(luò)回歸預(yù)測模型的總誤差函數(shù)為U(W)=E(W)+R(W),則可依式(4)得:
式(5)中:Z為歸一化常參數(shù)。
將式(5)與式(2)合并可得:
則神經(jīng)網(wǎng)絡(luò)的預(yù)測變?yōu)閷?duì)式(6)的計(jì)算,可式(6)沒法直接求得其解析解,需要借助諸如馬爾科夫鏈蒙特卡洛(MCMC)等數(shù)值積分近似法來解。
假設(shè)馬爾可夫鏈具有遍歷性,那么通過在此鏈上的大量采樣所趨于的穩(wěn)定分布便能夠表征式(5)的后驗(yàn)概率分布。用結(jié)果馬爾可夫鏈上的樣本序列{Wt},則針對(duì)式(6)積分的近似計(jì)算式如下:
式(7)中:n0為為保證收斂性而舍棄的一些初始馬爾可夫鏈;ns為平衡后驗(yàn)分布的權(quán)重向量樣本數(shù)。
LSTM 是目前機(jī)器學(xué)習(xí)領(lǐng)域中廣泛使用的深度學(xué)習(xí)方法,由 HOCHREⅠTER 等[9]在 1997 年提出。LSTM是專門用于處理時(shí)間序列數(shù)據(jù)的深度學(xué)習(xí)模型,其在網(wǎng)絡(luò)模型中加入門控制器,可以解決RNN 中的長期依賴問題(梯度爆炸或消失),結(jié)構(gòu)如圖1 所示。
圖1 LSTM 結(jié)構(gòu)圖
LSTM 模型在原有的短期記憶單元ht的基礎(chǔ)上,增加一個(gè)記憶單元ct來保持長期記憶,同時(shí)增加3 個(gè)門控機(jī)制來控制整個(gè)學(xué)習(xí)過程中的信息流。LSTM 單元在每個(gè)時(shí)間步長t的狀態(tài)被定義為一組5 個(gè)向量Rd:輸入門it、遺忘門ft、輸出門ot、隱藏狀態(tài)ht、存儲(chǔ)單元ct。d是LSTM 單位的數(shù)量。LSTM 傳遞函數(shù)為:
式(8)中:σ為sigmoid 函數(shù);W和b為權(quán)重和偏置參數(shù);xt為當(dāng)前輸入。
遺忘門控制從存儲(chǔ)單元?jiǎng)h除不需要的信息,而輸入門控制向存儲(chǔ)單元添加新信息,輸出門控制內(nèi)部存儲(chǔ)狀態(tài)的暴露。通過3 個(gè)門,存儲(chǔ)單元ct可以選擇性地更新、刪除和遺忘內(nèi)部信息,從而更好地理解序列中的長期依賴性,提取時(shí)序數(shù)據(jù)中隱藏特征。
本文利用上述LSTM 網(wǎng)絡(luò)處理風(fēng)電功率歷史運(yùn)行數(shù)據(jù),提取時(shí)序數(shù)據(jù)關(guān)聯(lián)特征,隨后將學(xué)習(xí)的趨勢特征送入貝葉斯神經(jīng)網(wǎng)絡(luò),構(gòu)建了貝葉斯LSTM 預(yù)測模型。
風(fēng)電功率與多種因素相關(guān),包括歷史風(fēng)電功率、各氣象因素,如風(fēng)速、風(fēng)向、溫度以及氣壓等。但各因素對(duì)風(fēng)電功率預(yù)測的影響程度不一樣,如果把所有因素均送入深度學(xué)習(xí)網(wǎng)絡(luò),一方面造成模型結(jié)構(gòu)復(fù)雜、參數(shù)眾多,效率也會(huì)較低,同時(shí)與風(fēng)電功率相關(guān)性較低的因素的加入對(duì)預(yù)測模型來說是一種噪聲干擾,會(huì)帶來負(fù)面影響,從而降低模型的預(yù)測精度。因此,需要對(duì)風(fēng)電數(shù)據(jù)集進(jìn)行相關(guān)性分析,剔除價(jià)值小的因素,同時(shí)也可降低數(shù)據(jù)維度。
本文采用Pearson 相關(guān)系數(shù)法計(jì)算風(fēng)電歷史數(shù)據(jù)集中不同因素與當(dāng)前時(shí)刻風(fēng)電功率的相關(guān)程度,其中二維變量的Pearson 相關(guān)系數(shù)計(jì)算公式如式(9)所示:
通過Pearson 相關(guān)計(jì)算分析,比較前一時(shí)刻的各個(gè)因素與下一個(gè)時(shí)刻風(fēng)電功率的相關(guān)性大小,選取合適的輸入變量。相關(guān)性分析結(jié)果如表1 所示。
表1 各因素與光伏功率的Person 相關(guān)系數(shù)
從表1 可知,各氣象因素與風(fēng)電功率的Person 相關(guān)系數(shù)由大到小分別是風(fēng)速、風(fēng)向、溫度和氣壓,也即風(fēng)速和風(fēng)向與風(fēng)電功率相關(guān)性最高,均大于0.5。
為了最大程度平衡訓(xùn)練精度和訓(xùn)練效率的關(guān)系,本文最終將Person 相關(guān)系數(shù)較高的前兩種氣象因素,風(fēng)速和風(fēng)向作為風(fēng)電功率貝葉斯神經(jīng)網(wǎng)絡(luò)預(yù)測模型最終的輸入變量,同時(shí),如前文所述,通過LSTM 對(duì)風(fēng)電歷史運(yùn)行數(shù)據(jù)進(jìn)行特征構(gòu)建后亦作為輸入喂給貝葉斯神經(jīng)網(wǎng)絡(luò)。
本文采用了2 種常用的概率評(píng)分方法。一個(gè)是彈球(pinball)失分,可以綜合表示可靠性和銳度,另一個(gè)是Winkler 評(píng)分,可以表示預(yù)測區(qū)間的銳度和無條件覆蓋度。
pinball 失分是對(duì)任何分位數(shù)q∈(0,1)的加權(quán)絕對(duì)誤差度量,可表述為:
概率預(yù)測的總體彈球損失分?jǐn)?shù)可以通過累積預(yù)測范圍內(nèi)所有目標(biāo)分位數(shù)的彈球損失來獲得。彈球損失越低,預(yù)測效果越好。
對(duì)于(1-α)×100%置信水平,Winkler 得分定義為:
式(11)中:δ=Ui-Li為區(qū)間寬度;Li和Ui分別為預(yù)測區(qū)間的下界和上界。
如果實(shí)際功率值落入預(yù)測區(qū)間,那么Winkler 分?jǐn)?shù)僅取決于預(yù)測區(qū)間寬度。否則,由于懲罰因子,分?jǐn)?shù)會(huì)很高。分?jǐn)?shù)越低,表示預(yù)測效果越好。
風(fēng)力發(fā)電數(shù)據(jù)集取自2017 年至2019 年26 311 h的ERCOT 每小時(shí)總風(fēng)力輸出[10]。數(shù)據(jù)顯示了德克薩斯州所有風(fēng)力發(fā)電機(jī)的總輸出功率??傃b機(jī)風(fēng)力發(fā)電量從16 246 MW 增加到22 607 MW,最大風(fēng)力輸出為19 099 MW。負(fù)荷的最大風(fēng)力輸出百分比為54.6%,出力百分比變化最大為280.6%。在26 311 h 的數(shù)據(jù)中,70%、10%和20%的部分分別用于訓(xùn)練、驗(yàn)證和測試集。
為了測試本文所述網(wǎng)絡(luò)的實(shí)際可行性和優(yōu)越性,本文分別在80%和90%兩種置信水平下進(jìn)行了光伏功率概率預(yù)測,并在80%置信水平下,與正態(tài)分布法和持續(xù)區(qū)間預(yù)測法進(jìn)行了對(duì)比驗(yàn)證。
80%置信水平下預(yù)測區(qū)間如圖2 所示,90%置信水平下預(yù)測區(qū)間如圖3 所示。從圖2 和圖3 可知,基于貝葉斯LSTM 神經(jīng)網(wǎng)絡(luò)的風(fēng)電概率預(yù)測模型可及時(shí)對(duì)功率波動(dòng)作出響應(yīng),給出下一預(yù)測點(diǎn)功率可能的波動(dòng)范圍,且準(zhǔn)確率較高。
圖2 80%置信水平風(fēng)電功率概率預(yù)測
圖3 90%置信水平風(fēng)電功率概率預(yù)測
不同算法風(fēng)電功率預(yù)測區(qū)間對(duì)比示意圖如4所示。風(fēng)電概率預(yù)測性能對(duì)比如表2 所示。
結(jié)合圖4 以及表2 可知,將本文方法與正態(tài)分布法及持續(xù)區(qū)間預(yù)測法進(jìn)行對(duì)比,從表2 的pinball 指標(biāo)和Winkler 指標(biāo)可知,本文所提方法的預(yù)測效果更好。
圖4 不同算法風(fēng)電功率預(yù)測區(qū)間對(duì)比示意圖
表2 風(fēng)電概率預(yù)測性能對(duì)比
針對(duì)風(fēng)電功率確定性點(diǎn)預(yù)測無法對(duì)風(fēng)電功率波動(dòng)進(jìn)行預(yù)測的問題。本文基于貝葉斯神經(jīng)網(wǎng)絡(luò),結(jié)合LSTM 提取時(shí)序數(shù)據(jù)關(guān)聯(lián)特征的特有優(yōu)勢,構(gòu)建了貝葉斯LSTM 預(yù)測模型。并以皮爾森相關(guān)系數(shù)法對(duì)影響風(fēng)電功率預(yù)測的復(fù)雜氣象輸入因素進(jìn)行了相關(guān)性計(jì)算,剔除了與風(fēng)電功率相關(guān)性低的因子,降低了輸入維度和輸入噪聲,最后以降維后的氣象因子以及LSTM 處理后的功率歷史時(shí)序數(shù)據(jù)為最終輸入,通過80%和90%兩種置信度下的預(yù)測仿真以及與正太分布法和持續(xù)區(qū)間預(yù)測法的對(duì)比驗(yàn)證,可知本文能更好地對(duì)風(fēng)電功率波動(dòng)性進(jìn)行預(yù)測。