辛 征,王 琦,劉興然
(山東建筑大學(xué)信息與電氣工程學(xué)院,山東 濟(jì)南 250101)
近年來,隨著化石能源的短缺和環(huán)境問題的日益嚴(yán)重,清潔能源發(fā)電的規(guī)模迅速擴(kuò)大。風(fēng)力發(fā)電以其清潔、經(jīng)濟(jì)、可持續(xù)發(fā)展的優(yōu)點(diǎn),已成為最重要的可再生能源發(fā)電方式之一。截至2021年底,全球風(fēng)能總裝機(jī)容量超過837 GW,2021 年全球風(fēng)能總裝機(jī)容量為93.6 GW[1]。雖然風(fēng)力發(fā)電技術(shù)越來越成熟,但由于風(fēng)力發(fā)電[2]的間歇性、隨機(jī)性和不確定性,影響了風(fēng)力發(fā)電以及電網(wǎng)的穩(wěn)定性、安全性和經(jīng)濟(jì)性。同時,風(fēng)電發(fā)電功率的不確定性也會對電力市場的設(shè)計、風(fēng)電系統(tǒng)的規(guī)劃與部署、電網(wǎng)調(diào)度、輸電能力升級等問題產(chǎn)生影響[3]。因此,準(zhǔn)確有效的風(fēng)電功率預(yù)測技術(shù)是不可缺少的,對于風(fēng)電的安全、穩(wěn)定、經(jīng)濟(jì)運(yùn)行具有重要意義。
目前,國內(nèi)外眾多學(xué)者對風(fēng)電預(yù)測方法進(jìn)行了綜合研究。根據(jù)預(yù)測原理的不同,風(fēng)電功率預(yù)測方法可以歸納為三大類:物理模型、機(jī)器模型和統(tǒng)計模型[4,5]。其中,物理模型依賴數(shù)值天氣預(yù)報(NWP)提供的天氣和風(fēng)速信息,需要建立大數(shù)據(jù)模型。該方法適用于大范圍的長期預(yù)測,不適用于小范圍和短期預(yù)測。機(jī)器模型基于研究數(shù)據(jù)的時空分析進(jìn)行預(yù)測,主要包括卡爾曼濾波(KF)[6]、回歸方法[7,8]、指數(shù)平滑方法[9]和時間序列分析方法[10]。雖然機(jī)器模型在簡單的時間序列預(yù)測和短期預(yù)測中表現(xiàn)良好,但在非線性數(shù)據(jù)處理方面存在不足。一般來說,統(tǒng)計模型在短期風(fēng)電預(yù)測中優(yōu)于物理模型。
風(fēng)能作為風(fēng)力發(fā)電的源動力,在空間的分布上是呈分散的,在時間的分布上是呈不穩(wěn)定與不連續(xù)的,所以風(fēng)能資源的時而大時而小、時而有時而無的特點(diǎn)決定了風(fēng)速具有不穩(wěn)定性與間歇性。
風(fēng)機(jī)輸出的可用功率由于受風(fēng)速、風(fēng)向波動等各種因素的影響會進(jìn)一步的減小。圖1為風(fēng)速與風(fēng)力發(fā)電功率的關(guān)系,風(fēng)機(jī)的功率和風(fēng)速的大小是正相關(guān)的。當(dāng)風(fēng)速愈大時,風(fēng)機(jī)的功率也愈大,并且風(fēng)速出現(xiàn)極大地時刻和風(fēng)機(jī)的功率出現(xiàn)極大的時刻基本保持相同。
圖1 風(fēng)速與風(fēng)力發(fā)電功率的關(guān)系
影響風(fēng)電功率的氣象信息還包括溫度、濕度等,這些因素主要通過空氣密度而導(dǎo)致風(fēng)電功率發(fā)生變化。溫度、濕度與風(fēng)力發(fā)電功率的關(guān)系如圖2、圖3 所示??諝饷芏圈咽菦Q定風(fēng)電機(jī)組發(fā)電功率的重要因素,特別是在高海拔地區(qū),空氣密度對風(fēng)能得影響較為明顯。相同風(fēng)速下,隨著空氣密度的增大,風(fēng)電機(jī)組的發(fā)電功率也相應(yīng)變大。
圖2 氣溫與風(fēng)力發(fā)電功率的關(guān)系
圖3 濕度與風(fēng)力發(fā)電功率的關(guān)系
風(fēng)電功率轉(zhuǎn)化過程中,風(fēng)速、風(fēng)向、氣溫、氣壓、濕度等氣象因素都會對預(yù)測功率產(chǎn)生影響。單一的輸入變量往往達(dá)不到預(yù)測精度的要求,而將所有特征作為預(yù)測模型的輸入變量,將會影響模型的性能。因此,在建模時需要充分考慮影響風(fēng)電功率的重要性特征。采用Spearman方法做相關(guān)性分析。計算兩個n維向量x,y 的Spearman 相關(guān)系數(shù)方法如式⑴。其中x,y 表示進(jìn)行相關(guān)性分析的兩個變量。
其中,Ri和Si分別是向量x,y進(jìn)行排序后觀測值i的秩次分別是向量x和y的平均秩次;N是i的總數(shù)量;di=Ri-Si表示兩個變量中i的秩次之差。Spearman 相關(guān)系數(shù)中ρs是[-1,1]中的實數(shù)。當(dāng)ρs>0時,兩個變量成正相關(guān),反之,則負(fù)相關(guān)。|ρs|越大,變量x和y的相關(guān)程度越高。
采用相關(guān)性分析的方法,計算國內(nèi)某風(fēng)電場2019年的風(fēng)電功率以及影響因素各變量數(shù)據(jù)間相關(guān)系數(shù),分析情況如表1 所示。由表1 可知,發(fā)電功率和風(fēng)速這個變量的相關(guān)性最大,相關(guān)系數(shù)為0.9405;而與風(fēng)力發(fā)電功率相關(guān)程度最低的為氣壓,為0.0898,經(jīng)過分析,將獲取的實測數(shù)據(jù)中影響發(fā)電功率的主要變量為:風(fēng)速、氣溫以及風(fēng)向。
表1 風(fēng)電功率與影響因子間相關(guān)性分析情況
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks,CNN)是一種前饋神經(jīng)網(wǎng)絡(luò),具有參數(shù)共享和稀疏連接兩大特點(diǎn),可以有效捕捉原始數(shù)據(jù)的特征。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,它引入了卷積層和池化層。對輸入數(shù)據(jù)進(jìn)行壓縮,通過卷積運(yùn)算提取重要特征。最大池化層的目的是通過減小特征映射的大小來獲取特征,降低計算成本。圖4是CNN的結(jié)構(gòu)。
圖4 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
卷積層與輸入特征進(jìn)行卷積,通過濾波器生成特征映射。卷積運(yùn)算可以表示為:
其中,f、k、u和*分別是得到的特征映射、卷積核、輸入特征和卷積算子。偏差和激活函數(shù)由b和φ表示。激活函數(shù)在多層神經(jīng)網(wǎng)絡(luò)中發(fā)揮非線性映射作用,可在歷史風(fēng)數(shù)據(jù)的時空特征與預(yù)測值之間建立復(fù)雜的函數(shù)關(guān)系。
LSTM 模型利用前向信息來預(yù)測后續(xù)信息,雙向LSTM 在LSTM 的基礎(chǔ)上,結(jié)合輸入序列的前向和后向信息來提高預(yù)測精度。對于某一時刻的輸出,前向LSTM 層有當(dāng)時及之前的輸入序列信息,后向LSTM層有當(dāng)時及之后的輸入序列信息。兩個LSTM 層的輸出向量可以通過相加、平均或鏈接的方式進(jìn)行處理。水平方向同時計算每個時間步t的正向LSTM隱藏向量和反向LSTM隱藏向量垂直方向表示從輸入層到隱藏層再到輸出層的單向流動。本文采用連接兩個隱態(tài)的方法,得到Bi-LSTM 模型的最終預(yù)測結(jié)果,如式⑶~式⑸所示。
其中,LSTM(·)表示LSTM 函數(shù)分別為正向LSTM 的權(quán)重和反向LSTM 的權(quán)重,輸出層的偏置用表示。Bi-LSTM的網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。
圖5 雙向長短期記憶網(wǎng)絡(luò)結(jié)構(gòu)
CNN-BiLSTM預(yù)測模型
針對風(fēng)電功率時間序列的隨機(jī)性、非平穩(wěn)性,本文提出了一種基于CNN-BiLSTM 風(fēng)電功率預(yù)測方法。
模型預(yù)測步驟如圖6所示。
圖6 CNN-BiLSTM模型結(jié)構(gòu)
模型中每層的敘述如下。
⑴輸入層 對長度為n的歷史風(fēng)電數(shù)據(jù)進(jìn)行預(yù)處理,將其作為模型的輸入,表示為
⑵CNN 層CNN 層的作用是提取歷史輸入序列的特征。此模型的CNN層設(shè)計為二層卷積層、二層池化層與一層全連接層。卷積層均為一維卷積,池化層均為最大池化方法。全連接層把處理之后的數(shù)據(jù)輸出,該層使用Sigmoid 激活函數(shù)。CNN 層的輸出Hc=[hc1…h(huán)ct-1…h(huán)ct…h(huán)cj]T的表示如下:
其中,卷積層1 與2 的輸出分別是C1和C2;池化層1 與2 的輸出分別是P1和P2;W1、W2與W3均為權(quán)重;b1、b2、b3、b4與b5均為偏差;?是卷積運(yùn)算。
⑶ BiLSTM 層 構(gòu)建BiLSTM 層,以學(xué)習(xí)CNN 層輸出的規(guī)律。BiLSTM層的輸出ht的表示如下:
通過前文對負(fù)荷影響因素的分析結(jié)果,選擇風(fēng)速、風(fēng)向、溫度、濕度、氣壓數(shù)據(jù)構(gòu)成輸入特征集合。使用的數(shù)據(jù)來自國內(nèi)某風(fēng)電場,選取2019年10月8日——2020 年10 月8 日的數(shù)據(jù),采樣間隔是5min,即每天有288 個采樣點(diǎn),共計105409 個采樣點(diǎn)。采用2019年10 月8 日——2020 年9 月1 日的數(shù)據(jù)作為訓(xùn)練集、2020年9月2日——2020年10月8日的數(shù)據(jù)作為測試集。
本文對風(fēng)力發(fā)電功率進(jìn)行預(yù)測,選取均方根誤差(root mean square error,RMSE)和平均絕對百分比誤差(mean absolute percentage error,MAPE)作為評價指標(biāo)。RMSE和MAPE的公式如下:
其中,m是樣本的個數(shù);yi與分別是樣本i風(fēng)電功率的實際值和預(yù)測值。
RMSE和MAPE這兩個評價指標(biāo)可以衡量模型的預(yù)測性能。在風(fēng)電功率預(yù)測中,如果RMSE 和MAPE的值越小,則代表預(yù)測值和實際風(fēng)電功率值的差別越小,預(yù)測精度越高。
為了更好地驗證所提出模型的有效性,分別使用LSTM 模型、CNN-LSTM 模型、CNN-BiLSTM 模型進(jìn)行短期風(fēng)電功率預(yù)測,4 種模型的預(yù)測結(jié)果分別如圖7~圖9所示。
由圖7~圖9可知,在風(fēng)電功率的預(yù)測中,四種模型均能大致預(yù)測風(fēng)電功率的趨勢,其中LSTM 模型的性能最差。LSTM 模型處理平穩(wěn)變化的風(fēng)電數(shù)據(jù)的能力較弱,LSTM 模型處理急速變化的風(fēng)電數(shù)據(jù)的能力較弱。CNN-LSTM 模型由于結(jié)合了CNN 和LSTM 兩個單一模型的優(yōu)點(diǎn),因此其預(yù)測誤差較小。
圖7 LSTM風(fēng)電功率預(yù)測比較
圖8 CNN-LSTM風(fēng)電功率預(yù)測比較
圖9 CNN-BiLSTM風(fēng)電功率預(yù)測比較
實驗結(jié)果使用RMSE、MAPE 兩個評價指標(biāo)進(jìn)行評估,結(jié)果如表2 所示,本文提出的CNN-BiLSTM 預(yù)測方法在RMSE 指標(biāo)上和其他方法相比較,比LSTM、CNN-LSTM 分別提升了0.9656、0.262。在MAPE 指標(biāo)上和其他方法進(jìn)行相比較,比LSTM、CNN-LSTM分別提升了0.2699、0.1489。因此經(jīng)過實驗驗證CNNBiLSTM模型相對于其他模型有較好的預(yù)測性能。
表2 不同預(yù)測模型的預(yù)測誤差對比
為了更好的預(yù)測風(fēng)電短期發(fā)電量,本文首先采用斯皮爾曼相關(guān)性分析的方法選取高度相關(guān)的指標(biāo)。然后提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)和雙向長短期記憶神經(jīng)網(wǎng)絡(luò)的混合短期風(fēng)電功率預(yù)測模型,該模型考慮了風(fēng)電短期預(yù)測輸入數(shù)據(jù)的明顯時空特征。最后,應(yīng)用各種深度學(xué)習(xí)模型進(jìn)行仿真,驗證模型的性能。實驗結(jié)果驗證CNN-BiLSTM 模型提高了風(fēng)電功率的預(yù)測精度。