程江洲,潘 飛,鮑 剛
(三峽大學電氣與新能源學院,湖北 宜昌 443000)
發(fā)展可再生能源可以有效減少對化石能源和其它燃燒能源的依賴,從而改善世界的能源和經濟安全性[1]。由于其清潔,安全和可持續(xù)的特性,風電在全球范圍內受到持續(xù)關注[2]。為了提高風電市場需求側和供應側的靈活性,提高風力發(fā)電預測準確性變得至關重要而緊迫[3]。專家學者們在風電功率預測方面已經做了很多研究。最近,智能算法和統計方法的結合進一步發(fā)展了預測技術。殷等[4]提出了級聯式卷積神經網絡(CCNN)-門控循環(huán)單元(GRU)預測模型。薛等[5]提出了CNN-GRU模型的超短期風電預測模型,克服了訓練過程中的梯度爆炸和消失問題。Liu等[6]提出了一種基于copula函數,雙變量經驗模態(tài)分解(BEMD)算法和GRU神經網絡的超短期風電功率預測方法。賞等[7]提出一種將隨機森林與GRU神經網絡相結合的超短期風電預測模型。上述預測方法,均采用不同的智能算法提取風電相關數據的特征,再通過神經網絡算法進行預測,沒有針對訓練樣本的分類和篩選進行研究。
鑒此,考慮到RCC方法在訓練樣本分類篩選和GRU網絡在小規(guī)模樣本預測中的優(yōu)勢,提出了基于RCC-GRU模型的超短期風電功率預測方法。實驗結果表明,該方法降低了模型的計算成本,提高了預測精度。與3種典型方法比較,RCC-GRU模型在預測精度和效率上具有明顯的優(yōu)勢。
風電功率輸出與許多因素有關,包括一些氣象因素和臨近日風電功率因素等,幾乎不可能包括所有影響因素。然而,這些因素對風電功率影響的權重不是恒定的。在不同的時間段和不同的天氣條件下有不同的影響。
風電功率和氣象數據采集系統每15分鐘記錄一次數據,共96個時間點,選擇6個有代表性且容易獲得的氣象因素進行比較,包括風速WS,風向正弦值sWD,風向余弦值cWD,溫度T,壓強PR,相對濕度H。用ρX,Y計算不同特征與不同時段輸出功率的相關性,并計算其平均值。
(1)
式中X代表不同的氣象影響因子,Y代表風電功率,N代表時間點數。
圖1表示6種不同氣象因素與風電功率輸出的相關系數,相關系數越大,說明該影響因子與風電功率輸出的相關性越強。從圖1可發(fā)現,風速與風電功率的相關性為0.758,在所有影響因子中最高,即用風速來篩選相似日更為合理。
圖1 不同氣象因素與風電功率的相關系數
因此,為了保證預測模型在學習不同時間段的微小差距的同時,能夠適應不同的季節(jié)。該方法將不同的時間段分開,并使用滑動窗口進行超短期功率預測。短期內氣候參數范圍小,氣候變化相對穩(wěn)定。通過分析預測點之前的氣候情況來推測預測點的氣候是有效的。設定原點(0,0,0)為參考點,通過將時間周期中不同時間點的風速設置為始值、均值和終值的坐標,可以計算這些坐標和原點之間的歐氏距離,如下所示
(2)
其中,Gstart,Gmean,Gend分別是預測時間點i之前的時間段(i-n,i-1)的風速的始值、均值和終值。n是選定時間段內的時間點數量。選擇n等于2、3、4、5和6進行驗證。
(3)
其中pi是時間節(jié)點i的風電功率輸出值。
不同時間步長的d與下一時刻的風電功率之間的相關性如表1所示。圖2中顯示了不同時間步長的ρd,p平均值和標準偏差,當時間步長為4時,相關性最高,并且穩(wěn)定性更好。因此,選擇預測點之前的4個時間點作為分析時間段。
表1 不同時間步長的d與下一時刻的風電功率之間的相關性
圖2 不同時間步長的ρd,p平均值和標準偏差
根據上述特征,提出了輻射坐標分類(RCC)方法作為選擇相似時間段的分類方法。將獲得的相似時間的對應數據重建為訓練數據集。訓練后,輸入該時間段的相應數據以預測風電功率輸出。具體過程如下。
首先,在預測當天的前30天和預測時間點前的前兩個時間段內的相同時間段內收集數據。將這些數據重構為由(Pt,WSt,sWDt,cWDt,Tt,PRt,Ht,Pt+1)組成的特征數組A。數組A的結構如下所示
A={Ad-30,Ad-29,…,Ad-1,Ad}
(4)
(5)
然后,對特征數組中的功率和氣象參數進行歸一化處理。歸一化公式定義為
(6)
其中Akl-new是歸一化后的數據,Akl表示功率和氣象數據的特定值,k表示值,均值或終值,l表示時間節(jié)點,Akmax和Akmin分別是氣象數據中對應的最大和最小值。
其次,通過將輻射分類特征坐標定義為(Gstart,Gmean,Gend),每個參數的定義與上面相同。將這32個時間段合并為相應的三維向量。計算這32個特征坐標與目標周期特征坐標之間的歐式距離λ。該公式定義為
(7)
選擇λ值較小的前10個時間段相對應的氣象和功率數據用作訓練網絡的數據集。
循環(huán)神經網絡(RNN)是一種設計用于處理序列數據的深度神經網絡,在序列挖掘領域起著重要作用。GRU模型是循環(huán)神經網絡的一種改進,是近年來深度學習的熱門技術之一。與傳統的遞歸神經網絡不同,GRU的隱藏層節(jié)點的內部結構不使用單個激活功能。GRU遞歸神經網絡如圖3所示。
圖3 GRU循環(huán)神經網絡
GRU使每個循環(huán)單元能自適應地捕捉不同時間尺度的依賴關系。GRU有門控單元來調節(jié)單元內部的信息流,但是沒有單獨的存儲單元。
(8)
(9)
(10)
(11)
為了更直觀地描述RCC-GRU預測方法,其實現過程如圖4所示。
圖4 RCC-GRU預測模型
其詳細步驟總結如下:
Step1:收集歷史風電功率和多元氣象因子數據集。
Step2:對數據進行預處理,包括異常數據和歸一化處理。
Step3:根據預測點之前時間段的氣象特征值,采用RCC算法確定樣本集中預測時間段的相似時間段,以此確定訓練樣本集。
Step4:初始化GRU神經網絡的閾值和權重。
Step5:使用相似時間段樣本訓練GRU神經網絡,然后得到最終的預測模型。
Step6:將預測時間點之前的特定時間段的功率和氣象數據輸入到預測模型中,以預測風電功率值。
采用單一誤差指標很難對預測模型進行全面評估,文中選擇了確定系數(R2),平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)、平均絕對誤差(MAE)[9]和國家能源局出臺的風電場預測預報考核指標中的準確率(r1)[10]作為評價指標,RMSE用于表示結果的分散程度,MAE和MAPE來表示預測的偏差,確定系數(R2)來表示實際值和預測值之間的線性相關性。各評價指標定義如下所示
(12)
(13)
(14)
(15)
(16)
文中選取了福建省某風電場的歷史氣象數據和功率數據作為實驗對象,其風電場開機容量為850kW,數據采集時間為2016年1月1日至2017年12月31日,每15min采集一次數據,一天共96個數據。
實驗基于Python3.6和64位操作系統的個人計算機實現的,該計算機的CPU為i5-7300HQ,RAM為8.00GB。軟件框架基于Tensorflow框架,繪圖軟件采用OriginPro8。
3.2.1 預測效果分析
為了驗證所提出的RCC-GRU模型的有效性,選擇了幾種典型網絡,包括RCC-LSTM模型,LSTM模型和GRU模型進行比較,并在4個季節(jié)中對不同的評價指標(MAPE,MSE,RMSE)進行對比分析。此外,還采用了確定系數R2和準確率r1來驗證RCC-GRU模型的預測準確性和穩(wěn)定性。在測試數據時間范圍內,隨機選取一天中采用不同預測模型得到的超短期風電功率預測結果和訓練時間成本結果如圖5-6所示。
圖5 不同模型的預測結果
圖6 不同的預測模型的訓練時間
不同模型的預測準確率和平均訓練時間如表2所示。由于RCC-GRU模型的訓練集樣本采用了RCC算法進行收集,訓練數據集很小。因此,每個實時預測步驟僅需要幾秒鐘,這在實際應用中是可以接受的。與GRU模型相比,RCC-GRU模型不僅提高了預測的準確性,而且降低了預測模型的訓練時間成本,其準確率提高了3.16%,訓練時間降低了37.95%。RCC-GRU模型與RCC-LSTM模型都采用了RCC算法來篩選訓練集樣本,但RCC-GRU模型的平均訓練時間成本降低了52.47%,預測準確率提高了1.11%,充分體現了GRU算法在小規(guī)模樣本時的性能優(yōu)勢。
表2 不同模型的預測準確率和平均訓練時間
綜上,與RCC-LSTM模型,LSTM模型和GRU模型進行比較,RCC-GRU模型的預測結果與風電功率實際值擬合度最高,預測準確性最高,且在預測效率上也具有一定優(yōu)勢。
3.2.2 通用性分析
為了進一步測試RCC-GRU模型在不同季節(jié)的通用性,選擇了不同季節(jié)中的幾天來擴展驗證樣本集,每個季節(jié)中隨機選擇3天。下面顯示了有關不同評估指標的詳細信息。
圖7 RMSE均值
圖7顯示了不同季節(jié)預測結果的平均RMSE值。RCC-GRU模型在每個季節(jié)的RMSE值均低于其它模型,RMSE的平均值為21.175KW,與其它模型相比,分別降低了20.17%,51.79%和59.24%,說明了該方法具有更好的預測精度。
不同季節(jié)預測結果的平均MAE值如圖8所示,與其它模型相比,RCC-GRU模型的平均MAE值分別降低了18.56%,42.46%和49.55%。
圖8 MAE均值
不同季節(jié)預測結果的平均MAPE值如圖9所示,與其它模型相比,RCC-GRU模型的平均MAPE值分別降低了15.53%,39.75%和47.99%。
圖9 MAPE均值
綜合圖7-9可知,與RCC-LSTM模型,LSTM模型和GRU模型相比,RCC-GRU模型的3個誤差指標值(RMSE,MAE,MAPE)在每個季節(jié)均為最低,體現了RCC-GRU風電功率預測模型的精確性和穩(wěn)定性。
除了RMSE,MAPE和MAE,確定系數R2也是評估預測模型的有效的參數,不同預測模型的R2的平均值(%)和標準偏差如圖10所示。從圖10可發(fā)現,這些模型均具有良好的預測性能,而所提出的模型的R2平均值和標準偏差分別為0.9899和0.013,均優(yōu)于其它比較模型,說明了RCC-GRU模型具有更高的預測精度和更好的穩(wěn)定性。
圖10 不同模型的平均確定系數R2和R2的標準差
提出了一種基于RCC-GRU模型的超短期風電功率預測方法,其具有以下優(yōu)勢:
1)RCC算法可以有效的對相似時間段進行分類和選擇,降低了預測模型的計算成本,提高了預測精度。
2)RCC-GRU模型的各項評價指標均優(yōu)于比較模型,其平均RMSE、MAPE、MAE、準確率和確定系數分別為20.43kW,3.52%,18.71kW,97.6%和98.99%,說明該方法具有更高的預測精度。此外,RCC-GRU模型比GRU-LSTM模型和GRU模型更高效,其平均訓練時間成本比RCC-LSTM模型降低了52.47%。
3)本文通過RCC方法進行訓練樣本篩選時,選擇λ值較小的前10個時間段的數據作為訓練集,后續(xù)還可以深入研究不同λ閾值對預測效果的影響。