魏聯(lián)濱 ,王 彬 ,王 瑩 ,張海峰
(1.國網(wǎng)天津市電力公司,天津 300010;2.北京大學動力中心,北京 100871)
隨著環(huán)境問題的日益突顯、能源需求的不斷增長以及光伏發(fā)電技術的逐步成熟,近年來光伏發(fā)電產(chǎn)業(yè)得到了快速發(fā)展。光伏發(fā)電輸出功率具有強烈的隨機性、波動性,隨著光伏發(fā)電裝機容量占比的不斷提高,其輸出功率的不確定性帶來了一系列的調(diào)度運行問題。及時準確地預測光伏發(fā)電功率可以有效降低光伏發(fā)電給電網(wǎng)安全運行帶來的不確定性。
通常情況下,光伏發(fā)電功率預測是以光伏電站歷史運行數(shù)據(jù)和歷史數(shù)值天氣預報數(shù)據(jù)為基礎,建立天氣預報數(shù)據(jù)與光伏電站發(fā)電功率之間的映射關系,進而預測未來光伏電站的發(fā)電功率。文獻[1]提出了基于極限學習機的光伏發(fā)電功率預測,但未根據(jù)氣象條件選擇訓練數(shù)據(jù)集合。文獻[2]提出了基于支持向量機模型的光伏短期功率預測,篩選歷史氣象相似日時未計算各種影響因素的權重。文獻[3]提出了基于灰色神經(jīng)網(wǎng)絡組合算法的光伏發(fā)電功率預測,神經(jīng)網(wǎng)絡各種參數(shù)未優(yōu)化,預測結果精度有待提高。文獻[4]提出了基于深度學習的短期光伏發(fā)電預測方法,存在陰天天氣情況下預測準確度不高問題。文獻[5]建立了基于隨機森林特征選擇和CEEMD 的短期光伏發(fā)電預測,算法魯棒性仍需提高。文獻[6]提出了基于時變參數(shù)自適應離散灰色模型的光伏發(fā)電長期預測模型,該模型未考慮識別和修復原始數(shù)據(jù)中異常數(shù)據(jù)。本文提出基于氣象相似日選取與提升回歸樹的光伏發(fā)電短期功率預測方法,通過動態(tài)時間彎曲距離選擇與預測日氣象因素相似的歷史日集合作為訓練樣本集合,采用提升回歸樹構建光伏發(fā)電功率預測模型,提升了預測結果的準確性。
影響光伏發(fā)電功率的因素眾多,主要包括氣象因素和光伏發(fā)電組件。
氣象因素是影響光伏發(fā)電出力的主要因素,包括太陽輻照度、周圍環(huán)境溫濕度以及降雨降雪等天氣過程。
太陽輻照度是指單位時間內(nèi)垂直投射在單位地表面積上的輻照能量,值越大光伏電站發(fā)電功率越高。
環(huán)境溫度是大氣分子熱運動的度量,溫度越高光伏發(fā)電功率越大。環(huán)境濕度較大時,空氣流動性差,阻擋了地表有效反射輻射,發(fā)電功率降低。
當光伏電站所處區(qū)域的天空云量增加時,云層的厚度、云底高度和云類的變化將導致大氣折射、吸收、散射效應趨于復雜,會導致光伏發(fā)電功率發(fā)生隨機性波動。
除了氣象因素外,光伏組件的轉(zhuǎn)換效率也是影響光伏發(fā)電功率的重要因素之一。光伏組件的轉(zhuǎn)換效率主要受到逆變器性能、組件材質(zhì)、安裝角度、老化和遮擋等因素的影響。理論上,光伏發(fā)電功率預測需要全面考慮上述影響因素。但是逆變器性能、光電轉(zhuǎn)換效率、組件安裝角度等光伏電站本身屬性在其投入運行時已經(jīng)確定。對于某一個光伏電站,歷史日發(fā)電功率數(shù)據(jù)和預測日發(fā)電功率對比,電站本身屬性條件基本不變,不同之處主要是外在氣象條件,電站本身屬性條件可以轉(zhuǎn)換為歷史日發(fā)電功率數(shù)據(jù)。
影響光伏發(fā)電功率的氣象條件包括周圍環(huán)境溫度濕度、降水量、太陽輻照度等。但是,各因素對光伏發(fā)電功率影響大小不同,需要確定各影響因素的權值,進而從歷史數(shù)據(jù)找到與預測日氣象條件最相似的歷史日。
采用層析分析法計算各氣象因素的權重系數(shù),具體步驟如下:
(1)組織光伏業(yè)務專家明確各因素指標之間的相對重要性,參照判斷矩陣標度表構建指標之間判斷矩陣X=(xij)n×n,標度表內(nèi)容如表1 所示。
表1 判斷矩陣標度表
(2)計算指標判斷矩陣X的每一行元素的積Mi
(3)計算每一行Mi的n次方根值:
式中:n為矩陣階數(shù)。
(4)計算一級指標權重系數(shù):
與層析分析法相比,熵值法完全基于數(shù)據(jù)分布情況計算各指標的權重系數(shù),避免了人為因素的影響。采用熵值法計算影響光伏發(fā)電氣象各因素的權重系數(shù),具體步驟如下:
(1)指標數(shù)據(jù)標準化。由于氣象各因素的量綱、數(shù)量級差異較大,需要對各指標數(shù)據(jù)歸一化至指定區(qū)間,具體公式如下:
式中:xj為第j項因素值,xmax為氣象數(shù)據(jù)集合中第j項因素最大值,xmin為氣象數(shù)據(jù)集合中第j項因素最小值,xij為第i個氣象日第j項因素標準化處理后的值。
(2)計算指標比重矩陣。根據(jù)步驟1 結果計算第j項因素下第i個時間點的比重yij,具體公式如下:
(3)計算信息熵值和信息效用值d。根據(jù)步驟2 結果可以計算第j項因素的信息熵值ej,具體公式如下:
接著,計算第j項指標的信息效用價值dj,具體公式如下:
(4)計算各指標因素權重。具體公式如下:
熵值法是指經(jīng)過對實際樣本集合進行整理、計算、分析,從而得到權重系數(shù)。該方法避免了人為因素的影響,比較符合實際的數(shù)據(jù)分布。本文采用熵值法確定氣象各因素指標權重系數(shù)。
氣壓、溫度、相對濕度、降水量、太陽輻照度等氣象數(shù)據(jù)是典型的時間序列數(shù)據(jù)。動態(tài)時間彎曲(dynamic time warping,DTW)是一種有效的時間序列對象相似性度量方法。它通過調(diào)整時間序列不同時間點對應元素之間的關系來獲取一條最優(yōu)彎曲路徑,使其能很好地度量時間序列之間的相似性。假設有兩條時間序列A={a1,…,ai,…,am}和B={b1,…,bj,…,bn},m和n分別表示時間序列A和B的長度,首先構造一個m×n的矩陣M,元素M(i,j)為ai與bj之間的距離,然后在矩陣中尋找一條使兩條序列間累積距離最小的彎曲路徑。彎曲路徑W={w1,…wk,…,wK}是矩陣M一組連續(xù)的元素集合,并且滿足以下約束:
(1)有界約束:max(m,n)≤K≤m+n-1。
(2)邊界約束:元素w1=M(1,1)和wK=M(m,n)分別是彎曲路徑的起點和終點。
(3)連續(xù)性約束:給定元素wk=M(i,j),其相鄰元素wk-1=M(i′,j′)需滿足i-i′≤1,j-j′≤1,即彎曲路徑元素是相鄰的。
(4)單調(diào)性約束:給定元素wk=M(i,j),其相鄰元素wk-1=M(i′,j′)需滿足,i-i′≥0,j-j′≥0。
矩陣T={(x1,y1),(x2,y2),…,(xN,yN)}中存在多條滿足上述約束條件的彎曲路徑,但是時間序列A和B的DTW 距離是最小的彎曲路徑。彎曲路徑是一種利用動態(tài)規(guī)劃算法求解的最優(yōu)化問題,其最優(yōu)解子結構為:
因此,上述時間序列A={a1,…,ai,…,am}和B={b1,…,bj,…,bn}的DTW 距離為Ddtw(A,B)=d(m,n)。相比于常用的歐氏距離,DTW 能更準確完整地反映兩個序列之間的相似程度。
從歷史數(shù)據(jù)搜索預測日氣象條件最相似的歷史日的步驟如下:
(1)根據(jù)歷史日各氣象因素數(shù)據(jù),采用熵值法計算各因素的權重w。
(2)對于預測日,計算每個歷史日每個氣象因子與預測日相應因子的DTW。
(3)計算每個歷史日與預測日氣象因子的相似度。
(4)從歷史日集合選擇與預測日氣象因素最相似的歷史日子集。
提升方法是一種典型的集成學習方法。在分類或回歸問題中,它通過改變訓練樣本的權重,構建多個分類(回歸)模型,并將這些基本模型線性組合提高分類(回歸)的性能。提升回歸樹是以回歸樹為基本模型的提升方法。
假設X與Y分別為輸入和輸出變量,并且Y為連續(xù)變量,給定訓練數(shù)據(jù)集D,D={(x1,y1),(x2,y2),…,(xn,yn)},考慮如何生成回歸樹。
如果一個回歸樹有M個葉子,那么該回歸樹將輸入空間X劃分為M個單元,每個單元Xm有一個輸出值cm?;貧w樹模型可表示為:
式中:I(x∈Rm)為示性函數(shù),當x∈Rm時取值為1,否則取值為0。
當輸入空間的劃分確定時使平方誤差最小,單元Rm輸出值cm的最優(yōu)值則是Rm上的所有輸入實例對應的輸出yi的均值,即
如何對輸入空間進行劃分。采用啟發(fā)式思想回歸樹具體生成算法如下:
提升回歸樹模型采用加法模型和前向分步算法實現(xiàn)學習的迭代優(yōu)化,具體表示為:
式中:T(x;Θm)表示回歸樹,Θm為回歸樹參數(shù),M為回歸樹數(shù)量。
采用前向分布算法,首先確定初始提升樹f0(x)=0,第m步模型為:
式中:fm-1(x)為當前模型。
在提升回歸樹生成過程中,需要經(jīng)驗風險最小化確定下一棵回歸樹的參數(shù)Θm,當采用平方差作為損失函數(shù)時則轉(zhuǎn)化為求解:
式中:yi-fm-1(x)為當前模型擬合樣本數(shù)據(jù)的殘差。因此在提升回歸樹構建過程中只需要擬合當前模型的殘差[13-15]。提升回歸樹生成算法如下:
以某地區(qū)2020 年1 月至3 月的數(shù)值天氣數(shù)據(jù)和2 kW 室外自動跟蹤光伏電站發(fā)電量實測數(shù)據(jù)作為樣本數(shù)據(jù)集合,對本文提出的基于氣象相似日選取與提升回歸樹的光伏發(fā)電功率預測模型進行了驗證,并對預測結果的精確性進行分析。數(shù)據(jù)集包括每15 min 溫度、相對濕度、風速、太陽輻照強度、光伏電站并網(wǎng)功率。
首先,提取歷史氣象數(shù)據(jù),氣象數(shù)據(jù)具體內(nèi)容如表2 和圖1 所示:
圖1 歷史日輻照度曲線
表2 氣象數(shù)據(jù)
接著,應用熵值法計算各個氣象影響因素的權重,經(jīng)過計算溫度、濕度、風速、太陽輻照強度的權重分別為0.063、0.040,0.104、0.793。
然后,計算歷史日氣象因素數(shù)據(jù)之間的DTW,太陽輻照度曲線如圖1 所示,它們之間的DTW 矩陣如表3 所示:
表3 輻照度序列之間DTW
可以看出,輻照度曲線越接近,其DTW 越小。
最后,計算各因素之間DTW。然后乘以它們之間權重就是氣象相似度大小。對于3 月20 日,其相似日如表4 所示:
表4 歷史氣象相似日
歷史相似日和預測日并網(wǎng)功率如圖2 所示,對比分析3 月18 日、3 月6 日和3 月9 日與3 月20 日并網(wǎng)功率數(shù)據(jù),從圖可以看出氣象條件越相似該歷史日和預測日的光伏發(fā)電短期功率曲線越吻合。
圖2 歷史日發(fā)電功率曲線
對于每個預測日的光伏發(fā)電功率預測,將k個歷史相似日的溫度、相對濕度、風速、太陽輻照時間序列數(shù)據(jù),以及每個歷史相似日前一天發(fā)電功率時間序列數(shù)據(jù)作為模型輸入變量,將k個歷史相似日發(fā)電功率數(shù)據(jù)作為模型的輸出變量,構建光伏發(fā)電功率預測模型。
為進一步分析本文模型的正確性與精確性,將回歸樹模型、氣象相似日-回歸樹模型、提升回歸樹模型預測結果與本文所提出的相似日-提升回歸樹模型的預測結果從均方誤差(MSE)、均方根誤差(RMSE)、平均絕對誤差(MAE)、擬合度(RSquared)四個方面進行對比分析,結果如表5 所示。
表5 預測結果對比分析
可以看出,氣象相似日-提升回歸樹較回歸樹、提升回歸樹的擬合度(R-Squared)提升,均方誤差(MSE)、均方根誤差(RMSE) 和平均絕對誤差(MAE)降低,因此相比其他方法,氣象相似日-提升回歸樹誤差減小的同時預測準確性度顯著提高。
光伏發(fā)電功率受氣象因素影響隨機波動性較大,隨著并網(wǎng)容量日益增大,對電網(wǎng)的安全運行影響越來越大。本文提出基于氣象相似日選取與提升回歸樹的光伏發(fā)電功率預測方法,通過動態(tài)時間彎曲距離選取與預測日相關度高的歷史樣本作為訓練樣本,采用集成學習方法對光伏發(fā)電功率進行日前預測。驗證結果表明,本文提出的氣象相似日選取與提升回歸樹的預測模型具有較高的預測準確度,可以有效降低光伏發(fā)電給電網(wǎng)安全運行帶來的不確定性。