岳有軍,劉英翰,趙 輝,2,王紅君
(1.天津理工大學天津市復雜系統(tǒng)控制理論與應用重點實驗室,天津 300384;2.天津農學院工程技術學院,天津 300384)
電力負荷預測在現(xiàn)代電力系統(tǒng)經(jīng)濟安全運行中發(fā)揮著重要作用,精準的負荷預測有利于電力企業(yè)制定合理的發(fā)電、調度、維護等計劃,能為電力企業(yè)帶來巨大效益[1]。
為此,國內外學者做了大量研究。目前短期負荷預測常用方法主要有以多元線性回歸(MLR)、自回歸移動平均(ARMA)為代表的統(tǒng)計學方法及以支持向量機(SVM)和人工神經(jīng)網(wǎng)絡(ANN)為代表的人工智能方法[2]。然而,上述方法僅能獲得確定性點預測結果,由于實際預測過程中存在眾多不確定因素,點預測會存在不同程度誤差,難以反映電力需求的不確定性,給決策工作帶來一定困難[3]。為此,負荷區(qū)間預測逐漸得到了重視。相比于點預測,區(qū)間預測可通過構建一定置信水平下的預測區(qū)間來描述未來負荷的變化范圍,更有利于電力企業(yè)做出合理決策,因此負荷區(qū)間預測具有重要的研究意義。目前常見的區(qū)間預測方法主要有Delta法、貝葉斯法、Bootstrap法[4]等。通過上述方法雖能得到一定置信水平下的預測區(qū)間,但這些方法普遍存在實施困難、計算量大、預測區(qū)間可靠性差等問題,從而限制了負荷區(qū)間預測的進一步發(fā)展。
因此,為克服上述問題,區(qū)間預測上下限估計法(lower upper bound estimation,LUBE)[5]逐漸成為了當前的研究熱點,該方法利用神經(jīng)網(wǎng)絡雙輸出結構,通過優(yōu)化區(qū)間評價函數(shù),直接獲取預測區(qū)間上下限。能夠降低區(qū)間預測計算復雜度且無需假設誤差分布,在區(qū)間預測領域取得了不錯的成果,但是目前在負荷區(qū)間預測問題中研究較少,且已有研究大多存在一定的不足。文獻[6-7]利用基于神經(jīng)網(wǎng)絡的LUBE模型進行負荷區(qū)間預測,并采用PSO算法優(yōu)化區(qū)間評價函數(shù),得到了較高質量的預測區(qū)間。但傳統(tǒng)神經(jīng)網(wǎng)絡訓練時間過長且PSO算法易陷入局部最優(yōu)。為此,文獻[8]利用模擬退火算法(SA)代替PSO算法對該模型進行優(yōu)化,雖提高了負荷預測區(qū)間質量,但仍存在模型訓練時間過長的問題。文獻[9]提出基于PSO優(yōu)化核極限學習機(KELM)的LUBE區(qū)間預測模型,該模型以KELM代替?zhèn)鹘y(tǒng)神經(jīng)網(wǎng)絡,有效提高了區(qū)間預測效率和質量,但訓練過程仍然容易陷入局部最優(yōu)。此外由于原始負荷數(shù)據(jù)是具有隨機性的非平穩(wěn)時間序列[10],目前負荷區(qū)間預測模型很少考慮這一問題,同樣很大程度地限制了負荷區(qū)間預測質量。
鑒于此,為解決上述研究所存在的問題,本文提出一種基于ESMD-DE和ICSA-KELM的短期負荷區(qū)間預測模型。首先利用ESMD對原始負荷序列進行分解,該方法克服了經(jīng)驗模態(tài)分解(EMD)模態(tài)混疊問題及集合經(jīng)驗模態(tài)分解(EEMD)所加噪聲難以完全消除的問題;同時利用分散熵(DE)對各子序列分析重組,解決了樣本熵(SE)計算耗時長及排列熵(PE)未考慮序列振幅值間差異的問題;隨后由基于ICSA優(yōu)化KELM的LUBE模型得到負荷預測區(qū)間,利用ICSA克服了PSO及CSA算法易陷入局部最優(yōu)的問題,同時采用的KELM能夠有效降低模型訓練時的復雜度并提高負荷預測區(qū)間質量。最后通過實測電力數(shù)據(jù)仿真分析證明了本文所提方法能夠有效提高負荷預測區(qū)間質量。
ESMD算法是2013年由Wang等[11]提出的一種新型非平穩(wěn)信號處理方法。該算法采用內部極點對稱插值代替常規(guī)的包絡線插值,并利用最小二乘法的思想優(yōu)化剩余分量得到自適應全局均線,以此選取最佳篩選次數(shù)。解決了EMD模態(tài)混疊及端點效應等問題,并克服了EEMD分解過程中所加噪聲難以完全消除的問題。ESMD具體步驟如下:
(1)尋找待分解數(shù)據(jù)X的全部極值點,將相鄰的極值點用線段連接,取各條線段的中點記為Fj(j=1,2,…,n-1)。采用線性插值法添加左右邊界中點F0及Fn。
(2)通過上述n+1個中點構建T條插值曲線L1-LT,并對其進行均值計算得到均值線L*=(L1+L2+…+LT)/T。
(3)對X-L*重復上述步驟直到滿足|L*|≤ε(ε為設定的誤差閾值)或達到最大篩選次數(shù)P,從而得到第一個模態(tài)分量IMF1。
(4)對余量X-IMF1重復上述步驟,從而可以得到IMF2,IMF3,…,直到余項R的極值點數(shù)不再大于設定值為止。該算法允許R含有多個極值點。
(5)在整數(shù)區(qū)間[Pmin,Pmax]內改變P的取值,重復上述步驟并計算相應的方差比率σ/σ0,其中σ為X-R的相對標準差,σ0為數(shù)據(jù)X的標準差。
(6)最后在區(qū)間[Pmin,Pmax]內找到方差比率最小時的最大篩選次數(shù)P0。并以此重復步驟(1)~(4)得到最終的分解結果。
DE是Rostaghi等[12]于2016年提出的一種用于度量時間序列復雜度的新型算法。該方法能夠有效解決樣本熵計算耗時長及排列熵未考慮序列振幅值間差異的問題。對于時間序列x={x1,x2,…,xn},DE的計算過程如下:
(3)求得cm個分散模式的相對頻率如下:
(m-1)d]
(1)
(4)最后,通過式(2)計算可得到分散熵值:
(2)
CSA算法是Askarzadeh[13]受烏鴉覓食行為啟發(fā)于2016年提出的一種新型群體智能優(yōu)化算法。該算法認為烏鴉覓食過程中會將剩余食物儲藏起來,并在有需要時將其取回;此外,它們可以跟蹤其他烏鴉并竊取其食物,而被跟蹤的烏鴉將通過一定感知概率隨機移動保護食物。CSA算法需設置的參數(shù)較少,計算過程簡單,有較好的尋優(yōu)能力,但尋優(yōu)過程中飛行步長Lf選擇不當會導致算法陷入局部最優(yōu)。為此將Lévy飛行[14]引入到CSA算法中,利用Lévy飛行能夠提高種群多樣性及增大搜索范圍的特點對Lf進行改進,從而增強算法搜索能力。改進烏鴉搜索算法(ICSA)具體過程如下。
xi,k+1=
(3)
(4)
(5)
最后,當烏鴉位置更新后計算其適應度值f(·),并通過式(6)更新記憶值:
(6)
KELM是Huang[15]提出的一種將原有極限學習機(ELM)與核函數(shù)相結合的改進方法。KELM采用核映射取代ELM中原有的隨機映射,相比ELM具有較強的穩(wěn)定性及泛化能力且無需設置隱含層節(jié)點數(shù)。KELM中核矩陣ΩELM定義如下:
(7)
式(7)中:K(xi,xj)表示核函數(shù),將其設定成RBF核:
(8)
將ELM與上述核學習結合可得到KELM模型的輸出如(9)所示,其中ELM具體過程見文獻[16]。
f(x)=h(x)HT(I/C+HHT)-1T=
[K(x,x1)K(x,x2) …K(x,xN)]T×
(I/C+ΩELM)-1T
(9)
式(9)中:I和C分別為對角矩陣和懲罰系數(shù),核矩陣ΩELM用于取代ELM原有的隨機矩陣HHT,核函數(shù)K(xi,xj)用于取代隱層輸出函數(shù)h(x)。同時由該式可知KELM輸出權值如下:
β=(I/C+ΩELM)-1T
(10)
為克服傳統(tǒng)區(qū)間預測方法計算過程復雜和需假設誤差分布的問題。利用基于ICSA-KELM的LUBE模型進行后續(xù)的負荷區(qū)間預測。該模型采用KELM雙輸出結構,在訓練過程中利用ICSA結合優(yōu)化目標函數(shù)對模型輸出權值β進行優(yōu)化,從而直接獲得最優(yōu)負荷預測區(qū)間,模型結構如圖1所示。
圖1 區(qū)間預測模型結構Fig.1 Interval prediction model structure
為得到合理的負荷預測區(qū)間,需構造該區(qū)間預測模型的優(yōu)化目標函數(shù),從而得到模型的最優(yōu)參數(shù)。合理地預測區(qū)間應滿足預測區(qū)間覆蓋率盡可能大且預測區(qū)間寬度盡可能小,因此目標函數(shù)的構造需同時考慮這兩個指標,本文以此構造目標函數(shù)。
2.2.1 預測區(qū)間覆蓋率
預測區(qū)間覆蓋率(PICP)表示目標值處于預測區(qū)間中的概率,用以衡量預測區(qū)間的可靠性。PICP越高說明越多的目標值落入預測區(qū)間內。其公式如下:
(11)
式(11)中:N代表預測樣本個數(shù);εi是變量,若目標值yi落在預測區(qū)間內則εi=1,反之εi=0。
2.2.2 預測區(qū)間平均寬度
在區(qū)間預測中若不考慮預測區(qū)間寬度,很容易得到較高的PICP。但如果區(qū)間過寬則將增加預測區(qū)間的不確定性,從而失去決策價值。因此為避免這一問題,需引入預測區(qū)間平均寬度(PINAW)指標。其公式如下:
(12)
式(12)中:R表示目標值變化范圍;Ui與Li分別表示樣本i的預測區(qū)間上下限。
2.2.3 優(yōu)化目標函數(shù)
在實際決策時PICP和PINAW兩個指標是存在矛盾的。當PICP較高時可能導致PINAW較大,而當減小PINAW時又將導致PICP減小。因此,為更好地權衡上述兩個指標,以覆蓋寬度準則(CWC)作為優(yōu)化目標函數(shù),CWC定義如下:
CWC=PINAW[1+γPICPe-η(PICP-μ)],
(13)
式(13)中:μ表示給定的置信水平;η為懲罰因子。當PICP不低于μ時表示PICP指標已滿足要求,此時CWC由PINAW決定;當PICP低于μ時,由于懲罰因子的存在會導致CWC變得很大,此時反應區(qū)間預測質量較差。因此優(yōu)化的目的是最小化CWC。
(1)初始化KELM,確定其核函數(shù),采用RBF核。將訓練樣本的輸出目標值進行上下小幅度浮動,作為KELM初始區(qū)間。
(2)將步驟(1)處理后的訓練樣本代入模型中訓練得到KELM初始輸出權重。
(3)在步驟(2)的基礎上初始化ICSA參數(shù)。設定烏鴉種群大小、飛行步長、感知概率、算法最大迭代次數(shù)。KELM初始輸出權重作為烏鴉初始位置。
(4)按照ICSA步驟對烏鴉位置進行更新,并結合式(13)所提目標函數(shù)計算烏鴉在每次迭代中的適應度值。利用式(6)對烏鴉最優(yōu)位置進行迭代更新得到最終的全局最優(yōu)解即模型最優(yōu)輸出權重β,并以此得到最優(yōu)負荷預測區(qū)間。
經(jīng)上文理論分析,結合各方法優(yōu)勢搭建了基于ESMD-DE和ICSA-KELM的短期負荷區(qū)間預測模型,該模型由數(shù)據(jù)處理環(huán)節(jié)(ESMD-DE)和區(qū)間預測環(huán)節(jié)(ICSA-KELM)組成。整體流程如圖2所示。
圖2 負荷區(qū)間預測模型流程Fig.2 Load interval prediction model flow
實驗數(shù)據(jù)選用第九屆電工數(shù)學建模競賽提供的電力負荷數(shù)據(jù)集。該數(shù)據(jù)集內包含某地區(qū)連續(xù)三年的電力負荷數(shù)據(jù)和對應的同期氣象數(shù)據(jù)。為有效驗證所提短期負荷區(qū)間預測模型的優(yōu)勢,選取其中2012年7月26日—8月24日連續(xù)30 d每日整點負荷數(shù)據(jù)作為訓練集,輔助數(shù)據(jù)為同期溫度數(shù)據(jù)和日期類型。分別對8月25日和8月26日整點負荷進行區(qū)間預測。仿真軟件為MATLAB 2016b。
為降低原始非平穩(wěn)負荷序列對預測區(qū)間質量的影響,首先利用ESMD對訓練集負荷數(shù)據(jù)進行分解,即對720個連續(xù)負荷數(shù)據(jù)點進行分解。分解過程中Pmin和Pmax分別設置為1和40,剩余極值點數(shù)設定值為4,最終分解結果如圖3所示。
圖3 ESMD分解結果Fig.3 ESMD decomposition results
由圖3可以看出原始負荷序列被分解為四個特征互異的模態(tài)分量和一個殘余分量。原始非平穩(wěn)負荷序列中的不同尺度特征被很好地分解出來。
隨后考慮到分解得到的模態(tài)分量較多,若直接對其搭建預測模型會導致整體模型較為復雜。因此本利用分散熵對各分量進行復雜度分析,并將熵值相近的分量進行重組。其中DE參數(shù)通過多次實驗確定,當m=3,d=1,c=3時最能體現(xiàn)各分量的復雜度差異。由此可得各分量分散熵值如圖4所示。
圖4 各分量DEFig.4 DE of each component
由分散熵值計算可知IMF1分散熵值最高且明顯高于其他分量,即IMF1復雜度最高,因此IMF1單獨作為重組分量F1;IMF2和IMF3的DE相差不大為0.29,復雜度相近,因此可以合并為重組分量F2;同理IMF4和R的DE相差為0.25,因此合并為重組分量F3。最終的重組方式如表1所示。
按照表1所示重組方式對各分量進行重組,可以得到重組后的新序列如圖5所示。
表1 各分量重組結果
圖5 重組序列Fig.5 Recombination sequence
由圖5可以看出重組序列F1頻率最高隨機性最強,因此可以看作為高頻隨機分量;重組序列F2具有一定的周期性,因此可以看作周期分量;重組序列F3能夠表示原始負荷數(shù)據(jù)的整體變化趨勢,因此可以看作為趨勢分量。
隨后利用文獻[17]的方法對各重組分量進行周期性分析,用以確定后續(xù)各重組分量對應的子區(qū)間預測模型的輸入集合。經(jīng)周期性分析可知重組分量F1周期為8 h,該分量隨機性強復雜度高,主要受高頻突發(fā)事件影響;F2周期為24 h,以天為單位,表示一天的負荷變化;F3周期為166.5 h,表示一周的負荷變化,波動變化平緩。且經(jīng)相關性分析可得F3與日最高溫度、日平均溫度有較強相關性,因此F3對應的輸入集合確定時需包含相應的溫度數(shù)據(jù)。同時考慮到負荷變化與日期類型有一定關系,星期類型以0.7代表周一,0.8代表周二到周五,0.5代表周六,0.3代表周日。最終由上述分析可確定各重組分量對應的輸入集合如表2所示。
表2 各重組分量對應輸入集合
最后將實驗數(shù)據(jù)歸一化到區(qū)間[0,1],以提高模型精度及效率。
隨后結合輸入集合利用各重組分量分別建立并訓練相應的ICSA-KELM區(qū)間預測模型,最終利用訓練后的ICSA-KELM預測模型得到各分量的預測值,并將其疊加從而得到最終的負荷預測區(qū)間。由表2可知F1、F2、F3對應輸入變量分別為8、5、10,因此各重組分量相應的模型中KELM的輸入層節(jié)點分別為8、5、10,而KELM的輸出層節(jié)點均設置為2,KELM核函數(shù)選擇RBF核,取核參數(shù)γ=0.1,取懲罰系數(shù)取C=0.5,訓練樣本輸出目標值上下浮動20%,作為KELM初始區(qū)間,取CWC中懲罰因子η=40。ICSA算法中,設置種群大小N=50,飛行步長Lf=2,感知概率Pa=0.1,最大迭代次數(shù)為100。
為驗證所提負荷區(qū)間預測模型的優(yōu)勢。在相同的實驗環(huán)境下采用相同數(shù)據(jù),在給定置信水平(95%)下分別構建ICSA-KELM、CSA-KELM、CSA-ELM負荷區(qū)間預測模型,分別對2012年8月25日和8月26日整點負荷進行區(qū)間預測。并將各模型的預測結果與本文所提預測模型所得預測結果對比。其中評價指標為預測區(qū)間覆蓋率PICP,預測區(qū)間平均寬度PINAW。
最終得到的各模型預測結果如圖6所示。
圖6 預測結果Fig.6 Prediction results
由圖6可以直觀地看出,在給定置信水平下,本文所提出的區(qū)間預測模型能夠得到最窄的預測區(qū)間,并且與其他預測模型相比覆蓋了更多的真實值。為了進一步證明ESMD-DE-ICSA-KELM區(qū)間預測模型的優(yōu)勢,選用PICP和PINAW作為評價指標。最終各模型的評價結果對比如表3所示。
表3 各模型預測結果
由表3中結果可以看出,所提出的預測模型相比ICSA-KELM預測模型PICP提高了2.09%,PINAW降低了0.019 6,預測區(qū)間質量更高,說明通過引入數(shù)據(jù)處理環(huán)節(jié)有效降低了原始非平穩(wěn)負荷序列對區(qū)間預測結果的影響;而ICSA-KELM預測模型相比于CSA-KELM預測模型,雖然PICP指標相同,但是PINAW降低了0.025 9,得到的預測區(qū)間更好,這是因為通過引入Lévy飛行得到的ICSA算法有效克服了常規(guī)CSA算法飛行步長Lf選擇不當會導致算法陷入局部最優(yōu)的問題,從而提高了預測區(qū)間質量;CSA-KELM預測模型相比于CSA-ELM預測模型,PICP指標提高了2.08%,并且PINAW值降低了0.063,在保證更高預測區(qū)間覆蓋率的情況下具有更窄的預測區(qū)間,預測效果更好,這是因為KELM相比ELM具有較強的穩(wěn)定性及泛化能力,有效提高了模型的預測能力。綜上可以看出,所提區(qū)間預測模型的PICP值最高并且PINAW值最小,在滿足給定置信水平的條件下,具有較窄的預測區(qū)間寬度,預測區(qū)間的質量和可靠性最高,從而證明了所提區(qū)間預測模型的優(yōu)勢。
為提高短期負荷區(qū)間預測質量,提出了基于ESMD-DE-ICSA-KELM的短期負荷區(qū)間預測模型。首先為了克服EMD模態(tài)混疊問題和EEMD所加噪聲難以完全消除的問題,將ESMD方法引入到負荷區(qū)間預測問題中,對原始負荷序列進行分解;隨后,為克服樣本熵計算耗時長及排列熵未考慮序列振幅值間差異的問題,利用DE對各子序列進行復雜度分析并重組;最后,為克服CSA算法易陷入局部最優(yōu)和ELM穩(wěn)定性及泛化能力較差的問題,構建了基于ICSA-KELM的LUBE模型作為區(qū)間預測環(huán)節(jié),同時也克服了常規(guī)區(qū)間預測方法計算量大、預測區(qū)間可靠性差等問題。
總起來說,由理論和仿真結果分析可知本文所提出的ESMD-DE-ICSA-KELM預測模型在短期負荷區(qū)間預測領域中具有一定的優(yōu)勢,有效提高了區(qū)間預測質量,為日后的負荷區(qū)間預測提供了一定的參考,具有一定的研究意義。