劉友波,吳 浩,劉挺堅,楊智宇,劉俊勇,李秋航
(1. 四川大學電氣工程學院,四川省成都市 610065;2. 國網(wǎng)成都供電公司,四川省成都市 610041)
負荷預測是電力系統(tǒng)安全經(jīng)濟運行與穩(wěn)定發(fā)展的重要內(nèi)容,其與電網(wǎng)的發(fā)展規(guī)劃、電力市場的運行、電力調度緊密相關[1]。近年來,許多機器學習算法被應用于負荷預測。文獻[2]采用協(xié)整-格蘭杰因果檢驗分析用電量與長期經(jīng)濟趨勢、循環(huán)分量以及季節(jié)分量之間的關系,減小了支持向量機對數(shù)據(jù)長度、質量的依賴,從而改善了預測效果。文獻[3]提出了一種核函數(shù)極限學習機模型并應用于小容量微電網(wǎng)的短期負荷預測。隨著深度學習技術的興起,如深度置信網(wǎng)絡[4]、循環(huán)神經(jīng)網(wǎng)絡[5-6]、生成對抗網(wǎng)絡[7]已應用于負荷預測并取得一定的成果。文獻[8]則利用長短期記憶(LSTM)網(wǎng)絡和輕梯度提升機進行短期負荷組合預測,可降低單一模型機端預測誤差的風險,提高預測精度。上述方法都是通過數(shù)據(jù)擬合各因素和電力負荷的影響關系,直接預測負荷凈需求。然而,隨著用戶側分布式能源尤其是園區(qū)內(nèi)、表計后新能源的裝機容量增長,用戶端口的凈負荷需求呈現(xiàn)出強隨機性和波動性,給主動配電網(wǎng)凈負荷預測帶來挑戰(zhàn),成為當前研究的重點與難點[9]。
用戶側凈負荷分離屬于一種單通道盲源分離(single channel blind source separation,SCBSS)問題,即傳感器接收到一組信號的混合數(shù)據(jù),研究人員期望將原始信號一一分離出來。如果在某些域中存在足夠大的差異,如時域、頻域、聯(lián)合域和其他變換域,則可以進行信號分離?;诖斯沧R,文獻[10]通過變換域濾波實現(xiàn)了信號識別。此外,文獻[11]總結了一些通用的SCBSS 方案。目前大多數(shù)基于連續(xù)小波變換[12-13]的研究取得了不錯的效果,是時頻分析中常用的數(shù)據(jù)處理工具,但是這種方法需要事先指定基函數(shù)并逐一進行尺度搜索,計算冗余、計算量大,不具備自適應性。而經(jīng)驗模態(tài)分解(EMD)無須預先設定任何基函數(shù),依據(jù)原始時序數(shù)列自身特點從數(shù)據(jù)層面進行SCBSS。因此,理論上EMD 可以處理任何類型的時間序列[14-15]。在針對用戶側凈負荷等非平穩(wěn)數(shù)據(jù)的處理上,數(shù)據(jù)分解是基于數(shù)據(jù)信號序列的各個時間尺度的局部特性。因此,其具有自適應性和優(yōu)越性。文獻[16-17]介紹了EMD 算法在負荷預測中的簡單應用。自適應噪聲的完全集成EMD(complete ensemble EMD with adaptive noise,CEEMDAN)作為一種改進的EMD 算法,可以實現(xiàn)可忽略的重建誤差,并解決信號加噪聲的不同實現(xiàn)方式的“模式混合”問題[18],突出展示各頻率負荷特性,從而構建不同頻率下的負荷預測模型,精準刻畫用戶側凈負荷需求。
端口表計只可測量園區(qū)的綜合凈負荷需求,電網(wǎng)公司難以獲取用戶側負荷、風光分布式能源各分量的數(shù)據(jù)信息,這是傳統(tǒng)預測方法的關鍵難點。因此,本文以盲源分離獨立預測的思路來研究含分布式電源智能園區(qū)的凈負荷需求預測問題,采用CEEMDAN 方法對具有不同變化特征的信號進行時序分解,配合深度信念網(wǎng)絡(deep belief network,DBN)獨立預測,實現(xiàn)用戶側凈負荷一次性精準預測,可以有效避免進行單獨預測產(chǎn)生的預測誤差累積,減少調度中心預測系統(tǒng)的配置成本。
隨著分布式能源的發(fā)展與智能電網(wǎng)的進步,電網(wǎng)將會朝著各個智能化單元的方向發(fā)展,對于一個智能臺區(qū)中既含有風能又含有太陽能的系統(tǒng),除開自身運行所需的電量外,其可向整個大電網(wǎng)提供的電量或其所需大電網(wǎng)供給的電量將是智能電網(wǎng)負荷預測所要考慮的一個重要指標。這種“凈負荷”指標的獲得依賴于給智能園區(qū)風力發(fā)電功率、光伏發(fā)電功率、負荷功率帶來波動后,進行更加準確的預測。
凈負荷需求主要包含3 個部分。在一個研究區(qū)域的原始負荷基礎上減去光伏、風機等所有形式的分布式能源出力后,即可得到本文所研究對象的凈負荷需求。風機和光伏出力的不確定性給凈負荷需求預測帶來了極大的挑戰(zhàn)。由于新能源的出力,光伏和風機往往就地平衡了一些原始負荷,使得凈負荷發(fā)生波動性變化,而電網(wǎng)運營公司只關注于用戶從電網(wǎng)獲得的電能,即凈負荷。
EMD 由黃鍔等人提出,用于分析處理波動性較大的非平穩(wěn)非線性信號[19]。它可以將任何信號分解為若干個本征模態(tài)函數(shù)(intrinsic mode function,IMF),每個IMF 代表著不同的振蕩成分,所生成的IMF 應滿足以下2 個要求。
1)IMF 極值的數(shù)量與穿越零值的次數(shù)必須相等或最多相差1。
2)在IMF 的任意一點,由局部最大值定義所形成的上包絡線的平均值和局部最小值定義所形成的下包絡線的平均值應等于零。其分解流程如圖1 所示,步驟如下。
圖1 EMD 流程圖Fig.1 Flow chart of EMD
步驟1:獲取凈負荷需求數(shù)據(jù)P(t),通過局部最大值和局部最小值的3 次樣條插值來創(chuàng)建其上包絡和下包絡線。
步驟2:計算上下包絡線的平均值m(t)。
步驟3:在原始凈負荷需求數(shù)據(jù)P(t)中減去m(t),檢驗剩余部分h(t)是否滿足之前所述的IMF的2 個要求,如果滿足則h(t)為其中一個IMF 分量,記為Ii(t),如果不滿足則將h(t)作為新的輸入重復步驟1 至步驟3,直至滿足要求。
步驟4:將所有IMF 從P(t)中分離出來,令IMF總個數(shù)為N,得到N個IMF 分量Ii(t),其中,i=1,2,…,N。檢驗殘余序列Res(t),停止條件為殘余序列是否為常數(shù)或單調函數(shù),如果不滿足則繼續(xù)尋找IMF,如果滿足則停止分解,最終的凈負荷信號分解結果如式(1)所示。
CEEMDAN 方法通過添加自適應白噪聲以及計算獨特信號殘差來克服EMD 的不足,從而獲得IMF,使重建后的信號幾乎與原始信號相同。CEEMDAN 方法不僅克服了現(xiàn)有的EMD 模式混合現(xiàn)象,而且通過增加分解次數(shù)減少了重構誤差。
定義Ej(·)為通過EMD 獲得的第j個模式分量的計算算子,則待分解的原始凈負荷曲線P(t)經(jīng)過CEEMDAN 的第k個IMF 為Iˉk,其算法步驟如下。
步驟1:CEEMDAN 采用原始凈負荷曲線P(t)+ε0ωi(t)在第1 階段(k=1)時進行M次實驗,其中ωi(t)為符合正態(tài)分布的高斯白噪聲,i=1,2,…,M,ε0為高斯白噪聲幅值常數(shù)。通過EMD對其進行分解,來獲取第1 個本征模態(tài)函數(shù)Ii,1,則CEEMDAN 得到的一個分量Iˉ1為M次實驗所有Ii,1的均值,即
步驟2:在第1 階段,計算第1 次的殘余序列r1(t)。
步驟3:對序列r1(t)+ε1E1(ωi(t))進行M次EMD,直到獲得其第1 個IMF,其中ε1為第1 階段后添加的高斯白噪聲自適應系數(shù),E1(·)為EMD 得到的第1 個分量。此時,可以計算得到CEEMDAN 的第2 個分量。
步驟4:對于其余每個階段k,需要重復步驟3,并按以下方式計算k+1 模態(tài)分量。
式中:rk(t)為第k次的殘差序列;εk為第k階段后添加的高斯白噪聲對應自適應系數(shù);Ek(·)為由EMD得到的第k個分量。
步驟5:執(zhí)行步驟4 直至獲得的殘差信號不再執(zhí)行任何IMF,且標準條件是無法從殘差中提取IMF,極端點的數(shù)量不超過2。
最終殘差信號為:
式中:K為模態(tài)分量的總數(shù)。
因此,原始凈負荷信號序列P(t) 經(jīng)過CEEMDAN 最終分解為:
CEEMDAN 方法通過添加標準正態(tài)分布的白噪聲可以解決傳統(tǒng)的EMD 模態(tài)混疊問題,在電力用戶側凈負荷信號分解上更具備自適應性[20-21]。
玻爾茲曼機由Hinton 和Sejnowski 于1986 年首次提出[22]。后來,Smolensky 提出了一種改進的玻爾茲曼機,也稱為受限玻爾茲曼機(restricted Boltzmann machine,RBM)。RBM 是一種能量生成模型,通常由2 層組成,即可見層和隱藏層,層間全連接。RBM 的體系結構如附錄A 圖A1 所示。
在圖A1 中,可見層V用于輸入訓練數(shù)據(jù),而隱藏層H包含特征檢測器。第σ個可見和隱藏單元分別用vσ和hσ表示,每一層可見單元數(shù)量和隱藏單元數(shù)量分別用nv和nh表示,aσ和bσ為偏差。同一層的各個單元之間沒有連接,但是每個單元仍然通過對稱權重矩陣W與另一層的單元完全連接。可見和隱藏單元的能量表示為:式中:wστ為可見層第σ個單元vσ與隱藏層第τ個單元hτ之間的權重參數(shù)。
可見層的概率分布函數(shù)為:
為了學習RBM 權重參數(shù)w、可見層偏置參數(shù)a、隱藏層偏置參數(shù)b的集合θ={w,a,b}的值,需要把方程式給出的似然函數(shù)最大化。似然函數(shù)形式定義為L=lnp(V),因此梯度為:
DBN[23]是一種導入的深度學習模型,而RBM是其基本模型之一,DBN 通過若干層RBM 堆疊后加一層反向傳播(back-propagation,BP)神經(jīng)網(wǎng)絡構成,其架構和訓練過程如附錄A 圖A2 所示。圖中所示的DBN 是通過堆疊若干個RBM 形成的。它的訓練過程分為2 個步驟:無監(jiān)督訓練和微調。在步驟1 即無監(jiān)督訓練期間,使用CD 算法以能量函數(shù)最低來訓練第1 個RBM。得到第1 個訓練完成的RBM 后,其隱藏層用作第2 層RBM 的可見層,以訓練第2 個RBM,以此類推直至所有的RBM 全部訓練完成。步驟2 使用從步驟1 獲得的參數(shù)作為初始值,通過BP 對DBN 進行微調。值得注意的是,通過使用從步驟1 獲得的參數(shù)初始化網(wǎng)絡而不是隨機初始化,可以避免訓練過程中的局部最優(yōu)。
為解決電表后分布式能源不可觀帶來的用戶側凈負荷難以精準預測問題,本文提出基于CEEMDAN-DBN 的電力用戶側凈負荷需求預測框架模型,如圖2 所示。
圖2 凈負荷需求預測框架模型Fig.2 Framework model of net load demand forecasting
首先獲取原始凈負荷數(shù)據(jù)信號,通過CEEMDAN 得到若干個IMF 分量及殘差分量r。之后引入電力用戶當?shù)氐臍庀髷?shù)據(jù),包括光照、溫度、風速等,這些因素關系到用戶電表后的光伏發(fā)電出力、風機發(fā)電出力和負荷數(shù)據(jù),對凈負荷有至關重要的影響,通過氣象數(shù)據(jù)與凈負荷數(shù)據(jù)構成訓練集合,針對每個IMF 分量獨立并行訓練DBN 模型,得到各自最佳預測模型。最后,通過測試集驗證,將所有DBN 的輸出結果相加得到最終的用戶凈負荷預測結果。為了驗證本文所提方法的優(yōu)越性和有效性,采用某地區(qū)實際凈負荷數(shù)據(jù)(該地區(qū)含有大量光伏發(fā)電與風機發(fā)電裝置,波動性清潔能源占比高)疊加到負荷數(shù)據(jù)上,導致凈負荷需求不平穩(wěn)性增強,體現(xiàn)了本文所提方法在非平穩(wěn)時序數(shù)列上預測的優(yōu)勢。
為了比較凈負荷需求信號的EMD 和CEEMDAN 的分解效果,選擇504 個用戶側負荷時序數(shù)據(jù)點進行分析,分解效果如圖3 和圖4 所示。根據(jù)CEEMDAN 的建議,ε0和M是非常重要的參數(shù)。ε0的合適值在0.01 至0.5 間,而較大的M會延長算法的運行時間??紤]到實際的計算條件,選擇ε0=0.2 和M=500。同時,EMD 和CEEMDAN 算法分解負荷曲線所用時間分別為0.665 s 和6.472 s,均滿足小時級尺度的短期負荷預測要求。
圖3 EMD 結果Fig.3 EMD results
圖4 CEEMDAN 結果Fig.4 CEEMDAN results
通過對比可以看到,與EMD 相比,CEEMDAN的IMF 更多,可以更有效地獲得信號的頻率分量,且IMF 更集中在特定的頻率上。CEEMDAN 的IMF 分量中IMF1 至IMF3 為幅值較低(均值為-0.015 MW)的高頻分量,是原始凈負荷中波動性難以預測的重要因素,但由于其幅值較低,預測誤差在凈負荷預測全局中顯得非常小。IMF4 至IMF6 為中等頻率分量,其幅值均值也在-0.015 MW 附近。IMF7 至IMF9 的頻率更低,波動較小,幅值較大,均值為1.221 MW。r為單調曲線,數(shù)值較大,幅值均值為32.501 MW。DBN 具有強大的非線性擬合能力,在面對較為平穩(wěn)的時序數(shù)列預測時能夠更好地發(fā)揮其預測能力。
本文采用了某地區(qū)的實際負荷數(shù)據(jù),同樣引入當?shù)氐臍庀髷?shù)據(jù),包括溫度、氣壓、光照、風速等,所選擇因素能夠影響用戶凈負荷。為了驗證本文所提方法的有效性,選擇平均絕對百分誤差eMAPE和均方根誤差eRMSE用于評判時序數(shù)列預測模型,作為評價預測模型準確性的指標,其計算公式為:
式中:yi和分別為第i個時刻的凈負荷需求實際值和凈負荷需求預測值;N為所有作為測試集的樣本個數(shù)。從計算公式上可以看到,eMAPE值代表了預測結果偏移的百分比,而eRMSE值代表了預測結果實際偏差的絕對值。eMAPE和eRMSE值越小說明預測效果越好。
凈負荷需求在經(jīng)過EMD 和CEEMDAN 后,分別形成了7 個和10 個IMF 分量,通過DBN 對每個IMF 分量各自的DBN 最佳模型進行獨立并行訓練,輸出預測結果并計算2 個誤差指標,如表1 和表2 所示。在使用DBN 獨立預測各IMF 分量時,選取日期、時間等要素和溫度、風速、光照強度等和負荷強相關的環(huán)境因素作為其輸入數(shù)據(jù),負荷作為預測模型的輸出結果,采用貪婪訓練法逐一搜索各DBN 的最佳層數(shù)與神經(jīng)單元數(shù)的最佳組合,選取前78%作為訓練集,剩余部份作為測試集進行模型有效性的驗證??梢钥吹?,DBN 在預測高頻信號分量時,雖然eMAPE值較大,但由于其幅值較小,產(chǎn)生的代表絕對誤差的eRMSE值并不大,因此高頻信號分量的預測誤差對最后的實際預測結果影響不會太大。在對中等頻率和低頻信號分量預測時,DBN 能夠展現(xiàn)出強大精準的預測能力,特別是對規(guī)律性較強、幅值較大的殘項,兩者的eMAPE值分別達到0.540% 和0.024%,eRMSE值分別為0.057 5 MW 和0.010 6 MW,能夠較好地克服傳統(tǒng)方法對高頻信號難以準確預測的不足,弱化其對最終負荷預測結果準確性的影響。
表1 EMD 各IMF 預測誤差Table 1 EMD forecasting error of each IMF
表2 CEEMDAN 各IMF 預測誤差Table 2 CEEMDAN forecasting error of each IMF
最后,將每個IMF 分量的預測結果疊加,可以得到最終的凈負荷需求預測結果,如圖5 所示。
圖5 不同算法負荷預測結果Fig.5 Load forecasting results with different algorithms
通過式(13)和式(14)計算可以得到,采用EMD-DBN 和CEEMDAN-DBN 方法得到的最終預測誤差eMAPE值分別為4.79%和4.32%,而采用DBN直接預測的誤差eMAPE值為5.55%,2 種方法分別將eMAPE值降低了13.69%和22.16%。同時,每個IMF預測的時間均在3 s 以內(nèi),足以滿足日前凈負荷小時級時間尺度的預測需求。此外,本文還將通過對比預測需求的算法,進一步論述分離方案。
為對比直接預測凈負荷需求和獨立預測疊加后的準確性,本文采用6 種常用的機器學習方法進行測試:多元線性回歸(MLR)、最小二乘支持向量機(LSSVM)、支持向量回歸(SVR)、高斯過程(GP)、LSTM 網(wǎng)絡和DBN,分別對比各自獨立預測與直接預測效果,并計算本文所用方法的性能提升效果。各個算法采用獨立預測方法和直接預測方法的誤差如表3 所示,同時給出了采用獨立預測算法后對預測模型的性能提升效果。
表3 不同方法預測誤差Table 3 Forecasting errors of different methods
與直接預測相比,獨立預測提高了4 組預測精度,平均預測誤差降低了14.08%。這是因為獨立預測不僅基于實測數(shù)據(jù),而且借助CEEMDAN 后形成幅值較低的高頻信號和幅值較大的低頻信號。在高頻信號預測時,預測誤差盡管偏移百分比較大,但對于凈負荷需求整體而言偏移量在可接受范圍內(nèi)。而在低頻信號預測時,能夠很好地擬合凈負荷需求曲線,淡化由高頻信號預測引入的誤差分量,從而提高了預測精度,進一步驗證了分離法的高效性。
為了解決用戶側可再生能源發(fā)電量無法監(jiān)測、配電網(wǎng)內(nèi)部分布式電源不可觀而帶來的凈負荷需求難以精準預測的問題,本文從數(shù)據(jù)層面出發(fā),將原始凈負荷數(shù)據(jù)分解為若干個頻率、幅值不一的時序分量,提出了一種基于CEEMDAN-DBN 的凈負荷需求預測方法。通過某地區(qū)實際凈負荷數(shù)據(jù)進行測試,可以得出如下結論。
1)CEEMDAN 能夠解決EMD 過程中的模態(tài)混疊問題,同常用的EMD 方法相比,有效地減少了迭代次數(shù),增加了重構精度,更加適合非線性信號的分析。
2)DBN 通過其強大的特征提取和函數(shù)表征能力,在處理高度復雜的隱性非線性時序數(shù)據(jù)擬合方面展現(xiàn)出明顯優(yōu)勢。
3)通過CEEMDAN 可以將原始的非平穩(wěn)序列分解為若干個幅值較低的高頻信號和幅值較大的低頻信號,配合DBN 智能算法,適用于非線性非平穩(wěn)的凈負荷需求,有助于降低凈負荷需求整體預測誤差。
后續(xù)研究將結合遷移學習、增量學習等技術手段,實現(xiàn)預測模型對用戶側模態(tài)變化的跟蹤與學習更新,提高預測模型的適應性與泛化能力。
附錄見本刊網(wǎng)絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡全文。