黃星知,劉 星,張文娟,張永飛
(1. 國網(wǎng)湖南省電力有限公司信息通信分公司,湖南 長沙 410007; 2.北京國電通網(wǎng)絡(luò)技術(shù)有限公司,北京 100070)
現(xiàn)代電力系統(tǒng)中,準確的負荷預(yù)測可以在滿足技術(shù)約束的同時達到卓越的電網(wǎng)運營效果,并提高電力公司和終端用戶的財務(wù)收益。相關(guān)文獻研究了在確定性和概率框架下不可調(diào)度負荷的內(nèi)在隨機性,其中后者更受關(guān)注,因為其可以滿足在不確定性條件下進行風(fēng)險評估和決策的需要[1-6]。文獻[1-6]在進行概率負荷預(yù)測(Probabilistic Load Forecasting,簡稱PLF)時討論了一些非參數(shù)方法的特點,包括基于分位數(shù)的回歸法[2]、集成組合法[3]、分位數(shù)回歸森林法(Quantile Regression Forests,簡稱QRFs)[4]和梯度增強回歸樹法(Gradient Boosting Regression Tree,簡稱GBRT)[5]等,其中負荷預(yù)測追蹤[6]進一步提高了預(yù)測性能。
與確定性負荷預(yù)測相比,這些文獻研究突出了PLF特有方法的稀缺性,對比了促進PLF發(fā)展的最新趨勢。在確定性負荷預(yù)測中,通常采用小波分解(Wavelet-Based Decompositions ,簡稱WBDs)對輸入負荷時間序列進行預(yù)處理,以通過頻譜內(nèi)容分離各分量,最常見的是與人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡稱ANNs)進行交互使用。
當前,WBDs在PLF中的應(yīng)用仍在評估中。文獻[7]對WBDs在概率可再生能源預(yù)測中的一些應(yīng)用進行了研究,但只有少數(shù)文獻對PLF中的WBDs進行了研究,而且都是利用ANNs進行預(yù)測。文獻[8]提出了一種新的集成方法,該方法中母小波和分解層次是不同的,通過偏最小二乘回歸將各個結(jié)果聚合起來形成集成預(yù)測。文獻[9]將負荷時間序列通過小波分解成3個分量,并對每個分量應(yīng)用3個ANNs,為了重建最終的負荷預(yù)測,只提出了一種估計預(yù)測總體方差的方法。文獻[10]將確定性ANNs應(yīng)用于負荷分量,使用Bootstrapping添加有關(guān)預(yù)測不確定性的信息。
這些文獻研究主要存在以下不足:①使用的是人工神經(jīng)網(wǎng)絡(luò),因此沒有其他模型與用于PLF的WBDs相結(jié)合;②使用離散小波變換(Discrete Wavelet Transform,簡稱DWT)來分解負荷時間序列;③通過Bootstrapping或評估點預(yù)測的方差來建立概率預(yù)測;④概率預(yù)測是根據(jù)可靠性或清晰度進行評估的,但沒有適當?shù)姆謹?shù)用于全面量化概率預(yù)測的性能[11-12]。
對于問題④,本文采用一個嚴格恰當?shù)姆謹?shù)來綜合評價負荷概率預(yù)測的準確性,并使用特定的圖表和指標分別評估概率預(yù)測的可靠性和清晰度。本文提出一種新的協(xié)同預(yù)測系統(tǒng),以解決問題①~③。該系統(tǒng)采用QRFs進行重要負荷分量的概率預(yù)測,用RF進行非重要負荷分量之和的確定性概率預(yù)測。每個模型返回預(yù)測樣本組合以構(gòu)建最終的負荷預(yù)測,避免分位數(shù)交叉。
本文使用2014年全球能源預(yù)測競賽(2014 Global Energy Forecasting Competition,簡稱GEFCOM 2014)[6]公布的實際負荷數(shù)據(jù)進行仿真分析,并考慮幾個概率基準,以便對所提方法的有效性進行全面評估。
本文提出的協(xié)同預(yù)測系統(tǒng)包括4個步驟,如圖1所示。
圖1 協(xié)同預(yù)測系統(tǒng)程序示意圖
步驟1:在原始負荷時間序列的WBD中,分離與典型負荷季節(jié)性(如每日或每周季節(jié)性)相關(guān)的特定頻率對應(yīng)的負荷分量。WBD可以捕捉到負荷時間序列的季節(jié)性,從而分別處理不同的光譜內(nèi)容。本文比較了4種不同的WBDs(DWT,WPT,SWT和DT-CWT),它們以不同的方式分割原始時間序列的光譜內(nèi)容。具體而言,選擇DWT作為基準小波分解,其他3個分解克服了DWT的一些主要缺點,提高了預(yù)處理的性能。WPT對沿整個光譜內(nèi)容的頻率進行均勻分解,SWT和DT-CWT則保證了分解對沿時間序列移動的不變性。步驟1的輸入是負荷時間序列P,輸出是N個負荷分量P(1),…,P(N)。
步驟2:N個負荷分量被標記為J個重要負荷分量P(s1),…,P(sJ)和K個非重要負荷分量P(ns1),…,P(nsK),其中N=J+K。重要負荷分量滿足:①包含負荷時間序列分析中與典型季節(jié)性對應(yīng)的頻率;②能量含量高于原始負荷時間序列能量含量的閾值百分比。
本文提出8種概率基準。前3種基準不考慮負荷時間序列的預(yù)處理,可以評估用WBD預(yù)處理負荷時間序列是否能夠提高預(yù)測的準確性。第4和第5種基準沒有使重要和非重要負荷分量的處理多樣化,可用于評估重要和非重要負荷分量的處理多樣化是否會提高預(yù)測的準確性。第6種基準中用一個確定的模型來計算重要負荷分量之和,用一個概率模型來計算非重要負荷分量之和,因此可評估將概率模型應(yīng)用于重要分量和確定性模型應(yīng)用于非重要分量是否優(yōu)于其他模型。第7種基準主要研究的是與GBRT交互的WBDs,而不是QRFs。第8種基準是一個初步的模型,僅供參考。
(1)QRF基準(版本1):第一個QRF基準(QRF-B1)改編自文獻[13],直接將單個QRF應(yīng)用于原始負荷時間序列,以便根據(jù)預(yù)測分位數(shù)構(gòu)建負荷概率預(yù)測。
(2) QRF基準(版本2):第二個QRF基準(QRF-B2)改編自文獻[13],將單個QRF應(yīng)用于在[0,1]范圍內(nèi)規(guī)范化的負載時間序列,這種標準化可能有助于獲得更準確的預(yù)測。在這個基準中,所有的外部定量預(yù)測因子也都在[0,1]范圍內(nèi)被標準化,對負荷時間序列的平均值(或最大值)的規(guī)范化可以返回非常相似的結(jié)果,本文中不顯示以避免冗長的表示。
(3)GBRT基準:GBRT基準(GBRT-B)基于用于分位數(shù)回歸的GBRT方法,以適應(yīng)概率框架,本文是利用R語言中的gbm包開發(fā)的。
(4)帶WBDs的QRF基準(版本1):DWT-QRF基準(DWT-QRF-B)、WPT-QRF基準(WPT-QRF-B)、SWT-QRF基準(SWT-QRF-B)和DT-CWT-QRF基準(DT-CWT-QRF-B)將相應(yīng)的WBD應(yīng)用于原始負荷時間序列,所有分量都通過不同的QRF進行處理。在實施過程中,不執(zhí)行步驟2,也不使用確定性預(yù)測方法處理任何分量,而是直接按照步驟4進行負荷預(yù)測重建。通過試驗,DT-CWT-QRF-B在所考慮的所有場景和周期中都優(yōu)于其他3個QRF基準。因此,本文只將DT-CWT-QRF-B的結(jié)果添加到比較分析中。
(5)帶WBDs的QRF基準(版本2):通過將相應(yīng)的WBD應(yīng)用于原始負荷時間序列,提出另一種DWT-QRF基準(DWT-QRF-B2),WPT-QRF基準(WPT-QRF-B2),SWT-QRF基準(SWT-QRF-B2)和DT-CWT-QRF基準(DT-CWT-QRF-B2)。在這些基準中,通過不同的QRF來處理重要負荷分量和非重要負荷分量之和。實際上,只用到步驟3中的概率預(yù)測方法,根據(jù)步驟4重構(gòu)最終負荷預(yù)測。通過試驗可知,在所有考慮的場景和周期中,WPT-QRF-B2和DT-CWT-QRF-B2優(yōu)于其他兩個基準。因此,本文只將WPT-QRF-B2和DT-CWT-QRF-B2的結(jié)果添加到后面的比較分析中,以避免冗余。
(6) 帶WBDs的RF/QRF基準:包括基準DWT-RF/QRF-B,WPT-RF/QRF-B,SWT-RF/QRF-B和DT-CWT-RF/QRF-B。在這些基準中,WBD用于負荷時間序列(如步驟1所示),并且重要負荷分量是個性化的(如步驟2所示)。在步驟3中所采取的操作是相反的:RFs應(yīng)用于重要負荷分量,QRF應(yīng)用于非重要負荷分量之和,最后按照步驟4進行最終負荷預(yù)測重建。在試驗中,DT-CWT-RF/QRF-B在所有考慮的場景和周期方面都優(yōu)于其他3個基準,因此只將DT-CWT-RF/QRF-B添加到比較分析中。
(7)帶WBDs的GBRT基準:帶WBDs的基于GBRT的基準(即DWT-GBRT-B,WPT-GBRT-B,SWT-GBRT-B和DT-CWT-GBRT-B),包括將GBRT用于WBDs產(chǎn)生的重要負荷分量的分位數(shù)回歸,以及將GBRT用于非重要負荷分量的確定性回歸。在試驗中,DT-CWT-GBRT-B在所有考慮的場景和周期方面都優(yōu)于其他3個基于GBRT的基準,因此只將DT-CWT-GBRT-B添加到比較分析中。
(8)初步基準:初步基準(N-B)是基于負荷的持久性的[14]。假設(shè)負荷在整個預(yù)測提前期內(nèi)保持恒定,并且每個預(yù)測分位數(shù)是最后一個觀測值(即預(yù)測起點處的負荷),則該基準可以提供一個無偏見、易于復(fù)制的參考。
本文主要利用彈球損失(Pinball Loss,簡稱PL)來比較預(yù)測結(jié)果。PL是一個嚴格正確的分數(shù),同時解決了預(yù)測的可靠性和清晰度問題。
對于給定的預(yù)測范圍和分位數(shù)水平,PL計算公式為
(1)
總PL是通過Q分位數(shù)水平求和并通過預(yù)測總數(shù)U求平均得到的,PL是一個正的、反向分數(shù),因此較小的PLs表明了更好的概率預(yù)測。
采用可靠性評估從概率預(yù)測中得到預(yù)測區(qū)間的一致性,通常通過可靠性圖或平均絕對覆蓋誤差(Average Absolute Coverage Error,簡稱AACE)指數(shù)來進行評估。
本文考慮用可靠性圖綜合評價方案的可靠性,并用AACE給定負荷預(yù)測和標稱覆蓋率,AACE(百分比)是標稱覆蓋率和估計覆蓋率之間的平均絕對差:
(2)
其中,較小的AAACE值表示更可靠的預(yù)測。
采用清晰度評估從概率預(yù)測中獲得的預(yù)測區(qū)間的寬度,通常是通過預(yù)測區(qū)間歸一化平均寬度(Prediction Interval Normalized Average Width,簡稱PINAW)來進行評估。給定U個預(yù)測、一個標準值P和標稱預(yù)測間隔率ρ,該間隔率下的PINAW:
(3)
越小的PPINAW值表示預(yù)測越清晰。本文考慮了兩個標稱預(yù)測間隔率(0.1和0.9)下的PPINAWs,并且P是訓(xùn)練期間的最大觀測負荷。
下面介紹仿真中使用的數(shù)據(jù)以及使用所提方法得到的預(yù)測結(jié)果,并與通過基準模型得到的結(jié)果進行比較。日前(1~24 h)提供每小時分辨率的負荷預(yù)測,此外,在αq=0.01,0.02,…,0.99時,對于每個預(yù)測值有Q=99個分位數(shù)。所提方法包括DWT-QRF/RF-M,WPT-QRF/RF-M,SWT-QRF/RF-M和DT-CWT-QRF/RF-M,分解層級數(shù)為4,以便根據(jù)每日季節(jié)性分離分量。
本文使用的數(shù)據(jù)是由GEFCOM 2014的第一個任務(wù)1區(qū)提供的,預(yù)測系統(tǒng)根據(jù)2005年1月1日至2010年9月30日的每小時數(shù)據(jù)進行訓(xùn)練,測試期為2010年10月1日至2011年9月30日(即預(yù)測實例)。
在兩種不同的場景下分別進行仿真。第一種場景(SC1)下,不使用溫度作為RF和QRF的外部預(yù)測因子,以便在只有歷史負荷可供預(yù)測的情況下校驗預(yù)測性能。第二種場景(SC2)是一個基于溫度的場景,使用GEFCOM 2014組織者提供的25個氣象站的平均溫度作為外部預(yù)測因子,以提高預(yù)測性能[6]。在這兩種情況下,對一天中的一小時、一周中的一天、一個月中的一天和一年中的一個月使用日歷進行定性預(yù)測,這些日歷預(yù)測值與文獻[14]相同,負荷及溫度數(shù)據(jù)集統(tǒng)計參數(shù)見表1。
表1 負荷及溫度數(shù)據(jù)集統(tǒng)計參數(shù)
下面主要討論QRFs和RFs在MATLAB中的訓(xùn)練和運行,而GBRT是在R語言中訓(xùn)練和運行的。
建立一年每小時預(yù)測所需的平均時間(即8 760個預(yù)測實例)如表2所示。
表2 平均計算時間
SC1仿真結(jié)果顯示,所提方法在較小的預(yù)測周期(1 h和6 h)情況下要優(yōu)于基準模型,在24 h的預(yù)測周期下二者差距較小。對于1 h, 6 h和24 h的預(yù)測周期,最優(yōu)方法的PL分別比最佳基準值小13.5%,4.2%和0.2%;在24天的預(yù)測期內(nèi),WPT-QRF/RF-M的PL最小,比最佳基準(即DT-CWT-QRF-B2)小1.5%。
場景SC1下WPT-QRF/RF-M,WP-QRF-B2和QRF-B2預(yù)測方法的損益以及日前水平的提前時間如圖2所示。將其與基準WPT-QRF-B2進行比較,以評估不同方法處理重要和非重要負荷分量的影響;與QRF-B2比較以評估WBD對預(yù)處理負荷時間序列的影響。由圖2可知:當預(yù)測周期長達12 h甚至超過19 h時,WPT-QRF/RF-M要優(yōu)于WPT-QRF-B2;在日前水平上QRF-B2性能不及帶WBD的方法。
圖2 場景SC1中WPT-QRF/RF-M,WPT-QRF-B2和QRF-B2預(yù)測方法的損益以及日前水平的提前時間
所提方法可以產(chǎn)生1 h和6 h預(yù)測周期的最可靠預(yù)測結(jié)果,而GBRT-B是24 h預(yù)測周期時最可靠的方法。WPT-QRF/RF-M,WPT-QRF-B2和QRF-B2在3個預(yù)測周期內(nèi)的可靠性如圖3所示。WPT-QRF/RF-M覆蓋率在較高水平上往往被低估,而WPT-QRF-B2和QRF-B2覆蓋率總是被高估。DT-CWT-RF/QRF-B在所有考慮的預(yù)測周期中是最清晰的方法,但其可靠性較差,從而PL較大。
WBD預(yù)處理可提高預(yù)測性能,但隨著預(yù)測周期的增加,這些優(yōu)勢往往會減少。比較最差的方法(即DT-QRF/RF-M)和最好的沒有WBD的QRF基準(即QRF-B2),前者的PL在1 h, 6 h和24 h的周期內(nèi)分別減小約29.5%,26.5%和1%。將GBRT-B與DT-CWT-GBRT-B進行比較發(fā)現(xiàn),WBD預(yù)處理提高了最終負荷預(yù)測的性能。這進一步表明,WBDs可以改進概率負荷預(yù)測。
分析所提方法的結(jié)果和以相同方式處理負荷分量的方法(DT-CWT-QRF-B,WPT-QRF-B2和DT-CWT-QRF-B2)的結(jié)果可知,這3個預(yù)測周期內(nèi)的最佳方法都優(yōu)于最佳基準。但是,最差的方法(即DWT-QRF/RF-M)無法在24 h預(yù)測周期內(nèi)提供小于最佳基準的PL。這表明,對重要和不重要負荷分量進行多樣化處理,可以最大限度地縮短預(yù)測周期,但性能會隨著預(yù)測周期的增加而下降。無溫度情況(SC1)所獲結(jié)果如表3所示。
表3 無溫度情況(SC1)所獲結(jié)果
考慮溫度的場景下(SC2)的結(jié)果如表4所示。所提方法僅在較短的預(yù)測周期(1 h和6 h)內(nèi)優(yōu)于基準,但在24 h預(yù)測周期內(nèi),其要優(yōu)于帶WBD的QRF基準。參照最佳基準,最佳方法的PL將減少7.1%(1 h預(yù)測周期),6%(6 h預(yù)測周期),而24 h預(yù)測周期的PL則會增加2%。在一天24個預(yù)測周期內(nèi),SWT-QRF/RF-M的PL最小,比最佳基準(即DT-CWT-QRF-B2)的PL小約1%。
表4 考慮溫度的場景下(SC2)的結(jié)果
場景SC2下WPT-QRF/RF-M,WPT-QRF-B2和QRF-B2預(yù)測方法的損益與日前預(yù)測周期的關(guān)系如圖4所示。由圖4可知,WPT-QRF/RF-M僅在10 h內(nèi)優(yōu)于WPT-QRF-B2,QRF-B2的準確度低于帶WBDs的方法。
圖4 場景SC2中WPT-QRF/RF-M, WPT-QRF-B2和QRF-B2預(yù)測方法的損益與日前預(yù)測周期的關(guān)系
所提方法可以產(chǎn)生最可靠的1 h預(yù)測周期的預(yù)測結(jié)果,而基于GBRT的基準是最可靠的6 h和24 h預(yù)測周期下的預(yù)測方法。
所用方法中最差的(即DWT-QRF/RF-M)在1 h, 6 h和24 h的預(yù)測周期內(nèi),PL分別以25%,14.4%和1.2%的比例優(yōu)于沒有WBD的最佳QRF基準(即QRF-B2)。
即使底層模型是GBRT,應(yīng)用WBD預(yù)處理也會提高其準確性,在基于溫度的場景中還會進一步提高性能。與場景SC1相反,最佳方法并不總是優(yōu)于以相同方式處理負荷分量的基準(即DT-CWT-QRF-B,WPT-QRF-B2和DT-CWT-QRF-B2)。特別是,在24 h預(yù)測周期內(nèi),這些基準的表現(xiàn)要優(yōu)于所提方法。對重要和不重要負荷分量進行多樣化處理,可最大限度地縮短預(yù)測周期,但預(yù)測性能會隨周期的增加而下降。
本文評估了WBDs在PLF中的應(yīng)用,提出了一種基于WBDs的協(xié)同預(yù)測系統(tǒng)。該系統(tǒng)將重要負荷分量和非重要負荷分量進行分離,分別通過QRFs和RF進行預(yù)測,并將所提方法與采用不同模型處理負荷分量的系統(tǒng)、WBD為預(yù)處理負荷時間序列的系統(tǒng)以及其他相關(guān)基準進行比較。最后,根據(jù)GEFCOM 2014年提供的實際數(shù)據(jù),通過數(shù)值仿真分析驗證了所提方法的有效性。所提方法最大的改進是可在最短的預(yù)測周期內(nèi)獲得,其中負荷時間序列的WBD提升了預(yù)測性能,在1 h的預(yù)測周期內(nèi),PL減少了29.5%。在未來一天的預(yù)測水平上,WPT-QRF/RF-M和SWT-QRF/RF-M的預(yù)測結(jié)果略好于其他方法,但PL減少不到2%。下一步將進一步研究WBD與其他概率模型的集成,以及基于WBD的新PLF系統(tǒng)的開發(fā)等。