王雪菲, 李 勇, 余國曉, 程 晨, 楊輝軍
(1.安徽國際商務職業(yè)學院 信息工程學院, 合肥 231131; 2.安徽財經(jīng)大學 統(tǒng)計與應用數(shù)學學院, 蚌埠 233030;3.安徽大學 電子信息工程學院, 合肥 230601)
當今時代,電力系統(tǒng)安全、高效地運行是經(jīng)濟社會發(fā)展的基本支撐,而持續(xù)保障電力系統(tǒng)平穩(wěn)有序運營的重要途徑之一就是對電力負荷在不同時間跨度上進行針對性的有效預測[1]。根據(jù)預測的時間跨度,負荷預測被分為短期、中期和長期預測,而電力系統(tǒng)配件的檢測維修、電網(wǎng)發(fā)電機組等設備的啟動和關停以及不同地域之間的供需平衡是決定電網(wǎng)運行效益、降低成本和提高效率的關鍵,精確的短期預測對以上工作大有裨益[2]。
目前,常用的短期電力負荷預測方法主要分為時間序列方法和機器學習方法兩大類[3]。其中時間序列方法包括多元線性回歸法[4-5]、指數(shù)平滑模型法[6]和自回歸積分移動平均模型法[7-8]等。這些方法考慮了負荷數(shù)據(jù)的時序性特點,根據(jù)歷史負荷值來預測未來負荷值,建模簡單,但反映負荷序列的非線性行為能力較弱,且在預測精度上關注度不夠。機器學習方法主要包括模糊系統(tǒng)、神經(jīng)網(wǎng)絡和支持向量機(Support vector machine,SVM)等。文獻[9]將支持向量機與計量經(jīng)濟學中的協(xié)整檢驗以及Granger因果檢驗結(jié)合起來預測經(jīng)過季節(jié)分解的電力負荷。文獻[10-11]使用BP神經(jīng)網(wǎng)絡(Back propagation,BP)對相應的負荷數(shù)據(jù)進行預測,文獻[12-13]則針對短期用電負荷建立了人工神經(jīng)網(wǎng)絡模型進行處理預測。文獻[14]以相關性數(shù)據(jù)作為電力負荷日預測的基礎,通過相關性分析方法在模糊推理和灰色關聯(lián)分析的基礎上得出。機器學習方法能夠較好地逼近非線性負荷曲線,但是缺少對負荷數(shù)據(jù)時序相關性的考慮,需要人為選擇時間特征來保證預測的精度。為了充分評估負荷序列隨時間波動的特性,含外部輸入的NARX被逐漸運用在負荷預測領域[15-17]。NARX網(wǎng)絡是一種有效用于時間序列預測的非線性動態(tài)循環(huán)神經(jīng)網(wǎng)絡,該網(wǎng)絡當前時刻的輸出不僅與當前時刻的輸入有關,還與之前的輸入輸出有關,所以在數(shù)據(jù)非線性和時序性的處理上有所加強,但是在識別負荷序列潛在變化趨勢上依然有所欠缺,無法充分提取出短期負荷數(shù)據(jù)之間蘊含的有效信息。
針對上述問題,提出一種基于DMD-NARX模型的短期電力負荷預測方法,有效提高了短期負荷預測精度。首先,運用ACF分析歷史負荷數(shù)據(jù)獲取相應日期內(nèi)基于相應短期負荷波動時間規(guī)律特性的輸入特征集合。其次,將該集合做歸一化處理,然后運用Hankel把現(xiàn)有的單變量輸入特征序列轉(zhuǎn)換為多維數(shù)據(jù)矩陣,同時通過DMD模型將矩陣特征分解并取得動態(tài)模態(tài)估計。最后,將DMD方法得出的動態(tài)模態(tài)作為NARX神經(jīng)網(wǎng)絡的外部輸入特征,并運用此模型推導出相應日期內(nèi)各時段負荷的分布。
由于相鄰時刻之間的負荷波動相對較小,同時短期內(nèi)電力負荷的變化與時間存在內(nèi)在聯(lián)系,因此要分析出非連續(xù)負荷數(shù)據(jù)之間的潛在聯(lián)系,本文須把目標時刻負荷作為參照,同時分析過去時刻負荷對目標負荷的影響[18]。同時,ACF標準的大量推廣,就是為了能夠選擇出適宜的輸入特征集合,并推導出負荷數(shù)據(jù)中的潛在聯(lián)系[19]。假設一天的負荷序列表示為p=[pt:t∈T],則t時刻與t-k時刻負荷間的自相關系數(shù)如式(1)所示:
(1)
在已有歷史數(shù)據(jù)的基礎上,結(jié)合ACF分析可以推導出3個最強相關性的滯后變量:上周同一日同時刻的值、t時刻前一時刻的值和前兩日同時刻的值?;谝陨戏治?,同時考慮到雙休日的用電負荷普遍比工作日的用電負荷低,預測輸入特征包括上周同一日的負荷數(shù)據(jù)、上周前一日的負荷數(shù)據(jù)以及前兩日的負荷數(shù)據(jù),因此本文取得的星期一、星期二和雙休日輸入特征集合需要分別表示[20]。星期一和星期二都是工作日,考慮到工作日之間的用電負荷相比較而言波動不大,所以其對應的輸入特征集合分別由上周星期一到星期四的用電負荷、星期一和上周星期一到星期三的用電負荷構(gòu)成;雙休日兩天的輸入特征集合分別由星期五、上周星期五、上周星期六和上上周星期六的用電負荷和星期六、上周星期六、上周星期天和上上周星期天的用電負荷構(gòu)成。不同預測日期的具體輸入特征集合如表1所示,其中,Pset表示預測日期的輸入特征集合,pD-d(d=1,2,4,5,6,7,8,14)表示預測日期之前d天所對應的日負荷。
表1 不同預測日期輸入特征集合
短期負荷序列是一組非線性時間信號,可由多個影響因素疊加組成,為了進一步提高短期負荷預測精度,需要精準獲取負荷序列的動態(tài)特征,但是負荷序列的動態(tài)特征往往受到多種因素影響。通過將一維矩陣轉(zhuǎn)為多維矩陣負荷序列轉(zhuǎn)換的過程,有效提升后期DMD方法對電力負荷數(shù)據(jù)的變化趨勢和底層多尺度動態(tài)的抓取能力,其中也包括對負荷數(shù)據(jù)矩陣進行特征分解和動態(tài)模態(tài)估計能力的提升。
首先,將預測日期輸入特征集合Pset構(gòu)建為輸入特征序列Pis=[p1,p2,…,pk,…,pM],并對Pis進行歸一化處理,歸一化形式為:
(2)
式中:xi為歸一化后的輸入特征;pmax和pmin分別表示序列Pis的最大和最小值。
(3)
DMD方法是圍繞線性Koopman算子概念發(fā)展的數(shù)據(jù)驅(qū)動的矩陣分解技術[22],通常應用于流體分析、復雜系統(tǒng)構(gòu)建以及數(shù)據(jù)挖掘等方面。將空間維度上的主成分分析結(jié)合時間維度上的功率譜分析是DMD方法的創(chuàng)新點所在[23],這種方法和只能提取一種模態(tài)的方法相比,由于可以在兩者結(jié)合的基礎上再提取出數(shù)據(jù)的時間和空間模態(tài),DMD可以更加精確地感知到數(shù)據(jù)中存在的潛在趨勢性。
假設X1和X2是由Hankel矩陣X創(chuàng)建的觀察矩陣,數(shù)據(jù)按照Δt時間間隔開,并且隨時間重疊。
X1=[x1,x2,…,xL-1]
(4)
X2=[x2,x3,…,xL]
(5)
在 Koopman 算子線性映射的運算策略基礎上,一個與系統(tǒng)矩陣A實現(xiàn)相鄰時刻狀態(tài)的投影關聯(lián)也可推導出,即xj+1=Axj,基于上述分析,式(4)和式(5)可進一步轉(zhuǎn)換為:
X1=[x1,Ax1,…,AL-2x1]
(6)
X2=AX1
(7)
當前,觀察矩陣X2的系統(tǒng)特性可通過矩陣A的屬性,如特征值和特征向量等反映出來。需要指出的是,當動態(tài)系統(tǒng)變化逐漸變緩,線性依賴關系將在各個數(shù)據(jù)之間逐漸形成[24],即X2中的觀測值xL可以由前一時刻X1中L-1個觀測值的加權(quán)線性組合表示:
xL=a1x1+a2x2+…+aL-1xL-1+r=X1a+r
(8)
式中:a1,a2,…,aL-1是L-1個觀測值的權(quán)重;r是長度為S的殘差向量?;诖耍赏茖С鲆韵鹿剑?/p>
(9)
X2=AUΣVH=UΣVHB
(10)
B=VΣ?UHX2
(11)
(12)
式中:?是偽逆操作。對式(12)進行特征分解可得:
(13)
Ψ=UW
(14)
Ψ的每一列是對應于Λ中特征值λi的DMD模態(tài)。結(jié)合式(14),Ψ推導出最終估計的模態(tài)如下:
(15)
式中:C=Ψ?x1表示DMD模態(tài)的初始幅度;Ω=ln(Λ)/Δt;t是一天中的時刻點。
NARX神經(jīng)網(wǎng)絡是一種動態(tài)循環(huán)網(wǎng)絡,這種網(wǎng)絡可以通過輸入和反饋連接同時采用時間延遲的條件下獲得,并且能夠在下一次的迭代訓練中在輸入端使用輸出信號,同時由于其本身的記憶體系較強,所以在對復雜映射關系的時變系統(tǒng)的描述上具備更強的能力,這也是該體系在非線性時間序列預測領域被廣泛應用的原因[25]。與傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(Recurrent neural network,RNN)綜合比較,NARX在學習能力、收斂速度、泛化性能以及預測精度等方面表現(xiàn)出了更好的效果[26]。NARX的數(shù)學表達式為:
(16)
典型的NARX神經(jīng)網(wǎng)絡主要包括輸入層、隱含層、輸出層及輸入和輸出延時層幾個部分,其基本結(jié)構(gòu)如圖1所示。圖中,wih、who和wjh表示各層鏈接之間的權(quán)重;b0和bh均表示閾值;fh(·)和fo(·)分別是隱含層和輸出層的功能函數(shù);z-1表示一個步長的延遲。
圖1 NARX神經(jīng)網(wǎng)絡結(jié)構(gòu)圖
NARX隱含層的作用是剔除不重要的信息,并在此基礎上存儲重要的信息。原則上隱含層層數(shù)與模型的非線性映射能力成正比,即層數(shù)越多,擬合效果越好。但是層數(shù)的增加也會導致訓練時間的增長,所以一般會綜合考慮,選擇相對用時較少、性價比較高的方案。根據(jù)Kolmogorov定理,任意的非線性特性最多只需兩層隱含層便可辨識出[27],因此,模型只需選取一個隱含層即可,在此條件下既可以保障模型預測結(jié)果的匹配度,又可以節(jié)約大量的時間[28]。同時,按照以下的經(jīng)驗公式選取隱含層節(jié)點數(shù),劃定隱含層節(jié)點范圍:
(17)
式中:h為隱含層節(jié)點個數(shù);mi為輸入層的節(jié)點個數(shù);mo為輸出層的節(jié)點個數(shù)。
基于DMD-NARX模型的短期電力負荷預測模型的主體結(jié)構(gòu)由兩塊構(gòu)成,DMD部分主要用于特征提取,NARX網(wǎng)絡主要負責電力數(shù)據(jù)負荷的預測。負荷數(shù)據(jù)集因系統(tǒng)故障等原因,可能存在個別數(shù)據(jù)異常情況,異常數(shù)據(jù)往往和正常數(shù)值偏離較大,可采用模糊聚類[29]、神經(jīng)網(wǎng)絡和基于最大閾值法[30]等方法修正異常數(shù)據(jù)。模型流程圖和模型整體程序偽代碼分別如圖2和表2所示。
圖2 短期負荷預測模型流程圖
表2 整體程序偽代碼
(1)對以往的歷史實際數(shù)據(jù)進行收集,并將數(shù)據(jù)進行一系列預處理,即對異常值進行修正,將其分為訓練集和測試集;
(2)根據(jù)ACF分析結(jié)果,構(gòu)建訓練集和測試集的輸入特征集合;
(3)先進行輸入特征集合到輸入特征序列的轉(zhuǎn)換,并在成功完成歸一化運算處理后將處理結(jié)果轉(zhuǎn)換為多維特征Hankel矩陣,其滑窗的長度一般為一維特征序列總長度的四分之一;
(4)以Hankel矩陣為基礎創(chuàng)建DMD的觀察矩陣,然后通過DMD方法估計出負荷系統(tǒng)的動態(tài)模態(tài);
(5)經(jīng)過(4)的推導運算可得到NARX神經(jīng)網(wǎng)絡的外部輸入特征,與動態(tài)模態(tài)對應時刻的歷史負荷作為網(wǎng)絡輸出;
(6)在確定了延遲階數(shù)和隱含層節(jié)點數(shù)之后,可以基于神經(jīng)網(wǎng)絡進行相應訓練,在訓練所得精度達到規(guī)定標準后可使用模型對測試集進行相應預測。
為驗證本文所提方法的有效性和普適性,使用兩個負荷數(shù)據(jù)集對模型進行驗證,并將本文所提方法和NARX模型、傳統(tǒng)RNN模型以及SVM模型方法的預測結(jié)果進行對比分析,為保證測試的嚴謹性,每種模型的輸入輸出特征以及預測時間點必須保持一致。兩個負荷數(shù)據(jù)集分別是澳大利亞新南威爾士州公開數(shù)據(jù)集和中國安徽省合肥市的實際電力負荷數(shù)據(jù)集。新南威爾士州公開數(shù)據(jù)集提供了2006年1月1日至2010年12月31日共5年的電力負荷數(shù)據(jù),每天取48個采樣值,即采樣頻率是30分鐘。合肥市的實際電力負荷數(shù)據(jù)集包括2016年1月1日至2017年12月31日共2年的電力負荷數(shù)據(jù),每天取24個采樣值,即采樣頻率是60分鐘。
本文選取的各種模型預測精度評價指標為平均絕對百分比誤差(Mean absolute percentage error,MAPE)和均方根誤差(Root mean square error,RMSE)。MAPE取值越小,模型的預測性能越好,其結(jié)果可以評價模型的優(yōu)良性。而RMSE同樣是取值越小越好,同時由于其對極大或極小誤差的敏感度較高,其運算結(jié)果也可用以評價模型的預測精度。兩個評價指標表達式為:
(18)
(19)
由于電力需求數(shù)據(jù)的變化與不同季節(jié)氣候的變化息息相關,因此若要充分驗證模型識別氣候和季節(jié)特征變化的能力,就必須通過對4個不同季節(jié)中負荷預測的結(jié)果進行分析,對比凸顯本文所建模型的預測能力。對比測試中使用相同地區(qū)不同季節(jié)的前10周作為訓練集(春季9月~11月、夏季12月~2月、秋季3月~5月、冬季6月~8月),在此基礎上同時對后一周電力負荷數(shù)據(jù)進行預測。圖(3)所示是對相同地區(qū)不同季節(jié)中的某一天的預測結(jié)果進行對比。
根據(jù)圖3觀察得出,對比分析不同季節(jié)負荷數(shù)據(jù)的預測結(jié)果,與其對比方法相比,本文所提出的基于DMD-NARX模型方法,對原始負荷曲線具有更好的擬合能力,同時,由于電力負荷數(shù)據(jù)底層的變化趨勢能夠被DMD有效識別,因此,本文所建立的模型在負荷曲線波動較大的位置上亦可表現(xiàn)出更高的擬合度,從而驗證了本文所提方法對提高短期負荷預測精度的有效性。
圖3 不同季節(jié)日負荷預測結(jié)果對比
表3為不同方法對4個季節(jié)中某一天負荷預測的精度結(jié)果。由此可見,本文所提方法預測精度的平均值高于其他3種方法,其中eMAPE誤差的平均值為0.57%,相比NARX模型、RNN模型和SVM模型方法精度分別提高了46.73%、60.14%和57.46%;eRMSE誤差的平均值為66.38 MW,相比NARX模型、RNN模型和SVM模型方法,誤差分別降低了69.52、92.09和82.34 MW。結(jié)合不同季節(jié)相應日期預測結(jié)果可以看出,NARX模型對時序預測的問題也取得了良好的效果,說明該模型對歷史負荷信息的利用效率較高。下一步將DMD分解導入NARX神經(jīng)網(wǎng)絡模型中,通過這種方法在增強預測模型對負荷數(shù)據(jù)之間潛在關聯(lián)和底層變化發(fā)掘能力的基礎上,進一步增強了模型預測精度。
表3 不同季節(jié)預測日期負荷預測精度對比
表4為2007年2月17日部分時刻的負荷預測結(jié)果。從eMAPE誤差的平均值可以看出,本文所提出的DMD-NARX模型和NARX對比模型各時刻點的eMAPE誤差平均值為0.50%和1.42%,相比于SVM模型和RNN模型精度分別提高了75.73%和31.07%以及76.53%和33.33%。在NARX模型中,雖然個別時刻點預測精度接近99.95%,預測結(jié)果相對準確,但由于整體預測結(jié)果偏差較大,誤差最大值達到9.82%,降低了模型整體的預測性能。而引入了DMD方法的NARX模型很好地解決了預測結(jié)果波動較大的問題,誤差范圍基本穩(wěn)定在0.50%左右,既提高了負荷預測精度,又保證了預測結(jié)果穩(wěn)定性。
表4 2007年2月17日部分時刻負荷預測結(jié)果
將合肥市數(shù)據(jù)劃分為兩種數(shù)據(jù)集,神經(jīng)網(wǎng)絡常用訓練集占總樣本數(shù)據(jù)的2/3以上,為了保證預測模型的有效性,訓練集是前10周的數(shù)據(jù),測試集為后1周的數(shù)據(jù),使用各類模型方法預測測試集的日負荷。圖4為測試集在各類模型運行下的結(jié)果對比。
圖4 各模型預測日期負荷結(jié)果對比
從幾種不同方法預測結(jié)果的比較中可以看出,與原始負荷曲線擬合度相對較高的是DMD-NARX模型方法,即使在負荷變化較大的區(qū)域,DMD-NARX模型方法同樣能進行較為準確的預測,且預測效果優(yōu)于其它方法,這與對新南威爾士州負荷預測結(jié)果的分析是相同的,在負荷序列潛在變化趨勢的抓取能力上,本文所使用的DMD方法具有一定優(yōu)勢,因此在電力負荷曲線出現(xiàn)較大范圍波動時也表現(xiàn)出較高的擬合度。
表5為不同方法對2017年6月某周五的負荷預測精度對比。從表中可知,本文所提出的DMD-NARX模型方法的預測效果優(yōu)于其他3種方法,eMAPE和eRMSE指標的精度分別是0.56%和98.78 MW,比其它3種方法精度平均提高了56.38%和59.93%,驗證了所提模型對提高負荷預測精度的有效性及普適性。
表5 各模型預測日期負荷精度對比
提出一種基于DMD-NARX模型的短期電力負荷預測方法,得出以下結(jié)論:
(1)通過考慮負荷序列的時序變化規(guī)律和數(shù)據(jù)潛在的變化趨勢,將DMD方法引入NARX模型中,既加大了對負荷序列潛在變化趨勢的發(fā)掘深度,又提高了對負荷序列非線性變化的模型識別水平,同時針對負荷曲線波動較大的情況具備了更強的擬合能力,提升了預測模型的整體性能。
(2)與單一模型和其組合模型相比,本文所提出的DMD-NARX模型能夠在預測精度高的同時保證模型的普適性能,符合負荷預測的實際需求。
(3)后續(xù)將結(jié)合注意力機制、殘差網(wǎng)絡等技術,充分挖掘更多可表征的預測特征,進一步提升預測精度。