段煉,鄉(xiāng)立,吳瓊,陸顥文,李茜瑩,孫毅
(1.廣東電網有限責任公司廣州供電局,廣東 廣州 510630;2.華北電力大學 電氣與電子工程學院,北京 102206)
短期負荷預測是指在考慮天氣因素、日類型等因素的前提下以小時、日或周為單位對電力系統(tǒng)的負荷進行預測[1]。相較于其他周期的負荷預測,短期負荷預測更具實際意義,是調度安排開停機計劃、機組最優(yōu)組合、經濟調度、電力市場交易的重要基礎數據[2-4]。短期負荷預測精度越高,越有利于提高發(fā)電設備的利用率和經濟調度的有效性。
近些年,人工智能快速興起,如長短期記憶(long short-term memory,LSTM)神經網絡、深度置信網絡、支持向量機(support vector machine,SVM),極限學習機(extreme learning machine,ELM)等智能算法被應用到負荷預測當中[5-6]。文獻[7]提出了一種新的多核算法和一種應用于電力系統(tǒng)短期負荷預測領域的加權支持向量回歸機。結合人工神經網絡和SVM技術,文獻[8]將其應用于電力系統(tǒng)短期(1 h)負荷預測。文獻[9]利用平均絕對百分比誤差和均方誤差對差分整合移動平均自回歸(autoregressive integrated moving average,ARIMA)模型和SVM模型的預測能力進行了比較。針對電力負荷數據呈指數級增長,文獻[10]提出了基于相似日的極端梯度提升(extreme gradient boosting,XGBoost)負荷預測模型。針對配電網負荷波動性和隨機性大的特點,文獻[11]提出K-means聚類和小波-SVM相結合的配電網短期負荷預測方法。也有文獻[12]采取了基于相似日選取和反向傳播(back propagation,BP)神經網絡的方法,對夏季短期負荷進行了預測。LSTM神經網絡作為目前受到學者關注較多的智能算法之一,能夠避免梯度消失導致的預測精度下降問題。文獻[13]通過相關分析篩選出與預測點高度相關的多元負荷序列,并用LSTM從時間的角度對負荷序列進行建模。為滿足強波動性配電網凈負荷短時預測需要,文獻[14]提出采用LSTM分別構建小時前配電網負荷預測模型和短期光伏出力預測模型。文獻[15]則充分利用歷史負荷數據,提高超短期負荷的預測精度,提出一種基于attention機制的LSTM超短期負荷預測方法。文獻[16]則考慮到配電網實測數據的結構化、非結構化和半結構化的復雜特性,提出了一種變壓器特性數據聚類的LSTM負荷分布式預測方法。
然而,LSTM的訓練稍顯困難,且需要存儲帶寬綁定計算,同時,一些智能算法屬于淺層結構算法,難以表示出大量數據間的復雜非線性關系?;谏鲜鑫墨I的梳理和總結,LSTM存在兩方面的缺陷:一是其從輸入到輸出能夠記憶大量長期的信息,但隨著輸出層的增加其記憶能力有所下降;二是隨著輸出層的增加,預測模型的復雜度隨之成倍增長,導致預測能力下降。LSTM盡管可有效兼顧時間序列數據的時序性及非線性關系,但仍然存在一些局限性[17]。
同時考慮到,BP神經網絡、ELM等把負荷預測作為靜態(tài)回歸問題[18],然而負荷數據是一種動態(tài)時間序列,即系統(tǒng)的輸出會持續(xù)受到過去輸入的影響;因此,BP和ELM等常規(guī)方法僅通過簡單建立輸入變量與輸出變量之間的非線性關系,難以持續(xù)深入挖掘到時間序列的內部規(guī)律[19]。
徑向基函數(radial basis function,RBF)神經網絡有很強的非線性擬合能力,可映射任意復雜的非線性關系,而且學習規(guī)則簡單,便于計算機實現,同時具有很強的魯棒性、記憶能力、非線性映射能力以及強大的自學習能力;因此,本文聚焦研究RBF神經網絡在電力系統(tǒng)臺區(qū)負荷預測上的應用,聚焦于點狀數據集采樣的臺區(qū)負荷預測。本文的研究著重挖掘時序數據之間的非線性聯(lián)系,能夠自適應構建高維度特征預測模型,挖掘其潛在相關性,并基于數據流驅動下的臺區(qū)負荷數據集來分析構建預測模型,以期拓展負荷預測的實踐開展方式和開展思路。
臺區(qū)負荷數據的主要指標參數有:經緯度信息、數據時間、額定容量、三相電壓、三相電流、綜合倍率、正向有功總功率、正向無功總功率等。
對于用電監(jiān)測系統(tǒng)采集到的臺區(qū)負荷數據,數據庫維護、網絡傳輸不穩(wěn)定、采集器斷路或短路、終端載波模塊故障等情況會引起數據缺失,同時也會產生無效值、異常尖峰值等數據,影響負荷數據的完整性及相應的預測準確度,因此要對負荷數據進行降噪預處理。預處理過程包括缺失數據的處理和降噪處理,可采用統(tǒng)計產品與服務解決方案軟件(statistical product and service solutions,SPSS)中多重插補或者均值替換的方法,對缺失數據進行填充[20]。
針對負荷數據流,本文采用一種帶有基分類器更新的數據流分類算法[21]進行分類,并著眼于同一臺區(qū)負荷進行預測分析。數據分類是數據資源庫形成、采集數據流存儲和分析的必要過程,同時,也是對本文構架的預測模型進行灰色關聯(lián)度分析以及交叉比對的重要基礎,用以體現和驗證本文預測方法的優(yōu)勢。
以下主要簡要概述分類器的構造和更新。
構造層面:用有序數據塊S1,S2,S3,…,Sn,…來表示負荷數據流,其中數據塊Sn={sn1,sn2,sn3,…}是由指標參數構成的數列,同時蘊含了經緯度信息、數據時間、額定容量等數據。將數據流實例、數據塊Sn大小、基分類器數量輸入基分類器模型中,用以輸出多個在線分類器的集合。集成分類模型在構造階段不對數據流進行分類。
更新層面:將最新的數據塊Sn作為測試集,計算均方誤差
(1)
式中:數據塊Sn中的實例形式是(Pp,c),Pp為原始的正向有功總功率,c為實例的實際類標簽,這里指臺區(qū)編號;i為基分類器序號;Pc,i(Pp)為第i個基分類器Ci將實際的類標簽貼為c的概率。計算數據塊Sn中的所有實例的(1-Pc,i(Pp))2值,并且求和取平均以獲得基分類器Ci的均方誤差ηMSEi,來給Ci分配權重wi,即
(2)
式中ε用來避免ηMSEi為0的情況,將其設置為無窮小正常數。
(3)
式中p(c)為在Sn中各個類所占比例,其取值在0到1之間。
當Ci的均方誤差ηMSEi>ηMSE,A時,基分類器對集成模型不起作用,需要進行更新,以達到能夠充分利用數據、增加基分類器之間的不相似度的目的。由此先完成數據分類(其中數據分類重點考察地理位置信息,即臺區(qū)所屬位置),其次再結合其他因素進一步利用灰色關聯(lián)法進行分析。
對于電力負荷數據的采集,現有技術可實現每間隔15 min獲得1個采樣點,構成點狀數據集。預測方法基于地理位置分類后的數據,數據集時間長度聚焦于1~2周的時間。直接采用分類好的原始數據進行訓練會出現神經元飽和現象,所以在利用神經網絡進行訓練和測試之前需要對輸入RBF網絡的原始數據進行歸一化處理。
根據實驗顯示,以適當的方式進行歸一化預處理可以使神經網絡的收斂速度變快,準確度變高,達到更好的預測效果。一般在輸入層先將負荷數據及各個特征量歸一化到[-1,1]中,用統(tǒng)一的歸一化數值進行分析[22]。
本文中序列的標準化采用最大最小值歸一化方法,即
(4)
式中:x′為歸一化值;x為待歸一化值,在本文中則為原始的正向有功總功率數據Pp;xmax為數據集中的最大值;xmin為數據集中的最小值。
RBF神經網絡是在借鑒生物局部調節(jié)和交疊接受區(qū)域知識的基礎上,提出的一種采用局部接受域來執(zhí)行函數映射的人工神經網絡,其基本網絡結構是具有單穩(wěn)層的三層前饋網絡,主要模擬了人腦中局部調整、相互覆蓋接受域的神經網絡結構,包括輸入層(輸入數據xn)、隱含層(函數Wn)和輸出層(輸出函數f(x)),其結構如圖1所示。
圖1 RBF神經網絡Fig.1 RBF neural network
RBF神經網絡輸入層直接由信號源節(jié)點構成,其作用只是接受輸入信號并將其傳遞到隱含層;隱含層是RBF網絡中最重要的一層,其單元數由所求解的問題的具體情況而定,該層神經元的傳遞函數則是一種局部分布的、對中心點徑向對稱衰減的非負非線性函數;而輸出層只實現對隱含層節(jié)點非線性基函數輸出的線性組合(其連接權值可調),從而得到最后的結果。RBF神經網絡是一種局部逼近網絡,理論上它能以任意的精度逼近任意連續(xù)函數,即具有唯一最佳逼近特性,且無局部極小問題[23]。
隱含層節(jié)點的激活函數對輸入激勵產生局部響應,輸入向量越靠近基函數的中心,隱含層節(jié)點做出的響應越大。隱含層第a個節(jié)點的輸出響應
(5)
式中:x′為歸一化后構成的多維輸入向量;Qa為第a個隱含層節(jié)點的中心向量;δa為第a個隱含層節(jié)點的寬度;A為隱含層節(jié)點個數;‖x′-Qa‖為歐幾里德范數。
隱含層往輸出層的映射是線性的,因此網絡的線性輸出為單元響應的總和,即
(6)
式中:Gj為第j個輸出對輸入向量x′的響應;wa,j為第a個隱含層節(jié)點與第j個輸出層節(jié)點的權值;J為輸出節(jié)點個數。
在本文的策略改進中,差分-RBF神經網絡負荷預測參考通信系統(tǒng)中對差分脈沖編碼調制(differential pulse code modulation,DPCM)和增量調制的思路對負荷數據進行差分預測。
以下介紹流程中涉及到的負荷預測編碼器和解碼器。
a)負荷預測編碼器。采用數據差分處理的方式作為神經網絡的輸入,形成負荷預測編碼器,如圖2所示。
圖2 負荷預測編碼器Fig.2 Load forecasting encoder
圖2可表達為
ei=x′i-x′i-1,x′i∈X′c(t) ,x′i-1∈X′c(t) .
(7)
b)負荷預測解碼器。采用與負荷預測編碼器差分相對應的延遲單元對負荷數據進行解碼,形成負荷預測解碼器,如圖3所示。
圖3 負荷預測解碼器Fig.3 Load forecasting decoder
圖3可表達為
(8)
理論上,基于數據驅動的差分-RBF神經網絡的臺區(qū)短期負荷預測方法,融合了編、解碼器在負荷預測流程中的實現,可以剔除負荷數據的共同基數,壓縮預測誤差的變化范圍,降低計算量,提高系統(tǒng)運行效率,并可以從關注負荷數據轉為關注負荷變化趨勢,進而根據趨勢來預測負荷。
c)預測的流程。運用RBF神經網絡進行短期負荷預測的具體實現思路是:首先將各種負荷影響因素映射為RBF神經網絡的輸入層向量;其次對隱含層選取相應的非線性函數作為激活函數,以實現從輸入層到隱含層的非線性變換;然后將輸出層對應為負荷預測目標,使它與隱含層之間建立線性變換關系;最后對隱含層和輸出層選用適當的算法進行訓練學習,獲取相應的網絡參數,代入已知負荷數據后即可獲得所需要的預測數據[23]。負荷預測流程如圖4所示。
圖4 基于差分-RBF神經網絡的臺區(qū)短期負荷預測分析流程Fig.4 Flowchart of short-term load forecasting analysis in station area based on differential RBF neural network
d)負荷預測模型的訓練算法。訓練樣本集建模:設X為歷史數據集樣本集,由d日歷史負荷數據構成,每日由v個數據構成,則X可表示為
(9)
將訓練樣本集按照上述流程進行訓練,如圖5所示。
圖5 預測模型的訓練和預測流程Fig.5 Training and prediction flowchart of prediction model
圖 5是將模型作為整體來示意預測的全過程。將前o日的數據作為模型訓練的輸入參數完成訓練,再將第o-1日的數據作為預測模型測試的輸入數據,用于預測第o日的負荷數據,并與實際數據進行對比。x′(d)為第d日數據的向量序列,d=1,2,…,第d日數據與前o日的數據相關,因此設函數W使序列x′(d)=W(x′(d-1),x′(d-2),…,x′(d-o)),以真實采集的日臺區(qū)負荷數據進行預測分析,取o=30,即神經網絡的輸入層神經元數目為30。RBF神經網絡的輸出層由需要求解的問題決定,就電力系統(tǒng)短期負荷而言,以相應時間段的負荷數據作為輸出,輸出層神經元數目為30。
為從數據指標層面客觀評價策略效果,且減少某一負荷數據對結果的影響過大,本文選取均方根誤差ηRMSE作為臺區(qū)負荷預測效果的評價指標,則
(10)
式中:x′p(λ)是第λ個預測點的負荷數值序列;Λ為預測點個數。
在數據分類的基礎上進行灰色關聯(lián)度分析,了解關鍵指標參數與負荷預測正向有功總功率之間的關聯(lián)度,用于實驗的交叉驗證。其中指標參數依據實際采集的負荷數據,見第1.1節(jié)的開頭。
簡要步驟為:
a)確定反映系統(tǒng)行為特征的參考數列,和影響系統(tǒng)行為的比較數列。參考數列指的是正向有功總功率構成的數列,比較數列指的是電流、電壓、正向無功總功率等構成的數列。
b)確保參考數列和比較數列已經歸一化處理。
c)求參考數列與比較數列的灰色關聯(lián)系數。參考數列B0有若干比較數列B1,B2,…,Bq,…。參照灰色關聯(lián)度分析計算方式,第q個比較數列Bq與參考數列在t時刻的關聯(lián)系數可用ξBq(t)表示,
(11)
式中:Δmin、Δmax分別為第2級最小差值、最大差值;Δ0q(t)為比較數列Bq的點與參考數列B0的點的絕對差值;ρ為分辨系數,一般在0~1之間,本文取0.5。
d)求灰色關聯(lián)度?;疑P聯(lián)度是各個時刻的關聯(lián)系數的平均值,比較數列Bq對參考數列的灰色關聯(lián)度
(12)
式中N為時刻總數。rq表示參考數列與比較數列Bq之間關聯(lián)程度,rq值越接近1,說明相關性越好。
e)灰色關聯(lián)度排序。因素間的關聯(lián)程度用灰色關聯(lián)度的大小次序描述。將比較數列對同一參考數列的灰色關聯(lián)度按大小順序排列。若rq>rs,則稱比較數列Bq對于同一參考數列B0優(yōu)于比較數列Bs,記為Bq>Bs。rs為比較數列Bs對參考數列的灰色關聯(lián)度。
依據由灰色關聯(lián)度分析得到的參數關聯(lián)度排序,可以在不同類數據中選取數據相似度低的數據,來交叉驗證本文方法的提升效果。這更加客觀地重現仿真結果,避免單次實驗的偶然性,也可以在工程實踐中給負荷預測的系統(tǒng)搭建等提供一種驗證思路。
圖6系統(tǒng)展示了本文各結構之間的關系:數據采集形成數據塊指代數據分類,進而實現基于數據流驅動的負荷數據集構建,并在分類的基礎上,采用圖4的流程實現負荷預測的仿真;而驗證則是基于灰色關聯(lián)度分析選取差異較大的數據集進行比對,確認最終的仿真實現效果?;跀祿寗拥牟罘?RBF神經網絡臺區(qū)短期負荷預測分析方法的負荷預測編碼和負荷預測解碼分別對應圖2和圖3,而差分-RBF神經網絡臺區(qū)短期負荷預測分析方法仍是基于圖1的基礎結構進行拓展的。
圖6 基于數據驅動的差分-RBF神經網絡的臺區(qū)短期負荷預測方法Fig.6 Short-term load forecasting method in station area based on data-driven difference RBF neural network
預測方法可以適應多類型、短時間段的數據采樣分析。本文整體的創(chuàng)新性體現在引入基于數據驅動的差分-RBF神經網絡的臺區(qū)短期負荷預測方法,其特點在于數據驅動分類與差分-RBF神經網絡的銜接構成的系統(tǒng),其優(yōu)勢在于充分利用RBF神經網絡的非線性并進行了改進,實現了性能優(yōu)化。
在數據處理過程中,對臺區(qū)負荷數據流采用基于集成分類器的數據流的分類方法,著眼于地理位置信息形成分類,基于關鍵指標參數,進行灰色關聯(lián)度分析,確定關聯(lián)度排序,搭建RBF神經網絡并驗證其有效性。在此基礎上,選取不同臺區(qū)的數據對差分-RBF神經網絡進行交叉驗證,并從運算時間、誤差區(qū)間等多個維度呈現仿真結果。
采用南方某地區(qū)變壓器2019年8月前15日96點數據源中15:00—24:00的數據進行仿真實驗,該時段為高峰負荷時段,基礎負荷數據分類歸一化后如圖7所示,其中:縱坐標為歸一化后的負荷數據,量綱為一;橫坐標為該時段內的時間序列,每個數值間隔代表15 min。
圖7 南方某省負荷數據源分類整理示意圖Fig.7 Schematic diagram of load data source classification in a province in South China
利用MATLAB軟件進行編程,設定目標誤差為0.001,輸入層神經元數目設為30,輸出層神經元數目設計為30,擴展速度設為3,并采用BP神經網絡、LSTM等多種預測算法[26]對同一編號的變壓器和同一時間段的負荷數據進行負荷預測分析,預測結果和對比如圖8所示,圖中“本文RBF神經網絡預測值”即為基于數據驅動的差分-RBF神經網絡預測值。
圖8 多種預測方法結果對比Fig.8 Result comparisons of various forecasting methods
直觀上,多種方式的預測結果均可貼近實際負荷數據形成的曲線,而本文RBF神經網絡預測方式的效果總體要好于BP、LSTM預測方式。
由圖8可知,2條RBF預測曲線(RBF和本文RBF)更接近實際負荷曲線。為體現改進的優(yōu)勢,著重分析2條曲線的其他指標。數據方面,為體現實際物理含義,將歸一化數據按照歸一化過程的反向求解得到物理意義的真實值(即逆歸一化)。在使用某綜合配電房負荷逆歸一化數據的情況下(算例1),2種預測算法結果的誤差區(qū)間(誤差上下限之間的區(qū)間)對比見表1。由表1可知,本文RBF神經網絡預測算法可在保持良好的負荷預測效果的基礎上,一定程度上降低負荷波動預測誤差負荷波動區(qū)間。
表1 算例1中預測算法結果的誤差區(qū)間對比Tab.1 Comparisons of error intervals of the results of forecasting algorithms in example 1
相應的,同樣配置環(huán)境下預測算法的性能(運行時間、平均絕對誤差、均方根誤差)對比見表2。
表2 算例1中預測算法性能對比Tab.2 Performance comparisons of the forecasting algorithms in example 1
依據灰色關聯(lián)度分析的結果排序,采用2組負荷曲線差異較大的數據進行交叉驗證。分別從某村配電變壓器數據和某綜合配電房數據中各抽取1組數據,這2組數據的相似度較低,具有負荷曲線的代表性。本文對這2組臺區(qū)數據的交叉驗證(算例2)以正向有功總功率為目標,選取的3個關鍵參數分別為B相電流、B相電壓、正向無功總功率,可得參數的關聯(lián)度分別為0.935、0.924、0.564,也即和負荷預測關聯(lián)度最高的是電壓電流。本文對該數據所做的仿真交叉驗證,本質是通過2組數據對同一套仿真體系進行驗證,得到2種預測算法結果誤差區(qū)間的對比(見表3)和性能的對比(見表4)。
表3 算例2中預測算法結果的誤差區(qū)間對比Tab.3 Comparisons of error intervals of the results of forecasting algorithms in example 2
表4 算例2中預測算法性能對比Tab.4 Performance comparisons of the forecasting algorithms in example 2
從表1和表3可知:與RBF神經網絡預測算法相比,本文RBF神經網絡預測算法可將算例1中誤差區(qū)間從[70.69 kW,83.95 kW]壓縮到[69.45 kW,82.77 kW],將算例2中誤差區(qū)間從[0.50 kW,12.15 kW]壓縮到[0.02 kW,8.61 kW],即誤差更加貼近0,充分體現了壓縮誤差區(qū)間的優(yōu)點。
通過比對交叉驗證后的表格數據(表3和表4)可得,本文策略的優(yōu)越性體現在縮短運算時間、壓縮誤差區(qū)間,具有一定的工程實踐意義。綜上,采用本文RBF神經網絡預測算法進行預測時,同精度下預測顆粒度更小,可降低預測誤差區(qū)間,拓展了負荷預測的實踐方式。
本文針對負荷預測問題,提出一種基于數據驅動的差分-RBF神經網絡的臺區(qū)短期負荷預測方法。本文首先引入了負荷數據流分類方法,為動態(tài)負荷數據流的處理與負荷預測的結合提供一種思路;其次,構建了差分-RBF神經網絡的臺區(qū)短期負荷預測模型,結合灰色關聯(lián)度分析;最后,采用交叉驗證的方式證實本文提出的算法逼近效果好,預測精度高,運行時間短,具有一定工程和實踐價值。