邢 偉, 母卓元
(內(nèi)蒙古國合電力有限責(zé)任公司,內(nèi)蒙古自治區(qū) 呼和浩特 010060)
短期電力負(fù)荷預(yù)測是電力系統(tǒng)運(yùn)行及調(diào)度的關(guān)鍵,也是系統(tǒng)經(jīng)濟(jì)運(yùn)行的前提條件,能夠?qū)崿F(xiàn)準(zhǔn)確的負(fù)荷預(yù)測,對于電網(wǎng)規(guī)劃及安全穩(wěn)定運(yùn)行具有重要意義。短期電力負(fù)荷監(jiān)測數(shù)據(jù)具有明顯的非平穩(wěn)特征,如果對其進(jìn)行預(yù)處理,將其分解為多個(gè)更為簡單的平穩(wěn)分量,則更容易挖掘出內(nèi)在特征,有助于實(shí)現(xiàn)精確趨勢預(yù)測。作為一種自適應(yīng)數(shù)據(jù)處理方法,經(jīng)驗(yàn)?zāi)B(tài)分解方法EMD(empirical mode decomposition) 具有獨(dú)特的優(yōu)勢,但也存在模態(tài)混疊、端點(diǎn)效應(yīng)等不足[1]。因此,本文在傳統(tǒng)EMD 方法基礎(chǔ)上提出集成干擾重構(gòu)經(jīng)驗(yàn)?zāi)B(tài)分解方法EIEMD(ensemble interferencereconstructed empirical mode decomposition),可有效緩解模態(tài)混疊和端點(diǎn)效應(yīng),與此同時(shí),原始數(shù)據(jù)中不可避免的干擾源也可以彼此相互抵消,從而達(dá)到抑制干擾的目的。
信息熵理論可有效反映非線性非平穩(wěn)數(shù)據(jù)的特征突變行為,能夠準(zhǔn)確刻畫數(shù)據(jù)序列的內(nèi)在狀態(tài)特征。與傳統(tǒng)的近似熵、樣本熵、排列熵相比,由Rostaghi 等人[2]提出的散布熵具有實(shí)現(xiàn)簡便、抗干擾能力強(qiáng)等優(yōu)點(diǎn)。但其僅能在單一尺度上描述數(shù)據(jù)特性,而基于粗?;幚磉^程提出的多尺度散布熵MDE(multiscale dispersion entropy) 算法[3]則可以描述數(shù)據(jù)序列在多個(gè)尺度上的內(nèi)在特性,但其算法的熵值計(jì)算不穩(wěn)定。為此,本文提出一種改進(jìn)多尺度散布熵IMDE(improved multiscale dispersion entropy) 算法,用于刻畫電力系統(tǒng)負(fù)荷監(jiān)測數(shù)據(jù)的內(nèi)在特征。
由于訓(xùn)練數(shù)據(jù)少,異常擾動明顯,預(yù)測實(shí)時(shí)性要求高,因此對電力負(fù)荷預(yù)測器的性能提出了更高要求[4]。目前,常用的一些預(yù)測器都存在影響參數(shù)多、計(jì)算負(fù)擔(dān)大、容易陷入局部最優(yōu)等缺點(diǎn),為規(guī)避此類缺陷,本文將一種新穎的XGBoost模型應(yīng)用于電力負(fù)荷預(yù)測[5],并將其與提出的EIEMD 和IMDE 方法相融合,提出基于EIEMDIMDE-XGBoost 模型的電力負(fù)荷預(yù)測方法,有望實(shí)現(xiàn)準(zhǔn)確的預(yù)測結(jié)果。
假設(shè)s(t)為真實(shí)數(shù)據(jù)序列,n(t)為干擾源,所監(jiān)測的原始數(shù)據(jù)x(t)可表示為x(t)=s(t)+n(t),EIEMD方法的具體實(shí)現(xiàn)步驟如下。
步驟1:由于干擾源n(t)=x(t)-s(t),在實(shí)際工況中存在各種干擾源nj(t),因此取j∈N。
步驟2:先從監(jiān)測到的原始數(shù)據(jù)x(t)中計(jì)算干擾源n(t),然后重采樣干擾源n(t)獲得nj(t)。
步驟3:對原始數(shù)據(jù)x(t) 進(jìn)行EMD 處理,EMD 具體原理可參考文獻(xiàn)[6]。
步驟4:使用固有模態(tài)函數(shù)IMF(intrinsic mode function) 分量估計(jì)得到干擾分量(t)。
步驟5:再次重采樣(t)來得到第j個(gè)干擾源(t)。
步驟6:用式(1)再次重構(gòu)所得數(shù)據(jù)序列(t)。
其中,(t)=x(t)-(t)。
步驟7:通過EMD 將x^j(t)分解為k個(gè)IMF 分量{cj,(kt),k=1,2,…,n}和1 個(gè)殘差分量{rj,(nt)}。
步驟8:r次重復(fù)步驟5 和步驟7,直到滿足敏感評判指標(biāo)為止。
步驟9:當(dāng)滿足敏感評判指標(biāo)時(shí),利用式(2)和式(3) 求其均值,最終得到平均處理后的IMF分量和殘差分量
考慮干擾源影響,引入干擾誤差來量化去干擾效果。假定經(jīng)過r次EMD 處理后獲得式(2)、式(3)中的IMF 分量和殘差分量,通過式(4)重構(gòu)去干擾數(shù)據(jù)(t)。
繼而得到平均干擾源
通過式(6)獲得相對干擾誤差
敏感評判指標(biāo)依據(jù)er<ε 來選取,其中ε=0.1為預(yù)設(shè)的誤差容限。
本文對傳統(tǒng)多尺度散布熵MDE 算法進(jìn)行改進(jìn),提出IMDE 算法,實(shí)現(xiàn)過程如下。
a) 在IMDE 算法中,對于長度為N的原始數(shù)據(jù){x|x1,x2,…,xj,1≤j≤N},在尺度條件下的粗粒化序列可通過式(7) 獲取。以尺度τ=2、τ=3 為例,MDE 和IMDE 算法粗?;^程分別如圖1 和圖2 所示。對比可發(fā)現(xiàn),計(jì)算不同尺度下的散布熵時(shí),原始算法僅僅考慮一個(gè)粗粒化序列,在改進(jìn)算法中,對于每個(gè)尺度因子τ,可以獲得τ 個(gè)不同粗粒化序列(k=1,2,…,π)。
b) 對于每個(gè)尺度因子τ,計(jì)算各粗?;蛄?k=1,2,…,π) 的散布熵值,并根據(jù)式(8) 求取散布熵的平均值,則不同尺度因子下對應(yīng)的散布熵均值即為最終結(jié)果,IMDE 表達(dá)式為
圖1 傳統(tǒng)MDE 算法粗?;疽鈭D
在IMDE 算法中,連續(xù)計(jì)算了所有粗?;蛄械纳⒉检刂担⑼ㄟ^求均值獲取最終的結(jié)果,該過程可有效提高所得熵值精確度及計(jì)算過程的穩(wěn)定性,更適合非線性非平穩(wěn)定時(shí)間序列的分析處理。
圖2 IMDE 算法粗粒化示意圖
構(gòu)造仿真數(shù)據(jù)序列來對比傳統(tǒng)多尺度散布熵算法及改進(jìn)多尺度散布熵算法的計(jì)算穩(wěn)定性。給定一個(gè)功率譜與頻率滿足S(f)∝1/fα條件的自相似隨機(jī)時(shí)間序列,當(dāng)α=0 時(shí)屬于高斯序列,當(dāng)α=1 時(shí)屬于分?jǐn)?shù)階序列[7]。
分別計(jì)算這兩種數(shù)據(jù)序列的熵值曲線,對比可發(fā)現(xiàn),由于分?jǐn)?shù)階序列比高斯序列更加復(fù)雜,具有長程相關(guān)性,其散布熵值較大,而高斯序列則不具有這一性質(zhì),因此其散布熵值更小。隨機(jī)生成30 個(gè)分?jǐn)?shù)階序列,每個(gè)序列1 000 個(gè)數(shù)據(jù)點(diǎn),計(jì)算IMDE 及MDE 誤差曲線,由此給出不同尺度下兩種算法所得熵值的均值及標(biāo)準(zhǔn)差,用于驗(yàn)證二者的穩(wěn)定性,結(jié)果如圖3 所示。觀察可發(fā)現(xiàn),IMDE 所得熵值的均值與MDE 相比,變化更平緩,穩(wěn)定性更好,并且熵值的標(biāo)準(zhǔn)差明顯更小,高斯序列對比結(jié)果與此相同。由此表明所提出的IMDE算法計(jì)算過程更加穩(wěn)定、準(zhǔn)確,在描述數(shù)據(jù)序列內(nèi)在特性方面更勝一籌。
XGBoost 基于損失函數(shù)2 階泰勒展開進(jìn)行優(yōu)化,提升了可分性,為避免過擬合和降低模型復(fù)雜度,在損失函數(shù)之外還引入了正則項(xiàng)整體求最優(yōu)解[8]。
圖3 分?jǐn)?shù)階序列誤差曲線
假設(shè)模型有k個(gè)決策樹,即
其損失函數(shù)為
損失函數(shù)可表示為
對損失函數(shù)泰勒展開有
移除常數(shù)項(xiàng)得到
定義Ij={i|q(xi=j}) 為第j個(gè)葉子點(diǎn),即
將式(15) 求導(dǎo)并令結(jié)果為0,則可得
把wj最優(yōu)解wj*帶入目標(biāo)函數(shù),可得最終結(jié)果
XGBoost 的分割步驟發(fā)生在每個(gè)已有的葉子節(jié)點(diǎn),取代了傳統(tǒng)分割標(biāo)準(zhǔn)最小化均方差的方法,能夠更加有效地枚舉樹的結(jié)構(gòu)。
電力系統(tǒng)負(fù)荷監(jiān)測數(shù)據(jù)是一種具有周期性、隨機(jī)變化性與趨勢性的復(fù)雜非平穩(wěn)數(shù)據(jù)。為了提高電力負(fù)荷預(yù)測的精度,本文提出了基于EIEMD-IMDE-XGBoost 模型的方法,預(yù)測流程如圖4 所示,具體實(shí)現(xiàn)步驟如下。
圖4 電力負(fù)荷預(yù)測流程
步驟一:對原始電力負(fù)荷數(shù)據(jù)進(jìn)行預(yù)處理,利用EIEMD 方法將其分解為若干平穩(wěn)的IMF 分量。步驟二:通過計(jì)算所得各IMF 分量與原始數(shù)據(jù)序列的相關(guān)系數(shù),將相關(guān)系數(shù)大于0.1 的IMF分量作為有效分量予以保留,同時(shí)剔除無效分量。步驟三:計(jì)算所得有效IMF 分量的IMDE 特征,合并后由此構(gòu)造特征向量。IMDE 計(jì)算過程選取嵌入維數(shù)m時(shí),如果m取值過小則難以有效檢測序列特性,反之則無法區(qū)分其波動狀態(tài),綜合比較后取m=3。設(shè)置類別個(gè)數(shù)c過小,則差異較大的數(shù)據(jù)點(diǎn)容易被劃分為同一類別,取值過大則計(jì)算效率降低,本文取c=5 來保證結(jié)果的可靠性。由于時(shí)延參數(shù)對計(jì)算過程影響很小,本文直接取λ=1。至于尺度的選取,設(shè)置過小難以完整提取有效信息,較大則容易導(dǎo)致計(jì)算不穩(wěn)定,綜合考慮后取τ=20。步驟四:利用所構(gòu)造的訓(xùn)練樣本特征向量對XGBoost 模型進(jìn)行訓(xùn)練,在訓(xùn)練過程中,以對數(shù)損失為準(zhǔn)則,通過網(wǎng)格搜索預(yù)測器的最優(yōu)決策樹規(guī)模及深度參數(shù)。步驟五:構(gòu)造測試樣本的特征向量,并輸入到訓(xùn)練好的最優(yōu)XGBoost 預(yù)測器中,輸出最終預(yù)測結(jié)果。
以內(nèi)蒙古呼和浩特市2018 年全年用電量為例,以1 h 為間隔全程監(jiān)測該市2018 年1 月1 日至12 月31 日的電力負(fù)荷數(shù)據(jù)。本文將2018 年8月1 日至10 月30 日的監(jiān)測數(shù)據(jù)作為訓(xùn)練樣本。
首先利用EIEMD 算法對原始數(shù)據(jù)進(jìn)行預(yù)處理,共得到如圖5 所示的8 個(gè)IMF 分量和1 個(gè)余量。繼而計(jì)算所得分量與原始數(shù)據(jù)的相關(guān)系數(shù),用于有效分量的選取,結(jié)果如表1 所示。由于前4 個(gè)分量的相關(guān)系數(shù)大于設(shè)定的閾值0.1,因此將IMF1~I(xiàn)MF4 作為有效分量予以保留,同時(shí)計(jì)算各有效分量的IMDE 值,由于每個(gè)分量得到20 個(gè)散布熵值特征,因此最終構(gòu)造出由80 個(gè)散布熵值組成的特征向量,同時(shí)將其輸入到XGBoost 預(yù)測器中對其進(jìn)行訓(xùn)練。
圖5 原始負(fù)荷數(shù)據(jù)EIEMD 處理結(jié)果
表1 各分量與原始數(shù)據(jù)的相關(guān)系數(shù)
XGBoost 在順序創(chuàng)建或者增加決策樹時(shí),每個(gè)決策樹都會試圖去糾正之前預(yù)測中存在的錯(cuò)誤,當(dāng)樹的規(guī)模達(dá)到一定程度后,預(yù)測效果已達(dá)到最優(yōu),即使再增加樹的棵數(shù)及深度,效果也不會出現(xiàn)明顯提升,反而會影響預(yù)測效率。因此,本文利用網(wǎng)格搜索方法對決策樹的規(guī)模及深度進(jìn)行尋優(yōu)。在尋優(yōu)過程中,利用對數(shù)損失作為指導(dǎo)標(biāo)準(zhǔn),對數(shù)損失越小達(dá)到的效果就越好。由于XGBoost模型中默認(rèn)樹的棵數(shù)為100,本文在尋優(yōu)時(shí)圍繞這一參考量將樹的規(guī)模取[50,100,150,200],深度取[2,4,6,8],參數(shù)尋優(yōu)結(jié)果如圖6 所示。由圖6 可知,決策樹的深度取4、規(guī)模取150 時(shí),預(yù)測效果已經(jīng)達(dá)到最優(yōu),因此在該參數(shù)條件下進(jìn)行測試分析。
圖6 決策樹的規(guī)模與深度尋優(yōu)曲線
將呼和浩特市2018 年10 月31 日當(dāng)日監(jiān)測數(shù)據(jù)作為測試樣本來驗(yàn)證所述方法的可靠性,圖7為預(yù)測結(jié)果與當(dāng)日實(shí)際負(fù)荷的對比。為定量衡量預(yù)測結(jié)果的可靠性及準(zhǔn)確性,引入相對誤差RE指標(biāo)進(jìn)行評判[9]。
其中,X(t)為電力負(fù)荷實(shí)際監(jiān)測值,(t)為通過預(yù)測方法得到的預(yù)測負(fù)荷值。
通過觀察圖7 可發(fā)現(xiàn),本文所述方法的預(yù)測結(jié)果走勢與實(shí)際負(fù)荷值基本保持一致,僅在前6個(gè)時(shí)間點(diǎn)處存在一定偏差,但最大相對誤差值也僅為-2.7%,后續(xù)18 個(gè)時(shí)間點(diǎn)預(yù)測結(jié)果更加精確,與實(shí)際負(fù)荷值相對誤差均保持在1%以內(nèi),偏差值波動很小??傮w來看,本文所述方法的預(yù)測結(jié)果較為準(zhǔn)確,對于電力系統(tǒng)調(diào)度應(yīng)用可提供較高的參考價(jià)值。
圖7 本文所述方法負(fù)荷預(yù)測結(jié)果
為了突出所述方法的優(yōu)勢,將所得結(jié)果與其他4 種不同預(yù)測方法結(jié)果進(jìn)行對比。在方法1(EIEMD+MDE+XGBoost) 中,利用傳統(tǒng)MDE 算法來提取有效分量的內(nèi)在特征并構(gòu)造特向量;在方法2(IMDE+XGBoost) 中,原始負(fù)荷監(jiān)測數(shù)據(jù)不經(jīng)過EIEMD 預(yù)處理,直接計(jì)算其IMDE 特征,并構(gòu)造維度為20 的特征向量;在方法3(EIEMD+MDE+SVM) 中,數(shù)據(jù)預(yù)處理及特征向量構(gòu)造過程不變,利用廣泛應(yīng)用的SVM 預(yù)測器來替換XGBoost 預(yù)測器;在方法4(EIEMD+MDE+BP)中,利用BP 神經(jīng)網(wǎng)絡(luò)預(yù)測器來替換XGBoost 預(yù)測器。經(jīng)過計(jì)算各方法的預(yù)測相對誤差曲線,結(jié)果顯示本文所述方法在各個(gè)時(shí)間點(diǎn)處預(yù)測相對誤差變化較為平滑,誤差值最小,而其他4 種方法得到的相對誤差波動幅度均較大。由此驗(yàn)證了本文所述方法在電力負(fù)荷監(jiān)測數(shù)據(jù)內(nèi)在特征描述以及預(yù)測性能上的優(yōu)勢。
電力負(fù)荷短期預(yù)測是電力系統(tǒng)調(diào)度運(yùn)營部門的日常工作,已成為電力企業(yè)現(xiàn)代化管理的重要內(nèi)涵之一。本文將XGBoost 模型引入電力負(fù)荷預(yù)測領(lǐng)域,提出了基于EIEMD-IMDE-XGBoost 模型的新方法,填補(bǔ)了現(xiàn)存預(yù)測方法存在的不足。實(shí)例驗(yàn)證結(jié)果表明,該方法能夠高效、可靠、準(zhǔn)確地實(shí)現(xiàn)電力負(fù)荷短期預(yù)測,可為發(fā)電計(jì)劃和輸電方案的制定提供參考,對于實(shí)際工程應(yīng)用具有一定借鑒價(jià)值。