狄曙光,劉 峰,孫建宇,冀 超,董鐸亮,蔄靖宇
(1.內(nèi)蒙古電力(集團(tuán))有限責(zé)任公司包頭供電分公司,內(nèi)蒙古包頭 014000;2.上海電力大學(xué)能源與機(jī)械工程學(xué)院,上海 200090)
短期電力負(fù)荷預(yù)測對保證電力系統(tǒng)平穩(wěn)安全高效運(yùn)行具有重要意義[1-4],地區(qū)電力系統(tǒng)負(fù)荷受氣候、經(jīng)濟(jì)、日期等多種因素影響,呈現(xiàn)周期性、隨機(jī)性和波動性等特點(diǎn),這也導(dǎo)致短期電力負(fù)荷預(yù)測具有很大的挑戰(zhàn)性[5-8]。
統(tǒng)計學(xué)預(yù)測和機(jī)器學(xué)習(xí)預(yù)測是目前常用的兩類短期負(fù)荷預(yù)測方法[9],由于電力負(fù)荷對外部因素影響較為敏感,單一預(yù)測方法很難得到滿意的預(yù)測精度[10],而極限學(xué)習(xí)機(jī)、支持向量機(jī)等智能學(xué)習(xí)技術(shù)為短期電力負(fù)荷預(yù)測提供了新的研究思路,學(xué)者們圍繞電力負(fù)荷數(shù)據(jù)處理、預(yù)測模型構(gòu)建等方面開展了系列研究:Huang[11]、Kouhi[12]等學(xué)者對負(fù)荷與外部影響因素之間的關(guān)聯(lián)性進(jìn)行了研究,采用條件互信息法等手段選取特征子集,但是未考慮特征之間的冗余度,導(dǎo)致選取的特征子集未必最優(yōu)。組合預(yù)測模型是當(dāng)前短期電力負(fù)荷預(yù)測的研究熱點(diǎn),姚程文[13]等在電力負(fù)荷數(shù)據(jù)預(yù)處理的基礎(chǔ)上,采用用遺傳算法優(yōu)化最小二乘支持向量機(jī)模型進(jìn)行預(yù)測,仿真結(jié)果也驗(yàn)證了該方法的有效性,但是該模型復(fù)雜度較高,運(yùn)行效率需要進(jìn)一步研究;魏健[14]等采用CNNGRU 復(fù)合模型進(jìn)行短期電力負(fù)荷預(yù)測,預(yù)測精度好于一般單一模型;朱凌建[15]等將高相關(guān)性特征向量作為預(yù)測模型輸入,并構(gòu)建融合卷積神經(jīng)網(wǎng)絡(luò)和長短時記憶神經(jīng)網(wǎng)絡(luò)的預(yù)測模型,但是沒有考慮負(fù)荷數(shù)據(jù)時空差異性。而且,參數(shù)設(shè)定是機(jī)器學(xué)習(xí)技術(shù)面臨的一個難題,傳統(tǒng)反復(fù)實(shí)驗(yàn)獲取參數(shù)的方法不僅效率低且預(yù)測精度不高。
為此,構(gòu)建基于負(fù)荷數(shù)據(jù)最優(yōu)特征子集提取、密度峰值聚類(Density Peak Clustering,DPC)和核極限學(xué)習(xí)機(jī)(Kernel Extreme Learning Machine,KELM)的短期電力負(fù)荷預(yù)測模型:采用DPC 算法對負(fù)荷數(shù)據(jù)進(jìn)行聚類分析,充分考慮數(shù)據(jù)時空差異性對預(yù)測精度的影響;設(shè)計最優(yōu)特征子集提取機(jī)制,在充分考慮特征之間關(guān)聯(lián)性的同時最大限度降低冗余度,提升預(yù)測效率;設(shè)計多核加權(quán)KELM,以提高極限學(xué)習(xí)機(jī)預(yù)測精度;設(shè)計改進(jìn)的人工蜂群(Artificial Bee Colony,ABC)算法,并對DPC,KELM 參數(shù)進(jìn)行優(yōu)化求解。結(jié)果表明,本文提出短期電力負(fù)荷預(yù)測方法具有更高的預(yù)測精度。
短期電力負(fù)荷預(yù)測的目的是通過分析歷史負(fù)荷、社會因素、氣象因素等數(shù)據(jù)中的規(guī)律,實(shí)現(xiàn)對未來短期電力負(fù)荷的準(zhǔn)確預(yù)測[16]。以某地區(qū)電網(wǎng)短期負(fù)荷預(yù)測為例,影響電力負(fù)荷的因素主要包括歷史電力負(fù)荷Phis、電價Ep、節(jié)假日Hv、工作日Wd、周末We等社會因素(設(shè)定Hv=1,Wd=1,We=1 分別為節(jié)假日、工作日、周末,否則取值為0),溫度tp、濕度hI、風(fēng)速ws、太陽輻射sr等氣候因素。構(gòu)建如圖1 所示的短期電力負(fù)荷預(yù)測模型,模型分為訓(xùn)練和預(yù)測2 個部分,主要包括最優(yōu)特征子集提取、聚類分析、極限學(xué)習(xí)機(jī)3 個模塊,并采用改進(jìn)ABC 算法對參數(shù)進(jìn)行優(yōu)化配置。
圖1 短期電力負(fù)荷預(yù)測模型示意圖Fig.1 Schematic diagram of short-term power load forecasting model
1)最優(yōu)特征子集提取。設(shè)計最優(yōu)特征子集提取機(jī)制,從輸入特征集合FS=(Phis,Ep,Hv,Wd,We,tp,hi,ws,sr) 中選取對于預(yù)測結(jié)果最有益的特征子集FS,best,在降低數(shù)據(jù)維度、特征冗余度的同時,提升運(yùn)算效率和預(yù)測精度。
2)聚類分析。采用密度峰值聚類理論對訓(xùn)練數(shù)據(jù)樣本集合Sn={(})Di,Yi進(jìn)行聚類分析,得到C個分類S′i(i=1,…,C)。(Di,Yi) 為:
3)極限學(xué)習(xí)機(jī)預(yù)測。訓(xùn)練階段,采用極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)技術(shù),對C個數(shù)據(jù)分類分別進(jìn)行訓(xùn)練,得到每個分類對應(yīng)的最佳參數(shù)配置。預(yù)測階段,對于待預(yù)測數(shù)據(jù)(D,Y),找到其最相似聚類分類S′j,利用S′j對應(yīng)的參數(shù)配置進(jìn)行預(yù)測,最終得到預(yù)測結(jié)果。
4)改進(jìn)ABC 算法。將DPC 及極限學(xué)習(xí)機(jī)參數(shù)配置過程等效成ABC 算法尋優(yōu)過程,通過設(shè)計新型蜜源搜索和蜜蜂進(jìn)化方式,提升改進(jìn)ABC 全局收斂能力,得到最佳參數(shù)配置。
ABC 算法[17]模擬仿生蜂群集體覓食行為,將蜂群劃分為雇傭蜂XEm、觀察蜂XOb、偵查蜂XSc,不同類型的蜜蜂賦予不同進(jìn)化方式,通過蜜蜂個體之間的信息交流實(shí)現(xiàn)最優(yōu)解尋找。ABC 算法實(shí)現(xiàn)過程可以描述為:
式中:φ為[-1,1] 均勻分布隨機(jī)數(shù)。
式中:N為蜂群規(guī)模。
步驟4:XSc更新。當(dāng)算法處于進(jìn)化停滯狀態(tài)時,對雇傭蜂執(zhí)行式(5)更新,得到XSc。
式中:Xmax,Xmin為上下邊界集合。
ABC 具有參數(shù)設(shè)置簡單、易于實(shí)現(xiàn)的特點(diǎn),但對于復(fù)雜優(yōu)化問題存在收斂精度不高、容易“早熟”的缺陷[18]。為此,設(shè)計新型蜜源搜索和蜜蜂進(jìn)化方式,以提升改進(jìn)ABC(Improved ABC,IABC)的全局收斂能力。
ABC 在實(shí)現(xiàn)過程中,將雇傭蜂、觀察蜂設(shè)置同等規(guī)模。但是,在算法進(jìn)化初期,種群樣本多樣性較大,應(yīng)采用更多的雇傭蜂進(jìn)行更新;隨著進(jìn)化次數(shù)的不斷增加,種群樣本逐漸降低,此時應(yīng)采用更多的觀察蜂進(jìn)行更新,以擴(kuò)展算法搜索空間。為此,將雇傭蜂、觀察蜂子種群規(guī)模NEm,NOb分別設(shè)定為:
式中:Xbest為蜂群最優(yōu)解。
隨機(jī)選取雇傭蜂子種群內(nèi)N1(N1≤NEm)個體執(zhí)行式(8)更新,其余個體執(zhí)行式(2)更新。
2)觀察蜂更新。ABC 采用輪盤賭的方式選取雇傭蜂再次執(zhí)行式(2)更新操作,其實(shí)質(zhì)為“2 次”雇傭蜂更新,降低了算法收斂效率。為此引入子種群最優(yōu)解,提升算法收斂速度,XOb更新公式為:
從新的蜂群進(jìn)化方式可以看出,蜂群在更新中引入了種群優(yōu)秀個體信息,提升了算法收斂速度,并且反更新操作的引入保證了蜂群種群多樣性,使改進(jìn)的ABC 全局尋優(yōu)能力更優(yōu)。IABC 實(shí)現(xiàn)流程如圖2 所示。
圖2 IABC實(shí)現(xiàn)流程示意圖Fig.2 Diagram of IABC implementation process
2014 年,Rodriguez[20]等在《Science》上發(fā)表了密度峰值聚類算法,該算法能夠識別出任意形狀數(shù)據(jù),具有實(shí)現(xiàn)建檔、參數(shù)唯一、魯棒性好等特點(diǎn)。電力負(fù)荷樣本數(shù)據(jù)時空差異性對預(yù)測結(jié)果精度影響較大,為此,采用DPC 算法對樣本進(jìn)行聚類分析,使得預(yù)測更具魯棒性。DPC 為數(shù)據(jù)點(diǎn)Xi設(shè)定局部密度ρi和最近點(diǎn)距離δi2 個屬性:
式中:χ(x)為函數(shù);dij為Xi到點(diǎn)Xj的距離;dc為截斷距離,也是DPC 唯一參數(shù)。
對于第k個數(shù)據(jù),定義判定參數(shù)γi,并給出其計算公式為γi=ρiδi,DPC 選擇γi取值較大點(diǎn)為聚類中心。
DPC 對于大部分?jǐn)?shù)據(jù)具有良好的聚類效果,但是存在明顯缺陷[21]:截斷距離dc以及聚類中心人為設(shè)定,效率較低,對分布不均勻數(shù)據(jù)聚類效果不理想。為此,引入邦費(fèi)羅尼指數(shù),提出改進(jìn)DPC(Improved DPC,IDPC)。
1)邦費(fèi)羅尼指數(shù)函數(shù)。引入邦費(fèi)羅尼指數(shù)函數(shù)BN來度量(γ1,…,γN) 有序程度,BN取值越大,越有利于數(shù)據(jù)聚類。
從式(13)可以看出,BN依dc變化而變化,求解過程屬于NP(Non-deterministic Polynomial)難題[22]。本文采用IABC 進(jìn)行優(yōu)化求解,即令:
通過IABC 迭代進(jìn)化,最終得到BN取最大值時對應(yīng)的最優(yōu)解,該解即為最佳截斷距離dc,best。
2)聚類中心自動確定dc,best確定后,計算每個數(shù)據(jù)點(diǎn)ρi,δi屬性和γi。按照γi大小將數(shù)據(jù)樣本降序排序,得到數(shù)據(jù)樣本集根據(jù)式(15)計算重新排序后的每個數(shù)據(jù)點(diǎn)對應(yīng)的聚類中心截止參數(shù)ωk:
式中:γk+1為第k+1 個數(shù)據(jù)點(diǎn)的判定參數(shù)取值;dj,k+1為第j個數(shù)據(jù)點(diǎn)到第k+1個數(shù)據(jù)點(diǎn)的距離。
定義ωk取最大值時對應(yīng)的數(shù)據(jù)點(diǎn)為聚類中心截止點(diǎn),該點(diǎn)以及排序在前的點(diǎn)即為聚類中心。聚類中心集合V=(C為聚類中心個數(shù))確定后,根據(jù)δi取值大小,將剩余數(shù)據(jù)點(diǎn)劃分到不同聚類中,從而得到C個分類{FC1,…,FCC} 。
對負(fù)荷特征FS進(jìn)行特征提取,能夠在降低數(shù)據(jù)維度、特征間冗余度的同時,提升運(yùn)行效率和預(yù)測精度[23]。定義特征提取向量l=(p1,p2,…,pM),
當(dāng)li=1 表示對應(yīng)的第i個特征被選取。利用l對FS進(jìn)行特征子集提?。?/p>
式中:fj為第j個提取特征;m為提取特征總數(shù)。
1)評價指標(biāo)。文獻(xiàn)[24]指出,當(dāng)式(18)定義的特征子集選取評價指標(biāo)Ο(l) 的取最優(yōu)值時,選取的特征子集能夠最大限度保持原始數(shù)據(jù)分類能力,而且特征之間的冗余度最低,此時的特征提取向量即為最佳lbest。
式中:U為相似矩陣;R=(lT,…,lT)為特征選取矩陣;Φ=(FS1,FS2,…,FSN)T為特征矩陣;ψ為相關(guān)性矩陣。
2)特征提取向量確定。采用IABC 對Ο(l) 優(yōu)化過程進(jìn)行求解,將l等效為蜜蜂編碼X,IABC 目標(biāo)函數(shù)選取為Ο(l)函數(shù)。
3)編碼位調(diào)換進(jìn)化。由于l編碼是離散的,此時如果仍采用式(8)—式(10)更新公式進(jìn)行更新,會產(chǎn)生大量不符合要求的解。為此,提出編碼位調(diào)換學(xué)習(xí)進(jìn)化策略。以向Xbest學(xué)習(xí)為例,將φ(Xbest-連續(xù)操作定義為編碼位調(diào)換進(jìn)化操作,即隨機(jī)選取Xbest內(nèi)K個編碼位替代(如圖3 所示。)
圖3 編碼位調(diào)換進(jìn)化操作示意圖Fig.3 Diagram of code bit exchange evolution operation
ELM 具有更快的運(yùn)算效率,被廣泛應(yīng)用于預(yù)測領(lǐng)域。對于訓(xùn)練數(shù)據(jù)集合Sn={(xi,yi)},ELM 利用輸入權(quán)值ω=(ω1,…,ωk)、連接權(quán)值β=(β1,…,βk)和偏置b=(b1,…,bk)定義預(yù)測輸出值向量Y=[y′1y′2…y′n]T:
式中:H為輸出矩陣。
訓(xùn)練過程中,X,Y已知,ω,β事先給定,根據(jù)式(20)可以得到β:
式中:H+為H的廣義逆矩陣。
為提高ELM 預(yù)測的穩(wěn)定性,引入訓(xùn)練誤差e=(e1,…,en)和正則系數(shù)Q,并求解β最小范數(shù):
當(dāng)H未知時,文獻(xiàn)[25]提出了一種核極限學(xué)習(xí)機(jī)(KELM),即通過構(gòu)造核矩陣ΩKELM替代HHT:
定義為K(xi,xj)=h(xi)h(xj)核函數(shù),則有:
1)多核加權(quán)KELM 提升了對復(fù)雜數(shù)據(jù)的預(yù)測能力,但是一種核函數(shù)不可能對所有數(shù)據(jù)都具備良好的分析預(yù)測性能,為此引入多核加權(quán)極限學(xué)習(xí)機(jī)(Multiple Kernel Extreme Learning Machine,MKELM),即:
式中:Kz(x,x1) 為第z(1 ≤z≤Z,Z為核函數(shù)總個數(shù))個核函數(shù);?z為第z個核函數(shù)對應(yīng)的加權(quán)值。
2)IABC 優(yōu)化MKELM 參數(shù)。本文選取三階多項(xiàng)式函數(shù)Kp(x,xn)、指數(shù)核函數(shù)Ke(x,xn)和高斯核函數(shù)KR(x,xn)為多核加權(quán)函數(shù),式中Kp(x,xn),Ke(x,xn),KR(x,xn)分別涉及參數(shù)C0,σe,σR。此時采用IABC 對MKLEM 參數(shù)進(jìn)行優(yōu)化,定義蜜蜂編碼X=(0,σe,σR,C?1,?2),目標(biāo)函數(shù)定義為訓(xùn)練集均方根誤差,即:
蜜蜂種群循環(huán)迭代進(jìn)化,最終得到MKELM 最優(yōu)參數(shù)組合。
采用MATLAB 平臺對某地區(qū)短期電力負(fù)荷進(jìn)行預(yù)測分析。每間隔1 h 采集8 月1 日至8 月31日以及12 月1 日至12 月31 日的電力負(fù)荷、環(huán)境因素等數(shù)據(jù),其中前25 天數(shù)據(jù)作為訓(xùn)練樣本集,后6 天為預(yù)測驗(yàn)證數(shù)據(jù)集以驗(yàn)證所提短期電力負(fù)荷預(yù)測的有效性(其中,8 月29 日、30 日,12 月28 日、29日為周末)。采用文獻(xiàn)[9]提出的均方根誤差RM與平均誤差MA進(jìn)行量化評估。最后采用本文提出的基于改進(jìn)密度峰值聚類和多核加權(quán)極限學(xué)習(xí)機(jī)預(yù)測方法(IDPC-MKELM)對短期電力負(fù)荷進(jìn)行預(yù)測。
以8 月27 日0:00-24:00 電力負(fù)荷預(yù)測為例,采用本文提出的短期電力負(fù)荷預(yù)測模型進(jìn)行預(yù)測分析。表1 給出了樣本最佳聚類個數(shù)C、特征提取數(shù)m、平均運(yùn)算時間tˉ,RM和MA結(jié)果,選取基本ABC、改進(jìn)的灰狼優(yōu)化算法(Improved Grey Wolf Optimizer,IGWO[19]進(jìn)行對比實(shí)驗(yàn)(對目標(biāo)函數(shù)值無量綱化處理),圖4 給出了某個分類對應(yīng)的IABC 優(yōu)化最優(yōu)特征子集提?。繕?biāo)函數(shù)取lg 值)、MKLEM參數(shù)收斂曲線。以最佳特征子集為基數(shù),依次增加或減少選取特征數(shù)量,圖5 給出了不同特征組合下RM,MA變化曲線(對RM,MA進(jìn)行無量綱化處理),圖6 給出了預(yù)測效果圖。
圖4 分類對應(yīng)IABC收斂曲線Fig.4 IABC convergence curve corresponding to classification
圖5 不同特征組合下RM,MA 變化曲線Fig.5 RM,MA change curve under different feature combinations
圖6 短期電力負(fù)荷預(yù)測效果圖Fig.6 Effect drawing of short-term power load forecasting
表1 短期電力負(fù)荷預(yù)測結(jié)果Table 1 Short term power load forecasting results
從圖4 可以看出,相比于其它2 種優(yōu)化算法,IABC 算法具有更快的收斂速度和更高的收斂精度,因此能夠給出更佳的參數(shù)優(yōu)化結(jié)果,有利于提升預(yù)測效果;從圖5 可以看出,隨著選取特征數(shù)的不斷增加,預(yù)測精度在提高,但是,當(dāng)特征選取數(shù)達(dá)到設(shè)定的最佳數(shù)值時,預(yù)測精度基本保持不變,這也表明,最優(yōu)特征子集提取不僅保持了原始數(shù)據(jù)辨識能力,而且能夠有效降低數(shù)據(jù)維度,減少數(shù)據(jù)處理復(fù)雜度;從表1、圖6 可以,本文預(yù)測模型的短期電力負(fù)荷預(yù)測曲線與真實(shí)值曲線擬合度很高,這也驗(yàn)證了所提短期電力負(fù)荷預(yù)測的有效性。
為進(jìn)一步驗(yàn)證所提IDPC-MKELM 的有效性,選取MKELM、卷積神經(jīng)網(wǎng)絡(luò)—雙向長短期記憶網(wǎng)絡(luò)(Convolutional Neural Networks-Bidirectional Long ShortTerm Memory,CNN-BiLSTM)[9]進(jìn)行對比實(shí)驗(yàn),表2 給出了8 月和12 月預(yù)測RM,MA對比結(jié)果,圖7、圖8 分別給出了8 月31 日和12 月28 日(周末)電力負(fù)荷預(yù)測曲線圖。
表2 不同算法短期電力負(fù)荷預(yù)測結(jié)果Table 2 Short term power load forecasting results with different algorithms
圖7 8月31日短期電力負(fù)荷預(yù)測曲線Fig.7 Short term power load forecasting curve on August 31
從表2 可以看出,無論是對于8 月還是12 月電力負(fù)荷預(yù)測,IDPC-MKELM 的RM和MA表現(xiàn)最好,CNN-BiLSTM 次之,而MKELM 表現(xiàn)最差。相比于其它2 種預(yù)測算法,IDPC-MKELM 的RM降低了約3.5%~37.5%,MA降低了約8.8%~39.8%;從圖7和圖8 可以看出,IDPC-MKELM 預(yù)測結(jié)果與原始數(shù)據(jù)曲線擬合度最高,而且能夠以更小的誤差給出工作日、非工作精確預(yù)測結(jié)果。對比實(shí)驗(yàn)仿真結(jié)果表明,利用改進(jìn)密度峰值聚類對數(shù)據(jù)進(jìn)行聚類分析,提升了預(yù)測的精細(xì)度和預(yù)測精度;多核加權(quán)極限學(xué)習(xí)改進(jìn)方式以及利用IABC 對參數(shù)進(jìn)行全局優(yōu)化,很大程度地改善了短期電力負(fù)荷預(yù)測精度,使所提的IDPC-MKELM 在短期電力負(fù)荷預(yù)測問題更具優(yōu)越性。
圖8 12月28日短期電力負(fù)荷預(yù)測曲線Fig.8 Short term power load forecasting curve on December 28
對短期電力系統(tǒng)負(fù)荷預(yù)測問題進(jìn)行了研究,提出了基于密度峰值聚類、極限學(xué)習(xí)機(jī)和智能優(yōu)化算法理論的的短期電力負(fù)荷預(yù)測方法。該方法從降低數(shù)據(jù)維度、提升預(yù)測效果出發(fā),分別設(shè)計了改進(jìn)DPC 聚類分析、最優(yōu)特征子集提取、多核加權(quán)ELM和改進(jìn)IABC 算法,并以某地區(qū)實(shí)測數(shù)據(jù)進(jìn)行驗(yàn)證分析,仿真結(jié)果表明,所提方法能夠很好地預(yù)測跟蹤短期電力負(fù)荷變化。