賈逸倫,龔慶武,李俊雄,占勁松
(武漢大學 電氣工程學院,武漢 430072)
負荷預測在現代電力系統(tǒng)運行管理中占有重要地位,對其精確預測是保證電力系統(tǒng)穩(wěn)定調度與計劃的重要基礎。目前多種方法已應用于此方向,如神經網絡模型,支持向量機(SVM)模型,時間序列(ARMA)方法,卡爾曼濾波等方法[1-3]。而在實際操作中,由于負荷信號往往具有復雜的時頻分布特性與動態(tài)機理較強的非線性特征,故單一預測方法往往不能兼顧不同時間尺度的變化特征。而使用前置分解能提取出非穩(wěn)態(tài)負荷信號中不同時間尺度的信息,并用統(tǒng)計學方法分別對其進行預測,故該類方法往往能改善預測效果[4-5]。經驗模態(tài)分解(Empirical Mode Decomposition,EMD)是近年黃鍔提出的一種自適應處理非線性與非穩(wěn)態(tài)信號方法,可以依次分解信號中的不同尺度信息。相比小波分析等其他分解方法,EMD克服了需要人為經驗選擇小波基函數與分解層數等不足,減少了主觀因素對結果的影響。然而其自身仍存在著一些不足,如信號采樣率設置、分解過程的循環(huán)終止條件設置、樣條插值邊界效應處理等問題。其中,分解產生的模態(tài)混疊現象,會對后續(xù)的預測結果產生較強的影響。針對模態(tài)混疊問題,Huang提出集合經驗模態(tài)分解方法(EEMD)[6],通過添加均勻分布的高斯白噪聲,并利用多次平均計算使零均值白噪聲互相抵消,從而消除模態(tài)混疊現象并消除白噪聲[7]。
然而,由于白噪聲分布的隨機性及集成平均實驗次數的有限性,在多尺度分解后,各重構信號仍有一定幅值的噪聲殘留,使預測的準確性降低,重構誤差可以通過增大集成平均計算次數減少,但會增大運算量,提高計算負荷?;诖?,本文引入一種新型的添加自適應白噪聲的完全集合經驗模態(tài)分解方法(Complete Ensemble Empirical Mode Decomposition with adaptive noise,CEEMDAN),通過對 EEMD分解過后的各分量進行白噪聲分量的疊加抵消,使由噪聲產生的重構誤差在分解過程中就消失,既保證分解精度,更提高了模態(tài)間的分辨率[8]。
在各種單項預測方法中,支持向量機方法由于其轉化復雜高維空間,并具有較好的泛化推廣能力,避免過學習問題等特點,成為人工智能方法與數據挖掘的新的研究熱點。而其中如何確定SVM方法中的不敏感損失系數、懲罰系數與核寬度系數等問題都決定了模型自身的準確性與有效性,故對其更精確與更方便的選擇是SVM算法中最重要的問題。本文提出利用量子粒子群算法對該系數進行尋優(yōu)[9],并與CEEMDAN方法結合進行組合預測,得到較為精確結果,從而證實了該方法的有效性。
EMD方法是時間序列處理方法—希爾伯特黃變換(Hilbert-Huang Transform,HHT)方法的核心,其本質是對信號做平穩(wěn)化處理,得到包含不同時間尺度重構局部特征信號的固有模態(tài)分量(Intrinsic Mode Function,IMF),其應滿足:(1)序列長度中跨 0點與極值點的數目相等或差1;(2)由局部極大值構成的上包絡線與局部極小值構成的下包絡線均值為0,即與時間軸對稱。原始信號x(t)經EMD分解后可表示為:
式中IMFi(t)為包含時間序列不同尺度分量,r(t)為殘余函數,代表信號整體趨勢。EMD算法步驟如下:
(1)確定x(t)所有局部極值點,并通過三次樣條插值分別連接極大值與極小值點,得到信號的上下包絡線Umax(t)與Umin(t),并求出均值,進而得到原始信號與均值的差值h1(t),有:作為最終的IMF。
EEMD方法可以在一定范圍內減小模態(tài)混疊現象的產生,但由于新加入白噪聲序列,在有限次的平均計算后,誤差并不會完全抵消,會影響重構序列的準確性,進而影響預測的精度。誤差值雖可以通過集成平均次數的增多而減少,但運算量與計算時間又隨之大幅增加。基于此現象,本文引入CEEMDAN方法,其在在每次EEMD分解中,由于其添加白噪聲nj(t)不同,最終產生的殘余信號都不同[10],即有:
(2)檢驗h1(t)是否滿足 IFM條件,若滿足,則有IMF1(t)=h1(t),并從原始信號x(t)中減去IMF1(t)得殘余信號r1(t);如不滿足,則將x(t)替換為h1(t),并重復步驟一,直到新的h1k(t)滿足條件;
(3)以r1(t)為新的待分解信號,重復上述過程,得到N個IMF分量。當最終殘余信號為單調函數或滿足變化足夠小條件時,迭代終止,EMD分解完成。
EEMD在傳統(tǒng)EMD基礎上,針對模態(tài)混疊問題,引入高斯白噪聲輔助進行數據分析,其步驟為:
(1)給原始數據x(t)中加入均值為0,標準差kε為的白噪聲序列nj(t),其中,k為白噪聲序列幅值系數,ε為序列標準差。一般k取0.01~0.5較適宜,且需多次嘗試比較得到更好結果;
(2)將上述混合序列進行EMD分解;
(3)執(zhí)行 M次步驟(1)、(2),每次加入不同的nj(t);
(4)取M次分解后所得固有模態(tài)分量的均值
定義算子emdi()為利用EMD算法產生的第i個模態(tài)分量,用CEEMDAN方法所得的第個模態(tài)分量記為,該方法步驟如下:
(1)與EEMD算法相同,CEEMDAN算法在M次計算中,對原始數據x(t)+p0nj進行分解,其中,參數pi控制著附加噪聲與原始信號的信噪比,使其保持在合適范圍,則第一個模態(tài)分量為:
(2)在下一步分解前,繼續(xù)引入白噪聲信號自我EMD分解的第一階分量,將其與殘余信號組合以消除噪聲對原始信號造成的誤差,則待分解信號更新為r1(t)+p1emd1(nj(t))。繼續(xù)用EEMD對第二個模態(tài)分量集成平均,可有:
(3)對剩余階段,繼續(xù)利用步驟2方式計算殘余信號,可得第n+1個模態(tài)分量為:
(4)當最終殘余信號滿足迭代終止條件時,算法終止,設此時有N個最終模態(tài)分量,則原始序列可表示為:
利用本文所示改進方法,可消除每階模態(tài)分解后殘余信號中由于添加白噪聲所產生的誤差,從而使分解結果更加精確。
支持向量機方法(SVM)已被證實是一種非常有效且高效的監(jiān)督學習方法,其以VC維理論與結構風險最小原理為基礎,構造分類超平面,將非線性問題映射到高維空間進行線性轉化。SVM方法的核心在于其參數的選擇,其中不敏感損失系數ν與懲罰系數C控制模型的復雜程度與精度,核寬度系數σ也影響著計算結果與運算量的大小,故對此三系數(C,σ,ν)的選擇,是SVM算法中的關鍵問題。
許多規(guī)范的參數尋優(yōu)方法被應用于支持向量機的參數尋優(yōu)中,其中粒子群算法憑借其搜索速度快、效率高、算法簡單等優(yōu)勢已被大量應用。而針對其容易陷入早熟收斂和局部收斂的缺陷,一些改進措施被提出應用,其中主要兩種為帶收縮因子的粒子群算法(YSPSO)與帶慣性權重的粒子群算法(SPSO)[11],且后者的性能通常要優(yōu)于前者。本文采用量子粒子群改進基本算法(Quantum Particle Swarm Optimization,QPSO),并與前兩種算法進行對比分析。量子粒子群算法首先由Sun提出,其將粒子群算法理論與量子力學的理論知識相結合,利用量子物理學中的量子運動方式描述粒子的運動,從而保證粒子的運動覆蓋整個可行解區(qū)域,從而保證搜索到全局最優(yōu)解[12]。
粒子群算法中粒子運動過程用量子力學來描述時,可以認為粒子群以點qi=(qi,1,qi,2,…,qi,m為吸引勢場中心進行運動。吸引勢場中心點的坐標可以描述為:
式中j=0,1,…,m,m為粒子維數;φi,j(t)是[0,1]上均勻分布的隨機數;pi,j(t)代表粒子經歷過的最優(yōu)位置;pg,j(t)代表種群經歷過的最優(yōu)位置。
量子空間中,使用波函數ψ來描述粒子的狀態(tài),波函數的模的平方值代表了粒子出現在空間某一點的概率密度,公式為:
Q表示粒子在當前時刻在點(x,y,z)出現的概率。假設單個粒子在一維空間中運動時,粒子的位置為X。p是粒子的吸引中心,在多維空間中時即為公式(9)中qi,j(t),在p處建立一維δ勢阱,通過求解薛定諤方程得到概率密度函數Q,再通過蒙特卡洛隨機模擬來測量量子的位置,可得算法的粒子基本進化方程:
式中L是一維勢阱的特征長度;u是[0,1]上均勻分布的隨機數。在多維空間中的粒子,可對每一維的吸引中心分別建立一維δ勢阱進行計算。故求解吸引中心qi,j(t)轉化為確定Li,j(t)的值,定義平均最好位置P(t)為粒子群中個體最好位置的平均值,對于m維空間中的n個粒子,平均最好位置為:
則Li,j(t)值可由下式確定:
其中,ξ是收縮—擴張系數,也是算法中除了迭代次數和種群規(guī)模之外唯一的一個可控制的參數,可以取作一個固定值,也可按一定方式動態(tài)變化。帶入式(11),得:
收縮—擴張因子可按式(15)進行變化:
式中ξmax為收縮—擴張因子最大值,ξmin為最小值,tmax為最大迭代次數。根據如上定義,在粒子群算法中,選定上述參數值后,隨機初始化中群內所有粒子位置后,利用式(13)計算種群的平均最優(yōu)位置P(0),計算每個粒子的適應度值,將當前各粒子的適應度值和當前位置儲存于粒子最優(yōu)解pbest中,當前種群的適應度值和當前最優(yōu)位置儲存于種群最優(yōu)解gbest中。再用式(10)、式(14)、式(15)更新粒子位置與吸引中心后計算新的各粒子間適應度值,并與之前pbest所保存值相比較,取出更優(yōu)值。在滿足終止條件和最大迭代次數后,輸出最優(yōu)解。
本文以MATLAB作為開發(fā)環(huán)境,選擇中國青海某區(qū)域實測負荷輸出功率數據為試驗樣本,該數據以2012年到2013年每隔半小時的電力負荷值為樣本,選取每日最大負荷值為采樣點,預測2014年1月每日最大負荷值,即進行負荷中期峰值預測。其序列樣本如圖1所示。
圖1 青海某區(qū)域兩年每日最大負荷序列Fig.1 Daily maximum load series of two years in a certain domain in Qinghai
首先,應用EMD,EEMD與CEEMDAN三種時間序列分解方法,將負荷序列分解為不同時間尺度,比較三種方法優(yōu)劣。其中加入白噪聲幅值系數k=0.2,集成次數M=500。其中,利用CEEMDAN算法所分解不同尺度模態(tài)分量如圖2所示。
可以看出,IMF1分量是不具有明顯周期性變化的隨機高頻分量,而IMF2則為明顯有以星期為單位的周期分量,IMF3到IMF6所表示的時間尺度分量也表現出一定的周期特性,且其每個分量中沒有大幅的頻率變化,各模態(tài)分量也沒有重合的頻率部分,故其分解的模態(tài)中并沒有明顯的混疊部分。為進一步比較該方法對模態(tài)混疊的現象的改進,將EMD,EEMD與CEEMDAN三種時間序列分解方法的Hilbert譜所列如下,為方便觀察,僅列出各序列的瞬時頻率值,未給出其瞬時幅值:
圖2 CEEMDAN算法分解原始序列圖Fig.2 Decomposition result of original series using CEEMDAN algorithm
由圖3可以看出,在橫向時間軸中某些點有著一定程度的聚集,而聚集為一定程度的點則表現為連貫的線,其中每一點表示由EMD方法分解的各IMF瞬時頻率值??梢钥闯?,圖(a)的各IMF瞬時頻率值分開程度不明顯,各相鄰分量間瞬時頻率有著部分重合與混疊部分,尤其在最高頻(圖中瞬時頻率在0.3~0.5部分)變化幅度大,且混亂性高,故可看出其模態(tài)混疊問題較為嚴重。而在圖(b)與圖(c)中,各IMF分開程度相較圖(c)有了提高,能顯著看出各分量有了自己一定的頻率區(qū)域,且在一定范圍內變化,各分量間的重疊部分明顯減少。相比圖(b),圖(c)的高頻隨機分量瞬時頻率值明顯與其他部分更加分開,說明利用CEEMDAN方法在初始分解高頻隨機分量后對殘余分量補足白噪聲的一階分量起到了明顯效果。由圖所示,EEMD與CEEMDAN兩種方法都有效緩解了模態(tài)混疊現象,而CEEMDAN使各分量有了更明顯的區(qū)分,有著更好的效果。
圖4給出了三種方法分解信號后的重構誤差,可以看出,在添加500組白噪聲后,EEMD分解確實使分解信號的重構誤差顯著增加,比原始EMD分解高很多量級,而CEEMDAN方法將白噪聲在各次分解中分別帶入抵消,故其重構誤差又降回原來量級,保證了后面的預測結果,驗證了該方法的優(yōu)越性。
圖3 三種分解方法Hilbert譜圖Fig.3 Hilbert spectrum diagram of three decomposition methods
圖4 三種分解方法的重構誤差Fig.4 Reconstruction error of three decomposition methods
得到原始信號的各分解值后,本文利用所提出的QPSO—SVM方法進行預測,由于預測值為1月負荷值,故選擇兩年內11月至12月,1月至2月數據作為訓練數據,以預測前7天負荷最大值為輸入量,并分別用二進制量1,0區(qū)分該日期為工作日還是節(jié)假日。使用滾動預測形式,例如用2013年12月25日至31日數據,得到2014年1月1日負荷最大量,然后利用基于得到的預測值再預測1月2日的負荷值,依此類推,直到得到預測的全部結果。
為比較本文所提方法的有效性與優(yōu)異性,引入EMD-QPSO,EEMD-QPSO,CEEMDAN-YSPSO 與CEEMDAN-SPSO四種算法進行比較,選擇三參數向量為(C,σ,ν),粒子群的規(guī)模n=20、最大迭代次數tmax=200、取ξmax=1,ξmin=0.5。YSPSO算法中學習因子c1=c2=2.05,收縮因子ξ=0.73,交叉驗證折數β=5;SPSO算法中,取c1=c2=2,最大慣性權重wmax=0.9,最小慣性權重wmin=0.4,交叉驗證折數β=5;QPSO算法中,對于空間第i個粒子,有:
利用所求三向量值帶入式(10)~式(15)中進行尋優(yōu),并將所求結果帶入支持向量機中,最終得到預測結果,并合并各分量預測值,與實際結果數據相對比,其數值比較如圖5所示。
圖5 不同組合方法預測結果圖Fig.5 Forecast result diagram of different combined methods
從圖中可以看出,CEEMDAN-QPSO方法的預測值最為接近實際值,CEEMDAN-YSPSO方法由于向量參數的選擇不同,得到的預測結果與實際值差距在幾種方法中明顯較大,而EEMD-QPSO方法由于白噪聲的引入,在某些點也有著較高的預測誤差,局部效果劣于EMD-QPSO方法,CEEMDAN-SPSO也有著較好的預測效果,但整體精度仍不如CEEMDAN-QPSO。
進一步比較五種方法的結果優(yōu)劣程度,取其最大相對誤差(maximum relative error),最小相對誤差(minimum relative error)與平均絕對百分誤差(mean absolute percentage error,MAPE)三個數值進行比較,所得結果如表1所示。
表1 不同組合預測方法性能比較Tab.1 Property comparison of different combined forecasting methods
由表1可看出,由于EEMD方法局部點預測與真實值差距較大,且作用較為明顯,使最終MAPE值最大,CEEMDAN-YSPSO方法整體與真實值也有一定距離,雖然CEEMDAN-SPSO方法的最小相對誤差值較大,但其整體預測效果與實際值相契合。在五種方法中,本文所提CEEMDAN-QPSO方法在三個指標中,都有著更好的效果,驗證了該方法的實際應用性。
本文提出一種基于添加自適應白噪聲的完全集合經驗模態(tài)分解方法與量子粒子支持向量機的預測方法,為電力負荷的預測提供一種新的解決方法。經過與其他方法的實驗對比,驗證了該方法的準確性與創(chuàng)新性。
其中在預測結果中,本文所提方法有一定創(chuàng)新,但由于EMD方法自身對準確性的要求,需要大量的集成運算,故在運算量的控制與進一步減少預測時間上仍可以繼續(xù)研究。而在預測中,除了工作日與休息日的區(qū)別,對其他可能影響預測結果的因素,如氣候等條件的引入,可以作為下一步的研究方向。