摘 要:準確預測電價有助于電力市場參與者進行風險規(guī)避并達到經(jīng)濟收益最大化。針對短期電價序列具有非平穩(wěn)性與非線性的特點,提出了一種新型混合預測模型CEEMD-SSA-ELM。采用互補集成經(jīng)驗模態(tài)分解(complementary ensemble empirical mode decomposition,CEEMD)方法對電價序列進行有效分解;針對分解后的最高頻分量具有較大隨機性的特征,采用奇異譜分析(singular spectrum analysis,SSA)對其進行降噪并提取趨勢項;最后,對最高頻分量的趨勢項及其余分量分別使用極限學習機(extreme learning machine,ELM)模型進行獨立預測,并將其預測結果進行重構集成以得到最終預測結果。對2種實際電價數(shù)據(jù)的預測分析結果表明:CEEMD-SSA-ELM模型和CEEMD-ELM、ELM模型相比,具有更高的預測精度。
關鍵詞:互補集成經(jīng)驗模態(tài)分解;奇異譜分析;極限學習機;短期電價預測
中圖分類號:TP391
文獻標識碼: A
文章編號"1000-5269(2020)05-0082-07"""DOI:10.15958/j.cnki.gdxbzrb.2020.05.13
電價能夠有效體現(xiàn)電能的供需變化,并可具體反映電力市場運營情況。對電價數(shù)據(jù)進行精準的預測將有助于售電企業(yè)決定市場報價,并能及時地規(guī)避市場風險。然而,由于短期電價受到天氣、日常活動、商務交易、供給側報價等多種因素的綜合影響,導致其具有典型的非平穩(wěn)性與非線性的特點。由于很難準確擬定顧及諸多影響因素的數(shù)學模型,采用經(jīng)典的因果關系回歸模型進行短期電價預測往往精度較低。近年來,另一種將歷史電價作為時間序列進行建模預測的方式得到了廣泛的研究。常用的時間序列預測方法有自回歸滑動平均模型(autoregressive moving-average model,ARMA模型)[1] ,廣義自回歸條件異方差模型(generalized autoregressive conditional heteroskedasticity model,GARCH模型)[2]等,但這些方法都是基于線性序列進行建模分析,其對于捕捉電價序列中的非線性特征能力有限,這也導致其預測結果的精度并不高。隨著人工智能技術的飛速發(fā)展,人工神經(jīng)網(wǎng)絡(artificial neural network,ANN)、支持向量機(support vector machine,SVM)等非線性方法在電價預測領域中已取得了較為成功的應用[3-5]。
為了進一步提高電價時間序列預測的精度,目前一種基于“分解-預測-集成”思想的混合預測方法被廣泛的關注和研究[6-8]。其預測思路為:首先采用小波變換(wavelet transform,WT)、經(jīng)驗模態(tài)分解(empirical mode decomposition,EMD)等信號分解方法將電價序列分解為多個分量,進而對每個分量采用ANN、SVM等非線性方法進行獨立預測,最后將所有分量預測進行重構集成。該類方法已經(jīng)證實可以有效提高預測精度[8];但是,小波變換需要對小波基函數(shù)、分解層數(shù)進行預先設置,所以小波變換并不是一種自適應的分解方法,而EMD方法也難以避免模態(tài)混疊現(xiàn)象的發(fā)生。另外,ANN方法存在有訓練速度慢、易陷入局部極小等問題;SVM方法也存在難以合理選擇模型參數(shù)的缺點。特別地,對于該類混合預測方法,由于分解后的最高頻分量的隨機性最強,其獨立預測的難度也最大。文獻[7]提出將最高頻分量舍去后對其余分量進行預測集成,但是這種舍去方式顯然也會影響最終的預測精度。
為了有效解決上述問題,本文提出CEEMD-SSA-ELM模型,并以澳大利亞昆士南州和新南威爾士州的電力市場某月的電價數(shù)據(jù)作為研究對象,進行了電價預測。實驗取得了較高的預測精度,也驗證了所提方法的有效性。
1"理論背景
1.1"CEEMD的基本原理
由于應用EMD方法對信號分解所獲得的固有模態(tài)函數(shù)(instrinsic mode function,IMF)會存在模態(tài)混疊問題,WU等[9]基于輔助白噪聲分析提出了一種集成經(jīng)驗模態(tài)分解(ensemble empirical mode decomposition,EEMD)方法以避免該現(xiàn)象的發(fā)生,但是,EEMD方法也存在有難以消除重構信號中的殘余輔助白噪聲的缺陷。YEH等[10]在EEMD的基礎上,以采用正、負成對的形式加入輔助白噪聲,提出了CEEMD方法。該方法的計算效率較高,并可在重構信號時完全消除殘余輔助噪聲,其計算流程為:
本文對矩陣XI1應用式(7)重建時間序列,以實現(xiàn)將噪聲從原始序列中分離。
1.3"ELM的基本原理
ELM是HUANG等在2006年提出的一種進化神經(jīng)網(wǎng)絡方法[14],可以避免傳統(tǒng)ANN方法存在的訓練速度慢、易陷入局部極小等缺陷。ELM數(shù)學模型為
2"短期電價預測的CEEMD-SSA-ELM方法
2.1"基于CEEMD的短期電價序列分解
2.2"基于SSA的最高頻分量趨勢提取
由于第1個最高頻分量IMF1變化劇烈、隨機性強,直接建模預測的效果較差,且將會影響整體的預測精度,因此,利用SSA對其去噪處理并提取趨勢項,記為IMF1′。
2.3"基于ELM預測模型結構的確定
2.4"CEEMD-SSA-ELM方法流程圖
綜上,將CEEMD-SSA-ELM應用于某地區(qū)電價預測中,可得到CEEMD-SSA-ELM模型的流程圖,如圖1所示。
2.5"預測模型的評價指標
為了定量評價電價預測模型的精度,本文選取2種評價指標:
3"實例分析
3.1"實例1
本文以澳大利亞昆士蘭州2016年6月1日00:30:00至2016年7月1日00:00:00共30 d的電價數(shù)據(jù)為研究對象,每半小時采集一次,共計1 440個短期電價時間序列。澳大利亞昆士蘭州原始電價數(shù)據(jù)序列如圖2所示。
為了減少數(shù)據(jù)量綱對建模的影響,采用下式將原始電價序列數(shù)據(jù)歸一到[-1,1]區(qū)間:
式中:X′(t)為歸一化后的電價序列;Xmin、Xmax分別為原序列中的最小值、最大值。在建模計算結束后,對輸出的訓練與預測數(shù)據(jù)進行反歸一化處理,可將其還原至原始區(qū)間。
成次數(shù)N=100,噪聲標準差設為0.2。分解后可得到10個IMF分量以及1個殘余分量。
對IMF1使用SSA方法進行去噪處理。在此過程中需確定其窗口長度L和重構選取的特征值個數(shù)k。文獻[12]建議L不大于N/2,且如果原序列總存在整數(shù)周期的分量,L應取與該周期成正比的數(shù)值。在本例中,采樣周期為1 d(48個采樣點),故經(jīng)測試后設置L=12。圖3給出了最高頻分量IMF1的奇異譜圖。
從圖3可以看出:將SSA方法中的矩陣XXT特征值由大到小排列,自第7個特征值開始,下降速率增大,且前7個的貢獻率為81.7%;根據(jù)設置的貢獻率閾值(80%),即可將k選為7。圖4給出了經(jīng)SSA處理前后的最高頻分量,其中,紅色虛線即為提取的趨勢項。
對經(jīng)CEEMD-SSA處理后的第一分量和其余分量序列設置嵌入維數(shù),構建樣本數(shù)據(jù)集。本文嵌入維數(shù)都設置為8,即由前8個數(shù)據(jù)預測第9個數(shù)據(jù)。由此,總樣本數(shù)目可構建為1 432個,統(tǒng)一以最后240個電價為預測對象,則訓練樣本數(shù)目設置為1 192個。在此基礎上,對每個分量序列分別建立ELM模型,其中,隱層神經(jīng)元節(jié)點數(shù)均設置為14,激活函數(shù)均選擇為“Sig”函數(shù)。由于ELM采用了隨機權值和偏置的獲取方式,將會使模型預測單次結果出現(xiàn)不穩(wěn)定現(xiàn)象。為此,在進行預測時,各循環(huán)操作了100次,并取其預測均值作為最終預測結果。
為了與本文方法進行對比,還建立了另外2種預測模型:(1)不使用SSA處理最高頻分量的CEEMD-ELM模型;(2)直接對電價數(shù)據(jù)進行預測的ELM模型。為了對比的公平性,這2種模型的參數(shù)均與本文所提模型設置完全一致。各種模型的預測結果如圖5所示。
從圖5可以看出:CEEMD-SSA-ELM模型的預測結果曲線與真實電價曲線的吻合度較高,充分表明了該模型具有良好的預測精度;CEEMD-ELM模型和ELM模型的預測曲線明顯偏離真值。3種模型精度指標統(tǒng)計結果見表1。
從表1可以發(fā)現(xiàn):CEEMD-SSA-ELM模型的預測精度最優(yōu),ELM模型預測性能最差;與CEEMD-ELM模型相比,CEEMD-SSA-ELM模型僅增加使用SSA對最高頻分量處理并提取趨勢項進行預測,但是,均方根誤差與平均絕對百分誤差分別減少了46.3%和44.8%,說明了SSA處理的必要性和有效性。
3.2"實例2
為了進一步驗證本文方法的有效性,第2個實例是以澳大利亞新南威爾士州在相同的時間段的電價數(shù)據(jù)為研究對象,即2016年6月1日00:30:00至2016年7月1日00:00:00共30 d,每半小時采集一次,共計1 440個短期電價時間序列。澳大利亞新南威爾士州原始電價數(shù)據(jù)序列如圖6所示。
應用CEEMD方法對上述數(shù)據(jù)進行自適應分解,對最高頻分量進行SSA處理。圖7給出了最高頻分量IMF1的奇異譜圖。從圖7可以看出:矩陣XXT的特征值從第8個開始,下降速率明顯增大,且前8個的貢獻率已超過80%,因此將k選為8。
在本例中,各種預測模型的數(shù)據(jù)集構造、參數(shù)設置與實例1完全一致。3種模型的預測結果如圖8所示。從圖8可以看出:CEEMD-SSA-ELM模型的預測結果曲線與真實電價曲線的吻合度較高,CEEMD-ELM模型和ELM模型的預測曲線明顯偏離真值。這與實例1的預測分析結果完全一致。精度指標統(tǒng)計結果見表2。
從表2可以看出: CEEMD-SSA-ELM模型的預測精度最高,CEEMD-ELM模型的預測精度次之,而ELM模型的預測精度最低。這與實例1的預測分析結果完全一致。
4"結論
(1)本文提出將一種CEEMD-SSA-ELM模型應用于短期電價序列預測中,取得了較高的預測精度,2個實例的分析結果充分表明該模型在短期電價預測中應用的可行性。
(2)與不加入SSA處理的CEEMD-ELM模型相對比,本文所提模型的均方根誤差與平均絕對百分誤差分別減少了40%與30%以上,充分說明了SSA對最高頻分量處理的必要性和有效性。
(3)本文對各分量建模采用ELM方法,而其輸入權值和偏置為隨機給定,并非最優(yōu)。為此,下一步的研究計劃是采用優(yōu)化算法、優(yōu)化參數(shù)以進一步提高預測精度。
參考文獻:
[1]MACIEJOWSKA K, NOWOTARSKIJ, WERON R. Probabilistic forecasting of electricity spot prices using factor quantile regression averaging[J]. International Journal of Forecasting, 2016, 32: 957-965.
[2]CIFTER A. Forecasting electricity price volatility with the Markov-switching GARCH model: evidence from the Nordic electric power market[J]. Electric Power Systems Research, 2013, 102: 61-67.
[3]IOANNIS P, ATHANASIOS S. Day-ahead electricity price forecasting via the application of artificial neural network based models[J]. Applied Energy, 2016, 172: 132-151.
[4]SINGHAL D, SWARUP K. Electricity price forecasting using artificial neural networks[J]. International Journal of Electrical Power amp; Energy Systems, 2011, 33(3): 550-555.
[5]劉慶彪, 張步涵, 王凱, 等. 電價預測的自適應支持向量機方法研究[J]. 電力系統(tǒng)保護與控制, 2008, 36(22): 34-39.
[6]蔣鋒, 何佳琪, 曾志剛, 等. 基于分解-優(yōu)化-集成學習方法的電價預測[J]. 中國科學: 信息科學, 2018, 48(10): 1300-1315.
[7]WANG D, LUO H, GRUNDER O, et al. Multi-step ahead electricity price forecasting using a hybrid model based on two-layer decomposition technique and BP neural network optimized by firefly algorithm[J]. Applied Energy, 2017, 190: 390-407.
[8]LIAN C, ZENG Z G, YAO W, et al. Displacement prediction model of landslide based on a modified ensemble empirical mode decomposition and extreme learning machine[J]. Natural Hazards, 2013, 66: 759-771.
[9]WU Z H, HUANG N E. Ensemble empirical mode decomposition: a noise assisted data analysis method [J]. Advances in Adaptive Data Analysis, 2009 (1): 1-41.
[10]YEH J R, SHIEH J S, HUANG N E. Complementary ensemble empirical mode decomposition: a novel noise enhanced data analysis method[J]. Advances in Adaptive Data Analysis, 2010, 2(2): 135-156.
[11]殷豪, 曾云, 孟安波, 等. 基于奇異譜分析的短期電價預測[J]. 電力系統(tǒng)保護與控制, 2019, 47(1): 115-122.
[12]HASSANI H . Singular spectrum analysis: methodology and comparison[J]. Journal of Data Science, 2007, 5(2): 239-257.
[13]王鑫, 吳際, 劉超, 等. 奇異譜分析在故障時間序列分析中的應用[J]. 北京航空航天大學學報, 2016, 42(11): 2321-2331.
[14]HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications [J]. Neurocomputing, 2006, 70(1/3): 489-501.
[15]YU C J, LI Y L, ZHANG M J. An improved wavelet transform using singular spectrum anaylsis for wind speed forecasting based on Elman neural network[J]. Energy Conversion and Management, 2017, 148: 895-904.
(責任編輯:周曉南)