侯 慧,王 晴,趙 波,章雷其,吳細秀,謝長君
關鍵信息缺失下基于相空間重構及機器學習的電力負荷預測
侯 慧1,王 晴1,趙 波2,章雷其2,吳細秀1,謝長君1
(1.武漢理工大學自動化學院, 湖北 武漢 430070;2.國網浙江省電力有限公司電力科學研究院, 浙江 杭州 310014)
隨著碳交易系統(tǒng)的發(fā)展,準確預測電力能源消耗對于能源管理是至關重要的。為實現在缺失天氣等多種關鍵信息下的電力負荷預測,首先采用混沌理論中的相空間重構技術對歷史負荷時間序列進行處理,根據排列熵驗證混沌特性。并利用8種機器學習模型進行預測與比較,其中包括4種以神經網絡為基礎的機器學習模型、3種以統(tǒng)計學習為基礎的機器學習模型及1種基準模型。其次采用灰色關聯度法對預測精度較高的極限學習機(ELM)和極端梯度提升(XGBoost)進行組合,構建了ELM-XGBoost模型。最后將ELM-XGBoost應用于一日至一周內不同時間尺度的負荷預測。結果表明,預測精度隨預測時間尺度增加而呈現降低的趨勢,且在日負荷預測中,所構建的ELM-XGBoost模型預測精度得到提升,應用效果良好。
電力負荷預測;關鍵信息;極限學習機;極端梯度提升;相空間重構;排列熵
準確的電力負荷預測對電網穩(wěn)定運行有著重要作用。電力負荷大小受多種關鍵信息影響:溫度、濕度、風速、日期類型、地區(qū)GDP等。然而,通常情況下難以獲得所有關鍵信息的準確數據。因此,若能在關鍵信息缺失情況下實施較為準確的電力負荷預測,則可以省去收集和處理多種數據的繁瑣過程,簡化電力負荷預測步驟。
現有短期電力負荷預測的研究主要分為多元時間序列分析和單一時間序列分析。多元時間序列分析考慮天氣等多種關鍵信息數據。如文獻[1]選取最大負荷、平均負荷、用電量、負荷密度和土地信息等負荷屬性作為多源影響因素,建立了空間負荷預測模型。文獻[2]將負荷歷史數據、溫度數據、日期數據和節(jié)假日信息分別輸入長短期記憶網絡(Long Short Term Memory, LSTM)和輕梯度提升機(Light Gradient Boosting Machine, LightGBM),通過最優(yōu)加權組合法得出組合模型的預測值。文獻[3]將氣溫、年份、月份、日期和工作日信息等多種關鍵信息輸入梯度提升樹,基于預測模型識別重要影響因素。為提高預測精度,文獻[4]將天氣預報的誤差作為負荷預測的特征之一。然而,多種關鍵信息的輸入在提高預測精度的同時會帶來繁瑣的數據處理及特征處理過程。數據處理包括數據清洗、集成及變換等步驟。特征提取可通過經驗模態(tài)分解[5]、卷積神經網絡[6]、關聯矩陣[7]、聚類分析[8]等方法實現。將所選定特征輸入到機器學習模型或深度學習模型[9-11]中,從而獲得預測結果。綜上可知,涉及多種關鍵信息下的負荷預測具有較復雜的數據處理及特征處理過程,且上述研究對天氣等關鍵信息數據依賴性較強,若不能獲取準確的關鍵信息數據,形成多元時間序列,則較難開展精確預測。
在實際情況中,部分研究難以獲得與某地區(qū)電力負荷歷史數據相匹配的關鍵信息數據,如負荷密度、土地信息、溫度信息等,或所獲取關鍵信息數據類型有限,限制了預測精度的提升。因此,為實現在缺失天氣等多種關鍵信息下的電力負荷預測及簡化預測步驟,有必要對單一時間序列的負荷預測進行研究。針對單一時間序列下的研究,文獻[12-14]指出,一般電網的電力負荷時間序列具有混沌特性,利用負荷的混沌特性進行負荷預測,可以不直接考慮影響負荷的因素,而是對受諸多關鍵信息影響的負荷歷史數據進行分析。據此,文獻[15]提出基于相空間重構理論和神經網絡融合的改進混沌神經網絡,通過對天津配電網和地區(qū)網的歷史負荷進行訓練和測試,證實了所提方法的有效性。文獻[16]提出基于相空間重構理論和遞歸神經網絡相結合的預測模型。文獻[17-18]采用相空間重構網絡對時間序列進行預測。雖然上述研究不涉及影響負荷的關鍵信息數據,僅使用負荷歷史數據完成預測,但其所采用的預測模型以神經網絡為主,模型較為單一?,F有研究中對于基于單一時間序列下的機器學習算法對比研究較少,且預測精度有待提高。
綜上,本文首先采用混沌理論中的相空間重構技術與機器學習模型相結合的方法,通過對比8種機器學習模型的預測精度,尋找單一時間序列下合適的電力負荷預測模型。其次,對于較優(yōu)的模型,在不同時間長度下進一步驗證方法的正確性。最后采用灰色關聯度法進行模型組合,提出了由ELM和XGBoost組合而成的ELM-XGBoost模型,算例結果表明,在日負荷預測中,本文組合模型能夠在缺失關鍵信息下取得較其他組合模型更優(yōu)的預測效果。
相空間重構理論(Phase Space Reconstruction Theory, PSRT)認為混沌系統(tǒng)中各分量的演化都是由與之相互作用的其他分量(如氣象因素等分量)所決定,即每個分量的演化過程中都隱含著系統(tǒng)的全部信息[19]。
1.1.1延遲時間計算
1.1.2嵌入維數計算
1.1.3混沌特性驗證
本文選取排列熵作為混沌特性驗證的依據。排列熵算法可分析混沌時間序列的復雜性,其值介于0和1之間,越接近1,表示時間序列的混沌特性越強,具體計算方法可參見文獻[24]。
本文所選用機器學習模型如圖1所示。
圖1 機器學習模型概覽圖
基于灰色關聯度的加權組合法是通過求灰色關聯度最大化來確定各單一預測模型所占的比重。
本文選取兩個無量綱評價指標和兩個有量綱評價指標。無量綱評價指標:均方根誤差的變異系數CVRMSE和平均絕對百分比誤差MAPE。有量綱評價指標:均方根誤差RMSE和平均誤差ME。表達式如式(8)—式(11)所示。
相空間重構作為數據處理的一種方式將歷史負荷數據重構為高維相空間,并認為該高維相空間包含了影響歷史負荷數據的多種關鍵信息特征。因此,將相空間重構與機器學習結合時,其結合方式是將相空間重構后的高維相空間作為機器學習模型的訓練輸入數據。
基于相空間重構及機器學習的電力負荷預測方法訓練流程如下:
(1) 計算歷史負荷數據的延遲時間與嵌入維數;
(2) 劃分歷史負荷數據為訓練集和測試集,根據延遲時間和嵌入維數對訓練集數據進行相空間重構,即為訓練輸入數據;
(3) 將原始訓練集后移一個預測時間長度,即為訓練輸出數據;
(4) 將訓練輸入數據與訓練輸出數據輸入機器學習模型,即可進行訓練。
本文算例流程如圖2所示。
圖2 算例流程圖
本文負荷數據來源為美國PJM電網的數據管理工具Data Miner 2網站。本文所指“關鍵信息缺失”表示缺失與電力負荷相關的天氣信息、地理信息、人口信息等,并僅使用歷史負荷數據實施預測。對歷史負荷數據進行相空間重構,重構后的二維時間序列即為機器學習模型的輸入特征。
圖3 歷史負荷數據的互信息函數
圖4 歷史負荷數據的偽近鄰率
圖5 排列熵計算
圖6 重構后的三維相空間
表1為所使用機器學習模型的超參數設置。
表1 超參數設置
采用表1中的超參數設置,首先對月歷史數據進行相似日負荷預測。除基準模型外,其余模型均通過自主學習訓練集數據特征輸出測試集預測結果,各個模型在測試集上的預測效果如表2所示。
表2 日負荷預測結果對比
從表2中可以看出,BP神經網絡和小波神經網絡在測試集上的預測精度低于基準模型,而在實際應用中應舍棄。在神經網絡模型中,若以CVRMSE、MAPE或RMSE為標準,則ELM誤差最低;若以ME為標準,則XGBoost表現最優(yōu)。因此,為達到更高的預測精度,本文選用ELM和XGBoost兩種模型進行組合預測。
采用ELM和XGBoost分別進行1天至7天內不同時間尺度下的負荷預測,并采用灰色關聯度法在不同預測時間長度下進行權重分配,結果如表3所示。所構建組合模型ELM-XGBoost在不同時間長度下的預測精度如圖7所示。
從圖7中可以看出,隨著預測時間尺度增加,預測誤差逐漸增大??梢?,相空間重構技術在應用于電力負荷預測時,對于短期負荷預測應用效果更優(yōu)。
表3 ELM-XGBoost模型權值分配
圖7 不同時間尺度下預測精度指標對比
分別采用不同組合模型對1天及7天的數據進行負荷預測,將ELM-XGBoost模型與現有文獻[2]中所提模型進行對比,包括BP-SVM和GBM-GP,并對將XGBoost換成SVR得到的ELM-SVR模型及將ELM換成LSTM得到的LSTM- XGBoost模型進行對比,得到結果如表4所示。
表4 不同模型結果對比
表4中的BP-SVM模型和GBM-GP模型為考慮多種關鍵信息條件下的組合模型負荷預測,ELM-SVR模型及LSTM-XGBoost模型為關鍵信息缺失下的組合模型負荷預測。由表4可知,與考慮多種關鍵信息條件下的組合模型相比,在日負荷預測中,本文所構建ELM-XGBoost模型的MAPE達到最小,為1.81%,優(yōu)于BP-SVM模型及GBM-GP模型,而周負荷預測誤差則稍大,進一步驗證了關鍵信息缺失下相空間重構技術在長時間尺度下的不適性。綜上,在短期負荷預測中,基于相空間重構的電力負荷預測不僅能省去收集和處理多種因素數據的繁瑣工作,還能提高預測精度,具有一定的實用價值。與關鍵信息缺失下的組合模型相比,不論在日負荷預測還是周負荷預測情況下,對比MAPE和RMSE兩種指標,本文所構建ELM-XGBoost模型均優(yōu)于ELM-SVR模型和LSTM-XGBoost模型,顯示了本文所構建ELM-XGBoost模型的優(yōu)越性。
圖8、圖9分別為兩種單一模型和組合模型的日負荷預測曲線和周負荷預測曲線。
圖8 日負荷預測曲線
圖9 周負荷預測曲線
從圖8和圖9可以看出,在日負荷預測和周負荷預測中,ELM-XGBoost模型對于日負荷與周負荷均具有良好的跟隨性能,顯示了在缺失關鍵信息的情況下相空間重構技術對于電力負荷的適用性。另外,ELM-XGBoost模型在日負荷預測中的預測精度高于周負荷預測,說明混沌理論中的相空間重構技術更適用于短期(日)負荷預測。
為實現在缺失天氣等關鍵信息數據下進行電力負荷預測,本文采用混沌理論中相空間重構技術與機器學習結合的形式進行預測,為提高預測精度,從8種機器學習模型中擇優(yōu)組合,通過算例仿真得出以下結論。
(1) 在相空間重構條件下,ELM和XGBoost為所選模型中的最優(yōu)預測模型。
(2) 采用灰色關聯度法對ELM和XGBoost進行組合,構建了ELM-XGBoost模型。在日負荷預測中,與現有部分文獻中考慮多種關鍵信息的負荷預測模型相比,ELM-XGBoost模型表現更優(yōu)。
(3) 相空間重構技術適用于短期負荷預測,其預測精度隨預測時間尺度增加而呈現減小的趨勢。
綜上,本文所提方法不僅能省去搜集和處理天氣等多種關鍵信息數據的繁瑣,還能在日負荷預測中進一步提高預測精度。
[1] 馬臨超, 齊山成, 牛賽, 等.考慮小區(qū)發(fā)展不均衡性和不確定性的多階段空間負荷預測[J].電力系統(tǒng)保護與控制, 2021, 49(1): 91-97.
MA Linchao, QI Shancheng, NIU Sai, et al.Multi-stage spatial load forecasting considering the imbalance and uncertainty of the development of the sub-area[J].Power System Protection and Control, 2021, 49(1): 91-97.
[2] 陳緯楠, 胡志堅, 岳菁鵬, 等.長短期記憶網絡和LightGBM組合模型的短期負荷預測[J].電力系統(tǒng)自動化, 2021, 45(4): 91-97.
CHEN Weinan, HU Zhijian, YUE Jingpeng, et al.Short-term load forecasting based on long-term memory network and LightGBM combination model[J].Automation of Electric Power Systems, 2021, 45(4): 91-97.
[3] 龐傳軍, 余建明, 張波, 等.基于梯度提升樹計及非線性的電力負荷影響因素分析[J].電力系統(tǒng)保護與控制, 2020, 48(24): 71-78.
PANG Chuanjun, YU Jianming, ZHANG Bo, et al.Nonlinear correlation analysis of influence factors of a power load based on a gradient boosting decision tree[J].Power System Protection and Control, 2020, 48(24): 71-78.
[4] 李天云, 劉自發(fā).電力系統(tǒng)負荷的混沌特性及預測[J].中國電機工程學報, 2000, 20(11): 36-40.
LI Tianyun, LIU Zifa.The chaotic property of power load and its forecasting[J].Proceedings of the CSEE, 2000, 20(11): 36-40.
[5] FAY D, RINGWOOD J.On the influence of weather forecast errors in short-term load forecasting models[J].IEEE Transactions on Power Systems, 2010, 25(3): 1751-1758.
[6] 陸繼翔, 張琪培, 楊志宏, 等.基于CNN-LSTM混合神經網絡模型的短期負荷預測方法[J].電力系統(tǒng)自動化, 2019, 43(8): 131-137.
LU Jixiang, ZHANG Qipei, YANG Zhihong, et al.Short-term load forecasting method based on CNN-LSTM hybrid neural network model[J].Automation of Electric Power Systems, 2019, 43(8): 131-137.
[7] 張志, 杜延菱, 崔慧軍, 等.考慮關聯因素的智能化中長期電力負荷預測方法[J].電力系統(tǒng)保護與控制, 2019, 47(2): 24-30.
ZHANG Zhi, DU Yanling, CUI Huijun, et al.Intelligent mid-long electricity load forecast method considering associated factors[J].Power System Protection and Control, 2019, 47(2): 24-30.
[8] 唐俊熙, 曹華珍, 高崇, 等.一種基于時間序列數據挖掘的用戶負荷曲線分析方法[J].電力系統(tǒng)保護與控制, 2021, 49(5): 140-148.
TANG Junxi, CAO Huazhen, GAO Chong, et al.A new user load curve analysis method based on time series data mining[J].Power System Protection and Control, 2021, 49(5): 140-148.
[9] ALIPOUR M, AGHAEI J, NOROUZI M, et al.A novel electrical net-load forecasting model based on deep neural networks and wavelet transform integration[J].Energy, 2020, 205.
[10] 陸繼翔, 張琪培, 楊志宏, 等.基于CNN-LSTM混合神經網絡模型的短期負荷預測方法[J].電力系統(tǒng)自動化, 2019, 43(8): 131-137.
LU Jixiang, ZHANG Qipei, YANG Zhihong, et al.Short-term load forecasting method based on CNN-LSTM hybrid neural network model[J].Automation of Electric Power Systems, 2019, 43(8): 131-137.
[11] 吳瀟雨, 和敬涵, 張沛, 等.灰色投影改進隨機森林算法的電力系統(tǒng)短期負荷預測[J].電力系統(tǒng)自動化, 2019, 39(12): 50-55.
WU Xiaoyu, HE Jinghan, ZHANG Pei, et al.Power system short-term load forecasting based on improved random forest with grey relation projection[J].Automation of Electric Power Systems, 2019, 39(12): 50-55.
[12] O‘NEILL-CARRILLO E, HEYDT G T, KOSTELICH E J.Chaotic phenomena in power systems: detection and applications[J].Electric Machines and Power Systems, 1999, 27(1): 79-91.
[13] 方仍存, 周建中, 彭兵, 等.電力負荷混沌動力特性及其短期預測[J].電網技術, 2008, 32(4): 61-66.
FANG Rengcun, ZHOU Jianzhong, PENG Bing, et al.Chaotic dynamics of power load and its short-term forecasting[J].Power System Technology, 2008, 32(4): 61-66.
[14] 楊正瓴, 林孔元.電力系統(tǒng)負荷記錄混沌特性成因的探討[J].電力系統(tǒng)自動化, 2002, 26(10): 18-22.
YANG Zhengling, LIN Kongyuan.Discussion on causes of chaos in load records of power systems[J].Automation of Electric Power Systems, 2002, 26(10): 18-22.
[15] 孫雅明, 張智晟.相空間重構和混沌神經網絡融合的短期負荷預測研究[J].中國電機工程學報, 2004, 24(1): 44-48.
SUN Yaming, SUN Zhisheng.A new model of STLF based on the fusion of PSRT and chaotic neural networks[J].Proceedings of the CSEE, 2004, 24(1): 44-48.
[16] 張智晟, 孫雅明, 王兆峰, 等.相空間近鄰點與遞歸神經網絡融合的短期負荷預測[J].中國電機工程學報, 2003, 23(8): 45-50.
ZHANG Zhisheng, SUN Yaming, WANG Zhaofeng, et al.A new STLF approach based on the fusion of optimal neighbor points in phase space and the recursive neural network[J].Proceedings of the CSEE, 2003, 23(8): 45-50.
[17] XU Z, ZHONG L, ZHANG A.Phase space reconstruction- based concept or network for time series prediction[J].IEEE Access, 2019, 7: 163172-163179.
[18] LI J, ZHANG Q, ZHANG Y, et al.Hidden phase space reconstruction: a novel chaotic time series prediction method for speech signals[J].Chinese Journal of Electronics, 2018, 27(6): 1221-1228.
[19] TAKENS F.Detecting strange attractors in turbulence[M].Heidelberg: Springer Berlin Heidelberg, 1981.
[20] 王德意, 楊卓, 楊國清.基于負荷混沌特性和最小二乘支持向量機的短期負荷預測[J].電網技術, 2008, 32(7): 66-71.
WANG Deyi, YANG Zhuo, YANG Guoqing.Short-term load forecasting based on chaotic characteristic of loads and least squares support vector machine[J].Power System Technology, 2008, 32(7): 66-71.
[21] GUO Fengfan, LI Lingpeng, WEI Chianghong.Short term load forecasting based on phase space reconstruction algorithm and bi-square kernel regression model[J].Applied Energy, 2018, 224: 13-33.
[22] ALBERS D, HRIPCSAK G.Estimation of time-delayed mutual information and bias for irregularly and sparsely sampled time-series[J].Chaos, Solitons & Fractals, 2012, 45(6): 853-860.
[23] 韓亞軍, 李太福.相空間重構短期風速與發(fā)電功率在線預測[J].控制工程, 2019, 26(8): 1503-1508.
HAN Yajun, LI Taifu.Online prediction of short-term wind speed and power generation based on phase space reconstruction[J].Control Engineering of China, 2019, 26(8): 1503-1508.
[24] LI G, LIT Y, ROOZITALAB F.Midterm load forecasting: a multistep approach based on phase space reconstruction and support vector machine[J].IEEE Systems Journal, 2020, 14(4): 4967-4977.
[25] 左遠龍, 黃玉水, 楊曉輝, 等.基于PFA-MBAS-BP神經網絡模型的光伏發(fā)電短期預測[J].電力系統(tǒng)保護與控制, 2020, 48(15): 84-91.
ZUO Yuanlong, HUANG Yushui, YANG Xiaohui, et al.Short-term prediction of photovoltaic power generation based on a PFA-MBAS-BP neural network model[J].Power System Protection and Control, 2020, 48(15): 84-91.
[26] LIU Y, YANG Q, AN D, et al.An improved fault diagnosis method based on deep wavelet neural network[C] // 2018 Chinese Control and Decision Conference (CCDC), June 9-11, 2018, Shenyang, China: 1048-1053.
[27] CHEN Y, XU P, CHU Y, et al.Short-term electrical load forecasting using the support vector regression (SVR) model to calculate the demand response baseline for office buildings[J].Applied Energy, 2017, 195: 659-670.
[28] ERTUGRUL ?.Forecasting electricity load by a novel recurrent extreme learning machines approach[J].International Journal of Electrical Power & Energy Systems, 2016, 78: 429-435.
[29] KIRANMAI S, LAXMI A.Data mining for classification of power quality problems using WEKA and the effect of attributes on classification accuracy[J].Protection and Control of Modern Power Systems, 2018, 3(1): 1-12.
[30] WANG Y, SUN S, CHEN X, et al.Short-term load forecasting of industrial customers based on SVMD and XGBoost[J].International Journal of Electrical Power & Energy Systems, 2021, 129.
[31] 張和平, 解曉龍.基于灰色關聯度的組合優(yōu)化模型研究[J].統(tǒng)計與決策, 2019, 35(9): 19-23.
ZHANG Heping, XIE Xiaolong.Research on combinatory optimization model based on grey relational degree[J].Statistics and Decision, 2019, 35(9): 19-23.
Power load forecasting without key information based on phase space reconstruction and machine learning
HOU Hui1, WANG Qing1, ZHAO Bo2, ZHANG Leiqi2, WU Xixiu1, XIE Changjun1
(1.School of Automation, Wuhan University of Technology, Wuhan 430070, China; 2.State Grid Zhejiang Electric Power Co., Ltd.Research Institute, Hangzhou 310014, China)
With the development of the carbon trading system, accurate forecasting of power consumption is crucial for energy management.For power load forecasting without key information such as weather information, phase space reconstruction technique of chaos theory is adopted first to deal with historical load time series.Permutation entropy is used to validate the chaotic characteristic.8 kinds of machine learning models are used to forecast and make comparisons, These models are: 4 kinds of neural network, 3 kinds of statistical machine learning and 1 kind of benchmark.Secondly, two optimal models, extreme learning machine (ELM) and extreme gradient boosting (XGBoost), are combined by a grey relational degree method to construct an ELM-XGBoost model.Finally, ELM-XGBoost is applied to forecast with different time scales from one day to one week.Results show that forecasting accuracy decreases with the increase of forecasting time scale.In daily load forecasting, the accuracy of ELM-XGBoost model is improved with a better application effect.This work is supported by the National Key Research and Development Program of China (No.2020YFB1506802).
power load forecasting; key information; extreme learning machine; extreme gradient boosting; phase space reconstruction; permutation entropy
10.19783/j.cnki.pspc.210573
2021-05-17;
2021-09-29
侯 慧(1981—),女,博士,副教授,博士生導師,研究方向為能源互聯網、電動汽車智能充電策略等;E-mail: houhui@whut.edu.cn
王 晴(1998—),女,碩士研究生,研究方向為能源互聯網、負荷預測等;E-mail: wangqing1342@whut.edu.cn
吳細秀(1975—),女,通信作者,博士,副教授,碩士生導師,研究方向為高電壓絕緣、高壓電器電磁仿真等。E-mail: wuxixiu@whut.edu.cn
國家重點研發(fā)計劃項目資助(2020YFB1506802);國家自然科學基金項目資助(52177110)
(編輯 許 威)