張海芳,何清龍,張 林
(貴州大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,貴州 貴陽 550025)
當(dāng)前,我國電氣化進(jìn)程發(fā)展迅速,電能作為能源領(lǐng)域重要的清潔能源之一,與我國社會能源利用密不可分。同時,電力產(chǎn)業(yè)在國家能源發(fā)展和國民經(jīng)濟(jì)建設(shè)中占據(jù)著重要地位,已成為我國各行各業(yè)發(fā)展的基礎(chǔ)性產(chǎn)業(yè)[1-3]。因此,優(yōu)質(zhì)、穩(wěn)定以及安全的電能資源是我國工業(yè)化生產(chǎn)的重要前提,是實(shí)現(xiàn)國家快速、長久發(fā)展的重要基礎(chǔ)和保障,對實(shí)現(xiàn)“碳達(dá)峰”和“碳中和”目標(biāo)具有全局性意義。
電能的生產(chǎn)、分配、運(yùn)輸和使用過程都離不開電力系統(tǒng)。由于電能具有不可存儲性和瞬時性的特點(diǎn),所以需要制定合理的電力系統(tǒng)調(diào)度方案為用戶提供持續(xù)可靠、優(yōu)質(zhì)的電能資源。制定電力系統(tǒng)調(diào)度方案需要了解未來的電力負(fù)荷使用情況,因此有必要對電力負(fù)荷進(jìn)行預(yù)測。負(fù)荷不同期的預(yù)測均能為電網(wǎng)提供有用信息,例如長期(未來數(shù)年)預(yù)測可以為電網(wǎng)擴(kuò)建、改造等計(jì)劃的制定提供參考,中期(未來數(shù)月)預(yù)測可以保障社會生活和企業(yè)生產(chǎn)用電,短期(兩周以內(nèi))預(yù)測是電網(wǎng)內(nèi)部機(jī)組調(diào)度、啟停和運(yùn)營計(jì)劃制定的基礎(chǔ)。但因氣象和社會事件等不確定因素以及負(fù)荷結(jié)構(gòu)趨于多元化,使傳統(tǒng)負(fù)荷預(yù)測模型應(yīng)用的效果降低,因此需進(jìn)一步研究電力系統(tǒng)負(fù)荷預(yù)測。
常用的負(fù)荷預(yù)測方法包括時間序列法、回歸模型以及深度學(xué)習(xí)等方法。時間序列法利用歷史負(fù)荷數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,建立描述負(fù)荷隨時間變化的數(shù)學(xué)模型,并對未來負(fù)荷進(jìn)行預(yù)測[4-7]?;貧w模型根據(jù)影響負(fù)荷變化的因素尋找負(fù)荷與各個因素之間的關(guān)系,確定回歸方程式,從而給出未來負(fù)荷值[8]。深度學(xué)習(xí)將長短期記憶網(wǎng)絡(luò)與其他機(jī)器學(xué)習(xí)方法結(jié)合在一起,學(xué)習(xí)電力負(fù)荷的變化規(guī)律并進(jìn)行負(fù)荷預(yù)測[9-10]。上述3種方法對時間分辨率小的序列進(jìn)行中長期預(yù)測,易導(dǎo)致負(fù)荷預(yù)測值趨于平穩(wěn),提取不到充分的信息。此外,若使用回歸模型,不僅采集與負(fù)荷相關(guān)因素的高質(zhì)量數(shù)據(jù)較為困難,還存在較大的預(yù)測偏差。偏差包括模型本身的預(yù)測偏差以及相關(guān)因素的不準(zhǔn)確導(dǎo)致的預(yù)測偏差。因此,為避免上述問題,本文提出了基于擴(kuò)大周期構(gòu)建的差分整合移動平均自回歸模型(ARIMA)以及LSTM模型,只需利用電力負(fù)荷這一單一數(shù)據(jù)就能給出較好的長、中、短期的預(yù)測結(jié)果,為電力系統(tǒng)規(guī)劃與調(diào)度提供更好的依據(jù)。
ARIMA是一種流行且被廣泛使用的時間序列預(yù)測統(tǒng)計(jì)方法,其具體分為3個部分:自回歸項(xiàng)(Auto Regression,AR)、差分項(xiàng)(Integrated,I)和移動平均項(xiàng)(Moving Average,MA)。這3個部分分別由ARIMA的p、d、q這3個參數(shù)定義[11]。該模型的一般形式如式(1)所示。
(1)
式中,?d=(1-B)d;Φ(B)=1-φ1B-…-φpBp為平穩(wěn)可逆ARMA(p,q)模型的自回歸系數(shù)多項(xiàng)式;Θ(B)=1-θ1B-…-θqBq為平穩(wěn)可逆ARMA(p,q)模型的移動平均系數(shù)多項(xiàng)式。
LSTM基于循環(huán)神經(jīng)網(wǎng)絡(luò)對神經(jīng)元結(jié)構(gòu)做出了改進(jìn),利用增加的記憶單元對時間間隔較遠(yuǎn)的過去時刻歷史信息進(jìn)行記憶存儲,并使用門結(jié)構(gòu)來增加、刪除和處理信息,保證了當(dāng)前時刻信息與間隔較遠(yuǎn)的過去時刻信息具有較強(qiáng)的時間相關(guān)性,以此有效解決簡單循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度爆炸或消失問題[12-14]。
LSTM主要由記憶單元、遺忘門、輸入門和輸出門構(gòu)成,3個門的激活函數(shù)σ均為sigmoid,tanh函數(shù)用于調(diào)節(jié)數(shù)值大小。遺忘門控制上一時刻的記憶單元ct-1所存儲的歷史信息,輸入門控制當(dāng)前時刻保存的信息,輸出門控制當(dāng)前時刻對外部狀態(tài)輸出的信息[12]。圖1為LSTM網(wǎng)絡(luò)結(jié)構(gòu)。
圖1 LSTM網(wǎng)絡(luò)結(jié)構(gòu)Figure 1. LSTM network structure
在圖1中,xt、ht分別為細(xì)胞輸入和輸出,ft為遺忘門,it為輸入門,ot為輸出門,ct為當(dāng)前時刻的記憶單元。3個門的形式化表示如式(2)~式(6)所示。
ft=σ(Wfxt+Ufht-1+bf)
(2)
it=σ(Wixt+Uiht-1+bi)
(3)
ot=σ(Woxt+Uoht-1+bo)
(4)
(5)
ht=ot×tanh(ct)
(6)
傳統(tǒng)ARIMA模型形式為
Yt=c+α1Yt-1+α2Yt-2+…+αpYt-p+
β1εt-1+…+βqεt-q
(7)
其中,α和β分別表示AR和MA模型的系數(shù)。對一般的時間序列來說,通常采用ARIMA模型進(jìn)行擬合和預(yù)測。若僅預(yù)測短期內(nèi)負(fù)荷值,可以使用ARIMA模型進(jìn)行擬合預(yù)測,但如果預(yù)測中長期負(fù)荷值,簡單的ARIMA模型可能導(dǎo)致負(fù)荷值趨于平穩(wěn)。
結(jié)合所觀察到的周期性這一先驗(yàn)信息,同時考慮到電力負(fù)荷存在一定的慣性,即當(dāng)前時刻的用電負(fù)荷不僅與前幾個時刻存在相關(guān)性,也與前幾天、前幾周甚至更長時間存在相關(guān)性(短期內(nèi)看,白天工作時間段的用電負(fù)荷高于非工作時間段;長期來看,工作日的用電負(fù)荷明顯高于雙休日),在傳統(tǒng)的ARIMA模型上進(jìn)行改進(jìn)。改進(jìn)后的模型形式為
(8)
式中,y表示對應(yīng)年份;M表示對應(yīng)月份;w表示對應(yīng)周;d表示對應(yīng)天;h表示對應(yīng)小時;m表示對應(yīng)分鐘;ε表示隨機(jī)誤差。該模型將電力負(fù)荷波形拆分成6個部分,分別為間隔單位為分鐘的波形、間隔單位為小時的波形、間隔單位為天的波形、間隔單位為周的波形、間隔單位為月的波形間以及隔單位為年的波形。這6個部分可以根據(jù)預(yù)測的時間長短進(jìn)行取舍??紤]到預(yù)測中期負(fù)荷值,模型僅保留間隔單位為天的波形,最終模型形式為
(9)
式中,含有一個示性函數(shù)I,k=h,j=m用來確定第h個時、第j個15 min所對應(yīng)的ARIMA模型。
基于上述擴(kuò)大周期的思想,考慮到電力負(fù)荷之間可能存在非線性關(guān)系,本文建立了LSTM模型,其結(jié)構(gòu)并未有較大變化,主要是輸入間隔單位為天的波形數(shù)據(jù),然后依次輸出對應(yīng)時刻的負(fù)荷預(yù)測值,其結(jié)構(gòu)如圖2所示。
圖2 LSTM模型結(jié)構(gòu)Figure 2. LSTM model structure
在圖2中,times表示一天的最小時間分辨率。
本文實(shí)驗(yàn)數(shù)據(jù)來源于廣東某市電網(wǎng)的電力系統(tǒng)負(fù)荷數(shù)據(jù),該數(shù)據(jù)集時間跨度為2018年1月1日~2021年8月31日,分辨率為15 min,即每一天包含96個用電負(fù)荷數(shù)據(jù)。在該數(shù)據(jù)集上實(shí)現(xiàn)本文構(gòu)建的預(yù)測模型。
在模型進(jìn)行訓(xùn)練之前,需要對原始數(shù)據(jù)進(jìn)行預(yù)處理。因?yàn)樵摂?shù)據(jù)集缺失了388條負(fù)荷數(shù)據(jù),故使用前后插補(bǔ)法和十字插補(bǔ)法對缺失值進(jìn)行填充[15-16]。若連續(xù)缺失值少于5個,則采用該處缺失值前后3個負(fù)荷值的均值進(jìn)行插補(bǔ),若連續(xù)缺失值多于5個,則采用該缺失值前后3天同一時刻前后3個負(fù)荷值的均值進(jìn)行插補(bǔ)。將缺失值補(bǔ)充完整后,將數(shù)據(jù)按照相同時刻不同天整理為1 339行96列的數(shù)據(jù)集。
從預(yù)處理后的數(shù)據(jù)中選取2021年7月31日以前的數(shù)據(jù)集作為訓(xùn)練集來建立模型,以2021年8月的負(fù)荷數(shù)據(jù)作為測試集用于比較模型預(yù)測效果。
為了便于比較模型預(yù)測效果,采用3種方法作為模型預(yù)測精度的評價指標(biāo),分別為均方根誤差(RMSE)、絕對值誤差(MAE)和相對誤差(MAPE)[17-18],其計(jì)算式分別為
(10)
(11)
(12)
通過ARIMA模型和LSTM模型得到2021年8月的預(yù)測值和實(shí)際值對比結(jié)果,如圖3所示。兩個模型可較為有效地?cái)M合出實(shí)際值的趨勢,為未來電力系統(tǒng)的規(guī)劃提供一定依據(jù)。
圖3 模型預(yù)測值與實(shí)際值對比(部分)Figure 3. Comparison of predicted value and actual value of the model(Part)
為了進(jìn)一步比較擴(kuò)大周期信息后模型的預(yù)測性能,將基于擴(kuò)大周期信息的ARIMA模型與傳統(tǒng)(直接輸入預(yù)處理完的電力負(fù)荷數(shù)據(jù))ARIMA模型、擴(kuò)大LSTM模型與原始LSTM模型進(jìn)行對比。將4個模型分別在對應(yīng)的訓(xùn)練集和測試集下進(jìn)行訓(xùn)練與測試,得到4個模型在測試集上的評價指標(biāo)數(shù)值情況,如表1所示。
表1 不同模型的指標(biāo)情況Table 1. Indicators of different models
由表1可知,傳統(tǒng)ARIMA模型和原始LSTM模型的預(yù)測效果明顯低于擴(kuò)大周期信息的ARIMA模型和LSTM模型,其均方根誤差、絕對值誤差和相對誤差3個評價指標(biāo)數(shù)值高于另外兩個模型,說明直接輸入預(yù)處理完的時間序列將導(dǎo)致模型預(yù)測結(jié)果偏離時間序列的真實(shí)情況,從而降低預(yù)測精度。擴(kuò)大周期后建立的ARIMA模型和LSTM模型的3個評價指標(biāo)數(shù)值并沒有較大差距,若僅比較相對誤差可知兩個模型的預(yù)測效果較好。ARIMA模型對電力負(fù)荷的預(yù)測效果優(yōu)于LSTM模型,其3個指標(biāo)值均低于LSTM模型。結(jié)合圖3可以看出ARIMA預(yù)測效果較好,LSTM模型預(yù)測的負(fù)荷值趨勢與實(shí)際值大致相同,但其并未充分提取完電力負(fù)荷時間序列的信息,導(dǎo)致預(yù)測值與實(shí)際值之間相差一個值,而ARIMA模型的負(fù)荷預(yù)測值與實(shí)際值較接近。綜上所述,擴(kuò)大周期信息構(gòu)建的模型具有較好的預(yù)測性能,可以更準(zhǔn)確地對電力負(fù)荷進(jìn)行預(yù)測。
為提高電力負(fù)荷的預(yù)測效果,本文提出了一種基于擴(kuò)大周期信息的ARIMA預(yù)測模型和LSTM預(yù)測模型。相比傳統(tǒng)的時間序列,尤其對于時間分辨率較低的序列來說,擴(kuò)大周期信息可以有效避免數(shù)據(jù)前后之間的慣性,有利于提取更充分的信息來提高模型的預(yù)測精度。實(shí)驗(yàn)結(jié)果表明,擴(kuò)大周期信息后的ARIMA模型和LSTM模型可以獲得更精確的預(yù)測結(jié)果。擴(kuò)大周期信息的ARIMA模型預(yù)測效果優(yōu)于LSTM模型。此外,本文僅利用了天周期的信息,在未來研究中將考慮周周期、月周期等信息,以便進(jìn)一步提高模型的預(yù)測精度。