劉倩倩, 劉鈺山,*, 溫?zé)铈? 何杰, 李曉, 畢大強(qiáng)
(1. 北京航空航天大學(xué) 自動化科學(xué)與電氣工程學(xué)院, 北京 100191;2. 清華大學(xué) 電機(jī)系, 北京 100084)
由于電能難以大量存儲及負(fù)荷需求時變等特點,要求發(fā)電、輸電、用電要時刻保持動態(tài)平衡。電力負(fù)荷預(yù)測準(zhǔn)確率的提高有助于保證電力系統(tǒng)安全可靠運行和提高發(fā)電機(jī)組的利用率[1],根據(jù)預(yù)測時間長度分為超短期負(fù)荷預(yù)測、短期負(fù)荷預(yù)測、中期負(fù)荷預(yù)測和長期負(fù)荷預(yù)測[2]。 超短期負(fù)荷預(yù)測是對當(dāng)前時刻后的有限時刻進(jìn)行預(yù)測,主要用于實時調(diào)度;短期負(fù)荷預(yù)測是對一天中的每個時刻進(jìn)行預(yù)測,主要用于制定發(fā)電日計劃;中期負(fù)荷預(yù)測是對月度負(fù)荷進(jìn)行預(yù)測,主要用于月度檢修;長期負(fù)荷預(yù)測是對年度負(fù)荷進(jìn)行預(yù)測,主要用于年度檢修。
電力系統(tǒng)短期負(fù)荷預(yù)測是一種基于歷史的負(fù)荷數(shù)據(jù),充分考慮系統(tǒng)的運行特性、天氣狀況、經(jīng)濟(jì)發(fā)展情況、工作日和節(jié)假日等影響因素,來預(yù)測未來一天內(nèi)的電力負(fù)荷用電情況[3]。 負(fù)荷數(shù)據(jù)的精準(zhǔn)預(yù)測有利于改善電力系統(tǒng)的運行規(guī)劃和實時調(diào)度,對電力系統(tǒng)的穩(wěn)定性大有裨益[4]。
目前,對電力負(fù)荷的短期預(yù)測方法主要分2 類:傳統(tǒng)預(yù)測方法和機(jī)器學(xué)習(xí)方法[5]。 傳統(tǒng)預(yù)測方法有回歸分析法[6-8]、灰色模型法[9-10]、模糊預(yù)測法[11]、自回歸積分滑動平均模型[12-13]等。 這些方法簡單、速度快,但多是基于線性關(guān)系模型,反映非線性關(guān)系的能力有限。 機(jī)器學(xué)習(xí)方法有隨機(jī)森林[14]、支持向量機(jī)[15]、專家系統(tǒng)[16]、人工神經(jīng)網(wǎng)絡(luò)預(yù)測法[17]、深度學(xué)習(xí)法[18]等。 人工神經(jīng)網(wǎng)絡(luò)預(yù)測法中的長短期記憶(long and short term memory, LSTM)神經(jīng)網(wǎng)絡(luò)擅于處理序列型數(shù)據(jù),可以有效減小負(fù)荷預(yù)測模型需要的數(shù)據(jù)量維度,充分挖掘時序數(shù)據(jù)間的內(nèi)在關(guān)系,相較于其他的機(jī)器學(xué)習(xí)算法有較高的準(zhǔn)確性。
LSTM 神經(jīng)網(wǎng)絡(luò)基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN),通過增加遺忘門、輸入門和輸出門,有效解決了梯度爆炸和梯度消失的問題。 在電力負(fù)荷預(yù)測中,LSTM 神經(jīng)網(wǎng)絡(luò)取得了一定的成果。 文獻(xiàn)[19] 建立了基于Attention-LSTM 的短期負(fù)荷預(yù)測模型計算用電量預(yù)測值。文獻(xiàn)[20]構(gòu)建了3 層LSTM 深度學(xué)習(xí)負(fù)荷預(yù)測模型用于預(yù)測電力負(fù)荷。 文獻(xiàn)[21]提出了一種深度雙向長短期記憶(deep bidirectional long and short term memory, DBiLSTM) 和多元線性回歸(multiple linear regression, MLR)組合預(yù)測模型。文獻(xiàn)[22]提出了一種小波分解-最小二乘支持向量機(jī)長短期記憶( wavelet deromposition-least squares support vector machine-LSTM, WD-LSSVMLSTM)神經(jīng)網(wǎng)絡(luò)組合模型預(yù)測短期負(fù)荷。 文獻(xiàn)[19-22]研究均采用LSTM 神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù),但在選擇輸入量時,不是未根據(jù)影響因素和電力負(fù)荷數(shù)據(jù)的相關(guān)關(guān)系選擇更合適的影響因素作為輸入量,就是對輸入量的處理過于繁瑣。
為提高負(fù)荷預(yù)測的準(zhǔn)確率,本文提出了一種基于Pearson 相關(guān)系數(shù)-LSTM(Pearson correlation coefficient-LSTM, PCC-LSTM)模型的多因素短期負(fù)荷預(yù)測方法。 首先對各類影響因素做Pearson相關(guān)性分析,確定與電力負(fù)荷變化的相關(guān)程度,選出合適的負(fù)荷預(yù)測參數(shù)作為LSTM 神經(jīng)網(wǎng)絡(luò)的輸入量,然后將其輸入到由LSTM 網(wǎng)絡(luò)層和全連接層構(gòu)成的模型中進(jìn)行預(yù)測。 由于使用了Pearson相關(guān)性分析方法,PCC-LSTM 模型有效增強(qiáng)了輸入數(shù)據(jù)與預(yù)測數(shù)據(jù)之間的相關(guān)性,可以顯著降低負(fù)荷預(yù)測誤差。
PCC 是為了分析2 個變量間的相關(guān)程度。 2個任意變量X、Y間的PCC 可表示為
式中:ρX,Y為變量X、Y的相關(guān)性系數(shù);E為樣本的數(shù)學(xué)期望。
當(dāng)X、Y兩變量無關(guān)時,PCC 為0;當(dāng)X、Y兩變量負(fù)相關(guān)時,PCC 在-1 ~0 之間;當(dāng)X、Y兩變量正相關(guān)時,PCC 在0 ~1 之間。 變量的相關(guān)程度由相關(guān)系數(shù)的絕對值表征,絕對值越大相關(guān)性越強(qiáng),具體的系數(shù)范圍和相關(guān)程度如表1 所示。
表1 相關(guān)系數(shù)范圍Table 1 Range of correlation coefficients
LSTM 神經(jīng)網(wǎng)絡(luò)是一種改進(jìn)的RNN,通過精巧的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計,可以學(xué)習(xí)時間序列中的長短期依賴信息。 其網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。
圖1 LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure diagram of LSTM neural network
LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括遺忘門、輸入門和輸出門。 遺忘門決定當(dāng)前細(xì)胞需要遺忘的部分,輸入門決定當(dāng)前細(xì)胞需要保留的向量,輸出門決定當(dāng)前細(xì)胞的輸出內(nèi)容,如式(2) ~式(7)所示[23]:
式中:ft、it和ot分別為遺忘門、輸入門和輸出門;xt、gt、ht和St分別為輸入量、輸入節(jié)點、中間輸出和狀態(tài)記憶單元;Wfx、Wfh、Wix、Wih、Wgx、Wgh、Wox和Woh分別為對應(yīng)門的矩陣權(quán)重;bf、bi、bg、bo分別為對應(yīng)門的偏置;⊙為矩陣的哈達(dá)瑪積;σ為sigmoid 激活函數(shù),可以表示為
圖2 為PCC-LSTM 模型結(jié)構(gòu)。 PCC-LSTM 模型主要包括2 部分:Pearson 相關(guān)性分析主要負(fù)責(zé)選取合適的影響因素作為輸入量,LSTM 神經(jīng)網(wǎng)絡(luò)主要負(fù)責(zé)負(fù)荷預(yù)測。 采用給出的數(shù)據(jù),對影響因素做Pearson 相關(guān)性分析,初步判斷所選取的因素是否會真正對負(fù)荷用電量產(chǎn)生影響。
除此之外,休閑運動還需要學(xué)校予以一定的支持,為學(xué)生進(jìn)行休閑運動提供良好的場地條件,教師也應(yīng)該加強(qiáng)對于休閑運動方式、項目的研究,從而以更加專業(yè)化的形式給予學(xué)生正確的指導(dǎo)。學(xué)校也可以定期舉辦休閑運動項目的活動,如組織學(xué)生在節(jié)假日,一起走出校門和深入大自然之中,開展郊游、登山、騎山地自行車、徒步越野等一系列空域、陸域、水域休閑體育項目。這些休閑項目操作簡單,對于學(xué)生的要求較低,而且這些休閑體育項目都是對于日?;緞幼骷寄艿木毩?xí),對于學(xué)生日常生活有著很好的幫助,能夠使學(xué)生在日常生活當(dāng)中也進(jìn)行自身的鍛煉,加強(qiáng)了學(xué)生的身體素質(zhì)。
圖2 PCC-LSTM 模型Fig.2 PCC-LSTM model
通過增加LSTM 的層數(shù)來增加預(yù)測模型的深度可以增強(qiáng)預(yù)測能力,故本文的預(yù)測模型包括3 個LSTM 網(wǎng)絡(luò)層。 在每個LSTM 網(wǎng)絡(luò)層后采用Dropout 方法防止模型過擬合。 在LSTM 后加一個全連接層(Dense),該全連接層可以匯集不同時間段的歷史數(shù)據(jù)對預(yù)測點的影響,對影響進(jìn)行綜合后,最終再通過一個全連接層輸出,得到預(yù)測日24 個時間點的電力負(fù)荷用電量。
模型訓(xùn)練過程中,使用Adam 優(yōu)化算法更新神經(jīng)元的權(quán)重項矩陣和偏置項矩陣,尋找損失函數(shù)的最小值[24]。 采用均方誤差函數(shù)為
式中:n為樣本個數(shù);Xact(t)和Xpred(t)分別為樣本數(shù)據(jù)的實際值和預(yù)測值。
使用平均絕對百分比誤差yMAPE和均方根誤差yRMSE兩項指標(biāo)來評估預(yù)測模型,表達(dá)式如下:
yMAPE可以評估模型精度,yRMSE可以表現(xiàn)預(yù)測的精度。yRMSE的數(shù)量級會跟隨電力負(fù)荷值的數(shù)量級變化,是相對值指標(biāo)。yMAPE和yRMSE的值越小,表明誤差越小,負(fù)荷預(yù)測效果越好。
實驗基于嘉捷BOX 和重慶麗苑維景國際大酒店這2 個實際電力負(fù)荷的數(shù)據(jù)集,將所提的PCC-LSTM 與Prophet、LSTNet、門控循環(huán)(gate recurrent unit, GRU)神經(jīng)網(wǎng)絡(luò)模型方法所得結(jié)果進(jìn)行對比。 Prophet 是對負(fù)荷數(shù)據(jù)進(jìn)行擬合的時間序列模型[25];LSTNet 是針對多變量時間序列預(yù)測的深度學(xué)習(xí)網(wǎng)絡(luò),其模型綜合了長期模式和短期模式[26];GRU 是基于LSTM 網(wǎng)絡(luò)模型結(jié)構(gòu)進(jìn)行優(yōu)化[27]。
2 個電力負(fù)荷數(shù)據(jù)集均提供了電力負(fù)荷數(shù)據(jù)、工作日信息、節(jié)假日信息、天氣信息、溫度數(shù)據(jù)和濕度數(shù)據(jù),一天采集24 個點,時間間隔為1 h。以2020 年11 月的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,2020 年12 月的數(shù)據(jù)作為測試數(shù)據(jù)集。 對于存在的數(shù)據(jù)丟失問題,取附近前后各2 個相似日數(shù)據(jù)的均值進(jìn)行填補(bǔ);對于突然變得異常大和突然變?yōu)? 的數(shù)據(jù),根據(jù)此數(shù)據(jù)所處時間前后時間段的數(shù)據(jù)及相似日的數(shù)據(jù)合理給出數(shù)據(jù)進(jìn)行替換。 采用min-max 標(biāo)準(zhǔn)化方法將原始數(shù)據(jù)歸一化到[0,1]之間。 對工作日、節(jié)假日和天氣等影響因素做量化處理,如對于節(jié)假日,節(jié)假日的預(yù)測日置1,否則置0。
基于表2 的分析結(jié)果,選取3 個會對嘉捷BOX 造成明顯影響的因素:濕度、工作日、溫度。因此輸入數(shù)據(jù)x主要由以下特征組成:歷史負(fù)荷、濕度、工作日、溫度。 由于待預(yù)測日的負(fù)荷數(shù)據(jù)與前一天負(fù)荷具有很大的相關(guān)性,選取前一天每小時(共24 h)的特征數(shù)據(jù)作為輸入,待預(yù)測日24 h的電力負(fù)荷值為輸出。
表2 嘉捷BOX 影響因素相關(guān)性分析Table 2 Correlation analysis of influencing factors of Jiajie BOX
重慶麗苑維景國際大酒店P(guān)earson 相關(guān)性分析結(jié)果如表3 所示。 基于此分析結(jié)果,選取了1 個會對重慶麗苑維景國際大酒店造成顯著影響的因素:濕度。 因此輸入數(shù)據(jù)x主要由以下特征組成:歷史負(fù)荷、濕度。 類似,選取前一天每小時(共24 h)的特征數(shù)據(jù)作為輸入,待預(yù)測日24 h 的電力負(fù)荷值為輸出。
表3 重慶麗苑維景國際大酒店影響因素相關(guān)性分析Table 3 Correlation analysis of influencing factors of Chongqing International Grand Metropark Liyuan Hotel
實驗使用的是64 位Windows10 版本系統(tǒng)的計算機(jī)。 在此操作系統(tǒng)上,利用PyCharm Professional Version 2020.3.1 和Anaconda3 開發(fā)環(huán)境,使用基于Keras 深度學(xué)習(xí)工具的Tensorflow 框架搭建模型。 Keras 庫具有模塊化的特點,支持神經(jīng)網(wǎng)絡(luò)層的自由組合和層層疊加。 Prophet 模型調(diào)用Facebook 開源的fbprophet 包。
PCC-LSTM 模型參數(shù)調(diào)優(yōu)采用控制變量法。經(jīng)實驗發(fā)現(xiàn),模型訓(xùn)練初期,預(yù)測精度隨LSTM 神經(jīng)網(wǎng)絡(luò)層數(shù)的增加而提高,但當(dāng)LSTM 網(wǎng)絡(luò)層增加到3 層時預(yù)測精度降低,表示預(yù)測模型對訓(xùn)練數(shù)據(jù)過擬合。 因此選擇LSTM 網(wǎng)絡(luò)層數(shù)為3 層,各層神經(jīng)元數(shù)量均為500,Dropout 為0. 5,在LSTM 后加入一個全連接層,神經(jīng)元數(shù)量為100,迭代次數(shù)為800,學(xué)習(xí)率為0.001。
以嘉捷BOX 2020 年11 月的數(shù)據(jù)作為訓(xùn)練集,2020 年12 月的數(shù)據(jù)作為測試集,對測試集的電力負(fù)荷日用電量進(jìn)行預(yù)測。
圖3 ~圖6 為PCC-LSTM 模型2020 年12 月1 日至4 日連續(xù)4 日的負(fù)荷預(yù)測結(jié)果,每1 h 為1 個時間采樣點。 對PCC-LSTM 模型連續(xù)4 日的預(yù)測結(jié)果計算平均絕對百分比誤差yMAPE和均方根誤差yRMSE,結(jié)果如表4 所示。
表4 嘉捷BOX PCC-LSTM 模型預(yù)測結(jié)果yMAPE 和yRMSE 對 比Table 4 Comparison of yMAPE and yRMSE of prediction results with PCC-LSTM model of Jiajie BOX
圖3 嘉捷BOX PCC-LSTM 模型2020 年12 月1 日預(yù)測結(jié)果Fig.3 Predicted curve of PCC-LSTM model of Jiajie BOX on December 1, 2020
圖4 嘉捷BOX PCC-LSTM 模型2020 年12 月2 日預(yù)測結(jié)果Fig.4 Predicted curve of PCC-LSTM model of Jiajie BOX on December 2, 2020
圖5 嘉捷BOX PCC-LSTM 模型2020 年12 月3 日預(yù)測結(jié)果Fig.5 Predicted curve of PCC-LSTM model of Jiajie BOX on December 3, 2020
圖6 嘉捷BOX PCC-LSTM 模型2020 年12 月4 日預(yù)測結(jié)果Fig.6 Predicted curve of PCC-LSTM model of Jiajie BOX on December 4, 2020
從表4 可以看出,PCC-LSTM 模型的預(yù)測誤差在4.78% ~6.09%,預(yù)測精度在93.91% ~95.22%,取得了較好的預(yù)測效果。
表5 為2020 年12 月3 日的電力負(fù)荷用電量Prophet、LSTNet、GRU 和PCC-LSTM 這4 種預(yù)測模型訓(xùn)練結(jié)果對比。 可知,PCC-LSTM 模型的預(yù)測誤差更小,預(yù)測精度更高,達(dá)到了95.44%,yMAPE相比其他3 種方法分別降低了22. 37%、6. 94%、3.02%;yRMSE分 別 降 低 了194. 93、99. 37、50. 07。PCC-LSTM 模型與其他3 種方法相比,在平均絕對百分比誤差yMAPE和均方根誤差yRMSE上均取得了較好的效果,預(yù)測誤差更小。 同時,由表5 可以看出,Prophet 用時最短,LSTNet 用時最長,PCC-LSTM 模型用時略長于GRU,而Prophet 的高計算效率以低預(yù)測精度為代價,PCC-LSTM 模型在增加了PCC 環(huán)節(jié)提高精度的情況下,計算效率與GRU 相當(dāng)。
表5 不同方法嘉捷BOX 日負(fù)荷預(yù)測結(jié)果比較Table 5 Comparison of results of daily load forecasting by different methods of Jiajie BOX
嘉捷BOX 2020 年12 月3 日電力負(fù)荷用電量的實際值和4 種模型的預(yù)測結(jié)果對比如圖7 所示。
圖7 嘉捷BOX 2020 年12 月3 日負(fù)荷預(yù)測結(jié)果對比Fig.7 Comparison of load forecasting results of Jiajie BOX on December 3, 2020
由圖7 可知,PCC-LSTM 模型對電力負(fù)荷用電量數(shù)據(jù)進(jìn)行了較好的擬合,幾乎完全和電力負(fù)荷用電量實際值重合,有效預(yù)測了負(fù)荷未來用電量的變化趨勢,精準(zhǔn)地把握了負(fù)荷變化的內(nèi)在規(guī)律。
本次實驗經(jīng)模型調(diào)優(yōu)后,選擇LSTM 網(wǎng)絡(luò)層數(shù)為3 層,各層神經(jīng)元數(shù)量均為700,Dropout 為0.5,在LSTM 后加入一層全連接層,神經(jīng)元數(shù)量為100,迭代次數(shù)為700,學(xué)習(xí)率為0.001。
以重慶麗苑維景國際大酒店2020 年11 月的數(shù)據(jù)作為訓(xùn)練集,2020 年12 月的數(shù)據(jù)作為測試集,對測試集的電力負(fù)荷日用電量進(jìn)行預(yù)測。
圖8 ~圖11 為PCC-LSTM 模型2020 年12 月3 日至6 日連續(xù)4 日的負(fù)荷預(yù)測結(jié)果,每1 h 為1 個時間采樣點。 對模型連續(xù)4 日的預(yù)測結(jié)果計算平均絕對百分比誤差yMAPE和均方根誤差yRMSE,結(jié)果如表6 所示。
圖11 重慶麗苑維景國際大酒店P(guān)CC-LSTM 模型2020 年12 月6 日預(yù)測結(jié)果Fig.11 Predicted curve of PCC-LSTM model of Chongqing International Grand Metropark Liyuan Hotel on December 6, 2020
從表6 可以看出,PCC-LSTM 模型的預(yù)測誤差在4.76%~8.05%,預(yù)測精度在91.95%~95.24%,預(yù)測精度良好。
表6 重慶麗苑維景國際大酒店P(guān)CC-LSTM 模型預(yù)測結(jié)果yMAPE 和yRMSE 對比Table 6 Comparison of yMAPE and yRMSE of prediction results with PCC-LSTM model of Chongqing International Grand Metropark Liyuan Hotel
表7 為2020 年12 月5 日的日負(fù)荷Prophet、LSTNet、GRU 和PCC-LSTM 這4 種預(yù)測模型結(jié)果對比,經(jīng)計算可知PCC-LSTM 模型的預(yù)測精度達(dá)到了95.13%,yMAPE相比其他3 種方法分別降低了8.16%、13.82%、0.2%、yRMSE分別降低了29.27、40.67、2.76。 PCC-LSTM 模型相對于其他3 種方法在2 項精度指標(biāo)上表現(xiàn)更為優(yōu)異。 計算時間由短到長排序為:Prophet、GRU、PCC-LSTM、LSTNet,可見PCC-LSTM 模型在提高精度的基礎(chǔ)上,計算效率與GRU 方法相當(dāng)。
表7 不同方法重慶麗苑維景國際大酒店日負(fù)荷預(yù)測結(jié)果比較Table 7 Comparison of results of daily load forecasting by different methods of Chongqing International Grand Metropark Liyuan Hotel
重慶麗苑維景國際大酒店2020 年12 月5 日電力負(fù)荷用電量實際值和4 種模型的預(yù)測結(jié)果對比如圖12 所示。 可知,PCC-LSTM 模型在重慶麗苑維景國際大酒店電力負(fù)荷用電量變化的4 個峰谷期均取得了較好的預(yù)測效果,更準(zhǔn)確地學(xué)習(xí)了負(fù)荷變化的規(guī)律,貼近負(fù)荷實際值曲線。
圖12 重慶麗苑維景國際大酒店2020 年12 月5 日負(fù)荷預(yù)測結(jié)果對比Fig.12 Comparison of load forecasting results of Chongqing International Grand Metropark Liyuan Hotel on December 5, 2020
本文提出了基于PCC-LSTM 模型的短期負(fù)荷預(yù)測方法,包括對PCC-LSTM 模型的訓(xùn)練、預(yù)測及調(diào)參等內(nèi)容。 以嘉捷BOX 和重慶麗苑維景國際大酒店的電力負(fù)荷用電量數(shù)據(jù)作為實際算例,得出以下結(jié)論:
1) 與時間序列模型(Prophet) 相比,PCCLSTM 模型由于考慮了與電力負(fù)荷相關(guān)的其他影響因素,對輸入量進(jìn)行了更為細(xì)致的分析,有效提高了預(yù)測精度。
2) 與其他類型的神經(jīng)網(wǎng)絡(luò)(LSTNet、GRU)相比,由于PCC-LSTM 模型在輸入量的選擇上,采用Pearson 相關(guān)性分析選取合適的影響因素作為輸入變量,提升了輸入變量與目標(biāo)變量的相關(guān)性,并結(jié)合LSTM 神經(jīng)網(wǎng)絡(luò),充分挖掘時序數(shù)據(jù)間的內(nèi)在關(guān)系,使得模型的擬合和預(yù)測性能整體更好。
3) PCC-LSTM 模型的預(yù)測精度對Dropout 的取值較為敏感,Dropout 取值過低,模型對訓(xùn)練數(shù)據(jù)過度學(xué)習(xí),可能導(dǎo)致過擬合,Dropout 取值過高,模型對訓(xùn)練數(shù)據(jù)學(xué)習(xí)不足,可能導(dǎo)致欠擬合,影響模型的性能。
值得說明的是,本文使用深度學(xué)習(xí)對短期電力負(fù)荷用電量進(jìn)行預(yù)測,未來可以考慮組合其他預(yù)測方法,對模型輸入量和模型架構(gòu)進(jìn)行更為詳細(xì)的劃分與分析,進(jìn)一步提高短期負(fù)荷預(yù)測精度。