黃海榮,吳 君,郁 丹,蘇本慶
(1.浙江華云電力工程設(shè)計(jì)咨詢有限公司,浙江 杭州 310000;2.上海電力大學(xué)電氣工程學(xué)院,上海 200090)
電力系統(tǒng)短期負(fù)荷預(yù)測可以根據(jù)歷史負(fù)荷變化情況,結(jié)合氣象、經(jīng)濟(jì)等因素,估算未來某天的負(fù)荷需求[1]。準(zhǔn)確的電力負(fù)荷預(yù)測是保證新型電力系統(tǒng)安全、經(jīng)濟(jì)運(yùn)行的基礎(chǔ)。因此,有必要研究電力負(fù)荷預(yù)測的新方法,以提高負(fù)荷預(yù)測的準(zhǔn)確度。
目前,短期電力負(fù)荷預(yù)測模型一般分為時(shí)間序列模型和深度學(xué)習(xí)模型兩類。其中,時(shí)間序列模型的代表主要有回歸分析法、傅里葉展開法、卡爾曼濾波及自回歸積分滑動(dòng)平均模型等[2]。以上模型大多以線性模型為基礎(chǔ),考慮了數(shù)據(jù)間的時(shí)序性關(guān)系,但對(duì)非線性數(shù)據(jù)的預(yù)測能力較弱。隨著近年來深度學(xué)習(xí)技術(shù)的興起,基于深度學(xué)習(xí)模型進(jìn)行短期負(fù)荷預(yù)測已成為相關(guān)領(lǐng)域的研究熱點(diǎn)之一。如循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、生成對(duì)抗網(wǎng)絡(luò)(generative adversarial network,GAN)已應(yīng)用于負(fù)荷預(yù)測并取得一定成果[3]。文獻(xiàn)[4]建立了基于長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)神經(jīng)和輕梯度提升機(jī)的組合預(yù)測模型,進(jìn)一步提升了負(fù)荷預(yù)測的精度。文獻(xiàn)[5]分別研究了LSTM神經(jīng)網(wǎng)絡(luò)、門循環(huán)單元神經(jīng)網(wǎng)絡(luò)和棧式自編碼器應(yīng)用于電力負(fù)荷預(yù)測時(shí)的效果。
為了進(jìn)一步提高短期負(fù)荷預(yù)測的精度,研究人員常將原始信號(hào)進(jìn)行分解,期望能夠?qū)W習(xí)到原始信號(hào)在某些域中存在的特征。這些域包括時(shí)域、頻域和其他變換域等[6]?;诖斯沧R(shí),研究人員多采用小波包、變分模態(tài)分解、經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)等算法,將歷史負(fù)荷分解為不同的分量,再結(jié)合機(jī)器學(xué)習(xí)方法等進(jìn)行預(yù)測,將各分量的預(yù)測值進(jìn)行組合以得到預(yù)測結(jié)果。文獻(xiàn)[7]提出了1種基于EMD和LSTM的短期電力負(fù)荷預(yù)測模型,提升了模型的非線性擬合能力和時(shí)間記憶能力。文獻(xiàn)[8]提出了1種結(jié)合變分模態(tài)分解、注意力機(jī)制和改進(jìn)的深度雙向門控循環(huán)單元的短期負(fù)荷預(yù)測模型,提升了負(fù)荷預(yù)測的速度和精度。
條件生成對(duì)抗網(wǎng)絡(luò)(conditional generative adversarial network,CGAN)能夠捕捉非線性時(shí)間序列數(shù)據(jù)間隱含的深層關(guān)系,并且能考慮到氣候、日期等因素的影響[9]。本文將EMD與CGAN相結(jié)合,建立了基于經(jīng)驗(yàn)?zāi)B(tài)分解-條件生成對(duì)抗網(wǎng)絡(luò)(empirical mode decomposition to conditional generative adversarial network,EMD-CGAN)的負(fù)荷預(yù)測模型。以實(shí)際算例對(duì)其進(jìn)行驗(yàn)證,并與其他基于深度學(xué)習(xí)的負(fù)荷預(yù)測模型進(jìn)行對(duì)比。對(duì)比結(jié)果表明,本文所提模型具有更小的預(yù)測誤差。
GAN是1種通過對(duì)抗過程來估計(jì)生成模型的深度學(xué)習(xí)方法,包括生成器和判別器2個(gè)部分。其中,生成器可以學(xué)習(xí)真實(shí)數(shù)據(jù)的分布,將輸入的隨機(jī)噪聲轉(zhuǎn)化為判別器無法分辨的假樣本數(shù)據(jù);判別器可以區(qū)分輸入數(shù)據(jù)是否為生成樣本。兩者通過相互博弈使GAN模型充分學(xué)習(xí)數(shù)據(jù)間隱含的深層關(guān)系并達(dá)到平衡。平衡后,理論上模型所生成的數(shù)據(jù)與真實(shí)數(shù)據(jù)相差無幾。CGAN是對(duì)原始GAN的改進(jìn)。CGAN保留了GAN生成器和判別器的博弈結(jié)構(gòu),并在此基礎(chǔ)上增加了條件值y作為輸入。隨機(jī)噪聲z與條件值y一起作為生成器的輸入,通過生成器生成樣本G(z|y)。判別器D則要判斷對(duì)應(yīng)條件下的生成樣本是否與真實(shí)樣本x相似,并將判別結(jié)果D(x|y)通過損失函數(shù)反饋給生成器和判別器。生成器和判別器根據(jù)反饋的損失函數(shù)更新自身參數(shù)并進(jìn)行優(yōu)化,從而達(dá)到納什均衡。
CGAN結(jié)構(gòu)如圖1所示。
CGAN模型中判別器和生成器的損失函數(shù)如式(1)、式(2)所示。
LG=-Ez~Pz{D[G(z|y)|y]}
(1)
式中:D(·)為判別器輸出的數(shù)據(jù);G(·)為生成器輸出的數(shù)據(jù);E(·)為對(duì)應(yīng)分布的期望值;z~Pz為噪聲數(shù)據(jù)z的分布。
LD=-Ex~Px[D(x|y)]+Ez~Pz{D[G(z|y)|y]}
(2)
式中:x~Px為真實(shí)樣本x的分布。
將LG、LD的損失函數(shù)進(jìn)行組合,可以得到CGAN的目標(biāo)函數(shù),如式(3)所示。其訓(xùn)練目標(biāo)為帶有條件的2人極小極大值博弈。
Ez-Pz{log{1-D[G(z|y)|y]}}
(3)
當(dāng)生成器完全學(xué)習(xí)到真實(shí)數(shù)據(jù)中隱含的深層關(guān)系時(shí),LG、LD的損失函數(shù)可以得到最優(yōu)解。
EMD是1種處理非線性非平穩(wěn)信號(hào)的時(shí)頻分析方法[10]。該方法可以根據(jù)負(fù)荷數(shù)據(jù)本身的時(shí)間尺度特性按頻率由高到低將其分解為多個(gè)本征模態(tài)函數(shù)(intrinsic mode function,IMF)分量和1個(gè)殘差(residual,RES)分量。每個(gè)IMF代表不同時(shí)間尺度下的負(fù)荷特征分量如式(4)所示。
(4)
式中:Pi(t)為多個(gè)IMF分量;Rn(t)為RES分量。
所有IMF必須滿足以下2個(gè)條件:函數(shù)極值點(diǎn)的個(gè)數(shù)必須等于零點(diǎn)的個(gè)數(shù)或者相差個(gè)數(shù)等于1;對(duì)于任意采樣點(diǎn),由局部最大值點(diǎn)和局部最小值點(diǎn)組成的上下包絡(luò)線的平均值為零[11]。
運(yùn)用EMD對(duì)負(fù)荷進(jìn)行分解的具體步驟如下。
①找出原始負(fù)荷數(shù)據(jù)的所有極大值點(diǎn)和極小值點(diǎn)。
②采用三次樣條插值法,分別求得極大值點(diǎn)形成的上包絡(luò)線e+(t)和極小值點(diǎn)形成的下包絡(luò)線e-(t)。
③計(jì)算均值包絡(luò)線e(t)。
(5)
④采用原始負(fù)荷數(shù)據(jù)P(t)減去均值包絡(luò)線e(t),得到新的負(fù)荷時(shí)間序列F1(t)。
F1(t)=P(t)-e(t)
(6)
⑤判斷F1(t)是否滿足IMF分量的2個(gè)條件。若不滿足,則返回步驟①繼續(xù)循環(huán);若滿足,則得到輸入負(fù)荷數(shù)據(jù)的一階IMF分量P1(t)。
⑥將原始負(fù)荷時(shí)間序列減去一階IMF分量得到一階殘差分量R1(t),并以其作為輸入信號(hào)求得二階IMF分量。
⑦重復(fù)上述過程,直至n階殘差分量Rn(t)的幅值小于預(yù)設(shè)閾值, EMD結(jié)束。
EMD分解可以將原始負(fù)荷時(shí)間序列分解為多個(gè)時(shí)間尺度下的負(fù)荷特征分量和一個(gè)殘差分量,從而提高負(fù)荷預(yù)測的精度。
EMD-CGAN結(jié)構(gòu)如圖2所示。
為了解決原始GAN對(duì)負(fù)荷進(jìn)行短期預(yù)測時(shí)存在的預(yù)測精度不高、模型不穩(wěn)定等問題,本文結(jié)合EMD與CGAN,提出了基于EMD-CGAN的負(fù)荷預(yù)測模型。
EMD-CGAN主要包括EMD、生成器和判別器3部分。由圖2可知,EMD-CGAN的生成器由n個(gè)LSTM組成。LSTM 具有較好的記憶性能,并且在短期負(fù)荷預(yù)測中表現(xiàn)良好,所以在生成器中采用n個(gè)LSTM網(wǎng)絡(luò)分別對(duì)n個(gè)負(fù)荷特征分量進(jìn)行預(yù)測,再對(duì)其輸出進(jìn)行求和即可得到負(fù)荷預(yù)測值。
EMD-CGAN在CGAN的基礎(chǔ)上將生成器的輸入由隨機(jī)噪聲改為歷史負(fù)荷數(shù)據(jù),并增加了1個(gè)EMD模塊將歷史負(fù)荷數(shù)據(jù)分解為多個(gè)經(jīng)驗(yàn)?zāi)B(tài)分量和1個(gè)殘差分量,使得生成器可以學(xué)習(xí)到多個(gè)時(shí)間尺度下的負(fù)荷特征。這不僅降低了生成模型的復(fù)雜度,還可以提高負(fù)荷預(yù)測的精度。
模型的網(wǎng)絡(luò)參數(shù)及意義如表1所示。
表1 網(wǎng)絡(luò)參數(shù)及意義
判別器的作用是判別輸入數(shù)據(jù)是生成數(shù)據(jù)還是真實(shí)數(shù)據(jù),相當(dāng)于1個(gè)二分類器。由于CNN具有較好的特征提取能力,且在分類任務(wù)中表現(xiàn)良好,所以判別器采用CNN。判別器結(jié)構(gòu)如圖3所示。
判別器由多個(gè)卷積層和1個(gè)全連接層組成。負(fù)荷預(yù)測值和實(shí)際負(fù)荷值分別與條件值拼接成1個(gè)矩陣作為判別器的輸入,經(jīng)過多層卷積后提取到高維數(shù)據(jù)的低維特征,并通過全連接層得到判別信息。
EMD-CGAN構(gòu)建后,首先將歷史數(shù)據(jù)分為訓(xùn)練集和測試集(訓(xùn)練集數(shù)據(jù)和測試集數(shù)據(jù)不重疊),然后采用訓(xùn)練集數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,最后運(yùn)用測試集數(shù)據(jù)對(duì)已訓(xùn)練負(fù)荷預(yù)測模型進(jìn)行驗(yàn)證。
EMD-CGAN模型的預(yù)測過程如下。
①數(shù)據(jù)預(yù)處理??紤]到歷史負(fù)荷數(shù)據(jù)和負(fù)荷影響因素具有不同的量綱和量綱單位,且試驗(yàn)數(shù)據(jù)分布區(qū)間跨度較大,會(huì)影響深度學(xué)習(xí)模型在進(jìn)行梯度下降求解時(shí)的下降速度,因此對(duì)試驗(yàn)數(shù)據(jù)采用歸一化操作。歸一化表達(dá)式為:
(7)
式中:X為要?dú)w一化的數(shù)據(jù);Xt為歸一化后的數(shù)據(jù);Xmin為原始數(shù)據(jù)的最小值;Xmax為原始數(shù)據(jù)的最大值。
②EMD-CGAN模型的優(yōu)化訓(xùn)練。首先,對(duì)經(jīng)過預(yù)處理的歷史負(fù)荷數(shù)據(jù)x進(jìn)行EMD,得到(n-1)個(gè)本征模態(tài)函數(shù)和1個(gè)余波。然后,將這n組數(shù)據(jù)分別與條件值y進(jìn)行拼接輸入到生成器的n個(gè)LSTM神經(jīng)網(wǎng)絡(luò)中,并對(duì)n個(gè)LSTM的輸出求和得到負(fù)荷預(yù)測數(shù)據(jù)。最后,將負(fù)荷預(yù)測數(shù)據(jù)、真實(shí)數(shù)據(jù)分別和條件值一起輸入判別器,將真實(shí)數(shù)據(jù)的判別結(jié)果和預(yù)測數(shù)據(jù)的判別結(jié)果組成交叉熵反饋給判別器和生成器,從而對(duì)模型進(jìn)行優(yōu)化訓(xùn)練。
③負(fù)荷預(yù)測。首先,將歷史負(fù)荷數(shù)據(jù)和條件值輸入已訓(xùn)練的EMD-GAN網(wǎng)絡(luò)后,生成器輸出負(fù)荷預(yù)測值。然后,對(duì)負(fù)荷預(yù)測值進(jìn)行反歸一化,即可得到負(fù)荷預(yù)測結(jié)果。
目前,負(fù)荷預(yù)測結(jié)果的評(píng)價(jià)指標(biāo)主要有均方根誤差(root mean square error,RMSE)和平均絕對(duì)百分誤差(mean absolute percentage error,MAPE)。其中:RMSE反映了負(fù)荷預(yù)測的準(zhǔn)確度;MAPE反映了預(yù)測模型的擬合度[12]。兩種指標(biāo)的表達(dá)式如式(8)和式(9)所示。
(8)
式中:x′i為預(yù)測負(fù)荷值;xi為實(shí)際負(fù)荷值;m為樣本數(shù)量;R為RMSE。
(9)
式中:M為MAPE。
為驗(yàn)證預(yù)測模型的準(zhǔn)確性,本文選取中國浙江某地配電網(wǎng)2016—2017年的電力負(fù)荷數(shù)據(jù)以及氣象數(shù)據(jù)(溫度、濕度、風(fēng)速)作為試驗(yàn)數(shù)據(jù)集,對(duì)所提短期負(fù)荷預(yù)測方法進(jìn)行驗(yàn)證。其中,負(fù)荷數(shù)據(jù)和氣象數(shù)據(jù)的時(shí)間分辨率均為15 min,即每日各類數(shù)據(jù)均有96個(gè)采樣點(diǎn)。選取前70%歷史數(shù)據(jù)作為訓(xùn)練集、其余歷史數(shù)據(jù)作為測試集,并以前1周的歷史負(fù)荷數(shù)據(jù)和氣象數(shù)據(jù)作為輸入預(yù)測未來24 h的負(fù)荷。
本文對(duì)歷史負(fù)荷數(shù)據(jù)進(jìn)行EMD。對(duì)于不同的歷史負(fù)荷數(shù)據(jù),分解得到的IMF項(xiàng)數(shù)可能是不同的。為保證生成器輸入的IMF項(xiàng)數(shù)相同,本文對(duì)不同負(fù)荷數(shù)據(jù)進(jìn)行多次EMD。經(jīng)過試驗(yàn)發(fā)現(xiàn),IMF的前6項(xiàng)已經(jīng)能很好地描述歷史負(fù)荷周期性趨勢(shì)。因此,本文將所有試驗(yàn)的IMF都設(shè)為6項(xiàng),將余項(xiàng)納入RES項(xiàng)進(jìn)行處理。浙江某地區(qū)1周負(fù)荷數(shù)據(jù)EMD結(jié)果如圖4所示。
由圖4可知,經(jīng)過 EMD 算法分解后的各IMF分量的規(guī)律性強(qiáng)于原始負(fù)荷,更有利于LSTM神經(jīng)網(wǎng)絡(luò)對(duì)電力負(fù)荷數(shù)據(jù)特征的學(xué)習(xí)。
本文建立的EMD-CGAN的生成器由7個(gè) LSTM 神經(jīng)網(wǎng)絡(luò)構(gòu)成。每個(gè)LSTM神經(jīng)網(wǎng)絡(luò)由2個(gè)隱藏層和1個(gè)輸出層組成。隱藏層的神經(jīng)元個(gè)數(shù)為20。激活函數(shù)為tanh,學(xué)習(xí)率為0.001。判別器則由3層CNN和1個(gè)全連接層構(gòu)成。其中:3層CNN的卷積核大小均為5×5;卷積核個(gè)數(shù)分別為32、64、128;滑動(dòng)步長均為2;激活函數(shù)為LReLU;學(xué)習(xí)率為0.001;池化方法為最大池化。
本文采用訓(xùn)練集數(shù)據(jù)對(duì)EMD-CGAN模型進(jìn)行訓(xùn)練。模型訓(xùn)練完成后,運(yùn)用測試集數(shù)據(jù)驗(yàn)證模型的有效性。EMD-CGAN預(yù)測結(jié)果如圖5所示。
由圖5可知,預(yù)測負(fù)荷和實(shí)際負(fù)荷基本吻合。
為了進(jìn)一步驗(yàn)證本文模型的有效性,在同等條件下,將本文所提方法預(yù)測結(jié)果與LSTM、EMD-LSTM以及CGAN的預(yù)測結(jié)果進(jìn)行對(duì)比。不同算法負(fù)荷預(yù)測結(jié)果如圖6所示。
對(duì)4種負(fù)荷預(yù)測方法預(yù)測結(jié)果的RMSE 值和MAPE值進(jìn)行計(jì)算。各方法預(yù)測誤差對(duì)比如表2 所示。從RMSE角度來看,本文所提方法與 LSTM、EMD-LSTM、CGAN相比,RMSE分別下降了120.893 MW、80.287 MW、99.253 MW。從MAPE角度來看,本文所提方法相對(duì)于其他算法的MAPE分別下降了1.646%、0.876%、1.189%。綜上所述,本文所提出的基于EMD-CGAN的短期負(fù)荷預(yù)測方法相對(duì)于其他方法具有更小的預(yù)測誤差。
表2 各方法預(yù)測誤差對(duì)比
針對(duì)復(fù)雜環(huán)境下歷史負(fù)荷數(shù)據(jù)呈現(xiàn)隨機(jī)性、非線性的特點(diǎn),本文提出1種基于EMD-CGAN 的短期負(fù)荷預(yù)測模型。該模型充分考慮了負(fù)荷數(shù)據(jù)本身的時(shí)間尺度特征以及外部環(huán)境因素的影響,提高了基于深度學(xué)習(xí)短期負(fù)荷預(yù)測模型的效率和精度。然而,本文所建模型在實(shí)際預(yù)測中并未分析各負(fù)荷影響因素與不同IMF分量之間的關(guān)聯(lián)關(guān)系,而是直接將所有條件值與IMF分量進(jìn)行組合。后續(xù)研究可以考慮不同負(fù)荷影響因素對(duì)各IMF分量預(yù)測精度的影響程度,針對(duì)不同的IMF分量選擇不同的條件值進(jìn)行拼接,從而進(jìn)一步提升負(fù)荷預(yù)測效率和精度。