陳中慧,王海云,常喜強(qiáng),徐 森
(1. 新疆大學(xué)電氣工程學(xué)院,新疆 烏魯木齊 830047;2. 國網(wǎng)新疆電力有限公司,新疆 烏魯木齊 830011)
為解決新疆地區(qū)燃煤供暖帶來的霧霾等環(huán)境污染問題,促進(jìn)新能源消納能力緩解棄風(fēng)棄光情況,新疆人民政府于2016年7月5日印發(fā)《關(guān)于擴(kuò)大新能源消納促進(jìn)能源持續(xù)健康發(fā)展的實(shí)施意見》提出加快推進(jìn)電鍋爐、電供暖等基礎(chǔ)設(shè)施的建設(shè),逐步替代傳統(tǒng)燃料供暖方式。隨著煤改電工程的推進(jìn),冬季電采暖負(fù)荷的加大給電能質(zhì)量以及電網(wǎng)安全穩(wěn)定運(yùn)行帶來挑戰(zhàn)[1]。精確的電采暖負(fù)荷預(yù)測不僅保證電網(wǎng)安全穩(wěn)定運(yùn)行還可以對電力系統(tǒng)進(jìn)行調(diào)峰、調(diào)頻[2]。
目前,短期負(fù)荷預(yù)測主要有統(tǒng)計學(xué)方法與機(jī)器學(xué)習(xí)方法兩大類[3]。常用的統(tǒng)計學(xué)方法有線性回歸法與時間序列法[4],其中多元線性回歸是線性回歸分析法中經(jīng)典的預(yù)測方法[5],但該方法對樣本數(shù)量大具有隨機(jī)波動性的時間序列預(yù)測精度不高。機(jī)器學(xué)習(xí)法主要有支持向量機(jī)(support vector machine,SVM) 、人工神經(jīng)網(wǎng)絡(luò)法(artificial neural netwoks,ANN)等,其中人工神經(jīng)網(wǎng)絡(luò)可以很好學(xué)習(xí)序列的非線性特征[6]。文獻(xiàn)[7]采用經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode,EMD)將負(fù)荷數(shù)據(jù)分解為有限個子序列,然后采用經(jīng)過層標(biāo)準(zhǔn)化(LN)優(yōu)化處理的長短期記憶網(wǎng)絡(luò)進(jìn)行短期負(fù)荷預(yù)測。其中EMD分解雖然降低了負(fù)荷數(shù)據(jù)的隨機(jī)波動性,但存在嚴(yán)重的模態(tài)混疊問題,影響負(fù)荷預(yù)測精度。文獻(xiàn)[8]采用集成經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition, EEMD)將歷史電采暖負(fù)荷數(shù)據(jù)分解為一系列子序列,針對不同子序列分別建立BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,最后匯總各預(yù)測模型的預(yù)測結(jié)果,得到最終的預(yù)測電采暖負(fù)荷。雖然EEMD一定程度緩解了EMD的模態(tài)混疊問題,但EEMD分的本征模態(tài)分量(Intrinsic Mode Function,IMF)含有殘余噪聲。且BP神經(jīng)網(wǎng)絡(luò)存在易陷入局部極小,收斂速度慢等問題。文獻(xiàn)[9]針對電采暖負(fù)荷的隨機(jī)波動性,通過充分挖掘電采暖負(fù)荷特點(diǎn)包括負(fù)荷最大值、最小值、負(fù)荷各時刻變化趨勢、負(fù)荷各時刻波動特征、負(fù)荷大幅度突變特征等,形成歷史數(shù)據(jù)特征集。然后將歷史數(shù)據(jù)特征集作為訓(xùn)練樣本應(yīng)用核極限學(xué)習(xí)機(jī)(kernel extreme learning machine,KELM)模型進(jìn)行電采暖短期負(fù)荷預(yù)測。該方法有效降低了電采暖負(fù)荷隨機(jī)波動性對預(yù)測精度的影響。但并未考慮氣象數(shù)據(jù)對電采暖負(fù)荷的影響。文獻(xiàn)[8]與文獻(xiàn)[9]的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型與KELM預(yù)測模型不具記憶性,對歷史數(shù)據(jù)不敏感,不能充分挖掘電采暖負(fù)荷的時間關(guān)聯(lián)性。文獻(xiàn)[10]首先確定長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)的模型參數(shù),然后采用分析得出的不同采樣間隔下的最優(yōu)訓(xùn)練步長分別建立LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測模型均取得了較好的預(yù)測效果。雖然LSTM充分挖掘了電采暖負(fù)荷序列的時間相關(guān)性但是LSTM網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,涉及大量預(yù)測數(shù)據(jù)計算量大、訓(xùn)練速度慢還會存在梯度消失的問題。
針對上述問題,文章提出了基于CEEMDAN-PSO-Elman神經(jīng)網(wǎng)絡(luò)的電采暖短期負(fù)荷預(yù)測方法。采用CEEMDAN將電采暖負(fù)荷數(shù)據(jù)分解為有限個IMF分量和一個剩余分量。CEEMDAN不僅解決了EMD存在的模態(tài)混疊問題,還克服了EEMD由于添加不同幅值白噪聲造成IMF分量中噪聲殘留的問題。應(yīng)用Elman神經(jīng)網(wǎng)絡(luò)對不同分量建立預(yù)測模型,Elman神經(jīng)網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò)、KELM等預(yù)測模型相比具有記憶性對歷史數(shù)據(jù)敏感可以充分挖掘電采暖負(fù)荷序列的時間相關(guān)性,且與LSTM模型相比結(jié)構(gòu)簡單,計算量小。對CEEMDAN分解的分量分別建立PSO-Elman模型,疊加各預(yù)測模型結(jié)果,經(jīng)過算理仿真分析驗(yàn)證了所述方法有效提高了電采暖負(fù)荷預(yù)測精度。
CEEMDAN是在EEMD分解的基礎(chǔ)上改進(jìn)的[11]。CEEMDAN分解方法通過對每次加入自適應(yīng)噪聲的分量進(jìn)行EMD分解,然后平均分解結(jié)果得出唯一本征模態(tài)分量IMF,很大程度上緩解了EMD模態(tài)混疊問題和EEMD分解中IMF噪聲殘留問題。CEEMDAN適用于非線性、非平穩(wěn)信號。CEEMDAN分解的具體步驟如下[12]。
文章定義求解IMF分量時的自適應(yīng)系數(shù)為εi-1,第i次加入的零均值單位方差白噪聲用wi(n)表示,以及EMD及CEEMDAN分解算法得到的第k 個IMF分量分別為Ek(·)、fIMFk。
1)在原始信號x(n)中加入噪聲分量ε0wi(n)進(jìn)行EMD,并在第i次加入白噪聲后分解出第一個IMF分量
(1)
式中I為加入白噪聲次數(shù)。
2)1計算CEEMDAN的第一個余量信號
(2)
3)向式(2)的剩余信號中加入自適應(yīng)白噪聲?1E1(wi(n))后,對其進(jìn)行EMD分解,求解第二個IMF分量
(3)
4)重復(fù)步驟2)、3),可得到第k個余量信號和k+1階IMF分量分別如式(4)和式(5)所示
(4)
(5)
5)重復(fù)步驟4),直至余量信號無法進(jìn)行EMD分解時終止。
假設(shè)算法終止后分解出K個IMF分量,則最終的余量信號為
(6)
Elman神經(jīng)網(wǎng)絡(luò)是由J.L.Elman提出的一種典型動態(tài)遞歸神經(jīng)網(wǎng)絡(luò)[13]。Elman神經(jīng)網(wǎng)絡(luò)是在BP神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上增加了承接層作為一步延時算子[14],使得Elman神經(jīng)網(wǎng)絡(luò)具有記憶能力,對歷史數(shù)據(jù)敏感,提高了對動態(tài)信息的處理能力,解決了BP神經(jīng)網(wǎng)絡(luò)不具備動態(tài)特性的問題。Elman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 Elman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
由圖1可以看出Elman神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層、承接層、輸出層組成的。其中輸入層僅僅具有信號傳輸信號的作用,輸出層具有輸出信號加權(quán)的作用。隱含層的激勵函數(shù)采用Signmoid非線性函數(shù),承接層具有記憶隱含層前一時刻的輸出信號的作用,是一個有一步延遲的延時算子。承接層將前一時刻隱含層的輸出信號反饋給當(dāng)前時刻隱含層輸入,這種連接方式使得Elman神經(jīng)網(wǎng)絡(luò)對歷史數(shù)據(jù)敏感,使網(wǎng)絡(luò)具有處理動態(tài)信息的能力,即達(dá)到了動態(tài)建模的目的[15]。
Elman神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)表達(dá)是如下
y(t)=g(w3x(t))
(7)
x(t)=f(w1xc(t)+w2(u(t-1)))
(8)
xc(t)=x(t-1)
(9)
式中u為r維輸入向量;y為m維輸出向量;x為n維隱含層向量;xc為n維反饋狀態(tài)向量;w1、w2、w3分別為隱含層到承接層連接權(quán)值、輸入層到隱含層連接權(quán)值、隱含層到輸出層連接權(quán)值。f(·)為隱含層的傳遞函數(shù);g(·)為輸出神經(jīng)元的傳遞函數(shù)。
粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是根據(jù)鳥類捕食行為研發(fā)的一種群體智能優(yōu)化算法。算法中每個粒子代表優(yōu)化問題的一個潛在解。每個粒子根據(jù)適應(yīng)度函數(shù)(Fitness)計算得到適應(yīng)度值,適應(yīng)度值決定粒子的優(yōu)劣[16]。適應(yīng)度函數(shù)(Fitness)公式如下
(10)
式中N為樣本總數(shù)目;m為粒子維數(shù);pij與tij分別為第i個樣本的第j維數(shù)據(jù)的重構(gòu)值與實(shí)際值。
粒子的速度決定了粒子的移動方向與距離。個體極值(Pbest)是指個體所經(jīng)歷位置中對應(yīng)適應(yīng)度值最優(yōu)的位置,群體極值(Gbest)是指種群中搜索到的所有粒子對應(yīng)適應(yīng)度值最優(yōu)的位置[17]。在進(jìn)行每一次迭代時,粒子跟蹤Pbest和Gbest更新個體位置,通過多次迭代得到問題的全局最優(yōu)解[18]。
假設(shè)在D維搜索空間,M個粒子構(gòu)成種群X=(X1,X2,…,XM),其中第j個粒子在解空間的位置可表示為Xj=(xj1,xj2,…,xjD)T,第j個粒子的速度可表示為Vj=(vj1,vj2,…,vjD),第j個粒子個體極值可記為Pbest=(pj1,pj2,…,pjD),第j個群體極值記為Gbest=(gj1,gj2,…,pjD),在迭代過程中粒子的速度和位置更新公式如下所示
(11)
(12)
式中k為當(dāng)前迭代次數(shù);w為慣性權(quán)重,c1與c2為加速因子,r1與r2為在(0,1)范圍內(nèi)的隨機(jī)數(shù)。d=1,2,…,D;j=1,2,…M。
采用具有快速全局尋優(yōu)能力的PSO優(yōu)化算法優(yōu)化Elman神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值解決其易陷入局部極小值、收斂速度慢等問題,提高Elman模型的預(yù)測精度。PSO優(yōu)化Elman神經(jīng)網(wǎng)絡(luò)參數(shù)具體步驟如下:
1)由輸入輸出樣本數(shù)據(jù)確定Elman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)神經(jīng)網(wǎng)絡(luò)的所有連接權(quán)值與閾值來確定粒子的維度。
2)粒子群種群初始化,即初始化粒子群參數(shù)包括迭代次數(shù),慣性權(quán)重w,加速因子c1與c2。把Elman神經(jīng)網(wǎng)絡(luò)的連接權(quán)值與閾值映射到粒子的各維度。
3)利用式(10)計算各粒子的適應(yīng)度值,在當(dāng)前粒子適應(yīng)度與個體極值Pbest適應(yīng)度中選擇適應(yīng)度值較大的更新體極值Pbest,同理更新群體極值Gbest。
4)運(yùn)用式(11)、(12)更新各粒子的速度和位置。
5)當(dāng)達(dá)到最大迭代次數(shù)或者群體極值Gbest達(dá)到設(shè)定值,終止尋優(yōu)。否則返回步驟3)。
電采暖負(fù)荷的影響因素有氣象因素:溫度、濕度等,日期類型:節(jié)假日、周幾、電價等。文章首先采用皮爾遜相關(guān)系數(shù)對該地區(qū)的電采暖負(fù)荷影響因素做相關(guān)性分析,然后采用相關(guān)性強(qiáng)的電采暖負(fù)荷影響因素作為CEEMDAN-PSO-Elman神經(jīng)網(wǎng)絡(luò)預(yù)測模型的輸入。皮爾遜相關(guān)系數(shù)公式如下所示。
(13)
式中n為樣本數(shù)量,Xi,Yi分別為樣本量。
電采暖負(fù)荷的隨機(jī)性、波動性影響負(fù)荷的預(yù)測精度,采用CEEMDAN將電采暖負(fù)荷序列分解為若干個較平穩(wěn)更具規(guī)律性的子序列以期提高預(yù)測精度;對于電采暖負(fù)荷序列的時間相關(guān)特性采用對歷史數(shù)據(jù)敏感的具有一定記憶性的Elman神經(jīng)網(wǎng)絡(luò)預(yù)測模型來充分挖掘電采暖負(fù)荷序列的時間關(guān)聯(lián)性。此外應(yīng)用PSO優(yōu)化Elman神經(jīng)網(wǎng)絡(luò)參數(shù)克服Elman神經(jīng)網(wǎng)絡(luò)易陷入極小值問題,尋找全局最優(yōu)解。文章建立基于CEEMDAN-PSO-Elman神經(jīng)網(wǎng)絡(luò)的電采暖短期負(fù)荷預(yù)測模型,流程圖如圖2所示。
圖2 基于CEEMDAN-PSO-Elman的電采暖負(fù)荷流程圖具體步驟為如下。
1)對電采暖負(fù)荷數(shù)據(jù)進(jìn)行預(yù)處理,填補(bǔ)空缺值,剔除異常值。
2)采用皮爾遜相關(guān)系數(shù)對電采暖負(fù)荷與電采暖影響因素做相關(guān)性分析,提取相關(guān)性強(qiáng)的影響因素與電采暖有功負(fù)荷數(shù)據(jù)作為負(fù)荷預(yù)測模型的輸入。
3)將歷史電采暖有功負(fù)荷序列進(jìn)行CEEMDAN分解,得到有限個IMF分量和一個剩余分量。
4)對每個IMF分量、強(qiáng)相關(guān)電采暖影響因素與剩余分量、強(qiáng)相關(guān)電采暖影響因素分別建立PSO-Elman神經(jīng)網(wǎng)絡(luò)預(yù)測模型。
5)疊加不同分量的預(yù)測結(jié)果得到電采暖短期負(fù)荷預(yù)測的最終結(jié)果。
文章采用新疆某地區(qū)2019年1月1日至2019年12月31日期間110天的電采暖有功負(fù)荷數(shù)據(jù)、氣象數(shù)據(jù)、日期類型進(jìn)行仿真測試,數(shù)據(jù)的采樣間隔為15min。
由于電采暖負(fù)荷數(shù)據(jù)采集過程采樣設(shè)備異?;蛲ㄐ旁O(shè)備故障等情況會造成采樣數(shù)據(jù)缺失、異常等質(zhì)量問題。首先剔除異常值,其次對缺失數(shù)據(jù)采用前一時刻與后一時刻值的一周的平均值進(jìn)行填補(bǔ)。
采用皮爾遜相關(guān)系數(shù)對電采暖負(fù)荷與氣溫、相對濕度、節(jié)假日、周幾、電價做相關(guān)性分析,共計10560*6個數(shù)據(jù)點(diǎn)。其中節(jié)假日用數(shù)字1表示,非節(jié)假日用數(shù)字0,周幾用數(shù)字1-7表示,結(jié)果如表1所示。
表1 相關(guān)系數(shù)指標(biāo)
皮爾遜相關(guān)系數(shù)的絕對值越接近1表明相關(guān)性越強(qiáng)。由表可知溫度與電采暖負(fù)荷的相關(guān)性較強(qiáng),因此選取溫度作為電采暖負(fù)荷的影響因素與電采暖有功負(fù)荷作為預(yù)測模型的輸入。選取前109天的的電采暖有功負(fù)荷數(shù)據(jù)與溫度數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),每9天的電采暖有功負(fù)荷與溫度數(shù)據(jù)作為輸入向量,第10天的電采暖有功負(fù)荷數(shù)據(jù)作為目標(biāo)向量,共得到100組訓(xùn)練樣本。第100天的數(shù)據(jù)作為測試樣本。
由于溫度與電采暖有功負(fù)荷的量綱不同,為避免加大預(yù)測誤差對數(shù)據(jù)進(jìn)行歸一化處理,將數(shù)據(jù)歸一化到[0,1]之間,公式如下所示
(14)
式中x~表示歸一化的數(shù)據(jù);xmin表示樣本數(shù)據(jù)中的最小值,xmax表示樣本數(shù)據(jù)中的最大值。
CEEMDAN將電采暖有功負(fù)荷序列分解為13個IMF分量和1個剩余分量r(t)結(jié)果如圖3所示。
圖3 CEEMDAN分解圖
對以上14個電采暖有功負(fù)荷子序列與溫度數(shù)據(jù)為輸入分別建立PSO-Elman神經(jīng)網(wǎng)絡(luò)預(yù)測模型。為了驗(yàn)證文章預(yù)測模型的有效性將文章預(yù)測模型的預(yù)測結(jié)果與Elman神經(jīng)網(wǎng)絡(luò)模型與EEMD-BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果對比,如圖4,圖5所示。
圖4 不同模型預(yù)測結(jié)果
圖5 不同模型預(yù)測結(jié)果局部圖
由圖4和部分局部圖5可以看出該文章預(yù)測模型具有較好的預(yù)測趨勢,Elman模型與EEMD-BP預(yù)測模型在電采暖負(fù)荷尖峰與低谷處有較大誤差。
為定量的分析不同預(yù)測模型的精確度,文章引用了MAE(平均絕對誤差)進(jìn)行誤差分析、MAPE(平均絕對百分比誤差)、RMSE(均方根誤差),其計算公式如式(15)-(17)所示。結(jié)果見表2。
(15)
(16)
(17)
表2 各預(yù)測模型的誤差評價指標(biāo)
由表2可知,文章模型的平均絕對百分比誤差比Elman模型降低了7.53%,比EEMD-BP模型降低了4.5%;文章模型的其它兩種誤差指標(biāo)均小于Elman模型與EEMD-BP模型。證明了電采暖負(fù)荷的隨機(jī)性波動性影響負(fù)荷預(yù)測精度。采用CEEMDAN分解電采暖負(fù)荷能夠提高電采暖負(fù)荷預(yù)測精度,利用PSO優(yōu)化模型參數(shù),使得Elman避免陷入局部最優(yōu)。
文章提出基于CEEMDAN-PSO-Elman神經(jīng)網(wǎng)絡(luò)電采暖負(fù)荷預(yù)測模型,結(jié)合算例仿真分析得到如下結(jié)論。
1)采用CEEMDAN分解電采暖負(fù)荷,降低了電采暖負(fù)荷的隨機(jī)波動性,消除不同趨勢之間的影響,并且解決了EEMD分解噪聲殘留的問題,提高了預(yù)測精度。
2)采用PSO優(yōu)化Elman神經(jīng)網(wǎng)絡(luò)模型參數(shù),克服了Elman神經(jīng)網(wǎng)絡(luò)易陷入局部最小值,收斂速度慢等缺點(diǎn)。
3)Elman神經(jīng)新增承接層是對BP神經(jīng)網(wǎng)絡(luò)的改進(jìn),提高了網(wǎng)絡(luò)對歷史數(shù)據(jù)的敏感性,適用于處理時間序列的電采暖負(fù)荷。
4)通過算例仿真該文章模型與Elman和EEMD-BP預(yù)測模型相比,MAPE降低了7.53%和4.50%,RMSE降低了10.88kW和7.31kW,MAE降低了9.47kW和5.80kW,表明該文章預(yù)測模型有效提高了電采暖負(fù)荷預(yù)測精度。