吳 云, 雷建文, 鮑麗山, 李春哲
(1. 東北電力大學(xué)信息工程學(xué)院, 吉林省吉林市 132012; 2. 國網(wǎng)江蘇省電力有限公司信息通信分公司, 江蘇省南京市 221000; 3. 國網(wǎng)吉林省電力有限公司遼源供電公司, 吉林省遼源市 136200)
短期電力負荷預(yù)測是電網(wǎng)運行調(diào)度、生產(chǎn)規(guī)劃的重要組成部分,它主要是對未來幾時、一天甚至幾天的電力負荷進行預(yù)測,其主要用于安排短期調(diào)度計劃、應(yīng)對緊急情況,是電力系統(tǒng)安全穩(wěn)定和經(jīng)濟運行的基礎(chǔ)[1-2]。
隨著影響負荷預(yù)測因素的數(shù)量、種類的增多,隨機性以及分布特點變得復(fù)雜,傳統(tǒng)的負荷預(yù)測方法的速度與精度已經(jīng)不能滿足大數(shù)據(jù)環(huán)境下的要求[3]。越來越多的算法應(yīng)用到負荷預(yù)測領(lǐng)域之中,使得負荷預(yù)測的精度不斷提高[4]。文獻[5]把灰色模型與神經(jīng)網(wǎng)絡(luò)的優(yōu)點相互結(jié)合,并采用遺傳算法對神經(jīng)網(wǎng)絡(luò)進行優(yōu)化,以此完成對短期電力負荷的預(yù)測,預(yù)測精度較單一的神經(jīng)網(wǎng)絡(luò)方法有所提高。然而該方法的訓(xùn)練樣本中有很多異于待測日特征的樣本,這不僅造成神經(jīng)網(wǎng)絡(luò)訓(xùn)練時間較長,而且收斂速度較慢。文獻[6]把改進的隨機森林算法與灰色投影相結(jié)合對電網(wǎng)短期負荷預(yù)測。該方法雖然通過灰色關(guān)聯(lián)投影法能夠找到與待測日具有相似特征的歷史日,但是找到的相似日只具備良好的負荷趨勢相似性,而不具備良好的負荷曲線形狀相似性[7],因此預(yù)測精度也有待提高。
為彌補傳統(tǒng)灰色關(guān)聯(lián)分析法在選擇相似日時只考慮負荷特征曲線的幾何相似程度而忽略了數(shù)值接近程度的缺陷,克服反向傳播(BP)神經(jīng)網(wǎng)絡(luò)泛化能力差、易陷入局部最優(yōu)[8]等不足,本文提出了一種基于改進灰色關(guān)聯(lián)與蝙蝠優(yōu)化神經(jīng)網(wǎng)絡(luò)的短期負荷預(yù)測(IGRA-BA-BP)方法,并結(jié)合實際案例對該方法進行了驗證。結(jié)果表明,相比現(xiàn)有的短期負荷預(yù)測方法,本文方法的預(yù)測結(jié)果有所提高。
短期電力負荷預(yù)測是依據(jù)電力負荷和其影響因素的歷史數(shù)據(jù),建立相關(guān)的預(yù)測模型,對未來的電力負荷進行科學(xué)的預(yù)測。氣象因素是影響負荷變化的重要因素,它對負荷的影響主要體現(xiàn)在氣象因素的突變會導(dǎo)致電力負荷隨之突然變化[9-10]。日期類型對電力負荷的影響主要體現(xiàn)在工作日與休息日(周末和節(jié)假日)之間的用電量差距[11]。因而本文選取氣象因素和日期類型作為負荷的主要影響因素,來對電力負荷進行預(yù)測。
把影響負荷的主要影響因素作為選取相似日粗集的指標(biāo),通過下述相似日粗集選取規(guī)則選取相似日粗集。由天氣預(yù)報得知待測日的氣象數(shù)據(jù),從歷史日中選出最高溫度與待測日相差±3 ℃以內(nèi)的樣本組成集合A;從集合A中選出最低溫度與待測日相差±3 ℃以內(nèi)的樣本組成集合B;從集合B中的選出平均溫度與待測日相差±3 ℃以內(nèi)的樣本組成集合C;從集合C中選出降雨量與待測日相差±3 mm以內(nèi)的樣本組成集合D;從集合D中選出日期類型(工作日、節(jié)假日、周末)與待測日一致的樣本組成集合E,則集合E為相似日粗集。
此過程只是選取出了與待測日具有粗糙相似的日期類型和氣象特征的歷史日,為了提高預(yù)測精度,再運用灰色關(guān)聯(lián)分析方法[12],在相似日粗集中進一步抽取與待測日具有高度關(guān)聯(lián)的若干歷史日,以這些歷史日作為下一步預(yù)測模型的訓(xùn)練樣本,無疑將會較大地提高負荷預(yù)測的精度[13]。
溫度和降雨量以及日期類型的數(shù)量級和單位都不相同,不能做進一步計算,如要進一步計算各相似日粗集中的樣本與待測日的灰色關(guān)聯(lián)度,需要對各影響因素進行量化,從而方便相似度的計算。本文參考文獻[14]對日期類型的與氣象數(shù)據(jù)進行量化來定性描述日期類型與氣象因素對短期電力負荷預(yù)測的影響。因其只對降雨類型做了量化,這樣量化不夠精細,因此本文參照其方法對降雨量根據(jù)區(qū)間進行量化,如表1所示。
表1 降雨量區(qū)間及其量化值Table 1 Rainfall interval and its quantified value
關(guān)聯(lián)分析的基本思想是根據(jù)數(shù)據(jù)序列的相似程度來判斷關(guān)聯(lián)程度[7,12],是灰色系統(tǒng)理論提出的一種分析系統(tǒng)中各因素關(guān)聯(lián)程度的方法。傳統(tǒng)灰色關(guān)聯(lián)分析法使用兩個數(shù)據(jù)序列之差的絕對值計算關(guān)聯(lián)度,只考慮了數(shù)據(jù)序列之間的幾何相似程度,而忽略了數(shù)值接近程度。如果兩條曲線平行,以傳統(tǒng)灰色關(guān)聯(lián)分析法計算出二者關(guān)聯(lián)度為1,實則兩條曲線的關(guān)聯(lián)度不為1,計算出的關(guān)聯(lián)度與實際不符。
本文從兩個角度分析兩條特征曲線的關(guān)聯(lián)度,兩條特征曲線各點的差越接近0或者商越接近1,則兩條特征曲線越接近。提出一種融合差方式和除方式的灰色關(guān)聯(lián)分析方法,從形狀和距離上定義綜合灰色關(guān)聯(lián)度。改進灰色關(guān)聯(lián)度步驟如下。
1)構(gòu)造特征矩陣
由各影響因素的值組成特征向量X,待測日特征向量以X0=[x0(1),x0(2),,x0(m)]表示。相似日粗集中的每日的特征向量以X1,X2,,Xn表示,這n+1個序列構(gòu)成一個m×(n+1)階的特征矩陣如式(1)所示。
[X0X1X2Xn]=
(1)
式中:m為特征向量的維數(shù);n為相似日粗集中樣本個數(shù);xi(k)表示相似日粗集中第i個樣本的第k個特征;x0(k)表示待測日的第k個特征;下標(biāo)i=1,2,,n,k=1,2,,m(下同)。
2)計算差矩陣
求待測日序列與相似日粗集中樣本序列各分量的差值,組成差值矩陣,如式(2)所示。
(2)
(3)
3)計算商矩陣
求待測日序列與相似日粗集中樣本序列各分量的商,組成商矩陣,如式(4)所示。
(4)
(5)
4)計算綜合灰色關(guān)聯(lián)度
求得相似日粗集中每個歷史日與待測日的綜合灰色關(guān)聯(lián)度。綜合灰色關(guān)聯(lián)度計算公式如下:
(6)
按照求取的綜合灰色關(guān)聯(lián)度,選擇相似日粗集中綜合關(guān)聯(lián)度大于0.85的所有樣本組成相似日集。
BP神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播,反復(fù)修正各層之間的連接權(quán)值和閾值,使得誤差函數(shù)值達到最小的多層前饋神經(jīng)網(wǎng)絡(luò),相鄰層之間通過不同的權(quán)值實現(xiàn)連接[15]。本文采用單隱含層的三層神經(jīng)網(wǎng)絡(luò),輸入層節(jié)點數(shù)為8個,其中包含待測日的負荷影響因素與待測日前一天t時刻、t-1時刻、t-2時刻的負荷值。輸出層節(jié)點為一個,代表待測日t時刻的負荷值,隱含層節(jié)點數(shù)根據(jù)經(jīng)驗式(7)來確定[16]。
(7)
式中:m′和n′分別為輸入層、輸出層節(jié)點的個數(shù);h為隱含層節(jié)點個數(shù);a為1~10之間的調(diào)節(jié)常數(shù),最終選定隱含層的節(jié)點數(shù)為4。隱含層和輸出層的激活函數(shù)采用sigmoid函數(shù)[17]
蝙蝠算法(bat algorithm,BA)[18]是一種全局搜索優(yōu)化算法,其基本思想是將每個種群個體映射為空間中的可行解,把搜索過程和優(yōu)化過程模擬成蝙蝠個體搜尋獵物和移動的過程,蝙蝠所處位置的優(yōu)劣以求解問題的適應(yīng)度函數(shù)來衡量,將尋優(yōu)過程類比為個體的優(yōu)勝劣汰過程。
蝙蝠在搜索尋優(yōu)的過程中每個個體的位置、速度以及回聲頻率按如下公式進行變化:
fi=fmin+(fmax-fmin)β
(8)
(9)
(10)
對于局部搜索,一旦從現(xiàn)有的最優(yōu)解中選出一個解,每只蝙蝠的下一個解pnew就在隨機游走中就近產(chǎn)生,即
pnew=pold+θAt
(11)
在初始時個體保持較強的響度和較低的脈沖發(fā)射率,在搜尋到食物后,則不斷減小響度,增大脈沖發(fā)射率,蝙蝠在搜尋獵物過程中,脈沖發(fā)射率和響度表示公式如下:
(12)
(13)
由于神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程緩慢,容易陷入局部小值,甚至還有可能無法收斂[20],所以要對BP神經(jīng)網(wǎng)絡(luò)的初始參數(shù)進行優(yōu)化。蝙蝠算法因具備并行性、分布式和收斂速度快等特點,被廣泛應(yīng)用到各個領(lǐng)域。它比粒子群優(yōu)化算法[21]和遺傳算法更具發(fā)展?jié)摿?BA算法結(jié)合這些算法的主要優(yōu)點,在優(yōu)化神經(jīng)網(wǎng)絡(luò)方面性能優(yōu)越[22]。
采用BA對BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進行優(yōu)化,使其不易陷入局部極小值,還可以增強泛化性能,提高預(yù)測精度和收斂速度。BA優(yōu)化的適應(yīng)度函數(shù)為:
(14)
BA優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的步驟如下。
步驟1:初始化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),即初始化輸入層、隱含層、輸出層的節(jié)點個數(shù),導(dǎo)入訓(xùn)練數(shù)據(jù)。
步驟3:計算適應(yīng)度Fitness(i)當(dāng)前最優(yōu)適應(yīng)度Fbest,當(dāng)前最優(yōu)位置pbest。
步驟4:按照式(8)至式(10)產(chǎn)生新解。
步驟7:判斷算法是否達到終止條件,若達到終止條件,輸出結(jié)果,得到神經(jīng)網(wǎng)絡(luò)的最優(yōu)權(quán)值和閾值。否則,返回步驟4繼續(xù)迭代。
步驟8:將蝙蝠全局最優(yōu)位置對應(yīng)的權(quán)值和閾值作為BP神經(jīng)網(wǎng)絡(luò)參數(shù),建立最優(yōu)的負荷預(yù)測模型。BA優(yōu)化BP神經(jīng)網(wǎng)絡(luò)流程圖見附錄A圖A1。
算例1:采用中國南方某地區(qū)2014年6月1日到9月23日的歷史數(shù)據(jù),對2014年9月24日全天24 h的電力負荷進行預(yù)測。首先利用本文第1節(jié)所述規(guī)則從歷史數(shù)據(jù)中選出相似日粗集,共有28個樣本被選入相似日粗集。再利用本文改進的灰色關(guān)聯(lián)方法計算相似日粗集中樣本與待測日的綜合灰色關(guān)聯(lián)度,計算結(jié)果見圖1。選取綜合灰色關(guān)聯(lián)度大于0.85的樣本作為待測日的最終相似日集,用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
圖1 綜合灰色關(guān)聯(lián)度Fig.1 Comprehensive grey relational degree
把預(yù)處理后的原始數(shù)據(jù)y經(jīng)式(15)歸一化后與量化之后的影響因素組成神經(jīng)網(wǎng)絡(luò)的輸入向量。預(yù)測結(jié)果的反歸一化如式(16)所示。
(15)
(16)
相關(guān)參數(shù)設(shè)置:BP神經(jīng)網(wǎng)絡(luò)為3層網(wǎng)絡(luò)結(jié)構(gòu),隱含層和輸出層之間采用sigmoid函數(shù),學(xué)習(xí)率為0.01,輸入節(jié)點為8個,隱含層節(jié)點為4個,輸出節(jié)點為1個,需要優(yōu)化的權(quán)值和閾值為8×4+4×1+4+1=41個,其中權(quán)值為36個,閾值為5個。所以蝙蝠個體維數(shù)為41,個體中各分量的范圍為[-1,1],種群規(guī)模為20,脈沖響度為0.3,脈沖發(fā)射率為0.5,脈沖響度衰減系數(shù)和脈沖發(fā)射率增加系數(shù)都為0.9,回聲頻率范圍[fmin,fmax]為[0,3],最大迭代次數(shù)為5 000次,期望誤差為0.001。
使用全部歷史數(shù)據(jù)分別通過單一的BP神經(jīng)網(wǎng)絡(luò)預(yù)測方法、蝙蝠優(yōu)化BP神經(jīng)網(wǎng)絡(luò)組合預(yù)測(BA-BP)方法、傳統(tǒng)灰色關(guān)聯(lián)與蝙蝠優(yōu)化BP神經(jīng)網(wǎng)絡(luò)組合預(yù)測(GRA-BA-BP)方法以及本文所提IGRA-BA-BP方法對2014年9月24日電力負荷進行預(yù)測,預(yù)測結(jié)果如圖2所示。
圖2 預(yù)測負荷曲線與實際負荷曲線Fig.2 Prediction load curves and actual load curve
(17)
由于相對誤差ERE有正負,為了避免正負相抵消,計算平均相對誤差的時候取相對誤差的絕對值。平均相對誤差如式(18)所示,均方根誤差如式(19)所示。
(18)
(19)
均方根誤差指標(biāo)加強了數(shù)值大的誤差的作用,提高了該指標(biāo)的靈活性。
為方便分析,把相對誤差去絕對值,做出對比如圖3所示。
圖3 相對誤差對比Fig.3 Comparison of relative error
4種方法的平均相對誤差和均方根誤差如表2所示。
表2 平均相對誤差與均方根誤差Table 2 Mean relative error and root mean square error
由圖3和表2可以看出:采用優(yōu)化過的神經(jīng)網(wǎng)絡(luò)來預(yù)測短期電力負荷,誤差比單一的神經(jīng)網(wǎng)絡(luò)預(yù)測要小;BA-BP方法預(yù)測結(jié)果的平均相對誤差和均方根誤差比單一的BP神經(jīng)網(wǎng)絡(luò)分別減小1.07%和1.06%;采用灰色關(guān)聯(lián)選取相似日和優(yōu)化的神經(jīng)網(wǎng)絡(luò)相結(jié)合的預(yù)測方法,預(yù)測效果相比沒有采用相似日法的預(yù)測效果也有明顯的提升;GRA-BA-BP方法預(yù)測結(jié)果的平均相對誤差和均方根誤差比BA-BP方法分別減小0.29%和0.37%;而預(yù)測效果最好的是IGRA-BA-BP方法,其預(yù)測結(jié)果比GRA-BA-BP方法預(yù)測結(jié)果的平均相對誤差和均方根誤差分別降低了0.07%和0.05%;IGRA-BA-BP方法的預(yù)測效果比BA-BP和BP方法的預(yù)測效果都有了大幅的提高,其中平均相對誤差與均方根誤差比BP方法分別減小了1.43%和1.48%。
算例2:為充分證明本文方法的優(yōu)越性,隨機選擇一組數(shù)據(jù)對其中一天的負荷進行預(yù)測,以2014年3月1日到5月20日的歷史數(shù)據(jù),對2014年5月21日全天24 h的電力負荷進行預(yù)測。并分別與算例1另外三種方法的預(yù)測結(jié)果對比,預(yù)測負荷曲線和實際負荷曲線圖見附錄A圖A2,具體的預(yù)測誤差見附錄A表A1。
針對短期電力負荷預(yù)測中選擇相似日的問題,本文首先通過相似日粗集選取規(guī)則從歷史日中選取與待測日具有相似性的樣本,在常規(guī)灰色關(guān)聯(lián)分析的基礎(chǔ)之上引入形狀相似性和距離相近性,選取綜合灰色關(guān)聯(lián)度大于0.85的樣本組成相似日集,利用相似日集作為神經(jīng)網(wǎng)絡(luò)預(yù)測模型的訓(xùn)練樣本,減少了訓(xùn)練樣本的數(shù)量和差異程度。在BP神經(jīng)網(wǎng)絡(luò)預(yù)測的基礎(chǔ)上,對其初始權(quán)值和閾值進一步優(yōu)化,使得BP神經(jīng)網(wǎng)絡(luò)很快速地收斂到一個較好的解。通過把本文方法的預(yù)測的結(jié)果分別和沒有經(jīng)過相似日選擇的兩種方法以及利用傳統(tǒng)灰色關(guān)聯(lián)方法選取相似日的預(yù)測方法相比較可得,改進的灰色關(guān)聯(lián)方法與蝙蝠優(yōu)化的神經(jīng)網(wǎng)絡(luò)結(jié)合,可以有效提高短期電力負荷預(yù)測的預(yù)測精度,為電網(wǎng)發(fā)電、調(diào)度等環(huán)節(jié)提供可靠支持。但是隨著電力系統(tǒng)數(shù)據(jù)量的增加,文中方法在大數(shù)據(jù)環(huán)境下的應(yīng)用還有一定的局限性。未來可以將本文方法和大數(shù)據(jù)平臺結(jié)合,進一步提高該方法的訓(xùn)練效率、應(yīng)用范圍及數(shù)據(jù)處理能力。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx)。