王 瑞,孫憶楓,逯 靜
(1.河南理工大學(xué) 電氣工程與自動(dòng)化學(xué)院,焦作 454000;2.河南理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,焦作 454000)
短期電力負(fù)荷預(yù)測(cè)主要目的是根據(jù)歷史負(fù)荷和影響因素對(duì)未來(lái)的負(fù)荷情況進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果可以作為電力部門(mén)調(diào)度和分配的參考[1]。短期電力負(fù)荷預(yù)測(cè)中根據(jù)相似日數(shù)據(jù)進(jìn)行預(yù)測(cè)可以利用較少的訓(xùn)練數(shù)據(jù)達(dá)到較高的預(yù)測(cè)精度,所以選擇合適的相似日就尤為重要。文獻(xiàn)[2]根據(jù)各類(lèi)影響因素的動(dòng)態(tài)加權(quán)和選取相似日;文獻(xiàn)[3]運(yùn)用虛擬相似日的概念,將一天多個(gè)負(fù)荷時(shí)段分別選取相似日;文獻(xiàn)[4]通過(guò)構(gòu)建相關(guān)因素特征矩陣智能識(shí)別相似日,并建立實(shí)時(shí)氣象偏差校正策略對(duì)負(fù)荷曲線進(jìn)行二次校正。以上方法都對(duì)相似日的選取有一定的意義,但都僅通過(guò)預(yù)測(cè)當(dāng)天的負(fù)荷影響因素與歷史日負(fù)荷影響因素做相關(guān)性分析來(lái)選取相似日,由于溫度因素與其他影響因素不同,在持續(xù)高溫的情況下,連續(xù)幾日的溫度變化對(duì)相似日選取也會(huì)有影響。本文考慮積溫效應(yīng),將溫度因素和其他影響因素分別進(jìn)行相關(guān)性分析,最后通過(guò)計(jì)算綜合相似度選取相似日,該方法考慮了積溫效應(yīng)對(duì)相似日選取的影響,使相似日選取更加準(zhǔn)確。
RBF神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線性映射能力,是短期電力負(fù)荷預(yù)測(cè)中一種常用的方法[5],優(yōu)化其隱含層參數(shù)設(shè)置可以提升模型整體性能。文獻(xiàn)[6]運(yùn)用交替梯度法交替訓(xùn)練RBF隱含層參數(shù)和輸出層權(quán)值;文獻(xiàn)[7]采用近鄰傳播算法來(lái)選取RBF的隱含層中心;文獻(xiàn)[8]運(yùn)用k-means聚類(lèi)算法選擇RBF隱含層參數(shù)。以上各種改進(jìn)方法均提高了RBF模型的預(yù)測(cè)精度,但均是針對(duì)大量樣本數(shù)據(jù)的RBF模型進(jìn)行改進(jìn),并沒(méi)有針對(duì)基于相似日數(shù)據(jù)的小樣本RBF模型進(jìn)行改進(jìn)。所以本文采用改進(jìn)的模糊c-means聚類(lèi)對(duì)相似日樣本進(jìn)行處理,來(lái)確定RBF的隱含層參數(shù),進(jìn)而提升基于相似日的RBF模型預(yù)測(cè)精度。
要建立短期電力負(fù)荷預(yù)測(cè)模型,首先要分析負(fù)荷與影響因素之間的關(guān)系[9]。氣象因素與日期類(lèi)型是電力負(fù)荷的主要影響因素,本文主要分析這兩者對(duì)負(fù)荷的影響。這些負(fù)荷影響因素的量綱不同,所以在一起分析前需要將它們進(jìn)行處理。
數(shù)值型影響因素用歸一化公式進(jìn)行處理:
其中,x'為歸一化后的值,max(x)和min(x)分別為影響因素歸一化前的最大值和最小值。
本文通過(guò)對(duì)待研究地區(qū)負(fù)荷變化進(jìn)行分析,對(duì)非數(shù)值化影響因素量化值如表1所示。
表1 非數(shù)值影響因素量化值
1.2.1 計(jì)算溫度序列的動(dòng)態(tài)相似度
在持續(xù)高溫的情況下,前幾日的溫度變化也會(huì)對(duì)當(dāng)天的負(fù)荷產(chǎn)生影響,所以即便當(dāng)天與之前某日的影響因素類(lèi)似,負(fù)荷情況也并不一定相同,考慮這種型精度的一種方法[10]。文獻(xiàn)[11]通過(guò)對(duì)溫積溫效應(yīng),是提高負(fù)荷預(yù)測(cè)模度進(jìn)行修正來(lái)考慮積溫效應(yīng),本文直接在選取相似日時(shí)就將積溫效應(yīng)考慮在內(nèi)。借鑒文獻(xiàn)[12]中的思想并進(jìn)行改進(jìn),在相似度公式中加入權(quán)重系數(shù)使之適應(yīng)溫度因素對(duì)負(fù)荷變化的影響,本文用改進(jìn)的方法來(lái)計(jì)算溫度變化的動(dòng)態(tài)相似度。
用P0表示待測(cè)日及前k天的溫度變化情況,
P0={X0,X1,…,Xi} i=0,1,…,k。P1表示歷史日及前k天的溫度變化情況,P1={Y0,Y1,…,Yi}i=0,1,…,k,本文k取2,即考慮連續(xù)3天的溫度變化。X0和Xi分別表示待測(cè)日當(dāng)天和待測(cè)日前i天的溫度信息組成的序列,Xi=(xi(1),xi(2),…,xi(n))T,Y0和Yi分別表示選取的歷史某日和該日前i天的溫度信息序列,Yi=(yi(1),yi(2),…,yi(n))T。xi(k)和yi(j)分別表示待測(cè)日和歷史日第j個(gè)溫度信息的值,n為考慮的溫度信息數(shù)目,本文n取3,考慮最高溫度,最低溫度和平均溫度。對(duì)每個(gè)溫度信息分別計(jì)算相似度:
式中dj為第j個(gè)溫度信息的數(shù)值相似度,tk為第j個(gè)溫度信息的趨勢(shì)相似度。因日期類(lèi)型在其他影響因素中考慮,這里不再考慮。最后將n個(gè)溫度信息結(jié)合起來(lái)可以計(jì)算出總體動(dòng)態(tài)相似度:
式中ωj為第j個(gè)溫度信息的權(quán)重,該權(quán)重由該溫度信息與負(fù)荷的相關(guān)性得出。
1.2.2 計(jì)算其他負(fù)荷影響因素相似度
除去溫度因素外,其他影響因素的變化趨勢(shì)對(duì)負(fù)荷影響不大,所以將每日的影響因素放在一起計(jì)算相似度。x0和xi(i=1,…,N)分別為預(yù)測(cè)日和預(yù)測(cè)日前i天除溫度外的其他影響因素構(gòu)成的序列,除溫度外的影響因素本文選擇濕度,風(fēng)速,天氣狀況,日期類(lèi)型,xi=(xi(1),…,xi(m)),m為選取的其他因素個(gè)數(shù),本文用灰色關(guān)聯(lián)法計(jì)算其他影響因素的相似度。首先用下式計(jì)算x0與xi的灰色關(guān)聯(lián)系數(shù):
1.2.3 計(jì)算歷史日綜合相似度
本文用綜合相似度作為相似日的評(píng)判標(biāo)準(zhǔn)。因溫度的相似度與其他影響因素的相似度都對(duì)相似日選取有影響,但影響程度難以確定,所以本文采取文獻(xiàn)[13]中因子相乘的方法來(lái)求取綜合相似度。通過(guò)下式可以計(jì)算出歷史日與預(yù)測(cè)日的綜合相似度:
ηi為待測(cè)日前i天的綜合相似度,綜合相似度值越大,表明歷史日與待測(cè)日負(fù)荷狀況越接近,根據(jù)綜合相似度排序選取相似日。
徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)因其能夠逼近任意非線性函數(shù)的特點(diǎn),近年來(lái)在預(yù)測(cè)領(lǐng)域取得了廣泛應(yīng)用[14]。它一般由輸入層,隱含層,輸出層三層組成。其隱含層激活函數(shù)為關(guān)于中心點(diǎn)徑向?qū)ΨQ(chēng)衰減的徑向基函數(shù),所以具有局部逼近的特點(diǎn),即輸入信號(hào)只會(huì)激活少量神經(jīng)元,使網(wǎng)絡(luò)不容易陷入局部最優(yōu)解。RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
式中ck為激活函數(shù)中心,σ為擴(kuò)展常數(shù)。
網(wǎng)絡(luò)的輸出為:
RBF神經(jīng)網(wǎng)絡(luò)通常要確定三個(gè)參數(shù):網(wǎng)絡(luò)隱含層激活函數(shù)的中心,擴(kuò)展常數(shù)和隱含層到輸出層的連接權(quán)值。一般情況下,合理的隱含層參數(shù)選擇往往能提高網(wǎng)絡(luò)性能[15]。網(wǎng)絡(luò)隱含層參數(shù)初值的選取一般由聚類(lèi)來(lái)實(shí)現(xiàn),本文通過(guò)待測(cè)日的相似日來(lái)挑選訓(xùn)練樣本,樣本數(shù)據(jù)差距并不大,所以選用模糊c-means聚類(lèi)對(duì)樣本進(jìn)行聚類(lèi)。模糊c-means聚類(lèi)的初始中心的確定方法具有很大的隨機(jī)性,一旦確定的中心偏差較大,將大大影響聚類(lèi)效果。所以本文將樣本先利用減聚類(lèi)算法聚類(lèi),根據(jù)輸出結(jié)果設(shè)置模糊c-means聚類(lèi)的初始值再次聚類(lèi),這樣可以很大程度上避免c-means聚類(lèi)隨機(jī)選取初值對(duì)聚類(lèi)效果的影響。根據(jù)聚類(lèi)結(jié)果設(shè)置RBF隱含層參數(shù)可以提高模型的性能。
3.1.1 模糊c-means聚類(lèi)
模糊c-means聚類(lèi)是由Dunn[16]和Bezdek[17]提出的一種聚類(lèi)算法,通過(guò)計(jì)算每個(gè)樣本點(diǎn)的隸屬度實(shí)現(xiàn)對(duì)樣本數(shù)據(jù)的自動(dòng)分類(lèi)。它不是將樣本歸到一個(gè)特定的聚類(lèi),而是通過(guò)隸屬度來(lái)表現(xiàn)其屬于各聚類(lèi)的程度,隸屬度可以取[0,1]區(qū)間內(nèi)的任何一個(gè)數(shù)。模糊c-means聚類(lèi)原理如下[18]:
假設(shè)模糊c-means聚類(lèi)要將數(shù)據(jù)樣本集X={x1,x2,…,xn}劃分成c類(lèi)(2≤c≤n),V={v1,v2,…,vc},代表c個(gè)聚類(lèi)中心,那么整個(gè)數(shù)據(jù)樣本集的隸屬度矩陣U可以表示為:
為了提高聚類(lèi)效果,采用如下聚類(lèi)準(zhǔn)則:
式中:dik=||xk-vi||,為樣本xk與聚類(lèi)中心vi之間的距離;m為模糊加權(quán)指數(shù),通常取m=2;J(U,V)為樣本與所有聚類(lèi)中心距離的二次方再加權(quán)求和的值。
通過(guò)求取J(U,V)的極小值,就可以得到模糊c-means聚類(lèi)算法結(jié)果。
3.1.2 改進(jìn)模糊c-means聚類(lèi)
模糊c-means聚類(lèi)的初始聚類(lèi)參數(shù)對(duì)c-means聚類(lèi)效果影響很大,所以需要其他算法進(jìn)行優(yōu)化。而減聚類(lèi)算法可以有效反映出樣本數(shù)據(jù)的分布情況,但得到的聚類(lèi)中心是原數(shù)據(jù)中的點(diǎn),不能反映聚類(lèi)中心的真正含義,所以多數(shù)情況下被用來(lái)初始化一些對(duì)初值要求較高的算法[19]。所以本文用它來(lái)優(yōu)化模糊c-means聚類(lèi)算法的初值。具體步驟如下:
1)根據(jù)下式計(jì)算出所有數(shù)據(jù)樣本的密度值[20]:
2)從中挑選出最大密度值為Dck,將其所對(duì)應(yīng)的樣本xc1設(shè)為第一個(gè)聚類(lèi)中心,然后按照下式更新數(shù)據(jù)樣本密度值:
3)從更新后的數(shù)據(jù)中再次挑選出最大密度值為Dc2,將其對(duì)應(yīng)的樣本xc2設(shè)置為第二個(gè)聚類(lèi)中心,并用Dc2,xc2分別替換式(11)中的Dc1,xc1再次更新密度值,選擇下一個(gè)聚類(lèi)中心,當(dāng)滿(mǎn)足Dci≤εDc1(ε∈(0,1))時(shí),停止運(yùn)算,輸出聚類(lèi)中心,本文取ε=0.5。
4)根據(jù)輸出的聚類(lèi)中心設(shè)置類(lèi)別數(shù)c和初始聚類(lèi)中心V,模糊加權(quán)指數(shù)m,初始化隸屬度矩陣U0,迭代步數(shù)l=0。
5)修正U
6)對(duì)于設(shè)定的ε>0,判斷是否滿(mǎn)足max{|ulikuikl-1|}<ε,如果滿(mǎn)足,則跳到第(8)步,否則l=l+1,進(jìn)行第7)步。
7)修正聚類(lèi)中心V并返回第5)步。
8)輸出聚類(lèi)結(jié)果,并根據(jù)聚類(lèi)結(jié)果設(shè)置RBF神經(jīng)網(wǎng)絡(luò)隱含層激活函數(shù)中心。
隱含層神經(jīng)元的作用范圍由擴(kuò)展常數(shù)決定,擴(kuò)展常數(shù)越大,作用范圍越廣,為了避免隱含層神經(jīng)元作用范圍太大或太小,隱含層擴(kuò)展常數(shù)可以直接由下式求得:
式中l(wèi)為隱含層中心數(shù),cmax為隱含層中心之間的最大距離。
隱含層到輸出層的連接權(quán)值有很多方法可以得到,其中最小二乘法使用起來(lái)非常方便,快速,所以本文選用該方法確定連接權(quán)值,計(jì)算公式如下[21]:
式中xn為第n個(gè)輸入樣本,vc為第c個(gè)聚類(lèi)中心。
本文結(jié)合相似日和改進(jìn)的RBF神經(jīng)網(wǎng)絡(luò)模型進(jìn)行短期電力負(fù)荷預(yù)測(cè)。具體步驟如下:首先將負(fù)荷影響因素量化和歸一化,根據(jù)連續(xù)多日的溫度變化計(jì)算歷史日與待測(cè)日的溫度動(dòng)態(tài)相似度,然后再計(jì)算出其他影響因素的相似度,兩者結(jié)合計(jì)算歷史日綜合相似度并據(jù)此選取相似日,并根據(jù)選取的相似日確定RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本。在RBF神經(jīng)網(wǎng)絡(luò)隱含層參數(shù)初值的選取方面,運(yùn)用模糊c-means聚類(lèi)算法對(duì)相似日樣本進(jìn)行聚類(lèi),并用減聚類(lèi)來(lái)優(yōu)化模糊c-means聚類(lèi)的初值,最后根據(jù)聚類(lèi)結(jié)果設(shè)置RBF神經(jīng)網(wǎng)絡(luò)隱含層參數(shù)的初值并訓(xùn)練神經(jīng)網(wǎng)絡(luò),用訓(xùn)練好的RBF神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行負(fù)荷預(yù)測(cè)。流程圖如圖2所示。
圖2 基于相似日和RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型
為了驗(yàn)證本文方法的有效性,在河南省某地區(qū)2018年96點(diǎn)負(fù)荷數(shù)據(jù)和氣象數(shù)據(jù)中,選取3月~8月的數(shù)據(jù)作為樣本,對(duì)連續(xù)高溫的8月29日~8月31日進(jìn)行96點(diǎn)負(fù)荷預(yù)測(cè)。
相似日選取的數(shù)量對(duì)負(fù)荷預(yù)測(cè)的影響也非常大,選取數(shù)量過(guò)少,模型訓(xùn)練不充分,預(yù)測(cè)精度較低,選取數(shù)量過(guò)多,訓(xùn)練速度慢,區(qū)別度較低。本文通過(guò)對(duì)8月高溫日進(jìn)行實(shí)驗(yàn),得到了圖3的結(jié)果,所以決定選取20日相似日作為實(shí)驗(yàn)的訓(xùn)練樣本。
圖3 相似日選擇數(shù)量對(duì)預(yù)測(cè)誤差的影響
同時(shí)由于本文綜合相似度法中的溫度序列動(dòng)態(tài)相似度考慮的是連續(xù)3天的溫度信息,所以在選取相似日時(shí)樣本中前兩日自動(dòng)排除在外。作為對(duì)比,用灰色關(guān)聯(lián)法在同樣的樣本中選取相似日。將兩種方法選取的相似日負(fù)荷序列與待測(cè)日負(fù)荷序列各點(diǎn)方差的平均值進(jìn)行比較,對(duì)比結(jié)果如表2所示。
表2 相似日負(fù)荷與預(yù)測(cè)日負(fù)荷的各點(diǎn)方差平均值對(duì)比
通過(guò)表2對(duì)比可以看到,對(duì)于連續(xù)高溫日,綜合相似度法選取的相似日效果更好,其選擇的相似日負(fù)荷與待測(cè)日負(fù)荷各點(diǎn)方差的平均值更小,說(shuō)明選出的相似日與待測(cè)日負(fù)荷更接近。傳統(tǒng)灰色關(guān)聯(lián)法選出的相似日負(fù)荷與待測(cè)日負(fù)荷之間的各點(diǎn)方差平均值比較大,說(shuō)明該方法只能大致篩選出與待測(cè)日相似的歷史日,但是篩選效果沒(méi)有本文方法好。由此可見(jiàn),本文改進(jìn)的相似日選取方法與灰色關(guān)聯(lián)法相比能夠更加準(zhǔn)確的選擇高溫日的相似日。
根據(jù)選出的20個(gè)相似日及其前幾天的負(fù)荷數(shù)據(jù)選取RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本。本文預(yù)測(cè)模型輸入選擇為X={x1,x2,x3,x1,x2},其中xa為待測(cè)時(shí)刻前a個(gè)時(shí)刻的負(fù)荷數(shù)據(jù),a=1,2,3。xb為待測(cè)時(shí)刻前b天相同時(shí)刻的負(fù)荷數(shù)據(jù),b=1,2。輸出為待測(cè)點(diǎn)負(fù)荷數(shù)據(jù)。
5.2.1 實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)
平均絕對(duì)百分誤差(MAPE)可以用來(lái)評(píng)價(jià)模型的好壞,均方根誤差(RMSE)對(duì)一組結(jié)果中極大或極小的誤差反應(yīng)敏感,也可以反映出預(yù)測(cè)精度。在同一預(yù)測(cè)模型中,MAPE和RMSE的值越小,預(yù)測(cè)結(jié)果越精確[22]。所以本文用MAPE和RMSE來(lái)評(píng)價(jià)各模型的預(yù)測(cè)精度,其表達(dá)式如下:
5.2.2 預(yù)測(cè)結(jié)果分析
用另外2種預(yù)測(cè)模型作為本文預(yù)測(cè)模型的對(duì)比,對(duì)8月29日~8月31日負(fù)荷進(jìn)行預(yù)測(cè)。模型一:用灰色關(guān)聯(lián)法選取相似日,模糊c-means聚類(lèi)優(yōu)化RBF隱含層參數(shù);模型二:用綜合相似度法選取相似日,模糊c-means聚類(lèi)優(yōu)化RBF隱含層參數(shù);模型三:用綜合相似度法選取相似日,減聚類(lèi)與模糊c-means聚類(lèi)結(jié)合優(yōu)化RBF隱含層參數(shù)。預(yù)測(cè)結(jié)果如圖4~圖6所示。
圖4 8月29日預(yù)測(cè)結(jié)果對(duì)比
圖5 8月30日預(yù)測(cè)結(jié)果對(duì)比
圖6 8月31日預(yù)測(cè)結(jié)果對(duì)比
表3 三種模型預(yù)測(cè)結(jié)果比較
通過(guò)圖3~圖5可以看到,連續(xù)三天的高溫日,模型三得到的預(yù)測(cè)曲線與實(shí)際負(fù)荷曲線都更為接近,雖然模型一和模型二也均能預(yù)測(cè)出負(fù)荷曲線的變化趨勢(shì),但在一天的后半段預(yù)測(cè)誤差較大,整體預(yù)測(cè)精度不如模型三。通過(guò)表3的預(yù)測(cè)誤差對(duì)比可以清楚看到,對(duì)于預(yù)測(cè)的3天來(lái)說(shuō),模型二的MAPE和RMSE比模型一更小,說(shuō)明用綜合相似度法選取相似日比灰色關(guān)聯(lián)度法效果更好。同時(shí),模型三的MAPE和RMSE比模型二更小,說(shuō)明本文用減聚類(lèi)優(yōu)化c-means聚類(lèi)的初值可以獲得更優(yōu)的RBF隱含層參數(shù),從而使預(yù)測(cè)精度更高。由此可見(jiàn),本文提出的相似日選取方法和改進(jìn)的RBF神經(jīng)網(wǎng)絡(luò)算法可以提高短期負(fù)荷預(yù)測(cè)精度。
本文通過(guò)考慮積溫效應(yīng),將溫度影響因素與其他負(fù)荷影響因素分開(kāi)計(jì)算相似度,再根據(jù)綜合相似度選取相似日,在減少輸入樣本數(shù)目的同時(shí),也提高了樣本質(zhì)量。在RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型中,根據(jù)本文訓(xùn)練樣本特征和模糊c-means聚類(lèi)在初值選取方面的不足,利用減聚類(lèi)來(lái)優(yōu)化模糊c-means聚類(lèi)的初值,運(yùn)用模糊c-means聚類(lèi)選取網(wǎng)絡(luò)的隱含層參數(shù),提高了RBF預(yù)測(cè)模型的精度。最后根據(jù)實(shí)際負(fù)荷數(shù)據(jù)對(duì)河南某地區(qū)連續(xù)高溫日進(jìn)行預(yù)測(cè),結(jié)果表明本文方法可以提高短期負(fù)荷預(yù)測(cè)精度。