葛宇達(dá),沈杰,周揚(yáng),李大任,陳茂佳,甘澤鴻
(1.國(guó)網(wǎng)浙江省電力有限公司溫州市洞頭區(qū)供電公司,浙江 溫州325700; 2.國(guó)網(wǎng)浙江省電力有限公司溫州供電公司,浙江 溫州325028)
用電量短期精準(zhǔn)預(yù)測(cè)是電網(wǎng)調(diào)度進(jìn)行管理決策的有效數(shù)據(jù)支撐,是確保電網(wǎng)安全、平穩(wěn)運(yùn)行、糾正電力偏差以及避免能源浪費(fèi)的重要手段[1],實(shí)時(shí)負(fù)荷調(diào)度的控制方略以解決電網(wǎng)電量偏差問(wèn)題,其核心即是需要準(zhǔn)確掌握用戶的用電量信息,對(duì)用戶的用電量進(jìn)行準(zhǔn)確預(yù)測(cè)。用電量短時(shí)預(yù)測(cè)具有時(shí)效性強(qiáng)、精準(zhǔn)度高的要求[2],在此前提下采取何種措施實(shí)現(xiàn)用電量短時(shí)預(yù)測(cè)既是國(guó)家電網(wǎng)實(shí)現(xiàn)需求側(cè)管理需關(guān)注的重點(diǎn)問(wèn)題,也關(guān)系著國(guó)家電網(wǎng)的經(jīng)濟(jì)利益,對(duì)電網(wǎng)的持續(xù)發(fā)展具有重要意義[3-4]。
具有較強(qiáng)隨機(jī)性以及易受不確定性因素的影響是用戶短期用電量表現(xiàn)出的顯著特性,在對(duì)預(yù)測(cè)算法進(jìn)行選取時(shí)需充分考慮短期用電量的特性,最大程度降低其特性對(duì)用電量預(yù)測(cè)的影響,才能有效提升用電量預(yù)測(cè)效果。喬黎偉等人針對(duì)傳統(tǒng)用電量預(yù)測(cè)模型未能兼顧用電量各影響因素的問(wèn)題,提出利用互信息法對(duì)用電量影響因素進(jìn)行辨識(shí),再通過(guò)隨機(jī)森林法實(shí)現(xiàn)用電量預(yù)測(cè)模型的構(gòu)建,以此完成中短期用電量的預(yù)測(cè)。該方法雖能降低不同用戶模式對(duì)用電量預(yù)測(cè)質(zhì)量的影響,但該方法具有局限性,僅能有效提升聚類(lèi)中心周邊用戶的用電量預(yù)測(cè)效果[5];魏明奎等人提出利用最小二乘支持向量機(jī)(LSSVM)神經(jīng)網(wǎng)絡(luò)構(gòu)建電力負(fù)荷預(yù)測(cè)模型,并通過(guò)粒子群算法實(shí)現(xiàn)模型參數(shù)的尋優(yōu),以提升短期電力負(fù)荷預(yù)測(cè)準(zhǔn)確度,該方法確具有較好的預(yù)測(cè)性能,但受負(fù)荷時(shí)間序列關(guān)聯(lián)因素的影響,使得負(fù)荷預(yù)測(cè)結(jié)果大打折扣[6]。因此,本文結(jié)合前人研究經(jīng)驗(yàn),有效結(jié)合混沌理論,提出基于混沌-LSSVM神經(jīng)網(wǎng)絡(luò)的用電量短期精準(zhǔn)預(yù)測(cè)算法,通過(guò)對(duì)用電量混沌時(shí)間序列進(jìn)行相空間重構(gòu),以達(dá)到用電量各影響變量關(guān)系辨識(shí)的目的,利用LSSVM神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)用電量的短期預(yù)測(cè),并通過(guò)參數(shù)優(yōu)化提高用電量預(yù)測(cè)準(zhǔn)確度。
用電量原始數(shù)據(jù)是通過(guò)某一時(shí)間間隔采樣獲取的時(shí)間序列數(shù)據(jù),具有離散性特點(diǎn),且用電量與時(shí)間呈非線性改變特性?;诨煦缋碚?,混沌系統(tǒng)內(nèi)所有變量信息均可通過(guò)時(shí)間序列進(jìn)行反映[7],因此,本文通過(guò)重構(gòu)相空間實(shí)現(xiàn)用電量隱含信息的分析。對(duì)于混沌系統(tǒng)而言,將任意時(shí)間點(diǎn)的狀態(tài)稱(chēng)之為相,相空間是其狀態(tài)的決定因素。根據(jù)Taken定理得出,系統(tǒng)內(nèi)某一變量的改變與其決定因素的演化具有緊密關(guān)聯(lián)性,對(duì)于混沌相空間重構(gòu)問(wèn)題,{x(t);t=1,2,…,N}表示采樣獲得的任意用電量時(shí)間序列,其長(zhǎng)度表示為N,對(duì)其進(jìn)行相空間重構(gòu),可得到x(t)={x(t),x(t+μ),…,x(t+(m-1)μ)},t=1,2,…,M,M=N-(M-1),其軌跡可通過(guò)下式進(jìn)行描述:
X=[X1,X2,…,Xn]=
(1)
其中:對(duì)于相空間,其內(nèi)一點(diǎn)表示為Xi,嵌入維度表示為m,延遲時(shí)間表示為μ。
確定m、μ是相空間重構(gòu)的基礎(chǔ),由此可確保系統(tǒng)動(dòng)力學(xué)形態(tài)得以復(fù)原,同時(shí)在保證原始數(shù)據(jù)間關(guān)聯(lián)關(guān)系不變的情況下,避免發(fā)生信息、噪聲冗余問(wèn)題[8]。通過(guò)對(duì)時(shí)間序列進(jìn)行相空間重構(gòu),可有效獲取用電量的特征向量,確保用電量短期預(yù)測(cè)精度獲得大幅提升。
(1)計(jì)算延遲時(shí)間
在對(duì)用電量時(shí)間序列數(shù)據(jù)進(jìn)行相空間重構(gòu)時(shí),其中一個(gè)主要參數(shù)即為延遲時(shí)間,其值的選擇至關(guān)重要。當(dāng)μ過(guò)小,相空間軌跡將集聚于某一位置處,此時(shí)難于獲取到完整信息,從而生成冗余誤差;當(dāng)μ過(guò)大,將使得臨近時(shí)刻的動(dòng)力學(xué)性態(tài)發(fā)生巨大改變,造成系統(tǒng)內(nèi)信號(hào)嚴(yán)重失真,生成不相關(guān)誤差。本文采用互信息法完成μ的確定,即獲取互信息函數(shù)的首個(gè)最小值。
{x(t),y(t)}表示兩組信號(hào),設(shè)定y(t)=x(t+μ),t=1,2,…N,通過(guò)已知的x(t)的實(shí)測(cè)值對(duì)y(t)的信息量均值進(jìn)行預(yù)估,公式描述為:
I(x,y)=H(x)+H(y)-H(x,y)
(2)
(3)
(4)
式中:對(duì)于信號(hào)x(t),其熵表示為H(x),用于描述測(cè)量N個(gè)x(i)獲得的信息量均值。對(duì)由變量構(gòu)成的樣本空間進(jìn)行網(wǎng)格劃分,得到數(shù)個(gè)網(wǎng)格,分別計(jì)算各網(wǎng)格所含點(diǎn)數(shù)確定各變量的概率值,分別表示為Pxy[x(i),y(j)]、Px[x(i)]、Py[y(j)]。
(2)嵌入維數(shù)的計(jì)算
在對(duì)用電量時(shí)間序列進(jìn)行相空間重構(gòu)時(shí),需確定的另一主要參數(shù)即為嵌入維數(shù)。本文利用Cao方法實(shí)現(xiàn)最近嵌入維數(shù)的確定,具體過(guò)程為:
{x(t);t=1,2,…,n}表示用電量時(shí)間序列,其長(zhǎng)度為n,分別對(duì)其m維、m+1維相空間進(jìn)行重構(gòu),對(duì)于m+1維相空間,其第i個(gè)相點(diǎn)表示為Xi(m+1),同理,對(duì)于m相空間,其第i個(gè)相點(diǎn)表示為Xi(m),Xj(m)(j=1,2,…k)為其最近鄰域點(diǎn),歐式距離表示為‖·‖,則有:
(5)
計(jì)算公式(5)的平均值,表示為E(m),其公式描述為:
(6)
時(shí)間序列由m維至m+1維相空間演化,其變化用下式進(jìn)行描述:
(7)
在相空間軌跡上,當(dāng)m不斷增大,E1(m)的變化量越來(lái)越小,逐漸趨于穩(wěn)定,由此可確定嵌入維數(shù)的最優(yōu)值為m+1。
支持向量機(jī)(SVM)的基本原理是采用非線性映射實(shí)現(xiàn)輸入數(shù)據(jù)向高維空間轉(zhuǎn)換,將其轉(zhuǎn)變?yōu)椴坏仁郊s束的二分類(lèi)問(wèn)題[9],與SVM相比,LSSVM的差異之處為L(zhǎng)SSVM是通過(guò)等式約束,以誤差平方和作為評(píng)價(jià)損失風(fēng)險(xiǎn),并通過(guò)線性矩陣計(jì)算方式實(shí)現(xiàn)實(shí)際問(wèn)題的求解。LSSVM的基本原理是:
y=f(x)=Gφ(x)+b
(8)
式中:慣性權(quán)重因子表示為G,偏差表示為b,以最低結(jié)構(gòu)風(fēng)險(xiǎn)作為目標(biāo)函數(shù)實(shí)現(xiàn)LSSVM的線性回歸[10],其公式描述為:
(9)
s.t.yi=GTφ(x)+b+δi
(10)
i=1,2,…,h
式中:正則化參數(shù)表示為λ,是對(duì)回歸函數(shù)經(jīng)驗(yàn)項(xiàng)重要程度的描述,經(jīng)驗(yàn)風(fēng)險(xiǎn)隨著該值的增大而減小,當(dāng)經(jīng)驗(yàn)風(fēng)險(xiǎn)值較低時(shí),回歸函數(shù)具有較低的泛化性能[11];松弛系數(shù)表示為δi,引入拉格朗日函數(shù)后,可將公式(9)描述為:
(11)
式中:拉格朗日乘子表示為ai,基于KKT條件可得:
(12)
對(duì)G、δi進(jìn)行消除后,可得到公式(10)的解,其公式描述為:
(13)
(14)
基于Mercer條件的核函數(shù)表示為K,其公式表示為:
K(xi,xj)=φ(xi)Tφ(xj)
(15)
由此可確定LSSVM的回歸函數(shù),其公式描述為:
(16)
K(x,xi)為非線性函數(shù),可實(shí)現(xiàn)樣本數(shù)據(jù)的高維空間映射。本文選用的核函數(shù)為徑向基函數(shù),其公式描述為:
(17)
式中:其寬度表示為σ。
通過(guò)對(duì)用電量混沌時(shí)間序列數(shù)據(jù)進(jìn)行相空間重構(gòu),獲取其特征向量,將其輸入到LSSVM神經(jīng)網(wǎng)絡(luò)中構(gòu)建用電量短期預(yù)測(cè)模型,實(shí)現(xiàn)用電量短期預(yù)測(cè)。由于參數(shù)λ、σ的取值對(duì)LSSVM神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)性能起決定性作用m、μ參數(shù)對(duì)相空間重構(gòu)具有重要影響,因此,需對(duì)以上參數(shù)進(jìn)行優(yōu)化,確保用電量預(yù)測(cè)模型具有較好的預(yù)測(cè)效果。
m、μ、λ、σ是基于混沌-LSSVM的用電量預(yù)測(cè)模型的四個(gè)重要參數(shù),各參數(shù)取值直接決定了該用電量預(yù)測(cè)模型的預(yù)測(cè)精度[12-13],因此,本文采用差分進(jìn)化算法對(duì)其進(jìn)行尋優(yōu),將適應(yīng)度函數(shù)作為目標(biāo)函數(shù),在不斷迭代運(yùn)算中通過(guò)確定其最小值實(shí)現(xiàn)用電量預(yù)測(cè)模型參數(shù)組合(m、μ、λ、σ)的優(yōu)化?;诓罘诌M(jìn)化的(m、μ、λ、σ)參數(shù)組合尋優(yōu)的基本原理是在定義域內(nèi)獲取一組(m、μ、λ、σ)參數(shù)組合序列,將其視為DE算法的初始個(gè)體,利用此組參數(shù)對(duì)用電量預(yù)測(cè)模型進(jìn)行訓(xùn)練,先計(jì)算模型預(yù)測(cè)均方差MSE值,再對(duì)各個(gè)體適應(yīng)度值進(jìn)行求解,在執(zhí)行交叉、變異、選擇過(guò)程中獲取DE算法的子代種群,繼續(xù)循環(huán)迭代,直至符合算法終止條件,由此實(shí)現(xiàn)參數(shù)組合(m、μ、λ、σ)的尋優(yōu),以最佳m、μ、λ、σ參數(shù)訓(xùn)練用電量預(yù)測(cè)模型,實(shí)現(xiàn)用電量的短期精準(zhǔn)預(yù)測(cè)。通過(guò)下式對(duì)其適應(yīng)度函數(shù)進(jìn)行運(yùn)算,公式描述為:
(18)
(19)
第一步:對(duì)參數(shù)進(jìn)行設(shè)定,初始迭代次數(shù)t=0。
第二步:以混合編碼方式對(duì)參數(shù)m、μ、λ、σ作編碼處理,對(duì)m、μ作二進(jìn)制編碼,λ、σ為實(shí)數(shù)編碼,通過(guò)混沌序列獲得DE算法的初始種群。
第三步:通過(guò)對(duì)個(gè)體進(jìn)行解碼獲得實(shí)際參數(shù),通過(guò)參數(shù)m、μ的確定實(shí)現(xiàn)用電量混沌時(shí)間序列的重構(gòu),通過(guò)λ、σ參數(shù)訓(xùn)練LSSVM,對(duì)各組參數(shù)下的用電量預(yù)測(cè)準(zhǔn)確度進(jìn)行登記,并對(duì)所有個(gè)體的適應(yīng)度值進(jìn)行求解。
第四步:通過(guò)交叉、變異、選擇獲得子代種群,t=t+1。
第五步:對(duì)DE算法的停止迭代條件進(jìn)行判定,當(dāng)符合停止迭代條件,則轉(zhuǎn)入下一步,反之,退回步驟三。
第六步:獲得最佳參數(shù)m、μ、λ、σ。
第七步:以m、μ參數(shù)實(shí)現(xiàn)用電量混沌時(shí)間序列的重構(gòu),通過(guò)λ、σ實(shí)現(xiàn)LSSVM的訓(xùn)練,獲得用電量短期精準(zhǔn)預(yù)測(cè)結(jié)果。
本文通過(guò)構(gòu)建的參數(shù)優(yōu)化后的混沌-LSSVM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型實(shí)現(xiàn)用電量的短期預(yù)測(cè),其流程如圖1所示。
圖1 用電量短期預(yù)測(cè)流程Fig. 1 Short term forecasting process of power consumption
用電量短期預(yù)測(cè)的具體流程為:
第一步:獲取全面、完整的用電量歷史數(shù)據(jù),選取預(yù)測(cè)日前一天的相同時(shí)段用電量數(shù)據(jù)作為混沌-LSSVM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的輸入變量。
第二步:對(duì)歷史用電量數(shù)據(jù)進(jìn)行預(yù)處理[14],通過(guò)補(bǔ)充、更正操作解決歷史用電量數(shù)據(jù)存在遺漏、異常的情況。
第三步:對(duì)用電量歷史數(shù)據(jù)進(jìn)行混沌時(shí)間序列重構(gòu),獲取用電量特征變量,將其輸入到LSSVM神經(jīng)網(wǎng)絡(luò)中,實(shí)現(xiàn)用電量短期預(yù)測(cè)模型的構(gòu)建。
第四步:采用差分進(jìn)化算法對(duì)混沌-LSSVM用電量短期預(yù)測(cè)模型的參數(shù)進(jìn)行尋優(yōu),以確定最適合的參數(shù)組合。
第五步:利用最佳參數(shù)組合訓(xùn)練混沌-LSSVM用電量短期預(yù)測(cè)模型,獲取用電量短期預(yù)測(cè)值。
第六步:判斷用電量預(yù)測(cè)值是否符合最小誤差條件[15-30],若滿足條件,則將用電量預(yù)測(cè)結(jié)果輸出;否則,退回到步驟四繼續(xù)尋優(yōu),直至滿足誤差條件為止。
以某地區(qū)歷史用電量數(shù)據(jù)作為研究對(duì)象,將本文算法應(yīng)用于該地區(qū)用電量短期預(yù)測(cè)中,分析本文算法的預(yù)測(cè)性能。利用設(shè)置于電能表上的傳感器采集某地區(qū)2021年3月用電量數(shù)據(jù),數(shù)據(jù)采集時(shí)間間隔為3分鐘,構(gòu)建歷史用電量數(shù)據(jù)集,其中包括14880個(gè)計(jì)數(shù)點(diǎn)的用電量數(shù)據(jù),將最后一天的480個(gè)計(jì)數(shù)點(diǎn)的歷史用電量數(shù)據(jù)作為預(yù)測(cè)樣本,其余全部為訓(xùn)練樣本。
應(yīng)用本文算法對(duì)歷史用電量數(shù)據(jù)集時(shí)間序列數(shù)據(jù)進(jìn)行相空間重構(gòu),通過(guò)對(duì)不同時(shí)間延遲時(shí)間μ下的互信息量變化情況進(jìn)行分析,實(shí)現(xiàn)延遲時(shí)間的確定,實(shí)驗(yàn)結(jié)果如圖2所示。
圖2 不同時(shí)間延遲下的互信息量分析Fig.2 Analysis of mutual information under different time delays
分析圖2可知,隨著時(shí)間延遲的不斷增大,互信息量開(kāi)始呈現(xiàn)不斷波動(dòng)趨勢(shì),當(dāng)延遲時(shí)間超過(guò)10s后,曲線慢慢趨于平穩(wěn),本文將互信息函數(shù)的首個(gè)最小值點(diǎn)對(duì)應(yīng)的時(shí)間點(diǎn)作為延遲時(shí)間,因此可確定延遲時(shí)間為μ=8s。
在確定μ后,采用本文算法對(duì)相空間重構(gòu)的嵌入維數(shù)進(jìn)行確定,實(shí)驗(yàn)結(jié)果如圖3所示。
圖3 嵌入維數(shù)分析Fig.3 Embedded dimension analysis
分析圖3可知,隨著嵌入維數(shù)m的不斷增加,E1(m)的值呈不斷增大趨勢(shì),當(dāng)m=7時(shí),曲線走勢(shì)趨于平緩,由此可確定嵌入維數(shù)為8。
設(shè)計(jì)三種用電量短期預(yù)測(cè)方案,具體內(nèi)容為:
方案一:僅利用LSSVM神經(jīng)網(wǎng)絡(luò)對(duì)測(cè)試樣本數(shù)據(jù)集進(jìn)行預(yù)測(cè);
方案二:在確定延遲時(shí)間為8,嵌入維數(shù)為8的前提下,采用LSSVM神經(jīng)網(wǎng)絡(luò)對(duì)測(cè)試樣本進(jìn)行用電量預(yù)測(cè);
方案三:對(duì)參數(shù)組合m、μ、λ、σ進(jìn)行優(yōu)化,再利用優(yōu)化后的混沌-LSSVM用電量預(yù)測(cè)模型(即本文算法)預(yù)測(cè)用電量。
分別應(yīng)用三種方案對(duì)測(cè)試樣本集用電量數(shù)據(jù)進(jìn)行短期用電量預(yù)測(cè),通過(guò)平均絕對(duì)百分誤差(MAPE)、平均絕對(duì)誤差(MAE)指標(biāo)分析三種方案的預(yù)測(cè)性能,實(shí)驗(yàn)結(jié)果如表1所示。
表1 三種方案的預(yù)測(cè)性能分析Tab.1 Prediction performance analysis of three schemes
分析表1可知,分別應(yīng)用三種預(yù)測(cè)方案對(duì)用電量進(jìn)行短期預(yù)測(cè),MAPE、MAE指標(biāo)值具有較大的差別,當(dāng)采用方案一實(shí)現(xiàn)用電量短期預(yù)測(cè)時(shí),二指標(biāo)值均最大,高于其他方案,方案三的二指標(biāo)值最小。實(shí)驗(yàn)表明,采用本文算法對(duì)各參數(shù)進(jìn)行尋優(yōu)后,可有效降低MAPE、MAE,提高用電量短期預(yù)測(cè)準(zhǔn)確度。
采用本文算法對(duì)測(cè)試數(shù)據(jù)集不同計(jì)數(shù)點(diǎn)的用電量進(jìn)行預(yù)測(cè),因篇幅有限,僅給出該區(qū)域當(dāng)日部分時(shí)刻的用電量預(yù)測(cè)結(jié)果,驗(yàn)證本文算法的預(yù)測(cè)能力,實(shí)驗(yàn)結(jié)果如表2所示。
表2 某區(qū)域用電量預(yù)測(cè)結(jié)果分析Tab.2 Analysis of power consumption prediction results in a certain area
分析表2可知,本文算法可實(shí)現(xiàn)用電量的短時(shí)預(yù)測(cè),且預(yù)測(cè)值與實(shí)際值存在較小差異,根據(jù)本文算法預(yù)測(cè)結(jié)果可有效衡量出該區(qū)域當(dāng)日用電情況,在11∶30左右以及17∶00左右為用電量高峰期,供電部門(mén)可依據(jù)本文算法預(yù)測(cè)結(jié)果進(jìn)行合理用電調(diào)度。實(shí)驗(yàn)結(jié)果表明,本文算法可有效提升用電量預(yù)測(cè)準(zhǔn)確度,具有一定的應(yīng)用性能。
獲取某區(qū)域2021年3月用電量數(shù)據(jù)建立歷史用電量數(shù)據(jù)集,以此作為實(shí)驗(yàn)對(duì)象,將本文算法應(yīng)用于用電量短期預(yù)測(cè)中,利用前30天用電量數(shù)據(jù)訓(xùn)練預(yù)測(cè)模型,將最后一天用電量數(shù)據(jù)作為測(cè)試數(shù)據(jù),實(shí)現(xiàn)用電量的預(yù)測(cè),驗(yàn)證本文方法的預(yù)測(cè)性能。實(shí)驗(yàn)結(jié)果表明:
(1)應(yīng)用本文算法實(shí)現(xiàn)用電量短期預(yù)測(cè),具有最低MAPE、MAE值。
(2)用電量預(yù)測(cè)結(jié)果與實(shí)際值誤差較小。