蘇 娟,方 舒,劉 博,杜松懷※,單葆國(guó),高 天
(1.中國(guó)農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院,北京 100083;2.國(guó)網(wǎng)北京市電力公司朝陽(yáng)供電公司,北京 100124;3.國(guó)網(wǎng)能源研究院有限公司,北京 102209)
短期負(fù)荷預(yù)測(cè)在電力系統(tǒng)的日運(yùn)行調(diào)度工作中具有舉足輕重的作用,可以有效協(xié)調(diào)發(fā)電、輸電、配電、用電的關(guān)系[1],對(duì)高比例可再生能源滲透下的電源靈活調(diào)節(jié)、電網(wǎng)高效聯(lián)通、用戶(hù)廣泛響應(yīng)的電力市場(chǎng)建設(shè)具有重要意義[2-3]。隨著市場(chǎng)交易規(guī)模持續(xù)擴(kuò)大,電力交易方式不斷更新,清潔能源將廣泛參與電力市場(chǎng)交易,電力負(fù)荷分析預(yù)測(cè)面臨新挑戰(zhàn)。
隨著電力系統(tǒng)對(duì)負(fù)荷預(yù)測(cè)精度的要求越來(lái)越高,人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等機(jī)器學(xué)習(xí)方法因具有較強(qiáng)的學(xué)習(xí)和模擬能力,預(yù)測(cè)效果好等優(yōu)點(diǎn),得到廣泛使用。最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)在支持向量機(jī)(Support Vector Machine,SVM)的基礎(chǔ)上進(jìn)行了改進(jìn),用平方差損失函數(shù)代替不敏感損失函數(shù),將SVM的不等式約束變?yōu)榈仁郊s束,采用最小二乘線(xiàn)性系統(tǒng)作為模型的損失函數(shù),待選參數(shù)少,簡(jiǎn)化了計(jì)算過(guò)程,提高了運(yùn)算速度[4],更適用于短期負(fù)荷預(yù)測(cè)。
對(duì)于波動(dòng)性較強(qiáng)的負(fù)荷序列,單一的預(yù)測(cè)方法難以達(dá)到較高預(yù)測(cè)精度,組合預(yù)測(cè)方法得到廣泛應(yīng)用。對(duì)原始負(fù)荷序列進(jìn)行分解,可以實(shí)現(xiàn)平穩(wěn)序列和非平穩(wěn)序列的分離[5],降低預(yù)測(cè)過(guò)程中的干擾。國(guó)內(nèi)外學(xué)者在基于負(fù)荷序列分解的短期負(fù)荷預(yù)測(cè)領(lǐng)域已開(kāi)展了大量研究。文獻(xiàn)[6]利用經(jīng)驗(yàn)?zāi)B(tài)分解將負(fù)荷序列分解為多個(gè)獨(dú)立的模態(tài)分量,利用多個(gè)指標(biāo)分析各分量與影響因素的相關(guān)關(guān)系,總結(jié)構(gòu)成各分量的不同負(fù)荷成分,使負(fù)荷特性分析更加深入細(xì)化;文獻(xiàn)[7]采用經(jīng)驗(yàn)?zāi)B(tài)分解的方法將負(fù)荷時(shí)間序列分解為頻率成分不同的本征模態(tài)函數(shù)分量,然后利用LSSVM對(duì)各分量進(jìn)行建模預(yù)測(cè),將分量預(yù)測(cè)值疊加后得到最終的負(fù)荷預(yù)測(cè)值。但經(jīng)驗(yàn)?zāi)B(tài)分解法難以避免模態(tài)混疊現(xiàn)象產(chǎn)生,分解得到虛假的本征模態(tài)函數(shù),在預(yù)測(cè)時(shí)產(chǎn)生不利的影響。文獻(xiàn)[8]利用小波分解算法對(duì)負(fù)荷曲線(xiàn)進(jìn)行分解,對(duì)所分解出負(fù)荷中幅值較大的部分建立時(shí)間序列預(yù)測(cè)模型,對(duì)幅值較小的部分建立基于氣象影響的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,實(shí)例證明該方法可有效提升預(yù)測(cè)精度。但小波基函數(shù)和分解尺度主要受人為主觀的影響,基本靠先前經(jīng)驗(yàn)去選擇,無(wú)法保證所選小波基函數(shù)和分解尺度對(duì)于當(dāng)前負(fù)荷序列的合理性。文獻(xiàn)[9]利用變分模態(tài)分解方法進(jìn)行負(fù)荷序列分解,采用互信息理論量化影響因素與各負(fù)荷分量的相關(guān)度,最后利用深度信念網(wǎng)絡(luò)對(duì)每個(gè)分量建立預(yù)測(cè)模型,可提升預(yù)測(cè)精度。變分模態(tài)分解將數(shù)據(jù)分解為特征互異的本征模態(tài)函數(shù),減輕了模態(tài)混疊現(xiàn)象發(fā)生,有利于信號(hào)的進(jìn)一步分析。
在負(fù)荷預(yù)測(cè)過(guò)程中,LSSVM中懲罰系數(shù)和核函數(shù)寬度基于經(jīng)驗(yàn)選取,易增大預(yù)測(cè)誤差。因此,需要考慮利用人工智能算法對(duì)預(yù)測(cè)模型進(jìn)行參數(shù)優(yōu)化。文獻(xiàn)[10]利用布谷鳥(niǎo)搜索算法優(yōu)化支持向量機(jī),但布谷鳥(niǎo)搜索算法搜索速度慢;文獻(xiàn)[11]利用粒子群的全局搜索能力克服了LSSVM 在選參時(shí)的不足;文獻(xiàn)[12]采用粒子群算法對(duì)LSSVM的模型參數(shù)進(jìn)行尋優(yōu),實(shí)現(xiàn)LSSVM參數(shù)的自動(dòng)優(yōu)化選取,單一的 LSSVM 很難做到準(zhǔn)確地預(yù)測(cè)短期負(fù)荷;文獻(xiàn)[13]采用LSSVM模型提高了SVM模型的學(xué)習(xí)能力和泛化能力,采用基于雙種群的粒子群算法尋求混合核函數(shù)LSSVM模型的最優(yōu)參數(shù),結(jié)果表明預(yù)測(cè)精度明顯提高。
本文提出了一種基于模態(tài)組合的短期負(fù)荷預(yù)測(cè)方法。首先,從真實(shí)性、獨(dú)立性、有效性 3個(gè)方面,分別針對(duì)時(shí)域和頻域的不同特點(diǎn),提出了負(fù)荷序列和影響因素序列分解評(píng)價(jià)方法,并以評(píng)價(jià)指標(biāo)最優(yōu)為目標(biāo)函數(shù),利用粒子群優(yōu)化算法優(yōu)化變分模態(tài)分解參數(shù);然后,以負(fù)荷的組合模態(tài)與待分析因素的相關(guān)性特征值最大為目標(biāo)函數(shù),通過(guò)遍歷所有模態(tài)組合,尋找最優(yōu)方案,將與負(fù)荷頻域特性相似的影響因素模態(tài)序列進(jìn)行組合,實(shí)現(xiàn)了影響因素的拓展;最后,將模態(tài)組合方法拓展出的影響因素變量作為粒子群優(yōu)化最小二乘支持向量機(jī)(PSO-LSSVM)預(yù)測(cè)模型的輸入變量,采用 2種預(yù)測(cè)組合策略進(jìn)行短期負(fù)荷預(yù)測(cè),并利用算例驗(yàn)證所提預(yù)測(cè)方法的有效性。
在信號(hào)分解領(lǐng)域,變分模態(tài)分解(Variational Mode Decomposition,VMD)是目前應(yīng)用較為廣泛的方法之一[14]。相比于其他常規(guī)信號(hào)分解方法,VMD解決信號(hào)混疊問(wèn)題的性能卓越。但目前對(duì)于VMD參數(shù)優(yōu)化的研究存在優(yōu)化維度不全面、優(yōu)化方向不明確、優(yōu)化方法過(guò)于主觀等不足,無(wú)法滿(mǎn)足高精度的負(fù)荷預(yù)測(cè)要求,需要進(jìn)一步的深入研究。因此,本文提出一種基于評(píng)價(jià)指標(biāo)優(yōu)化的改進(jìn)VMD方法。
VMD整體框架為變分問(wèn)題,以Wiener濾波、Hilbert變換、頻率混合[15]為基礎(chǔ),可有效解決遞歸式分解方式所造成的包絡(luò)線(xiàn)估計(jì)誤差不斷累積的問(wèn)題[16]。VMD方法[17-18]通過(guò)尋求指定個(gè)數(shù)的本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF),使各模態(tài)的估計(jì)帶寬之和最小來(lái)構(gòu)造變分問(wèn)題,同時(shí),利用交替方向乘子法更新模態(tài)的中心頻率,對(duì)變分問(wèn)題進(jìn)行求解。
本征模態(tài)函數(shù)為一個(gè)調(diào)幅-調(diào)頻信號(hào),IMF的表達(dá)式為
式中Ak(t)為uk(t)的瞬時(shí)幅值,V;φk(t)為相位非遞減函數(shù),ωk(t)為uk(t)的瞬時(shí)頻率,Hz。Ak(t)及ωk(t)相對(duì) 于φk(t)是 緩 變 的 , 即 在[t-δ,t+δ]( 其 中δ=2π //(t))的時(shí)間間隔內(nèi),u(t)可以看做是一個(gè)幅k值為Ak(t)、頻率為ωk(t)的諧波信號(hào)。
目前在負(fù)荷預(yù)測(cè)領(lǐng)域?qū)π盘?hào)分解質(zhì)量的評(píng)價(jià)指標(biāo)主要集中在時(shí)域?qū)用?,然而頻域中體現(xiàn)出的信號(hào)分解效果同樣重要。因此,本文綜合考慮時(shí)域、頻域 2個(gè)維度在信號(hào)分解評(píng)價(jià)中的突出特點(diǎn),量化描述 2個(gè)維度在信號(hào)分解真實(shí)性、獨(dú)立性、有效性 3個(gè)方面的影響程度,建立改進(jìn)的信號(hào)分解評(píng)價(jià)指標(biāo)。
1.2.1 真實(shí)性檢驗(yàn)
對(duì)信號(hào)分解的真實(shí)性檢驗(yàn)包括冗余分量檢驗(yàn)與殘差分量檢驗(yàn)2部分,若某信號(hào)分解方法同時(shí)通過(guò)上述2個(gè)檢驗(yàn),則認(rèn)為此分解方法信號(hào)分解通過(guò)真實(shí)性檢驗(yàn),可以進(jìn)行后續(xù)評(píng)價(jià)指標(biāo)的計(jì)算;若只通過(guò) 1種檢驗(yàn)或是 2種檢驗(yàn)均未通過(guò),則該方法不滿(mǎn)足真實(shí)性檢驗(yàn)的要求,說(shuō)明其信號(hào)分解效果差,不宜采取。
1)冗余分量的真實(shí)性檢驗(yàn)。
冗余分量真實(shí)性檢驗(yàn)針對(duì)時(shí)域分解信號(hào)進(jìn)行評(píng)價(jià),采用分量信號(hào)與原始信號(hào)的皮爾遜相關(guān)系數(shù)[19]與真實(shí)性閾值的對(duì)比,公式如下:
式中{x1,x2,...xn}、{y1,y2,...yn}為2組長(zhǎng)度為n的數(shù)據(jù)序列,、分別為2組數(shù)據(jù)序列的平均值。
冗余分量真實(shí)性檢驗(yàn)通過(guò)的條件為 ?fi,ρ(fi,fo)>rre。其中fo為原始信號(hào),fi, (i= 1 ,2,...,K)為分解出的分量信號(hào),K為分量信號(hào)總數(shù),ρ(fi,fo)為分量信號(hào)fi與原始信號(hào)fo的皮爾遜相關(guān)系數(shù),rre為相關(guān)性閾值。
2)殘差分量的真實(shí)性檢驗(yàn)
殘差分量的真實(shí)性檢驗(yàn)的定義是殘差分量與原始信號(hào)數(shù)據(jù)序列的二范數(shù)比例衡量信號(hào)的能量占比。本文從頻域來(lái)評(píng)價(jià)分解信號(hào)的真實(shí)性,利用殘差頻譜中幅值顯著的頻段在原始信號(hào)頻段中的比例衡量殘差分量的頻譜特性。殘差分量真實(shí)性檢驗(yàn)通過(guò)的條件為。其中fe為殘差分量,n o rm (fe)為殘差分量數(shù)據(jù)序列的二范數(shù), n orm(fo)為原始信號(hào)數(shù)據(jù)序列的二范數(shù),ren為能量占比閾值;lo為原始信號(hào)的顯著頻譜長(zhǎng)度,ler為殘差頻譜中的顯著頻段長(zhǎng)度,rfr為殘差頻段占比閾值。
1.2.2 獨(dú)立性評(píng)價(jià)指標(biāo)
每一個(gè)信號(hào)分量分別對(duì)應(yīng)原始信號(hào)中某一獨(dú)特的特征信息,相互獨(dú)立的信號(hào)分量之間信息交叉少,可提供較為純粹的特征信息,因此信號(hào)分量的獨(dú)立性是評(píng)價(jià)信號(hào)分解質(zhì)量的重要參考依據(jù)。本文利用信號(hào)分量?jī)蓛芍g的平均皮爾遜相關(guān)系數(shù)I1和顯著頻段平均重疊度I2這2個(gè)指標(biāo),在時(shí)域和頻域2個(gè)維度對(duì)信號(hào)分解的獨(dú)立性進(jìn)行評(píng)價(jià)。平均皮爾遜相關(guān)系數(shù)I1計(jì)算公式如下:
顯著頻段平均重疊度I2的計(jì)算公式如下:
式中=lij/(li+lj), (i,j∈ 1 ,2,...,K;i≠j),代表分量信號(hào)fi與fj的顯著頻段重疊度,li、lj分別為fi與fj的顯著頻段長(zhǎng)度,lij為fi與fj重疊的顯著頻段長(zhǎng)度。I2的數(shù)值越小,信號(hào)分解方法的頻域獨(dú)立性表現(xiàn)越好。
1.2.3 有效性指標(biāo)檢驗(yàn)
有效性評(píng)價(jià)指標(biāo)用于評(píng)價(jià)分解出的各分量信號(hào)所攜帶有效信息的質(zhì)量。高質(zhì)量的分量信息攜帶原始信號(hào)中較多且集中的特征信息,其在時(shí)域中體現(xiàn)出與原始信號(hào)的相關(guān)性更強(qiáng),因此,采用各信號(hào)分量與原始信號(hào)的平均皮爾遜相關(guān)系數(shù)I3來(lái)衡量有效性的時(shí)域特性,公式如下:
同時(shí),高質(zhì)量的信號(hào)分量在頻域中體現(xiàn)出頻譜更為密集的特點(diǎn),采用分量信號(hào)顯著頻段的平均集中度指標(biāo)I4對(duì)其進(jìn)行量化:
式中l(wèi)f為信號(hào)的頻域長(zhǎng)度,lsec為第一個(gè)顯著頻率與最后一個(gè)顯著頻率之間的頻段長(zhǎng)度。I4的數(shù)值越小,信號(hào)分解方法的頻域有效性表現(xiàn)越好。
1.2.4 綜合評(píng)價(jià)指標(biāo)
針對(duì)獨(dú)立性評(píng)價(jià)的時(shí)域、頻域指標(biāo)以及有效性評(píng)價(jià)的頻域指標(biāo),指標(biāo)數(shù)值越小,特性表現(xiàn)越好。但有效性評(píng)價(jià)的時(shí)域指標(biāo)I3卻表現(xiàn)出相反的性能,為了統(tǒng)一指標(biāo)的性能方向,在綜合評(píng)價(jià)指標(biāo)中對(duì)I3進(jìn)行反向處理,采用=1-I3作為新的有效性評(píng)價(jià)時(shí)域指標(biāo),使4個(gè)指標(biāo)的性能方向一致,且4個(gè)指標(biāo)的取值范圍均在0~1之間,不存在數(shù)據(jù)量級(jí)不統(tǒng)一帶來(lái)的數(shù)據(jù)遮蔽問(wèn)題。綜合評(píng)價(jià)指標(biāo)Ic由這4個(gè)指標(biāo)相加得到,公式如下:
綜合評(píng)價(jià)指標(biāo)的數(shù)值越小,信號(hào)分解效果越好。需要注意的是,綜合評(píng)價(jià)指標(biāo)的使用前提為通過(guò)真實(shí)性檢驗(yàn)。
VMD方法中涉及的參數(shù)有4個(gè),分別為模態(tài)分解總數(shù)K,二次項(xiàng)懲罰因子α、拉格朗日乘子保真度τ和判別精度e[20]。其中判別精度參數(shù)對(duì)分解結(jié)果的影響較小。另外 3個(gè)參數(shù)對(duì)信號(hào)分解的效果影響較大,需要對(duì)其進(jìn)行優(yōu)化。本文以信號(hào)分解的綜合評(píng)價(jià)指標(biāo)為目標(biāo)函數(shù),利用粒子群優(yōu)化算法對(duì) 3個(gè)參數(shù)進(jìn)行優(yōu)化,建立基于評(píng)價(jià)指標(biāo)優(yōu)化的VMD方法。
粒子群優(yōu)化算法[21-22](Particle Swarm Optimization ,PSO)的原理表述如下:首先,在可行域的范圍內(nèi)初始化一群隨機(jī)粒子,在每一次迭代中,每個(gè)粒子通過(guò)2個(gè)極值來(lái)更新自己的速度和位置:個(gè)體極值pbest和全局極值。個(gè)體極值是單一粒子曾經(jīng)經(jīng)過(guò)的最優(yōu)位置,全局極值是粒子群中所有粒子曾經(jīng)經(jīng)過(guò)的最優(yōu)位置。通過(guò)多次迭代搜索優(yōu)化問(wèn)題的最優(yōu)解。
粒子群的進(jìn)化公式如下:
式中w為慣性權(quán)重;c1、c2為加速因子;r1,r2∈ R and[0,1],用以保證算法的不確定性;分別為第k次迭代中第i個(gè)粒子的速度、位置、個(gè)體極值最優(yōu)位置和群體極值最優(yōu)位置。
在以往的負(fù)荷預(yù)測(cè)建模中,通常將影響因素的原始序列作為影響因素變量直接加入到模型的輸入中。但上述做法并未挖掘影響因素序列中隱含的特征信息,存在數(shù)據(jù)利用效率低的問(wèn)題。因此,本文利用模態(tài)組合的方法對(duì)負(fù)荷預(yù)測(cè)的影響因素序列進(jìn)行預(yù)處理,充分挖掘隱含的特征信息。同時(shí),采用最小二乘支持向量機(jī)(LSSVM)作為預(yù)測(cè)算法,利用粒子群優(yōu)化算法(PSO)優(yōu)化LSSVM的參數(shù)。
每一個(gè)模態(tài)序列都對(duì)應(yīng)原始序列的某種特征信息,將模態(tài)序列進(jìn)行組合,可以挖掘出更多的隱含特征。依據(jù)特征條件將攜帶相似特征信息的模態(tài)進(jìn)行組合,實(shí)際上是對(duì)原始序列的有效分割。模態(tài)組合方法主要包含特征提取、模態(tài)組合2部分。
2.1.1 特征提取
1)時(shí)域特征提取
在概率論和信息論的領(lǐng)域中,互信息(Mutual Information)是一種有效的信息度量,描述一個(gè)隨機(jī)變量中所包含另一個(gè)隨機(jī)變量信息量的大小,是 2個(gè)隨機(jī)變量之間相互依賴(lài)程度的度量。不同于皮爾遜相關(guān)系數(shù)只能反映變量之間的線(xiàn)性相關(guān)程度,互信息利用熵的概念,既可以衡量變量之間的線(xiàn)性相關(guān)性,也可以衡量變量之間的非線(xiàn)性相關(guān)性[24],故本文采用互信息作為時(shí)域特征提取方法,互信息計(jì)算公式如下:
式中I(X,Y)為變量X、Y的互信息,n為變量X中的元素個(gè)數(shù),m為變量Y中的元素個(gè)數(shù),p(xi)、p(yj)分別為xi、yj元素出現(xiàn)的概率,p(xi,yj)為xi、yj共同出現(xiàn)的概率,I(X,Y)數(shù)值越大,X、Y的相關(guān)性越高。
2)頻域特征提取
經(jīng)改進(jìn)的 VMD方法分解所得的各模態(tài)序列之間相互獨(dú)立,各模態(tài)的頻譜帶寬緊湊。因此,本文取各模態(tài)頻率中心所對(duì)應(yīng)的模態(tài)周期作為各模態(tài)的頻域特征,計(jì)算公式如下:
式中fi為各模態(tài)的中心頻率,Hz;iT為各模態(tài)的中心頻率所對(duì)應(yīng)的模態(tài)周期。
2.1.2 模態(tài)組合
模態(tài)組合是通過(guò)模態(tài)數(shù)據(jù)序列求和的方式,將多個(gè)模態(tài)序列整合成為一個(gè)組合模態(tài)序列。各個(gè)組合模態(tài)序列相加后可以得到原始的數(shù)據(jù)序列,符合數(shù)據(jù)的完整性原則。模態(tài)組合方法的流程圖如下圖所示:
為充分挖掘影響因素序列中隱含的特征信息,本文利用模態(tài)組合的方法,將與負(fù)荷頻域特性中體現(xiàn)出相似周期性的影響因素模態(tài)序列進(jìn)行組合。組合之后,影響因素?cái)?shù)目由一個(gè)拓展到多個(gè),影響因素的數(shù)目與負(fù)荷頻域特性的顯著頻段個(gè)數(shù)相同,且組合后的影響因素模態(tài)與相應(yīng)的負(fù)荷序列具有更強(qiáng)的相關(guān)性。
由于短期負(fù)荷預(yù)測(cè)的預(yù)測(cè)對(duì)象為日負(fù)荷,結(jié)合前期采用小波分析、評(píng)價(jià)指標(biāo)優(yōu)化的集合經(jīng)驗(yàn)?zāi)B(tài)分解法(Ensemble Empirical Mode Decomposition,EEMD)、VMD法等分解算法對(duì)大量負(fù)荷序列的分解結(jié)果得出,分解后的負(fù)荷頻譜主要在 3個(gè)頻段內(nèi)呈現(xiàn)較高的周期性:周期大于24 h(不包括24 h)的負(fù)荷,體現(xiàn)在日期類(lèi)型(如工作日、節(jié)假日)的周期變化,可以近似描述短期負(fù)荷的趨勢(shì)性;周期為12~24 h(不包含12 h)的負(fù)荷頻段,體現(xiàn)了1 d內(nèi)用電習(xí)慣(如晝夜交替、日前電價(jià))的變化,可以近似描述負(fù)荷的波動(dòng)性;小于12 h的負(fù)荷頻段,體現(xiàn)了用戶(hù)在1 d內(nèi)用電的隨機(jī)性(如天氣、電價(jià)不確定性對(duì)負(fù)荷的影響),可以近似描述負(fù)荷的隨機(jī)性和不確定性。根據(jù)以上分析,本文對(duì)上述影響因素拓展方法進(jìn)行如下簡(jiǎn)化:
1)將影響因素模態(tài)序列中周期變化大于24 h(不包含 24 h)的模態(tài)進(jìn)行組合,組合模態(tài)作為影響因素趨勢(shì)分量,對(duì)應(yīng)描述負(fù)荷的趨勢(shì)性;
2)將影響因素模態(tài)序列中周期變化為12~24 h(不包含 12 h)的模態(tài)進(jìn)行組合,組合模態(tài)作為影響因素波動(dòng)分量,對(duì)應(yīng)描述負(fù)荷的周期波動(dòng)性;
3)將影響因素模態(tài)序列中周期變化小于12 h的模態(tài)進(jìn)行組合,組合模態(tài)作為影響因素隨機(jī)分量,對(duì)應(yīng)描述負(fù)荷的隨機(jī)性與不確定性。
支持向量機(jī)方法具有較強(qiáng)的泛化能力,在尋找全局最優(yōu)中有較大優(yōu)勢(shì)。但考慮到支持向量機(jī)方法在參數(shù)設(shè)定方面存在不足,本文采用最小二乘支持向量機(jī)(LSSVM)作為預(yù)測(cè)算法,并利用粒子群(PSO)優(yōu)化算法優(yōu)化LSSVM的參數(shù)。
2.3.1 LSSVM基本模型
最小二乘支持向量機(jī)[25-27](LSSVM)是支持向量機(jī)(SVM)的一種變形,保留了傳統(tǒng)的支持向量機(jī)結(jié)構(gòu)風(fēng)險(xiǎn)最小的特性[28]。將支持向量機(jī)優(yōu)化模型中的不敏感損失函數(shù)設(shè)定為最小二乘損失函數(shù),用等式約束替代不等式約束,減少需優(yōu)化的參數(shù)個(gè)數(shù),降低了求解復(fù)雜度[29-30]。
LSSVM的非線(xiàn)性函數(shù)式如下式所示:
式中k(x,xi)取不同的核函數(shù)就可生成不同的支持向量機(jī)。目前使用最多的核函數(shù)主要有多項(xiàng)式核函數(shù)、線(xiàn)性核函數(shù)、徑向基函數(shù)(Radial Basis Function,RBF)。其中,RBF核函數(shù)結(jié)構(gòu)簡(jiǎn)單,泛化能力強(qiáng),僅核函數(shù)σ與正規(guī)化參數(shù)γ需進(jìn)行優(yōu)化。
2.3.2 適應(yīng)度函數(shù)設(shè)置
粒子群優(yōu)化算法中的每個(gè)粒子包含3個(gè)維度,分別代表需要優(yōu)化的3個(gè)參數(shù),本文利用粒子群算法優(yōu)化LSSVM的核參數(shù)σ和正規(guī)化參數(shù)γ,適應(yīng)度函數(shù)為
式中N為樣本數(shù)量;Pij、Rij分別為第i個(gè)樣本第j維觀測(cè)數(shù)據(jù)的預(yù)測(cè)值和真實(shí)值。
2.3.3 基于模態(tài)組合的 PSO-LSSVM 短期負(fù)荷預(yù)測(cè)方法
傳統(tǒng)的模態(tài)預(yù)測(cè)方法(以下稱(chēng)原始模型)是將各影響因素的整體序列作為模型的輸入變量,得到負(fù)荷整體預(yù)測(cè)值。基于模態(tài)組合的預(yù)測(cè)方法在預(yù)測(cè)組合策略上主要分為 2種,一種是建立組合預(yù)測(cè)模型(以下稱(chēng)組合模型),即分別利用各個(gè)影響因素的趨勢(shì)分量、波動(dòng)分量、隨機(jī)分量預(yù)測(cè)負(fù)荷的趨勢(shì)模態(tài)、波動(dòng)模態(tài)和隨機(jī)模態(tài),得到負(fù)荷各模態(tài)的預(yù)測(cè)值之后,再將其加和得到最終的預(yù)測(cè)結(jié)果。另一種是僅建立一個(gè)預(yù)測(cè)模型(以下稱(chēng)單一模型),將所有影響因素的趨勢(shì)分量、波動(dòng)分量、隨機(jī)分量均作為模型的輸入變量,直接得到最終的預(yù)測(cè)結(jié)果。
2種預(yù)測(cè)策略各有優(yōu)勢(shì),建立組合預(yù)測(cè)模型的策略中,各影響因素分量與對(duì)應(yīng)的負(fù)荷模態(tài)有更強(qiáng)的相關(guān)性,單個(gè)模型的預(yù)測(cè)精度可以得到有效保障。但由于多個(gè)預(yù)測(cè)模型預(yù)測(cè)值的疊加會(huì)累積預(yù)測(cè)模型本身存在的固有誤差,可能無(wú)法滿(mǎn)足短期負(fù)荷預(yù)測(cè)對(duì)預(yù)測(cè)精度的要求。直接預(yù)測(cè)最終負(fù)荷的預(yù)測(cè)策略,由于僅建立單個(gè)預(yù)測(cè)模型,因此不存在模型固有誤差的疊加,但可能存在重復(fù)性輸入的問(wèn)題,需進(jìn)行降維處理[31-32]。
將得到的影響因素拓展變量輸入PSO-LSSVM模型,即可得到預(yù)測(cè)日的負(fù)荷預(yù)測(cè)值。輸入變量主要包含歷史負(fù)荷、溫度、濕度、日前電價(jià)的原始序列,拓展出的分量序列以及經(jīng)降維后的主成分序列,具體如下:
1)溫度。預(yù)測(cè)日當(dāng)天、預(yù)測(cè)日前1 d、預(yù)測(cè)日前2 d的溫度原始序列、趨勢(shì)分量、波動(dòng)分量與隨機(jī)分量;
2)濕度。預(yù)測(cè)日當(dāng)天、預(yù)測(cè)日前1 d、預(yù)測(cè)日前2 d的濕度原始序列、趨勢(shì)分量、波動(dòng)分量與隨機(jī)分量;
3)歷史負(fù)荷。預(yù)測(cè)日前一周同時(shí)刻、前1 d同時(shí)刻、前1 d前一時(shí)刻的負(fù)荷原始序列、趨勢(shì)分量、波動(dòng)分量、隨機(jī)分量;
4)日前電價(jià)。預(yù)測(cè)日當(dāng)天的日前電價(jià)原始序列、趨勢(shì)分量、波動(dòng)分量、隨機(jī)分量;
5)主成分序列。針對(duì)影響因素的重復(fù)輸入,將降維后的主成分序列作為輸入變量。
為驗(yàn)證上述所提基于模態(tài)組合的短期負(fù)荷預(yù)測(cè)方法的有效性,本文以美國(guó)新英格蘭地區(qū) 2016年全年 8760點(diǎn)實(shí)測(cè)負(fù)荷數(shù)據(jù)為數(shù)據(jù)源,利用基于評(píng)價(jià)指標(biāo)優(yōu)化的變分模態(tài)方法對(duì)負(fù)荷序列進(jìn)行分解,以驗(yàn)證基于評(píng)價(jià)指標(biāo)優(yōu)化的變分模態(tài)分解方法的有效性。同時(shí),選用新英格蘭地區(qū)2016年1月2日-2月29日冬季以及2016年7月1日-8月31日夏季的工作日負(fù)荷、日前電價(jià)、溫度、濕度數(shù)據(jù)為數(shù)據(jù)源進(jìn)行算例分析,以驗(yàn)證模型預(yù)測(cè)的精度。
3.1.1 分解結(jié)果分析
利用基于評(píng)價(jià)指標(biāo)優(yōu)化的變分模態(tài)分解方法對(duì)上述負(fù)荷序列進(jìn)行自適應(yīng)的信號(hào)分解,分解后的各模態(tài)時(shí)序圖以及各模態(tài)的頻譜圖如圖2、圖3所示:
由圖2可知,本文方法分解出了3個(gè)模態(tài)分量,本征模函數(shù)(Intrinsic Mode Function,IMF)IMF1的能量占比最大,但波動(dòng)性較小,與原始負(fù)荷序列表現(xiàn)出相同的變化趨勢(shì),夏季負(fù)荷水平較高,且負(fù)荷差最大;IMF2的波動(dòng)性較強(qiáng),尤其在夏季時(shí)段最為顯著;IMF3的能量占比最小,但波動(dòng)性最強(qiáng),而其夏季時(shí)段(5 000 h左右時(shí)段對(duì)應(yīng)7、8月)的波動(dòng)性較弱。殘差分量的數(shù)值主要在-2~2間波動(dòng),在原始信號(hào)中的能量占比為 0.011%,幾乎可忽略不計(jì)。
從圖3中可以看出,IMF1的頻段主要集中在1.649e-6Hz左右,IMF2的頻段主要集中在1.157e-6Hz,IMF3的頻段主要集中在2.315e-5Hz,殘差分量無(wú)明顯頻段特征。IMF1的顯著頻段對(duì)應(yīng)的模態(tài)周期為大于24 h(不包含24 h),IMF2的顯著頻段對(duì)應(yīng)的模態(tài)周期為12~24 h(不包含 12 h),IMF3的顯著頻段對(duì)應(yīng)的模態(tài)周期為小于 12 h,殘差沒(méi)有顯著頻段。且各模態(tài)之間未出現(xiàn)明顯的頻段重疊。由此可見(jiàn),本方法能夠提取出原始序列中周期性較強(qiáng)的模態(tài)分量,信號(hào)分解的質(zhì)量也較高。
3.1.2 與其他方法的比較分析
為驗(yàn)證本文方法的有效性,將小波分析[33-34]、集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)[35]、VMD這3種在負(fù)荷分解中應(yīng)用效果較好的信號(hào)分解方法進(jìn)行比較分析。小波分析,利用小波函數(shù)db3(Daubechies,db),取分解層數(shù)為1~10,對(duì)相同數(shù)據(jù)源進(jìn)行分解,選取效果最好的分解結(jié)果作為對(duì)比,最優(yōu)的分解層數(shù)為3層,得到4個(gè)信號(hào)分量。評(píng)價(jià)指標(biāo)優(yōu)化的EEMD方法,利用PSO優(yōu)化2個(gè)主要參數(shù):白噪聲序列幅值系數(shù)k以及執(zhí)行經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical mode decomposition,EMD)的總次數(shù)M,以綜合評(píng)價(jià)指標(biāo)最優(yōu)為適應(yīng)度函數(shù),將原始數(shù)據(jù)序列自適應(yīng)地分成了12個(gè)分量。未經(jīng)優(yōu)化的VMD,對(duì)相同數(shù)據(jù)集進(jìn)行分解,分解出了 4個(gè)模態(tài)分量。各分解方法的指標(biāo)對(duì)比結(jié)果如表1所示。
從表1中可以看出:在4種信號(hào)分解方法中,小波分析未通過(guò)真實(shí)性檢驗(yàn),其他2種方法均通過(guò)了真實(shí)性檢驗(yàn);優(yōu)化后的VMD方法綜合評(píng)價(jià)指標(biāo)比優(yōu)化后的EEMD方法小 0.989;優(yōu)化后的 VMD方法綜合評(píng)價(jià)指標(biāo)比未優(yōu)化的VMD方法小0.155。由此可見(jiàn),本文所提信號(hào)分解方法在實(shí)際應(yīng)用中具有明顯優(yōu)越性。
表1 不同信號(hào)分解方法的指標(biāo)對(duì)比Table 1 The index comparison of different signal decomposition methods
以美國(guó)新英格蘭地區(qū)2016年1-2月份的工作日負(fù)荷、日前電價(jià)、溫度、濕度數(shù)據(jù)為數(shù)據(jù)源,進(jìn)行負(fù)荷結(jié)構(gòu)辨識(shí)與影響因素拓展的算例分析。數(shù)據(jù)樣本為每日24個(gè)數(shù)據(jù)點(diǎn),共計(jì)960個(gè)樣本點(diǎn)。
3.2.1 氣象因素拓展
經(jīng)VMD分解后的溫度和濕度的時(shí)序圖如圖4、圖5所示:
考慮到溫度、濕度的累積效應(yīng),利用模態(tài)組合的方法對(duì)預(yù)測(cè)日前2 d、前1 d以及當(dāng)天的氣象因素進(jìn)行組合,組合結(jié)果見(jiàn)表2~表3。
表2 氣象因素的組合結(jié)果Table 2 Combination of meteorological factors
表3 模態(tài)組合因素與預(yù)測(cè)日負(fù)荷的相關(guān)性Table 3 Correlation between modal combination factors and forecast daily load
從表2可以看出,通過(guò)模態(tài)組合的方法,預(yù)測(cè)日前2 d溫度、預(yù)測(cè)日前1 d溫度、預(yù)測(cè)日當(dāng)天溫度均被拓展成了2個(gè),分別為溫度趨勢(shì)分量與溫度波動(dòng)分量;濕度因素由于只存在 1個(gè)模態(tài),沒(méi)有組合出更多的因素分量。
從表3可知,預(yù)測(cè)日前2 d溫度因素拓展出的趨勢(shì)分量和波動(dòng)分量與負(fù)荷的相關(guān)性分別比原始序列高 0.25、0.06;預(yù)測(cè)日前1 d溫度因素拓展出的趨勢(shì)分量與負(fù)荷的相關(guān)性比原始序列高 0.14,波動(dòng)分量低 0.01;預(yù)測(cè)日當(dāng)天溫度因素拓展出的趨勢(shì)分量和波動(dòng)分量與負(fù)荷的相關(guān)性分別比原始序列高0.21、0.05。預(yù)測(cè)日前2 d濕度因素拓展出的趨勢(shì)分量與負(fù)荷相關(guān)性比原始序列高 0.01;預(yù)測(cè)日前 1 d濕度因素拓展出的趨勢(shì)分量與負(fù)荷的相關(guān)性比原始序列高 0.02;預(yù)測(cè)日當(dāng)天濕度因素拓展出的趨勢(shì)分量與負(fù)荷的相關(guān)性比原始序列高 0.01。由此可見(jiàn),基于模態(tài)組合的方法不僅使影響因素的數(shù)目得到拓展,而且組合出的因素分量與負(fù)荷的相關(guān)性更高,有利于提升預(yù)測(cè)模型的精度。
3.2.2 歷史負(fù)荷因素的模態(tài)組合
由于負(fù)荷自身的周期性,歷史負(fù)荷也是常見(jiàn)的負(fù)荷預(yù)測(cè)影響因素變量。選取預(yù)測(cè)日前 1周同時(shí)刻負(fù)荷、預(yù)測(cè)日前1 d同時(shí)刻負(fù)荷、預(yù)測(cè)日前1 d前一時(shí)刻負(fù)荷作為歷史負(fù)荷因素,并利用模態(tài)組合的方法研究影響因素,結(jié)果如表4、表5所示。
從表4、表5可知,預(yù)測(cè)日前1周同時(shí)刻負(fù)荷、預(yù)測(cè)日前1 d同時(shí)刻負(fù)荷、預(yù)測(cè)日前1 d前一時(shí)刻負(fù)荷的原始序列均被拓展成了 3個(gè)分量,分別為趨勢(shì)分量、波動(dòng)分量、隨機(jī)分量。預(yù)測(cè)日前 1周同時(shí)刻負(fù)荷拓展出的趨勢(shì)分量、波動(dòng)分量和隨機(jī)分量與負(fù)荷的相關(guān)性分別比原始序列高0.34、0.55、0.27;預(yù)測(cè)日前1 d同時(shí)刻負(fù)荷拓展出的趨勢(shì)分量、波動(dòng)分量和隨機(jī)分量與負(fù)荷的相關(guān)性分別比原始序列高0.43、0.48、0.26;預(yù)測(cè)日前1 d前一時(shí)刻負(fù)荷拓展出的趨勢(shì)分量、波動(dòng)分量和隨機(jī)分量與負(fù)荷的相關(guān)性比原始序列高0.52、0.56、0.19。
表4 歷史負(fù)荷因素的組合結(jié)果Table 4 Combination results of historical load factors
表5 模態(tài)組合歷史負(fù)荷因素與預(yù)測(cè)日負(fù)荷的相關(guān)性統(tǒng)計(jì)Table 5 Correlation statistics between historical load factors of modal combination and forecast daily load
3.2.3 經(jīng)濟(jì)因素拓展
日前電價(jià)分解后的時(shí)序圖如圖6所示。
利用模態(tài)組合的方法對(duì)日前電價(jià)因素進(jìn)行組合的結(jié)果見(jiàn)表6、表7。
由表6、表7可知,日前電價(jià)因素被拓展成了3個(gè)因素分量,IMF1構(gòu)成了趨勢(shì)分量,IMF2構(gòu)成了波動(dòng)分量,IMF3、IMF4、IMF5共同構(gòu)成了隨機(jī)分量。拓展之后的分量中,趨勢(shì)分量與預(yù)測(cè)日負(fù)荷的相關(guān)性為 0.70,波動(dòng)分量與預(yù)測(cè)日負(fù)荷的相關(guān)性為 0.78,高于原始序列與預(yù)測(cè)日負(fù)荷的相關(guān)性。隨機(jī)分量的相關(guān)性為 0.43,雖不如原始序列與負(fù)荷的相關(guān)性高,但也具有較強(qiáng)的相關(guān)性。
表6 日前電價(jià)因素的組合結(jié)果Table 6 Combined results of the previous electricity price factors
表7 模態(tài)分解的日前電價(jià)因素與預(yù)測(cè)日負(fù)荷的相關(guān)性統(tǒng)計(jì)Table 7 Correlation statistics between day-ahead electricity price factors and forecast daily load based on modal decomposition
日前電價(jià)中IMF3與負(fù)荷的相關(guān)性為0.33,IMF4與負(fù)荷的相關(guān)性為0.26,IMF5與負(fù)荷的相關(guān)性為0.21。經(jīng)模態(tài)組合后,3個(gè)模態(tài)構(gòu)成的隨機(jī)分量與負(fù)荷的相關(guān)性為0.43,均大于單獨(dú)的3個(gè)模態(tài),證明了本方法的有效性。
為了說(shuō)明本文所提基于模態(tài)組合的負(fù)荷預(yù)測(cè)方法的有效性,本文分別選用美國(guó)新英格蘭地區(qū)2016年1-2月冬季以及2016年7-8月夏季的工作日負(fù)荷、日前電價(jià)、溫度、濕度數(shù)據(jù)為數(shù)據(jù)源進(jìn)行算例分析。分別建立基于 PSO-LSSVM的原始預(yù)測(cè)模型、單一預(yù)測(cè)模型和組合預(yù)測(cè)模型。原始預(yù)測(cè)模型,將歷史負(fù)荷數(shù)據(jù)和影響因素?cái)?shù)據(jù)作為 PSO-LSSVM模型的輸入,得到預(yù)測(cè)日的負(fù)荷預(yù)測(cè)值。單一預(yù)測(cè)模型,將通過(guò) VMD分解及主成分分析法降維處理后的各影響因素的趨勢(shì)分量、波動(dòng)分量和隨機(jī)分量作為 PSO-LSSVM模型的輸入,得到預(yù)測(cè)日的負(fù)荷預(yù)測(cè)值。組合預(yù)測(cè)模型,采用PSO-LSSVM模型分別對(duì)負(fù)荷的趨勢(shì)模態(tài)、波動(dòng)模態(tài)、隨機(jī)模態(tài)進(jìn)行預(yù)測(cè),對(duì)應(yīng)的輸入為歷史負(fù)荷及其影響因素對(duì)應(yīng)的模態(tài)分量,最后將各模態(tài)的預(yù)測(cè)值累加得到得到預(yù)測(cè)日的負(fù)荷數(shù)據(jù)。
圖7、圖8為冬季、夏季3種預(yù)測(cè)模型預(yù)測(cè)結(jié)果與實(shí)際值的對(duì)比。表8為預(yù)測(cè)精度對(duì)比。
表8 不同模型的日負(fù)荷預(yù)測(cè)精度對(duì)比Table 8 Comparison of forecasting accuracy between single model, combined model and original model
從表8中可以看出,除最小絕對(duì)誤差組合模型最高外,單一預(yù)測(cè)模型與組合預(yù)測(cè)模型在各精度指標(biāo)上,都優(yōu)于不進(jìn)行模態(tài)組合的原始預(yù)測(cè)模型。組合預(yù)測(cè)模型相比于原始模型,最大相對(duì)誤差降低了3.36個(gè)百分點(diǎn),平均相對(duì)誤差降低了1.71個(gè)百分點(diǎn),最大絕對(duì)誤差降低了95 MW,平均絕對(duì)誤差降低了55.72 MW,證明了模態(tài)組合方法在負(fù)荷預(yù)測(cè)工作中的有效性。在本算例中,2種基于模態(tài)組合的預(yù)測(cè)模型均具有良好的預(yù)測(cè)精度。
針對(duì)本算例結(jié)果可知,單一預(yù)測(cè)模型和組合預(yù)測(cè)模型的的預(yù)測(cè)精度指標(biāo)優(yōu)于原始模型,但 2種模型的優(yōu)越性比較還需要再進(jìn)行更加廣泛的試驗(yàn)驗(yàn)證。但是組合模型存在的固有誤差累計(jì)現(xiàn)象不容忽視,這種組合預(yù)測(cè)模型中出現(xiàn)的固有誤差的累計(jì),將嚴(yán)重影響預(yù)測(cè)精度,可能導(dǎo)致其無(wú)法滿(mǎn)足短期負(fù)荷預(yù)測(cè)對(duì)精度的要求。建議針對(duì)不同的數(shù)據(jù)集分別建立組合預(yù)測(cè)模型和單一預(yù)測(cè)模型,選取適合此數(shù)據(jù)集的精度較高的模型。
本文提出了一種基于模態(tài)組合的短期負(fù)荷預(yù)測(cè)方法,本文首先從建立信號(hào)分解的評(píng)價(jià)指標(biāo)入手,針對(duì)負(fù)荷預(yù)測(cè)領(lǐng)域的信號(hào)分解特點(diǎn),制定了包括真實(shí)性檢驗(yàn)、獨(dú)立性指標(biāo)和有效性指標(biāo) 3部分的評(píng)價(jià)指標(biāo),為信號(hào)分解技術(shù)的優(yōu)化方向提供了參考依據(jù)。繼而利用粒子群優(yōu)化算法優(yōu)化變分模態(tài)分解的參數(shù),提出了改進(jìn)的變分模態(tài)分解方法。將改進(jìn)變分模態(tài)分解方法分解出的高質(zhì)量模態(tài)進(jìn)行組合,進(jìn)行負(fù)荷結(jié)構(gòu)辨識(shí)以及影響因素拓展。最后,建立了基于模態(tài)組合的 PSO-LSSVM 短期負(fù)荷預(yù)測(cè)模型。結(jié)合美國(guó)新英格蘭地區(qū)2016年的實(shí)測(cè)負(fù)荷數(shù)據(jù)進(jìn)行算例分析,結(jié)果表明:
1)本文所提改進(jìn)變分模態(tài)分解方法在信號(hào)分解的真實(shí)性、獨(dú)立性、有效性方面均具有顯著優(yōu)越性,可以提供高質(zhì)量的模態(tài)數(shù)據(jù)序列;
2)本文所提基于模態(tài)組合的PSO-LSSVM短期負(fù)荷預(yù)測(cè)方法在高質(zhì)量影響因素變量的挖掘中能夠在數(shù)據(jù)集不變的基礎(chǔ)上顯著提升數(shù)據(jù)利用效率。同時(shí)證明了基于模態(tài)組合的 PSO-LSSVM 算法相比于直接采用PSO-LSSVM方法,最大相對(duì)誤差降低了3.36個(gè)百分點(diǎn),平均相對(duì)誤差降低了1.71個(gè)百分點(diǎn),最大絕對(duì)誤差降低了95 MW,平均絕對(duì)誤差降低了55.72 MW。
本文提出的基于模態(tài)組合的短期負(fù)荷預(yù)測(cè)方法提高了負(fù)荷預(yù)測(cè)精度,對(duì)電力系統(tǒng)調(diào)度和電力市場(chǎng)交易起到積極作用。未來(lái)可在本文研究結(jié)果的基礎(chǔ)上,將研究對(duì)象擴(kuò)展至高比例可再生能源電力系統(tǒng)下的廣義負(fù)荷,深入分析廣義負(fù)荷的時(shí)頻特征,完善廣義負(fù)荷的解析方法;挖掘廣義負(fù)荷與電價(jià)、氣象等影響因素在時(shí)域、頻域的動(dòng)態(tài)關(guān)聯(lián)關(guān)系,分析廣義負(fù)荷對(duì)于電價(jià)、氣象的響應(yīng)特性,研究考慮互動(dòng)響應(yīng)的廣義負(fù)荷預(yù)測(cè)方法。