張金金 張 倩 馬 愿李 智
(1.安徽大學(xué)電氣工程與自動(dòng)化學(xué)院,安徽合肥 230601;2.教育部電能質(zhì)量工程研究中心,安徽合肥 230601;3.國(guó)網(wǎng)安徽省電力有限公司,安徽合肥 230073)
為了適應(yīng)社會(huì)發(fā)展需求,大規(guī)模可再生能源接入電網(wǎng),導(dǎo)致功率波動(dòng)、電壓升高,給電網(wǎng)安全穩(wěn)定帶來了隱患,為此,對(duì)電能的合理調(diào)度顯得愈發(fā)重要[1].對(duì)負(fù)荷進(jìn)行精確預(yù)測(cè)能夠最大程度地利用電能,節(jié)約用電成本[2-4].
目前,在短期負(fù)荷預(yù)測(cè)中已有多種預(yù)測(cè)方法,如時(shí)間序列法[5]、線性回歸分析法[6]、人工神經(jīng)網(wǎng)絡(luò)法[7-8]、支持向量機(jī)(support vector machine,SVM)[9-10]等.其中,時(shí)間序列法和線性回歸法依賴于數(shù)學(xué)方法建立預(yù)測(cè)模型,不能解決天氣等與負(fù)荷之間的非線性問題.反向傳播(back propagation,BP)等人工神經(jīng)網(wǎng)絡(luò)對(duì)于復(fù)雜非線性函數(shù)具備較好的擬合能力,自學(xué)習(xí)能力很強(qiáng),但是采用經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化(empirical risk minimization,ERM)進(jìn)行訓(xùn)練,易陷入局部最優(yōu)解,基于統(tǒng)計(jì)學(xué)習(xí)理論,SVM可以減少有限訓(xùn)練樣本集的過度擬合,但對(duì)于大量訓(xùn)練樣本集,由于計(jì)算復(fù)雜性顯著增加,SVM[10]模型的收斂速率較慢,其優(yōu)化過程復(fù)雜.隨機(jī)森林(random forest,RF)[11-12]算法因其良好的泛化能力和快速的計(jì)算速度而應(yīng)用于負(fù)荷預(yù)測(cè)領(lǐng)域.但是單一的預(yù)測(cè)模型對(duì)于具有復(fù)雜變化及隨機(jī)特性的負(fù)荷序列,預(yù)測(cè)難以獲得理想的精度.
近年來,許多研究者投身于組合預(yù)測(cè)方法.其中,先分解負(fù)荷再進(jìn)行預(yù)測(cè)的方法得到廣泛應(yīng)用.小波分解[13]、經(jīng)驗(yàn)?zāi)B(tài)分解[14]、局部均值分解[15]等方法將原始信號(hào)進(jìn)行有效分解,然后再結(jié)合預(yù)測(cè)方法進(jìn)行預(yù)測(cè),以經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)[16]為主的分解方法能夠體現(xiàn)出原信號(hào)的典型動(dòng)態(tài)信息,但是,EMD分解方法難以避免模態(tài)混疊現(xiàn)象產(chǎn)生,得到虛假固有模態(tài)分量(intrinsic mode functions,IMF).針對(duì)此問題,Gilles J[17]提出了經(jīng)驗(yàn)小波變換(empirical wavelet transform,EWT),確保分解后得到的分量的數(shù)目更少,降低計(jì)算難度.而經(jīng)過EWT分解后的高頻分量隨機(jī)性強(qiáng),波動(dòng)幅度大,需要進(jìn)一步處理提升其預(yù)測(cè)精度.通過對(duì)具有不確定性的負(fù)荷序列聚類,實(shí)現(xiàn)同類別的數(shù)據(jù)最大同質(zhì)化,不同類別的數(shù)據(jù)最大異質(zhì)化,最終達(dá)到合理分組的效果[18].基于密度的聚類(density-based spatial clustering of applications with noise,DBSCAN)能將高密度點(diǎn)區(qū)域劃分成簇,但該算法[19]依賴于鄰域半徑Eps和鄰域密度閾值MinPts的選取.Sunita等[20]根據(jù)數(shù)據(jù)集在每個(gè)維度的密度分布,對(duì)Eps進(jìn)行動(dòng)態(tài)設(shè)置,但仍需手動(dòng)輸入MinPts.
為了進(jìn)一步提高負(fù)荷預(yù)測(cè)精度,本文提出基于改進(jìn)的隨機(jī)森林(improved random forest,IRF)和DBSCAN的短期負(fù)荷頻域預(yù)測(cè)方法.首先,利用EWT將原始負(fù)荷分解為低中頻和高頻分量,其中,高頻分量無(wú)規(guī)律且隨機(jī)性強(qiáng),不利于直接預(yù)測(cè).然后,引入一種確定Eps[21]的方法,并結(jié)合輪廓系數(shù)確定MinPts,對(duì)DBSCAN算法進(jìn)行了改進(jìn),以減少人工選取參數(shù)帶來的誤差,并用于對(duì)高頻分量分析聚類處理,得到噪聲樣本、大樣本和小樣本.接著,利用提出的IRF算法對(duì)低頻、中頻以及聚類后的樣本進(jìn)行預(yù)測(cè),對(duì)IRF的改進(jìn)如下:為了提升RF 算法的學(xué)習(xí)效率,將訓(xùn)練方法Bagging(bootstrap aggregating)替換為Subagging(subsample aggregating);為降低其泛化誤差,預(yù)測(cè)過程實(shí)行加權(quán)投票方法實(shí)時(shí)更新.最后,將各個(gè)分量的預(yù)測(cè)值相加,與EWT-IRF,EWT-RF,EMD-IRF模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,仿真結(jié)果表明該方法的精度更高.
本文引入的EWT[22]算法,是一種全新的處理負(fù)荷信號(hào)的自適應(yīng)分析方法.其關(guān)鍵思想在于提取出具有緊湊支撐特性的傅立葉譜的調(diào)幅-調(diào)頻(amplitude modulation-frequency modulation,AM-FM)分 量.使用EWT得到不同模態(tài),既可以解決EMD存在的模態(tài)混疊問題,同時(shí)分解后得到的分量的數(shù)目更少,進(jìn)而降低計(jì)算的難度.定義細(xì)節(jié)系數(shù)(n,t)和近似系數(shù)(0,t)的公式與傳統(tǒng)的小波變換類似,如式(1)-(2):
定義經(jīng)驗(yàn)小波為每個(gè)連續(xù)分段上的帶通濾波器.根據(jù)構(gòu)建Littlewood-Paley and Meyer’s wavelets[23]的思想,對(duì)于任意n>0,得到經(jīng)驗(yàn)尺度函數(shù)和經(jīng)驗(yàn)小波函數(shù)的計(jì)算公式(3)和式(4):
分割傅立葉譜的目的是分離頻譜中與模式相對(duì)應(yīng)的不同部分,例如以特定頻率為中心和緊湊支撐.為了找到N+1個(gè)邊界ωn,需要對(duì)傅里葉幅值進(jìn)行檢測(cè),找出其局部最大值Mj(j=1,···,M),然后將其降序排列(0,π不包含在內(nèi)).假定算法找到了M個(gè)局部最大值,且Mj滿足Mj >MM+α(M1-MM)(不等式右邊稱為閾值),其中α對(duì)應(yīng)于相對(duì)振幅比.可能會(huì)出現(xiàn)兩種情況:
1)M≥N,此時(shí)取前N-1個(gè)最大值;
2)M N為大于閾值的局部最大值的個(gè)數(shù),兩個(gè)連續(xù)的局部最大值的中心定義為每個(gè)段的邊界ωn.在這組邊界的基礎(chǔ)上加上0和π,總共得到N+1個(gè)邊界. DBSCAN[19]是一種基于密度的典型空間聚類方法,核心思想在于按照密度高低情況對(duì)數(shù)據(jù)集進(jìn)行聚類,找到其中的高密度集合.因此,適用于隨機(jī)性強(qiáng)的序列聚類,進(jìn)一步提升預(yù)測(cè)精度. 該算法有兩個(gè)重要參數(shù),分別為Eps和MinPts.參數(shù)Eps和MinPts值的選取決定了聚類結(jié)果的好壞. 確定Eps傳統(tǒng)的方法是將計(jì)算得到的k-dist值進(jìn)行升序排列,并畫出k-dist圖.然后通過觀察圖中kdist值急劇變化的點(diǎn)來確定Eps參數(shù).這種方法操作繁雜,并且依賴人工觀察來選取,導(dǎo)致得到的Eps具有很大的不確定性,本文通過計(jì)算每個(gè)點(diǎn)與下個(gè)點(diǎn)之間的差值(這里稱為斜率)來尋找k-dist圖中急劇陡升的點(diǎn).點(diǎn)的斜率定義為第個(gè)點(diǎn)的k-dist值與+1個(gè)點(diǎn)的k-dist值之間差的絕對(duì)值,計(jì)算公式如下: 確定最優(yōu)Eps的步驟如下: 1) 按照式(9)計(jì)算各點(diǎn)的斜率并濾除斜率為零的點(diǎn). 2) 計(jì)算剩余點(diǎn)的斜率的均值和標(biāo)準(zhǔn)差. 3) 第1個(gè)大于均值與標(biāo)準(zhǔn)差和的斜率對(duì)應(yīng)的kdist值,即為所求的Eps[21]. 本文對(duì)DBSCAN進(jìn)行了改進(jìn),具體如下: 為了更好地確定鄰域密度閾值MinPts,在得出最佳的Eps后,引入聚類有效性指標(biāo)輪廓系數(shù)(silhouette coefficient)來找出最優(yōu)的MinPts.樣本輪廓系數(shù)的計(jì)算公式如式(12): 式中:a(j′)是第j′個(gè)樣本與同一類別中其余樣本之間的平均距離,而b(j′)是第j′個(gè)樣本與不同類別中樣本之間的平均距離的最小值. 1)s(j′)→1,說明樣本聚類合理. 2)s(j′)→0,樣本處于兩類的邊界. 3)s(j′)→-1,則此時(shí)樣本的分類錯(cuò)誤. 具有復(fù)雜變化特性的高頻分量采用DBSCAN根據(jù)溫度濕度進(jìn)行聚類.具體步驟如下: 1) 輸入待聚類數(shù)據(jù)集D的氣象因素溫、濕度,計(jì)算各樣本點(diǎn)的k-dist值并按升序排列. 2) 按照式(9)計(jì)算每個(gè)點(diǎn)所對(duì)應(yīng)的斜率,然后計(jì)算斜率不為零的點(diǎn)的斜率的均值和標(biāo)準(zhǔn)差. 3) 找出第1個(gè)大于均值與標(biāo)準(zhǔn)差和的斜率,其對(duì)應(yīng)的k-dist為Eps. 4) 根據(jù)得到的Eps,運(yùn)用輪廓系數(shù)確定最好的MinPts. 5) 對(duì)于D中的樣本點(diǎn)進(jìn)行聚類. 原始負(fù)荷具有隨機(jī)性、不確定性,而經(jīng)過經(jīng)驗(yàn)小波變換的分解,可以獲得較少的負(fù)荷序列,部分尺度上的序列會(huì)呈現(xiàn)出規(guī)律性,有助于提高預(yù)測(cè)的準(zhǔn)確性.本文提出的整體預(yù)測(cè)模型如圖2所示. 圖2 負(fù)荷預(yù)測(cè)模型Fig.2 Load forecasting model 低中頻分量具有明顯的規(guī)律,曲線平滑,采用IRF建模預(yù)測(cè),輸入為歷史負(fù)荷數(shù)據(jù).高頻分量由于規(guī)律性差、波動(dòng)幅度大,不平穩(wěn),采用DBSCAN算法根據(jù)氣象因素溫度、濕度進(jìn)行聚類,得到噪聲樣本、大樣本集合以及小樣本集合.對(duì)于噪聲樣本,本應(yīng)該直接去除.考慮噪聲樣本含有少量預(yù)測(cè)點(diǎn),又由于其數(shù)目較少,數(shù)值與原始負(fù)荷相比很小,故不作處理.IRF訓(xùn)練速度快,所需調(diào)節(jié)的參數(shù)少,泛化能力強(qiáng),具有很強(qiáng)的抗過擬合能力以及抗噪能力,能夠處理非線性問題,同時(shí)適用于解決小樣本數(shù)據(jù)下機(jī)器學(xué)習(xí)問題,故對(duì)大樣本、小樣本集合負(fù)荷進(jìn)行預(yù)測(cè).IRF模型的輸入為歷史氣象因素和歷史負(fù)荷,根據(jù)時(shí)間點(diǎn)先后合成高頻分量的預(yù)測(cè)結(jié)果. 上述5個(gè)分量,根據(jù)其具有的特性,采用不同方法建模預(yù)測(cè).將5個(gè)部分預(yù)測(cè)結(jié)果重構(gòu),即為預(yù)測(cè)日的預(yù)測(cè)結(jié)果. 作為決策樹的理論擴(kuò)展,RF[11]是一種分類和回歸樹的集成學(xué)習(xí)方法.該算法具有預(yù)測(cè)精度高、計(jì)算速度快以及調(diào)節(jié)參數(shù)少等優(yōu)點(diǎn),可有效避免“過擬合”,對(duì)未知樣本和異常數(shù)據(jù)的魯棒性強(qiáng),適用于各種數(shù)據(jù)集的運(yùn)算.為了進(jìn)一步提高預(yù)測(cè)模型的泛化能力和效率,本文提出了IRF方法,而不是訓(xùn)練樣本和特征變量無(wú)監(jiān)督的雙隨機(jī)抽樣過程,具體的改進(jìn)如下. 4.2.1 Subagging方法 傳統(tǒng)的RF模型則采用Bagging方法生成訓(xùn)練子集,能夠有效緩解子模型的預(yù)測(cè)波動(dòng)現(xiàn)象.然而,可替換的隨機(jī)取樣,易導(dǎo)致Bagging方法計(jì)算效率偏低,耗費(fèi)時(shí)間.針對(duì)此問題,本文引入一種Subagging的集合技術(shù)作為Bagging 的替代方法.該方法可由Bagging 導(dǎo)出,通過從原始負(fù)荷訓(xùn)練集中隨機(jī)提取樣本而不進(jìn)行替換來構(gòu)建每個(gè)單獨(dú)的模型.由于在回歸中使用每個(gè)單獨(dú)模型的較少樣本來進(jìn)行裝袋,這種Subagging策略在計(jì)算時(shí)間方面具有明顯的優(yōu)勢(shì),能夠增強(qiáng)魯棒性.具體采樣過程如[24]. 4.2.2 加權(quán)預(yù)測(cè)過程 由于不同的決策樹對(duì)于預(yù)測(cè)所起到的作用不同,在RF模型的加權(quán)投票過程中,應(yīng)用與每個(gè)樹相關(guān)的合理權(quán)重來提高全局預(yù)測(cè)精度,減少生成錯(cuò)誤.測(cè)試數(shù)據(jù)的每個(gè)樣本由RF模型中的所有決策樹預(yù)測(cè),預(yù)測(cè)結(jié)果是所有決策樹的加權(quán)平均值.加權(quán)回歸結(jié)果定義為 式中:wqp為第q個(gè)樣本上的第p個(gè)決策樹的權(quán)重,yqp是第q個(gè)樣本上的第p個(gè)決策樹的預(yù)測(cè)結(jié)果,Yq是第q個(gè)樣本的最終預(yù)測(cè)結(jié)果.本文中的誤差函數(shù)定義為 更新決策樹的權(quán)重采用隨機(jī)梯度下降,公式如下: 4.2.3 基于IRF的預(yù)測(cè)模型 綜上所述,分別運(yùn)用IRF對(duì)各分量進(jìn)行建模預(yù)測(cè),步驟如下: 1) 對(duì)于訓(xùn)練樣本S0,通過Subagging方法采樣得到訓(xùn)練樣本子集Sr(r=1,2,···,k). 2) 基于隨機(jī)子空間理論,從訓(xùn)練樣本中隨機(jī)選擇一些特征變量以幫助形成決策樹,使其從根到葉生長(zhǎng)并達(dá)到預(yù)期的大小.假設(shè)特征變量的數(shù)量是m,則每棵樹的節(jié)點(diǎn)分裂過程是2m.而決策樹的個(gè)數(shù)k根據(jù)預(yù)測(cè)結(jié)果進(jìn)行合理調(diào)整. 3) 所有這些決策樹構(gòu)成IRF.將不同的IRF模型分別應(yīng)用于低中、高頻分量的預(yù)測(cè). 4) 對(duì)每個(gè)決策樹的預(yù)測(cè)結(jié)果使用式(11)計(jì)算最終預(yù)測(cè)結(jié)果,然后根據(jù)式(13)-(14)實(shí)時(shí)更新每個(gè)決策樹的權(quán)重.最后,組合每個(gè)決策樹的結(jié)果,得到負(fù)荷預(yù)測(cè)結(jié)果. 為了驗(yàn)證本文提出的IRF 的優(yōu)越性,將其與傳統(tǒng)RF,SVM,BP進(jìn)行對(duì)比.選取安徽省某一地市2017年6月16日到6月30日的負(fù)荷數(shù)據(jù)進(jìn)行仿真,預(yù)測(cè)最后3天的負(fù)荷.表1為4種方法的參數(shù)設(shè)置,具體結(jié)果如表2.其中,式(15)的平均絕對(duì)百分比誤差(MAPE)指標(biāo)可以用來評(píng)估不同模型的泛化能力. 表1 4種方法的參數(shù)Table 1 Parameters of four methods 表2 4種方法的結(jié)果Table 2 Results of four methods 由表2可得,BP神經(jīng)網(wǎng)絡(luò)在模型訓(xùn)練時(shí)間方面具有很大優(yōu)勢(shì),但是其預(yù)測(cè)誤差遠(yuǎn)遠(yuǎn)高于其他3種方法,并且數(shù)值穩(wěn)定性最差.4種方法當(dāng)中,本文提出的IRF模型的預(yù)測(cè)誤差最小,泛化能力最佳,數(shù)值穩(wěn)定性相對(duì)較好.模型的訓(xùn)練時(shí)間稍長(zhǎng),優(yōu)勢(shì)顯而易見.因此,對(duì)于短期負(fù)荷預(yù)測(cè),IRF算法相對(duì)于其他3種算法具有更好的適用性. 試驗(yàn)選取了2017年7月10日到31日共22天的某地市負(fù)荷實(shí)測(cè)數(shù)據(jù).采樣間隔為15 min,每天96個(gè)采樣點(diǎn),預(yù)測(cè)后4天的電力負(fù)荷.其中圖3為原始負(fù)荷序列曲線圖. 圖3 原始負(fù)荷曲線Fig.3 Original load curve 5.2.1 EWT的分解結(jié)果 運(yùn)用EWT對(duì)原始負(fù)荷數(shù)據(jù)進(jìn)行分解,圖4給出了分解結(jié)果.EWT將負(fù)荷仿真信號(hào)準(zhǔn)確分解,得到的分量信號(hào)更為平滑,分量的頻率特征較為明顯.選取的params.globtrend=‘poly’,用于從信號(hào)f中消除全局趨勢(shì);多項(xiàng)式插值次數(shù)params.degree=10;params.reg=‘none’,params.reg用于選擇想要的正則化方式,‘none’為不需要進(jìn)行正則化.檢測(cè)方法params.detect設(shè)置為尺度空間,想要的閾值檢測(cè)方法為empiricallaw函數(shù),該函數(shù)可以得到有意義的邊界.經(jīng)過分解得到最佳的分量個(gè)數(shù)為4. 圖4 EWT分解結(jié)果Fig.4 Results of EWT decomposition 采用EMD分解原始負(fù)荷,結(jié)果如圖5所示.由這兩種分解方法得到的結(jié)果曲線可知,兩者的分解結(jié)果存在明顯差異.EWT的分量個(gè)數(shù)為4,而EMD為9.顯然,EWT可以有效的減少分量個(gè)數(shù),降低預(yù)測(cè)難度.兩種分解方法得到的IMF 分量均表現(xiàn)出低頻到高頻的變化規(guī)律,并且經(jīng)EWT進(jìn)行分解后的IMF0曲線十分光滑,IMF1具有明顯的變化規(guī)律,故這兩個(gè)分量均能取得接近100%的準(zhǔn)確度.IMF2較IMF1波動(dòng)較大,但仍具有較為明顯的變化規(guī)律,預(yù)測(cè)精度很高.剩下的高頻分量隨機(jī)性強(qiáng),波動(dòng)幅度大,采用DBSCAN對(duì)其相應(yīng)的氣象因素聚類,再分別對(duì)得到的每類負(fù)荷進(jìn)行預(yù)測(cè).而EMD 分解得到的分量存在虛假分量.高頻分量IMF1,IMF2不僅波動(dòng)幅度大,隨機(jī)性強(qiáng),而且兩者共占原始負(fù)荷幅值的12%,很大程度上降低預(yù)測(cè)精度.基于上述分析,證明了EWT分解負(fù)荷序列的有效性. 圖5 EMD分解結(jié)果Fig.5 Results of EMD decomposition 5.2.2 預(yù)測(cè)分析 對(duì)以上得到的IMF0,IMF1,IMF2分量構(gòu)建IRF預(yù)測(cè)模型.決策樹數(shù)目k以及特征數(shù)目m很大程度上影響著預(yù)測(cè)結(jié)果以及泛化能力.經(jīng)過多次試驗(yàn),k,m分別取為100,2.采用交叉驗(yàn)證方法尋找IRF算法的最優(yōu)權(quán)重. 高頻分量IMF3 波動(dòng)較大,且隨機(jī)性較強(qiáng),采用DBSCAN根據(jù)溫度、濕度進(jìn)行聚類.計(jì)算非零斜率的均值為0.0013,標(biāo)準(zhǔn)差為0.0242,二者之和為0.0255.第1個(gè)大于0.0255的斜率對(duì)應(yīng)的k-dist值為0.38,即為Eps.MinPts的確定采用Silhouette coefficient(所有樣本點(diǎn)silhouette coefficient的平均值),silhouette coefficient 越接近于1,表明聚類效果越好.表3 為不同MinPts值的silhouette coefficient. 表3 不同MinPts的silhouette coefficientTable 3 Silhouette coefficients of differentMinPts 由表3可得,MinPts為12時(shí)的聚類結(jié)果最差而MinPts為76時(shí) 的Silhouette coefficient為0.892,與1最為接近.因此,最優(yōu)參數(shù)Eps,MinPts分別為0.38,76.圖6為IMF3的聚類結(jié)果.此時(shí),聚類得到159個(gè)噪聲點(diǎn),一個(gè)大樣本集合(1830個(gè)點(diǎn))以及一個(gè)小樣本集合(123個(gè)點(diǎn))一共3類.對(duì)于噪聲樣本,是異常點(diǎn),本應(yīng)該直接去除.考慮噪聲樣本含有32個(gè)預(yù)測(cè)點(diǎn),又由于其數(shù)目較少,數(shù)值極大部分不超過10 MW,與原始負(fù)荷幅值相比很小,故不作處理,直接作為預(yù)測(cè)值.加入溫度、濕度,和負(fù)荷作為輸入,采用IRF方法對(duì)大樣本集合負(fù)荷進(jìn)行預(yù)測(cè).同理,對(duì)小樣本集合的負(fù)荷使用IRF方法預(yù)測(cè).按照時(shí)間點(diǎn)合成IMF3的預(yù)測(cè)值.聚類之前IMF3 的MAPE 為22%,聚類后的IMF3的MAPE為4%,極大地提高了預(yù)測(cè)準(zhǔn)確度. 圖6 聚類結(jié)果Fig.6 Clustering result 綜上,將4個(gè)部分的預(yù)測(cè)值相加.為了體現(xiàn)出本文組合預(yù)測(cè)方法的優(yōu)越性,將基于IRF和DBSCAN的頻域預(yù)測(cè)模型(模型1)與EWT-IRF 預(yù)測(cè)模型(模型2)、EWT-RF預(yù)測(cè)模型(模型3)、EMD-IRF的預(yù)測(cè)模型(模型4)進(jìn)行對(duì)比.圖7給出4種方法的結(jié)果. 由圖7可知,基于IRF和DBSCAN的頻域預(yù)測(cè)模型得出的結(jié)果與實(shí)際原始負(fù)荷值具有一致的變化趨勢(shì).相比于沒有對(duì)高頻分量進(jìn)行處理的EWT-IRF,本文提出的模型一定程度上提高了預(yù)測(cè)精度,驗(yàn)證了對(duì)IMF3采用DBSCAN算法聚類再分別預(yù)測(cè)的可行性.對(duì)于EWT-RF,EMD-IRF,本文模型的預(yù)測(cè)結(jié)果與實(shí)際負(fù)荷的實(shí)時(shí)變化規(guī)律更為一致.因此,本文模型具有更佳的預(yù)測(cè)效果.本文采用平均絕對(duì)百分比誤差(MAPE)和均方根誤差(RMSE)兩種誤差指標(biāo)分析模型,其公式如下: 式中:Pti為功率實(shí)際值,Pprei為功率預(yù)測(cè)值,K為數(shù)據(jù)數(shù)量. 圖7 各種方法的預(yù)測(cè)結(jié)果比較Fig.7 Prediction performance among different methods 表4為4種模型的誤差指標(biāo).將第2種模型與第4種模型進(jìn)行對(duì)比,預(yù)測(cè)效果在兩個(gè)誤差指標(biāo)的均值上分別降低了83%,76.1%,驗(yàn)證了EWT分解的有效性.然后,將本文提出的模型與第2種模型進(jìn)行比較,相應(yīng)誤差指標(biāo)分別降低37.5%,34%,體現(xiàn)出文中二次處理方法的可行性.之后,再與第3種模型進(jìn)行比較.本文提出的預(yù)測(cè)模型的平均MAPE 值相對(duì)于EWT-RF模型降低了68.7%,本文提出的預(yù)測(cè)模型的平均RMSE值相對(duì)于EWT-RF模型降低了69.4%,驗(yàn)證了IRF算法的預(yù)測(cè)準(zhǔn)確性. 4天預(yù)測(cè)日中的4種方法誤差指標(biāo)的箱線圖見圖8,橫坐標(biāo)標(biāo)簽1,2,3,4分別表示本文方法、EWT-IRF,EWT-RF和EMD-IRF.選擇MAPE來對(duì)4個(gè)預(yù)測(cè)方法進(jìn)行比較. 表4 誤差指標(biāo)統(tǒng)計(jì)Table 4 Error indicator statistics 從圖8中可以看出,雖然本文提出的方法和第2種方法中位數(shù)接近,但是本文提出的方法具有更低的MAPE且提供更穩(wěn)定的預(yù)測(cè)性能.相比與第3,4種方法,本文提出的方法中位數(shù)、MAPE均為最小,預(yù)測(cè)性能得到顯著改善. 圖8 預(yù)測(cè)日MAPE的箱線圖Fig.8 Box plots of forecast days MAPE 為了提高預(yù)測(cè)精度,從數(shù)據(jù)平穩(wěn)化的角度,本文采用經(jīng)驗(yàn)小波變換方法分解原始負(fù)荷序列.之后,根據(jù)各分量的具體特征有針對(duì)性地選用合適的預(yù)測(cè)方法.結(jié)合IRF,對(duì)規(guī)律性強(qiáng)的低頻和中頻分量進(jìn)行預(yù)測(cè).對(duì)于波動(dòng)性較大的高頻分量,采用DBSCAN先依據(jù)溫度、濕度聚類,再根據(jù)分類結(jié)果分別采用考慮氣象因素的IRF建立預(yù)測(cè)模型,噪聲樣本集合無(wú)需進(jìn)行預(yù)測(cè).將各個(gè)子模型的結(jié)果疊加,獲得負(fù)荷預(yù)測(cè)值.實(shí)驗(yàn)結(jié)果表明,本文提出的方法具有更高的預(yù)測(cè)精度和有效性,對(duì)研究短期負(fù)荷預(yù)測(cè)具有一定的參考意義.3 DBSCAN
4 負(fù)荷預(yù)測(cè)模型
4.1 整體預(yù)測(cè)框架
4.2 改進(jìn)的隨機(jī)森林
5 實(shí)驗(yàn)仿真
5.1 性能測(cè)試
5.2 案例分析
6 結(jié)論