吳浩天,孫榮富,廖思陽(yáng),柯德平,徐 箭,徐海翔
(1. 武漢大學(xué)電氣與自動(dòng)化學(xué)院,湖北省武漢市 430072;2. 國(guó)網(wǎng)冀北電力有限公司,北京市 100032)
截至2020 年底,中國(guó)風(fēng)電總裝機(jī)容量為280 GW,約為新能源總裝機(jī)容量的50%[1]。同時(shí),隨著以新能源為主體的新型電力系統(tǒng)的構(gòu)建,風(fēng)電占比將進(jìn)一步提升,這也對(duì)風(fēng)電功率預(yù)測(cè)的準(zhǔn)確性提出了更高要求。
風(fēng)電功率概率預(yù)測(cè)主要通過區(qū)間估計(jì)[2-3]或概率密度估計(jì)[4]預(yù)測(cè)得到未來一段時(shí)間內(nèi)風(fēng)電功率的變化范圍。按照建模對(duì)象可以將風(fēng)電功率概率預(yù)測(cè)分為兩大類。第1 類概率預(yù)測(cè)直接對(duì)風(fēng)電功率進(jìn)行建模,通過直接挖掘?qū)崪y(cè)數(shù)據(jù)得到未來一段時(shí)間風(fēng)電功率的概率分布,包括統(tǒng)計(jì)法[5-6]與人工智能法[7-9]。該類方法大多存在一定主觀因素,例如隸屬于統(tǒng)計(jì)法的高斯過程回歸將風(fēng)電功率及其影響因素序列視為服從多維高斯分布,然而部分研究表明高斯分布并不適合表征風(fēng)電功率概率分布[10-11];以文獻(xiàn)[7]為代表的機(jī)器學(xué)習(xí)法大多需要依據(jù)評(píng)價(jià)指標(biāo)構(gòu)造目標(biāo)函數(shù),但人為設(shè)定的指標(biāo)與概率預(yù)測(cè)結(jié)果的魯棒性并不能畫等號(hào)。
第2 類概率預(yù)測(cè)以點(diǎn)預(yù)測(cè)的結(jié)果作為基礎(chǔ),統(tǒng)計(jì)預(yù)測(cè)誤差并建模得到其對(duì)應(yīng)的概率分布,進(jìn)而與預(yù)測(cè)值疊加得到概率預(yù)測(cè)結(jié)果。該類方法能夠?qū)⑾冗M(jìn)的點(diǎn)預(yù)測(cè)與誤差建模方法相結(jié)合,因而更受青睞。近年來,點(diǎn)預(yù)測(cè)以深度學(xué)習(xí)方法為主,包括門控循環(huán)單元(GRU)[12]、卷積神經(jīng)網(wǎng)絡(luò)(CNN)[13]等。預(yù)測(cè)誤差建模主要分為參數(shù)化與非參數(shù)化方法。參數(shù)化方法假定預(yù)測(cè)誤差遵循某一特定形式的分布,如高斯分布[6]、通用分布[11]。非參數(shù)建模利用核密度估計(jì)[4]、Cornish-Fisher 級(jí)數(shù)[14]等方法實(shí)現(xiàn)非線性映射,計(jì)算出預(yù)測(cè)誤差概率密度函數(shù)(probability density function,PDF)或累積分布函數(shù)(cumulative distribution function,CDF)的分位點(diǎn)。
引入條件概率理論對(duì)相似樣本進(jìn)行聚合劃分有助于提升預(yù)測(cè)準(zhǔn)確性。其中,以點(diǎn)預(yù)測(cè)功率與風(fēng)速的大小為條件進(jìn)行樣本分類是最常見的條件概率預(yù)測(cè)方法[15-16]。此外,基于多維氣象數(shù)據(jù)進(jìn)行天氣分型從而實(shí)現(xiàn)分組預(yù)測(cè)的方法得到了廣泛應(yīng)用。文獻(xiàn)[17-19]分別依據(jù)風(fēng)速、氣溫、氣壓等因素的性質(zhì)對(duì)樣本進(jìn)行相似日分類,組成不同氣象模式,實(shí)現(xiàn)分組功率預(yù)測(cè);文獻(xiàn)[20]設(shè)計(jì)了天氣分型因子,并按照晴、雨等氣象條件進(jìn)行光伏預(yù)測(cè)。然而,由于同日不同時(shí)刻的氣象條件可能具有一定差異,若按照文獻(xiàn)[17-19]的思路以日為單位劃分氣象模式,將一日中高溫與低溫、高風(fēng)速與低風(fēng)速的樣本歸為一類,則可能在各模式中引入一定噪聲成分。而且,以文獻(xiàn)[17-20]為代表的研究主要應(yīng)用于新能源功率點(diǎn)預(yù)測(cè)。有關(guān)多維氣象分型的風(fēng)電功率條件概率預(yù)測(cè),目前尚無足夠的理論研究支撐。
基于上述研究,本文提出了基于氣象聚類分型與改進(jìn)高斯混合模型(Gaussian mixture model,GMM)聚類的風(fēng)電功率概率預(yù)測(cè)方法。首先,結(jié)合最大期望(expectation-maximum,EM)算法與改進(jìn)的禿鷹搜索(improved bald eagle search,IBES)算法提出基于IBES-EM 算法的GMM(IBES-EMGMM)聚類模型,依據(jù)多維氣象數(shù)據(jù)對(duì)歷史氣象-功率數(shù)據(jù)集聚類劃分,得到多個(gè)氣象模式。其次,利用CNN-GRU 網(wǎng)絡(luò)對(duì)各氣象模式的數(shù)據(jù)集進(jìn)行訓(xùn)練得到點(diǎn)預(yù)測(cè)結(jié)果,據(jù)此統(tǒng)計(jì)各氣象模式下的誤差樣本,采用Cornish-Fisher 級(jí)數(shù)建立各氣象模式下風(fēng)電功率預(yù)測(cè)誤差CDF 分位點(diǎn),并與對(duì)應(yīng)點(diǎn)預(yù)測(cè)結(jié)果疊加,得到最終的概率預(yù)測(cè)結(jié)果。算例仿真從聚類效果與概率預(yù)測(cè)角度驗(yàn)證了IBES-EM-GMM 聚類相較于其他聚類模型的優(yōu)越性。
短期風(fēng)電功率概率預(yù)測(cè)通常以次日00:00 起至未來24~72 h 的氣象預(yù)報(bào)數(shù)據(jù)作為輸入,預(yù)測(cè)對(duì)應(yīng)時(shí)刻風(fēng)電功率的置信區(qū)間或概率分布。本文計(jì)及氣象四要素(風(fēng)速、風(fēng)向、氣溫、氣壓)提出IBES-EMGMM 聚類模型。該模型根據(jù)歷史氣象數(shù)據(jù)的自身性質(zhì),將其自適應(yīng)劃分為多個(gè)氣象模式,繼而實(shí)現(xiàn)精細(xì)化的分組訓(xùn)練與預(yù)測(cè),其示意圖見附錄A 圖A1。
GMM 聚類基于多維GMM 來刻畫各樣本的簇類。多維GMM 由數(shù)個(gè)多維高斯分布線性疊加得到,二者PDF 如式(1)和式(2)所示。
式中:N為總樣本組數(shù);XEM為待優(yōu)化參數(shù)集合;xn為第n組氣象樣本。該優(yōu)化問題常用基于拉格朗日乘子的EM 算法[21]進(jìn)行求解。
禿鷹搜索(bald eagle search,BES)算法每輪迭代的核心尋優(yōu)部分主要包括選擇空間、搜索獵物、俯沖捕獵3 個(gè)階段[22]。選擇空間與俯沖捕獵作為一輪迭代的起止階段,若種群陷入局部最優(yōu),則將影響到整體的種群尋優(yōu)過程。因此,分別利用Levy 飛行與自適應(yīng)t分布變異策略改進(jìn)上述兩階段,如式(4)—式(6)所示。式(4)為L(zhǎng)evy 步長(zhǎng)計(jì)算式,式(5)和式(6)分別為改進(jìn)后的選擇空間及自適應(yīng)t分布變異過程。
由式(5)可知,在選擇空間階段,當(dāng)λ1ρ1取值較小時(shí),禿鷹種群易陷入局部最優(yōu)。因此,引入有較高概率出現(xiàn)大步長(zhǎng)的Levy 步長(zhǎng)si以拓寬禿鷹的搜索空間[23]。式(6)所示自適應(yīng)t分布變異以算法迭代次數(shù)作為t分布自由度參數(shù),迭代前期自由度小,類似柯西分布,步長(zhǎng)較大,從而增強(qiáng)算法前期的全局搜索能力;迭代后期自由度大,類似高斯分布,步長(zhǎng)適中,從而提升算法局部收斂能力。
基于Levy 飛行與自適應(yīng)t分布變異策略改進(jìn)的IBES 算法流程見附錄A 圖A2(a)。相較于原BES算法,其在迭代初期具有更大的搜索空間,在迭代后期通過自適應(yīng)變異提升收斂性能,從而得到更優(yōu)的聚類結(jié)果。
由于初值隨機(jī)給定,EM 算法易陷入局部最優(yōu),而直接利用IBES 算法求解GMM 聚類無法充分利用目標(biāo)函數(shù)的梯度信息。此外,利用IBES 算法得到的禿鷹位置難以符合GMM 的參數(shù)特性,如協(xié)方差矩陣θk必須為對(duì)稱正定陣等?;趦深愃惴ǖ?/p>
步驟3:EM 算法更新。隨機(jī)選擇一只禿鷹,利用EM 算法迭代一步,更新其對(duì)應(yīng)的GMM 參數(shù)與禿鷹位置。
步驟4:IBES 算法更新。利用IBES 算法中改進(jìn)的選擇空間、搜索獵物、俯沖捕獵、自適應(yīng)t分布變異4 個(gè)階段更新禿鷹位置。每個(gè)階段位置更新結(jié)束后,需要對(duì)禿鷹位置進(jìn)行邊界檢查,若某一維位置不在取值范圍內(nèi),則對(duì)該位置隨機(jī)賦予邊界內(nèi)的值。此外,為了保證GMM 系數(shù)αk對(duì)應(yīng)的禿鷹位置分量滿足和為1 的約束,在邊界檢查結(jié)束后需要對(duì)該分量按照式(8)進(jìn)行標(biāo)準(zhǔn)化操作。
步驟5:終止條件。IBES-EM 算法終止條件為指定迭代數(shù)Nset內(nèi)最佳適應(yīng)度Fbest與平均適應(yīng)度Fmean的變化值均小于閾值,如式(9)所示。
求得XIBESEM后,遍歷所有樣本xn,按照式(11)計(jì)算xn中第k個(gè)高斯分布生成的后驗(yàn)概率γn,k,并將xn歸于概率最大的一類,得到氣象聚類分型結(jié)果。
本文采用CNN-GRU 網(wǎng)絡(luò)[13-14]作為各氣象模式下風(fēng)電功率點(diǎn)預(yù)測(cè)回歸模型,其網(wǎng)絡(luò)結(jié)構(gòu)和輸入輸出數(shù)據(jù)結(jié)構(gòu)如圖1 所示。為了保證CNN 對(duì)輸入特征提取的便捷性,以當(dāng)前時(shí)刻與前3 個(gè)時(shí)刻的氣象四要素組成的4×4 二維特征圖作為輸入,輸出當(dāng)前時(shí)刻的風(fēng)電功率預(yù)測(cè)值。這樣,基于氣象聚類分型的點(diǎn)預(yù)測(cè)模型能夠同時(shí)考慮不同氣象模式的差異性與相鄰時(shí)間斷面氣象條件的耦合特性,從而進(jìn)一步提升點(diǎn)預(yù)測(cè)的精度。
圖1 CNN-GRU 網(wǎng)絡(luò)與數(shù)據(jù)的結(jié)構(gòu)Fig.1 Structure of CNN-GRU network and data
通過CNN-GRU 網(wǎng)絡(luò)對(duì)各氣象模式下樣本進(jìn)行訓(xùn)練,可以得到各氣象模式對(duì)應(yīng)的預(yù)測(cè)誤差樣本,如式(12)所示。
式中:wˉk,j和wk,j分別為第k類氣象模式中第j個(gè)樣本的風(fēng)電功率預(yù)測(cè)值與實(shí)際值;ek,j為第k類氣象模式中第j個(gè)樣本的預(yù)測(cè)誤差。
利用含5 階矩的Cornish-Fisher 級(jí)數(shù)建立各氣象模式下預(yù)測(cè)誤差CDF,如式(13)—式(18)所示。
式中:Jk為第k類氣象模式的樣本數(shù);ηk和σk分別為第k類氣象模式預(yù)測(cè)誤差的均值與標(biāo)準(zhǔn)差;uk,3、uk,4、uk,5分別為第k類氣象模式下預(yù)測(cè)誤差的3、4、5 階原點(diǎn)矩;ξq為標(biāo)準(zhǔn)高斯分布對(duì)應(yīng)概率q的分位點(diǎn);φk,q和Qk,q分別為標(biāo)準(zhǔn)化與去標(biāo)準(zhǔn)化后第k類氣象模式下預(yù)測(cè)誤差CDF 對(duì)應(yīng)概率q的分位點(diǎn)。
Cornish-Fisher 級(jí)數(shù)通過式(13)—式(16)構(gòu)造預(yù)測(cè)誤差原點(diǎn)矩,并利用式(17)和式(18)進(jìn)行級(jí)數(shù)展開與去標(biāo)準(zhǔn)化計(jì)算,得到預(yù)測(cè)誤差CDF 的分位點(diǎn)。其對(duì)于呈現(xiàn)明顯偏軸特征的非正態(tài)分布具有較好的擬合效果,并且能夠直接對(duì)表征置信區(qū)間的預(yù)測(cè)誤差CDF 的分位點(diǎn)進(jìn)行擬合,相較于核密度估計(jì)等方法省略了對(duì)CDF 求逆從而間接獲得分位點(diǎn)的步驟,操作更為簡(jiǎn)便。
值得注意的是,通過CNN-GRU 網(wǎng)絡(luò)訓(xùn)練得到的誤差樣本既包含氣象數(shù)據(jù)引起的誤差,又包含模型計(jì)算引起的誤差。通過足夠次數(shù)的重復(fù)訓(xùn)練,采用最佳訓(xùn)練精度下的網(wǎng)絡(luò)參數(shù)與誤差樣本分別作為單點(diǎn)預(yù)測(cè)與誤差建模的依據(jù),可以最大限度地消除網(wǎng)絡(luò)計(jì)算誤差,從而進(jìn)一步提高誤差建模的魯棒性。
本文提出的概率預(yù)測(cè)方法整體框架見圖2,簡(jiǎn)易流程如附錄A 圖A3 所示。
圖2 基于氣象聚類分型的風(fēng)電功率概率預(yù)測(cè)示意圖Fig.2 Schematic diagram of probability forecasting for wind power based on meteorological clustering and classification
首先,利用IBES-EM-GMM 聚類將歷史氣象-功率數(shù)據(jù)集劃分為多個(gè)氣象模式。其次,構(gòu)造輸入特征圖,采用CNN-GRU 網(wǎng)絡(luò)對(duì)各氣象模式包含的全部氣象-功率數(shù)據(jù)進(jìn)行訓(xùn)練,得到訓(xùn)練好的網(wǎng)絡(luò)參數(shù)與預(yù)測(cè)誤差集,并利用Cornish-Fisher 級(jí)數(shù)得到各氣象模式下預(yù)測(cè)誤差CDF 的分位點(diǎn)。最后,輸入待預(yù)測(cè)時(shí)刻氣象預(yù)報(bào)數(shù)據(jù),按照式(11)計(jì)算后驗(yàn)概率匹配氣象模式,采用訓(xùn)練好的網(wǎng)絡(luò)參數(shù)集進(jìn)行預(yù)測(cè),得到點(diǎn)預(yù)測(cè)結(jié)果,并將同一氣象模式下誤差CDF 疊加至點(diǎn)預(yù)測(cè)結(jié)果,得到最終的短期風(fēng)電功率概率預(yù)測(cè)結(jié)果。
從聚類角度來看,本文所提方法利用IBES-EM算法增強(qiáng)了全局搜索能力,在保證聚類完備性的前提下相較EM 算法能夠得到似然值更高、效果更好的氣象分型結(jié)果。從預(yù)測(cè)角度來看,由于氣象分型考慮了不同氣象條件下風(fēng)電功率及其預(yù)測(cè)誤差的差異性,該方法相比無聚類的概率預(yù)測(cè)模型更具魯棒性。
本章選取中國(guó)冀北地區(qū)風(fēng)電場(chǎng)的實(shí)際數(shù)據(jù)進(jìn)行分析。其中,3.1.1 節(jié)至3.3.2 節(jié)采用的風(fēng)電場(chǎng)數(shù)據(jù)時(shí)間跨度為2017 年5 月26 日至2018 年5 月26 日;3.3.3 節(jié)采用的風(fēng)電場(chǎng)數(shù)據(jù)時(shí)間跨度為2016 年5 月28 日至2019 年8 月11 日。其采樣間隔均為15 min,包括該風(fēng)電場(chǎng)的風(fēng)速、風(fēng)向、氣溫、氣壓預(yù)報(bào)數(shù)據(jù)與對(duì)應(yīng)時(shí)刻的功率數(shù)據(jù)。訓(xùn)練集與測(cè)試集均按照8∶2的比例進(jìn)行劃分。算例中所有聚類算法最大迭代次數(shù)均為100 次,終止閾值γ1與γ2均為0.001。同時(shí),所有智能算法的種群數(shù)量均取30,具體參數(shù)設(shè)置見附錄A 表A1。CNN-GRU 網(wǎng)絡(luò)采用Adam 算法進(jìn)行訓(xùn)練,其最大訓(xùn)練次數(shù)為30 次;最小批處理樣本數(shù)為總樣本數(shù)的4%;初始學(xué)習(xí)率為0.01,20 次訓(xùn)練后學(xué)習(xí)率為0.004。
算例采用min-max 歸一化[12]方法對(duì)所有氣象數(shù)據(jù)進(jìn)行無量綱化處理,以消除不同氣象子序列單位不同對(duì)預(yù)測(cè)結(jié)果的影響。仿真硬件為Intel Core i5-6400 CPU 與12 GB RAM;軟 件 為MATLAB 2020B,其中CNN 與GRU 網(wǎng)絡(luò)調(diào)用MATLAB 深度學(xué)習(xí)工具箱。
以GMM 為基礎(chǔ)的聚類模型通常采用貝葉斯信息準(zhǔn)則(Bayesian information criterion,BIC)作為評(píng)價(jià)指標(biāo)。其以聚類模型的復(fù)雜度作為懲罰項(xiàng),是反映模型復(fù)雜度與似然估計(jì)能力的綜合指標(biāo)[24]。BIC值越小,聚類模型的性能越好。
3.1.1 BES 類算法比較
分別采用BES 算法、IBES 算法、BES-EM 算法與IBES-EM 算法優(yōu)化GMM 聚類模型。以聚類后的氣象模式數(shù)K(K=2,3,…,20)為變量,計(jì)算BIC值進(jìn)行比較,結(jié)果如圖3(a)所示。由圖3(a)可知,IBES-EM 算法在所有聚類數(shù)目下的BIC 值均最小,因此在4 種算法中具有最好的性能。
進(jìn)一步對(duì)比4 種算法在最優(yōu)聚類數(shù)目下的收斂曲線,如圖3(b)所示。其中,BES 算法與IBES 算法最優(yōu)聚類數(shù)目均為2,BES-EM 算法與IBES-EM 算法最優(yōu)聚類數(shù)目分別為9 與11。由圖3(b)可知,BES-EM 算法與IBES-EM 算法由于利用了目標(biāo)函數(shù)的梯度信息,使得迭代初期的適應(yīng)度值迅速爬升。同時(shí),由于IBES 算法能夠持續(xù)拓寬禿鷹種群的搜索空間,其在迭代100 次后的適應(yīng)度值達(dá)到了52 081,相較BES-EM 算法高出了約6 660,論證了IBES-EM 算法具有相對(duì)最好的收斂性能。
圖3 不同算法的BIC 值與收斂過程對(duì)比Fig.3 Comparison of BIC values and convergence process of different algorithms
3.1.2 不同智能算法比較
為了驗(yàn)證BES 類算法的優(yōu)越性,選取粒子群優(yōu)化(particle swarm optimization,PSO)算法與麻雀搜索算法(sparrow search algorithm,SSA)進(jìn)行對(duì)比。采用相同思路嵌入EM 算法的迭代過程,構(gòu)成PSOEM 算 法 與SSA-EM 算 法,并 與IBES-EM、BESEM 和EM 算法進(jìn)行對(duì)比,如圖3(c)所示。由圖3(c)可知,在絕大部分聚類數(shù)目下,PSO-EM 與SSAEM 算法的BIC 值高于BES-EM 與IBES-EM 算法,這證明了BES 類算法能夠得到更好的聚類結(jié)果。
依 據(jù)BIC 值 選 取EM、PSO-EM、SSA-EM、BES-EM 與IBES-EM 算法的最優(yōu)聚類數(shù)目分別為10、9、7、9 與11,并繪制最優(yōu)聚類數(shù)目下各算法收斂曲線如圖3(d)所示。由圖3(d)可知,IBES-EM 算法的似然函數(shù)始終處于上升狀態(tài),在迭代約9 次后便領(lǐng)先其余算法,收斂性能最佳。
選取IBES-EM-GMM 聚類模型中樣本數(shù)目較多的7 類氣象模式下風(fēng)速、風(fēng)向、氣溫?cái)?shù)據(jù)的3 維分布進(jìn)行展示,詳見附錄A 圖A4。在數(shù)學(xué)層面,各氣象模式隸屬于不同參數(shù)的多元高斯分布;在物理層面,由于氣象四要素的數(shù)值分布有差異,各氣象模式均具有一定物理意義。例如圖A4 中,氣象模式1 代表中風(fēng)速、中高氣溫氣象條件;氣象模式2 代表中低風(fēng)速,東南風(fēng)向(歸一化在0.75~1 之間,即270°~360°)氣象條件。
點(diǎn)預(yù)測(cè)評(píng)價(jià)指標(biāo)選取歸一化平均絕對(duì)誤差eNMAE與均方根誤差eNRMSE,概率預(yù)測(cè)的評(píng)價(jià)指標(biāo)選取可靠性[4]、區(qū)間平均寬度與技能分?jǐn)?shù)[6],詳見附錄A。其中,可靠性絕對(duì)值越接近于0,則概率預(yù)測(cè)結(jié)果與設(shè)定的置信度越契合;區(qū)間平均寬度越小,則置信區(qū)間聚集不確定性的能力越強(qiáng);技能分?jǐn)?shù)恒為負(fù)值,是對(duì)所有置信度下概率預(yù)測(cè)結(jié)果的綜合評(píng)價(jià),其值越接近于0,代表概率預(yù)測(cè)結(jié)果越好。
3.2.1 單點(diǎn)預(yù)測(cè)結(jié)果對(duì)比
基于3.1 節(jié)算例分析結(jié)果,選取IBES-EMGMM、 BES-EM-GMM、 SSA-EM-GMM、 EMGMM 聚類模型的最佳聚類數(shù)目分別為11、9、7、10,利用CNN-GRU 網(wǎng)絡(luò)對(duì)基于4 種聚類模型氣象聚類后的訓(xùn)練集以及未進(jìn)行聚類的原始訓(xùn)練集進(jìn)行訓(xùn)練,并以15 min 為一個(gè)時(shí)段進(jìn)行預(yù)測(cè),基于2018 年3 月15 日00:00 至3 月18 日00:00 的 氣 象 預(yù) 報(bào) 數(shù) 據(jù)進(jìn)行短期風(fēng)電功率單點(diǎn)預(yù)測(cè)。預(yù)測(cè)曲線對(duì)比如圖4所示,該時(shí)段各模型的預(yù)測(cè)信息對(duì)比如表1 所示。
圖4 單點(diǎn)預(yù)測(cè)結(jié)果對(duì)比Fig.4 Comparison of single-point forecasting results
由表1 可知,該時(shí)段下4 種聚類模型均包含多種氣象模式,因此該時(shí)段的預(yù)測(cè)效果對(duì)比具有一定的代表性。相較于無聚類,4 種聚類模型的點(diǎn)預(yù)測(cè)精度均有提高,論證了氣象分型的有效性。其中,IBES-EM-GMM 聚類模型具有相對(duì)最好的點(diǎn)預(yù)測(cè)效果,其eNMAE與eNRMSE分別為4.52%與5.82%,表明本文所提改進(jìn)算法的優(yōu)勢(shì)。
表1 不同聚類模型預(yù)測(cè)信息對(duì)比Table 1 Comparison of forecasting information of different clustering models
如圖4(a)所示,在風(fēng)電功率處于峰谷與拐點(diǎn)階段,無聚類與EM-GMM 聚類模型的預(yù)測(cè)誤差較大,而IBES-EM-GMM 聚類模型能夠在整個(gè)時(shí)段內(nèi)準(zhǔn)確擬合風(fēng)電功率的波動(dòng)趨勢(shì)。圖4(b)中,SSA-EMGMM 聚類模型在時(shí)段80 至160 左右的精度遠(yuǎn)低于其余模型;BES-EM-GMM 聚類模型在最后20 個(gè)時(shí)段誤差較大。綜合而言,本文提出的IBES-EMGMM 聚類模型具有最好的點(diǎn)預(yù)測(cè)效果。然而,在拐點(diǎn)與波動(dòng)劇烈的時(shí)段下,IBES-EM-GMM 聚類模型的精度也有下降。這也表明了單點(diǎn)預(yù)測(cè)的局限性與通過誤差建模進(jìn)一步修正預(yù)測(cè)結(jié)果的必要性。該時(shí)段下每日各聚類模型的預(yù)測(cè)精度對(duì)比見附錄B圖B1。
3.2.2 概率預(yù)測(cè)結(jié)果對(duì)比
選 取80%、85%、90%、95% 置 信 度,利 用Cornish-Fisher 級(jí)數(shù)對(duì)各聚類模型依據(jù)氣象條件劃分后的訓(xùn)練集以及未聚類的原始訓(xùn)練集進(jìn)行誤差建模。不同預(yù)測(cè)時(shí)間尺度下的預(yù)測(cè)指標(biāo)對(duì)比見附錄B表B1,各置信度下的概率預(yù)測(cè)結(jié)果詳細(xì)對(duì)比見圖B2。其概率預(yù)測(cè)指標(biāo)對(duì)比如表1 和圖B3 所示。由表1 和圖B3 可得以下結(jié)論:
1)無聚類的概率預(yù)測(cè)結(jié)果最差;IBES-EMGMM 聚類模型的短期概率預(yù)測(cè)結(jié)果最優(yōu);BESEM-GMM 聚類模型對(duì)應(yīng)的技能分?jǐn)?shù)略優(yōu)于EM 聚類模型,而SSA-EM-GMM 聚類模型的技能分?jǐn)?shù)在4 種聚類模型中最差。這一方面表明氣象分型能夠有效提升概率預(yù)測(cè)準(zhǔn)確性,另一方面也論證了IBES算法的優(yōu)勢(shì)。
2)根據(jù)附錄B 圖B3 可知,無聚類的概率預(yù)測(cè)結(jié)果雖具有可靠性,但區(qū)間寬度過大,導(dǎo)致其提供的不確定性信息有限。IBES-EM-GMM 聚類模型利用了相對(duì)最窄的置信區(qū)間(區(qū)間平均寬度不超過25 MW)提供了最可靠(可靠性值在2%以內(nèi))的概率預(yù)測(cè)結(jié)果。BES-EM-GMM 聚類模型在可靠性方面優(yōu)于EM-GMM 聚類模型,但其區(qū)間平均寬度相對(duì)更寬,因此,二者的效果較為接近。
3)附錄B 圖B3(a)中,雖然85%與80%置信度下BES-EM-GMM 聚類模型相較IBES-EM-GMM聚類模型的可靠性絕對(duì)值更低,但I(xiàn)BES-EM-GMM聚類模型的可靠性值為正,意味著實(shí)際預(yù)測(cè)區(qū)間能夠囊括比給定置信度更多的實(shí)際值。因此,就實(shí)際運(yùn)行而言,IBES-EM-GMM 聚類模型在85% 與80%置信度下的概率預(yù)測(cè)結(jié)果更優(yōu)。
SSA-EM-GMM 聚類模型在該段時(shí)間的預(yù)測(cè)效果受到了聚類后樣本數(shù)目的影響。如表1 所示,其樣本數(shù)最少的模式僅有9 個(gè)樣本,進(jìn)而導(dǎo)致其技能分?jǐn)?shù)僅為-0.203 9。不同時(shí)間尺度下的預(yù)測(cè)結(jié)果對(duì)比見附錄B 圖B4。
3.3.1 單年樣本魯棒性檢驗(yàn)
為進(jìn)一步驗(yàn)證IBES-EM-GMM 聚類模型概率預(yù)測(cè)結(jié)果的魯棒性,對(duì)各模型的訓(xùn)練集重復(fù)訓(xùn)練10 次,并以1 d 96 點(diǎn)為預(yù)測(cè)單位,對(duì)單年樣本下測(cè)試集共73 d 的風(fēng)電功率進(jìn)行10 次預(yù)測(cè)。評(píng)價(jià)指標(biāo)采用eNRMSE與技能分?jǐn)?shù)。其中技能分?jǐn)?shù)的計(jì)算選取概率值q=5%,10%,15%,…,95%。各聚類模型評(píng)價(jià)指標(biāo)的概率分布如圖5 所示,其均值與標(biāo)準(zhǔn)差對(duì)比如表2 所示。
由圖5 可知,基于BES 算法的兩種聚類模型對(duì)應(yīng)指標(biāo)的概率分布在偏度與峰度上均優(yōu)于其余所有模型;而IBES-EM-GMM 聚類模型在偏度上略優(yōu)于BES-EM-GMM 聚類模型。由表2 可知,IBES-EMGMM 聚類模型的eNRMSE為7.58%,技能分?jǐn)?shù)為-0.419 6,分別超過其余模型1% 與0.04 以上;同時(shí),IBES-EM-GMM 聚類模型的eNRMSE與技能分?jǐn)?shù)的標(biāo)準(zhǔn)差均最小。因此,上述結(jié)果均表明,IBESEM-GMM 聚類模型的點(diǎn)預(yù)測(cè)與概率預(yù)測(cè)結(jié)果均具有最強(qiáng)的魯棒性。各聚類模型區(qū)間寬度與可靠性對(duì)比見附錄C 圖C1,IBES-EM-GMM 聚類模型各氣象模式與無聚類的預(yù)測(cè)結(jié)果對(duì)比詳見圖C2 和表C1。
圖5 不同聚類模型預(yù)測(cè)指標(biāo)的概率分布Fig.5 Probability distribution of forecasting indicators of different clustering models
表2 不同聚類模型魯棒性檢驗(yàn)結(jié)果對(duì)比Table 2 Comparison of robustness test results of different clustering models
在實(shí)際應(yīng)用過程中,當(dāng)某一氣象模式樣本數(shù)量極少時(shí),重新遍歷該模式所有樣本,按照式(11)計(jì)算各樣本歸于每類模式的后驗(yàn)概率,并將其合并至后驗(yàn)概率第2 高的氣象模式。若合并后某一氣象模式樣本數(shù)仍過少,則重復(fù)上述過程將該模式進(jìn)一步合并,直至所有氣象模式包含的樣本數(shù)量滿足預(yù)測(cè)需求(至少百余條以上)。有關(guān)氣象模式合并的過程詳見附錄D。
3.3.2 氣象數(shù)據(jù)誤差對(duì)聚類模型預(yù)測(cè)結(jié)果的影響
實(shí)際預(yù)測(cè)中,氣象預(yù)報(bào)數(shù)據(jù)往往存在一定誤差。為了進(jìn)一步分析氣象數(shù)據(jù)誤差對(duì)聚類模型預(yù)測(cè)準(zhǔn)確性的影響,以單年樣本中的氣象預(yù)報(bào)數(shù)據(jù)為基準(zhǔn),并以預(yù)測(cè)過程中常見的高斯噪聲形式為例,對(duì)整個(gè)單年樣本的氣象四要素預(yù)報(bào)數(shù)據(jù)疊加如式(19)所示的噪聲。
令cnoise分別取0.2、0.5、1、2、5,并將噪聲序列疊加至原氣象預(yù)報(bào)數(shù)據(jù)中,比較IBES-EM-GMM、EM-GMM 聚類模型與無聚類模型對(duì)整個(gè)測(cè)試集的概率預(yù)測(cè)效果。相關(guān)指標(biāo)的計(jì)算與3.3.1 節(jié)一致,其結(jié)果如表3 所示。
表3 不同噪聲系數(shù)下不同聚類模型的預(yù)測(cè)精度Table 3 Forecasting accuracy of different clusteringmodels with different noise coefficients
由表3 可知,在0.2 與0.5 的噪聲系數(shù)下,由于噪聲比例較低,其對(duì)于精度影響較小;而當(dāng)噪聲系數(shù)達(dá)到1 時(shí),各聚類模型的精度均出現(xiàn)了明顯的下降;噪聲系數(shù)超過2 時(shí),預(yù)測(cè)效果進(jìn)一步惡化。由于噪聲系數(shù)超過2 后,輸入基本以噪聲為主,因此噪聲系數(shù)為5 時(shí)的預(yù)測(cè)結(jié)果精度下降不明顯。在不同噪聲系數(shù)下,IBES-EM-GMM 聚類模型預(yù)測(cè)效果均最優(yōu)。同時(shí),在噪聲系數(shù)不斷增大的過程中,IBES-EMGMM 聚類模型預(yù)測(cè)結(jié)果受影響的程度相對(duì)最低,且當(dāng)噪聲占據(jù)主導(dǎo)的情況下,其技能分?jǐn)?shù)仍達(dá)到-0.804 2,分別超過EM-GMM 聚類模型與無聚類模型0.09 與0.5 以上。
IBES-EM-GMM 聚類模型之所以能夠在誤差影響下保證魯棒性,是因?yàn)槠湓趯?duì)含誤差的氣象數(shù)據(jù)進(jìn)行聚類的過程中,一方面對(duì)不同氣象條件下的數(shù)據(jù)進(jìn)行了聚類劃分,另一方面也對(duì)不同誤差條件下的數(shù)據(jù)進(jìn)行了恰當(dāng)劃分,因而便于數(shù)據(jù)驅(qū)動(dòng)類預(yù)測(cè)模型進(jìn)行“學(xué)習(xí)”。
3.3.3 3 年樣本魯棒性檢驗(yàn)
本節(jié)對(duì)3 年樣本進(jìn)行算例仿真,以進(jìn)一步論證IBES-EM-GMM 聚類模型在聚合更多氣象的大樣本下概率預(yù)測(cè)結(jié)果的魯棒性。同樣以96 個(gè)時(shí)段為預(yù)測(cè)單位,對(duì)測(cè)試集共234 d 的風(fēng)電功率進(jìn)行10 次預(yù)測(cè),得到2 340 條評(píng)價(jià)指標(biāo)序列,其均值與標(biāo)準(zhǔn)差對(duì)比如表4 所示。
表4 大樣本下不同聚類模型魯棒性檢驗(yàn)結(jié)果對(duì)比Table 4 Comparison of robustness test results of different clustering models with large sample number
在聚合更多氣象條件的大樣本下,氣象聚類后的預(yù)測(cè)結(jié)果精度提升顯著。其中IBES-EM-GMM聚類模型的eNRMSE達(dá)到6.15%,技能分?jǐn)?shù)為-0.354 1,相較無聚類提升了1 倍。此外,采用智能算法改進(jìn)后的聚類模型相較于EM-GMM 聚類模型的預(yù)測(cè)效果提升同樣明顯。三者中效果相對(duì)較差的SSA-EM-GMM 聚類模型的技能分?jǐn)?shù)相較于EMGMM 聚類模型提升約0.17,而3.3.1 節(jié)中,對(duì)應(yīng)技能分?jǐn)?shù)提升僅0.01。上述結(jié)果表明,在引入更多氣象數(shù)據(jù)參與聚類訓(xùn)練的情況下,由于樣本量更為充足,氣象分型對(duì)預(yù)測(cè)結(jié)果的提升更為明顯。
上述魯棒性分析結(jié)果分別從小樣本、氣象誤差、大樣本的角度充分驗(yàn)證了IBES-EM-GMM 聚類模型的魯棒性與有效性。
本文提出一種基于IBES-EM-GMM 聚類的短期風(fēng)電功率概率預(yù)測(cè)方法。該方法能夠根據(jù)氣象數(shù)據(jù)的性質(zhì)自適應(yīng)劃分多個(gè)氣象模式,并利用CNNGRU 網(wǎng)絡(luò)與Cornish-Fisher 級(jí)數(shù)實(shí)現(xiàn)各氣象模式的分組訓(xùn)練與預(yù)測(cè)。通過算例仿真可得出以下結(jié)論:
1)基于IBES-EM 算法改進(jìn)的GMM 聚類模型相較于其余算法具有更好的收斂性能,能夠得到相對(duì)更優(yōu)的氣象聚類分型結(jié)果。
2)相較于不進(jìn)行氣象聚類分型,通過各種氣象聚類模型得到的概率預(yù)測(cè)結(jié)果在點(diǎn)預(yù)測(cè)精度與置信區(qū)間可靠度等方面均有顯著提升。其中,IBESEM-GMM 聚類模型對(duì)應(yīng)的概率預(yù)測(cè)結(jié)果具有最佳的準(zhǔn)確性。
3)當(dāng)氣象預(yù)報(bào)數(shù)據(jù)存在一定誤差時(shí),IBESEM-GMM 聚類模型仍然能夠得到較為精確的概率預(yù)測(cè)結(jié)果;隨著樣本規(guī)模的增大,基于氣象分型的預(yù)測(cè)方法優(yōu)勢(shì)更加顯著,且IBES-EM-GMM 聚類模型的魯棒性得到進(jìn)一步提升。
本文的研究為單風(fēng)電場(chǎng)的概率預(yù)測(cè)提供了思路,通過氣象聚類分型,能夠在常規(guī)概率預(yù)測(cè)模型的基礎(chǔ)上進(jìn)一步提升概率預(yù)測(cè)的準(zhǔn)確性。后續(xù)研究工作將致力于進(jìn)一步細(xì)化氣象特征,如降水量等,并探究在更多氣象特征下IBES-EM-GMM 聚類模型的聚類效果與概率預(yù)測(cè)的魯棒性。此外,融合多站點(diǎn)、多類型數(shù)據(jù)的氣象預(yù)報(bào)修正/空間降尺度策略與基于多風(fēng)電場(chǎng)聯(lián)合氣象聚類分型的概率預(yù)測(cè)也將是下一步研究計(jì)劃關(guān)注的重點(diǎn)。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。