摘 要:為提高短期風(fēng)電功率預(yù)測的準確性,解決點預(yù)測難以描述風(fēng)電功率不確定性,且在數(shù)據(jù)發(fā)生突變時傳統(tǒng)GRU無法準確跟蹤數(shù)據(jù)突變問題,提出一種基于分位數(shù)回歸的改進權(quán)重GRU風(fēng)電功率區(qū)間預(yù)測模型(QR-EGRU)。首先采用改進的自適應(yīng)小波閾值去噪方法對原始數(shù)據(jù)降噪處理,減少數(shù)據(jù)噪聲影響;然后引入兩個更新門權(quán)重矩陣代替?zhèn)鹘y(tǒng)更新門權(quán)重矩陣,新的權(quán)重矩陣采用信息熵動態(tài)調(diào)整矩陣的變化趨勢,量化權(quán)重的變化程度,構(gòu)建信息熵權(quán)重門控循環(huán)單元(EGRU)網(wǎng)絡(luò);最后基于分位數(shù)回歸算法獲取不同分位數(shù)下的點預(yù)測概率區(qū)間。通過風(fēng)電場的有功功率進行實驗驗證,結(jié)果表明:相比于其他對比方法,所提出的模型在相同實驗條件下能提高預(yù)測精度,具有較好的風(fēng)電功率區(qū)間預(yù)測性能。
關(guān)鍵詞:風(fēng)電功率;預(yù)測;門控循環(huán)單元;分位數(shù)回歸;信息熵;小波閾值去噪
中圖分類號:TM614;TP18 " " " " " " " 文獻標志碼:A
0 引 言
短期風(fēng)電功率預(yù)測為提前1~3 d的預(yù)測,用于日前發(fā)電計劃制定、備用容量安排等。準確的短期風(fēng)電功率預(yù)測在優(yōu)化電網(wǎng)調(diào)度計劃、滿足風(fēng)電并網(wǎng)技術(shù)標準發(fā)展要求、提高設(shè)備利用率和滿足市場交易需求等方面具有重要的實際意義和應(yīng)用價值[1]。由于風(fēng)電功率具有隨機性和波動性,確定性預(yù)測不能提供預(yù)測值的分布信息,使決策者難以僅根據(jù)確定性預(yù)測值做出最優(yōu)運行策略。因此,研究者針對風(fēng)電功率概率預(yù)測開展研究。
概率預(yù)測能提供具體預(yù)測值及預(yù)測結(jié)果的概率信息,量化點預(yù)測的不確定性。概率預(yù)測可分為概率分布預(yù)測、隨機場景和區(qū)間預(yù)測[2]。概率分布預(yù)測是未來風(fēng)電功率的概率密度預(yù)測,通常假定預(yù)測對象符合現(xiàn)有的參數(shù)分布,局限性強。隨機場景是未來風(fēng)電功率多個可能取值的場景。區(qū)間預(yù)測是未來風(fēng)電功率可能變化的范圍,其結(jié)果為風(fēng)電功率的中心預(yù)測區(qū)間,表現(xiàn)更為直觀,便于決策者直接使用。針對區(qū)間預(yù)測問題,國內(nèi)外學(xué)者開展了相關(guān)研究[3-5]。根據(jù)是否假設(shè)風(fēng)電功率或預(yù)測誤差服從某一分布,區(qū)間預(yù)測分為參數(shù)法和非參數(shù)法。參數(shù)法假設(shè)風(fēng)電功率或誤差服從某種分布,如高斯分布[6]、指數(shù)分布[7]等。當(dāng)實際分布與假設(shè)分布不一致時,將導(dǎo)致預(yù)測結(jié)果不可靠。非參數(shù)法集中于先建立點預(yù)測模型然后通過分位數(shù)回歸[8]、高斯過程回歸[9]和核密度估計[10-11]等方法得到置信條件下的預(yù)測區(qū)間和概率密度函數(shù)。非參數(shù)方法有效避免了因假設(shè)分布不合理帶來誤差的問題。
由于風(fēng)電場數(shù)據(jù)具有強波動性和非平穩(wěn)性,考慮獲得準確預(yù)測區(qū)間的同時還需要考慮如何應(yīng)對突變數(shù)據(jù)的影響。近年來,門控循環(huán)單元(gated recurrent unit,GRU)網(wǎng)絡(luò)因結(jié)構(gòu)簡單、訓(xùn)練難度低,在時序數(shù)據(jù)預(yù)測中獲得廣泛應(yīng)用[12]。但已有算法主要通過優(yōu)化GRU門單元結(jié)構(gòu),提高訓(xùn)練速度,或與特征提取算法結(jié)合[12]以提高預(yù)測性能。實際應(yīng)用中,GRU的門控單元在訓(xùn)練過程中有較強的隨機性,當(dāng)數(shù)據(jù)具有較強非平穩(wěn)性時,傳統(tǒng)GRU模型未凸顯出對強波動性數(shù)據(jù)變化趨勢的刻畫能力,因而無法針對發(fā)生突變的數(shù)據(jù)進行有效跟蹤,從而影響預(yù)測結(jié)果[13]。
為提高模型對數(shù)據(jù)變化的敏感程度,提供預(yù)測結(jié)果的概率信息,本文提出一種基于分位數(shù)回歸的改進權(quán)重GRU風(fēng)電功率區(qū)間預(yù)測模型(quantile regression-entropy gated recurrent unit,QR-EGRU)。采用改進小波閾值去噪方法去除數(shù)據(jù)噪聲,減小噪聲的影響;構(gòu)建基于信息熵(in formation entropy,IE)改進的權(quán)重門控循環(huán)單元(entropy gated recurrent unit,EGRU)模型。由于信息熵能夠通過刻畫數(shù)據(jù)的變化,反映不確定性事件發(fā)生的概率,不確定性越大,越能體現(xiàn)風(fēng)電功率的波動性[14]。因此,引入兩個更新門權(quán)重矩陣代替?zhèn)鹘y(tǒng)更新門權(quán)重矩陣,新的權(quán)重矩陣采用信息熵動態(tài)調(diào)整矩陣的變化趨勢,量化權(quán)重的變化程度;采用分位數(shù)回歸算法計算風(fēng)電功率的預(yù)測區(qū)間。在相同的實驗條件下,將所提出的模型與其他預(yù)測方法相對比,驗證模型的區(qū)間預(yù)測效果,及跟蹤突變數(shù)據(jù)變化趨勢的能力。
1 改進的小波閾值去噪算法
小波閾值去噪具有良好的時頻定位特性,能較好地分解非平穩(wěn)信號。影響小波去噪的主要因素包括閾值函數(shù)的選擇和閾值的設(shè)定。
1.1 改進的閾值函數(shù)
小波閾值去噪算法中,分解后噪聲系數(shù)需要通過閾值函數(shù)濾除,去噪結(jié)果直接受閾值函數(shù)影響。常用的閾值函數(shù)分為硬閾值和軟閾值函數(shù),其數(shù)學(xué)表達式分別為:
[ωj,k=ωj,k, |ωj,k|≥λ0, |ωj,k|lt;λ] (1)
[ωj,k=sgn(ωj,k)(|ωj,k|-λ), |ωj,k|≥λ0, |ωj,k|lt;λ ] (2)
式中:[j]——分解層數(shù);[ωj,k]——閾值處理前第[j]層下的第[k]個小波系數(shù);[λ]——臨界閾值;[sgn(?)]——符號函數(shù);[ωj,k]——處理后的小波系數(shù)。由于硬閾值函數(shù)不連續(xù),在[±λ]處存在跳變點,去噪后的信號易存在尖峰毛刺。而軟閾值函數(shù)雖具有較好的連續(xù)性,去噪后信號相對平滑,但處理前后的小波系數(shù)存在恒定的閾值偏差,重構(gòu)后部分有用信號會被濾除,導(dǎo)致信號失真。
為克服上述缺陷,本文通過改進得到新的閾值函數(shù)。新的閾值函數(shù)需滿足:1)在定義域內(nèi)具有連續(xù)性且高階可導(dǎo),保證去噪時不會產(chǎn)生斷點;2)漸進線為[ωj,k=ωj,k],[ωj,k]與[ωj,k]之間的偏差逐漸減?。?)同時具有軟、硬閾值函數(shù)特征。因此,新的閾值函數(shù)引入帶指數(shù)參數(shù)的閾值估計器,改進后的閾值函數(shù)為:
[ωj,k=ωj,k-sgn(ωj,k)λeαsinωj,kλ-1·ωj,k-λ, |ωj,k|≥λ0, |ωj,k|lt;λ] (3)
式中:[α]——調(diào)節(jié)參數(shù),通過調(diào)節(jié)[α]使新的閾值函數(shù)可轉(zhuǎn)變?yōu)檐?、硬閾值函?shù),從而改善小波閾值降噪的濾波效果。對式(3)進行分析有:
1)當(dāng)[|ωj,k|→λ]時,[limωj,k→λωj,k=0],改進的閾值函數(shù)具有連續(xù)性;2)當(dāng)[ωj,k→±∞]時,[limωj,k→±∞ωj,kωj,k=1],即新閾值函數(shù)以[ωj,k]=[ωj,k]為漸近線,且隨著[ωj,k]的增大,小波系數(shù)估計值[ωj,k]逐漸接近[ωj,k];3)同時具有軟、硬閾值函數(shù)特征:當(dāng)α=0時,[eαsinωj,kλ-1·ωj,k-λ=1],[ωj,k=ωj,k-sgn(ωj,k)λ],函數(shù)等價于軟閾值函數(shù),當(dāng)[α→+∞]時,[λeαsinωj,kλ-1·ωj,k-λ=0],閾值函數(shù)等同于硬閾值函數(shù)。
綜上,改進的閾值函數(shù)滿足改進所需的條件。為直觀觀察并分析改進閾值函數(shù)特性,取不同[α]值,繪制閾值函數(shù)如圖1所示(閾值為0.5)。由圖1可看出:當(dāng)[α=0.1]時,與軟閾值接近重合;隨著[α]增加,當(dāng)[α=35]時,上升趨勢基本保持不變,且改進的閾值函數(shù)上升趨勢更平坦,能夠更好地實現(xiàn)降噪。因此,通過調(diào)節(jié)參數(shù)[α]使閾值函數(shù)具有自適應(yīng)性,可實現(xiàn)在軟、硬閾值函數(shù)區(qū)間內(nèi)平滑過渡,保證良好的連續(xù)性,克服恒定偏差,提高小波閾值降噪的濾波效果。
1.2 閾值的確定
通過設(shè)定恰當(dāng)?shù)拈撝底鳛榕卸ㄩT限,舍棄小于閾值的小波系數(shù),保留大于閾值的小波系數(shù),實現(xiàn)去噪。Donoho等[15]提出固定閾值計算表達式為:
[λ=σn2lnN] (4)
式中:[σn=median(|ωj,k|)/0.6745]——噪聲的均方差;[N]——數(shù)據(jù)總數(shù);[median(?)]——中值函數(shù)。由于含有噪聲的小波系數(shù)隨分解尺度增加使得幅值減小,信號中的小波系數(shù)的幅值會越來越大,因此在不同尺度上需要選取不同閾值,使其能夠適應(yīng)每層的噪聲分布。閾值過小,易出現(xiàn)消噪不足,造成信號弱特征成分被噪聲覆蓋;反之,會使有用信號被濾除。為解決去噪不徹底現(xiàn)象,本文采用文獻[16]提出的自適應(yīng)閾值:
[λj=σn2lnNjlog2(j+1)] (5)
式中:[Nj]——第[j]層高頻系數(shù)[ωj,k]的數(shù)量,隨著分解層數(shù)的增加,可對分解后的小波系數(shù)進行修正。
由上述設(shè)計的可調(diào)閾值函數(shù)結(jié)合閾值的設(shè)定對分解后的各層小波系數(shù)進行量化去噪,重構(gòu)后得到去噪信號,算法實現(xiàn)的具體流程如圖2所示。
2 信息熵權(quán)重門控循環(huán)單元(EGRU)
信息熵使用定量的方式度量事件或信息不確定性程度。隨機變量[X]的信息熵[H]定義為:
[H(X)=E=-i=1Np(xi)log2p(xi)] (6)
式中:[p(xi)]——[N]種獨立結(jié)果每個結(jié)果出現(xiàn)的概率。信息熵越大,信息的不確定性越大。因此,通過概率描述信息分布可衡量不同概率時間包含的信息量。
針對風(fēng)電功率數(shù)據(jù)的非平穩(wěn)特性,本文提出一種新的信息熵權(quán)重門控循環(huán)單元(EGRU)網(wǎng)絡(luò)。與GRU網(wǎng)絡(luò)相比,EGRU引入基于信息熵的改進權(quán)重矩陣組合代替?zhèn)鹘y(tǒng)更新門權(quán)重矩陣,新單元利用信息熵動態(tài)調(diào)整更新門對前一狀態(tài)信息的遺忘程度和對新狀態(tài)信息的保留程度,解決GRU單元難以量化跟蹤突變數(shù)據(jù)變化趨勢的問題,有效提升模型的預(yù)測精度。EGRU網(wǎng)絡(luò)的單元結(jié)構(gòu)如圖3所示。
EGRU設(shè)計兩個新的更新門權(quán)重矩陣[Wz1]和[Wz2]代替原始矩陣[Wz]。[Wz1]和[Wz2]分別與已激活信息熵[σ(E)]和[(1-σ(E))]相乘得到新的門控輸出[z1]和[z2]。以[t]時刻狀態(tài)的輸入[xt]和前一時刻的隱狀態(tài)[ht-1]作線性變換,通過sigmoid激活函數(shù)與相應(yīng)的權(quán)重矩陣計算重置門和更新門的輸出。分別將z1和[z2]相加得到新的更新門[zt],具體計算公式為:
[z1=σ(Wz1[ht-1, xt]⊙σ(E))] (7)
[z2=σ(Wz2[ht-1,xt]⊙(1-σ(E))] (8)
[rt=σ(Wr[ht-1,xt])] (9)
[zt=z1+z2] (10)
[ht=tanh(Wh[rt⊙ht-1,xt])] (11)
[ht=(1-zt)⊙ht-1+zt⊙ht] (12)
式中:[[ht-1],[xt]]——輸入向量;⊙——Hadamard乘積;[E]——輸入數(shù)據(jù)的信息熵矩陣;[rt]——重置門輸出;[Wr]、[Wh]——重置門和中間狀態(tài)的權(quán)重矩陣;[ht]——中間狀態(tài);tanh——雙曲正切激活函數(shù);[ht]——輸出信息。
3 基于分位數(shù)回歸的EGRU區(qū)間預(yù)測
3.1 分位數(shù)回歸(QR)
分位數(shù)回歸是依據(jù)因變量的條件分位數(shù)對自變量進行回歸,得到給定分位數(shù)下的回歸模型。假設(shè)自變量[X=[x1,x2,…, xn]],因變量[Y=[y1,y2,…,yn]],線性分位數(shù)回歸模型的表達形式為:
[Qyi(τ|xi)=β(τ)xi,i=1,2,…,n] (13)
式中:[Qyi(τ|xi)]——因變量[yi]的第[τ]個條件分位數(shù),[τ]的范圍為(0,1),[xi]是[m+1]維向量;[β(τ)]——回歸系數(shù)的向量,[β(τ)=[β0(τ), β1(τ), …, βm(τ)]]。當(dāng)模型的訓(xùn)練數(shù)據(jù)已知,求不同分位數(shù)點的回歸系數(shù)向量;[β(τ)]的問題可轉(zhuǎn)化為求最小化損失函數(shù)[L],即:
[βτ=argminβL=argminβi=1nγτyi-xTiβ(τ)] (14)
式中:[γτ]——傾斜絕對值函數(shù),其計算公式為:
[γτ(s)=τs, s≥0(τ-1)s, slt;0] (15)
式中:[s=yi-xTiβ(τ)]。
3.2 QR-EGRU模型構(gòu)建
由于式(13)為線性分位數(shù)回歸模型,只適用于研究自變量和因變量間的線性關(guān)系,而實際風(fēng)電功率數(shù)據(jù)更多具有非線性關(guān)系。由Taylor[17]提出的分位數(shù)回歸神經(jīng)網(wǎng)絡(luò)模型(quantile regression neural network,QRNN)公式為:
[L(τi)=minv,wt|yi≥f(xi,v,w)nγz(τi)|yi-f(xi,v,w)|+λ1k,iw2ki+λ2iv2i]
(16)
式中:[λ1]和[λ2]——正則化參數(shù);[v]和[w]——權(quán)重參數(shù);[i]——網(wǎng)絡(luò)輸入層節(jié)點;[k]——隱藏層節(jié)點。在式(16)的基礎(chǔ)上得出QR-EGRU模型的非線性分位數(shù)回歸損失函數(shù)表示為:
[L(τi)=minW(τi)i=1nγz(τi)yi-fxi,W(τi)] (17)
式中:[W(τi)=[Wz(τi),Wh(τi)]]——EGRU在不同分位點[τi]下的權(quán)重參數(shù)。
基于QR-EGRU模型區(qū)間預(yù)測步驟如下:
1)數(shù)據(jù)預(yù)處理:基于改進小波閾值去噪算法去除噪聲。將去噪后的數(shù)據(jù)集劃分為訓(xùn)練集和測試集,對數(shù)據(jù)集作歸一化處理,使數(shù)據(jù)更為集中。
2)設(shè)置EGRU網(wǎng)絡(luò)超參數(shù),如輸入層、隱藏層和輸出層大小等,初始化權(quán)重參數(shù)和偏置,訓(xùn)練EGRU模型。當(dāng)滿足收斂條件時,訓(xùn)練結(jié)束,得到EGRU點預(yù)測模型。
3)構(gòu)建QR-EGRU模型,計算分位數(shù)損失函數(shù),如不滿足收斂條件,利用Adam優(yōu)化器更新網(wǎng)絡(luò)參數(shù),當(dāng)達到最大迭代次數(shù),得到最優(yōu)參數(shù)模型。對輸出反歸一化,得到區(qū)間預(yù)測結(jié)果。
4)利用測試集驗證QR-EGRU的預(yù)測性能。
基于QR-EGRU的區(qū)間預(yù)測框圖如圖4所示。
4 實驗分析
4.1 數(shù)據(jù)來源
實驗數(shù)據(jù)來源于Kaggle比賽的風(fēng)電數(shù)據(jù)[18],選用兩組數(shù)據(jù),第一組為2019年11月1日—12月26日數(shù)據(jù),第二組為2020年1月1日—2月24日數(shù)據(jù),兩組樣本數(shù)量分別為8064和7920,每日樣本點數(shù)量為144。兩組共270條數(shù)據(jù)均用來預(yù)測未來5 d的風(fēng)電功率。
4.2 預(yù)測評價指標
4.2.1 點預(yù)測評價指標
點預(yù)測評價指標包括均方根誤差(root mean square error,RMSE)、平均絕對誤差(mean absolute error,MAE),表達式分別為:
[ERMSE=1Ni=1N(Pri-Ppi)2] (18)
[EMAE=1Ni=1NPri-Ppi] (19)
式中:[Pri]——風(fēng)功率原始值,kW;[Ppi]——風(fēng)功率預(yù)測值,kW;[N]——樣本總數(shù)。
4.2.2 區(qū)間預(yù)測評價指標
區(qū)間預(yù)測評價指標包括預(yù)測區(qū)間覆蓋率(prediction interval coverage probabilrty,PICP)、區(qū)間平均寬度(prediction interval normalized average width,PINAW)以及溫克勒分數(shù)(WS)[19]。PICP表征預(yù)測的可靠性,其值越接近于1,真實值落在預(yù)測區(qū)間的可能性越大。PINAW定義為預(yù)測區(qū)間上下界之間的寬度,寬度越小,預(yù)測值更接近真實值。采用[WS]對預(yù)測結(jié)果的可靠性與敏銳度進行綜合評價,其值越小,模型綜合評價越好,評價指標公式分別為:
[IPICP=1Nn=1NBn] (20)
[IPINAW=1N·Ei=1N(PUi-PDi)] (21)
[WS=1Ni=1NRi] (22)
[Ri=μ, PUi≤Pri≤PDiμ+2(Ui-Pri)κ, Prilt;PUiμ-2(Pri-Li)κ, Prigt;PDi] (23)
式中:[Bn]——布爾量,通過對真實值與上下邊界的值進行比較,落在區(qū)間內(nèi)置為1,否則置位0;[E]——真實值最大值和最小值的差;[PU]和[PD]——預(yù)測區(qū)間的上界和下界;[λ]——預(yù)測區(qū)間寬度;[κ]——顯著性水平。
4.3 數(shù)據(jù)降噪
小波基的選擇影響小波閾值降噪的效果。以Daubechies為小波基函數(shù),dbN小波隨階次[N]的增加消失矩增大。消失矩表示小波變換后的能量集中程度。消失矩越高光滑性越好,頻域的局部化能力越強,頻帶的劃分效果越好。但過高的消失矩,容易使有用信號本身的突變被平滑,導(dǎo)致信息丟失。因此通過對多種小波基和不同分解層數(shù)進行反復(fù)實驗對比,本文選用db10作為小波基對風(fēng)電功率數(shù)據(jù)進行3層小波分解,分解后的數(shù)據(jù)包括1個低頻近似系數(shù)和3個高頻細節(jié)系數(shù)。選用軟、硬閾值函數(shù)和文獻[20]提出的閾值函數(shù)作為對比方法,驗證改進小波閾值去噪法的效果。
以2020年1月1日—2月27日數(shù)據(jù)為例,共8325條。采用不同閾值函數(shù)并訓(xùn)練EGRU模型預(yù)測未來兩天變化趨勢。表1為不同閾值函數(shù)去噪前后的預(yù)測結(jié)果。由表1可得:在相同實驗條件下,基于改進閾值函數(shù)的小波閾值去噪方法具有較小的預(yù)測誤差。相比于原始數(shù)據(jù),RMSE降低了54.1%,MAE降低了53.4%。與其他方法相比,改進閾值去噪方法預(yù)測誤差有明顯降低。
由圖5改進算法的去噪效果與原始數(shù)據(jù)對比可知,原始數(shù)據(jù)波動較為明顯,尤其在尖峰處振蕩較大,與真實值有較大偏差。去噪后,濾除由噪聲帶來的數(shù)據(jù)振蕩,同時保留數(shù)據(jù)突變處信息,從而使得數(shù)據(jù)曲線不至過分平坦,丟失突變信息。
4.4 實驗結(jié)果分析
4.4.1 權(quán)重矩陣變化分析
EGRU模型通過權(quán)重矩陣[Wz1]和[Wz2]改進更新門,選用頻率直方圖繪制權(quán)重矩陣[Wz1]和[Wz2]訓(xùn)練前后變化情況,驗證權(quán)重矩陣在模型訓(xùn)練過程中的作用。為防止網(wǎng)絡(luò)在正向傳遞過程中產(chǎn)生梯度爆炸或消失,對權(quán)重參數(shù)進行初始化。初始化后的參數(shù)服從正態(tài)分布且均為0~1之間的數(shù),如圖6a和圖6c所示。訓(xùn)練結(jié)束后,繪制[Wz1]和[Wz2]的頻率直方圖,如圖6b和圖6d所示。橫坐標代表權(quán)重矩陣取值大小,縱坐標表示該權(quán)重取值出現(xiàn)的次數(shù)。
由圖6可知,模型訓(xùn)練前權(quán)重矩陣范圍集中在[-0.2]~0.2之間,訓(xùn)練后[Wz1]和[Wz2]變化范圍增加到[-0.4]~0.4之間,相比于訓(xùn)練前分布范圍更廣,部分權(quán)重約達到±0.5,權(quán)重參數(shù)頻率明顯增加。權(quán)重的變化刻畫出數(shù)據(jù)的變化趨勢。根據(jù)實驗對比得出,在訓(xùn)練過程中[Wz1]和[Wz2]可根據(jù)數(shù)據(jù)變化趨勢自適應(yīng)調(diào)整權(quán)重大小。
4.4.2 點預(yù)測分析
在相同實驗條件下,選用RNN、LSTM、GRU與EGRU進行對比。EGRU訓(xùn)練批次設(shè)定為64,訓(xùn)練次數(shù)和學(xué)習(xí)率分別為200和0.01,選用線性層作為全連接層。為提高預(yù)測精度,在保證其他參數(shù)相同的情況下,通過不斷調(diào)整網(wǎng)絡(luò)的隱含層數(shù)和神經(jīng)元數(shù)目,確定模型的最優(yōu)參數(shù),從而確定EGRU網(wǎng)絡(luò)結(jié)構(gòu)。實驗最終確定EGRU及各對比模型參數(shù)如表2所示,基于兩組數(shù)據(jù)的預(yù)測誤差如表3所示。
由表3可知,EGRU與RNN、GRU、LSTM相比,均具有最小的RMSE和MAE,為直觀對比各模型點預(yù)測結(jié)果,繪制第二組數(shù)據(jù)預(yù)測曲線如圖7所示。RNN曲線振蕩較大,在曲線平緩處仍有較大誤差。LSTM效果優(yōu)于RNN,但在尖峰處波動較大;GRU較好地擬合曲線變化,但在突變處無法準確顯示;EGRU在GRU的基礎(chǔ)上很好地跟蹤突變點的曲線趨勢,預(yù)測結(jié)果更接近于真實值。由實驗結(jié)果可知,EGRU網(wǎng)絡(luò)基于信息熵的權(quán)重矩陣可更好刻畫數(shù)據(jù)的變化趨勢,在數(shù)據(jù)波動性較為明顯時,具有更好的預(yù)測效果。
將EGRU模型與文獻[21]的Stacking Model及其對比模型進行比較,采用與文獻[20]相同數(shù)據(jù)集及評價指標,預(yù)測結(jié)果如表4所示。從表4可看出,EGRU預(yù)測結(jié)果R2值與其他模型相差甚微,說明EGRU能較好地擬合真實值。均方誤差MSE顯示,相比于Stacking Model及對比模型,EGRU模型具有更小的預(yù)測誤差,從而具有更高的點預(yù)測精度。
4.4.3 區(qū)間預(yù)測分析
為量化點預(yù)測的不確定性,在EGRU模型基礎(chǔ)上,構(gòu)建基于分位數(shù)回歸的QR-EGRU區(qū)間預(yù)測模型。選擇95%和90%的置信區(qū)間,采用QR與RNN、LSTM、GRU相結(jié)合的區(qū)間預(yù)測方法作為對比模型,各模型預(yù)測結(jié)果如表5所示。
由表5可知,在95%置信區(qū)間下,QR-EGRU的區(qū)間覆蓋率比QR-RNN、QR-GRU和QR-LSTM模型分別提高了4.83%、0.28%和2.60%,在90%置信區(qū)間下分別提高了5.95%、0.29%和1.46%。在同一置信水平下,QR-EGRU模型具有最高的區(qū)間覆蓋率。在滿足PICP要求條件下,QR-EGRU比對比模型有更小的PINAW值,說明QR-EGRU的預(yù)測區(qū)間更窄,具有更精確的擬合效果。觀察綜合指標[WS]值,QR-EGRU的[WS]值明顯小于其他對比模型,顯示該模型具有更高的可靠性和敏銳度,是一個綜合評價較好的風(fēng)電功率區(qū)間預(yù)測模型。
為了更直觀地觀察QR-EGRU區(qū)間預(yù)測性能,選取不同區(qū)間下的預(yù)測結(jié)果,繪制第二組數(shù)據(jù)預(yù)測曲線如圖8所示。
由圖8可知:在95%置信度下,真實值全部落在預(yù)測區(qū)間的上下限內(nèi)部,表明即使數(shù)據(jù)波動性較大時EGRU模型也能準確跟蹤風(fēng)電功率的變化趨勢。在90%置信度下,大部分
真實值落在預(yù)測區(qū)間內(nèi)部,且具有較窄的區(qū)間平均寬度,但當(dāng)數(shù)據(jù)變化劇烈時,如在第360個樣本點附近,真實值超出預(yù)測區(qū)間上下限。因此,在實際應(yīng)用中,需要根據(jù)預(yù)測任務(wù)的要求選擇QR-EGRU區(qū)間預(yù)測的置信區(qū)間。
5 結(jié) 論
考慮風(fēng)電場輸出功率波動性和不確定性,點預(yù)測難以描述風(fēng)電功率不確定性,且在數(shù)據(jù)發(fā)生突變時GRU模型無法準確跟蹤數(shù)據(jù)突變問題,本文提出基于分位數(shù)回歸的改進權(quán)重GRU風(fēng)電功率區(qū)間預(yù)測模型,得出以下主要結(jié)論:
1)基于軟、硬閾值去噪算法無法取得較好效果。改進的自適應(yīng)小波閾值算法,通過改變閾值函數(shù)調(diào)節(jié)參數(shù)和閾值能夠自適應(yīng)調(diào)整去噪算法,在有效去除噪聲的同時不使數(shù)據(jù)過于平滑,保留實際數(shù)據(jù)中的突變信息。
2)基于信息熵改進EGRU使網(wǎng)絡(luò)結(jié)構(gòu)可根據(jù)輸入數(shù)據(jù)的變化自適應(yīng)的調(diào)整更新門權(quán)重矩陣系數(shù),該方法相比于傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)變化更為敏感,更好地跟蹤數(shù)據(jù)的變化趨勢,可提高預(yù)測精度。
3)相比于經(jīng)典的參數(shù)模型,提出的基于分位數(shù)回歸和EGRU概率模型能更有效表征風(fēng)電功率預(yù)測結(jié)果的概率分布特性,具有更高的區(qū)間預(yù)測精度。
[參考文獻]
[1] 喬穎, 魯宗相, 閔勇. 提高風(fēng)電功率預(yù)測精度的方法[J]. 電網(wǎng)技術(shù), 2017, 41(10): 3261-3269.
QIAO Y, LU Z X, MIN Y. Research amp; application of raising wind power prediction accuracy[J]. Power system technology, 2017, 41(10): 3261-3269.
[2] 黎靜華, 駱怡辰, 楊舒惠, 等. 可再生能源電力不確定性預(yù)測方法綜述[J]. 高電壓技術(shù), 2021, 47(4):1144-1157.
LI J H, LUO Y C, YANG S H, et al. Review of uncertainty forecasting methods for renewable energy power[J]. High voltage engineering, 2021, 47(4): 1144-1157.
[3] HU J M, HENG J N, WEN J M, et al. Deterministic and probabilistic wind speed forecasting with de-noising-reconstruction strategy and quantile regression based algorithm[J]. Renewable energy, 2020, 162: 1208-1226.
[4] ZHANG C, JI C L, HUA L, et al. Evolutionary quantile regression gated recurrent unit network based on variational mode decomposition, improved whale optimization algorithm for probabilistic short-term wind speed prediction[J]. Renewable energy, 2022, 197: 668-682.
[5] LIU G J, WANG Y, QIN H, et al. Probabilistic spatiotemporal forecasting of wind speed based on multi-network deep ensembles method[J]. Renewable energy, 2023, 209: 231-247.
[6] 韓麗, 喬妍, 景惠甜. 基于誤差分類的風(fēng)電功率區(qū)間評估[J]. 電力系統(tǒng)自動化, 2021, 45(1): 97-104.
HAN L, QIAO Y, JING H T. Interval estimation of wind power based on error classification[J]. Automation of electric power systems, 2021, 45(1): 97-104.
[7] 劉芳, 潘毅, 劉輝, 等. 風(fēng)電功率預(yù)測誤差分段指數(shù)分布模型[J]. 電力系統(tǒng)自動化, 2013, 37(18): 14-19.
LIU F, PAN Y, LIU H, et al. Piecewise exponential distribution model of wind power forecasting error[J]. Automation of electric power systems, 2013, 37(18): 14-19.
[8] 殷豪, 黃圣權(quán), 孟安波, 等. 基于長短期記憶網(wǎng)絡(luò)分位數(shù)回歸的短期風(fēng)電功率概率密度預(yù)測[J]. 太陽能學(xué)報, 2021, 42(2): 150-156.
YIN H, HUANG S Q, MENG A B, et al. Short-term wind power probability density prediction based on long short term " memory " network " quantile " regression[J]. "Acta energiae solaris sinica, 2021, 42(2): 150-156.
[9] ZHANG C, WEI H K, ZHAO X, et al. A Gaussian process regression based hybrid approach for short-term wind " speed " prediction[J]. " Energy " conversion " and management, 2016, 126: 1084-1092.
[10] 余灃, 董存, 王錚, 等. 考慮山東近海不同風(fēng)能天氣特征的風(fēng)電功率區(qū)間預(yù)測模型[J]. 電網(wǎng)技術(shù), 2020, 44(4): 1238-1247.
YU F, DONG C, WANG Z, et al. Wind power interval forecasting model considering different wind energy weather "characteristics "in "Shandong "offshore "areas[J]. Power system technology, 2020, 44(4): 1238-1247.
[11] 王曉東, 鞠邦國, 劉穎明, 等. 基于QR-NFGLSTM與核密度估計的風(fēng)電功率概率預(yù)測[J]. 太陽能學(xué)報, 2022, 43(2): 479-485.
WANG X D, JU B G, LIU Y M, et al. Probability prediction of wind power based on QR-NFGLSTM and kernel density estimation[J]. Acta energiae solaris sinica, 2022, 43(2): 479-485.
[12] ZHAO Z N, YUN S N, JIA L Y, et al. Hybrid VMD-CNN-GRU-based model for short-term forecasting of wind power considering " "spatio-temporal " "features[J]. " "Engineering applications of artificial intelligence, 2023, 121: 105982.
[13] 張冬梅, 李金平, 李江, 等. 基于門控權(quán)重單元的多變量時間序列預(yù)測[J]. 湖南大學(xué)學(xué)報(自然科學(xué)版), 2021, 48(10): 105-112.
ZHANG D M, LI J P, LI J, et al. Multivariate time series prediction based on gating weight unit[J]. Journal of Hunan University (natural sciences), 2021, 48(10): 105-112.
[14] 鄔超, 朱桂萍, 錢敏慧. 基于信息熵的歷史數(shù)據(jù)選取對超短期風(fēng)電功率預(yù)測精度影響研究[J]. 電網(wǎng)技術(shù), 2021, 45(5): 1767-1772.
WU C, ZHU G P, QIAN M H. Impact of historical data selection on accuracy of ultra-short-term wind power prediction "based "on "prediction "information "entropy[J]. Power system technology, 2021, 45(5): 1767-1772.
[15] DONOHO D L, JOHNSTONE I M. Ideal spatial adaptation by wavelet shrinkage[J]. Biometrika, 1994, 81(3): 425-455.
[16] WANG F Y, CEN J, YU Z W, et al. Research on a hybrid model for cooling load prediction based on wavelet threshold denoising and deep learning: a study in China[J]. Energy reports, 2022, 8: 10950-10962.
[17] TAYLOR J W. A quantile regression neural network approach to estimating the conditional density of multiperiod returns[J]. Journal of forecasting, 2000, 19(4): 299-311.
[18] Wind Power Forecasting [OB/OL]https://www.kaggle.com/datasets/theforcecoder/wind-power-forecasting.
[19] LIU B D, NOWOTARSKI J, HONG T, et al. Probabilistic load forecasting via quantile regression averaging on sister forecasts[J]. IEEE transactions on smart grid, 2017, 8(2): 730-737.
[20] 李雪瑩, 李宗民, 陳光源, 等. 小波變換的潮灘沉積物含水量預(yù)測[J]. 光譜學(xué)與光譜分析, 2022, 42(4): 1156-1161.
LI X Y, LI Z M, CHEN G Y, et al. Prediction of tidal flat sediment moisture content based on wavelet transform[J]. Spectroscopy and spectral analysis, 2022, 42(4): 1156-1161.
[21] LIU W J, JIA L. Wind power prediction based on the stacking model of XGBoost and random forest[C]//2022 IEEE 11th Data Driven Control and Learning Systems Conference (DDCLS). Chengdu, China, 2022: 1118-1123.
IMPROVED WEIGHTED GRU WIND POWER INTERVAL
PREDICTION BASED ON QUANTILE REGRESSION
Liu Tianhong1,Qi Shengli1,Yi Yang1 ,Jian Libin2,Qiao Xianzhu1,Zhang Enze1
(1. School of Information Engineering, Yangzhou University, Yangzhou 225127, China;
2. NARI Technology Co., Ltd., Nanjing 211106, China)
Abstract:In order to improve the accuracy of short-term wind power prediction, an improved entropy weighted GRU wind power interval prediction model based on quantile regression (QR-EGRU) is proposed to solve the problems that point prediction is difficult to describe wind power uncertainty and the traditional GRU cannot accurately track the data mutation when data changes. Firstly, the improved adaptive wavelet threshold denoising method is used to reduce the noise of the original data. Then two update gate weight matrices are introduced to replace the traditional update gate weight matrix. The new weight matrices adopt information entropy to dynamically adjust the matrix changes, quantify the change degree of the weights, and construct the information entropy weighted GRU(EGRU) network. Finally, the probability interval under different quantiles of the point prediction is obtained based on quantile regression algorithm. Experimental results show that the proposed model can improve the prediction accuracy compared with other comparison methods under the same experimental conditions and has a better interval prediction performance.
Keywords:wind power; prediction; gated recurrent unit; quantile regression; information entropy; wavelet threshold denoising