孟鑫禹,王睿涵,張喜平,王明杰,丘 剛,王政霞
(1.重慶交通大學(xué)信息科學(xué)與工程學(xué)院,重慶 400074;2.中國(guó)大唐集團(tuán)新能源科學(xué)技術(shù)研究院有限公司,北京 100043;3.積成電子股份有限公司,濟(jì)南 250104;4.國(guó)網(wǎng)新疆電力公司,烏魯木齊 830002;5.海南大學(xué)計(jì)算機(jī)與網(wǎng)絡(luò)空間安全學(xué)院,???570228)
當(dāng)今世界面臨能源危機(jī),風(fēng)能是最具開(kāi)發(fā)前景的一種可再生能源。風(fēng)力發(fā)電具有環(huán)保可持續(xù)、成本低廉、規(guī)模經(jīng)濟(jì)顯著等優(yōu)點(diǎn)。但由于受溫度、海拔、地形、氣壓等因素的影響,風(fēng)能具有波動(dòng)性、隨機(jī)性和不穩(wěn)定性的特點(diǎn)。而風(fēng)機(jī)的運(yùn)行效率隨著風(fēng)速的變化而變化[1],大規(guī)模風(fēng)電并網(wǎng)必然會(huì)對(duì)電網(wǎng)調(diào)度產(chǎn)生負(fù)面影響,從而降低電網(wǎng)的可靠性[2]。風(fēng)電場(chǎng)需要完備的風(fēng)功率預(yù)測(cè)系統(tǒng)來(lái)制定合適的發(fā)電、配電和維護(hù)策略,提高風(fēng)電并網(wǎng)的可靠性。因此,精準(zhǔn)的風(fēng)功率預(yù)測(cè)能夠有效提高電網(wǎng)調(diào)峰能力,增強(qiáng)電網(wǎng)的風(fēng)電接納能力,改善電力系統(tǒng)運(yùn)行的安全性與經(jīng)濟(jì)性,對(duì)于風(fēng)電一體化和電力系統(tǒng)的穩(wěn)定運(yùn)行至關(guān)重要[3]。
根據(jù)預(yù)測(cè)時(shí)間范疇,風(fēng)功率預(yù)測(cè)可分為四類[4]:應(yīng)用于風(fēng)電場(chǎng)設(shè)計(jì)可行性研究的長(zhǎng)期預(yù)測(cè);應(yīng)用于指導(dǎo)風(fēng)電場(chǎng)維護(hù)規(guī)劃和運(yùn)行管理的中期預(yù)測(cè);應(yīng)用于電網(wǎng)調(diào)度,以保證供電質(zhì)量[5]的短期預(yù)測(cè);以及超短期預(yù)測(cè)。超短期風(fēng)功率預(yù)測(cè)精度要求較高,用于平衡負(fù)荷和優(yōu)化調(diào)度能源,通常需要提前幾分鐘或幾小時(shí)進(jìn)行預(yù)測(cè)[6]。
風(fēng)功率預(yù)測(cè)方法可分為物理方法和統(tǒng)計(jì)方法兩大類。物理方法通常使用數(shù)值天氣預(yù)報(bào)[7]、地形、地貌等信息,建立完整的流體力學(xué)和熱力學(xué)模型,通過(guò)求解高維非線性方程,計(jì)算出風(fēng)機(jī)輪轂高度處的風(fēng)速大小,然后結(jié)合風(fēng)機(jī)功率曲線,得到風(fēng)機(jī)的輸出功率。該類方法能較好地運(yùn)用大氣運(yùn)動(dòng)的本質(zhì),不需要積累大量的歷史風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)。但由于風(fēng)電場(chǎng)特殊的地理環(huán)境和一些物理現(xiàn)象(如尾流效應(yīng)等)的影響,風(fēng)況往往難以準(zhǔn)確評(píng)估,因此數(shù)值天氣預(yù)報(bào)的時(shí)空分辨率往往會(huì)制約預(yù)測(cè)結(jié)果的準(zhǔn)確率。另一方面需根據(jù)風(fēng)機(jī)自身運(yùn)行狀態(tài)和外部環(huán)境因素建立符合風(fēng)機(jī)真實(shí)運(yùn)行工況的風(fēng)機(jī)功率曲線模型[8-9],這增加了風(fēng)功率預(yù)測(cè)的不穩(wěn)定性因素。統(tǒng)計(jì)方法是通過(guò)分析歷史風(fēng)功率數(shù)據(jù)的統(tǒng)計(jì)規(guī)律,建立時(shí)序風(fēng)功率樣本之間的非線性映射關(guān)系,以此得到風(fēng)功率的預(yù)測(cè)值。傳統(tǒng)的時(shí)間序列預(yù)測(cè)方法,如自回歸移動(dòng)平均(AutoRegressive Moving Average,ARMA)模型,常用于風(fēng)功率的預(yù)測(cè);文獻(xiàn)[10]提出了使用Burg 和Shanks 算法的ARMA 過(guò)程預(yù)測(cè)風(fēng)功率,文獻(xiàn)[11]考慮了風(fēng)速的自相關(guān)和波動(dòng)特性,基于F 準(zhǔn)則建立了ARMA模型用于風(fēng)功率預(yù)測(cè)。隨著人工智能技術(shù)的飛速發(fā)展,一些基于機(jī)器學(xué)習(xí)算法的風(fēng)功率預(yù)測(cè)工作涌現(xiàn)。如:文獻(xiàn)[3]提出一種基于支持向量機(jī)(Support Vector Machine,SVM)和改進(jìn)的蜻蜓算法的短期風(fēng)功率預(yù)測(cè)方法;文獻(xiàn)[12]介紹了一種基于深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)的預(yù)測(cè)方法;文獻(xiàn)[13-14]介紹了循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)在預(yù)測(cè)引擎中的應(yīng)用,其中,文獻(xiàn)[13]提出了脊波神經(jīng)網(wǎng)絡(luò)(Ridgelet Neural Network,RNN)與埃爾曼神經(jīng)網(wǎng)絡(luò)(Elman Neural Network,ENN)結(jié)合的兩階段預(yù)測(cè)方法,文獻(xiàn)[14]提出了一種結(jié)合門控循環(huán)單元(Gated Recurrent Unit,GRU)與卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的預(yù)測(cè)方法。這些基于統(tǒng)計(jì)模型的算法,可以避免對(duì)物理機(jī)制把握不足的差異,更適合于風(fēng)功率的短期和超短期預(yù)測(cè)任務(wù)。
ARMA 算法適合處理平穩(wěn)時(shí)序信號(hào),對(duì)于風(fēng)速、風(fēng)功率這樣的非平穩(wěn)信號(hào),往往需要將原始信號(hào)差分處理成平穩(wěn)信號(hào)再輸入模型訓(xùn)練。文獻(xiàn)[15]提出了小波分解與重構(gòu)的方法;文獻(xiàn)[16-17]采用了局域波分解以及經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)的方法,將原始信號(hào)轉(zhuǎn)化為平穩(wěn)信號(hào)后使用ARMA算法,取得了較好的效果;文獻(xiàn)[18]提出了基于集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)與小波神經(jīng)網(wǎng)絡(luò)(Wavelet Neural Network,WNN)的新型風(fēng)功率組合預(yù)測(cè)模型,WNN 集人工神經(jīng)網(wǎng)絡(luò)和小波分析優(yōu)點(diǎn)于一身,具有網(wǎng)絡(luò)收斂速度快,避免陷入局部最優(yōu),同時(shí)又具備時(shí)頻局部分析的特點(diǎn)。近年來(lái),循環(huán)神經(jīng)網(wǎng)絡(luò)作為一種利用時(shí)間關(guān)系的統(tǒng)計(jì)模型,在風(fēng)功率預(yù)測(cè)任務(wù)中顯示出了良好的優(yōu)勢(shì)。然而,由于天氣環(huán)境、切入切出風(fēng)速、風(fēng)機(jī)狀態(tài)等諸多不確定因素的存在,風(fēng)功率信號(hào)表現(xiàn)出非平穩(wěn)的性質(zhì),循環(huán)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)機(jī)制也很難捕獲其時(shí)序規(guī)律??紤]到信號(hào)分解能增強(qiáng)數(shù)據(jù)的平穩(wěn)性,提出了一種基于經(jīng)驗(yàn)?zāi)B(tài)分解與融合GRU 層、卷積層的多分支神經(jīng)網(wǎng)絡(luò)模型——經(jīng)驗(yàn)?zāi)B(tài)分解的卷積循環(huán)神經(jīng)網(wǎng)絡(luò)(Convolutional Recurrent Neural Network based on Empirical Mode Decomposition,EMD_CRNN):首先,原始風(fēng)功率信號(hào)經(jīng)過(guò)EMD 算法分解后再重構(gòu),獲得風(fēng)功率的相對(duì)平穩(wěn)信號(hào);然后,將重構(gòu)后的張量輸入一個(gè)融合了GRU 層與卷積層的多分支神經(jīng)網(wǎng)絡(luò),分別學(xué)習(xí)風(fēng)功率時(shí)序信號(hào)的趨勢(shì)特征和局部特征;最后經(jīng)過(guò)特征融合得到風(fēng)功率預(yù)測(cè)結(jié)果。該模型具有如下優(yōu)點(diǎn):
1)經(jīng)過(guò)EMD 算法分解后再重構(gòu)的多維度信號(hào),每個(gè)維度是相對(duì)平穩(wěn)的,網(wǎng)絡(luò)在平穩(wěn)頻域?qū)W習(xí)到的特征有更強(qiáng)的時(shí)間趨勢(shì)表示性,該方法可以弱化非平穩(wěn)因素帶來(lái)的擾動(dòng);
2)原始信號(hào)分解成多個(gè)信號(hào)分量后重構(gòu)成多維張量輸入網(wǎng)絡(luò),并非每一分量單獨(dú)預(yù)測(cè),考慮了分量之間的內(nèi)在相關(guān)性,采用信息互補(bǔ)的策略增強(qiáng)網(wǎng)絡(luò)模型的魯棒性;
3)兼顧時(shí)間序列分量的趨勢(shì)特征和局部特征,兩部分特征并行提取并融合。不僅保留了不同策略提取特征的獨(dú)立性,同時(shí)也在特征融合階段對(duì)目標(biāo)函數(shù)做了整體約束。
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)是將非平穩(wěn)信號(hào)按不同尺度的波動(dòng)或趨勢(shì)逐級(jí)分解成若干個(gè)內(nèi)在模式函數(shù)(Intrinsic Mode Function,IMF)的平穩(wěn)化處理。IMF 滿足以下條件:1)函數(shù)在整個(gè)時(shí)間序列范圍內(nèi),局部極值點(diǎn)和過(guò)零點(diǎn)的數(shù)目相等或最多相差一個(gè);2)在任意時(shí)間點(diǎn),局部最大值的包絡(luò)(上包絡(luò)線)和局部最小值的包絡(luò)(下包絡(luò)線)平均值為零。
設(shè)x(t)為任意時(shí)序信號(hào),經(jīng)驗(yàn)?zāi)B(tài)分解具體步驟如下。
1)確定信號(hào)x(t)的局部極大值點(diǎn)和局部極小值點(diǎn),利用三次樣條插值擬合形成原數(shù)據(jù)的上、下包絡(luò)線;
2)令上包絡(luò)線和下包絡(luò)線的均值為m(t),計(jì)算h(t)=x(t) -m(t),判斷h(t)是否滿足IMF 條件,若不滿足,則把h(t)看作新的x(t),重復(fù)以上操作,即:
直到hk(t)滿足IMF 條件,這樣就得到了第一個(gè)IMF,即c1(t)和信號(hào)的剩余分量r1(t):
3)對(duì)r1(t)按照步驟2)的方法繼續(xù)進(jìn)行分解,直到所得的剩余分量滿足給定的終止條件,分解過(guò)程結(jié)束,得到若干IMF和一個(gè)剩余分量:
原始信號(hào)可表示為若干IMF和剩余分量之和,即:
剩余分量rn(t)反映原始信號(hào)的中心趨勢(shì)。
受不確定性環(huán)境因素影響,風(fēng)速是非平穩(wěn)的時(shí)序信號(hào),風(fēng)速與風(fēng)功率存在一定的映射關(guān)系,因此風(fēng)功率是隨風(fēng)速波動(dòng)的非平穩(wěn)信號(hào)。將風(fēng)功率原始時(shí)序信號(hào)利用EMD 算法進(jìn)行分解,得到的信號(hào)分量與原始信號(hào)結(jié)合進(jìn)行數(shù)據(jù)重構(gòu),重構(gòu)的張量作為神經(jīng)網(wǎng)絡(luò)模型的輸入。設(shè)原始風(fēng)功率信號(hào)長(zhǎng)度為t,經(jīng)驗(yàn)?zāi)B(tài)分解之后得到n個(gè)IMF分量和1個(gè)剩余分量,加上原始信號(hào)后數(shù)據(jù)重構(gòu)成t×(n+2)的2D 張量。重構(gòu)過(guò)程表示為:
其中:x是重構(gòu)后的2D 張量,x(t)是原始時(shí)序信號(hào),ci(t)是IMF,rn(t)是剩余分量。重構(gòu)后的信號(hào)既保留了原始風(fēng)功率的信息也融合了多個(gè)頻段的平穩(wěn)信號(hào)信息,對(duì)后面的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過(guò)程有促進(jìn)作用。
這部分將詳細(xì)介紹本文模型(EMD_CRNN)的結(jié)構(gòu),依次介紹了卷積層和GRU 層在特征提取方面各自的優(yōu)勢(shì),以及特征融合的方法。EMD_CRNN的整體架構(gòu)如圖1所示。
圖1 EMD_CRNN 整體架構(gòu)Fig.1 Overall framework of EMD_CRNN
卷積神經(jīng)網(wǎng)絡(luò)(CNN)的核心是對(duì)數(shù)據(jù)張量的卷積。CNN學(xué)到的模式具有平移不變性,這使得它可以高效地利用數(shù)據(jù),少量的樣本也可以學(xué)到具有泛化能力的數(shù)據(jù)表示。此外CNN還可以學(xué)到模式的空間層次結(jié)構(gòu),這使得它可以有效地學(xué)習(xí)抽象的空間層次概念。卷積層具有指定大小的濾波器,用以提取數(shù)據(jù)的局部特征,這一過(guò)程可以表示為:
其中:?表示卷積運(yùn)算,x是數(shù)據(jù)張量,ReLU(Rectified Linear Unit)是激活函數(shù),Wc和bc是網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中需要修正的權(quán)重和偏置。重構(gòu)后的風(fēng)功率信號(hào)作為卷積層的輸入,網(wǎng)絡(luò)可以學(xué)習(xí)到不同頻段信號(hào)之間的相互依賴,卷積層提取到的是不同頻段信號(hào)的局部特征。
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)處理時(shí)間序列任務(wù)有獨(dú)特的優(yōu)勢(shì),但隨著層數(shù)的增加,其面臨梯度消失的問(wèn)題。門控循環(huán)單元(GRU)神經(jīng)網(wǎng)絡(luò)作為RNN 的一種變體,它特殊的門結(jié)構(gòu)可以有效地解決長(zhǎng)短時(shí)間序列上的變化問(wèn)題。GRU 層的過(guò)程可以表示為:
其中:zt是記憶門,rt是遺忘門是更新的隱含層單元,ht是隱含層單元,⊙表示內(nèi)積運(yùn)算,σ表示sigmoid 函數(shù),Wz、Wr、Wh表示網(wǎng)絡(luò)學(xué)習(xí)的權(quán)重。重構(gòu)后的風(fēng)功率信號(hào)作為GRU 層的輸入,網(wǎng)絡(luò)可以學(xué)習(xí)到歷史信號(hào)的時(shí)序依賴關(guān)系,GRU 層提取時(shí)序信號(hào)的長(zhǎng)期趨勢(shì)特征。
多分支神經(jīng)網(wǎng)絡(luò)模型由GRU 層和卷積層分別提取特征,經(jīng)過(guò)特征融合后再通過(guò)全連接層,最后得到網(wǎng)絡(luò)的輸出。GRU 層學(xué)習(xí)到的特征側(cè)重于時(shí)序信號(hào)的長(zhǎng)期趨勢(shì),而卷積層學(xué)習(xí)到的特征側(cè)重于不同頻段信號(hào)的局部關(guān)聯(lián),全連接層可以擬合復(fù)雜的非線性映射[19]。這樣組合的混合神經(jīng)網(wǎng)絡(luò)優(yōu)勢(shì)在于:兼顧了CNN 和GRU 兩種神經(jīng)網(wǎng)絡(luò)的獨(dú)立性和相關(guān)性,在網(wǎng)絡(luò)中兩個(gè)分支是并行的,以保證針對(duì)數(shù)據(jù)的不同特性學(xué)習(xí)到不同的參數(shù)分布,并通過(guò)特征融合來(lái)約束統(tǒng)一的目標(biāo)。
特征融合采用特征向量連接的方式實(shí)現(xiàn),經(jīng)過(guò)卷積層提取到的特征是3D 張量,經(jīng)過(guò)GRU 層提取到的特征是1D 張量。兩部分特征向量無(wú)法直接連接,文章使用Keras 中的Flatten 層將多維特征一維化,即把3D 張量“壓平”,然后再進(jìn)行連接。連接方式采用向量合并的策略,合并之后的總特征數(shù)為各部分特征數(shù)相加之和,文章使用Keras 中的concatenate函數(shù)實(shí)現(xiàn)特征融合。
風(fēng)功率預(yù)測(cè)的流程如下:首先原始風(fēng)功率時(shí)序信號(hào)經(jīng)過(guò)EMD 算法分解成若干子信號(hào),通過(guò)1.2 節(jié)提到的方法將信號(hào)重構(gòu);然后重構(gòu)張量作為神經(jīng)網(wǎng)絡(luò)的輸入,由GRU 層和卷積層分別提取趨勢(shì)特征和局部特征;最后將兩個(gè)分支得到的特征融合,經(jīng)過(guò)全連接層后得到最后的預(yù)測(cè)結(jié)果。整個(gè)多分支神經(jīng)網(wǎng)絡(luò)可以用式(11)來(lái)表示:
其中:p是預(yù)測(cè)功率;C(x)和R(ht)分別由式(6)、(10)計(jì)算得到,代表提取到的特征向量表示向量合并;W和b是需要訓(xùn)練的權(quán)重和偏置,Φ代表整個(gè)網(wǎng)絡(luò)學(xué)習(xí)的函數(shù)。
本文實(shí)驗(yàn)使用內(nèi)蒙古某風(fēng)場(chǎng)的實(shí)際運(yùn)行數(shù)據(jù),風(fēng)機(jī)信息如下,風(fēng)機(jī)型號(hào)(http://wp.china-nengyuan.com/member_product/21293.html):CCWE-1500/77,額定功率1500 kW,輪轂高度:70 m,轉(zhuǎn)子直徑:77 m。原始數(shù)據(jù)的采樣周期是10 s,單位采樣次數(shù)下的數(shù)據(jù)波動(dòng)很小,因此對(duì)原始數(shù)據(jù)的缺失信息,采用了鄰近值填充的方式,即對(duì)于某時(shí)刻缺失的風(fēng)功率數(shù)值,向上搜尋一個(gè)時(shí)間單位的數(shù)值,如果依舊缺失則繼續(xù)向上搜尋一個(gè)時(shí)間單位,直到搜尋到數(shù)值為止。稱搜尋到的這個(gè)數(shù)值為當(dāng)前缺失信息位置的最鄰近值,依次找到所有缺失信息位置的最鄰近值進(jìn)行填充,補(bǔ)全整個(gè)數(shù)據(jù)集。
樣本數(shù)據(jù)的波動(dòng)會(huì)影響預(yù)測(cè)精度,導(dǎo)致解的不確定性。數(shù)據(jù)的標(biāo)準(zhǔn)化可以減小樣本波動(dòng)的影響,提高預(yù)測(cè)性能。標(biāo)準(zhǔn)化方程為:
其中:di是標(biāo)準(zhǔn)化后的值,d是待標(biāo)準(zhǔn)化的數(shù)據(jù),dmax是待標(biāo)準(zhǔn)化數(shù)據(jù)的最大值,dmin是待標(biāo)準(zhǔn)化數(shù)據(jù)的最小值。
神經(jīng)網(wǎng)絡(luò)的目標(biāo)函數(shù)表示為:
其中:W、b為神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的權(quán)重和偏置,i是指某一樣本點(diǎn),pi是實(shí)測(cè)功率值是預(yù)測(cè)功率值。網(wǎng)絡(luò)優(yōu)化器選擇考慮了動(dòng)量的Adam 方法。卷積層、GRU 層和全連接層中相應(yīng)的神經(jīng)元參數(shù)通過(guò)大量的實(shí)驗(yàn)調(diào)整到相對(duì)最優(yōu)值,卷積層的過(guò)濾器個(gè)數(shù)為32,尺寸為5×5,GRU 中隱含層的特征數(shù)為128。使用平均絕對(duì)誤差(Mean Absolute Error,MAE)和均方誤差(Mean Square Error,MSE)來(lái)評(píng)估各種方法的性能,MAE 的優(yōu)勢(shì)體現(xiàn)在對(duì)異常數(shù)據(jù)的魯棒性[20]。
此課題使用了數(shù)據(jù)集中2 880 個(gè)樣本作為訓(xùn)練集,1 440個(gè)樣本作為測(cè)試集,對(duì)比了在風(fēng)功率預(yù)測(cè)中較常用的一些傳統(tǒng)算法,同時(shí)也對(duì)比了引言部分提及的幾個(gè)重要算法:差分整合自回歸移動(dòng)平均(AutoRegressive Integrated Moving Average,ARIMA)模型[21]、梯度提升決策樹(shù)(Gradient Boosting Decision Tree,GBDT)[22]、支持向量機(jī)(SVM)[3]、深度神經(jīng)網(wǎng)絡(luò)(DNN)[12]、門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(GRU)、文獻(xiàn)[14]提出的GRU_CNN 和文獻(xiàn)[17]提出的EMD_ARMA,此外為了說(shuō)明多分支神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì),還對(duì)比了EMD 重構(gòu)分別與DNN、CNN、GRU 網(wǎng)絡(luò)結(jié)合的結(jié)果(依次記作EMD+DNN、EMD+CNN、EMD+GRU)。為了觀察算法時(shí)間跨度預(yù)測(cè)性能,實(shí)驗(yàn)也列舉了模型在不同時(shí)間跨度下的表現(xiàn)。由于計(jì)算出的評(píng)價(jià)指標(biāo)精度高,為了便于展示,結(jié)果上做了1E-1和1E-2的運(yùn)算。
圖2 可視化了一段時(shí)間內(nèi)的原始風(fēng)功率信號(hào)和分解后各頻段的信號(hào),圖的右邊是EMD 算法對(duì)圖左邊原始信號(hào)的分解。可以看出原始信號(hào)的無(wú)周期性和非平穩(wěn)性,信號(hào)分解后,滿足IMF條件的分量是平穩(wěn)信號(hào),而且表現(xiàn)出了弱規(guī)律性,這給神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)降低了難度。
圖2 風(fēng)功率信號(hào)EMD可視化Fig.2 EMD visualization of wind power signal
表1 記錄了所有對(duì)比模型的MAE 和MSE 結(jié)果,隨著預(yù)測(cè)步長(zhǎng)的增加,預(yù)測(cè)的準(zhǔn)確度會(huì)降低。歷史風(fēng)功率信號(hào)經(jīng)過(guò)EMD 重構(gòu)之后再輸入神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)很明顯,與ARIMA、DNN、GRU 相比,EMD_ARMA、EMD+DNN、EMD+GRU 在MAE表現(xiàn)方面都至少有1E-3 的提升,EMD+GRU 更是提升了將近5E-3。GRU_CNN 并沒(méi)有表現(xiàn)出很好的性能,因?yàn)閷?duì)于風(fēng)功率的單一信號(hào)而言,一維卷積并沒(méi)有發(fā)揮出預(yù)測(cè)性能方面的優(yōu)勢(shì)。EMD_CRNN 的卷積是針對(duì)EMD 分解過(guò)后的多維信號(hào),相比之下,它展現(xiàn)出來(lái)的優(yōu)勢(shì)就很明顯,其MAE 比傳統(tǒng)的ARIMA 方法下降了30%左右。EMD+CNN 和EMD+GRU 相對(duì)其他模型也有較小的MAE 和MSE,EMD_CRNN 發(fā)揮了卷積層和GRU 層的優(yōu)勢(shì),達(dá)到了更好的效果。EMD+CNN 和EMD+GRU 在預(yù)測(cè)性能上差別不大,因?yàn)閷?duì)預(yù)測(cè)結(jié)果起決定性作用的樣本序列較短,CNN 中的卷積核也能挖掘到重要的時(shí)序特征。
為了證明EMD_CRNN 的普適性,表2給出了EMD重構(gòu)后的幾個(gè)神經(jīng)網(wǎng)絡(luò)模型在不同采樣周期下的評(píng)價(jià)指標(biāo)結(jié)果,采樣周期分別為1 min、3 min和5 min。結(jié)果表明EMD_CRNN在各個(gè)采樣周期上都比其他方法有優(yōu)勢(shì)。采樣間隔時(shí)間越長(zhǎng),所有方法預(yù)測(cè)結(jié)果準(zhǔn)確度都會(huì)降低,因?yàn)轱L(fēng)速的不穩(wěn)定性導(dǎo)致長(zhǎng)間隔內(nèi)的不確定性因素的增加,故預(yù)測(cè)難度增加。
圖3是表1中MAE和MSE的柱狀圖,縱坐標(biāo)是模型名稱,橫坐標(biāo)分別是評(píng)價(jià)指標(biāo)MAE和MSE的值。
圖4 展示了GRU、EMD+GRU 與EMD_CRNN 三種模型在訓(xùn)練過(guò)程中隨著迭代次數(shù)增加的損失折線圖??梢钥闯?,經(jīng)過(guò)EMD 數(shù)據(jù)重構(gòu)的神經(jīng)網(wǎng)絡(luò)更能訓(xùn)練得到較小的損失。GRU 神經(jīng)網(wǎng)絡(luò)在迭代過(guò)程中損失一直比較平穩(wěn),EMD_CRNN在迭代到5 次時(shí)模型效果達(dá)到最佳,后面則開(kāi)始出現(xiàn)過(guò)擬合的現(xiàn)象,所以訓(xùn)練模型時(shí),選擇一個(gè)合適的迭代參數(shù)尤為關(guān)鍵。圖5 給出了EMD_CRNN 預(yù)測(cè)結(jié)果與實(shí)測(cè)值的對(duì)比,采樣周期和預(yù)測(cè)跨度皆為1 min,模型能較為準(zhǔn)確地預(yù)測(cè)出風(fēng)功率的走勢(shì)和突變值,在應(yīng)用上有一定的參考價(jià)值。
表1 不同模型評(píng)價(jià)指標(biāo)對(duì)比Tab.1 Evaluation index comparison of different models
表2 不同采樣周期的評(píng)價(jià)指標(biāo)對(duì)比Tab.2 Evaluation index comparison of different sampling peroids
圖3 MAE、MSE柱狀圖Fig.3 Histograms of MAE and MSE
圖4 不同模型在驗(yàn)證集上的loss折線圖Fig.4 Loss graph of different models on validation set
圖5 預(yù)測(cè)結(jié)果與實(shí)測(cè)值可視化Fig.5 Visualization of prediction results and real values
本文模型EMD_CRNN 是一種基于EMD 算法與數(shù)據(jù)重構(gòu),以及多分支神經(jīng)網(wǎng)絡(luò)的超短期風(fēng)功率預(yù)測(cè)模型。多分支體現(xiàn)在利用卷積層和GRU 層并行提取局部特征和趨勢(shì)特征。實(shí)驗(yàn)結(jié)果驗(yàn)證了該模型在實(shí)際風(fēng)場(chǎng)數(shù)據(jù)集上預(yù)測(cè)風(fēng)功率的優(yōu)勢(shì),主要包括以下3個(gè)方面:
1)把非平穩(wěn)風(fēng)功率信號(hào)重構(gòu)為在各頻段相對(duì)平穩(wěn)的數(shù)據(jù)張量,循環(huán)神經(jīng)網(wǎng)絡(luò)在平穩(wěn)信號(hào)的數(shù)據(jù)驅(qū)動(dòng)下能學(xué)習(xí)到更強(qiáng)的趨勢(shì)依賴特征,克服了風(fēng)功率預(yù)測(cè)中非平穩(wěn)信號(hào)給模型學(xué)習(xí)帶來(lái)的困難;
2)卷積層提取不同頻段信號(hào)的局部特征,GRU 層提取時(shí)序信號(hào)的長(zhǎng)期趨勢(shì)特征,兼顧了不同特征之間的獨(dú)立性與相關(guān)性,使得模型對(duì)風(fēng)功率數(shù)據(jù)有更強(qiáng)的挖掘能力;
3)數(shù)據(jù)重構(gòu)與多分支神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)層面與特征層面都體現(xiàn)出了信息互補(bǔ)的策略,該策略能提高風(fēng)功率預(yù)測(cè)模型的魯棒性。