胡道波,陳芳芳,張倩倩,文博,羅銀榕
云南民族大學(xué) 電氣信息工程學(xué)院,云南 昆明 650504
風(fēng)電功率具有一定的不穩(wěn)定性和隨機(jī)性。隨著風(fēng)電并入電網(wǎng),會(huì)給電力系統(tǒng)的安全帶來極大的挑戰(zhàn)[1],風(fēng)電功率預(yù)測是解決該挑戰(zhàn)的方法之一,可以作為電網(wǎng)調(diào)度的重要依據(jù)。因此,準(zhǔn)確預(yù)測風(fēng)力發(fā)電機(jī)組出力具有非常重要的意義。
基于數(shù)值天氣預(yù)報(bào)的風(fēng)電出力預(yù)測仍然是目前的研究熱點(diǎn)之一,有效的特征選擇能提高模型的預(yù)測精度。近年來,國內(nèi)外研究工作人員對(duì)預(yù)測模型輸入特征優(yōu)選做了大量的研究。文獻(xiàn)[2]引入灰色關(guān)聯(lián)度分析法測算各影響因素與工時(shí)的關(guān)聯(lián)度,并驗(yàn)證該方法的有效性。文獻(xiàn)[3]提出一種基于灰色關(guān)聯(lián)分析法分析歷史數(shù)據(jù)與預(yù)測日間的關(guān)聯(lián)程度,將灰色關(guān)聯(lián)系數(shù)大于0.9 的特征數(shù)據(jù)作為模型輸入特征,實(shí)驗(yàn)結(jié)果表明該方法提高了模型的預(yù)測精度。文獻(xiàn)[4]指出Kendall 秩相關(guān)系數(shù)可檢測出2 個(gè)變量之間的非性相關(guān)性。文獻(xiàn)[5]使用互信息用來提取風(fēng)電預(yù)測模型的輸入特征向量,提高了模型的預(yù)測精度。上述文獻(xiàn)有效解決了建模過程中特征選擇的問題,顯著提高了預(yù)測精度。但多數(shù)研究使用一種特征選擇方法,很少從不同角度運(yùn)用多種方法選擇輸入特征,進(jìn)而導(dǎo)致輸入特征選擇不充分,影響模型的性能。基于上述存在的問題,本研究運(yùn)用3 特征選擇方法橫向?qū)Ρ冗M(jìn)行特征選擇,選擇有效特征,剔除冗余信息。
神經(jīng)網(wǎng)絡(luò)方法對(duì)具有序列特征的數(shù)據(jù)非常有效,可以充分從數(shù)據(jù)中提取時(shí)間序列信息。門控循環(huán)單元(gated recurrent unit,GRU)神經(jīng)網(wǎng)絡(luò)是在長短期記憶(long short-term memory,LSTM)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上改變的一種神經(jīng)網(wǎng)絡(luò),也具有門控機(jī)制,其結(jié)構(gòu)比LSTM 簡單,所需參數(shù)少[6-7]。文獻(xiàn)[6]通過注意力(attention)機(jī)制優(yōu)化GRU 的輸入權(quán)重和基于麻雀搜索算法(sparrow search algorithm,SSA)優(yōu)化GRU 的超參數(shù),建立了Attention-SSA-GRU 的短期負(fù)荷預(yù)測模型,在短期負(fù)荷預(yù)測方面取得了很好的預(yù)測結(jié)果。文獻(xiàn)[7]建立了基于粒子群優(yōu)化GRU 的故障診斷模型,通過粒子群優(yōu)化GRU 的超參數(shù),提高了模型的診斷精度。因此,本文選用GRU 神經(jīng)網(wǎng)絡(luò)進(jìn)行短期風(fēng)電出力預(yù)測,并引入SSA 對(duì)GRU 神經(jīng)網(wǎng)絡(luò)的初始隱含層節(jié)點(diǎn)數(shù)和學(xué)習(xí)率進(jìn)行優(yōu)化。
特征選擇是從眾多影響因子中優(yōu)選部分有效影響因子,對(duì)原始數(shù)據(jù)進(jìn)行降維處理的同時(shí)能夠降低模型的訓(xùn)練難度,提高模型的預(yù)測精度。影響風(fēng)電出力的影響因子有很多,風(fēng)力機(jī)組輸出功率的表達(dá)式為
式中:P為風(fēng)輪機(jī)輸出功率,kW;Cp為風(fēng)能利用系數(shù);A為轉(zhuǎn)輪旋轉(zhuǎn)截面面積,m2; ρ為空氣密度,kg/m3;V為風(fēng)速,m/s。
灰色關(guān)聯(lián)度(grey relation analysis,GRA)[8]是對(duì)風(fēng)電出力的影響因子進(jìn)行分析,以原始數(shù)據(jù)為基礎(chǔ)提取對(duì)風(fēng)電功率影響具有強(qiáng)相關(guān)性的數(shù)據(jù)特征,灰色關(guān)聯(lián)分析具體步驟如下。
1)將歷史風(fēng)電出力數(shù)據(jù)X0=[X0(1),X0(2),···,X0(m)]T設(shè)為參考系列, 將影響因子向量X1,X2,···,Xn構(gòu)成的矩陣設(shè)為比較矩陣:
式中:m為影響因子維數(shù),n為樣本數(shù)。
2)對(duì)數(shù)據(jù)進(jìn)行無量綱處理,使所有數(shù)據(jù)取值都位于0~1 之間:
式中:i=0,1,···,n;k=1,2,···,m。
3)計(jì)算影響因子序列和目標(biāo)系列之間的灰色關(guān)聯(lián)度系數(shù):
式中:i=1,2,···,n;ε=0.5。
4)計(jì)算關(guān)聯(lián)度 γi,并將得到的關(guān)聯(lián)度系數(shù)由高到低進(jìn)行排序。
根據(jù)上述計(jì)算得到灰色關(guān)聯(lián)度值,關(guān)聯(lián)度值越大,得到比較序列和參考序列的變化趨勢越相同。
Kendall 秩相關(guān)系數(shù)又稱Kendall 系數(shù),是一個(gè)基于秩的相關(guān)性指標(biāo),用來衡量2 組非線性數(shù)據(jù)之間的有序關(guān)聯(lián)統(tǒng)計(jì)量,它是以Maurice Kendall 命名的一種數(shù)據(jù)處理算法[9-10],其計(jì)算公式為
式中:n為輸入風(fēng)電數(shù)據(jù)的采樣點(diǎn),x為數(shù)值天氣預(yù)報(bào)(numerical weather prediction,NWP)數(shù)據(jù)特征,y為風(fēng)電功率數(shù)據(jù)。Kendall 秩相關(guān)系數(shù)的取值區(qū)間為[-1,1]。其中相關(guān)系數(shù)絕對(duì)值表示2 組隨機(jī)向量之間一致和不一致關(guān)系,當(dāng)這些變量相互獨(dú)立時(shí),Kendall 秩相關(guān)系數(shù)值為0。在此定義Kendall 秩相關(guān)系數(shù)值在[0.6,1]表示強(qiáng)相關(guān),[0.4,0.6]表示中等相關(guān),[0,0.4]表示弱相關(guān)。
互信息(mutual information,MI)是信息熵理論中一種有用的信息度量,用來表示2 個(gè)或多個(gè)系統(tǒng)間的相關(guān)信息量[11]。文中用來表示原始風(fēng)電特征數(shù)據(jù)X和風(fēng)電功率數(shù)據(jù)Y之間的相關(guān)信息,X、Y之間的互信息I(X;Y)定義為
式中:p(x,y)為聯(lián)合概率密度,p(x)p(y)分別為x、y的邊緣概率密度函數(shù)。MI 法是通過計(jì)算所有影響因子與風(fēng)電出力的互信息度量,選取n個(gè)MI 最高的特征,達(dá)到特征優(yōu)選的目的。
基于上述3 種特征選擇方法,搭建最優(yōu)特征選擇模型,具體思路如下:基于灰色關(guān)聯(lián)度分析法、Kendall 秩相關(guān)系數(shù)法和互信息理論用于計(jì)算各個(gè)特征對(duì)風(fēng)電功率的灰色關(guān)聯(lián)度系數(shù)、相關(guān)系數(shù)和互信息量,基于3 種特征選擇方法選擇出3 個(gè)最佳特征子集,通過取交集的方式得到預(yù)測模型輸入的最佳特征集。特征選擇模型如圖1 所示。
圖1 最優(yōu)輸入特征集選擇
GRU 神經(jīng)網(wǎng)絡(luò)是傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neuron network,RNN)[12-13]的一種變形,能夠充分利用歷史信息,具有計(jì)算效率高、拓?fù)湫詮?qiáng)等優(yōu)點(diǎn)。GRU 模型結(jié)構(gòu)如圖2 所示。
圖2 GRU 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
GRU 神經(jīng)網(wǎng)絡(luò)的最終輸出由輸出門與門控單元共同決定,公式如下:
式中: σ為sigmoid 函數(shù),rt為遺忘門,為更新門,ht為隱藏層,wr、wz、wc和wh?分別為對(duì)應(yīng)變量的權(quán)重矩陣,xt為輸入,yt為輸出,br、bn和bm分別為rt、zt和的偏置向量,zt為重置門。
SSA 是根據(jù)麻雀覓食和反捕食行為的啟發(fā)而提出的新型群體智能優(yōu)化算法[14-15]。在種群中,每只麻雀都有3 種行為,分別為發(fā)現(xiàn)者、加入者和警戒者[16-17]。在麻雀搜索算法中,發(fā)現(xiàn)者的位置迭代表達(dá)式如下:
式中:t為當(dāng)前迭代次數(shù),j=1,2,···,d,rmax為最大迭代次數(shù),為第i只麻雀在第j維中的位置信息,α ∈(0,1]為隨機(jī)數(shù),R2∈(0,1]為預(yù)警值,TS∈[0.5,1]為安全值,Q為服從正態(tài)分布的隨機(jī)數(shù),L為1×d的矩陣。
跟隨者的位置迭代更新表達(dá)式為
式中:XP為發(fā)現(xiàn)者所處最優(yōu)位置;Xworst為發(fā)現(xiàn)者所處最差位置;A為1×d的矩陣,其中每個(gè)元素隨機(jī)賦值為1 或者-1,且A+=AT(AAY)-1;當(dāng)i>n/2,表示適應(yīng)度較低的第i個(gè)加入者沒有得到食物。
在麻雀反捕食過程中會(huì)有一部分麻雀具有警戒偵察能力,這部分群體的表達(dá)式為
式中:Xbest為當(dāng)前最優(yōu)位置, β為步長控制參數(shù),K∈[-1,1]為均勻的隨機(jī)數(shù),fi為第i個(gè)個(gè)體適應(yīng)度值,fg和fw為當(dāng)前全局最優(yōu)和最差適應(yīng)度值, ε為常數(shù)。
為了提高GRU 預(yù)測模型的精度,本文提出了一種混合模型SSA-GRU,利用SSA 優(yōu)化GRU 的初始隱含層節(jié)點(diǎn)數(shù)和學(xué)習(xí)率。SSA-GRU 預(yù)測模型主要步驟如下,預(yù)測模型如圖3 所示。
圖3 短期風(fēng)電出力預(yù)測整體框架
1) 初始化。初始化種群規(guī)模、最大迭代次數(shù)、參數(shù)取值范圍,初始化GRU 的參數(shù),以GRU模型的隱含層節(jié)點(diǎn)數(shù)和學(xué)習(xí)率作為優(yōu)化目標(biāo)。
2) 將參數(shù)代入訓(xùn)練模型,計(jì)算麻雀種群個(gè)體適應(yīng)度值,找出最優(yōu)適應(yīng)度個(gè)體及最劣適應(yīng)度個(gè)體。
3) 根據(jù)種群的當(dāng)前狀態(tài),判斷是否滿足停止條件:若是,則輸出最優(yōu)適應(yīng)度值;若不是,則返回步驟2)。
4) 將SSA 尋找的最優(yōu)學(xué)習(xí)率、隱含層神經(jīng)元個(gè)數(shù)賦值給GRU 網(wǎng)絡(luò),建立最優(yōu)的SSA-GRU 短期風(fēng)電出力預(yù)測模型。
為驗(yàn)證所構(gòu)建模型的有效性,選取西北某風(fēng)電場2017 年7 月4 日—2017 年8 月10 日的風(fēng)電歷史數(shù)據(jù)進(jìn)行分析和計(jì)算,數(shù)據(jù)每15 min 采樣一次,共得到3 648 條數(shù)據(jù),其中采用8 月10 日整天實(shí)際數(shù)據(jù)共96 個(gè)數(shù)據(jù)點(diǎn)作為測試集,7 月4日—8 月9 日共3 552 個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練集。采集的數(shù)據(jù)參量包括風(fēng)速、風(fēng)向、濕度和溫度等,具體見表1。
表1 原始數(shù)據(jù)特征表
為了能更好地評(píng)價(jià)預(yù)測模型精度,本實(shí)驗(yàn)將均方根誤差ERMS、平均絕對(duì)誤差EMA和擬合優(yōu)度系數(shù)R2作為評(píng)價(jià)標(biāo)準(zhǔn),表達(dá)式如下:
采用灰色關(guān)聯(lián)度、Kendall 秩相關(guān)系數(shù)和互信息分別計(jì)算各特征數(shù)據(jù)對(duì)風(fēng)電功率影響的程度,得到的相關(guān)系數(shù)如圖4~圖6 所示。其中Kendall秩相關(guān)系數(shù)強(qiáng)相關(guān)取值范圍為[0.6,1],灰色關(guān)聯(lián)度強(qiáng)相關(guān)的取值范圍為[0.65,1]。
圖4 基于灰色關(guān)聯(lián)度各特征相關(guān)系數(shù)
由圖4 可知,灰色關(guān)聯(lián)度為強(qiáng)相關(guān)的特征為不同距離點(diǎn)的風(fēng)速和天氣濕度,說明風(fēng)速和濕度與風(fēng)電功率具有很強(qiáng)的關(guān)聯(lián)度。由圖5 可知,Kendall 秩相關(guān)系數(shù)為強(qiáng)相關(guān)的特征為不同距離點(diǎn)的風(fēng)速和0 m 處風(fēng)向,再次說明風(fēng)速與風(fēng)電功率具有很強(qiáng)的相關(guān)性。由圖6 可知,不同距離點(diǎn)風(fēng)速特征和0 m 處風(fēng)向互信息量遠(yuǎn)遠(yuǎn)大于其他影響特征的互信息量。其中灰色關(guān)聯(lián)度濕度特征的關(guān)聯(lián)度為0.662 8,但是風(fēng)速特征和0 m 處風(fēng)向的關(guān)聯(lián)度均大于0.78,很顯然濕度特征的影響程度遠(yuǎn)遠(yuǎn)沒有風(fēng)速特征和0 m 處風(fēng)向高。綜合灰色關(guān)聯(lián)度、Kendall 秩相關(guān)系數(shù)和互信息,取三者交集作為最佳特征集。
圖5 基于 Kendall 各特征相關(guān)系數(shù)
圖6 基于互信息各特征相關(guān)系數(shù)
上述3 種特征選擇方法都驗(yàn)證風(fēng)速對(duì)風(fēng)電出力有著重要的影響。因此,最終選擇最優(yōu)輸入特征為:10、30、50、70 m 處風(fēng)速和0 m 處風(fēng)向5 個(gè)特征作為本文預(yù)測模型的輸入特征。
為了防止采用SSA-GRU 模型時(shí)參數(shù)之間的單位不統(tǒng)一,要消除參數(shù)之間的量綱影響,在訓(xùn)練模型就必須先對(duì)風(fēng)電的歷史數(shù)據(jù)進(jìn)行歸一化分析處理:
式中:xmin和xmax分別為數(shù)據(jù)中的最小值和最大值,x為實(shí)際數(shù)據(jù)值,x′為歸一化分析處理后的值。
為驗(yàn)證SSA-GRU 風(fēng)電功率預(yù)測模型的預(yù)測性能,在保持同一特征集的前提下,采用GRU、極限學(xué)習(xí)機(jī)(extreme learning machine, ELM)、LSTM和SSA-LSTM 模型得到的風(fēng)電出力預(yù)測效果并進(jìn)行對(duì)比,得到各預(yù)測模型的風(fēng)電功率預(yù)測圖和誤差評(píng)價(jià)指標(biāo)值如圖7 和表2 所示,其中均方根誤差和平均絕對(duì)誤差誤差評(píng)分越小表示預(yù)測效果越好,而擬合優(yōu)度系數(shù)值越大說明模型預(yù)測性能越好。從圖7 和表2 可以得出,不管是均方根誤差、平均絕對(duì)誤差還是擬合優(yōu)度系數(shù)均比未優(yōu)化前效果更好,其中均方根誤差和平均絕對(duì)誤差分別下降了54.3%和62.5%,擬合優(yōu)度系數(shù)提高了39.2%,且與其他預(yù)測模型相比,均方根誤差和平均絕對(duì)誤差平均下降了25.3%和31.3%,擬合優(yōu)度系數(shù)平均提高了10.2%。綜上實(shí)驗(yàn)數(shù)據(jù)可知本文所構(gòu)建預(yù)測模型預(yù)測效果最好,在短期風(fēng)電功率預(yù)測方面能取得很好的預(yù)測精度。
表2 不同模型的誤差評(píng)價(jià)指標(biāo)值
圖7 不同模型的功率預(yù)測效果
本文提出基于特征優(yōu)選和SSA-GRU 的短期風(fēng)電功率預(yù)測,經(jīng)過仿真驗(yàn)證得出以下結(jié)論:
1)利用灰色關(guān)聯(lián)度、Kendall 秩相關(guān)系數(shù)和互信息量3 種方法對(duì)輸入特征進(jìn)行選擇,在保留有效信息的同時(shí)避免冗余信息。
2)針對(duì)GRU 人工調(diào)參量大且準(zhǔn)確性差的問題,利用麻雀搜索算法尋找最優(yōu)超參數(shù),充分發(fā)揮GRU 的性能。
通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),本文構(gòu)建的模型與其他傳統(tǒng)模型相比,具有更好的預(yù)測精度和泛化能力。