劉 倩,李 時(shí),陳 苗
(1.滁州職業(yè)技術(shù)學(xué)院 電氣工程學(xué)院,安徽 滁州 239000;2.國網(wǎng)滁州供電公司,安徽 滁州 239000)
風(fēng)能作為儲(chǔ)備豐富、無污染的可再生能源,在全球經(jīng)濟(jì)高速發(fā)展的情形下獲得越來越多的關(guān)注,我國風(fēng)電項(xiàng)目的總體容量在我國電力系統(tǒng)所占比例不斷提升[1]。風(fēng)速具有較大波動(dòng)性和間歇性,導(dǎo)致風(fēng)力發(fā)電的實(shí)際功率具有隨機(jī)性、不穩(wěn)定性、受季節(jié)因素影響大等缺點(diǎn),提高風(fēng)電功率預(yù)測(cè)系統(tǒng)的預(yù)測(cè)精度是保證風(fēng)電系統(tǒng)安全穩(wěn)定運(yùn)行的必要前提和保證[2].
通過研究國內(nèi)外文獻(xiàn)知,風(fēng)電預(yù)測(cè)方法主要有兩種:統(tǒng)計(jì)模型法和人工智能法[3-4].統(tǒng)計(jì)模型法主要是處理線性數(shù)據(jù)并建模,風(fēng)電屬于非線性數(shù)據(jù),統(tǒng)計(jì)模型法難以克服其對(duì)預(yù)測(cè)精度的影響;人工智能法適用于線性、非線性甚至極高復(fù)雜度的數(shù)值關(guān)系,無需構(gòu)建精確的數(shù)學(xué)模型,廣泛應(yīng)用于風(fēng)電預(yù)測(cè),但其精準(zhǔn)度依賴于輸入?yún)?shù)和訓(xùn)練樣本[5-6].近年來,深度學(xué)習(xí)法廣泛應(yīng)用于電力負(fù)荷預(yù)測(cè)并取得不錯(cuò)的預(yù)測(cè)效果,在眾多深度神經(jīng)網(wǎng)絡(luò)模型中,LSTM網(wǎng)絡(luò)模型是一種能兼顧時(shí)序數(shù)據(jù)的時(shí)序性和非線性關(guān)系的一種深度神經(jīng)網(wǎng)絡(luò)模型,如何提高模型的預(yù)測(cè)精準(zhǔn)度和減少計(jì)算量和復(fù)雜度成為研究重點(diǎn).鑒于此,筆者提出一種基于CNN-LSTM的短期風(fēng)電預(yù)測(cè)模型,通過試驗(yàn)結(jié)果表明,此模型的預(yù)測(cè)精度遠(yuǎn)高于傳統(tǒng)LSTM預(yù)測(cè)模型,具有普遍適應(yīng)性.
CNN近年來在數(shù)據(jù)特征提取、高維數(shù)據(jù)降維上取得廣泛應(yīng)用,它通過卷積層、池化層這兩個(gè)主要部分對(duì)多維時(shí)間序列在空間結(jié)構(gòu)上的關(guān)系進(jìn)行提取.
典型的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,卷積層通過對(duì)輸入數(shù)據(jù)進(jìn)行卷積運(yùn)算,提取數(shù)據(jù)特征,一維卷積計(jì)算為:
圖1 卷積神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)處理過程
式中oc為某層卷積的特征映射,fc(x)為卷積激活函數(shù),?為卷積操作,Wc為當(dāng)前卷積核的權(quán)值向量,bc為當(dāng)前卷積層的偏置.
池化層是數(shù)據(jù)特征的深層提取以保留主要特征數(shù)據(jù),在卷積層之后,采用最大池化法對(duì)數(shù)據(jù)進(jìn)行降維(即降采樣),可以減少網(wǎng)絡(luò)的參數(shù)和計(jì)算復(fù)雜度.
式中op為全局池化層的輸出最大序列,oc為卷積層輸出向量集.全連接層將池化層的輸出特征映射成固定長度的列向量,用于模型的訓(xùn)練分類和回歸運(yùn)算.
LSTM算法是Hochreiter和Schmidhuber提出的一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),它克服了傳統(tǒng)RNN在處理嘗試序列時(shí)的梯度消失問題,LSTM算法通過“門”邏輯控制和狀態(tài)傳遞單元(圖2)找出時(shí)間序列內(nèi)部變化規(guī)律,并記住較長期的信息,通過狀態(tài)單元不斷更新避免了梯度消失,適用于預(yù)測(cè)風(fēng)電的短期負(fù)荷[7].
如圖2所示,LSTM能有效地對(duì)輸入數(shù)據(jù)進(jìn)行利用,將過去
的長期數(shù)據(jù)形成記憶,LSTM單元將前一個(gè)單元的輸出信息ct-1和本單元聯(lián)系在一起,實(shí)現(xiàn)狀態(tài)單元不斷更新ct,通過輸入門τi、遺忘門τf、輸出門τo三種控制門機(jī)制來實(shí)現(xiàn)的.
式中h,x,c為單元的3個(gè)變量,變量下標(biāo)為t-1對(duì)應(yīng)的是上一個(gè)單元的輸出,sigmoid和tanh對(duì)應(yīng)的是激活函數(shù)的變量.bi、bf、bo、bc表示偏移常數(shù),Wi、Wf、Wo、Wc分別對(duì)應(yīng)3個(gè)門和狀態(tài)單元的權(quán)系數(shù)矩陣.
控制長期狀態(tài)c是LSTM算法的關(guān)鍵,輸入門τi決定了輸入xt保存至當(dāng)前ct的程度、遺忘門τf決定上一單元ct保存至這一單元ct的程度、輸出門τo決定了ct多大程度輸出至當(dāng)前ht.
(1)數(shù)據(jù)預(yù)處理階段主要針對(duì)風(fēng)電數(shù)據(jù)中的異常值和空值比如設(shè)備損壞、異常干擾、停電等,筆者利用pandas工具對(duì)數(shù)據(jù)進(jìn)行讀取,查看并利用函數(shù)修補(bǔ)法或者直接剔除異常值.再對(duì)數(shù)據(jù)歸一化處理,消除風(fēng)電場(chǎng)裝機(jī)容量差異及數(shù)據(jù)集維度在量綱上的差異.綜合考慮風(fēng)電負(fù)荷數(shù)據(jù)的特點(diǎn),將風(fēng)電原始數(shù)據(jù):風(fēng)電功率、風(fēng)速、風(fēng)向χs采用公式進(jìn)行歸一化處理,χc為歸一化處理之后的輸入數(shù)據(jù),大小在[0-1]之間的,用于模型的輸入數(shù)據(jù).為原始數(shù)據(jù),χmax、χmin為原始數(shù)據(jù)的最值.
(2)采用一維卷積神經(jīng)網(wǎng)絡(luò)CNN對(duì)風(fēng)電數(shù)據(jù)進(jìn)行降維處理,χc為1*3向量,卷積核向右平移,移動(dòng)步長為2,經(jīng)過大小為1*2的池化層池化,完成一次卷積池化過程,再經(jīng)過幾次卷積層池化層,全連接后得到維度大幅度縮減之后的特征值χc’,提取能最大程度代表風(fēng)電功率的特征數(shù)據(jù),以減少訓(xùn)練參數(shù),降低算法的復(fù)雜度,能有效地避過度擬合,使訓(xùn)練時(shí)間加快,提高算法的泛化能力.
(3)將特征序列作為LSTM預(yù)測(cè)模型的輸入,生成初始預(yù)測(cè)結(jié)果.
(4)對(duì)N個(gè)驗(yàn)證數(shù)據(jù),Yi為風(fēng)電預(yù)測(cè)數(shù)據(jù),Yi-1為風(fēng)電實(shí)際數(shù)據(jù),以相對(duì)誤差值、RMSE為預(yù)測(cè)綜合評(píng)價(jià)指標(biāo)
本實(shí)驗(yàn)樣本采用安徽省某市風(fēng)電負(fù)荷數(shù)據(jù)及氣象數(shù)據(jù)風(fēng)電功率、風(fēng)速、風(fēng)向,采樣間隔時(shí)間為1小時(shí),數(shù)據(jù)中前70%數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),20%作為驗(yàn)證樣本,10%的數(shù)據(jù)作為測(cè)試數(shù)據(jù),數(shù)據(jù)維度為36.首先對(duì)負(fù)荷數(shù)據(jù)及氣象數(shù)據(jù)進(jìn)行預(yù)處理,包括異常值去除后再對(duì)數(shù)據(jù)進(jìn)行歸一化處理,采用雙層CNN神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行降維處理,并在改變LSTM的單元數(shù)測(cè)試不同的LSTM模型預(yù)測(cè)效果,實(shí)驗(yàn)結(jié)果表明,1個(gè)、2個(gè)、4個(gè)LSTM的隱含層其RMSE分別是0.68、0.61和0.6,3個(gè)LSTM的隱含層能達(dá)到最佳擬合效果,RMSE=0.53,訓(xùn)練時(shí)長隨著隱含層的增多呈增加的趨勢(shì).
本文采用CNN-LSTM和傳統(tǒng)LSTM兩種模型分別進(jìn)行預(yù)測(cè),圖示3和圖4為風(fēng)電功率的預(yù)測(cè)效果圖:黑色曲線(·標(biāo)識(shí))對(duì)應(yīng)的是傳統(tǒng)LSTM模型的預(yù)測(cè)值,細(xì)實(shí)線為實(shí)際值,虛線(o標(biāo)識(shí))為采用CNNSLTM模型的預(yù)測(cè)值.從下圖的曲線可以看出,傳統(tǒng)的LSTM預(yù)測(cè)模型和CNN-LSTM預(yù)測(cè)模型都能對(duì)短期風(fēng)電進(jìn)行預(yù)測(cè),曲線的變化符合實(shí)際風(fēng)電曲線的變化趨勢(shì).
圖4 步長為3時(shí)的風(fēng)電預(yù)測(cè)曲線圖
對(duì)比圖3、圖4可以看出,步長增加時(shí)的預(yù)測(cè)效果會(huì)下降,是由于在增加步長的同時(shí),風(fēng)電的隨機(jī)性導(dǎo)致預(yù)測(cè)數(shù)據(jù)和訓(xùn)練數(shù)據(jù)之間的關(guān)聯(lián)性減低,影響模型的預(yù)測(cè)精度;CNN的移動(dòng)步長分別選擇2、3時(shí)的預(yù)測(cè)數(shù)據(jù)對(duì)比,平均減少27.6%、29.1%.
圖3 步長為2時(shí)的風(fēng)電預(yù)測(cè)曲線圖
如圖5所示,虛線標(biāo)識(shí)的是LSTM傳統(tǒng)模型的相對(duì)誤差曲線,實(shí)線為筆者預(yù)測(cè)模型結(jié)果的相對(duì)誤差曲線.經(jīng)CNN處理之后的LSTM模型在數(shù)據(jù)特征選取上的優(yōu)點(diǎn)更加明顯,卷積層和池化層能有效地選取更能代表風(fēng)電功率的特征數(shù)據(jù),極大提高模型的預(yù)測(cè)效果.
圖5 預(yù)測(cè)模型的相對(duì)誤差
為了提高短期風(fēng)電預(yù)測(cè)模型的精度,提出了一種基于CNNLSTM的預(yù)測(cè)模型.通過CNN的卷積層和池化層的堆疊作用,提取最能代表風(fēng)電特征的特征數(shù)據(jù)并對(duì)其降維處理,同時(shí)保留其在時(shí)間維度上的特征,實(shí)現(xiàn)了對(duì)特征數(shù)據(jù)的深度挖掘;LSTM特有的“門”機(jī)制和對(duì)時(shí)間序列的記憶作用能高效地利用歷史特征數(shù)據(jù)進(jìn)行風(fēng)電預(yù)測(cè),此模型的預(yù)測(cè)精度遠(yuǎn)高于傳統(tǒng)LSTM模型的預(yù)測(cè)效果,本實(shí)驗(yàn)為短期風(fēng)電預(yù)測(cè)技術(shù)的研究積累了經(jīng)驗(yàn).