摘 要:針對傳統(tǒng)光伏功率預(yù)測方法的精度和魯棒性難以兼顧的不足,提出一種結(jié)合相似日理論、改進麻雀算法(ISSA)與SE通道注意力機制的卷積(CNN)雙向長短期記憶(BiLSTM)神經(jīng)網(wǎng)絡(luò)模型(簡寫為ISC-BiLSTM),能實現(xiàn)短期光伏功率的準(zhǔn)確預(yù)測。該方法首先通過相關(guān)性計算,篩選出影響光伏功率的主要氣象因子;再使用模糊C均值聚類(FCM)方法對存在相似天氣特征的相似日進行聚類;然后通過加入SE的CNN對主要氣象參數(shù)與歷史功率的時空特征進行充分提取;接著利用BiLSTM對數(shù)據(jù)序列間的依賴關(guān)系進行捕捉;最后通過ISSA對模型的超參數(shù)進行尋優(yōu),并選擇超參數(shù)最優(yōu)的模型進行功率預(yù)測。對比實驗與仿真結(jié)果表明,該方法預(yù)測誤差較低,能實現(xiàn)日前分鐘級短期光伏功率的準(zhǔn)確預(yù)測。
關(guān)鍵詞:光伏發(fā)電;預(yù)測;神經(jīng)網(wǎng)絡(luò);注意力機制;改進麻雀算法;模糊聚類
中圖分類號:TM615 """""文獻標(biāo)志碼:A
0 引 言
光伏發(fā)電憑借安全、高效、經(jīng)濟、環(huán)保的優(yōu)勢已成為能源清潔轉(zhuǎn)型的主力,其并網(wǎng)滲透率不斷提高。但光伏發(fā)電具有較大的隨機性、波動性和間歇性,這些特性影響著電網(wǎng)運行的穩(wěn)定性和安全性。因此,精確預(yù)測光伏輸出功率對于輸電調(diào)配、機組調(diào)度和日前市場交易具有重要意義[1]。
按照方法的不同,光伏功率預(yù)測方式通常分為物理法、統(tǒng)計法和機器學(xué)習(xí)法。物理法[2-3]是基于發(fā)電原理構(gòu)建相應(yīng)數(shù)學(xué)模型的方法,不依賴大量的歷史數(shù)據(jù),但建模和求解過程復(fù)雜,預(yù)測穩(wěn)定性和可靠性較弱。統(tǒng)計法[4]通過參數(shù)估計和曲線擬合等方式利用歷史數(shù)據(jù)來建立預(yù)測模型,其通用性強、建模方便,但其預(yù)測質(zhì)量與歷史數(shù)據(jù)的質(zhì)量強相關(guān),數(shù)據(jù)的誤差或缺失都對預(yù)測效果有顯著影響。目前,機器學(xué)習(xí)法多數(shù)是利用神經(jīng)網(wǎng)絡(luò)自主學(xué)習(xí)輸入特征與輸出結(jié)果的對應(yīng)關(guān)系來進行預(yù)測,其使用方便、抗干擾能力強,預(yù)測準(zhǔn)確率高。其中長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)在時間序列預(yù)測任務(wù)中表現(xiàn)優(yōu)越,在光伏發(fā)電功率預(yù)測領(lǐng)域中的應(yīng)用日漸廣泛。文獻[5]結(jié)合天氣信息和LSTM提出一種光伏功率預(yù)測方法,實現(xiàn)了在天氣信息較模糊的情況下對分布式光伏發(fā)電功率進行短期預(yù)測,但單一神經(jīng)網(wǎng)絡(luò)模型精度較低;文獻[6]結(jié)合極端梯度提升模型(extreme Gradient Boosting,XGBoost)與LSTM對短期光伏發(fā)電功率進行預(yù)測;文獻[7]提出一種結(jié)合VMD-LSTM模型與誤差補償技術(shù)的光伏功率預(yù)測方法,采用變分模態(tài)分解(variational mode decom position,VMD)算法將原始功率序列分解為若干不同模態(tài),并建立對應(yīng)的LSTM模型進行超短期預(yù)測;文獻[8]提出一種EMD-PCA-LSTM光伏功率預(yù)測模型,采用經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)將環(huán)境因素序列進行分解,再通過主成分分析法(principal component analysis,PCA)提取關(guān)鍵影響因素,并使用LSTM進行建模預(yù)測,消除了原始序列的冗余性;文獻[9]比較了卷積神經(jīng)網(wǎng)絡(luò)模型(convolutional neural network,CNN)、LSTM模型和CNN-LSTM模型在光伏功率預(yù)測中的效果,結(jié)果表明CNN-LSTM組合模型的預(yù)測精度相對較高;文獻[10]提出一種基于W-BiLSTM的風(fēng)電、光伏功率預(yù)測方法,該方法將LSTM拆分為兩個方向,充分學(xué)習(xí)了數(shù)據(jù)的正反向特征,結(jié)果表明雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(Bidrirectional long short-term memory, BiLSTM)模型預(yù)測精度高于LSTM;文獻[11]提出一種基于相似日聚類和QR-CNN-BiLSTM模型的光伏功率區(qū)間預(yù)測模型,結(jié)果表明將歷史數(shù)據(jù)按照一定規(guī)律進行聚類可有效提高模型的預(yù)測精度。上述方法雖相對于單一神經(jīng)網(wǎng)絡(luò)模型預(yù)測精度有所提高,但在復(fù)雜天氣情況下的精度與魯棒性仍需進一步提升。
綜合近來的研究成果,光伏功率預(yù)測的準(zhǔn)確度與效率相較于早期方法均有較大提升,但多數(shù)方法在面對多變的氣候條件時仍存在預(yù)測性能與魯棒性難以兼顧的不足。對此,本文充分考慮了信息流的正反向傳播特點以及神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集、特征提取效果以及神經(jīng)網(wǎng)絡(luò)中超參數(shù)設(shè)置對預(yù)測精度的影響,結(jié)合相信日理論,提出一種由改進麻雀算法優(yōu)化的帶通道注意力機制的卷積雙向長短期記憶神經(jīng)網(wǎng)絡(luò)模型(ISC-BiLSTM),用于短期光伏功率預(yù)測。該方法在不同天氣環(huán)境下均可保持良好的表現(xiàn),且預(yù)測時間間隔較短,時間粒度精細,預(yù)測信息更詳細。
1 基于FCM的相似日聚類
針對氣象因子對光伏功率的顯著影響,本文運用模糊C均值聚類算法(fuzzy C-means clustering,F(xiàn)CM)對天氣類型相似的日期進行聚類,并根據(jù)聚類結(jié)果對不同天氣類型的日期建立相應(yīng)的訓(xùn)練集,為后續(xù)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練提供更具針對性的天氣數(shù)據(jù),進而提高整體的預(yù)測效率和精度。
1.1 光伏發(fā)電影響因素分析
影響光伏功率的因素通??煞譃閮?nèi)在因素和外在因素。內(nèi)在因素主要有電站的設(shè)計差別、光伏組件的轉(zhuǎn)換效率、逆變器的差異等;外在因素主要包括輻照度、溫度、濕度、壓強、風(fēng)速等氣象因素。對于固定光伏場來說,歷史功率數(shù)據(jù)中通常已經(jīng)包含內(nèi)在因素的影響,因此在研究中只考慮外在因素(氣象因素)即可[12]。
為了量化氣象因素與光伏發(fā)電功率之間的相關(guān)程度,本文采用皮爾遜(Pearson)相關(guān)系數(shù)來衡量各氣象因子與光伏功率之間的線性相關(guān)程度[13],其計算公式為:
[r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)212] (1)
式中:[x]、[y]——氣象因子和光伏功率;[x]、[y]——[x]、[y]的平均值;[r]——Pearson相關(guān)系數(shù)值,其值域為[-"1],正負值的意義為正相關(guān)和負相關(guān),[r]越大,說明變量相關(guān)性程度越高。
本文采用澳大利亞DKASC中光伏站點Alice Springs的2018年的實測數(shù)據(jù)與當(dāng)?shù)貧庀蟛块T記錄的同年天氣數(shù)據(jù)進行相關(guān)性計算與分析。考慮的氣象因素包括總水平輻照度、散射輻照度、氣溫、濕度、風(fēng)速、風(fēng)向、降雨量。光伏功率與上述氣象因素的相關(guān)系數(shù)與相關(guān)程度如表1所示。
從表1可看出,光伏發(fā)電功率與總水平輻照度存在極強的相關(guān)性;與散射輻照度、氣溫和濕度的相關(guān)性次之;與風(fēng)速相關(guān)性較弱;與風(fēng)向、降雨量相關(guān)性極弱。因此,本文認為總水平輻照度、散射輻照度、氣溫和濕度為影響光伏發(fā)電功率的主要因素。
1.2 基于FCM的相似日聚類
FCM是基于傳統(tǒng)K-means聚類算法的一種改進算法,可根據(jù)樣本與聚類中心的相似度關(guān)系實現(xiàn)柔性模糊聚類,提供更加優(yōu)越、靈活的聚類結(jié)果[14]。
由表1可知,光伏發(fā)電功率與總水平輻照度的Pearson相關(guān)系數(shù)值接近"說明兩者之間存在極強的線性相關(guān)性,總水平輻照度能全面反映光伏功率數(shù)據(jù)的波動規(guī)律和特點,本文選取每日總水平輻照度的最大值、平均值、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)差率、峰度、偏度作為相似日聚類的特征,將具有相似特征的日期定義為相似日。
FCM聚類本質(zhì)上是通過反復(fù)迭代計算,使各特征關(guān)于同一聚類中心的歐式距離和隸屬度函數(shù)取得最小值,并滿足相似日特征的類內(nèi)距離最小,且類間距離最大。根據(jù)聚類水平選取相似日能集中數(shù)據(jù)的有效信息,提升選取效率和效果。
FCM的目標(biāo)函數(shù)本質(zhì)上是各特征樣本到各聚類中心的歐氏距離之和,可表示為:
[J(U,V)=i=1nj=1cumijd2ij] (2)
式中:[U]——隸屬度矩陣;[V]——聚類中心;[m]——隸屬度因子;[n]——樣本數(shù)量;[c]——聚類數(shù)量;[umij]——第[i]個樣本屬于第[j]類的隸屬度;[d2ij]——樣本到聚類中心的歐氏距離。
為使目標(biāo)函數(shù)取得最小值,在迭代過程中使用拉格朗日乘數(shù)法計算第l步的聚類中心[ν(l)j]和隸屬度矩陣[u(l)ij],分別表示為:
[ν(l)j=i=1n(u(l-1)ij)mxii=1n(u(l-1)ij)m] (3)
[u(l)ij=1k=1cd(l)ijd(l)ik2m-1] (4)
式中:[xi]——樣本點;[d(l)ik]——第[i]個樣本到第[k]個聚類中心的歐氏距離。迭代的終止條件為:
[maxiju(t+1)ij-u(t)ijlt;ε] (5)
式中:[t]——迭代步數(shù);[ε]——中止閾值。當(dāng)滿足中止條件后,認為樣本隸屬度不再發(fā)生變化,目標(biāo)函數(shù)收斂于局部最小值點或鞍點,此時完成聚類任務(wù)。
2 ISC-BiLSTM模型
針對目前多數(shù)模型在光伏功率預(yù)測中精度和魯棒性難以兼得的不足,本文提出一種基于改進麻雀算法(improved sparrow search algorithm, ISSA)與(squeeze-and-excitation,SE)通道注意力機制的卷積(CNN)雙向長短期記憶(BiLSTM)神經(jīng)網(wǎng)絡(luò)模型(簡寫為ISC-BiLSTM)。
2.1 結(jié)合SE注意力機制的CNN
融合SE模塊后的CNN對各通道的特征有更強的辨別能力,進而能有效提升模型的預(yù)測精度,SE-CNN的結(jié)構(gòu)與主要工作過程如圖1所示。
CNN具有高效的特征提取能力,其基本結(jié)構(gòu)主要包括輸入層、卷積層、池化層、全連接層和輸出層。卷積層是CNN的核心,能通過卷積核捕捉影響光伏功率的各氣象數(shù)據(jù)序列中的不同特征。池化層位于卷積層之后,對特征進行降維和二次提取能有效提高模型泛化能力。CNN的卷積和池化過程分別如圖1a、圖1b所示。
考慮到在光伏功率預(yù)測中會對多種不同的氣象因素進行特征提取,這往往會導(dǎo)致CNN在處理大量冗雜的數(shù)據(jù)時提取到一些特征不明顯的信息[15],影響預(yù)測精度。神經(jīng)網(wǎng)絡(luò)中的注意力機制模擬了人腦注意力的運作情況,能從大量信息中篩選出少量且重要的信息,并加以重點關(guān)注[16],能有效降低冗余特征對預(yù)測精度的影響,因此本文在CNN的池化層后嵌入SE模塊來優(yōu)化模型的特征提取效果。
SE并非是一個完整的網(wǎng)絡(luò)結(jié)構(gòu),而是一個端到端的子結(jié)構(gòu)。SE的核心是建立卷積或池化得到的特征圖之間的依賴關(guān)系模型,并通過全連接網(wǎng)絡(luò)根據(jù)損失函數(shù)自動學(xué)習(xí)每個特征通道的重要程度并賦予相應(yīng)的權(quán)重值,使神經(jīng)網(wǎng)絡(luò)集中關(guān)注高權(quán)重值的特征通道,從而使模型達到更優(yōu)效果。具體實現(xiàn)過程如圖1c所示,可描述為:
1)擠壓(squeeze),即圖1c中的[Fsq]操作,通過全局平均池化將特征圖的大小壓縮為1×"進而可將[c]個特征圖映射為1×1×c的一維特征數(shù)組,可表示為:
[Zc=Fsq(Uc)=1h×wi=1hj=1wUc(i,j)] (6)
式中:[Zc]——擠壓操作的輸出權(quán)重;[Uc]——每個通道的特征圖;[h]和[w]——特征圖的高度和寬度;[Uc(i,j)]——特征通道[c]中第[i]行第[j]列的值。
2)激勵(excitation),即圖1c中的[Fex]操作,通過參數(shù)學(xué)習(xí)計算出每個通道對應(yīng)的權(quán)重值,可表示為:
[S=Fex(Z,W)=σ(W2δ(W1Z))] (7)
式中:S——特征圖的權(quán)重,[σ]和[δ]——激活函數(shù);[W1]和[W2]——維度[c/r×c]和[c×c/r]的權(quán)重矩陣;[r]——降維系數(shù)。模型包含兩個全連接層,先通過[W1]降維,再通過[W2]升維,能有效降低復(fù)雜度并發(fā)揮輔助泛化作用。
3)點積(scale),即圖1c中的[Fscale]操作,將得出的權(quán)重值加權(quán)到對應(yīng)通道的特征上,可表示為:
[X=Fscale(Uc, Sc)=Sc?Uc] (8)
式中:[Sc]——通道權(quán)重值;[?]表示逐元素相乘。
2.2 BiLSTM神經(jīng)網(wǎng)絡(luò)
光伏功率預(yù)測任務(wù)中伴隨著對長時間序列數(shù)據(jù)的處理,傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)在處理較長的時間序列時很容易發(fā)生梯度消失問題,導(dǎo)致無法準(zhǔn)確預(yù)測。而LSTM神經(jīng)網(wǎng)絡(luò)通過遺忘門、輸入門和輸出門這3個獨特的“門”結(jié)構(gòu)來控制細胞內(nèi)信息的存儲和丟棄,從而實現(xiàn)時序信息的保留和長期記憶,避免了梯度消失問題 [17],更加適合用于光伏功率預(yù)測。LSTM的基本神經(jīng)元結(jié)構(gòu)如圖2a所示。
在光伏功率預(yù)測中,若能充分考慮氣象序列數(shù)據(jù)的正反向信息傳播規(guī)律可進一步提高預(yù)測的準(zhǔn)確度。BiLSTM是對單LSTM的優(yōu)化改進,由前向LSTM和后向LSTM構(gòu)成[18],其結(jié)構(gòu)如圖2b所示。BiLSTM能同時捕捉氣象序列信息的正反向流動的變化規(guī)律,綜合考慮雙向的歷史氣象序列信息有利于進一步提高模型預(yù)測精度。
在本文建立的光伏功率預(yù)測模型中,歷史氣象序列數(shù)據(jù)經(jīng)過SE-CNN進行特征提取后,輸入到BiLSTM中,由前向LSTM層和后向LSTM層分別進行正反向計算,最終結(jié)合兩者的計算結(jié)果得到最終輸出。其中,LSTM單元內(nèi)的計算過程為:
[ft=σWf·[ht-1, xt]+bfit=σWi·[ht-1, xt]+bict=tanh(Wc·[ht-1, xt]+bc)ct=ft·ct-1+it·ctot=σWo·[ht-1, xt]+boht=ot·tanhct] (9)
式中:[ft]、[it]、[ot]——遺忘門、輸入門、輸出門的狀態(tài);[ct]——記憶單元的輸入狀態(tài);[ct]——細胞狀態(tài);[ht]——隱藏層輸出;[Wf],[Wi],[Wo],[Wc]——遺忘門、輸入門、輸出門和細胞狀態(tài)的權(quán)重;[bf],[bi],[bo],[bc]——遺忘門、輸入門、輸出門和細胞狀態(tài)的偏置量;[σ]——激活函數(shù)。
2.3 改進的麻雀搜索算法
在深度學(xué)習(xí)中,神經(jīng)網(wǎng)絡(luò)模型的超參數(shù)的選取顯著影響模型預(yù)測效果。其中初始學(xué)習(xí)率過大會導(dǎo)致模型難以收斂,過小則導(dǎo)致模型收斂過慢甚至無法學(xué)習(xí);隱藏層節(jié)點數(shù)量過多會使模型易陷入局部最優(yōu),過少則會導(dǎo)致模型泛化能力低;正則化能通過降低模型復(fù)雜度防止過擬合。為降低人工尋找較優(yōu)超參數(shù)的時間成本,且使模型的超參數(shù)選擇相對最優(yōu),本文采用混合改進的麻雀算法(ISSA)對BiLSTM的初始學(xué)習(xí)率、隱藏層節(jié)點數(shù)量、正則化系數(shù)3種超參數(shù)進行尋優(yōu)。
麻雀搜索算法(SSA)模擬了麻雀的覓食與反捕食行為 [19],傳統(tǒng)SSA中的麻雀分為發(fā)現(xiàn)者和加入者,并從中隨機產(chǎn)生占種群數(shù)量10%~20%的警戒者。其中,發(fā)現(xiàn)者負責(zé)尋找適應(yīng)度值高的位置并領(lǐng)導(dǎo)種群移動,加入者跟隨適應(yīng)度最高的發(fā)現(xiàn)者來更新位置,警戒者能意識到危險并發(fā)出警報。傳統(tǒng)SSA收斂速度快、收斂精度高,但其種群豐富度低、全局搜索能力差、易陷入局部最優(yōu)。為降低以上缺陷帶來的誤差,提出一種基于Chebyshev混沌映射與精英反向策略混合改進的麻雀搜索算法。
Chebyshev映射是混沌映射的典型代表,其初值敏感性較低,魯棒性強。相比于原算法的隨機初始化,通過Chebyshev映射來優(yōu)化麻雀的初始種群,有助于使種群更加均勻地分布在空間中,進而提高初始種群的多樣性。Chebyshev混沌映射的數(shù)學(xué)表達式為:
[xt+1=cos(tcos-1(xt))] (10)
式中:[x]的范圍為[0,1];[x1]——屬于(0,1)均勻分布的隨機數(shù)。
反向策略基本思想是以當(dāng)前解為基礎(chǔ),通過反向?qū)W習(xí)尋找對應(yīng)的反向解,并進行比較,保留更好的解。反向策略可擴大算法搜索區(qū)域,但此過程也具有一定盲目性,易造成搜索時間的浪費。因此,進一步引入精英策略,通過精英個體的反向?qū)W習(xí)來引導(dǎo)搜索過程逐步逼近最優(yōu)解[20]。精英反向策略的機制為:設(shè)[xi(t)]為第[t]次迭代的解,其反向解為[x′i(t)],目標(biāo)函數(shù)為[f(x)]。當(dāng)[xi(t)≥x′i(t)]時,則稱[xi(t)]為第[t]次迭代的精英個體,反之,精英個體則為[x′i(t)]。故設(shè)[xij]為個體[xi]在[j]維上的值,其反向解為:
[x′ij(t)=mlij(t)+uij(t)-xij(t)] (11)
式中:[m]——介于0~1的隨機數(shù);[lij(t)]、[uij(t)]——[x′ij(t)]在第[j]維的最小值和最大值;[[lij, uij]]——精英群體所構(gòu)造的區(qū)間。精英反向策略在SSA中的體現(xiàn)為:選擇適應(yīng)度排名前10%的個體作為精英,并在區(qū)間內(nèi)利用反向策略求取反向解,并對比更新前后個體,保留較優(yōu)者。
經(jīng)過Chebyshev混沌映射與精英反向策略混合改進的ISSA相比于傳統(tǒng)SSA有更強的全局搜索能力、更快的收斂速度,有效降低了模型陷入局部最優(yōu)的可能性,能更準(zhǔn)確地對模型超參數(shù)進行尋優(yōu),提升模型的預(yù)測效率與效果。
2.4 基于ISC-BiLSTM的預(yù)測模型
本文所提基于ISC-BiLSTM的模型用以預(yù)測光伏發(fā)電功率,模型框架如圖3所示。
模型主要步驟如下:
1)進行相關(guān)性分析,通過式(1)計算出每個氣象因子與光伏功率之間的Pearson系數(shù)值,篩選出與光伏功率相關(guān)程度較高的氣象因素,接著通過式(2)~式(5)進行相似日聚類,根據(jù)待測日的天氣類型建立相應(yīng)的訓(xùn)練集,確定輸入序列。
2)對輸入的數(shù)據(jù)進行歸一化處理,防止不同量綱氣象數(shù)據(jù)的輸入對預(yù)測結(jié)果造成不良影響,并加快模型訓(xùn)練的收斂速度,如式(12)表示。
[Xnom=X-XminXmax-Xmin] (12)
式中:[Xnom]——歸一化后的值;[X]——數(shù)據(jù)原始值;[Xmax]、[Xmin]——序列中最大與最小值。
3)通過SE-CNN提取氣象數(shù)據(jù)的特征,首先通過卷積層通過卷積運算進行初步提取,接著通過池化層進行特征降維和二次提取,然后通過式(6)~式(8)建立SE注意力機制,通過分配特征通道的注意力權(quán)重來提升模型效果。
4)將提取出的特征數(shù)據(jù)輸入到BiLSTM層中,通過式(9)實現(xiàn)每個LSTM單元的計算,最終結(jié)合正反向計算結(jié)果實現(xiàn)對模型特征數(shù)據(jù)的訓(xùn)練。
5)通過式(10)優(yōu)化ISSA的初始種群,再通過式(11)優(yōu)化ISSA的學(xué)習(xí)策略,以模型的均方誤差([eMSE])作為適應(yīng)度函數(shù),通過反復(fù)迭代,對模型的隱藏層節(jié)點數(shù)、初始學(xué)習(xí)率、正則化系數(shù)3種超參數(shù)進行尋優(yōu),最后以超參數(shù)最優(yōu)的模型完成預(yù)測任務(wù)并輸出預(yù)測結(jié)果。
6)將預(yù)測數(shù)據(jù)進行反歸一化處理后輸出,并采用[eMSE]、平均絕對誤差([eMAE])、均方根誤差([eRMSE])和決定系數(shù)([R2])作為模型的誤差評價指標(biāo)對模型效果進行評估,計算式如式(13)~式(16)所示。[eMSE、eMAE、eRMSE]的值越小代表模型預(yù)測精度越高,[R2]的值越接近1表明模型效果越好。
[eMSE=1ni=1n(y′i-yi)2] (13)
[eMAE=1ni=1nyi-y′i] (14)
[eRMSE=1ni=1n(y′i-yi)2] (15)
[R2=1-i=1n(y′i-yi)2i=1n(y-yi)2] (16)
式中:[yi]——實際功率值;[y′i]——功率預(yù)測值;[y]——功率平均值值;[n]——樣本總數(shù)。
3 算例分析
本文采用澳大利亞DKASC的光伏發(fā)電站Alice Springs中某站點在2018年的光伏發(fā)電數(shù)據(jù)與本文篩選出的4個氣象因素(總水平輻照度、散射輻照度、氣溫、濕度)作為算例分析數(shù)據(jù)。光伏發(fā)電功率數(shù)據(jù)與各氣象數(shù)據(jù)的采樣間隔都為5 min,即每天采集288組數(shù)據(jù)。
3.1 相似日聚類結(jié)果
根據(jù)總水平輻照度的特點,并結(jié)合實際情況,采用FCM算法將天氣類型劃分為晴天、多云、陰天、雨天4種類型。由于夜晚光伏發(fā)電功率為0,故只取每天白天(06:00—20:00)的發(fā)電功率數(shù)據(jù)進行相似日聚類示意圖的繪制,如圖4所示。
由圖4可看出,在相同的天氣類型中,光伏發(fā)電功率曲線具有相似的波動情況。晴天時功率曲線最穩(wěn)定,很少出現(xiàn)波動;多云時功率曲線波動頻率增高,且劇烈波動發(fā)生的時間多數(shù)位于午后,但整體輸出功率依然可觀;陰天時功率曲線波動更加頻繁、劇烈,整體輸出功率有所降低,但大致滿足中午時間段發(fā)電功率較高的特點;雨天時功率曲線波動頻繁、無序,整體輸出功率最低?;谝陨戏治?,判斷出基于FCM的相似日聚類結(jié)果符合實際天氣特點。
3.2 相似日聚類效果與單一模型性能分析
為驗證相似日聚類對預(yù)測效果的提升和BiLSTM模型的優(yōu)越性,選取4個天氣類型不同的日期(晴天(10月9日)、多云(10月19日)、陰天(11月18日)、雨天(11月21日))進行對比實驗。
除了BiLSTM模型外,本文另外選取了常用于預(yù)測任務(wù)的反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BP)與極限學(xué)習(xí)機(extreme learning machines,ELM)作為對照組進行對比實驗。此外,按照是否進行相似日聚類,把方法分為未聚類組(BP、ELM、BiLSTM)與聚類組(FCM-BP、FCM-ELM、FCM-BiLSTM)。其中,未聚類組的訓(xùn)練集采用待測日前4天的數(shù)據(jù)作為訓(xùn)練集;聚類組采用待測日前一天和距離待測日最近(30天內(nèi))的3個相似日的數(shù)據(jù)作為訓(xùn)練集。兩組模型在4個不同天氣下的預(yù)測效果如表2所示。
由表2可知,進行相似日聚類后,4種天氣下的BP、ELM、BiLSTM模型的[eMSE、eMAE、eRMSE]相比聚類前都有不同程度的降低,[R2]都有不同程度的提高,表明進行相似日聚類能有效提升模型的預(yù)測效果。此外,相比于BP與ELM模型,BiLSTM模型的預(yù)測效果在多數(shù)情況下更加優(yōu)越,尤其是在光伏功率波動相對劇烈的陰雨天更能保持良好的性能,表明BiLSTM作為光伏功率預(yù)測的基礎(chǔ)模型能取得較好效果。
3.3 ISC-BiLSTM模型預(yù)測結(jié)果分析
為進一步驗證CNN、SE、ISSA對于模型的改進效果,將本文所提ISC-BiLSTM模型與BiLSTM模型、CNN-BiLSTM模型、SE-CNN-BiLSTM模型分別在3.2節(jié)中4個待測日的預(yù)測結(jié)果進行對比。為確保對比的公平性,所有模型的訓(xùn)練數(shù)據(jù)集都采用相似日聚類后的數(shù)據(jù),此外,除了本文方法中有3種超參數(shù)由ISSA尋優(yōu)外,其余超參數(shù)的設(shè)置均相同。4種方法在4個待測日的預(yù)測結(jié)果如圖5所示。
由圖5可看出,在4個不同天氣的待測日中,ISC-BiLSTM的預(yù)測曲線總是最接近實際功率曲線,尤其在拐點處也能保持較好的吻合度。相對地,單一BiLSTM模型的預(yù)測值與實際值偏差相對最大。為定量地分析各模型的效果,表3展示了各方法在不同天氣的預(yù)測誤差情況。
由表3中數(shù)據(jù)可直觀看出,在不同的天氣中預(yù)測結(jié)果的誤差都滿足:ISC-BiLSTM模型lt;SE-CNN-BiLSTM模型lt;CNN-BiLSTM模型lt;BiLSTM模型。其中,CNN-BiLSTM模型相較于BiLSTM模型,[eRMSE]平均降低11.66%,[eMAE]平均降低20.52%,[eMSE]平均降低19.89%,[R2]平均提高0.00131。說明比起單一BiLSTM模型,加入CNN模塊對數(shù)據(jù)信息進行特征提取能優(yōu)化模型性能,有效提升模型預(yù)測精度。SE-CNN-BiLSTM模型相較于CNN-BiLSTM模型,[eRMSE]平均降低8.03%,[eMAE]平均降低4.52%,[eMSE]平均降低15.18%, [R2]平均提高0.00063。說明加入SE注意力機制的CNN模塊具有更優(yōu)秀的特征捕捉能力,可再次提高模型的預(yù)測準(zhǔn)確度。ISC-BiLSTM模型相較于SE-CNN-BiLSTM模型,[eRMSE]平均降低12.68%,[eMAE]平均降低17.2%,[eMSE]平均降低23.19%,[R2]平均提高0.0006。說明利用ISSA對模型的超參數(shù)進行尋優(yōu)能進一步提高模型預(yù)測準(zhǔn)確度。
綜上所述,本文提出的基于相似日與ISC-BiLSTM的光伏發(fā)電功率預(yù)測模型有效降低了單一模型的預(yù)測誤差,能在各種天氣環(huán)境下對功率進行準(zhǔn)確預(yù)測,且在4種不同天氣下模型的[R2]都保持在0.993以上,證明模型還具有較強的魯棒性,能較準(zhǔn)確地反映預(yù)測日的光伏發(fā)電功率特征。
3.4 模型區(qū)間預(yù)測結(jié)果分析
光伏發(fā)電功率常常表現(xiàn)出顯著的隨機性,因此對光伏出力一定置信區(qū)間的上下限進行準(zhǔn)確預(yù)測有助于確定光伏發(fā)電功率的波動范圍、評估光伏電站功率極限,進而保障電力系統(tǒng)運行的安全與穩(wěn)定性、降低系統(tǒng)運行成本。
本文采用Bootstrap法[21]進行ISC-BiLSTM模型的預(yù)測誤差分布分析。圖6給出了4種不同天氣下模型在85%、90%、95%置信水平下的置信區(qū)間帶。
從圖6可看出,隨著置信度的增大,預(yù)測區(qū)間寬度變寬,實際功率曲線可較好地包絡(luò)到置信區(qū)間帶中。
為準(zhǔn)確分析區(qū)間預(yù)測效果,采用區(qū)間覆蓋率(PICP)指標(biāo)進行定量分析。PICP具體公式可參考文獻[22],區(qū)間預(yù)測效果如表4所示。
由表4中數(shù)據(jù)可直觀看出,隨著置信水平的提高,PICP同步增大,與圖7表現(xiàn)一致。此外,在不同的置信水平下各天氣中的PICP值都接近其對應(yīng)的置信水平值,表明本文模型可配合Bootstrap方法對光伏發(fā)電功率區(qū)間的上下限進行精準(zhǔn)預(yù)測,以準(zhǔn)確地計算光伏發(fā)電功率的波動范圍;且在一定的置信水平下不同天氣的PICP值相差較小,進一步表明本文模型有較強的魯棒性,在不同的天氣環(huán)境下均能保持較好的預(yù)測效果。
4 結(jié) 論
精細化的光伏出力預(yù)測可使電力調(diào)度部門提前制定更詳細的調(diào)度計劃,增強電網(wǎng)的穩(wěn)定性與安全性。本文提出一種基于相似日與ISC-BiLSTM的光伏功率預(yù)測模型,對光伏功率進行了日前分鐘級精細化預(yù)測,通過實驗驗證分析得出以下結(jié)論:
1)通過FCM按照不同的天氣特征將天氣分為晴天、多云、陰天、雨天4種典型天氣的相似日后,在預(yù)測過程中提取與預(yù)測日同天氣類型的相似日數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù),使BiLSTM模型在晴天、多云、陰天、雨天的[R2]由0.9834、0.99852、0.99056和0.96664提升至0.9977、0.99906、0.99509和0.98715,顯著提升了模型的預(yù)測效果。
2)在BiLSTM模型中加入SE-CNN模塊,充分發(fā)揮了CNN高效的空間特征提取的優(yōu)勢、BiLSTM對數(shù)據(jù)雙向時序特征提取的優(yōu)越性能以及SE注意力機制的突出關(guān)鍵歷史時間點的信息,以減少冗余或無用特征對預(yù)測效果影響的能力,從而使SE-CNN-BiLSTM相對于BiLSTM在4種天氣下的[R2]提升至0.99859、0.99923、0.99666和0.99228,進一步提升了模型的預(yù)測精度。
3)本文提出的混合改進的ISSA與傳統(tǒng)SSA相比,搜索能力更優(yōu)、收斂速度更快、陷入局部最優(yōu)的概率更小。實驗結(jié)果說明,經(jīng)過ISSA進行超參數(shù)尋優(yōu)的ISC-BiLSTM模型相較于其他對比模型,在4種不同天氣下的eMAE、eMAE、eRMSE的值均為最低,且在天氣波動較劇烈的多云、陰天和雨天環(huán)境下,誤差也能維持在較低水平,R2進一步提升至0.9987、0.99953、0.99792和0.993。至此,模型在4種天氣下的R2均大于0.99,充分凸顯了本文模型良好的預(yù)測精度、優(yōu)秀的自適應(yīng)性與魯棒性。
[參考文獻]
[1] 王曉霞, 俞敏, 冀明, 等. 基于氣候相似性與SSA-CNN-LSTM的光伏功率組合預(yù)測[J]. 太陽能學(xué)報, 2023, 44(6): 275-283.
WANG X X, YU M, JI M, et al. Photovoltaic power combination forecasting based on climate similarity and ssa-cnn-lstm[J]. Acta energiae solaris sinica, 2023, 44(6): 275-283.
[2] LI Y T, SU Y, SHU L J. An ARMAX model for forecasting the power output of a grid connected photovoltaic system[J]. Renewable energy, 2014, 66: 78-89.
[3] OGLIARI E, DOLARA A, MANZOLINI G, et al. Physical and hybrid methods comparison for the day ahead PV output power forecast[J]. Renewable energy, 2017, 113: 11-21.
[4] MASSERAN N, RAZALI A M, IBRAHIM K, et al. Fitting a mixture of von Mises distributions in order to model data on wind direction in Peninsular Malaysia[J]. Energy conversion and management, 2013, 72: 94-102.
[5] 李豐君, 王磊, 趙健, 等. 基于天氣融合和LSTM網(wǎng)絡(luò)的分布式光伏短期功率預(yù)測方法[J]. 中國電力, 202""55(11): 149-154.
LI F J, WANG L, ZHAO J, et al. Research on distributed photovoltaic short-term power prediction method based on weather fusion and LSTM-Net[J]. Electric power, 202""55(11): 149-154.
[6] 譚海旺, 楊啟亮, 邢建春, 等. 基于XGBoost-LSTM組合模型的光伏發(fā)電功率預(yù)測[J]. 太陽能學(xué)報, 202""43(8): 75-81.
TAN H W, YANG Q L, XING J C, et al. Photovoltaic power prediction based on combined XGBoost-LSTM model[J]. Acta energiae solaris sinica, 202""43(8): 75-81.
[7] 王福忠, 王帥峰, 張麗. 基于VMD-LSTM與誤差補償?shù)墓夥l(fā)電超短期功率預(yù)測[J]. 太陽能學(xué)報, 202""43(8): 96-103.
WANG F Z, WANG S F, ZHANG L. Ultra short term power prediction of photovoltaic power generation based on VMD-LSTM and error compensation[J]. Acta energiae solaris sinica, 202""43(8): 96-103.
[8] 張雲(yún)欽, 程起澤, 蔣文杰, 等. 基于EMD-PCA-LSTM的光伏功率預(yù)測模型[J]. 太陽能學(xué)報, 202""42(9): 62-69.
ZHANG Y Q, CHENG Q Z, JIANG W J, et al. Photovoltaic power prediction model based on EMD-PCA-LSTM [J]. Acta energiae solaris sinica, 202""42(9): 62-69.
[9] WANG K J, QI X X, LIU H D. A comparison of day-ahead photovoltaic power forecasting models based on deep learning neural network[J]. Applied energy, 2019, 251: 113315.
[10] 謝小瑜, 周俊煌, 張勇軍, 等. 基于W-BiLSTM的可再生能源超短期發(fā)電功率預(yù)測方法[J]. 電力系統(tǒng)自動化, 202""45(8): 175-184.
XIE X Y, ZHOU J H, ZHANG Y J, et al. W-BiLSTM based ultra-short-term generation power prediction method of renewable energy[J]. Automation of electric power systems, 202""45(8): 175-184.
[11] 王開艷, 杜浩東, 賈嶸, 等. 基于相似日聚類和QR-CNN-BiLSTM模型的光伏功率短期區(qū)間概率預(yù)測[J]. 高電壓技術(shù), 202""48(11): 4372-4388.
WANG K Y, DU H D, JIA R, et al. Short-term interval probability prediction of photovoltaic power based on similar daily clustering and QR-CNN-BiLSTM model[J]. High voltage engineering, 202""48(11): 4372-4388.
[12] 戚曉俠. 基于深度學(xué)習(xí)的光伏/風(fēng)電功率預(yù)測研究[D]. 哈爾濱: 哈爾濱工程大學(xué), 2020.
QI X X. Research on photovoltaic/wind power prediction based on deep learning[D]. Harbin: Harbin Engineering University, 2020.
[13] 張姍, 冬雷, 紀(jì)德洋, 等. 基于NWP相似性分析的超短期光伏發(fā)電功率預(yù)測[J]. 太陽能學(xué)報, 202""43(4): 142-147.
ZHANG S, DONG L, JI D Y, et al. Power forecasting of ultra-short-term photovoltaic station based on nwp similarity analysis[J]. Acta energiae solaris sinica, 202""43(4): 142-147.
[14] 呂偉杰, 方一帆, 程澤. 基于模糊C均值聚類和樣本加權(quán)卷積神經(jīng)網(wǎng)絡(luò)的日前光伏出力預(yù)測研究[J]. 電網(wǎng)技術(shù), 202""46(1): 231-238.
LYU W J, FANG Y F, CHENG Z. Prediction of day-ahead photovoltaic output based on FCM-WS-CNN[J]. Power system technology, 202""46(1): 231-238.
[15] 夏睿, 高云鵬, 朱彥卿, 等. 基于SE-CNN模型的竊電檢測方法研究[J]. 電力系統(tǒng)保護與控制, 202""50(20): 117-126.
XIA R, GAO Y P, ZHU Y Q, et al. A detection method of electricity theft behavior based on an SE-CNN model[J]. Power system protection and control, 202""50(20): 117-126.
[16] 吉興全, 曾若梅, 張玉敏, 等. 基于注意力機制的CNN-LSTM短期電價預(yù)測[J]. 電力系統(tǒng)保護與控制, 202""50(17): 125-132.
JI X Q, ZENG R M, ZHANG Y M, et al. CNN-LSTM short-term electricity price prediction based on an attention mechanism[J]. Power system protection and control, 202""50(17): 125-132.
[17] 畢貴紅, 趙鑫, 陳臣鵬, 等. 基于多通道輸入和PCNN-BiLSTM的光伏發(fā)電功率超短期預(yù)測[J]. 電網(wǎng)技術(shù), 202""46(9): 3463-3476.
BI G H, ZHAO X, CHEN C P, et al. Ultra-short-term prediction of photovoltaic power generation based on multi-channel input and PCNN-BiLSTM[J]. Power system technology, 202""46(9): 3463-3476.
[18] SONG D L, YU M, WANG Z F, et al. Wind and wave energy prediction using an AT-BiLSTM model[J]. Ocean engineering, 2023, 281: 115008.
[19] 李爭, 羅曉瑞, 張杰, 等. 基于改進麻雀搜索算法的光伏功率短期預(yù)測[J]. 太陽能學(xué)報, 2023, 44(6): 284-289.
LI Z, LUO X R, ZHANG J, et al. Short term prediction of photovoltaic power based on improved sparrow search algorithm[J]. Acta energiae solaris sinica, 2023, 44(6): 284-289.
[20] 馮增喜, 李詩妍, 趙錦彤, 等. 基于精英反向?qū)W習(xí)策略的麻雀搜索算法[J]. 計算機仿真, 2023, 40(1): 378-38""393.
FENG Z X, LI S Y, ZHAO J T, et al. Sparrow search algorithm based on elite reverse learning strategy[J]. Computer simulation, 2023, 40(1): 378-38""393.
[21] 宋紹劍, 羅世堅, 李國進, 等. 基于MPA-LSTM模型和Bootstrap方法的短期光伏功率區(qū)間預(yù)測[J]. 廣西大學(xué)學(xué)報(自然科學(xué)版), 202""47(4): 986-997.
SONG S J, LUO S J, LI G J, et al. A short-term PV power interval forecasting based on MPA-LSTM network model and Bootstrap method[J]. Journal of Guangxi University (natural science edition), 202""47(4): 986-997.
[22] 楊錫運, 張璜, 關(guān)文淵, 等. 基于滑動分塊百分位數(shù)Bootstrap法的風(fēng)電功率概率區(qū)間預(yù)測[J]. 太陽能學(xué)報, 2019, 40(2): 430-437.
YANG X Y, ZHANG H, GUAN W Y, et al. Probabilistic intervals forecasting of wind power based on moving block percentile bootstrap method[J]. Acta energiae solaris sinica, 2019, 40(2): 430-437.
SHORT-TERM PHOTOVOLTAIC POWER FORECAST METHOD BASED ON SIMILAR DAYS AND ISC-BiLSTM
Yang Yihang"Han Lu"Shi Huabo"Deng Xinlong "Chen Zitong "Sun Rutian 3
(1. College of Electrical"Engineering"and"Automation, Southwest Petroleum University, Chengdu 610500, China;
2. State"Grid"Sichuan"Electric"Power"Research"Institute, Chengdu 61004""China;
3. Karamay Vocational amp; Technical College, Karamay 834000, China)
Abstract:Aiming at the problem that the accuracy and robustness of traditional photovoltaic power prediction methods are difficult to balance, an improved convolutional (CNN) bidirectional long-term and short-term memory(BiLSTM) neural network model (ISC-BiLSTM) is proposed by combining similar days theory, improved sparrow algorithm (ISSA) and(SE) channel attention mechanism, which can achieve accurate prediction of short-term photovoltaic power. Firstly, the main meteorological factors affecting photovoltaic power are screened out by correlation calculation. Then the fuzzy C-means clustering (FCM) method is used to cluster similar days with similar weather characteristics. Then, the spatial and temporal characteristics of the main meteorological parameters and historical power are fully extracted by SE-CNN; then, BiLSTM is used to capture the dependencies between data sequences. Finally, the hyper-parameters of the model are optimized by ISSA, and the model with the optimal hyper-parameters is selected for power prediction. The comparative experiment and simulation results show that the prediction error of this method is low, and the accurate prediction of short-term photovoltaic power at the minute level before the day can be realized.
Keywords:photovoltaic power; forecasting; neural network; attention mechanism; improved sparrow search algorithm; fuzzy clustering