摘 要:為有效挖掘光伏發(fā)電功率數(shù)據(jù)中的有效時(shí)序信息,進(jìn)一步提升光伏發(fā)電功率預(yù)測(cè)效果,提出一種基于多因素融合的高效通道注意力機(jī)制(ECA)-時(shí)間卷積網(wǎng)絡(luò)(TCN)預(yù)測(cè)模型。首先,采用最大互信息系數(shù)(MIC)提取光伏發(fā)電功率相關(guān)特征;其次,使用多項(xiàng)式特征衍生方法融合各相關(guān)因素特征,衍生高維特征,進(jìn)行特征組合;然后,將自適應(yīng)選擇一維卷積核大小的ECA模塊與可有效捕捉光伏發(fā)電功率數(shù)據(jù)時(shí)序性信息的TCN相結(jié)合,搭建ECA-TCN預(yù)測(cè)模型;最后,采用多個(gè)模型進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明:該文提出的特征組合方法可高效的選擇光伏發(fā)電功率數(shù)據(jù)特征,提升特征的表現(xiàn)能力。特征組合后的 ECA-TCN預(yù)測(cè)模型的均方根誤差(RMSE)為0.0828 kW,相較于LSTM、LSTM-TCN、ECA-LSTM,ECA-TCN的RMSE分別降低了0.29、0.23和0.13個(gè)百分點(diǎn),并具有最優(yōu)的擬合度(R2)90.74%。該模型可在保持高擬合度的同時(shí)有效提高光伏發(fā)電功率預(yù)測(cè)精度。
關(guān)鍵詞:光伏發(fā)電;預(yù)測(cè);時(shí)間卷積網(wǎng)絡(luò);最大互信息系數(shù);高效通道注意力
中圖分類號(hào):TM615 " " " "文獻(xiàn)標(biāo)志碼:A
0 引 言
隨著全球?qū)η鍧嵞茉葱枨蟮脑鲩L,光伏發(fā)電已成為電力行業(yè)不可或缺的重要組成部分[1]。太陽能安全且環(huán)保,具有豐富的資源優(yōu)勢(shì)。但受節(jié)律和自然條件的限制,光伏發(fā)電具有波動(dòng)性和間歇性,電站輸出功率也受到多方面因素影響,隨機(jī)性較強(qiáng)[2-3]。因此,最大限度提取監(jiān)測(cè)數(shù)據(jù)中的特征信息實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè),對(duì)于調(diào)整調(diào)度策略、穩(wěn)定光伏產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展具有重要意義。
光伏發(fā)電功率預(yù)測(cè)主要分為數(shù)據(jù)處理和模型預(yù)測(cè)兩部分。光伏發(fā)電功率的預(yù)測(cè)實(shí)際上是對(duì)非平穩(wěn)數(shù)據(jù)序列的分析與預(yù)判,其模型的準(zhǔn)確性通常與時(shí)序特征的提取和處理方法息息相關(guān)[4]。數(shù)據(jù)處理中特征構(gòu)建以改善異常特征或放大有效特征為目的[5],特征構(gòu)建通常集中在特征降維、特征聚類及特征衍生三方面,憑借經(jīng)典降維算法主成分分析法[6](principal component analysis,PCA)、變分模態(tài)分解[7]等獲取彼此獨(dú)立的少數(shù)變量,雖然一定程度上提高了模型效率,但忽略了序列的時(shí)間延續(xù)性,且改變了原本的數(shù)據(jù)結(jié)構(gòu),不利于后期對(duì)模型的解釋;特征聚類[5, 8-10]則依據(jù)算法實(shí)現(xiàn)數(shù)據(jù)類別的劃分,尋找同類時(shí)序集的波動(dòng)規(guī)律完成精準(zhǔn)預(yù)測(cè);特征衍生在聚類的基礎(chǔ)上,深層次挖掘監(jiān)控?cái)?shù)據(jù)中的特征信息構(gòu)建新特征組合,以供模型完成預(yù)測(cè),文獻(xiàn)[11]使用性能良好且作用機(jī)理不同的極致梯度提升(eXtreme gradient boosting,XGBoost)模型和長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)模型實(shí)現(xiàn)特征衍生,基于二者預(yù)測(cè)結(jié)果構(gòu)建的高層次特征,可更全面地綜合特征間的線性及非線性特征,更好地把握光伏發(fā)電功率相關(guān)數(shù)據(jù)特征的時(shí)序特點(diǎn),但特征衍生一般適用于特征量較小的情況,特征量較大會(huì)引起計(jì)算負(fù)擔(dān),導(dǎo)致效率降低。
在建立模型方面,現(xiàn)有研究主要分物理模型[12]、統(tǒng)計(jì)學(xué)模型[13-14]和混合模型三大類,前兩種模型實(shí)現(xiàn)簡(jiǎn)單,但對(duì)數(shù)據(jù)依賴程度高,泛化能力較差。因此,隨著人工智能的發(fā)展,相關(guān)的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)模型通過不斷地學(xué)習(xí)迭代,深入挖掘數(shù)據(jù)特征,算法表現(xiàn)性能更為優(yōu)越。文獻(xiàn)[15]利用融合多個(gè)線性決策樹XGBoost算法,提高模型層次和性能的同時(shí)提高了預(yù)測(cè)精度,但忽略了變量間的非線性關(guān)系。文獻(xiàn)[16]利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)-LSTM網(wǎng)絡(luò)集成學(xué)習(xí)融合預(yù)測(cè)模型,實(shí)現(xiàn)了實(shí)時(shí)的多模式光伏發(fā)電功率精確預(yù)測(cè),研究表明該方法可實(shí)現(xiàn)較高的預(yù)測(cè)精度;但LSTM模型訓(xùn)練速度較慢,參數(shù)調(diào)優(yōu)較困難,傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)因卷積核的大小的限制,也無法高效捕捉長時(shí)的依賴信息。文獻(xiàn)[17]提出的時(shí)間卷積網(wǎng)絡(luò)(temporal convolutional network,TCN)由能夠?qū)斎霐?shù)據(jù)進(jìn)行大規(guī)模的并行處理,在可達(dá)到與循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)系列算法相當(dāng)?shù)念A(yù)測(cè)精度的同時(shí),運(yùn)算速度更快;盡管TCN通過擴(kuò)張卷積來擴(kuò)大感受野,但仍受卷積核大小的限制,使得其在捕捉任意長度的相關(guān)信息特征時(shí)效果略差。文獻(xiàn)[18]將殘差結(jié)構(gòu)的串聯(lián)模式改為并聯(lián)分布增強(qiáng)了模型對(duì)不同情況的普適性。雖然模型考慮到接收所有輸入,但并未表現(xiàn)出時(shí)間序列中不同特征的重要性差異。
針對(duì)現(xiàn)有研究中特征構(gòu)建改變?cè)緮?shù)據(jù)結(jié)構(gòu),不利于對(duì)模型解釋的問題,本文提出利用相關(guān)性分析算法最大信息系數(shù)(maximal information coefficent,MIC)計(jì)算各輸入變量與目標(biāo)變量之間的相關(guān)性,在不改變?cè)緮?shù)據(jù)結(jié)構(gòu)的基礎(chǔ)上,去除冗余信息,重構(gòu)數(shù)據(jù)樣本;為進(jìn)一步提升特征表現(xiàn)力,利用多項(xiàng)式特征衍生方法進(jìn)行特征組合。在模型構(gòu)建方面,針對(duì)現(xiàn)有研究所提模型未能體現(xiàn)時(shí)間序列特征的重要性差異的問題,本文提出一種可充分挖掘時(shí)序數(shù)據(jù)之間的關(guān)聯(lián)信息并關(guān)注重要特征的高效通道注意力機(jī)制(efficient channel attention,ECA)-時(shí)間卷積網(wǎng)絡(luò)(TCN)模型,模型不僅能顯著提升光伏發(fā)電功率預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性,還實(shí)現(xiàn)了更快的訓(xùn)練速度。
1 TCN和ECA概述
1.1 時(shí)間卷積網(wǎng)絡(luò)(TCN)
時(shí)間卷積網(wǎng)絡(luò)[17] (TCN)是一種融合膨脹卷積及殘差塊連接的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)。膨脹卷積與標(biāo)準(zhǔn)卷積的區(qū)別在于,前者在進(jìn)行卷積運(yùn)算時(shí)可對(duì)輸入數(shù)據(jù)進(jìn)行間隔采樣,受圖1中采樣率[d]控制;殘差連接結(jié)構(gòu)可避免梯度消失問題,是一種新型網(wǎng)絡(luò)結(jié)構(gòu)。
在模型訓(xùn)練過程中,輸出層在時(shí)刻t的數(shù)據(jù)僅依賴于網(wǎng)絡(luò)隱藏層在同一時(shí)刻的值以及歷史值,當(dāng)實(shí)際應(yīng)用需要捕捉序列數(shù)據(jù)的長期依賴關(guān)系時(shí),增加輸入變量和線性堆疊層數(shù)可能會(huì)引發(fā)梯度消失的問題。為解決這一問題,采用膨脹卷積進(jìn)行間隔采樣,使得有效采樣窗口隨著層數(shù)的增加而呈指數(shù)級(jí)擴(kuò)展,從而有效覆蓋整個(gè)時(shí)間序列。如圖1所示,在此過程中,膨脹系數(shù)d用于調(diào)節(jié)采樣率,隨著層級(jí)的提升,d值也會(huì)增大,d的具體表達(dá)式為:
[d=2n-1] (1)
式中:[n]——膨脹卷積層數(shù)。
TCN神經(jīng)網(wǎng)絡(luò)由多個(gè)TCN殘差塊堆疊而成,每個(gè)殘差塊結(jié)合了因果擴(kuò)張卷積和神經(jīng)網(wǎng)絡(luò)處理層,如圖2所示。因此,在處理光伏發(fā)電功率的時(shí)序數(shù)據(jù)時(shí),TCN網(wǎng)絡(luò)充分發(fā)揮了兩種卷積網(wǎng)絡(luò)的優(yōu)勢(shì),并通過激活函數(shù)引入非線性處理,同時(shí),Dropout模塊有助于緩解因結(jié)構(gòu)復(fù)雜性導(dǎo)致的梯度消失問題。
1.2 高效通道注意力機(jī)制(ECA)
近年來,將通道注意力機(jī)制融入卷積塊以增強(qiáng)卷積網(wǎng)絡(luò)性能的方法受到廣泛關(guān)注。其中SENet(squeeze-and-inspire networks)實(shí)現(xiàn)了良好的運(yùn)用。SENet需捕獲所有通道的依賴關(guān)系時(shí),為避免計(jì)算負(fù)擔(dān),數(shù)據(jù)需進(jìn)行壓縮降維處理,但模型精度會(huì)受到一定的影響。針對(duì)以上問題,文獻(xiàn)[18]提出一種高效通道注意力(ECA)模塊專門針對(duì)卷積神經(jīng)網(wǎng)絡(luò),能有效捕捉局部的跨通道交互信息,并對(duì)重要的輸入信息分配更多的運(yùn)算資源。因此,本文引入通道注意力機(jī)制,以達(dá)到更好的預(yù)測(cè)性能。
具有全局特征的通道注意力機(jī)制結(jié)構(gòu)如圖3所示,其中[X]為輸入變量,參數(shù)[B]為批量大小,[H]為時(shí)間窗口長度,[W]為屬性數(shù)量。ECA模塊運(yùn)作機(jī)制如下:大小為[B×H×W]的三維輸入[X],經(jīng)單位卷積核處理后,化為大小為[1×H×W]的三維
矩陣[Xnew];經(jīng)卷積操作后獲取序列特征,化為行數(shù)為1列數(shù)為[H×W]的([1×HW])二維矩陣[X1];[X1]經(jīng)ReLU函數(shù)歸一化處理后形成大小為[1×HW]的二維相關(guān)矩陣[X2];[X1]與[X2]對(duì)應(yīng)元素相加構(gòu)成全局特征矩陣[X3];[X3]經(jīng)二次卷積操作后生成大小變?yōu)閇1×H×W]的三維全局特征[X4];[X4]經(jīng)單位卷積塊處理后與[X]中的對(duì)應(yīng)元素相加形成具有注意力機(jī)制的特征矩陣[Y]。
2 基于特征組合的ECA-TCN光伏發(fā)電功率預(yù)測(cè)模型
基于特征組合的ECA-TCN預(yù)測(cè)模型的構(gòu)建主要包括9個(gè)模塊:獲取數(shù)據(jù)、數(shù)據(jù)無量綱化處理、數(shù)據(jù)相關(guān)性分析、特征衍生、多項(xiàng)式融合法獲取高維特征、特征組合、模型構(gòu)建、模型的訓(xùn)練和優(yōu)化、模型的預(yù)測(cè)。其中,本文將經(jīng)過特征相關(guān)性分析并降維后的特征和特征衍生后形成的高維特征重組構(gòu)成特征組合,以并行計(jì)算的TCN為基礎(chǔ)學(xué)習(xí)特征組合的時(shí)序信息;嵌入ECA模塊,通過一維卷積生成通道權(quán)重進(jìn)而實(shí)現(xiàn)不降維的局部跨通道交互,捕獲重要信息,基于特征組合的ECA-TCN模型如圖4所示。
2.1 數(shù)據(jù)相關(guān)性分析
當(dāng)影響光伏發(fā)電功率的因素之間具有較大相關(guān)性時(shí),將所有影響因素作為模型輸入會(huì)引入冗余信息,影響模型預(yù)測(cè)精度和效率,因此需對(duì)原數(shù)據(jù)特征做相關(guān)性分析,本文選擇可保留數(shù)據(jù)原有結(jié)構(gòu)的MIC方法來進(jìn)行相關(guān)性分析。MIC克服了互信息對(duì)連續(xù)變量計(jì)算不便的缺點(diǎn),擁有更高的準(zhǔn)確度,當(dāng)有足夠的樣本時(shí),MIC 可檢測(cè)到變量之間廣泛的線性和非線性關(guān)系,更能體現(xiàn)光伏發(fā)電功率相關(guān)因素之間的相關(guān)程度。
由于數(shù)據(jù)中存在多個(gè)可能影響光伏發(fā)電功率的因素,且各因素的數(shù)值范圍各異,為統(tǒng)一這些指標(biāo)對(duì)模型的影響,本研究采用數(shù)據(jù)歸一化技術(shù)對(duì)樣本數(shù)據(jù)進(jìn)行無量綱化處理。隨后,針對(duì)經(jīng)過無量綱化處理的數(shù)據(jù),使用MIC提取特征間的相關(guān)性,MIC通過互信息來評(píng)估變量之間的線性與非線性關(guān)系。以變量[x]和[y]為例,MIC的計(jì)算公式為:
[MIC(x,y)=MAX(xylt;B(n))I(x,y)log2(min(x,y))I(x,y)=x?Xy?Yp(x,y)log2p(x,y)p(x)p(y)] (2)
式中:[I(x,y)]——變量[x]和[y]之間的互信息值;[p(x)]、[p(y)]——邊緣概率分布;[p(x,y)]——聯(lián)合概率分布;[B(n)]——通常設(shè)置為數(shù)據(jù)量[n]的0.6次方。
2.2 特征衍生
為全面綜合光伏發(fā)電功率相關(guān)數(shù)據(jù)特征之間的線性和非線性關(guān)系,本研究盡可能多地提取光伏發(fā)電數(shù)據(jù)中的特征信息,以供ECA-TCN算法進(jìn)行模型訓(xùn)練,并采用特征多項(xiàng)式融合方法以生成新特征。特征多項(xiàng)式融合不僅可以生成交叉項(xiàng)特征,還能得到高次項(xiàng)特征[19]。通過多項(xiàng)式特征衍生,低維特征得以組合形成高維特征,從而使ECA-TCN模型能夠更有效地捕捉數(shù)據(jù)間的基本關(guān)系,并“學(xué)習(xí)”到更多信息。特征衍生的表達(dá)式為:
[Polya,b,c,dn=(a,b,c,d,a2,ab,ac,ad,b2,bc,bd,c2,cd,d2,a3,a2b,a2c,a2d,ab2,abc,abd,ac2,acd,ad2,b3,b2c,b2d,bc2,bcd,bd2,c3,c2d,d3,…,bdn-1,dn)] (3)
式中:[Polyn]——[n]階特征衍生;[a、b、c、d]——數(shù)據(jù)集的4個(gè)特征。
2.3 ECA-TCN模型構(gòu)建
ECA-TCN模型的構(gòu)建基于多個(gè)ECA-TCN殘差模塊的層疊,在基本的TCN殘差模塊中,TCN卷積層對(duì)輸入特征進(jìn)行學(xué)習(xí),并通過WeightNorm、ReLU和Dropout層引入非線性因素及對(duì)網(wǎng)絡(luò)進(jìn)行正則化。改進(jìn)后的TCN殘差塊在下采樣階段集成ECA模塊,最終通過乘法方式將ECA模塊提取的注意力權(quán)重與原始特征加權(quán)融合以實(shí)現(xiàn)輸出。具體結(jié)構(gòu)如圖5所示。
3 實(shí)驗(yàn)評(píng)估
3.1 數(shù)據(jù)來源及介紹
本研究采用2018年光伏電站人工智能運(yùn)維大數(shù)據(jù)處理分析大賽所提供的數(shù)據(jù)集,該數(shù)據(jù)集涵蓋了某光伏發(fā)電設(shè)備連續(xù)45天的采集數(shù)據(jù),數(shù)據(jù)共有9000條。監(jiān)測(cè)數(shù)據(jù)包括3個(gè)隨機(jī)采集點(diǎn)A、B和C的轉(zhuǎn)換效率、電壓、電流、功率,以及光伏組件的背測(cè)溫度和平均轉(zhuǎn)換效率等運(yùn)行狀態(tài)參數(shù)。此外,還包含電站現(xiàn)場(chǎng)的溫度、輻照度、風(fēng)速和風(fēng)向等信息。本文將前30天內(nèi)的6000條數(shù)據(jù)用作訓(xùn)練集,將第31~45天的3000條數(shù)據(jù)作為測(cè)試集。
3.2 特征工程
使用MIC相關(guān)分析算法對(duì)待預(yù)測(cè)指標(biāo)與所有相關(guān)因素進(jìn)行相關(guān)分析,根據(jù)相關(guān)度分析結(jié)果選取與預(yù)測(cè)指標(biāo)相關(guān)度較大的因素。
MIC相關(guān)性分析結(jié)果見表1。從表1的數(shù)據(jù)可看出,光伏組件運(yùn)行狀態(tài)參數(shù)中功率、電流和輻照度之間的相關(guān)系數(shù)較高,功率A與目標(biāo)變量相關(guān)系數(shù)為0.9755、功率B與目標(biāo)變量相關(guān)系數(shù)為0.8949、功率C與目標(biāo)變量相關(guān)系數(shù)為0.9135、平均功率與目標(biāo)變量相關(guān)系數(shù)為0.9786、電流A與目標(biāo)變量相關(guān)系數(shù)為0.9415、電流B與目標(biāo)變量相關(guān)系數(shù)為0.8811、電流C與目標(biāo)變量相關(guān)系數(shù)為0.9099、光照強(qiáng)度與目
標(biāo)變量相關(guān)系數(shù)為0.6150,因此選取這8個(gè)相關(guān)因素進(jìn)行進(jìn)一步的特征處理。
減少變量間的高度相關(guān)性,可避免由于變量共線性問題導(dǎo)致的模型貢獻(xiàn)度減弱的問題。因此,對(duì)MIC相關(guān)性分析后的相關(guān)因素進(jìn)行自變量相關(guān)性分析,自變量之間的相關(guān)性結(jié)果如圖6所示。由于平均功率與其他6種因素間存在高度相關(guān)性,因此剔除平均功率,保留輻照度。電流A與功率A、電流B與功率B、電流C與功率C具有高度共線性,經(jīng)對(duì)比發(fā)現(xiàn),相較于電流A,功率A與其他因素的相關(guān)性略高,因此保留電流A。同理,保留電流B和功率C。經(jīng)MIC相關(guān)性分析后獲取的特征變量為輻照度、電流A、電流B和功率C,共計(jì)4個(gè)原始變量。
將a表示光照強(qiáng)度,b表示電流A,c表示電流B,d表示功率C,4個(gè)原始變量采用二階多項(xiàng)式增項(xiàng)后得到的特征數(shù)量為14,其中新特征數(shù)量為10。以其中的3個(gè)數(shù)據(jù)樣本為例,最終生成的特征組合如表2所示。
3.3 評(píng)估指標(biāo)
為評(píng)估不同模型的預(yù)測(cè)性能,本研究使用平均方根誤差(root mean squared error,RMSE)和模型擬合優(yōu)度的決定系數(shù)(R2)。RMSE對(duì)比預(yù)測(cè)值與真實(shí)值的差值,衡量預(yù)測(cè)框架預(yù)測(cè)值精度;[R2]則反映回歸線與預(yù)測(cè)值的擬合程度。公式為:
[IRMSE=1Nk=1N(yk-y′k)2] (4)
[R2=y'k-y2yk-y2] (5)
式中:[N]——預(yù)測(cè)點(diǎn)數(shù)量;[yk]——第[k]個(gè)光伏發(fā)電功率真實(shí)值;[y'k]——第[k]個(gè)預(yù)測(cè)值;[y]——[yk]的平均值。
3.4 模型預(yù)測(cè)效果對(duì)比分析
3.4.1 參數(shù)設(shè)置說明
通過經(jīng)驗(yàn)和反復(fù)試驗(yàn)確定以下實(shí)驗(yàn)參數(shù):批量大小設(shè)置
為15,學(xué)習(xí)率為0.001,滑動(dòng)窗口的時(shí)間步長為3,Dropout設(shè)置為0.2;LSTM隱藏層層數(shù)為1,隱藏層節(jié)點(diǎn)數(shù)為10;TCN殘差單元數(shù)量為1,卷積核數(shù)量為4,卷積核大小為3,擴(kuò)張率為[1,2,4]。
3.4.2 特征組合效果
分別將原特征數(shù)據(jù)、特征組合前的數(shù)據(jù)、特征組合后的數(shù)據(jù)輸入LSTM和TCN模型進(jìn)行預(yù)測(cè),為避免實(shí)驗(yàn)偶然性,將實(shí)驗(yàn)重復(fù)5次,計(jì)算各模型的平均誤差率及擬合度,然后取平均值。由表3可知,與原特征相比,特征組合前的數(shù)據(jù)在LSTM和TCN模型上預(yù)測(cè)結(jié)果的RMSE分別降低了0.07、0.08個(gè)百分點(diǎn),R2分別提升了0.18、0.16個(gè)百分點(diǎn);說明MIC相關(guān)分析可有效對(duì)光伏發(fā)電功率數(shù)據(jù)進(jìn)行特征選擇,能保留具有重要信息的特征,去除冗余信息,從而提升光伏發(fā)電功率預(yù)測(cè)模型預(yù)測(cè)精度。
相比特征組合后與特征組合前的數(shù)據(jù)預(yù)測(cè)結(jié)果,特征組合后LSTM、TCN算法的RMSE分別降低了0.09、0.23個(gè)百分點(diǎn),R2分別提升了0.20、0.54個(gè)百分點(diǎn);說明相較于多項(xiàng)式特征衍生的特征組合算法可在MIC相關(guān)分析的基礎(chǔ)上進(jìn)一步提升特征的表現(xiàn)能力。對(duì)比 LSTM、TCN兩種算法對(duì)光伏發(fā)電功率的預(yù)測(cè)結(jié)果可知,原特征、特征組合前特征、特征組合后特征,TCN在RMSE、R2上的表現(xiàn)均優(yōu)于 LSTM算法。結(jié)果表明,基于多項(xiàng)式特征衍生的特征組合算法可有效提升特征的表現(xiàn)能力,且TCN對(duì)光伏發(fā)電功率具有較好的預(yù)測(cè)表現(xiàn)。
3.4.3 不同模型效果對(duì)比分析
對(duì)基于多項(xiàng)式特征衍生的特征組合的有效性進(jìn)行驗(yàn)證,圖7為LSTM、TCN、LSTM-TCN、ECA-LSTM、ECA-TCN這5個(gè)模型在組合特征上的訓(xùn)練過程損失對(duì)比,圖中損失值函數(shù)表示預(yù)測(cè)值和真實(shí)值之間的誤差,訓(xùn)練過程一共設(shè)置了30個(gè)epoch。
由圖7可看到,在經(jīng)30個(gè)epoch訓(xùn)練后,ECA-TCN模型的學(xué)習(xí)效率最佳,其次是TCN模型,然后是ECA-LSTM模型;同時(shí)實(shí)驗(yàn)結(jié)果表明在嵌入ECA后,TCN模型的學(xué)習(xí)效率得到明顯提升,添加注意力機(jī)制后,TCN模型可更加全面的學(xué)習(xí)數(shù)據(jù)集的特征,在其他模型趨于收斂時(shí),ECA-TCN模型的損失曲線還在繼續(xù)振蕩式下降,直到30個(gè)epoch訓(xùn)練結(jié)束,達(dá)到了最佳學(xué)習(xí)率,體現(xiàn)了本文提出模型的有效性。
以特征組合后的特征作為輸入,LSTM、TCN、LSTM-TCN、ECA-LSTM、ECA-TCN為預(yù)測(cè)模型,重復(fù)實(shí)驗(yàn)5次,計(jì)算各模型的平均誤差率及擬合度。
由表4可知,ECA-TCN模型的RMSE最小,且擬合度R2最高。相較于LSTM、LSTM-TCN、ECA-LSTM,ECA-TCN的RMSE分別降低了0.29、0.23、0.13個(gè)百分點(diǎn),R2分別提升了0.66、0.52、0.29個(gè)百分點(diǎn)。ECA-TCN相較于單個(gè)TCN模型,RMSE降低了0.04%,R2提升了0.09%;ECA-LSTM和單個(gè)LSTM模型比較,RMSE降低了0.16%,R2提升了0.37%。在運(yùn)算速度上,ECA-TCN的運(yùn)行時(shí)間最短,為215.36 s,其次是TCN模型,單獨(dú)LSTM模型運(yùn)行速度最慢,達(dá)到424.59 s。結(jié)果表明,ECA殘差網(wǎng)絡(luò)結(jié)構(gòu)可提升神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)性能,同時(shí),ECA-TCN模型可有效提升光伏發(fā)電效率預(yù)測(cè)的準(zhǔn)確率和運(yùn)算效率。
4 結(jié) 論
針對(duì)光伏發(fā)電功率監(jiān)控?cái)?shù)據(jù)中特征的共線性特征和特征信息挖掘不充分導(dǎo)致預(yù)測(cè)效果差的問題,本文提出基于MIC相關(guān)分析和多項(xiàng)式特征衍生的特征組合方法,建立可有效捕捉數(shù)據(jù)的時(shí)序性信息的ECA-TCN預(yù)測(cè)模型,通過對(duì)比證明該模型在光伏發(fā)電功率預(yù)測(cè)上的優(yōu)越性。得到主要結(jié)論如下:
1)MIC相關(guān)分析可在保留原始光伏發(fā)電功率數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ)上有效進(jìn)行特征選擇,保留具有重要信息的特征,去除冗余信息,從而提升光伏發(fā)電功率預(yù)測(cè)模型的預(yù)測(cè)精度。
2)多項(xiàng)式特征衍生的特征組合算法可在MIC相關(guān)分析的基礎(chǔ)上進(jìn)一步提升光伏發(fā)電功率數(shù)據(jù)特征的表現(xiàn)能力,有效提高了后續(xù)預(yù)測(cè)模型的預(yù)測(cè)效果。
3)將具有對(duì)通道間信息的高效捕獲能力的ECA嵌入TCN模型可實(shí)現(xiàn)并行運(yùn)算,具備高效數(shù)據(jù)處理能力的TCN能夠克服因卷積核大小受限而導(dǎo)致的感受野不足的問題,使TCN模型能更多關(guān)注到對(duì)光伏發(fā)電功率預(yù)測(cè)更重要的時(shí)序性特征,從而有效提升TCN模型在光伏發(fā)電功率預(yù)測(cè)上的預(yù)測(cè)性能。
本文為提高光伏發(fā)電功率預(yù)測(cè)效果提供了一種新的思路,可以輔助相關(guān)生產(chǎn),實(shí)現(xiàn)更高效的光伏發(fā)電。
[參考文獻(xiàn)]
[1] HONG T, PINSON P, WANG Y, et al. Energy forecasting: a review and outlook[J]. IEEE open access journal of power and energy, 2020, 7: 376-388.
[2] LAW E W, PRASAD A A, KAY M, et al. Direct normal irradiance forecasting and its application to concentrated solar thermal output forecasting-a review[J]. Solar energy, 2014, 108: 287-307.
[3] BENMOUIZA K, CHEKNANE A. Small-scale solar radiation forecasting using ARMA and nonlinear autoregressive neural network models[J]. Theoretical and applied climatology, 2016, 124(3): 945-958.
[4] 李桂蘭, 楊杰, 周滿國. 基于改進(jìn)時(shí)間卷積網(wǎng)絡(luò)的光伏發(fā)電功率預(yù)測(cè)[J]. 激光與光電子學(xué)進(jìn)展, 2022, 59(8): 480-489.
LI G L, YANG J, ZHOU M G. Power prediction of photovoltaic generation based on improved temporal convolutional " "network[J]. " "Laser " "amp; " "optoelectronics progress, 2022, 59(8): 480-489.
[5] 武新章, 王澤宇, 代偉, 等. 基于異質(zhì)聚類與Stacking的雙集成光伏發(fā)電功率預(yù)測(cè)[J]. 電網(wǎng)技術(shù), 2023, 47(1): 275-284.
WU X Z, WANG Z Y, DAI W, et al. Bi-ensembled photovoltaic (PV) power prediction based on heterogeneous clustering and stacking[J]. Power system technology, 2023, 47(1): 275-284.
[6] 程港, 林小峰, 宋紹劍, 等. 基于PCA-GA-ELM的光伏發(fā)電功率預(yù)測(cè)研究[J]. 可再生能源, 2019, 37(10): 1440-1447.
CHENG G, LIN X F, SONG S J, et al. Research on photovoltaic power generation forecasting based on PCA-GA-ELM[J]. Renewable energy resources, 2019, 37(10): 1440-1447.
[7] 楊凌升, 李偉. 基于多氣象要素降維及改進(jìn)型變分模態(tài)分解算法的光伏發(fā)電功率預(yù)測(cè)模型研究[J]. 可再生能源, 2022, 40(9): 1157-1165.
YANG L S, LI W. Research on photovoltaic power prediction model based on multi-meteorological factors dimension reduction and OVMD-tSSA-LSSVM algorithm[J]. Renewable energy resources, 2022, 40(9): 1157-1165.
[8] 楊帆, 申亞, 李東東, 等. 基于GA-GNNM的極地光伏發(fā)電功率預(yù)測(cè)方法[J]. 太陽能學(xué)報(bào), 2022, 43(4): 167-174.
YANG F, SHEN Y, LI D D, et al. Polar photovoltaic power forecasting method based on GA-GNNM[J]. Acta energiae solaris sinica, 2022, 43(4): 167-174.
[9] 商立群, 李洪波, 侯亞東, 等. 基于VMD-ISSA-KELM的短期光伏發(fā)電功率預(yù)測(cè)[J]. 電力系統(tǒng)保護(hù)與控制, 2022, 50(21): 138-148.
SHANG L Q, LI H B, HOU Y D, et al. Short-term photovoltaic power generation prediction based on VMD-ISSA-KELM[J]. Power system protection and control, 2022, 50(21): 138-148.
[10] YANG B, ZHU T J, CAO P L, et al. Classification and summarization of solar irradiance and power forecasting methods: a thorough review[J]. CSEE journal of power and energy systems, 2023, 9(3): 978-995.
[11] 譚海旺, 楊啟亮, 邢建春, 等. 基于XGBoost-LSTM組合模型的光伏發(fā)電功率預(yù)測(cè)[J]. 太陽能學(xué)報(bào), 2022, 43(8): 75-81.
TAN H W, YANG Q L, XING J C, et al. Photovoltaic power prediction based on combined XGBoost-LSTM model[J]. Acta energiae solaris sinica, 2022, 43(8): 75-81.
[12] 荊博. 光伏電站短期功率預(yù)測(cè)方法研究[D]. 鎮(zhèn)江: 江蘇大學(xué), 2017.
JING B. Study on short-term power forecasting method of photovoltaic power station[D]. Zhenjiang: Jiangsu University, 2017.
[13] 蔡金錠, 葉榮, 陳漢城. 回復(fù)電壓多元參數(shù)回歸分析的油紙絕緣老化診斷方法[J]. 電工技術(shù)學(xué)報(bào), 2018, 33(21): 5080-5089.
CAI J D, YE R, CHEN H C. Aging diagnosis method of oil-paper insulation based on multiple parameter regression analysis of recovery voltage[J]. Transactions of China Electrotechnical Society, 2018, 33(21): 5080-5089.
[14] 劉翼飛, 崔承剛. 基于地基云圖云量特征的光伏發(fā)電功率區(qū)間預(yù)測(cè)[J]. 南方電網(wǎng)技術(shù), 2023, 17(2): 92-100.
LIU Y F, CUI C G. Interval prediction for short-term solar power based on cloud features of ground-based cloud images[J]. Southern power system technology, 2023, 17(2): 92-100.
[15] 王獻(xiàn)志, 曾四鳴, 周雪青, 等. 基于XGBoost聯(lián)合模型的光伏發(fā)電功率預(yù)測(cè)[J]. 太陽能學(xué)報(bào), 2022, 43(4): 236-242.
WANG X Z, ZENG S M, ZHOU X Q, et al. Power forecast of photovoltaic generation based on XGBoost combined model[J]. Acta energiae solaris sinica, 2022, 43(4): 236-242.
[16] 徐鶴勇, 張倩. 基于數(shù)字孿生和改進(jìn)LSTM的光伏發(fā)電預(yù)測(cè)技術(shù)[J]. 熱能動(dòng)力工程, 2023, 38(2): 84-91, 100.
XU H Y, ZHANG Q. Photovoltaic power generation prediction technology based on digital twin and improved LSTM[J]. Journal of engineering for thermal energy and power, 2023, 38(2): 84-91, 100.
[17] LEA C, FLYNN M D, VIDAL R, et al. Temporal convolutional networks for action segmentation and detection[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA, 2017: 1003-1012.
[18] WANG Q L, WU B G, ZHU P F, et al. ECA-net: efficient channel attention for deep convolutional neural networks[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle, WA, USA, 2020: 11531-11539.
[19] 劉瑩, 楊超宇. 基于多因素的LSTM瓦斯?jié)舛阮A(yù)測(cè)模型[J]. 中國安全生產(chǎn)科學(xué)技術(shù), 2022, 18(1): 108-113.
LIU Y, YANG C Y. LSTM gas concentration prediction model based on multiple factors[J]. Journal of safety science and technology, 2022, 18(1): 108-113.
ECA-TCN PHOTOVOLTAIC POWER PREDICTION MODEL BASED ON FEATURE COMBINATION
Wen Tingxin,Guo Xiaosai
(College of Business Administration, Liaoning Technology University, Huludao 125105, China)
Abstract:To effectively extract valuable temporal information from photovoltaic (PV) power data and further improve the accuracy of PV power prediction, we propose an efficient channel attention mechanism (ECA)- temporal convolutional network (TCN) prediction model based on multi-factor fusion. Firstly, the maximum information coefficient (MIC) is utilized to extract relevant features of PV power. Secondly, a polynomial feature derivation method is employed to combine the features of various factors, generating high-dimensional features and facilitating feature combination. Then, the ECA module, which adaptively selects the size of one-dimensional convolutional kernels, is combined with TCN to construct the ECA-TCN prediction model, which effectively captures the temporal characteristics of PV power data. Finally, multiple models are compared through experimental evaluation. The results demonstrate that the proposed feature combination method efficiently selects PV power data features and enhances their discriminative ability. The ECA-TCN prediction model with feature combination achieves a root mean square error (RMSE) of 0.0828 kW. Compared to LSTM, LSTM-TCN, and ECA-LSTM, the RMSE of the ECA-TCN was reduces by 0.29, 0.23, and 0.13 percentage points, respectively, and exhibits the best fitting performance with an R2 value of 90.74%. This model effectively improves the accuracy of PV power prediction while maintaining a high fitting performance.
Keywords:PV power; forecasting; temporal convolutional network; max information coefficient; efficient channel attention