楊海柱,李慶華,張 鵬
(1.河南理工大學(xué)電氣工程與自動(dòng)化學(xué)院,河南焦作 454000;2.天津大學(xué)電氣自動(dòng)化與信息工程學(xué)院,天津 300072)
光伏發(fā)電作為主流發(fā)電方式之一,在現(xiàn)有的能源結(jié)構(gòu)中起著不可替代的作用。由于光伏發(fā)電系統(tǒng)一直處在一個(gè)持續(xù)變化的環(huán)境中,導(dǎo)致光伏發(fā)電技術(shù)呈現(xiàn)出穩(wěn)定性差和波動(dòng)性嚴(yán)重的特性,給光伏并網(wǎng)的電網(wǎng)造成巨大的調(diào)節(jié)和調(diào)度負(fù)擔(dān)。對(duì)光伏發(fā)電進(jìn)行可靠的預(yù)測(cè)對(duì)新能源發(fā)電的大規(guī)模使用和國(guó)家電力系統(tǒng)的高質(zhì)量運(yùn)行具有重大意義。
目前,短期光伏發(fā)電功率預(yù)測(cè)方法可以歸結(jié)為兩大類:物理模型和智能學(xué)習(xí)模型。隨著技術(shù)的發(fā)展,智能學(xué)習(xí)模型也演化出一種組合模型的預(yù)測(cè)方式。近年來,以人工神經(jīng)網(wǎng)絡(luò)[1-3]、支持向量機(jī)[4-6]為代表的智能模型已經(jīng)在光伏發(fā)電功率預(yù)測(cè)方面得到大量研究和利用。王福忠[7]等人使用變分模態(tài)分解(Variational Mode Decomposition,VMD)對(duì)數(shù)據(jù)進(jìn)行分解重構(gòu)并采用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)模型(Neural Network Model For Long And Short Term Memory,LSTM)進(jìn)行短期形式的光伏功率預(yù)測(cè),利用VMD 雖然在一定程度上改善了LSTM 模型的預(yù)測(cè)精度,但是并沒有采取參數(shù)尋優(yōu)的處理方法。袁建華[8]等人考慮原始數(shù)據(jù)的質(zhì)量和反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)的參數(shù)對(duì)預(yù)測(cè)效果的問題,在利用VMD 對(duì)原始所有數(shù)據(jù)進(jìn)行分解后,針對(duì)每個(gè)分量采用粒子群算法(Particle Swarm Optimization,PSO)進(jìn)行參數(shù)優(yōu)化后的BP 神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè),但是并沒有解決神經(jīng)網(wǎng)絡(luò)在光伏預(yù)測(cè)方面中預(yù)測(cè)速度慢的問題。朱瑞金[9]等人使用互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)和排列熵優(yōu)化最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)的組合模型,綜合考慮了模型的預(yù)測(cè)效率和精度,但是通過添加噪聲的方式并沒有解決向量機(jī)模型受數(shù)據(jù)影響大和參數(shù)調(diào)整困難的現(xiàn)狀。深度極限學(xué)習(xí)機(jī)(Deep Limit Learning Machine,DELM)作為一種新型人工智能預(yù)測(cè)模型,它在極限學(xué)習(xí)機(jī)(Limit Learning Machine,ELM)的基礎(chǔ)上進(jìn)行改進(jìn),引入自動(dòng)編碼器的極限學(xué)習(xí)機(jī)(Extreme Learning Machine for Automatic Encoders,ELM-AE)進(jìn)行隱藏層輸入權(quán)重和閾值初始化,有效克服了ELM 因隨機(jī)產(chǎn)生權(quán)值和閾值而導(dǎo)致輸出不穩(wěn)定的問題[10],同時(shí)也克服了神經(jīng)網(wǎng)絡(luò)等模型的訓(xùn)練速度慢,預(yù)測(cè)時(shí)間長(zhǎng)的弊端。李斌[11]等人利用遺傳算對(duì)ELM 進(jìn)行參數(shù)尋優(yōu)并用于光伏發(fā)電功率預(yù)測(cè),在預(yù)測(cè)精度上有了一定提升。王瑞[12]等人驗(yàn)證了利用智能算法改進(jìn)混合極限學(xué)習(xí)機(jī)在風(fēng)功率預(yù)測(cè)方面的有效性。王忠義[13]等人利用非洲禿鷲優(yōu)化算法對(duì)DELM 參數(shù)進(jìn)行尋優(yōu),取得了不錯(cuò)的預(yù)測(cè)效果。
本文結(jié)合深度極限學(xué)習(xí)機(jī)的參數(shù)少、預(yù)測(cè)速度快的優(yōu)勢(shì),提出一種基于皮爾遜相關(guān)性、麻雀算法(Sparrow Search Algorithm,SSA)、深度極限學(xué)習(xí)機(jī)的短期光伏發(fā)電功率預(yù)測(cè),采用SSA 對(duì)DELM 的相關(guān)參數(shù)進(jìn)行尋優(yōu),建立改進(jìn)麻雀優(yōu)化深度極限學(xué)習(xí)機(jī)的光伏發(fā)電功率預(yù)測(cè)模型,用每個(gè)季節(jié)的一天數(shù)據(jù)對(duì)模型的高精準(zhǔn)度和通用性進(jìn)行驗(yàn)證。
對(duì)于一個(gè)特定的光伏站來說,影響光伏出力的因素主要有光輻照度、散射、溫度、相對(duì)濕度、風(fēng)速、風(fēng)向等,其中最為主要的是光輻照度(水平輻射),理論中對(duì)光伏發(fā)電功率的高精度預(yù)測(cè)要考慮所有影響因素,但是各類天氣因素對(duì)光伏發(fā)電功率的影響程度不同,若將所有因素考慮在內(nèi)將造成預(yù)測(cè)的冗余和偏差。因此根據(jù)光伏發(fā)電的特點(diǎn),本文采用皮爾遜相關(guān)法對(duì)天氣因素進(jìn)行篩選,確定出模型輸入向量。
光伏發(fā)電是一種受多種因素影響的發(fā)電方式,在預(yù)測(cè)過程中,若考慮所有的影響因素,將會(huì)給預(yù)測(cè)帶來冗余和預(yù)測(cè)耗時(shí)問題,甚至為預(yù)測(cè)的期望造成相反的后果,因此,利用皮爾遜對(duì)影響功率的天氣因素進(jìn)行篩選,確定關(guān)鍵影響因素,其表達(dá)式為:
式中:ρx,y為皮爾遜相關(guān)系數(shù),取值范圍為[-1,1],當(dāng)取值為-1 時(shí),表示變量間完全負(fù)相關(guān)的關(guān)系,+1 時(shí)表示完全正相關(guān)的關(guān)系,0 表示兩變量間不存在線性相關(guān);n為樣本數(shù);xi,yi分別為天氣因素和光伏發(fā)電功率;為xi,yi兩個(gè)變量的平均值。
相關(guān)系數(shù)取值范圍常常被用以判斷變量之間的相關(guān)強(qiáng)度,相關(guān)程度按絕對(duì)值大小分類如表1 所示。
表1 皮爾遜相關(guān)性分類Table 1 Classification of Pearson correlation analysis
使用澳大利亞某光伏電站數(shù)據(jù)進(jìn)行相關(guān)性分析,其中考慮的氣象因素包含光水平輻射度、散射、溫度、相對(duì)濕度、風(fēng)速、風(fēng)向、降水量。由于變量之間的量綱不同會(huì)對(duì)預(yù)測(cè)過程產(chǎn)生影響,所以在進(jìn)行相關(guān)性分析前對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理:
式中:zi為第i列的原始數(shù)據(jù);zi,min為第i列數(shù)據(jù)的最小值;zi,max為第i列數(shù)據(jù)的最大值。
氣象因素和光伏發(fā)電功率之間的相關(guān)性如表2所示。
由表2 可知風(fēng)向、降水量的相關(guān)系數(shù)值分別為-0.050 8 和-0.0636,幾乎沒有相關(guān)性,因此將水平輻射、漫射、溫度、相對(duì)濕度和風(fēng)速5 個(gè)相關(guān)性較強(qiáng)的氣象因素作為輸入特征。
麻雀算法(SSA)是XueJ[14]等在2020 年提出的一種群智能尋優(yōu)算法。根據(jù)麻雀覓食的特點(diǎn),將SSA 中麻雀種群分為發(fā)現(xiàn)者、加入者和警戒者3 部分[15]。假設(shè)SSA 中麻雀的個(gè)體數(shù)量為N,則種群X可以表示為:
式中:m為變量的維數(shù)。
其適應(yīng)值Fx可以描述為:
式中:f(xN,m)為麻雀?jìng)€(gè)體的適應(yīng)度值;Fx為求取麻雀種群適應(yīng)度值的函數(shù)。
在SSA 中,發(fā)現(xiàn)者在整個(gè)種群中起到領(lǐng)導(dǎo)者的作用,通常在種群中具有10%~20%的占比[16-17]。
1)發(fā)現(xiàn)者的位置更新可以描述為:
2)加入者的位置更新過程可以描述為:
3)為了覓食的安全性,需要設(shè)置10%~20%的麻雀作為警戒者[18]。警戒者位置更新公式為:
由于群智能算法本身的一些特性,給算法造成全局搜索能力差而過早進(jìn)行收斂,產(chǎn)生局部最優(yōu)的現(xiàn)象。因此,本文對(duì)傳統(tǒng)SSA 做如下改進(jìn)。
1)黃金正弦算法
黃金正弦算法(Golden-SA)利用正弦函數(shù)的黃金分割系數(shù)和獨(dú)特的尋優(yōu)特點(diǎn),使SSA 既能對(duì)局部進(jìn)行充分搜索又能很好地開展局部開發(fā)[19]。根據(jù)發(fā)現(xiàn)者在覓食過程中位置變化可知,算法在迭代初期就呈現(xiàn)出陷入局部最優(yōu)的趨勢(shì),出現(xiàn)過早收斂的問題,因此本文使用Golden-SA 對(duì)發(fā)現(xiàn)者在覓食過程中的移動(dòng)方式進(jìn)行改進(jìn),此時(shí),發(fā)現(xiàn)者位置為:
式中:Z1為取值[0,2π]的隨機(jī)數(shù),其決定個(gè)體移動(dòng)的距離;Z2為取值[0,π]的隨機(jī)數(shù),用于決定下次更新位置的方向;x1,x2為通過黃金分割原理得到的系數(shù),且x1=-π+(1-τ)×2π,x2=-π+τ×2π,其中。
2)自適應(yīng)t分布和動(dòng)態(tài)選擇策略
t分布存在標(biāo)準(zhǔn)高斯分布和柯西分布2 個(gè)邊界特例[20]。本文在個(gè)體位置更新方式中以迭代次數(shù)iter作為t 分布變異算子,對(duì)麻雀位置起到擾動(dòng)作用[21]。具體更新公式為:
雖然自適應(yīng)t分布的引入對(duì)于避免陷入局部最優(yōu)具有很好的調(diào)節(jié)作用,但將這種改進(jìn)方式對(duì)所有麻雀均使用,在一定程度上會(huì)摒棄了傳統(tǒng)SSA 的特性,并且還會(huì)造成效率低,產(chǎn)生耗時(shí)問題。動(dòng)態(tài)選擇概率P的引入則避免了此問題的發(fā)生[22]。
式中:maxiter為最大迭代次數(shù);ω1為決定動(dòng)態(tài)選擇的概率上限;ω2為決定動(dòng)態(tài)選擇概率的變化幅度。
改進(jìn)后的麻雀算法流程如圖1 所示。
圖1 改進(jìn)的麻雀算法流程Fig.1 Improved sparrow algorithm flow
Huang 等人在2004 年提出的一種被稱為極限學(xué)習(xí)機(jī)的快速學(xué)習(xí)模型,ELM 網(wǎng)絡(luò)相比于其他類別的模型具有學(xué)習(xí)速度快、泛化能力強(qiáng)等優(yōu)點(diǎn)[23]。自動(dòng)編碼器(AE)是作為一種無監(jiān)督學(xué)習(xí)算法,在DELM 模型中最為逼近器使用,其在DELM 中發(fā)揮著將ELM 的輸入用于輸出的作用[24-25]。
結(jié)合ELM 和AE 的深度極限學(xué)習(xí)機(jī)(DELM)的分層無監(jiān)督訓(xùn)練方式,對(duì)于重構(gòu)誤差具有很好的衰減作用[26]。圖2 為DELM 模型的訓(xùn)練過程,其中,β為輸出權(quán)重,β=[β1,β2,…,βn],βi(i=1,2,…,n)。ω為輸入權(quán)重,ω=[ω1,ω2,…,ωn],ωi(i=1,2,…,n),X1,X2,Y分別表示各隱藏層輸出,T為輸出層輸出。
圖2 DELM模型訓(xùn)練過程圖Fig.2 Diagram showing DELM model training process
DELM 隱藏層的輸出權(quán)重可以表達(dá)為:
式中:I為單位矩陣;X為輸入數(shù)據(jù),X=[x1,…,xN];C為正則化參數(shù);H為隱藏層輸出。
對(duì)于等維度特征表達(dá),隱藏層的輸出權(quán)重可以表示為:
在DELM 的模型訓(xùn)練過程中,采用黃金正弦算法和自適應(yīng)t 分布和動(dòng)態(tài)選擇策略改進(jìn)后的麻雀算法tGSSA 對(duì)輸入層權(quán)重和閾值進(jìn)行參數(shù)尋優(yōu),可以得到最優(yōu)輸入層權(quán)重和閾值,減小DELM 的波動(dòng)問題。整個(gè)優(yōu)化流程如圖3 所示。
圖3 tGSSA-DELM流程圖Fig.3 Flowchart for tGSSA-DEM
本文采用tGSSA-DELM 模型對(duì)未來1 d 的光伏站發(fā)電功率進(jìn)行預(yù)測(cè)。為測(cè)試本文所提模型在光伏發(fā)電功率預(yù)測(cè)領(lǐng)域的應(yīng)用性能,選用澳大利亞某光伏電站2014 年全年的公開發(fā)電數(shù)據(jù)進(jìn)行測(cè)試,數(shù)據(jù)采樣時(shí)間為當(dāng)?shù)孛刻?:00—17:30,每隔5 min 進(jìn)行一次采樣。選用2014 年10 月、1 月、4月、7 月來進(jìn)行四季模擬,取每月中的28 天共3 220個(gè)樣本,其中前3 105 個(gè)樣本點(diǎn)為訓(xùn)練數(shù)據(jù)集,后115 個(gè)樣本點(diǎn)為預(yù)測(cè)數(shù)據(jù)集,通過本文所提模型進(jìn)行光伏站全天(8:00—17:30)的功率預(yù)測(cè)分析。
為了對(duì)各模型的預(yù)測(cè)性能進(jìn)行更加全面的評(píng)估,本文選用均方根誤差(Root Mean Squared Error,RMSE)、平均絕對(duì)誤差(MeanAbsolute Error,MAE)、平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)、擬合優(yōu)度(R2)作為評(píng)價(jià)指標(biāo)進(jìn)行誤差分析。RMSE,MAE,MAPE 的值分別用ERMS,EMA,EMAP表示,表達(dá)式為:
式中:pi為光伏發(fā)電功率真實(shí)值;為光伏發(fā)電功率預(yù)測(cè)值。
3.2.1 算法模型測(cè)試
為更加直觀表現(xiàn)麻雀算法改進(jìn)后的優(yōu)越性能,通過單峰和多峰測(cè)試函數(shù)進(jìn)行收斂速度、精度和全局尋優(yōu)比較試驗(yàn),試驗(yàn)測(cè)試條件為:種群數(shù)量為30,迭代次數(shù)為300。測(cè)試函數(shù)如式(17)所示。
改進(jìn)前后的麻雀算法對(duì)比如圖4 所示。
圖4 2種函數(shù)下的適應(yīng)度曲線Fig.4 Fitness curves with two functions
由圖4 可知,在單峰、多峰測(cè)試函數(shù)下SSA 在300 次迭代結(jié)束后均未達(dá)到理想最優(yōu)結(jié)果。tGSSA在迭代50 次前均已達(dá)到全局最優(yōu)值,且收斂速度快。表明tGSSA 性能遠(yuǎn)超傳統(tǒng)SSA 的性能。
為驗(yàn)證本文所提DELM 模型在利用算法提高預(yù)測(cè)精度時(shí),依然保持在高效率進(jìn)行光伏功率預(yù)測(cè)方面的優(yōu)越性,本文將麻雀算法優(yōu)化深度極限學(xué)習(xí)機(jī)(Sparrow Algorithm Optimization Deep Limit Learning Machine,SSA-DELM)分別與在光伏預(yù)測(cè)中常用的SSA 優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)模型和LSSVM 向量機(jī)模型進(jìn)行預(yù)測(cè)性能對(duì)比,模型參種群數(shù)量為20,迭代次數(shù)為100,預(yù)測(cè)時(shí)間對(duì)比如表3 所示。
表3 3種預(yù)測(cè)模型預(yù)測(cè)時(shí)間對(duì)比Table 3 Comparison of prediction time among three prediction models s
由表3 可知,在相同條件下,DELM 模型在保證預(yù)測(cè)精度的情況下可以明顯提高預(yù)測(cè)的速度,可以看出在同樣的算法優(yōu)化條件下,DELM 模型在預(yù)測(cè)速度方面存在明顯的優(yōu)勢(shì)。
3.2.2 預(yù)測(cè)結(jié)果分析
為了更加直觀看出本文所提模型在光伏發(fā)電功率預(yù)測(cè)技術(shù)中的有效性和優(yōu)越性,選取DELM,SSA-DELM 典型模型和遺傳算法優(yōu)化深度極限學(xué)習(xí)機(jī)(Genetic Algorithm Optimization of Deep Limit Learning Machine,GA-DELM)、人工蜂群算法優(yōu)化深度極限學(xué)習(xí)機(jī)(Optimization of deep limit learning machine using artificial bee colony algorithm,ABCDELM)、鯨魚優(yōu)化算法優(yōu)化深度極限學(xué)習(xí)機(jī)(Whale algorithm optimization deep limit learning machine,WOA-DELM)與其進(jìn)行比較。對(duì)于DELM 模型采用sig 激活函數(shù),隱藏層數(shù)設(shè)置為2,每層節(jié)點(diǎn)數(shù)為3。
由圖5 可以看出,春季預(yù)測(cè)值跟隨真實(shí)值呈現(xiàn)出較大的波動(dòng)性,存在很明顯的隨機(jī)性,且本文所提模型和其他對(duì)比模型得到的功率擬合曲線與實(shí)際曲線均有較大的差距。但是相比而言,改進(jìn)的tGSSA-DELM 模型得到的功率擬合曲線要優(yōu)于其他對(duì)比模型。
圖5 春季預(yù)測(cè)結(jié)果Fig.5 Forecasting results in spring
由圖6 可以看出,夏季的預(yù)測(cè)曲線和真實(shí)光伏功率曲線波動(dòng)均較為穩(wěn)定,利用tGSSA 與DELM 組合預(yù)測(cè)模型擬合效果要優(yōu)于傳統(tǒng)模型和其他對(duì)比算法。
圖6 夏季預(yù)測(cè)結(jié)果Fig.6 Forecasting results in summer
由圖7 可以看出,不同模型得到的功率擬合曲線均比較穩(wěn)定且十分接近實(shí)際功率曲線,由此說明,不同模型對(duì)于秋季的光伏發(fā)電功率適應(yīng)性較好。
圖7 秋季預(yù)測(cè)結(jié)果Fig.7 Forecasting results in autumn
由圖8 可以看出,傳統(tǒng)DELM 模型擬合曲線與實(shí)際有很大偏差,并且各個(gè)模型在中午時(shí)刻與實(shí)際有明顯的偏差,但是相比而言,本文所提模型擬合度更高,tGSSA-DELM 模型具有更強(qiáng)的預(yù)測(cè)性能。
圖8 冬季預(yù)測(cè)結(jié)果Fig.8 Forecasting results in autumn
表4 為不同預(yù)測(cè)模型在不同季節(jié)環(huán)境下的預(yù)測(cè)評(píng)價(jià)指標(biāo)對(duì)比結(jié)果。表4 給出了春季、夏季、秋季、冬季4 個(gè)季節(jié)在6 種預(yù)測(cè)模型下的對(duì)比結(jié)果。由表4 可知,6 種模型均可以對(duì)不同季節(jié)的光伏發(fā)電功率做出有效的預(yù)測(cè),但相比之下,tGSSA-DELM得到的預(yù)測(cè)效果要優(yōu)于傳統(tǒng)的DELM,SSADELM。而對(duì)于GA-DELM,ABC-DELM,WOADELM 來說,tGSSA-DELM 具有更小的預(yù)測(cè)誤差,tGSSA-DELM 預(yù)測(cè)模型在春季、夏季、秋季、冬季下的RMSE 值分別為0.213 92,0.189 19,0.147 77,0.150 06,MAE 值分別為0.158 65,0.139 67,0.130 14,0.115 96,MAPE 值分別為5.911 1%,4.03 36%,4.900 7%,3.353 4%,相關(guān)系數(shù)R2分別為0.938 08,0.954 52,0.958 11,0.962 85。以春季為例分析,本文提出的模型相比于DELM,SSA-DELM 模型R2分別提升了0.191 67,0.010 8,相比于GA,ABC,WOA優(yōu)化后的模型,擬合優(yōu)度R2分別提升了0.018 78,0.012 57,0.014 02。
表4 不同季節(jié)下的預(yù)測(cè)模型仿真性能指標(biāo)對(duì)比Table 4 Comparison of simulation performance indicators among prediction models under different seasons
分析可知,對(duì)于4 個(gè)季節(jié)下的預(yù)測(cè),本文模型具有較好的預(yù)測(cè)性能,并且夏季、秋季、冬季的光伏發(fā)電預(yù)測(cè)精度要明顯優(yōu)于春季的預(yù)測(cè)結(jié)果,這是由于春季的發(fā)電功率存在較強(qiáng)的不穩(wěn)定性和波動(dòng)性,且春季為多雨季節(jié),空氣濕度高,給預(yù)測(cè)帶來了較大的困難,而其他3 個(gè)季節(jié)的光伏發(fā)電功率較為穩(wěn)定,光照充足,降水天氣少,因此預(yù)測(cè)模型在夏季、秋季、冬季下的適應(yīng)性要強(qiáng)于春季。由不同季節(jié)下各模型的預(yù)測(cè)效果對(duì)比可知,tGSSA-DELM 預(yù)測(cè)模型在光伏發(fā)電功率方面具有較高的預(yù)測(cè)精度,在不同季節(jié)下的預(yù)測(cè)精度都在90%以上,具有較高的實(shí)用性和推廣意義。
為了提高短期光伏發(fā)電功率的預(yù)測(cè)性能,提出一種基于tGSSA-DELM 的短期光伏發(fā)電功率預(yù)測(cè)模型,通過實(shí)例得到如下結(jié)論:
1)針對(duì)現(xiàn)有光伏預(yù)測(cè)模型因需優(yōu)化參數(shù)多而導(dǎo)致的預(yù)測(cè)速度低、泛化能力弱的問題,提出了基于DELM 的光伏發(fā)電功率預(yù)測(cè)模型。
2)針對(duì)DELM 因輸入權(quán)重偏置選擇不當(dāng)而導(dǎo)致的預(yù)測(cè)性能低下的問題,提出了tGSSA 用于優(yōu)化DELM 的相關(guān)參數(shù),結(jié)果表明,tGSSA 可以尋得更優(yōu)的DELM 相關(guān)參數(shù)解,且能夠有效提高其整體預(yù)測(cè)性能。
3)仿真結(jié)果表明,tGSSA-DELM 模型能夠有效對(duì)短期光伏發(fā)電功率做出預(yù)測(cè),在預(yù)測(cè)速度方面具有極大的優(yōu)勢(shì),且在4 個(gè)季節(jié)下得到的4 個(gè)評(píng)價(jià)指標(biāo)均優(yōu)于其他模型,但是該模型在夏季的預(yù)測(cè)精度相比于其他四個(gè)季節(jié)的預(yù)測(cè)精度低,是下一步研究和改進(jìn)的重點(diǎn)問題。