彭宇文,楊之樂,李冰,張豪,周邦昱
(1.廣東碳中和研究院,廣東 韶關(guān) 512000;2.中國科學(xué)院 深圳先進(jìn)技術(shù)研究院,廣東 深圳 518000)
隨著傳統(tǒng)化石能源的急劇消耗,可再生能源的重要性在全球范圍內(nèi)日益凸顯,尤其光伏發(fā)電以其低運(yùn)行成本和環(huán)境污染小的特點(diǎn),迅速成為新能源領(lǐng)域的研究重點(diǎn)[1-2]。然而,光伏發(fā)電具有嚴(yán)重的隨機(jī)不確定性,容易受環(huán)境因素的影響,尤其在光伏機(jī)組大規(guī)模接入電網(wǎng)后,會對電力系統(tǒng)的穩(wěn)定運(yùn)行造成嚴(yán)重破壞,此時需要大量棄光以保證電力系統(tǒng)機(jī)組的安全穩(wěn)定運(yùn)行,間接造成了大規(guī)模的能源就地浪費(fèi)[3]。因此,需要對光伏發(fā)電功率進(jìn)行準(zhǔn)確的短期預(yù)測,以確保光伏機(jī)組在并網(wǎng)后依然能保持電力系統(tǒng)運(yùn)行的經(jīng)濟(jì)性和穩(wěn)定性。
為了提高光伏發(fā)電功率的預(yù)測精度,國內(nèi)外學(xué)者進(jìn)行了大量的智能方法研究,主要集中在兩大預(yù)測模型:機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型。機(jī)器學(xué)習(xí)模型作為人工智能領(lǐng)域研究的重要分支,可以根據(jù)給定的訓(xùn)練數(shù)據(jù)自適應(yīng)做出決策,并預(yù)測短期未來的數(shù)據(jù),常見模型包括隨機(jī)森林[4]、貝葉斯回歸樹[5]、支持向量機(jī)[6]等。這種預(yù)測方法的模型訓(xùn)練簡單,但對于非線性較強(qiáng)的高維時間序列數(shù)據(jù)的擬合效果并不理想,且缺乏對數(shù)據(jù)的深度挖掘,導(dǎo)致模型預(yù)測精度較差。因此,學(xué)者們轉(zhuǎn)向深度學(xué)習(xí)模型的研究。深度學(xué)習(xí)模型主要依賴于數(shù)據(jù)模態(tài)特征處理和神經(jīng)網(wǎng)絡(luò)序列的深層映射,實(shí)現(xiàn)邏輯的深度挖掘,以達(dá)到更高的預(yù)測精度。文獻(xiàn)[7]將傳統(tǒng)經(jīng)驗(yàn)?zāi)B(tài)分解算法與長短期記憶(long short term memory,LSTM)神經(jīng)網(wǎng)絡(luò)相結(jié)合,開發(fā)出組合預(yù)測模型;文獻(xiàn)[8]利用變分模態(tài)分解(variational mode decomposition,VMD)算法對光伏序列數(shù)據(jù)進(jìn)行多層模態(tài)分解,不僅消除了序列分解過程中的模態(tài)混淆,還提高了模型擬合精度;文獻(xiàn)[9]針對LSTM神經(jīng)網(wǎng)絡(luò)存在超參數(shù)難以確定的問題,采用智能啟發(fā)式算法對LSTM神經(jīng)網(wǎng)絡(luò)的超參數(shù)全局尋優(yōu),以確定初始超參數(shù)的選取。文獻(xiàn)[10]通過模擬退火算法優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)的超參數(shù),從而避免了人為選擇的經(jīng)驗(yàn)性,以此提高組合模型的預(yù)測精度。然而,上述文獻(xiàn)要么注重于特征工程方法的模態(tài)處理,要么關(guān)注模型超參數(shù)的選取,將兩者相結(jié)合的組合模型卻較為少見。
因此,在考慮光伏發(fā)電功率受到環(huán)境特征因素影響的前提下,本文提出基于VMD和改進(jìn)麻雀搜索算法(improved sparrow search algorithm,ISSA)優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)的短期光伏發(fā)電功率預(yù)測方法。首先,通過VMD算法將原始多維光伏時間序列特征分解成若干模態(tài)分量和殘差項(xiàng),以降低光伏時間序列數(shù)據(jù)的波動性和非平穩(wěn)性;然后,采用ISSA對LSTM神經(jīng)網(wǎng)絡(luò)的超參數(shù)進(jìn)行尋優(yōu),得到了各層模型的模態(tài)特征分量預(yù)測集合后,將它們序列組合成最終的輸出結(jié)果;最后,將不同類型的組合模型和VMD-ISSA-LSTM組合模型進(jìn)行誤差指標(biāo)對比,以驗(yàn)證本文提出的組合模型具有更精確的魯棒擬合性。
光伏發(fā)電功率通常會表現(xiàn)出強(qiáng)烈的非線性時序變化特征,主要的環(huán)境特征影響因素包括光照輻射度、空氣溫度、環(huán)境濕度、機(jī)組材料和大氣壓強(qiáng)等,這些環(huán)境特征的時空變化會在不同程度上影響光伏機(jī)組的發(fā)電效率[11]。因此,選擇合適的環(huán)境特征是提高組合模型預(yù)測精度的關(guān)鍵,通過計(jì)算采集特征樣本與光伏發(fā)電功率的皮爾遜相關(guān)系數(shù),可以綜合評價(jià)出所選擇環(huán)境特征對光伏發(fā)電功率的潛在影響。環(huán)境特征的皮爾遜相關(guān)系數(shù)
(1)
表1 環(huán)境因素的相關(guān)系數(shù)與主成分占比Tab.1 Determination and correlation coefficients of major environmental factors
從表1可以看出:光伏發(fā)電功率與光照輻照度的正相關(guān)性最強(qiáng),這成為了決定光伏發(fā)電功率的重要環(huán)境表現(xiàn)特征;環(huán)境濕度和大氣壓強(qiáng)與光伏發(fā)電功率呈現(xiàn)出負(fù)相關(guān)性,這間接說明了該環(huán)境特征可能對光伏發(fā)電功率產(chǎn)生消極影響;同時,空氣溫度和機(jī)組材料對光伏發(fā)電功率的影響相對較小,這與傳統(tǒng)物理常識也是相符合的。因此,本文選擇光照輻照度、空氣溫度、環(huán)境濕度、機(jī)組材料和大氣壓強(qiáng)這5種環(huán)境特征作為VMD-ISSA-LSTM組合模型的主成分輸入特征數(shù)據(jù)集。
VMD算法屬于完全非遞歸的時頻信號特征處理方法,該方法假設(shè)任何時間序列都由特定中心頻率和有限帶寬的本征模態(tài)所構(gòu)成[12]。在多維序列特征的模態(tài)分解過程中,首先要對每個分解出來的子序列模態(tài)分量進(jìn)行希爾伯特變換,計(jì)算出相關(guān)的解析頻率信號;然后通過估計(jì)指數(shù)來調(diào)整序列的中心頻率,實(shí)現(xiàn)對各頻譜的基帶區(qū)域轉(zhuǎn)移;最后利用解調(diào)信號的帶寬平滑度生成約束變分式,以提高多模態(tài)的解列度。構(gòu)建的約束變分模型[13]為:
(2)
式中:t為時間;μk為各層模態(tài)分量的函數(shù);ωk為各層模態(tài)對應(yīng)的中心頻率;δ(t)為單位脈沖信號;?t為偏導(dǎo)的運(yùn)算符;*表示卷積運(yùn)算;K為模態(tài)分解層的數(shù)量;f為原始序列信號的函數(shù)。
為了能夠快速求解上述含條件極值的多元函數(shù)優(yōu)化問題,采用二階懲罰項(xiàng)因子α和拉格朗日乘子λ來消除變分模型的條件約束性,進(jìn)而可以將約束變分問題轉(zhuǎn)化為非約束變分的問題。其模型轉(zhuǎn)換擴(kuò)展的拉格朗日表達(dá)式為:
(3)
通過使用交替方向乘子法結(jié)合傅里葉變換,可以計(jì)算出各層的泛函分量和容限頻率,接著可以得出優(yōu)化后的模態(tài)分量μk和中心頻率ωk。其交替迭代更新方向的泛函計(jì)算公式如下:
(4)
綜上所述,VMD算法是強(qiáng)大的非線性自適應(yīng)模態(tài)特征處理方法,它的核心思想是:最小化帶有約束條件的數(shù)學(xué)規(guī)劃問題,這個規(guī)劃問題的目標(biāo)是找到一組固有模態(tài)函數(shù),使得這些函數(shù)的帶寬之和達(dá)到最小值。該特征工程算法在處理復(fù)雜非線性光伏時間序列信號采樣和降噪等方面均表現(xiàn)出強(qiáng)大的魯棒性,具有重要的現(xiàn)實(shí)工程意義。
SSA是元啟發(fā)式智能優(yōu)化算法,其設(shè)計(jì)靈感源自于麻雀的搜索覓食行為。該智能算法將麻雀尋找到的食物位置和躲避危險(xiǎn)的行為作為全局優(yōu)化變量,以解決麻雀群的位置更新問題。在迭代移動過程中,麻雀最終找到的食物位置象征著全局搜索到的最優(yōu)解。下面將簡單描述SSA的全局搜索位置更新[14]過程。
a)在搜索階段,麻雀會在集合區(qū)域內(nèi)盡可能地尋找已存在的食物源,具有高適應(yīng)度的麻雀被稱為發(fā)現(xiàn)者,它們的主要任務(wù)是探尋食物位置,并共享其位置為整個種群指明尋找的方向。發(fā)現(xiàn)者麻雀位置更新的公式為:
(5)
式中:Di,j為第i個麻雀在第j維度的位置;T為最大迭代次數(shù);α為[0,1]之間的隨機(jī)數(shù);Q為服從正態(tài)分布的隨機(jī)數(shù);R2為預(yù)警值;ST為安全閥值;E為元素均為1的1×d維矩陣,d為全局優(yōu)化變量的數(shù)目。
b)在跟蹤階段,被稱為跟隨者的麻雀會根據(jù)上一階段被稱為發(fā)現(xiàn)者麻雀的提示,縮小其區(qū)域搜索范圍,并深入鄰域進(jìn)行探索。他們會根據(jù)發(fā)現(xiàn)者麻雀提供的位置來同步更新自身位置,逐步靠近目標(biāo)食物位置,這種尋優(yōu)方式有助于提升全局解的質(zhì)量。跟隨者麻雀位置更新的公式為:
(6)
式中:Dpbest為個體搜索的最佳位置;Dworst為麻雀搜索的最差位置;A+=AT(AAT)-1,A為隨機(jī)賦值±1的1×d階矩陣;N為種群數(shù)量。
c)在攻擊階段,被稱為攻擊者的麻雀會對已確定食物源的位置進(jìn)行精確定位,并在該食物源鄰域范圍進(jìn)行搜尋,它同時會根據(jù)已知的食物源位置迅速調(diào)整自身的移動方向,盡可能地靠近已搜尋到的食物源。攻擊者麻雀位置更新的公式為:
(7)
式中:Dgbest為全局搜索的最佳位置;β為步長控制的隨機(jī)數(shù);q為服從正態(tài)分布的隨機(jī)數(shù);ε為避免分母為0的最小常數(shù);Fi為麻雀的個體最優(yōu)適應(yīng)度;Fg為麻雀的全局最優(yōu)適應(yīng)度;Fw為麻雀的全局最差適應(yīng)度。
通過觀察得出:發(fā)現(xiàn)者麻雀和跟隨者麻雀的角色是動態(tài)變化的,任何可以找到更近食物源位置的麻雀都有可能成為新的發(fā)現(xiàn)者麻雀。盡管麻雀的角色是可以變動的,但發(fā)現(xiàn)者和跟隨者在麻雀種群中的數(shù)量比例始終保持恒定[15]。當(dāng)麻雀感知到外部環(huán)境存在威脅時,外圍的麻雀會快速向安全區(qū)域轉(zhuǎn)移,而中心的麻雀則會隨機(jī)移動方向。SSA程序設(shè)計(jì)步驟如下:
步驟1:初始化麻雀種群和迭代次數(shù)。
步驟2:計(jì)算出個體適應(yīng)度,從大到小排序。
步驟3:更新發(fā)現(xiàn)者和跟隨者的位置。
步驟4:更新攻擊者位置的麻雀。
步驟5:計(jì)算新適應(yīng)度,并更新麻雀位置。
步驟6:若滿足要求,輸出結(jié)果;否則,重復(fù)步驟2—6。
在利用SSA對目標(biāo)函數(shù)進(jìn)行優(yōu)化時,初始的種群位置是完全隨機(jī)分布的,這會導(dǎo)致算法的收斂速度很慢,且容易陷入局部最優(yōu)解。為了改善算法在性能上的問題,本文利用混沌映射策略來初始化麻雀的位置。其混沌映射策略具有隨機(jī)性、規(guī)律性和遍歷性的特點(diǎn),可以使種群在初始化過程中的分布變得更加均勻,提高了全局搜索的能力。通過將搜索區(qū)域范圍內(nèi)的序列混沌投影,可以生成一系列初始的位置,使得麻雀種群可以更好地探索整個搜索空間,加快了算法的收斂速度,也避免了陷入局部最優(yōu)解。因此,將混沌映射策略應(yīng)用于SSA的種群位置初始化是一種有效的改進(jìn)方法。
在ISSA中,可以選擇不同類型的線性混沌映射策略,例如Logistic映射和Tent映射等,不同混沌映射策略對種群位置初始化分布有著很大的區(qū)別。Logistic映射分布不均勻,這會嚴(yán)重影響全局搜索最優(yōu)解的精度。相比之下,Tent映射能夠均勻地將位置參數(shù)分布到各個維度上,具有更好的遍歷性。因此,本文選擇Tent映射來初始化種群的分布位置。其Tent映射表達(dá)式如下:
(8)
式中:pn為第n次迭代時的映射函數(shù)值;u為麻雀種群位置的混沌分布系數(shù)。
LSTM神經(jīng)網(wǎng)絡(luò)是由多層網(wǎng)絡(luò)所構(gòu)建的深度學(xué)習(xí)模型,它是由循環(huán)神經(jīng)網(wǎng)絡(luò)改進(jìn)結(jié)構(gòu)后的特殊組成形式[16]。與循環(huán)神經(jīng)網(wǎng)絡(luò)不同的是,LSTM神經(jīng)網(wǎng)絡(luò)在其內(nèi)部結(jié)構(gòu)中增設(shè)了遺忘門、輸入門和輸出門。這種門控設(shè)計(jì)使得該模型具有選擇性地保留或遺忘信息的能力,從而能夠有效地處理時間序列數(shù)據(jù),成功地解決了循環(huán)神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中出現(xiàn)的梯度消失或梯度爆炸的問題[17]。因此,通過引入多級控制門機(jī)制,可以使得LSTM神經(jīng)網(wǎng)絡(luò)更加穩(wěn)定地預(yù)測多特征時間序列。其網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)如圖1所示。其中:f(t)、i(t)、o(t)分別為遺忘門、輸入門、輸出門的狀態(tài)信息;a(t)為輸入門的候選狀態(tài)信息;c(t)、h(t)分別為記憶狀態(tài)、隱藏狀態(tài)的信息。
圖1 長短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 LSTM neural network structure
由圖1可以看出,本文的LSTM神經(jīng)網(wǎng)絡(luò)是由多層鏈?zhǔn)介T結(jié)構(gòu)所構(gòu)建的,遺忘門負(fù)責(zé)決定時間序列信息的篩選,輸入門負(fù)責(zé)確定新選擇信息的存儲量,輸出門負(fù)責(zé)控制傳輸信息的強(qiáng)度[18]。通過多結(jié)構(gòu)門的協(xié)同耦合工作,深度神經(jīng)網(wǎng)絡(luò)就能夠進(jìn)行高維特征時間序列的過濾和保存。
a)遺忘門是LSTM神經(jīng)網(wǎng)絡(luò)狀態(tài)傳遞的重要組成部分,其主要功能是處理來自上一時刻單元的時間序列狀態(tài)信息,進(jìn)而決定輸入特征的時間序列狀態(tài)信息應(yīng)是被保留還是應(yīng)該被遺忘。遺忘門輸出信息狀態(tài)更新公式如下:
f(t)=σ(Wfh(t-1)+Wfx(t)+bf).
(9)
式中:σ為Sigmid激活函數(shù);h(t-1)為上時刻的隱藏狀態(tài);x(t)為當(dāng)前的輸入序列;bf為遺忘門的偏置矢量;Wf為遺忘門的權(quán)重矩陣。
b)輸入門主要負(fù)責(zé)控制時間序列信息進(jìn)入細(xì)胞單元狀態(tài)的變化程度,以此決定需要更新的時間序列狀態(tài)信息,這有利于將新候選信息添加到原始狀態(tài)中。輸入門輸出信息狀態(tài)更新公式如下:
i(t)=σ(Wih(t-1)+Wix(t)+bi),
(10)
a(t)=tanh(Wah(t-1)+Wax(t)+ba).
(11)
式中:i(t)為輸入門的當(dāng)前狀態(tài);Wi、bi分別為輸入門σ的權(quán)重矩陣和偏置矢量;Wa、ba分別為輸入門tanh的權(quán)重矩陣和偏置矢量。
c)細(xì)胞狀態(tài)更新是通過疊加過去信息和現(xiàn)在信息所獲得的狀態(tài)來實(shí)現(xiàn)的。它將遺忘門決定的初始序列狀態(tài)信息保留,同時利用輸入門來篩選新候選的時間序列信息,最后將輸入狀態(tài)信息添加到原始細(xì)胞狀態(tài)中,這樣就實(shí)現(xiàn)了初始細(xì)胞狀態(tài)的序列信息更新。細(xì)胞狀態(tài)更新的公式如下:
C(t)=f(t)*C(t-1)+i(t)*a(t).
(12)
式中:C(t)為當(dāng)前的細(xì)胞單元狀態(tài);C(t-1)為上時刻的細(xì)胞單元狀態(tài)。
d)輸出門是通過結(jié)合短期信息與當(dāng)前輸入信息生成的狀態(tài),加上長期信息疊加步長信息后得到的長短期記憶結(jié)構(gòu)。這種混合結(jié)構(gòu)可以決定每個時間狀態(tài)的更新,進(jìn)而記住新的時間序列特征,其生成的信息序列用于更新細(xì)胞的記憶狀態(tài)[19]。輸出門狀態(tài)更新的公式如下:
o(t)=σ(Woh(t-1)+Wox(t)+bo).
(13)
h(t)=o(t)tanh(C(t)).
(14)
式中:Wo為輸出門的權(quán)重矩陣;bo為輸出門的偏置矢量;h(t)為隱含層的輸出向量。
e)經(jīng)過上述步驟,共同更新了當(dāng)前時刻的輸出狀態(tài)序列,其計(jì)算公式為:
(15)
本文構(gòu)建的ISSA-LSTM組合模型同時結(jié)合了ISSA和LSTM神經(jīng)網(wǎng)絡(luò)。大量研究表明,盡管LSTM神經(jīng)網(wǎng)絡(luò)對于單特征時間序列具有較好的擬合性能,但其收斂速度和泛化能力仍受到最大迭代次數(shù)、隱藏層神經(jīng)元個數(shù)和學(xué)習(xí)率等網(wǎng)絡(luò)超參數(shù)的影響[20]。因此,通過利用ISSA對LSTM神經(jīng)網(wǎng)絡(luò)中的最大迭代次數(shù)、隱藏層神經(jīng)元個數(shù)和學(xué)習(xí)率等網(wǎng)絡(luò)超參數(shù)進(jìn)行全局迭代尋優(yōu),可以使得組合模型的擬合精度變得更高。ISSA-LSTM組合模型構(gòu)建流程如圖2所示,主要步驟[21]包括:
圖2 ISSA-LSTM組合模型構(gòu)建流程Fig.2 Building procedure of ISSA-LSTM combined model
a)數(shù)據(jù)預(yù)處理:包括數(shù)據(jù)清洗、行列式標(biāo)準(zhǔn)化和格式歸一化等步驟,以確保數(shù)據(jù)完備性。
b)初始化ISSA的運(yùn)行參數(shù):包括麻雀種群的規(guī)模、最大迭代次數(shù)和可控變量的位置等。
c)設(shè)置LSTM神經(jīng)網(wǎng)絡(luò)初始超參數(shù):包括最大迭代次數(shù)、隱含層神經(jīng)元個數(shù)和學(xué)習(xí)率。
d)開始優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)超參數(shù):使用ISSA對LSTM神經(jīng)網(wǎng)絡(luò)超參數(shù)進(jìn)行全局尋優(yōu),利用隨機(jī)梯度下降法來最小化均方根誤差。
e)預(yù)測與評估:使用訓(xùn)練好的LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行高維特征序列的預(yù)測,比較預(yù)測結(jié)果和實(shí)際值的均方根誤差來評估其組合模型性能。
傳統(tǒng)VMD算法在分解復(fù)雜非線性時間序列方面表現(xiàn)出色,可以應(yīng)用于處理多特征的光伏時間序列數(shù)據(jù)[22]。在光伏時間序列預(yù)測過程中,首先需要對光伏時間序列信號進(jìn)行預(yù)處理,進(jìn)一步消除環(huán)境噪聲和非線性干擾因素;然后使用VMD算法對處理過的多維光伏時間序列進(jìn)行模態(tài)特征分解,以提取更有價(jià)值的模態(tài)序列分量;最后利用已經(jīng)訓(xùn)練好的VMD-ISSA-LSTM組合模型進(jìn)行多維模態(tài)光伏時間序列的特征分量預(yù)測,并將其模態(tài)預(yù)測序列分量組合成最終輸出結(jié)果[23]。組合模型的短期光伏發(fā)電功率預(yù)測流程如圖3所示。
圖3 基于VMD-ISSA-LSTM模型的光伏功率預(yù)測流程Fig.3 PV prediction procedure based on VMD-ISSA-LSTM model
本文以廣東省某工業(yè)園區(qū)的實(shí)際光伏發(fā)電數(shù)據(jù)作為基礎(chǔ),構(gòu)建了VMD-ISSA-LSTM組合模型進(jìn)行光伏功率預(yù)測。由于實(shí)際光伏發(fā)電功率存在嚴(yán)重的瞬時不確定性,選用單步計(jì)量的方式進(jìn)行多維度的數(shù)據(jù)采集,采樣時間跨度從2023年3月1日至2023年6月15日,平均每天采集96個點(diǎn),確保每15 min計(jì)量裝置后臺記錄一次,以實(shí)現(xiàn)高質(zhì)量的特征數(shù)據(jù)采集和信息傳輸。通過傳感器獲得的數(shù)據(jù),分別使用LSTM神經(jīng)網(wǎng)絡(luò)模型和VMD-ISSA-LSTM組合模型對光伏發(fā)電功率進(jìn)行短期預(yù)測,并將模型預(yù)測結(jié)果與實(shí)際歷史光伏發(fā)電功率進(jìn)行比對,從而驗(yàn)證所提出組合模型的擬合穩(wěn)定性和預(yù)測精確性。
在處理光伏時間序列數(shù)據(jù)的過程中,分解層數(shù)的選擇是特征算法的核心環(huán)節(jié),這個參數(shù)的設(shè)置直接影響序列信號分解效果的優(yōu)劣:如果該層值設(shè)定過小,可能導(dǎo)致高維模態(tài)而產(chǎn)生混疊現(xiàn)象;若該層值設(shè)定過大,則可能引發(fā)模態(tài)重復(fù)或噪聲干擾等問題。考慮到光伏時間序列數(shù)據(jù)會因環(huán)境變化而呈現(xiàn)出明顯的非線性特征,于是本文選擇7層模態(tài)分量作為光伏序列數(shù)據(jù)分解的層數(shù)。同時,為滿足特征算法的分解機(jī)制,還應(yīng)該設(shè)定相應(yīng)的運(yùn)行參數(shù):懲罰因子設(shè)置為2 000;中心頻率設(shè)置為0;收斂因子設(shè)置為10-7。通過特征參數(shù)的選擇,光伏時間序列數(shù)據(jù)可以成功地被分解為7層本征模態(tài)分量的集合。模態(tài)分解結(jié)果如圖4所示。
圖4 VMD算法的模態(tài)分解結(jié)果Fig.4 Modal decomposition results of VMD
從圖4可以觀察到:經(jīng)過VMD算法處理的光伏時間序列數(shù)據(jù),各層模態(tài)特征分量均呈現(xiàn)出明顯的規(guī)律性和周期性,其頻率相對穩(wěn)定,沒有出現(xiàn)頻譜混疊的現(xiàn)象,表明光伏數(shù)據(jù)預(yù)處理步驟已成功完成。這不僅驗(yàn)證了所選擇VMD算法作為特征工程處理的正確性,也證實(shí)了本文經(jīng)驗(yàn)設(shè)定其內(nèi)部運(yùn)行參數(shù)的合理性,這都為接下來的組合模型的訓(xùn)練和預(yù)測工作提供了堅(jiān)實(shí)的基礎(chǔ)。
本文采用VMD-ISSA-LSTM組合模型對光伏發(fā)電功率序列進(jìn)行短期預(yù)測,通過優(yōu)化最大迭代次數(shù)、隱藏層神經(jīng)元個數(shù)和學(xué)習(xí)率,提升了組合模型的擬合精度。在應(yīng)用ISSA優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)超參數(shù)的過程中,設(shè)定的種群規(guī)模為100組,控制變量維度設(shè)定為3個;其中,最大迭代次數(shù)變量的范圍設(shè)置在100~500之間,隱藏層神經(jīng)元的數(shù)量范圍設(shè)置在50~300之間,學(xué)習(xí)率更新的搜索范圍設(shè)置在0.001~0.01之間。經(jīng)過多組仿真試驗(yàn),可以發(fā)現(xiàn)LSTM神經(jīng)網(wǎng)絡(luò)在最大迭代次數(shù)設(shè)為228、隱藏層神經(jīng)元個數(shù)設(shè)為93、學(xué)習(xí)率設(shè)為0.01時,其組合模型的擬合效果最佳。SSA、ISSA在尋優(yōu)過程中的誤差變化曲線如圖5所示。
圖5 誤差變化曲線Fig.5 Error variation curve chart
由圖5可知:ISSA在迭代到341次后找到了最小均方根誤差,使得LSTM神經(jīng)網(wǎng)絡(luò)能夠更準(zhǔn)確地預(yù)測光伏發(fā)電功率。通過與SSA優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)誤差曲線對比,驗(yàn)證了ISSA在迭代速度和收斂精度方面的優(yōu)越性。
為了說明本文所提出的VMD-ISSA-LSTM組合模型的魯棒擬合性,分別使用LSTM神經(jīng)網(wǎng)絡(luò)模型、VMD-LSTM組合模型、VMD-SSA-LSTM組合模型和VMD-ISSA-LSTM組合模型對光伏特征序列數(shù)據(jù)進(jìn)行短期日前預(yù)測的比較。在模型對比實(shí)驗(yàn)過程中,這些組合模型的周期均設(shè)置為24 h,共采集48個數(shù)據(jù)預(yù)測點(diǎn)。光伏發(fā)電功率預(yù)測結(jié)果對比如圖6所示。
圖6 光伏發(fā)電功率組合模型預(yù)測對比Fig.6 Comparison of PV power combined model prediction
從圖6可以觀察到:VMD-ISSA-LSTM組合模型預(yù)測曲線的擬合程度明顯優(yōu)于其他模型的預(yù)測擬合曲線,這表明本文所提出的組合模型在預(yù)測性能效果上有著更好的表現(xiàn)。為了驗(yàn)證該組合模型的魯棒預(yù)測精度,通過比較多組模型預(yù)測結(jié)果與實(shí)際值之間的指標(biāo)差異,進(jìn)行組合模型的誤差檢驗(yàn)分析。其計(jì)算誤差結(jié)果見表2。
表2 不同模型預(yù)測誤差比較Tab.2 Prediction Results of Different Models
由表2可以看出:使用ISSA優(yōu)化后的LSTM神經(jīng)網(wǎng)絡(luò)在擬合效果上有著明顯提升。這說明這種網(wǎng)絡(luò)超參數(shù)優(yōu)化策略不僅可以減少人為經(jīng)驗(yàn)設(shè)定參數(shù)導(dǎo)致的理論誤差,還能很好地增強(qiáng)組合模型的擬合魯棒性。因此,這種組合優(yōu)化方法對于短期光伏發(fā)電功率的預(yù)測具有重要實(shí)踐意義。
針對光伏發(fā)電功率存在的隨機(jī)波動性,本文提出了基于VMD-ISSA-LSTM組合模型的光伏發(fā)電功率預(yù)測方法。在構(gòu)建組合模型時,充分考慮了模型設(shè)置的運(yùn)行超參數(shù),包括最大迭代次數(shù)、隱藏層神經(jīng)元個數(shù)和學(xué)習(xí)率。通過將ISSA找到的最優(yōu)超參數(shù)配置到LSTM神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中,可以構(gòu)建出更為精確的組合預(yù)測模型,從而更好地管理光伏發(fā)電系統(tǒng),這對于光伏機(jī)組大量并網(wǎng)工業(yè)園區(qū)的優(yōu)化調(diào)度有重要意義。主要研究成果如下:
a)利用VMD算法對5種采集的光伏時間序列特征進(jìn)行多層模態(tài)分解,得到各層不同的高維本征模態(tài)分量以及殘差項(xiàng)。
b)通過ISSA優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)超參數(shù),可以獲得調(diào)參后的組合優(yōu)化模型,從而避免了人為經(jīng)驗(yàn)選擇參數(shù)的系統(tǒng)誤差性。
c)使用VMD-ISSA-LSTM組合模型對多維光伏特征序列數(shù)據(jù)進(jìn)行預(yù)測,通過仿真對比,驗(yàn)證了該組合模型具有更強(qiáng)的擬合魯棒性。