武小梅, 張 琦, 田明正
(廣東工業(yè)大學 自動化學院,廣東 廣州 510006)
基于VMD-SE和優(yōu)化支持向量機的光伏預測方法
武小梅, 張 琦, 田明正
(廣東工業(yè)大學 自動化學院,廣東 廣州 510006)
針對光伏電站短期功率預測準確性的問題,提出了一種基于VMD-SE與改進的灰狼優(yōu)化(Grey Wolf Optimization, GWO)算法優(yōu)化支持向量機回歸(Support Vector Regression,SVR)的組合預測方法。由于不同天氣類型的光伏功率輸出相差較大,因而利用相似日選取相同天氣類型下的數據進行預測;考慮到光伏功率輸出隨機波動性較強,采用變分模態(tài)分解對原始光伏功率序列進行分解,以減少數據的非平穩(wěn)性;為了克服支持向量回歸參數盲目選取的弊端,利用改進的灰狼優(yōu)化算法對其參數進行優(yōu)化,以進一步提高數據的預測精度;最后,將分解后的子序列經樣本熵重組后相加求和得到最終預測結果。算例結果表明,該組合預測方法整體上預測誤差最小,有效提高了光伏輸出功率預測的準確性,可以更好地保障電力系統(tǒng)的可靠運行。
光伏功率預測; 變分模態(tài)分解; 差分進化; 灰狼優(yōu)化; 支持向量回歸; 組合預測
隨著化石能源如煤、石油和天然氣等越來越匱乏,太陽能作為豐富的、清潔的和可再生的能源,已成為綠色能源開發(fā)和利用的前景之一。因此,為了提高光伏系統(tǒng)的實時控制性能和減小可能產生的負面影響,光伏輸出功率的準確預測是非常必要的[1]。
目前,光伏功率預測已提出了人工神經網絡、馬爾可夫鏈和機器學習[2-5]等諸多單一預測方法。但考慮到光伏功率受環(huán)境影響而呈現較大的不確定性,采用單一預測方法進行光伏功率預測將存在極大的誤差,因此,組合預測模型得到了廣泛的應用。文獻[6]利用各單一模型的優(yōu)勢,根據某種權重關系篩選出最佳的權重系數,從而建立權重組合模型。文獻[7]采用粒子群算法(Particle Swarm Optimization,PSO)優(yōu)化BP神經網絡的權值和閾值,但粒子群算法存在易陷入局部最優(yōu)和后期收斂速度慢的缺點。文獻[8]利用經驗模態(tài)分解(Empirical Mode Decomposition,EMD) 的信號分解技術,通過將原始數據信號分解為不同尺度下的固有模態(tài)分量和剩余分量,并對各分量分別采用人工智能優(yōu)化算法進行預測。但EMD分解的時間序列存在分模態(tài)混疊現象及端點效應。
因此,本文提出了一種新型的非遞歸、自適應分解技術—VMD分解,首先,將原始光伏數據序列通過VMD分解成有限帶寬的子序列;為降低預測模型的復雜度,采用樣本熵重組將各子序列重組分為趨勢分量、細節(jié)分量以及隨機分量;然后對各分量分別建立優(yōu)化支持向量機回歸的光伏功率預測模型。又考慮到支持向量機參數選取問題,利用具有良好全局搜索能力的改進的灰狼優(yōu)化算法對支持向量機的學習參數進行優(yōu)化,從而進一步提高預測模型的精度。最后,通過某光伏電站數據驗證了該組合預測方法的有效性。
1.1VMD分解
變分模態(tài)分解(Variational Mode Decomposition,VMD)是一種新型多分辨率的信號分解技術,其整體求解過程即為變分問題的構造與求解。通過將光伏功率序列信號f分解為一系列具有中心頻率ωk的有限帶寬的子模態(tài)信號uk(t),k=1,2,…,K為模態(tài)數量。其中,子信號uk的帶寬具體構造步驟如下[9]:
(1)根據Hilbert變換,計算得到每一子模態(tài)uk相應的解析信號,從而求取其單側頻譜。
(2)通過對各模態(tài)解析信號對應的中心頻率ωk的指數項e-jωkt混疊,將子模態(tài)信號uk的頻譜變換至基頻帶。
(3)對上述解調信號梯度的平方L2范數進行計算,從而估計出子模態(tài)信號uk的帶寬,其中帶約束條件的變分問題為:
(1)
式中:{uk}={u1,u2,…,uk}、{ωk}={ω1,ω2,…,ωk};δ(t)為狄拉克分布。
此外,變分問題的求解為:
(1)將式(1)帶約束的變分問題通過二次懲罰因子α和拉格朗日乘子λ的引入轉化為非約束的變分問題,可表示如下:
(2)
式中:α用于在高斯噪聲存在時保證信號的重構精度;λ保持約束條件的嚴謹性。
(3)對uk和ωk求解迭代的解為:
(3)
(4)
1.2樣本熵
樣本熵(Sample Entropy)是由Richman和Moornan[11]提出的一種新的度量時間序列復雜性的方法,是針對近似熵的改進算法,其目的在于降低近似熵的誤差,與已知的隨機部分有更加緊密的一致性。相比近似熵,樣本熵具有不依賴于數據長度,是條件概率的負平均自然對數的精確值;并且樣本熵具有更好的一致性特點,樣本熵的值越大,序列越復雜,反之,表明序列的自相似程度越高。
1.3DE-GWO優(yōu)化SVR
1.3.1 SVR原理
支持向量機(Support Vector Machines, SVM) 是于1955年由 Vapnik[12]等人提出的一種智能學習算法,具有較好的非線性處理能力和推廣能力,尤其對高維數據處理時,能有效解決 “維數災”問題。將SVM用于光伏功率預測的非線性回歸預測問題,即可得到支持向量機回歸SVR,SVR回歸預測原理如下。
假設光伏功率預測樣本數據為(xi,yi),xi∈Rn,yi∈R,(i=1,2,...,l),SVR的主要思想是利用非線性映射φ:Rn→Rm(m≥n)將原始數據映射到高維特征空間,然后根據方程f(x)=[ω·φ(x)]+b在該空間中線性回歸。
(5)
(6)
然后,根據Mercer原理,引入核函數K(xi,x)=φ(xi)·φ(x),求解式(6)以得到決策回歸函數為:
(7)
1.3.2 SVR參數優(yōu)化
由于大量結果[13-14]表明核函數的選擇對回歸預測的準確率影響較小,而參數選擇影響較大且采用核函數進行預測時,懲罰參數c和核參數γ對算法的表現起主導作用,當c值太大而γ值太小(0.1~1)時會使訓練集出現過學習現象;當c值太小(0.1~10)而γ的值太大(100~10 000)時會使訓練集出現欠學習現象。因此,本文采用DE-GWO算法優(yōu)化SVR參數。
1.3.3 DE-GWO算法
灰狼優(yōu)化(Grey Wolf Optimization, GWO)算法[15]是由Mirjalili等于2014年提出的一種新興元啟發(fā)式優(yōu)化算法。它通過模仿灰狼群體跟蹤、包圍、追捕、攻擊獵物等捕食行為實現優(yōu)化的過程。相比其他進化算法,灰狼算法通過對比得到各灰狼社會等級并控制搜索方向,具有較高的優(yōu)化效率、結構簡單、參數設置少。由于篇幅原因,其算法的具體步驟及算法描述詳見文獻[16]。
由于GWO算法處理在高維優(yōu)化問題時存在后期收斂速度慢、易陷入局部最優(yōu)等問題。因而本文利用DE算法[17-18]優(yōu)化GWO,將DE加入GWO中以更新灰狼當前最優(yōu)位置的種群決策層中的α、β和σ,從而使GWO跳出局部最優(yōu)。其算法具體步驟如下[19]:
Step1:定義DE-GWO相關參數。包括種群數目n,最大迭代次數τmax,決策變量Var,縮放因子M,交叉概率Pc。
Step2:根據式(8)隨機初始化種群,其中X由SVR算法的學習參數C和γ構成:
(8)
Step3:計算個體適應度值,并以非遞減的順序對個體適應度進行重新排序,確定適應度值排列前三位的灰狼個體位置Xα、Xβ和Xσ作為決策層。
Step4:根據式(9)更新灰狼父代種群中個體的位置,然后根據式(10)、(11) 進行變異、交叉操作,產生新的子代種群。
X(t+1)=Xp(t)-AD
(9)
Vi(τ)=Xr1(τ)+M·(Xr2(τ)-Xr3(τ))
(10)
(11)
式中:A為收斂因子;D為灰狼個體與獵物間的距離;M縮放因子;r1≠r2≠r3≠i;τ=0,1,2,…,τmax為迭代次數;CR為交叉概率;jrand為1到d之間的隨機整數;d為個體數量的維數。
Step5:根據式(12)更新父代種群,再根據式(13)、(14)、(15)更新C、A和a。
(12)
C=2r2
(13)
A=2ar2-a
(14)
a(t)=2-2t/τmax
(15)
式中:k為種群數目;r2∈[0,1]間的隨機數;C為擺動因子;a隨迭代次數t增加而從2線性遞減到0。
Step6:更新父代Pα、Pβ和Pσ,再以非遞減順序對灰狼父代群體重新排序。判斷是否滿足算法終止條件,若滿足,則返回父代Pα和f(Pα),輸出當前最優(yōu)解C、γ。
Step7:根據最優(yōu)C、γ建立SVR預測模型。
其算法流程如圖1所示。
圖1 DE-GWO-SVR算法預測流程
影響光伏系統(tǒng)輸出功率的因素較多,如光伏輻照強度、環(huán)境溫度、風速、相對濕度等。實際工程中,光伏陣列輸出功率表示為[20]:
Ppv=ηIsA[1-0.005(Tk+25)]
(16)
式中:η為光伏陣列的轉化效率;Is為輻照強度,W/m2;A為陣列的總面積m2;Tk為大氣溫度,℃。
通常對某一特定的光伏電站,在進行短期功率預測時,其安裝角度、陣列面積及光伏陣列轉換效率為一常數,因此無需考慮。但日類型、輻照強度、溫度、風速等對光伏輸出功率均有一定的影響,因而本文通過對這些因素進行了研究。
2.1不同日類型的光伏輸出功率
考慮到不同日類型下的光伏輸出功率差異較大,因而應針對不同日類型分別進行預測。圖2為晴天、多云和雨天3種常見日類型下美國俄勒岡州的某光伏電站在2015年7~8月的光伏功率輸出。從圖2中可以看出,晴天的光伏輸出功率曲線最為平穩(wěn),且中午時分光伏輸出功率達到最大值為12 000 W左右;而多云、雨天的光伏功率曲線隨機性、波動性較大,這一情況不僅會影響光伏系統(tǒng)運行的可靠性,同時也會增加光伏預測的難度和預測誤差。因此,針對不同日類型數據進行預測是十分必要的。
2.2氣象要素對光伏輸出功率的影響
如考慮將所有影響光伏功率的氣象因子作為模型的輸入變量,將會增加預測模型的復雜度及預測誤差,因此本文選取光伏電站2015年4月~5月光伏輻照強度、環(huán)境溫度和風速歷史氣象數據與光伏輸出功率數據,利用Pearson秩相關系數法[21]進行分析,得到其秩相關系數結果如表1所示。
圖2 不同日類型的光伏輸出功率
由表1觀察到,輻照強度與光伏功率呈現強相關性,而溫度、風速與光伏功率呈現弱相關??紤]到這三者對光伏輸出功率均會產生一定的影響,因此,本文將這三個氣象因子的最大、最小和平均值作為DE-GWO-SVR模型的輸入變量。
表1 Pearson相關系數分析結果 p.u.
2.3相似日理論
根據2.2節(jié)的分析,選取輻照強度、環(huán)境溫度及風速作為影響光伏輸出功率的氣象因素。因此,可以設定每日特征向量為[22]:
(17)
采用歐氏距離dij描述第i天與第j天之間的各氣象總體差異度公式為:
(18)
式中:n為特征向量的個數;k為特征向量的序號。根據式(18)求解與待預測日相似度高(即歐氏距離小)的多天作為預測日的樣本集。
3.1數據處理
對光伏原始數據采用歸一化預處理,其歸一化的公式為:
(19)
3.2建模流程
基于VMD-SE和DE-GWO-SVR的光伏功率預測模型,首先將光伏所有歷史數據進行歸一化預處理,再通過相似日計算選取與待預測日的相似樣本。然后將所得相似樣本中的光伏功率序列進行VMD分解并通過樣本熵重組后形成隨機分量、趨勢分量和細節(jié)分量。其中,隨機分量體現了光伏功率的隨機波動性,因而SVR采用高斯徑向基RBF核函數;趨勢分量是光伏功率的主要構成分量,其曲線變化緩慢,可采用線性函數作為SVR的核函數;而細節(jié)分量體現了原始數據的細節(jié)波動情況,可根據試驗選取RBF或Sigmoid函數作為核函數。最后,針對這三個分量分別建立DE-GWO-SVR預測模型,并將各分量預測結果求和相加得到最終的預測值。該算法的預測流程如圖3所示。
4.1數據收集
以美國俄勒岡州的某光伏電站為研究對象,研究時段為2015年1月~2016年4月的06:00~18:00時間段,針對系統(tǒng)每5 min采集一次數據,本文選取1 h內每15 min的數據求平均值,總共49個點。將光伏數據經相似日理論分析后,根據不同日類型分別選取晴天數據樣本85天,多云數據樣本43天,雨天數據樣本30天。對所有數據集采用歸一化處理到[0,1]區(qū)間后,將75%的數據作為訓練集,剩余25%的作為測試樣本,建立提前1天的光伏輸出功率預測。
圖3 基于VMD-SE-DE-SVR組合預測算法流程
4.2VMD-SE分析
以4.1節(jié)多云天氣數據樣本為例,將前32天作為訓練集,后11天為測試集。對樣本訓練集和測試集的光伏輸出功率序列進行VMD分解。考慮到VMD分解需提前設定模態(tài)數K,模態(tài)數過多會出現過分解,而過少會出現欠分解。因此,取模態(tài)數K范圍為4~8,經過多次試驗,當K>5時,出現中心頻率相近的模態(tài),因而,取K=5。圖4為分解后的子序列。
圖4 多云天氣光伏功率序列的VMD分解
若對分解后的每一子序列分別建立SVR預測模型將會增加計算規(guī)模。為減小計算規(guī)模,利用SE熵值對每一子序列的復雜度進行分析,再根據熵值將各子序列重新組合。圖5為各序列熵值結果。
圖5 各子序列的樣本熵值
若取給定光伏序列樣本熵閾值ψ變化范圍為ψ=0.08,則根據樣本熵重組規(guī)則,將子序列樣本熵值大于給定光伏序列樣本熵值范圍內的序列構成隨機分量;反之,子序列樣本熵值小于給定光伏序列樣本熵值范圍內的序列構成趨勢分量;而處于給定光伏序列樣本熵值范圍內的序列構成細節(jié)分量。因此,從圖5可知,序列1為趨勢分量,序列2為細節(jié)分量,序列3、4、5為隨機分量。
4.3預測結果評價指標
采用歸一化絕對平均誤差eNMAE和歸一化均方根誤差eNRMSE作為誤差評價指標,具體公式為:
(20)
(21)
4.4仿真結果分析
為了驗證本文所述預測模型的效果,按4.2節(jié)分析,根據得到的各分量與預處理后的氣象數據形成預測樣本集,針對晴天、多云日和雨天類型下的樣本數據建立提前一天的SVR回歸預測模型。同時,提出了以下幾種模型進行比較分析:(1)基于VMD-SE和PSO-SVR、VMD-SE和DE-GWO-BP預測模型;(2)基于EMD-SE和DE-GWO-SVR預測模型;(3)基于VMD-SE-SVR預測模型。
為了公平起見,各預測模型的種群數目s均取20,最大迭代次數τmax為200,待優(yōu)化變量維數為2。DE-GWO算法中,交叉概率Pc為0.25,縮放因子最大、最小值分別為0.8和0.2。PSO算法中,慣性權重系數為0.85,學習因子c1=c2=2。針對晴天、多云、雨天日類型下各方法預測結果如圖6~8,預測誤差指標結果見表2。
圖6 不同算法下的晴天預測結果
圖7 不同算法下多云天氣預測結果
圖8 不同算法下雨天預測結果
從圖6、7、8和表2可知:
(1)晴天時,各預測方法的預測精度均很高,eNMAE%和eNRMSE%均在5%以下;多云和雨天時,由于光伏輸出功率具有較高的隨機性和不確定性,因而其預測精度相比晴天預測精度有所降低,但總體上本文所提方法預測效果最佳。
(2)在VMD-SE分析前提下,DE-GWO優(yōu)化SVR優(yōu)于PSO優(yōu)化SVR,說明DE-GWO優(yōu)化算法能夠更好地提高SVR的泛化能力和預測精度;而SVR模型與BP神經網絡模型相比,不僅驗證了SVR具有較強的泛化能力,而且也有效避免了BP固有的訓練結果不穩(wěn)定的缺陷。
(3)經VMD分解的預測模型相比EMD分解模型,其eNMAE%和eNRMSE%在陰天時均提高了2%左右,說明VMD分解能夠有效克服EMD分解存在的模態(tài)混疊現象,降低預測誤差。
(4)未經優(yōu)化的VMD-SE-SVR預測模型的eNMAE%和eNRMSE%明顯低于優(yōu)化后的預測模型,說明SVR的參數優(yōu)化是有必要。
表2 不同算法的預測指標結果
針對光伏輸出功率的間歇性、隨機性、波動性等特點,采用VMD分解技術對原始光伏功率序列進行分解,再將分解后的多個子序列進行樣本熵重構以降低預測模型的復雜度,并根據SVR模型的小樣本學習能力、學習速度快、泛化能力強的優(yōu)點,充分運用SVR解決非線性問題的優(yōu)勢,考慮不同的環(huán)境影響因素作為模型的輸入變量,對光伏功率進行回歸預測。由于PSO算法在SVR參數尋優(yōu)方面易陷入局部最優(yōu),導致算法收斂速度慢、預測精度較低,而本文提出的改進灰狼優(yōu)化算法是通過模擬狼群的狩獵行為的新型智能算法,相對粒子群算法、BP神經網絡算法等,更易跳出局部最優(yōu)從而獲得全局最優(yōu)。通過實例結果表明,該算法在整體上大大提高了預測的準確性和預測效率,可以更好地保障電力系統(tǒng)的可靠運行。
[1] LI Y, HE Y, SU Y, et al. Forecasting the daily power output of a grid-connected photovoltaic system based on multivariate adaptive regression splines[J]. Applied Energy, 2016, 180(8):392-401.
[2]婁寶磊. 灰色動態(tài)BP神經網絡在光伏短期出力預測中的應用[J]. 電氣技術, 2015, 16(12):47-51.
[3]丁明, 王磊, 畢銳. 基于改進BP神經網絡的光伏發(fā)電系統(tǒng)輸出功率短期預測模型[J]. 電力系統(tǒng)保護與控制, 2012, 40(11):93-99.
[4]丁明, 徐寧舟. 基于馬爾可夫鏈的光伏發(fā)電系統(tǒng)輸出功率短期預測方法[J]. 電網技術, 2011,35(1):152-157.
[5]高陽, 張碧玲, 毛京麗,等. 基于機器學習的自適應光伏超短期出力預測模型[J]. 電網技術, 2015, 39(2):307-311.
[6]楊錫運, 劉歡, 張彬,等. 基于熵權法的光伏輸出功率組合預測模型[J]. 太陽能學報, 2014, 35(5):744-749.
[7]張佳偉, 張自嘉. 基于PSO-BP神經網絡的短期光伏系統(tǒng)發(fā)電預測[J]. 可再生能源, 2012, 30(8):28-32.
[8]徐敏姣, 徐青山, 袁曉冬. 基于改進EMD及Elman算法的短期光伏功率預測研究[J]. 現代電力, 2016, 33(3):8-13.
[9]張亞超, 劉開培, 秦亮. 基于VMD-SE和機器學習算法的短期風電功率多層級綜合預測模型[J]. 電網技術, 2016, 40(5):1334-1340.
[10]DRAGOMIRETSKIY K, ZOSSO D. Variational mode decomposition[J]. IEEE Transactions on Signal Processing, 2014, 62(3):531-544.
[11]WIDODO A, SHIM M C, CAESARENDRA W, et al. Intelligent prognostics for battery health monitoring based on sample entropy[J]. Expert Systems with Applications, 2011, 38(9):11763-11769.
[12]YANG H T, HUANG C M, HUANG Y C, et al. A weather-based hybrid method for 1-day ahead hourly forecasting of PV power output[J]. IEEE Transactions on Sustainable Energy, 2014, 5(3):917-926.
[13]吳米佳, 盧錦玲. 基于改進粒子群算法與支持向量機的變壓器狀態(tài)評估[J]. 電力科學與工程, 2011, 27(3):27-31.
[14]BAMAKAN S M H, WANG H, RAVASAN A Z. Parameters optimization for nonparallel support vector machine by particle swarm optimization [J]. Procedia Computer Science, 2016, 91(7):482-491.
[15]龍文, 趙東泉, 徐松金. 求解約束優(yōu)化問題的改進灰狼優(yōu)化算法[J]. 計算機應用, 2015, 35(9):2590-2595.
[16]徐松金, 龍文. 嵌入遺傳算子的改進灰狼優(yōu)化算法[J]. 蘭州理工大學學報, 2016, 42(4):102-108.
[17]黃興, 楊琳琳, 韓濤,等. 含風電機組的電力系統(tǒng)動態(tài)經濟排放調度研究[J]. 電力科學與工程, 2014, 30(8):51-56.
[18]LUKE J, CHAKKARAVARTHY V, IRISAPPANE S, et al. Application of differential evolution algorithm in static and dynamic economic or emission dispatch problem: a review[J]. Renewable and Sustainable Energy Reviews, 2017,77(3):1206-1220.
[19]ZHU A, XU C, LI Z, et al. Hybridizing grey wolf optimization with differential evolution for global optimization and test scheduling for 3D stacked SoC[J]. Journal of Systems Engineering and Electronics, 2015, 26(2):317-328.
[20]王曉蘭, 葛鵬江. 基于相似日和徑向基函數神經網絡的光伏陣列輸出功率預測[J]. 電力自動化設備, 2013, 33(1):100-103.
[21]葉林, 陳政, 趙永寧,等. 基于遺傳算法-模糊徑向基神經網絡的光伏發(fā)電功率預測模型[J]. 電力系統(tǒng)自動化, 2015,39(16):16-22.
[22]張華彬, 楊明玉. 基于天氣類型聚類和LS-SVM的光伏出力預測[J]. 電力科學與工程, 2014, 30(10):42-47.
Photovoltaic Prediction Method Based on VMD-SE and Optimized Support Vector Machine
WU Xiaomei, ZHANG Qi, TIAN Mingzheng
(Faculty of Automation,Guangdong University of Technology,Guangzhou 510006,China)
Aiming at improving the short-term power prediction accuracy for photovoltaic station, a combination prediction method based on the VMD-SE and improved grey-wolf optimization algorithm to optimize the support vector regression is proposed in this paper. Due to the great difference of photovoltaic power output in different weathers, the data of the same weather are selected by selecting the similar days. Taking into account the strong random fluctuation of photovoltaic power output, the variational mode decomposition is used to decompose the original photovoltaic power sequence in order to reduce the non-stationary of the data. In order to overcome the disadvantage of blind selection of support vector regression parameters, the improved grey wolf optimization algorithm is applied to optimize the parameters to improve the prediction accuracy of the data. Finally, using sample entropy composed the subsequences and then summing them up, the final results are obtained. The results of a case shows that the combination forecasting method has the least overall prediction error, and it effectively improves the prediction accuracy for the PV output power, which can better guarantee the reliable operation of the power system.
photovoltaic power prediction; variational mode decomposition; differential evolution; grey wolf optimization; support vector regression; combination prediction
10.3969/j.ISSN.1672-0792.2017.09.005
TM615
A
1672-0792(2017)09-0029-08
2017-05-31。
中央財政支持地方高校發(fā)展專項資金項目(粵財教[2016]202號)。
武小梅(1972-),女,博士,副教授,主要研究方向為新能源發(fā)電、電力市場;張琦(1992-),女,碩士研究生,主要研究方向為新能源發(fā)電;田明正(1993-),男,碩士研究生,主要研究方向為電力市場。