趙博超,馬嘉駿,崔磊,欒文鵬*,朱靜
(1.天津大學(xué)電氣自動(dòng)化與信息工程學(xué)院智能電網(wǎng)教育部重點(diǎn)實(shí)驗(yàn)室,天津 300072;2.中國華能集團(tuán)有限公司華能江蘇綜合能源服務(wù)有限公司,江蘇 南京 210015)
太陽能光伏發(fā)電是一種清潔、可再生、無污染的新型能源,在多項(xiàng)利好政策落地和平價(jià)上網(wǎng)實(shí)現(xiàn)的扶持下,相關(guān)技術(shù)和產(chǎn)業(yè)在國內(nèi)發(fā)展迅猛。據(jù)報(bào)道,中國新增裝機(jī)量、分布式裝機(jī)量以及分布式占比均屢創(chuàng)新高。截至2021 年底,光伏新增裝機(jī)規(guī)模達(dá)到54.88 GW,同比增長13.9%。分布式裝機(jī)量約占全部新增裝機(jī)量的53.4%,達(dá)到29.28 GW[1]。無論是對于大型光伏發(fā)電企業(yè)還是部署了分布式光伏系統(tǒng)的用戶,如何兼顧發(fā)電安全和經(jīng)濟(jì)收益都是其關(guān)注的核心問題。光伏發(fā)電系統(tǒng)運(yùn)行狀態(tài)將直接影響其發(fā)電效率和能力,進(jìn)而影響系統(tǒng)安全性和經(jīng)濟(jì)效益。然而,考慮到環(huán)境和操作條件的復(fù)雜性以及光伏發(fā)電系統(tǒng)自身的特點(diǎn),硬件故障、組件老化、陰影遮蓋以及光伏板污染等異常情況時(shí)有發(fā)生[2],不僅會(huì)導(dǎo)致能源浪費(fèi),還會(huì)增加維護(hù)成本并影響發(fā)電效率和穩(wěn)定性。因此,光伏發(fā)電異常檢測是系統(tǒng)運(yùn)維決策制定中的重要環(huán)節(jié)[3]。
當(dāng)前光伏發(fā)電系統(tǒng)異常檢測方法主要分為兩類:一類是在光伏組件層面直接定位和檢測的方法,通常借助傳感器并結(jié)合圖像識(shí)別、紅外線、熱成像技術(shù)[4];另一類是數(shù)據(jù)分析方法,通過對光伏發(fā)電系統(tǒng)電氣數(shù)據(jù)及環(huán)境數(shù)據(jù)進(jìn)行建模與分析來檢測異常狀況[5]。后者可進(jìn)一步分為直接法和間接法[6]。直接法通過提取標(biāo)注數(shù)據(jù)中的異常特征來訓(xùn)練異常檢測模型[7]。間接法通過構(gòu)建光照強(qiáng)度、溫度等環(huán)境數(shù)據(jù)和光伏出力的關(guān)聯(lián)模型來預(yù)測光伏常態(tài)發(fā)電曲線,與真實(shí)數(shù)據(jù)對比后分析偏差來間接判斷異常[8]。由于直接法依賴數(shù)據(jù)標(biāo)注,因此其表現(xiàn)受實(shí)際場景中的不準(zhǔn)確標(biāo)注或不全面的故障類型影響較大。然而,光伏電站和戶用光伏系統(tǒng)往往缺乏大量故障標(biāo)注數(shù)據(jù),既制約了這類直接法應(yīng)用初期的性能,又需要額外成本輔助更新模型,推廣應(yīng)用價(jià)值有限。因此,本文采用間接法進(jìn)行研究。
間接法中的預(yù)測模型主要分為物理模型、統(tǒng)計(jì)模型和機(jī)器學(xué)習(xí)模型[9]這3 種。物理模型是一種建立在光伏發(fā)電物理原理上的數(shù)學(xué)模型,結(jié)合相關(guān)物理知識(shí)和經(jīng)驗(yàn)規(guī)律對數(shù)據(jù)進(jìn)行特征提取并完成數(shù)學(xué)建模。在文獻(xiàn)[10]中,制造商提供的光伏組件參數(shù)(短路電流、開路電壓、最大功率點(diǎn)電壓電流等)被用于光伏系統(tǒng)仿真建模,通過比對各種故障類型造成的功率損失模型和實(shí)時(shí)監(jiān)測功率數(shù)據(jù)記錄來判斷故障類型。雖然該方法僅需要功率信號(hào)作為輸入,但是其根據(jù)光伏組件數(shù)據(jù)精準(zhǔn)搭建的模型不具備普適性。基于概率理論和統(tǒng)計(jì)學(xué)分析的統(tǒng)計(jì)模型需要根據(jù)數(shù)據(jù)估計(jì)模型參數(shù),對不同變量進(jìn)行相關(guān)性建模,如在文獻(xiàn)[11-12]中,馬爾可夫鏈和自回歸模型分別被應(yīng)用于光伏發(fā)電異常檢測。文獻(xiàn)[13]構(gòu)建單二極管模型,利用加權(quán)移動(dòng)平均法結(jié)合歷史信息提高模型對光伏功率變化的敏感性,通過對比預(yù)測值與觀測值的累計(jì)偏差量及其預(yù)設(shè)閾值來判定異常。該方法還在線性模型中加入了有界干擾參數(shù),進(jìn)一步提升了異常點(diǎn)與干擾變量的區(qū)分能力,減少了干擾變量對檢測結(jié)果的影響,提高了效率和準(zhǔn)確率。
雖然以上基于統(tǒng)計(jì)模型的光伏發(fā)電異常檢測方案在特定數(shù)據(jù)集上表現(xiàn)較好,但是考慮到實(shí)際場景中光伏發(fā)電量、氣象條件、太陽輻射強(qiáng)度等環(huán)境因素間存在復(fù)雜的非線性關(guān)系,以及噪聲和測量誤差等干擾因素,預(yù)測和異常檢測精度可能會(huì)有明顯下降[14]。鑒于上述模型的局限性,機(jī)器學(xué)習(xí)方法被應(yīng)用于光伏發(fā)電異常檢測任務(wù)。在文獻(xiàn)[15]中,支持向量機(jī)被用于天氣狀態(tài)分類,據(jù)此構(gòu)建針對不同天氣狀態(tài)的光伏預(yù)測子模型,通過預(yù)測日發(fā)電量來實(shí)現(xiàn)光伏模組性能評估。文獻(xiàn)[16]將人工神經(jīng)網(wǎng)絡(luò)應(yīng)用于光伏系統(tǒng)故障建模,基于歷史發(fā)電數(shù)據(jù)、氣象數(shù)據(jù)和故障標(biāo)注來訓(xùn)練故障識(shí)別網(wǎng)絡(luò)。雖然上述方法均在實(shí)驗(yàn)中有效識(shí)別出了光伏發(fā)電異常情況,但是在天氣持續(xù)變化的實(shí)際場景中,對天氣狀態(tài)進(jìn)行有限分類建模制約了其性能。此外,常規(guī)光伏電站異常故障少有發(fā)生,獲取故障數(shù)據(jù)需要大量監(jiān)測資源和人力成本,方法實(shí)用性受限。
本文提出一種用于光伏發(fā)電異常檢測的改進(jìn)VMD-XGBoost-BiLSTM 組合模型,變分模態(tài)分解(VMD)將光伏發(fā)電量分解為多個(gè)模態(tài)分量(IMF),利用自適應(yīng)賦權(quán)、Attention 機(jī)制和改進(jìn)鯨魚優(yōu)化算法(IWOA)模型超參數(shù)優(yōu)化為每個(gè)IMF 訓(xùn)練組合模型。首先,為了提供盡可能準(zhǔn)確的正常運(yùn)行狀態(tài)建模數(shù)據(jù),在原始訓(xùn)練數(shù)據(jù)預(yù)處理中去除異常值。其次,通過對原始數(shù)據(jù)類型進(jìn)行相關(guān)性分析,篩選和融合特征,在保留特征關(guān)聯(lián)關(guān)系的同時(shí)排除冗余。隨后,利用VMD 分解時(shí)序信號(hào)至多個(gè)IMF,以提取光伏發(fā)電量信號(hào)的周期和非周期特征。該方法分析復(fù)雜光伏發(fā)電數(shù)據(jù)中的模態(tài)混疊情況,凸顯其周期趨勢特性和局部波動(dòng)特征,進(jìn)而利用預(yù)處理后的特征對每個(gè)IMF 分別訓(xùn)練神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)結(jié)構(gòu)由極端梯度提升(XGBoost)和雙向長短期記憶(BiLSTM)通過自適應(yīng)賦權(quán)方法組合而成,用來預(yù)測常態(tài)IMF并合成常態(tài)光伏發(fā)電量預(yù)測結(jié)果。在此基礎(chǔ)上,對鯨魚優(yōu)化算法(WOA)進(jìn)行改進(jìn),將其應(yīng)用于模型超參數(shù)自適應(yīng)選擇過程。
準(zhǔn)確的訓(xùn)練數(shù)據(jù)對于精準(zhǔn)擬合光伏發(fā)電量模型至關(guān)重要,然而在實(shí)際采集數(shù)據(jù)的過程中,會(huì)存在由傳感器故障、數(shù)據(jù)傳輸錯(cuò)誤以及自然因素等原因?qū)е碌臄?shù)據(jù)異常。這些離群值會(huì)導(dǎo)致模型過度適應(yīng)偏斜明顯的數(shù)據(jù)樣本,從而影響模型泛化能力。圖1所示為4 類典型的原始數(shù)據(jù)。
圖1 原始數(shù)據(jù)示例Fig.1 Original data example
圖1 中除風(fēng)速外的3 種數(shù)據(jù)中均存在異常值,如達(dá)到上千攝氏度的環(huán)境溫度、光伏出力平均功率的離群點(diǎn)以及大于360°的風(fēng)向角度。而風(fēng)速最大值25 m/s 相當(dāng)于10 級大風(fēng),不屬于異常值。運(yùn)用基于統(tǒng)計(jì)分析方法對除風(fēng)向外的特征異常值進(jìn)行檢測,首先計(jì)算各類原始數(shù)據(jù)的標(biāo)準(zhǔn)化得分(z-sscore),根據(jù)3σ原則,若則該數(shù)據(jù)采樣點(diǎn)為異常值。對于風(fēng)向,則將異常數(shù)據(jù)判斷的閾值設(shè)置為360°。為了維持?jǐn)?shù)據(jù)的完整性和周期性,本文用最鄰近數(shù)值來替代異常值。
針對任意2 個(gè)特征向量,相關(guān)性分析可以用來衡量其關(guān)聯(lián)密切程度。本文采用皮爾遜相關(guān)系數(shù),定義如式(1)所示:
其中:x和y是2 個(gè)特征向量和分別是x和y的平均值;n是數(shù)據(jù)個(gè)數(shù)。因此,rxy?[ -1,1]表示x和y間的相關(guān)程度,rxy=1 表明x和y完全正相關(guān),rxy=-1表明x和y完全負(fù)相關(guān),rxy=0 表明x和y無線性相關(guān)關(guān)系。
圖2 所示為多種數(shù)據(jù)間的關(guān)聯(lián)性。對于發(fā)電量而言,光照強(qiáng)度和電流的相關(guān)性較強(qiáng),時(shí)間、平均功率、板溫、風(fēng)速和風(fēng)向的影響有限,而環(huán)境溫度、轉(zhuǎn)換效率和電壓則影響甚微。雖然光伏發(fā)電量會(huì)因氣象原因出現(xiàn)隨機(jī)波動(dòng),但是其在一個(gè)自然日內(nèi)通常對最大發(fā)電量時(shí)刻呈現(xiàn)中心對稱趨勢,這種現(xiàn)象在天氣晴朗無云時(shí)可被觀測到,如圖3 所示(僅保留發(fā)電時(shí)段數(shù)據(jù))。
圖2 關(guān)聯(lián)矩陣Fig.2 Correlation matrix
圖3 晴朗無云時(shí)光伏發(fā)電量示例Fig.3 Example of photovoltaic generation for sunny days
本文定義如下新特征:
1)F1(峰值距離),用來表示當(dāng)前時(shí)刻在一個(gè)自然日內(nèi)的相對位置。
2)F2(峰值電量),表示峰值點(diǎn)的發(fā)電量大小。
3)F3(區(qū)間平均功率),表示采樣點(diǎn)到峰值區(qū)間內(nèi)平均功率的距離,用來反映采樣點(diǎn)和峰值點(diǎn)的相對強(qiáng)度和位置。
4)F4(區(qū)間標(biāo)準(zhǔn)差),用來反映峰值區(qū)間內(nèi)功率的穩(wěn)定程度。
上述新特征有助于更全面地理解和分析光伏發(fā)電數(shù)據(jù)。針對圖2 中與發(fā)電量關(guān)聯(lián)性較弱的數(shù)據(jù)類型,如轉(zhuǎn)換效率是光伏板輸出和輸入功率比值,構(gòu)建F5(光照強(qiáng)度×轉(zhuǎn)換效率),用以表征對發(fā)電量的影響。其次,由于光伏板和環(huán)境的溫差與發(fā)電量相關(guān)性較強(qiáng),因此其也被引入作為新特征F6。圖4 所示為篩選后的特征相關(guān)性。從圖4 可以看出,新構(gòu)建特征與發(fā)電量之間呈現(xiàn)出較為明顯的相關(guān)性,證明其可有效提高特征的表達(dá)能力。利用新特征可以更好地描述原始數(shù)據(jù)的關(guān)聯(lián)關(guān)系,從而提高數(shù)據(jù)分析和建模的精度。
圖4 特征改進(jìn)后的關(guān)聯(lián)矩陣Fig.4 Correlation matrix with improved features
對于非晴朗天氣狀態(tài),光伏發(fā)電量時(shí)序信號(hào)f(t)可看作是整體趨勢與局部波動(dòng)的疊加。從整體趨勢上看,f(t)具有以日為單位的周期性,而環(huán)境、氣象因素可能會(huì)導(dǎo)致明顯的局部波動(dòng)。信號(hào)分解常被用于促進(jìn)信號(hào)特征提取,如經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)[17]、局部均值分解[18]、小波包分解[19]等。由于EMD 中包含信號(hào)極值遞歸檢測和基于極值插值的包絡(luò)估計(jì),其分解結(jié)果易受極值檢測方法、插值方法以及施加的停止準(zhǔn)則的影響,導(dǎo)致魯棒性較低[20]。而小波包分解計(jì)算復(fù)雜度較高且對噪聲敏感,局部均值分解中存在包絡(luò)平滑迭代誤差,且結(jié)果易受步長選擇的影響。
不同于上述基于遞歸篩選的信號(hào)分解方法,非遞歸的VMD 方法在面對弱線性光伏發(fā)電量時(shí)間序列時(shí)可有效克服端點(diǎn)效應(yīng)和模態(tài)混疊,其魯棒性和自適應(yīng)性更優(yōu)[21]。利用VMD 分解f(t)可以得到本征分量(IMF)[22],凸顯其波動(dòng)性、周期性、趨勢性等特征。VMD 通過迭代求解變分優(yōu)化問題獲得每個(gè)IMF 的頻率和帶寬,從而實(shí)現(xiàn)對原始信號(hào)自適應(yīng)分解和降噪的效果[23]。VMD 分解方法目標(biāo)函數(shù)如式(2)所示:
其中:μk(t)表示第k個(gè)模態(tài)分量在t時(shí)刻的樣本;ωk表示第k個(gè)模態(tài)分量在t時(shí)刻的中心頻率;?t表示對時(shí)刻t求微分;δ(t)表示單位沖擊函數(shù)為L2 范數(shù)。對于每個(gè)模態(tài)對應(yīng)的帶寬約束問題,引入增廣拉格朗日函數(shù)將其轉(zhuǎn)換成無約束問題,求解方法如式(3)所示:
其中:L(·)表示增廣拉格朗日函數(shù);λ(t)表示拉格朗日乘法算子;α表示二次懲罰因子為內(nèi)積。各模態(tài)分量μk及其對應(yīng)的中心頻率ωk通過交替方向乘子法進(jìn)行更新,求解方法如式(4)、式(5)所示:
通過以上計(jì)算,原始光伏發(fā)電量時(shí)間序列f(t)被分解為不同的分量μk(t),并得到各分量對應(yīng)的中心頻率ωk。通過對各分量中心頻率的大小進(jìn)行分析進(jìn)而選擇合適的分量數(shù)量,避免模態(tài)欠分解或模態(tài)過分解問題。
如圖5 所示,長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)被用來解決長序列訓(xùn)練中出現(xiàn)的梯度消失和梯度爆炸問題[24]。LSTM 包含遺忘門、輸入門和輸出門3 個(gè)門控單元,計(jì)算如式(6)所示:
圖5 LSTM 結(jié)構(gòu)示意圖Fig.5 Schematic diagram of LSTM structure
其中:ft、it、ht分別表示遺忘門、輸入門和輸出門的輸出;Wf、Wi、Wo分別代表對應(yīng)的權(quán)值系數(shù);bf、bi、bo分別代表對應(yīng)的偏置常數(shù);σ表示將輸出限制在[0,1]范圍內(nèi)的Sigmoid 激活函數(shù);tanh 激活函數(shù)可以將輸出限制在[-1,1]范圍內(nèi)。
通過輸出門的輸出ht得到LSTM 的光伏發(fā)電量預(yù)測結(jié)果,計(jì)算如式(7)所示:
其中:st是用來表示長期記憶信息的細(xì)胞狀態(tài);yt為預(yù)測結(jié)果的輸出;Wd為輸出層的權(quán)值系數(shù);bd為對應(yīng)的偏置常數(shù)。
BiLSTM 神經(jīng)網(wǎng)絡(luò)在LSTM 的基礎(chǔ)上通過新增反向隱藏層實(shí)現(xiàn)輸入序列在網(wǎng)絡(luò)中的反向傳播,使得輸出同時(shí)考慮上下文信息,從而提高了網(wǎng)絡(luò)的泛化和表達(dá)能力[25]。由于時(shí)間序列預(yù)測任務(wù)中的上下文往往都攜帶了有用信息,因此BiLSTM 的表現(xiàn)往往優(yōu)于LSTM。圖6 所示為BiLSTM 的基本結(jié)構(gòu)。
圖6 BiLSTM 結(jié)構(gòu)示意圖Fig.6 Schematic diagram of BiLSTM structure
BiLSTM 的總輸出為前向LSTM 和后向LSTM輸出之和,表達(dá)式如式(8)所示:
XGBoost 是一種基于梯度提升決策樹的機(jī)器學(xué)習(xí)方法,通過組合迭代訓(xùn)練構(gòu)建的多個(gè)決策樹模型以實(shí)現(xiàn)預(yù)測功能[26]。在迭代過程中,XGBoost 會(huì)根據(jù)前一次迭代結(jié)果來調(diào)整新建樹節(jié)點(diǎn)的位置,使當(dāng)前模型損失函數(shù)最小化。以第t棵決策樹為例,XGBoost 表達(dá)式如式(9)所示:
其中:Tk和ω分別表示第k棵樹的葉節(jié)點(diǎn)數(shù)量和得分;t表示樹的數(shù)量;γ和λ均為比例因子參數(shù),分別用來控制葉節(jié)點(diǎn)的個(gè)數(shù)和分?jǐn)?shù)。在目標(biāo)函數(shù)OObj中,為正則項(xiàng)為誤差項(xiàng)。
迭代后目標(biāo)函數(shù)得到更新,計(jì)算如式(11)所示:
為了簡化目標(biāo)函數(shù)的計(jì)算,對目標(biāo)函數(shù)進(jìn)行泰勒展開,計(jì)算如式(12)所示:
其中:gi和hi分別為損失函數(shù)的一階和二階導(dǎo)數(shù)。式(12)可以進(jìn)一步化簡為:
此時(shí)目標(biāo)函數(shù)可以看作一個(gè)關(guān)于葉節(jié)點(diǎn)的函數(shù),對ω求導(dǎo)可得最優(yōu)解,將其代入式(11)中可得:
根據(jù)目標(biāo)函數(shù)不斷生成新的較優(yōu)的樹,從而降低模型的偏差。將所有樹的結(jié)果累加起來得到最終的光伏常態(tài)發(fā)電量預(yù)測結(jié)果。
Attention 機(jī)制模仿了人類視覺在信息加工中的作用,在模型中引入權(quán)重向量,用來衡量輸入的不同部分的重要性,通過動(dòng)態(tài)調(diào)整輸入特征權(quán)重來改變不同特征對輸出的影響[27],使得模型可以選擇性地關(guān)注輸入信息,更好地捕捉關(guān)鍵信息。Attention 機(jī)制結(jié)構(gòu)如圖7 所示。由于環(huán)境因素復(fù)雜且對光伏發(fā)電量影響較大,因此Attention 機(jī)制可引導(dǎo)模型關(guān)注光照強(qiáng)度等重要信息。
圖7 Attention 機(jī)制結(jié)構(gòu)Fig.7 Attention mechanism structure
WOA 是一種模擬鯨魚狩獵行為的優(yōu)化算法[28],分為包圍獵物、泡網(wǎng)攻擊和搜索獵物3 個(gè)步驟。攻擊和搜索階段的最佳定位分別如式(16)、式(17)所示:
其中:t為迭代次數(shù);X(t+1)為第t+1 次迭代時(shí)的位置;X*(t)為當(dāng)前最佳位置矢量;A和D為系數(shù)矢量;D'為鯨魚與獵物之間的距離;l?[ -1,1]、p?[0,1]均為隨機(jī)數(shù);b為常數(shù);Xrand為隨機(jī)生成的位置矩陣。WOA 存在局限性,隨迭代線性下降的a會(huì)拖慢收斂速度[29],在全局搜索時(shí)對迭代過程中鯨魚位置更新的能力差異欠考慮會(huì)導(dǎo)致次優(yōu)解。
本文通過以下步驟對WOA 進(jìn)行改進(jìn):
步驟1調(diào)整收斂因子。
由于a被用于調(diào)整全局搜索能力和局部尋優(yōu)能力,為了提升效率和精度,結(jié)合搜索早期的粗略搜索策略和搜索后期的搜索范圍限定,對a進(jìn)行調(diào)整,如式(18)所示:
其中:t為迭代次數(shù);Tmax為最大迭代次數(shù);a為IWOA收斂因子;a'為WOA 收斂因子。
步驟2引入動(dòng)態(tài)慣性權(quán)重因子。
受粒子群算法中慣性權(quán)重方法的啟發(fā),引入自適應(yīng)權(quán)重因子,以提高搜索效率和準(zhǔn)確性[30]。調(diào)整后如式(19)、式(20)所示:
其中:i為當(dāng)前迭代次數(shù)。
本文通過組合VMD、XGBoost 和BiLSTM 構(gòu)建光伏發(fā)電異常檢測模型。針對光伏發(fā)電量VMD 得到的IMF 和特征提取結(jié)果,利用XGBoost 迭代優(yōu)化生成的決策樹系列來預(yù)測常態(tài)光伏發(fā)電量,將該結(jié)果作為輸入特征并與其他特征一起訓(xùn)練考慮Attention 機(jī)制的 BiLSTM(BiLSTM-AT)網(wǎng) 絡(luò)。BiLSTM 不僅緩解了訓(xùn)練過程中的梯度消失或梯度爆炸問題,還充分考慮了雙向信息,進(jìn)而提高了網(wǎng)絡(luò)的泛化和表達(dá)能力。為了進(jìn)一步提升算法性能,Attention 機(jī)制通過對輸入特征進(jìn)行差異化賦權(quán),幫助捕捉重要特征,其預(yù)測結(jié)果與先前XGBoost 的結(jié)果加權(quán)求和以生成最終的預(yù)測結(jié)果。本文使用基于殘差的自適應(yīng)賦權(quán),其中權(quán)重計(jì)算公式如式(21)所示:
其中:ωi,t為i模型在t時(shí)刻的權(quán)重;ei,t為i模型的預(yù)測殘差;n為模型總數(shù);m為采樣點(diǎn)總數(shù)。通過目標(biāo)函數(shù)可以得到各模型在t采樣點(diǎn)處的最優(yōu)權(quán)值,為了達(dá)成異常檢測任務(wù)目標(biāo),通過對樣本最優(yōu)權(quán)值的計(jì)算推算預(yù)測點(diǎn)處的最優(yōu)權(quán)值,推算過程如式(22)所示:
BiLSTM 和XGBoost 在多個(gè)領(lǐng)域的非線性數(shù)據(jù)處理任務(wù)中均表現(xiàn)優(yōu)異,且神經(jīng)網(wǎng)絡(luò)模型和樹模型的內(nèi)涵保證了其結(jié)果的差異性,因此,本文提出的模型組合方式有利于提升異常檢測結(jié)果的準(zhǔn)確性。此外,光伏發(fā)電量的隨機(jī)性和波動(dòng)性會(huì)導(dǎo)致模型預(yù)測結(jié)果不穩(wěn)定,使用基于殘差的自適應(yīng)賦權(quán)方法來代替固定權(quán)重,可進(jìn)一步增強(qiáng)組合模型的魯棒性。由于訓(xùn)練結(jié)果對模型超參數(shù)的選擇較敏感,因此本文采用易于實(shí)現(xiàn)且收斂性和穩(wěn)定性較好的IWOA 分別對BiLSTM-AT 模型和XGBoost 模型進(jìn)行超參數(shù)優(yōu)化,其流程如圖8 所示。
圖8 IWOA 優(yōu)化流程Fig.8 IWOA optimization procedure
最后,通過對比預(yù)測結(jié)果與實(shí)際測量值,本文提出基于動(dòng)態(tài)閾值的異常判斷規(guī)則,避免了由低光照強(qiáng)度導(dǎo)致低發(fā)電量從而造成的誤判。異常判斷規(guī)則具體為:將每個(gè)采樣點(diǎn)的閾值設(shè)定為前1 h 內(nèi)真實(shí)光伏發(fā)電量均值乘以系數(shù)0.2,若連續(xù)2 個(gè)采樣點(diǎn)的發(fā)電量均超過該閾值,則判斷為存在異常。需要注意的是,每日光伏系統(tǒng)開始發(fā)電的第1 個(gè)小時(shí)出力較少,不進(jìn)行異常判斷?;诟倪M(jìn)VMD-XGBoost-BiLSTM 組合模型的光伏發(fā)電量異常檢測方法完整流程如圖9 所示。
圖9 基于改進(jìn)VMD-XGBoost-BiLSTM 組合模型的光伏發(fā)電量異常檢測方法流程Fig.9 Procedure of photovoltaic anomaly detection method based on improved VMD-XGBoost-BiLSTM combination model
本文實(shí)驗(yàn)數(shù)據(jù)均采集自南京市某樓宇屋頂光伏發(fā)電系統(tǒng),采樣間隔為5 min。數(shù)據(jù)由電力監(jiān)測傳感器采集的電氣數(shù)據(jù)和環(huán)境監(jiān)測傳感器采集的環(huán)境數(shù)據(jù)組成,電氣數(shù)據(jù)包括發(fā)電量、平均功率、電壓、電流和轉(zhuǎn)換效率,環(huán)境數(shù)據(jù)包括光照強(qiáng)度、板溫、環(huán)境溫度、風(fēng)向和風(fēng)速。利用2022 年3 月1 日—6 月10 日采集的數(shù)據(jù)構(gòu)建光伏發(fā)電異常檢測模型,其中前80%數(shù)據(jù)用于模型訓(xùn)練,后20%數(shù)據(jù)用于驗(yàn)證。需要注意的是,光伏發(fā)電系統(tǒng)于2022 年2 月完成調(diào)試,3 月份正式投運(yùn)和維護(hù),因此,用于訓(xùn)練和驗(yàn)證的數(shù)據(jù)代表的是正常運(yùn)行狀態(tài)。而2023 年3 月1 日—3 月31 日的數(shù)據(jù)被用于測試??紤]到光伏發(fā)電量在日落時(shí)段趨近于0,為了提升算法處理效率,實(shí)驗(yàn)數(shù)據(jù)僅保留高于閾值0.04 kW·h 的部分。表1 所示為實(shí)驗(yàn)參數(shù)設(shè)置。
表1 實(shí)驗(yàn)參數(shù)設(shè)置Table 1 Experimental parameter settings
本文利用均方根誤差(RMSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)衡量光伏發(fā)電異常檢測模型的性能。評估指標(biāo)計(jì)算公式如式(23)所示:
其中:Xtrue,i和Xmodel,i分別為真實(shí)值和模型預(yù)測值;n為訓(xùn)練集總?cè)萘俊?/p>
在對光伏發(fā)電量進(jìn)行VMD 前需確定待分解IMF 的數(shù)量K,避免因K選擇不當(dāng)導(dǎo)致的模態(tài)欠分解或由過度分解產(chǎn)生的無用分量。實(shí)驗(yàn)中設(shè)定K的初始值為3,通過觀察各IMF 的中心頻率在K逐步增大時(shí)的變化來確定最終K值。表2 所示為K不同取值時(shí)各模態(tài)的中心頻率。從表2 可以看出,當(dāng)K=6 時(shí),IMF2和IMF3的中心 頻率比值為2.69,當(dāng)K=7 時(shí),該比值降為1.59,即當(dāng)K=7 時(shí)IMF2和IMF3的中心頻率更為接近,更易出現(xiàn)模態(tài)混疊,因此,最優(yōu)K值應(yīng)設(shè)為6。VMD 結(jié)果如圖10 所示。
表2 模態(tài)中心頻率Table 2 Center frequencies of IMFs
圖10 VMD 結(jié)果Fig.10 VMD results
從圖10 可以看出,IMF1變化較為緩慢,反映了光伏發(fā)電量的長期趨勢,而IMF2反映了以日為單位的周期性規(guī)律,IMF1和IMF2代表了光伏發(fā)電量的總體趨勢。IMF3~I(xiàn)MF6的幅值區(qū)間大致相同,其中IMF3的幅值波動(dòng)略大并且有明顯周期性,因此判斷其受到了強(qiáng)相關(guān)性特征的影響。IMF6的高波動(dòng)頻率和弱規(guī)律性可能由弱相關(guān)性特征影響導(dǎo)致。VMD從模態(tài)混疊的光伏發(fā)電量原始信號(hào)中分解出了全局趨勢特征與局部震蕩特征,有利于后續(xù)異常判斷。
為驗(yàn)證所提方法各網(wǎng)絡(luò)組成部分和改進(jìn)模塊的有效性,對多個(gè)模型的光伏常態(tài)發(fā)電量預(yù)測結(jié)果進(jìn)行對比,模型描述如表3 所示,對比結(jié)果如表4 所示,最優(yōu)結(jié)果加粗標(biāo)注。
表3 對比模型描述Table 3 Description of comparative models
表4 實(shí)驗(yàn)結(jié)果對比Table 4 Experimental results comparison
從表4 可以看出,單一XGBoos(t#5)的實(shí)驗(yàn)結(jié)果略優(yōu)于單一BiLSTM(#4),而引入VMD 后,VMDBiLSTM(#6)略優(yōu)于VMD-XGBoos(t#7)。因此,可推斷BiLSTM 在該異常檢測任務(wù)中更易受到特征混疊的影響。VMD 分別將BiLSTM 和XGBoost 的預(yù)測精度約提升31.47%和22.67%,證明其能有效分離混疊特征,進(jìn)而提升特征質(zhì)量。VMD-XGBoost-BiLSTM 組合模型的誤差相對單一XGBoost 和單一BiLSTM 分別約降低20.74%和27.30%,驗(yàn)證了利用組合模型的差異性可有效增強(qiáng)其檢測性能。此外,該對比實(shí)驗(yàn)還評估了所提網(wǎng)絡(luò)模型優(yōu)化改進(jìn)方法。在組合模型賦權(quán)自適應(yīng)化的基礎(chǔ)上,Attention 機(jī)制和基于IWOA 的模型超參數(shù)優(yōu)化分別將平均誤差指標(biāo)降低約5.53%和10.73%,驗(yàn)證了所提自適應(yīng)賦權(quán)方法、Attention 機(jī)制和IWOA 模型超參數(shù)優(yōu)化方法的有效性。
為了更直觀地展示光伏發(fā)電量預(yù)測結(jié)果,對單一模型無VMD 時(shí)表現(xiàn)最優(yōu)的XGBoost、單一模型有VMD 時(shí)表現(xiàn)最優(yōu)的VMD-BiLSTM、VMD-XGBoost-BiLSTM 以及本文所提改進(jìn)VMD-XGBoost-BiLSTM模型在3 種典型天氣下的表現(xiàn)進(jìn)行對比,結(jié)果如圖11 所示。從圖11 可以看出:晴天時(shí)光伏發(fā)電量波動(dòng)較小且趨勢明顯,4 種模型均表現(xiàn)較好,所提模型略勝一籌;陰天時(shí)光伏發(fā)電量存在一定波動(dòng),VMDXGBoost-BiLSTM 和VMD-BiLSTM 仍有不錯(cuò)的表現(xiàn),這得益于VMD 對局部波動(dòng)特征的分解提高了擬合精度,但是仍有個(gè)別采樣點(diǎn)未能準(zhǔn)確地預(yù)測到光伏發(fā)電量的波動(dòng)。此外,XGBoost 模型結(jié)果中存在周期性震蕩,可能會(huì)導(dǎo)致誤判;在發(fā)電量波動(dòng)較為劇烈的多云天氣下,所提模型和組合模型仍表現(xiàn)穩(wěn)定,在浮云飄過導(dǎo)致光伏發(fā)電量突然下降時(shí),所提模型相較于組合模型能更早地做出反應(yīng),而其他2 種對比模型精度均明顯下降。綜上,相較于對比模型,所提模型在光伏常態(tài)發(fā)電量預(yù)測任務(wù)中展現(xiàn)出更好的氣象環(huán)境普適性。
圖11 不同天氣下的對比結(jié)果Fig.11 Comparison results under different weather conditions
為了驗(yàn)證所提方法的異常檢測性能,在從測試數(shù)據(jù)集中得到的實(shí)驗(yàn)結(jié)果中截取部分包含異常情況的典型片段,異常檢測結(jié)果如圖12 所示。從圖12 可以看出,本文所提方法不僅能準(zhǔn)確預(yù)測光伏常態(tài)發(fā)電量曲線,還可結(jié)合偏差量對比和判斷規(guī)則識(shí)別出異常數(shù)據(jù),實(shí)現(xiàn)光伏發(fā)電異常檢測。在光伏系統(tǒng)正常運(yùn)行時(shí),本文所設(shè)計(jì)的規(guī)則有效地避免了誤判,而在線路損壞時(shí)也能夠及時(shí)識(shí)別異常。圖12(c)中可見光伏組件積塵會(huì)導(dǎo)致出力達(dá)不到常態(tài)水平,在高光照強(qiáng)度時(shí),所提方法準(zhǔn)確檢測出了這一異常類型,而在低光照強(qiáng)度時(shí),所提方法未識(shí)別出異常,證明其可以有效降低因天氣變化造成的誤判概率。
圖12 異常檢測結(jié)果Fig.12 Anomaly detection results
本文提出一種基于電氣數(shù)據(jù)和氣象數(shù)據(jù)的光伏發(fā)電異常檢測方法。利用異常值去除和相關(guān)性分析對特征進(jìn)行篩選和融合,采用改進(jìn)VMD-XGBoost-BiLSTM 組合模型,結(jié)合自適應(yīng)賦權(quán)、Attention 機(jī)制和IWOA 模型超參數(shù)優(yōu)化方法,預(yù)測光伏常態(tài)發(fā)電量曲線,最后通過分析偏差情況實(shí)現(xiàn)異常判斷。在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該方法不僅可以準(zhǔn)確預(yù)測光伏常態(tài)發(fā)電量曲線,在異常檢測任務(wù)中也具有有效性和對不同氣象環(huán)境的普適性。VMD 使得單一模型的誤差指標(biāo)平均約降低27.07%,組合模型相較單一模型取得了超過20%的平均誤差下降幅度,而引入Attention 機(jī)制和IWOA 則分別取得了約5.53%和10.73%的平均誤差下降幅度。下一步將對所提方法在多種數(shù)據(jù)采樣頻率下的魯棒性進(jìn)行研究,同時(shí)探索可以辨識(shí)異常類型的檢測方法。