歐陽衛(wèi)年,趙紫昱,陳淵睿
(1.廣東電網(wǎng)有限責(zé)任公司佛山供電局,佛山 528010;2.華南理工大學(xué)電力學(xué)院,廣州 510640)
近年來各國亟待實(shí)現(xiàn)能源轉(zhuǎn)型,高效利用太陽能、風(fēng)能等可再生清潔能源成為解決能源危機(jī)問題的共識(shí)。“雙碳”目標(biāo)下,我國光伏發(fā)電已進(jìn)入規(guī)?;l(fā)展平價(jià)上網(wǎng)階段,成為分布式能源的主要組成部分,電網(wǎng)滲透率快速增長,發(fā)展前景廣闊[1-2]。但光伏出力受天氣影響較大,具有間歇性和波動(dòng)性,且經(jīng)由電力電子裝置接入電網(wǎng),高比例光伏會(huì)對(duì)配電網(wǎng)的安全穩(wěn)定運(yùn)行帶來一定沖擊,導(dǎo)致功率倒送[3]、電壓越限[4]以及帶來“棄光”等問題。為了確保發(fā)電供應(yīng)滿足電力需求并保證電力質(zhì)量,電網(wǎng)依賴對(duì)系統(tǒng)負(fù)荷和光伏發(fā)電的預(yù)測,因此,精準(zhǔn)的光伏發(fā)電功率預(yù)測可以為容量規(guī)劃和運(yùn)行管理提供依據(jù),提高光伏電站的運(yùn)行效率,對(duì)于系統(tǒng)的規(guī)劃、運(yùn)行和調(diào)度有著重要意義。
傳統(tǒng)光伏發(fā)電預(yù)測一般站在電站的角度,基于物理特性和環(huán)境因素均可觀測的條件進(jìn)行預(yù)測,即先建立模擬光伏機(jī)組發(fā)電的物理模型,輸入物理參數(shù)進(jìn)行預(yù)測,物理量包括太陽輻照度、溫度、光伏機(jī)組有效面積、轉(zhuǎn)化效率等[5],這種方式不需要?dú)v史發(fā)電功率數(shù)據(jù)就可以建立模型,但存在一些缺陷,如:難以考慮所有物理影響因素,預(yù)測公式本身存在模型誤差,用戶設(shè)備物理參數(shù)不一,以及在運(yùn)行過程中光伏機(jī)組老化導(dǎo)致自身參數(shù)變化等[6],都會(huì)導(dǎo)致系統(tǒng)誤差增大。
但早期物理建模方法過程過于復(fù)雜,且參數(shù)獲取困難,因此已逐漸被當(dāng)前的統(tǒng)計(jì)學(xué)習(xí)模型[7-9]淘汰。建模方法包括時(shí)間序列分析、回歸分析等傳統(tǒng)預(yù)測方法,也包括支持向量機(jī)、馬爾可夫鏈、神經(jīng)網(wǎng)絡(luò)等智能算法。統(tǒng)計(jì)學(xué)習(xí)模型通過尋找數(shù)據(jù)之間的映射關(guān)系,構(gòu)建光伏發(fā)電出力預(yù)測模型。傳統(tǒng)預(yù)測模型存在預(yù)測速度慢、精度低和非線性擬合能力差等問題,而智能算法可以較好地規(guī)避此類問題。近年來,以數(shù)據(jù)驅(qū)動(dòng)為核心的人工智能技術(shù)快速發(fā)展,被廣泛應(yīng)用于光伏發(fā)電預(yù)測研究領(lǐng)域。文獻(xiàn)[10]以數(shù)值天氣預(yù)報(bào)NWP(numerical weather prediction)數(shù)據(jù)為輸入,建立功率自組織映射神經(jīng)網(wǎng)絡(luò)模型;文獻(xiàn)[11]基于支持向量機(jī)建立天氣狀態(tài)模式識(shí)別的方法,對(duì)不同天氣狀態(tài)的光伏發(fā)電功率進(jìn)行神經(jīng)網(wǎng)絡(luò)預(yù)測;文獻(xiàn)[12]提出一種基于長短記憶神經(jīng)網(wǎng)絡(luò)優(yōu)化的短期光伏發(fā)電預(yù)測方法;文獻(xiàn)[13]采用時(shí)空?qǐng)D網(wǎng)絡(luò)模型進(jìn)行光伏功率預(yù)測。此外,也有文獻(xiàn)采用先對(duì)序列進(jìn)行分解提取特征再進(jìn)行預(yù)測的方式[14]。
但實(shí)際情況下,大部分光伏電站通常僅記錄用于傳統(tǒng)物理模型的輻照度數(shù)據(jù)[15],未記錄譬如溫度、濕度、風(fēng)速等歷史氣象信息,無法使用基于氣象信息的預(yù)測方法,缺少相關(guān)數(shù)據(jù)時(shí)將會(huì)對(duì)模型訓(xùn)練提出新的挑戰(zhàn)。因此,在數(shù)據(jù)匱乏的情況下,實(shí)現(xiàn)準(zhǔn)確預(yù)報(bào)的難度較大,如何在無NWP數(shù)據(jù)輸入下,建立起預(yù)測模型是電網(wǎng)側(cè)光伏功率預(yù)測的難點(diǎn)[16]。針對(duì)以上問題,部分文獻(xiàn)選擇處理數(shù)據(jù)樣本來解決,文獻(xiàn)[17]將基于相似日的方法引入光伏陣列輸出功率模型構(gòu)建,文獻(xiàn)[18]基于晴朗系數(shù)和多層次匹配來進(jìn)行光伏功率預(yù)測。
對(duì)此,本文基于無NWP 數(shù)據(jù)研究光伏功率預(yù)測,采用光伏電站實(shí)測輻照度和功率數(shù)據(jù),基于輻照度特征指標(biāo)分離出3類主要天氣,再根據(jù)功率驟降事件檢測進(jìn)行自樣本特征構(gòu)造,獲取細(xì)粒度的狀態(tài)標(biāo)簽。進(jìn)一步采用一維1D(one dimensional)卷積神經(jīng)網(wǎng)絡(luò)CNN(convolutional neural network)結(jié)合雙向長短期記憶BiLSTM(bidirectional long short-term memory)神經(jīng)網(wǎng)絡(luò)建立光伏功率預(yù)測模型。實(shí)驗(yàn)結(jié)果表明,本文所提方法充分挖掘了模型在不同天氣狀態(tài)下光伏機(jī)組出力預(yù)測的準(zhǔn)確性和適應(yīng)性,在有限數(shù)據(jù)下有效提升了光伏電網(wǎng)側(cè)預(yù)測準(zhǔn)確率和配電網(wǎng)自動(dòng)化系統(tǒng)對(duì)光伏機(jī)組的監(jiān)控能力,提供了數(shù)據(jù)分析支撐,對(duì)現(xiàn)有技術(shù)難以準(zhǔn)確估算目標(biāo)配電網(wǎng)區(qū)域光伏發(fā)電用戶的實(shí)時(shí)發(fā)電場景提供了較好的適應(yīng)能力和可靠性。
在實(shí)際工程中,光伏系統(tǒng)的輸出功率往往以物理模型進(jìn)行表示[5],即輸入物理量參數(shù)直接根據(jù)模型得到光伏出力,是間接預(yù)測常采用的方式,表示為
式中:ηPV為光伏陣列的轉(zhuǎn)換效率;S為光伏陣列的總面積;Ir為光伏陣列接收到的太陽輻照度;Tc為光伏組件的溫度。
太陽輻射照度是指太陽輻射經(jīng)過大氣層的吸收、散射、反射等作用后,到達(dá)地球表面上單位面積單位時(shí)間內(nèi)的輻射能量,而光伏發(fā)電通過太陽能電池板將輻射能量轉(zhuǎn)化為電能。研究[5,9-10]表明,目前硅晶片光伏發(fā)電單元的發(fā)電功率主要與太陽輻射照度、光伏單元參數(shù)及其表面溫度等因素相關(guān),其中光伏單元參數(shù)包括光伏組件轉(zhuǎn)化效率、面板傾角等,在無故障運(yùn)行下對(duì)于光伏功率預(yù)測問題的研究影響較小,可以忽略不計(jì)[10];而太陽輻照度是決定光伏功率的主要因素,由式(1)可知,物理模型中太陽輻照度與光伏功率呈線性關(guān)系。
某光伏電站實(shí)測數(shù)據(jù)的太陽輻照度-功率實(shí)測曲線如圖1 所示,圖中包含兩條曲線,即功率曲線和輻照度曲線。由圖1 可見,實(shí)際情況中,輻照度和功率之間的波動(dòng)并非完全一致,光伏電站會(huì)進(jìn)一步放大輻照度的波動(dòng)性,引起功率波動(dòng)。因此,除太陽輻照度外的因素也需要進(jìn)一步考慮。
圖1 光伏電站輻照度-功率曲線Fig.1 Irradiance-power curve of PV station
除直接影響因素之外,還有諸多間接的影響因素,比如天氣類型、云層遮擋等,但這類氣象狀態(tài)的描述具有模糊性,比較難以量化[19]。
不同天氣類型下的光伏機(jī)組發(fā)電功率的波動(dòng)性不同,例如:晴天情況下光伏機(jī)組發(fā)電比較穩(wěn)定,太陽輻照度與發(fā)電功率的相關(guān)性較好,而陰雨天情況下,地表的太陽輻照度衰弱嚴(yán)重且波動(dòng)性較大,導(dǎo)致其相關(guān)性較差。晴天、多云和陰雨天這3種主要類型天氣狀況下,太陽輻照度與光伏機(jī)組發(fā)電功率的皮爾遜相關(guān)性分析結(jié)果如圖2所示。
圖2 不同天氣下光伏輻照度-功率的皮爾遜相關(guān)性分析Fig.2 Analysis of Pearson correlation between PV irradiance and power under different weather conditions
由圖2 可見:不同天氣的太陽輻照度與光伏功率的相關(guān)性有著一定差異,皮爾遜相關(guān)系數(shù)R在晴天時(shí)高達(dá)0.912,而多云和陰雨天的情況下分別為0.881 和0.841;相關(guān)性依次降低,表明天氣類型區(qū)別于太陽輻照度可以影響光伏機(jī)組發(fā)電功率的大?。桓鶕?jù)輻照度-功率點(diǎn)的分布情況可以看到,陰雨天的整體功率明顯小于晴天和多云的功率,其輻照度-功率點(diǎn)主要分布在圖像左下方,而晴天和多云主要分布在圖像中間和右上方。
光伏發(fā)電出力與太陽輻照度相關(guān)性極大,光伏發(fā)電出力曲線具有明顯的周期性[11]。但由上述分析可知,在不同天氣類型下,太陽輻照度與光伏出力并非呈完美的線性關(guān)系,天氣好壞還會(huì)影響兩者的波動(dòng)性,在多云與陰雨天的情況下尤其明顯。若不加處理直接將數(shù)據(jù)輸入模型訓(xùn)練,必然會(huì)導(dǎo)致模型難以處理不同天氣下的特征波動(dòng),因此對(duì)實(shí)時(shí)天氣進(jìn)行分類,將有助于模型的訓(xùn)練。文獻(xiàn)[18]提出采用晴朗系數(shù)天氣進(jìn)行劃分,而本文參考晴朗系數(shù)的概念對(duì)太陽輻照度進(jìn)一步分析,提出輻照度均值和波動(dòng)兩種指標(biāo)針對(duì)不同天氣類型數(shù)據(jù)的分類。
1.4.1 輻照度均值
輻照度均值定義為一天內(nèi)各個(gè)時(shí)刻輻照度的平均值,它可以很好地區(qū)分晴天和陰雨天的天氣類型,晴天的輻照度均值明顯高于陰雨天的輻照度均值。輻照度均值的計(jì)算公式為
式中:Ir(i)為在t時(shí)刻的太陽輻照度;n為一天內(nèi)總時(shí)刻點(diǎn)數(shù),此處取n=96,即時(shí)間間隔為15 min。
1.4.2 輻照度平均波動(dòng)
輻照度平均波動(dòng)定義為一天內(nèi)各個(gè)相鄰時(shí)刻輻照度差值絕對(duì)值的平均值與該天內(nèi)最大輻照度的比值,描述了其變化的程度。由圖1 可見,一般多云天氣的輻照度平均波動(dòng)比較大,以輻照度平均波動(dòng)進(jìn)行區(qū)分比較合適。輻照度平均波動(dòng)可計(jì)算為
輻照度均值指標(biāo)可以反映日內(nèi)的整體輻照強(qiáng)度,而輻照度平均波動(dòng)指標(biāo)可以反映日內(nèi)的波動(dòng)情況,兩者從側(cè)面反映出實(shí)際的天氣情況。
1.4.3 基于K-means 聚類的天氣標(biāo)簽分類
不同天氣狀態(tài)下,輻照度的整體幅值和波動(dòng)都存在差異,因而導(dǎo)致光伏出力隨之存在不同的表現(xiàn),給模型訓(xùn)練帶來一定影響。天氣預(yù)報(bào)中的天氣分類多,且難以反映真實(shí)的輻照度水平和波動(dòng)。
因此,本文采用K-means 聚類的方法,基于第1.4.1節(jié)和第1.4.2節(jié)中提出的輻照度均值Ir,ave和輻照度平均波動(dòng)ΔIr兩個(gè)指標(biāo),對(duì)數(shù)據(jù)進(jìn)行聚類分析,重新定義自適應(yīng)天氣標(biāo)簽,如圖3所示。
圖3 基于輻照度指標(biāo)的K-means 聚類Fig.3 K-means clustering based on irradiance index
基于K-means 聚類分析的結(jié)果,對(duì)天氣類型這類離散特征采用獨(dú)熱編碼來處理,根據(jù)云層運(yùn)動(dòng)對(duì)光伏出力的影響,依次建立天氣分類的標(biāo)簽:陰雨天為(0,1),多云為(1,0),晴天為(1,1)。
由于天氣類型較多,且具有區(qū)域特殊性,因此本文根據(jù)實(shí)際情況采取簡化處理,將天氣分為代表性的常見類型:晴天、多云和陰雨天,不考慮天氣突變?nèi)缜甾D(zhuǎn)雨、雨轉(zhuǎn)多云等情況。
根據(jù)上述分析,對(duì)陰雨天、多云和晴天分別定義為數(shù)值1、2 和3,假設(shè)標(biāo)簽類型與真實(shí)天氣之間的1-范數(shù)距離為d?;谏鲜鲋笜?biāo),分類與實(shí)際天氣情況的對(duì)比如表1所示。
表1 實(shí)際天氣與標(biāo)簽類型距離分析Tab.1 Analysis of distance between actual weather and tag type
由表1 可知,大部分標(biāo)簽類型與實(shí)際天氣完全一致,即距離d為0,而另一小部分距離d為1 和2,因此,大部分天氣類型的定義基本符合實(shí)際情況,但一天內(nèi)實(shí)際天氣有可能出現(xiàn)天氣類型變化的情況以及光伏電站區(qū)域天氣與天氣預(yù)報(bào)類型不一致的情況,需要進(jìn)一步定義。
根據(jù)實(shí)際的輻照度-功率曲線分析,可以近似認(rèn)為云層遮擋和移動(dòng)造成了輻照度和功率的波動(dòng),而實(shí)際的天氣類型對(duì)功率的影響其實(shí)與云層遮擋和移動(dòng)關(guān)系很大,因此引入事件滑動(dòng)窗[20]來定義日內(nèi)實(shí)時(shí)狀態(tài),進(jìn)行自樣本特征的重構(gòu)。圖4為光伏發(fā)電功率驟降的事件檢測。
圖4 基于光伏發(fā)電功率驟降的事件檢測Fig.4 Event detection based on PV power slump
由圖4 可以看到,框內(nèi)有兩次光伏發(fā)電功率的驟降,推測為云層的遮擋導(dǎo)致功率的波動(dòng),因此從功率角度進(jìn)行分析。若功率出現(xiàn)驟降,則將其定義為云層遮擋事件,判定準(zhǔn)則為
式中:Pt為t時(shí)刻的功率;ΔPt,(1,1)和ΔPt,(1,0)分別為t時(shí)刻晴天和多云天氣下的功率一階差分量,即當(dāng)前時(shí)刻與前一時(shí)刻的功率差值;λ1和λ2分別為跳變閾值,可根據(jù)額定功率和實(shí)際功率波動(dòng)設(shè)置,本文取值分別為-600 kW和-400 kW。當(dāng)出現(xiàn)云層遮擋事件時(shí),狀態(tài)標(biāo)簽進(jìn)行自適應(yīng)更新,即(1,1)變化為(1,0)、(1,0)變化為(0,1),而在輻照度為0 時(shí),狀態(tài)標(biāo)簽為(0,0)。
基于光伏發(fā)電功率驟降的事件檢測本質(zhì)上是一項(xiàng)特征工程,是對(duì)天氣標(biāo)簽的進(jìn)一步解釋,以解決其語義模糊性問題,比如,在晴天出現(xiàn)功率驟降時(shí),傳統(tǒng)的天氣標(biāo)簽不會(huì)發(fā)生改變,而基于事件檢測后可使得天氣標(biāo)簽更接近其真實(shí)狀態(tài)。
隨著人工智能技術(shù)的發(fā)展,循環(huán)神經(jīng)網(wǎng)絡(luò)RNN(recurrent neural network)被提出來,用于解決序列問題。RNN 改善了BPNN 不擅長處理時(shí)間序列的缺點(diǎn),但在長時(shí)間序列的學(xué)習(xí)時(shí),其隱含層的簡單結(jié)構(gòu)使得誤差反向傳播的過程中產(chǎn)生“梯度消失”或“梯度爆炸”的問題,導(dǎo)致RNN 網(wǎng)絡(luò)極難收斂,無法訓(xùn)練出理想模型。LSTM神經(jīng)網(wǎng)絡(luò)基于此問題進(jìn)行改進(jìn),引入了遺忘門、更新門和輸出門結(jié)構(gòu)來改進(jìn)RNN 的長期依賴問題,減少了長時(shí)間歷史信息的丟失。LSTM模型的單元結(jié)構(gòu)如圖5所示。
圖5 LSTM 模型的單元結(jié)構(gòu)Fig.5 Unit structure of LSTM model
LSTM 內(nèi)部的遺忘門、輸入門和輸出門的表達(dá)式分別為
式中:xt為當(dāng)前t時(shí)刻的輸入;ht和ht-1為當(dāng)前t時(shí)刻和上一t-1 時(shí)刻的輸出;ft、it和ot分別為遺忘門、輸入門和輸出門的輸出;ct、ct-1和為細(xì)胞當(dāng)前時(shí)刻、上一時(shí)刻和中間狀態(tài)的輸出;Wf、Wi、Wo和Wc分別為遺忘門、輸入門和輸出門的權(quán)重矩陣和記憶分量權(quán)重矩陣;Uf、Ui、Uo和Uc分別為遺忘門、輸入門和輸出門與上一時(shí)刻的耦合矩陣和記憶分量耦合矩陣;bf、bi、bo和bc分別為遺忘門、輸入門、輸出門的偏置和記憶分量的偏置;tanh和σ為激活函數(shù)。
單向的LSTM 網(wǎng)絡(luò)的狀態(tài)傳輸為單向傳遞,具有遺忘性,容易丟失重要的時(shí)序特征信息。而BiLSTM 神經(jīng)網(wǎng)絡(luò)不改變LSTM 單元內(nèi)部結(jié)構(gòu),而是通過兩個(gè)獨(dú)立的LSTM對(duì)輸入數(shù)據(jù)以正序和逆序的方式進(jìn)行訓(xùn)練。兩層LSTM網(wǎng)絡(luò)共同進(jìn)行輸出,使t時(shí)刻所獲得特征數(shù)據(jù)同時(shí)擁有過去和將來之間的信息,對(duì)于長時(shí)間序列有更好的記憶效果。
CNN在圖像處理上有巨大的優(yōu)勢,其提取特征的能力很強(qiáng),研究表明,1DCNN 在時(shí)間序列處理上有不錯(cuò)的表現(xiàn)[21],1DCNN特征處理結(jié)構(gòu)如圖6所示。
CNN主要由3部分構(gòu)成:卷積層、池化層和全連接層。卷積層對(duì)輸入數(shù)據(jù)進(jìn)行卷積運(yùn)算,提取出局部信息的特性來提高處理性能,將傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中的權(quán)重參數(shù)簡化為卷積層中卷積核的參數(shù),可降低計(jì)算量。池化層對(duì)于卷積層結(jié)果進(jìn)行數(shù)據(jù)壓縮,減小過擬合,更好地保留特征信息。池化后得到多維特征,進(jìn)行平鋪后可連接全連接層進(jìn)行映射。全連接層將通過卷積層和池化層訓(xùn)練得到的特征進(jìn)行網(wǎng)絡(luò)參數(shù)的映射,最后輸出訓(xùn)練模型的預(yù)測結(jié)果。
基于上述分析,本文采用1DCNN 進(jìn)行特征提取,將處理完的多維特征展開,接入BiLSTM網(wǎng)絡(luò),訓(xùn)練時(shí)間序列本身的時(shí)序性,最后以全連接層輸出。1DCNN-BiLSTM光伏出力預(yù)測模型如圖7所示。
圖7 1DCNN-BiLSTM 光伏出力預(yù)測模型Fig.7 1DCNN-BiLSTM PV output prediction model
模型訓(xùn)練流程如圖8 所示。輸入數(shù)據(jù)后,首先根據(jù)輻照度數(shù)據(jù)進(jìn)行天氣分類,再依據(jù)功率進(jìn)行驟降事件檢測,獲取細(xì)粒度的狀態(tài)標(biāo)簽。將自樣本構(gòu)造的狀態(tài)標(biāo)簽一同作為輸入后,進(jìn)行訓(xùn)練集和測試集的劃分,以及進(jìn)行數(shù)據(jù)清洗和歸一化等預(yù)處理操作,隨即設(shè)置模型參數(shù)進(jìn)行訓(xùn)練,在達(dá)到迭代次數(shù)后通過測試集驗(yàn)證輸出反歸一化后的結(jié)果。
圖8 1DCNN-BiLSTM 模型訓(xùn)練流程Fig.8 Flow chart of training of 1DCNN-BiLSTM model
2.3.1 模型特征選取及數(shù)據(jù)處理
選取歷史輻照度和歷史光伏功率數(shù)據(jù)及其天氣標(biāo)簽作為輸入數(shù)據(jù)進(jìn)行特征處理。由于原始數(shù)據(jù)往往會(huì)存在缺失值、異常值等情況,需要進(jìn)行數(shù)據(jù)清洗以及拆分為訓(xùn)練集和測試集等一系列數(shù)據(jù)預(yù)處理流程。本文以電網(wǎng)側(cè)光伏電站實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行分析,對(duì)其進(jìn)行數(shù)據(jù)清洗,針對(duì)其異常數(shù)據(jù)進(jìn)行處理。實(shí)際運(yùn)行中的異常數(shù)據(jù)主要為光伏出力在夜晚期間出現(xiàn)負(fù)值,考慮為表計(jì)測量誤差,對(duì)其歸零。實(shí)際數(shù)據(jù)中未出現(xiàn)缺失值,若出現(xiàn)缺失值則采用前后平均值插值進(jìn)行填充,以保證時(shí)間序列信息的連貫性。
2.3.2 數(shù)據(jù)歸一化與反歸一化
歸一化是重要的數(shù)據(jù)處理流程之一,由于數(shù)據(jù)類型和量綱不同,采用未歸一化數(shù)據(jù)直接進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練會(huì)產(chǎn)生梯度消失、難以收斂等問題,因此通常會(huì)進(jìn)行歸一化處理。歸一化公式為
式中:Xmax和Xmin分別為一列數(shù)據(jù)中的最大值和最小值;Xi和分別為未歸一化和歸一化后的數(shù)據(jù)。當(dāng)模型預(yù)測時(shí),需要根據(jù)式(6)對(duì)輸出值進(jìn)行反歸一化,使其還原至原來量級(jí)的Xi。
2.3.3 模型評(píng)價(jià)指標(biāo)
為驗(yàn)證本文所提方法的有效性,選擇均方根誤差百分比(ERMSE)、平均絕對(duì)誤差(EMAE)和平均絕對(duì)誤差百分比(EMAPE)作為時(shí)序序列預(yù)測模型的評(píng)價(jià)指標(biāo),其計(jì)算公式分別為
式中:n為測試集樣本總數(shù);Xr(i)和Xp(i)分別為i時(shí)刻的實(shí)際值和預(yù)測值;ERMSE為預(yù)測結(jié)果實(shí)際偏差的絕對(duì)值;EMAE為預(yù)測結(jié)果絕對(duì)偏差平均值;EMAPE為預(yù)測結(jié)果偏移百分比。上述指標(biāo)越小,模型預(yù)測效果越好。
但由于光伏機(jī)組只在輻照度較強(qiáng)的時(shí)候進(jìn)行發(fā)電,實(shí)際運(yùn)行過程中,日出前和日落后的時(shí)間段內(nèi)存在零值點(diǎn),直接采用式(9)進(jìn)行誤差計(jì)算將無法運(yùn)算。對(duì)此,本文通過式(6)對(duì)Xr(i)和Xp(i)進(jìn)行歸一化,對(duì)其結(jié)果加1,使其縮放至區(qū)間[1,2],以此處理EMAPE計(jì)算過程中零值作為分母的問題。
為驗(yàn)證本文所提方法的有效性,實(shí)驗(yàn)使用廣東省佛山市某光伏電站的實(shí)際運(yùn)行數(shù)據(jù),采用軟件MATLAB R2019b搭建1DCNN-BiLSTM神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行仿真。選取歷史數(shù)據(jù)為2022年4月—6月期間的運(yùn)行數(shù)據(jù),采樣間隔為15 min,有效記錄時(shí)間91 d。進(jìn)行K-means 聚類天氣劃分后,樣本劃分為25個(gè)陰雨天、35個(gè)多云日和31個(gè)晴天,再經(jīng)過事件檢測將天氣狀態(tài)標(biāo)簽細(xì)化到每一時(shí)刻。選取訓(xùn)練集與測試集比例分別為0.8 和0.2,對(duì)其結(jié)果取整,選擇前72 d為訓(xùn)練集,后19 d為測試集。
本文采用1DCNN-BiLSTM神經(jīng)網(wǎng)絡(luò)模型,其中輸入單元為4 列特征,輸出單元為1 列。選取歷史時(shí)刻的輻照度x1和功率x2以及離散實(shí)時(shí)天氣標(biāo)簽x3、x4作為網(wǎng)絡(luò)的輸入?yún)?shù),輸出y為預(yù)測點(diǎn)功率。
訓(xùn)練參數(shù)的選取上,最大迭代次數(shù)設(shè)置為100次,訓(xùn)練算法設(shè)置為adam,初始學(xué)習(xí)率設(shè)置為0.001,每20 次迭代后乘以因子0.05 來降低學(xué)習(xí)率。在1DCNN卷積層中卷積核個(gè)數(shù)為100個(gè),滑動(dòng)窗口大小為3,滑動(dòng)步長為1。池化層滑動(dòng)窗口為3,滑動(dòng)步長為2。為了避免出現(xiàn)過擬合,模型加入dropout 層設(shè)置為0.2 的概率,使得其神經(jīng)元停止工作,增強(qiáng)模型泛化性。
選擇CNN、LSTM 算法作為所提方法1DCNNBiLSTM的對(duì)比,其中隱藏層節(jié)點(diǎn)數(shù)、迭代次數(shù)等網(wǎng)絡(luò)參數(shù)與所提算法的一致,則某一天的預(yù)測結(jié)果如圖9所示,有、無狀態(tài)標(biāo)簽的預(yù)測結(jié)果如圖10所示。
圖9 光伏預(yù)測結(jié)果Fig.9 PV prediction results
圖10 有無狀態(tài)標(biāo)簽預(yù)測結(jié)果Fig.10 Prediction results with or without status tag
由圖9 可見,LSTM 由于其記憶性,剛開始出力時(shí)會(huì)存在很高的殘差值,而CNN和1DCNN-BiLSTM的跟隨性上均優(yōu)于LSTM。由圖10 可見,帶有預(yù)測標(biāo)簽的模型能更好地跟蹤和分析前面時(shí)刻的波動(dòng),在模型表現(xiàn)和誤差上效果更優(yōu)。
以測試集中某一天的具體時(shí)刻出力預(yù)測為例,結(jié)果如表2所示。由表2 可知,CNN和1DCNN-BiLSTM由于卷積神經(jīng)網(wǎng)絡(luò)的特征提取,可以更快地感知前一段時(shí)間的低出力特征,而LSTM 更容易擬合歷史的趨勢,在起始值時(shí)刻的預(yù)測值偏高。CNN在低出力值時(shí)擁有更好的表現(xiàn),而在高出力值時(shí)刻,1DCNN-BiLSTM 預(yù)測效果更佳。不同算法預(yù)測模型整體的誤差分析結(jié)果如表3所示。
表2 具體時(shí)刻出力預(yù)測結(jié)果Tab.2 Output prediction results at specific time points
表3 光伏出力預(yù)測結(jié)果誤差分析Tab.3 Error analysis of PV output prediction results
由表3 可知,本文所提方法1DCNN-BiLSTM 的誤差指標(biāo)均優(yōu)于CNN 和LSTM 的,ERMSE、EMAE和EMAPE分別為222.43 kW,109.18 kW 和3.62%,各項(xiàng)指標(biāo)均有較好的提升。并且在加入了狀態(tài)標(biāo)簽后,各個(gè)模型的效果均有較大的提升,驗(yàn)證了所提方法在樣本特征較少時(shí)的有效性,即在僅有輻照度和功率數(shù)據(jù)而無外接NWP數(shù)據(jù)的情況下的模型表現(xiàn)較佳。
電網(wǎng)側(cè)通常難以獲取用于光伏預(yù)測所需的NWP 數(shù)據(jù),僅有光伏站點(diǎn)自測的輻照度和功率數(shù)據(jù),導(dǎo)致在光伏預(yù)測中輸入特征過少,模型訓(xùn)練效果不佳等問題。本文針對(duì)上述問題,提出了一種自樣本特征構(gòu)造的1DCNN-BiLSTM 光伏發(fā)電出力預(yù)測方法,主要結(jié)論如下。
(1)通過輻照度均值和輻照度平均波動(dòng)指標(biāo)將天氣聚類并標(biāo)簽化為晴天、多云和陰雨天3 類,通過功率驟減事件檢測獲取細(xì)粒度的狀態(tài)標(biāo)簽,進(jìn)行自樣本特征構(gòu)造?;诠β鼠E降事件檢測的特征工程為模型提供了更充分的特征,有效提升模型的穩(wěn)定性。引入功率驟降事件檢測后,CNN、BiLSTM和本文所提方法的預(yù)測平均絕對(duì)誤差百分比分別提升了0.21%、0.25%和0.34%。
(2)針對(duì)單一模型的不足,采用CNN與BiLSTM網(wǎng)絡(luò)相結(jié)合的方式,更適合學(xué)習(xí)光伏功率序列的空間和時(shí)間上的特征。所提方法較LSTM 和CNN 單一模型的平均絕對(duì)誤差百分比分別提升1.87%和0.59%。
(3)本文方法優(yōu)點(diǎn)在于,只需要輻照度和光伏功率出力數(shù)據(jù)進(jìn)行預(yù)測,降低了多特征數(shù)據(jù)存在的數(shù)據(jù)匱乏和數(shù)據(jù)穩(wěn)定性風(fēng)險(xiǎn),改善了預(yù)測模型的預(yù)測性能和魯棒性,在電網(wǎng)無法獲取相應(yīng)光伏電站的NWP 數(shù)據(jù)時(shí)提供一種提高預(yù)測精度的解決方案。但本文方法也存在局限性,受限于數(shù)據(jù)匱乏,僅考慮了輻照度和功率作為原始變量,不能充分考慮溫度、濕度等其他因素的影響。此外,對(duì)功率驟降事件閾值的設(shè)定,本文采用的是經(jīng)驗(yàn)參數(shù),實(shí)際生產(chǎn)中可根據(jù)統(tǒng)計(jì)規(guī)律決定。