李 麗,張振臣,劉國(guó)軍
(國(guó)網(wǎng)冀北電力有限公司灤南縣供電分公司,河北 唐山 063500)
當(dāng)前,我國(guó)電力供應(yīng)仍以煤炭發(fā)電為主,不利于節(jié)能環(huán)保。因此,國(guó)務(wù)院辦公廳發(fā)布的《節(jié)能發(fā)電調(diào)度辦法》提出節(jié)能發(fā)電調(diào)度理念,建議以清潔能源為主,保障電力供應(yīng)的環(huán)保性和穩(wěn)定性。電網(wǎng)公司應(yīng)用太陽(yáng)輻射能發(fā)電技術(shù),建立分布式光伏發(fā)電站。雖然分布式光伏發(fā)電站的裝機(jī)容量有了很大的提升,但是對(duì)光能的利用效率始終不理想。光伏發(fā)電具有一定的不確定性和隨機(jī)性,難以得到某一時(shí)刻的具體發(fā)電量。長(zhǎng)此以往,無(wú)法保證發(fā)電與功率之間的平衡,進(jìn)而影響電力系統(tǒng)的正常運(yùn)轉(zhuǎn)。為了保證電網(wǎng)的正常供電,對(duì)光伏發(fā)電功率進(jìn)行預(yù)測(cè)十分必要。
為了對(duì)分布式光伏發(fā)電功率展開精準(zhǔn)預(yù)測(cè),徐瀟源[1]等將自組織映射和寬度學(xué)習(xí)系統(tǒng)進(jìn)行整合,構(gòu)建了光伏發(fā)電功率超短期預(yù)測(cè)模型。該模型首先對(duì)光伏數(shù)據(jù)進(jìn)行24 h不間斷采集,并結(jié)合自組織映射對(duì)其進(jìn)行聚類,得到具體的出力波動(dòng)特征;然后利用寬度學(xué)習(xí)系統(tǒng)對(duì)光伏發(fā)電功率的步長(zhǎng)展開預(yù)測(cè),并增加節(jié)點(diǎn)數(shù)量,以完成預(yù)測(cè)。時(shí)珉[2]等將灰色關(guān)聯(lián)分析算法與基于多層注意力機(jī)制網(wǎng)絡(luò)的地理傳感器時(shí)間序列預(yù)測(cè)(multi-level attention networks for geo-sensory time series prediction,GeoMAN)模型整合,共同實(shí)現(xiàn)對(duì)光伏發(fā)電功率的短期預(yù)測(cè)。該模型首先對(duì)分布式光伏電站采用灰色關(guān)聯(lián)分析算法,完成各電站之間的空間相關(guān)性分析,在周圍電站中選擇與待預(yù)測(cè)光伏電站相關(guān)性最高的電站;然后通過(guò)GeoMAN模型實(shí)現(xiàn)預(yù)測(cè)光伏電站環(huán)境與氣候特征的動(dòng)態(tài)提取。GeoMAN模型由解碼器和編碼器2個(gè)部分構(gòu)成。解碼器用于獲取待預(yù)測(cè)光伏電站的自身特征以及與周圍電站之間的站間特征。編碼器主要用于提取氣象動(dòng)態(tài)指數(shù)。解碼器和編碼器共同作用,得到光伏發(fā)電功率預(yù)測(cè)結(jié)果。
上述2種方法并未對(duì)采集到的各項(xiàng)數(shù)據(jù)進(jìn)行預(yù)處理,使得最終的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果之間存在較大誤差。長(zhǎng)短時(shí)記憶(long short-term memory,LSTM)網(wǎng)絡(luò)是1種具有超強(qiáng)時(shí)序記憶能力的網(wǎng)絡(luò),近幾年在光伏發(fā)電功率預(yù)測(cè)領(lǐng)域卓有成效。基于此,在節(jié)能發(fā)電調(diào)度理念下,本文利用LSTM,針對(duì)分布式光伏發(fā)電功率提出了1種短期預(yù)估方法。本文采用主成分分析[3](principal component analysis,PCA)法將光伏發(fā)電功率影響因素進(jìn)行降維轉(zhuǎn)換,以減少數(shù)據(jù)的計(jì)算開銷,并進(jìn)行歸一化處理,從而為發(fā)電功率預(yù)估模型的運(yùn)算提供簡(jiǎn)潔的數(shù)據(jù)基礎(chǔ)。這不僅去除了冗余數(shù)據(jù),還盡可能地保留了大部分有效信息,實(shí)現(xiàn)了精準(zhǔn)預(yù)測(cè)。
處于自然環(huán)境下的分布式光伏發(fā)電站,受多種因素的影響,隨機(jī)性和波動(dòng)性[4]較大。這會(huì)導(dǎo)致無(wú)法精準(zhǔn)預(yù)測(cè)發(fā)電功率,進(jìn)而浪費(fèi)了大量的電能,不利于節(jié)能。本文對(duì)影響因素歸類劃分,得到2大類因素,分別為由發(fā)電設(shè)備自身原因引起的內(nèi)部因素和由天氣、氣候等原因?qū)е碌耐獠恳蛩亍0l(fā)電設(shè)備出廠時(shí)經(jīng)過(guò)層層審核,操作和安裝均按照標(biāo)準(zhǔn)規(guī)程,對(duì)發(fā)電功率的影響并不大。所以本文忽略操作和安裝的影響作用,主要對(duì)外部因素展開分析,以減少數(shù)據(jù)冗余[5]。濾除外部因素中影響強(qiáng)度較低的因素后,則分析的氣象因子主要包括總水平輻射強(qiáng)度、陣列輻射強(qiáng)度、法向輻射強(qiáng)度、風(fēng)向、風(fēng)速、垂直風(fēng)速、溫度、濕度。同時(shí),一部分因素之間具有一定的耦合性,而另一部分因素則獨(dú)立存在、互不影響。為避免這部分隱藏信息被忽略,本文采用PCA法進(jìn)行降維處理,以挖掘更多隱藏的信息,同時(shí)盡可能保留數(shù)據(jù)中的有效信息。
PCA將分布在m維空間內(nèi)的因素,通過(guò)映射作用轉(zhuǎn)換到p維空間內(nèi)(m>p),并保持原始數(shù)據(jù)特征不變,將因素進(jìn)行拆分、重組,得到維度[6]普遍偏低的新主成分?jǐn)?shù)據(jù)。PCA主要實(shí)現(xiàn)步驟如下。
①將元素矩陣定義為X=(x1,x2,…,xl)。該矩陣中包含l個(gè)因素和n組數(shù)據(jù)。X的原始矩陣可表示為:
(1)
②xi和xj為式(1)矩陣中的2個(gè)變量。xi和xj之間具有rij=(i,j=1,2,…,l)的相關(guān)系數(shù)。
rij可表示為:
(2)
xi與xj之間的相關(guān)系數(shù)矩陣R[7]為:
(3)
③在式(3)矩陣的基礎(chǔ)上,展開特征方程的計(jì)算,可以得到l個(gè)特征根λ1,λ2,…,λl(λ1≥λ2≥…≥λl>0)和l個(gè)單位特征向量e1,e2,…,el。
本文假設(shè)a為特征方程累計(jì)貢獻(xiàn)率[8]閾值,則前p個(gè)閾值都被看作主成分。
λl的特征方程計(jì)算式為:
|R-λlI|=0
(4)
式中:I為特征單位向量[9]。
a的計(jì)算式為:
(5)
式中:λj為特征根。
④將原始數(shù)據(jù)序列映射到包含q個(gè)特征向量的新序列中,計(jì)算新序列的主成分,則:
(6)
式中:tj為新序列中數(shù)據(jù)的特征向量;Yij為經(jīng)過(guò)降維處理后的q維數(shù)據(jù)主成分。
根據(jù)上述過(guò)程,本文提取氣象因子自變量主成分。一般而言,相關(guān)系數(shù)矩陣R經(jīng)過(guò)Bartlett球形檢驗(yàn)分布后的檢驗(yàn)值<0.05,可以認(rèn)為自變量之間具有相關(guān)性,適合作PCA。對(duì)特征值進(jìn)行貢獻(xiàn)率分析后,將貢獻(xiàn)率由大到小進(jìn)行排序,取前a的主成分作為新序列的主成分。此時(shí),經(jīng)過(guò)原始序列與新序列的映射轉(zhuǎn)換后,數(shù)據(jù)的單位和物理意義并不會(huì)發(fā)生改變[10]。a值的大小取決于映射前后數(shù)據(jù)序列的維數(shù)。降維處理可有效減少算法的計(jì)算開銷。經(jīng)過(guò)處理后,氣象因子自變量之間的耦合性大大減少,同時(shí)可以保留自變量成員的特征信息,以作為功率預(yù)估模型的輸入數(shù)據(jù)。
LSTM基本單元結(jié)構(gòu)如圖1所示。
圖1 LSTM基本單元結(jié)構(gòu)圖
圖1中,ht、αt分別為短期狀態(tài)[11]和長(zhǎng)期狀態(tài);βt為最后輸出;ct為當(dāng)前單元狀態(tài);It、Ot和ft分別為輸入門、輸出門和遺忘門;dt為候選值。
LSTM的計(jì)算過(guò)程如下。
It=σ(wi,uut+wi,hht-1+bi)
(7)
式中:wi,u、wi,h為權(quán)值矩陣;ut為t時(shí)刻的輸入內(nèi)容;ht-1為(t-1)時(shí)刻的輸出內(nèi)容;σ為sigmoid激活函數(shù)。
Ot=σ(wo,uut+wo,hht-1+bo)
(8)
式中:wo,u、wo,h為權(quán)值矩陣。
ft=σ(wf,uut+wf,hht-1+bf)
(9)
式中:wf,u、wf,h為權(quán)值矩陣。
dt=tanh(wd,uut+wd,hht-1+bd)
(10)
式中:wd,u、wd,h為權(quán)值矩陣。
在t時(shí)刻將數(shù)據(jù)輸入LSTM結(jié)構(gòu),則上一個(gè)單元狀態(tài)ct-1會(huì)自動(dòng)更新,產(chǎn)生當(dāng)前單元狀態(tài)ct。ct的更新過(guò)程可通過(guò)式(11)進(jìn)行描述:
ct=ftct-1+Itdt
(11)
LSTM結(jié)構(gòu)輸出的βt為:
βt=ht=Ot×tanh(ct)
(12)
2.2.1 數(shù)據(jù)預(yù)處理
在對(duì)分布式光伏發(fā)電功率進(jìn)行短期預(yù)測(cè)時(shí),受內(nèi)部因素和外部因素的影響,發(fā)電功率信息會(huì)出現(xiàn)缺失或者損壞的情況。這將影響對(duì)發(fā)電功率的預(yù)測(cè)效果,導(dǎo)致供電不穩(wěn)。針對(duì)此種現(xiàn)象,本文對(duì)原始數(shù)據(jù)進(jìn)行填補(bǔ)和歸一化處理。
缺失的發(fā)電功率信息可以是數(shù)據(jù)類型的,也可以是非數(shù)據(jù)類型的。如果為前者,即對(duì)與之對(duì)應(yīng)的數(shù)據(jù)的均值進(jìn)行計(jì)算,將計(jì)算結(jié)果作為缺失數(shù)據(jù)的填補(bǔ)。如果為后者,即參考統(tǒng)計(jì)學(xué)中的重?cái)?shù)理論,找出與缺失信息相互對(duì)應(yīng)的數(shù)據(jù),并將出現(xiàn)頻率最高的數(shù)據(jù)作為填補(bǔ)信息。補(bǔ)充完成后即對(duì)整體數(shù)據(jù)進(jìn)行歸一化處理。其計(jì)算如式(13)所示。
(13)
式中:ε為未處理前的發(fā)電功率;ε′為歸一化處理后得到的發(fā)電功率;εmax、εmin分別為輸入樣本數(shù)據(jù)的最大值和最小值。
2.2.2 模型建立及參數(shù)設(shè)置
基于LSTM的分布式光伏發(fā)電功率短期預(yù)估模型為:
ε″=ε*(εmax-εmin)+εmin
(14)
式中:ε*為預(yù)估的歸一化數(shù)據(jù);ε″為模型預(yù)估結(jié)果。
基于LSTM的分布式光伏發(fā)電功率短期預(yù)估模型共有2層,其中包含了100個(gè)神經(jīng)元。為了避免計(jì)算過(guò)程中出現(xiàn)過(guò)度擬合的情況,本文在模型中引入了參數(shù)為0.2的dropout理論和early-stopping機(jī)制。均方根誤差為預(yù)估模型的損失函數(shù),優(yōu)化器選擇的是adam。本文將截尾正態(tài)分布理論的偏置設(shè)為0.1,對(duì)權(quán)值進(jìn)行初始化處理,取Batch size為24、學(xué)習(xí)率為0.001、Epoch為200。經(jīng)過(guò)模型處理后輸出的結(jié)果為發(fā)電功率短期預(yù)估結(jié)果。
為了驗(yàn)證本文方法在實(shí)際應(yīng)用中是否可以取得理想的光伏發(fā)電功率預(yù)測(cè)結(jié)果,本文方法與自組織映射和灰色關(guān)聯(lián)分析算法進(jìn)行了對(duì)比試驗(yàn)。試驗(yàn)數(shù)據(jù)來(lái)自某地40 kWp分布式光伏發(fā)電站。試驗(yàn)采集了2021年1~12月的發(fā)電功率數(shù)據(jù)。每個(gè)季度分別選取連續(xù)3天的發(fā)電功率數(shù)據(jù),采樣間隔為6 min。夜間沒(méi)有光照,故光伏系統(tǒng)的輸出功率值為0。自變量包括:預(yù)測(cè)日前一天每小時(shí)的平均輸出功率;預(yù)測(cè)日前一天每小時(shí)的平均輻射強(qiáng)度;預(yù)測(cè)日前一天環(huán)境溫度最大值、最小值、差值;預(yù)測(cè)日環(huán)境溫度最大值、最小值、差值;預(yù)測(cè)日前一天風(fēng)速最大值、最小值、差值;預(yù)測(cè)日風(fēng)速最大值、最小值、差值。自變量共計(jì)14個(gè)輸入量。試驗(yàn)將得到的200組監(jiān)測(cè)數(shù)據(jù)作為測(cè)試數(shù)據(jù),其余天數(shù)內(nèi)的2 100組監(jiān)測(cè)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。在接下來(lái)的試驗(yàn)中,3種算法所用到的數(shù)據(jù)均為相同的數(shù)據(jù)。
采用單一的評(píng)價(jià)指標(biāo)很難對(duì)3種算法的優(yōu)劣性能作出合理評(píng)價(jià)。為了保證試驗(yàn)對(duì)比結(jié)果的公平性,本文選取平均絕對(duì)誤差M′、均方根誤差R′和相關(guān)系數(shù)F作為算法預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo)。
(15)
(16)
(17)
式中:V為相關(guān)系數(shù)參數(shù)。
M′和R′的值越小、F的值越大,則算法的預(yù)測(cè)性能越優(yōu)。
3種算法在4個(gè)季節(jié)連續(xù)3天發(fā)電功率預(yù)測(cè)結(jié)果對(duì)比如圖2所示。
圖2 3種算法在4個(gè)季節(jié)連續(xù)3天發(fā)電功率預(yù)測(cè)結(jié)果對(duì)比
評(píng)價(jià)指標(biāo)下3種算法的對(duì)比結(jié)果如表1所示。
表1 評(píng)價(jià)指標(biāo)下3種算法的對(duì)比結(jié)果
由圖2和表1可知,通過(guò)本文方法預(yù)測(cè)到的發(fā)電功率曲線與實(shí)際結(jié)果更接近,甚至多處出現(xiàn)了重合現(xiàn)象,而自組織映射和灰色關(guān)聯(lián)分析算法預(yù)測(cè)曲線均與實(shí)際結(jié)果曲線存在較大的偏差。同時(shí),本文方法取得的M′值和R′值在3種算法中始終最小,而F值始終最大。由此可以說(shuō)明,通過(guò)本文方法對(duì)分布式光伏發(fā)電功率進(jìn)行預(yù)測(cè),可保證最小的誤差,取得與實(shí)際數(shù)據(jù)最接近的結(jié)果。
電力行業(yè)大力倡導(dǎo)低碳化發(fā)展,提出節(jié)能降耗的發(fā)電要求。在電網(wǎng)發(fā)電穩(wěn)定的前提下,必須以節(jié)能環(huán)保為中心理念,對(duì)電網(wǎng)的發(fā)電調(diào)度作出改進(jìn)。由于分布式光伏發(fā)電功率數(shù)據(jù)受天氣和季節(jié)影響因素較大,存在一定的非線性特征,傳統(tǒng)方法在對(duì)其預(yù)測(cè)時(shí)難以取得理想的預(yù)測(cè)效果。由此,本文提出了應(yīng)用LSTM理論的分布式光伏發(fā)電功率的短期預(yù)估方法。該方法主要考慮了來(lái)自外部因素即氣象因子的影響,利用PCA法深度挖掘氣象數(shù)據(jù)的關(guān)聯(lián),降低氣象因子自變量之間的耦合性。在此基礎(chǔ)上,該方法填補(bǔ)和歸一化處理數(shù)據(jù),利用LSTM構(gòu)建分布式光伏發(fā)電功率短期預(yù)估模型,并通過(guò)試驗(yàn)驗(yàn)證了該方法具有最高的相關(guān)系數(shù),以及最低的均方根誤差和平均絕對(duì)誤差。其結(jié)果與實(shí)際發(fā)電功率接近。該方法降低了發(fā)電過(guò)程中的電能損耗,使分布式光伏發(fā)電更節(jié)能、更經(jīng)濟(jì)。