唐冬來,鐘聲 ,李擎宇,陳澤宇,龔奕宇,聶瀟
(1.四川思極科技有限公司, 四川 成都 610047;(2.國網(wǎng)四川省電力公司, 四川 成都 610041)
隨著全球化石能源的枯竭和“雙碳”目標的提出,能源體系轉(zhuǎn)型已成為世界各國關(guān)注的重點[1-2]。中國大力發(fā)展可再生能源,是推動“雙碳”目標實現(xiàn)的主力軍[3]。其中,屋頂光伏以太陽能蘊藏量豐富、清潔無污染、發(fā)電裝置安裝便捷等優(yōu)點,成為中國能源體系轉(zhuǎn)型的重點[4]。屋頂光伏數(shù)量龐大,發(fā)電功率具有隨機性、波動性的特點,并網(wǎng)時將對電網(wǎng)消納和運行安全造成影響,因此,對超短期屋頂光伏功率進行預測,對促進電網(wǎng)大規(guī)模屋頂光伏消納具有積極的作用。
國內(nèi)外許多學者對超短期光伏功率預測做了大量研究。文獻[5]中,通過空氣霧霾濃度與發(fā)電損失指數(shù)進行關(guān)聯(lián)分析,從而進行超短期屋頂功率預測。文獻[6]中,采用改進密度算法,對屋頂系數(shù)、歷史光照輻射度等因素進行綜合分析,從而進行超短期光伏功率預測。文獻[7]中,通過非劣解集的均勻分布分析,從而預測超短期光伏功率。文獻[8]中,通過四季變化、晴天、雨天等因素與光伏發(fā)電關(guān)系的聚合,從而預測超短期光伏功率。文獻[9]中,通過挖掘氣象變化規(guī)律和光伏功率協(xié)同關(guān)系,從而進行光伏發(fā)電功率預測。文獻[10]中,通過貝葉斯算法計算氣象變化及輻射度過程,從而修正光伏預測功率。由此可見,光伏預測功率方法多樣,且取得了一定的成績。但上述方法主要針對相對集中的光伏電站功率預測。屋頂光伏較分散,環(huán)境因素影響更為復雜,上述方法在屋頂光伏中預測準確率不高。
為解決超短期屋頂光伏功率預測精度低的問題,本文提出了一種基于多分類器的超短期屋頂光伏功率預測方法。該方法是一種多模型的集成預測方法??筛鶕?jù)輸入的屋頂光伏數(shù)據(jù)自動的匹配相對應(yīng)的算法,從而解決了單個屋頂光伏算法模型對不同區(qū)域的超短期屋頂光伏功率預測率不高的問題。
文中所提基于多分類器的超短期屋頂光伏功率預測方法框架分成屋頂光伏歷史功率數(shù)據(jù)質(zhì)量評估與清洗、屋頂光伏出力影響因素分析、屋頂光伏區(qū)塊分類、屋頂光伏功率預測四部分,如圖1所示。
圖1 屋頂光伏功率預測框架圖Fig.1 Frame diagram of roof photovoltaic power prediction
在屋頂光伏歷史功率數(shù)據(jù)質(zhì)量評估與清洗環(huán)節(jié),首先,基于規(guī)則庫對屋頂光伏歷史功率數(shù)據(jù)的完整性和有效性進行質(zhì)量評估;然后,根據(jù)跨區(qū)域屋頂光伏多源異構(gòu)數(shù)據(jù)間的信息進行語義提取,進而實現(xiàn)多源異構(gòu)屋頂光伏數(shù)據(jù)的交叉驗證;最后,采用線性回歸法實現(xiàn)屋頂光伏歷史數(shù)據(jù)的清洗與補正。在屋頂光伏出力影響因素分析環(huán)節(jié),首先,分析太陽輻照度、空氣溫度、相對濕度、光伏組件溫度和大氣壓力等因素和屋頂光伏功率的關(guān)聯(lián)度,分析強相關(guān)的因素;其次,基于氣象數(shù)據(jù),對影響屋頂光伏發(fā)電功率的指標權(quán)重進行分析。在屋頂光伏區(qū)塊分類聚類環(huán)節(jié),首先,對屋頂光伏發(fā)電區(qū)域的區(qū)塊進行劃分;然后,對屋頂光伏進行區(qū)塊聚類,獲得發(fā)電區(qū)塊的典型特征;最后,分析每個區(qū)塊中影響屋頂光伏發(fā)電功率的權(quán)重。在屋頂光伏功率預測環(huán)節(jié),首先,根據(jù)屋頂光伏區(qū)塊特征,選擇對應(yīng)的預測模型;其次,分區(qū)塊進行超短期屋頂光伏功率預測;最后,將各區(qū)塊的屋頂光伏功率進行疊加,形成超短期屋頂光伏功率預測結(jié)果。
2.1.1 屋頂光伏歷史功率數(shù)據(jù)質(zhì)量評估
在屋頂光伏功率數(shù)據(jù)采集的過程中,受傳輸信道、量測設(shè)備運行狀態(tài)等因素影響,會造成空值、缺失等異常數(shù)據(jù)。該類異常數(shù)據(jù)將影響超短期屋頂光伏預測精度[11-13]。因此,在進行超短期屋頂光伏功率預測前,先對屋頂光伏歷史功率數(shù)據(jù)進行質(zhì)量評估。
針對屋頂光伏歷史功率數(shù)據(jù)的質(zhì)量評估目標,配置不同的數(shù)據(jù)質(zhì)量評估規(guī)則,將屋頂光伏功率數(shù)據(jù)質(zhì)量評估規(guī)則中涉及評估特征定義成一個屋頂光伏功率數(shù)據(jù)評估特征因子值。根據(jù)屋頂光伏功率數(shù)據(jù)評估規(guī)則和屋頂光伏功率特征因子進行數(shù)據(jù)評估。評估的約束規(guī)則如表1所示。
2.1.2 屋頂光伏歷史功率數(shù)據(jù)清洗
屋頂光伏發(fā)電設(shè)備數(shù)量多,在發(fā)電生產(chǎn)過程中,依賴量測系統(tǒng)產(chǎn)生了大量的發(fā)電功率數(shù)據(jù)。在海量屋頂光伏發(fā)電功率數(shù)據(jù)產(chǎn)生過程中,受到量測裝置故障、數(shù)據(jù)傳輸問題、量測裝置時鐘不同步等因素,導致會產(chǎn)生無效和錯誤的屋頂光伏功率數(shù)據(jù)[14-15]。在進行屋頂光伏功率預測數(shù)據(jù)挖掘時,由于數(shù)據(jù)的錯誤和缺失,會造成預測精度降低。因此,首先需對屋頂光伏歷史功率數(shù)據(jù)的錯誤和缺失值進行清洗,提供滿足屋頂光伏功率預測要求的補正數(shù)據(jù)。
屋頂光伏歷史功率數(shù)據(jù)清洗是指從質(zhì)量評估中檢測出的缺失與錯誤數(shù)據(jù),并進行屋頂光伏歷史功率數(shù)據(jù)補正的過程。線性插值方法是一種屋頂光伏歷史功率數(shù)據(jù)插值函數(shù)一次多項式的方法,該方法在插值節(jié)點上的誤差小,具有插值過程簡單、運算速度快的特點[16]。因此,文中采用線性插值法進行數(shù)據(jù)補正。屋頂光伏發(fā)電的歷史功率缺失補正數(shù)據(jù)Ja為:
(1)
式中:Jb和Jc分別為缺失或異常屋頂光伏歷史功率點前后已知的功率值數(shù)據(jù);Kb和Kc分別為缺失或異常屋頂光伏歷史功率點前后已知的屋頂光伏歷史發(fā)電功率時間點數(shù)據(jù);Ka為Kb和Kc之間的任一時間點的數(shù)據(jù)。通過兩個已知的屋頂光伏數(shù)據(jù),即可求的缺失頂光伏歷史發(fā)電功率數(shù)據(jù)的近似值。
屋頂光伏出力影響因素分析是為了評估分析太陽輻照度、大氣壓力等因素與光伏出力的關(guān)聯(lián)度,尋求具有強相關(guān)性的因素[17]。依據(jù)中國光伏協(xié)會的光伏評估指標,屋頂光伏出力影響因素選擇如表2所示。
表2 屋頂光伏出力影響因素表Tab.2 Influencing factors of roof photovoltaic output
主成分分析(principalcomponentanalysis,PCA)是一種降維分析統(tǒng)計方法。該方法中,通過正交變換將具有一定相關(guān)性的指標進行降維,重新組合成一組維度數(shù)量少且相關(guān)性低的變量來替代原有指標。該方法具有多變量數(shù)據(jù)優(yōu)化效果好、信息損失小等特點[18-19]。因此,文中采用PCA方法進行屋頂光伏出力影響因素降維。
屋頂光伏出力影響因素標準化處理值Sab為:
(2)
式中:Sbc為第b個屋頂光伏出力影響因素評價對象的第c個指標取值;Sc為第c個屋頂光伏出力影響因素指標的樣本均值;Cc為第c個屋頂光伏出力影響因素指標的標準差。
然后,計算屋頂光伏出力影響因素相關(guān)性Ba。
(3)
式中:ma為屋頂光伏出力影響因素相關(guān)性個數(shù),在文中即為表2屋頂光伏出力影響因素表的內(nèi)容;Sbi為不同的屋頂光伏出力影響因素評價對象的相關(guān)性;Sci為不同的樣本均值與評價對象的相關(guān)性。
在此基礎(chǔ)上,計算評估屋頂光伏出力影響因素的綜合得分Fa:
(4)
式中:na為屋頂光伏出力影響因素中主成分的個數(shù);hj為第j個屋頂光伏出力影響因素主成分的貢獻率;gj為第j個屋頂光伏出力影響因素主成分的累計貢獻率。最后,根據(jù)屋頂光伏出力影響因素相關(guān)性分析結(jié)果建立屋頂光伏出力影響關(guān)系映射。
屋頂光伏分布在城市、鄉(xiāng)鎮(zhèn)、農(nóng)村不同的建筑物類型上。在不同的建筑物或不同的地形地貌中,屋頂光伏發(fā)電功率的典型特征差異較大[20-21]。因此,在進行超短期屋頂光伏功率預測前,先進行屋頂光伏功率的區(qū)塊分類。
數(shù)值天氣預報(numericalweatherprediction,NWP)是根據(jù)氣象的實際情況,在確定的邊界范圍內(nèi),采用氣象相關(guān)算法進行天氣演變過程預測的一種方法,在全球的NWP中,歐洲的天氣預報區(qū)塊劃分較細,預測結(jié)果較其他國家的產(chǎn)品準確[22-23]。因此,文中選用歐洲NWP進行區(qū)塊劃分,劃分的網(wǎng)格大小為3*3公里。NWP的區(qū)塊劃分La為:
(5)
式中:nb為NWP區(qū)塊的數(shù)量;li為不同的NWP區(qū)塊。
然后,將屋頂光伏按地理區(qū)塊與NWP區(qū)域進行擬合。擬合區(qū)塊Ca為:
(6)
式中:nc為屋頂光伏地理區(qū)塊的數(shù)量;ri為不同的屋頂光伏地理區(qū)塊;Lai為不同的NWP區(qū)塊。
模糊C均值聚類(fuzzyC-meansalgorithm,FCM)是基于劃分的聚類算法,該算法通過優(yōu)化每個聚類樣本到聚類中心的隸屬程度,從而進行分類。該算法具有目標函數(shù)計算準確率高、分類速度快的特點[24-26],因此,文中采用FCM聚類方法進行屋頂光伏區(qū)塊聚類,以獲得不同區(qū)塊的屋頂光伏典型特征。屋頂光伏區(qū)塊FCM聚類的目標函數(shù)Ga為:
(7)
式中:nc為屋頂光伏區(qū)塊的簇數(shù)量;ui為不同的屋頂光伏隸屬于簇中心的隸屬度;mc為FCM聚類中的模糊加權(quán)指數(shù);vi為不同的屋頂光伏區(qū)塊樣本到FCM聚類中心的距離。
通過FCM聚類獲得發(fā)電區(qū)塊的典型特征,然后,再根據(jù)式4,計算屋頂光伏每個區(qū)塊的屋頂光伏發(fā)電功率影響權(quán)重。
屋頂光伏功率預測中,根據(jù)屋頂光伏區(qū)塊特征,選擇對應(yīng)的預測模型;然后,對分區(qū)塊進行超短期屋頂光伏功率預測;最后,將各區(qū)塊的屋頂光伏功率進行疊加,形成超短期屋頂光伏功率預測結(jié)果。
基于長短期記憶網(wǎng)絡(luò)(longshort-termmemory,LSTM)的多模型集成預測方法,通過LSTM網(wǎng)絡(luò)中空間的連續(xù)函數(shù)進行擬合[27-28]。該方法是一種多模型集成的預測方法,每個模型的訓練程度、網(wǎng)絡(luò)結(jié)構(gòu)均有不同,與普通的預測方法不同,該方法部署在屋頂光伏區(qū)塊數(shù)據(jù)輸入和超短期屋頂光伏功率預測輸出直接的求解一個精確的函數(shù)對應(yīng)關(guān)系,而是采用屋頂光伏預測模塊匹配算法,尋找一組與輸入的屋頂光伏輸入數(shù)據(jù)對應(yīng)的預測輸出數(shù)據(jù),該數(shù)據(jù)并非精確的函數(shù),而是較接近的數(shù)值。在每次進行多分類器選擇的時候,隨著輸入的屋頂光伏影響因素數(shù)據(jù)的變化,模型選擇也會隨著變化,從而達到了屋頂光伏功率動態(tài)預測的目的。屋頂光伏功率預測功能結(jié)構(gòu)如圖2所示。
圖2 屋頂光伏功率預測功能架構(gòu)Fig.2 Function architecture of roof photovoltaic power prediction
由圖2可見,屋頂光伏功率預測步驟如下。
(1)根據(jù)屋頂光伏的區(qū)塊類型及數(shù)量,構(gòu)建多個基于LSTM網(wǎng)絡(luò)的屋頂光伏基準分類器,以便對每個區(qū)塊進行最合適的預測;
(2)基于基準分類器,采用LSTM網(wǎng)絡(luò)模型對屋頂光伏區(qū)塊類別進行單獨訓練,確保每個LSTM網(wǎng)絡(luò)適合該類的超短期屋頂光伏功率預測;
(3)確定超短期屋頂光伏預測基準LSTM模型與FCM聚類簇的適應(yīng)度,判別基準LSTM模型的歸屬類型;
(4)確定各超短期屋頂光伏預測基準LSTM模型的權(quán)重,以便個屋頂光伏區(qū)塊進行適應(yīng)性權(quán)重調(diào)整;
(5)確定輸入的超短期屋頂光伏預測相關(guān)輸入數(shù)據(jù)能夠正確選擇不同的屋頂光伏超短期功率子預測基準模型;
(6)采用多個超短期屋頂光伏預測LSTM模型,分別對不同的屋頂光伏區(qū)塊進行超短期功率預測;
(7)將多個超短期屋頂光伏預測LSTM模型的預測結(jié)果進行疊加,并形成最終的屋頂光伏功率預測結(jié)果數(shù)據(jù)。
約束條件:屋頂光伏功率大小Pa約束為:
(8)
式中:nd為屋頂光伏發(fā)電機組的數(shù)量;pi為不同的屋頂光伏發(fā)電機組最大輸出功率;yai為不同的屋頂光伏發(fā)電機組的組件組合損失;ybi為不同的屋頂光伏發(fā)電機組的光伏面污穢損失;yci為不同的屋頂光伏發(fā)電機組的溫度損失;ydi為不同的屋頂光伏發(fā)電機組的濕度損失;yei為不同的屋頂光伏發(fā)電機組的大氣壓力損失;yfi為不同的屋頂光伏發(fā)電機組的太陽能組件傾斜角度損失。
屋頂光伏發(fā)電機組功率pb與太陽輻射度、太陽能組件轉(zhuǎn)換率的約束為:
(9)
式中:ne為屋頂光伏發(fā)電機組的總體數(shù)量;zi為不同的屋頂光伏板接收到的太陽輻射量;λi為不同的太陽能組件轉(zhuǎn)換率。
采用文中所提基于多分類器的超短期屋頂光伏功率預測方法在某整縣屋頂光伏運營商進行模擬運行。該縣的面積為1620平方公里,按照數(shù)值天氣預報的3×3公里區(qū)塊劃分為186個區(qū)塊。該整縣光伏運營商擁有屋頂光伏發(fā)電用戶數(shù)量為28179個,裝機容量47.9MW,在各區(qū)塊中均有屋頂光伏發(fā)電用戶分布。屋頂光伏發(fā)電用戶通過0.4kV配電線路接入上網(wǎng),并采用單獨的表計裝置對屋頂光伏發(fā)電進行計量和回傳運營商屋頂光伏調(diào)控系統(tǒng)。
文中算例運行在聯(lián)想ThinkServer服務(wù)器上,該服務(wù)器的操作系統(tǒng)為WindowsServer2019,服務(wù)器的處理器為2顆英特爾至強Scalable系列處理器,運行頻率為1.9GHz。服務(wù)器的內(nèi)存為128GB,服務(wù)器硬盤為16TB。
文中的超短期屋頂光伏功率預測是指4小時的屋頂光伏功率預測。文中的訓練集數(shù)據(jù)為2021年1至12月的屋頂光伏功率相關(guān)數(shù)據(jù)。文中用于比對的方法是文獻[29]中的XGBoost雙層協(xié)同超短期功率預測模型。該預測方法在屋頂光伏預測領(lǐng)域廣泛應(yīng)用,具有行業(yè)通用性。
3.2.1 屋頂光伏功率影響因素分析
屋頂光伏功率影響因素分析是評估太陽輻射度、大氣壓力等因素對屋頂光伏發(fā)電影響程度的指標,該指標選擇表2屋頂光伏出力影響因素表的指標對整縣屋頂光伏發(fā)電數(shù)據(jù)進行分析。在表2中,由于太陽能組件轉(zhuǎn)換率、太陽能組件傾斜角度、組件組合損失在屋頂光伏發(fā)電設(shè)備安裝時均已固定,為簡化計算,在統(tǒng)計時,以上三個指標不納入計算。屋頂光伏功率影響因素的計算方式為將模型評估的影響因素占比與人工依據(jù)中國光伏協(xié)會典型影響占比計算方法進行對比,兩者一致即為準確,其比值為準確率。
選擇表2中的7個影響因素,采用文中所提基于多分類器的超短期屋頂光伏功率預測方法中的PCA方法與XGBoost方法比較屋頂光伏功率影響因數(shù)準確性,其結(jié)果如表3所示。
表3 屋頂光伏功率影響因素對比表Tab.3 Comparison of influencing factors of roof photovoltaic power
由表3可見,文中所提PCA方法的平均屋頂光伏功率影響因素分析準確率為97.6%,高于XGBoost分析方法的69.3%,因此,文中所提方法的屋頂光伏功率影響因素分析更優(yōu)。
3.2.2 數(shù)據(jù)清洗準確性分析
數(shù)據(jù)清洗準確性分析是為了評估修復屋頂光伏功率缺失、錯誤數(shù)據(jù)的質(zhì)量。該指標是模型計算的基礎(chǔ)。其計算方式為,將歷史功率數(shù)據(jù)依據(jù)式1進行清洗補正后,人工依據(jù)中國光伏協(xié)會的行業(yè)標準判斷屋頂光伏功率數(shù)據(jù)是否修復準確,若在行業(yè)標準允許的范圍內(nèi),則為準確,若在范圍外,則為不準確。屋頂光伏功率數(shù)據(jù)修復準確的數(shù)量與修復總數(shù)的比值為屋頂光伏功率數(shù)據(jù)清洗準確率。
分別選擇待修復的屋頂光伏功率數(shù)據(jù)為1000、2000、3000、4000、5000、6000、8000、10000條,采用文中所提方法與XGBoost比較屋頂光伏功率數(shù)據(jù)清洗準確率,比較結(jié)果如表4所示。
表4 屋頂光伏數(shù)據(jù)清洗準確性分析表Tab.4 Comparison of influencing factors of roof photovoltaic power
續(xù)表4
由圖4可見,在不同樣本數(shù)量的驗證集下,文中所提方法屋頂光伏數(shù)據(jù)清洗準確性均優(yōu)于XGBoost分析方法。
3.2.3 超短期屋頂光伏功率預測準確性
超短期屋頂光伏預測準確性分析的目的是為了評估屋頂光伏功率預測是否準確。超短期是指4個小時內(nèi)的屋頂光伏功率預測時間范圍。其計算方式為預測的屋頂光伏功率與實際的屋頂光伏功率之間絕對值的比值。該指標的取值范圍為0%~100%,其超短期屋頂光伏預測準確性取值越高,則說明該指標越好。
選擇2022年3月某天,采用文中所提基于多分類器的超短期屋頂光伏功率預測方法與XGBoost分析方法對比超短期屋頂光伏預測準確性,預測時段為該天的96點數(shù)據(jù),預測的超短期屋頂光伏功率曲線和實際功率曲線對比情況如圖3所示。
圖3 屋頂光伏功率預測圖Fig.3 Prediction diagram of roof photovoltaic power
由圖3可見,文中所提基于多分類器的超短期屋頂光伏功率預測方法曲線與實際功率曲線更為接近,經(jīng)數(shù)據(jù)統(tǒng)計分析,其預測準確性約為91.2%,高于XGBoost分析方法的83.5%,由此可見,文中所提基于多分類器的超短期屋頂光伏功率預測更準確[30-32]。
基于多分類器的超短期屋頂光伏功率預測方法框架分成屋頂光伏歷史功率數(shù)據(jù)質(zhì)量評估與清洗、屋頂光伏出力影響因素分析、屋頂光伏區(qū)塊分類、屋頂光伏功率預測四部分組成。該方法通過對屋頂光伏進行區(qū)塊劃分,提高了分析的細粒度。同時,該方法根據(jù)輸入的屋頂光伏數(shù)據(jù)自動的匹配相對應(yīng)的算法,從而提高預測的準確性。最后,該方法在某縣域屋頂光伏進行了應(yīng)用,其結(jié)果驗證了該方法的有效性。
下一步,將結(jié)合數(shù)值天氣預報,對超短期風力發(fā)電功率預測做進一步研究。