收稿日期:2022-02-14
基金項(xiàng)目:國家重點(diǎn)研發(fā)計(jì)劃(2018YFE0208400);國家電網(wǎng)有限公司總部科技項(xiàng)目《面向跨境互聯(lián)的多能互補(bǔ)新型能源系統(tǒng)關(guān)鍵技術(shù)研究》
通信作者:許 野(1980—),男,博士、副教授,主要從事綜合能源系統(tǒng)優(yōu)化方面的研究。xuye@ncepu.edu.cn
DOI:10.19912/j.0254-0096.tynxb.2022-0158 文章編號(hào):0254-0096(2023)06-0265-10
摘 要:為有效提升光伏短期發(fā)電功率的預(yù)測精度和保障電網(wǎng)的穩(wěn)定運(yùn)行,在分別利用皮爾遜相關(guān)系數(shù)法(PCC)提取相關(guān)氣象要素、傳遞閉包法確定相似日的基礎(chǔ)上,結(jié)合ARIMA時(shí)間序列和BP神經(jīng)網(wǎng)絡(luò),分別構(gòu)建PCC-傳遞閉包-ARIMA和PCC-傳遞閉包-BP兩類組合預(yù)測模型,用于解決云南賓川某光伏發(fā)電站的出力預(yù)測問題。對比結(jié)果顯示:1)相較于單一模型,組合預(yù)測模型的預(yù)測精度明顯提升,其中PCC-傳遞閉包-BP模型的預(yù)測效果最好,平均精度可達(dá)91.19%;2)在歷史光伏出力普遍偏高的前提下,ARIMA模型在高光伏出力時(shí)段可較好地描述光伏出力的波動(dòng)和變化特性,BP模型在低光伏出力時(shí)段具有更強(qiáng)的調(diào)整和糾正能力。
關(guān)鍵詞:光伏發(fā)電;預(yù)測模型;因子分析;皮爾遜相關(guān)系數(shù);傳遞閉包;ARIMA;BP神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TM615""""""""""""""""""nbsp;"""""""" 文獻(xiàn)標(biāo)志碼:A
0 引 言
太陽能作為一種重要的可再生能源,具有清潔、取之不盡用之不竭、、分布廣、靈活等優(yōu)點(diǎn),已成為發(fā)展最快的可再生能源之一[1]。光伏發(fā)電作為一種太陽能發(fā)電形式。受天氣條件和設(shè)備特性等因素的影響,具有間歇性、波動(dòng)性的特點(diǎn),給電網(wǎng)的穩(wěn)定運(yùn)行帶來巨大挑戰(zhàn)。因此,如何實(shí)現(xiàn)光伏發(fā)電功率的準(zhǔn)確預(yù)測備受關(guān)注[2]。光伏發(fā)電預(yù)測方法眾多,按預(yù)測的時(shí)間尺度可分為超短期、短期、中期和長期預(yù)測[3-4]。根據(jù)《光伏發(fā)電功率預(yù)測系統(tǒng)功能規(guī)范》標(biāo)準(zhǔn)[5],短期功率預(yù)測是指預(yù)測光伏發(fā)電站次日零時(shí)至未來72小時(shí)的有功功率;超短期功率預(yù)測是指預(yù)測光伏發(fā)電站15~240 min的有功功率。按預(yù)測的原理可分為直接預(yù)測法和間接預(yù)測法,其中直接預(yù)測法無需考慮光伏發(fā)電站的位置和具體電力參數(shù),主要基于大量光伏發(fā)電歷史數(shù)據(jù)和相應(yīng)的氣象參數(shù),運(yùn)用數(shù)學(xué)模型直接預(yù)測發(fā)電功率[6];間接預(yù)測法是在確定太陽輻射量的基礎(chǔ)上,根據(jù)光電轉(zhuǎn)換效率計(jì)算得到光伏發(fā)電系統(tǒng)的輸出功率。相較于間接預(yù)測法,直接預(yù)測法具有所需參數(shù)少、過程簡便和誤差可控等優(yōu)點(diǎn),在短期光伏預(yù)測中得到廣泛運(yùn)用。
由于單一的直接預(yù)測模型無法保證預(yù)測精度,目前國內(nèi)外研究人員普遍采用組合預(yù)測的方式完成光伏出力估算。例如,韓雙等[7]提出一套基于Copula函數(shù)和長短期記憶網(wǎng)絡(luò)的光伏預(yù)測方法,在利用Copula函數(shù)提取影響光伏發(fā)電關(guān)鍵氣象因素的基礎(chǔ)上,采用長短期記憶網(wǎng)絡(luò)模型預(yù)測發(fā)電量,顯著提高了預(yù)測精度。李玲玲等[8]運(yùn)用HIMVO-SVM模型完成了3種不同天氣類型下的光伏出力預(yù)測,其均方誤差和平均絕對百分比誤差明顯降低。李秉晨等[9]首先以氣象要素為分類依據(jù),運(yùn)用K-均值算法選出待預(yù)測日的相似日,然后采用CEEMD、PE與LSTM神經(jīng)網(wǎng)絡(luò)的混合預(yù)測模型進(jìn)行預(yù)測,平均絕對誤差百分比為1.81%,明顯低于單一的LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測模型。趙濱濱等[10]采用ARIMA時(shí)間序列與支持向量機(jī)的混合預(yù)測模型對晴天、霧霾天、陰天和雨天4種天氣類型條件下的光伏出力進(jìn)行預(yù)測,年預(yù)測誤差為13.65%。
上述結(jié)果表明,采用組合預(yù)測模型,選取與預(yù)測日氣象條件相似歷史時(shí)期的氣象參數(shù)和光伏出力來訓(xùn)練預(yù)測模型,精度明顯提高。但在相似日的選取過程中,由于天氣類型之間無明確界限,且同一個(gè)天氣類型下數(shù)據(jù)的波動(dòng)范圍較大,以單一天氣類型的氣象數(shù)據(jù)作為相似日數(shù)據(jù)的簡化處理方式可能導(dǎo)致較大偏差。模糊聚類針對氣象數(shù)據(jù)界限不分明的特點(diǎn),考慮到數(shù)據(jù)之間存在一定關(guān)聯(lián)關(guān)系,將數(shù)據(jù)對應(yīng)各類別的隸屬度由原來的0,1擴(kuò)展到[0,1],全面、客觀地選出與預(yù)測日隸屬度最大的樣本,有利于提高出力預(yù)測的準(zhǔn)確性[11]。傳遞閉包法可有效挖掘參數(shù)的不確定信息,相較于模糊C均值聚類方法,其理論更為成熟,近年來在一些領(lǐng)域得到應(yīng)用。例如,陳釘均等[12]應(yīng)用傳遞閉包法對指標(biāo)進(jìn)行篩選,構(gòu)建了重大疫情下鐵路應(yīng)急救援能力評估指標(biāo)體系,為鐵路部門應(yīng)急處置能力提升奠定了很好的基礎(chǔ)。王振東[13]運(yùn)用傳遞閉包法構(gòu)建了鐵路物流園區(qū)層級(jí)劃分模型,完成山西省11個(gè)地級(jí)市物流園區(qū)的層級(jí)劃分,為當(dāng)?shù)匚锪鲌@區(qū)的宏觀規(guī)劃提供了理論依據(jù),但該方法在光伏出力預(yù)測方面鮮有應(yīng)用。
因此,本文在使用傳遞閉包法提取相似日的基礎(chǔ)上,選取應(yīng)用較廣泛的ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型分別構(gòu)建短期的光伏出力預(yù)測模型,以此提高光伏出力預(yù)測的精度,以期為電網(wǎng)高比例消納光伏發(fā)電和穩(wěn)定運(yùn)行提供技術(shù)支持。
1 研究方法
1.1 總體思路
本文遵循“要素識(shí)別-相似日確定-出力預(yù)測-對比分析”技術(shù)路線(如圖1所示),首先采用皮爾遜相關(guān)系數(shù)法對包括全輻射輻照度、風(fēng)速、風(fēng)向、溫度以及濕度在內(nèi)的5類氣象要素和光伏短期出力進(jìn)行相關(guān)性分析,提取出對光伏出力影響較大的3類因素,即全輻射輻照度、溫度和濕度;然后,分別采用ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行出力預(yù)測,得到單一模型的預(yù)測結(jié)果;然后,運(yùn)用傳遞閉包法對歷史日與預(yù)測日進(jìn)行聚類,找到與預(yù)測日氣象變量高度相關(guān)的相似日;最后,以相似日氣象和出力數(shù)據(jù)作為訓(xùn)練樣本,分別構(gòu)建PCC-傳遞閉包-ARIMA模型和PCC-傳遞閉包-BP神經(jīng)網(wǎng)絡(luò)模型,并將組合模型的光伏出力預(yù)測結(jié)果與單一模型進(jìn)行比對,得出相關(guān)結(jié)論。
1.2 皮爾遜相關(guān)系數(shù)
皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient,PCC)也叫線性相關(guān)系數(shù),常用來衡量變量之間的線性相關(guān)程度。該方法的主要計(jì)算公式為:
[r=XY-XYNX2-X2NY2-Y2N]" (1)
式中:[r]——變量間的相關(guān)系數(shù);[X]——影響光伏短期出力的氣象因素;[Y]——光伏短期出力,MW;[N]——[X、Y]所包含的數(shù)據(jù)數(shù)量。
運(yùn)用PCC法得到的相關(guān)系數(shù)[r]的取值范圍為[[-1,1]],正、負(fù)值分別表示兩個(gè)變量之間的關(guān)系為正相關(guān)或負(fù)相關(guān),絕對值越大意味著相關(guān)性越強(qiáng)。表1為不同相關(guān)系數(shù)[r]對應(yīng)的相關(guān)程度。
1.3 傳遞閉包法
傳遞閉包法是一類根據(jù)研究對象本身的屬性來構(gòu)造模糊相似矩陣,并在此基礎(chǔ)上根據(jù)隸屬度的不同來確定分類關(guān)系的方法。[X=X1,X2,…,Xn]為待分類的歷史日,其中[n]為
歷史日的數(shù)量;每個(gè)歷史日[Xi]對應(yīng)有[m]個(gè)特性指標(biāo),即[Xi]可由[m]維特性指標(biāo)向量[xi1,xi2,…,xim,][其中i=1,2,…,n]表示,xij為第i個(gè)歷史日的第j個(gè)特性指標(biāo),[j=1,2,…,m]。此時(shí),可得特性指標(biāo)矩陣為:
[X*=xijn×m=x11x12 …x1mx21?x22 …??x2m?xn1xn2 …xnm]" (2)
1.3.1 數(shù)據(jù)標(biāo)準(zhǔn)化
考慮到[m]個(gè)特性指標(biāo)的數(shù)量級(jí)和量綱不同,可能對分類效果產(chǎn)生影響,采用最大值規(guī)格化法,對指標(biāo)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化,確保每個(gè)指標(biāo)值落在[0,1]范圍內(nèi)[11]。具體操作流程為:
1) 確定[X*]第[j]列的最大值[Mj=maxx1j,x2j,…,xnj];
2) 計(jì)算[xij′=xij/Mj],確保指標(biāo)值落在[0,1]范圍內(nèi)。
1.3.2 構(gòu)造模糊相似矩陣[R]
運(yùn)用已標(biāo)準(zhǔn)化的數(shù)據(jù),求得[Xi=xi1,xi2,…,xim]與[Xj=xj1,xj2,…,xjm]之間的相似度,記作[rij∈0,1],得到模糊相似矩陣[R=rijn×n]。目前,[rij]的常用計(jì)算方法有數(shù)量積法、夾角余弦法、相關(guān)系數(shù)法、最大最小法、算術(shù)平均最小法、幾何平均最小法等[11]。本文采用最大最小法計(jì)算相似度。
[rij=k=1mxik∧xjkk=1mxik∨xjk]" (3)
1.3.3 計(jì)算傳遞閉包[t(R)]
由于模糊相似矩陣[R]不一定具備傳遞性,需由[R]構(gòu)造一個(gè)傳遞閉包作為[R]的模糊等價(jià)矩陣進(jìn)行動(dòng)態(tài)聚類。在依次計(jì)算[R2, R4, …]的基礎(chǔ)上,當(dāng)?shù)谝淮纬霈F(xiàn)[R2k=R2k+1]時(shí),[R2k]即為模糊相似矩陣對應(yīng)的傳遞閉包,并將傳遞閉包的元素從大到小進(jìn)行排序,即[λ1gt;λ2gt;…]。
1.3.4 求出所有λ對應(yīng)的截矩陣[Rλ]
通過預(yù)先設(shè)定[λ=λk],傳遞閉包[t(R)]中大于等于λk的元素取1,小于[λk]的元素取0,即可得到[λk]對應(yīng)的截矩陣。在截矩陣中,若[rij=1],則對應(yīng)的[Xi]和[Xj]歸為一類,由此得到λk水平下的分類結(jié)果。
1.4 ARIMA時(shí)間序列模型
時(shí)間序列法是根據(jù)變量的歷史長序列值對其未來變化趨勢進(jìn)行預(yù)測的方法??紤]到該方法只需光伏出力的歷史數(shù)據(jù)即可有效避免功率曲線對誤差的放大,模型簡單且預(yù)測精度較好,因此常用于超短期和短期預(yù)測[14]。受制于氣象因素的影響,光伏出力呈非平穩(wěn)特征,對于非平穩(wěn)的時(shí)間序列,常用的時(shí)間序列模型為ARIMA([p,d,q])模型,即差分自回歸移動(dòng)平均模型。其中:AR代表自回歸模型,MA代表移動(dòng)平均模型,[p]為自回歸項(xiàng),[d]為將非平穩(wěn)的時(shí)間序列轉(zhuǎn)為平穩(wěn)時(shí)間序列所需的差分次數(shù),[q]為移動(dòng)平均項(xiàng)。具體表達(dá)式為:
[Φ(B)(1-B)dxt=Θ(B)εt]""" (4)
式中:[Φ(B)]——自回歸算子,[Φ(B)=1-φ1B-φ2B2-…-φPBP;][(1-B)d]——差分算子;[xt]——光伏短期出力時(shí)間序列;[Θ(B)]——移動(dòng)平均算子,[Θ(B)=1-θ1B-θ2B2-…-θqBq;][εt]——?dú)埐钚蛄小?/p>
ARIMA模型的建立一般包括時(shí)間序列的平穩(wěn)性檢驗(yàn)、平穩(wěn)化處理、模型定階、參數(shù)估計(jì)以及評估模型等步驟[15]。本文首先采用單位根和白噪聲檢驗(yàn)時(shí)間序列的平穩(wěn)性,運(yùn)用差分法進(jìn)行平穩(wěn)化處理,通過貝葉斯信息準(zhǔn)則(BIC)確定最優(yōu)階數(shù);然后,通過最小二乘法進(jìn)行參數(shù)估計(jì);最后,進(jìn)行殘差檢驗(yàn),完成基于ARIMA模型的光伏短期出力預(yù)測。
1.5 BP神經(jīng)網(wǎng)絡(luò)
反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)是一種基于誤差反向傳播算法的多層前饋神經(jīng)網(wǎng)絡(luò)模型,包括輸入層、隱藏層以及輸出層,具有結(jié)構(gòu)簡單、方便高效的特點(diǎn),在光伏出力預(yù)測方面得到廣泛應(yīng)用[16]。BP模型的使用包括信號(hào)的前向傳播和誤差的反向傳遞兩個(gè)過程。其中,前向傳播是將輸入的信號(hào)經(jīng)過隱藏層的計(jì)算作用于輸出層,產(chǎn)生輸出信號(hào);當(dāng)實(shí)際輸出和預(yù)測輸出相差過大時(shí),進(jìn)入誤差反向傳播過程,通過迭代處理的方法,逐漸對神經(jīng)元之間的連接權(quán)重進(jìn)行優(yōu)化,最終確保實(shí)際輸出與預(yù)測輸出之間的誤差趨于穩(wěn)定并達(dá)到最小。本文采用3層BP神經(jīng)網(wǎng)絡(luò),輸入層的節(jié)點(diǎn)數(shù)量主要取決于PCC法篩選出的主要?dú)庀笠氐臄?shù)量;輸出層為1個(gè)節(jié)點(diǎn),對應(yīng)光伏發(fā)電量;隱藏層的節(jié)點(diǎn)數(shù)通過式(5)確定[17]:
[a=0.43b2+0.12c22.54b+0.77c+0.35+0.51]" (5)
式中:[a]——隱藏層的節(jié)點(diǎn)數(shù)量;[b]——輸入層的節(jié)點(diǎn)數(shù)量;[c]——輸出層的節(jié)點(diǎn)數(shù)量。
1.6 模型預(yù)測性能指標(biāo)
以模型的光伏出力預(yù)測結(jié)果作為輸出參數(shù),對比電站的實(shí)際出力情況,分別選定精確度和相對誤差作為評價(jià)模型預(yù)測性能的主要指標(biāo),定量評估單一模型和組合模型的實(shí)用性和有效性。二者的計(jì)算公式為:
[d=p1-p2p1×100%]"" (6)
[A=1-d] (7)
式中:[d]——相對誤差;[p1]——電站實(shí)際出力,MW;[p2]——模型預(yù)測出力,MW;[A]——模型預(yù)測精確度。
2 案例分析
2.1 案例概述
本文選用的數(shù)據(jù)為云南賓川某光伏發(fā)電站的氣象和短期出力歷史實(shí)測數(shù)據(jù),其中氣象數(shù)據(jù)包括全輻射輻照度、風(fēng)速、風(fēng)向、溫度以及濕度共5類氣象要素。綜合考慮季節(jié)、氣象等因素對光伏出力的影響,且光伏發(fā)電集中在白天,選取氣象和出力數(shù)據(jù)最為完整、準(zhǔn)確的時(shí)段,即2018—2020年夏季(7—9月份)08:00—19:00時(shí)間段為典型時(shí)段,采樣的時(shí)間間隔為15 min,用于驗(yàn)證預(yù)測模型的實(shí)用性。圖2為2018年夏季光伏電站出力的總體變化情況,橫坐標(biāo)為該時(shí)段收集的數(shù)據(jù)數(shù)量,共計(jì)4140個(gè)數(shù)據(jù)(數(shù)字1~4140對應(yīng)2018年7月1日08:00—2018年9月30日19:00的電站出力)。
2.2 變量相關(guān)性分析
采用PCC法對影響光伏出力的五類氣象要素進(jìn)行相關(guān)性分析,分析結(jié)果見表2。如表2所示,全輻射輻照度與出力的相關(guān)程度最高,[r]值達(dá)到0.977,為高度相關(guān);溫度和濕度的相關(guān)程度為顯著相關(guān);至于風(fēng)速和風(fēng)向,相關(guān)性程度較低,可
忽略不計(jì)。根據(jù)相關(guān)性分析結(jié)果,將全輻射輻照度、溫度和濕度作為BP模型的輸入變量,構(gòu)建光伏出力預(yù)測模型。另外,選取全輻射輻照度作為傳遞閉包法提取相似日的關(guān)鍵要素,可為后續(xù)組合預(yù)測模型的構(gòu)建奠定基礎(chǔ)。
2.3 單一模型的預(yù)測結(jié)果分析
2.3.1 ARIMA模型預(yù)測結(jié)果分析
預(yù)先選定2020年9月21—30日作為預(yù)測日,其余作為歷史日進(jìn)行出力預(yù)測。首先對時(shí)間序列進(jìn)行ADF檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量(Test Satistic)[=-6.10lt;ADF(0.05)=-2.37,]且[p]值為0.0000001,表明時(shí)間序列為平穩(wěn)序列,無需再進(jìn)行差分;在白噪聲檢驗(yàn)中,得到[p]遠(yuǎn)小于顯著性水平[α=0.05],拒絕原假設(shè),即該序列不是純隨機(jī)時(shí)間序列,可用來進(jìn)行預(yù)測。表3列出了不同的[AR(p)]和MA(q)條件下的BIC值。其中,BIC值越小,意味著數(shù)據(jù)的擬合效果越好。為了控制計(jì)算量,限定AR(p)和MA(q)的最大階數(shù)不超過4。如表3所示,當(dāng)[p=4,q=3]時(shí),BIC值最小,因此確定ARIMA模型為ARIMA(4,0,3)。
利用ARIMA(4,0,3)模型對光伏短期出力進(jìn)行預(yù)測,表4給出了預(yù)測精度和相對誤差。
如表4所示,預(yù)測的平均精確度為87.97%,平均相對誤差為12.03%。其中,2020年9月22日的預(yù)測精度最高,為92.41%;2020年9月30日的預(yù)測精度最低,為78.40%。分析可知,導(dǎo)致預(yù)測日精度存在很大差異的原因在于光伏短期出力的大小。在該時(shí)期光伏出力普遍偏高的前提下,光伏出力越大,預(yù)測精度越高;相反,光伏出力越小,即光伏出力出現(xiàn)波動(dòng)時(shí),預(yù)測精度越低。其中,2020年9月22日的全天光伏出力總和最大,因此預(yù)測精度最高;相反,2020年9月30日傍晚19:00的光伏出力僅0.13 MW,是所有預(yù)測日在該時(shí)刻出力的最小值,預(yù)測的相對誤差達(dá)637.63%,精確度為[-537.63%],拉低了全天的預(yù)測精度,使得9月30日的預(yù)測精度最低。
2.3.2 BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果分析
本文采用3層BP神經(jīng)網(wǎng)絡(luò),輸入層為3個(gè)節(jié)點(diǎn),分別為全輻射輻照度、溫度和濕度;隱藏層的節(jié)點(diǎn)數(shù)量根據(jù)式(5)計(jì)算后,確定節(jié)點(diǎn)數(shù)量為7;輸出結(jié)果為短期出力,預(yù)測結(jié)果如表5所示。預(yù)測的平均精確度為83.14%,平均相對誤差為16.86%。其中,2020年9月23日的預(yù)測精度最高,為93.30%;2020年9月29日的預(yù)測精度最低,為72.47%。導(dǎo)致預(yù)測精度存在明顯差異的主要原因是19:00(即全天光伏出力的最小時(shí)刻)預(yù)測精度的巨大偏差。其中,2020年9月23日傍晚19:00的預(yù)測精度為83.58%,為所有預(yù)測日在該時(shí)刻預(yù)測精度的最大值;2020年9月29日在該時(shí)刻的預(yù)測精度為[-702.53%],是所有預(yù)測日中預(yù)測精度的最小值,拉低了全天的預(yù)測精度,使得9月29日的預(yù)測精度最低。
2.3.3 單一模型的預(yù)測效果對比分析
圖3為ARIMA模型和BP模型的預(yù)測效果對比情況。如圖3所示,單一的ARIMA模型預(yù)測效果更好,預(yù)測值貼近
真實(shí)值且穩(wěn)定;相反,BP的預(yù)測值在真實(shí)值附近波動(dòng)較大,預(yù)測效果不穩(wěn)定。結(jié)合表4和表5可知,相比于BP模型,ARIMA模型的平均預(yù)測精度提高4.83%。
2.4 組合模型的預(yù)測結(jié)果分析
2.4.1 基于傳遞閉包法的相似日確定
根據(jù)PCC法的分析結(jié)果,選定全輻射輻照度作為傳遞閉包法提取相似日的關(guān)鍵要素;另外,[λ]值越大,意味著歸為一類的氣象日之間的相似程度越高,考慮到樣本量的適當(dāng)增加有助于預(yù)測精度的提升,因此本文選定[λ]的閾值為0.85。表6給出了待預(yù)測日的相似日數(shù)量和對應(yīng)的[λ]值。
2.4.2 考慮相似日的ARIMA模型和BP模型預(yù)測結(jié)果分析
以傳遞閉包法得到的相似日的氣象和出力數(shù)據(jù)信息為訓(xùn)練樣本,分別得到預(yù)測日對應(yīng)的ARIMA(p,d,q)模型(見表7)和BP神經(jīng)網(wǎng)絡(luò)模型。
表8和圖4分別為兩類組合模型的預(yù)測效果和對比情況。如表8所示,PCC-傳遞閉包-ARIMA模型的平均預(yù)測精度為89.27%,平均相對誤差為10.73%;其中2020年9月28日的預(yù)測精度最高,為93.33%;2020年9月30日的預(yù)測精度最低,為80.80%。PCC-傳遞閉包-BP模型的平均預(yù)測精度為91.19%,平均相對誤差為8.81%;其中2020年9月22日的預(yù)測精度最高,為95.91%;2020年9月26日的預(yù)測精度最低,為84.36%。相較于PCC-傳遞閉包-ARIMA模型,PCC-傳遞閉包-BP模型的預(yù)測效果更好,精度提高1.92%。
由圖4可看出,在光伏出力較高的時(shí)段,PCC-傳遞閉包-ARIMA模型的擬合效果好;相反,PCC-傳遞閉包-BP模型的預(yù)測精度更高。其主要原因在于PCC-傳遞閉包-ARIMA模型更多依賴于出力數(shù)據(jù),當(dāng)出力呈現(xiàn)波動(dòng)變化時(shí),其糾錯(cuò)和調(diào)整能力略差,有限的光伏出力更易放大預(yù)測誤差,進(jìn)而拉低整體的預(yù)測精度,這也是PCC-傳遞閉包-ARIMA模型的預(yù)測精度不如PCC-傳遞閉包-BP模型的關(guān)鍵原因所在。由此可見,根據(jù)樣本數(shù)據(jù)的變化特征,建立適于樣本特點(diǎn)且方法原理不同的多樣化預(yù)測模型對于提升預(yù)測精度至關(guān)重要。
圖5為單一模型和組合模型的預(yù)測效果對比情況。相較于兩類單一模型,組合模型的預(yù)測精度均有所提升。其中,PCC-傳遞閉包-ARIMA模型的平均精確度提高1.3個(gè)百分點(diǎn),BP模型的平均精確度提高8.05個(gè)百分點(diǎn)。這也反映利用傳遞閉包法選取相似日的主要優(yōu)勢,即可降低無效樣本的干擾,可為后續(xù)出力預(yù)測模型的構(gòu)建奠定基礎(chǔ)。
prediction models
對比分析單一模型和組合模型的預(yù)測結(jié)果可知,光伏出力偏小時(shí)段的預(yù)測精度明顯較低,且ARIMA模型的受影響程度更大。表9為去除08:00和19:00兩個(gè)時(shí)段,兩個(gè)組合模型的預(yù)測精度和相對誤差。其中,PCC-傳遞閉包-ARIMA模型的平均預(yù)測精度高達(dá)95.34%,平均相對誤差為4.66%;PCC-傳遞閉包-BP模型的平均預(yù)測精度為94.49%,平均相對誤差為5.51%,再次驗(yàn)證了ARIMA模型在高光伏出力時(shí)段的優(yōu)越性以及BP模型在低光伏出力時(shí)段的調(diào)整和糾正能力。
2.5 討 論
為了更好地展示基于傳遞閉包的組合預(yù)測方法的優(yōu)勢和特點(diǎn),筆者廣泛查閱了國內(nèi)外學(xué)者在基于相似日理論的光伏出力預(yù)測方面取得的研究成果,并對各類方法的精確度和相對誤差進(jìn)行量化對比,如表10所示。在出力預(yù)測模型均為BP的前提條件下,采用天氣類型、K-均值算法和綜合相似度指數(shù)選取相似日的組合模型預(yù)測效果較差,相較于傳遞閉包法,精度分別下降6.27個(gè)百分點(diǎn)、3.25個(gè)百分點(diǎn)和1.71個(gè)百分點(diǎn)。其主要原因在于,K-均值算法和以歐氏距離與灰色關(guān)聯(lián)度相結(jié)合的綜合相似度指數(shù)法在預(yù)先劃定歷史日和待預(yù)測日的天氣類型同為晴天、雨天和陰天等類型的基礎(chǔ)上,根據(jù)氣象數(shù)據(jù)的相似程度,從相同天氣類型的歷史日中挑選出相似日。但是,由于天氣類型之間無明確界限,以單一天氣類型的氣象數(shù)據(jù)作為相似日的判定依據(jù),可能導(dǎo)致較大偏差,無法選出與預(yù)測日關(guān)聯(lián)度最高的相似日。相反,模糊聚類方法針對氣象數(shù)據(jù)界限不分明的特點(diǎn),可全面、客觀地選出與預(yù)測日隸屬度最大的樣本。相較于模糊C均值聚類法,傳遞閉包法的理論更成熟,可有效挖掘參數(shù)的不確定信息。因此,采用傳遞閉包法可得到與預(yù)測日相似程度更高的訓(xùn)練數(shù)據(jù),進(jìn)而提高組合模型的預(yù)測精度。至于K-均值-CEEMD-PE-LSTM的組合模型預(yù)測精確度更高,這是因?yàn)镃EEMD和PE算法的有效運(yùn)用,可將電站出力和影響因素?cái)?shù)據(jù)的原始序列分解成多個(gè)具有一定規(guī)律和趨勢的子序列,降低了時(shí)間序列的復(fù)雜度。未來考慮將其與傳遞閉包法進(jìn)行組合,以期進(jìn)一步提高模型的預(yù)測精度。
表10 基于相似日理論的組合預(yù)測模型對比分析
Table 10 Comparison analysis among various combined prediction models based on similar day
[相似日確定方法 出處""" 組合預(yù)測模型""" 精確度/%""" 相對誤差/%" 傳遞閉包法" 本文""" PCC-傳遞閉包-ARIMA""" 89.27"" 10.73"" PCC-傳遞閉包-BP 91.19"" 8.81""" K-均值算法" 文獻(xiàn)[9]" K-均值-CEEMD-PE-LSTM 96.54""" 3.46""" K-均值算法" 文獻(xiàn)[18]" K-均值-BP"" 87.94"" 12.06"" 天氣類型""" 文獻(xiàn)[10]" ARIMA"" 84.06""" 15.94"" ARIMA-BP""" 84.92"" 15.08"" 模糊C均值聚類法""" 文獻(xiàn)[19]" 孤立森林-模糊C均值聚類-BP" 88.04""" 11.96"" 綜合相似度指數(shù)法""" 文獻(xiàn)[20]" 綜合相似度指數(shù)-BP"" 89.48"" 10.52"" ]
3 結(jié) 論
本文以云南賓川某光伏電站為主要研究對象,在分別采用PCC法提取關(guān)鍵氣象要素、傳遞閉包法確定相似日的基礎(chǔ)上,結(jié)合ARIMA時(shí)間序列和BP神經(jīng)網(wǎng)絡(luò),構(gòu)建了PCC-傳遞閉包-ARIMA和PCC-傳遞閉包-BP兩類組合預(yù)測模型,模擬得到指定日期的光伏出力。對比結(jié)果顯示,考慮相似日的組合模型的表現(xiàn)明顯好于傳統(tǒng)的單一模型;其中,在歷史光伏出力普遍偏高的前提下,ARIMA模型在高光伏出力時(shí)段可很好地反映其變化特性,BP模型在低光伏出力時(shí)段則具有更強(qiáng)的適應(yīng)性和調(diào)整能力。與同類型方法的對比結(jié)果顯示,采用數(shù)據(jù)預(yù)處理方法剔除異常值的干擾、降低時(shí)間序列的復(fù)雜度、引入更為先進(jìn)的深度學(xué)習(xí)算法,有助于進(jìn)一步提升組合預(yù)測模型的優(yōu)越性和實(shí)用性。
[參考文獻(xiàn)]
[1]" WAN C, ZHAO J, SONG Y H, et al. Photovoltaic and solar power forecasting for smart grid energy management[J]. CSEE journal of power and energy systems, 2015, 1(4): 38-46.
[2]" 王育飛, 付玉超, 孫路, 等. 基于混沌-RBF神經(jīng)網(wǎng)絡(luò)的光伏發(fā)電功率超短期預(yù)測模型[J]. 電網(wǎng)技術(shù), 2018, 42(4): 1110-1116.
WANG Y F, FU Y C, SUN L, et al. Ultra-short term prediction model of photovoltaic output power based on chaos-rbf neural network[J]. Power system technology, 2018, 42(4): 1110-1116.
[3]" DAS U K, TEY K S, SEYEDMAHMOUDIAN M, et al. Forecasting of photovoltaic power generation and model optimization:" a" review[J]." Renewablenbsp; and"" sustainable energy reviews, 2018, 81: 912-928.
[4]" 吳碩. 光伏發(fā)電系統(tǒng)功率預(yù)測方法研究綜述[J]. 熱能動(dòng)力工程, 2021, 36(8): 1-7.
WU S. Review of power forecasting methods of photovoltaic power generation system[J]. Thermal power engineering, 2021, 36(8): 1-7.
[5]" NB/T 32031—2016, 光伏發(fā)電功率預(yù)測系統(tǒng)功能規(guī)范[S].
NB/T 32031—2016, Function specification of PV power forecasting system[S].
[6]" 舒勝, 謝應(yīng)明, 楊文宇, 等. 光伏發(fā)電預(yù)測方法研究進(jìn)展[J]. 熱能動(dòng)力程, 2020, 35(11): 1-11.
SHU S, XIE Y M, YANG W Y, et al. A review of photovoltaic" power"" generation"" forecasting"" methods[J]. Thermal power engineering, 2020, 35(11): 1-11.
[7]" HAN S, QIAO Y H, YAN J, et al. Mid-to-long term wind and photovoltaic power generation prediction based on copula function and long" short" term" memory" network[J]. Applied energy, 2019, 239: 181-191.
[8]" LI L L, WEN S Y, TSENG M L,et al. Renewable energy prediction:a"" novel"" short-term"" prediction"" model"" of photovoltaic output power[J] .Journal of cleaner production, 2019, 228: 359-375.
[9]" 李秉晨, 于惠鈞, 劉靖宇. 基于Kmeans和CEEMD-PE-LSTM的短期光伏發(fā)電功率預(yù)測[J]. 水電能源科學(xué), 2021, 39(4): 204-208.
LI" B" C," YU" H" J," LIU" J" Y." Prediction" of" short-term photovoltaic power generation based on kmeans and CEEMD-PE-LSTM[J]. Water resources and power, 2021, 39(4): 204-208.
[10]" 趙濱濱, 王瑩, 王彬, 等. 基于ARIMA時(shí)間序列的分布式光伏系統(tǒng)輸出功率預(yù)測方法研究[J]. 可再生能源, 2019, 37(6): 820-823.
ZHAO B B, WANG Y, WANG B, et al. Photovoltaic power prediction in distribution network based on ARIMA model time serie[J]. Renewable energy resources, 2019, 37(6): 820-823.
[11]" 張曉宇. 模糊聚類在優(yōu)化決策中的應(yīng)用[D]. 成都: 西南交通大學(xué), 2016.
ZHANG X Y. The appliccation of fuzzy clustering in the optimization" decision[D]." Chengdu:" Southwest" Jiaotong University, 2016.
[12]" 陳釘均, 孫運(yùn)豪, 李俊捷, 等. 重大疫情下鐵路應(yīng)急救援能力評估指標(biāo)體系構(gòu)建[J]. 交通運(yùn)輸工程學(xué)報(bào), 2020, 20(3): 129-138.
CHEN D J, SHUN Y H, LI J J, et al. Construction of evaluation index system for emergency rescue capacity of rail transit under serious epidemic situation[J]. Journal of traffic and transportation engineering, 2020, 20(3): 129-138.
[13]" 王振東. 基于模糊聚類的鐵路物流園區(qū)規(guī)劃研究[D]. 北京: 中國鐵道科學(xué)研究院, 2019.
WANG Z D. Research on railway logistics park planning based on fuzzy clustering[D]. Beijing: China Academy of Railway Sciences, 2019.
[14]" 李文, 鄧升, 段妍, 等. 時(shí)間序列預(yù)測與深度學(xué)習(xí):文獻(xiàn)綜述與應(yīng)用實(shí)例[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2020, 37(10): 64-70, 84.
LI W, DENG S, DUAN Y, et al. Time series forecasting and deep learning:literature review and empirical example[J]. Computer applications and software, 2020, 37(10): 64-70, 84.
[15]" 陳春俊, 楊露, 何智穎, 等. ARIMA-BP神經(jīng)網(wǎng)絡(luò)高速列車隧道壓力波預(yù)測模型研究[J]. 中國測試, 2021, 47(10): 80-86.
CHEN C J, YANG L, HE Z Y, et al. Research on tunnel pressure wave prediction model of high-speed train based on ARIMA-BP neural network[J]. China measurement amp; testing technology, 2021, 47(10): 80-86.
[16] "張凌浩, 張明, 嵇文路, 等. 基于灰色關(guān)聯(lián)理論和BP神經(jīng)網(wǎng)絡(luò)的分布式光伏電站運(yùn)維數(shù)據(jù)虛擬采集方法[J]. 電力建設(shè), 2021, 42(1): 125-131.
ZHANG L H, ZHANG M, JI W L, et al. Virtual acquisition method for operation data of distributed PV applying the mixture of grey relational theory and BP neural work[J]. Electric power construction, 2021, 42(1): 125-131.
[17]" 高大啟. 有教師的線性基本函數(shù)前向三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)研究[J]. 計(jì)算機(jī)學(xué)報(bào), 1998, 21(1): 80-86.
GAO D Q. On structures of supervised linear basis function feedforward"" three-layered" neural" networks[J]." Chinese journal of computers, 1998, 21(1): 80-86.
[18]" 張雨金, 楊凌帆, 葛雙冶, 等. 基于Kmeans-SVM的短期光伏發(fā)電功率預(yù)測[J]. 電力系統(tǒng)保護(hù)與控制, 2018, 46(21): 118-124.
ZHANG Y J, YNAG L F, GE S Z, et al. Short-term photovoltaic power forecasting based on Kmeans algorithm and support vector machine[J]. Power system protection and control, 2018, 46(21): 118-124.
[19]" 張金金, 張倩, 馬愿, 等. 模糊聚類-Elman神經(jīng)網(wǎng)絡(luò)短期光伏發(fā)電預(yù)測模型[J]. 電測與儀表, 2020, 57(12): 46-51.
ZHANG J J, ZHANG Q, MA Y, et al. Fuzzy clustering-Elman neural network model for short-term photovoltaic power"""" generation"""" prediction[J].""""" Electricity""""" and instrumentation, 2020, 57(12): 46-51.
[20]" HU W, ZHANG X Y, ZHU L J, et al. Short-term photovoltaic power prediction based on similar days and improved" SOA-DBN" model[J]." IEEE" access," 2021," 9(1): 1958-1971.
RESEARCH OF" COMBINED FORECASTING METHOD OF SHORT-TERM PHOTOVOLTAIC POWER ON TRANSITIVE CLOSURE BASED
Li Wei1,Wang Xinpeng1,Xu Ye1,Wang Xu1,Ma Wenjing2
(1. College of Environmental Science and Engineering, North China Electric Power University, Beijing 102206, China;
2. China National Energy Group Technical and Economic Research Institute, Beijing 102211, China)
Abstract:In order to effectively improve the prediction accuracy of short-term photovoltaic power generation and ensure the stable operation of the power grid, this study uses the Pearson Correlation Coefficient (PCC) method to extract relevant meteorological elements and adopts the transitive closure method to determine the similar days. Combining ARIMA time series and BP neural network, two combined prediction models of PCC-transitive closure-ARIMA and PCC-transitive closure-BP are constructed, and used to solve the output prediction problem of a photovoltaic power station in Binchuan, Yunnan. The comparison results demonstrate that, (i) compared with single model, the prediction accuracy of two combination models is improved significantly, where the combined model based on BP neural network has the better performance, with an average prediction accuracy of 91.19%; (ii) ARIMA model is suitable to describe the fluctuation and variation characteristics of photovoltaic output in the period of high-level electricity output ; correspondingly, BP model owns more adjust and correct capability under unfavorable meteorological condition.
Keywords:photovoltaic power; prediction model; factor analysis; Pearson correlation coefficient; transitive closure; ARIMA; BP neural network