摘要:提出一種基于EOF-DBSCAN劃分集群的改進統(tǒng)計升尺度的光伏集群出力預測建模方法。針對傳統(tǒng)統(tǒng)計升尺度方法子集群中光伏電站出力特性不一致問題,通過皮爾遜相關(guān)系數(shù)和經(jīng)驗正交函數(shù)(EOF)優(yōu)化特征空間,再根據(jù)密度聚類模型(DBSCAN)對區(qū)域內(nèi)光伏電站劃分集群,從而增強光伏電站聚類后集群出力特性的一致性。針對待預測日權(quán)重系數(shù)時間序列動態(tài)特性的提取、預測問題,提出一種基于動態(tài)時間規(guī)整(DTW)的相似日選取算法。最后利用循環(huán)神經(jīng)網(wǎng)絡(GRU)模型進行光伏電站出力預測。實驗表明該集群預測方法的平均誤差百分數(shù)(MAPE)約為6.33%,均方根誤差(RMSE)約為13.93kW,均方誤差(MSE)為194.25 kW,通過實際光伏電站數(shù)據(jù)證明了所提方法的準確性和有效性。
關(guān)鍵詞:分布式光伏電站;集群劃分;經(jīng)驗正交函數(shù);DBSCAN聚類算法;動態(tài)時間規(guī)整
中圖分類號:TM615文獻標志碼:A
0引言
當光伏發(fā)電并網(wǎng)達到一定的容量時會威脅到電網(wǎng)系統(tǒng)的安全穩(wěn)定性1-2]。如何確保電網(wǎng)安全運行和提高光伏出力預測的精度是當前亟需解決的問題。光伏電站目前大部分呈分布式狀態(tài),因此分布式光伏發(fā)電集群出力預測是當前新穎的研究方向。
以往的光伏出力預測主要集中光伏電站單體出力預測,分布式光伏電站集群出力預測的相關(guān)研究還較少,集群出力預測的研究主要集中在風電出力預測方面。集群功率預測的方式主要有3種:累加法、外推法和統(tǒng)計升尺度法3。文獻[4]提出一種基于差分整合移動平均自回歸模型(autoregressiveintegrated moving average model,ARIMA)的分布式光伏系統(tǒng)出力預測方法,但該方法存在預測精度較低的問題,不能較好的應用在集群出力預測中;文獻[5]提出一種基于統(tǒng)計升尺度的光伏發(fā)電集群功率預測方法,該方法在劃分集群時未考慮各電站本身出力特性,從而導致集群中電站出力特性不一致,且基準電站的權(quán)重靠相關(guān)性系數(shù)計算,無法反映權(quán)重時間序列上的動態(tài)變化。
對于光伏電站的集群劃分,文獻[6]通過K-均值聚類(K-means clustering algorithm,K-means)將同一地區(qū)光伏電站劃分到不同匯聚區(qū),利用改進的支持向量機(support vectormachine,SVM)代替?zhèn)鹘y(tǒng)的滾動預報形成區(qū)域功率預測模型,但算法預測的精度有待提高;文獻[7]采用層次聚類對光伏數(shù)據(jù)進行聚類,結(jié)合遞歸神經(jīng)網(wǎng)絡(recurrent neural network,RNN)預測模型,通過與其他方法進行對比,該方法驗證了分層聚類比K-均值算法有更高的預測精度。上述聚類方法不能很好地提取光伏電站的特征信息,造成光伏電站集群劃分不準確,密度聚類模型(density-base spatial clustering ofapplications with noise,DBSCAN)聚類有對異常點不敏感,同時無需指定聚類的數(shù)量的優(yōu)勢。
光伏電站單體出力預測作為光伏集群出力預測的根基,國內(nèi)外學者在此領(lǐng)域已有深入研究[8-91。神經(jīng)網(wǎng)絡模型和改進優(yōu)化算法在光伏預測領(lǐng)域已有較多研究。文獻[10]對傳統(tǒng)最大相關(guān)最小冗余(max-relevance and min-redundancy,mRMR)算法的增量搜索過程進行了改進,提出一種可并行篩選多個特征子集的改進mRMR算法,采用極度梯度提升樹(extreme gradient boosting,XGBoost)算法構(gòu)建氣象信息與光伏功率的預測模型;文獻[11]提出一種經(jīng)驗模態(tài)分解(empirical mode decomposition,EMD)、主成分分析(principalcomponentanalysis,PCA)和長短期記憶神經(jīng)網(wǎng)絡(long short-term memory,LSTM)相結(jié)合的光伏功率預測模型,有效提高了光伏預測的精度。門循環(huán)控制單元(gate recurrent unit,GRU)相比于傳統(tǒng)的機器學習算法有更強的學習能力,同時,GRU作為LSTM的一種變體,有效解決了LSTM梯度消失和梯度爆炸的問題。
由于經(jīng)驗正交函數(shù)(empirical orthogonal function,EOF)算法在保留原始信息的前提下可有效壓縮數(shù)據(jù)量,減少訓練時間;DBSCAN聚類對異常點不敏感,非常適合預測模型中訓練數(shù)據(jù)量大,且易出現(xiàn)異常值的領(lǐng)域[12]。本文提出一種基于EOF-DBSCAN-GRU改進統(tǒng)計升尺度的分布式光伏電站發(fā)電量預測方法。針對集群劃分中出現(xiàn)的問題,先采用皮爾遜(Pearson)相關(guān)系數(shù)計算各電站之間的相關(guān)性系數(shù),然后把相關(guān)性系數(shù)、電站地理位置、接入電網(wǎng)母線等級等特征信息根據(jù)經(jīng)驗正交函數(shù)EOF算法重構(gòu)組成更好的特征空間,提升特征質(zhì)量,將重構(gòu)后的特征輸入DBSCAN聚類模型對區(qū)域內(nèi)分布式光伏電站劃分集群。針對權(quán)重時間序列不平穩(wěn),規(guī)律性較差難以預測的問題,采用動態(tài)時間規(guī)整(dynamic timewarping,DTW)計算歷史日期與待預測日期的氣象數(shù)據(jù)時間序列的相似度,選取相似度最高的日期的權(quán)重時間序列作為待預測日的權(quán)重時間序列。在基準電站出力預測任務中,GRU神經(jīng)網(wǎng)絡模型的預測精度優(yōu)于其他模型,能最大程度提升光伏集群出力預測的精度。
1基于EOF-DBSCAN的集群劃分
首先計算出光伏電站之間Pearson相關(guān)性系數(shù):
式中:ry——Pearson相關(guān)性系數(shù);n——樣本量;X、Y——兩個變量的觀測值。
它描述了兩個定距變量間聯(lián)系的緊密程度,用于度量兩個變量X和Y之間的相關(guān)性,如表1所示。
之后將電站相關(guān)性系數(shù)與其他電站原始特征一同構(gòu)成特征矩陣并用EOF優(yōu)化特征空間。首先將原始電站數(shù)據(jù)特征矩陣歸一化處理成矩陣的形式,得到一個新的數(shù)據(jù)矩陣Xx,m為特征數(shù)量,n為時間序列長度。然后計算矩陣Xmxn的協(xié)方差矩陣Cmxm、特征根(λ?,···,λ)和特征向量Vm×n。
式中:X——歸一化后的原始矩陣;XT——X的轉(zhuǎn)置矩陣;Emxm——m×m對角陣;Cmxm——矩陣X的協(xié)方差矩陣;V" ——特征向量組成的矩陣。
將特征空間矩陣特征值λ按從大到小的順序排序,λ?gt;λ?gt;…gt;λm,V,V?,…,Vm為原始場的特征空間特征向量。其中λ越大說明相應特征向量越重要說明貢獻越大。將前K個特征向量的貢獻率相加求和可得到累計貢獻率,累計貢獻率越大則表示利用該K個特征向量構(gòu)建的空間越能表示原始空間,最終將維度為m的原始特征空間優(yōu)化為維度為K的特征空間。
根據(jù)DBSCAN算法對重構(gòu)后的電站特征數(shù)據(jù){(X?,Y),·…,(X,Y,)},m∈[1,M],n∈[1,N]劃分聚類。輸入樣本集為EOF特征重構(gòu)后的電站數(shù)據(jù)D=(x?,X??…,xm),鄰域參數(shù)(e,Minpts),參數(shù)中用ε描述某一樣本的鄰域距離閾值,用Minpts描述某一樣本的距離為ε的鄰域中樣本數(shù)量的閾值。DBSCAN聚類具體步驟為:從樣本中隨機選取一個樣本點P,以P為中心,以ε為半徑,判斷在半徑范圍內(nèi)樣本數(shù)目IN∈(x)I與Minpts的關(guān)系,當IN∈(x)l≥Minpts ,則P為中心點,范圍內(nèi)樣本核心對象,否則為噪聲點,接著將核心對象看作圓心,重復上述步驟,直到遍歷所有樣本點,最終將重構(gòu)后的電站數(shù)據(jù)集劃分成若干子集群。
2基于DTW的相似日選取
利用DTW計算待預測日天氣時間序列與歷史日期天氣時間序列的距離,選取距離最小的歷史日期作為與待預測日近似的相似日。一般度量時間序列相似性主要方法為歐氏距離和動態(tài)時間規(guī)整[13]。但歐式距離對時間序列相似性度量具有一定的弊端,對數(shù)據(jù)中的噪聲具有較強的敏感性,也無法處理時間尺度不一的樣本。氣象數(shù)據(jù)又有一定的波動性,氣象時間序列中可能存在突變值,因此歐氏距離對于氣象時間序列進行度量并不適用。DTW對于計算時間序列相似性可用于等長時間序列也可用于非等長時間序列[14],且對異常值不敏感。DTW算法會在時間序列中自動尋找最佳對齊點的距離作為時間序列距離度量方法。對于長度為M和N的時間序列XM和Y、,生成時間結(jié)點矩陣,表達式為:
計算距離矩陣中時間節(jié)點對的距離,并使其距離之和最小,在算法實現(xiàn)過程中往往將其寫為一個時間對應節(jié)點之間的基距離與到匹配對應時間節(jié)點的最小距離之和的形式,公式為:
式中:D(Xw,Y)——長度為M的Y和長度為N的X兩條時間序列之間的DTW距離;|Xm,Y?|——X時間序列中第m個數(shù)與Y時間序列中第n個數(shù)之間的距離。
3基于GRU的光伏出力預測模型
3.1 GRU光伏預測模型原理
2014年Chung提出門控循環(huán)單元GRU,它作為長短期記憶網(wǎng)絡的一種變體,改進了LSTM的模型,利用其特定的記憶和遺忘板塊可較好地解決時間序列訓練過程中的梯度消失以及梯度爆炸的問題[15-17]。對光伏出力和負荷的時間序列采取動態(tài)時間上的建模時,和LSTM相較GRU減少了門的數(shù)量,既保證了光伏出力預測的精度又降低了預測訓練的時間18]。
將LSTM神經(jīng)網(wǎng)絡中的循環(huán)體單元替代為GRU循環(huán)單元即可得到GRU神經(jīng)網(wǎng)絡的循環(huán)體單元連接圖,GRU網(wǎng)絡循環(huán)單體單元鏈接方式如圖1所示。
GRU網(wǎng)絡的基本結(jié)構(gòu)如圖2所示。
由圖2可見,GRU具有兩個門,分別是更新門z,和重置門r,。GRU實質(zhì)是對LSTM中的遺忘門輸入門兩者進行集成,構(gòu)成一個新的更新門z,用一個重置門r,替換LSTM中的輸出門,決定上一時刻的狀態(tài)將會有哪些被再次寫入到此刻的候選集上,GRU的數(shù)學模型為:
式中:h?-1——上一時刻的狀態(tài)變量;h,——該時刻的狀態(tài)變量;r,——更新門狀態(tài)變量;z,——重置門狀態(tài)變量;h?——此刻候選集狀態(tài);y?——當前狀態(tài);W,、W。、W?、Wh?、W。——輸出向量與x,、h?_1構(gòu)成矩陣相乘得出的權(quán)重、候選集、重置門及更新門;σ——sigmoid激活函數(shù);φ——tanh激活函數(shù)。
GRU將重置門和更新門作為核心,采用sigmoid將輸入序列與前一時刻記憶變量的拼接矩陣變換后更新,并將此更新值輸入更新門,確定前一時刻變量的狀態(tài)對當前狀態(tài)變量的重要程度。在重置門中,確定前一時刻有多少需被寫進候選集中,將h?_1乘以I-z,儲存在前一時刻信息中,再將h?的Z,倍記錄在當前信息,將二者相加作為此刻的輸出19]。
3.2分布式光伏集群出力預測模型結(jié)構(gòu)
利用上述方法的原理,本文構(gòu)建EOF-DBSCAN-GRU分布式光伏集群出力預測模型,預測模型流程圖如圖3所示,預測模型對應的算法步驟如下:
1)首先Pearson相關(guān)系數(shù)計算各電站之間的相關(guān)性系數(shù),然后把相關(guān)性系數(shù)、電站地理位置、接入電網(wǎng)母線等特征一同構(gòu)成特征矩陣。
2)對重新根據(jù)經(jīng)驗正交函數(shù)EOF算法重構(gòu)組成更好的特征空間,提升特征質(zhì)量。
3)將重構(gòu)后的特征輸入DBSCAN聚類模型對區(qū)域內(nèi)分布式光伏電站劃分集群。
4)然后采用DTW計算歷史日期與待預測日期的氣象數(shù)據(jù)時間序列的相似度,選取相似度最高的日期的權(quán)重時間序列作為待預測日的權(quán)重時間序列。
5)對選取的各集群的相似日利用GRU神經(jīng)網(wǎng)絡模型預測,最后根據(jù)權(quán)重時間序列對預測的相似日進行放大得到集群預測結(jié)果。
3.3模型評價指標
本文選擇平均誤差百分數(shù)(mean absolute percentageerror,MAPE)、均方根誤差(root mean squared error,RMSE)與均方誤差(mean square error,MSE)度量預測模型精度,MAPE和RMSE越小,表明預測結(jié)果的精確度越高。
式中:y;——光伏輸出功率的真實值;y——光伏輸出功率的預測值;m——測試樣本集的數(shù)量。
4算例分析
4.1設備參數(shù)特征
該區(qū)域內(nèi)分布式光伏集群出力預測實驗數(shù)據(jù)來源于蕭山區(qū)27個頂棚式分布式光伏電站數(shù)據(jù),包括:板溫、功率、日發(fā)電量、歷史發(fā)電量、交直流電壓、交直流電流、組串數(shù)據(jù),記錄的時間間隔為15 min;氣象數(shù)據(jù)取自中國天氣網(wǎng)2020年10月—2021年9月杭州市蕭山區(qū)的觀測數(shù)據(jù),時間尺度為小時,氣象因子包括環(huán)境氣溫、風向、風級、降水量、相對濕度。
在區(qū)域內(nèi)分布式光伏集群出力預測實驗中,將2020年10月1日—2021年9月21日的電站數(shù)據(jù)與氣象數(shù)據(jù)作為訓練集,2021年9月22日的電站數(shù)據(jù)與氣象數(shù)據(jù)作為測試集,通過歷史電站與光伏電站數(shù)據(jù)來預測未來1天區(qū)域內(nèi)分布式光伏電站出力曲線。
4.2算例結(jié)果對比分析
將27個電站按地理位置進行編號,按地理位置劃分的集群類別結(jié)果如表2所示。
選取電站0,計算該電站日出力與其余電站的日出力皮爾遜相關(guān)系數(shù),得到日出力相關(guān)系數(shù)如表3所示??梢姼麟娬局g出力相關(guān)性系數(shù)均在0.6以上,屬于強相關(guān),個別電站相關(guān)性系數(shù)在0.9以上,相關(guān)性極強,且各電站之間相關(guān)性系數(shù)差異較明顯,便于實現(xiàn)聚類。同理構(gòu)建其他原始特征的日相關(guān)性系數(shù)序列,一同構(gòu)成M×N的特征空間,再根據(jù)EOF優(yōu)化該特征空間,最后對優(yōu)化過后的特征空間進行基于DBSCAN的聚類,從而劃分子集群,按EOF-DBSCAN方法集群劃分結(jié)果如表4所示。
相較于傳統(tǒng)統(tǒng)計升尺度法按地理位置和母線電壓的集群劃分,基于EOF-DBSCAN優(yōu)化后的集群劃分中蘊含的信息更多,集群劃分更細致,子集群的數(shù)量更多。
計算子集群內(nèi)各電站出力與子集群總出力的相關(guān)性系數(shù)大小,選擇相關(guān)性系數(shù)最大的作為基準電站,計算各時刻基準電站出力在其集群總出力的占比,構(gòu)建權(quán)重系數(shù)時間序列。通過觀察該時間序列是否穩(wěn)定可判斷集群劃分的效果,權(quán)重系數(shù)時間序列越穩(wěn)定,集群內(nèi)各電站出力曲線一致性越強。以2021年9月22為例,優(yōu)化統(tǒng)計升尺度法與傳統(tǒng)統(tǒng)計升尺度法的權(quán)重時間序列對比如圖4所示。圖4顯示在基于EOF-DBSCAN集群劃分后,由于集群劃分的標準不但包括了地理位置,還包括通過相關(guān)性系數(shù)度量得到的光伏出力相關(guān)性、氣象條件相關(guān)性等信息,聚類劃分的維度大大增加,聚類得到的類別數(shù)增加了。且由于在聚類劃分中增加了光伏出力相關(guān)性信息,類內(nèi)電站的出力一致性得到了極大的提高,因此權(quán)重時間序列的方差出現(xiàn)了明顯下降,時間序列的波動更加平穩(wěn)。實驗得到的比較結(jié)果也驗證集群內(nèi)電站日出力曲線一致性得到了有效提高。
傳統(tǒng)統(tǒng)計升尺度的權(quán)重時間序列預測是通過計算過去權(quán)重時間序列的均值得出的。為了能更精確的描述待預測日的權(quán)重時間序列,根據(jù)DTW計算氣象時間序列之間的距離來選取相似日,將相似日的權(quán)重時間序列作為待預測日的時間序列。相似日選取的權(quán)重時間序列預測對比如圖5所示。
由圖5可知基于DTW相似日預測的權(quán)重時間序列與真實權(quán)重時間序列擬合狀況良好,傳統(tǒng)方法通過計算歷史時間段的權(quán)重時間序列的均值來表示待預測日的真實權(quán)重時間序列,忽略了日內(nèi)權(quán)重時間序列的變化,基于DTW相似日預測的權(quán)重時間序列能挖掘出日內(nèi)權(quán)重時間序列的波動特性,相較于傳統(tǒng)的均值法能提升模型預測精度。權(quán)重時間序列預測誤差對比如表5所示。由表5可知,相似日選取法的平均誤差百分數(shù)為3.38%,均方根誤差為0.002 kW,均方誤差為6.7×10-?kW,相比于傳統(tǒng)均值法、線性回歸與支持向量機,預測效果有較大提升,能更準確反映權(quán)重時間序列的變化規(guī)律。
在基準電站光伏出力預測實驗中,輸入量包括氣溫、天氣類型、是否降雨氣象數(shù)據(jù),板溫、交/直流電壓/電流光伏器件數(shù)據(jù),采樣頻率為15 min,輸出為待預測日(9月22日)的電站功率。GRU與其他模型的集群預測結(jié)果對比如圖6所示。
從圖6各模型預測結(jié)果對比圖可看出,GRU神經(jīng)網(wǎng)絡模型相較于其他預測模型預測效果較好。計算各模型預測結(jié)果的MAPE、RMSE與MSE,進一步比較各模型的預測精度,各模型預測誤差統(tǒng)計如表6所示。
從各模型的誤差預測表中可看出,GRU網(wǎng)絡模型在輸入變量一致的情況下,與線性回歸、XGBoost、LSTM算法相比,各項指標均有一定提高。GRU模型相較于線性回歸、XGBoost、LSTM模型預測的精度更高,MAPE分別降低了27.34、6.17和0.78個百分點,RMSE分別降低了93.63、29.16 kW和4.88 kW,MSE分別降低了11374.31、1681和159.82。從預測結(jié)果表明,線性回歸模型不適合光伏預測領(lǐng)域,GRU網(wǎng)絡相較于傳統(tǒng)的機器學習模型XGBoost有更好的學習能力,同時GRU也比LSTM有更加高的預測精度,實驗結(jié)果證明了EOF-DBSCAN-GRU的光伏集群出力預測方法的有效性。
5結(jié)論
本文在研究基于傳統(tǒng)統(tǒng)計升尺度的光伏集群出力預測方法的基礎上,針對傳統(tǒng)方法中集群劃分中集群內(nèi)電站出力曲線一致性較弱的問題,提出一種基于EOF-DBSCAN子集群劃分方法,對傳統(tǒng)的根據(jù)地理位置劃分子集群的方法進行改進,先通過經(jīng)驗正交函數(shù)對整體光伏集群電站特征進行分解和提取,將分解提取的向量空間作為DBSCAN算法模型的輸入量進行子集群劃分。對比兩者集群劃分過后的基準電站權(quán)重時間序列,可知基EOF-DBSCAN子集群劃分方法有效提升了集群內(nèi)光伏電站出力曲線的一致性。針對待預測日權(quán)重時間序列選取難,時間序列不平穩(wěn)性較強的問題,提出一種基于DTW的相似日選取法取代傳統(tǒng)的均值代替法,使得權(quán)重時間序列的選取更加合理準確。
最終通過實例驗證,預測了2021年9月22日的區(qū)域內(nèi)電站集群出力數(shù)據(jù)。其中GRU模型相較于線性回歸、XG、LSTM模型預測的精度更高,其MAPE為6.33%,RMSE為13.93 kW、MSE為194.25 kW,預測效果最好。綜上,基于EOF-DBSCAN-GRU的光伏集群出力預測方法預測精度高,具有良好的應用前景。在現(xiàn)有研究中,集群預測主要集中在風電集群預測領(lǐng)域,同時由于獲取的分布式光伏電站的數(shù)據(jù)有限,無法驗證所提的EOF-DBSCAN集群劃分方法在大量光伏電站的劃分效果。GRU對梯度消失問題有所緩解,但不能完全解決;此外GRU模型結(jié)構(gòu)不可并行計算,在數(shù)據(jù)量較小時取得了較好的預測效果,但在數(shù)據(jù)量逐步增大的未來,會極大地影響模型的預測效率。光伏集群預測相關(guān)研究還在進一步研究,以提高光伏預測的精度和效率。
[參考文獻]
[1]趙澤妮,云斯寧,賈凌云,等.基于統(tǒng)計模型的短期風能預測方法研究進展[J].太陽能學報,2022,43(11):224-234
ZHAOZN,YUN SN,JIA LY,etal.Recent progress inshort-term forecasting of wind energy based on statisticalmodels[J].Acta energiaesolaris sinica,2022,43(11):224-234
[2]吳碩.光伏發(fā)電系統(tǒng)功率預測方法研究綜述[J].熱能動力工程,2021,36(8):1-7.
WU S.Review of power forecasting methods of photovoltaicpower generation system[J].Journal of engineering forthermal energy and power,2021,36(8):1-7.
[3]賈凌云,云斯寧,趙澤妮,等.神經(jīng)網(wǎng)絡短期光伏發(fā)電預測的應用研究進展[J].太陽能學報,2022,43(12):88-97.
JIA LY,YUN SN,ZHAOZN,etal.Recent progress ofshort-term forecasting of photovoltaic generation based onartificial neural networks[J].Acta energiaesolaris sinica,2022,43(12):88-97.
[4]趙濱濱,王瑩,王彬,等.基于ARIMA時間序列的分布式光伏系統(tǒng)輸出功率預測方法研究[J].可再生能源,2019,37(6):820-823.
ZHAO B B,WANG Y,WANG B,etal.Photovoltaicpower prediction in distribution network based on ARIMAmodel time series[J].Renewable energy resources,2019,37(6):820-823.
[5]孫榮富,丁華杰,牧晶,等.基于統(tǒng)計升尺度的光伏發(fā)電集群功率預測方法及裝置:CN109978242A[P].2019-07-05.
SUN R F,DING H J,MU J,etal.Photovoltaicpowergeneration cluster power prediction method and devicebased on statistical upscaling:CN109978242A[P].2019-07-05.
[6]張揚科,李剛,李秀峰.基于典型代表電站和改進SVM的區(qū)域光伏功率短期預測方法[J].電力自動化設備,2021,41(11):205-210.
ZHANG YK,LIG,LIXF.Short-term forecasting methodfor regional photovoltaic power based on typicalrepresentative power stations and improved SVM[J].Electric power automation equipment,2021,41(11):205-210.
[7]OUYANG W,YU K M,SODSONG N,etal.Short-termsolar PV forecasting based on recurrent neural network andclustering [C]//2019 International Conference on Imageand Video Processing,and Artificial Intelligence.Shanghai,China,2019.
[8]TINA G M,VENTURA C,F(xiàn)ERLITO S,etal.A state-of-art-review on machine-learning based methods for PV[J].Applied sciences,2021,11(16):7550.
[9]GANDOMAN F H,RAEISI F,AHMADI A.A literaturereview on estimating of PV-array hourly power undercloudy weather conditions[J].Renewable and sustainableenergy reviews,2016,63:579-592.
[10]劉嘉誠,劉俊,趙宏炎,等.基于DKDE與改進mRMR特征選擇的短期光伏出力預測[J].電力系統(tǒng)自動化,2021,45(14):13-21.
LIU J C,LIU J,ZHAO H Y,etal.Short-termphotovoltaic output forecasting based on diffusion kerneldensity estimation and improved max-relevance and Min-redundancy feature selection[J].Automation of electricpower systems,2021,45(14):13-21
[11]張雲(yún)欽,程起澤,蔣文杰,等.基于EMD-PCA-LSTM的光伏功率預測模型[J].太陽能學報,2021,42(9):62-69.
ZHANG Y Q,CHENG Q Z,JIANG W J,etal.Photovoltaic power prediction model based on EMD-PCA-LSTM[J].Acta energiaesolaris sinica,2021,42(9):62-69.
[12]朱瓊鋒,李家騰,喬驥,等.人工智能技術(shù)在新能源功率預測的應用及展望[J].中國電機工程學報,2023,43(8):3027-3048.
ZHU QF,LIJT,QIAO J,etal.Application and prospectof artificial intelligence technology in renewable energyforecasting[J].Proceedings of the CSEE,2023,43(8):3027-3048.
[13]陳海燕,劉晨暉,孫博.時間序列數(shù)據(jù)挖掘的相似性度量綜述[J].控制與決策,2017,32(1):1-11.
CHEN H Y,LIU C H,SUN B.Survey on similaritymeasurement of time series data mining [J].Control anddecision,2017,32(1):1-11.
[14]JEONG Y S,JEONG MK,OMITAOMU O A.Weighteddynamic time warping for time series classification[J].Pattern recognition,2011,44(9):2231-2240.
[15]王志建,張煒健,劉士杰.基于EMD-GRU循環(huán)神經(jīng)網(wǎng)絡的轉(zhuǎn)向交通流量組合預測[J].工業(yè)控制計算機,2020,33(12):73-76.
WANG ZJ,ZHANG WJ,LIU SJ.Combinedforecastingof turning traffic flow based on EMD-GRU recurrent neuralnetwork[J].Industrial control computer,2020,33(12):73-76.
[16]朱偉,孫運全,錢堯,等.基于CEEMD-GRU模型的短期電力負荷預測方法[J].電測與儀表,2023,60(1):16-22.
ZHU W,SUN Y Q,QIAN Y,etal.Short-term loadforecasting method based on complementary ensembleempirical mode decomposition and gated recurrent unitneural network[J].Electrical measurement amp;instrumentation,2023,60(1):16-22.
[17]趙兵,王增平,紀維佳,等.基于注意力機制的CNN-GRU短期電力負荷預測方法[J].電網(wǎng)技術(shù),2019,43(12):4370-4376.
ZHAO B,WANG Z P,JI W J,etal.A short-term powerload forecasting method based on attention mechanism ofCNN-GRU[J].Power system technology,2019,43(12):4370-4376.
[18]王康,張智晟,撤奧洋,等.基于Bagging的雙向GRU集成神經(jīng)網(wǎng)絡短期負荷預測[J].電力系統(tǒng)及其自動化學報,2021,33(10):24-30.
WANG K,ZHANG ZS,HAN A Y,etal.Short-term loadforecasting based on bidirectional GRU neural networkintegrated by bagging algorithm[J].Proceedings of theCSU-EPSA,2021,33(10):24-30.
[19]姚程文,楊蘋,劉澤健.基于CNN-GRU混合神經(jīng)網(wǎng)絡的負荷預測方法[J].電網(wǎng)技術(shù),2020,44(9):3416-3424.
YAO C W,YANG P,LIU Z J.Load forecasting methodbased on CNN-GRU hybrid neural network[J].Powersystem technology,2020,44(9):3416-3424.
RESEARCH ON DISTRIBUTED PV CLUSTER POWER OUTPUTFORECASTING METHOD BASED ON EOF-DBSCAN-GRU
Ma Lübin1,Pan Guobing2,Jiang Qun3,Guo Peng3,Wu Chunhua1,Zhao Yuhang2
(1.ZhejiangHuayun Information Technology Co.,Hangzhou 310030,China;
2.Zhejiang University of Technology,Mechanical and Electrical Institute,Hangzhou 310014,China;
3.State Grid Zhejiang Electric Power Co.,Hangzhou 310063,China)
Abstract:An improved statistical scale-up modeling method for PV cluster output forecasting based on empirical orthogonal function(EOF)and density-base spatial clustering of applications with noise(DBSCAN)is proposed.To solve the problems of inconsistentoutput characteristics of PV power stations in the subgroup of traditional statistical upscaling method,Pearson correlation cofficientandEOF were used to optimize the feature space,and then the PV power stations in the region were divided into clusters according toDBSCANmodel,so as to enhance the consistency of the output characteristics of PV power stations after clustering.Aiming at theproblems of extracting and predicting the dynamic characteristics of time series of weight coefficients of days to be forecasted,asimilarday selection algorithm based on dynamic time warping(DTW)was proposed.Finally,the gate recurent unit(GRU)neural networkmodel is built to predict the power output of PV power stations.Experimental results show that the mean absolute percentage error(MAPE),root mean square error(RMSE)and mean square error(MSE)of the cluster forecasting method are about 6.33%,13.93 and194.25kW.The effectiveness and accuracy of the proposed method are verified by the measured data of actual PV power stations.
Keywords:distributed photovoltaic power generation;clusterdivision;empirical orthogonal function;density-base spatial clusteringof applications with noise;dynamic time warping