陳顥元,蔣瑋,韓俊
(1.東南大學電氣工程學院,江蘇 南京 210096;2.國網(wǎng)江蘇省電力有限公司經(jīng)濟技術研究院,江蘇 南京 210008)
當前,分布式光伏發(fā)電在配電網(wǎng)中的滲透率逐年提升[1—7]。由于光伏發(fā)電系統(tǒng)輸出功率本身具有極強的隨機性和波動性,有效評估配網(wǎng)系統(tǒng)電壓風險的需求變得日益迫切。概率潮流計算是一種評估配網(wǎng)系統(tǒng)電壓風險的重要手段[8—11]。在使用模擬法進行概率潮流計算時,其準確性很大程度上取決于輸入變量建模的準確性[12—15]。因此,在光伏接入評估等計算應用時,應綜合考慮各因素對光伏電站輸出功率的影響,生成典型性的場景模型作為蒙特卡洛方法的抽樣對象[16—18]。
目前,配電系統(tǒng)的光伏輸出功率建模仍不完善,這是由于傳統(tǒng)使用的Beta、Weibull等概率模型往往不能真實地反映實際運行狀態(tài)[19—20]。在光伏高滲透率配電系統(tǒng)中,一個集中區(qū)域內(nèi)往往存在多個光伏電站,其參數(shù)、地理位置和運行時間之間均存在相關性。為考慮電站之間的相關性,文獻[21—22]在光伏電站建模中分別引入了NATAF變換和Cholesky分解。文獻[23]使用Copula函數(shù)直接獲取各光伏電站輸出功率的聯(lián)合概率分布。文獻[24]提出混合Copula函數(shù)建模法,使用歐式距離判定最優(yōu)Copula函數(shù)。該文獻指出:受氣象、光照、運行方式等外界條件影響,各光伏輸出功率之間的相關性可能會發(fā)生變化,單一的概率模型不能很好地應對外界條件的變化。文獻[25]提出利用K-means聚類和Copula函數(shù)來建立多場景概率模型,其中K-means聚類的參數(shù)確定常依賴經(jīng)驗。
針對上述問題,文中引入了一種基于局部密度中心的聚類算法(local density clustering,LDC)。首先,提出考慮相關性的光伏輸出功率多場景模型建立方法。該方法結合LDC聚類方法、核密度估計法和Copula函數(shù),將各光伏輸出功率聯(lián)合分布函數(shù)場景化。其次,對生成的多場景概率分布模型進行抽樣,對生成的樣本進行概率潮流計算。模型考慮多個光伏電站輸出功率間相關性以及輸出功率隨外界條件的變化,可實現(xiàn)配電網(wǎng)多個光伏輸出功率的精準建模。最后,為驗證文中方法的可靠性,將場景優(yōu)化方法應用于某地區(qū)實際配電網(wǎng)結構的節(jié)點系統(tǒng),進行算法性能分析。
為計算概率潮流,須獲得配電網(wǎng)光伏輸出功率以及負荷的概率分布。在估計未知隨機變量的概率密度函數(shù)時,須對已知概率密度函數(shù)的參數(shù)形式進行估計。由于Beta分布、Weibull分布等一些常見的概率密度形式往往不能準確反映實際概率分布,故文中采用核密度的方式進行估計。
核密度估計法要求使用平滑的峰值函數(shù)(即核函數(shù))來擬合數(shù)據(jù)樣本。對于滿足獨立同分布的n個樣本點(x1,x2,…,xn),設其概率密度函數(shù)為f,則核密度估計函數(shù)為:
(1)
式中:K(·)為核函數(shù);h為平滑參數(shù),稱作帶寬;Kh(x)為縮放核函數(shù),如式(2)所示。
(2)
核函數(shù)的選擇需要符合概率密度性質,常用的核函數(shù)包括方波函數(shù)、三角函數(shù)、雙峰曲線、三峰曲線、高斯曲線等。文中選用高斯核函數(shù),即K(x)為高斯分布的概率密度函數(shù),如式(3)所示。
(3)
作為一種非參數(shù)化方法,核密度估計法面對任意的概率分布無須預先假設已知的標準形式。由于該方法具有較好的預期準確度,因此可被用于估計光伏輸出功率和負荷的概率分布情況。
文中采用核密度估計法得出配電網(wǎng)中的各光伏輸出功率,推導出若干單個光伏輸出功率的概率模型。當配電網(wǎng)接入多個光伏電站時,場景生成建模應考慮模型間的相關性。因此,文中采用Copula函數(shù)理論獲取多個光伏電站的聯(lián)合概率分布。
Copula函數(shù)能將多維隨機變量的聯(lián)合分布函數(shù)與各自的邊緣分布函數(shù)連接起來,為求取聯(lián)合分布函數(shù)提供靈活的方法。
對于邊緣分布函數(shù)F1(x1),F2(x2),…,Fn(xn),存在一個Copula函數(shù)C滿足:
F(x1,x2,…,xn)=C[F1(x1),F2(x2),…,Fn(xn)]
(4)
當F1(x1),F2(x2),…,Fn(xn)連續(xù)時,Copula函數(shù)C唯一確定。文中將服從任意分布的xi轉換為均勻分布ui=Fi(xi)。
常用的Copula函數(shù)主要有高斯Copula 函數(shù)、t-Copula函數(shù)、Gumbel Copula函數(shù)、Clayton Copula函數(shù)和Frank Copula函數(shù)等。不同的Copula函數(shù)在描述隨機變量相關性方面具有明顯的差異[26]。Copula函數(shù)的構造步驟為:首先,確定各隨機變量的邊緣分布;然后,選取合適的Copula函數(shù)形式;最后,估計模型中的參數(shù)。
針對以上步驟,文中采用核密度估計的結果作為隨機變量的邊緣分布,選取歐式距離法確定最優(yōu)的Copula形式以描述輸出功率的相關結構,并使用極大似然方法對模型進行參數(shù)估計。文中構建的基于Copula函數(shù)的概率模型可準確描述配電網(wǎng)多個光伏電站輸出功率的概率特性,并反映光伏輸出功率等隨機變量之間的相關性。
基于Copula函數(shù)的光伏電站建模方法考慮了多個輸出功率之間的相關性,但未考慮到相關性可能隨天氣、運行方式等外界因素影響發(fā)生的變化。因此,本節(jié)借助聚類這一數(shù)據(jù)挖掘方法,將單一的概率函數(shù)模型改進為多場景模型。文中使用核密度估計和Copula函數(shù),對每個場景下的數(shù)據(jù)分別估計輸出功率的聯(lián)合概率分布,進行精細化建模。
聚類分析可挖掘數(shù)據(jù)樣本之間的內(nèi)在規(guī)律,該方法已廣泛應用于電力系統(tǒng)的場景生成、故障篩選等領域。由于常見的K-means聚類方法存在對噪音和異常點敏感、依靠經(jīng)驗確定類數(shù)等問題,文中使用LDC聚類算法來確定聚類中心,定義樣本的局部密度作為聚類依據(jù)。該方法可自動生成類數(shù)和聚類中心[27],并剔除異常點。光伏輸出功率LDC聚類流程如圖1所示。
圖1 光伏輸出功率LDC聚類流程Fig.1 Diagramfor LDC clustering of PVoutputs
LDC聚類算法的具體步驟如下:
(1) 假設配電網(wǎng)接入的光伏電站數(shù)量為N,獲取N個電站輸出功率的歷史數(shù)據(jù)構成原始數(shù)據(jù)集P。Pi=(Pi1,Pi2,…,PiN)為數(shù)據(jù)集P內(nèi)的其中一個樣本點,表示某一時刻i下所有光伏電站的輸出功率,是一個N維向量。
(2) 對每個輸出功率樣本點Pi,定義每個樣本點的局部密度函數(shù)ρi為:
(5)
式中:dc為截斷距離,是預先設定的參數(shù);dij為2個樣本點之間的距離。對于函數(shù)χ(a),當a>0時,其值為0,否則為1,如式(5)所示:
(6)
(3) 定義每個樣本點的距離偏量δi,其含義為所有局部密度大于樣本點Pi的樣本點到Pi的距離的最小值,即:
(7)
(4) 確定聚類中心。聚類中心需要滿足以下條件:樣本點本身的局部密度ρi大于周圍點的密度,且樣本的距離偏量δi應盡可能大。綜合考慮以上條件,建立指標ρi×δi。當該指標大于設定的閾值,判定該點為一個聚類中心。
(5) 對其余樣本點歸類。首先,對樣本點按ρi降序排列;其次,選取Pi,Pj,根據(jù)Pi的具體情況選取Pj,Pj滿足局部密度高于ρi且距離值dij最小,把Pj的類別標號賦給Pi;最后,根據(jù)局部密度的降序依次對樣本點進行類別賦值,形成多個場景。
文中建立一個多光伏電站輸出功率模型,該模型將各光伏電站輸出功率的相關性及相關性隨外界條件的變化考慮在內(nèi)。在對數(shù)據(jù)進行LDC聚類后,通過核密度估計法和Copula函數(shù)獲取各光伏電站輸出功率聯(lián)合分布函數(shù),并將其場景化?;诙鄨鼍澳P偷母怕食绷饔嬎懔鞒倘鐖D2所示。
圖2 基于多場景模型的概率潮流計算流程Fig.2 Probabilistic power flow calculation based on multi-scenarios model
場景生成的具體步驟如下:
(1) 獲取配電網(wǎng)絡下所有光伏電站的歷史數(shù)據(jù),并進行數(shù)據(jù)清洗和預處理。
(2) 對數(shù)據(jù)集進行LDC聚類,產(chǎn)生N類場景,按照各場景建模,形成光伏輸出功率多場景模型。
(3) 使用核密度估計方法,按場景獲取各光伏電站的邊緣概率密度函數(shù)。
(4) 對每類場景的邊緣概率密度函數(shù),構建各理論Copula函數(shù),參數(shù)估計使用極大似然估計法。采用歐式距離法得到最優(yōu)Copula函數(shù),以此建模。
(5) 生成光伏輸出功率樣本。首先,使用拉丁超立方抽樣(latin hypercube sampling,LHS)采樣法[28—29]對每個場景下的Copula函數(shù)抽樣。假設總采樣數(shù)量為K,則每一場景下的采樣數(shù)量Ki根據(jù)各場景發(fā)生概率進行確定。其次,對每一類中抽取的樣本進行組合,生成全體光伏輸出功率樣本。
在進行配電網(wǎng)潮流計算時,除了光伏建模,還需考慮各負荷的概率分布。因此,使用核密度估計法進行估計時,先使用LHS采樣法對概率分布進行采樣,生成典型負荷樣本。根據(jù)光伏輸出功率和負荷樣本的典型場景,結合蒙特卡洛法實現(xiàn)各場景的概率潮流計算,進而評估配電網(wǎng)的運行狀態(tài)。
(8)
(9)
式中:μa,i,σa,i分別為基準方法的節(jié)點電壓均值和標準差;μc,i,σc,i分別為計算結果的節(jié)點電壓均值和標準差。
(10)
式中:k為運行次數(shù)。
文中采用的算例基于某地區(qū)某實際配電網(wǎng)結構,相關配電網(wǎng)參數(shù)來源于該實際電網(wǎng)。系統(tǒng)的接線如圖3所示。其中,2臺光伏電站(PV1、PV2) 位于圖1節(jié)點系統(tǒng)中的12、18號節(jié)點。
圖3 配電網(wǎng)系統(tǒng)接線Fig.3 Distribution test system
所有節(jié)點的基準功率為100 MV·A,除0號變電站高壓側節(jié)點的基準電壓為110 kV,其余節(jié)點系統(tǒng)的基準電壓為10 kV。發(fā)電機組的額定容量均為1 MV·A,發(fā)電機組實際輸出功率和各節(jié)點負荷的歷史數(shù)據(jù)來源于實際的用電信息采集系統(tǒng)。
對于PV1、PV2的輸出功率歷史數(shù)據(jù)進行LDC聚類,結果如圖4所示。
圖4 光伏輸出功率聚類結果Fig.4 Clustering Results for PV Output
由圖4的聚類結果可知,光伏輸出功率場景被分為5類,對應5個場景,黑色為離群點。每個場景下,2個光伏電站所有時刻有功輸出功率構成的向量分別為:Pk1,Pk2(k=1,2,3,4,5)。為了對比各個場景下數(shù)據(jù)的相關性變化,統(tǒng)計5個場景和原始樣本Pk1,Pk2之間的皮爾遜相關性系數(shù)ρPk1,Pk2。
(11)
式中:Cov(·)為協(xié)方差函數(shù);σ(·)為標準差函數(shù)。
各場景的相關系數(shù)與原始樣本差異見表1。
表1 皮爾遜系數(shù)相關性分析Table 1 Pearson coefficient analysis
由表1可知,單一的建模方法往往只能反映部分樣本的相關性,無法適應所有樣本。基于LDC聚類的光伏輸出功率多場景生成方法有望解決這一問題。對各場景的輸出功率進行核密度估計,如圖5所示。
圖5為各光伏電站在各場景下的邊緣概率分布,其中坐標軸下方的黑線表示光伏輸出功率在各場景下的樣本,藍色陰影表示通過核密度估計得到的邊緣概率分布。根據(jù)各輸出功率的邊緣概率分布,按場景進行Copula 函數(shù)建模。使用歐式距離法得到該場景下的最優(yōu)Copula函數(shù),并統(tǒng)計各場景樣本占比,生成結果如表2所示。同時對各Copula進行LHS采樣,可得到概率潮流計算所需的樣本。
圖5 各場景下輸出功率邊緣分布Fig.5 PVs′ marginal distribution in different scenarios
表2 各場景Copula模型Table 2 Copula models of each scenario
表3 計算誤差指標對比Table 3 Computing error comparision %
表4 算法穩(wěn)定性分析Table 4 Method′s stability index
根據(jù)計算得到的節(jié)點電壓概率分布,可以計算節(jié)點電壓的期望值和置信區(qū)間,從而評估電壓質量。根據(jù)國網(wǎng)經(jīng)研院相關標準,電壓允許偏差為正負7%,據(jù)此可計算出各節(jié)點電壓的合格率和越限概率。
節(jié)點18在各場景下電壓幅值統(tǒng)計情況如表5所示。各場景下的電壓越限概率差距較大,其中電源輸出功率最大的場景5達到了19.38%。運行與規(guī)劃人員可根據(jù)各場景下電壓越限概率,采取相應的措施以保障系統(tǒng)安全經(jīng)濟運行。
表5 節(jié)點18各場景電壓幅值分析Table 5 Voltage magnitude analysis of node 18 in each scenario
圖6 采樣規(guī)模對計算結果的影響Fig.6 Performance of different sampling number
由圖6可知,對于LDC聚類方法、K-means聚類方法以及傳統(tǒng)蒙特卡洛方法來說,取樣次數(shù)N越大,算法誤差越小。這3種方法均存在一個閾值,在采樣數(shù)量方面提升至閾值后,計算精度的提升十分有限。由圖6可知,文中方法的閾值小于基于K-means方法和蒙特卡洛法的閾值,且達到閾值所需的采樣規(guī)模最低。這意味著,為了達到較為滿意的精度,使用文中方法可采用更小的采樣規(guī)模,從而減小算法的計算負擔。在實際計算中,當誤差達到閾值后,可停止增加采樣數(shù)量。
文中提出了基于LDC聚類的多場景生成方法,用于計算含有光伏接入配電網(wǎng)的概率潮流,從而進行配電網(wǎng)狀態(tài)評估。該方法考慮了光伏輸出功率相關性隨電站運行方式等不同場景發(fā)生變化的情況,實現(xiàn)了更為精確的輸出功率建模。相比于K-means聚類的建模方法,文中方法在計算精度和算法穩(wěn)定性方面均實現(xiàn)了提升。
文中在建立配電網(wǎng)模型時,作出了配電網(wǎng)拓撲不發(fā)生改變的假設。而在中長期配電網(wǎng)的規(guī)劃下,配電網(wǎng)拓撲將發(fā)生改變。因此,后續(xù)可以針對這一情況作出進一步研究。
本文得到國網(wǎng)江蘇省電力有限公司科技項目“考慮光伏接入的配電網(wǎng)電壓風險分析及最優(yōu)接入容量規(guī)劃技術研究”(J2019057)資助,謹此致謝!