曲銳,王世榮,辛文龍
(1.廣東電網(wǎng)有限責(zé)任公司佛山供電局,廣東 佛山 528000;2. 長春工業(yè)大學(xué) 電氣與電子工程學(xué)院,吉林 長春 130000)
暫態(tài)穩(wěn)定評(píng)估是電力系統(tǒng)安全穩(wěn)定分析方法的重要組成部分[1]。隨著我國電力系統(tǒng)規(guī)模的不斷擴(kuò)展,新能源的大規(guī)模并網(wǎng)、電力電子設(shè)備的廣泛應(yīng)用、大區(qū)域互聯(lián)系統(tǒng)的復(fù)雜程度不斷提高,給電網(wǎng)穩(wěn)定運(yùn)行帶來嚴(yán)峻挑戰(zhàn),為避免類似美國、加拿大、西歐大停電事故的再度發(fā)生[2],尋求準(zhǔn)確有效的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估方法具有重要意義[3]。
目前,暫態(tài)穩(wěn)定評(píng)估方法主要以時(shí)域仿真[4]為主、直接法[5]為輔。時(shí)域仿真法具有較高的準(zhǔn)確性,而直接法可尋求系統(tǒng)暫態(tài)穩(wěn)定裕度等優(yōu)點(diǎn),已在電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估領(lǐng)域得到了大量研究和應(yīng)用,并取得很多研究成果[6]。隨著研究的深入,時(shí)域仿真法和直接法2項(xiàng)技術(shù)框架的不足也逐漸顯現(xiàn)出來,主要包括:①時(shí)域仿真法需要求解電力系統(tǒng)的大量代數(shù)和非線性方程,具有計(jì)算速度較慢和無法定量描述的不足,很難滿足在線實(shí)時(shí)評(píng)估的實(shí)際需求[4];②直接法在確定穩(wěn)定裕度時(shí),極限能量的求取受非線性時(shí)變因素的影響,無法適應(yīng)復(fù)雜的系統(tǒng)網(wǎng)絡(luò)拓?fù)洌ㄓ眯院懿?。人工智能方法兼顧時(shí)域仿真和機(jī)器學(xué)習(xí)的優(yōu)勢[7-11],具有精度高、耗時(shí)短、維度低等優(yōu)點(diǎn),已在電力系統(tǒng)實(shí)時(shí)評(píng)估中得到廣泛應(yīng)用[12-14]。
現(xiàn)有支持向量機(jī)(support vector machine, SVM)[15-16]、廣義特征值近端支持向量機(jī)(generalized eigenvalue proximal support vector machine, GEPSVM)等人工智能方法為監(jiān)督學(xué)習(xí)模式,其泛化性能依賴于是否具有足夠的樣本標(biāo)記信息[17-18],只采用有標(biāo)記的樣本數(shù)據(jù)進(jìn)行模型訓(xùn)練;然而,現(xiàn)實(shí)世界中的許多學(xué)習(xí)問題,例如自然語言分析[19]、垃圾郵件過濾[20]等有標(biāo)記數(shù)據(jù)的獲取通常較困難,而未標(biāo)記數(shù)據(jù)的收集更容易,當(dāng)標(biāo)記信息量不足時(shí)監(jiān)督分類器的評(píng)估性能則不是很理想。電力系統(tǒng)暫態(tài)穩(wěn)定的歷史狀態(tài)信息很難表征復(fù)雜多變的穩(wěn)定狀態(tài)情況,而廣域量測信息可很好地表征系統(tǒng)運(yùn)行情況,且廣域量測數(shù)據(jù)相對容易獲??;因此,電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估的標(biāo)記數(shù)據(jù)不足或不準(zhǔn)而未標(biāo)記數(shù)據(jù)無法充分利用問題急需解決。
為解決大量未標(biāo)記數(shù)據(jù)和較少標(biāo)記數(shù)據(jù)的暫態(tài)穩(wěn)定評(píng)估模型訓(xùn)練問題,可采用半監(jiān)督學(xué)習(xí)進(jìn)行模型訓(xùn)練[17]。流形正則化(manifold regularization,MR)具有較好的優(yōu)化結(jié)構(gòu)[21],其在MR框架中引入了2個(gè)正則化項(xiàng),分別用于處理分類器的復(fù)雜性和流形的平滑性。文獻(xiàn)[22]首先將監(jiān)督非平行近端分類器擴(kuò)展到半監(jiān)督模型,并提出拉普拉斯孿生SVM,實(shí)驗(yàn)結(jié)果可證明其有效性;但拉普拉斯孿生SVM的挑戰(zhàn)在于2個(gè)高維二次規(guī)劃問題的求解,計(jì)算效率較低。
針對上述問題,提出一種半監(jiān)督近似流形支持向量機(jī)(manifold proximal support vector machine,MPSVM)用于暫態(tài)穩(wěn)定評(píng)估模型,該模型不僅引入MR技術(shù)從輸入樣本數(shù)據(jù)內(nèi)部捕獲盡可能多的幾何信息,并通過最大距離理論表征電力系統(tǒng)穩(wěn)定類和不穩(wěn)定類之間的差異,即:①通過求解2個(gè)特征值問題確定最優(yōu)超平面,有效避免復(fù)雜的矩陣求逆計(jì)算;②采用貝葉斯非線性分層模型進(jìn)行參數(shù)優(yōu)化,有效提高評(píng)估性能;③MPSVM可充分利用無標(biāo)簽進(jìn)行模型訓(xùn)練,有效提高數(shù)據(jù)利用率和評(píng)估性能。采用IEEE 39標(biāo)準(zhǔn)系統(tǒng)和鞍山電網(wǎng)的仿真分析驗(yàn)證所提評(píng)估模型的有效性和準(zhǔn)確性。
采用二維樣本來分析不同分類器的分類原理,此處每個(gè)樣本包含2個(gè)特征,橫軸為特征1取值范圍,縱軸為特征2取值范圍,如圖1所示。假設(shè)120個(gè)樣本中只有3個(gè)有標(biāo)簽樣本(包括2個(gè)正類和1個(gè)負(fù)類),其余樣本為無標(biāo)簽樣本,如圖1(a)。如果僅采用這3個(gè)有標(biāo)簽樣本進(jìn)行模型訓(xùn)練,SVM和GEPSVM最優(yōu)超平面訓(xùn)練結(jié)果如圖1(b)和圖1(c)所示,誤分類的幾率較大,而利用無標(biāo)簽和有標(biāo)簽樣本的訓(xùn)練結(jié)果如圖1(d),可有效改善評(píng)估性能。
圖1 分類器SVM、GEPSVM和MPSVM的分類原理Fig.1 Classification principles of SVM, GEPSVM and MPSVM
(1)
(2)
鑒于暫態(tài)穩(wěn)定評(píng)估的模型構(gòu)建為非線性優(yōu)化問題,特引入MPSVM的非線性模型。利用2個(gè)核函數(shù)構(gòu)建近端超平面:
(3)
式中:X′為輸入樣本數(shù)據(jù)矩陣的轉(zhuǎn)置;x′為輸入樣本矩單個(gè)樣本的轉(zhuǎn)置;ω1和ω2為法向量分量;b1和b2為偏差分向量;K(·,·)為核函數(shù),例如徑向基核函數(shù)K(u,v)=e-γ‖u-v‖2,核參數(shù)γ>0,進(jìn)而可得如下所示MPSVM的非線性優(yōu)化問題:
(4)
(5)
式中:A∈Rm1×n和B∈Rm2×n分別為正類“+1”和負(fù)類“-1”有標(biāo)簽樣本,m1+m2=l;e1、e2、e為單位矩陣;c1>0為經(jīng)驗(yàn)風(fēng)險(xiǎn)懲罰參數(shù);c2>0為MR參數(shù);L為拉普拉斯乘子。
令Hφ=[K(A,X′)e1],Gφ=[K(B,X′)e2],Jφ=[K,e],v1=[ω1;b1],v2=[ω2;b2],上述優(yōu)化問題可轉(zhuǎn)化為:
(6)
s.t.‖v2‖2=1.
(7)
可通過求解如下方程的特征值λ1、λ2和特征向量,來確定式(6)和式(7)優(yōu)化問題的解:
(8)
(9)
優(yōu)化問題的最優(yōu)解即為式(8)和式(9)最小特征值的特征向量。進(jìn)而確定(ω1,b1)和(ω2,b2),當(dāng)輸入測試樣本x∈Rn,類別標(biāo)號(hào)為i(i=“+1”,“-1”),并可以通過如下判別函數(shù)來確定分類結(jié)果:
(10)
貝葉斯非線性分層模型可通過最大化參數(shù)分布的后驗(yàn),確定最優(yōu)參數(shù)值。貝葉斯非線性分層模型的推斷過程[23]如圖2所示。
圖2 貝葉斯非線性分層模型Fig.2 Bayesian nonlinear layered model
1.2.1 第一層推斷
第一層貝葉斯推斷可解釋為經(jīng)驗(yàn)風(fēng)險(xiǎn)懲罰參數(shù)c1的貝葉斯推斷。將式(6)和式(7)的分類模型定義為H,訓(xùn)練數(shù)據(jù)集用D表示,D的分布為p(D|c1,c2,H),參數(shù)的先驗(yàn)概率為p(D|c2,H),假設(shè)正則化參數(shù)c2給定,經(jīng)驗(yàn)風(fēng)險(xiǎn)懲罰參數(shù)c1的后驗(yàn)概率可通過貝葉斯準(zhǔn)則的第一層推斷獲得,若訓(xùn)練樣本獨(dú)立同分布,且p(D|c1,c2,H)服從高斯分布,則貝葉斯式如下:
(11)
假設(shè)
(12)
(13)
得到:
(14)
(15)
式(11)—(15)中:yi為第i個(gè)樣本的輸出數(shù)據(jù);Cconst為常數(shù)。
式(15)的后2項(xiàng)與經(jīng)驗(yàn)風(fēng)險(xiǎn)懲罰參數(shù)c1無關(guān),因此式(15)的優(yōu)化訓(xùn)練結(jié)果可轉(zhuǎn)化為最大化c1的后驗(yàn)概率,進(jìn)而獲得c1的最優(yōu)值c1MP。
1.2.2 第二層推斷
第二層貝葉斯推斷可解釋為MR參數(shù)的貝葉斯推斷,通過最大化p(c2|D,H)∝p(D|c2,H)p(c2|H)來選擇MR參數(shù)c2。假設(shè)p(c2|H)平坦,正則化參數(shù)c2可由最大化p(D|c2,H)來確定。若在c1=c1MP時(shí),正則化參數(shù)的后驗(yàn)概率服從高斯分布,則c2可通過對c1積分求得:
(16)
其中:
(17)
而Ec1,MP、ED,MP分別為Ec1、ED在c1=c1,MP時(shí)的取值,由文獻(xiàn)[6]可知c2的最優(yōu)值不必通過最大化lnp(D|c2,H)求解,只需令式(16)對c2偏導(dǎo)數(shù)為零,即
2c2Ec1,MP=γ.
(18)
式中γ=k-c2tranceΛ-1。
(19)
(20)
式中:I為單位矩陣;T為調(diào)制矩陣;φ(xi)為中繼調(diào)制矩陣。
若用ρi表示Z的特征值,通過對矩陣進(jìn)行特征向量分解,可得到:
(21)
(22)
式中k為調(diào)制因子。
進(jìn)一步計(jì)算p(D|c2,H)的值,并通過迭代計(jì)算得到MR參數(shù)c2的最優(yōu)取值。
1.2.3 第三層推算
第三層貝葉斯推斷可解釋為核參數(shù)的貝葉斯推斷,可通過計(jì)算模型訓(xùn)練數(shù)據(jù)集D的后驗(yàn)概率和貝葉斯參數(shù)估計(jì)理論對核參數(shù)進(jìn)行推斷估計(jì),獲得MPSVM核參數(shù)的最佳值。D的后驗(yàn)概率為
(23)
同步相量測量單元作為現(xiàn)代電力系統(tǒng)的量測儀器,可持續(xù)不斷地采集系統(tǒng)運(yùn)行數(shù)據(jù),見表1[24]。
表1 同步相量測量單元數(shù)據(jù)Tab.1 Synchronization phasor measurement unit data
由故障后的實(shí)測數(shù)據(jù),構(gòu)建表征電力系統(tǒng)動(dòng)態(tài)特性的原始特征集[8],并應(yīng)用特征選擇方法對原始特征集進(jìn)行特征壓縮,進(jìn)而確定與暫態(tài)穩(wěn)定特性具有較大強(qiáng)相關(guān)的12維特征,見表2,其中包含故障初始時(shí)刻t0和故障清除時(shí)刻tcl的系統(tǒng)特征。
表2 數(shù)據(jù)集的輸入特征量Tab.2 Inputcharacteristic quantity of the data set
由多次故障實(shí)測數(shù)據(jù)確定的特征集,構(gòu)建成電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估的樣本集,并將樣本集隨機(jī)分為用于模型訓(xùn)練的訓(xùn)練集和模型有效性驗(yàn)證的測試集,采用第1.1節(jié)介紹的MPSVM進(jìn)行電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估。
由上述分析可知,本文所提MPSVM評(píng)估方法的暫態(tài)穩(wěn)定評(píng)估流程如圖3所示,其中ROC為接受運(yùn)行特性曲線。
圖3 暫態(tài)穩(wěn)定評(píng)估流程圖Fig.3 Transient stability assessment flow chart
評(píng)估流程主要分為3步:①采用特征選擇方法對原始特征集進(jìn)行特征壓縮;②采用貝葉斯非線性分層模型優(yōu)化參數(shù),改善評(píng)估性能;③基于訓(xùn)練集對MPSVM進(jìn)行離線訓(xùn)練,構(gòu)建暫態(tài)穩(wěn)定評(píng)估模型,同時(shí)計(jì)算評(píng)價(jià)指標(biāo)值。
準(zhǔn)確率指標(biāo)定義為評(píng)估正確樣本數(shù)與樣本總數(shù)的比。Tij表示第i類被評(píng)估為j類樣本數(shù),其中i={0,1},j={0,1},則準(zhǔn)確率為
(24)
統(tǒng)計(jì)值指標(biāo)D可用于評(píng)價(jià)評(píng)估分類和實(shí)際分類的一致性,即
(25)
接受運(yùn)行特性曲線(receiver operating characteristic curve,ROC)指標(biāo)R包括評(píng)估結(jié)果的誤報(bào)率(false positive rate,F(xiàn)PR)函數(shù)fFPR和評(píng)估結(jié)果的命中率(true positive rate,TPR)函數(shù)fTPR,且:
(26)
(27)
綜合評(píng)價(jià)指標(biāo)可表征所提分類器模型在不同評(píng)價(jià)角度的平均性能,且
(28)
利用電力系統(tǒng)仿真軟件PSD-BPA進(jìn)行仿真計(jì)算獲得電力系統(tǒng)的潮流和穩(wěn)定運(yùn)行數(shù)據(jù),發(fā)電機(jī)采用二階模型,負(fù)荷為恒阻抗負(fù)荷,故障類型為三相短路,故障開始和清除時(shí)刻分別為0.1 s和0.3 s,圖4為IEEE 39的系統(tǒng)圖,其中G表示發(fā)電機(jī)。
圖4 新英格蘭10機(jī)39節(jié)點(diǎn)系統(tǒng)Fig.4 New England 10-machine 39-node system
將測試系統(tǒng)的相對功角差最大值Δδmax作為暫態(tài)判據(jù),Δδmax≥360°表示系統(tǒng)失穩(wěn);Δδmax<360°表示系統(tǒng)穩(wěn)定。把獲得的2 400個(gè)樣本構(gòu)成樣本集,隨機(jī)選取樣本集中的1 200樣本用于構(gòu)建評(píng)估模型,其余樣本用于暫態(tài)穩(wěn)定評(píng)估來獲得評(píng)價(jià)指標(biāo)。該算例分析如下:
a)MPSVM評(píng)估模型的準(zhǔn)確性分析。采用4種分類器進(jìn)行暫態(tài)穩(wěn)定評(píng)估,4種分類器包括C-SVM、nu-SVM、GEPSVM和MPSVM,評(píng)價(jià)結(jié)果見表3。
表3 4種分類器的評(píng)價(jià)指標(biāo)Tab.3 Evaluation indicators of 4 classifiers
由表3可知:對比準(zhǔn)確率指標(biāo)A、ROC指標(biāo)R、D指標(biāo),可以發(fā)現(xiàn)MPSVM的準(zhǔn)確率為93.83%,綜合評(píng)價(jià)指標(biāo)值η為0.919 0,均分別高于其他3種分類器,但準(zhǔn)確率指標(biāo)未超過95.00%,初始參數(shù)時(shí)評(píng)估性能有待進(jìn)一步提升。
b)利用貝葉斯非線性分層模型優(yōu)化參數(shù)提高評(píng)估性能。通過貝葉斯非線性分層模型的第二層推斷確定最優(yōu)MR參數(shù)及第三層推斷確定最優(yōu)核參數(shù)后MPSVM的暫態(tài)穩(wěn)定評(píng)估性能,見表4。
表4 貝葉斯參數(shù)優(yōu)化后MPSVM的評(píng)估精度Tab.4 Evaluation accuracy of MPSVM after Bayesian parameter optimization
由表4可知:經(jīng)過貝葉斯非線性分層模型優(yōu)化參數(shù)后的總體評(píng)估性能有所改善,第一層優(yōu)化后由93.83%提高到94.40%,綜合指標(biāo)由0.919 0提高到0.925 0,比未優(yōu)化前略有提高;第二層優(yōu)化選取最優(yōu)MR參數(shù)后,評(píng)估準(zhǔn)確率由94.40%提高到95.25%,綜合指標(biāo)由0.925 0提高到0.934 6;第三層進(jìn)一步優(yōu)化選取最優(yōu)核參數(shù)后,評(píng)估準(zhǔn)確率由95.25%進(jìn)一步提高到96.83%,綜合指標(biāo)由0.934 6進(jìn)一步提高到0.957 6??梢姴煌瑓?shù)對評(píng)估性能的影響較大,合理選擇參數(shù)對提高評(píng)估準(zhǔn)確率具有重要意義。貝葉斯參數(shù)優(yōu)化后4種分類器的評(píng)估精度見表5。由表5可知經(jīng)貝葉斯參數(shù)優(yōu)化后C-SVM、nu-SVM和GEPSVM的綜合評(píng)價(jià)指標(biāo)都有所提高,但仍低于MPSVM的綜合評(píng)價(jià)指標(biāo),進(jìn)一步說明MPSVM較現(xiàn)有分類器具有更高的評(píng)估性能。
c)MPSVM的核函數(shù)分析。采用3種核函數(shù)分析其對MPSVM分類器的影響,3種核函數(shù)包括多項(xiàng)式、線性和徑向基核函數(shù),不同核函數(shù)的評(píng)價(jià)指標(biāo)見表6。
表5 貝葉斯參數(shù)優(yōu)化后4種分類器的評(píng)估精度Tab.5 Evaluation accuracy of 4 classifiers after Bayesian parameter optimization
表6 3種核函數(shù)的MPSVM評(píng)價(jià)指標(biāo)Tab.6 MPSVM evaluation indicators of three kernel functions
由表6可知:MPSVM采用多項(xiàng)式核函數(shù)的綜合評(píng)價(jià)指標(biāo)為0.928 3,在3種核函數(shù)中的綜合評(píng)價(jià)指標(biāo)最小,但也高于表3中C-SVM、nu-SVM和GEPSVM的綜合評(píng)價(jià)指標(biāo);采用徑向基核函數(shù)的綜合評(píng)價(jià)為0.957 6,具有最高的綜合評(píng)價(jià)指標(biāo),因此可選擇徑向基核函數(shù)作為MPSVM的核函數(shù)。
鞍山電網(wǎng)地處遼寧電網(wǎng)中南部,隨著遼寧電網(wǎng)的快速發(fā)展,網(wǎng)架結(jié)構(gòu)不斷加強(qiáng),復(fù)雜性也不斷加劇,其整體穩(wěn)定性問題不斷出現(xiàn),鞍山電網(wǎng)的區(qū)域接線如圖5所示。
圖5 鞍山電網(wǎng)地區(qū)接線圖Fig.5 Anshan power grid area wiring diagram
從鞍山電網(wǎng)共獲得1 000樣本來構(gòu)成樣本集,隨機(jī)選取樣本集的3/4作為訓(xùn)練集,其余作為測試集,暫態(tài)穩(wěn)定評(píng)估結(jié)果見表7。
表7 鞍山電網(wǎng)的暫態(tài)穩(wěn)定評(píng)估結(jié)果Tab.7 Transient stability assessment results of Anshan power grid
由表7可知:在鞍山電網(wǎng)中通過貝葉斯非線性分層模型進(jìn)行第一層參數(shù)優(yōu)化后,評(píng)估準(zhǔn)確率由92.40%提高到94.02%;第二層優(yōu)化選取最優(yōu)MR參數(shù)后,評(píng)估準(zhǔn)確率由94.02%提高到94.40%,綜合指標(biāo)由0.909 1提高到0.932 6;第三層優(yōu)化選取最優(yōu)核參數(shù)后,評(píng)估準(zhǔn)確率由94.40%提高到96.40%,綜合指標(biāo)由0.932 6提高到0.949 2??梢娫趯?shí)際系統(tǒng)通過合理選擇參數(shù)可有效提高評(píng)估準(zhǔn)確率。
本文提出一種基于半監(jiān)督MPSVM的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估方法,通過IEEE 39標(biāo)準(zhǔn)系統(tǒng)和鞍山電網(wǎng)的仿真分析,得出如下結(jié)論:
a)根據(jù)廣域量測信息采集的故障后信息,計(jì)算與電力系統(tǒng)穩(wěn)定性相關(guān)的原始樣本集,并采用特征選擇方法進(jìn)行特征壓縮,可在原始樣本集的基礎(chǔ)上搜索最優(yōu)特征子集,進(jìn)一步減少特征冗余信息,降低特征維數(shù)。
b)利用貝葉斯非線性分層模型確定MPSVM的最優(yōu)參數(shù),可有效改善暫態(tài)穩(wěn)定評(píng)估的性能,分析不同核函數(shù)的評(píng)估性能,同時(shí)得出徑向基核函數(shù)具有最高的評(píng)估準(zhǔn)確率。
c)采用半監(jiān)督學(xué)習(xí)模式,可有效利用無標(biāo)簽樣本數(shù)據(jù)信息,提高評(píng)估準(zhǔn)確率,相較于現(xiàn)有分類器SVM、GEPSVM等具有較高的評(píng)估性能。
本文所提的暫態(tài)穩(wěn)定評(píng)估方法可有效利用電網(wǎng)的無標(biāo)簽數(shù)據(jù)信息來提高評(píng)估準(zhǔn)確率,可以作為電力系統(tǒng)暫態(tài)穩(wěn)定預(yù)警的基礎(chǔ)。如何將所提方法應(yīng)用含大規(guī)模風(fēng)電并網(wǎng)系統(tǒng)的暫態(tài)穩(wěn)定評(píng)估,將是下一步工作的重點(diǎn)。