劉頌凱,黨 喜,崔梓琪,楊 超,阮肇華,袁銘洋
(1.三峽大學(xué)電氣與新能源學(xué)院,湖北宜昌 443002;2.新能源微電網(wǎng)湖北省協(xié)同創(chuàng)新中心,湖北宜昌 443002;3.國網(wǎng)福建寧德供電公司,福建寧德 352100)
隨著電力系統(tǒng)互聯(lián)度及新能源滲透率的不斷提高,電力系統(tǒng)安全穩(wěn)定的內(nèi)在機(jī)理變得更加復(fù)雜,對其進(jìn)行評估變得愈加困難[1-3]。造成大部分大電網(wǎng)停電事故發(fā)生的主要原因是電力系統(tǒng)暫態(tài)失穩(wěn),因此,實(shí)現(xiàn)滿足在線應(yīng)用的暫態(tài)穩(wěn)定評估對于電力系統(tǒng)的穩(wěn)定運(yùn)行有著重要意義[4]。
傳統(tǒng)的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法主要包含時域仿真法和直接法。時域仿真法需要求解電力系統(tǒng)的非線性微分代數(shù)方程組,其計(jì)算量大[5]。直接法[6-9]可以快速計(jì)算并提供穩(wěn)定裕度,但評估結(jié)果較為保守。故傳統(tǒng)方法難以同時滿足在線暫態(tài)穩(wěn)定評估的精度和速度需求。隨著同步相量測量單元(Phasor Measurement Unit,PMU)的應(yīng)用,為基于機(jī)器學(xué)習(xí)的暫態(tài)穩(wěn)定評估奠定基礎(chǔ)[10-11]。傳統(tǒng)的機(jī)器學(xué)習(xí)算法,如決策樹[12-13](Decision Tree,DT)、隨機(jī)森林[14-15](Random Forest,RF)和支持向量機(jī)[16-18](Support Vector Machine,SVM)等由于特征提取能力弱,大多采取“先人工提取特征,然后訓(xùn)練分類模型”的模式,而人工提取特征具有一定主觀性且較耗時耗力[19]。
此外,由于實(shí)際電力系統(tǒng)的魯棒性,系統(tǒng)出現(xiàn)暫態(tài)失穩(wěn)的情況并不頻繁,從而會出現(xiàn)樣本類不平衡問題[20],造成暫態(tài)穩(wěn)定評估模型結(jié)果的準(zhǔn)確性下降[21]。文獻(xiàn)[22]基于改進(jìn)損失函數(shù)加強(qiáng)了失穩(wěn)樣本的擬合程度,增加了對樣本錯誤分類的權(quán)重,但該方法受限于失穩(wěn)場景數(shù)據(jù),在實(shí)際場景應(yīng)用會有些困難。文獻(xiàn)[23]為減輕深度置信網(wǎng)絡(luò)對漏判樣本的影響,將模型分類結(jié)論不同的樣本設(shè)置為不確定樣本,但模型的復(fù)雜度也隨之增加。文獻(xiàn)[24]利用改進(jìn)深度卷積生成對抗網(wǎng)絡(luò)產(chǎn)生新的失穩(wěn)樣本,使得模型對失穩(wěn)樣本的識別率有所提升,但是會造成一些數(shù)據(jù)信息缺失。
本文提出了一種基于改進(jìn)合成少數(shù)過采樣技術(shù)的深度殘差網(wǎng)絡(luò)(Deep Residual Network,ResNet)電力系統(tǒng)暫態(tài)穩(wěn)定評估方法。首先,通過基于平衡迭代規(guī)約層次聚類和邊界中點(diǎn)質(zhì)心的合成少數(shù)過采樣技術(shù)(Balanced Iterative Reducing and Clustering Using Hierarchies and Boundary Midpoint Centroid Synthetic Minority Over-sampling Technique,BIBMCSMOTE)在濾除噪聲的少數(shù)類樣本中合成多樣化的新樣本形成平衡數(shù)據(jù)集;然后,基于ResNet 構(gòu)建電力系統(tǒng)暫態(tài)穩(wěn)定評估模型,解決網(wǎng)絡(luò)退化問題且能有效地提取數(shù)據(jù)特征,在生成平衡數(shù)據(jù)集的基礎(chǔ)上增強(qiáng)了模型的評估性能;最后,基于10 機(jī)39節(jié)點(diǎn)和47 機(jī)140 節(jié)點(diǎn)系統(tǒng)進(jìn)行算例驗(yàn)證,驗(yàn)證結(jié)果表明了本文所提方法的優(yōu)越性。
合成少數(shù)過采樣技術(shù)(Synthetic Minority Oversampling Technique,SMOTE)通過在少數(shù)樣本之間進(jìn)行線性插值合成新的樣本,以達(dá)到平衡數(shù)據(jù)集的作用[25],示意圖如圖1(a)所示。其在合成新樣本時,忽略了一些問題。首先,沒有考慮濾除噪聲樣本的必要性;其次,該算法通過搜索少數(shù)樣本的最近鄰來合成新樣本,可能會使新樣本與舊樣本完全相同;最后,邊界樣本的信息也很重要,忽略邊界樣本將導(dǎo)致最終分類結(jié)果不準(zhǔn)確。本文使用BIBMCSMOTE 算法,可以有效避免以上問題,使用該算法的采樣示意圖如圖1(b)所示。
BI-BMCSMOTE 算法主要分為8 個步驟:
1)為初始數(shù)據(jù)集中的每個少數(shù)類樣本找到K個最近鄰,將K個最近鄰都是多數(shù)類樣本的少數(shù)類樣本視為噪聲,將其濾除,獲取新的少數(shù)類樣本集H,其總個數(shù)為N。然后,將H代入利用層次方法的平衡迭代規(guī)約和聚類(Balanced Iterative Reducing and Clustering Using Hierarchies,BIRCH)算法中,輸出聚類簇C。
2)找到每個少數(shù)類樣本h∈H的K個最近鄰,其中多數(shù)類樣本和少數(shù)類樣本個數(shù)分別標(biāo)記為Kd和Ks。當(dāng)Kd>Ks時,將此樣本設(shè)置為邊界少數(shù)類樣本,從而獲得邊界少數(shù)類樣本集F。
3)計(jì)算每個邊界少數(shù)類樣本fa的抽樣概率Oa:
式中:ρa(bǔ),Kad和分別為邊界少數(shù)類樣本f 的多數(shù)類近鄰樣本密度、個數(shù)和歸一化后的密度分布;M為邊界少數(shù)類樣本總個數(shù)。
4)計(jì)算每個簇Cγ∈C的密度分布dγ:
式中:Nγ為簇Cγ中的樣本個數(shù);Vγ為簇Cγ中樣本點(diǎn)形成的D維超球體積。
式中:G為gamma 函數(shù);rγ為質(zhì)心vγ到簇Cγ中樣本點(diǎn)的最遠(yuǎn)歐氏距離。
5)計(jì)算每個簇Cγ的過采樣權(quán)重Θγ:
式中:L為簇的總個數(shù)。
6)計(jì)算每個簇Cγ中需生成的新樣本數(shù)Nγnew:
將新樣本數(shù)Nγnew按1:1 的比例分為Nγnew1和Nγnew2,其中Nγnew1為該簇Cγ中需合成的邊界少數(shù)類樣本數(shù),Nγnew2為該簇Cγ中需合成的少數(shù)類樣本數(shù)。設(shè)通過步驟3 的抽樣概率選擇的邊界少數(shù)類樣本集為Sγ1,提取的少數(shù)類樣本集為Sγ2。
7)計(jì)算樣本集Sγ1中所有樣本點(diǎn)到質(zhì)心vγ的歐氏距離,所有樣本點(diǎn)按歐氏距離從小到大排序:Sγ1=(y1,…,ymid,ymid+1…yη),排序后的樣本集Sγ1從中間位置ymid分為近心集Ymin=(y1,y2,…,ymid)和遠(yuǎn)心集Ymax=(ymid+1,ymid+2,…yη)。將近心集和遠(yuǎn)心集按順序排列,從2 個集合中各選取1 個樣本點(diǎn)進(jìn)行配對,在配對的兩個樣本點(diǎn)連接中點(diǎn)處合成第一輪新樣本:
式中:yq為近心集中的任一量。
8)將樣本集Sγ2重復(fù)步驟7)中樣本集Sγ1的操作,最終獲得新合成的樣本,并加入到初始數(shù)據(jù)集中形成平衡數(shù)據(jù)集。
深度殘差網(wǎng)絡(luò)是一種改進(jìn)型卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)。CNN 的分類性能很大程度上取決于網(wǎng)絡(luò)深度[26],然而在網(wǎng)絡(luò)達(dá)到一定深度后,梯度消失問題會導(dǎo)致模型性能退化。為解決該問題,本文使用一種深度殘差學(xué)習(xí)框架,其基本思想是在構(gòu)建CNN 時引入恒等映射。ResNet 沒有引入新參數(shù),沒有增加復(fù)雜度,克服了隨著層數(shù)加深導(dǎo)致精度上的飽和問題,更有利于進(jìn)行深度訓(xùn)練[27]。
ResNet 由輸入層、卷積(Convolutiona,Conv)層、激活函數(shù)、批處理歸一化(Batch Normalization,BN)層、多個殘差模塊、均值池化層、全連接層和輸出層構(gòu)成,深度殘差網(wǎng)絡(luò)的結(jié)構(gòu)如圖2 所示。
圖2 殘差網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Residual network structure
卷積層增強(qiáng)了原始圖的信息量,抑制了噪聲的干擾。其中卷積層的卷積核又稱為過濾器,最常用的過濾器是3×3 矩陣和5×5 矩陣。首先,過濾器按照從左至右,從上至下的順序卷積對子矩陣卷積,即先從輸入數(shù)據(jù)的左上角子矩陣進(jìn)行卷積,卷積計(jì)算的結(jié)果經(jīng)過激活函數(shù)得到一個新的特征值;然后,過濾器繼續(xù)與下一個子矩陣卷積,每個子矩陣的大小與過濾器相同;最后,過濾器與輸入數(shù)據(jù)的所有子矩陣分別經(jīng)過卷積和激活函數(shù)計(jì)算后,所有新的特征值構(gòu)成的特征矩陣作為卷積層的輸出。本文選用使網(wǎng)絡(luò)更快地收斂的非線性激活函數(shù)ReLU。
批處理歸一化層將數(shù)據(jù)歸一化為標(biāo)準(zhǔn)高斯分布,并通過減少內(nèi)部協(xié)變量移位,減輕了深度神經(jīng)網(wǎng)絡(luò)對初始參數(shù)的依賴,提高了訓(xùn)練收斂速度和準(zhǔn)確率。
殘差模塊是ResNet 的基本組成模塊,殘差模塊結(jié)構(gòu)如圖3 所示。已知輸入為x,期望輸出的是復(fù)雜潛在映射Γ(x)。殘差模塊不直接學(xué)習(xí)復(fù)雜潛在映射Γ(x),而是通過“捷徑連接”的方式將短路路徑的輸入x 恒等輸出,并將與其殘差路徑的輸出P(x)相加得到復(fù)雜潛在映射Γ(x)。所以目標(biāo)更改為學(xué)習(xí)殘差P(x)=Γ(x)-x,將殘差結(jié)果逼近于0。
圖3 單個殘差模塊Fig.3 Structure of single residual module
令第t 個殘差模塊的輸入為xt,則下一層的輸出可表示為:
式中:wt為殘差函數(shù)對應(yīng)的權(quán)重系數(shù);P(·) 為單個殘差模塊中的映射函數(shù)。
通過迭代,深層的第T個殘差模塊的輸出xT的表達(dá)式為:
根據(jù)反向傳播的鏈?zhǔn)揭?guī)則可得反向過程的梯度為:
式中:σ為深度殘差網(wǎng)絡(luò)的損失函數(shù)。
通過式(9)分析可知,殘差模塊能有效地緩解反向傳播中的梯度消失問題。
均值池化層可以減小下一層輸入數(shù)據(jù)的大小,意味著減小了網(wǎng)絡(luò)參數(shù),降低過擬合的風(fēng)險。全連接層連接輸出層,在2 者之間通常使用Softmax 分類器來獲得最終的分類結(jié)果。Softmax 函數(shù)為:
式中:fj為樣本屬于j類的概率;βj為樣本屬于j類的原始輸出值。
為解決當(dāng)前電力系統(tǒng)受到噪聲干擾和樣本不平衡問題,滿足在線應(yīng)用的要求,本文提出基于BIBMCSMOTE 和深度殘差網(wǎng)絡(luò)的電力系統(tǒng)暫態(tài)穩(wěn)定評估模型,評估流程分為離線訓(xùn)練和在線應(yīng)用2 部分,每部分的具體流程如圖4 所示。
圖4 暫態(tài)穩(wěn)定評估流程圖Fig.4 Flow chart of transient stability evaluation
首先向操作點(diǎn)添加合理的波動,例如系統(tǒng)負(fù)載水平、發(fā)電機(jī)/負(fù)載功率分布、負(fù)載特性的變化和預(yù)想故障等,通過時域仿真計(jì)算獲得初始數(shù)據(jù)集,每個樣本的特征由母線電壓幅值、發(fā)電機(jī)有功和無功功率以及負(fù)荷的有功和無功功率構(gòu)成[20],根據(jù)發(fā)電機(jī)轉(zhuǎn)子功角差建立樣本相應(yīng)的暫態(tài)穩(wěn)定指標(biāo),具體如式(11)和式(12)所示:
式中:δmax為暫態(tài)穩(wěn)定過程中任意2 臺發(fā)電機(jī)功角差的最大絕對值。
判斷系統(tǒng)是否穩(wěn)定的標(biāo)簽y為:
然后,利用BI-BMCSMOTE 算法得到一個更豐富且平衡的數(shù)據(jù)集,有效緩解了類不平衡問題;最后,隨機(jī)將樣本集以7:3 的比例分為訓(xùn)練樣本和測試樣本。將樣本特征作為ResNet 評估模型的輸入,相應(yīng)的暫態(tài)穩(wěn)定指標(biāo)作為ResNet 評估模型的輸出,挖掘輸入和輸出之間的隱藏關(guān)系。訓(xùn)練完畢之后,基于測試集對ResNet 評估模型進(jìn)行性能檢驗(yàn)。
選取與離線訓(xùn)練相同的樣本特征對應(yīng)的數(shù)據(jù)輸入至預(yù)先訓(xùn)練好的暫態(tài)穩(wěn)定評估器中,快速輸出分類結(jié)果。如果當(dāng)前狀態(tài)被確定為暫態(tài)穩(wěn)定,則電力系統(tǒng)將繼續(xù)被監(jiān)視;否則,將向電力系統(tǒng)操作人員發(fā)送預(yù)警信號。
使用混淆矩陣描述ResNet 評估模型對測試集的分類性能,1 表示事件為穩(wěn)定,0 表示事件為失穩(wěn),TP,F(xiàn)N分別表示真實(shí)穩(wěn)定事件預(yù)測為穩(wěn)定和失穩(wěn),F(xiàn)P,TN分別表示真實(shí)失穩(wěn)事件預(yù)測為穩(wěn)定和失穩(wěn),如圖5 所示。
圖5 暫態(tài)穩(wěn)定評估的混淆矩陣Fig.5 Confusion matrix for transient stability evaluation
為使模型的評估結(jié)果更具準(zhǔn)確性需考慮以下2方面因素:(1)穩(wěn)定樣本與失穩(wěn)樣本比例不平衡;(2)漏判將不穩(wěn)定樣本分類為穩(wěn)定樣本,將對系統(tǒng)造成巨大的損失。本文采用整體準(zhǔn)確率Tac、穩(wěn)定樣本分類準(zhǔn)確率Tsr及失穩(wěn)樣本分類準(zhǔn)確率Tur作為性能評價指標(biāo)。3 種性能評價指標(biāo)的計(jì)算公式如式(13)—式(15)所示:
為驗(yàn)證本文所提方法的優(yōu)越性,基于PSS/E 仿真軟件,在以圖6 所示的10 機(jī)39 節(jié)點(diǎn)系統(tǒng)中進(jìn)行暫態(tài)穩(wěn)定研究,此系統(tǒng)包含G1~G10 共10 臺發(fā)電機(jī)、39 條母線和46 條線路。全程仿真過程中,編程語言為python。
圖6 10機(jī)39節(jié)點(diǎn)系統(tǒng)Fig.6 10-machine 39-bus system
在新英格蘭10 機(jī)39 節(jié)點(diǎn)系統(tǒng)中考慮了80%,85%,…,130%共計(jì)11 個負(fù)荷水平,故障主要設(shè)置于每條輸電線路的0%,20%,50%和80%處,且故障類型設(shè)為三相短路故障。故障持續(xù)時間為0.1 s,0.15 s,0.18 s 和0.20 s,仿真持續(xù)時間為6 s,仿真步長為0.01 s??偣采? 984 個樣本,其中穩(wěn)定樣本和不穩(wěn)定樣本分別為4 032 和1 952。
為了分析BI-BMCSMOTE 算法處理樣本類不平衡問題的效果,選取隨機(jī)過采樣(Random Oversampling,ROS),SMOTE,自適應(yīng)合成抽樣(Adaptive Synthetic Sampling,ADASYN)和 BIBMCSMOTE 進(jìn)行比較,分類模型均采用ResNet,測試效果如表1 所示。
表1 各種采樣方法對評估模型的影響Table 1 Influence of various sampling methods on evaluation model
從表1 分析可得,由于初始數(shù)據(jù)集中失穩(wěn)樣本很少,以至于模型對失穩(wěn)樣本的分類準(zhǔn)確率Tur較低。使用ROS,SMOTE,ADASYN 與BI-BMCSMOTE采樣算法都對評估結(jié)果有所提升,但BIBMCSMOTE 算法既考慮了噪聲的影響還考慮了邊界少數(shù)類樣本,相比其它采樣算法,BI-BMCSMOTE算法在處理類不平衡問題上的優(yōu)勢更加明顯。
為驗(yàn)證本文所提方法的優(yōu)越性,基于相同的數(shù)據(jù)集對DT,RF,近鄰算法(K-nearest Neighbor,KNN),CNN 和ResNet 進(jìn)行評估性能對比測試。其中,DT 使用CART 算法,其最大深度設(shè)為18;RF 選擇的最大深度為9;KNN 取最近鄰點(diǎn)數(shù)為15;CNN采用經(jīng)典結(jié)構(gòu),并采用自適應(yīng)矩估計(jì)算法進(jìn)行訓(xùn)練。不同模型評估性能對比如圖7 所示。
圖7 各分類器的性能對比Fig.7 Performance comparison between different classifiers
由圖7 分析可得,本文所使用的ResNet 分類器評價性能指標(biāo)均高于其它基準(zhǔn)模型,說明ResNet 分類器評估性能要優(yōu)于其他基準(zhǔn)評估模型。是由于ResNet 模型更深的網(wǎng)絡(luò)層數(shù)具有更強(qiáng)大的數(shù)據(jù)挖掘能力,使其可以建立更加精確的非線性映射關(guān)系。
在實(shí)際應(yīng)用中,運(yùn)行數(shù)據(jù)不可避免地存在一些噪聲。本實(shí)驗(yàn)通過在測試集中添加高斯白噪聲模擬實(shí)際所產(chǎn)生的測量誤差。添加的噪聲服從N(0,φ),具體構(gòu)造如下:
式中:xa為原測試集;為添加高斯白噪聲的新測試集;τ為服從均值為0、方差為φ的高斯分布;φ的取值范圍為0.01~0.1。
在不同噪聲水平下對各模型的影響如圖8 所示。
圖8 不同噪聲水平對各模型的影響Fig.8 Influence of different noise levels on each model
由圖8 可見,加入高斯白噪聲后各模型的準(zhǔn)確率均有所降低。其中,淺層學(xué)習(xí)模型DT,RF 和KNN 學(xué)習(xí)能力有限,隨著噪聲的增大,整體準(zhǔn)確率有明顯的波動,說明此類模型抗噪能力弱。而CNN模型的整體準(zhǔn)確率曲線趨勢較為平緩,說明CNN 模型具備一定的抗噪能力,但其準(zhǔn)確率仍低于ResNet模型。綜上所述,ResNet 模型即使在高噪聲情況下,依然可以對樣本特征進(jìn)行有效提取,具有良好的評估性能和魯棒性。
為了進(jìn)一步驗(yàn)證本文所提方法在大系統(tǒng)上仍具有同樣的適應(yīng)性,在新英格蘭47 機(jī)140 節(jié)點(diǎn)系統(tǒng)上進(jìn)行算例分析,采用4.1 節(jié)所述方式生成數(shù)據(jù)集。共計(jì)生成2 9520 個樣本,穩(wěn)定樣本和不穩(wěn)定樣本數(shù)量分別為23 885 和5 635?;谛聵颖炯瘜Ω髟u估模型進(jìn)行評估性能測試,評估結(jié)果如圖9 所示。
圖9 140節(jié)點(diǎn)系統(tǒng)各分類器的性能對比Fig.9 Performance comparison between classifiers of 140-bus system
由圖9 可見,雖然仿真系統(tǒng)規(guī)模有所擴(kuò)大,但本文所使用的分類器評估性能仍要高于一般的淺層模型和深層模型,說明本文所提方法在較大系統(tǒng)下依然具有較好的適應(yīng)性。
實(shí)現(xiàn)實(shí)時暫態(tài)穩(wěn)定評估要考慮PMU 測量裝置采集頻率的影響,即評估模型處理每個樣本的時間要小于0.02 s[28]。為進(jìn)一步驗(yàn)證本文所提方法在大、小型節(jié)點(diǎn)系統(tǒng)中的評估性能和對樣本集的處理速度,分別在新英格蘭10 機(jī)39 節(jié)點(diǎn)和47 機(jī)140 節(jié)點(diǎn)系統(tǒng)上進(jìn)行測試,測試結(jié)果如表2 所示。
表2 不同算例規(guī)模耗時和評估性能對比Table 2 Comparison of time consuming and evaluation performance between different example sizes
由表2 可知,在大型節(jié)點(diǎn)系統(tǒng)中,本文所提方法的評估性能略有下降,這是因?yàn)橄到y(tǒng)所含的節(jié)點(diǎn)數(shù)越多,包含的特征量就越多,訓(xùn)練過程更加復(fù)雜,訓(xùn)練模型也就需要越多時間。本文所提方法在2種不同規(guī)模的算例系統(tǒng)中均能保持較好的評估性能,尤其是其失穩(wěn)樣本分類準(zhǔn)確率仍然保持在98%以上,可以極大程度避免系統(tǒng)因漏判而導(dǎo)致的嚴(yán)重后果。在線應(yīng)用過程中,2 種算例規(guī)模評估每個樣本的應(yīng)用耗時都遠(yuǎn)小于0.02 s,能滿足在線應(yīng)用的實(shí)時性要求,具有較高的實(shí)用意義。
本文提出了一種基于BI-BMCSMOTE 和深度殘差網(wǎng)絡(luò)的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法,并在10機(jī)39 節(jié)點(diǎn)系統(tǒng)和47 機(jī)140 節(jié)點(diǎn)系統(tǒng)上進(jìn)行算例分析,得出以下結(jié)論:
1)與其他采樣方法ROS,SMOTE 和ADASYN相比,BI-BMCSMOTE 算法考慮了噪聲影響和邊界少數(shù)類樣本的重要性,提高了ResNet 模型的評估性能。
2)與其他淺層機(jī)器學(xué)習(xí)DT,RF,KNN 和深層機(jī)器學(xué)習(xí)CNN 相比,ResNet 模型不僅具有良好的特征提取能力,還緩解了深層機(jī)器學(xué)習(xí)隨著層數(shù)加深而導(dǎo)致的精度飽和問題,因此該模型更能滿足暫態(tài)穩(wěn)定分類性能評估的準(zhǔn)確性要求。
3)與其他評估方法相比,在含有不同高斯白噪聲水平情況下,本文所提出的基于BMCSMOTE 和ResNet 模型的方法能夠保持較高的整體準(zhǔn)確率,說明文本所提方法具有良好的評估性能和強(qiáng)大的魯棒性。
4)在47 機(jī)140 節(jié)點(diǎn)系統(tǒng)中,ResNet 模型依然有優(yōu)異的評估性能,表現(xiàn)了模型良好的適應(yīng)性。