李 楠,朱 嫄,崔 瑩
考慮代價(jià)敏感的AC-LSTM暫態(tài)穩(wěn)定評(píng)估
李 楠1,2,朱 嫄2,崔 瑩3
(1.現(xiàn)代電力系統(tǒng)仿真控制與綠色電能新技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室(東北電力大學(xué)),吉林 吉林 132012;2.東北電力大學(xué)電氣工程學(xué)院,吉林 吉林 132012;3.廣東電網(wǎng)有限責(zé)任公司珠海供電局,廣東 珠海 519000)
電力系統(tǒng)穩(wěn)定樣本與失穩(wěn)樣本的失衡會(huì)導(dǎo)致數(shù)據(jù)驅(qū)動(dòng)型暫穩(wěn)評(píng)估模型對(duì)失穩(wěn)樣本的漏分率增加,由于失穩(wěn)樣本漏判的代價(jià)遠(yuǎn)高于穩(wěn)定樣本誤判的代價(jià),因此提出一種引入代價(jià)敏感機(jī)制的AC-LSTM電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估模型。通過改進(jìn)Adaboost算法,引入代價(jià)敏感函數(shù)對(duì)樣本權(quán)重進(jìn)行更新,更好地考慮了少數(shù)類樣本對(duì)整體分類準(zhǔn)確率的影響,降低不穩(wěn)定樣本的漏分率。并進(jìn)一步將改進(jìn)的Adaboost算法和長短期記憶網(wǎng)絡(luò)(long short-term memory, LSTM)相結(jié)合以提高分類器的綜合性能。在IEEE39和IEEE140節(jié)點(diǎn)系統(tǒng)上的仿真結(jié)果表明,所提模型較其他模型具有良好的適應(yīng)性和泛化能力,提升了評(píng)估模型的綜合性能,其抗噪能力也優(yōu)于其他模型。
暫態(tài)穩(wěn)定評(píng)估;樣本不平衡;代價(jià)敏感;Adaboost;LSTM
隨著特高壓直流輸電系統(tǒng)和可再生能源的快速發(fā)展[1-3],電網(wǎng)的風(fēng)險(xiǎn)水平和運(yùn)行難度逐漸增加。暫態(tài)穩(wěn)定評(píng)估(transient stability assessment, TSA)是對(duì)電力系統(tǒng)在元器件故障、短路故障等擾動(dòng)后的暫態(tài)穩(wěn)定性進(jìn)行預(yù)先評(píng)估的一種方法[4-5]。如果系統(tǒng)判斷暫態(tài)不穩(wěn)定,就會(huì)觸發(fā)相應(yīng)的緊急控制措施,并導(dǎo)致大規(guī)模停電、電力設(shè)備損壞等情況。因此,暫態(tài)穩(wěn)定評(píng)估對(duì)電網(wǎng)的安全穩(wěn)定運(yùn)行至關(guān)重要[6]。
傳統(tǒng)的時(shí)域仿真法[7-8]和直接法[9]由于計(jì)算量大、耗時(shí)長、抗擾能力差等,不能很好地應(yīng)用于電力系統(tǒng)的在線穩(wěn)定評(píng)估。隨著PMU[10]的廣泛應(yīng)用,機(jī)器學(xué)習(xí)[11-12]可獲取大量樣本進(jìn)行離線訓(xùn)練及更新學(xué)習(xí),基于數(shù)據(jù)驅(qū)動(dòng)的TSA模型具有速度快、精度高等優(yōu)點(diǎn)。但機(jī)器學(xué)習(xí)大多屬于淺層學(xué)習(xí),對(duì)于復(fù)雜電力大數(shù)據(jù)的處理能力有限,難以適應(yīng)真實(shí)電力系統(tǒng)的復(fù)雜評(píng)估。近年來,利用深度學(xué)習(xí)[13-14]來評(píng)估電力系統(tǒng)暫態(tài)穩(wěn)定取得了較大的進(jìn)展,常用的模型有卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)、堆疊自動(dòng)編碼器(stacked auto encoder, SAE)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)和長短期記憶網(wǎng)絡(luò)(long short-term memory, LSTM)等。文獻(xiàn)[15]基于SAE并利用深層模型自動(dòng)提取特征數(shù)據(jù)完成分類評(píng)估。文獻(xiàn)[16]訓(xùn)練CNN模型并與時(shí)域仿真相結(jié)合,提高了CNN的分類性能。上述算法應(yīng)用于TSA時(shí)多以處理靜態(tài)數(shù)據(jù)為主,而RNN及其變形(如LSTM)等模型的出現(xiàn),為處理時(shí)間序列數(shù)據(jù)提供了新的研究思路。文獻(xiàn)[17]將注意力機(jī)制的LSTM模型應(yīng)用于TSA中,有效地處理了時(shí)間序列變量,提高了預(yù)測(cè)精度。
電力系統(tǒng)的運(yùn)行特點(diǎn)決定了電力大數(shù)據(jù)中穩(wěn)定樣本與失穩(wěn)樣本的數(shù)量分布是不均衡的。分類評(píng)估時(shí),即使存在一定的失穩(wěn)樣本被誤分類的情況,由于穩(wěn)定樣本數(shù)量上的優(yōu)勢(shì),評(píng)估模型仍可得到較高的準(zhǔn)確率。但是,如果將不穩(wěn)定樣本誤分為穩(wěn)定樣本,會(huì)給電力系統(tǒng)帶來巨大的安全風(fēng)險(xiǎn)。在已有的研究中,數(shù)據(jù)不平衡[18]問題可在樣本層面和算法層面進(jìn)行改進(jìn)。樣本層面的處理方法大多借助于數(shù)據(jù)采樣法使整體樣本趨于平衡。文獻(xiàn)[19]提出了EasyEnsemble算法對(duì)數(shù)據(jù)集進(jìn)行欠采樣,仿真結(jié)果表明其綜合指標(biāo)和訓(xùn)練時(shí)間皆優(yōu)于不進(jìn)行樣本處理的原算法。但由于欠采樣后的樣本數(shù)要少于原來的樣本數(shù),因此會(huì)造成一些信息缺失。文獻(xiàn)[20]通過SMOTE算法隨機(jī)生成少數(shù)類樣本來均衡樣本類別,但該方法會(huì)導(dǎo)致對(duì)多數(shù)類的錯(cuò)誤分類,從而影響模型的整體平衡。文獻(xiàn)[21]利用改進(jìn)的SMOTE算法在部分少數(shù)類樣本中合成新樣本,間接改變和更新權(quán)重,產(chǎn)生了更好的分類模型。上述方法雖平衡了不同類別樣本的數(shù)量,但未考慮數(shù)據(jù)間的整體關(guān)系,同時(shí)過多地捕捉了訓(xùn)練數(shù)據(jù)中的噪聲,影響了分類邊界的確定,使模型的泛化能力變?nèi)?。算法層面的處理包括模型融合、增量模型和代價(jià)敏感方法。文獻(xiàn)[22]將多種算法通過bagging方法集成,充分發(fā)揮各自模型優(yōu)勢(shì),提高了TSA的分類性能。文獻(xiàn)[23]基于隨機(jī)森林進(jìn)行暫態(tài)穩(wěn)定裕度評(píng)估,相比單個(gè)決策樹提高了模型的泛化能力。文獻(xiàn)[24]使用改進(jìn)的XGBoost算法,在進(jìn)行TSA的同時(shí)減小不穩(wěn)定樣本錯(cuò)誤分類的可能性。上述從算法層面進(jìn)行改進(jìn)的方法在某些噪音較大的分類或回歸問題上會(huì)產(chǎn)生過擬合。文獻(xiàn)[25]提出一種采用焦點(diǎn)損失函數(shù)(focal lossing, FL)的方法來解決樣本的不平衡問題。該方法在平衡交叉熵的基礎(chǔ)上引入調(diào)制因子增大對(duì)少數(shù)樣本的關(guān)注度,其本質(zhì)屬于一種代價(jià)敏感方法。文獻(xiàn)[26]通過引入焦點(diǎn)損失函數(shù),調(diào)整權(quán)重系數(shù)來修正模型訓(xùn)練的傾向性,將其與深度殘差收縮網(wǎng)絡(luò)相結(jié)合實(shí)現(xiàn)TSA模型的改進(jìn)。但焦點(diǎn)損失函數(shù)中超參數(shù)的數(shù)量相對(duì)較多且具有一定的耦合關(guān)聯(lián)性,模型訓(xùn)練時(shí)參數(shù)的微小變化會(huì)導(dǎo)致評(píng)估結(jié)果產(chǎn)生較大的差異性,調(diào)參難度較大。
為減小樣本不平衡對(duì)評(píng)估模型的影響,提升評(píng)估模型的綜合性能,本文將增量模型與代價(jià)敏感相結(jié)合,提出一種改進(jìn)的AC-LSTM (adaboost-lstm based on cost-sensitive learning)暫態(tài)穩(wěn)定評(píng)估模型。該模型在弱分類器迭代構(gòu)建強(qiáng)分器的過程中引入代價(jià)敏感機(jī)制,改進(jìn)樣本權(quán)重更新策略,提高誤分代價(jià)高的樣本權(quán)重,減小分類正確的樣本權(quán)重,從而更多地考慮了少數(shù)類樣本對(duì)分類準(zhǔn)確率的影響。評(píng)估模型在線應(yīng)用時(shí),因獲取的電力數(shù)據(jù)為動(dòng)態(tài)時(shí)間序列,故借助LSTM在處理長時(shí)間序列時(shí)能較好地解決梯度問題的優(yōu)勢(shì),將其與Adaboost算法[27]相結(jié)合,進(jìn)一步提升了評(píng)估模型的綜合性能。并在IEEE39節(jié)點(diǎn)和IEEE140節(jié)點(diǎn)系統(tǒng)上進(jìn)行測(cè)試,驗(yàn)證了所提評(píng)估模型的有效性。
RNN是用于處理序列數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò),當(dāng)時(shí)間間隔增大時(shí),RNN會(huì)出現(xiàn)“梯度消失”問題,嚴(yán)重影響模型處理時(shí)間數(shù)據(jù)的能力。LSTM是RNN網(wǎng)絡(luò)的改進(jìn)模型,該模型通過引入門限機(jī)制來控制信息的累計(jì)速度,并可以選擇地遺忘之前的信息,從而有效地解決了RNN網(wǎng)絡(luò)中的長期依賴問題。LSTM網(wǎng)絡(luò)的時(shí)序結(jié)構(gòu)如圖1所示,其中S是隱藏單元,C是新增的狀態(tài)單元,是輸入時(shí)間序列數(shù)據(jù)。
圖1 LSTM網(wǎng)絡(luò)的時(shí)序結(jié)構(gòu)
式中:為sigmoid函數(shù);表示將上一個(gè)隱層單元的輸出和當(dāng)前輸入連接起來;和分別為遺忘門的權(quán)重和偏置向量。
根據(jù)更新后的單元狀態(tài),輸出門將輸出一個(gè)新的細(xì)胞狀態(tài),計(jì)算和更新方程分別為
式中:(t)為輸出門的輸出;(t)當(dāng)前時(shí)刻狀態(tài)單元的輸出;(t)為當(dāng)前時(shí)刻隱層單元的輸出;和分別為輸出門的權(quán)重和偏置向量。
本文應(yīng)用LSTM基于以下幾點(diǎn)考慮:
1) 具有快速適應(yīng)變化的能力,能深入挖掘電力數(shù)據(jù)特征間的關(guān)聯(lián)性;
2) 可有效解決梯度消失和梯度爆炸的問題,克服時(shí)間序列長期依賴問題,能快速捕捉電力數(shù)據(jù)的實(shí)變動(dòng)態(tài)信息;
3) 對(duì)噪聲有較強(qiáng)的魯棒性。
Adaboost算法是一種具有自適應(yīng)性質(zhì)的Boosting集成學(xué)習(xí)算法,其自適應(yīng)主要表現(xiàn)在每次迭代之后,錯(cuò)誤分類實(shí)例的權(quán)值自動(dòng)增加,而正確分類實(shí)例的權(quán)值自動(dòng)降低。其具體的算法流程如下:
1) 初始化訓(xùn)練樣本權(quán)重。樣本的初始權(quán)重為
2) 更新訓(xùn)練樣本權(quán)重。
(4) 更新訓(xùn)練集上的樣本權(quán)重,用于下一次迭代,更新公式為
化簡后,得
式中,sign(·)為符號(hào)函數(shù)。
Adaboost算法通過迭代更新權(quán)重訓(xùn)練不同的基分類器,加權(quán)構(gòu)成性能更好的強(qiáng)分類器,提高了分類器的精度。同時(shí)通過權(quán)重的更新,使得Adaboost可以專注于困難樣本的分類,以減少訓(xùn)練誤差。
傳統(tǒng)的Adaboost是以決策樹作為基分類器進(jìn)行訓(xùn)練,但決策樹存在以下缺點(diǎn):(1) 針對(duì)不平衡樣本集,決策樹很可能在某些類占主導(dǎo)地位時(shí),創(chuàng)建出有偏異的樹而導(dǎo)致精度下降;(2) 決策樹極易出現(xiàn)過擬合問題,其抗噪能力較差。LSTM具有快速適應(yīng)場景急劇變化的能力,可對(duì)樣本集中隱含的特征進(jìn)行充分挖掘,進(jìn)而提升分類性能,且LSTM能充分逼近復(fù)雜的非線性關(guān)系,對(duì)噪聲有較強(qiáng)的魯棒性和容錯(cuò)能力。本文將以LSTM作為基分類器進(jìn)行訓(xùn)練,算法整體框架如圖3所示。
圖3 Ada-LSTM算法框架
本文將多個(gè)LSTM網(wǎng)絡(luò)通過Adaboost算法的思想經(jīng)過訓(xùn)練構(gòu)建成為強(qiáng)分類器。初始時(shí)每個(gè)樣本的權(quán)重是相同的,在訓(xùn)練過程中通過前一個(gè)網(wǎng)絡(luò)的分類結(jié)果對(duì)下一個(gè)網(wǎng)絡(luò)的樣本權(quán)重進(jìn)行調(diào)整,調(diào)整后的樣本集繼續(xù)訓(xùn)練,直到達(dá)到預(yù)先指定的迭代次數(shù)。最后的分類結(jié)果為將個(gè)學(xué)習(xí)得到的分類器進(jìn)行加權(quán)求和后經(jīng)過符號(hào)函數(shù)的映射值。
由于穩(wěn)定樣本和不穩(wěn)定樣本數(shù)量不平衡,需要設(shè)計(jì)代價(jià)敏感機(jī)制來提高分類器的性能。代價(jià)敏感機(jī)制是為不同類型的錯(cuò)誤分類設(shè)置不同的代價(jià)參數(shù)。由于參數(shù)的調(diào)整,兩類樣本在訓(xùn)練過程中對(duì)模型的調(diào)整程度是不同的,代價(jià)參數(shù)越大的類,其判別性能越好。
評(píng)價(jià)指標(biāo)在分類器的構(gòu)建和性能的評(píng)估中起著重要作用,是指導(dǎo)分類模型參數(shù)調(diào)整的關(guān)鍵,傳統(tǒng)上采用準(zhǔn)確率ACC來衡量模型的性能。然而,當(dāng)樣本類別的數(shù)量不平衡時(shí),多數(shù)樣本的判別結(jié)果主導(dǎo)了模型的性能,因此需要定義更詳細(xì)、具體的指標(biāo)來評(píng)價(jià)模型的性能。本文通過構(gòu)造混淆矩陣來評(píng)估算法的分類效果,混淆矩陣的具體表示如表1所示。
表1 混淆矩陣
在評(píng)估類分布不均衡數(shù)據(jù)的分類性能時(shí),一般使用Gmean。與ACC相比,Gmean值能反映模型對(duì)失穩(wěn)樣本的預(yù)測(cè)效果,重視不平衡數(shù)據(jù)下的少數(shù)類,對(duì)于衡量和評(píng)價(jià)數(shù)據(jù)更有利。故本文選用ACC、FN(誤分率)、FP(漏分率)和Gmean作為評(píng)價(jià)分類性能的指標(biāo),對(duì)模型進(jìn)行評(píng)價(jià),計(jì)算公式分別為
超參數(shù)值的選取是模型獲得最佳性能的關(guān)鍵,本文通過迭代次數(shù)和代價(jià)敏感參數(shù)的聯(lián)合優(yōu)化來訓(xùn)練模型。通過保持其中一個(gè)參數(shù)不變,訓(xùn)練另一個(gè)參數(shù)來實(shí)現(xiàn)兩個(gè)參數(shù)的聯(lián)合優(yōu)化。
迭代次數(shù)即訓(xùn)練基分類器的個(gè)數(shù),每迭代一次即完成一個(gè)基分類器的訓(xùn)練。本節(jié)通過設(shè)置不同的迭代次數(shù)以及樣本不平衡度,觀測(cè)迭代次數(shù)對(duì)評(píng)估模型性能的影響。為消除隨機(jī)因素對(duì)試驗(yàn)結(jié)果的影響,本實(shí)驗(yàn)重復(fù)進(jìn)行200次,取其均值作為最終結(jié)果。以迭代次數(shù)2為步長,仿真結(jié)果如圖4所示。
圖4 迭代次數(shù)及不平衡度對(duì)模型性能影響分析
從圖4結(jié)果可以看出,模型的ACC和Gmean值隨著迭代次數(shù)的增加呈現(xiàn)波動(dòng)上升,并趨于平緩穩(wěn)定的態(tài)勢(shì),該現(xiàn)象的原因如下:(1) 根據(jù)集成學(xué)習(xí)思想,基分類器的疊加效果決定了最終強(qiáng)分類器的分類能力,隨著基分類器個(gè)數(shù)的增加,分類效果會(huì)顯著提升。(2) 理論上隨著迭代次數(shù)的增加,訓(xùn)練的錯(cuò)誤率上界會(huì)逐漸下降,有效地解決了過擬合問題。從仿真結(jié)果看,隨著基分類器數(shù)量的增加,ACC和Gmean呈現(xiàn)小幅值上升并趨向于穩(wěn)定的態(tài)勢(shì),但算法的執(zhí)行效率會(huì)下降,復(fù)雜度急劇上升,算法消耗的時(shí)間成本也相應(yīng)增加。因此,迭代次數(shù)應(yīng)在時(shí)間成本與模型性能間權(quán)衡選擇。(3) 由于模型引入了代價(jià)敏感機(jī)制,數(shù)據(jù)集中不同的樣本平衡度并不影響迭代次數(shù)與模型評(píng)估性能關(guān)系的總體規(guī)律。從圖4(a)中可以看出,當(dāng)?shù)螖?shù)大于25時(shí),ACC和Gmean值波動(dòng)較小;從圖4(b)可以看出,在不同的樣本不平衡度下,模型的性能隨著迭代次數(shù)的增加呈上升趨勢(shì),同樣在迭代25次之后逐漸趨于穩(wěn)定。考慮到時(shí)間成本和評(píng)估性能之間的平衡,本文在下面的仿真中將基分類器的數(shù)量設(shè)置為25。
3種方案的模型性能如表2所示(仿真中樣本的不平衡度為4)。
表2 不同方案下的模型性能
由表2可知,代價(jià)敏感參數(shù)的取值影響了分類器的性能。在電力系統(tǒng)TSA的實(shí)際應(yīng)用中,不穩(wěn)定樣本漏分所造成的損失更為嚴(yán)重,方案1無法有效提高不平衡樣本在訓(xùn)練過程中的權(quán)重;而方案3穩(wěn)定樣本的誤分率雖比方案1高,但其不穩(wěn)定樣本的漏分率明顯優(yōu)于其他方案,減小了由于對(duì)失穩(wěn)樣本誤判引發(fā)電力安全事件的機(jī)率,有效地發(fā)揮了代價(jià)敏感學(xué)習(xí)算法的優(yōu)越性。因此,下文中將代價(jià)調(diào)整函數(shù)中的權(quán)重參數(shù)10設(shè)置為穩(wěn)定樣本與失穩(wěn)樣本的數(shù)量比值。
本節(jié)將引入代價(jià)敏感的方法與其他處理不平衡樣本問題的方法進(jìn)行對(duì)比,測(cè)試結(jié)果如表3所示。SMOTE算法和欠采樣為數(shù)據(jù)層面的改進(jìn),RF、XGBoost和FL-LSTM為算法層面的模型。其中本文所提AC-LSTM中LSTM模型的超參數(shù)設(shè)置如下:采用Adam優(yōu)化算法,網(wǎng)絡(luò)層數(shù)為2,Batchsize為64,學(xué)習(xí)率為0.001,Epoch為100,隱層單元設(shè)為50,激活函數(shù)為sigmoid函數(shù),整體AC-LSTM的迭代次數(shù)為25,代價(jià)調(diào)整函數(shù)中權(quán)重參數(shù)10設(shè)置為穩(wěn)定樣本與失穩(wěn)樣本的數(shù)量比值,在本節(jié)中設(shè)置為4。RF基分類器數(shù)量為70,最大深度為10;XGBoost基分類器數(shù)量為100,最大深度為10;FL-LSTM模型的超參數(shù)權(quán)重和調(diào)節(jié)因子分別設(shè)置為0.25和2,其LSTM的參數(shù)設(shè)置同AC-LSTM模型中一致。
表3 處理不平衡樣本問題的不同方法對(duì)比
由表3可以看出,基于代價(jià)敏感模型AC-LSTM的失穩(wěn)樣本FP是最低的,從而大大減少了在實(shí)際問題中不穩(wěn)定樣本被誤分為穩(wěn)定樣本的情況,在一定程度上避免了嚴(yán)重的后果。代價(jià)敏感模型穩(wěn)定樣本的誤分率FN相對(duì)其他算法略高,F(xiàn)N是將穩(wěn)定樣本誤分為不穩(wěn)定樣本,其對(duì)電力系統(tǒng)的安全風(fēng)險(xiǎn)影響不大,且本文所提模型的Gmean和ACC最優(yōu),綜合評(píng)估性能最好。
在IEEE39節(jié)點(diǎn)和IEEE140節(jié)點(diǎn)系統(tǒng)上對(duì)本文所提模型進(jìn)行了測(cè)試。電力系統(tǒng)仿真軟件為中國電科院的PSD-BPA,編程語言為python,計(jì)算機(jī)配置為R7-5800 CPU/RTX 3060Ti/16GB RAM。
電力系統(tǒng)運(yùn)行工況參數(shù)設(shè)置如下:
3) 故障發(fā)生時(shí)刻為0 s,在故障發(fā)生后 0.1 s、0.15 s、0.18 s、0.2 s故障切除;
4) 總仿真時(shí)長為10 s,仿真步長為0.01 s,取故障清除后12個(gè)周波的數(shù)據(jù);
5) 在故障后一段時(shí)間內(nèi),系統(tǒng)任意2臺(tái)發(fā)電機(jī)之間功角差大于360o,則判定系統(tǒng)失穩(wěn),反之穩(wěn)定。
母線電壓作為系統(tǒng)的潮流數(shù)據(jù),對(duì)故障的響應(yīng)比轉(zhuǎn)子角快[28],能準(zhǔn)確反映系統(tǒng)的運(yùn)行情況,且可通過PMU量測(cè)得到。因此本文取故障清除后的母線電壓幅值構(gòu)建模型的輸入特征集。
IEEE39節(jié)點(diǎn)系統(tǒng)通過仿真獲取樣本12 240個(gè),其中穩(wěn)定樣本8123個(gè),不穩(wěn)定樣本4117個(gè)。對(duì)于IEEE140節(jié)點(diǎn)系統(tǒng)通過仿真獲取樣本22 026個(gè),其中穩(wěn)定樣本16 744個(gè),不穩(wěn)定樣本5281個(gè)。并按照8:1:1的比例劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集。
為驗(yàn)證本文所提AC-LSTM評(píng)估模型的有效性,將其與DT、KNN、SVM、Adaboost、LSTM及Ada-LSTM評(píng)估模型進(jìn)行對(duì)比。上述模型在兩套不同電力系統(tǒng)上的對(duì)比結(jié)果如表4所示。其中AC-LSTM的超參數(shù)設(shè)置同2.6節(jié);DT采用CART算法,評(píng)估指標(biāo)為基尼系數(shù),最大深度設(shè)置為7;KNN中的超參數(shù)值為6,距離參數(shù)為2,即使用歐氏距離度量;SVM使用徑向基函數(shù)作為核函數(shù),其中超參數(shù)懲罰因子的取值為[10-4, 104]、核函數(shù)參數(shù)的取值為[2-8, 28];Adaboost基分類器使用CART分類樹,最大深度為10;LSTM和Ada-LSTM模型中的LSTM參數(shù)與AC-LSTM中的參數(shù)一致。
由表4可以看出,相較于其他評(píng)估模型,本文所提AC-LSTM模型的ACC和Gmean最高。與Ada-LSTM模型相比,AC-LSTM在兩套電力系統(tǒng)上對(duì)不穩(wěn)定樣本的漏分率分別降低了2.83%和0.67%,這是因?yàn)橛?xùn)練集中樣本的不平衡度分別為2和3,代價(jià)敏感模型更傾向于區(qū)分不穩(wěn)定樣本,使穩(wěn)定樣本與不穩(wěn)定樣本之間的數(shù)量不平衡對(duì)模型的影響得到有效的修正,從而提高了評(píng)價(jià)模型的整體準(zhǔn)確性和Gmean,證明了改進(jìn)的有效性。
表4 兩套電力系統(tǒng)上不同評(píng)估模型的性能對(duì)比
為進(jìn)一步說明本文所提算法對(duì)不平衡類樣本分類性能的影響,設(shè)置多組不同的樣本不平衡度進(jìn)行實(shí)驗(yàn),其中IEEE39節(jié)點(diǎn)系統(tǒng)的樣本不平衡度設(shè)置為2、3、4、5、6,IEEE140節(jié)點(diǎn)系統(tǒng)的樣本不平衡度設(shè)置為3、4、5、6,得到兩套系統(tǒng)在不同樣本不平衡度下的模型性能對(duì)比,如圖5所示。
圖5 兩套系統(tǒng)在不同樣本不平衡度下的模型性能對(duì)比
傳統(tǒng)的學(xué)習(xí)算法在不平衡數(shù)據(jù)中具有較大的局限性。從圖5可以看出,隨著數(shù)據(jù)集不平衡度的增加,其他模型在Gmean上的性能表現(xiàn)得越來越差,而本文所提的AC-LSTM模型具有較好的穩(wěn)健性。
在實(shí)際應(yīng)用中,PMU在測(cè)量并采集電力數(shù)據(jù)時(shí)必定存在噪聲污染問題。為了驗(yàn)證所提評(píng)估模型對(duì)PMU測(cè)量噪聲的魯棒性,本節(jié)在兩套電力系統(tǒng)上,對(duì)PMU測(cè)量時(shí)受到兩類噪聲干擾進(jìn)行仿真實(shí)驗(yàn)。當(dāng)信噪比分別為40 dB、30 dB、20 dB時(shí),在兩類噪聲影響下各模型的TSA結(jié)果如表5和表6所示。
第1組是對(duì)原始樣本集均勻加入不同程度的高斯白噪聲來模擬測(cè)量誤差;第2組為突發(fā)噪聲,這種噪聲反映了測(cè)量值的隨機(jī)突變性,在任意給定時(shí)刻,考慮每個(gè)發(fā)電機(jī)的測(cè)量值有0.1的概率發(fā)生噪聲污染,因此該類噪聲要比均勻噪聲更真實(shí)。
從表5和表6可以看出,在兩類噪聲的干擾下,對(duì)比模型的ACC及Gmean都受到一定程度的影響。但本文提出的AC-LSTM評(píng)估模型,ACC仍能保持在98%以上,且精度下降程度也比其他模型輕微,對(duì)PMU噪聲具有良好的魯棒性。另外,通過對(duì)比表5和表6可以看出,整體上加入突發(fā)噪聲所造成的影響要比第1組的小,第2組的ACC和Gmean普遍比第1組的高,且隨著噪聲水平的變化下降緩慢,由于突發(fā)噪聲具有隨機(jī)性且小概率加入,其評(píng)估性能比較穩(wěn)定。
為驗(yàn)證所提模型在拓?fù)渥兓系挠绊?,本文隨機(jī)切除一條線路,并提取母線電壓幅值構(gòu)造數(shù)據(jù)集。先對(duì)完整拓?fù)涞臄?shù)據(jù)集進(jìn)行訓(xùn)練,再將-1下得到的數(shù)據(jù)集作為測(cè)試集進(jìn)行測(cè)試,并與其他模型所得結(jié)果進(jìn)行對(duì)比,ACC和Gmean測(cè)試結(jié)果如圖6所示。
表5 兩套電力系統(tǒng)上不同程度高斯白噪聲下各模型性能對(duì)比
表6 兩套電力系統(tǒng)上不同程度突變?cè)肼曄赂髂P托阅軐?duì)比
由圖6可以看出,由于拓?fù)浣Y(jié)構(gòu)發(fā)生變化,各算法的性能與完整拓?fù)湎碌男阅芟啾却蟠蠼档?,但本文所提AC-LSTM模型的ACC和Gmean均高于其他模型,因此具有較強(qiáng)的適應(yīng)性和泛化能力。
本文提出了以LSTM為基分類器,并通過改進(jìn)Adaboost算法訓(xùn)練構(gòu)造的AC-LSTM評(píng)估模型。該模型引入了代價(jià)敏感機(jī)制,對(duì)樣本分類不平衡問題進(jìn)行處理,旨在減少由于失穩(wěn)樣本漏分造成的電力重大安全事故。在IEEE39節(jié)點(diǎn)和IEEE140節(jié)點(diǎn)系統(tǒng)上進(jìn)行了仿真分析,得到以下結(jié)論:
1) 與其他機(jī)器學(xué)習(xí)構(gòu)造的評(píng)估模型相比,本文所提模型具有優(yōu)良的綜合性能及可靠性。此外,引入的代價(jià)敏感機(jī)制提高了失穩(wěn)樣本的識(shí)別準(zhǔn)確率,從而降低失穩(wěn)樣本的漏分率,并優(yōu)于其他處理樣本不平衡的方法,具有更好的分類性能。
2) 對(duì)于數(shù)據(jù)采集存在噪聲的問題,通過添加兩類不同的噪聲進(jìn)行仿真分析,本文所提模型仍具有較高的ACC和Gmean,對(duì)噪聲具有較好魯棒性。
3) 當(dāng)面對(duì)拓?fù)渥兓那闆r時(shí),本文所提模型雖比其他對(duì)比模型具有更強(qiáng)的適應(yīng)性和泛化能力,但仍未達(dá)到理想效果。因此,如何提取出未訓(xùn)練的拓?fù)渥兓c已知拓?fù)渲g的特征相似性,提升拓?fù)浣Y(jié)構(gòu)改變時(shí)分類器的性能,以及如何選擇合理的更新方案,是未來研究的重點(diǎn)。
[1] 李欣悅, 李鳳婷, 尹純亞, 等. 直流雙極閉鎖故障下送端系統(tǒng)暫態(tài)過電壓計(jì)算方法[J]. 電力系統(tǒng)保護(hù)與控制, 2021, 49(1): 1-8.
LI Xinyue, LI Fengting, YIN Chunya, et al. Transient overvoltage calculation method of HVDC sending-end system under DC bipolar blocking[J]. Power System Protection and Control, 2021, 49(1): 1-8.
[2] 王璐, 李鳳婷, 尹純亞, 等. 考慮直流電流變化的HVDC系統(tǒng)不對(duì)稱故障換相失敗分析[J]. 電力系統(tǒng)保護(hù)與控制, 2021, 49(1): 17-23.
WANG Lu, LI Fengting, YIN Chunya, et al. Analysis of asymmetric fault commutation failure in an HVDC system with DC current variation[J]. Power System Protection and Control, 2021, 49(1): 17-23.
[3] 文勁宇, 周博, 魏利屾. 中國未來電力系統(tǒng)儲(chǔ)電網(wǎng)初探[J]. 電力系統(tǒng)保護(hù)與控制, 2022, 50(7): 1-10.
WEN Jinyu, ZHOU Bo, WEI Lishen. Preliminary study on an energy storage grid for future power system in China[J]. Power System Protection and Control, 2022, 50(7): 1-10.
[4] KUNDUR P, PASERBA J, AJJARAPU V, et al. Definition and classification of power system stability[J]. IEEE Transactions on Power Systems, 2004, 19(3): 1387-1401.
[5] REN Chao, XU Yan, ZHANG Yuchen. Post-disturbance transient stability assessment of power systems towards optimal accuracy-speed tradeoff[J]. Protection and Control of Modern Power Systems, 2018, 3(2): 194-203.
[6] YUAN Minyu. Research on risk assessment and planning of distribution networks integrating large-scale distributed photovoltaics[D]. Hefei: Hefei University of Technology, 2020.
[7] 汪芳宗. 大規(guī)模電力系統(tǒng)暫態(tài)穩(wěn)定性數(shù)值計(jì)算方法[M]. 北京: 科學(xué)出版社, 2013.
[8] 曹樹立, 汪芳宗, 劉濤, 等. 基于二次向量場的暫態(tài)穩(wěn)定性快速數(shù)值計(jì)算方法[J]. 電力系統(tǒng)保護(hù)與控制, 2021, 49(10): 37-42.
CAO Shuli, WANG Fangzong, LIU Tao, et al. Fast transient stability simulation using the quadratic vector field method[J]. Power System Protection and Control, 2021, 49(10): 37-42.
[9] CHANG H D, CHU C C, CAULEY G. Direct stability analysis of electric power systems using energy functions: theory, applications, and perspective[J]. Proceedings of the IEEE, 1995, 83(11): 1497-1529.
[10] APPASANI B, JHA A V, MISHRA S K, et al. Communication infrastructure for situational awareness enhancement in WAMS with optimal PMU placement[J]. Protection and Control of Modern Power Systems, 2021, 6(1): 124-135.
[11] 劉雷濤. 基于機(jī)器學(xué)習(xí)的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估[D]. 北京: 華北電力大學(xué), 2017.
LIU Leitao. Transient stability assessment of power system based on machine learning[D]. Beijing: North China Electric Power University, 2017.
[12] 葉圣永, 王曉茹, 劉志剛, 等.基于受擾嚴(yán)重機(jī)組特征及機(jī)器學(xué)習(xí)方法的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估[J]. 中國電機(jī)工程學(xué)報(bào), 2011, 31(1): 46-51.
YE Shengyong, WANG Xiaoru, LIU Zhigang, et al. Power system transient stability assessment based on severely disturbed generator attributes and machine learning method[J]. Proceedings of the CSEE, 2011, 31(1): 46-51.
[13] 胡偉, 鄭樂, 閔勇, 等. 基于深度學(xué)習(xí)的電力系統(tǒng)故障后暫態(tài)穩(wěn)定評(píng)估研究[J]. 電網(wǎng)技術(shù), 2017, 41(10): 3140-3146.
HU Wei, ZHENG Le, MIN Yong, et al. Research on power system transient stability assessment based on deep learning of big data technique[J]. Power System Technology, 2017, 41(10): 3140-3146.
[14] 劉謀海, 胡軍華, 丁國棟, 等. 基于深度學(xué)習(xí)的電力監(jiān)控視頻超分辨率重建[J]. 電力系統(tǒng)保護(hù)與控制, 2021, 49(11): 181-187.
LIU Mouhai, HU Junhua, DING Guodong, et al. Super- resolution reconstruction of a power monitoring video based on deep learning[J]. Power System Protection and Control, 2021, 49(11): 181-187.
[15] 朱喬木, 陳金富, 李弘毅, 等. 基于堆疊自動(dòng)編碼器的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估[J]. 中國電機(jī)工程學(xué)報(bào), 2018, 38(10): 2937-2946.
ZHU Qiaomu, CHEN Jinfu, LI Hongyi, et al. Transient stability assessment based on stacked autoencoder[J]. Proceedings of the CSEE, 2018, 38(10): 2937-2946.
[16] 田芳, 周孝信, 史東宇, 等. 基于卷積神經(jīng)網(wǎng)絡(luò)綜合模型和穩(wěn)態(tài)特征量的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估[J]. 中國電機(jī)工程學(xué)報(bào), 2019, 39(14): 4025-4032.
TIAN Fang, ZHOU Xiaoxin, SHI Dongyu, et al. Transient stability assessment of power system based on convolutional neural network comprehensive model and steady-state characteristic quantities[J]. Proceedings of the CSEE, 2019, 39(14): 4025-4032.
[17] WANG X, ZHOU Q, HUANG C, et al. A transient stability assessment method using LSTM network with attention mechanism[C] // 2019 IEEE 8th International Conference on Advanced Power System Automation and Protection (APAP), October 21-24, 2019, Xi’an, China: 120-124.
[18] TAN B, YANG J, TANG Y, et al. A deep imbalanced learning framework for transient stability assessment of power system[J]. IEEE Access, 2019, 7: 81759-81769.
[19] LIU X Y. Exploratory under-sampling for class- imbalance learning[C] // Sixth International Conference on Data Mining (ICDM'06), December 18-22, 2006, Hongkong, China: 965-969.
[20] RODRIGUEZ-TORRES F, CARRASCO-OCHOA J A, MARTINEZ-TRINIDAD J F. Deterministic oversampling methods based on SMOTE[J]. Journal of Intelligent and Fuzzy Systems, 2019, 36(5): 4945-4955.
[21] BEJ S, DAVTYAN N, WOLFIEN M, et al. LoRAS: an oversampling approach for imbalanced datasets[J]. Machine Learning, 2021, 110(2): 279-301.
[22] 趙冬梅, 謝家康, 王闖, 等. 基于Bagging集成學(xué)習(xí)的電力系統(tǒng)暫態(tài)穩(wěn)定在線評(píng)估[J]. 電力系統(tǒng)保護(hù)與控制, 2022, 50(8): 1-10.
ZHAO Dongmei, XIE Jiakang, WANG Chuang, et al. On-line transient stability assessment of a power system based on Bagging ensemble learning[J]. Power System Protection and Control, 2022, 50(8): 1-10.
[23] 王彤, 劉九良, 朱劭璇, 等. 基于隨機(jī)森林的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估與緊急控制策略[J]. 電網(wǎng)技術(shù), 2020, 44(12): 4694-4701.
WANG Tong, LIU Jiuliang, ZHU Shaoxuan, et al. Transient stability assessment and emergency control strategy based on random forest in power system[J]. Power System Technology, 2020, 44(12): 4694-4701.
[24] 張晨宇, 王慧芳, 葉曉君. 基于XGBoost算法的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估[J]. 電力自動(dòng)化設(shè)備, 2019, 39(3): 77-83, 89.
ZHANG Chenyu, WANG Huifang, YE Xiaojun. Transient stability assessment of power system based on XGBoost algorithm[J]. Electric Power Automation Equipment, 2019, 39(3): 77-83, 89.
[25] LIN T Y, GOYAL P, GIRSHICK R, et al. Focal loss for dense object detection[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2020, 42(2): 318-327.
[26] 盧錦玲, 郭魯豫. 基于改進(jìn)深度殘差收縮網(wǎng)絡(luò)的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估[J]. 電工技術(shù)學(xué)報(bào), 2021, 36(11): 2233-2244.
LU Jinling, GUO Luyu. Power system transient stability assessment based on improved deep residual shrinkage network[J]. Transactions of China Electrotechnical Society, 2021, 36(11): 2233-2244.
[27] 曹瑩, 苗啟廣, 劉家辰, 等. AdaBoost算法研究進(jìn)展與展望[J]. 自動(dòng)化學(xué)報(bào), 2013, 39(6): 745-758.
CAO Ying, MIAO Qiguang, LIU Jiachen, et al. Advance and prospects of adaboost algorithm[J]. Acta Automatica Sinica, 2013, 39(6): 745-758.
[28]ZHANG R, WONG K P, XU Y, et al. Post-disturbance transient stability assessment of power systems by a self-adaptive intelligent system[J]. IET Generation Transmission & Distribution, 2015, 9(3): 296-305.
AC-LSTM transient stability assessment considering cost-sensitivity
LI Nan1, 2, ZHU Yuan2, CUI Ying3
(1. Key Laboratory of Modern Power System Simulation and Control & Renewable Energy Technology, Ministry of Education (Northeast Electric Power University), Jilin 132012, China; 2. School of Electrical Engineering,Northeast Electric Power University, Jilin 132012, China; 3. Zhuhai Power Supply Bureau of Guangdong Power Grid Corporation, Zhuhai 519000, China)
When the data-driven transient stability assessment model is used to judge the stability of power system, there can be an increase in the false positive rate of unstable samples. This is due to the imbalance between stable samples and unstable samples. Also the cost of misjudgment of unstable samples is much higher. An AC-LSTM transient stability assessment model with a cost-sensitive mechanism is proposed. By improving the Adaboost algorithm and introducing a cost-sensitive function to update the sample weights, the influence of minority samples on the overall classification accuracy is eliminated to minimize the false positive rate of unstable samples. In addition, the improved AdaBoost algorithm is integrated with long short-term memory (LSTM) to improve the comprehensive performance of the classifier. The simulation results on the IEEE39-bus and IEEE140-bus systems show that the model proposed has better adaptability and generalization ability than others, and the comprehensive evaluation performance is improved. In addition, the anti-noise ability is also better than other models.
transient stability assessment; sample imbalance; cost-sensitive; Adaboost; LSTM
10.19783/j.cnki.pspc.220217
國家自然科學(xué)基金項(xiàng)目資助(61973072)
This work is supported by the National Natural Science Foundation of China (No. 61973072).
2022-02-23;
2022-08-25
李 楠(1973—),女,通信作者,博士,副教授,研究方向?yàn)閿?shù)據(jù)挖掘在電力系統(tǒng)中的應(yīng)用;E-mail: jllinan@ 163.com
朱 嫄(1999—),女,碩士研究生,研究方向?yàn)樯疃葘W(xué)習(xí)在電力系統(tǒng)中的應(yīng)用;E-mail: zhuy1346@163.com
崔 瑩(1987—),男,博士,研究方向?yàn)榈蛪弘娏€載波通信。E-mail: cuiying794758706@126.com
(編輯 許 威)