蘭宇田,姚 偉,張文棟,劉世超,仇玉強(qiáng)
(1.強(qiáng)電磁技術(shù)全國重點(diǎn)實(shí)驗(yàn)室(華中科技大學(xué)電氣與電子工程學(xué)院),湖北 武漢 430074;2.國網(wǎng)山東省電力公司,山東 濟(jì)南 250000)
隨著新型電力系統(tǒng)建設(shè)的推進(jìn),以風(fēng)能為代表的新能源大規(guī)模并網(wǎng),新能源的隨機(jī)性、間歇性使得電力系統(tǒng)的運(yùn)行條件越發(fā)難以預(yù)測。相比于傳統(tǒng)電力系統(tǒng),含高比例新能源的新型電力系統(tǒng)形態(tài)發(fā)生重大變化,穩(wěn)定機(jī)理和特征更加復(fù)雜[1]。因此,針對(duì)新型電力系統(tǒng)開展快速且準(zhǔn)確的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估(transient stability assessment,TSA)是當(dāng)前的研究熱點(diǎn)。
傳統(tǒng)時(shí)域仿真法[2]和能量函數(shù)法[3]已經(jīng)無法滿足新型電力系統(tǒng)TSA 對(duì)時(shí)效性、準(zhǔn)確性的要求。前者雖結(jié)果可靠但計(jì)算耗時(shí)長,后者雖求解迅速但結(jié)果偏于保守。近年來,隨著廣域測量系統(tǒng)(wide area measurement system,WAMS)和相量測量單元(phasor measurement unit,PMU)的發(fā)展,電力系統(tǒng)實(shí)時(shí)運(yùn)行數(shù)據(jù)變得易于獲?。?],以數(shù)據(jù)為驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法成為當(dāng)前最具發(fā)展前景的TSA 方法[5]。目前大量研究人員將機(jī)器學(xué)習(xí)與TSA 結(jié)合,如門控循環(huán)神經(jīng)網(wǎng)絡(luò)(gated recurrent neural network,GRU)[6-8]、長短期記憶網(wǎng)絡(luò)(long short term memory network,LSTM)[9-11]、卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)[12-15]、生成對(duì)抗網(wǎng)絡(luò)(generative adversarial network,GAN)[16-17],均取得了優(yōu)異的指標(biāo)效果。但這些研究大多都基于同步機(jī)主導(dǎo)的常規(guī)電力系統(tǒng)進(jìn)行,新型電力系統(tǒng)由于新能源的隨機(jī)性和間斷性,表現(xiàn)出更為復(fù)雜的穩(wěn)定機(jī)理,所以針對(duì)傳統(tǒng)電力系統(tǒng)的研究在新型電力系統(tǒng)中具有一定的局限性。
此外,這些主流的機(jī)器學(xué)習(xí)方法都具有“黑箱”屬性,即只了解模型的輸入和輸出,不清楚模型的內(nèi)在邏輯或預(yù)測過程??山忉屝匀?、不透明等缺點(diǎn),導(dǎo)致“黑箱”模型的不信任感。目前已經(jīng)有部分文獻(xiàn)嘗試解決模型的“黑箱”屬性,文獻(xiàn)[18]基于模型無關(guān)局部解釋(local interpretable model-agnostic explanations,LIME)算法對(duì)TSA 模型進(jìn)行了事后解釋,但LIME 算法基于隨機(jī)擾動(dòng),存在解釋不穩(wěn)定的現(xiàn)象;文獻(xiàn)[19]基于注意力機(jī)制,繪制了模型對(duì)特征的注意力熱力圖,但從中并不易獲取模型具體關(guān)鍵決策量等知識(shí);文獻(xiàn)[20]基于沙普利值加性解釋(shapley additive explanations,SHAP)算法對(duì)電力系統(tǒng)暫態(tài)電壓穩(wěn)定評(píng)估模型進(jìn)行了事后解釋,雖然其取得了相比于LIME 更佳的解釋結(jié)果,但并未就獲取的模型內(nèi)在知識(shí)進(jìn)行進(jìn)一步的研究。所以如何解決數(shù)據(jù)驅(qū)動(dòng)的“黑箱”屬性和對(duì)模型內(nèi)在知識(shí)進(jìn)行進(jìn)一步運(yùn)用是當(dāng)前研究的難點(diǎn)。
文中聚焦新型電力系統(tǒng)暫穩(wěn)評(píng)估,首先提出了一種基于CatBoost(categorical boosting)算法的兩階段TSA 評(píng)估模型,解決了模型梯度偏移問題,實(shí)現(xiàn)了高質(zhì)量新型電力系統(tǒng)暫態(tài)穩(wěn)定判別。進(jìn)一步地,使用Tree-SHAP 算法對(duì)所提出的包含粗判和精判的兩階段CatBoost 模型進(jìn)行了事后解釋,揭示了模型的預(yù)測過程,解決了模型的“黑箱”屬性,并通過定量分析特征貢獻(xiàn)度絕對(duì)均值,選取新型電力系統(tǒng)暫態(tài)評(píng)估的關(guān)鍵影響因素作為輕量化模型特征。最后,針對(duì)文獻(xiàn)[20]未就模型內(nèi)部知識(shí)進(jìn)行進(jìn)一步研究的問題,基于獲取的暫態(tài)關(guān)鍵影響因素訓(xùn)練了低維CatBoost 兩階段模型,實(shí)現(xiàn)了模型的輕量化。
所提出的基于CatBoost 的新型電力系統(tǒng)兩階段輕量化暫穩(wěn)智能評(píng)估方法主要分為兩個(gè)部分:離線訓(xùn)練部分和在線評(píng)估部分,具體框架如圖1 所示。其中離線訓(xùn)練部分包含CatBoost 暫穩(wěn)評(píng)估模塊、Tree-SHAP 解釋與關(guān)鍵影響因素提取模塊、低維CatBoost 暫穩(wěn)評(píng)估輕量化模塊共三個(gè)模塊。
離線訓(xùn)練部分需要學(xué)習(xí)大量新型電力系統(tǒng)運(yùn)行數(shù)據(jù),從而挖掘暫態(tài)穩(wěn)定樣本和失穩(wěn)樣本的特征,離線訓(xùn)練的流程如圖2 所示,具體流程如下:
圖2 基于CatBoost的新型電力系統(tǒng)兩階段輕量化暫穩(wěn)評(píng)估模型離線訓(xùn)練流程Fig.2 Process of the two-stage lightweight transient stability intelligent assessment for new type power systems based on CatBoost
1)構(gòu)建新型電力系統(tǒng),通過設(shè)置不同運(yùn)行工況進(jìn)行時(shí)域仿真,獲取仿真數(shù)據(jù);
2)基于仿真數(shù)據(jù)訓(xùn)練1 階段粗判CatBoost,選取低置信率區(qū)間樣本重新訓(xùn)練2 階段精判CatBoost;
3)基于Tree-SHAP 對(duì)兩階段評(píng)估模塊從局部和全局兩個(gè)角度進(jìn)行解釋,獲取模型內(nèi)部知識(shí),即暫態(tài)關(guān)鍵影響因素;
4)基于Tree-SHAP 獲取的知識(shí),重新訓(xùn)練低維CatBoost 輕量化兩階段模型。
對(duì)于數(shù)據(jù)驅(qū)動(dòng)的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估,需要通過有監(jiān)督學(xué)習(xí)構(gòu)建樣本輸入特征和輸出標(biāo)簽之間的映射關(guān)系。文中基于CatBoost 算法進(jìn)行暫穩(wěn)評(píng)估。
CatBoost 是由俄羅斯Yandex 公司提出的一種由多棵對(duì)稱決策樹(oblivious trees,OT)串聯(lián)組合而成的Boosting 集成學(xué)習(xí)算法[21],隸屬于梯度提升樹(gradient boosting decision tree,GBDT)算法框架。相比于其他GBDT 算法,能有效處理離散類別型特征的編碼問題、梯度偏差問題和預(yù)測偏移問題,提升了模型的準(zhǔn)確性和泛化能力。
在CatBoost 訓(xùn)練過程中,每次迭代均會(huì)生成一個(gè)弱學(xué)習(xí)器,最終得到強(qiáng)學(xué)習(xí)器,以此讓整體模型損失函數(shù)達(dá)到最小值。假設(shè)在第t輪訓(xùn)練中,已經(jīng)有訓(xùn)練好的前t-1 輪強(qiáng)學(xué)習(xí)器Ft-1(x) 損失函數(shù)為l(y,Ft-1(x))。本輪的目標(biāo)就是加入新的弱學(xué)習(xí)器ht(x),使得本輪損失函數(shù)最小。第t輪迭代的目標(biāo)函數(shù)即弱學(xué)習(xí)的參數(shù)如式(1)所示。
式中:y為樣本標(biāo)簽;E為期望函數(shù);x為輸入樣本。
由于是沿著損失函數(shù)下降最快方向進(jìn)行迭代,所以每一輪損失的近似值由損失函數(shù)的負(fù)梯度-gt(x,y)表示,如式(2)所示。
將式(2)帶入式(1)得
最終得到第t輪強(qiáng)學(xué)習(xí)器Ft(x)。
式中:lr為每一輪迭代的學(xué)習(xí)率。
但在每一輪迭代過程中,使用的梯度都是由相同的訓(xùn)練樣本xtrain進(jìn)行計(jì)算的,但實(shí)際上與所有樣本x之間存在一定的偏差,即梯度偏差。CatBoost 算法為解決該問題造成的模型精度下降,對(duì)GBDT 算法進(jìn)行了改進(jìn):在第t輪迭代過程中,令gk(xk,yk)為在本輪第k個(gè)樣本(xk,yk)上的損失函數(shù)梯度值。為使gk(xk,yk)無偏于模型Ft-1,首先使用前k-1 個(gè)樣本重新訓(xùn)練代理模型Mk,再基于代理模型Mk來估計(jì)xk上的梯度。這樣每個(gè)樣本的梯度都是通過不包含該樣本的其他樣本進(jìn)行計(jì)算的,進(jìn)而解決了梯度偏差問題。具體數(shù)學(xué)證明可參考文獻(xiàn)[21]。
CatBoost 兩階段模塊在未輕量化之前需要采集電力系統(tǒng)的幾乎所有電氣特征,數(shù)據(jù)量大,傳輸時(shí)間長,在實(shí)際電力系統(tǒng)中幾乎無法應(yīng)用。所以需要對(duì)模型進(jìn)行輕量化,減少模型的輸入特征。
事后解釋算法Tree-SHAP[22]基于合作博弈論,具有局部精度、對(duì)稱性、無效性和可加性四種特征[23],是目前理論最優(yōu)的歸因算法之一。使用Tree-SHAP 算法能透明化模型的決策過程,挖掘模型的內(nèi)在關(guān)鍵影響因素,進(jìn)而指導(dǎo)模型在維持評(píng)估精度的前提下減少輸入特征的數(shù)目。
合作博弈論認(rèn)為單純按照每個(gè)玩家固定收益對(duì)總收益進(jìn)行分配是不合理的,故提出了以邊界貢獻(xiàn)(marginal contribution,MC)作為分配指標(biāo)的收益分配思路。在電力系統(tǒng)中,定義游戲G為暫態(tài)穩(wěn)定評(píng)估模型,玩家P為模型的各個(gè)輸入特征??赏ㄟ^式(5)來計(jì)算特征對(duì)暫穩(wěn)評(píng)估結(jié)果的貢獻(xiàn)度,即Shapley 值。
由于模型的輸入特征過多,特征子集有151!個(gè),極難計(jì)算。所以針對(duì)樹模型的特有結(jié)構(gòu)特性,研究人員提出了兩種簡化思路,實(shí)現(xiàn)了Shapley 值的快速計(jì)算。
1)簡化方向1。
通過樹結(jié)構(gòu)來評(píng)估特征貢獻(xiàn)。根據(jù)Shapley 值的可加性特征,繪制出一種可能的特征子集編碼情況中模型預(yù)測的預(yù)期變化,如圖3 所示。
圖3 模型預(yù)測期望變化Fig.3 Expectation changes based on model prediction
所以,為求解特征i的Shapley 值?i,就只需要求解f{x1,x2,…,xi-1}({x1,x2,…,xi-1}) 和f{x1,x2,…,xi}({x1,x2,…,xi})的差值,而樹結(jié)構(gòu)中對(duì)具有缺失值的數(shù)據(jù)條件期望的求解是簡單的,因?yàn)槠鋾?huì)忽略缺失值所在的葉節(jié)點(diǎn)。通過這樣簡化來計(jì)算特征子集的特征p的Shapley 值,只需要遍歷每一棵樹的每一個(gè)節(jié)點(diǎn)。此時(shí),Tree-SHAP 時(shí)間復(fù)雜度為O(TL2M),其中T為樹的總數(shù),L為總節(jié)點(diǎn)數(shù)目,M為特征數(shù)目。
2)簡化方向2。
按照樹結(jié)構(gòu)進(jìn)行遍歷。通過簡化方向1,可以將不同特征組合輸入,簡化求解各個(gè)特征的貢獻(xiàn)度,但特征組合依然是2M個(gè)。簡化方向2 的大致思路為不遍歷所有特征組合,而是只需要遍歷樹的所有路徑,在遍歷的過程中記錄路徑信息,在葉節(jié)點(diǎn)處求解這條路徑的特征貢獻(xiàn)。因?yàn)閺臉涞穆窂浇嵌葋砜矗谥虚g節(jié)點(diǎn)除了其判斷條件以外,其他特征的引入對(duì)樹的決策是不會(huì)有任何改變的,這些特征組合均不用考慮。
獲取電力系統(tǒng)實(shí)時(shí)數(shù)據(jù),對(duì)離線訓(xùn)練獲取的暫態(tài)關(guān)鍵影響因素進(jìn)行采集,形成樣本j的模塊輸入矩陣Xj=[x1,j,x2,j,…,xn,j]。首先,將輸入矩陣輸入1 階段粗判CatBoost 進(jìn)行暫態(tài)穩(wěn)定狀態(tài)預(yù)測,并獲取預(yù)測為穩(wěn)定的概率值Pj;其次,對(duì)Pj進(jìn)行分析,如果Pj屬于預(yù)先設(shè)定的高置信區(qū)間則直接輸出預(yù)測結(jié)果,如果Pj落入低置信率區(qū)間,則說明該樣本為1 階段粗判CatBoost 的邊界樣本,需要2 階段精判CatBoost模型給出預(yù)測結(jié)果。評(píng)估流程如圖4 所示。
研究人員稱,父母對(duì)于子女日后的語言表達(dá)能力也起著十分重要的作用。所以嬰兒期堅(jiān)持給寶寶“磨耳朵”,日后會(huì)有意想不到的收獲哦!
所提出的基于CatBoost 的兩階段電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估和其可解釋性研究是基于仿真數(shù)據(jù)進(jìn)行分析的,研究系統(tǒng)為接入高比例風(fēng)電的IEEE 39 節(jié)點(diǎn)系統(tǒng)。算例研究的硬件平臺(tái)為CPU Intel? Core(TM)i9-10900K @3.70 GHz,RAM 64 GB,GPU NVIDIA Geforce RTX 2080 Super,電力系統(tǒng)時(shí)域仿真基于PSASP 軟件實(shí)現(xiàn),機(jī)器學(xué)習(xí)模型基于Scikitlearn1.3.0 搭建。
IEEE 39 節(jié)點(diǎn)系統(tǒng)也被稱為新英格蘭10 機(jī)電力系統(tǒng),對(duì)于含風(fēng)電的IEEE 39 節(jié)點(diǎn)電力系統(tǒng),有5 臺(tái)發(fā)電機(jī)、4 個(gè)風(fēng)電場、39 根母線、46 條支路、12 臺(tái)變壓器和19 個(gè)負(fù)載,其拓?fù)浣Y(jié)構(gòu)如圖5 所示,圖中G表示發(fā)電機(jī),其中G1 表示多個(gè)發(fā)電機(jī),WF 表示風(fēng)電場。
圖5 含風(fēng)電的IEEE 39節(jié)點(diǎn)電力系統(tǒng)Fig.5 IEEE 39 bus power system with wind power
為覆蓋盡可能多的電力系統(tǒng)運(yùn)行工況和故障發(fā)生情況,可以通過以下操作實(shí)現(xiàn):設(shè)置潮流水平在85%~115% 之間波動(dòng),設(shè)置為85%、90%、95%、100%、105%、110%、115%;故障設(shè)置為三相金屬性短路并切線(N-1),故障線路遍歷IEEE 39 系統(tǒng)中所有的非變壓器支路,故障位置為每一條線路全長的2%、25%、50%、75%、98%,故障時(shí)間設(shè)置為0.1 s、0.2 s、0.3 s、0.4 s、0.5 s。具體生成方案如表1 所示,這樣可以較為全面地覆蓋系統(tǒng)運(yùn)行工況和故障發(fā)生的可能性。仿真時(shí)間設(shè)置為10 s,剔除部分?jǐn)?shù)據(jù)異常樣本,最終生成5 873 個(gè)樣本。
表1 IEEE 39節(jié)點(diǎn)系統(tǒng)樣本生成方案Table 1 IEEE 39 system sample generation solution
為提高模型的準(zhǔn)確率,采集所有能觀測或能計(jì)算的電氣特征,采集時(shí)間定為故障切除后的下一時(shí)刻,具體特征如表2 所示。
表2 樣本具體電氣特征量Table 2 Sample specific electrical characteristic quantity
表2 中共計(jì)采集151 個(gè)特征量構(gòu)成樣本的模型輸入數(shù)據(jù),樣本標(biāo)簽由暫態(tài)穩(wěn)定指數(shù)(transient stability index,TSI)確定[24]:
式中:|Δδ|max為在仿真時(shí)間內(nèi),任意兩臺(tái)發(fā)電機(jī)相對(duì)功角差值絕對(duì)值的最大值;STI為暫態(tài)穩(wěn)定指數(shù),STI>0 說明該樣本為穩(wěn)定的;STI<0 說明該樣本為失穩(wěn)的。最后得到穩(wěn)定樣本共計(jì)3 514 個(gè),失穩(wěn)樣本共計(jì)2 359 個(gè)。
將全體樣本分為70%、15%、15%三部分,分別作為訓(xùn)練集、驗(yàn)證集和測試集。通過訓(xùn)練集訓(xùn)練CatBoost 模型,再根據(jù)驗(yàn)證集調(diào)整參數(shù),最后在測試集上測試模型效果。
根據(jù)2.1 節(jié)中簡述的CatBoost 原理訓(xùn)練一階段粗判TSA 模型,其結(jié)果的混淆矩陣如圖6 所示。
圖6 一階段粗判TSA模型混淆矩陣Fig.6 One-stage prediction segment TSA model confusion matrix
一階段粗判TSA 模型在所有樣本中僅取得了98.33%的準(zhǔn)確率。為進(jìn)一步提升模型的準(zhǔn)確率,首先繪制模型對(duì)所有樣本判斷為穩(wěn)定的預(yù)測概率散點(diǎn)圖,如圖7 所示。
圖7 一階段粗判TSA模型預(yù)測概率散點(diǎn)圖Fig.7 Scatter plot of predicted probabilities for first-stage preliminary TSA
從圖7 中,不難發(fā)現(xiàn):預(yù)測概率大于0.6 或小于0.2 時(shí),模型識(shí)別準(zhǔn)確率極高;但在大于0.2 且小于0.6 的部分,準(zhǔn)確率出現(xiàn)了下降。這是因?yàn)槟P驮谟?xùn)練過程中,會(huì)更加偏向于大眾樣本;對(duì)于決策邊界附近的樣本,由于正則化的存在,會(huì)使得模型精度下降。對(duì)于大模型,更希望其決策邊界更加光滑,所以降低正則化參數(shù)的操作是不可取的。
為識(shí)別這些特殊邊界樣本的特征,可以構(gòu)建二階段精判TSA 模型。從低置信區(qū)中篩選出判別錯(cuò)誤的樣本,重新構(gòu)成新的訓(xùn)練集、驗(yàn)證集、測試集,注意篩選前后樣本類別須保持一致?;谶@些樣本重新訓(xùn)練能識(shí)別特殊樣本的精細(xì)化評(píng)估模型,其訓(xùn)練結(jié)果和常見模型評(píng)價(jià)指標(biāo)[19]結(jié)果如表3 所示。
表3 基于CatBoost的新型電力系統(tǒng)兩階段暫穩(wěn)評(píng)估模型指標(biāo)Table 3 Indicators for the two-stage transient stability assessment model in new type power systems based on Catboost
基于表3,可以發(fā)現(xiàn)兩階段TSA 評(píng)估模型指標(biāo),除測試集的召回率外,全面優(yōu)于一階段模型。因此可以認(rèn)為,引入二階段精細(xì)化評(píng)估邊界樣本能有效提高CatBoost 模型的判斷準(zhǔn)確度。類似地,再對(duì)比其他機(jī)器學(xué)習(xí)模型,包括XGBoost[25]、隨機(jī)森林[26]、支持向量機(jī)[27]和決策樹[28],模型常見評(píng)價(jià)指標(biāo)[19]對(duì)比如圖8 所示。
利用Tree-SHAP 算法對(duì)模型預(yù)測結(jié)果進(jìn)行事后解釋,首先分析單個(gè)樣本。隨機(jī)選取第8 號(hào)、第13號(hào)樣本。前者預(yù)測為穩(wěn)定的概率為10.11%,直接由一階段粗判模型給出失穩(wěn)判斷結(jié)果,其透明化的預(yù)測過程如圖9 所示;后者預(yù)測一階段預(yù)測為穩(wěn)定的概率為55.13%,為邊界樣本,落入二階段精細(xì)判斷模型,二階段模型的預(yù)測過程如圖10 所示。通過Tree-SHAP 算法,可以直觀感受模型的決策過程,提高模型的可解釋性,挖掘模型的內(nèi)在知識(shí)。
圖9 第8號(hào)樣本的決策過程Fig.9 Decision-making process for sample No.8
圖10 第13號(hào)樣本的決策過程Fig.10 Decision-making process for sample No.13
對(duì)于每一個(gè)樣本都可以分析出其決策過程,挖掘哪些特征對(duì)決策做出了重要貢獻(xiàn)。再從全局角度分析,計(jì)算如式(7)所示的m個(gè)樣本的所有特征絕對(duì)貢獻(xiàn)均值mean(||?),就能得出模型主要側(cè)重于哪些重要特征,進(jìn)行電力系統(tǒng)暫態(tài)穩(wěn)定域的關(guān)鍵影響因素的挖掘,具體前20 個(gè)關(guān)鍵影響因素如圖11 所示。
圖11 暫態(tài)關(guān)鍵影響因素Fig.11 Key transient influencing factors
模型的效果與選擇的特征之間存在緊密聯(lián)系,可選擇篩選出來的前30 個(gè)關(guān)鍵影響因素重新訓(xùn)練CatBoost 兩階段評(píng)估模型,依據(jù)其訓(xùn)練結(jié)果來間接證明識(shí)別效果的有效性,其訓(xùn)練結(jié)果如表3 所示。
從表3 可以發(fā)現(xiàn)進(jìn)行特征選擇后的低維CatBoost 兩階段評(píng)估模型只用了20%的特征量就達(dá)到甚至超過了一階段CatBoost 評(píng)估模型的效果。對(duì)比原始兩階段評(píng)估模型,模型在測試集上的準(zhǔn)確率僅下降了1.11%,也遠(yuǎn)超于其他算法,所以暫態(tài)關(guān)鍵影響因素的識(shí)別效果比較優(yōu)秀。為繼續(xù)探究低維CatBoost 的模型效果低于高維模型的原因,繪制低維一階段模型預(yù)測概率散點(diǎn)圖如圖12 所示。
圖12 低維一階粗判TSA預(yù)測概率散點(diǎn)圖Fig.12 Scatter plot of predicted probabilities for low-dimensional first-stage preliminary TSA
根據(jù)圖12 可以發(fā)現(xiàn),由于低維CatBoost 特征維度有限,低置信區(qū)錯(cuò)判樣本明顯增多,而且邊界樣本數(shù)目上升,導(dǎo)致二階段識(shí)別的邊界樣本特征也有限,最終導(dǎo)致了效果低于高維模型。
暫態(tài)穩(wěn)定分析是新型電力系統(tǒng)領(lǐng)域的研究重點(diǎn),傳統(tǒng)暫穩(wěn)分析方法在時(shí)效性和準(zhǔn)確性上略有欠缺。機(jī)器學(xué)習(xí)技術(shù)目前在各個(gè)領(lǐng)域取得了巨大的成果,將其與新型電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估結(jié)合擁有廣闊的前景。文中針對(duì)TSA,構(gòu)建了具有高質(zhì)量指標(biāo)的評(píng)估模型,并基于機(jī)器學(xué)習(xí)可解釋性算法提取模型內(nèi)在知識(shí),實(shí)現(xiàn)了模型的輕量化,具體創(chuàng)新點(diǎn)如下:
1)針對(duì)單層CatBoost 評(píng)估模型指標(biāo)精度不足的問題,設(shè)計(jì)了粗判加精判兩階段CatBoost 評(píng)估模型,取得了模型指標(biāo)的全面提升;
2)針對(duì)模型可解釋性不足的問題,引入Tree-SHAP 算法,實(shí)現(xiàn)了模型決策過程的透明化,并從中獲取了模型的內(nèi)在知識(shí),即暫態(tài)關(guān)鍵影響因素;
3)針對(duì)TSA 模型輸入特征量大、參數(shù)多的問題,基于暫態(tài)關(guān)鍵影響因素訓(xùn)練了低維兩階段輕量化CatBoost 模型,以20%的特征數(shù)量實(shí)現(xiàn)了超越單層CatBoost 評(píng)估模型的評(píng)價(jià)指標(biāo)。
文中采用的是仿真軟件獲取的時(shí)域仿真數(shù)據(jù),與實(shí)際中基于PMU 測量獲取的數(shù)據(jù)還存在一定的差距;僅針對(duì)新型電力系統(tǒng)暫態(tài)穩(wěn)定的評(píng)估問題,但事后控制并未涉及,如何基于模型解釋結(jié)果進(jìn)行控制也值得深入研究。