任柯政,徐泰山,郭瑾程,涂孟夫,陸進軍,劉 俊,丁 濤
(1.西安交通大學電氣工程學院,陜西西安 710049;2.南瑞集團有限公司(國網(wǎng)電力科學研究院),江蘇南京 211000;3.智能電網(wǎng)保護和運行控制國家重點實驗室,江蘇南京 211000)
為了應(yīng)對氣候變化,全球能源正在增速轉(zhuǎn)型,中國在2020 年提出“雙碳”計劃,大力發(fā)展新能源發(fā)電、儲能等技術(shù)[1]?,F(xiàn)代電力系統(tǒng)已經(jīng)發(fā)展為一個極其龐大、復雜的非線性系統(tǒng)[2]。電力系統(tǒng)的正常運行狀態(tài),需要在滿足負荷需求、運行約束的基礎(chǔ)上,能承受預想故障集的沖擊。在電力系統(tǒng)中,輸電斷面一般是指起點和終點相同或相近,功率流向一致的一條或多條線路的組合[3]。斷面能輸送的功率極限是由多種因素共同決定,根本原因是電力系統(tǒng)存在各種穩(wěn)定問題,包括熱穩(wěn)定、暫態(tài)穩(wěn)定、電壓穩(wěn)定等。受這些穩(wěn)定問題的制約,形成了對應(yīng)的斷面功率極限,這些極限的交集即是該斷面的穩(wěn)定極限。
然而,傳統(tǒng)的依賴人類智能來制定電網(wǎng)安全規(guī)則的方法需要大量的時間和人力[4]。在新型電力系統(tǒng)中,新能源不確定性特征明顯,運行方式復雜多變,同一斷面在不同運行方式下穩(wěn)定限額相差較大。在此情況下,傳統(tǒng)方法不能滿足電力系統(tǒng)精細化管理需求,例如,在發(fā)電計劃優(yōu)化編制中,要求每15 min 得到一個準確的斷面限額約束[5]。因此新型電力系統(tǒng)需要一個更加精確、快速的斷面極限估算方法,充分挖掘電力輸電通道的送電潛力,提高電力系統(tǒng)日前調(diào)度的效率,減少棄風棄光,提高電力市場的經(jīng)濟性等。
基于數(shù)據(jù)驅(qū)動的方法具有不依賴物理模型、計算速度快等優(yōu)點[6]。目前已有很多學者研究機器學習技術(shù)在電力系統(tǒng)安全分析中的應(yīng)用方法,利用機器學習強大的擬合能力和數(shù)據(jù)挖掘能力,學習電力系統(tǒng)復雜的高維非線性特征。文獻[7]提出了一種基于發(fā)電機各節(jié)點相量測量的電力系統(tǒng)穩(wěn)定連續(xù)在線監(jiān)測系統(tǒng)。文獻[8]提出了一種基于集成學習結(jié)構(gòu)的數(shù)據(jù)驅(qū)動電網(wǎng)極限傳輸容量預測器,以提高計算效率。文獻[9]提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的在線暫態(tài)穩(wěn)定評估和失穩(wěn)模式預測方法。然而,還很少有研究分析新型電力系統(tǒng)輸電斷面極限的數(shù)據(jù)驅(qū)動方法。同時,在運用機器學習方法解決電力系統(tǒng)問題時,對特征分析較少,存在數(shù)據(jù)冗余、計算效率低等問題[10-12]。
本文首次提出了一種數(shù)據(jù)驅(qū)動的考慮直流輸送功率與新能源波動的系統(tǒng)斷面極限估算方法,并在實際電網(wǎng)算例中驗證了所提方法的有效性和準確性;提出了一種基于最大相關(guān)最小冗余(minimum Redundancy Maximum Relevance,mRMR)的系統(tǒng)斷面極限關(guān)鍵特征選擇方法,實現(xiàn)了復雜高維非線性數(shù)據(jù)的有效選取,減低存儲空間和計算復雜度;建立了一種基于輸電斷面極限關(guān)鍵特征和AdaBoost算法的斷面極限預測模型。實際電網(wǎng)算例估算結(jié)果表明在不同的運行方式下所提的方法估算精度較高,計算速度較快,有望實時為電力系統(tǒng)優(yōu)化調(diào)度提供具體運行條件下斷面極限的安全約束。
針對新型電力系統(tǒng)新能源比例大、交直流混聯(lián)的特點,首先對斷面極限的影響因素進行定性分析,然后提出了一種新的數(shù)據(jù)驅(qū)動方法框架,使用特征選擇技術(shù)和機器學習技術(shù)對輸電斷面極限進行估算。
斷面極限影響因素包括區(qū)域發(fā)電機的開機情況、用電負荷、網(wǎng)絡(luò)結(jié)構(gòu)等,在新型電力系統(tǒng)中,新能源出力水平、直流輸電功率也會給輸電斷面帶來不同程度的影響。
1)負荷水平的影響。電力系統(tǒng)的任務(wù)是滿足負荷需求。因此負荷是系統(tǒng)運行狀態(tài)的基礎(chǔ),大負荷水平下,系統(tǒng)的穩(wěn)定性問題更加突出。
2)機組開機方式及出力的影響。不同的機組開機與出力情況,系統(tǒng)關(guān)鍵斷面流過的功率不同,系統(tǒng)的慣性、穩(wěn)定性也不同[13],斷面極限隨之改變。
3)新能源機組的影響。新能源機組具有慣性相對低、抗擾性弱、過載能力低、同等容量下機組數(shù)量多等,對系統(tǒng)功角穩(wěn)定性、暫態(tài)穩(wěn)定性、電壓穩(wěn)定性等都有明顯影響[14]。同時,新能源機組出力具有波動性、隨機性,系統(tǒng)斷面流過的功率不確定性增加。
4)大容量直流輸電的影響。直流系統(tǒng)輸送功率大,發(fā)生故障后,送受端系統(tǒng)間存在大量不平衡功率,可能發(fā)生功角失穩(wěn)、電壓失穩(wěn)等穩(wěn)定性問題[15]。
因此,針對新型電力系統(tǒng)的斷面極限估算,除了考慮確定運行方式下的“N-1”故障系統(tǒng)穩(wěn)定,還需要考慮新能源波動、直流功率對斷面極限的影響。
為了對電力系統(tǒng)特征與輸電斷面極限進行定性分析,本文采用皮爾遜相關(guān)系數(shù)來度量2 個變量之間的線性相關(guān)性P[16],計算公式為:
式中:X,Y為n維變量,X={X1,X2,…,Xn},Y={Y1,Y2,…,Yn}其中Xi(i=1,2,…,n),Yi(i=1,2,…,n)分別為X,Y的第i個元素;Xˉ,Yˉ為X,Y的均值。
皮爾遜相關(guān)系數(shù)值介于-1 與1 之間,其絕對值越大,相關(guān)程度越大[17]。
針對影響新型電力系統(tǒng)斷面極限的不同因素,考慮新能源不確定性、直流輸送功率、開機方式以及負荷大小等因素的影響??紤]到電力系統(tǒng)運行數(shù)據(jù)不足,本文結(jié)合歷史數(shù)據(jù)與機電暫態(tài)仿真軟件生成大量斷面極限樣本數(shù)據(jù),然后使用特征選擇技術(shù)和機器學習技術(shù)對輸電斷面穩(wěn)定極限進行估算。
圖1 為本文提出的一種新的數(shù)據(jù)驅(qū)動的斷面極限估算方法框架。
圖1 系統(tǒng)斷面極限估算的數(shù)據(jù)驅(qū)動方法Fig.1 Data-driven method of section limit estimation
電力系統(tǒng)特征數(shù)量多、冗余性強,隨著新能源與電力電子的發(fā)展,非線性特征愈發(fā)突出[18]。不同的特征選擇算法與機器學習回歸算法對斷面極限估算有不同程度的影響。本文采用mRMR 特征選擇、AdaBoost 回歸來對斷面極限的進行數(shù)據(jù)挖掘與預測。
現(xiàn)代電力系統(tǒng)已經(jīng)發(fā)展成為一個復雜的非線性系統(tǒng),其內(nèi)部的特征過于龐大,對于運行人員的監(jiān)測、控制都會帶來不利的影響。
高維數(shù)據(jù)存在的問題有:(1)“維數(shù)災(zāi)”問題。高維數(shù)據(jù)給儲存和計算帶來巨大負擔;(2)距離測度被弱化。維數(shù)的增加使樣本直接的距離測度被弱化,導致很多算法失去原本的作用;(3)過擬合問題。高維空間數(shù)據(jù)分布更加不規(guī)律,更容易導致神經(jīng)網(wǎng)路“過擬合”等問題。
特征選擇是指從已有的特征子集中選擇更具有代表性的特征構(gòu)成新的特征子集。和特征提取將高維數(shù)據(jù)映射到低維空間中不同,特征選擇不會對特征進行變化,而是保留了原始特征,更加具備物理解釋性,因此,特征選擇算法能夠去除冗余數(shù)據(jù)以及不相關(guān)數(shù)據(jù),減小特征數(shù)量的同時最大程度保留數(shù)據(jù)信息[19]。
mRMR 算法利用數(shù)據(jù)集的內(nèi)在信息建立特征的重要度,然后根據(jù)排序準則函數(shù)選擇得分較高的特征。實際上與標簽相關(guān)性最高的特征子集不一定是最優(yōu)的,因此mRMR 算法在最大化特征與標簽之間的相關(guān)性的同時最小化特征與特征之間的相關(guān)性[20],減少了特征的冗余度,以提高神經(jīng)網(wǎng)絡(luò)的預測精度。
mRMR 規(guī)定:特征集S與標簽c的相關(guān)性D(S,c)由特征集S中各個特征fm與標簽c之間所有互信息值的平均值定義,即:
式中:Ns為特征集S包含的特征量;fm為特征集S中第m個特征序列。I(fm,c)為互信息,可以計算下式:
式中:p(fm,c) 為2 個變量的聯(lián)合概率密度函數(shù);p(fm)p(c)為變量fm,c的邊緣概率密度函數(shù)。
規(guī)定特征集S內(nèi)所有特征的冗余度R(S)由所有特征之間的互信息值I的平均值定義,即:
式中:fi,fj為特征集S中不同的特征序列。
mRMR 選取特征子集的標準是最大化相關(guān)性并且最小化冗余性,滿足:
增量搜索法改進的mRMR 能避免同時選取M個特征帶來的大量計算,將已選擇m-1 個特征記為Sm-1,在剩余的特征子集S-Sm-1中選取1 個特征并滿足,即:
增量搜索法改進的mRMR 流程圖如圖2 所示。
圖2 基于增量搜索的mRMR特征選擇算法Fig.2 mRMR feature selection algorithm based on incremental search
常用的機器學習方法包括決策樹(Decision Tree,DT)、支持向量機(Support Vector Machine,SVM[21])、神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)[22]等。然而,這些算法的精度始終限制了機器學習算法在實際工程中的應(yīng)用。如前饋(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)是一種弱學習算法,具有過擬合、泛化能力不強等特點,易陷入局部最優(yōu)。Boosting 算法是一種集成學習技術(shù),能夠集合多個預測精度較低的弱學習器,得到預測精度高的強學習器,避免直接構(gòu)造復雜的強學習器。
AdaBoost 算法融合了在線分配算法,其核心思想是通過改變訓練樣本集的樣本權(quán)值分布來控制訓練過程:迭代過程中,錯分樣本的權(quán)值不斷加大,下一個子分類器更加重視當前難以被分類樣本;同時采用加權(quán)投票策略,分類準確率高的子分類器的投票權(quán)值更大,在結(jié)果中占主導地位[23]。AdaBoost同時解決了子分類器生成和集成兩大問題,真正讓Boosting 算法具有實用價值[24-25]。
AdaBoost 算法包含1 個代理Agent 和多個策略,N個樣本,一共進行t=1,2,…,T次迭代[26]。每一次決策中,Agent 都有1 個針對所有策略的權(quán)值分布pt,對于每個策略,≥0 且=1。將這些策略應(yīng)用到環(huán)境中,會得到損失lt,則Agent 的混合損失為,算法的目標是使凈損失最小,也就是找到1 個最優(yōu)的權(quán)值分布pt,以最小化混合損失與最佳策略損失的差,即:
AdaBoost.R2 將傳統(tǒng)Boosting 分類算法拓展到回歸問題中,其具體算法步驟為:
1)給定1 個弱訓練器WeakLearn,N個樣本
2)初始化每個訓練樣本的權(quán)重。
初始化權(quán)重向量可以表示為:
3)調(diào)用具有權(quán)值分布wt的弱分類器得到預測值ht(x),然后計算第t次迭代中弱分類器在每個樣本上的誤差εt,i。
式中:為第i組數(shù)據(jù)的預測值;為該弱分類器在樣本上的最大誤差。
4)計算該弱分類器第t次迭代總的誤差率εt。
式中:為第t次訓練樣本i的權(quán)重。
5)更新權(quán)重向量,定義更新因子βt。
樣本(xi,yi)的權(quán)重更新為:
式中:Zt為歸一化因子。
6)t=t+1,步驟3)到步驟6)循環(huán)T次。
7)多個弱訓練器組合為1 個強訓練器輸出結(jié)果H(x)。
式中:f(x)為所有的中位數(shù)。
經(jīng)過mRMR 算法選擇后的電力系統(tǒng)特征為輸入量,輸電斷面極限為輸出量,構(gòu)建以決策樹[27-28]為基礎(chǔ)的AdaBoost 模型。同時,對輸入數(shù)據(jù)進行歸一化處理可以充分利用神經(jīng)網(wǎng)絡(luò)的泛化能力,提高預測精度[29],即:
式中:x為原始數(shù)據(jù);xmax為數(shù)據(jù)的最大值;xmin為原始數(shù)據(jù)最小值;為歸一化后數(shù)據(jù)。
基于mRMR 特征選擇和AdaBoost 回歸分析的斷面極限估算方法流程如圖3 所示。
圖3 基于mRMR和AdaBoost的斷面極限估算方法流程圖Fig.3 Flow diagram of section limit estimation method based on mRMR and AdaBoost
本文使用某省級電網(wǎng)的機電暫態(tài)仿真算例進行分析,如圖4 所示,該地區(qū)北方分布有大量風電、光伏發(fā)電系統(tǒng),包括大功率直流輸電系統(tǒng),南方是該地區(qū)的負荷中心。該地區(qū)的電力潮流從北方送到南方,因此選擇南北之間的4 回750 kV 輸電線路為輸電斷面,研究各種故障下輸電斷面的極限值。
圖4 機電仿真系統(tǒng)示意圖Fig.4 Diagram of electromechanical simulation system
首先,利用BPA-Python 互聯(lián)仿真生成樣本。在典型的大、中、小3 種運行方式及不同的直流送出功率下,結(jié)合新能源功率波動,生成大量樣本。
由BPA-Python 互聯(lián)仿真得到不同運行方式下1 221 條樣本數(shù)據(jù),樣本的斷面極限如圖5 所示。
圖5 不同樣本的斷面極限分布Fig.5 Limit of transmission section in different samples
本文共提取8 938 維特征,按照電力系統(tǒng)特性將這些特征分為5 類,如表1 所示。
表1 電力系統(tǒng)的特征分組Table 1 Feature groups of power system
在對樣本的數(shù)據(jù)挖掘中,發(fā)現(xiàn)直流輸送功率和新能源出力對斷面限額有不同程度的影響,因為直流輸電容量遠大于一座新能源電站的容量,故直流輸送功率對斷面極限的影響會“淹沒”新能源波動帶來的影響,故需要在直流輸送功率固定情況下分析新能源特征與輸電極限的關(guān)系。2 種樣本下的相關(guān)性分析如表2 所示。
表2 電力系統(tǒng)特征相關(guān)性分析Table 2 Correlation analysis of power system features%
收集全部樣本數(shù)據(jù)進行相關(guān)性系數(shù)計算,58.7%的特征與斷面極限無關(guān),僅1.7%的特征與斷面極限呈強相關(guān)或極強相關(guān)性。對直流輸送功率固定為其額定容量50%的樣本進行分析,將相關(guān)性結(jié)果與全部樣本下的相關(guān)性分析結(jié)果進行比較,直流功率固定情況下,與輸電斷面相關(guān)的參數(shù)個數(shù)明顯增加。如表3 所示。由表3 可知,固定直流輸送功率情況下,新能源機組特征對斷面限額影響增加,在極強相關(guān)性特征中占比最大。
表3 極強相關(guān)性特征類型分析Table 3 Strong correlation analysis of power system features %
由皮爾遜相關(guān)性分析可知,在不同的運行狀態(tài)下,與斷面極限相關(guān)的特征有明顯的差別。皮爾遜系數(shù)只能分析線性相關(guān)性,而新型電力系統(tǒng)是一個非線性系統(tǒng),因此,在大量樣本下,本文選擇了可以分析非線性相關(guān)性的mRMR 算法進行特征選擇,在減少數(shù)據(jù)維度的同時,避免信息的缺失。
由于電力系統(tǒng)的運行特征,存在部分特征值不變或方差非常小的情況,需要篩選掉這些對神經(jīng)網(wǎng)絡(luò)訓練無意義的特征。經(jīng)過篩選,剩下各類特征共3 615 個。然后利用mRMR 算法,減少特征的數(shù)量,提高訓練的效率,最大化特征與標簽之間的相關(guān)性同時最小化特征與特征之間的相關(guān)性,保證訓練精度不受影響。
mRMR 屬于過濾式算法,通過觀察數(shù)據(jù)集內(nèi)在統(tǒng)計屬性進行特征選擇。它是一種全局最優(yōu)的算法,不依賴后續(xù)的回歸模型。為了得到最優(yōu)的特征數(shù)量,本文研究不同的mRMR 篩選的特征數(shù)量與預測精度的關(guān)系,如圖6 所示。
圖6 特征數(shù)量與預測精度的關(guān)系Fig.6 Relationship between feature numbers and prediction accuracy
實驗結(jié)果表明,合理的特征選擇可以在精度不變的情況下減小計算復雜度。綜合考慮訓練精度與訓練復雜度,提高模型的適應(yīng)性,在后續(xù)實驗中,mRMR 選擇100 個特征,其中直流特征、新能源特征、發(fā)電特征、負荷特征、節(jié)點特征個數(shù)分別為5,23,12,14,46。
經(jīng)過mRMR 算法選擇后特征比例如圖7 所示。
圖7 mRMR算法特征選擇結(jié)果分析Fig.7 Analysis of feature selection results of mRMR algorithm
由圖7 可知,直流特征、新能源特征、節(jié)點特征的比例都明顯增加,說明了新能源特征、直流特征在新型電力系統(tǒng)輸電斷面極限的重要性,因此經(jīng)過mRMR 特征選擇后重要性逐漸凸顯;節(jié)點特征包含電壓等信息,與系統(tǒng)穩(wěn)定性密切相關(guān),所以比例較大。該結(jié)果反面說明了mRMR 算法選出來的特征是符合新型電力系統(tǒng)特征的,有利于下一步回歸分析。
圖8 為AdaBoost 的訓練過程。由圖8 可知,隨著弱分類器數(shù)目增加,錯分樣本的權(quán)值會不斷加大,預測精度隨之提高。
圖8 AdaBoost訓練過程Fig.8 Training process of AdaBoost
AdaBoost 由多個弱分類器組合而成,因此弱分類器的參數(shù)和精度會影響預測結(jié)果。本文中,AdaBoost 由決策樹組成,AdaBoost 算法的訓練結(jié)果與決策樹的最大深度和決策樹的個數(shù)密切相關(guān),如圖9 所示。其中,縱坐標為決策樹最大深度,可知訓練精度隨決策樹最大深度的增加而快速提高,在達到5 層之后變化不大;橫坐標為弱分類器的數(shù)目。由圖9 可知,在同一最大深度的情況下,AdaBoost 預測精度隨弱分類器數(shù)目變化不明顯,弱分類器數(shù)目增大預測誤差略微下降,甚至在弱分類器數(shù)目過大時可能出現(xiàn)過擬合現(xiàn)象,導致預測誤差增加。綜合考慮,本文選擇50 個最大深度為5 的決策樹組成AdaBoost 模型。
圖9 AdaBoost參數(shù)對預測精度的影響Fig.9 Influence of AdaBoost parameters on prediction accuracy
圖10 為同樣的輸入數(shù)據(jù)下,AdaBoost、決策樹模型與全連接神經(jīng)網(wǎng)絡(luò)3 種算法的預測結(jié)果。實驗結(jié)果表明,本文提出的數(shù)據(jù)驅(qū)動斷面極限估算方法在多種神經(jīng)網(wǎng)絡(luò)模型下都有效。
圖10 預測算法結(jié)果對比Fig.10 Comparison of prediction algorithm results
3 種算法的平均誤差和預測時間對比如表4 所示。結(jié)果表明AdaBoost 預測誤差最小,預測時間較短。
表4 AdaBoost、決策樹、全連接神經(jīng)網(wǎng)絡(luò)對比Table 4 Comparison of AdaBoost,decision tree and fully connected neural networks
相比于傳統(tǒng)離線仿真方法,本文提出的方法計算速度快,結(jié)果更加精細。3 種方法在100 個樣本上的計算時間都小于100 ms,而且針對不同的運行狀態(tài),可以求出較為準確的斷面極限,對比傳統(tǒng)方法給出階梯式極限值更加精細,可以滿足新型電力系統(tǒng)實時控制優(yōu)化的要求。
新型電力系統(tǒng)具有交直流混聯(lián)、新能源比例高、新能源出力不確定性大等特點,這導致系統(tǒng)運行方式復雜繁多,輸電斷面極限在不同運行方式下波動變化大。針對傳統(tǒng)斷面極限離線仿真計算存在的速度慢、結(jié)果不夠精細等特點,本文提出了一種數(shù)據(jù)驅(qū)動的新型電力系統(tǒng)斷面極限估算方法。大量樣本分析表明皮爾遜系數(shù)受其線性特征的影響,因而不適用于新型電力系統(tǒng)。而本文提出的基于mRMR 特征選擇和AdaBoost 回歸算法,通過真實電網(wǎng)算例驗證,結(jié)果表現(xiàn)良好。結(jié)果表明,利用mRMR 算法篩選的100 個電力系統(tǒng)關(guān)鍵特征,結(jié)合AdaBoost 的強擬合能力,本文提出的數(shù)據(jù)驅(qū)動方法能精細地預測出不同運行方式下的斷面極限,平均預測誤差為0.4%,平均預測時間小于1ms。本文提出的方法有望為電力系統(tǒng)優(yōu)化調(diào)度實時提供具體運行條件下斷面極限的安全約束。
未來研究中,可以針對輸電斷面的選取、負荷不確定性對斷面極限的影響等展開研究。