包永金
(宜賓電業(yè)局,四川 宜賓 644000)
在能量管理系統(tǒng)(energy management system,EMS)中,電力系統(tǒng)狀態(tài)估計負責處理由SCADA采集到的包含噪聲的冗余數(shù)據(jù)以便為諸如:經(jīng)濟分配、安全分析等應(yīng)用軟件提供精確的實時數(shù)據(jù)。電力系統(tǒng)運行人員通過分析這些軟件的結(jié)果來采取決策。如果所使用的實時數(shù)據(jù)庫中包含錯誤數(shù)據(jù),這些應(yīng)用軟件的結(jié)果可能毫無意義,根據(jù)這些結(jié)果采取的決策也很可能對電力系統(tǒng)的安全運行產(chǎn)生危險。故而不良數(shù)據(jù)辨識是狀態(tài)估計中一項十分重要的任務(wù)。
現(xiàn)行電力系統(tǒng)中有很多狀態(tài)估計的方法[1]。在正常運行(噪聲數(shù)據(jù)主要來自量測不準確)的條件下,這些方法通常都會獲得很好的結(jié)果。不過當出現(xiàn)較大的量測誤差和拓撲結(jié)構(gòu)錯誤的時候,情況可能就不一樣了。不良數(shù)據(jù)辨識的方法正是基于這些問題而提出的。大多數(shù)的方法都是在進行狀態(tài)估計計算后,利用量測殘差進行假設(shè)檢驗的統(tǒng)計理論方法[2-4]。在很多情況下這些方法都表現(xiàn)得很好,不過仍然存在著一些缺點:難于辨識多相關(guān)不良數(shù)據(jù),對于關(guān)鍵量測點的不良數(shù)據(jù)和包含不相關(guān)支路時的拓撲結(jié)構(gòu)錯誤無法辨識。而且這些方法很難同時處理遙測和遙信不良數(shù)據(jù)。針對以上這些問題,又提出了基于數(shù)據(jù)挖掘的方法。主要有基于神經(jīng)網(wǎng)絡(luò)(ANN)[5-7]、基于模糊理論和聚類分析[8]及基于間歇統(tǒng)計(GSA)[9]等一些方法?;谏窠?jīng)網(wǎng)絡(luò)的方法大多采用典型工況的正確量測數(shù)據(jù)作為訓練樣本來構(gòu)造了一個神經(jīng)元網(wǎng)絡(luò),用估計前濾波來辨識各種形式的不良數(shù)據(jù)。但由于神經(jīng)網(wǎng)絡(luò)算法的固有特性,不能從根本上避免訓練過飽和及陷入局部最小值的問題,且隨著時間的推移,訓練樣本集應(yīng)該動態(tài)更新,但此類文獻也沒有提出對樣本集更新的動態(tài)處理措施。
支持向量機(support vector machine,SVM)是數(shù)據(jù)挖掘中一種具有優(yōu)良模式識別性能的新方法。利用SVM回歸和分類算法分別建立起了辨識遙測和遙信不良數(shù)據(jù)的模型:回歸模型采用SVM非線性回歸算法對各種運行情況下的正常遙測數(shù)據(jù)進行曲線擬合(即訓練),使模型具有對遙測數(shù)據(jù)的一步預測能力;針對狀態(tài)估計中拓撲結(jié)構(gòu)錯誤的特點(一條支路上的拓撲結(jié)構(gòu)錯誤會在該支路周圍的支路潮流和母線注入功率上產(chǎn)生較大的殘差),應(yīng)用支持向量機分類算法構(gòu)建起了辨識遙信不良數(shù)據(jù)的分類模型。值得一提的是上述兩種模型都可進行在線訓練,SVM在線學習方法能對每次迭代過程中增加的樣本進行學習,利用前一次迭代的運算結(jié)果,減少計算復雜度,實現(xiàn)在較小時間代價下的新樣本學習。模型構(gòu)建好后首先運用回歸模型對實際遙測數(shù)據(jù)進行預測,通過比較預測值與實測值之間的殘差來一次性辨識量測數(shù)據(jù)中的遙測不良數(shù)據(jù)。一旦檢測出不良數(shù)據(jù)就可將其替換成合理的預測值以避免出現(xiàn)系統(tǒng)的不可觀測性。遙信不良數(shù)據(jù)辨識時,先對消除不良數(shù)據(jù)影響后的量測數(shù)據(jù)進行狀態(tài)估計,算出量測殘差,再將量測殘差輸入分類模型,運用SVM分類的良好泛化能力辨識出遙信錯誤。通過對IEEE-30節(jié)點模型的仿真結(jié)果表明,所提出的方法對電力系統(tǒng)不良數(shù)據(jù)檢測的效率和準確性都有較大的提高,說明了方法的有效性。
支持向量機(SVM)是由 Vapnik[10]最早提出的一種統(tǒng)計學習方法。目前國內(nèi)外所研究的支持向量機回歸算法主要是多輸入、單輸出,即每次只能對一個特征量進行回歸預測,對于多輸出支持向量機的研究并不多[11-12],且算法的效果也不太理想。鑒于此,采用多個單輸出支持向量機來實現(xiàn)多輸出問題。
將支持向量機用于解決回歸問題即支持向量回歸(support vector regression,SVR)。SVR用來解決回歸預測的基本思想是:通過一個非線性映射φ,將輸入空間中的數(shù)據(jù)映射到高位特征空間G中,并在G空間中進行線性回歸。假設(shè)有這樣的訓練數(shù)據(jù){(x1,y1),…,(xl,yl)?x × R},這里 x 表示輸入樣本空間(如:x=Rd)。SVR通過引入損失函數(shù)來解決回歸問題,采用式(1)來計算函數(shù)。
對優(yōu)化目標取極值
約束條件為
約束條件為
對優(yōu)化目標取極值和引入拉格朗日因子ai和,函數(shù)可表示為
高維特征空間中線性問題的內(nèi)積運算可以用核函數(shù)來代替,即
常用的核函數(shù)有:徑向基函數(shù)、多項式函數(shù)、Sigmoid函數(shù)、線性函數(shù)等。
目前,SVR的訓練方式有兩種:批量訓練與在線訓練。其問題表述和最優(yōu)化求解的原理相同,不同點在于:在線支持向量機不斷將新樣本添加到訓練集,通過在線調(diào)整模型參數(shù),實現(xiàn)預測模型的不斷變化,而不是批量式的一次訓練所有樣本。這樣不但能提高其訓練時間,而且能提高模型的適應(yīng)能力,使系統(tǒng)的運行情況發(fā)生變化時,模型能相應(yīng)地發(fā)生變化。增量式SVR的基本思想如圖1所示。
這里采用增量學習的SVR來訓練數(shù)據(jù),具體算法可以查看文獻[13]。
支持向量機分類(support vector classification,SVC)與SVR算法很相似,具體算法可查看相關(guān)文獻[14],在此不再贅述。采用在狀態(tài)估計前后分別進行不良數(shù)據(jù)辨識的方式,在狀態(tài)估計后采用SVC主要對遙信不良數(shù)據(jù)進行分類辨識。
圖1 增量式SVR的基本思想
一般來說,當系統(tǒng)某一元素(輸電線或母線)發(fā)生拓撲錯誤或量測量突變時,不良數(shù)據(jù)只會出現(xiàn)在圍繞該元素的量測點上,故而對每一個系統(tǒng)元素都采用一個SVC分類器來具體辨識出不良數(shù)據(jù)的類別。當出現(xiàn)不良數(shù)據(jù)時,只會調(diào)用該不良數(shù)據(jù)所對應(yīng)的SVC分類器,以減少計算量。對任意支路s-r來說,SVC的輸入是該支路潮流和支路兩端母線上注入功率的標準殘差;當SVC用于辨識母線結(jié)構(gòu)錯誤時,其輸入為母線電壓和母線上各支路潮流的標準殘差。
狀態(tài)估計后的不良數(shù)據(jù)分為支路拓撲錯誤、母線拓撲錯誤以及遙測錯誤。遙測錯誤是由于狀態(tài)估計前辨識遙測不良數(shù)據(jù)時的漏判或誤判造成,此外系統(tǒng)中某一元素發(fā)生的拓撲錯誤也可能會在與其相鄰的元素上產(chǎn)生較大的殘差,此類異常數(shù)據(jù)點稱作非不良數(shù)據(jù)點。在訓練階段,支路拓撲錯誤所對應(yīng)的SVC輸出選為-1,遙測錯誤的輸出選為1,而非不良數(shù)據(jù)點的輸出選為0。至于母線拓撲錯誤的輸出則要根據(jù)具體母線可能發(fā)生的拓撲錯誤而定,有幾種拓撲錯誤就選幾個輸出值。
應(yīng)用支持向量機來辨識電力系統(tǒng)不良數(shù)據(jù)的模型如圖2所示。下面分別對模型各部分加以說明。
第1步:計算遙測數(shù)據(jù)的估計值和平方誤差
由經(jīng)過良好訓練的SVR模型可得到原始遙測數(shù)據(jù)的估計值。初始SVR模型可通過離線訓練獲得,訓練集可由各種運行條件下的歷史正常遙測數(shù)據(jù)或?qū)W(wǎng)絡(luò)進行離線仿真獲取。進行在線預測時,每采到一次遙測數(shù)據(jù)就可由回歸模型獲得該組遙測數(shù)據(jù)的估計值,然后再將該組遙測數(shù)據(jù)添加到訓練數(shù)據(jù)中進行SVR增量學習。由于SVR增量學習不需要從頭進行訓練,所以訓練的時間很短,滿足在線辨識的需要。獲得估計值之后,就可由量測值和估計值計算平方誤差。
圖2 不良數(shù)據(jù)辨識模型
第2步:辨識和修正遙測不良數(shù)據(jù)
為避免閾值選取主觀性對辨識結(jié)果帶來的影響,這里采用GSA算法來辨識遙測數(shù)據(jù)中的不良數(shù)據(jù)。GSA方法是一種強化聚類效果的數(shù)據(jù)挖掘算法,它可以估計數(shù)據(jù)集最佳的聚類個數(shù)。在電力系統(tǒng)不良數(shù)據(jù)辨識中,可以將良好數(shù)據(jù)和不良數(shù)據(jù)所在的聚類準確地區(qū)分進而檢測和辨識不良數(shù)據(jù)[9,13]。據(jù)此將上一步獲得的平方誤差進行聚類,如果聚類個數(shù)大于1,則表明有不良數(shù)據(jù),接著辨識出不良數(shù)據(jù)并采用估計值進行修正。
第3步:進行狀態(tài)估計
在消除遙測不良數(shù)據(jù)的影響后就可利用狀態(tài)估計器對系統(tǒng)進行狀態(tài)估計,這里采用加權(quán)最小二乘法狀態(tài)估計。進行狀態(tài)估計的目的是為了獲取系統(tǒng)最可能的運行狀態(tài)和為辨識遙信不良數(shù)據(jù)做準備。
第4步:計算標準殘差并判別是否存在不良數(shù)據(jù)
由上一步計算得到的狀態(tài)估計值和SCADA量測值就可以計算出標準殘差,判別是否存在不良數(shù)據(jù)仍然采用GSA算法,判別的原則同辨識遙測不良數(shù)據(jù)時一樣。如果不存在不良數(shù)據(jù)則狀態(tài)估計結(jié)束,輸出估計結(jié)果。依然存在不良數(shù)據(jù)時,此時的不良數(shù)據(jù)有兩種情況:一是由于遙信數(shù)據(jù)錯誤產(chǎn)生,此類不良數(shù)據(jù)即遙信不良數(shù)據(jù);此外在辨識遙測不良數(shù)據(jù)時漏判和相鄰支路的遙信錯誤也會導致本支路殘差過大而出現(xiàn)不良數(shù)據(jù),此類的不良數(shù)據(jù)稱為量測量突變。這里采用SVM分類算法來辨識上述不良數(shù)據(jù)的類別。
第5步:由SVM分類模型辨識不良數(shù)據(jù)的類別
由于發(fā)生拓撲錯誤時的殘差特性與發(fā)生遙測不良數(shù)據(jù)時的殘差特性有很明顯的區(qū)別,所以在獲取訓練數(shù)據(jù)集時不需要模擬系統(tǒng)所有運行狀態(tài)。進行在線辨識時,對上一步獲得的每一個不良數(shù)據(jù)調(diào)用它所對應(yīng)的分類器,由分類器就可獲得該不良數(shù)據(jù)的類型。對于遙測不良數(shù)據(jù)可采用其估計值進行修正或者直接丟棄;對于拓撲結(jié)構(gòu)錯誤則更新系統(tǒng)拓撲結(jié)構(gòu)。接著轉(zhuǎn)入下一次狀態(tài)估計,重復第3步到第5步直到不再出現(xiàn)不良數(shù)據(jù)為止。
通過IEEE-30節(jié)點系統(tǒng)為例來驗證方法的可行性。在缺乏真實量測數(shù)據(jù)的情況下,假設(shè)系統(tǒng)的運行情況如下:將原系統(tǒng)中給定的負荷作為最大負荷需求,最小負荷假定為最大負荷的20%,用一個負荷取值區(qū)域模型來模擬母線上的負荷波動。這樣的一個例子如圖3所示,圖3中一條母線上的最大和最小負荷通過一個6個時間段的取值區(qū)域來表示。母線上所有可能的負荷波動都包含在陰影區(qū)域以內(nèi)。對母線2上所接的發(fā)電機采用同樣的處理方法,母線1作為平衡節(jié)點,變壓器的變比選取在0.95~1.05之間。
根據(jù)上述運行情況,通過仿真計算獲取了288組運行數(shù)據(jù),其中三分之二用于訓練SVM模型,其余用于測試。模型將添加噪聲后的數(shù)據(jù)作為輸入數(shù)據(jù),將潮流計算值作為目標值來進行訓練。對于大型系統(tǒng)不良數(shù)據(jù)辨識實時性的要求,在訓練和測試階段可將量測值分為幾組分別計算,即每組數(shù)據(jù)都可以有它相應(yīng)的模型。這樣就可將每次采集到的量測數(shù)據(jù)送入其對應(yīng)的分組模型進行不良數(shù)據(jù)的辨識。這里采用文獻[7]所述將數(shù)據(jù)按電壓等級分為了兩組。
情況1:遙測不良數(shù)據(jù)
假設(shè)第35組測試數(shù)據(jù)中出現(xiàn)了6個不良數(shù)據(jù),分別是 P6-9、P6-10、Q19-20、Q8-28、Q2和 V15。不良數(shù)據(jù)與正常量測值的偏差在±(20-100)標準差之間。此種情況下,GSA算法正確地區(qū)分出了上述不良數(shù)據(jù)。不良數(shù)據(jù)的情況如表1所示。
表1 遙測不良數(shù)據(jù)辨識結(jié)果
情況2:支路遙信變位錯誤
假設(shè)在第72組數(shù)據(jù)的時刻收到支路4-12錯誤的遙信變位信息。支路4-12開關(guān)實際為閉合狀態(tài),但收到的遙信信息為開關(guān)斷開。根據(jù)前面所提方法,在進行狀態(tài)估計后,只有當出現(xiàn)不良數(shù)據(jù)時才會調(diào)用不良數(shù)據(jù)所對應(yīng)的SVM分類模型對不良數(shù)據(jù)進行辨識,且每個系統(tǒng)元素都對應(yīng)著一個SVM分類模型。由GSA算法得出的一組可疑數(shù)據(jù)如表2所示。從分類結(jié)果可以得出SVM分類模型成功辨識出了支路4-12的遙信變位錯誤。
表2 支路遙信錯誤辨識
值得注意的是當辨識出遙信錯誤后就可直接更新系統(tǒng)的拓撲結(jié)構(gòu),無需再進行其他的辨識。
情況3:母線分裂型錯誤
假定在90組數(shù)據(jù)的時刻母線15發(fā)生分裂,但并沒有收到相應(yīng)的遙信信息。分裂前后的情況如圖3所示。
圖3 母線15分裂前后模型
表3列出了可疑數(shù)據(jù)集,在訓練階段將此類型拓撲錯誤對應(yīng)的SVC輸出選為2。由分類結(jié)果可知SVM模型成功辨識出了母線15的分裂錯誤。
表3 母線分裂型錯誤辨識
以上提出了一種在電力系統(tǒng)實時狀態(tài)估計中辨識不良數(shù)據(jù)的新方法。與傳統(tǒng)狀態(tài)估計中的假設(shè)檢驗方法相比,該方法可以很好地避免殘差污染和殘差淹沒,且能克服基于神經(jīng)網(wǎng)絡(luò)的方法中神經(jīng)網(wǎng)絡(luò)訓練過飽和和容易陷入局部最小值的問題。仿真分析證明了本方法的有效性,將此方法與現(xiàn)行電力系統(tǒng)狀態(tài)估計結(jié)合可有效實現(xiàn)不良數(shù)據(jù)的辨識與修正。
[1]ALi Abur,Antonin Gómez Expósito.Power System State Estimation:Theory and Implementation[M].New York:Marcel Dekker,2004.
[2]L.Mili,Th Van Cutsem and M.Ribbens Pavella.Hypothesis Testing Identification:A New Method for Bad Data Analysis in Power System State Estimation[J].IEEE Trans.on Power Apparatus and Systems,1984,103(11):3239-3252.
[3]L.Mili,Th.Van Cutsem.Implementation of HTI Method in Power System State Estimation[J].IEEE Trans.on Power Systems,1988,3(3):887-889.
[4]Salehfar H,Zhao R.A Neural Network Preestimation Filter for Bad Data Detection ad Identification in Power System State Estimation [J].Electric Power System Research.1995,34(9):127-134.
[5]J.C.S.Souza,A.M.Leite da Silva,A.P.Alves da Silva.Online Topology Determination and Bad Data Suppression in Power System Operation Using Artificial Neural Networks[J].IEEE Transactions on Power Systems,1998,13(3):796-803.
[6]S.P.Teeuwsen.Neural Network Based Multi-dimensional Feature Forecasting for Bad Data Detection and Feature Restoration in Power System[C].IEEE Power Engineering Society General Meeting,2006:18-22.
[7]D.Singh,J.P.Pandey,D.S.Chauhan.Topology Identification,Bad Data Processing,and State Estimation Using Fuzzy Pattern Matching[J].IEEE Transactions on Power Delivery,2005,20(3).
[8]Huang SJ,Lin JM.Enhancement of Power System Data Debugging Using GSA-based Data Mining Technique.[J].IEEE Transactions on Power Systems,2002,17(4):1022-1029.
[9]Vapnik V.The Nature of Statistical Learning Theory[M].New York:Springer,1995:138-145.
[10]F.Pérez-Cruz,G.Camps,E.Soria,J.Pérez,A.R.Figueiras Vidal,and A.Artés-Rodríguez.Multi-dimensional Function Approximation and Regression Estimation[C].in Proc.ICANN,Madrid,Spain,2002.
[11]M.P.Sánchez-Fernández,M.de Prado-Cumplido,J.Arenas-García,and F.Pérez-Cruz.SVM Multiregression for Nonlinear Channel Estimation in Multiple-input Multiple-output Systems[J].IEEE Trans.Signal Process,2004,52(8):2298-2307.
[12]Parrella F.Online Support Vector Regression[D].Master's Thesis,University of Genoa,2007.
[13]Chih-Wei Hsu,Chih-Chung Chang,and Chih-Jen Lin.A Practical Guide to Support Vector Classification.Technical Report,Department of Computer Science and Information Engineering,National Taiwan University,Taipei,2003.http://www.csie.ntu.edu.tw/~ cjlin/libsvm/
[14]吳軍基,楊偉,葛成,等.基于GSA的肘形判別用于電力系統(tǒng)不良數(shù)據(jù)辨識[J].中國電機工程學報,2006,26(22):23-28.