祝海寧,丁云飛
(1.上海電機學院 資產(chǎn)與實驗室管理處,上海 201306; 2.上海電機學院 電氣學院,上海 201306)
斷路器是一種常見的廣泛應(yīng)用于電力系統(tǒng)中重要電力設(shè)備,不僅基數(shù)大,經(jīng)濟上的投入也很大.斷路器能夠根據(jù)電力運行狀態(tài)進行切換或通斷,其可靠性直接關(guān)系到整個電網(wǎng)的安全穩(wěn)定性.它自身的故障狀態(tài)往往會引發(fā)電力系統(tǒng)的較大事故,產(chǎn)生較大的社會和經(jīng)濟方面的影響.因此,針對斷路器的工作狀態(tài)進行準確高效的故障診斷分析,對于電力系統(tǒng)的安全運行以及電網(wǎng)質(zhì)量的穩(wěn)定都具有重要的意義.
故障診斷技術(shù)是通過對提取的故障數(shù)據(jù)樣本建立故障診斷模型,然后通過模型對待測樣本進行模式識別和分類.目前應(yīng)用較多的故障診斷方法都是基于人工智能的方法.專家系統(tǒng)通常是通過對故障信息建立專家知識庫和推理規(guī)則,或者與其他方法結(jié)合如小波分析等進行診斷[1-3].神經(jīng)網(wǎng)絡(luò)模型容易建立,在斷路器的部分故障狀態(tài)下仍可應(yīng)用于其他單元診斷[4-5],與其他優(yōu)化算法如粒子群[6]、貝葉斯決策[7]和主成分分析方法[8]相結(jié)合可提高斷路器的故障診斷正確率.近來,支持向量機(Support Vector Machine,SVM)作為一種核方法廣泛應(yīng)用在斷路器故障診斷領(lǐng)域,它還可以結(jié)合核主成分分析、因子分析、粒子群優(yōu)化等方法來簡化輸入特征樣本,優(yōu)化算法收斂,提高分類準確率[9-11].
然而這些方法在對斷路器故障進行診斷時,會存在一些難點.比如基于專家智能系統(tǒng)的診斷方式的難點是如何建立和更新非常依賴于專家經(jīng)驗的知識庫,以及如何解釋推理機制;將遺傳算法和神經(jīng)網(wǎng)絡(luò)引入到故障診斷中可使診斷模型更加復(fù)雜,模型訓練時需要盡可能多樣本來提高精度,計算量也隨之增大.基于SVM的算法雖然實現(xiàn)了非線性映射,但模型還是需要大量支持向量,隨著樣本增加,運算量增加也很大.
在實際運行中,斷路器故障原因比較復(fù)雜.當斷路器處于非正常工作狀態(tài)時,斷路器設(shè)備所在的回路以及設(shè)備本身會伴隨著一些與故障明顯相關(guān)的特征,即有關(guān)的電氣量波動明顯,而相關(guān)的非電氣量也會發(fā)生很大變化.本文針對SF6氣體斷路器,通過一種基于核的分層貝葉斯故障診斷方法提取分析相關(guān)電氣量以及非電氣量信息,從而能使斷路器故障時快速報警和診斷,并降低誤報的頻次,盡可能保證電網(wǎng)的安全可靠供電.
KPCA是一種核方法,是主成分分析(Principal Component Analysis,PCA)的一種延伸.首先,定義一個樣本空間X及其在高維空間的映射φ(X)為
然后定義一個核函數(shù)K,對于任意xi,xj∈X都有如下等式成立:
(1)
目前,應(yīng)用較多的核函數(shù)有多項式核、高斯核、Sigmoid核、B樣條核等.KPCA先將樣本輸入空間里的X轉(zhuǎn)換到高維向量空間;然后對高維空間中線性可分的映射樣本進行PCA,提取主要成分對應(yīng)的特征向量;再對原樣本集進行特征提取和降維處理.用C表示高維空間的協(xié)方差矩陣,則有
(2)
其特征值λ和特征向量v需要滿足:
(3)
式(3)通過點積可以變?yōu)?/p>
(4)
由式(4)可推出
(5)
根據(jù)式(1)的定義,式(5)可以簡化為
(6)
對式(6)求解就可以得到λ和v.而特征向量在高維空間的映射變?yōu)?/p>
(7)
KPCA還需要對高維空間進行預(yù)處理,則核矩陣可以通過下式完成中心化:
(8)
分層貝葉斯模型是基于貝葉斯概率分析的一種監(jiān)督學習方法[12].通過對兩層先驗參數(shù)的分布進行設(shè)定,能令模型中的部分參數(shù)系數(shù)減少到0,根據(jù)需求調(diào)節(jié)模型的復(fù)雜度,提高運行時間.給定N個數(shù)據(jù)的一個輸入訓練集合D={(x1,y1),(x2,y2),…,(xN,yN)},這里xi∈(1,2,…,N)為D維輸入向量,yi∈(1,2,…,N)為一個二值輸出向量.給定N×M維矩陣H=[h(x1),h(x2),…,h(xN)]T,M為所選基函數(shù)個數(shù).于是可以得到含有潛變量z的模型
(9)
式中:z=(z1,z2,…,zN)T;w為符合高斯分布的零均值的單位誤差向量,可以表示為p(w)=φ(w|0,1);β為需要估計的參數(shù).
模型根據(jù)z≥0時y=1,以及z<0時y=0來進行分類,即滿足
(10)
對z求取似然函數(shù)如下:
(11)
為了便于對β求取參數(shù)的估計值,令βi滿足
(12)
模型中z和新引入的τ=[τ1,τ2,…,τM]T都是未知數(shù)據(jù),這里將模型分層能夠容易通過期望極大(Expectation Maximization algorithm,EM)方法實現(xiàn)對參數(shù)的估計.將Jeffreys分布引入到τ上能夠減少額外參數(shù)參與到運算中[13],從而簡化參數(shù)估計模型.由式(11)、式(12)能夠得出
(13)
通過EM算法,求出對Υ的期望值V和z的期望值s,這里t是迭代次數(shù),從而得出
(14)
(15)
聯(lián)立式(13)~式(15),可以求得參數(shù)β為
(16)
為了避免迭代過程中除以零的出現(xiàn),新定義一矩陣
(17)
則式(16)可以變?yōu)?/p>
(18)
本文所提出的故障診斷方法,首先采用KPCA對原數(shù)據(jù)進行特征值提取,從而找出訓練樣本在高維映射中的特征向量.其次,將核方法引入分層貝葉斯模型中,這里的核函數(shù)都選擇相同的高斯核函數(shù).同時,由于該分層貝葉斯分類器只能解決兩類分類問題,而生產(chǎn)過程中出現(xiàn)的故障往往是多于兩類的.本文采用故障樹中的二叉樹理論,建立一系列對應(yīng)不同故障類別的二分類器,進行組合診斷.整體故障診斷如圖1所示.
圖1 基于核的分層貝葉斯故障診斷框圖Fig.1 Kernel based hierarchical Bayesian framework for fault diagnosis
具體的故障診斷算法步驟如下:
步驟1對歷史訓練數(shù)據(jù)和待測數(shù)據(jù)標準化,并對模型參數(shù)進行初始化和設(shè)定迭代終止條件.
步驟2利用高斯核函數(shù)如下所示,計算核矩陣K,即
(19)
式中:δ為核寬參數(shù),可以由交叉尋優(yōu)方法來確定.
步驟3按照式(8)修正核矩陣得到K′.
步驟4根據(jù)系統(tǒng)要求,按照式(7)計算特征向量的投影tk,從而得到映射后的訓練數(shù)據(jù)集X.
步驟5利用核方法對X重新定義,并求取設(shè)計矩陣,于是H中的向量變?yōu)?/p>
(20)
步驟6將H代入到分層貝葉斯模型中,通過式(15)和式(17)分別求得s(t)和Q(t)值.
步驟7利用式(18)求得新的參數(shù)向量β(t+1).
步驟8重復(fù)步驟6和7,直到滿足算法終止條件.
步驟9對待測樣本進行分類診斷.
步驟10判斷故障類別數(shù)c是否等于2.如果是,則輸出診斷結(jié)果;如果不是,則采用二叉樹的方法構(gòu)建多類分類器:首先將故障種類中最經(jīng)常發(fā)生的故障作為第一類,將其他(c-1)類故障看作另一類,重復(fù)步驟5~9,建立第1個二分類模型;然后在(c-1)類故障中重復(fù)前面的分類,建立第2個二分類模型,直到得到(c-1)個二分類器.待測樣本通過這些分類器得到最后的多分類故障.
實驗以某電氣公司3AP1FG型SF6氣體斷路器在線監(jiān)測系統(tǒng)進行數(shù)據(jù)的采集.該系統(tǒng)包括傳感器(如壓力傳感器PMR300和溫度傳感器PT100等)、數(shù)據(jù)處理系統(tǒng)、通訊網(wǎng)絡(luò)(RS485總線)和監(jiān)控主機.監(jiān)控主機通過提取分析大量斷路器故障或非正常工作時相關(guān)電氣量以及非電氣量歷史信息,利用所提出的故障診斷方法在Matlab上對其進行離線訓練;然后使用訓練好的故障診斷模型對斷路器故障進行在線分析,快速診斷出結(jié)果,判斷屬于哪類故障,并在人機界面上直觀展示出來.
高壓斷路器SF6的故障診斷主要依賴于對采集數(shù)據(jù)的分析.實驗選取能夠為SF6氣體斷路器故障診斷提供重要的參考信息的8個非電氣量,包括SF6氣體微水量、SF6氣體密度、導電接觸部分溫度、絕緣電阻、接觸電阻、分合閘線圈電流、線圈電壓、分合閘時間.這里主要考慮SF6斷路器的常見的4種故障,包括氣體泄漏、機械卡澀、絕緣閃絡(luò)和二次回路故障.為驗證所提出的故障診斷算法的有效性,選取故障實驗訓練樣本400個,其中每種故障樣本為100個.另外取100個樣本作為待測數(shù)據(jù)集,其中每種故障樣本為25個.訓練樣本標準化后通過核主元分析其樣本閾值對主元數(shù)據(jù)樣本的關(guān)系如圖2所示.從圖2中曲線可以看出:KPCA對原訓練樣本的縮減效率,當閾值增加時,縮減的數(shù)據(jù)組數(shù)則減少,也就是說為了達到某一閾值所需要的樣本數(shù)量增加了;關(guān)系圖的斜率在閾值取0.96~0.98時最大,此時在此閾值區(qū)間內(nèi)對應(yīng)的縮減樣本所含原信息量在保持一定的縮減成本之下是最大的,即核主元轉(zhuǎn)換效率最高.所以最優(yōu)的閾值設(shè)為0.97,對應(yīng)的新的樣本數(shù)為280組.
圖2 KPCA閾值與主元樣本量關(guān)系圖Fig.2 The relationship KPCA between threshhold and remained samples
將新訓練樣本通過二叉樹訓練出3個基于核的分層貝葉斯模型,然后將100個測試數(shù)據(jù)分類.在相同的初始條件下,該方法與其他另外兩種廣泛應(yīng)用的方法進行了比較.① KPCA通過統(tǒng)計方法求取T2和平方預(yù)測誤差(Squared Prediction Error,SPE)統(tǒng)計量,判斷樣本的顯著誤差,從而進行故障診斷.② 將SVM和二叉樹結(jié)合實現(xiàn)的斷路器的多類故障診斷.其分類結(jié)果如表1所示.
表1 故障診斷結(jié)果Tab.1 The result of fault diagnosis
表1中:F1~F4表示4類故障中每類故障所對應(yīng)的錯分樣本數(shù)目;正確率是針對整個測試樣本的正確分類的準確率;nsv表示3個二分類模型需要的支持向量的平均個數(shù).從表1中可以看出:分層貝葉斯的分類準確率比其他兩個方法都高些,KPCA較低,并且它是基于統(tǒng)計的方法來判斷故障類別,所以沒有具體的支持向量個數(shù).然而對于SVM而言,它的平均nsv為42個,但分層貝葉斯只需要19個.這說明在分類精度相差不大,甚至更好的情況下,后者所建立的模型參數(shù)個數(shù)比前者少一半左右,模型的結(jié)構(gòu)要更為簡單,計算效率相應(yīng)更高.
本文針對電力系統(tǒng)中常見的斷路器設(shè)備的故障,提出了一種基于核的分層貝葉斯故障診斷方法.該方法利用斷路器的8個故障特性參數(shù)為輸入樣本,利用KPCA對原故障訓練集合進行縮減,并最大限度地保留原始數(shù)據(jù)集的信息.然后在新數(shù)據(jù)樣本的基礎(chǔ)上,訓練已經(jīng)利用核方法改進的分層貝葉斯模型.這樣就可以通過核函數(shù)隱式映射為高維線性關(guān)系,實現(xiàn)非線性故障診斷.根據(jù)故障類別數(shù),結(jié)合二叉樹進行多類故障診斷.通過實例分析,該故障診斷方法與另外兩種方法KPCA和SVM的故障診斷結(jié)果比較表明,所提出的基于核的分層貝葉斯故障診斷方法在數(shù)據(jù)樣本縮減、模型參數(shù)簡化、分類準確率上都好于另外兩種方法,從而驗證了本文方法的有效性.