王鶴,姜鴻儒,王振丁
(1. 東北電力大學(xué),吉林 吉林 132012; 2. 國網(wǎng)山東省電力公司黃島供電公司,山東 青島 266000)
電力變壓器作為電力系統(tǒng)中能量轉(zhuǎn)換、傳輸?shù)暮诵模芊窨焖?、?zhǔn)確地診斷出變壓器故障,直接影響系統(tǒng)的安全、穩(wěn)定運行[1-2]。我國目前已有較多變壓器在長期運行過程中出現(xiàn)絕緣老化、材質(zhì)劣化等故障隱患,這將導(dǎo)致發(fā)生事故的概率不斷增加[3]。由此有必要采取合理的方法來及時的發(fā)現(xiàn)變壓器潛伏性故障,進(jìn)而預(yù)防和降低事故發(fā)生的概率[4]。
目前,變壓器油中溶解氣體分析法(Dissolved Gas Analysis,DGA)已成為診斷和檢測變壓器內(nèi)部故障性質(zhì)的重要方法[5]?;贒GA已形成了IEC推薦的三比值法、Rogers法等傳統(tǒng)診斷方法[6-7]。隨著人工智能技術(shù)的發(fā)展,國內(nèi)外學(xué)者將人工神經(jīng)網(wǎng)絡(luò) (ANN)[6]、貝葉斯分類器[8]、極限學(xué)習(xí)機(jī)(ELM)[9]和支持向量機(jī)(SVM)[10]等人工智能算法引入到變壓器故障診斷領(lǐng)域,為電力變壓器故障診斷技術(shù)的發(fā)展提供了新思路。其中,支持向量機(jī)因所需訓(xùn)練樣本數(shù)據(jù)少、泛化能力強(qiáng)等優(yōu)點廣泛應(yīng)用于變壓器故障診斷中[11-12]。文獻(xiàn)[12]利用布谷鳥算法對SVM的參數(shù)進(jìn)行尋優(yōu),利用優(yōu)化后的SVM模型進(jìn)行變壓器故障判斷。文獻(xiàn)[13]利用建立的快速相關(guān)向量機(jī)多層次分類模型減少了模型的訓(xùn)練時間,并利用量子粒子群算法優(yōu)化了模型參數(shù),提高了診斷的精度。文獻(xiàn)[14]利用多核學(xué)習(xí)向量機(jī)將模型分解為2個凸優(yōu)問題進(jìn)行求解,降低了計算復(fù)雜度。以上基于SVM的智能算法最終均是以故障類型作為診斷的結(jié)果,但是考慮到變壓器結(jié)構(gòu)復(fù)雜,故障現(xiàn)象與故障特征間存在著模糊性,其仍存在誤診斷問題。
提出一種基于MCPO模型的變壓器故障診斷方法,其在繼承了SVM優(yōu)點的基礎(chǔ)上,通過利用Sigmoid函數(shù)實現(xiàn)SVM的概率輸出,進(jìn)而綜合多個二分類輸出結(jié)果,將模型的求解轉(zhuǎn)化為一個凸二次規(guī)劃求解問題實現(xiàn)多分類概率輸出。該方法能夠判別故障特征是否明確,減少了對變壓器故障的誤判,仿真結(jié)果驗證了基于MCPO模型的變壓器故障診斷方法的有效性。
所建立的基于SVM的MCPO模型是在傳統(tǒng)SVM方法的基礎(chǔ)上,通過引入Sigmoid函數(shù)將SVM的決策函數(shù)輸出映射為二分類概率輸出,進(jìn)而綜合多個二分類輸出結(jié)果,將模型的求解轉(zhuǎn)化為一個凸二次規(guī)劃求解問題實現(xiàn)多分類概率輸出。
支持向量機(jī)的本質(zhì)是在訓(xùn)練樣本數(shù)據(jù)中找出用于構(gòu)造最優(yōu)分類超平面的支持向量,在數(shù)學(xué)上可歸結(jié)為求解一個二次優(yōu)化問題[12]。
對于線性可分的樣本,其可被最優(yōu)分類超平面區(qū)分開,超平面方程為:
ex+f=0,e∈Rn,f∈R
(1)
式中e為超平面法線;f為分類閾值;n為樣本空間維數(shù)。
設(shè)一組樣本(xi,yi),xi為樣本數(shù)據(jù),yi為樣本類別標(biāo)志。最優(yōu)分類超平面問題的求解可轉(zhuǎn)化為求解帶約束條件的優(yōu)化問題:
(2)
式中l(wèi)為訓(xùn)練樣本總數(shù)。
對于線性不可分的樣本,在約束條件中引入松弛變量βi來解決分類誤差問題,則約束條件可表示為:
yie·xi+f≥1-βii=1,2,…,l
(3)
由此可得到線性不可分時的最優(yōu)分類面,其可表示為如式(4)所示的優(yōu)化問題:
(4)
式中C(C>0)為懲罰參數(shù),其作用是控制對錯分樣本的懲罰程度。
利用拉格朗日函數(shù)求解上述優(yōu)化問題:
(5)
式中ai為拉格朗日乘子。
對于非線性問題,SVM通過引入核函數(shù)實現(xiàn)某一非線性變換后的線性分類。文中采用RBF作為模型的核函數(shù):
(6)
式中σ為RBF函數(shù)寬度參數(shù)。
則SVM的分類決策函數(shù)為:
(7)
采用文獻(xiàn)[15]的方法利用Sigmoid函數(shù)將g(x)映射在區(qū)間[0,1],則概率輸出表達(dá)式:
(8)
式中a,b為Sigmoid函數(shù)的待定參數(shù)。
Sigmoid函數(shù)的參數(shù)a,b可通過最小化交叉熵誤差函數(shù)獲得,其求解模型可表示為:
(9)
其中:
(10)
式中M是樣本類型為yi=1的樣本個數(shù);M′是樣本類型為yi=-1的樣本個數(shù)。
式(10)可利用牛頓法獲得最優(yōu)解,即令G(a,b)的梯度矩陣等于0時的解為最優(yōu)解。G(a,b)的梯度矩陣如式(11)所示。
(11)
獲得參數(shù)a,b后,則可利用Sigmoid函數(shù)將g(x)映射成概率輸出形式。對于一個二分類問題,利用式(8)可獲得x屬于某一類(w或v類)的概率估計swv:
(12)
電力變壓器的故障類型眾多,其診斷的過程應(yīng)屬于多分類問題。一個m分類的問題應(yīng)該綜合考慮1/2m(m-1)個二分類SVM的結(jié)果,進(jìn)而將其swv綜合為多分類的概率輸出,則x為每一類的概率pw可表示為:
(13)
利用文獻(xiàn)[16]給出的從二分類概率得到多分類概率的方法實現(xiàn)多分類的概率輸出。考慮有:
(14)
即:
swv/svw≈pw/pv
(15)
對上式進(jìn)行變換并求和:
(16)
利用式(16)求解以下模型進(jìn)而獲得pw:
(17)
上述模型的求解可轉(zhuǎn)化為求解一個凸二次規(guī)劃問題:
(18)
當(dāng)滿足式(19)時,其獲得最優(yōu)解。
(19)
式中e=[1,1, …,1]T,pT=[p1,p2, …,pm]?;赟VM的MCPO模型構(gòu)建流程見圖1。
MCPO模型的輸入為(x,y),其中x是DGA數(shù)據(jù)中H2、CH4、C2H6、C2H4、C2H2這五種氣體含量,分別記作x1、x2、x3、x4、x5,則特征向量x=(x1、x2、x3、x4、x5);特征向量y為故障類型,所考慮的故障類型如表1所示。
圖1 MCPO模型構(gòu)建流程
序號故障類型簡稱樣本數(shù)1熱故障t<300 ℃T1502熱故障300 ℃
MCPO模型的輸出為(pT1,pT2,pT3,pPD,pD1,pD2),pT1,pT2,pT3,pPD,pD1,pD2分別代表變壓器的狀態(tài)為T1,T2,T3,PD,D1,D2的概率。考慮到DGA數(shù)據(jù)中各氣體含量存在較大差異,將各種溶解氣體含量換算為[0,1]范圍內(nèi)的相對含量,按照式(20)對DGA數(shù)據(jù)進(jìn)行歸一化處理。
(20)
式中xiq為第i個樣本第q類故障氣體的含量。
所提出的MCPO模型,其參數(shù)(C,σ)的選擇對提高故障診斷的準(zhǔn)確率至關(guān)重要。因此,采用網(wǎng)格搜索的方法,對訓(xùn)練樣本集進(jìn)行交叉驗證,并選擇其中準(zhǔn)確率最高的一組(C,σ)作為模型的參數(shù)。同時,實現(xiàn)概率輸出還要形成Sigmoid函數(shù)的參數(shù)訓(xùn)練集,同樣利用交叉驗證的方法形成Sigmoid函數(shù)的參數(shù)訓(xùn)練集(gi,yi)。獲得最優(yōu)參數(shù)的流程如下:
(1)給定參數(shù)(C,σ);
(2)將樣本隨機(jī)分成k個互不相交的子集,每次選擇一個子集作為測試集,其他作為訓(xùn)練集;
(3)訓(xùn)練SVM,計算驗證集gi;
(4)k個子集交叉驗證形成Sigmoid函數(shù)的訓(xùn)練集(gi,yi),訓(xùn)練Sigmoid函數(shù)的參數(shù)a,b;
(5)計算全部swv,得到多分類概率估計pw,若完成對所有子集的計算,則計算交叉驗證的準(zhǔn)確率。否則,返回到第二步。
(1)數(shù)據(jù)處理,歸一化輸入特征向量,形成訓(xùn)練、測試集樣本;
(2)確定最優(yōu)參數(shù)(C,σ);
(3)利用最優(yōu)參數(shù)訓(xùn)練SVM及Sigmoid函數(shù)的參數(shù)a、b,進(jìn)而獲得診斷模型;
(4)應(yīng)用診斷模型對測試樣本進(jìn)行故障診斷。
選擇了270組已確定故障類型的DGA數(shù)據(jù)進(jìn)行研究,并將樣本數(shù)據(jù)按2∶1比例分為訓(xùn)練集和測試集。模型參數(shù)(C,σ)分別在取值范圍[2-15,2-14,…,214,215],[2-7,2-6,…,26,27]內(nèi)以指數(shù)增長方式獲取。將訓(xùn)練樣本分為5組進(jìn)行交叉驗證,得到的最優(yōu)參數(shù)為(2-1,23)。表2列舉了10組測試樣本的DGA數(shù)據(jù)。表3給出了MCPO模型的診斷結(jié)果。
表2 測試樣本DGA數(shù)據(jù)
由表2可知,MCPO模型的診斷結(jié)果是變壓器的狀態(tài)為每類故障的概率。如果將概率最大作為判斷故障類型的依據(jù),基于MCPO模型的故障診斷正確率為90%。考慮到上述方法在故障特征不明顯(樣本故障分類概率相差較小)的情況時存在一定的誤判,因此本文進(jìn)一步對診斷判據(jù)進(jìn)行研究。
利用MCPO模型的故障診斷數(shù)據(jù),提出基于最大概率Pm和標(biāo)準(zhǔn)差ε的兩種故障診斷判據(jù)。其中,Pm=max{p1、p2、p3、p4、p5、p6},ε為{p1、p2、p3、p4、p5、p6}的標(biāo)準(zhǔn)差。為了能夠方便的說明Pm和ε的意義,對測試樣本進(jìn)行分類。分類原則如下:如果MCPO模型的診斷結(jié)果中概率最大的故障為實際故障,則樣本標(biāo)記為Rh,若不是樣本標(biāo)記為Rl。
由表2、表3可知,依據(jù)上述分類原則樣本3屬于Rh,此時Pm=83.79%,ε=0.301。樣本4屬于Rl,此時Pm=43.17%,ε=0.15。結(jié)果表明,故障特征顯著的樣本,Pm和ε的取值較大;故障特征不顯著的樣本,Pm和ε的取值較小。
表4給出了基于上述分類原則,所有測試樣本的分類結(jié)果。
表3 模型診斷結(jié)果
表4 測試樣本分類結(jié)果
表4中,Pmax-z和εz為Pm和ε的平均值。由表4可知,樣本集Rh中Pmax-z和εz的值均大于樣本集Rl中的值。以上分析結(jié)果表明,故障特征明顯的樣本,樣本故障分類概率相差較大,Pm、ε取值較大;故障特征不明顯的樣本,樣本故障分類概率較為接近,Pm、ε取值較小。因此,可以利用Pm和ε表征樣本的故障特征是否顯著。計算了所有測試集的Pm和ε,計算結(jié)果見圖2。
圖2 Pm、ε計算結(jié)果
由圖2可知,對于故障特征不明確的樣本主要分布在Pm<0.6和ε<0.25的區(qū)域中。因此,本文給出判斷標(biāo)準(zhǔn)為Pm=0.6和ε=0.25,即認(rèn)為Pm<0.6且ε<0.25的樣本為故障特征不明確的樣本,對于這類樣本需要利用MCPO模型的診斷結(jié)果針對可能存在的故障做出相應(yīng)的校正措施。
表5列舉了采用SVM方法和MCPO方法對同樣的樣本進(jìn)行故障診斷得到的結(jié)果。
表5 不同診斷方法的比較
由表5可知,故障特征顯著的樣本利用SVM方法和MCPO方法都能有效的辨別故障類型;故障特征不顯著的樣本,利用SVM方法會導(dǎo)致誤診斷,而MCPO方法可利用基于最大概率Pm和標(biāo)準(zhǔn)差ε的兩種故障診斷判據(jù)有效的辨識故障特征不顯著的樣本,對于這類樣本,可參考概率較大的兩三個故障類型進(jìn)行相應(yīng)的校正措施,彌補(bǔ)了傳統(tǒng)SVM方法在辨別故障特征不明確的樣本時會導(dǎo)致誤診斷的問題。
提出的基于多分類概率輸出模型的變壓器故障診斷方法分類效果較好,并能夠提供概率信息。針對故障特征不明確的樣本,可參考概率較大的兩三個故障類型進(jìn)行相應(yīng)的校正措施,進(jìn)而降低了對變壓器故障的誤判。通過仿真分析驗證了基于最大概率Pm和標(biāo)準(zhǔn)差ε的兩種故障診斷判據(jù)的有效性,為進(jìn)一步開展合理的校正措施提供了一定的依據(jù)。