雷昳,劉明真,田威
(國網(wǎng)湖北省電力公司檢修公司,湖北 宜昌 443001)
電力變壓器是電力系統(tǒng)中的核心設(shè)備,同時也是數(shù)量最多的設(shè)備,在電網(wǎng)中主要負責變換、分配和傳輸電能,是電力系統(tǒng)實現(xiàn)電力供應的重要支撐。變壓器故障一直是影響電力系統(tǒng)安全可靠運行的重要因素,一旦發(fā)生故障,會嚴重影響電力系統(tǒng)供電的可靠性、安全性、持續(xù)性。因此,及時準確地診斷出變壓器內(nèi)部潛伏性故障對電力系統(tǒng)的運行尤為重要。
變壓器運行過程中油中溶解氣體的含量容易監(jiān)測,能準確反映變壓器的運行狀態(tài),基于油中溶解氣體分析(DGA)技術(shù)可以不停電、實時在線進行診斷,已成為目前對油浸式變壓器進行故障診斷最方便有效的手段之一[1]。經(jīng)過學者們和相關(guān)部門的不斷研究,在油中溶解氣體分析(DGA)技術(shù)的基礎(chǔ)上已經(jīng)形成了特征氣體法、羅杰斯比值法和改良三比值法。其中改良三比值法由于原理簡單、容易實施,得到了廣泛的應用。但在實際應用中暴露出編碼不全、編碼過界和過于絕對等缺陷[2]。隨著計算機技術(shù)的發(fā)展,人工智能方法在工程應用中表現(xiàn)出了廣闊的前景。學者們紛紛研究了基于神經(jīng)網(wǎng)絡[3-5]、支持向量機[6-9]、貝葉斯網(wǎng)絡[10-11]、模糊理論[12-13]和云理論[14]等人工智能方法的變壓器故障診斷技術(shù),并取得了良好的效果。文獻[5]采用SOM神經(jīng)網(wǎng)絡進行故障診斷,通過SOM網(wǎng)絡對訓練樣本進行提取和優(yōu)化,顯著提高了BP神經(jīng)網(wǎng)絡的診斷精度。文獻[9]采用遺傳算法從變壓器典型故障數(shù)據(jù)庫中獲取最佳溶解氣體比作為樣本訓練SVM故障診斷模型,實例證明該方法在故障診斷中具有較好的魯棒性和泛化性。文獻[11]將選擇性貝葉斯分類器引入到變壓器的故障診斷中,該方法在解決信息不完備方面有一定的優(yōu)勢。文獻[14]結(jié)合云理論和Adaboos算法建立了變壓器集成診斷模型。
雙支持向量機(TSVM)[15]是Jayadeva在2007年提出的一種二分類算法。與傳統(tǒng)支持向量機不同的是,在解決二分類問題時,雙支持向量機求解兩個規(guī)模更小的二次規(guī)劃問題產(chǎn)生兩個非平行的超平面,每一個超平面在盡可能靠近一類樣本的同時遠離另一類樣本[16]。通過將傳統(tǒng)支持向量機中的較大規(guī)模的二次規(guī)劃問題轉(zhuǎn)化為兩個較小的二次規(guī)劃問題,雙支持向量機的訓練時間大大的縮短,約簡到傳統(tǒng)SVM的1/4[17]。作為雙向量機的延伸,最小二乘雙支持向量機(LSTSVM)用等式約束替代原二次規(guī)劃問題中的不等式約束,大大降低計算的復雜度。與傳統(tǒng)SVM相比,LSTSVM計算速度快,而且對不平衡數(shù)據(jù)分類有一定的適應能力。
文章基于油中溶解氣體分析(DGA)技術(shù),采用最小二乘雙支持向量機和決策樹對變壓器進行故障診斷。為了減少誤差積累、加快診斷速度、提高精度,在建立變壓器故障診斷模型時,結(jié)合最小二乘雙支持向量機和哈夫曼樹實現(xiàn)多類分類,并在訓練過程中采用蝙蝠算法優(yōu)化最小二乘雙支持向量機的參數(shù)。
雙支持向量機通過求解兩個小規(guī)模的二次規(guī)劃問題,使計算量大大的減小,但是仍需要求解一個比較復雜的凸二次規(guī)劃問題。為此,M.Arun kumar和M.Gopa[18]受雙支持向量機啟發(fā),在2009年提出最小二乘版本的雙支持向量機。最小二乘雙支持向量機將兩個二次規(guī)劃問題轉(zhuǎn)化為兩個線性方程,計算速度得到了明顯的提高。
對于一個二分類問題,給定包含(m1+m2)個n維樣本的樣本集X∈Rm×n,m1×n維的矩陣A表示正類樣本集,m2×n維的矩陣B表示負類樣本集,非線性最小二乘雙支持向量機可以通過求解如下優(yōu)化問題得到:
s.t.-(K(B,CT)v1+e2γ1)+ξ2=e2
(1)
s.t.-(K(A,CT)v2+e1γ2)+ξ1=e1
(2)
式中C=[ATBT]T;ξ1和ξ2為松弛變量;c1和c2是值大于0的懲罰參數(shù);e1和e2為全一向量;v1和γ1分別為所求得最優(yōu)超平面的法向量和偏移量。K表示核函數(shù),文中采用Gauss徑向基核函數(shù)。
對于式(1)和式(2),將等式約束代入目標函數(shù)中得到:
(3)
(4)
式(3)分別對v1和γ1求偏導,式(4)分別對v1和γ1求偏導,可以得到:
(5)
(6)
式中G=[K(A,CT),e1],H=[K(B,CT),e2]。εI是為了避免出現(xiàn)病態(tài)解而加入矩陣項,其中I是單位矩陣,ε是一個很小的正數(shù)。
根據(jù)求解的結(jié)果構(gòu)造兩個非平衡超平面:
K(xT,CT)v1+γ1=0
(7)
K(xT,CT)v2+γ2=0
(8)
最終可得最小二乘雙支持向量機的分類判決函數(shù)為:
(9)
哈夫曼樹[19]是一種加權(quán)路徑長度最小的二二叉樹[20],采用自下而上的構(gòu)造方式,每次都從所有的類中尋找最難分割的兩類作為二叉樹的下層節(jié)點,直至二叉樹建立完畢。在哈夫曼樹的構(gòu)造過程中,兩類之間分類的難易程度采用類間相異度來衡量。相異度的定義如下:
對于一個包含K類樣本的樣本集,X={X1,X2,...XK},將每一類樣本集投影到特征空間,并在特征空間里構(gòu)造K個超球體,每個超球體包含其中一類樣本。則i類樣本與j類樣本之間的相異度Dij的計算公式如下:
(10)
式中dij表示i類中所有樣本到j類樣本的超球體中心的平均歐氏距離;Nij(dij)表示i類樣本到j類樣本所對應的超球體中心歐氏距離大于dij所有樣本的數(shù)量;d(i,j)為兩超球體球心的歐氏距離;ni和nj為i類樣本和j類樣本的樣本數(shù)量。
對于基于決策樹的多分類模型,層次結(jié)構(gòu)的合理性直接決定了其分類準確率和分類決策速度。哈夫曼樹作為最優(yōu)二叉樹,將其與LSTSVM相結(jié)合自下而上構(gòu)造一種多分類LSTSVM模型,不僅可以降低誤差積累,提高分類精度,還能有效縮短訓練和分類時間。
基于哈夫曼樹的多分類LSTSVM模型的建立過程如下:
(1)兩兩計算訓練樣本集中各個類之間的相異度,構(gòu)造相異度矩陣D;
(2)將所有類中相異度最小的兩類Xi和Xj合并為一個類簇,將合并后的樣本集作為兩類LSTSVM的訓練樣本集進行訓練,得到的兩類LSTSVM分類器構(gòu)成哈夫曼樹的一個非葉子結(jié)點;
(3)對于類Xi和Xj合并之后的K-1個類簇,計算這K-1個類簇兩兩間的相異度;
(4)按照(2)中訓練一個兩類LSTSVM分類器,構(gòu)成一個新的非葉子節(jié)點;
(5)重復上述過程,建立完整的哈夫曼樹。
蝙蝠(BA)算法是由劍橋大學學者Yang[21]受自然界微型蝙蝠尋找食物和躲避障礙物的過程而提出的一種新型隨機搜索優(yōu)化算法。微型蝙蝠是一種具有較強的回聲定位能力的生物,其通過發(fā)出聲波和探測回聲來建立周圍空間的聲音-圖像,協(xié)助其準確地抓捕獵物。在其飛行過程中,蝙蝠向周圍空間中發(fā)出較高頻率和較寬頻帶的聲波,并根據(jù)周圍獵物的距離自動調(diào)節(jié)聲波脈沖的響度和頻率,在搜索獵物時,脈沖響度可以高達110 dB,當靠近獵物時,脈沖響度降為0。
蝙蝠(BA)算法正是基于模擬蝙蝠的覓食行為對優(yōu)化問題可行解空間的最優(yōu)解進行搜索,達到尋優(yōu)的目的。在其尋優(yōu)過程中,通過模擬蝙蝠覓食行為中聲波脈沖的響度、頻率的自適應調(diào)節(jié)過程,實現(xiàn)全局尋優(yōu)和局部尋優(yōu)的自由切換,從而使算法的全局搜索能力和局部搜索能力得到平衡。
fi=fmin+(fmax-fmin)β
(11)
(12)
(13)
式中fi表示蝙蝠i發(fā)出聲波的頻率,fi∈[fmin,fmax],在初始化是在其取值范圍內(nèi)隨機給定;β是一個隨機數(shù),β∈[0,1]。X*表示t時刻全局搜索過程中最優(yōu)的蝙蝠位置。
在局部搜索過程中,從當前的最優(yōu)解集中隨機選取一個解并給其一個隨機擾動,在該最優(yōu)解的鄰域內(nèi)進行局部搜索。局部搜索時,該蝙蝠的位置更新公式如下:
xnew=xold+εAt
(14)
式中xold表示所選取的一個最優(yōu)解;ε是一個隨機數(shù),ε∈[-1,1];xnew表示對選取的最優(yōu)解進行一個隨機擾動之后得到的新解。
為了平衡全局搜索和局部搜索,在蝙蝠覓食過程中,其發(fā)射聲波響度和頻率需要跟隨搜索獵物的進程自動調(diào)節(jié),未發(fā)現(xiàn)獵物時,蝙蝠需要盡可能增大聲波響度,增加搜索獵物的機會,當發(fā)現(xiàn)獵物時,蝙蝠則降低其發(fā)出聲波的響度、提高頻率。蝙蝠i發(fā)出聲波響度Ai和頻率ri的調(diào)節(jié)公式如下:
(15)
(16)
多分類哈夫曼樹中的每一個非葉子節(jié)點的兩類LSTSVM分類器的分類性能直接影響著整體的分類精度,而每一個LSTSVM分類器的分類性能與懲罰參數(shù)c1、c2和高斯核參數(shù)σ的選取有很大的關(guān)系。因此,采用蝙蝠算法對每一個LSTSVM分類器的懲罰參數(shù)c1、c2和核參數(shù)σ進行尋優(yōu),以期獲得最佳的分類效果?;隍鹚惴▋?yōu)化LSTSVM參數(shù)的具體步驟如下:
(1)收集樣本,并將其分為訓練樣本和測試樣本;
(2)設(shè)置相關(guān)參數(shù),包括蝙蝠種群數(shù)Xsize、最大迭代次數(shù)Maxgen,覓食空間維數(shù)d,聲波頻率最大值fmax和最小值fmin、最大聲波響度A0,初始頻率r0,聲波響度增加系數(shù)α以及常量γ;
(3)初始化,隨機產(chǎn)生蝙蝠i的位置Xi和速度Vi,蝙蝠i的初始位置Xi包括三種屬性:c1、c2和σ;
(4)評估蝙蝠個體適應度,并找出當前時刻最優(yōu)解X*。將蝙蝠的位置所對應的三種屬性值作為LSTSVM的參數(shù),利用訓練樣本集進行訓練得到分類器,利用校驗樣本集進行測試,將測試準確率作為適應度函數(shù),適應度最好的蝙蝠個體所對應的位置即為當前最優(yōu)解X*。
適應度函數(shù)為:
(17)
式中l(wèi)t為正確分類的樣本數(shù);l為校驗樣本總數(shù)。
(5)按照式(12)和式(13)更新蝙蝠個體的位置和速度;
(6)在[0,1]范圍內(nèi)產(chǎn)生一個隨機數(shù)rand,與ri比較,若rand>ri,則根據(jù)式(14)給當前最優(yōu)解一個隨機擾動,產(chǎn)生一個新解,并作越界處理;
(7)生成隨機數(shù)rand,若rand (8)計算各個蝙蝠個體的適應度,更新當前時刻最優(yōu)解X*; (9)判斷迭代終止條件是否滿足,若不滿足,則轉(zhuǎn)到步驟(4); (10)輸出最優(yōu)解所對應的c1、c2和σ的值,將其作為LSTSVM的參數(shù)。 電力變壓器在運行過程中,內(nèi)部發(fā)熱或放電故障引起變壓器油發(fā)生分解產(chǎn)生一些特征氣體,主要包括H2, C2H4, C2H6, C2H4, C2H2五種,發(fā)生不同性質(zhì)和不同程度的故障時,這些特征氣體的含量會有明顯的差異。因此,選取油中溶解H2, C2H4, C2H6, C2H4, C2H2五種氣體的含量作為特征量。所以故障診斷模型的輸入特征向量記為x=(x1,x2,x3,x4,x5),其中x1,x2,x3,x4,x5分別代表油中H2, C2H4, C2H6, C2H4, C2H2五種氣體的含量??紤]到五種氣體氣體含量較大的差異可能會引起計算誤差,所以將五種氣體的含量按下式進行歸一化: (18) x′={x1/c1,x2/c2,x3/c2,x4/c2,x5/c2} (19) 歸一化之后,原始輸入特征向量的各維屬性值均映射到[0,1]區(qū)間。 在變壓器實際運行過程中,內(nèi)部故障主要包括兩大類:放電性和過熱性,有時這兩種故障還會同時存在。參考相關(guān)規(guī)定以及一些變壓器實際運行資料數(shù)據(jù),將變壓器的故障模式細分為6種,包括中低溫過熱T1(低于700 ℃)、高溫過熱T2(高于700 ℃)、低能放電D1、高能放電D2、局部放電PD以及放電兼過熱DT。 變壓器的故障模式有6種,其故障診斷過程實質(zhì)是一個多類分類問題。LSTSVM作為一個二分類器,不能直接用于多類分類,所以本文結(jié)合哈夫曼樹和二分類LSTSVM構(gòu)造多類分類器,并應用于變壓器的故障診斷中。具體故障診斷實現(xiàn)過程圖1所示。 圖1 基于多分類器的變壓器故障診斷實現(xiàn)過程 (1)數(shù)據(jù)預處理:采集變壓器運行過程中各種故障模式的DGA數(shù)據(jù)構(gòu)成故障診斷樣本集,歸一化后,將各類故障樣本按比例分類訓練樣本集和測試樣本集; (2)建立故障診斷模型:計算相異度矩陣,并依據(jù)各種故障模式之間分類的難易程度自下而上建立故障診斷哈夫曼樹,采用蝙蝠算法對每一個非葉子結(jié)點的LSTSVM的參數(shù)進行尋優(yōu),以最優(yōu)參數(shù)構(gòu)造LSTSVM分類器; (3)測試:針對待測樣本,沿哈夫曼樹自上而下進行判斷,直至葉子結(jié)點,得到待測樣本的故障類型。 從某地區(qū)供電局的生產(chǎn)資料中獲取到178 組變壓器DGA數(shù)據(jù),從其中選取99組樣本作為訓練樣本集,其余的樣本均作為測試樣本,各種故障類型的樣本分布如表1所示,采用文中的模型進行故障診斷。 表1 各種故障類型樣本分布 根據(jù)各類訓練樣本數(shù)據(jù)構(gòu)建的多分類哈夫曼樹如圖2所示。 圖2 多分類哈夫曼樹 根據(jù)建立的哈夫曼樹,針對6種故障類型,需要訓練5個二分類LSTSVM分類器。在訓練各個LSTSVM分類器,采用蝙蝠算法對其參數(shù)進行尋優(yōu)。蝙蝠算法的相關(guān)參數(shù)設(shè)置為:種群規(guī)模xsize=30,最大迭代此時Maxgen=200,覓食空間維數(shù)d=3,fmax=2,fmin=0,A0=1.6,r0=0.000 1,α=0.9,γ=0.99。優(yōu)化后,各個LSTSVM分類器的參數(shù)選取如表2所示。 表2 LSTSVM參數(shù)優(yōu)化結(jié)果 基于最優(yōu)參數(shù)建立的故障診斷模型對測試集中各種故障類型的診斷準確率如表3所示。 表3 測試集診斷結(jié)果 從表3中診斷結(jié)果可以看出,文中故障診斷方法在中低溫過熱、高溫過熱、低能放電、高能放電四種故障類型的診斷過程中均取得了較高的準確率,而對于局部放電和放電兼過熱故障,由于樣本太少,導致診斷準確率偏低。 為了驗證該方法的優(yōu)越性,采用支持向量機對原樣本集進行故障診斷,并與文中方法進行比較。采用支持向量機方法進行故障診斷時,參考文獻[22]中的二叉樹模型建立基于支持向量機的多類分類模型,每一個二分類支持向量機的參數(shù)采用粒子群算法進行優(yōu)化。兩種方法的故障診斷效果對比如表4和表5所示。 表4 PSO-SVM方法與本文方法訓練時間對比 對比表4中兩種方法各個子分類器的時間可以看出,文中方法的訓練時間遠遠小于PSO-SVM方法,說明采用文中算法對變壓器進行故障診斷時計算復雜度得到了顯著的減小。 對表5中兩種方法的故障診斷結(jié)果分析可知,對于放電兼過熱故障,文中方法的診斷準確率略低于PSO-SVM方法;對于低溫過熱、高能放電、局部放電三種故障類型,文中方法的診斷準確率與PSO-SVM方法相等;而對于高溫過熱、低能放電故障,與PSO-SVM方法相比,該方法的診斷準確率得到了很大的提升。同時,該方法整體的故障診斷精度要顯著優(yōu)于PSO-SVM方法。 表5 PSO-SVM方法與本文方法診斷結(jié)果對比 作為支持向量機的改進算法,LSTSVM具有更優(yōu)的分類性能。文章使用LSTSVM對變壓器進行故障診斷,并結(jié)合兩分類LSTSVM和哈夫曼樹建立多分類故障診斷模型,對于多分類哈夫曼樹中每一個子分類器,采用蝙蝠(BA)算法對其參數(shù)進行優(yōu)化,使其分類性能達到最佳。實際案例表明,采用該方法對變壓器進行故障診斷,不僅可以大大地縮短訓練時間,而且能獲得更優(yōu)的診斷精度,在故障診斷中能取得更好的效果。3 基于BA-LSTSVM的變壓器故障診斷
3.1 特征量選取與數(shù)據(jù)預處理
3.2 故障類型劃分
3.3 變壓器故障診斷的具體實現(xiàn)過程
4 實際案例
5 結(jié)束語