楊 梅
在冶金行業(yè)中,變壓器作為電氣設(shè)備的樞紐,其運行情況直接影響整個電力系統(tǒng)的安全。對變壓器進行故障檢測,對于提高電力系統(tǒng)的可靠性有著重要意義。對變壓器故障進行識別,及時發(fā)現(xiàn)變壓器內(nèi)部故障的性質(zhì)和未來發(fā)展趨勢,準(zhǔn)確掌握變壓器的運行狀況,也是制定變壓器維護措施和檢修計劃的重要依據(jù)。目前廣泛使用的氣體色譜分析法是檢測變壓器內(nèi)部故障性質(zhì)的重要方法[1]。
支持向量機是一種以小樣本統(tǒng)計學(xué)習(xí)理論為基礎(chǔ)發(fā)展起來的新型通用學(xué)習(xí)方法,有效地解決了小樣本、高維數(shù)、非線性等的學(xué)習(xí)問題,并克服了人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)難以確定合理結(jié)構(gòu)和存在局部最優(yōu)的缺點,大大地提高了學(xué)習(xí)方法的泛化能力。目前支持向量機已經(jīng)廣泛應(yīng)用于手寫字體識別[2]、人臉識別[3]、遙感圖像分類[4]等領(lǐng)域,并取得了良好的效果。本文將支持向量機引入變壓器故障診斷中,提出了基于多分類支持向量機的變壓器故障診斷方法,對變壓器故障進行分類,以達到設(shè)備狀態(tài)監(jiān)測的目的。
支持向量機方法在處理非線性問題時,將輸入空間通過特定的函數(shù)進行非線性映射,將原輸入空間變換到高維特征空間;然后,在高維空間中根據(jù)結(jié)構(gòu)風(fēng)險最小化原則尋找最大間隔最優(yōu)線性分類超平面。此超平面對應(yīng)著原輸入空間的非線性分類面,分類后將高維空間的最優(yōu)線性分類超平面做逆映射,從而得到原輸入空間的非線性分類面。支持向量分類器只涉及到向量間(原輸入空間或變換后的空間)的內(nèi)積運算,因此,可以很好地應(yīng)用核函數(shù)的方法來解決高維空間中的維數(shù)災(zāi)難問題,減少計算量。
最小二乘支持向量機(Least Squares Support Vector Machine,LS-SVM)則是在標(biāo)準(zhǔn)支持向量機的一種擴展。它采用最小二乘線性系統(tǒng)誤差平方和作為損失函數(shù)[5],將求解過程變成了解一組等式方程,提高了求解速度,減少了計算資源。在原始空間的最小二乘支持向量機分類問題描述為:
定義拉格朗日函數(shù):
其中,αi∈R,根據(jù)優(yōu)化條件
消除ω和ε后,得到矩陣方程:
定義 Ω=ZZT=[qij]l×l,根據(jù) Mercer[6]條件,該矩陣的元素可以表示為:
求解上述問題后可得到最優(yōu)分類函數(shù)如下:
假定高維特征空間的內(nèi)積函數(shù)為:
稱上式的內(nèi)積函數(shù)為核函數(shù)。只要一種核函數(shù)k(xi,xj)滿足Mercer條件它就對應(yīng)某一變換空間中的內(nèi)積。
本文選用高斯徑向基函數(shù),如式(8)所示:
其中,σ≠0為方差。由此可知,待優(yōu)化的變量包括核參數(shù)σ和正則化參數(shù)γ。
電力變壓器故障識別對象最常見的有4種狀態(tài):電力變壓器的高能放電、低能放電、過熱和正常狀態(tài)。基于多分類支持向量機的電力變壓器故障識別過程,包括變壓器故障狀態(tài)的特征提取、訓(xùn)練和測試。
變壓器故障診斷是個多分類問題,而支持向量機適用于二分類問題,因此,采用支持向量機解決變壓器故障診斷問題時,就需要將多分類問題轉(zhuǎn)化為二分類問題。
通常通過構(gòu)造多個二分類器,將一個多分類問題轉(zhuǎn)化為多個二分類問題。處理多分類問題時,最小輸出編碼相對于其他編碼方式所需計算時間最短[7]。因此,本文采用最小輸出編碼方式解決多分類問題。
已知多分類問題的樣本類別數(shù)為C。當(dāng)采用最小輸出編碼方式解決多分類問題時,對于C類問題需要的二分類器數(shù)為能表示C的最小二進制數(shù)的位數(shù)。在支持向量機的參數(shù)優(yōu)化問題中,為減少計算量,不需要對每個子二分類支持向量機的超參數(shù)都進行選擇,而是通過最小輸出編碼方法的編碼和解碼過程把個二分類機作為一個整體,形成一個多分類支持向量機。
由上可知,支持向量機需要選擇的超參數(shù)為σ和γ,根據(jù)仿真優(yōu)化問題模型,直接利用支持向量機分類后的結(jié)果,通過計算分類正確率來表示個體的適應(yīng)度,具體表示如下:
其中,m為遺傳算法中的種群規(guī)模,本文中3.2章節(jié)有詳細介紹。
通過獨立輸出編碼方法得到的多分類支持向量機模型的性能采用正確率(theAccuracyRate,AR)作為評價指標(biāo),記為:
其中,yi為實際值,為模型預(yù)測輸出,l為樣本數(shù)。表示分類結(jié)果,分類正確為1,反之為0。
遺傳算法[8](GeneticAlgorithms,GA)是基于生物界的自然選擇和自然遺傳機制的基本思想形成的一類優(yōu)化方法。由于它采用群體搜索和基于交叉算子、變異算子實現(xiàn)群體中個體之間的信息交換,使其具有隱含并行性,大大提高了搜索的效率,同時克服了傳統(tǒng)優(yōu)化方法對于目標(biāo)函數(shù)有連續(xù)、可微的要求。因此,遺傳算法在實際問題中得到了廣泛應(yīng)用。
遺傳算法中,描述和評價待優(yōu)化問題中的每個解,以及實現(xiàn)選擇、交叉、變異等進化操作是算法的核心問題。
遺傳算法中,搜索空間中的每個解都是通過以一定編碼方式表示的個體加以描述的。因此,合理的編碼方式是保證后續(xù)進化操作的基礎(chǔ)。目前,常用的編碼方式有二進制編碼、實數(shù)編碼等。本章中,支持向量分類模型中的超參數(shù)通常為實數(shù),因此,采用實數(shù)編碼方式描述待優(yōu)化參數(shù)σ和γ,記個體為 x=(γ,σ)。
選擇算子根據(jù)種群中個體的適應(yīng)度,按照一定的規(guī)則,從第t代種群中選擇出較優(yōu)勢個體遺傳到下一代種群。目前,常用的選擇算子有輪盤賭選擇、聯(lián)賽選擇、精英保留選擇等選擇方法。本章中,為保證每代的最優(yōu)個體進入下一代種群,采用隨機聯(lián)賽選擇和最優(yōu)個體保留方法相結(jié)合的方法選擇算子,具體操作如下。
第一步:從當(dāng)前種群中選出具有最高適應(yīng)度值的個體和具有最低適應(yīng)度值的個體。如果當(dāng)前種群中最優(yōu)個體適應(yīng)度大于保留集中的最優(yōu)個體適應(yīng)度,則將當(dāng)前種群中的最優(yōu)個體保存在保留集中,作為新的保留集最優(yōu)個體;同時,用保留集最優(yōu)個體替代當(dāng)前種群中的最差個體。
第二步:從種群中隨機選取N(N=2)個個體,比較其適應(yīng)度大?。徊⒕哂休^大適應(yīng)度的個體遺傳到下一代種群中。
第三步:將上述過程重復(fù)m次,得到下一代種群的m個個體。這里,m為種群規(guī)模。
交叉算子是將種群中隨機配對的個體,以某一概率對二者進行基因重組。針對不同編碼方式的個體,有多種不同的交叉算子。目前,常用的交叉算子包括實數(shù)編碼的算數(shù)交叉,二進制編碼的單點交叉、多點交叉等。本章中,鑒于個體采用實數(shù)編碼方式,所以采用算術(shù)交叉。
算術(shù)交叉就是將兩個個體通過線性組合,生成兩個新個體。針對個體xa(t)和xb(t),以交叉概率Pc運用算術(shù)交叉后產(chǎn)生的新個體是:
其中,g為[0,1]之間的常數(shù)。
變異操作就是對種群中的某些個體,以某一概率改變其某一個或某一些基因位上的取值。該操作對于提高算法的搜索能力具有重要作用。針對不同編碼方式的個體,有多種不同的變異算子。目前,常用的變異算子包括實數(shù)編碼的非均勻變異,二進制編碼的單點變異、多點變異等。本章中,考慮到個體采用實數(shù)編碼方式,所以采用非均勻變異算子。
非均勻變異算子就是以變異概率Pm隨機對個體中某一變量值進行非均勻變異。例如:假設(shè)變異前后的個體分別為。若發(fā)生變異的變量 γ 的取值范圍為[γmin,γmax],那么非均勻變異操作記為:
其中,△(t,e)(e 代表 γmax-γ 或 γ-γmin)表示[0,e]范圍內(nèi)符合非均勻分布的一個隨機數(shù)。
本文分析的基礎(chǔ)是利用色譜分析得到的各種特征氣體(包括 H2、CH4、C2H6、C2H4和 C2H2等)含量信息,它反映了電力變壓器的高能放電、低能放電、過熱和正常4種狀態(tài)的特征信息,這些數(shù)據(jù)都是絕對值數(shù)據(jù),每個測試數(shù)據(jù)都是由反映這些特征氣體含量的n+1個分量[9]組成(n由實際情況決定)。為方便進行訓(xùn)練和識別,需要對檢測出的特征氣體含量進行預(yù)處理,以得到變壓器故障識別需要的各種特征量,組成的訓(xùn)練樣本具體如下。
(1)n種特征氣體的相對含量:
其中,cn為第n種特征氣體的絕對含量。
(2)反映各組測試數(shù)據(jù)之間橫向比較信息的一個特征量,它通過下式得到:
這樣就得到了n+1個特征量,組成一個n+1維的特征向量 X=[x1x2x3…xnxn+1]T,該特征向量反映了識別高能放電、低能放電、過熱和正常4種變壓器狀態(tài)需要的各種特征信息。
將特征向量作為多分類支持向量機的輸入對模型進行訓(xùn)練,4類問題需要的二分類器數(shù)為2個。根據(jù)實際情況,將訓(xùn)練好的支持向量機用于測試。
本文將遺傳算法與支持向量機結(jié)合,提出了一種基于遺傳算法的支持向量分類超參數(shù)選擇方法。進一步將遺傳算法優(yōu)化得到的參數(shù)應(yīng)用到多分類支持向量機模型中,針對電力變壓器故障識別問題,利用氣體色譜分析法采集數(shù)據(jù),并對采集的數(shù)值進行預(yù)處理得到特征值,對多分類支持向量機進行訓(xùn)練和識別,判斷輸出變壓器所處的狀態(tài),預(yù)測設(shè)備的未來發(fā)展趨勢,降低故障發(fā)生率。
參考文獻:
[1]孫才新,郭俊峰,鄭海平等.基于行為的變壓器油色譜分析模糊診斷專家系統(tǒng)研究.電工技術(shù)學(xué)報,2001,16(3):49-53.
[2]張 凱,王建平.基于混合核函數(shù)的脫機手寫漢字識別.計算機與數(shù)字工程,2007(12):25-27.
[3].賈云得.機器視覺.科學(xué)出版社,2000.
[4]Yi-nan Guo, Mei Yang,Da-wei Xiao.The Selection Method for Hyper-parameters of Support Vector Classification by Chaotic Cultural Algorithm.International Journal of Intelligent Computing and Cybernetics,2010,3(3):449-462.
[5]鄧乃揚,田英杰.數(shù)據(jù)挖掘中的新方法:支持向量機.北京:科學(xué)出版社,2004.
[6]方瑞明.支持向量機理論及其應(yīng)用分析.北京:中國電力出版社,2007.
[7]陳小娟.支持向量機及其在多屬性決策中的應(yīng)用.西安電子科技大學(xué),2008.
[8]Yi-nan Guo,Da-wei Xiao,Mei Yang.Genetic Algorithm-Based Support Vector Classification Method for Multispectral Remote Sensing Image,Lecture Notes in Computer Science.2010.6328:213-221.
[9]呂干云,程浩忠,董立新,等.基于多級支持向量機分類器的電力變壓器故障識[J].電力系統(tǒng)及其自動化學(xué)報,2005,17(1):19-22.