湯三 武紅玉
【摘 ?要】油中溶解氣體分析是電力變壓器故障診斷中常用的方法,論文提出了一種基于K均值聚類和混合核函數(shù)相關向量機的變壓器故障診斷方法。論文首先對樣本進行K均值聚類,然后再利用相關向量機的二叉樹結構進行分類劃分,相關向量機的核函數(shù)采用高斯核函數(shù)和二項式核函數(shù)混合組合的方法。實驗結果表明,相比于三比值法、BP神經(jīng)網(wǎng)絡算法,論文所提方法具有較高的變壓器故障診斷正確率。
【Abstract】Dissolved gas analysis in oil is a common method in power transformer fault diagnosis. This paper proposes a power transformer fault diagnosis method based on K-means clustering and relevance vector machine with the optimized combined kernel function. Firstly, the paper clusters the samples with K-means, and then uses the binary tree architecture of the relevance vector machine to classify and divide. The kernel function of the relevance vector machine adopts the method of combining Gaussian kernel function and polynomial kernel function. The experimental results show that, compared with the three-ratio method and BP neural network algorithm, the method proposed in the paper has a high accuracy rate of power transformer fault diagnosis.
【關鍵詞】故障診斷;相關向量機;電力變壓器;K均值聚類
【Keywords】fault diagnosis; relevance vector machine; power transformer; K-means clustering
【中圖分類號】TM407 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻標志碼】A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號】1673-1069(2020)07-0165-03
1 引言
電力變壓器是電力系統(tǒng)中不可缺少的重要設備,在電力系統(tǒng)安全運行中具有非常重要的作用。變壓器在設計上雖然具有良好的機械性能和足夠的電氣強度,但其自身結構比較復雜,所處工作環(huán)境較為復雜、惡劣,在長期運行過程中可能出現(xiàn)過熱、過流等非正常狀態(tài),造成絕緣老化、材料劣化,進而引發(fā)故障和事故。因此,對變壓器進行故障診斷研究,及時發(fā)現(xiàn)變壓器潛伏性故障,對電力系統(tǒng)運行的穩(wěn)定性和可靠性具有非常重要的意義。
變壓器油中溶解氣體的含量和氣體含量的比值可在不同的方面反映變壓器的運行狀態(tài)[1],油中溶解氣體分析DGA(Dissolved Gas Analysis)方法成為油浸式變壓器故障診斷的一種有效方法,傳統(tǒng)的IEC三比值法、Rogers法[2]等正是在此基礎上形成的。隨著計算機技術和人工智能的快速發(fā)展,人工神經(jīng)網(wǎng)絡、支持向量機等人工智能方法在變壓器故障診斷中得到不斷應用。
相關向量機(relevance vector machine,RVM)是基于稀疏貝葉斯理論的一種新型機器學習算法,具有需要訓練樣本少、泛化能力強等優(yōu)點。朱永利等[3]第一次將相關向量機應用于變壓器故障診斷,隨后基于各種改進的相關向量機的診斷變壓器故障方法不斷出現(xiàn)。尹金良等[4]將代價敏感機制引入多分類相關向量機應用于變壓器故障診斷,克服其診斷方法未考慮誤診代價差異性的問題。陳嘉霖等[5]提出了將鄰域粗糙集與相關向量機相結合的變壓器故障綜合診斷模型,以提升相關向量機的實用性和準確性。袁海滿等[6]利用粒子群優(yōu)化算法對相關向量機的核函數(shù)參數(shù)進行優(yōu)化,以提高變壓器的故障診斷精度。各種算法和相關向量機的結合,可以有效提高變壓器故障診斷正確率和診斷精度。
本文將K均值聚類和相關向量機結合的方法構造變壓器故障診斷模型。首先通過K均值聚類方法得到各個類的聚類中心,然后根據(jù)層次劃分,利用各個聚類中心構造一棵二叉樹,利用聚類中心重新形成訓練樣本集,進而訓練二叉樹各個節(jié)點處的相關向量機分類器,采用混合核函數(shù)對測試樣本進行測試,最后得到變壓器故障診斷模型。
2 方法理論概述
2.1 K均值聚類算法
K均值聚類算法是基于距離的硬聚類算法。對于給定數(shù)據(jù)集:
X={xi│xi ∈Rm, i=1,2,…,n} ? ? ? (1)
其中,n為樣本個數(shù),m為樣本維數(shù),樣本集的類別空間:
μ={μj│μj ∈Rm, j=1,2,…,c} ? ? ? ? ? (2)
c為類別數(shù)。兩個樣本點的距離采用歐式距離進行度量,即:
D(xi,xj)=? ? ? ? ? ? ?(3)
聚類中心為μk=
式中,n表示屬于第k類的樣本個數(shù)。
K均值算法的目標是達到簇內(nèi)樣本距離最小化,簇間樣本距離最大化,因此,其目標函數(shù)為:
min= D(xi,μj) ? ? ? ? ? ? ? ? ? ? ?(4)
K均值算法的流程如圖1所示。
2.2 相關向量機算法
2.2.1 相關向量機算法
相關向量機是一種用于回歸和分類的貝葉斯稀疏算法,對于二分類問題,給定訓練樣本集{X,T},其中X=(xi)為輸入量,T=(ti)為目標向量,T∈(0,1)且。輸入樣本X和目標值t直接的關系表示為:p(ti),其中,噪聲εi服從高斯分布:εi~N(0,?滓2),其均值為0,方差為?滓2[7]。
相關向量機的分類模型如下:
y(x,ω)=?ωiK(x,xi)+ω0 ? ?(5)
式中,分類模型權值ω=[ω1,ω2,…,ωn],K(x,xi)為相關向量機的核函數(shù)。由于假設目標值ti獨立,因此,整個數(shù)據(jù)集的似然函數(shù)為:
p(ti│ω,σ2)=N( Φω,σ2) ? ? ?(6)
其中,φ是由核函數(shù)組成的結構矩陣:
Φ=[φ(x1),φ(x2),…,φ(xn)]T
Φ的每行表達式為φ(xn)=[1,K(xi,x1),…,K(xn,xN)]T。若直接用最大似然法求解ω和σ2,通常會導致ω中的大部分元素不為0,導致過學習。為避免過學習的出現(xiàn),定義權重的ARD先驗概率分布:
其中,a=(a0,a1,…,aN)是由超參數(shù)組成的向量,假定超參數(shù)a與噪聲參數(shù)σ2均服從Gamma先驗概率分布,則求解權重ω的問題轉化為求解超參數(shù)a,當a趨于無窮大時,ω趨向0。
2.2.2 相關向量機分類器核函數(shù)選取
在相關向量機算法中,核函數(shù)的選取和核參數(shù)的設置對分類性能帶來特別重要的影響。變壓器的故障樣本數(shù)據(jù)包含多種不同的特征信息,在分類的過程中若RVM采用單一的核函數(shù)會降低分類的精度和準確度。本文采用付華等[8]提出的核函數(shù)選取方法,將高斯核函數(shù)和二項式核函數(shù)按權系數(shù)p結合,該方法可以融合多種特征信息,克服了單一核函數(shù)預測精度低的缺點。核函數(shù)公式如式(8)所示。
Kpoly=[(xiyj)+1]2KRBF=exp(-‖xi-yj‖2/2K=pKpoly+(1-p)KRBFσ2 ? ? ?(8)
式中,p為核函數(shù)權系數(shù),0≤p≤1,p=0或者p=1時分別為單一核函數(shù);Kpoly為二項式核函數(shù);KRBF為高斯核函數(shù);σ為核函數(shù)的寬度。
3 多分類相關向量機模型
變壓器故障診斷是一個多分類的問題,而RVM本質上是二分類算法,因此,文中建立多分類模型,采用多個RVM分類器實現(xiàn)變壓器的故障診斷。本文采用二叉樹分類思想[9],把變壓器故障的多分類模型不斷分解成一系列的兩分類組合問題,最后使所有的分類都細化劃分到只有一個類別,其中任意兩個子類的劃分采用RVM分類器。
文中通過K均值聚類算法得到各個類的聚類中心,進而根據(jù)變壓器故障類別進行層次劃分,利用各個聚類中心構造一棵二叉樹。在二叉樹的每個節(jié)點處,相當于有一個RVM分類器。根據(jù)所得的聚類中心重新形成訓練樣本集。最后利用新的樣本集訓練二叉樹各個節(jié)點處的RVM分類器,采用上節(jié)所述的混合核函數(shù)相關向量機,最終得到基于二叉樹的混合核函數(shù)相關向量機分類器模型。
4 變壓器故障診斷方法
變壓器處于不正常狀態(tài)工作時,變壓器油的氣體含量會大幅增加,通常選取油中產(chǎn)生的H2、CH4、C2H2、C2H4、C2H6這五種特征氣體作為參考變量。依據(jù)收集的實際故障樣本,在對變壓器故障類型特點分析的基礎上,將變壓器的運行狀態(tài)分為正常狀態(tài)(N)和低能放電(D1)、高能放電(D2)、中低溫過熱(T12)、高溫過熱(T3)四種故障狀態(tài)。
基于二叉樹的混合核函數(shù)相關向量機的變壓器故障診斷流程圖如圖2所示。
5 實驗結果及分析
本文從相關文獻中選用已確定實際故障的355組DGA數(shù)據(jù)進行驗證,根據(jù)數(shù)據(jù)實際情況分為正常狀態(tài)(N)、低能放電(D1)、高能放電(D2)、中低溫過熱(T12)、高溫過熱(T3)五種狀態(tài)。將樣本數(shù)據(jù)大約按1:1分組,如表1所示。
表1 ?訓練及測試樣本數(shù)據(jù)
①利用K均值聚類算法,分別對訓練樣本五種狀態(tài)進行聚類,得到各自的聚類中心,Y={y1,y2,y3,y4,y5},分別和N、D1、D2、T12、T3對應,如表2所示。
表2 ?五種狀態(tài)訓練樣本各自所對應的聚類中心
②利用K均值聚類將Y={y1,y2,y3,y4,y5}聚類為兩類,Yn={y1}和Yf={y2,y3,y4,y5},同理,將Yf聚類為兩類,Yd={y2,y3}和Yt={y4,y5},以此類推,分別對Yd和Yt進行聚類,最終形成二叉樹,如圖3所示。
③根據(jù)建立的二叉樹模型,將訓練樣本逐層分解,在樹的各個節(jié)點處,重新組織分解到的相應訓練樣本,訓練對應的相關向量機分類器,保存訓練優(yōu)化得到的各個相關向量機參數(shù),進而建立基于二叉樹的混合核函數(shù)相關向量機的變壓器故障診斷模型。
為了驗證本文方法的有效性,將本文算法與三比值法、BP神經(jīng)網(wǎng)絡方法的變壓器故障診斷進行對比分析。BP神經(jīng)網(wǎng)絡算法輸入層神經(jīng)元為5,隱層神經(jīng)元數(shù)為15,輸出層神經(jīng)元為5。表3給出了三比值法、BP神經(jīng)網(wǎng)絡算法和本文算法的變壓器故障診斷正判率及對比情況。
表3 ?故障診斷結果對比
對表3分析可知,與三比值法、基于BP神經(jīng)網(wǎng)絡算法的變壓器故障診斷方法相比,本文所提方法具有較高的故障診斷正確率。
6 結論
本文提出了一種基于K均值聚類和混合核函數(shù)相關向量機的變壓器故障診斷方法,該模型采用二叉樹方式建立RVM的二分類方法。通過對測試樣本集的實驗對比,驗證了本文算法的有效性,與三比值法及基于BP神經(jīng)網(wǎng)絡算法對比,本文算法明顯提高了變壓器故障診斷的正確率。
【參考文獻】
【1】操敦奎.變壓器油色譜分析與故障診斷[M].北京:中國電力出版社,2010.
【2】張德明.變壓器分接開關狀態(tài)監(jiān)測與故障診斷[M].北京:中國電力出版社,2008.
【3】朱永利,尹金良.組合核相關向量機在電力變壓器故障診斷中的應用研究[J].中國電機工程學報,2013,33(20):68-74.
【4】尹金良,劉玲玲.代價敏感相關向量機的研究及其在變壓器故障診斷中的應用[J].電力自動化設備,2014,34(5):111-115.
【5】陳嘉霖,段家華,張明宇.鄰域粗糙集與相關向量機相結合的變壓器故障綜合診斷模型[J].電力系統(tǒng)及其自動化學報,2016,28(011):117-122.
【6】袁海滿,雷帆,陳宇,等.基于DGA的粒子群相關向量機變壓器故障診斷[J].高壓電器,2017,53(2):108-112.
【7】李強,皮智謀.基于獨立分量分析和相關向量機的軸承故障診斷研究[J].制造業(yè)自動化,2014,36(8):6-9.
【8】付華,任仁.基于組合核相關向量機和量子粒子群優(yōu)化算法的變壓器故障診斷方法[J].2017,53(10):131-135.
【9】吳恩英,呂佳.基于二叉樹支持向量機多類分類算法的研究[J].重慶師范大學學報(自然科學版),2016,33(3):102-105.