摘"要:變壓器狀態(tài)對于智能配電房的安全穩(wěn)定運行具有重要意義。為實現(xiàn)對變壓器故障的準(zhǔn)確診斷,在變壓器油中溶解氣體分析(DGA)的基礎(chǔ)上,提出了一種聯(lián)合使用支持向量數(shù)據(jù)描述(SVDD)和改進(jìn)KMeans聚類的變壓器故障診斷方法。首先利用SVDD構(gòu)造閉合分類曲面實現(xiàn)“正?!焙汀肮收稀眱深惻袛?,然后對“故障”類樣本進(jìn)行K-Means聚類分析,自動將其劃分為低能放電、中低溫過熱、高能放電、高溫過熱和局部放電5種故障類型,同時針對KMeans初始聚類中心選取難題,提出局部密度概念自動確定KMeans初始聚類中心,提升聚類性能。最后利用變壓器故障真實數(shù)據(jù)開展實驗,結(jié)果表明,相較于支持向量機(SVM)和BP神經(jīng)網(wǎng)絡(luò)模型,所提方法的故障診斷準(zhǔn)確率分別提升9.8%和8%。
關(guān)鍵詞:智能配電房;變壓器故障診斷;油中溶解氣體分析;支持向量數(shù)據(jù)描述;多分類器聯(lián)合
中圖分類號:TM41""""""文獻(xiàn)標(biāo)識碼:A
Transformer"Fault"Diagnosis"Model"Based"
on"SVDD"and"Improved"KMeans
XIE"Xuqin,"LIU"Quanhui,"ZHAO"Xiangwen,"ZHANG"Qingsong,"LIN"Jianxiong,"ZHANG"Fan"
(Guangzhou"Zengcheng"Power"Supply"Burea,China"Southern"Power"Grid"Co.,"Ltd.,Guangzhou,"Guangdong"510000,"China)
Abstract:The"operation"status"of"transformer"is"of"great"significance"to"the"stability"and"reliability"of"intelligent"distribution"room."In"order"to"realize"the"accurate"diagnosis"of"transformer"faults,"based"on"the"analysis"of"dissolved"gases"in"transformer"oil,"a"multiclassifier"joint"fault"diagnosis"method"based"on"the"combined"use"of"support"vector"data"description"(SVDD)"and"improved"KMeans"clustering"is"proposed."First,"SVDD"is"used"to"construct"a"closed"classification"surface"to"realize"“normal”"and"“fault”"judgments."Then"KMeans"clustering"analysis"is"carried"out"on"the"“fault”"samples,"which"are"automatically"divided"into"five"types:"low"energy"discharge,"medium"and"low"temperature"overheat,"high"energy"discharge,"high"temperature"overheat"and"partial"discharge."At"the"same"time,"the"concept"of"local"density"is"proposed"to"automatically"determine"the"initial"clustering"center"of"KMeans"to"improve"the"clustering"performance."Finally,"the"transformer"fault"data"of"the"intelligent"distribution"room"is"used"to"carry"out"the"verification"experiment."The"results"show"that"compared"with"the"traditional"support"vector"machine"(SVM)"and"BP"neural"network"model,"the"fault"diagnosis"accuracy"of"the"proposed"method"is"improved"by"9.8%"and"8%,respectively.
Key"words:"intelligent"distribution"room;"transformer"fault"diagnosis;"analysis"of"dissolved"gas"in"oil;"support"vector"data"description;"multiclassifier"association
電力變壓器是智能配電房進(jìn)行能量轉(zhuǎn)換和傳輸?shù)暮诵脑O(shè)備,其運行狀態(tài)對于智能配電房至關(guān)重要,是決定智能配電房安全、可靠和穩(wěn)定運行的關(guān)鍵[1]。然而變壓器運行工況和運行環(huán)境較為復(fù)雜,長時間運行導(dǎo)致的繞組變形和絕緣老化等原因都可能會引發(fā)變壓器故障,給人民群眾的生命財產(chǎn)安全帶來隱患。因此,建立變壓器故障診斷模型,從而實現(xiàn)對變壓器運行狀態(tài)的實時準(zhǔn)確監(jiān)控對于智能配電房具有重要意義[2]。
目前絕大多數(shù)變壓器都采用油紙組成的絕緣結(jié)構(gòu),當(dāng)變壓器發(fā)生故障時,絕緣材料會產(chǎn)生各種氣體,且不同故障產(chǎn)生的氣體成分和濃度不同,因此通過油中溶解氣體分析(dissolved"gas"analysis,"DGA)可以實現(xiàn)對變壓器不同故障類型的診斷[3]。傳統(tǒng)基于DGA的變壓器故障診斷方法包括IEC三比值法、無編碼比值法、羅杰斯比值法等[4,5],該類方法都是通過C2H2、C2H4、CH4、H2、C2H6五種氣體之間的比值大小進(jìn)行變壓器故障判斷,具有原理簡單、容易實現(xiàn)等優(yōu)點,但存在信息提取維度單一、需要先驗知識等問題,導(dǎo)致該類方法的故障診斷精度較低[6]。近年來,隨著我國智能配電房建設(shè)的推進(jìn)以及人工智能技術(shù)的發(fā)展,利用人工智能算法對變壓器進(jìn)行故障診斷得到了眾多學(xué)者的關(guān)注[7,8]。文獻(xiàn)[9]建立了小波變換聯(lián)合反向傳播(back"propagation,"BP)神經(jīng)網(wǎng)絡(luò)的變壓器故障診斷模型,利用小波變換進(jìn)行時頻變換和故障特征提取,利用BP神經(jīng)網(wǎng)絡(luò)實現(xiàn)信息融合和故障診斷分類;文獻(xiàn)[10]在DGA數(shù)據(jù)的基礎(chǔ)上,將XGBoot模型引入變壓器故障診斷領(lǐng)域,同時利用遺傳算法對XGBoot模型參數(shù)進(jìn)行尋優(yōu);文獻(xiàn)[11]提出一種灰狼算法優(yōu)化的支持向量機(support"vector"machine,"SVM)模型,并對提出的5種DGA特征進(jìn)行分類判決,最終實現(xiàn)故障診斷;文獻(xiàn)[12]提出一種多源信息融合的特征提取方法,并利用卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)變壓器不同故障的分類診斷。
上述已有研究都是采用單一分類器模型進(jìn)行故障診斷,而DGA數(shù)據(jù)又表現(xiàn)出明顯的波動性和非平穩(wěn)特征,單一分類器模型由于無法全面描述不同故障類型之間的差異性,同時實際中“故障”類樣本較難獲取,導(dǎo)致變壓器故障診斷往往面對不平衡樣本集難題,上述有監(jiān)督故障分類診斷方法的性能難以滿足實際應(yīng)用需求。針對該問題,提出一種聯(lián)合使用支持向量數(shù)據(jù)描述(support"vector"data"description,"SVDD)和KMeans聚類的多分類器聯(lián)合故障分類診斷方法,并利用實際變壓器故障數(shù)據(jù)對其性能進(jìn)行驗證評估。
1"算法概述
圖1給出了所提方法的流程圖。在模型訓(xùn)練階段,輸入“正?!鳖悩颖?,首先對其進(jìn)行DGA分析并提取特征構(gòu)成特征向量,然后利用特征向量對SVDD進(jìn)行模型訓(xùn)練,得到最優(yōu)閉合分類面。SVDD作為一種一類分類器,只需要“正?!鳖悩颖炯纯蓸?gòu)造分類面,從而大大降低訓(xùn)練階段“故障”類樣本的獲取難度。
在測試階段,輸入“正?!被颉肮收稀鳖悩颖?,同樣對其進(jìn)行DGA分析并提取特征構(gòu)成特征向量,然后利用訓(xùn)練階段獲得的最優(yōu)SVDD分類面對特征向量進(jìn)行分類判決,自動實現(xiàn)“正?!焙汀肮收稀眱煞N狀態(tài)的判決。接下來利用所提ImKMeans對“故障”數(shù)據(jù)進(jìn)行進(jìn)一步分析,首先定義局部密度概念,并選取局部密度最大的K個樣本作為KMeans的初始聚類中心,然后利用ImKMeans對“故障”樣本進(jìn)行聚類分析,自動將其劃分為“低能放電”“中低溫過熱”“高能放電”“高溫過熱”“局部放電”5種故障類型。
2"SVDD
變壓器絕大部分時間都處于正常工作狀態(tài),即“正常”是一種長期且穩(wěn)定的狀態(tài),而“故障”是一種隨機且短暫的狀態(tài),因此在實際使用過程中,通常難以獲得足夠多的“故障”類樣本用于檢測模型的訓(xùn)練。因此,本文首先選用SVDD一類分類器進(jìn)行變壓器“故障”檢測,只需要“正?!鳖悩颖炯纯赏瓿勺顑?yōu)分類面的訓(xùn)練。
對于“正?!鳖悩颖炯蟈=[x1,x2,…,xN]T,SVDD分類模型可以用式(1)表示:
min""B(c,r)=r2+C∑Ni=1ξis.t."""(xi-c)T(xi-c)≥r2+ξi,
ξi≤0,i=1,…,N(1)
式中:c為SVDD閉合超球體分類面的球心,r為對應(yīng)的半徑;ξi和C分別為避免過擬合而設(shè)置的松弛變量和懲罰因子。由于真實環(huán)境中訓(xùn)練樣本集通常不符合球狀分布,因此SVDD引入核函數(shù)將訓(xùn)練樣本向高維空間映射,從而使其在高維空間中呈現(xiàn)出球狀分布,常用的核函數(shù)為式(2)所示徑向基形式:
K(xi,xj)=exp(-‖xi-xj‖2σ2)(2)
式中:σ為核參數(shù)。對式(1)引入拉格朗日乘子和核函數(shù),可以將其轉(zhuǎn)化為式(3)所示對偶形式:
max""L=∑Ni=1α′iK(xi,xj)-∑i,jα′iα′j(xi,xj)s.t."""∑ni=1α′i=1,0≤α′i≤C,i=1,…,N(3)
式中:α′i為支撐向量標(biāo)識符,當(dāng)α′igt;0時,對應(yīng)的xi為超球面上的支撐向量。根據(jù)式(3)獲得的所有支撐向量可以得到SVDD最優(yōu)超球體為:
c=∑Ni=1α′ixir=‖K(xi)-K(c)‖2(4)
得到最優(yōu)超球體后,對于任意測試樣本x*,只需要根據(jù)其與球心之間的距離是否大于半徑即可實現(xiàn)“正?!焙汀肮收稀钡呐袛?,即SVDD判決函數(shù)為:
f(x*)=‖K(x*)-K(c)‖2-r2(5)
若f(x*)≤0,即x*處于超球體內(nèi)部,表明其為“正常”類樣本;若f(x*)gt;0,即x*處于超球體外,表明其為“故障”類樣本。
3"ImKMeans
得到“故障”類樣本后,需要對其故障類型進(jìn)行進(jìn)一步判斷。KMeans是一種經(jīng)典的無監(jiān)督聚類方法,根據(jù)樣本之間的歐式距離大小即可實現(xiàn)不同子集的劃分,具有原理簡單、運算效率高的優(yōu)勢。但是KMeans聚類性能受初始聚類中心的選取影響較大,而選擇合適的初始聚類中心并非易事。一種好的聚類結(jié)果是同一類別內(nèi)樣本之間的聚集性好,而不同類別聚類中心之間的分散性高。因此合適的初始聚類中心應(yīng)該選擇在樣本分布較為密集的區(qū)域,同時不同初始聚類中心之間的距離應(yīng)盡可能大?;诖耍疚奶岢鰳颖距徲虬霃胶途植棵芏鹊母拍?,進(jìn)而建立改進(jìn)的KMeans(Improved"KMeans,"ImKMeans)聚類模型。
對于SVDD獲得的M個“故障”類樣本X=nMn=1,利用所提ImKMeans對其進(jìn)行聚類分析的步驟如下。
步驟1:根據(jù)“故障”類別確定最優(yōu)聚類個數(shù)K。
步驟2:選取初始聚類中心。
①"定義式(6)所示樣本空間密度概念,并計算每個樣本的空間密度值dist(n);
dist(n)=∑Mj=1‖n-j‖l2∑Ni=1,i≠n‖n-i‖l2(6)
式中:‖·‖l2表示計算l2范數(shù)算子。
②定義式(7)所示鄰域半徑概念,并計算每個樣本的鄰域半徑值r(n):
r(n)=1M∑Mn=1exp"(-dist(n))(7)
③在樣本空間密度和鄰域半徑的基礎(chǔ)上,進(jìn)一步定義式(8)所示樣本局部密度概念,并計算每個樣本的局部密度值ρ(*n):
ρ(*n)=dist(*n)×log"(r(*n))(8)
④選取局部密度最大的K個樣本作為初始聚類中心。
步驟3:將樣本集合中除初始聚類中心外的樣本按照歐式距離的大小劃分至最近的聚類中。
步驟4:按式(9)計算得到新的聚類中心。
k=1nk∑nkn=1n(9)
式中:nk為第k個子類中的樣本數(shù)。
步驟5:重復(fù)步驟3~步驟4,直至相鄰兩次聚類結(jié)果相同,得到最終聚類結(jié)果。
從樣本空間密度的定義可知,空間密度描述的是樣本之間的距離,空間密度越大,表明該樣本與其他樣本之間的距離越大;從鄰域半徑的定義可知,鄰域半徑描述的是樣本之間的聚集程度,樣本鄰域半徑越大,表明該樣本處在周圍樣本的均值附近。局部密度同時考慮了樣本空間密度和鄰域半徑,選擇局部密度大的樣本作為初始聚類中心能夠保證不同聚類中心之間的距離較遠(yuǎn),同時每個聚類中心都處在樣本分布較為密集的區(qū)域。
4"實驗及結(jié)果分析
4.1"實驗數(shù)據(jù)及評估指標(biāo)
為了驗證所提方法的故障檢測性能,從IEC"TC10數(shù)據(jù)庫及中國電力行業(yè)標(biāo)準(zhǔn)DL/T"722-2014故障案例中,分析整理出413條變壓器故障數(shù)據(jù)及對應(yīng)的5種故障類型:低能放電59條、中低溫放電86條、高能放電96條、高溫過熱114條和局部放電58條,與400條變壓器正常數(shù)據(jù)構(gòu)成實驗數(shù)據(jù)集,數(shù)據(jù)集中同時包含H2、CH4、C2H6、C2H4、C2H2五種DGA數(shù)據(jù)。為了便于分析,對正常數(shù)據(jù)和不同故障類型數(shù)據(jù)進(jìn)行標(biāo)號,每種數(shù)據(jù)的標(biāo)號及樣本數(shù)如表1所示。
實驗首先將“正?!鳖悩颖景?∶4的比例進(jìn)行劃分,其中60%(240個)作為訓(xùn)練樣本,完成SVDD模型訓(xùn)練,剩余40%(160個)作為測試樣本,同時將所有413個故障樣本作為1類同正常樣本一起構(gòu)成測試數(shù)據(jù)集。完成SVDD分類后,進(jìn)一步對“故障”類樣本進(jìn)行ImKMeans聚類分析。
實驗用數(shù)據(jù)分析平臺為聯(lián)想ThinkPad"X1"Carbon便攜式計算機,采用Intel"Core"i7處理器,2.1"GHz主頻,32"GB內(nèi)存,數(shù)據(jù)分析軟件平臺為MATLAB"R2018b。
采用表2所示混淆矩陣對所提方法的故障檢測性能進(jìn)行分析,其中TPi_P為將實際第i(i=0,1,…,5)類數(shù)據(jù)正確判決為第i類標(biāo)簽的樣本數(shù),TPi_N為將實際第i類數(shù)據(jù)錯誤判決為其他類標(biāo)簽的樣本數(shù)。
在表2的基礎(chǔ)上,定義式(10)所示每類樣本的正確分類率(ACC)和所有樣本的平均正確分類率(ACC_MEANS)2項指標(biāo)對所提方法的故障診斷性能進(jìn)行定量評估。
ACCi=TPi_PTPi_P+∑TPi_NACC_MEANS=∑Ki=0TPi_P∑Ki=0TPi_P+∑Ki=0TPi_N"(10)
4.2"實驗結(jié)果及分析
圖2給出了利用SVDD進(jìn)行故障檢測得到結(jié)果的二維投影,其中“--”為利用正常類樣本訓(xùn)練得到的SVDD最優(yōu)分類面??梢钥闯觯米顑?yōu)分類面對測試樣本進(jìn)行分類判決,所有“正常”類測試樣本被包圍在最優(yōu)分類面以內(nèi),同時所有“故障”類測試樣本均分布在最優(yōu)分類面以外,表明SVDD能夠有效地實現(xiàn)“正?!焙汀肮收稀钡姆诸悺?/p>
圖3給出了利用ImKMeans對SVDD判決為“異?!鳖惖臄?shù)據(jù)進(jìn)行聚類分析得到的聚類結(jié)果,可以看出,聚類后不同故障類型對應(yīng)的數(shù)據(jù)都表現(xiàn)出了較好的類內(nèi)聚集性,同時不同類別之間的樣本距離較遠(yuǎn),表現(xiàn)出了較好的類間分離性。
對SVDD和ImKMeans聚類結(jié)果進(jìn)行綜合,得到所提方法的最終故障檢測結(jié)果如表3所示,同時為了對比,表3中一并給出了在相同條件下采用文獻(xiàn)[11]所提SVM方法和文獻(xiàn)[9]所提BP神經(jīng)網(wǎng)絡(luò)方法進(jìn)行故障檢測得到的結(jié)果??梢钥闯?,所提方法對于每一類數(shù)據(jù)的分類結(jié)果均優(yōu)于兩種對比方法,對所有類別的平均檢測結(jié)果相較于SVM方法提升9.8%,相較于BP神經(jīng)網(wǎng)絡(luò)方法提升8%。究其原因在于SVM和BP神經(jīng)網(wǎng)絡(luò)方法需要直接對1類“正?!睒颖竞?類“故障”樣本進(jìn)行檢測分類,一方面多類分類會造成分類模型較為復(fù)雜,同時從表1所示每種類別樣本數(shù)量可知,低能放電和局部放電2類“故障”類樣本數(shù)量較少,在分類器學(xué)習(xí)過程中會導(dǎo)致該2類所占權(quán)重較低,導(dǎo)致最終檢測結(jié)果中該2類“故障”樣本的分類性能較低。而所提方法在利用ImKMeans聚類時,通過設(shè)置聚類個數(shù)可以有效避免樣本不均衡導(dǎo)致的分類結(jié)果下降問題。
5"結(jié)"論
本文提出了一種聯(lián)合使用SVDD和ImKMeans聚類的變壓器故障診斷模型,并利用實際數(shù)據(jù)驗證了模型的有效性,得到以下結(jié)論。
(1)"針對變壓器故障診斷面臨的樣本非平衡問題,提出利用SVDD一類分類器首先進(jìn)行故障診斷,然后利用ImKMeans進(jìn)行無監(jiān)督聚類的方法,該方法不需要“故障”類訓(xùn)練樣本即可實現(xiàn)故障診斷,大大降低了樣本獲取難度;
(2)"針對傳統(tǒng)KMeans初始聚類中心確定難題,提出局部密度概念,進(jìn)而得到ImKMeans聚類算法,ImKMeans能夠自動選擇局部密度最大的K個樣本作為初始聚類中心,從而提升聚類性能;
(3)"基于實際變壓器故障診斷數(shù)據(jù)的實驗結(jié)果表明,相對于傳統(tǒng)SVM和BP神經(jīng)網(wǎng)絡(luò)模型,所提方法對于每種故障類型均能獲得更優(yōu)的分類結(jié)果。
參考文獻(xiàn)
[1]"李婷,"肖京,"劉簪,"等."基于信息融合和神經(jīng)網(wǎng)絡(luò)的變壓器內(nèi)部故障快速診斷方法[J/OL]."電測與儀表,"2022,"DOI:http://kns.cnki.net/kcms/detail/23.1201.TH.20211101.1014.006.html.
[2]"張育杰,"李典陽,"馮健,"等."基于多模型選擇性統(tǒng)合的變壓器在線故障診斷[J]."電力系統(tǒng)自動化,"2021,45(13):95-101.
[3]"吳國強,"姚建鋒,"管敏淵,"等."基于DBSCAN的電力變壓器故障診斷[J]."武漢大學(xué)學(xué)報(工學(xué)版),"2021,"54(12):1172-1179.
[4]"羅偉."基于支持向量機與化學(xué)反映優(yōu)化算法的變壓器故障診斷[D]."長沙:湖南大學(xué),"2017.
[5]"朱保軍,"咸日常,"范慧芳,"等."WRSR與改進(jìn)樸素貝葉斯融合的變壓器故障診斷技術(shù)研究[J]."電力系統(tǒng)保護與控制,"2021,"49(20):120-128.
[6]"王東,"朱永利."基于模糊C均值聚類和改進(jìn)相關(guān)向量機的變壓器故障診斷[J]."電測與儀表,"2019,"56(12):14-19.
[7]"張育杰,"馮健,"李典陽,"等."基于油色譜數(shù)據(jù)的變壓器故障征兆新優(yōu)選策略[J]."電網(wǎng)技術(shù),"2021,"45(08):3324-3332.
[8]"劉可真,"茍家萁,"駱釗,"等."基于粒子群優(yōu)化長短期記憶網(wǎng)絡(luò)模型的變壓器油中溶解氣體濃度預(yù)測方法[J]."電網(wǎng)技術(shù),"2020,"44(7):2778-2884.
[9]"李騰飛,"郝玉杰,"袁方,"等."基于多源特征信息融合的油浸式變壓器故障智能診斷模型[J]."電工電能新技術(shù),"2023,"42(1):48-57.
[10]張又文,"馮斌,"陳頁,"等."基于遺傳算法優(yōu)化XGBoost的油浸式變壓器故障診斷方法[J]."電力自動化設(shè)備,"2021,"41(2):200-206.
[11]李云淏,"咸日常,"張海強,"等."基于改進(jìn)灰狼算法與最小二乘支持向量機耦合的電力變壓器故障診斷方法[J/OL]."電網(wǎng)技術(shù),"2023,"https://kns.cnki.net/kcms/detai//11.2410.TM.20230222.1629.005.html
[12]孫葉,"唐琳,"蘇冰,"等."基于深度學(xué)習(xí)算法的變壓器故障識別研究[J]."微型電腦應(yīng)用,"2021,"37(12):74-77.