薛盛煒,李 川,李英娜
(1.昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650500;2.云南省計(jì)算機(jī)技術(shù)應(yīng)用重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500)
隨著人工智能的不斷發(fā)展,運(yùn)用人工智能+變壓器油中溶解氣體分析(dissolved gas analysis,DGA)對(duì)變壓器進(jìn)行故障診斷與識(shí)別,取得了一定的成果[1-3]。在現(xiàn)有的人工智能技術(shù)條件下,變壓器故障診斷模型有人工神經(jīng)網(wǎng)絡(luò)[4-5]、支持向量機(jī)、極限學(xué)習(xí)機(jī)以及聚類[6-10]等算法,將上述人工智能方法與DGA數(shù)據(jù)相融合,可有效提高故障診斷與識(shí)別的準(zhǔn)確率,但同時(shí)面臨計(jì)算復(fù)雜以及部分算法容易陷入局部最優(yōu)值的問(wèn)題。此外,以灰色系統(tǒng)、證據(jù)理論為基礎(chǔ)進(jìn)行的變壓器故障識(shí)別研究也取得了一定的進(jìn)展[11-13]。在上述方法中,模糊C均值聚類(fuzzy C-means,F(xiàn)CM)分析方法在模型建立階段無(wú)需樣本數(shù)據(jù)的先驗(yàn)知識(shí),其工作原理是根據(jù)樣本數(shù)據(jù)在空間維度上的聚集進(jìn)行分類,在變壓器故障診斷中取得了較好的效果[14-16]。但是,應(yīng)用傳統(tǒng)模糊C均值聚類方法分析DGA數(shù)據(jù)時(shí),會(huì)對(duì)所有數(shù)據(jù)賦予相同的權(quán)重,忽視不同故障類型對(duì)應(yīng)特征氣體的特異性,出現(xiàn)數(shù)據(jù)等趨勢(shì)劃分,造成聚類結(jié)果失準(zhǔn)以及聚類中心代表性下降的問(wèn)題[17]。
本文通過(guò)對(duì)油浸式變壓器的DGA數(shù)據(jù)進(jìn)行點(diǎn)密度加權(quán)處理,優(yōu)化FCM算法的輸入數(shù)據(jù),提高聚類準(zhǔn)確性,期望獲得較為準(zhǔn)確以及代表性較強(qiáng)的聚類中心數(shù)據(jù)與故障數(shù)據(jù)標(biāo)準(zhǔn)譜。同時(shí),采用改進(jìn)的主成分分析(principal component analysis,PCA)方法建立主成分模型,最大程度簡(jiǎn)化與保留數(shù)據(jù)信息,以待測(cè)數(shù)據(jù)與主成分間歐氏距離為判據(jù)進(jìn)行故障識(shí)別。本文方法減輕了變壓器吊裝檢查以及人工巡檢的成本與壓力,與傳統(tǒng)的油浸式變壓器故障識(shí)別方法相比,具有明顯的優(yōu)勢(shì)。
在中國(guó)油浸式變壓器故障診斷相關(guān)國(guó)家標(biāo)準(zhǔn)以及學(xué)者的相關(guān)研究中,通過(guò)DGA數(shù)據(jù)能夠識(shí)別與判斷的油浸式變壓器故障主要分為6種,當(dāng)變壓器出現(xiàn)故障時(shí),設(shè)備絕緣油中會(huì)產(chǎn)生以H2、CH4、C2H6、C2H4和C2H2這5種氣體為主的特征氣體。同時(shí),根據(jù)《變壓器油中溶解氣體分析和判斷導(dǎo)則》可知:故障類型與特征氣體間具有對(duì)應(yīng)關(guān)系,這對(duì)判斷與識(shí)別油浸式變壓器內(nèi)部故障具有重要意義。
圖1 改進(jìn)的FCM算法流程圖
根據(jù)對(duì)油浸式變壓器故障DGA數(shù)據(jù)的分析可知:同類型故障發(fā)生時(shí),各特征氣體DGA在數(shù)據(jù)表現(xiàn)上具有相似性,同時(shí)FCM聚類算法的目的也是將最相似的數(shù)據(jù)劃分為一類。因此,根據(jù)油浸式變壓器不同故障類型下DGA樣本數(shù)據(jù)的相似性,可以利用FCM對(duì)其故障數(shù)據(jù)進(jìn)行聚類分析。
針對(duì)等趨勢(shì)劃分的缺陷,本文采用點(diǎn)密度加權(quán)方式對(duì)數(shù)據(jù)進(jìn)行處理[18]。點(diǎn)密度的定義為:
(1)
dij=‖xi-xj‖,
(2)
其中:dij為任意兩個(gè)樣本之間的歐氏距離;N為樣本數(shù)。同時(shí),DGA樣本數(shù)據(jù)的權(quán)值為:
(3)
其中:加權(quán)系數(shù)wi所代表的信息為某一DGA樣本數(shù)據(jù)本身對(duì)聚類的影響程度。聚類時(shí)中隸屬度uij與聚類中心vi的迭代公式如下:
(4)
(5)
其中:m為模糊化程度參數(shù),一般選取2。
改進(jìn)的FCM算法流程圖如圖1所示。
主成分分析方法是通過(guò)將高維數(shù)據(jù)投影,進(jìn)行數(shù)據(jù)特征抽取、降維的一種方法,在傳統(tǒng)主成分分析中,為消除量綱等的影響,常以標(biāo)準(zhǔn)化方法進(jìn)行數(shù)據(jù)預(yù)處理。但標(biāo)準(zhǔn)化處理會(huì)忽視數(shù)據(jù)間的差異信息,而在分析過(guò)程中造成一定的影響[19]。
本文采用對(duì)原始DGA數(shù)據(jù)施加慣性系數(shù)的優(yōu)化方式產(chǎn)生一級(jí)優(yōu)化數(shù)據(jù),以經(jīng)過(guò)二級(jí)優(yōu)化的DGA數(shù)據(jù)協(xié)方差替代傳統(tǒng)主成分分析方法的相關(guān)系數(shù)矩陣[20]。
對(duì)油浸式變壓器油中DGA數(shù)據(jù)集進(jìn)行主成分分析時(shí),對(duì)DGA數(shù)據(jù)處理優(yōu)化的步驟如下:
(Ⅰ)設(shè)X={x1,x2,x3,...,xp},p為油中DGA數(shù)據(jù)的特征氣體個(gè)數(shù),本文中p的值為5。
(Ⅱ)設(shè)ω={ω1,ω2,ω3,...,ωp}為對(duì)DGA數(shù)據(jù)施加的慣性系數(shù),
(6)
(7)
通過(guò)以上步驟對(duì)樣本賦慣性系數(shù)進(jìn)行數(shù)據(jù)處理。將最終處理后的DGA數(shù)據(jù)即二級(jí)優(yōu)化數(shù)據(jù)應(yīng)用在主成分分析方法中,具體步驟如下:
(Ⅰ)對(duì)經(jīng)過(guò)二級(jí)優(yōu)化的DGA數(shù)據(jù)矩陣求取協(xié)方差矩陣,協(xié)方差矩陣為:
(8)
圖2 改進(jìn)的PCA方法的流程圖
(Ⅱ)根據(jù)公式|λI-V|=0計(jì)算協(xié)方差矩陣的特征根以及特征向量,得到p個(gè)特征值,對(duì)應(yīng)p個(gè)特征向量,為U=(u1,u2,...,up),其中,ui=(ui1,ui2,...,uip)。
(Ⅲ)根據(jù)協(xié)方差矩陣的特征值計(jì)算主成分的方差貢獻(xiàn)率α和累計(jì)方差貢獻(xiàn)率β,其中:
(9)
(10)
為了滿足在實(shí)際應(yīng)用時(shí)精度的要求,本文以累計(jì)方差貢獻(xiàn)率大于或等于0.85的原則,對(duì)主成分的個(gè)數(shù)n進(jìn)行選取。
(Ⅳ)通過(guò)選取的n個(gè)主成分組成的因子載荷矩陣求得主成分的表達(dá)式:
(11)
上述改進(jìn)的PCA方法的流程圖如圖2所示。
利用點(diǎn)密度加權(quán)改進(jìn)的FCM算法,對(duì)從云南省昆明市變壓器廠收集到的165組DGA數(shù)據(jù)進(jìn)行聚類,聚類結(jié)果與利用傳統(tǒng)FCM對(duì)DGA數(shù)據(jù)集進(jìn)行聚類得到的結(jié)果進(jìn)行對(duì)比。經(jīng)過(guò)數(shù)據(jù)加權(quán)處理以及映射至高維空間后的聚類算法,對(duì)故障類型的識(shí)別和劃分準(zhǔn)確率更高。兩次聚類結(jié)果的對(duì)比情況見(jiàn)表1。由表1可知:相比于傳統(tǒng)FCM算法,本文所采用的方法對(duì)故障判別的平均正確率提升9.6%。采用改進(jìn)FCM算法處理DGA數(shù)據(jù)集,最終聚類中心的DGA數(shù)值見(jiàn)表2,即可將此處聚類中心數(shù)據(jù)作標(biāo)準(zhǔn)故障數(shù)據(jù)譜。
表1 傳統(tǒng)FCM算法與本文方法聚類結(jié)果對(duì)比
表2 聚類中心的DGA數(shù)值
表2為對(duì)165組數(shù)據(jù)進(jìn)行點(diǎn)密度加權(quán)處理后聚類劃分的聚類中心數(shù)值。表2中每個(gè)序號(hào)所在行代表聚類中心對(duì)應(yīng)的5種特征氣體含量的確定值。根據(jù)《變壓器油中溶解氣體分析和判斷導(dǎo)則》中改良的三比值法對(duì)其進(jìn)行了三比值編碼,依據(jù)編碼結(jié)果與《變壓器油中溶解氣體分析和判斷導(dǎo)則》中的編碼-故障類型表進(jìn)行對(duì)應(yīng),得出各聚類中心所代表的變壓器故障類型。同時(shí),通過(guò)每條數(shù)據(jù)對(duì)應(yīng)的變壓器工況記錄的查詢,再次確認(rèn)每條數(shù)據(jù)真實(shí)情況下的故障類型。
利用本文所述的主成分分析方法,得到的第一主成分方差貢獻(xiàn)率有所提升,且累計(jì)方差貢獻(xiàn)率更加突出,降維效果明顯。
通過(guò)計(jì)算DGA數(shù)據(jù)的主成分與待測(cè)DGA樣本數(shù)據(jù)之間的歐氏距離,作為故障類型識(shí)別與判斷的判據(jù)。兩者間歐氏距離越小,代表兩者所具有的故障類型越相似。
分別采用傳統(tǒng)PCA方法與本文所述的PCA方法處理20組DGA數(shù)據(jù),結(jié)果對(duì)比如表3所示。
表3 兩種PCA方法處理DGA數(shù)據(jù)的結(jié)果對(duì)比
由表3可知:利用本文所述的主成分分析方法,得到的第一主成分方差貢獻(xiàn)率有所提升,說(shuō)明其包含的信息更為全面。在主成分的累計(jì)方差貢獻(xiàn)率方面,與傳統(tǒng)方法相比,使用改進(jìn)方法得到的第一累計(jì)方差貢獻(xiàn)率更突出,更有效地綜合了指標(biāo)信息。從所有指標(biāo)來(lái)看,當(dāng)以累計(jì)方差貢獻(xiàn)率大于0.85為要求進(jìn)行篩選時(shí),傳統(tǒng)方法第三主成分累計(jì)方差貢獻(xiàn)率為0.824 8,與要求的數(shù)值有較大差距,說(shuō)明其不能滿足降維要求。而本文方法累計(jì)貢獻(xiàn)率為0.875 6,超出要求的數(shù)值,總體降維效果更為明顯,可以用較少的指標(biāo)反映原始指標(biāo)的大部分信息,降低了分析的復(fù)雜度,達(dá)到了主成分分析簡(jiǎn)化指標(biāo)維數(shù)的主要目的。
本文利用改進(jìn)FCM算法對(duì)165組DGA數(shù)據(jù)進(jìn)行聚類,得到7個(gè)聚類中心對(duì)應(yīng)的DGA數(shù)據(jù)。將這7個(gè)聚類中心作為代表油浸式變壓器7類故障的標(biāo)準(zhǔn)譜,通過(guò)實(shí)際檢查的方式對(duì)照,確定各聚類中心代表的故障類型。
(Ⅰ)利用已知為高溫過(guò)熱故障類型的油浸式變壓器DGA數(shù)據(jù)作為待測(cè)樣本,其DGA數(shù)據(jù)如下:H2含量為15.5 μL/L、CH4含量為68.6 μL/L、C2H6含量為32.9 μL/L、C2H4含量為1 007.6 μL/L、C2H2含量為4.8 μL/L。
通過(guò)得到的故障數(shù)據(jù)標(biāo)準(zhǔn)譜與已知故障類型DGA數(shù)據(jù)構(gòu)造樣本初始矩陣X,其中,x1、x2、...、x7為不同故障類型DGA數(shù)據(jù)下的標(biāo)準(zhǔn)數(shù)據(jù),x8為待測(cè)樣本數(shù)據(jù)。
對(duì)初始矩陣賦予綜合權(quán)重后求取特征值λ與特征向量矩陣a,其中:
λ=[1.909 4 0.539 3 0.256 3 0.014 2 0.000 0];
根據(jù)公式計(jì)算求得累計(jì)方差貢獻(xiàn)率矩陣:
M=[0.702 2 0.900 5 0.994 8 1.000 0 1.000 0]。
在實(shí)際問(wèn)題中,當(dāng)累計(jì)方差貢獻(xiàn)率大于0.85時(shí),已經(jīng)可以保證主成分具有足夠的精度。因此,可確定其主成分個(gè)數(shù)為3。
相應(yīng)選取特征向量為a1~a3,則主成分為:
計(jì)算待測(cè)DGA樣本與其他主成分之間的歐氏距離dij:
dij=[d1d2d3d4d5d6d7]=[1.40 1.01 0.84 1.41 1.31 1.21 0.79]。
通過(guò)對(duì)比可知:d7=0.79最小,因此,可認(rèn)為待測(cè)樣本的DGA數(shù)據(jù)所對(duì)應(yīng)的故障類型為高溫過(guò)熱故障,此結(jié)論與已知結(jié)論相符。
(Ⅱ)利用已知為低能放電故障類型的油浸式變壓器DGA數(shù)據(jù)作為待測(cè)樣本,其DGA數(shù)據(jù)如下:H2含量為30.0 μL/L、CH4含量為7.4 μL/L、C2H6含量為8.5 μL/L、C2H4含量為1.8 μL/L、C2H2含量為19 μL/L。經(jīng)過(guò)與上述實(shí)例驗(yàn)證的相同步驟,得到此處待測(cè)樣本DGA數(shù)據(jù)與其他主成分之間的歐氏距離為:
dij=[d1d2d3d4d5d6d7]=[1.53 1.10 0.64 1.84 1.48 1.64 0.83]。
通過(guò)對(duì)比可知:d3=0.64最小,因此,可認(rèn)為待測(cè)樣本的DGA數(shù)據(jù)所對(duì)應(yīng)的故障類型為低能放電,此結(jié)論與已知結(jié)論相符。
(1)采用點(diǎn)密度加權(quán)方式對(duì)傳統(tǒng)FCM算法進(jìn)行改進(jìn)優(yōu)化,克服了傳統(tǒng)FCM算法中對(duì)所有樣本數(shù)據(jù)賦予相同權(quán)重造成等勢(shì)劃分的影響。實(shí)例驗(yàn)證表明:本文所采用的方法在對(duì)油浸式變壓器DGA數(shù)據(jù)進(jìn)行故障類型劃分時(shí),相較于傳統(tǒng)FCM算法,平均準(zhǔn)確率提升了9.6%。
(2)通過(guò)二級(jí)優(yōu)化方式對(duì)主成分分析方法進(jìn)行了優(yōu)化,在應(yīng)用中降維效果較傳統(tǒng)方式有所改善。以歐氏距離為判據(jù)對(duì)油浸式變壓器故障進(jìn)行識(shí)別,計(jì)算結(jié)果與實(shí)際故障類型一致,且相對(duì)傳統(tǒng)故障識(shí)別方法較為簡(jiǎn)便與高效。