張 貴, 丁云飛
(上海電機學院 電氣學院, 上海 201306)
風能是我國大力發(fā)展的清潔能源,近幾年,我國風力發(fā)電規(guī)模不斷擴大,風力發(fā)電技術(shù)也愈發(fā)成熟,并且有著廣闊的發(fā)展前景[1]。當風力不穩(wěn)定的時候,風電系統(tǒng)的輸出電壓也會不穩(wěn)定,這會導致風電變壓器出現(xiàn)各種故障,甚至有可能發(fā)生重大事故。因此,在故障初期精準地發(fā)現(xiàn)變壓器的故障并對典型故障進行分析,是保障風電變壓器安全可靠運行的重要舉措[2]。
模糊C均值(Fuzzy C-Means, FCM)算法是在K-means的基礎上加入了模糊的思想,賦予每一個樣本數(shù)據(jù)隸屬度,從而實現(xiàn)模糊劃分,聚類性能得以加強。FCM算法因其良好的效果在分類和故障診斷等方面得到大量應用。自從1974年Dunn等[3-4]提出FCM算法后,該算法被科研工作者研究改進,聚類性能和效果進一步提高。如劉長良等[5]采用變分模態(tài)分解方法提取特征向量,通過FCM聚類方法對滾動軸承故障進行故障識別,能快速地得到聚類中心,且診斷精度為100%。唐燕雯[6]將模糊核聚類算法應用于船舶故障診斷,得到了收斂速度快、魯棒性強的故障診斷模型。代憲亞等[7]針對電廠的復雜性,將FCM算法和神經(jīng)網(wǎng)絡結(jié)合在一起,從確定隸屬度到處理參數(shù),再到神經(jīng)網(wǎng)絡診斷,最后將結(jié)果融合,從而得出高準確度的診斷結(jié)果。李贏等[8]提出基于FCM和改進相關向量機的模型,該模型采用完全二叉樹改進相關向量機,對故障診斷精度有明顯提升,也為實時在線檢測發(fā)現(xiàn)故障并及時做出診斷提供了實用價值。王軍輝等[9]利用集合經(jīng)驗模式分解得到特征矩陣,特征矩陣處理后進行模糊聚類分析,并將其應用到齒輪箱故障診斷中,實驗表明,該方法更能有效進行故障分類。
由于FCM算法沒有考慮樣本向量中每個維度特征的差異性情況,特征加權(quán)FCM(Feature-Weighted C-Means, WFCM)算法被提出。文獻[10]將特征權(quán)重、核函數(shù)與模糊聚類方法結(jié)合,將核函數(shù)從低維映射到高維,并對樣本各維度加權(quán),對于維度較高的樣本有較好的處理效果,該方法在汽輪發(fā)電機組故障診斷中得到了有效的驗證。文獻[11]改進了人工魚群優(yōu)化,并與WFCM算法結(jié)合,能夠使算法收斂更快并解決FCM受初始值影響較大的問題。文獻[12]對模糊C有序均值算法通過極差正規(guī)化的手段特征加權(quán),既保證了算法的健壯性,又能優(yōu)化樣本數(shù)據(jù)的分布。
本文在WFCM算法的啟發(fā)下,提出基于改進加權(quán)FCM(Improved Feature-Weighted Fuzzy C-Means, IWFCM)算法的故障診斷方法,并將其應用到變壓器故障診斷中。該方法考慮到聚類過程中聚類中心的變化會帶來樣本分布的變化,因此,權(quán)重也應動態(tài)更新來適應樣本的重構(gòu)。通過采用動態(tài)更新特征權(quán)重的方法,使得樣本的分布更趨于合理,診斷準確度得以提高,從而為變壓器的故障診斷技術(shù)提供一種新的研究方法。
FCM算法通過對每一個樣本數(shù)據(jù)賦予隸屬度,使得聚類過程中聚到同一類的樣本有最大的相似度,從而實現(xiàn)了樣本數(shù)據(jù)的模糊劃分。FCM算法以較為簡單的結(jié)構(gòu)和較強的聚類性能被應用于眾多領域,是最受科研工作者們喜愛的算法之一。
有數(shù)據(jù)集D={xi}∈Rd,其中xi∈Rd,d為特征維數(shù),C為分類數(shù)。聚類目標函數(shù)表示為
(1)
(2)
(3)
本文所提到的IWFCM算法,通過動態(tài)更新特征權(quán)重,使得不同比重的權(quán)重值能夠體現(xiàn)各維度特征在聚類過程中所起作用的大小,這對于特征的細分優(yōu)化有非常大的提升。IWFCM算法的目標函數(shù)為
(4)
式中
(5)
(6)
(7)
IWFCM算法是在經(jīng)典的FCM算法上動態(tài)更新特征權(quán)重,使得權(quán)重得以重新分配,某些布局不均衡的樣本分布也變得更合理,樣本精度得以提高。IWFCM算法的具體步驟如下:
步驟1采集風電變壓器故障樣本,對樣本做預處理。
步驟2設置參數(shù),包括分類數(shù)C,模糊度m,隸屬度uij。
步驟3初始化隸屬度uij和特征權(quán)重wd。
步驟4按照式(5)~式(7)更新隸屬度、聚類中心和特征權(quán)重。
步驟5判斷迭代終止條件是否滿足,若不滿足,則轉(zhuǎn)到步驟4;若滿足,則停止迭代過程。
步驟6依據(jù)特征權(quán)重值的大小來判斷各維度在聚類過程中所起的主次作用,通過隸屬度的大小來判斷故障類型。
風電變壓器在工作過程中處于故障狀態(tài)時,相比于正常工作狀態(tài),產(chǎn)生的H2、CH4、C2H6、C2H4和C2H2等含量會大幅增加。而且對于不同類型的故障,原始樣本中氣體含量會有較大的數(shù)量級差異。因此,以H2、CH4、C2H6、C2H4和C2H2這5種氣體的體積分數(shù)作為特征量,為了減少計算誤差,需要經(jīng)過歸一化處理后再加載到故障診斷模型。歸一化公式為(處理后的樣本數(shù)據(jù)值介于0到1之間)
(8)
基于IWFCM算法的模型充分考慮了數(shù)據(jù)各維度之間權(quán)重的差異,動態(tài)更新特征權(quán)重可以在訓練階段實時體現(xiàn)聚類信息的變化?;贗WFCM算法的風電變壓器故障診斷的具體實現(xiàn)過程如下:
(1) 采集樣本數(shù)據(jù)。采集風電變壓器5種油中溶解氣體的氣體含量數(shù)據(jù),構(gòu)成原始數(shù)據(jù)集。
(2) 數(shù)據(jù)預處理。利用式(8)對原始數(shù)據(jù)做歸一化處理,并將處理后的樣本集作為輸入樣本。
(3) 建立故障診斷模型。確定故障樣本的聚類中心和隸屬度,利用式(7)動態(tài)更新數(shù)據(jù)集特征權(quán)重,使得不同的權(quán)重能夠?qū)颖镜姆植加懈侠淼闹貥?gòu),建立起動態(tài)加權(quán)的故障診斷模型。
(4) 故障結(jié)果分類。將樣本數(shù)據(jù)輸入診斷模型,聚類后通過隸屬度矩陣的大小得出診斷模型聚類后的故障類別,通過特征權(quán)重矩陣的大小找出對聚類結(jié)果影響較大的幾維特征,從而得出5種氣體中哪幾種氣體的含量對聚類的效果影響較大。
故障診斷流程如圖1所示。
圖1 故障診斷流程圖
本文反映變壓器故障類型的油中溶解氣體數(shù)據(jù)來源于風電公司,數(shù)據(jù)共有246組。在本文中,將風電變壓器的故障類型分為6種,具體樣本個數(shù)分布如表1所示。
表1 故障樣本集組成
為驗證所提方法的可行性,分別利用K-means方法、FCM和IWFCM診斷方法來識別故障并比較實驗結(jié)果。設置以下參數(shù):m=2,C=6。
聚類效果如圖2~4所示。圖中,橫向是實際6種聚類結(jié)果,縱向是聚類后的情況?;煜仃噷蔷€上的數(shù)字代表聚類結(jié)果與實際情況相符的聚類個數(shù)。
圖2 K-means聚類結(jié)果與實際情況的混淆矩陣
圖3 FCM聚類結(jié)果與實際情況的混淆矩陣
圖4 IWFCM聚類結(jié)果與實際情況的混淆矩陣
圖2中聚類后的低溫過熱中有16個樣本與實際情況相符,8個被分到了中溫過熱,1個被分到了高溫過熱。IWFCM診斷方法在中、高溫過熱和低、高能放電上,相較于K-means和FCM診斷方法,故障識別精度分別有了大幅度的提升。其中,K-means、FCM、IWFCM診斷方法在中溫過熱上準確率分別為28.57%、78.57%、95.24%;在高溫過熱上準確率分別為90%、62.86%、97.14%;在低能放電上準確率分別為30%、55%、80%;在高能放電上準確率分別為88.68%、39.62%、81.13%。在低溫過熱和局部放電上,3種診斷方法的準確率無明顯變化。雖然在高能放電上K-means診斷方法的精度最高,但其比IWFCM方法高的并不多,而且從整體上看,IWFCM診斷方法的精度是最高的,為87.40%。
K-means和FCM中各維度的特征權(quán)重都是相同的,對于維度較高的數(shù)據(jù)集,K-means和FCM在聚類結(jié)果上會受到不重要維度和噪聲特征的干擾。因此,在FCM中加入了動態(tài)更新的特征權(quán)重,使得貢獻權(quán)重的分配更趨于合理,得到的故障識別率更加精確。
相較于K-means和FCM,IWFCM由于加入了動態(tài)更新的特征權(quán)重,使得樣本數(shù)據(jù)集的每一維特征都有著不同比重的效果,且該特征權(quán)重在訓練過程中是實時更新的,因此,對于高維度的數(shù)據(jù)而言,可以突出某些維度特征的主要作用,降低冗余特征的干擾。在IWFCM聚類所得到的結(jié)果中,由權(quán)重所得到的特征權(quán)重直方圖如圖5所示。由圖5可知,第3、第5維在聚類過程中所占的比重較大,即C2H6和C2H2是主導特征。這與實際情況是相符的,因為當變壓器絕緣油分解產(chǎn)氣只有熱源輸出時,主要產(chǎn)生低分子烴類氣體,其中CH4和C2H6的含量占總烴的80%以上,而當火花放電時,產(chǎn)生的主要氣體是C2H2。由于動態(tài)更新特征權(quán)重能夠優(yōu)化樣本的分布,因此,可以得到最優(yōu)的聚類中心。最優(yōu)聚類中心如表2所示。
圖5 5種氣體的特征權(quán)重直方圖
類別H2CH4C2H6C2H4C2H2低溫過熱0.10830.31570.18220.39010.0037中溫過熱0.45830.13430.02260.18590.1990高溫過熱0.87020.06540.02830.02800.0081局部放電0.10200.27100.53630.08770.0030低能放電0.13160.27670.08340.50020.0082高能放電0.40910.09470.04280.09280.3606
風電變壓器發(fā)生不同故障時,其內(nèi)部產(chǎn)生的氣體含量是不同的,各氣體在聚類過程中所起的作用也是不同的。針對一般的聚類方法未考慮到數(shù)據(jù)各維度之間權(quán)重的差異,本文提出了IWFCM算法的風電變壓器故障診斷方法,該方法在傳統(tǒng)的FCM算法中通過動態(tài)更新特征權(quán)重,使得樣本數(shù)據(jù)集的每一維都有著主次劃分,突出了某些特征對聚類的主要影響,降低了冗余特征的干擾。結(jié)果表明:此方法可以優(yōu)化數(shù)據(jù)的分布,極大地提高聚類準確率,特征權(quán)重矩陣能夠反映出聚類過程中數(shù)據(jù)集各維度所起作用的不同,對于變壓器的故障診斷有著重要的參考價值。