張 鑫, 郭順生, 江 麗
(1. 武漢理工大學 機電工程學院,武漢 430070;2. 武漢理工大學 湖北省數(shù)字制造重點實驗室,武漢 430070)
隨著工業(yè)4.0在全球化的興起,機械設備的故障診斷在正確率和診斷效率上需要達到更高的要求,而現(xiàn)代機械設備的故障數(shù)據(jù)往往呈現(xiàn)出非線性、非平穩(wěn)性、非高斯分布的海量高維特性,采用傳統(tǒng)的故障識別方法難以達到理想化的診斷效果[1-4]。研究如何從高維非線性的故障數(shù)據(jù)中,提取出對于故障識別有用的特征量,是當前故障識別領域的一大熱點,對于實際的生產維護也有很好的指導意義。
傳統(tǒng)的線性分析方法,如主元分析(Principal Components Analysis, PCA)算法[5]和獨立主元分析算法[6]無法揭示復雜故障數(shù)據(jù)的非線性結構。此外,傳統(tǒng)的非線性學習方法,如核主成分分析(Kernel PCA, KPCA)算法[7]在希爾伯特特征空間利用核函數(shù)執(zhí)行了線性PCA,一定程度上提取了高維非線性數(shù)據(jù)的低維表征量。但是,如何選取最優(yōu)的核函數(shù)提高KPCA算法的特征提取性能是一個巨大的挑戰(zhàn),而且它沒有考慮樣本的類別信息。核判別分析(Kernel Discriminant Analysis, KDA)算法[8]則要求數(shù)據(jù)服從高斯分布。自組織特征映射算法[9]計算較為復雜,且易陷入局部最優(yōu)。上述傳統(tǒng)的非線性算法難以挖掘蘊含在高維數(shù)據(jù)中的潛在信息,而流形學習則充分挖掘了非線性數(shù)據(jù)中潛在的幾何結構和內在規(guī)律,為高維非線性故障數(shù)據(jù)的特征提取提供了一種新的思路[10]。
拉普拉斯特征映射(Laplacian Eigenmaps,LE)是一種經(jīng)典的流形學習算法,它運用圖拉普拉斯概念計算高維流形來得到低維特征表示[11]。在機械故障診斷領域,LE算法多采取和聚類算法組合的方式,但它們大多是無監(jiān)督的[12-14]。這樣的無監(jiān)督方式忽略了故障的類別信息,缺少監(jiān)督信息的約束,易造成分類結果不理想。然而,有監(jiān)督的訓練需要大量昂貴的有標記樣本的支持。
基于約束種子K均值(Constrained Seed K-means,CSKM)算法[15]的初始聚類中心由標記樣本生成,其可靠性對后續(xù)聚類效果影響很大。而在實際應用中,標記樣本中難免會因外界環(huán)境干擾,造成一定的偏差,容易導致聚類結果的不理想。針對這些情況,本文在LE算法基礎上進行改進,并提出了基于改進LE算法和CSKM算法的半監(jiān)督識別模型。該模型利用大量廉價的未標記樣本學習出數(shù)據(jù)的潛在流形結構,少量昂貴的有標記樣本學習出整個流形上的類別信息,彌補了上述兩種監(jiān)督方式的不足。另外,本文提出的改進LE算法增加了對有標記樣本的降維約束,使得同類樣本點降維后更易聚集,異類樣本點降維后更易分離,從而保證CSKM算法具有更理想化的初始聚類中心,優(yōu)化了聚類效果。
給定高維空間RD上的一組訓練樣本和一組測試樣本, 構成數(shù)據(jù)集X={x1,x2,…,xm,xm+1,…,xm+n},xi∈RD。 其中m為訓練樣本總數(shù),n為測試樣本總數(shù),m+n即為總樣本數(shù),D為高維樣本的維數(shù)。 假設其在低維空間Rd上的低維嵌入為Y={y1,y2,…,ym,ym+1,…,ym+n},yi∈Rd;d為低維樣本的維數(shù)且d?D。
LE算法主要目標是挖掘潛藏在原始高維流形中的低維流形特征,其實質就是要獲得一個平均意義上的數(shù)據(jù)點局部近鄰信息。它的基本思想是,在高維空間上距離很近的點,在低維空間上的投影也應該距離很近。LE算法所產生的映射可以看成是對幾何流形的一種連續(xù)離散逼近的映射,通過構建數(shù)據(jù)點之間的鄰域圖來近似代表流形,并用Laplace-Beltrami算子近似標識鄰域圖的權值矩陣,實現(xiàn)高維流形的最優(yōu)低維嵌入。其算法的步驟如下:
步驟1構造近鄰圖G。計算高維空間上所有數(shù)據(jù)點對之間的歐式距離,根據(jù)k近鄰法,確定每個樣本點的k個近鄰點。如果高維空間上的兩點xi,xj是近鄰點,那么認為這兩點之間有邊連接,否則兩點之間是斷開的。
步驟2構造樣本點間的權值矩陣。樣本點間的權值選擇有兩種方法:①熱核法(Heat Kernel),若兩點xi,xj連通, 則其權值為Wij=exp(-‖xi-xj‖2/σ2); 否則Wij=0。② 簡單法。這種方法較為簡便,若兩點xi,xj是連通的,則Wij=1,否則Wij=0。本文采用簡單法,鄰接權值定義為
(1)
步驟3計算低維嵌入
(2)
傳統(tǒng)半監(jiān)督LE算法在標記樣本類間相似度低的情況下,無法對標記樣本生成精確的鄰邊矩陣與度矩陣,可能會造成異類樣本有邊相連的情況,造成流形學習的結果不可靠。本文提出的改進LE(Improved Laplacian Eigenmaps,ILE)算法,對標記樣本的降維學習加以約束,使得同類樣本間的低維流形更聚集,異類樣本的低維流形更離散,為后續(xù)CSKM算法聚類結果提供更可靠的半監(jiān)督信息,從而優(yōu)化分類準確率。在計算樣本近鄰圖G的鄰邊矩陣時,定義一置信度矩陣C, 如式(3)~式(5)所示。
(3)
(4)
δ2=2-δ1
(5)
計算樣本點間的歐式距離得到實際距離矩陣distance, 并通過置信度矩陣C進行約束, 構建兩點間的理想距離矩陣A,如式(6)定義
A(Xi,Xj)=distance(Xi,Xj)×C(i,j)
(6)
根據(jù)文獻[16]選擇合適的k值為8,最優(yōu)的嵌入維數(shù)d=β-1(β為樣本類別數(shù)), 對理想距離矩陣A進行排序, 對每個樣本點選擇前k個最近鄰的點, 并設置連接權值Wij=1, 從而構建近鄰矩陣W與度矩陣D。 通過“1.2”節(jié)中提出的方法,計算得到高維模式空間的低維嵌入ε1,ε2,…,εd。
在現(xiàn)實的聚類任務中,利用額外的監(jiān)督信息使得模型取得更優(yōu)的聚類效果,稱為半監(jiān)督聚類[17]。本文利用半監(jiān)督聚類算法對降維后的數(shù)據(jù)進行聚類分析,以標記樣本為監(jiān)督信息,實現(xiàn)聚類效果的最優(yōu)化。
步驟1利用標記樣本監(jiān)督信息,初始化聚類中心。
(7)
步驟4更新迭代次數(shù)t→t+1,重復上述步驟,直至收斂。
根據(jù)高維空間上不同故障樣本呈現(xiàn)出不同的流形結構,本文提出基于改進LE算法的故障診斷模型,如圖1所示。其基本思路是:運用ILE算法對原始高維模式空間進行流形學習,挖掘其潛在流形結構,從而提取表征故障本質的低維流形特征。其中,大量的無標記樣本可以學習出潛在的流形結構,少量標記樣本學習出樣本空間上的類別信息。提取出的低維流形涵蓋故障空間的主要特征,將它們輸入到CSKM分類器中,通過迭代尋優(yōu)的方式,實現(xiàn)最佳聚類效果從而識別出機械設備的工作狀態(tài)、診斷其故障類型。本文算法的診斷步驟如下:
圖1 基于改進LE算法的半監(jiān)督故障識別模型Fig.1 Semi-supervised fault identification model based on improved laplace feature mapping
(1) 構建原始高維模式空間
通過傳感器對故障設備進行數(shù)據(jù)采集,采用min-max標準化法對時域振動信號進行歸一化處理,從而得到一個原始振動時間序列構建的高維模式空間。
(2) 低維特征提取
通過“1.3”節(jié)提出的改進LE算法對高維故障數(shù)據(jù)進行流形學習,提取表征故障本質的低維流形特征。
(3) 基于約束種子K均值的分類器
低維流形特征包含有標記樣本與測試樣本,有標記樣本含有類別信息,一同輸入到后續(xù)半監(jiān)督分類器中。分類器最終輸出一個類別標識矩陣,同低維嵌入矩陣一同進行可視化聚類,并得到故障類型的診斷結果。
本文作為算法驗證的實驗數(shù)據(jù)來自于美國Case Western Reserve University電氣工程實驗室的滾動軸承故障數(shù)據(jù)[19],滾動軸承實驗臺由一個1 491.4 W的三相電動機、一個扭矩傳感器和一個加載電機組成。試驗軸承(型號為6205-2RS JEM SKF)安裝于電動機的驅動端,加速度傳感器粘貼于驅動端正上方的機殼。本文采用的實驗數(shù)據(jù)均在以下工作參數(shù)下測得:電機負載功率可選0~2.24 kW,對應轉速分別為1 797 r/min,1 772 r/min,1 750 r/min以及1 730 r/min。數(shù)據(jù)記錄儀(16通道)采樣頻率為12 kHz。依托于上述實驗條件,進行以下兩組實驗。第一組實驗選擇相同故障尺寸,驗證本文算法對故障類別的識別效果,第二組實驗針對滾動體故障,驗證不同受損程度的分類效果。兩組實驗同時與KPCA+KNN(K-Nearest Neighbor)算法、KDA+KNN算法、LE+KNN算法進行實驗對比,驗證本文算法的優(yōu)越性。上述三種對比算法的診斷過程為:分別采用KPCA算法、KDA算法、LE算法對高維流形結構進行特征提取,再通過K近鄰算法進行故障模式分類。通過五折交叉驗證,分別確定KPCA算法和KDA算法對應的最佳核(本文全部選用RBF(Radial Basis Function)核函數(shù))寬度σ[20]。
為驗證本文算法對軸承故障類型的識別效果,選取故障尺寸為0.53 mm的四類故障(內圈故障、球體故障、外圈故障、正常)數(shù)據(jù),進行如下模擬實驗。
對每類故障分別構建100組樣本,其中10組為含有類別標簽的有標記樣本,另外90組無標記樣本作為測試樣本。每組樣本含有1 024個采樣點,均在電機轉速1 750 r/min條件下測得。將高維空間的故障樣本映射到低維特征空間上,利于實現(xiàn)故障分類與可視化聚類。這400組樣本作為原始高維數(shù)據(jù)輸入到本文的算法模型中,樣本共分為四種類型,故確定算法的嵌入維數(shù)為d=3,設置CSKM算法迭代上限t=10,置信度系數(shù)由式(4)、式(5)求得。四種算法模型的詳細參數(shù)如表1所示。
表1 實驗一參數(shù)選擇
圖2展示了四種組合算法對不同故障類型的識別效果??梢钥闯?,KPCA作為一種無監(jiān)督算法,類內離散度高且類間沒有明顯的劃分。圖2(b)中有監(jiān)督的 KDA算法較之KPCA算法,分類效果有明顯的改善,但對于“正?!迸c“球體故障”兩類樣本的聚類效果提升不大。圖2(c)中,傳統(tǒng)LE算法較好的實現(xiàn)了不同故障狀態(tài)的識別,但對球體故障和外圈故障無法進行明顯的劃分,且分界面處樣本劃分混亂。圖2(d)中的ILE算法則成功分離了這兩類樣本,四類樣本在二維空間上劃分明顯。因此,本文提出的算法組合體現(xiàn)了更好的分離性能與聚類效果,能更好地表征和識別軸承的故障狀態(tài)。
圖2 四種算法的低維映射結果Fig.2 Low-dimensional mapping results of four algorithms
表2為上述四種算法多次運行后,計算耗時與識別率的對比結果。其中,計算耗時為特征提取與分類器耗時的總和??梢钥闯?,KDA,KPCA兩種算法雖然耗時較低,但識別精度過低(低于80%)。而本文提出的改進LE算法結合約束K均值分類器,計算耗時要比LE+KNN的組合更低,且識別率接近98%,識別效果優(yōu)于其他三種算法。
表2 實驗一算法對比
本實驗選取軸承滾動體不同故障尺寸(無故障,0.18 mm,0.36 mm,0.53 mm)作為故障類型,驗證本文算法對滾動體故障嚴重程度的分類效果,并與上述三種算法組合形成對比實驗。圖3為滾動軸承不同故障尺寸下時域特性,無法明顯區(qū)分四類故障尺寸。
圖3 不同故障尺寸的原始時域Fig.3 Original time domain of different fault sizes
樣本條件與“3.1”節(jié)實驗相同,每類故障類型包含100組樣本(共100×1 024個采樣點,電機轉速1 772 r/min下測得),其中包含10組標記樣本和90組測試樣本。四種算法參數(shù)設置如表3所示。
表3 實驗二參數(shù)選擇
圖4(a)為KPCA算法對上述樣本的聚類效果,可以看出四種故障尺寸間無法明顯劃分,分類情況和聚合情況都很差。圖4(b)中KDA算法的類內距較之KPCA算法有了較好的改善,但有三種類型的樣本投影混合在一起,無法區(qū)分。這二類算法對軸承故障尺寸的分類效果都不理想,準確率也都較低。
圖5(a)、圖5(b)分別為LE+KNN組合算法與本文算法對有標記樣本的聚類效果。從圖5(a)可知,故障尺寸0.18 mm的標記樣本與故障尺寸0.36 mm的樣本高度重合,分離度很差。而圖5(b)中四類有標記樣本聚類后分類效果明顯,且同類樣本幾乎集中于一點,因此本文算法對有標記樣本的降維效果大大優(yōu)于LE+KNN。
圖5(c)、圖5(d)為兩種算法對測試樣本的降維效果。從圖5(c)可知,經(jīng)LE算法降維后類內體現(xiàn)了很好的聚合性,但是由于傳統(tǒng)LE算法的聚類效果過度依賴于有標記樣本的可靠性,始終無法將故障尺寸為0.18 mm與0.36 mm的兩類實現(xiàn)分離,最終導致識別準確率較低。而圖5(d)中基于聚類效果更好的有標記樣本,本文算法組合清晰的區(qū)分了0.18 mm與0.36 mm兩類樣本,同一類型的樣本內部重合度較高,僅有一例0.18 mm樣本被錯標為正常,準確率大大提高。與傳統(tǒng)LE+KNN相比,本文提出的算法模型改善了有標記樣本聚類后類間距過小的情況,提高了有標記樣本的可靠性,對軸承故障尺寸的分類效果明顯更優(yōu),識別準確率更高。
圖4 KPCA與KDAFig.4 Kernel principal component analysis and Kernel discriminant analysis
圖5 LE與改進LEFig.5 LE and improved LE
表4為實驗二中四種算法的計算耗時與識別率的對比。結合實驗一的結果,綜合耗時與精度兩大要素,本文提出的改進LE算法在軸承故障診斷中的表現(xiàn)明顯優(yōu)于其他三種。
表4 實驗二算法對比
上述兩個實驗中,分類器的判別結果如圖6所示??梢钥闯鰬眉s束種子K均值分類器,使得本文模型有了良好的迭代特性,這是KNN分類器不具備的。
圖6 識別準確率隨迭代次數(shù)變化趨勢Fig.6 The trend of the identification accuracy when iterations added
對各算法組合的聚類結果進行后續(xù)驗證,以確保模型診斷的有效性。故障診斷是典型的模式識別問題,可以采用類內距來衡量模式識別的聚類效果[21]。在后續(xù)實驗中, {α1,α2,…,αd}是低維嵌入的投影向量,每類樣本的類內距參數(shù)定義如式(8)
(8)
對實驗一的聚類結果進行類內距驗證,結果如表5所示。從整體來看:KPCA算法的聚類效果最差,尤其對球體故障的聚類效果很不理想。KDA算法較之KPCA算法有了一定的提高,但其正常樣本的類內距仍然較大。LE算法對四類故障的聚類效果較為平均,也比上述兩種算法的聚類效果更好。而本文提出的改進LE算法聚類效果最好,其類內距均小于其他三種算法。
表5 類內距驗證
為進一步驗證改進LE算法的有效性與可靠性,采取五折交叉驗證方法進行如下實驗。分別選擇“3.1”節(jié)與“3.2”節(jié)中的四類軸承故障數(shù)據(jù)組成兩個樣本集,每類故障樣本數(shù)目為100。將每個樣本集打亂后等分為5個不相交的子集,每個子集分別作為測試集,其它為訓練集。實驗結果表明,改進LE算法對軸承故障類型的識別效果良好且結果可靠。
表6 五折交叉驗證
本文基于流形學習的思想,采用半監(jiān)督的方式,提出一種基于改進拉普拉斯特征映射(ILE)算法和約束種子K均值的半監(jiān)督故障識別模型。
(1) 利用LE算法的非線性降維能力,對高維復雜樣本空間進行降維學習,繼而在低維空間上進行樣本分類。同時對LE算法做出了相應的改進,添加置信度因素使得同類標記樣本降維后距離更近,異類標記樣本距離更遠,為約束種子K均值算法提供了質量更高的初始簇中心。
(2) 通過兩組實驗驗證,證明了本文算法在軸承故障類型和滾動體受損程度上都有很高的識別精度。采用類內距對實驗一進行參數(shù)驗證,對比KPCA,KDA,LE算法,證明了改進LE算法有更好的識別效果。
(3) 采用五折交叉驗證方法進一步證明了改進LE算法的有效性與可靠性。因此,與傳統(tǒng)方法相比,本文提出的基于改進LE算法的故障識別模型能更好地表征軸承健康狀態(tài),并明顯提高故障識別性。