董 飛 ,俞 嘯 ,3,丁恩杰 ,吳守鵬
(1.中國礦業(yè)大學信息與控制工程學院,江蘇 徐州 221008;2.中國礦業(yè)大學物聯(lián)網(感知礦山)研究中心,江蘇 徐州 221008;3.徐州醫(yī)科大學醫(yī)學信息學院,江蘇 徐州 221009)
滾動軸承作為旋轉機械設備的關鍵部件之一,其發(fā)生故障會嚴重影響到旋轉機械的安全穩(wěn)定運行[1]。因此,進行滾動軸承的狀態(tài)監(jiān)測與故障診斷對保障安全生產和降低維護成本具有重要意義。近年來,隨著信號處理、數(shù)據(jù)挖掘以及人工智能的快速發(fā)展,基于數(shù)據(jù)驅動的方法在滾動軸承故障診斷中變得越來越重要,其主要可分為四個步驟:信號處理,特征提取,特征降維和故障模式識別[2-3]。
滾動軸承在運行過程中的振動信號蘊含著豐富的狀態(tài)信息,是軸承故障狀態(tài)分析與診斷的有效手段[2]。小波變換是分析非線性、非平穩(wěn)振動信號的有效方法,但是由于小波變換沒有對信號的高頻部分做進一步的分解,容易導致高頻部分故障特征信息的丟失。針對此問題,在小波變換的基礎上,小波包變換被提出,它能進一步分解信號在高頻區(qū)的細節(jié)系數(shù),提供更詳細、更全面的時頻面。文獻[4]將小波包分解及其能量譜用于發(fā)動機連桿軸承故障診斷;文獻[5]將小波包能量特征與徑向基函數(shù)網絡相結合,建立了滾動軸承故障監(jiān)測模型;文獻[6]通過計算小波包提取的信號包絡譜的峰值,增強信號峭度特征,用于微弱瞬時信號的監(jiān)測。
結合小波包變換與統(tǒng)計參數(shù)可得到高維原始特征集。然而,由于故障類型與統(tǒng)計特征之間存在復雜的映射關系,原始特征集中存在干擾和冗余特征,可能會影響故障診斷的準確度。因此,提出一種基于樸素貝葉斯的故障敏感特征選擇方法(Features Selection Based on Naive Bayes,F(xiàn)SNB),實現(xiàn)對原始特征集中單個統(tǒng)計特征的故障敏感度的量化分析,篩選出故障敏感度較高的統(tǒng)計特征進行故障診斷。
在特征降維方面,領域保持嵌入(Neighborhood Preserving Embedding,NPE),是一種非監(jiān)督的線性降維方法,其主要目標是保持數(shù)據(jù)流行中的局部結構。LDA作為一種經典的線性降維方法,其可以將故障的類別信息考慮到特征降維過程中。因此可以結合NPE與LDA各自的優(yōu)點,提出一種改進的特征降維方法,基于類別標簽的監(jiān)督鄰域保持嵌入方法(Supervised Neighborhood Preserving Embedding with Label Information,SNPEL),以此來提高故障診斷的精度與適應性。
在故障模式識別方面,采用KNN方法。KNN是一種經典的非參數(shù)分類方法,在模式識別領域得到了廣泛的應用。文獻[7]利用局部均值分解和KNN實現(xiàn)滾動軸承故障診斷。文獻[8]利用模糊K近鄰支持向量進行數(shù)據(jù)描述,從而實現(xiàn)水電機組振動故障診斷。
首先利用WPT分解振動信號,得到終端節(jié)點的單支重構信號并計算其包絡譜(Hilbert Envelope Spectrum,HES),隨后結合統(tǒng)計參數(shù),可得到原始統(tǒng)計特征集。然后利用樸素貝葉斯方法進行敏感特征的篩選,再利用提出的基于類別標簽的監(jiān)督NPE方法進行特征降維,得到新的特征集并用于訓練KNN分類器。最后,已訓練的分類器用于對測試數(shù)據(jù)進行故障診斷。實驗分析結果表明,該模型可以達到比較理想的滾動軸承故障識別效果。
樸素貝葉斯算法是基于貝葉斯定理的分類方法。根據(jù)已有的樣本數(shù)據(jù)實例,運用貝葉斯公式來判定待測數(shù)據(jù)的歸類問題。貝葉斯算法的主要思想是將事件的先驗概率和后驗概率相聯(lián)系,并利用先驗信息預測事件的后驗概率。樸素貝葉斯算法還具有自學習能力,可以將新數(shù)據(jù)記錄加入到已知的先驗信息中,從而進一步影響事件的后驗概率,提高事件預測的準確性。
貝葉斯公式如下:
式中:P(A|B)—條件B下A的后驗概率;P(A)—A的先驗概率;P(B|A)—條件A下B的后驗概率;P(B)—B的先驗概率。
令訓練樣本為 X={x1,x2,…,xn},每個樣本對應的類別為label(xi)∈C,其中C={c1,c2,…,cm}表示類別集合,T={t1,t2,…,tn}為測試樣本。
樣本T歸屬于類cj的后驗概率為:
式中:P(cj|t1,t2,…,tn)—測試樣本歸入故障類型 cj的后驗概率;P(t1,t2,…,tn|cj)—故障類型 cj的條件概率;式中 P(cj)為故障類型 cj的先驗概率;α=1/P(t1,t2,…,tn),α 為常量。樸素貝葉斯算法根據(jù)式(2)計算出全部類 cj,j=1,2,…,m 的后驗概率,然后將測試樣本中數(shù)據(jù)歸入后驗概率最大的類中。樸素貝葉斯是以各屬性變量間相互獨立的條件為基礎,因此,式(1)中的后驗概率的計算可以變換為:
在訓練樣本中,共有M種故障類型,每種故障類型有N個樣本,每個樣本有K種統(tǒng)計特征。故障敏感特征選擇的目標是從K種統(tǒng)計特征中選擇出對故障類型較為敏感的特征,然后組成新的特征集。對于每種統(tǒng)計特征,利用樸素貝葉斯算法對其樣本進行分類,分類的精度作為衡量其故障敏感程度的指標。
經信號處理和統(tǒng)計參數(shù)計算,可以得到原始特征集[FS1,F(xiàn)S2,…,F(xiàn)SK],其中 FSk如下所示:
圖1 訓練集樣本Saccuracy序列值分布Fig.1 Saccuracy Sequence Distribution of Training Samples
然后,利用樸素貝葉斯算法對每種故障狀態(tài)樣本分別進行分類,得到分類精度Accurac,將 Saccuracy(k)=Accurac作為第k種統(tǒng)計特征對故障敏感程度的衡量指標??梢缘玫揭粋€分類精度和的序列Saccuracy={Saccuracy(1),Saccuracy(2),…,Saccuracy(K)}。最后,對分類精度和的序列進行降序排列。我們認為Saccuracy(k)值越大,說明該統(tǒng)計特征對故障敏感程度越高,更適合用于故障診斷與分類。訓練集樣本Saccuracy序列值分布,如圖1所示。
提出了一種基于類別標簽的監(jiān)督NPE方法,該方法的目標是可以在保持高維數(shù)據(jù)局部幾何結構不變的同時,通過融合LDA的優(yōu)化目標,構建出一個新的優(yōu)化目標函數(shù)。使得在降維過程中考慮了類別標簽信息,獲得判別性較強的低維表示,從而更有利于故障診斷與分類。
令訓練樣本為 X={x1,x2,…,xn},其中 xi∈Rm,n 訓練樣本的個數(shù),m為訓練樣本的維數(shù)。每個樣本對應的類別為label(xi)∈C,其中 C={c1,c2,…,cm}表示類別集合。尋找一個映射矩陣 A={a1,a2,…,ad},其中 ai∈Rm,d 為將訓練樣本進行映射之后的維度,將Rm空間的數(shù)據(jù)映射到一個相對維度較低的特征空間Rd(d≤m)中。數(shù)據(jù)點xi在Rd中的表示為yi,且yi=ATxi。
SNPEL的第一個優(yōu)化目標是保持數(shù)據(jù)集的局部鄰域流行結構不變,構造訓練樣本上的近鄰圖時采用的方法和LLE相同。令xi的近鄰集合為knn(xi),其近鄰圖重構權重系數(shù)矩陣W滿足下面要求[9-10]:
對于非0的權重系數(shù),需要通過最小化重構損失函數(shù)求得:
當W可以在Rm空間中重構出數(shù)據(jù)點xi,那么在Rd空間中也可以重構對應的點yi。所以映射矩陣的求解可以轉換為求解下述最小化問題得到:
SNPEL的第二個優(yōu)化目標是最大化類間散度和最小化類內散度,來獲得判別性較強的低維表示。其中,類間散度矩陣Sb和類內散度矩SW陣定義如下:
式中:cl—第 l類樣本集合;μl—第 l類樣本均值;μ—所有樣本均值。類間散度矩陣Sb和類內散度矩陣SW的等價形式如下:
式中:Pb=、PW=—權值矩陣;Db、DW—n×n 的對角矩陣,從上式中可以看出和中體現(xiàn)類別的判別信息。于是,SNPEL的第二個優(yōu)化目標可歸結為下面的優(yōu)化問題:
利用式(7)來保持樣本原有的局部幾何結構,利用式(14)和式(15)實現(xiàn)最大化類間散度和最小化類內散度,結合式(7),式(14)和式(15),可得SNPEL的優(yōu)化目標函數(shù)如下:
結合式(10)和式(11),可改寫成跡比優(yōu)化形式:
式中:Z=(I-W)T(I-W),I=diag(1,…,1),對于上式,還需要對分母
進行歸一化,因此優(yōu)化目標函數(shù)最終為:
式中:(DW-PW)nor、Znor—經過歸一化后的矩陣。最終,SNPEL 的目標函數(shù)優(yōu)化問題轉化為下面的廣義特征值求解問題:
其中,L=(DW-PW)nor,S=(DW-PW)nor+Znor。假設是式(19)特征值λ0≥λ1≥…≥λM所對應的特征向量,則用于降維的映射矩陣由前 d 個特征向量組成,即 A={a1,a2,…,ad}。因此,給定 xi∈Rm,可以得到其相應的映射變換 yi∈Rd:xi→yi=ATxi。
圖2 故障診斷方法系統(tǒng)結構示意圖Fig.2 System Structure of the Fault Diagnosis Method
所提出的故障診斷方法系統(tǒng)結構,如圖2所示。整個故障診斷過程分為四個步驟:信號處理,特征提取,特征降維和故障模式識別。在第一步中,原始振動信號經WPT處理,得到終端節(jié)點的單支重構信號并計算包絡譜,結合統(tǒng)計參數(shù),得到原始特征集;第二步中,將原始特征集經過基于樸素貝葉斯的故障敏感特征選取方法處理,得到故障敏感特征。第三步中,對于訓練樣本的高維特征集,利用SNPEL方法,得到低維特征集,并作為分類器的輸入,同時還得到降維映射矩陣,直接用于測試樣本的高維特征集降維。第四步中,將從訓練樣本中得到的低維特征集用于訓練分類器,訓練好的分類器直接運用于測試樣本的故障診斷。
使用美國凱斯西儲大學滾動軸承數(shù)據(jù)中心的軸承振動數(shù)據(jù),驅動端采用型號為6205-2RS JEM SKF的深溝球軸承,故障類型有滾珠故障、內圈故障和外圈故障,故障尺寸有0.007英寸,0.014英寸,0.021英寸和0.028英寸。電機的工作負載范圍是(0~3)hp,對應轉速為1730到1797r/min。正常情況在內的12種故障模式,如表1所示。從每種故障模式中提取60個振動信號樣本,每個樣本包含2000個連續(xù)的數(shù)據(jù)點。由于滾動軸承在實際工作環(huán)境中,其負載是變化的,處于變工況狀態(tài)。因此為了驗證提出故障診斷算法在變工況狀態(tài)下的有效性和適應性,設計了四個驗證案例。有兩組對比實驗,每組中均是采用一種電機負載的樣本做訓練集,不同電機負載的樣本做測試集。其中,案例1和案例2均采用2hp樣本作為訓練集,案例1使用2hp的樣本為測試集,案例2使用3hp的樣本為測試集。案例3和案例4也是類似的對比實驗,其不同在于采用3hp的樣本作為訓練集。
表2 統(tǒng)計參數(shù)Tab.2 Statistical Parameters
利用WPT處理原始振動信號,在實驗中,選用“db5”小波,經四層小波包分解得到的16個終端節(jié)點信號的單支重構信號,再分別計算出其希爾伯特包絡譜,結合表2所示的6個統(tǒng)計參數(shù),可以得到96個時域統(tǒng)計特征和96個包絡譜統(tǒng)計特征,共192個統(tǒng)計特征,構成原始特征集(OriginalFeatures Set,OFS)。利用FSNB方法計算得到的訓練集樣本Saccuracy序列值分布,如圖1所示。說明不同的統(tǒng)計特征對于故障敏感程度不同,我們可以基于此選擇出故障敏感度高的特征子集用于故障診斷,如表1、表2所示。
表1 實驗中使用的振動數(shù)據(jù)集Tab.1 The Used Vibration Dataset in Experiments
分別對 OFS-KNN、OFS-FSNB-PCA-KNN、OFS-FSNBLDA-KNN和OFS-FSNB-SNPEL-KNN故障模型開展實驗分析。這五個模型均是基于KNN的故障診斷模型,OFS-KNN是原始特征集(OFS)直接用于訓練KNN。其余模型是首先將原始特征集進過FSNB敏感特征選擇之后,將敏感特征分別使用PCA、LDA和SNPEL降維處理,結果用于訓練KNN,最后將訓練好的模型用于對測試樣本進行故障診斷。四個案例所對應實驗結果,每一個子圖中是四種故障分析模型的精度曲線,橫軸表示所選取的敏感特征數(shù),縱軸是故障診斷的精度,如圖3所示。
圖3 四個故障診斷模型的實驗結果Fig.3 Experimental Results of Four Fault Diagnosis Models
實驗中PCA的降維大小為15,LDA的降維大小為11,SNPEL的降維大小為20。從圖中可以看出,對于案例1和案例3,sfn在一定的范圍內,四種故障分析模型均表現(xiàn)出較好的性能。對于案例2和案例4,sfn在一個較寬的范圍內,OFS-FSNBSNPEL-KNN 表現(xiàn)出更好的性能,例如,sfn在(60~110)時,故障診斷的精度均可達到95%以上。因此,實驗結果表明所提出的故障敏感特征選擇方法FSNB與改進的降維方法SNPEL對于變工況下的滾動軸承故障診斷具有良好的效果與適應性,可應用于智能故障診斷系統(tǒng)。
在對WPT、樸素貝葉斯以及NPE的研究基礎上,提出一種基于樸素貝葉斯的故障敏感特征選擇方法和監(jiān)督NPE的特征降維方法,建立OFS-FSNB-SNPEL-KNN故障診斷模型,同時還設置了其他三種故障診斷模型(OFS-KNN,OFS-FSNB-PCA-KNN,和OFS-FSNB-LDA-KNN),實驗分析結果表明:
(1)提出的FSNB方法,可以從時頻分析得到的原始統(tǒng)計特征集中提取出故障狀態(tài)敏感的特征分量,可以有效提高后續(xù)故障識別準確率;
(2)提出的SNPEL方法,可以實現(xiàn)降維過程中,既保持數(shù)據(jù)間集合結構不變,也最大化類間散度和最小化類內散度,從而得到更有利于故障診斷與分類的特征空間;
(3)對于OFS-FSNB-SNPEL-KNN故障診斷模型,選擇合適故障敏感特征數(shù)量,可以獲取較高的滾動軸承故障診斷識別率。