楊 宇 潘海洋 李 杰 程軍圣
湖南大學汽車車身先進設計制造國家重點實驗室,長沙,410082
滾動軸承故障診斷實質上是一個模式識別的過程。而對于模式識別來說,其重點在于分類器的設計,分類器設計的好壞直接影響分類的結果。針對滾動軸承的故障診斷問題,已經(jīng)有各種不同的分類器。
目前常用且已成熟的故障診斷分類器有神經(jīng)網(wǎng)絡和支持向量機等,但神經(jīng)網(wǎng)絡分類器具有一些缺陷,如網(wǎng)絡訓練速度慢、局部極小點和過學習,且非常依賴于經(jīng)驗和先驗知識[1];隨后出現(xiàn)的支持向量機分類器雖然用途較廣,但也存在一些難以解決的缺陷,如需要嚴格的核函數(shù)和參數(shù)調整[2],而這些主觀因素對分類結果有非常大的影響。尤為重要的是,這兩種分類器都沒有考慮所提取的特征值之間的內在變量關系。然而,在機械故障診斷中,特征值之間或多或少具有一定的內在關系,而且這種特征值之間的內在關系在不同的系統(tǒng)或類別(相同的系統(tǒng)在不同的工況下)間具有顯著的不同。
基于特征值之間的這種內在關系,Raghuraj等[3]提出了一種新的模式識別方法——基于多變量預測模型的模式識別(variable predictive mode based class discriminate,VPMCD)方法,該方法的實質就是通過特征值之間的相互內在關系建立數(shù)學模型并完成分類。其中預測模型的建立是VPMCD分類器的核心部分,VPMCD模式識別方法采用4種回歸模型建立預測模型,對于特征值較為規(guī)則的,其模型具有一定的實用性。但當特征值之間的關系較為復雜時,用這4種模型建立預測模型,會出現(xiàn)局部偏差,這樣很難準確建立接近真實模型的近似模型,以至于所建立的VPMCD分類器分類精度達不到要求。
Kriging模型是一種估計方差最小的無偏估計模型[4-6]。Kriging模型由回歸模型和相關模型組合而成,通過Kriging模型中的回歸模型和相關模型隨機組合,最終可以建立若干真實模型的近似模型,它們之間不同的組合建模將對結果產(chǎn)生很大影響[7],從不同的組合模型中選出最理想的一個組合作為最佳預測模型,進而能充分反映特征值之間的關系,建立有效的分類器。
本文將Kriging模型引入機械故障診斷中,把Kriging模型應用于VPMCD中建立模型,從而建立基于Kriging模型的VPMCD分類器。即將Kriging模型應用于VPMCD方法中,得到基于Kriging的多變量預測模型(Kriging variable predictive mode based class discriminate,KVPMCD)模式識別方法。該方法首先采用Kriging模型中的回歸模型和相關模型依次組合建立VPM數(shù)學模型,再以最小誤差平方和最小為依據(jù),建立KVPMCD的預測模型,從而建立KVPMCD分類器以用于分類識別。
在機械故障診斷中,提取p個不同的特征值X= (X1,X2,…,Xp)來描述一個故障類別,由于特征值之間存在內在關系,因此,在不同的故障類別中,X1會受到其他特征值的影響而產(chǎn)生不同的變化,在此類問題中,特征值之間可能存在一對一的關系:X1=f(X2);或者一對多的關系:X1=f(X2,X3,…)。為了識別系統(tǒng)的故障模式,需建立數(shù)學模型。VPMCD方法中,為特征值Xi定義的變量預測模型VPMi為一個線性或者非線性的回歸模型,文獻[3]中提出了4種數(shù)學模型。以p個特征值為例,對4種模型中任意一個模型采用特征值Xj(j≠i)對Xi進行預測,都可以得到
其中,特征值Xi稱為被預測變量;Xj(j≠i)稱為預測變量;e為預測誤差;b0、bj、bjj和bjk為模型參數(shù)。式(1)稱為特征值Xi的變量預測模型VPMi。
VPMCD的本質是利用特征值之間的內在關系,然后調用已存在的4種回歸模型建立反映特征值之間真實關系的近似模型,但當特征值之間的關系比較復雜時,由于4種模型的條件限制,所建立的模型可能不能充分反映特征值之間的內在聯(lián)系,因此,本文將Kriging模型應用于VPMCD中得到KVPMCD,Kriging模型中存在3種回歸模型和6種相關模型,它們之間相互組合可以建立18種模型,其中的回歸模型類似于VPMCD中的模型,構建了預測模型的主結構,6種相關模型則進行輔助,使得所建立的模型更加逼真,從而可以建立反映特征值之間復雜關系的KVPMCD模型,其KVPMCD模式識別方法步驟如下:
(1)對于g類分類問題,共收集n個訓練樣本,每一類樣本數(shù)分別為n1,n2,…,ng。對所有訓練樣本提取特征量X= (X1,X2,…,Xp),每一類樣本特征量的規(guī)模大小分別為n1×p,n2×p,…,ng×p。
(2)選擇第k(k=1,2,…,g)類訓練樣本的特征量Xj(i=1,2,…,p)作為被預測變量,選擇剩下的p-1個特征量Xj(j≠i)作為預測變量。
(3)令回歸模型類型m=1(Zero order polynomial、One order polynomial、Two order polynomial 3種模型分別用數(shù)值1、2、3標記),相關模型的類別r=1(Exponential、Generalized exponential、Gaussian、Linear、Spherical、Cubic spline 6種模型分別用數(shù)值1、2、3、4、5、6標記),建立一個數(shù)學模型。
(4)先后分別令r←r+1和m←m+1,直至r=R,m=M結束。預測變量的組合方式共有M×R種可能,因此對于特征量Xi可建立nk=M×R個數(shù)學方程。
(5)對于每一個特征量Xi建立的nk個方程,然后把第k類訓練樣本的特征量進行回代,利用Kriging模型得到特征量Xi的預測值Xipred。
(7)令k←k+1,循環(huán)步驟(3)~ (7)直至k=g結束。至此,在回歸模型類型為m和相關模型類型為r的情況下,g個類別的所有特征量都分別建立了變量預測模型VPM(k)i,其中k=1,2,…,g表示不同類別,i=1,2,…,p表示不同特征量。這些變量預測模型構成一個大小為g×p的VPM矩陣。
(8)將所有訓練樣本作為測試樣本分別對每一個VPM矩陣進行回代分類測試,選擇分類正確率最高的VPM矩陣所對應的回歸模型類型和相關模型類型作為最佳變量預測模型的類型。至此,各種類別下的所有特征量的最佳變量預測模型的類型、預測變量都得以確定。
(9)選擇測試樣本,并提取其特征值X=(X1,X2,…,Xp)。對于測試樣本的所有特征值Xi(i=1,2,…,p),分別采用變量預測模型對其進行預測,得到預測值。
對于滾動軸承的故障診斷,特征提取是其中的關鍵環(huán)節(jié),只有選擇合適的特征才能準確區(qū)分滾動軸承的工作狀態(tài)和故障類型。用來描述系統(tǒng)非線性特性的參數(shù)較多,復雜度相對較為簡單;峭度和模糊熵也常用來處理非線性問題;最大李雅普諾夫指數(shù)可用來分析信號的復雜程度。因此,本文采用組合的方法,即提取信號的復雜度、峭度、模糊熵[8]和最大李雅普諾夫指數(shù)。它們之間可相互補充、相互印證,更有利于識別故障信號,增強可靠性。但這些指標對噪聲較為敏感,為了降低噪聲的影響,本文結合局部特征尺度分解(local characteristic scale decomposition,LCD)[9]方法,采用LCD降噪來獲取降噪后的重構信號。
本文采用對原信號進行LCD分解后重構獲得降噪后的信號,首先采用LCD得到N個內稟尺度分量(intrinsic scale component,ISC)信號。對每一個ISC求其與原信號的互相關性,得到相關系數(shù)值。由于白噪聲信號與任何信號都不相關,原信號中包含的噪聲信號畢竟很少,而且噪聲信號在分解過程中進行了強迫對稱分解,已不再是白噪聲,所以它與原信號的互相關值接近于零。本文根據(jù)經(jīng)驗設定兩個閾值,單分量ISC信號與原信號相關系數(shù)值大于閾值的區(qū)間,則被判定為有用分量,予以保留下來;相關系數(shù)值在閾值區(qū)間之內的被判定為偽分量,進一步判定;相關系數(shù)值小于閾值區(qū)間的被判定為噪聲分量,直接剔除。然后進一步對偽分量進行自相關分析,如果自相關系數(shù)只在零點處取得較大值,其余皆很小,則可判定為噪聲分量,否則判定為有用分量。最后把判定為有用分量的進行重構,以實現(xiàn)降噪。此方法為簡單的降噪方法,目的就是得到含有噪聲較少的信號,使得對提取的特征影響較小。
基于KVPMCD的滾動軸承故障診斷方法步驟如下:
(1)在一定轉速下以采樣率fs對滾動軸承正常、內圈故障、外圈故障和滾動體故障4種狀態(tài)進行采樣,每種狀態(tài)采集N組樣本。
(2)利用LCD降噪方法對原始振動信號進行分解降噪,得到降低噪聲的重構信號。對重構信號分別提取復雜度、峭度、模糊熵、最大李亞譜諾夫指數(shù)作為特征值,組成特征值向量,每種狀態(tài)下得到N×i階的特征值矩陣。
(3)每種狀態(tài)取M個樣本作為訓練樣本,通過KVPMCD訓練,建立預測模型
(4)剩下的作為測試樣本,用訓練好的數(shù)學預測模型對測試樣本進行分類,根據(jù)KVPMCD分類器的輸出結果來確定滾動軸承的工作狀態(tài)和故障類型。
UCI標準數(shù)據(jù)[10]是公認的驗證數(shù)據(jù),因此,為了驗證KVPMCD方法的適用性,本文采用UCI標準數(shù)據(jù)進行測試,選取UCI標準數(shù)據(jù)中l(wèi)iver數(shù)據(jù)和pima數(shù)據(jù)兩類進行試驗。其中,liver數(shù)據(jù)包含6個特征值,兩種狀態(tài);pima數(shù)據(jù)包含8個特征值,兩種狀態(tài)。首先分別任意選取liver數(shù)據(jù)和pima數(shù)據(jù)中的60組作為訓練樣本,任意選取40組作為測試樣本。然后使用支持向量機、RBF神經(jīng)網(wǎng)絡、VPMCD和KVPMCD對訓練樣本進行訓練。經(jīng)過優(yōu)化選擇,所取RBF神經(jīng)網(wǎng)絡訓練誤差的平方和都為0.01;liver數(shù)據(jù)和pima數(shù)據(jù)的支持向量機折衷系數(shù)取1,核函數(shù)都采用RBF核函數(shù);對于KVPMCD的相關模型參數(shù)theta,此處采用對訓練樣本進行交叉驗證,通過比較識別率,選取theta=0.15。最后通過4種分類器對測試樣本進行分類,其分類結果如圖1所示。
圖1 兩類UCI標準數(shù)據(jù)樣本在4種分類器下的識別率
從圖1中可知,盡管4種類分類器對liver數(shù)據(jù)和pima數(shù)據(jù)的分類識別率不是特別高,但KVPMCD還是顯示其優(yōu)越性,尤其是對liver數(shù)據(jù),相對于其他3種分類器,識別率有較大的提高。
為了驗證KVPMCD在機械故障診斷中的應用,本文采用美國凱斯西儲大學電氣工程實驗室的滾動軸承數(shù)據(jù)[11],滾動軸承選用型號為6205-2RS型的深溝球軸承,轉速為1772r/min,采樣頻率為48 000Hz,故障直徑是0.018mm,故障深度是0.028mm,電機負載為0.746kW。機械設備運行時,其部件滾動軸承有可能會出現(xiàn)內圈故障、外圈故障或滾動體故障。因此,選取軸承正常、內圈故障、外圈故障和滾動體故障4類狀態(tài)下的振動信號各100組數(shù)據(jù)。隨機抽取其中的50組數(shù)據(jù)為訓練樣本,其余50組數(shù)據(jù)為測試樣本。內圈故障下的滾動軸承振動信號如圖2所示。
圖2 內圈故障狀態(tài)下滾動軸承振動信號時域波形
首先對信號進行LCD降噪處理,得到重構信號,然后提取重構信號的復雜度、峭度、模糊熵和最大李雅普諾夫指數(shù)作為特征值,對于復雜度和峭度,則直接提取特征值,模糊熵需要設置參數(shù),如相似容限r(nóng)、指數(shù)函數(shù)邊界梯度n和維數(shù)m,經(jīng)過優(yōu)化選擇[8],取r=0.2,n=2,m=2,最大李雅普諾夫指數(shù)選用wolf法[12]。提取特征值后,再進行模式識別。把訓練樣本分別通過VPMCD和KVPMCD訓練,得到預測模型。對于KVPMCD的建模需要設置相關模型參數(shù)theta,本文采用訓練樣本交叉驗證的方法得到相關模型參數(shù)theta,把訓練樣本分為5組,然后進行交叉驗證,其驗證結果如圖3所示。
圖3 各相關參數(shù)在交叉檢驗法下得到的識別率
通過圖3可知,當theta的取值大于0.23時,其交叉驗證識別率保持為100%,因此本文取theta=0.23。為了比較VPMCD方法和KVPMCD方法在各種檢驗法下的識別精度,本文分別采用 Re-substitution(簡稱 RS)檢驗法、K-fold cross-validation(簡稱 K-CV)檢驗法和Jack-knife(簡稱JK)檢驗法進行驗證,其中Re-substitution檢驗法能驗證算法的自相容性,K-CV交叉檢驗法常用來測試算法的準確性,Jack-knife(簡稱JK)檢驗法是較為客觀和嚴格的交叉檢驗法,是目前公認最好的交叉檢驗方法,能反映算法的推廣能力。采用3種檢驗法分別對VPMCD和KVPMCD的性能進行檢驗,其中采用RS檢驗法檢驗所有數(shù)據(jù)的自相容性;K-CV交叉檢驗法用來檢驗測試樣本的識別率;JK交叉檢驗法用來檢驗訓練樣本的識別率。另外引入的Kappa系數(shù)是一種計算分類精度的方法,其值越大,則表示分類效果越好。檢驗結果如表1所示。
表1 3種檢驗法下的VPMCD和KVPMCD分類性能對比
表1顯示了2種分類方法在3種檢驗法下的識別率和Kappa系數(shù)。通過測試,KVPMCD具有更高的自相容性和分類準確性,因此,在兩類檢驗法下,KVPMCD無論是總識別率還是Kappa系數(shù),均優(yōu)于VPMCD方法。
另外,從識別精度方面來說明KVPMCD更加優(yōu)越,參數(shù)不變,每種狀態(tài)取50個樣本訓練,50個樣本測試。首先通過訓練樣本建立4種狀態(tài)的預測模型;然后把測試樣本代入所建立的預測模型,求出每個樣本特征值在各個預測模型下的估計值;接著求出每個樣本在4種預測模型下的預測誤差平方和,由于不同預測模型下得到的最小誤差平方和數(shù)量級相差過大,因此,對得到的誤差平方和求對數(shù),如圖4和圖5所示,顯示了部分樣本在4種預測模型下的預測誤差平方和對數(shù)值;最后比較每個樣本在4種預測模型下得到的預測誤差平方和,以最小預測誤差平方和為依據(jù)進行分類。
圖4 VPMCD在滾動軸承各種狀態(tài)下的識別精度
由圖4可知,測試信號為正常信號時,在正常信號預測模型下得到的預測誤差平方和與另外3種預測模型下得到的預測誤差平方和相差較大,易判別;測試信號為內圈故障時,在內圈故障預測模型下得到的預測誤差平方和與在滾動體故障預測模型下得到的預測誤差平方和相差很小,幾度出現(xiàn)交叉,致使出現(xiàn)錯誤分類;測試樣本為外圈故障或者滾動體故障時,其效果也不是很好,因此,VPMCD雖然整體識別率較好,但識別精度并不是很好,容易出現(xiàn)錯分。圖5是KVPMCD的識別精度圖,整體看,4種狀態(tài)的預測誤差平方和區(qū)分特別明顯,沒有出現(xiàn)錯分現(xiàn)象。因此,從兩個圖中可以得出,KVPMCD比VPMCD有更高的識別精度。
圖5 KVPMCD在滾動軸承各種狀態(tài)下的識別精度
綜上所述,通過對VPMCD和KVPMCD分類器的檢驗,無論用UCI標準數(shù)據(jù)還是滾動軸承數(shù)據(jù),以及無論用何種檢驗法識別率還是識別精度,都證明了KVPMCD方法能建立更加接近真實模型的近似模型,從而可以更加準確對樣本的進行分類。
(1)對所提取的特征值進行組合,即提取信號的復雜度、峭度、模糊熵和Lyapunov指數(shù),它們各有不足,因此通過組合,使得它們相互補充,相互印證,更有利于診斷。
(2)VPMCD的預測模型建立,不受主觀因素的影響,而在神經(jīng)網(wǎng)絡分類器和支持向量機分類器中。它們的結構、類型、參數(shù)及核函數(shù)選擇往往都非常依賴于經(jīng)驗或先驗知識。同理,KVPMCD類似于VPMCD,只需要設置“相關模型”中的相關函數(shù)參數(shù),其設置較為廣泛,不需要太依賴先驗知識,因此,KVPMCD模式識別方法受主觀因素的影響較少,所得分類結果較為客觀。
(3)把Kriging模型應用于VPMCD中得到KVPMCD,VPMCD中4種回歸模型對于特征值之間的內在關系較為復雜時,很難準確建立預測模型,KVPMCD中采用以回歸模型為主題,相關模型輔助,從而建立更加真實地預測模型。
(4)對UCI標準數(shù)據(jù)中的兩類數(shù)據(jù)若干狀態(tài)和滾動軸承4種狀態(tài)的信號的分析結果表明,Kriging模型和VPMCD相結合的KVPMCD可以有效的應用于模式識別,也證實其適用性,在對滾動軸承的試驗中,該方法可以準確、有效地對滾動軸承的工作狀態(tài)和故障類型進行分類,從而為滾動軸承的故障診斷提供了一種新的方法。
[1] Wang Huaqing,Chen Peng.Intelligent Diagnosis Method for Rolling Element Bearing Faults Using Possibility Theory and Neural Network[J].Computer &Industrial Engineering,2011,60(4):511-518.
[2] Fei Shengwei,Zhang Xiaobin.Fault Diagnosis of Power Transformer Based on Support Vector Machine with Genetic Algorithm[J].Expert Systems with Applications,2009,36(8):11352-11357.
[3] Raghuraj R,Lakshminarayanan S.Variable Predictive Models-a New Multivariate Classification Approach for Pattern Recognition Applications[J].Pattern Recognition,2009,42(1):7-16.
[4] Cressie N.The Origins of Kriging[J].Mathematical Geology,1990,22(3):239-252.
[5] Gou Peng,Liu Wei,Cui Weicheng.A Comparison of Approximation Methods for Multidisciplinary Design Optimization of Ship Structures[J].Journal of Ship Mechanics,2007,11(6):913-923.
[6] 張仁鐸.空間變異理論及應用[M].北京:地質出版社,2005.
[7] Rana M,Andreas P.An Empirical Comparison of Kriging Methods for Nonlinear Spatial Point Prediction[J].Mathematical Geology,2002,34(4):365-386.
[8] Chen Weiting,Wang Zhizhong,Xie Hongbo,et al.Characterization of Surface EMG Signal Based on Fuzzy Entropy[J].IEEE Transaction on Neural Systems and Rehabilitation Engineering,2007,15(2):267-272.
[9] 程軍圣,鄭近德,楊宇.一種新的非平穩(wěn)信號分析方法——局部特征尺度分解[J].振動工程學報,2012,25(2):215-220.Cheng Junsheng,Zheng Jinde,Yang Yu.A Nonstationary Signal Analysis Approach-the Local Characteristic-scale Decomposition Method[J].Journal of Vibration Engineering,2012,25(2):215-22.
[10] Frank A,Asuncion A.UCI Machine Learning Repository[EB/OL].(2010-05-03).http://archive.ics.uci.edu/ml.
[11] Case Western Reserve University Bearing Data Center.Bearing Data Center Fault Test Data[EB/OL].(2009-10-01).http://www.eecs.case.edu/laboratory/bearing.
[12] Wolf A,Swift J,Swinney H,et al.Detemining lyapunov Exponents from a Time Series[J].Physica D:Nonlinear Phenomena,1985,16(3):285-317.