鄒劍暉,敖銀輝
(廣東工業(yè)大學 機電工程學院,廣州 510006)
在軸承的故障診斷領域中,基于振動信號分析的方法是目前最有效的方法。其中,利用適用的信號處理方法從振動信號中有效提取故障特征是實現(xiàn)軸承故障診斷的關鍵[1]。Huang等[2]提出了自適應信號處理方法,即經驗模態(tài)分解(EMD)和集合經驗模態(tài)分解(EEMD),但這兩種方法都會受到模態(tài)混疊效應的影響。Yeh等[3]提出了補充集合經驗模態(tài)分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD),該方法完全解決了模態(tài)混疊的問題。熵可以反映信號的復雜程度,通常被用作故障信息的特征參數。Pincus提出了近似熵,Richman等人提出了樣本熵[4],但是這樣的單尺度熵算法在數據處理時經常會得到相互矛盾的結果,后來Costa等[5]提出了多尺度熵(Multiscale Entropy,MSE)的概念。極限學習機(Extreme Learning Machine,ELM)是一類針對單層前饋神經網絡(Single Layer Feedforward neuron Network,SLFN)設計的機器學習算法[6],具有學習能力快,泛化能力強等優(yōu)點[7]。
大量機械零件故障診斷研究領域的文獻使用EEMD和支持向量機或者神經網絡的結合模型。文獻[8]結合EEMD和ELM進行齒輪診斷;文獻[9]提出一種基于EEMD和SVM的識別滾動軸承退化狀態(tài)的方法;文獻[10]利用多尺度熵提取特征。由于SVM在大規(guī)模訓練樣本中的局限性和傳統(tǒng)BP神經網絡易陷入局部極小化等問題,本文提出一種CEEMD多尺度熵和小波核極限學習機(Wavelet Kernel ELM,WKELM)結合的故障診斷方法。
本文將以滾動軸承作為研究對象,針對幾種典型的工作模式如滾動軸承正常工況、外圈故障、內圈故障和滾動體故障,分析相關振動信號數據,利用CEEMD多尺度熵提取特征,采用WKELM模型來對滾動軸承進行故障診斷,相對于傳統(tǒng)的神經網絡等方法提高了診斷準確率。
EMD算法從原信號中提取出若干個固有模態(tài)分量IMF,但會產生模態(tài)混疊。EEMD將白噪聲加入到原始信號當中,有效抑制了模態(tài)混疊,但添加的白噪聲會使得IMF分量重構時產生誤差。
為了解決上述白噪聲干擾且無法完全被中和的問題,CEEMD算法通過給原始信號添加符號相反的白噪聲,分別對兩組信號進行EMD分解,重構誤差得到了明顯減少,添加的白噪聲得到了最大限度地中和。
(3)通過多組分量組合的方式得到分解結果,即CEEMD分解最終得到的IMF分量:
(1)
多尺度熵的實質就是在不同尺度因子下計算給定數據的樣本熵,設原始數據長度為X={x1,x2,…,xN},預先給定相似容量r和嵌入維數m,計算過程如下:
(1)對原始數據X進行粗?;幚?,建立新的粗粒化向量yj(τ)。
(2)求N個粗粒向量的樣本熵,由在尺度τ下的粗?;蛄薪M成m維數矢量Y(i)。
(4)當重構m維數據時,求樣本的平均值相似度Bm。
(5)重復步驟(2)~步驟(4)得到Bm+1(r),則原始信號序列的樣本熵為:
(2)
(6)計算每一個尺度因子序列的樣本熵,則可得到MSE,即MSE(x,τ,m,r)=SampEn(yτ,m,r) 。
結合CEEMD和多尺度熵進行滾動軸承故障特征提取,首先用CEEMD將滾動軸承振動信號分解為多個IMF分量,然后根據相關系數法篩選出5個包含有效信息最多的分量,再計算5個IMF分量的多尺度熵值,構造出五維故障特征向量。多尺度熵值的計算與尺度因子τ、相似容量r和嵌入維數m有關,依據本文數據和以往經驗,尺度因子τ取10,相似容量r取原始信號數據標準差的0.2倍,嵌入維數m取2。
極限學習機是一種單隱層前饋神經網絡SLFN學習算法,相對于傳統(tǒng)神經網絡具有學習速度快,泛化性能好的優(yōu)點。該算法只用設置網絡的隱含層節(jié)點個數和核函數,不需要設置輸入層與隱含層間的連接權值和隱含層神經元的閾值,便可以得到唯一的最優(yōu)解。
極限學習機的數學模型可以表述為:給定任意Q個不同樣本(xi,ti),其中xi∈Rn為輸入樣本,ti∈Rm為輸出樣本,設隱含層神經元個數為L,核函數為g(x),則輸出可表示為:
(3)
上式可簡化成:
Hβ=T′
(4)
其中,wi為輸入層與隱含層的連接權值,bi為隱含層神經元的偏置,βi為輸出權值。
綜上,ELM的學習算法如下:
(1)確定隱含層神經元的數量,隨機設置輸入層神經元和隱含層神經元間的連接權值w和隱含層神經元的偏置b;
(2)選取適當的函數作為隱含層神經元的核函數,并計算出隱含層的輸出矩陣H;
為進一步提高ELM的分類能力,將小波核函數引入ELM。一般的ELM使用的核函數為′sig′(默認)、′sin′和′hardlim′,而基于Morlet小波在數據處理方面的優(yōu)越性,小波核函數可以實現(xiàn)逼近任意函數,泛化能力更強且在非線性分類平面上的效果更佳。
核極限學習機的核函數需要滿足平移不變性定理和Mercer條件,因此本文選用Morlet小波函數h(x)=cos 1.75x·exp (-x2/2),其相應的小波核函數表達式為:
(5)
式中:a為尺度因子。
軸承是重要的旋轉運動部件,其狀態(tài)直接關系著設備的穩(wěn)定運行。軸承失效模式多種多樣,簡單分類有內圈故障、外圈故障和滾動體故障,任何一種故障都會影響軸承正常運轉,進而導致機械設備產生故障,因此制定一種高效的故障診斷方法具有實際意義,基于振動信號的測試分析是軸承故障診斷的主要方法。
本文使用的軸承振動實驗數據來自美國凱斯西儲大學電氣工程實驗室的滾動軸承故障模擬實驗臺所測得的數據,實驗時電機轉速1797 r/min,采樣頻率為12kHz,數據采自驅動端電機上型號為6205 2RS JEM SKF的深溝球軸承,其結構參數如表1 所示。
表1 軸承結構參數
本文首先利用CEEMD分解原始信號,根據包絡譜分析得到故障特征頻率,驗證CEEMD的優(yōu)越性能。然后,利用多尺度熵進行特征向量提取,輸入到小波核極限學習機中訓練和測試。該數據處理過程如圖1所示。
圖1 數據處理過程
以驅動端軸承外圈故障數據為例,截取一段信號進行CEEMD分解,信號分解產生的IMF分量如圖2所示,再對這一段截取信號進行EEMD分解,對比兩次分解過程的箱型圖,如圖3所示。
(a) 原始信號、IMF1和IMF2
(b) IMF3、IMF4和IMF5
(c) IMF6、IMF7和IMF8
(d) IMF9和殘余分量 圖2 軸承外圈故障振動信號及其CEEMD分解結果
(a) EEMD篩選迭代次數
(b) CEEMD篩選迭代次數 圖3 EEMD和CEEMD的篩選迭代次數對比
由圖2可知,CEEMD分解后的IMF按頻率高低排列,振幅依次減弱,各IMF平穩(wěn)且沒有模態(tài)混疊現(xiàn)象。由圖3可知,CEEMD算法迭代的次數僅為EEMD的58.6%,降低了計算成本。
CEEMD分解后利用相關系數法篩選出與原始信號相關性大、包含最多有效信息的IMF分量,重構后做傅里葉變換得到的包絡譜如圖4所示。
圖4 重構信號的包絡譜
由圖4可知,該發(fā)生外圈故障的滾動軸承的特征故障振動頻率為105.5Hz,與理論特征故障振動頻率一致。同時,在圖4中還可以找到它的二倍頻210.9Hz和三倍頻316.4Hz,并且頻率突出,沒有受到噪聲干擾埋沒,因此該CEEMD算法在本次處理的軸承信號數據中是有效的。
根據第1節(jié)理論,輸入到小波核極限學習機的特征向量可以由多尺度熵來構造。因此,首先要選取出可用的特征向量,通過計算各分量與原始信號的相關系數即可篩選出有效IMF分量。
對于該次實驗,本文為4種工況分別構造了115組樣本,每組樣本數據的長度是1024,組合成460×1024的矩陣樣本進行處理。
本文擬在每組數據中篩選出5個最能反映原始信號特點的特征向量,選取第一組樣本數據進行處理,計算4種工況數據的IMF相關系數,如表2所示,列出了前7個IMF的計算結果。
表2 各工況數據的前7個IMF分量的相關系數
由表2可知,正常工況和故障工況數據經過CEEMD分解后,得到的IMF分量與原始信號的相關性由高到低排列,其中前5個IMF與原始信號相關系數較大,可以用來構造特征向量。計算前5個IMF分量的多尺度熵值,如表3所示。
表3 各工況數據的前5個IMF分量的多尺度熵值
根據表3中4種工況數據分解后的IMF分量多尺度熵值,結合經驗可知,各工況下的多尺度熵值基本反映了對應工況的振動特點。
為驗證表3的結果不存在偶然性,每種工況選取32組樣本,各取前3個IMF分量的多尺度熵值,構造CEEMD-多尺度熵特征向量,可視化特征提取結果如圖5所示,圖中不同工況構造的特征向量之間界限清晰,類內聚集性良好,其中正常工況的特征向量與3種故障工況的特征向量分離明顯,因此本方法構造的4種特征向量能夠真實反映其對應工況的信號特點。
圖5 CEEMD-多尺度熵故障特征向量
將得到的特征向量作為輸入特征輸入小波核極限學習機進行分類,從而達到識別輸入特征所屬信號歸于哪類工況的目標。
本文采用交叉實驗的方法,對構造的樣本進行了6次分類識別。其中,樣本總數為340,包括250個訓練集樣本,90個測試集樣本,根據多次實驗總結,設置隱含層神經元個數為100。首先,將正常工況樣本與3種故障工況樣本進行分類識別,每次實驗中,訓練集樣本由170個正常工況樣本和80個故障工況樣本組成,測試集由60個正常工況樣本和30個故障工況樣本組成,其結果如表4所示。
然后,對3種故障工況樣本之間進行相互識別,共3組實驗,結果如表5所示。此次識別中的前兩組實驗用外圈故障樣本取代了表4實驗中正常工況樣本,樣本數目保持不變,命名為主樣本,訓練集和測試集中的少數部分樣本則由內圈故障樣本和滾動體樣本取代,命名為副樣本。表中第3組實驗的主樣本和副樣本則分別是內圈故障樣本和滾動體樣本。
表4 正常工況和故障工況的分類結果
表5 3種故障工況的相互分類結果
根據表4和表5可知,小波核極限學習機在分類準確率上表現(xiàn)優(yōu)異,本文還利用支持向量機和BP神經網絡進行識別,最終效果與本文所用方法對比如表6所示。
表6 小波核極限學習機與其他分類方法的結果比較
本文利用CEEMD多尺度熵和小波核極限學習機結合的診斷方法,對滾動軸承進行故障診斷,具有良好效果。其中,CEEMD算法解決了模態(tài)混疊問題,多尺度熵提取出的特征很好地反映出原始信號的特點,結合小波核極限學習機實現(xiàn)了精確診斷。與SVM和BP神經網絡相比,本文所提出的方法的診斷精度最高,達到97.96%,可以運用在實際滾動軸承故障信號診斷上。