趙 云,宿 磊,李 可,顧杰斐,盧立新
(1.江南大學 江蘇省食品先進制造裝備技術重點實驗室,江蘇 無錫214122;2.江南大學 機械工程學院,江蘇 無錫214122)
滾動軸承作為機械設備中應用廣泛且容易出現(xiàn)故障的核心部件,對機械的運轉有著至關重要的意義。提取滾動軸承振動信號故障特征頻率能有效實現(xiàn)其故障檢測,但滾動軸承多數(shù)工作在強噪聲環(huán)境下,故障信號時常淹沒于噪聲中導致振動信號信噪比較低,難以有效區(qū)分某些頻率特征,當滾動軸承發(fā)生故障時對所采集到的非平穩(wěn)非線性信號進行特征提取十分困難。
迄今為止,已有多種特征提取方法實用于滾動軸承并取得了良好效果。在傳統(tǒng)分析方法中,基于信號平均值的時域參數(shù)分析、頻域分析以及倒譜分析等在故障診斷中被普遍使用。為提高故障診斷的準確性,眾多時頻域方法應時而生,譬如小波分析、稀疏分解等方法受到了廣泛關注。吳雅朋等[1]利用小波分析與基于負熵的獨立分量分析實現(xiàn)滾動軸承含噪振動信號處理。張晗等[2]將稀疏分解逐級匹配形態(tài)分析方法用于航空發(fā)動機軸承故障信號中諧波和沖擊成分的分離。然而,小波變換由于小波基函數(shù)的有效選擇較為困難;稀疏分解雖具備較強分解能力但存在過度依賴原子庫的選取且計算復雜度較高,對于多種復合故障類型的定性分析能力也較弱。以上方法對于復雜非平穩(wěn)非線性特性振動信號的處理顯得力有不逮,因而愈來愈多非線性分析方法應運而生,如關聯(lián)維數(shù)、近似熵以及排列熵等。排列熵(Permutation entropy,PE)用于檢測一維時間序列單個尺度下的隨機性和復雜度[3],抗噪能力強且算法簡單,但較難獲取表現(xiàn)于其他尺度中的信息。為衡量時間序列多個尺度下復雜性變化,Aziz等[4]提出了多尺度排列熵并得到廣泛應用。王余奎等[5]提出一種衡量MPE變化趨勢的偏均值指標,對液壓泵信號的分析驗證了該指標的優(yōu)良性。陳哲等[6]利用MPE算法對艦船輻射噪聲進行分類識別,效率明顯高于采用的其他特征提取算法。董治麟等[7]使用復合多尺度排列熵表征軸承故障信息,該方法優(yōu)化了MPE的粗粒化過程。陳東寧等[8]以變分模態(tài)分解各模態(tài)分量MPE的均值為特征向量并采用GK模糊聚類使?jié)L動軸承故障達到了較優(yōu)的分類性能。
MPE 算法具有許多優(yōu)點但容易受其參數(shù)的影響,參數(shù)設置不合理將使計算結果產(chǎn)生較大誤差。在重構相空間過程中,時間延遲與嵌入維數(shù)兩參數(shù)有單獨與聯(lián)合確定兩種觀點。在重構相空間過程中單獨確定時間延遲與嵌入維數(shù)兩參數(shù)的方法存在計算量大等缺點[9]。進行有限數(shù)據(jù)長度時間序列分析時無法預知序列是否具有非線性特征,而嵌入維數(shù)與時間延遲之間不可避免可能存在相關的關系。Kim等[10]提出的關聯(lián)積分法能實現(xiàn)對時間延遲與嵌入窗的同時估計,計算量遠小于參數(shù)單獨確定的方式。鄭近德等[11]提出一種基于MPE 與支持向量機的故障診斷方法,對排列熵參數(shù)選取進行分析,通過計算高斯白噪聲在限定時間序列長度不同維度下排列熵的差值大小決定最終數(shù)據(jù)長度值。
滾動軸承故障診斷的關鍵在于模式識別。極限學習機(Extreme learning machine,ELM)相比于支持向量機與BP神經(jīng)網(wǎng)絡等方法,具備更強的學習和泛化能力,但輸入權值與閾值的隨機初始化可能會導致模型不穩(wěn)定[12]。Huang[13]提出的核極限學習機KELM 通過引用核函數(shù)使核映射代替了隨機映射,算法的分類與泛化能力明顯增強。敦泊森等[14]使用螢火蟲算法對KELM進行參數(shù)優(yōu)化。楊錫運等[15]利用粒子群算法優(yōu)化KELM 輸出權值,所得模型能準確高效地實現(xiàn)對風電功率的區(qū)間預測。
綜合以上分析,本文在前人理論研究的基礎上提出基于參數(shù)優(yōu)化MPE 與KELM 相結合的故障診斷方法。首先使用關聯(lián)積分法優(yōu)化MPE 參數(shù)中的嵌入維數(shù)與時間延遲,確定MPE 的最優(yōu)參數(shù),實現(xiàn)滾動軸承故障特征提取。為提高故障診斷效率,利用KELM 算法對滾動軸承振動信號進行分類識別。通過實驗驗證了優(yōu)化參數(shù)后的MPE 算法具有更好的故障特征提取能力,與KELM 相結合能有效實現(xiàn)軸承的故障診斷。
當信號的非線性越強時,信號的規(guī)則性隨之減弱,復雜程度卻逐步升高。信號復雜性越大通常所對應的排列熵也會增大,MPE從多個尺度表征時間序列的復雜度特征,以下為具體計算方法。
對一維時間序列X={xi,i=1,2,…,N}進行粗?;玫讲煌叨鹊淖有蛄校?/p>
式中:N是時間序列長度;s為尺度因子,s=1,2,…,s=1時上述序列表示原始序列,[N/s]表示取整。
以合適的時間延遲τ與嵌入維數(shù)m進行相空間重構:
式中:l表示重構矩陣Y(s)l中對應的第l個重構分量,l=1,2,…,N-(m-1)τ;對重構分量中各元素依照公式(3)進行升序排列得到表示各重構分量元素所在列的索引j1,j2,…,jm。
顯然,對于任意的重構分量可得到符號序列D(r)=(j1,j2,…,jm),r=1,2,…,R且R≤m!,統(tǒng)計出現(xiàn)的概率Pr(r=1,2,…,R),定義多尺度下子序列的排列熵:
當Pr=1/m!時,Hp(m)取得最大值ln(m!),對其進行歸一化處理:
因此,0 ≤Hp≤1,若Hp越小,時間序列越規(guī)則,否則越接近隨機[16]。
計算MPE的過程中,參數(shù)值的選取和設定對結果影響較大。m太小使重構序列包含狀態(tài)過少,難以有效檢測序列動力學突變[17]。m取值太大則會直接影響計算效率,無法反映序列微弱變化。s決定時間序列粗?;潭龋≈颠^小致使無法有效提取故障特征,s過大則難以區(qū)分信號之間的復雜度差異。N與τ也會對計算結果產(chǎn)生影響,因此,對MPE的參數(shù)進行優(yōu)化選擇使得能夠更加有利于提取滾動軸承的故障特征信息尤其重要。
對于時間序列{xi,i=1,2,…,N}重構相空間中的點Xi,定義嵌入時間序列的關聯(lián)積分方程為:
其中:r為參考半徑且r>0,τ為時間延遲,m是嵌入維數(shù),M=N-(m-1)τ,θ(a)為階躍函數(shù),如下式所示:
關聯(lián)積分為相空間中任意點對間距離小于r的點對數(shù)量占點對總數(shù)的比例,以矢量之差的無窮范數(shù)表示點之間的距離。將{xi,i=1,2,…,N}分成τ個不相交的序列,計算檢驗統(tǒng)計量:
采用分塊平均策略定義子序列為:
當N→∞上式寫作:
若相空間點獨立分布且滿足條件N→∞,對于任意r值S(m,r,τ)=0,然而真實數(shù)據(jù)長度有限且各序列存在相關關系,則使得S(m,r,τ)≠0。最優(yōu)時間延遲τd取S(m,r,τ)首次經(jīng)過零點或者對所有r變化最小的點,此時的點接近均勻分布。定義r的最大偏差變量為:
當N≥500 時,取m=2,3,4,5,ri=iσ/2,σ為時間序列標準差,i=1,2,3,4。計算以下統(tǒng)計量:
通常確定(τ)的首個零點或者(τ)的第一極小值為最佳時間延遲,Scor(τ)最小值對應橫坐標為最佳嵌入窗寬τω,由下列公式得到:
ELM算法源自單隱含層前饋神經(jīng)網(wǎng)絡,以xi和yi表示結構網(wǎng)絡的輸入與輸出,輸入層、隱含層、輸出層的神經(jīng)元數(shù)目分別為n、l和m。bi是隱含層神經(jīng)元的閾值,輸入層與隱含層、隱含層和輸出層之間的連接權值對應為ωi和βi。
假設對于樣本容量為Q的訓練集(xi,ti),其中xi∈Rn,ti∈Rm,T為期望輸出,以g(x)表示隱含層神經(jīng)元激活函數(shù),則輸出表達式:
當前饋神經(jīng)網(wǎng)絡以零誤差逼近于Q個樣本時,,簡化得到:
其中:H表示為隱含層輸出矩陣,詳細表達式為:
在求解偽逆矩陣H+=HT(HHT)-1時,HHT常表現(xiàn)出非奇異。引入懲罰系數(shù)C,使HHT特征根偏離零值,其中I為對角矩陣,求得最終權值:
得到ELM的輸出模型:
其中:h(xi)為隱含層輸出,xi為Q的第i個樣本。
為提高ELM模型泛化能力,引入核函數(shù)將輸入樣本映射到高維特征空間,以解決低維線性不可分的問題[13]。用核矩陣代替ELM的隨機矩陣:
由式(19)、式(20)和式(21)計算得到KELM 的輸出:
本文選擇的高斯核函數(shù)表達式如下:
本文以MPE作為特征參量,首先使用關聯(lián)積分法優(yōu)化選取MPE的嵌入維數(shù)與時間延遲,將優(yōu)化后的參數(shù)設置為MPE的參數(shù),計算滾動軸承正常和故障狀態(tài)下的多尺度排列熵值。最后根據(jù)所得的多尺度排列熵提取特征向量,選取部分樣本為訓練樣本,其他作為待識別的測試樣本,以此實現(xiàn)滾動軸承的故障分類識別。如圖1所示。該圖為基于MPEKELM方法的故障診斷過程。
圖1 MPE-KELM故障診斷系統(tǒng)流程
為驗證本文方法的有效性,采用如圖2所示實驗平臺采集到的滾動軸承振動信號進行驗證。
圖2 滾動軸承故障診斷實驗平臺
如圖3所示。采用線切割加工技術在滾動軸承上布置細微傷痕模擬各自對應的故障類型。故障直徑為0.3 mm,深度為0.05 mm,通過磁鐵吸盤將接觸式HD-YD-221 型加速度傳感器吸附在被測量的機械裝備上,采集各狀態(tài)的加速度振動信號,采樣頻率設定為50 kHz,轉速為1 000 r/min。
圖3 滾動軸承故障類型
如圖4所示,NO、OF、IF、RF分別表示滾動軸承正常、外圈故障、內(nèi)圈故障以及滾動體故障振動信號時域波形。
圖4 滾動軸承振動信號時域圖
計算各狀態(tài)振動信號排列熵需要選定相關參數(shù),其中參數(shù)m對結果的影響較大。Bandt 等[3]建議m取3~7,嵌入維數(shù)m決定相空間的維數(shù),選取太小會影響算法檢測突變性能的能力,選取過大直接降低計算效率。時間序列長度N通常應滿足N≥5m![18],才能得到有效的計算結果,尺度因子s的最大取值通常大于10。時間延遲τ對排列熵值計算結果影響較小。因此,選取一組如下經(jīng)驗參數(shù)[19](m=6,τ=1,s=12,N=2 048),用EMPE 表示在該參數(shù)下滾動軸承正常與各種故障狀態(tài)下的排列熵值,如圖5所示。滾動軸承各種狀態(tài)下的復雜度不同,從圖中可看出各種故障狀態(tài)下的排列熵值波動強度也不相同,但由于環(huán)境噪聲干擾使得各狀態(tài)下特征值區(qū)分度不明顯,各狀態(tài)下某些尺度排列熵值相差不大,不能有效區(qū)分特征。因此直接將經(jīng)驗參數(shù)設定為MPE 的參數(shù)難以有效提取滾動軸承的故障特征。
圖5 使用經(jīng)驗參數(shù)計算的排列熵EMPE
采用關聯(lián)積分法對排列熵的嵌入維數(shù)m和時間延遲τ進行優(yōu)化,然后在得到最優(yōu)參數(shù)的基礎上計算正常振動信號各尺度下的排列熵。利用關聯(lián)積分法聯(lián)合確定m與τ的規(guī)則,設置計算過程中最大時間延遲τ=100,得出Sˉ(τ)、ΔSˉ(τ)和Scor(τ)與τ的關系如圖6(a)所示。ΔSˉ(τ)第一極小值確定的延遲時間穩(wěn)定性更強[3],因此本文以此確定最優(yōu)延遲時間。圖6(a)中(τ)第一極小值對應的最佳延遲時間τ=4,Scor(τ)最小值對應的τ為最佳嵌入窗寬τω=22,由公式(15)可求得嵌入維數(shù)m=6。同理,使用關聯(lián)積分法計算其他故障狀態(tài)下對應的優(yōu)化后m與τ。圖6中C-CNO,C-COF,C-CIF,C-CRF分別表示滾動軸承正常、外圈故障、內(nèi)圈故障與滾動體故障振動信號計算所得的(τ)(τ)和Scor(τ)的變化曲線。為減小在參數(shù)優(yōu)化時所產(chǎn)生的不穩(wěn)定性誤差,通過10次運算取整得到參數(shù)的平均值,具體優(yōu)化后的參數(shù)m與τ如表1所示。
圖6 各狀態(tài)下(τ)、(τ)和Scor(τ)的變化曲線
表1 關聯(lián)積分法優(yōu)化后參數(shù)m和τ
設定正常與各種故障狀態(tài)下優(yōu)化后的參數(shù)為MPE 的參數(shù),計算優(yōu)化后各尺度下的PE 值,以CMPE表示圖7優(yōu)化后計算所得的排列熵。
將圖7與圖5對比可以明顯看出,在描述多尺度信號的復雜度時,經(jīng)由參數(shù)優(yōu)化后計算所得到的排列熵可以更好地區(qū)分滾動軸承的故障類型,無交叉混疊現(xiàn)象。尺度因子s的增大會使排列熵值總體呈下降趨勢,由此表明粗粒度序列的復雜度和隨機性將隨著s增加而逐漸降低。計算結果具有更強的穩(wěn)定性。
圖7 關聯(lián)積分法優(yōu)化參數(shù)m和τ后的排列熵CMPE
以參數(shù)優(yōu)化后多尺度排列熵的值作為特征參量,結合KELM算法對滾動軸承故障進行分類識別。由于各狀態(tài)下的排列熵在前幾個尺度已表征出信號的主要信息特征,因此選取滾動軸承4種狀態(tài)下前8個尺度的PE 值[11],以T表示對應的特征向量,即T=(PE1,PE2,PE3,PE4,PE5,PE6,PE7,PE8)。同時,計算滾動軸承各狀態(tài)振動信號時域統(tǒng)計量波形指標、峰值指標、脈沖指標、裕度指標、偏斜度指標以及峭度指標組成特征向量T2。每種狀態(tài)計算120 組樣本數(shù)據(jù),以標簽1表示滾動軸承正常振動信號,標簽2~4分別對應外圈故障、內(nèi)圈故障和滾動體故障振動信號。選定前60組特征向量數(shù)據(jù)為訓練樣本,利用后60組數(shù)據(jù)對訓練模型進行測試。得到采用經(jīng)驗參數(shù)與優(yōu)化參數(shù)進行多尺度排列熵特征提取、時域統(tǒng)計量特征提取后結合KELM進行故障識別3種方法的診斷結果,以EMPE-KELM、CMPE-KELM與TD-KELM分別表示所得分類診斷結果。
如圖8至圖10所示,符號“●”與“ ”兩者的中心重合則說明識別故障類型結果與實際滾動軸承狀態(tài)一致,兩者分離則表示識別結果與實際情況不符,最終診斷結果如表2所示。由于滾動軸承幾種故障振動信號的復雜度差異較小,導致正常狀態(tài)的排列熵值與故障狀態(tài)區(qū)別不顯著,正常狀態(tài)下樣本也被錯分到其他類別中。表2中由于滾動軸承各狀態(tài)時域統(tǒng)計特征指標相近導致其診斷率相比前面兩種方法較低,TD-KELM方法故障診斷正確率僅89.58%,由此表明多尺度排列熵特征提取能力強于時域指標統(tǒng)計分析。
圖10 TD-KELM測試樣本故障分類結果
由圖8和表2可知,EMPE-KELM 方法中標簽2與標簽3相互錯分明顯,圖5中使用經(jīng)驗參數(shù)計算所得兩種故障狀態(tài)下的排列熵值接近。因此使用KELM 進行故障分類時容易導致標簽誤判,EMPEKELM 方法的故障識別正確率為93.33%。經(jīng)過參數(shù)優(yōu)化后計算得到的排列熵具有較強的區(qū)分性,CMPE-KELM 方法中僅有標簽3 中的4 個樣本被錯分到第1 類,其余外圈與滾動體故障樣本均被完全識別,故障識別正確率為97.50%。因此,利用關聯(lián)積分法優(yōu)化MPE 參數(shù)進行特征提取后使用KELM方法具有更好的診斷效果。使用CMPE-KELM 對滾動軸承故障診斷的正確率大于EMPE-KELM診斷的正確率,說明CMPE-KELM 相比于EMPE-KELM故障診斷準確性更高。
表2 故障分類結果
圖8 EMPE-KELM測試樣本故障分類結果
圖9 CMPE-KELM測試樣本故障分類結果
為驗證KELM 故障分類的高效性,對比分析在相同特征提取條件下幾種不同分類方法的最終識別率,得到表3與圖11 所示結果,圖中TD、EMPE、CMPE分別表示使用時域統(tǒng)計特征、經(jīng)驗參數(shù)MPE,優(yōu)化參數(shù)MPE 進行特征提取,SVM、PNN、ELM、KELM分別表示使用支持向量機、概率神經(jīng)網(wǎng)絡、極限學習機、核極限學習機的故障分類方法,SVM 方法中核函數(shù)類型為高斯核函數(shù),懲罰因子C與核函數(shù)參數(shù)σ通過交叉驗證的方法確定。圖中方法所得診斷率均取10 次平均值。
表3 故障診斷正確率/(%)
圖11 測試樣本故障分類結果
對比圖中同一種分類方法,基于復雜度的非線性特征提取方法診斷率高于時域統(tǒng)計特征方法,其故障特征提取能力更強。其中,CMPE 相比于EMPE進行特征提取效率更高,再次說明改進優(yōu)化參數(shù)后特征提取能力更強。對比同一種特征提取方法,以KELM 作為分類器的方法具有最高的診斷率,以此說明KELM分類的有效性。
本文采用關聯(lián)積分法對MPE 中嵌入維數(shù)與時間延遲兩個參數(shù)進行優(yōu)化,將經(jīng)過參數(shù)優(yōu)化后的多尺度排列熵應用于滾動軸承故障特征的提取,采用SVM、PNN、ELM、KELM 方法對具有多種故障類型的滾動軸承故障信號進行模式識別。對比以TD、EMPE 為特征的分析方法,通過分析滾動軸承實驗平臺采集到得正常與各種故障狀態(tài)下的數(shù)據(jù),試驗結果表明基于復雜度的MPE 方法相比傳統(tǒng)時域統(tǒng)計方法能更有效實現(xiàn)特征提取。參數(shù)優(yōu)化后的MPE 與KELM 相結合的滾動軸承故障診斷精度高于采用經(jīng)驗參數(shù)計算所得結果。
當前排列熵時間序列長度的有效確定較為困難,相關研究甚少,多數(shù)情況下仍然依靠經(jīng)驗選擇。為進一步減少人為因素對排列熵參數(shù)選取的干擾,下一步將對排列熵時間序列長度進行優(yōu)化。