王朝兵, 靳福濤, 張 龍, 熊國良, 顏秋宏, 喬 宇
(1.軌道交通基礎設施性能監(jiān)測與保障國家重點實驗室,南昌 330013,E-mail:chaobing@163.com;2.中車戚墅堰機車有限公司,江蘇 常州 213011)
滾動軸承作為現(xiàn)代機械中關鍵的基礎部件,在高鐵和輪船等交通工具中得到了廣泛使用。其工作時若發(fā)生故障,可能會對機械設備造成局部損傷、甚至人員傷亡,軸承自身的健康狀況對于機械設備的可靠運行有著重要影響[1]。因此對滾動軸承進行故障診斷、狀態(tài)監(jiān)測對安全生產(chǎn)、工業(yè)發(fā)展具有重要的現(xiàn)實意義。
在對軸承進行故障診斷時,由于振動波形易受到機械噪聲的干擾,如何準確提取出其特征是識別軸承故障類型的基礎。Colominas等[2]于2014年提出改進自適應噪聲完備經(jīng)驗模式分解方法(Improved Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,ICEEMDAN)。該方法能夠去除模態(tài)分量中大部分的殘余量,從而獲得較小的重構誤差,同時消除了模態(tài)混疊等問題,獲得了較好的重構結果[3]。楊洋等[4]提出ICEEMDAN與多尺度樣本熵的心音特征,結合邏輯回歸模型用于左室舒張功能障礙識別。隨著ICEEMDAN逐漸應用到故障診斷的降噪處理中,Ziming Kou等[5]應用ICEEMDAN能量熵與SVM相結合,有效改善了礦井提升機的軸承故障識別率。此外,在各類故障識別方法中,熵值指標因其能反映出振動信號的復雜特性,常被作為特征向量使用。由于實際機車輪對軸承的振動信號往往呈非線性、非平穩(wěn)特點,單一尺度下不能包含完整的故障信息,Costa等[6]在樣本熵的基礎上進行多尺度粗?;倪M,提出了多尺度樣本熵(Multi-scaleper Mutation Entropy, MSE)的概念,反映時間序列在不同尺度下的自相似性和復雜程度,能體現(xiàn)出多個尺度上包含的故障信息。張龍等[7]通過在多個不同時間序列中分別計算它們的樣本熵值,構造出MSE特征向量,實現(xiàn)軸承故障類型的分類。
在軸承的故障識別方面,深度學習[8](Deep Learning,DL)可以從海量的數(shù)據(jù)中提取到關鍵的特征對象,實現(xiàn)“端到端”故障診斷。但深度學習方法均需較大量的樣本數(shù)據(jù)進行訓練[9],對于真實的機車輪對軸承故障識別問題,由于故障樣本量較少,因此在實際工程中表現(xiàn)欠佳。支持向量機(Support Vector Machine,SVM)作為小樣本場景下被廣泛應用的機器學習方法,具有速度快、準確率高的優(yōu)點[10]。然而其分類性能易受到懲罰因子c和核函數(shù)參數(shù)g影響[11],因此有學者將各類優(yōu)化算法用于SVM參數(shù)尋優(yōu)。周建民等[12]使用遺傳算法(GA)優(yōu)化SVM參數(shù),確定參數(shù)最優(yōu)值。趙東升等[13]通過引力搜索算法(GSA)對支持向量機(SVM)的關鍵參數(shù)進行優(yōu)化,構造了BGSA-SVM的分類模型。但上述算法存在易收斂到局部優(yōu)值、尋優(yōu)時間久等問題,難以滿足對真實機車輪對軸承故障診斷的要求[14]?;依撬惴╗15](Grey Wolf Optimization,GWO)涉及參數(shù)少、收斂快、不易陷入局部最優(yōu),易于實現(xiàn),應用在SVM超參數(shù)尋優(yōu)能夠有效提高分類性能。
針對機車輪對軸承不同健康狀態(tài)的分類問題,本文提出ICEEMDAN、MSE相結合的特征提取方法,應用GWO-SVM實現(xiàn)滾動軸承的故障分類。本文實驗使用同組DF4型內燃機車輪對軸承的實際故障數(shù)據(jù),同時與CEEMDAN-MSE+GWO-SVM、ICEEMDAN-MSE-SVM等方法進行比較驗證。
傳統(tǒng)的CEEMDAN方法,是將添加了自適應噪聲的原始信號或殘余分量,在一次迭代中進行EMD分析,并對所得到的IMF信息采用平均處理的手段,得出最后的IMF。ICEEMDAN相比傳統(tǒng)方法,通過利用上一個迭代的殘差值與本次若干個添加了自適應噪聲的信號殘余誤差平均值的差額,得出了這個迭代的IMF分量,使分解后的虛假分量有所降低,進而減少了模態(tài)混疊的現(xiàn)象。
ICEEMDAN算法通過將高斯白噪聲經(jīng)過EMD分解后的第k個IMF分量作為新的特殊噪聲Ek[w(i)],計算其在每個IMF上的局部均值,定義ICEEMDAN分解后的IMF為殘差分量與局部均值的差值,以削減分量上的殘余噪聲。ICEEMDAN算法如下:
(1) 對原始信號x疊加可控噪聲;
x(i)=x+β0E1[w(i)],(i=1,2,…,N)
(1)
式中:x(i)是構造信號;β0是噪聲標準偏差;E1(·)為分解算子;w(i)是添加零均值單位方差的第i個白噪聲。
(2) 計算構造信號x(i)的局部均值,并求其平均值即為殘余分量r1:
(2)
其中:M1(·)為局部均值函數(shù)。
(3)計算第1個模態(tài)(k=1),即原信號x與第1個殘余分量r1之差:
(3)
(4) 計算第k個模態(tài)(k≥2),即上一次計算的殘余誤差rk-1與本次殘余誤差rk的差值:
(4)
(5)
(5) 計算第k=k+1個模態(tài),回到(4),直至滿足迭代終止條件。
樣本熵是能夠表征時間序列復雜性和非線性的測度指標,但其只能從單一尺度上進行熵值的特征計算,無法充分挖掘故障特征的信息。為了彌補該方面的不足,MSE算法被提出,其通過計算出序列于不同尺度上的粗?;Y構,求出各個粗?;蛄械臉颖眷刂礫16],從而表征時間序列在多個尺度下的自相似性和復雜程度,其計算過程如下:
(1) 對時間序列{x(i)}=x(1),x(2),…,x(N),定義粗粒化序列P(τ):
(6)
式中:尺度因子為正整數(shù),即τ=[1,2,…,τmax],粗?;蛄虚L度為原時間序列的1/τ。
(2) 當τ取不同值時,計算P(τ)的SE值,即MSE:
(7)
MSE計算結果受m,r和τ的共同作用。嵌入維數(shù)越大則結果越精確,根據(jù)時間序列的長短,一般取2或3;r決定了模糊函數(shù)的邊界寬度,常取原始信號的0.15倍標準差。在現(xiàn)實應用中,如果τ取值較小,就不能反映原始序列的復雜度;如果τ取值較大,則可能會丟失信息,故本文取最大尺度因子τmax=20。
GWO是一種新型群體尋優(yōu)算法,其尋優(yōu)過程即模擬狼群相互配合、調整狩獵位置,逐步移動靠近、直至捕獲獵物的行為。其過程如下:
(1) 包圍。即模擬狼群搜索并接近獵物的行為,數(shù)學表達如式(8)所示。
(8)
式中:D為灰狼到目標的距離;t為迭代次數(shù);A、C為協(xié)同系數(shù),Xp為目標位置,X(t)為灰狼當前坐標;r1、r2為[0,1]的隨機向量,α是收斂因子,隨t增加而遞減。
(2)狩獵。設α、β、δ3匹狼識別能力較強,故保留其位置信息,更新其他狼的位置,數(shù)學描述為:
(9)
式中:X為灰狼當前位置;Xα、Xβ、Xδ分別為α、β、δ狼的位置信息。
(3) 捕獲。狼群狩獵的最后一步,頭狼α代表的數(shù)據(jù)即為尋優(yōu)結果。
SVM的目標是在輸入特征空間上找到一個最優(yōu)超平面對原樣本盡可能多的進行正確分割,且使每類樣本在該平面上的間距最大,并構成了一個約束二次規(guī)劃問題,通過求解該問題,可以得到分類器[17],因其優(yōu)異的分類性能和可靠性被廣泛用于故障診斷領域。以RBF為核函數(shù)的支持向量機中,徑向基函數(shù)的2個重要參數(shù)懲罰因子c和方差系數(shù)g,它們的取值對SVM的分類性能有著重要影響。
由于GWO算法收斂快、涉參少、全局尋優(yōu)能力強等優(yōu)點,運用該算法對超參數(shù)c和g尋優(yōu),以提高SVM分類精度。圖1為GWO-SVM優(yōu)化流程圖:
(1) 初始化灰狼算法,設置狼群大小P、搜索維度T和最大迭代次數(shù)N等,并生成狼群初始位置,;
(2) 初始化支持向量機參數(shù),以正確率作為適應度函數(shù),設置c、g參數(shù)尋優(yōu)范圍;
(3) 輸入數(shù)據(jù),計算當前適應度值,由式(9)調整狼群位置并更新適應度函數(shù)值;
(4) 判斷循環(huán)條件,迭代次數(shù)≤N時回到(3),否則退出循環(huán),輸出最佳參數(shù)c和g;
(5) 將尋優(yōu)結果參數(shù)c、g帶入訓練SVM模型,保存最佳模型后并在測試集上進行故障分類。
▲圖1 GWO-SVM流程圖
機車輪對軸承產(chǎn)生的故障信號呈強非線性非平穩(wěn)特性,通過對原始信號ICEEMDAN分解,將重構后信號的MSE值作為特征向量,以SVM為分類器進行軸承故障分類與識別。如圖2所示,具體步驟如下:
(1) 采集機車軸承原始故障信號,進行數(shù)據(jù)處理;
(2) 對不同健康狀態(tài)的原始信號進行ICEEMDAN分解得到若干組IMF分量,將大于相關系數(shù)閾值的IMF分量重構;
(3) 對重構后的信號計算MSE值得到特征向量,隨機劃分訓練集和測試數(shù)據(jù)集;
(4) 構建GWO-SVM模型,初始化網(wǎng)絡參數(shù),設置核函數(shù)、懲罰因子等參數(shù);
(5) 通過訓練樣本不斷優(yōu)化模型參數(shù),得到訓練好的診斷模型;
(6) 輸入測試樣本,最后通過分類器輸出得到診斷的結果。
▲圖2 故障診斷流程圖
為驗證所述方法的有效性,本文實驗在某局機務段的JL-501機車軸承試驗臺上完成,如圖3所示。待測軸承安裝在主軸箱上進行旋轉動作;待測軸承通過液壓系統(tǒng)實現(xiàn)進行徑向的壓力加載。電源為380 V,50 Hz三相四線交流電源,電機驅動總功率為5 kW,主軸轉速范圍為120 r/min~1 200 r/min,本次試驗轉速為500 r/min。
▲圖3 JL-501機車軸承檢測臺
本文實驗使用DF4型內燃機車裝配的滾子軸承,型號為NJ2232WB,外徑φ290 mm,內徑為φ160 mm,故障均為列車實際運行產(chǎn)生,實驗前對所有軸承進行了除污處理,以避免對實驗結果的影響。本實驗數(shù)據(jù)通過設置三通道(加速度傳感器A、B、C)對機車輪對軸承進行信號采集,采樣頻率為20 000 Hz。對采集的7種機車軸承類型,并依次編號C1-C7,其中C1為正常軸承數(shù)據(jù),如圖4為每種故障類型所對應的機車軸承。
▲圖4 六種機車輪對軸承故障類型
為避免數(shù)據(jù)集劃分對檢測結果的影響,在每種狀態(tài)下70組樣本中,隨機選取55組共計385組數(shù)據(jù)為訓練樣本,每種類型剩余15組,共計105組數(shù)據(jù)為測試集。設置7種工況的訓練集狀態(tài)標簽依次為1、2、3、4、5、6、7。
表1 故障類型及樣本數(shù)量
試驗采集的7種機車軸承數(shù)據(jù)均來自傳感器B,單個樣本信號包含2 401個數(shù)據(jù)點,共計490個樣本。以軸承外圈中度故障為例,使用ICEEMDAN方法對樣本信號分解,如圖5所示。
▲圖5 軸承外圈中度故障ICEEMDAN分解結果
由圖5可知,ICEEMDAN分解后產(chǎn)生了部分虛假分量,為剔除該部分虛假分量,本文引入相關系數(shù)準則,比較各分量與原始信號之間的相關性大小[12]。根據(jù)皮爾遜相關系數(shù)公式(式10)計算圖5中各IMF分量與軸承外圈中度故障原始信號的相關系數(shù),如圖6所示:
(10)
由式(11)計算軸承不同狀態(tài)下的相關系數(shù)閾值:
(11)
得到樣本信號相關性閾值為μ=0.083 6,若ρxy>0.083 6,則將其對應IMF分量重構;若ρxy<0.083 6,則去除其相應分量。
由圖6,選擇ρxy>0.083 6對應的第1、2、3階IMF作為特征分量進行重構。
▲圖6 ICEEMDAN分解后各IMF分量的互相關系數(shù)
對實驗的滾動軸承7種狀態(tài)下,每種狀態(tài)70組數(shù)據(jù)分別做上述ICEEMDAN分解與閾值重構處理,得到各狀態(tài)下的重構信號。圖7為經(jīng)ICEEMDAN分解后7種不同軸承健康狀態(tài)的重構信號MSE值,可以看出它們熵值變化趨勢大體相同,都隨尺度因子的增加而降低,不同軸承重構信號的MSE值在前幾個尺度上有重疊現(xiàn)象,但從第4個尺度后區(qū)分開始較為明顯,交叉重疊現(xiàn)象減少。
為驗證本文方法,設置對照實驗,將相同的滾動軸承7種狀態(tài)共490組樣本進行CEEMDAN分解與閾值重構處理,得到各狀態(tài)的對照組重構信號。
設置GWO算法參數(shù):P=20,N=100,優(yōu)化參數(shù)數(shù)量為2,CV常數(shù)為5,設置c、g尋優(yōu)范圍為0.01-100。運行GWO算法,計算得到bestc=23.61,bestg=1.45。
分別對ICEEMDAN-MSE方法得到的特征向量與CEEMDAN-MSE方法得到的特征向量,使用未經(jīng)優(yōu)化的SVM分類模型進行識別,某次得到結果分別為圖8(a)、圖8(c)所示;使用相同的上述兩組特征,應用經(jīng)過GWO算法優(yōu)化過的SVM分類模型進行分類,某次識別結果如圖8(b)、圖6(d)所示。滾動軸承7種狀態(tài)的具體識別結果如表2所示。
表2 故障診斷結果
由表2可知,使用同一組前文設定的MSE參數(shù)求取特征向量時,當對信號進行CEEMDAN分解,且對SVM參數(shù)不進行算法優(yōu)化,某次有31組樣本被識別錯誤(如圖8(a)所示),SVM的20次平均識別率為70.43%;在相同參數(shù)設置下,使用GWO算法對SVM超參數(shù)尋優(yōu)后,分類平均識別率提高了22.95%,優(yōu)化后SVM的20次平均識別率為93.38%。使用本文方法即對原始振動信號進行ICEEMDAN分解后,在MSE相同參數(shù)設置下進行故障狀態(tài)識別,應用經(jīng)GWO算法優(yōu)化后的SVM分類模型,20次平均識別率為96.86%,較未優(yōu)化SVM參數(shù)的模型20次平均識別率提高了23.57%,較CEEMDAN-MSE與GWO-SVM結合的方法總體識別率提高了3.48%,不同方法診斷準確率見圖9。
▲圖8 識別結果比較
▲圖9 不同方法診斷準確率
由圖9可知,對真實機車輪對軸承振動信號使用ICEEMDAN分解,能有效改善CEEMDAN方法模態(tài)混疊、殘余分量多等問題,在剔除掉與原始信號相關性小的部分分量后,重構信號故障特征較未處理前更明顯,故準確率得到提高;使用同組設定的MSE參數(shù)得到的特征向量,GWO優(yōu)化SVM超參數(shù)后進行識別時,進一步考慮了其核參數(shù)對分類結果的影響,使得所取懲罰因子c和核參數(shù)g更適應該特征矩陣,故使分類準確度獲得大幅提升。由此表明本文方法在真實機車輪對軸承故障診斷場合下具有更加優(yōu)越的性能。
本文提出將ICEEMDAN、MSE方法與GWO-SVM模型結合,用于機車輪對軸承健康狀態(tài)的分類,并應用真實的機車滾子軸承數(shù)據(jù),驗證了本方法的有效性和優(yōu)越性。
(1) 使用ICEEMDAN方法分解原始信號,根據(jù)相關系數(shù)閾值法剔除相關性較小分量,并對保留的分量進行重構;
(2) MSE能有效表達真實機車輪對軸承振動信號的復雜特性;對SVM的超參數(shù)c、g進行灰狼算法全局尋優(yōu),避免了經(jīng)驗選參對識別結果的影響,有效提高了模型分類性能和自適應性;
(3) 本文所提方法得到各狀態(tài)MSE值組成故障特征向量,經(jīng)驗證平均故障識別準確率為96.86%,與SVM參數(shù)未優(yōu)化以及CEEMDAN分解的MSE值作為特征向量的GWO-SVM識別模型的結果進行對比,分別提高了23.57%、3.48%,且模型運行穩(wěn)定,具備更好的魯棒性,為機務段實際檢測提供了一種有效方法。