楊 帥, 郝如江
(石家莊鐵道大學(xué) 機(jī)械工程學(xué)院,河北 石家莊 050043)
高鐵軸承是高鐵的重要部件之一,對于高鐵安全穩(wěn)定運(yùn)行起著決定性作用[1]。由于軸承運(yùn)行狀態(tài)的很多相關(guān)信息都可以在軸承振動信號中得以體現(xiàn),因此在軸承故障診斷方法中,振動信號分析法是最常用也是最有效的方法。CEEMDAN算法[2]是一種信號的自適應(yīng)分解算法,能夠有效改善其他分解算法中存在的模態(tài)混疊現(xiàn)象[3-4],并且重構(gòu)誤差較小,完備性較好。在信號處理和分析方面,特征提取是一種常用的技術(shù)手段,近些年來,排列熵、樣本熵、奇異值等無量綱參數(shù)被引入機(jī)械設(shè)備振動信號的特征提取之中,給機(jī)械故障診斷提供了更多的方法和思路。劉珍珍等[5]利用多尺度排列熵算法,成功地對軸承故障樣本進(jìn)行了特征分類;別峰峰等[6]利用奇異值作為特征提取方式,對往復(fù)泵的振動信號樣本進(jìn)行了特征提?。粡垖幍萚7]則利用樣本熵作為特征提取手段,進(jìn)行了行星齒輪箱故障診斷研究。支持向量機(jī)[8]是一種分類算法,可以用于不同類型信號的分類和識別,且其對小樣本數(shù)據(jù)的支持性較好,運(yùn)行效率也比較高。狼群優(yōu)化算法是一種新型的啟發(fā)式參數(shù)尋優(yōu)算法,因為能夠進(jìn)行全局尋優(yōu),且收斂速度快、尋優(yōu)精度高而被廣泛應(yīng)用于各種領(lǐng)域,周同樂等[9]利用狼群算法來輔助生成無人機(jī)攻防策略數(shù)學(xué)模型,成功提高攻防策略的作戰(zhàn)效能并降低了行動代價;蔣一鋤[10]則利用狼群算法來優(yōu)化圖書館借閱數(shù)據(jù)聚類模型的初始參數(shù)值,并成功提高了聚類精度。本次實(shí)驗以高鐵軸承不同故障狀態(tài)下的振動信號作為實(shí)驗對象,并將振動信號分解后提取出的各階分量的樣本熵特征值作為樣本和測試數(shù)據(jù),利用SVM進(jìn)行高鐵軸承故障的診斷。結(jié)果表明,此方法能有效進(jìn)行高鐵軸承的故障分類,準(zhǔn)確率也較高。
CEEMDAN算法是對EMD算法的一種改進(jìn),通過添加自適應(yīng)噪聲來輔助分解,使得分解結(jié)果能夠在一定程度上改善模態(tài)混疊現(xiàn)象,并且信號重構(gòu)的完備性較好,誤差也比較小[11],下面簡述CEEMDAN分解算法的原理。
(1)
S1(t)=S(t)-IMF1(t)
(2)
(2)定義一種新的計算方式Ek(·),其含義為任意信號經(jīng)過EMD分解后得到的第k個分量。在剩余信號S1(t)中加入噪聲再次構(gòu)造新的信號S1(t)=S1(t)+a1E1[ni(t)],再對其進(jìn)行一階段的EMD分解,將獲得的多個第一階段的本征模態(tài)分量再次集合平均,得到最終的第二階本征模態(tài)分量IMF2(t),計算方法如式(3)所示,得到剩余信號S2(t),計算方法如式(4)所示。
(3)
S2(t)=S1(t)-IMF2(t)
(4)
(3)按照上文中的規(guī)則可以一直計算下去,直到最后的剩余信號不滿足再次分解所需要的條件,分解結(jié)束,信號經(jīng)過分解后得到多個本征模態(tài)分量和剩余信號,其結(jié)果的表達(dá)形式為
(5)
樣本熵[12]是評價信號混亂程度的一種方式,計算簡單,不依賴于數(shù)據(jù)長度,且對于噪聲等干擾條件的抵抗能力較強(qiáng),能有效表征不同信號在時間序列上的復(fù)雜性。下面簡述其計算方式。
(1)首先,對于任意一個時間序列x={x1,x2,x3,…,xn},構(gòu)造一個形式如式(6)的新的M維的X(i),其中i的取值范圍是{1,2,n-M+1},n是原始信號的數(shù)據(jù)長度,M是預(yù)先設(shè)定的模式維數(shù),新數(shù)據(jù)的含義是原始信號從第i個點(diǎn)開始截取的M個連續(xù)的信號數(shù)值。
XM(i)={x(i),x(i+1),…,x(i+M-1)}
(6)
(2)定義向量XM(i)和XM(j)之間的距離為D,其計算方式為2個不同向量之間相對應(yīng)的元素差值的絕對值的最大者,即D{XM(i),XM(j)}=Max{∣x(i+q)-x(j+q)∣},其中,q的取值范圍為{1,2,…,M-1}。
(3)根據(jù)事先確定的閾值R,統(tǒng)計距離D小于R的個體數(shù)目,記為Bi,其中,1≤i≤N-M,計算出其在總個數(shù)N-M中所占的比值,記為Bi(R)=Bi/(N-M-1),對于所有的Bi(R)按照式(7)取其算術(shù)平均值,記為B(R)。
(7)
(4)將模式維數(shù)設(shè)定為M+1維,再次重復(fù)以上步驟,可以計算出M+1維度下新的B(R)值,將其記為A(R),那么對于含有有限個點(diǎn)的數(shù)據(jù)x而言,其樣本熵便定義為SampEn(x)=-ln[A(R)/B(R)]。樣本熵的計算需要設(shè)定模式維度M和閾值R2個參數(shù),一般情況下,M的取值為1或者2,而閾值的取值可以落在0.1~0.2倍原始信號標(biāo)準(zhǔn)差這個區(qū)間范圍內(nèi),在這樣的前提下,計算結(jié)果比較準(zhǔn)確合理。
灰狼優(yōu)化算法是模擬自然界中狼群狩獵捕食行為的一種啟發(fā)式優(yōu)化算法,它按照自然界中狼群等級將種群分為α、β、δ、ω4種等級,其中α狼的等級最高,又被稱為頭狼,它負(fù)責(zé)統(tǒng)領(lǐng)并協(xié)調(diào)其他狼,為種群的領(lǐng)導(dǎo)者,其他3種狼受頭狼的指揮,整個尋優(yōu)計算過程就是狼群之間相互配合不斷接近直到最終捕捉獵物的自然行為。它的主要過程如下:
(1)包圍。這一步代表的是狼群搜索獵物并接近獵物的行為,數(shù)據(jù)的更新規(guī)則如式(8)所示,其中的t表示當(dāng)前的迭代次數(shù),A和C是協(xié)同系數(shù)向量,Xp代表獵物位置,X(t)表示灰狼位置,2個r是[0,1]之間的隨機(jī)向量。
(8)
(2)狩獵。這一步模型假定α、β、δ3匹狼識別潛在獵物的能力較強(qiáng),因此可以保留最優(yōu)的3匹狼的位置信息來更新其他搜索代理的位置,更新規(guī)則如式(9)所示,其中Xα、Xβ、Xδ表示當(dāng)前3匹狼的位置信息,X表示灰狼的位置信息,D表示當(dāng)前候選灰狼和最優(yōu)3匹狼之間的距離。
(9)
(3)攻擊。這一步便是狼群捕食的最后一步,也就是算法得到最優(yōu)解的過程,其中α頭狼所代表的數(shù)據(jù)結(jié)果便是尋找的最優(yōu)解結(jié)果。
本次實(shí)驗采用東方所振動信號采集儀(INV3018A)以及DASP軟件來采集鐵路軸承綜合性能實(shí)驗臺的數(shù)據(jù),其中采樣頻率設(shè)定為51 200 Hz,驅(qū)動電機(jī)轉(zhuǎn)速為1 200 r/min,不添加外部荷載。實(shí)驗所用的軸承為實(shí)驗室的高鐵輪對軸承,其外徑長度為240 mm,內(nèi)徑長度為130 mm,節(jié)徑長度為185 mm,采用人為加工缺陷來模擬不同部位的軸承故障,故障尺寸長寬深分別為5、1、0.7 mm。分別采集正常軸承、內(nèi)圈故障軸承和外圈故障軸承3種狀態(tài)下的高鐵軸承振動信號,傳感器為振動加速度傳感器,型號為PCB35A26。本次實(shí)驗一共采用了360組數(shù)據(jù),其中的150組用作訓(xùn)練數(shù)據(jù),其余210組用作測試數(shù)據(jù)。具體的實(shí)驗方案及流程設(shè)計如下:
(1)采集不同類型的振動信號,并將每一個信號樣本作為原始數(shù)據(jù)輸入CEEMDAN分解算法進(jìn)行自適應(yīng)分解,分解過程中輔助白噪聲的幅值設(shè)定為原始信號標(biāo)準(zhǔn)差的0.2倍,保存分解結(jié)果。
(2)計算每一組分解后獲得的本征模態(tài)分量的樣本熵特征值,其中模式維度設(shè)定為2,并將結(jié)果作為SVM模型的訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù)。
(3)將訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)進(jìn)行預(yù)處理,例如歸一化操作等,利用訓(xùn)練數(shù)據(jù)創(chuàng)建SVM的模型,其中的參數(shù)懲罰因子C和核函數(shù)參數(shù)G采用狼群算法進(jìn)行優(yōu)化,創(chuàng)建完模型后利用測試數(shù)據(jù)來測試模型,利用訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)進(jìn)行SVM模型的故障診斷實(shí)驗,記錄分類效果,統(tǒng)計分類的正確率,評價故障診斷模型的效果。模型的創(chuàng)建、訓(xùn)練和識別的流程如圖1所示。
圖1 故障診斷實(shí)驗流程圖
(1)啟動鐵路軸承測試實(shí)驗臺的設(shè)備和DASP采集系統(tǒng),從實(shí)驗臺中分別采集正常軸承、內(nèi)圈故障軸承、外圈故障軸承3種不同狀態(tài)下的軸承振動信號,典型的3種不同狀態(tài)的振動信號如圖2所示。從3種信號的時域波形圖中無法有效分辨3種信號的差異,需要提取更加深層次的信息。
圖2 軸承振動信號時域波形圖
(2)將不同狀態(tài)的振動信號進(jìn)行CEEMDAN自適應(yīng)分解,從中挑選任意3種不同信號分解后獲得的分量的時域波形圖進(jìn)行展示,限于篇幅,只展示了其前5階段的本征模態(tài)分量,其分解結(jié)果如圖3~圖5所示,觀察信號模態(tài)分量的時域圖仍然難以明確分辨3種信號分量之間的具體差異。
圖3 正常軸承信號CEEMDAN分解圖
圖4 內(nèi)圈故障信號CEEMDAN分解圖
圖5 外圈故障信號CEEMDAN分解圖
(3)分別計算任意3組數(shù)據(jù)的樣本熵特征參數(shù)值,其結(jié)果如圖6所示。從圖6中不難發(fā)現(xiàn),在圖中黑色豎線標(biāo)記的左側(cè),三者的特征值的數(shù)值都在0.5以上,并且三者有著較為明顯的差距,而在豎線右側(cè),特征值小于0.5,且三者的特征值差別不大,無法有效代表不同類型信號之間的差異,因此,為使樣本的特征值數(shù)據(jù)有最好的識別和區(qū)分度,本次實(shí)驗選擇3種信號分解后提取出的前5階樣本熵特征參數(shù)值數(shù)據(jù)作為SVM模型的訓(xùn)練和識別數(shù)據(jù)。
圖6 樣本熵特征參數(shù)值對比圖
(4)對所有采集到的不同故障狀態(tài)下的軸承振動信號分別進(jìn)行以上的CEEMDAN分解和計算特征值的操作,其部分特征值如表1的內(nèi)容所示。將得到的150組訓(xùn)練樣本和210組測試樣本先后輸入支持向量機(jī)SVM中,訓(xùn)練模型時,正常信號的標(biāo)簽被設(shè)定為1,內(nèi)圈故障軸承信號的標(biāo)簽設(shè)定為2,外圈故障軸承信號的標(biāo)簽設(shè)定為3。訓(xùn)練所采用的參數(shù)C和G利用灰狼優(yōu)化算法來確定,在灰狼算法的計算下,可以得到優(yōu)化后的參數(shù)值。在實(shí)驗中,狼群的種群規(guī)模設(shè)定為20,最大的進(jìn)化迭代次數(shù)設(shè)定為25,優(yōu)化參數(shù)數(shù)量設(shè)定為2個,取值范圍限定于[0.01,100]區(qū)間范圍內(nèi),經(jīng)過計算,優(yōu)化后的懲罰因子C的值為70.93,核函數(shù)參量G的值為9.91。將以上訓(xùn)練數(shù)據(jù)和優(yōu)化結(jié)果錄入SVM進(jìn)行模型的創(chuàng)建,在創(chuàng)建完模型后,采用相同的標(biāo)簽設(shè)定規(guī)則對測試數(shù)據(jù)進(jìn)行標(biāo)簽設(shè)定,而后再將其輸入SVM進(jìn)行分類,SVM的識別結(jié)果如圖7所示。采用相同的實(shí)驗數(shù)據(jù),利用未優(yōu)化參數(shù)的SVM模型進(jìn)行了對比實(shí)驗,標(biāo)簽設(shè)定與SVM模型設(shè)定方式相同,其中2個參數(shù)仍在[0,100]范圍內(nèi)取值。本次實(shí)驗進(jìn)行了2次人為取值,取值分別為[80,60]和[90,80],采用與上文相同的實(shí)驗方法進(jìn)行故障識別,其識別結(jié)果如圖8所示。
表1 部分實(shí)驗數(shù)據(jù)表
圖7 優(yōu)化后的GWOSVM計算結(jié)果圖
圖8 未優(yōu)化的SVM計算結(jié)果圖
(5)具體的計算結(jié)果數(shù)據(jù)匯總于表格2中。由表2中數(shù)據(jù)可以看出,在GWO優(yōu)化的SVM模型下,其中正常信號和外圈故障信號全部識別正確,內(nèi)圈故障信號只有一個樣本被錯誤識別成了外圈故障樣本,總體的正確率可以到達(dá)比較高的99.52%。在第一次未優(yōu)化參數(shù)的實(shí)驗中,正常信號數(shù)據(jù)中有3個被誤判為外圈故障信號數(shù)據(jù),內(nèi)圈故障信號數(shù)據(jù)中有5個被誤判為外圈故障信號數(shù)據(jù),整體的正確率為96.19%;在第二次未優(yōu)化參數(shù)的實(shí)驗中,正常信號數(shù)據(jù)中有7個被誤判為外圈故障信號數(shù)據(jù),內(nèi)圈故障信號數(shù)據(jù)中有7個被誤判為外圈故障信號數(shù)據(jù),整體的正確率為93.33%,2次模型分類的準(zhǔn)確率均比參數(shù)優(yōu)化后的模型分類的準(zhǔn)確率要低。由以上數(shù)據(jù)可以得出,GWO優(yōu)化后的SVM取得了較高的識別正確率,并且由于GWO算法可以根據(jù)實(shí)際的數(shù)據(jù)來自動確定參數(shù),無需人工設(shè)定,讓實(shí)驗流程更加科學(xué)合理;未優(yōu)化參數(shù)的SVM模型的識別正確率較低,說明人為選定參數(shù)可能會對識別結(jié)果產(chǎn)生影響,也增大了故障診斷過程中潛在的人為經(jīng)驗誤差。
表2 分類識別結(jié)果
總結(jié)出一種基于CEEMDAN和SampEn特征參數(shù)和GWOSVM的高鐵軸承故障診斷方法,并利用實(shí)際采集的高鐵軸承振動信號進(jìn)行了模型可行性測試實(shí)驗。實(shí)驗結(jié)果表明,對于高鐵軸承不同故障類型振動信號的識別和分類,此模型是有效的,且能取得較好的分類結(jié)果,GWO算法的加入讓參數(shù)的設(shè)定更加科學(xué),避免了人為操作帶來的誤差影響,是一種科學(xué)合理的高鐵軸承故障診斷方案。