劉 杰,李長杰,趙 昕,譚玉濤
(沈陽工業(yè)大學(xué)機(jī)械工程學(xué)院,遼寧 沈陽 110870)
滾動(dòng)軸承由于所處工作環(huán)境較為復(fù)雜,采集到的信號(hào)數(shù)據(jù)不僅包括了其相對(duì)應(yīng)狀態(tài)的特征,還包括了背景噪音等復(fù)雜環(huán)境噪聲。在滾動(dòng)軸承的故障診斷過程中,特征的提取與選擇成為影響診斷準(zhǔn)確率的重要指標(biāo)。隨著信息處理技術(shù)的發(fā)展,對(duì)滾動(dòng)軸承的信號(hào)特征提取也從單一特征轉(zhuǎn)換為多源域特征的提取。隨著特征維度的增加,后續(xù)故障診斷的計(jì)算量也隨冗余特征增加而增長。因此需要剔除無效特征和冗余特征,以此提升滾動(dòng)軸承故障診斷準(zhǔn)確率。特征融合是采用降維方法結(jié)合相關(guān)分析法對(duì)冗余特征進(jìn)行篩選、剔除,降低特征維數(shù),保留有效特征,降低后續(xù)診斷成本。
文武等[1]采用螢火蟲算法改進(jìn)信息增益的方法,將提取到的特征進(jìn)行增益排序,并對(duì)排序后的特征進(jìn)行最優(yōu)子集篩選。范雪莉等[2]利用互信息計(jì)算變量之間的關(guān)聯(lián)度,再結(jié)合所提的改進(jìn)主成分分析方法,提取出主成分作為優(yōu)化指標(biāo)。姚登舉等[3]采用隨機(jī)森林并結(jié)合診斷準(zhǔn)確率作為特征篩選融合的依據(jù)。歐陽武等[4]采用熵權(quán)模糊綜合評(píng)價(jià)法構(gòu)建多維專家偏好系數(shù)模型,實(shí)現(xiàn)主觀和客觀兩方面評(píng)價(jià)水潤滑尾軸承的優(yōu)劣程度評(píng)估。齊詠生等[5]提出改進(jìn)自適應(yīng)變分模態(tài)分解法結(jié)合主成分分析(Principal Component Analysis,PCA)降維去噪構(gòu)造故障診斷模型庫,實(shí)現(xiàn)對(duì)監(jiān)測信號(hào)的實(shí)時(shí)檢測。Yang 等[6]通過多種聚類分析結(jié)合相關(guān)分析的方法實(shí)現(xiàn)對(duì)軸承數(shù)據(jù)特征的降維及故障分類。Wang等[7]提取故障診斷中常用指標(biāo)如峭度、熵等的數(shù)學(xué)關(guān)系,并將相關(guān)指標(biāo)通過計(jì)算平方包絡(luò)權(quán)重得到標(biāo)準(zhǔn)化后的融合特征。Wei 等[8]提出了一種自適應(yīng)特征篩選方法,通過所提方法實(shí)現(xiàn)對(duì)冗余特征的有效篩選,降低了故障診斷分類的計(jì)算成本。
本文通過提取時(shí)域、頻域、能量及熵多維故障特征,實(shí)現(xiàn)對(duì)故障信號(hào)特征的充分表征。采用LLEEWM 對(duì)所提取信號(hào)進(jìn)行多特征融合,篩選出有效特征集。最后采用GSA 改進(jìn)SVM 的分類方法對(duì)融合特征集進(jìn)行分類診斷,通過凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)集以及實(shí)測信號(hào)兩類數(shù)據(jù)集的案例分析,驗(yàn)證本文方法的有效性及準(zhǔn)確性。
由于時(shí)域分析的簡單性和直接性,廣泛地應(yīng)用于各類滾動(dòng)軸承在線檢測系統(tǒng)之中。通過計(jì)算信號(hào)的簡單統(tǒng)計(jì)特征來分析信號(hào),然后選擇適當(dāng)?shù)奶卣鲄?shù)來準(zhǔn)確地分類不同類型的故障,其中統(tǒng)計(jì)參數(shù)主要分為兩類:有量綱特征、無量綱特征。如表1 所示,其中t1-t8為有量綱特征,t9-t14為無量綱特征。
表1 時(shí)域、頻域特征及對(duì)應(yīng)公式
對(duì)故障軸承的頻域分析有助于監(jiān)測其工作狀態(tài)及發(fā)現(xiàn)振源的具體位置,故障在頻域中會(huì)對(duì)應(yīng)產(chǎn)生相應(yīng)的故障分量。故障分量的振幅變化和是否有新的振動(dòng)頻率的生成,也是故障診斷過程中判斷軸承的工作狀態(tài)和劣化程度的依據(jù)?;陬l域的分析方法可以平滑非平穩(wěn)信號(hào)并反映信號(hào)中的特征信息[9]。本文所采用的頻域特征包括重心頻率、均方頻率、均方根頻率、頻率方差、頻率標(biāo)準(zhǔn)差、幅值譜和功率譜等。其中部分公式如表1 所示。
1.2.1 小波分解
對(duì)信號(hào)通過小波分解及不同頻帶的能量可以反映故障類型的深層信息。在小波分解過程中,會(huì)將信號(hào)分解為高頻和低頻兩部分,其中低頻系數(shù)之間的損失特征可以由高頻表示出來。因此對(duì)信號(hào)高頻部分的分解過程中不會(huì)產(chǎn)生遺漏特征的問題,也不會(huì)產(chǎn)生特征的冗余,可以實(shí)現(xiàn)信號(hào)的局部詳盡分析[10]。對(duì)信號(hào)進(jìn)行小波包分解:
式中:ε(t)為正交尺度函數(shù);φ(t)為正交小波函數(shù);h(n)和l(n)為濾波器系數(shù)。則小波包系數(shù)的遞推公式為:
則得到重構(gòu)公式為:
1.2.2 EEMD 分解
EEMD 集合經(jīng)驗(yàn)?zāi)B(tài)分解是由經(jīng)驗(yàn)?zāi)J椒纸?EMD)發(fā)展而來。EMD 是對(duì)時(shí)間序列信號(hào)進(jìn)行分解得到多個(gè)相對(duì)簡單的固有模態(tài)函數(shù)IMF 分量,由于其具有較強(qiáng)的自適應(yīng)性,因此適用于對(duì)非線性非平穩(wěn)信號(hào)的分析[11]。EEMD 則在EMD 的基礎(chǔ)上避免了模式混合的問題,EEMD 的分解結(jié)果如式(4)所示:
式中:x(t)為原始信號(hào);ui(t)為第i次實(shí)驗(yàn)分解得到的IMF 分量;r(t)為殘差。
1.2.3 熵特征
信息熵是用來度量信號(hào)的不確定性和復(fù)雜程度的特征,即給定變量a,a可能出現(xiàn)的值a∈{a1,a2,…,an},和每個(gè)值出現(xiàn)的概率σ,σ∈{σ1,σ2,…,σn}且=1,則變量a所包含的信息熵為:
信息熵描述的是信號(hào)的復(fù)雜程度,當(dāng)復(fù)雜程度高,其值就越大。當(dāng)變量對(duì)應(yīng)的概率值σ相等時(shí),信息熵達(dá)到最大[12]。
模糊熵是當(dāng)時(shí)間序列變化時(shí),生成新的故障類型的可能性概率,其值隨著序列復(fù)雜度的升高而增加[13]。模糊熵的表達(dá)式如下式所示:
當(dāng)N的長度有限時(shí),代入式中可得:
式中:m為嵌入維數(shù)參數(shù);n為邊界梯度;r為相似容忍限度。
局部線性嵌入算法是對(duì)每個(gè)數(shù)據(jù)點(diǎn)度量與其臨近點(diǎn)的局部關(guān)系,并對(duì)臨近點(diǎn)計(jì)算重構(gòu)權(quán)重,以此實(shí)現(xiàn)最大程度低維表示[14]。具體計(jì)算過程如下:
①對(duì)樣本點(diǎn)的鄰近局部關(guān)系線性重構(gòu)并計(jì)算權(quán)重:
式中:n為樣本總數(shù);樣本x(i)的鄰近樣本量為ι;為樣本x(i)與鄰近樣本之間的權(quán)重系數(shù);wi,j為樣本與第j個(gè)鄰近樣本之間的權(quán)重系數(shù)。
②保持樣本點(diǎn)的鄰近局部關(guān)系,進(jìn)行降維:
式中:Z為維度低于原始特征的降維后特征;z(i)為第i個(gè)樣本降維后的特征。
熵權(quán)法是一種較為客觀的計(jì)算權(quán)重的方法,其值越大說明該數(shù)據(jù)中所包含的信息越多,具體步驟為:
①確定評(píng)價(jià)對(duì)象,構(gòu)造評(píng)價(jià)矩陣(Rij)mn,i=1,…,m;j=1,…,n,其中m為評(píng)價(jià)對(duì)象個(gè)數(shù),n為評(píng)價(jià)指標(biāo)個(gè)數(shù);
②標(biāo)準(zhǔn)化評(píng)價(jià)矩陣:
③計(jì)算對(duì)應(yīng)熵值:
支持向量機(jī)通過將樣本投射至高維空間中,在高維空間中采用最佳決策邊界分離數(shù)據(jù)的間距,從而找到分離數(shù)據(jù)類型的最佳超平面[15]。解決非線性情況下的公式為:
式中:ω為超平面權(quán)重向量;ξi為松弛變量;xi為需分類樣本;yi為樣本對(duì)應(yīng)類別;b為訓(xùn)練閾值;C為懲罰函數(shù)。懲罰函數(shù)是對(duì)錯(cuò)分樣本的懲罰率,它用于最大化分類范圍和最小化誤分類樣本數(shù)折衷,是一個(gè)對(duì)SVM 分類性能有重要影響的參數(shù)。
通過引入拉格朗日函數(shù)和核函數(shù)來解決式(10)中凸二次規(guī)劃問題,并對(duì)ω、b求偏導(dǎo)并將偏導(dǎo)數(shù)等于0,得到如下公式:
式中:αi為拉格朗日算子;kernal(xi,xj)為核函數(shù),本文選用徑向基函數(shù)作為核函數(shù),其優(yōu)點(diǎn)是泛化性能良好,其表達(dá)式如下:
式中:支持向量機(jī)的分類能力受到C、g參數(shù)的影響。且SVM 本自身的C、g取值常需要依賴經(jīng)驗(yàn)法設(shè)定,因此本文引入引力搜索算法對(duì)SVM 中的C、g兩個(gè)參數(shù)進(jìn)行尋優(yōu)。
引力搜索算法是一種基于牛頓引力定律和粒子間相互作用的智能優(yōu)化算法[16]。首先設(shè)定參數(shù)C、g的搜索范圍及粒子種群大小,設(shè)置GSA 隨機(jī)搜索初始位置,通過對(duì)粒子位置及運(yùn)動(dòng)速度迭代,在達(dá)到最大迭代次數(shù)時(shí),輸出最佳C、g參數(shù)值。
本文所采用的基于LLE-EWM 結(jié)合GSA-SVM的故障診斷流程如圖1 所示。
圖1 多特征融合故障診斷流程圖
采用凱斯西儲(chǔ)大學(xué)軸承實(shí)驗(yàn)數(shù)據(jù)[17]驗(yàn)證所提特征融合方法的有效性,其中試驗(yàn)臺(tái)由三相異步電動(dòng)機(jī)、扭矩編碼器、振動(dòng)加速度傳感器等部分組成,如圖2 所示。
圖2 凱斯西儲(chǔ)大學(xué)試驗(yàn)臺(tái)圖示
試驗(yàn)中所采用的SKF6205 型號(hào)軸承,根據(jù)不同的故障深度將故障分為輕度故障,中度故障和重度故障,共10 類軸承運(yùn)行狀態(tài)。每類樣本采集到120 000 個(gè)數(shù)據(jù)點(diǎn),取1 200 為故障的一個(gè)樣本,每類故障得到100 個(gè)樣本。具體參數(shù)如表2 所示。
表2 凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)具體參數(shù)
其中以負(fù)載條件3 hp,故障深度為0.533 4 mm及正常運(yùn)行狀態(tài)下的的軸承振動(dòng)信號(hào)為例,軸承振動(dòng)信號(hào)的振動(dòng)特征如圖3 所示。
圖3 滾動(dòng)軸承故障深度0.533 4 mm 振動(dòng)信號(hào)
首先對(duì)滾動(dòng)軸承原始信號(hào)進(jìn)行第一節(jié)所提到的時(shí)域、頻域、能量及熵特征的提取,并設(shè)置時(shí)域特征為T=[t1,t2,…,t14],頻域特征為P=[p1,p2,…,p7]。其中能量特征包含小波分解的6 維特征,EEMD 分解得到的14 個(gè)IMF 特征,構(gòu)成的能量特征為E=[e1,e2,e3,…,e19,e20]。熵特征由信息熵和模糊熵構(gòu)成χ=[χ1,χ2,χ3,χ4,χ5,χ6,χ7]。得到含有48個(gè)特征的滾動(dòng)軸承特征數(shù)據(jù)集Q1。每類故障特征選出一個(gè)繪制特征圖示,如圖4 所示。
圖4 多源域提取特征圖示
提取到的48 個(gè)信號(hào)特征會(huì)導(dǎo)致診斷過程中的計(jì)算量過大,從而降低對(duì)滾動(dòng)軸承的診斷效率。首先采用SVM 對(duì)48 類信號(hào)特征進(jìn)行第一輪的篩選。通過對(duì)單一特征進(jìn)行診斷得到相應(yīng)的診斷準(zhǔn)確率,如圖5 所示。
圖5 48 個(gè)特征篩選
由圖5 所示,其中柱狀圖高度為單特征由SVM診斷的準(zhǔn)確率,其中1~14 代表時(shí)域特征;15~21 代表頻域特征;22~41 代表能量特征;42~48 代表熵特征。以閾值50%為例,保留大于50%的特征為有效特征。50%閾值篩選得到有效特征為38 個(gè),60%閾值篩選得到有效特征為28 個(gè)。
計(jì)算篩選得到的特征之間的皮爾遜相關(guān)系數(shù),得到相關(guān)系數(shù)最大的特征,如表3 所示。
表3 閾值50%篩選最大相關(guān)系數(shù)及對(duì)應(yīng)特征
由表3 可得,通過計(jì)算38 個(gè)篩選特征和對(duì)應(yīng)特征的相關(guān)系數(shù),得到38×38 的系數(shù)矩陣,篩選得到每個(gè)特征對(duì)應(yīng)的相關(guān)性最大特征。篩選后得到時(shí)域特征8 個(gè);頻域特征1 個(gè);能量特征10 個(gè);熵特征1 個(gè)。
對(duì)剩余的時(shí)域特征和能量特征采用LLE-EWM方法進(jìn)行處理。采用LLE 算法對(duì)時(shí)域特征和能量特征進(jìn)行降維處理,設(shè)置算法臨近點(diǎn)數(shù)為20,維數(shù)為2,得到7 維敏感特征及對(duì)應(yīng)的權(quán)重,分別為:0.181 0、0.135 6、0.161 8、0.117 0、0.158 6、0.099 4、0.146 6。采用相同方法對(duì)閾值60%特征進(jìn)行計(jì)算,如表4 所示。
表4 閾值60%篩選最大相關(guān)系數(shù)及對(duì)應(yīng)特征
經(jīng)過相關(guān)系數(shù)篩選后得到:時(shí)域特征7 個(gè)、頻域特征1 個(gè)、能量特征7 個(gè)、熵特征1 個(gè)。采用LLEEWM 計(jì)算主成分及權(quán)重,得到7 維敏感特征及對(duì)應(yīng)的權(quán)重,分別為:0.126 9、0.122 3、0.171 8、0.118 1、0.197 4、0.144 5、0.119 0。圖6 為篩選后的7 個(gè)特征權(quán)重圖示。
圖6 篩選特征的權(quán)重
將50%及60%篩選后的特征數(shù)據(jù)集輸入GSASVM 分類模型中,在模型訓(xùn)練之前對(duì)信號(hào)特征進(jìn)行歸一化,并將計(jì)算得到的特征對(duì)應(yīng)權(quán)重與歸一化的特征相乘。將處理過的特征輸入模型,得到GSA 對(duì)SVM 的尋優(yōu)曲線及診斷結(jié)果。將50%準(zhǔn)確率篩選的軸承故障信號(hào)特征,按照70%訓(xùn)練、30%測試的比例輸入GSA-SVM 中,通過GSA 對(duì)SVM 進(jìn)行參數(shù)尋優(yōu)。迭代過程及診斷結(jié)果如圖7 所示。
圖7 融合特征集診斷結(jié)果(50%準(zhǔn)確率)
經(jīng)過30 次迭代后得到最終的診斷結(jié)果為98.7%,相較于單一故障的故障診斷,所提多故障特征融合方法的診斷結(jié)果具有更高的準(zhǔn)確率。
將60%準(zhǔn)確率篩選的軸承故障信號(hào)特征,按照與上文相同的劃分方法輸入SVM 模型進(jìn)行尋優(yōu)。迭代過程及診斷結(jié)果如圖8 所示。
圖8 融合特征集診斷結(jié)果(60%準(zhǔn)確率)
經(jīng)過30 次迭代后得到最終的診斷結(jié)果為99.7%,相較于按照50%劃分的故障診斷結(jié)果,60%劃分方法的特征具有更高的診斷精度,說明相對(duì)較高的篩選要求能夠有效地提升診斷準(zhǔn)確率和效率。
為了驗(yàn)證GSA-SVM 對(duì)滾動(dòng)軸承故障診斷的能力,將所提方法與GridSearch-SVM、PSO-SVM 以及GA-SVM 對(duì)50%和60%閾值融合特征進(jìn)行故障診斷。通過不同的模型對(duì)SVM 的尋優(yōu)對(duì)比,驗(yàn)證本文所提方法的診斷精度,同時(shí)驗(yàn)證不同篩選比例對(duì)診斷結(jié)果的影響。得到相應(yīng)的對(duì)比結(jié)果如表5 所示。
表5 不同方法診斷結(jié)果
表5 所示的結(jié)果表明,在閾值的選擇過程中,選擇50%閾值融合特征在不同尋優(yōu)模型的診斷準(zhǔn)確率,均明顯低于60%閾值特征融合。同時(shí)對(duì)比其他方法,本文所提方法在不同條件下的故障診斷結(jié)果均可獲得更高的滾動(dòng)軸承故障診斷精度。
本文提出了一種基于LLE-EWM 的滾動(dòng)軸承多特征融合方法并結(jié)合GSA-SVM 實(shí)現(xiàn)軸承的故障診斷。通過實(shí)例驗(yàn)證,可以得出以下結(jié)論:
①提取滾動(dòng)軸承48 維特征信號(hào)集,并結(jié)合皮爾遜相關(guān)分析以及LLE-EWM 進(jìn)行故障特征的融合。從而實(shí)現(xiàn)對(duì)故障信號(hào)所包含的信息進(jìn)行綜合提取。
②對(duì)多特征融合的故障特征輸入GSA-SVM 模型中進(jìn)行診斷,通過設(shè)定不同篩選閾值以及對(duì)比不同的SVM 尋優(yōu)模型。實(shí)現(xiàn)特征融合的閾值選擇,驗(yàn)證了所提方法具有較高的故障診斷精度。
結(jié)果表明所提方法具有較高的故障診斷能力,能夠較為充分地提取出故障信號(hào)中所包含的特征信息,在故障診斷過程中也能較為準(zhǔn)確地診斷出滾動(dòng)軸承的故障種類及程度。