尹澤明,王彩年,王 智,毛范海
(1.大連理工大學(xué)機(jī)械工程學(xué)院,大連 116024;2.通用技術(shù)集團(tuán)大連機(jī)床有限責(zé)任公司,大連 116620)
滾動(dòng)軸承在機(jī)械設(shè)備中是應(yīng)用最多也最易損壞的零件。據(jù)不完全統(tǒng)計(jì),由滾動(dòng)軸承引起的故障約占旋轉(zhuǎn)機(jī)械故障總數(shù)的30%[1],因此準(zhǔn)確且迅速地判斷滾動(dòng)軸承的運(yùn)行狀態(tài)并采取應(yīng)對(duì)措施非常重要。由于受到負(fù)載、碰撞和環(huán)境等因素的影響,傳統(tǒng)的特征提取技術(shù)很難在振動(dòng)信號(hào)中找出具有代表性的特征信息,增加了診斷的難度。
針對(duì)這個(gè)問題,研究人員分別在信號(hào)的時(shí)域、頻域與時(shí)頻域上提取特征信息嘗試提高故障診斷的準(zhǔn)確率[2-4]。但是單一域的特征提取往往會(huì)忽略掉振動(dòng)信號(hào)中的重要信息造成部分誤判,彭宅銘等[5]通過多域特征提取提高滾動(dòng)軸承故障診斷的準(zhǔn)確率。
雖然多域特征集對(duì)故障的表征會(huì)更全面,但是其維度過高、信息冗余和非線性等問題會(huì)降低識(shí)別度準(zhǔn)確率。
鄭新[6]采用了EMD與PCA結(jié)合的滾動(dòng)軸承故障診斷方法對(duì)相關(guān)矩陣進(jìn)行降維,有著較高的準(zhǔn)確率。JIANG等[7]將變尺度離散熵和t-SNE結(jié)合,對(duì)混合尺度模型進(jìn)行降維,能夠有效的識(shí)別故障類型。但PCA的主成分特征維度的含義具有模糊性且會(huì)丟掉很多底層的結(jié)構(gòu)信息,t-SNE可以保留底層的數(shù)據(jù)結(jié)構(gòu)但是計(jì)算速度非常慢,而統(tǒng)一流行逼近與投影算法(uniform manifold approximation and projection for dimension reduction,UMAP)[8]既可以獲得PCA的速度優(yōu)勢(shì)又能保留更多特征集中的數(shù)據(jù)信息。
因此為提高多域特征提取方法對(duì)故障類型識(shí)別的準(zhǔn)確率、降低計(jì)算資源占用、加快識(shí)別速度,本文提出了基于統(tǒng)一流形逼近與投影算法(UMAP)改進(jìn)的多域特征提取方法。通過此方法建立的特征集輸入到支持向量機(jī)進(jìn)行診斷模型的訓(xùn)練,采用某大學(xué)滾動(dòng)軸承實(shí)驗(yàn)信號(hào)將基于UMAP算法改進(jìn)的多域特征提取方法與不同算法改進(jìn)的多域特征提取方法進(jìn)行對(duì)比分析,進(jìn)一步驗(yàn)證該方法在滾動(dòng)軸承故障診斷中的可行性。
為保留更多特征信息本文選取了多種時(shí)域、頻域特征參數(shù)構(gòu)成時(shí)域特征向量S、頻域特征向量P,具體如表1所示。
表1 特征參數(shù)分類
滾動(dòng)軸承一但發(fā)生故障會(huì)導(dǎo)致振動(dòng)信號(hào)的某些頻段的能量發(fā)生一定的變化,能量矩[9]是將經(jīng)CEEMDAN分解[10]產(chǎn)生的IMF分量做對(duì)時(shí)間軸的積分而得到的能量,表達(dá)式為:
(1)
式中:Δt為采樣周期,n為總采樣點(diǎn)數(shù),k為采樣點(diǎn),Ci(t)為軸承振動(dòng)信號(hào)CEEMDAN分解產(chǎn)生的IMF分量。
將其歸一化并構(gòu)造能量矩特征向量L為:
L=[E1,E2,E3,…,EN]/∑iEi
(2)
樣本熵算法對(duì)近似熵算法進(jìn)行了改進(jìn),同時(shí)相比小波能量熵更抗干擾。樣本熵越高,信號(hào)的時(shí)間序列越混亂。對(duì)給定容限r(nóng)的m維向量其樣本熵的表達(dá)式為:
(3)
當(dāng)L為有限值時(shí),樣本熵的近似值為:
(4)
式中:m為維數(shù)取值一般為1或2,相似容限r(nóng)的取值范圍一般為原始數(shù)據(jù)標(biāo)準(zhǔn)差的10%~25%。本文選取m=2,r為20%。
構(gòu)造樣本熵特征向量SE:
SE=[SampEn1,SampEn2,…,SampEnN]
(5)
由于不同故障類型的信號(hào)經(jīng)過CEEMDAN分解后會(huì)產(chǎn)生數(shù)量不等的IMF分量。因此為保證各組數(shù)據(jù)多域特征集的特征與維度一致性,采用相關(guān)系數(shù)法計(jì)算選取與原始振動(dòng)信號(hào)互相關(guān)系數(shù)ρi(τ)≥0.1的IMF分量提取能量矩與樣本熵特征。
將時(shí)域特征特征向量S、頻域特征特征向量P、能量矩特征向量L和樣本熵特征向量SE結(jié)合構(gòu)造為多域特征集T。
T=[S,P,L,SE]
(6)
原始的多域特征提取方法雖然能更好的展現(xiàn)滾動(dòng)軸承故障信息,但是其構(gòu)造的特征集維度較高且非線性易產(chǎn)生信息冗余使診斷模型的訓(xùn)練速度變慢精度降低,往往最后得到的診斷結(jié)果不理想。
UMAP算法是一種數(shù)據(jù)信息提取融合的優(yōu)化算法,通過假設(shè)數(shù)據(jù)均勻流行分布在拓?fù)淇臻g中將其近似映射到低維空間。由于具有更優(yōu)越的運(yùn)算性能、更好的可擴(kuò)展性同時(shí)保留了更多的關(guān)鍵信息,所以UMAP算法可以有效地解決傳統(tǒng)多域特征提取方法構(gòu)造的特征集高維、非線性、信息冗余等問題。UMAP算法的步驟為:
步驟1:求每個(gè)數(shù)據(jù)點(diǎn)xi的k近鄰,定義ρi和σi,設(shè):
ρi=min{d(xi,xij)|1≤j≤k,d(xi,xij)>0}
(7)
并設(shè)σi為:
(8)
步驟2:使用力導(dǎo)向圖布局算法計(jì)算xi的加權(quán)k鄰域圖的低維分布:
(9)
式中:a和b是超參數(shù),yi和yj為坐標(biāo)。
改進(jìn)后的多域特征提取方法步驟為:
步驟1:提取軸承振動(dòng)信號(hào)時(shí)域、頻域特征;
步驟2:將軸承振動(dòng)信號(hào)進(jìn)行CEEMDAN分解提取IMF分量能量矩與樣本熵特征并根據(jù)相關(guān)系數(shù)法選取有效特征;
步驟3:將時(shí)域特征、頻域特征、能量矩特征與樣本熵特征組合構(gòu)造多域特征集;
步驟4:采用UMAP算法對(duì)多域特征集進(jìn)行全局信息提取與融合,將多維特征映射到低維空間;
步驟5:結(jié)束算法,輸出新的特征集合。
改進(jìn)后的流程圖如圖1所示。
圖1 改進(jìn)的多域特征提取方法流程圖
由于傳統(tǒng)的多域特征提取方法構(gòu)造的多域特征集存在維度過高、信息冗余和非線性等問題導(dǎo)致其占用計(jì)算資源過大,分類精度不足,所以對(duì)訓(xùn)練故障診斷模型的智能算法要求過高。因此本節(jié)采用前文所提出的基于UMAP算法改進(jìn)的多域特征提取方法通過基礎(chǔ)的支持向量機(jī)構(gòu)造滾動(dòng)軸承故障診斷模型,避免分類算法過于復(fù)雜、模型計(jì)算時(shí)間過長(zhǎng)、診斷準(zhǔn)確率降低的情況。具體流程如圖2所示。
圖2 滾動(dòng)軸承故障診斷流程圖
由圖2可知,本文的滾動(dòng)軸承故障診斷流程主要分為3部分:
(1)對(duì)獲取的軸承振動(dòng)數(shù)據(jù)進(jìn)行CEEMDAN分解等基礎(chǔ)處理;
(2)采用基于UMAP算法改進(jìn)的多域特征提取方法求解多域特征的低維映射構(gòu)造低維特征集;
(3)將構(gòu)造好的低維特征集輸入到支持向量機(jī)中進(jìn)行診斷模型訓(xùn)練與故障信號(hào)識(shí)別。
實(shí)驗(yàn)驗(yàn)證數(shù)據(jù)來自某大學(xué)的滾動(dòng)軸承振動(dòng)信號(hào)實(shí)驗(yàn)數(shù)據(jù)集,選取負(fù)載2 hp,轉(zhuǎn)速1750 r/min,故障直徑0.177 8 mm,采樣頻率12 kHz,外圈滾道故障在6點(diǎn)鐘位置的驅(qū)動(dòng)端軸承故障數(shù)據(jù)進(jìn)行測(cè)試。
4種軸承振動(dòng)信號(hào)如圖3所示。每種樣本狀態(tài)取200組共800組數(shù)據(jù),每組數(shù)據(jù)1024個(gè)點(diǎn)。
(a) 健康狀態(tài) (b) 內(nèi)圈故障狀態(tài)
根據(jù)圖2所示的流程圖對(duì)每組軸承振動(dòng)信號(hào)進(jìn)行多域特征提取。經(jīng)過實(shí)際計(jì)算CEEMDAN分解的各組信號(hào)的前4個(gè)IMF分量與原始信號(hào)的互相關(guān)系數(shù)均大于0.1,所以選取各組前4個(gè)IMF分量作為有效分量提取能量矩與樣本熵特征。在圖4中可見各個(gè)軸承樣本狀態(tài)分解后的前4個(gè)IMF分量,4種軸承樣本狀態(tài)的振動(dòng)信號(hào)IMF分量波形有明顯的不同。
由圖5可知,UMAP算法改進(jìn)的多域特征提取方法效果最好,其特征集在三維與二維中各狀態(tài)的數(shù)據(jù)點(diǎn)聚集在一起且清晰可分,t-SNE算法改進(jìn)的多域特征提取方法構(gòu)造的特征集在三維與二維中勉強(qiáng)可分但有少部分?jǐn)?shù)據(jù)接觸在一起發(fā)生混疊,而PCA、KPCA與MDS三種算法改進(jìn)的多域特征提取方法構(gòu)造的特征集在三維與二維中均有特征數(shù)據(jù)點(diǎn)混疊發(fā)生。
圖5 不同優(yōu)化算法效果對(duì)比圖
將通過各改進(jìn)算法得到的特征集輸入到支持向量機(jī)中進(jìn)行訓(xùn)練,采用五折交叉驗(yàn)證對(duì)訓(xùn)練得到的模型進(jìn)行檢驗(yàn)并對(duì)比。
由表2和表3可知,基于UMAP算法改進(jìn)的多域特征提取方法計(jì)算速度較快且識(shí)別準(zhǔn)確率為100%。雖然t-SNE算法改進(jìn)后的多域特征提取方法識(shí)別結(jié)果較為準(zhǔn)確但計(jì)算時(shí)間過長(zhǎng),PCA、KPCA、MDS三種算法改進(jìn)的多域特征提取方法識(shí)別準(zhǔn)確率較低,而傳統(tǒng)的多域特征提取方法識(shí)別準(zhǔn)確率為89.3%不能實(shí)現(xiàn)軸承故障的完全識(shí)別且訓(xùn)練時(shí)間較長(zhǎng)。
表2 各方法準(zhǔn)確率對(duì)比
表3 各方法計(jì)算時(shí)間對(duì)比
因此基于UMAP算法改進(jìn)的多域特征提取方法在診斷的準(zhǔn)確率與計(jì)算速度方面都優(yōu)于其他方法,驗(yàn)證了本文所提方法的有效性。
本文提出了一種基于統(tǒng)一流行逼近與投影算法(UMAP)改進(jìn)的多域特征提取方法并通過支持向量機(jī)與軸承振動(dòng)信號(hào)數(shù)據(jù)集驗(yàn)證了該方法的有效性。實(shí)例分析結(jié)果表明,基于UMAP算法改進(jìn)的多域特征提取方法構(gòu)造的特征集各故障狀態(tài)特征點(diǎn)清晰可分,相對(duì)于其他優(yōu)化算法和傳統(tǒng)多域特征提取方法在計(jì)算速度與識(shí)別準(zhǔn)確率方面均有改善,能準(zhǔn)確識(shí)別出軸承故障狀態(tài)。