郝勇,劉尚宗,吳文輝
(1.華東交通大學(xué)機電與車輛工程學(xué)院,南昌330013;2.青島四方龐巴迪鐵路運輸設(shè)備有限公司,山東青島266111)
振動信號分析廣泛應(yīng)用于機械設(shè)備的故障診斷和健康狀態(tài)測試與維護。軸承是機械設(shè)備中一種重要零部件,它的主要功用是支撐機械旋轉(zhuǎn)體,降低其運動過程中的摩擦因數(shù),并保證其回轉(zhuǎn)精度,其質(zhì)量優(yōu)劣直接影響機械系統(tǒng)的壽命、安全性和穩(wěn)定性[1],在旋轉(zhuǎn)機械中有70%的故障是由滾動軸承引起的。軸承振動信號具有非線性、非平穩(wěn)和缺陷特征微弱的特點[2-3],因此,從振動信號中直接提取軸承的故障特征較困難且不準(zhǔn)確,需要探索一種適用于強背景干擾下的信號特征提取和分析方法實現(xiàn)軸承品質(zhì)的評估。
振動信號結(jié)合機器學(xué)習(xí)方法常用于軸承的故障診斷和質(zhì)量品質(zhì)評估模型的建立[4]。然而,傳統(tǒng)的機器學(xué)習(xí)算法如支持向量機(Support vector machine,SVM)對于大數(shù)據(jù)訓(xùn)練樣本會耗費大量機器內(nèi)存與運算時間,對于非線性問題還需要選擇最優(yōu)核函數(shù)[5];決策樹(Decision tree)不支持在線學(xué)習(xí),且會忽略數(shù)據(jù)集屬性間的相關(guān)性,模型容易過擬合;邏輯回歸(Logistic regression)只能處理兩分類問題,對多類特征不能很好處理,容易欠擬合。因此,傳統(tǒng)的機器學(xué)習(xí)算法雖然結(jié)構(gòu)簡單,但是在復(fù)雜非線性關(guān)系的分類問題中其分析能力受到極大限制。
近年來,深度學(xué)習(xí)作為自動提取特征的典型方法應(yīng)用于智能故障診斷。Kong 等[6]提出一種新穎的正則化策略,在堆棧自編碼模型訓(xùn)練中引入內(nèi)積,,構(gòu)造出基于內(nèi)部產(chǎn)品的堆棧式自編碼模型,用以改善工業(yè)過程的深層特征。葉狀等[7]利用經(jīng)驗?zāi)B(tài)分解方法得到多通道一維信號,構(gòu)建多通道一維卷積神經(jīng)網(wǎng)絡(luò)(Multi-channel one-dimensional convolutional neural network,MC-1DCNN)模型進行特征提取。在MC-1DCNN的全連接層后接堆疊降噪自編碼器層,進一步進行維度縮減和特征提取并實現(xiàn)特征分類。李益兵等[8]利用粒子群優(yōu)化(Particle swarm optimization,PSO)算法優(yōu)選深度置信網(wǎng)絡(luò)(Deep belief nets,DBN)網(wǎng)絡(luò)結(jié)構(gòu),隨后運用具有最優(yōu)結(jié)構(gòu)的DBN 模型直接提取低維故障特征,并將故障特征輸入軸承故障識別模型進行故障判斷。Wang 等[9]提出了一種基于強化學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)自動搜索方法,用于滾動軸承的故障診斷,該方法以遞歸神經(jīng)網(wǎng)絡(luò)(Recursive neural network,RNN)為控制器生成一系列動作,每個動作指定一種設(shè)計選擇,以構(gòu)造用于故障診斷的子模型。CNN 是一種有監(jiān)督深度學(xué)習(xí)模型,具有局部區(qū)域感知、權(quán)重共享和空間采樣3個關(guān)鍵的架構(gòu)思想,適用于處理高維數(shù)據(jù)[10-11],并且是含有多層處理單元的特征學(xué)習(xí)方法,可以將輸入層的數(shù)據(jù)逐層轉(zhuǎn)換成更易于識別的特征[12]。
論文針對強背景干擾下振動信號的特征提取和建模分析問題,以滾動軸承的故障診斷和質(zhì)量品質(zhì)評估振動信號作為實驗數(shù)據(jù)集,提出了一種基于振動圖像(Vibration image,VI)結(jié)合CNN的軸承故障診斷與質(zhì)量評估方法:將振動信號轉(zhuǎn)為二維振動圖像,結(jié)合CNN方法提取圖像多維特征信息并進行建模分析,以期實現(xiàn)噪聲影響下振動信號的有效特征提取和精確穩(wěn)定的模型構(gòu)建。
在軸承故障診斷和質(zhì)量品質(zhì)評估過程中,采集的振動信號包含了豐富的質(zhì)量品質(zhì)信息和設(shè)備運行產(chǎn)生的沖擊等干擾響應(yīng)信息,由于時域信號不相鄰樣本點間關(guān)系獲取比較困難,若將其轉(zhuǎn)換為振動圖像,獲取給定圖像元素與其相鄰圖像元素間的關(guān)系相對容易。因此,為了有效提取振動信號樣本點間關(guān)系信息,將振動信號轉(zhuǎn)換為振動圖像,樣本幅值歸一化到[-1,1],然后將歸一化的樣本幅值轉(zhuǎn)換為圖像像素值[13-14]。圖1所示為振動信號轉(zhuǎn)換為振動圖像的構(gòu)建過程示意圖。
圖1 振動圖像構(gòu)建過程示意圖
樣本幅值與對應(yīng)圖像像素值的表達式為
式中:M 為圖像尺寸長度;N 為圖像尺寸寬度;j=1∶M;k =1∶N; P[ j,k]為M × N 大小振動圖像對應(yīng)像素的強度;B[·]是振動信號中樣本點轉(zhuǎn)化的幅值。振動圖像中像素的個數(shù)等于振動信號中樣本點的個數(shù)。
1.2.1 振動信號時域特征分析
在振動信號分析過程中,實驗采集的滾動軸承振動信號包含了軸承工作的全部信息,具有較強的時域信息,因此對信號進行時域特征提取是一種最直接、最有效的特征提取方法。振動信號時域特征(Vibration signal time domain feature,VSTF)提取獲取信號時域特征參數(shù)。
時域特征參數(shù)可分為有量綱和無量綱。本文有量綱特征統(tǒng)計參數(shù)為均值、均方根值、方根幅值、絕對平均值、偏斜度、峭度、方差、最大值、最小值、峰峰值;波形指標(biāo)、峰值指標(biāo)、脈沖指標(biāo)、裕度指標(biāo)、偏斜度指標(biāo)、峭度指標(biāo)等特征為無量綱統(tǒng)計參數(shù)。
1.2.2 梯度方向直方圖算子
梯度方向直方圖(Histogram of oriented gridients,HOG)源于SIFT算法,是一種圖像局部特征描述符,通過對圖像中某一矩形區(qū)域中像素點梯度幅值和方向綜合信息的統(tǒng)計來獲取圖像特征。
1)每個像素點梯度以及估算梯度的幅值G(x, y)和方向α(x, y)的計算式分別為:
2)圖像分割成大小相似的單元模式(Cell),以單元模式為主要統(tǒng)計單位來估計其梯度方向的質(zhì)量分布圖(Cell-HOG)。對于每個Cell計算梯度方向的質(zhì)量分布圖向量其中
3)相鄰Cell 組成一個塊。該塊在圖像中向右或向下方移動一個Cell 以獲得下一個塊。
4)所有的塊的梯度直方圖融合起來,獲得其最終輸入圖像的HOG 特征。
1.2.3 支持向量機(SVM)
SVM是由Vapnik 基于統(tǒng)計學(xué)習(xí)理論提出的一種機器學(xué)習(xí)算法,算法獨特優(yōu)勢在于解決小樣本、非線性問題。懲罰因子c 和核函數(shù)參數(shù)g 的選擇會對SVM 模型最終結(jié)果起關(guān)鍵作用,參數(shù)尋優(yōu)將關(guān)系到SVM 模型的優(yōu)劣。網(wǎng)格搜索算法(Grid search,GS)是將c、g 在一定范圍內(nèi)劃分網(wǎng)格,通過遍歷網(wǎng)格內(nèi)所有點來找到最優(yōu)參數(shù)組合。
CNN 網(wǎng)絡(luò)具有前饋結(jié)構(gòu),在圖像分析中具有3個重要的特點:局部感知、權(quán)重共享和空間采樣。CNN 典型結(jié)構(gòu)由卷積層、池化層以及全連接層[15]構(gòu)成。圖2所示為典型的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖2 典型的卷積神經(jīng)網(wǎng)絡(luò)
卷積層將輸入圖像與內(nèi)核進行卷積。卷積層內(nèi)核大小相同,提取圖像局部特征。一般情況下,卷積過程中的數(shù)學(xué)模型表示為
式中: xlj為l 卷積層j 通道的值;(*)為卷積操作;Mj為 計算 xlj的特征圖集;k 為S ×S 的核矩陣;f 為非線性激活函數(shù); blj為偏置項。
池化層對于上一層輸入的振動圖像進行降采樣處理,同時減少網(wǎng)絡(luò)參數(shù)[16]。此外,池化層通過對輸入進行小的變換保持了局部不變性,其數(shù)學(xué)模型為
式中:down(·)為子采樣函數(shù);β 為乘法偏置。
全連接層是一種傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò),其目的是上層的特征圖中收集所有的特征進行分類[17],Softmax函數(shù)作為輸出層激活函數(shù)。Softmax 函數(shù)定義如下
為了實現(xiàn)軸承振動信號多維信息特征的提取和分析,擬采用振動圖像結(jié)合CNN的信息提取和建模方法對滾動軸承故障和質(zhì)量等級評估等反映軸承質(zhì)量品質(zhì)的振動信號進行分析,軸承質(zhì)量品質(zhì)評估分析流程圖如圖3所示。
圖3 軸承質(zhì)量品質(zhì)評估分析流程
該方法主要分為2個核心步驟:振動信號轉(zhuǎn)換為振動圖像和振動圖像特征提取建模與分類識別。該方法的一般步驟如下:
1)采用振動信號采集系統(tǒng)依據(jù)國標(biāo)[18]或行業(yè)推薦標(biāo)準(zhǔn)[19]采集軸承故障振動信號或不同品質(zhì)軸承工作的振動信號;
2)利用1.1 節(jié)所述方法將振動信號轉(zhuǎn)換為振動圖像;
3)數(shù)據(jù)樣本隨機劃分為訓(xùn)練集與測試集,訓(xùn)練集訓(xùn)練CNN模型,測試集評估模型精度,實現(xiàn)軸承故障診斷和質(zhì)量品質(zhì)評估。正確識別率CRR為
式中:RCR為正確識別率,RCR越高,表明模型越好;p為正確識別樣本數(shù);t 為總樣本數(shù)。
2.1.1 數(shù)據(jù)來源
為有效驗證本文所提軸承振動信號分析方法,采用美國凱斯西儲大學(xué)電氣工程實驗室提供的故障數(shù)據(jù)集[20]。以型號為6205-2RSSKF的軸承為研究對象,電火花加工單點損傷,電機負載為0HP、軸承轉(zhuǎn)速為1797 r/min、采樣頻率為48 kHz 下進行試驗。選取傳感器在驅(qū)動端采集得到的4種狀態(tài)(正常狀態(tài)、內(nèi)圈故障、外圈故障(6點鐘方向)及滾動體故障)振動信號,總體樣本數(shù)為200,樣本信號包含2304個樣本點。數(shù)據(jù)樣本說明如表1所示。
2.1.2 基于振動信號的軸承故障診斷判別模型研究
1)VS-SVM 模型
直接采用SVM方法用于軸承故障診斷識別模型的構(gòu)建,原始信號作為模型特征輸入,SVM采用的核函數(shù)為徑向核函數(shù),通過GS尋優(yōu)方法獲取最優(yōu)值,參數(shù)c、g 尋優(yōu)范圍[2-20,220]。將滾動軸承4種狀態(tài)的振動信號直接建模,隨機選取120樣本作為訓(xùn)練集用于故障診斷模型的建立,其余樣本用于驗證模型,隨機10次樣本劃分并建立SVM 模型,優(yōu)化得懲罰因子c為0.41,核函數(shù)參數(shù)g 為0.04,訓(xùn)練集平均識別率為100%,測試集平均識別率為95.62%。
2)VSTF-SVM 模型
振動信號包含豐富的相關(guān)軸承故障信息,通過提取振動信號的時域特征,采用優(yōu)化參數(shù)的SVM進行軸承故障診斷識別模型構(gòu)建。利用統(tǒng)計方法提取16個時域特征,200個樣本按3∶2比例劃分訓(xùn)練集與測試集進行模型訓(xùn)練與驗證。模型優(yōu)化后c =8,g =0.25,隨機10次樣本劃分后獲得訓(xùn)練集平均識別率98.82%,測試集平均識別率97.25%。
2.1.3 基于振動圖像和卷積神經(jīng)網(wǎng)絡(luò)的軸承故障診斷判別模型研究
依據(jù)1.1節(jié)方法將樣本振動信號轉(zhuǎn)化為48×48的振動圖像,圖像樣本如圖4 所示。由圖看出正常狀態(tài)的振動圖像與其他3種狀態(tài)振動圖像差別明顯。
圖4 4種狀態(tài)軸承振動圖像
1)VI-HOG-SVM 模型
為克服在振動信號中提取特征時不能很好挖掘軸承工作特征信息,將振動信號轉(zhuǎn)換為振動圖像,利用HOG 算法獲取振動圖像的圖像特征,使用SVM分類器對軸承故障進行診斷識別。樣本訓(xùn)練集與測試集按3∶2劃分并進行特征提取并建模分析,隨機10次樣本劃分建模分析獲得訓(xùn)練集平均識別率為100%,測試集平均識別率為99.62%。最優(yōu)模型參數(shù)c =5.66,g =0.004。
2)VI-CNN 模型
按上述比例隨機劃分樣本數(shù)據(jù),設(shè)置2層卷積與2層池化。卷積層參數(shù)分別設(shè)置[21-22]為:50@3×3,100@2×2,步長均設(shè)為1,使用ReLU 激活函數(shù)。池化層均采用2×2,步長設(shè)置為2的最大池化。隨機10次樣本劃分后訓(xùn)練集與測試集平均識別率均為100%。
2.1.4 最優(yōu)故障診斷模型分析
圖5和表2所示為采用隨機分組方式進行樣本劃分后,對每種振動信號分析方法建立10個模型的計算結(jié)果。
表2 軸承故障識別結(jié)果統(tǒng)計
圖5 軸承故障識別結(jié)果比較
由圖5 可知,VI-CNN 方法得到了最高的CRR 值,且10個模型的CRR值均為100%;VI-HOG-SVM模型的CRR 次之,為99.62%;VSTF-SVM 模型的CRR 為97.25%;VS-SVM方法的分析結(jié)果最低,且10個模型的測試結(jié)果差異較大,表明該方法具有較低的穩(wěn)健性。直接采用振動信號結(jié)合SVM 方法較難提取分析信號的深度特征信息;VI-CNN 模型相比于其它方法具有更好的細節(jié)信息分辨力和信噪分離能力,模型具有較好的分析精度和穩(wěn)健性。
VI-CNN 模型最佳結(jié)果混淆矩陣如圖6所示,由圖可知該模型平均測試精度為100%,每一類分類識別率均為100%,表明VI-CNN 模型可以實現(xiàn)振動信號信息特征的有效且多維度提取,可以實現(xiàn)更好的識別結(jié)果。
圖6 VI-CNN 模型最佳結(jié)果混淆矩陣
2.2.1 數(shù)據(jù)來源為進一步驗證所提方法的優(yōu)勢,依據(jù)《JB/T 7047-2006中深溝球軸承振動水平標(biāo)準(zhǔn)》,采用S0910裝置依據(jù)機械行業(yè)推薦標(biāo)準(zhǔn)-深溝球軸承振動水平采集得優(yōu)等品、一等品及合格品軸承振動信號。振動信號檢測裝置如圖7所示。主軸轉(zhuǎn)速為1800 r/min,軸向載荷70 N,采樣頻率為8 kHz。每一等級樣本各50個,樣本信號包含2304個樣本點。圖8所示為3種品質(zhì)軸承振動信號。
圖7 軸承檢測裝置簡圖
圖8 3種品質(zhì)軸承振動信號圖
2.2.2 基于振動信號的軸承質(zhì)量等級評估模型研究
隨機選取90個振動信號樣本作為訓(xùn)練集,60個作為測試集。
1)VS-SVM 模型
直接采用優(yōu)化參數(shù)的SVM進行建模與軸承質(zhì)量等級評估,隨機10次樣本劃分后訓(xùn)練集平均識別率為100%,測試集平均識別率為84.83%。優(yōu)化后模型參數(shù)c=1,g =0.71。
2)VSTF-SVM 模型
使用振動信號16個時域特征并結(jié)合SVM進行建模與軸承質(zhì)量評估,隨機10 次樣本劃分后訓(xùn)練集平均識別率為97.77%,測試集平均識別率為86.66%。模型參數(shù)c=22.63,g =0.18。
2.2.3 基于振動圖像和卷積神經(jīng)網(wǎng)絡(luò)的軸承質(zhì)量等級評估模型研究
依據(jù)1.1節(jié)所提方法,樣本信號轉(zhuǎn)化為48×48的振動圖像,振動圖像如圖9所示。由圖9可知優(yōu)等品與一等品、合格品振動圖像有明顯差別將振動圖像樣本隨機分為90個訓(xùn)練集樣本和60個測試集樣本。
圖9 3種軸承品質(zhì)的振動圖像
1)VI-HOG-SVM 模型
軸承質(zhì)量等級樣本訓(xùn)練集與測試集進行特征提取并建模與預(yù)測識別,隨機10次樣本劃分建模分析獲得訓(xùn)練集平均識別率為100%,測試集平均識別率為95.83%。最優(yōu)模型參數(shù)c = 4,g = 0.0055。
2)VI-CNN 模型
振動圖像根據(jù)節(jié)1.1方法由振動信號轉(zhuǎn)換,分別設(shè)置2層卷積與2層池化,卷積層參數(shù)分別設(shè)置為:50@3×3,150@2×2,步長均設(shè)為1,使用ReLU 激活函數(shù)。池化層均采用2×2,步長設(shè)置為2的最大池化。隨機10次樣本劃分后訓(xùn)練集平均識別率為100%,測試集平均識別率均為98.16%。
2.2.4 最優(yōu)判別模型分析
對軸承質(zhì)量等級評估實驗數(shù)據(jù)樣本隨機劃分后,每種振動分析方法分別建立10個模型評估識別結(jié)果,如圖10所示。由圖可以看出,VI-CNN 模型平穩(wěn)性最好,其他3個模型軸承質(zhì)量評估識別結(jié)果波動比較大。表3中計算得到10次VI-CNN 模型的CRR 平均值為98.16%,標(biāo)準(zhǔn)差為0.49;VI-HOGSVM 模型CRR平均值為95.83%,但CRR值標(biāo)準(zhǔn)差為2.49,標(biāo)準(zhǔn)差值過高,其余2個模型CRR值均低于90%,且由標(biāo)準(zhǔn)差值可以看出模型穩(wěn)定性較差。VI-CNN 模型在軸承質(zhì)量等級評估過程中,表現(xiàn)出更好的樣本特征信息提取能力,模型精度更高。
圖10 軸承質(zhì)量等級評估結(jié)果比較
表3 軸承質(zhì)量等級評估結(jié)果統(tǒng)計
對于軸承質(zhì)量等級數(shù)據(jù)集,VI-CNN 模型識別結(jié)果混淆矩陣如圖11所示。標(biāo)簽1、2、3分別代表優(yōu)等品、一等品、合格品,行代表測試值標(biāo)簽,列代表真實值標(biāo)簽,在進行軸承等級識別分類時錯將某一優(yōu)等品樣本識別成一等品樣本,導(dǎo)致平均測試識別精度為98.33%。對于不同質(zhì)量等級的軸承振動信號樣本數(shù)據(jù),該模型仍能高效穩(wěn)定識別。
圖11 VI-CNN 模型識別結(jié)果混淆矩陣
1)振動圖像對比于振動信號包含更為豐富的軸承樣本信息,在進行特征提取有效減少信息缺失。
2)對比振動信號傳統(tǒng)特征提取方法,CNN自適應(yīng)特征提取不依賴先驗知識,模型能更好學(xué)習(xí)特征且提高識別準(zhǔn)確率。
3)通過振動圖像結(jié)合CNN 對滾動軸承4類故障和滾動軸承3類質(zhì)量等級實現(xiàn)了準(zhǔn)確診斷。實驗得出CNN 模型對于不同數(shù)據(jù)集仍具有很好的適應(yīng)性,測試集識別率均到達了100%。
鑒于本研究中故障診斷和軸承質(zhì)量等級樣本數(shù)據(jù)有限,CNN 方法中采用4個卷積層已使樣本數(shù)據(jù)達到很好分類效果。故障樣本數(shù)據(jù)和質(zhì)量等級數(shù)據(jù)需進一步擴大,以構(gòu)建深層卷積網(wǎng)絡(luò),并優(yōu)化模型內(nèi)部參數(shù),利用大數(shù)據(jù)樣本建模與內(nèi)部參數(shù)優(yōu)化是以后進行研究的方向。