董紹江,吳文亮,賀 坤,潘雪嬌,蒙志強,湯寶平,趙興新
(1.重慶交通大學 機電與車輛工程學院,重慶 400074;2.重慶大學 機械傳動國家重點實驗室,重慶 400032; 3.重慶長江軸承股份有限公司,重慶 401336)
軸承作為現(xiàn)代制造業(yè)的重要組成部分,在大多數(shù)旋轉(zhuǎn)機械的運行中發(fā)揮著至關(guān)重要的作用。軸承壽命狀態(tài)識別對機械系統(tǒng)的可靠性和安全性具有重大意義。但滾動軸承的壽命狀況受各種因素影響,難以識別。因此,研究滾動軸承壽命狀態(tài)識別方法顯得非常重要。
近年來,數(shù)據(jù)驅(qū)動方法運用在軸承故障診斷、性能評估、剩余壽命預測等諸多方面。 在壽命識別領(lǐng)域,數(shù)據(jù)驅(qū)動方法試圖使用機器學習技術(shù)從測量信號中推導出機械的衰退過程,根據(jù)衰退過程對壽命狀態(tài)進行識別。軸承壽命狀態(tài)識別存在兩個必須解決的問題:如何構(gòu)建合適的軸承性能衰退指標;如何建立有效的軸承壽命狀態(tài)識別模型。
合適的軸承性能衰退指標必須充分利用復雜的信號特征,能夠在軸承性能衰退的各個階段獲得軸承的性能演變。在機械故障診斷中有多種指標,如峰值指標、裕度指標、峭度指標等。Wang等[4]使用了原始振動信號的14個時域特征來捕獲衰退特征。Bo?koski等[5]提出了采用Rényi熵作為特征指標。Chen等[6]將均方根用于評估軸承性能下降。然而,這些指標要么對早期軸承缺陷不夠敏感,要么后續(xù)穩(wěn)定性不足。常用的指標針對不同的振動特性,僅對特定階段的特定缺陷有效。張康等[7]通過降維算法建立盾構(gòu)裝備刀盤多傳感器數(shù)據(jù)與其健康狀態(tài)的關(guān)系,實現(xiàn)了刀盤性能衰退狀態(tài)的有效量化評估。但該方法無法直接運用于復雜的軸承振動信號,需要先在原始信號中提取有效特征。近年來CNN在深度學習方法的研究中展示了提取復雜軸承特征的能力。因此,本文提出了由CAE提取原始信號特征,再通過MDS算法降維,以低維特征空間構(gòu)造的歐氏距離為軸承性能衰退指標。
目前,數(shù)據(jù)驅(qū)動的軸承壽命狀態(tài)識別模型不斷被提出。數(shù)據(jù)驅(qū)動的方法在精度和復雜性方面提供了折中的選擇,Ben Ali等[8]提出了模糊自適應(yīng)共振理論映射(SFAM)神經(jīng)網(wǎng)來進行軸承的壽命狀態(tài)識別和預測。Benkedjouh等[9]運用等距特征映射約簡技術(shù)(isomap)和支持向量回歸(SVR)模擬軸承退化的演化過程,預測軸承的壽命狀態(tài)。這些模型在軸承的壽命狀態(tài)識別方面取得了不錯的效果,但是這些模型沒有考慮噪聲干擾的情況,難以保證精度,因此本文提出了改進卷積神經(jīng)網(wǎng)絡(luò)軸承壽命狀態(tài)識別模型,為增加樣本數(shù),抑制過擬合,對原始訓練樣本進行加噪,為提高模型抗干擾能力,并以LReLU函數(shù)和dropout作為激活函數(shù)。
本文提出了一種新的針對軸承衰退期壽命狀態(tài)識別模型。將軸承信號通過CAE進行特征提取,將提取后的信號特征通過MDS算法降維,在低維特征空間構(gòu)造歐氏距離作為評價軸承性能衰退指標?;诩榷ǖ闹笜藰?gòu)建CNN模型,最終實現(xiàn)軸承壽命狀態(tài)識別。
在本文中,首先,利用卷積自編碼器提取軸承信號特征,再將提取的特征通過MDS算法[10]降維,在二維空間中,將各個樣本特征點到正常樣本中心的歐氏距離作為軸承性能衰退指標,具體理論依據(jù)為:
卷積自編碼網(wǎng)絡(luò)是由編碼和解碼過程組成,編碼過程是由高維原始數(shù)據(jù)向低維投影,如下
(1)
(2)
(3)
式中:λ為權(quán)重衰減系數(shù);sl為第l層神元個數(shù);m為樣本數(shù)。
卷積自編碼可獲得I維的特征集合h={h1,h2,…,hI},可得任意兩樣本特征之間的距離δi,j
(4)
δi,j可組成變量間的距離矩陣
(5)
將矩陣的第i行記為δi,MDS得到了一組大小為I的向量集{δ1,δ2,…,δI,δi∈RI},矩陣的每一行對應(yīng)RI空間中的一個向量,RI空間的維度代表原始變量與其他變量之間的距離。MDS算法是在保持變量間相對距離不變的基礎(chǔ)上,尋找一個從數(shù)據(jù)集RI到RN之間的映射關(guān)系。最終,MDS將轉(zhuǎn)化為計算式(6)的最優(yōu)化問題
(6)
求解式(6)時,構(gòu)建矩陣H,T,D,其中Hi為RN空間中第i個坐標點,tij為矩陣T中的元素,D為距離矩陣,dij為D中的元素。矩陣關(guān)系如式(7)所示
(7)
由式(7)可得
(8)
可得到距離矩陣D中元素與矩陣T中元素的關(guān)系
(9)
最后,對矩陣T進行特征值分解,如式(10)所示。其中U為特征向量,Λ為特征值矩陣。
(10)
(11)
取H的前N個最大的特征值與特征向量對矩陣進行近似表示,即完成了從RI到RN空間的降維,可得到低維空間特征集{θ1,θ2,…,θN,θi∈RN}。
歐氏距離通常用于計算兩點之間的距離[11]。在本文中,在二維空間中的樣本數(shù)據(jù)與軸承正常期樣本域中心的歐氏距離用來作為軸承性能衰退指標ID,值越大表示軸承衰退情況越嚴重,其算法如下
(12)
式中,θo為低維空間中正常期軸承信號特征。
本節(jié)中運用數(shù)據(jù)集來證明所提指標的有效性,從測試中捕獲信號,獲取軸承壽命狀態(tài)特征,構(gòu)建軸承性能衰退指標,與其他方法的結(jié)果進行比較。
試驗數(shù)據(jù)集來自NSFI/UCR Center on Intelligent Maintenance Systems(IMS)。試驗系統(tǒng)如圖1、2所示。四個軸承安裝在一個軸上,速度始終保持在2 000 r/min,通過彈簧機構(gòu)將2 721.55 kg的徑向載荷放置在軸上并軸承上。所有軸承都經(jīng)過強制潤滑,兩個PCB353B33高靈敏度石英ICP加速度計安裝在每個軸承上,共有八個加速度計。圖1顯示了測試設(shè)置并顯示了傳感器的位置。數(shù)據(jù)以20 kHz采樣。試驗數(shù)據(jù)詳細介紹見文獻[14]。
本小節(jié)中,選取的是試驗數(shù)據(jù)集中第1組軸承測試中的第3個軸承的x軸數(shù)據(jù)。完成樣本處理后,利用卷積自編碼器提取軸承信號特征,運用MDS算法進行降維,獲得維度為二維的低維特征。將二維特征值分別作為橫坐標和縱坐標,結(jié)果如圖3(a)所示。為了進行對比,運用了流形算法t-SNE進行對比,其結(jié)果如圖3(b)所示。為了方便比較,對結(jié)果進行了歸一化處理。
(a) MDS特征(b) t-SNE特征圖3 特征降維結(jié)果Fig.3 Dimensionality reduction of result
試驗以全壽命的樣本作為輸入,圖3中包含了正常期、衰退期的數(shù)據(jù)。一般情況下,試驗軸承剛開始采集的信號不穩(wěn)定,因此,本文中規(guī)定在試驗開始的第二天數(shù)據(jù)的特征中心為正常期樣本域中心,即為圖3中紅色的點。根據(jù)相似度的降維思想,圖3中向外偏離正常期樣本域中心的特征點,損壞程度越高,顏色越深說明聚集程度越高。一般來說,軸承信號會有一段較長的正常期,可計算得到MDS特征點的離散度為0.046,t-SNE特征點的離散度為0.321 3,MDS特征點的聚合度更高,更符合軸承數(shù)據(jù)的特性。另外,離散度越大,所建指標的噪聲水平和不穩(wěn)定性越大,會導致對軸承性能狀態(tài)的錯誤評估。MDS是線性降維,它保證的是在降維前后,特征點之間的距離一致,能夠在低維特征中保留高維特征之間的相對關(guān)系,這也同時保留了高維特征從正常到重度變換的時序規(guī)律,但t-SNE是非線性降維,它保證的是降維前后,特征點的條件概率分布一致,非線性變換可能造成特征在時序規(guī)律上的變換,對指標的建立造成影響。因此,本文中將MDS用于降維。
MDS基于特征之間的歐氏距離進行降維,所以根據(jù)在二維空間中的歐氏距離構(gòu)建軸承性能衰退指標最能體現(xiàn)高維特征之間的相似度。為說明根據(jù)歐氏距離構(gòu)建指標的優(yōu)勢,將歐氏距離與馬氏距離進行對比。歐氏距離只計算特征點之間直線距離,而馬氏距離的建立基于全部特征點。首先,在低維特征空間中,獲取軸承正常樣本域中心,再將樣本數(shù)據(jù)的二維特征點與正常期樣本域中心的距離作為軸承性能衰退指標,結(jié)果如圖4所示,圖4(a)為基于MDS特征的歐氏距離結(jié)果,圖4(b)為基于MDS特征的馬氏距離結(jié)果,圖4(c)為基于t-SNE特征的歐氏距離結(jié)果。
比較圖4(a)與圖4(b),MDS特征的歐氏距離的方差為0.021 7,MDS特征的馬氏距離的方差為0.026 9。馬氏距離波動比歐氏距離大,可能會導致出現(xiàn)異常值,并增加了誤判的可能,這說明歐氏距離更適于建立指標。比較圖4(a)與圖4(c),軸承樣本的損傷程度能夠從基于MDS特征的歐氏距離上有效的反應(yīng),但在圖4(c)中,雖然總體上能夠反應(yīng)軸承退化的趨勢,但是在總體波動太大,對軸承性能評估能力較差,這可能是由于t-SNE算法的非線性變換造成了特征在時序規(guī)律上的變換。圖4(a)中所提出的指標克服了其他方法的缺點,基于MDS特征的歐氏距離更能反應(yīng)出軸承性能退化過程,所以,本文中采用了該方法構(gòu)建指標,首先,將提取的特征通過MDS算法降維,在二維空間中,將各個樣本特征點到正常樣本中心的歐氏距離作為軸承性能衰退指標。
(a) MDS特征的歐氏距離(b) MDS特征的馬氏距離
(c) t-SNE特征的歐氏距離 圖4 降維特征在二維空間的距離Fig.4 Distance of dimensionality reduction feature intwo-dimensional space
為了驗證本文中所構(gòu)建的指標的優(yōu)勢,將所提出的指標,與最常用的均方根進行了比較,如圖5所示。
圖5 均方根指標Fig.5 Root mean square
從圖5中可以看出,均方根指標的噪聲水平和不穩(wěn)定性都比本文中所提出的指標要大。在健康的軸承狀況下,這會導致出現(xiàn)異常值,并增加了在檢測初期退化時發(fā)出錯誤警報的機會。圖5所示的均方根指標在600 h后的幅值變化較難區(qū)分,難以得出軸承早期退化階段的明顯結(jié)論。圖4(a)所示的本文所提出的指標明顯克服了這些缺點,比傳統(tǒng)的均方根指標更有效。比較圖4(a)、圖5,可以得出結(jié)論,本文所提出的指標曲線在區(qū)分軸承的正常,輕微和嚴重退化階段時更為直觀。
本文中所提出的CNN識別模型,共建立19層模型,包括1個輸入層,8個卷積層,8個池化層,1個全連接層,1個輸出層。另外,本文為增加樣本數(shù),抑制模型過擬合,在原始數(shù)據(jù)中加入隨機白噪聲,為提高模型抗干擾能力,并以LReLU函數(shù)和Dropout作為激活函數(shù)。同時,通過批量歸一化(batch normalization,BN)方法對數(shù)據(jù)進行處理。BN層使得輸入到該層的數(shù)據(jù)落入敏感的非線性變換函數(shù)的區(qū)域中,以避免梯度消失。CNN詳細訓練過程見文獻[14]。
數(shù)據(jù)集增強技術(shù)通過增加訓練樣本,已達到增強神經(jīng)網(wǎng)絡(luò)泛化性能的目的,對于軸承振動信號,由于其特有周期性,采用重疊采樣的方法來增加訓練樣本的數(shù)量。另外,神經(jīng)網(wǎng)絡(luò)訓練過程中很容易造成過擬合,導致所得到的網(wǎng)絡(luò)對測試樣本識別效果差,泛化能力弱。在有限的壽命樣本輸入中加入隨機白噪聲,減弱神經(jīng)網(wǎng)絡(luò)的聯(lián)合適應(yīng)性,學習到的特征區(qū)分度大,增強魯棒性。同時,進行訓練時,加入隨機噪聲相當于增加樣本,減少神經(jīng)網(wǎng)絡(luò)過擬合。
常用的激活函數(shù)是ReLU函數(shù)。ReLU函數(shù)解決了Sigmoid函數(shù)部分梯度爆炸和消失的缺點,計算和收斂速度都很快,但是針對軸承信號來說,ReLU函數(shù)將振動信號的負軸特征全部舍去,減弱了模型對軸承壽命狀態(tài)的識別性能。因此,本文采用LeakyReLU(LReLU)函數(shù),LReLU解決了ReLU函數(shù)在輸入為負時產(chǎn)生的梯度消失的問題。另外,針對噪聲干擾問題,模型通過增加Dropout層來增強抗干擾能力。Dropout使得神經(jīng)元節(jié)點之間的關(guān)節(jié)適應(yīng)性的減弱,同時起到類似于數(shù)據(jù)集增強的作用,減少過擬合。因此,原有的ReLU由LReLU和dropout代替,其算法如下:
LReLU(xi)=max(aixi,xi)
(13)
ri~Bernoulli(p)
(14)
yi=ri*LReLU(xi)
(15)
式中:LReLU(·)是Leaky ReLU激活函數(shù);ai是LReLU函數(shù)負半軸斜率;ri是由遵循相同伯努利分布的幾個獨立變量組成的向量;p是某個神經(jīng)元存活的概率。最終,可構(gòu)建軸承壽命狀態(tài)識別模型,其結(jié)構(gòu)如圖6所示。
圖6 軸承壽命狀態(tài)識別模型Fig.6 Bearing life state recognition model
首先,將預處理過的軸承振動信號通過CAE進行處理,自動提取軸承壽命狀態(tài)特征,再將所提取的特征通過MDS進行約簡獲得低維特征,在低維特征空間構(gòu)造歐氏距離作為軸承性能衰退指標。然后,根據(jù)標簽化軸承數(shù)據(jù)訓練改進的CNN軸承壽命狀態(tài)識別模型。在訓練過程中,為抑制過擬合,對原始訓練樣本進行加噪、重疊采樣處理,為提高模型抗干擾能力,將LReLU函數(shù)和Dropout作為激活函數(shù)。
本節(jié)中,將數(shù)據(jù)集2中第2組軸承測試中的第1個軸承的x軸數(shù)據(jù)以證明所提方法的有效性。從測試中捕獲信號,構(gòu)建軸承性能衰退指標,根據(jù)標簽化的數(shù)據(jù)訓練模型。最后,將測試的識別結(jié)果與其他方法的結(jié)果進行比較。
在獲取和處理完之后,將樣本數(shù)據(jù)導入CAE模型進行特征提取。本文中的CAE共9層,參數(shù)見表1。表中,所有Resize層插值方式是雙線性插值。Fully-connection1的結(jié)果作為樣本降維之后的結(jié)果。
圖7為CAE-MDS提取特征后的二維特征分布,顏色越深的區(qū)域為特征點越集中的區(qū)域。本文中,CAE-MDS算法以全壽命的樣本作為輸入,圖7中包含了正常期、衰退期的數(shù)據(jù)。一般來說,軸承信號會有一段較長的正常期,因此,圖7中顏色較深的中心區(qū)域就是正常期軸承信號提取特征后的特征點分布,越向外特征點偏離正常期樣本域中心,進入衰退期。圖7通過CAE-MDS的提取特征方法,有效的展示了正常期、衰退期樣本域的分布情況,使得正常期、衰退期樣本域特征被很好地表征。由圖7可獲得軸承正常期樣本域中心,取該中心作為基準數(shù)據(jù)。在二維中,計算其他樣本與基準數(shù)據(jù)的歐氏距離,即是本文中采用的軸承性能衰退指標,得到圖8。
表1 本研究所提出的CAE模型參數(shù)
在建立軸承壽命狀態(tài)識別模型之前,需要確定衰退期,完成以壽命狀態(tài)為標簽的標簽數(shù)據(jù)。CNN根據(jù)標簽提取衰退期信號中的特征,得到最終的壽命狀態(tài)識別模型。一般情況下,實驗軸承剛開始采集的信號不穩(wěn)定,因此,本文中規(guī)定在實驗開始的第二天到第三天的最大歐氏距離值為閾值,連續(xù)10個歐氏距離值超過閾值的點為衰退期起始點,以實驗結(jié)束時為衰退期結(jié)束點。衰退期起始點為0.03,衰退期結(jié)束點為0.65。在衰退期起始點之前是正常期,衰退期起始點、結(jié)束點之間為衰退期,將整個衰退期按時間均勻的劃分,文中分別劃分了12類和24類,圖9是12類數(shù)據(jù)集的劃分,每類500組數(shù)據(jù),每組4 096個數(shù)據(jù)點,每類都可以的認為是一個退化階段。在固定長度的衰退期內(nèi)劃分的越多,意味著識別難度越大,這是因為類別數(shù)越多,每一類的樣本數(shù)越少,相鄰兩個類別的間隔時間越短,軸承信號的相似度越高,識別難度就越大。
圖9 12類別數(shù)據(jù)集的劃分Fig.9 Classification of 12 categories of data sets
CNN模型各層的參數(shù)見表2。
表2 本研究構(gòu)建的CNN模型參數(shù)
在實驗中使用的所提出的CNN結(jié)構(gòu)由8個卷積和池化層組成,緊接著是全連接層和SoftMax層。實驗使用Google的Tensorflow工具箱實現(xiàn)。第一個卷積內(nèi)核的大小為1×64,合適的第一個卷積內(nèi)核可以起到抗干擾作用[15],其余內(nèi)核大小為1×4,激活函數(shù)為LReLU和Dropout的組合,為了減少運算量在全連接層運用ReLU為激活函數(shù)。池化類型為最大池化,在每個卷積層和完全連接的層之后,批量歸一化用于改善CNN的性能。實驗中分別做了12、24分類模型。
為了證明所提出方法的優(yōu)點,本文使用標準CNN進行比較,還與其他傳統(tǒng)方法來分析相同的數(shù)據(jù)集,包括支持向量機(SVM)、深度置信網(wǎng)絡(luò)(DBN)等,各個方法對軸承磨損程度的識別正確率見表3。
表3 不同分類模型識別正確率
從表3可以看出,本文所提出的方法在0 dB環(huán)境下的正確率比其他傳統(tǒng)方法具有更高的精度。主要原因是CNN相較于BPNN、DBN等神經(jīng)網(wǎng)絡(luò)在提取局部特征上的能力更強,卷積運算使得CNN能夠更加有效地從輸入數(shù)據(jù)中學習細節(jié)特征。CNN相較于SVM傳統(tǒng)智能方法在自動提取復雜特征上的能力更強,傳統(tǒng)智能方法的性能在很大程度上依賴于手動特征提取,在從原始特征集中選擇最敏感的特征或設(shè)計具有優(yōu)異特性的新特征后,其診斷結(jié)果將得到進一步改善,然而,這是一項盲目和主觀的任務(wù)。與部分神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)智能方法相比,CNN的自動特征學習能力更強大。
另外,為驗證所提出改進部分的優(yōu)越性,進行不同噪聲環(huán)境試驗、12分類和24分類試驗,以分析不同模型的性能。為驗證樣本加噪對模型的影響,表4比較了不同噪聲下12分類模型識別正確率。表4中,A表示文中所提出的方法,訓練樣本加噪,12分類,激活函數(shù)中Dropout率為100%,神經(jīng)網(wǎng)絡(luò)節(jié)點全部存活;B表示傳統(tǒng)CNN,訓練樣本加噪,12分類;C表示傳統(tǒng)CNN,訓練樣本未加噪,12分類。傳統(tǒng)CNN的參數(shù)和改進CNN除了激活函數(shù)不一樣,其他的參數(shù)和結(jié)構(gòu)都一致,改進模型的激活函數(shù)是LRULE,傳統(tǒng)CNN模型的激活函數(shù)是RULE。
表4 不同噪聲下12分類模型識別正確率
表4示出了在SNR值為-4 dB~8 dB時,所有模型具有較高的識別準確度。然而,隨著噪聲加強,傳統(tǒng)的CNN模型的準確度顯著降低。當測試樣本的SNR低于1 dB時,傳統(tǒng)的CNN的精度低于50%,而即使在SNR值為-2 dB~8 dB的樣本上進行測試時,所提出的CNN的準確度仍然高于95%。這表明樣本加噪訓練方式有效的抑制了模型過擬合。在0~8 dB環(huán)境下,模型A和模型B的識別率相差僅在0.5%以下,且正確率都在99%以上。為了進一步驗證改進激活函數(shù)對模型的影響,模型進行24分類的測試,結(jié)果見表5。表中,D表示傳統(tǒng)CNN,訓練樣本加噪,24分類;E表示文中所提出的方法,訓練樣本加噪,24分類,激活函數(shù)中Dropout率為80%,節(jié)點存活概率為80%;F表示文中所提出的方法,訓練樣本加噪,24分類,激活函數(shù)中Dropout率為90%,節(jié)點存活概率為90%。
表5 不同噪聲下24分類模型識別正確率
從表5中看出,比較模型D與模型E,無論SNR值處于何值,模型E的正確率均高于模型D,驗證了針對軸承信號,改進后的激活函數(shù)比傳統(tǒng)CNN模型中的ReLU激活函數(shù)更具有優(yōu)越性。比較模型E、模型F,在-4 dB~-2 dB噪聲環(huán)境下,模型F的識別率較高,在0 dB~8 dB噪聲環(huán)境下,模型E的識別率較高。因此,改進激活函數(shù)選擇合適的Dropout率能使模型能夠更好的提取特征,有更好的識別正確率。該結(jié)果驗證了改進模型的優(yōu)越性。
(1) 本文通過CAE與MDS算法完成了軸承壽命狀態(tài)特征的特征與表達,并構(gòu)建了軸承性能衰退指標,再根據(jù)構(gòu)建指標和改進卷積神經(jīng)網(wǎng)絡(luò)建立了軸承壽命狀態(tài)識別模型,實現(xiàn)了軸承壽命狀態(tài)識別。
(2) 針對在噪聲環(huán)境下的軸承信號,LReLU與Dropout組合的激活函數(shù)比ReLU激活函數(shù)更具有優(yōu)越性,提出的帶有Dropout結(jié)構(gòu)的模型相比別的模型對噪聲的容忍度更高,提出的訓練數(shù)據(jù)加噪的方法有效的抑制了神經(jīng)網(wǎng)絡(luò)過擬合問題。
(3) 驗證結(jié)果表明相較于其他模型,所提出軸承壽命狀態(tài)識別模型具有更好的抗干擾能力,能更好實現(xiàn)對軸承實驗數(shù)據(jù)壽命狀態(tài)的識別。