楊 慧,張瑞君,陳國(guó)良
(1.安徽文達(dá)信息工程學(xué)院 智能制造學(xué)院,安徽 合肥 230001;2.西安交通大學(xué) 機(jī)械工程學(xué)院,陜西 西安 710049;3.聯(lián)合傳動(dòng)及軸承技術(shù)研究中心,寧夏 石嘴山 753000)
滾動(dòng)軸承是旋轉(zhuǎn)設(shè)備的重要部件,軸承運(yùn)行狀態(tài)直接影響整個(gè)設(shè)備的使用壽命,及時(shí)準(zhǔn)確地識(shí)別出軸承故障具有重要意義[1]。
目前,基于機(jī)器學(xué)習(xí)的軸承故障診斷方法得到了廣泛應(yīng)用[2,3]。SOUALHI A等人[4]采用了改進(jìn)蟻群算法,優(yōu)化了支持向量機(jī),從而對(duì)軸承進(jìn)行了故障識(shí)別,取得了較高的故障識(shí)別準(zhǔn)確率;但蟻群算法存在效率較低的缺陷。BAZAN G H等人[5]將信息論引入了軸承振動(dòng)信號(hào)分析中;但信息論依賴專家經(jīng)驗(yàn),缺乏自適應(yīng)性。
由此可見(jiàn),基于機(jī)器學(xué)習(xí)模型的軸承故障診斷方法需要借助復(fù)雜的信號(hào)處理算法提取相關(guān)特征,從而限制了機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用范圍。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)能自動(dòng)從信號(hào)中學(xué)習(xí)故障判別性特征,因而也得到了廣泛應(yīng)用。HOANG D T等人[6]利用CNN,結(jié)合信息融合技術(shù),對(duì)滾動(dòng)軸承故障進(jìn)行了有效地診斷;但CNN受噪聲影響較大,網(wǎng)絡(luò)收斂速度較慢。KAO I H等人[7]利用一維CNN進(jìn)行了軸承自動(dòng)故障診斷,取得了97%以上的診斷準(zhǔn)確率;但CNN抗噪能力較差。
基于CNN的軸承故障診斷研究雖然取得了一定成果,但模型普遍缺乏判別特征的學(xué)習(xí)機(jī)制,難以學(xué)習(xí)判別性故障特征[8]。若直接將軸承原始振動(dòng)信號(hào)輸入卷積神經(jīng)網(wǎng)絡(luò),環(huán)境噪聲的存在會(huì)降低卷積神經(jīng)網(wǎng)絡(luò)的故障診斷準(zhǔn)確率[9]。
而Laplace小波與軸承故障振動(dòng)信號(hào)形狀相似,適合作為振動(dòng)信號(hào)濾波前處理方法。
因此,筆者將Laplace小波和改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)-雙向門控循環(huán)單元(improved convolutional neural network-bi-directional gated recurrent unit,ICNN-BiGRU)模型結(jié)合,提出了一種滾動(dòng)軸承故障診斷模型(方法)。
筆者首先使用Laplace小波對(duì)振動(dòng)信號(hào)進(jìn)行相關(guān)濾波,并進(jìn)行功率譜變換;然后,利用ICNN-BiGRU自動(dòng)提取功率譜特征;最后,采用西安交通大學(xué)-昇陽(yáng)科技聯(lián)合實(shí)驗(yàn)室(XJTU-SY)滾動(dòng)軸承加速壽命試驗(yàn)數(shù)據(jù)集,對(duì)提出ICNN-BiGRU模型進(jìn)行驗(yàn)證。
Laplace小波表達(dá)式如下:
Ψ(ω,ζ,τ,t)=
(1)
式中:ξ—阻尼比;τ—時(shí)間參數(shù);Ws—小波支撐區(qū)間。
由于ω=2πf,f的大小決定了小波振蕩頻率的快慢。
定義向量F、Z和T分別為:
F={f1,f2,…fm}
Z={ξ1,ξ2,…ξn}
T={τ1,τ2,…τp}
(2)
Laplace小波濾波可看作從基函數(shù)庫(kù)ψ中選擇與故障信號(hào)最為相似的波形所對(duì)應(yīng)的參數(shù),參數(shù)滿足下式:
ψ={ψγ:γ∈Γ}={ψ(f,ξ,τ,t):f∈F,ξ∈Ζ,τ∈T}
(3)
Laplace小波與x(t)的內(nèi)積公式為:
〈ψγ(t),x(t)〉=‖ψγ‖2‖x‖2cosθ
(4)
x(t)與ψγ(t)的相似度計(jì)算如下:
(5)
當(dāng)Kr最大時(shí),Laplace小波的波形與軸承故障信號(hào)最相似,然后做出每個(gè)時(shí)刻相關(guān)系數(shù)Kr峰值的功率譜,進(jìn)而完成相關(guān)濾波[10]。
輸入層將信號(hào)每隔M點(diǎn)采集一次,連續(xù)采集N次生成一個(gè)子段,最后將信號(hào)分割為M段,每段N個(gè)數(shù)據(jù)點(diǎn)。
筆者對(duì)每段信號(hào)進(jìn)行Laplace小波相關(guān)濾波,然后得到功率譜,輸入層數(shù)據(jù)結(jié)構(gòu)如下:
X=[x1,x2,x3,…,xM]
(6)
式中:X—模型輸入;xi—功率譜。
1維卷積層對(duì)輸入X在第j個(gè)卷積核處的計(jì)算公式sj如下:
sj=[sj(1),sj(2),…,sj(N-FL+1)]
(7)
式中:FL—卷積核長(zhǎng)度。
其中:
(8)
式中:Hjc—第j個(gè)卷積核的第c通道;fj—第j個(gè)卷積核的激活函數(shù);bj—第j個(gè)卷積核偏置,q:q+FL-1—第q個(gè)卷積區(qū)域。
其中:
q∈[1,2,…,N-FL-1]
(9)
輸入X在第1卷積層的輸出向量S計(jì)算如下:
S=[s1,s2,…,sFN]
(10)
池化操作提取特征如下:
Z=[z1,z2,…,zFN]
(11)
zj=[zj(1),zj(2),…,zj(Np)]
(12)
zj(v)=max(sj(v-1)K+1,…sj(vK))
(13)
式中:zj—池化層輸出;K—池化長(zhǎng)度。
動(dòng)態(tài)選擇(dynamic selection,DS)能自動(dòng)選擇特征向量中有用的通道信息,進(jìn)一步提高模型的特征學(xué)習(xí)能力。DS層包括1個(gè)平均池化層和2個(gè)全連接層。
特征向量Z通過(guò)平均池化層得到C為:
C=[c1,c2,…,cFN]
(14)
其中:
(15)
C通過(guò)2個(gè)全連接層,生成一個(gè)包含不同權(quán)重的信息通道段d,計(jì)算如下:
d=f(U2f(U1C+b1)+b2)
(16)
式中:U1,U2—權(quán)重矩陣;b1,b2—偏置;f—激活函數(shù)。
筆者將d與Z進(jìn)行通道式相乘操作,獲得新的特征向量M,如下:
M=d?Z=[m1,m2,…,mFN],mj∈RNp
(17)
式中:?—對(duì)應(yīng)通道相乘。
DS過(guò)程如圖1所示。
圖1 DS過(guò)程
雙向門控循環(huán)單元(bi-directional gated recurrent unit,BiGRU)結(jié)構(gòu),如圖2所示。
圖2 BiGRU層結(jié)構(gòu)
隱藏狀態(tài)ht計(jì)算如下:
(18)
(19)
(20)
式中:V—隱藏狀態(tài)權(quán)值矩陣;W—輸入信息權(quán)值矩陣;ht—t時(shí)刻隱藏狀態(tài)。
自注意力(self-attention,SA)機(jī)制可調(diào)整不同特征向量的注意力權(quán)重,以弱化冗余特征信息,保留目標(biāo)特征。
SA模型結(jié)構(gòu)如圖3所示。
圖3 SA模型結(jié)構(gòu)
SA層通過(guò)柔性最大函數(shù)(soft version of max,SoftMax)后,計(jì)算公式如下:
(21)
式中:ht—特征向量;q—查詢向量;F—評(píng)分函數(shù)。
F計(jì)算如下:
(22)
當(dāng)分段特征概率分布生成時(shí),整個(gè)SA輸出如下:
(23)
式中:αt—注意力分布。
筆者將特征向量v輸入全連接層后使用SoftMax函數(shù),實(shí)現(xiàn)故障診斷,計(jì)算如下:
e=f(Wrv+br)
(24)
y=SoftMax(Wfe+bf)
(25)
式中:f—ReLU激活函數(shù);Wr,Wf—全連接層權(quán)重矩陣;br,bf—全連接層偏置。
ICNN-BiGRU故障診斷的步驟如下:
(1)使用加速度傳感器采集軸承振動(dòng)信號(hào);
(2)對(duì)信號(hào)進(jìn)行樣本劃分;
(3)使用Laplace小波對(duì)樣本進(jìn)行相關(guān)濾波得到功率譜;
(4)將信號(hào)功率譜樣本輸入模型框架進(jìn)行訓(xùn)練,即首先通過(guò)2個(gè)1維卷積層和2個(gè)最大池化層提取功率譜特征;其次為突出有效信息通道,在每1個(gè)最大池化層后,構(gòu)造一個(gè)DS層;然后,將提取的特征通過(guò)BiGRU層,考慮到BiGRU層輸出的特征向量不一定對(duì)軸承故障識(shí)別都具有同等貢獻(xiàn),引入SA層調(diào)整不同特征向量的注意力權(quán)重,過(guò)濾冗余特征,保留目標(biāo)特征;最后,堆疊1個(gè)全連接層和1個(gè)輸出層實(shí)現(xiàn)軸承多故障診斷。
ICNN-BiGRU框架如圖4所示。
圖4 ICNN-BiGRU模型框架
為了驗(yàn)證模型有效性,筆者采用XJTU-SY軸承加速壽命試驗(yàn)數(shù)據(jù)進(jìn)行驗(yàn)證,試驗(yàn)臺(tái)如圖5所示。
圖5 軸承試驗(yàn)臺(tái)
試驗(yàn)臺(tái)主要由電機(jī)、轉(zhuǎn)速控制器、加速度傳感器和測(cè)試軸承等組成。
其中,2個(gè)加速度傳感器分別安裝在測(cè)試軸承的垂直和水平方向,測(cè)試軸承型號(hào)為UER204,電機(jī)轉(zhuǎn)速為2 400 r/min,徑向力10 kN,采樣頻率25.6 kHz,采樣間隔1 min,每次采樣時(shí)長(zhǎng)1.28 s。
軸承參數(shù)如表1所示。
表1 軸承參數(shù)
軸承加速壽命試驗(yàn)結(jié)束后,軸承3_1出現(xiàn)了外圈故障,軸承3_2出現(xiàn)了滾動(dòng)體故障,軸承3_4出現(xiàn)內(nèi)圈故障,因此,筆者采用軸承3_1、3_2和3_4的全壽命周期數(shù)據(jù)進(jìn)行分析。
文獻(xiàn)[11]中,將軸承3_1全壽命數(shù)據(jù)中第525、2 350、2 475和2 538(單位:mm)對(duì)應(yīng)的4組數(shù)據(jù)作為4種軸承狀態(tài)(正常、外圈輕微故障、外圈中度故障、外圈重度故障),將軸承3_2全壽命數(shù)據(jù)中第1 279、1 362和1 642(單位:min)對(duì)應(yīng)的3組數(shù)據(jù)作為3種軸承狀態(tài)(滾動(dòng)體輕度故障、滾動(dòng)體中度故障和滾動(dòng)體重度故障);同時(shí),將軸承3_4全壽命數(shù)據(jù)中第1 417、1 445和1 479(單位:min)對(duì)應(yīng)的3組數(shù)據(jù)作為其他3種軸承狀態(tài)(內(nèi)圈輕度故障、內(nèi)圈中度故障和內(nèi)圈重度故障),共10種軸承狀態(tài)。
筆者采用滑動(dòng)分割方法對(duì)樣本進(jìn)行劃分(每個(gè)樣本的長(zhǎng)度和滑動(dòng)分割的步長(zhǎng)分別為2 048和28,共10 500個(gè)樣本數(shù)據(jù)),最后對(duì)樣本數(shù)據(jù)預(yù)處理進(jìn)行標(biāo)準(zhǔn)化操作;對(duì)于每種故障信號(hào),選取80%作為訓(xùn)練集,剩余20%作為測(cè)試集。
軸承故障數(shù)據(jù)集詳細(xì)描述如表2所示。
表2 軸承故障數(shù)據(jù)集詳細(xì)描述
10種軸承狀態(tài)的時(shí)域波形如圖6所示。
圖6 10種工況信號(hào)時(shí)域波形
由圖6可知:軸承振動(dòng)信號(hào)的時(shí)域圖受噪聲干擾嚴(yán)重,難以直接進(jìn)行軸承故障工況辨識(shí)。以工況h為例,經(jīng)計(jì)算軸承滾動(dòng)體的故障特征頻率f0約125 Hz,功率譜如圖7所示。
圖7 工況h振動(dòng)信號(hào)功率譜
由圖7可知:功率譜中故障頻率被噪聲淹沒(méi),難以進(jìn)行故障診斷。將Laplace小波原子參數(shù)設(shè)置為F={2 500∶30∶3 500},Z={{0.005∶0.005∶0.2}U{0.3∶0.1∶0.9},T={0∶0.001∶0.1},Laplace小波相關(guān)濾波后的功率譜如圖8所示。
圖8 Laplace小波相關(guān)濾波后的功率譜
由圖8可知故障頻率及其2倍頻,由此證明,Laplace小波相關(guān)濾波法是有效的。
ICNN-BiGRU模型的參數(shù)如表3所示。
表3 ICNN-BiGRU模型的參數(shù)
筆者討論DS模塊對(duì)模型識(shí)別性能的影響,為此建立包含3個(gè)、2個(gè)、1個(gè)、0個(gè)DS層的4種結(jié)構(gòu),分別記作:3DS,2DS,1DS和0DS。
在試驗(yàn)過(guò)程中,筆者通過(guò)在信號(hào)中加入高斯白噪聲干擾,均采用Laplace小波相關(guān)濾波法作為信號(hào)前處理方法。
在高斯白噪聲為-5 dB情況下,DS模塊有效性試驗(yàn)結(jié)果如表4所示。
表4 DS模塊有效性試驗(yàn)結(jié)果
表4中,當(dāng)DS模塊數(shù)量為2時(shí),模型性能最高;當(dāng)繼續(xù)增加DS模塊數(shù)量時(shí),模型性能下降(原因可能是過(guò)多的DS模塊導(dǎo)致模型過(guò)擬合);2DS比0DS的準(zhǔn)確率增加近7%,表明DS模塊可通過(guò)增強(qiáng)某些特征通道有效提高網(wǎng)絡(luò)的特征學(xué)習(xí)能力,從而使整個(gè)網(wǎng)絡(luò)具有更好的性能。
為了進(jìn)一步理解DS模塊的內(nèi)部運(yùn)行過(guò)程,筆者對(duì)通道向量的輸出進(jìn)行可視化,DS層通道向量輸出特征圖如圖9所示。
圖9 DS層通道向量輸出特征圖
圖9中:DS模塊會(huì)抑制模型無(wú)用的特征通道,增強(qiáng)有用的特征通道。尤其是第2個(gè)DS模塊,只選擇幾個(gè)特征通道,但性能卻得到了有效提升,進(jìn)一步證明采用DS模塊進(jìn)行通道特征選擇的有效性。
在高斯白噪聲為-5 dB情況下,筆者驗(yàn)證SA層對(duì)模型故障識(shí)別性能的影響。同樣,試驗(yàn)建立2種網(wǎng)絡(luò)結(jié)構(gòu),即0SA和1SA。
驗(yàn)證結(jié)果如表5所示。
表5 SA層試驗(yàn)結(jié)果 (%)
表5中,1SA比0SA的故障診斷準(zhǔn)確率增加了約4.2%,并非所有特征對(duì)于故障診斷都有效;移除SA層后,網(wǎng)絡(luò)最后輸出的每個(gè)特征都具有相同的概率權(quán)重,無(wú)法過(guò)濾冗余特征,從而導(dǎo)致性能下降。
筆者對(duì)SA層輸出權(quán)重概率進(jìn)行可視化,如圖10所示。
圖10 SA層輸出權(quán)重概率
圖10中:當(dāng)軸承處于正常工況時(shí),注意力概率權(quán)重分布在大多數(shù)序列段,這表明大部分序列對(duì)于故障識(shí)別的輸出貢獻(xiàn)基本相同;當(dāng)軸承處于滾動(dòng)體故障工況時(shí),注意力概率權(quán)重分散在少數(shù)序列段,這表明這些少數(shù)序列對(duì)于最終的輸出結(jié)果起著重要作用。
筆者首先在不同噪聲環(huán)境下,將ICNN-BiGRU與正交正則化一維卷積神經(jīng)網(wǎng)絡(luò)(orthogonal regularization 1D convolutional neural network,OR1D-CNN)[12]、貝葉斯優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)(bayesian optimization convolutional neural network,BOCNN)[13]和改進(jìn)門控循環(huán)單元網(wǎng)絡(luò)(modified gated recurrent unit network,MGRU)[14]的性能進(jìn)行比較;信號(hào)濾波方法均為L(zhǎng)aplace小波相關(guān)濾波法。
不同深層網(wǎng)絡(luò)模型故障識(shí)別率均值對(duì)比結(jié)果,如表6所示。
表6 不同深層網(wǎng)絡(luò)模型故障識(shí)別率均值對(duì)比 (%)
表6中:隨噪聲強(qiáng)度的增加,各模型性能都有所下降,但是ICNN-BiGRU模型的準(zhǔn)確率要顯著好于其他3種模型,特別是在SNB=-5 dB時(shí),ICNN-BiGRU模型的準(zhǔn)確率仍達(dá)到了93.13%。
對(duì)比實(shí)驗(yàn)結(jié)果證明,ICNN-BiGRU模型在不同噪聲背景下具有優(yōu)越的診斷性能[15]。
第1次試驗(yàn)結(jié)果的多分類混淆矩陣如圖11所示。
圖11 第1次測(cè)試結(jié)果的混淆矩陣
圖11中:10種軸承診斷準(zhǔn)確率均達(dá)到99%以上。
然后,筆者在不同噪聲環(huán)境下,將Laplace小波相關(guān)濾波(Laplace wavelet correlation filtering,LWCL)與Morlet小波相關(guān)濾波(morlet wavelet correlation filtering,MWCL)[16]和Morlet連續(xù)小波變換濾波(morlet continuous wavelet transform filtering,MCWTL)[17]的性能進(jìn)行比較。
不同濾波方法的故障識(shí)別率均值對(duì)比結(jié)果,如表7所示。
表7 不同濾波方法的故障識(shí)別率均值對(duì)比 (%)
表7中:LWCL作為信號(hào)前處理方法時(shí),模型的準(zhǔn)確率優(yōu)于其他2種濾波方法。對(duì)比試驗(yàn)結(jié)果表明:Laplace小波能為ICNN-BiGRU提供更為優(yōu)秀的訓(xùn)練樣本。
以MWCL方法為例,經(jīng)MWCL處理后工況h信號(hào)的功率譜,如圖12所示。
圖12 MWCF處理后信號(hào)的功率譜
圖12中:經(jīng)MWCF處理后的信號(hào)功率譜只能提取到轉(zhuǎn)頻,且功率譜中分布著大量噪聲頻率分量,難以為ICNN-BiGRU提供優(yōu)秀的訓(xùn)練樣本。
為驗(yàn)證不同轉(zhuǎn)速和負(fù)載下的模型診斷性能,筆者根據(jù)西安交大-昇陽(yáng)軸承加速壽命試驗(yàn)數(shù)據(jù)集,取3大類工況進(jìn)行分析。
軸承加速壽命試驗(yàn)工況如表8所示。
表8 軸承加速壽命試驗(yàn)工況
表8共有3種軸承狀態(tài),分別為:軸承Bearing 1_2對(duì)應(yīng)1種軸承狀態(tài)(外圈輕微故障),軸承Bearing 2_3對(duì)應(yīng)1種軸承狀態(tài)(保持架輕微故障),Bearing3_3對(duì)應(yīng)1種軸承狀態(tài)(內(nèi)圈輕微故障)。
筆者同樣采用滑動(dòng)分割方法對(duì)其進(jìn)行樣本劃分,每個(gè)樣本的長(zhǎng)度和滑動(dòng)分割的步長(zhǎng)分別為2 048和28,得到10 500個(gè)樣本數(shù)據(jù),選取80%作為訓(xùn)練集,剩余20%作為測(cè)試集。
筆者將ICNN-BiGRU與3.4節(jié)所列出的OR1D-CNN、BOCNN和MGRU模型性能進(jìn)行比較,驗(yàn)證結(jié)果的均值如表9所示。
表9 不同深層網(wǎng)絡(luò)模型故障識(shí)別率對(duì)比 (%)
表9中:在不同轉(zhuǎn)速不同負(fù)載工況下,ICNN-BiGRU模型的診斷準(zhǔn)確率顯著好于其他3種網(wǎng)絡(luò)模型,對(duì)比實(shí)驗(yàn)結(jié)果證明,ICNN-BiGRU模型在不同轉(zhuǎn)速負(fù)載工況下有優(yōu)越的診斷性能。
為了解決噪聲環(huán)境下滾動(dòng)軸承故障識(shí)別率較低的問(wèn)題,筆者首先利用Laplace小波優(yōu)越的降噪能力,對(duì)軸承振動(dòng)信號(hào)進(jìn)行了相關(guān)濾波降噪;然后,利用ICNN-BiGRU的自動(dòng)特征提取能力與故障識(shí)別能力,對(duì)滾動(dòng)軸承故障進(jìn)行了診斷;最后,通過(guò)測(cè)試數(shù)據(jù)對(duì)試驗(yàn)結(jié)果進(jìn)行了驗(yàn)證。
研究結(jié)論如下:
(1)基于Laplace小波降噪的ICNN-BiGRU模型識(shí)別準(zhǔn)確率達(dá)99.65%,相比基于Morlet小波降噪高出近2.4%,Laplace小波作為信號(hào)的前處理方法能為ICNN-BiGRU模型提供了優(yōu)秀的訓(xùn)練樣本;
(2)ICNN-BiGRU模型通過(guò)引入動(dòng)態(tài)選擇DS模塊能有效抑制模型的無(wú)用通道信息,增強(qiáng)了模型特征學(xué)習(xí)能力;并通過(guò)引入自注意力機(jī)制SA對(duì)信號(hào)序列的特征段進(jìn)行了有效篩選,進(jìn)一步增強(qiáng)了模型的特征提取能力。
在后續(xù)的研究中,筆者將進(jìn)一步優(yōu)化Laplace小波濾波方法和ICNN-BiGRU更為有效的優(yōu)化方法,以滿足軸承大數(shù)據(jù)時(shí)代的智能化故障識(shí)別的需求。