秦國(guó)浩 張 楷,2 丁 昆 黃鋒飛 鄭 慶,2 丁國(guó)富,2
1.西南交通大學(xué)機(jī)械工程學(xué)院,成都,6100312.西南交通大學(xué)軌道交通運(yùn)維技術(shù)與裝備四川省重點(diǎn)實(shí)驗(yàn)室,成都,610031
軸承作為旋轉(zhuǎn)機(jī)械的關(guān)鍵零部件之一,其運(yùn)行狀態(tài)直接影響著機(jī)械裝備的運(yùn)行狀態(tài)[1]。在長(zhǎng)期的運(yùn)行過(guò)程中軸承承受交變載荷和疲勞損傷,易產(chǎn)生磨損、點(diǎn)蝕、剝落等破壞,以致機(jī)械設(shè)備停機(jī),造成巨大經(jīng)濟(jì)損失和人員傷亡等危害[2]。因此,狀態(tài)信號(hào)監(jiān)測(cè)和智能診斷對(duì)軸承長(zhǎng)期健康運(yùn)行具有重要研究意義和應(yīng)用價(jià)值[3]。
以支持向量機(jī)、淺層神經(jīng)網(wǎng)絡(luò)等為代表的傳統(tǒng)機(jī)器學(xué)習(xí)故障診斷方法是將獲取的軸承振動(dòng)信號(hào)進(jìn)行人工特征提取和篩選,然后通過(guò)分類(lèi)器對(duì)軸承健康狀態(tài)進(jìn)行識(shí)別。如楊宇等[4]使用經(jīng)驗(yàn)?zāi)B(tài)分解方法提取軸承故障特征進(jìn)行診斷,完成了對(duì)軸承工作狀態(tài)和故障類(lèi)別的有效精確識(shí)別,但是此類(lèi)方法存在依賴(lài)專(zhuān)家經(jīng)驗(yàn)、非線性特征提取能力差、故障診斷精度不足等問(wèn)題。隨著計(jì)算能力的提高和人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)因其強(qiáng)大的非線性特征自適應(yīng)提取能力受到機(jī)械故障診斷領(lǐng)域的廣泛研究[5]。例如,侯文擎等[6]在自編碼網(wǎng)絡(luò)中引入“稀疏”和“損傷加噪”構(gòu)成了DAE(denosing autoencoder)網(wǎng)絡(luò),提取的數(shù)據(jù)特征魯棒性強(qiáng);趙光權(quán)等[7]使用深度置信網(wǎng)絡(luò)對(duì)原始時(shí)域信號(hào)直接進(jìn)行故障提取和健康狀況識(shí)別,取得了較高的診斷精度。然而,上述神經(jīng)網(wǎng)絡(luò)局部特征提取能力較弱,無(wú)法高效提取數(shù)據(jù)深層表示特征,制約了其在工業(yè)中的應(yīng)用與發(fā)展。卷積神經(jīng)網(wǎng)絡(luò)為解決此問(wèn)題而設(shè)計(jì)的局部感知和權(quán)值共享能有效減少模型參數(shù)量、抑制過(guò)擬合。一些學(xué)者也針對(duì)一維振動(dòng)信號(hào)作為輸入的軸承故障診斷任務(wù)進(jìn)行了適應(yīng)性改進(jìn)[8-9]。
近年來(lái),卷積神經(jīng)網(wǎng)絡(luò)已成為軸承故障診斷主要智能算法框架之一,許多學(xué)者從不同方面對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了大量改進(jìn),以提高其故障診斷精度。在深度學(xué)習(xí)理論中,通常認(rèn)為網(wǎng)絡(luò)層數(shù)的增加有利于深層非線性抽象特征的提取。趙小強(qiáng)等[10]在軸承故障診斷中引入神經(jīng)網(wǎng)絡(luò)Alexnet,并將一維振動(dòng)信號(hào)按橫向插樣構(gòu)建為二維特征圖以保留軸承故障信息卷積運(yùn)算時(shí)域信號(hào)的關(guān)聯(lián)性;趙宇凱等[11]使用連續(xù)的3×3卷積核替代原本的卷積核,再反復(fù)疊加卷積層和池化層增加網(wǎng)絡(luò)的深度,使得該方法能夠更好地提取滾動(dòng)軸承振動(dòng)信號(hào)的更深層特征;溫江濤等[12]使用堆疊的一維卷積自編碼的殘差結(jié)構(gòu),搭建無(wú)監(jiān)督領(lǐng)域自適應(yīng)的遷移學(xué)習(xí)網(wǎng)絡(luò)模型,較好地實(shí)現(xiàn)了源域到目標(biāo)域特征知識(shí)遷移,提高了軸承故障診斷精度。然而,當(dāng)網(wǎng)絡(luò)層數(shù)超過(guò)一定范圍后,網(wǎng)絡(luò)輸入或梯度信息在傳播過(guò)程中可能會(huì)消失,進(jìn)而導(dǎo)致模型診斷能力下降甚至失效。深度殘差網(wǎng)絡(luò)(deep residual network,ResNet)通過(guò)引入跨層連接擬合殘差項(xiàng)有效解決了深度神經(jīng)網(wǎng)絡(luò)深度增加所帶來(lái)的梯度消失和梯度爆炸等問(wèn)題[13]。趙靖等[14]使用殘差注意力卷積神經(jīng)網(wǎng)絡(luò)方法,有效提取源域故障特征,提高了遷移學(xué)習(xí)方法下的軸承故障診斷精度。除了增加網(wǎng)絡(luò)層數(shù),也可將跨層連接擴(kuò)展至所有層直接相連,以進(jìn)一步確保網(wǎng)絡(luò)中各層之間的最大信息流傳遞[15]。熊鵬等[16]結(jié)合動(dòng)態(tài)加權(quán)密集連接卷積網(wǎng)絡(luò)對(duì)不同頻帶信息自適應(yīng)加權(quán),加強(qiáng)了密集連接卷積網(wǎng)絡(luò)對(duì)變轉(zhuǎn)速工況的特征表征能力,提高了變轉(zhuǎn)速下故障識(shí)別率。此外,為使信息感知多樣化,采用多尺度卷積設(shè)計(jì)是一種可行的方案。如吳靜然等[17]針對(duì)噪聲條件下故障識(shí)別準(zhǔn)確率偏低的問(wèn)題,提出了一種基于注意力機(jī)制的多尺度端到端故障診斷方法;趙小強(qiáng)等[18]也通過(guò)引入Inception網(wǎng)絡(luò)結(jié)構(gòu)和注意力機(jī)制對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),使網(wǎng)絡(luò)能最大化地提取故障數(shù)據(jù)中的信息。
以上針對(duì)卷積神經(jīng)網(wǎng)絡(luò)及擴(kuò)展網(wǎng)絡(luò)的改進(jìn)方法在軸承故障診斷中取得了較好的效果,但在實(shí)際工程中,往往不能直接對(duì)軸承振動(dòng)進(jìn)行接觸測(cè)量,一些微弱早期故障信號(hào)在傳遞過(guò)程中易受到相關(guān)部件運(yùn)行噪聲干擾,使得其故障特征淹沒(méi)在噪聲中[19]。而現(xiàn)有診斷模型特征提取范圍仍受其卷積核感受野大小的制約,統(tǒng)一尺度的卷積核也難以充分捕捉軸承故障振動(dòng)信號(hào)中的不同沖擊頻率成分,進(jìn)而阻礙故障診斷準(zhǔn)確率的進(jìn)一步提高。本文提出一種基于動(dòng)態(tài)寬卷積殘差網(wǎng)絡(luò)(dynamic wide-kernels residual network,DWResNet)的軸承故障診斷方法,該方法在一維深度殘差網(wǎng)絡(luò)基礎(chǔ)上引入寬殘差核結(jié)構(gòu)形成雙通道并行網(wǎng)絡(luò)結(jié)構(gòu),并通過(guò)注意力機(jī)制對(duì)卷積核進(jìn)行動(dòng)態(tài)加權(quán),自適應(yīng)地充分提取不同尺度特征信息,以實(shí)現(xiàn)強(qiáng)噪聲背景下軸承故障的高精度診斷。
卷積層是卷積神經(jīng)網(wǎng)絡(luò)中最為核心的組成部分,每一個(gè)卷積層都由多個(gè)卷積核組合而成。相較于全連接網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)具有數(shù)據(jù)局部感知和權(quán)值參數(shù)共享等優(yōu)勢(shì),能夠有效減少網(wǎng)絡(luò)的參數(shù)量。在輸入的振動(dòng)信號(hào)數(shù)據(jù)上,卷積核通過(guò)滑動(dòng)不同的步長(zhǎng)來(lái)提取相應(yīng)位置的局部特征。同時(shí),可以使用一個(gè)卷積核來(lái)提取不同位置的同類(lèi)局部特征進(jìn)行權(quán)值共享,從而實(shí)現(xiàn)卷積網(wǎng)絡(luò)中參數(shù)量的有效利用。卷積的運(yùn)算可表示為
(1)
式中,Xl為第l層的輸出;W(c)為第c個(gè)卷積核的權(quán)重矩陣;*為卷積運(yùn)算;b為權(quán)重偏置。
為了使得卷積層具有不同的感受野,可通過(guò)設(shè)置不同的卷積核大小來(lái)實(shí)現(xiàn)。卷積核感受野的計(jì)算公式為
(2)
式中,Ll為第l層對(duì)應(yīng)的感受野大小;kl為第l層的卷積核大小;si為第i層的移動(dòng)步長(zhǎng)。
空洞卷積就是在標(biāo)準(zhǔn)的卷積中加入空洞,擴(kuò)大卷積層的感受野,且不失對(duì)特征的分辨提取能力。在不增加卷積層層數(shù)的前提下,通過(guò)設(shè)置不同的空洞率,形成不同感受野大小的空洞卷積。
假設(shè)原來(lái)第l-1層的卷積核大小為kl-1,則卷積核空洞率為d的一層空洞卷積的感受野大小Ll為
Ll=kl-1+(kl-1-1)(d-1)
(3)
假設(shè)空洞卷積的步長(zhǎng)為s,那么經(jīng)過(guò)空洞卷積后的特征圖大小m的計(jì)算公式為
(4)
式中,x為當(dāng)前層的輸入;p為填充操作的尺寸。
通過(guò)設(shè)置不同的空洞率d使得原本的卷積核擁有更大的感受野,同時(shí)配合填充操作,使得輸出的特征圖大小m能夠與原卷積層輸出的特征圖大小一致,從而保證不同卷積核輸出的特征圖能夠進(jìn)行信息融合。
對(duì)于一維的滾動(dòng)軸承振動(dòng)信號(hào),通過(guò)設(shè)置空洞卷積能夠使得網(wǎng)絡(luò)在提取不同特征區(qū)間有效信息的同時(shí)保證網(wǎng)絡(luò)參數(shù)量的緩慢增長(zhǎng)。
ResNet的提出使得在網(wǎng)絡(luò)深度增加的同時(shí)獲得更高的收益成為可能。ResNet不是直接學(xué)習(xí)多層堆疊的函數(shù)擬合的直接映射,而是學(xué)習(xí)它們的殘差映射。圖1展示了一個(gè)標(biāo)準(zhǔn)的殘差結(jié)構(gòu)(x表示輸入,σ表示激活函數(shù)),通過(guò)學(xué)習(xí)F(x)函數(shù)的殘差映射而非直接映射F(x)+x來(lái)有效減少網(wǎng)絡(luò)由于深度增加帶來(lái)的梯度問(wèn)題以及對(duì)直接映射的過(guò)擬合問(wèn)題。
圖1 標(biāo)準(zhǔn)的殘差塊Fig.1 Residual block
ResNet模型的核心部分由許多基本的殘差塊堆疊而成,如圖2所示。每一個(gè)基本殘差塊中,均由兩個(gè)卷積層、兩個(gè)ReLU[20]激活函數(shù)、兩個(gè)批量正則化(batch normalization,BN)[21]和一個(gè)恒等映射連接而成。當(dāng)前后通道數(shù)發(fā)生改變時(shí),通過(guò)一個(gè)圖2b所示的卷積層來(lái)適配改變的通道數(shù)。其中,采用BN層的目的是為了加快網(wǎng)絡(luò)收斂,提高網(wǎng)絡(luò)的泛化性,它的計(jì)算公式如下[21]:
(5)
式中,E[x]為x的期望;Var[x]為x的方差;γ、β均為可訓(xùn)練的超參數(shù);ε為一個(gè)趨近于0的常量。
ReLU是常見(jiàn)的激活函數(shù),其主要作用是減小網(wǎng)絡(luò)計(jì)算量,緩解過(guò)擬合,其計(jì)算公式如下:
(6)
通過(guò)上述殘差連接的結(jié)構(gòu)可使得網(wǎng)絡(luò)向更深的層次發(fā)展,同時(shí)也能一定程度地緩解網(wǎng)絡(luò)的退化、梯度消失和梯度爆炸等問(wèn)題。
為了使得網(wǎng)絡(luò)更易于提取振動(dòng)信號(hào)的特征信息,減少信號(hào)強(qiáng)噪聲干擾所帶來(lái)的影響,本文提出了動(dòng)態(tài)寬卷積殘差網(wǎng)絡(luò)對(duì)軸承振動(dòng)信號(hào)進(jìn)行學(xué)習(xí)。具體來(lái)說(shuō),本文首先在殘差網(wǎng)絡(luò)的基礎(chǔ)上,對(duì)殘差塊的每層卷積進(jìn)行改進(jìn),然后引入可選擇核網(wǎng)絡(luò)(selective kernel networks,SKNet)[22]中可選擇性操作進(jìn)行改進(jìn),使得網(wǎng)絡(luò)能夠在3×1的卷積核和寬核的空洞卷積之間進(jìn)行自適應(yīng)的選擇,最后按照不同的權(quán)重融合兩個(gè)不同卷積核的輸出特征作為每層的輸出特征進(jìn)行學(xué)習(xí)。
本文所提方法的單層結(jié)構(gòu)如圖3所示,對(duì)于任意一個(gè)給定的特征圖輸入X(X∈RC×H×W,C為輸入數(shù)據(jù)的維度,H、W分別為輸入數(shù)據(jù)的高和寬),將其同時(shí)輸入到兩個(gè)卷積核大小分別為3×1和空洞率d為14的3×1空洞卷積中,使其在擴(kuò)大感受野的同時(shí)減少參數(shù)量的增長(zhǎng)。在經(jīng)過(guò)兩個(gè)卷積變換之后得到兩個(gè)特征圖:
UA=FA(X)
(7)
UB=FB(X)
(8)
其中,F為對(duì)應(yīng)的卷積變換函數(shù)。然后,將得到的兩個(gè)卷積核大小不同(其中一個(gè)為寬卷積核)的特征圖UA和UB拼接進(jìn)行信息融合,得到的融合特征表示為
U=Concat(UA,UB)
(9)
類(lèi)似于SE模塊[23]的結(jié)構(gòu),將得到的融合特征通過(guò)全局平均池化(global average pooling,GAP)操作在特征圖上進(jìn)行低維特征融合,以保留特征圖的主要特征,同時(shí)減小網(wǎng)絡(luò)的計(jì)算量,防止網(wǎng)絡(luò)的過(guò)擬合。該過(guò)程的計(jì)算公式為
(10)
由于輸入為一維數(shù)據(jù),則高度H為1。
然后再通過(guò)一個(gè)全連接層(fully connected-layers,FC)將其以r的壓縮率壓縮,使其成為具有全局感受野的實(shí)數(shù)向量。向量的長(zhǎng)度為C/r,S為GAP操作后的輸出,壓縮操作后的輸出為
(11)
式中,B為批量正則化層;W為全連接層權(quán)重。
在壓縮后,通過(guò)兩個(gè)全連接層分別將壓縮的輸出擴(kuò)張為原始維度(ZA和ZB),然后通過(guò)Softmax操作進(jìn)行權(quán)值歸一化,得到不同卷積核和不同通道的權(quán)值A(chǔ)和B:
(12)
(13)
根據(jù)這樣兩個(gè)不同的權(quán)重值,可自適應(yīng)地選擇不同空間尺度上的信息。將歸一化之后的不同的權(quán)重乘以對(duì)應(yīng)的特征圖,可得到最終加權(quán)之后由網(wǎng)絡(luò)自適應(yīng)選擇的輸出:
Y=AUA+BUB=A′+B′
(14)
本文所提方法中的每個(gè)殘差塊的卷積層都使用了可選擇的寬卷積核,使得網(wǎng)絡(luò)能夠在提取特征的每一個(gè)階段都能夠自適應(yīng)地選擇合適的卷積核進(jìn)行卷積,并且通過(guò)寬卷積核的壓縮擴(kuò)張?zhí)幚磉_(dá)到信號(hào)降噪的功能。此外,還修改了網(wǎng)絡(luò)中的通道數(shù)為8、16、32、64,以減小網(wǎng)絡(luò)的參數(shù)量,提高網(wǎng)絡(luò)的訓(xùn)練效率。
圖4展示了所提模型的整體結(jié)構(gòu)。該模型以18層的殘差網(wǎng)絡(luò)為基礎(chǔ),對(duì)其中所有殘差塊中的卷積層進(jìn)行改進(jìn),整個(gè)網(wǎng)絡(luò)由第一層的卷積、16個(gè)改進(jìn)的卷積層和一個(gè)全連接層組成,其具體結(jié)構(gòu)參數(shù)如表1所示。
圖4 所提方法網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.4 Structure diagram of the proposed method network
每個(gè)改進(jìn)卷積層的結(jié)構(gòu)如圖3所示。在數(shù)據(jù)輸入網(wǎng)絡(luò)時(shí),首先對(duì)數(shù)據(jù)進(jìn)行卷積操作,再輸入到后續(xù)網(wǎng)絡(luò)層中。后續(xù)網(wǎng)絡(luò)層按照殘差連接的方式分為兩種不同的殘差塊。在輸入輸出特征通道不改變時(shí),使用殘差塊1依次經(jīng)過(guò)卷積層、批量正則化、激活函數(shù)、卷積層和批量正則化后直接與原始輸入特征進(jìn)行連接。在輸入輸出通道改變時(shí),使用殘差塊2經(jīng)過(guò)幾個(gè)與殘差塊1相同的操作之后,將輸入特征進(jìn)行卷積,以匹配改變的通道數(shù)。最后得到提取的特征,輸入全局平均池化層進(jìn)行特征信息的融合,經(jīng)過(guò)全連接層輸出最后分類(lèi)結(jié)果。
本文所提方法的軸承故障診斷具體流程如圖5所示。軸承故障診斷可大致分為4個(gè)步驟:①利用加速度傳感器采集軸承試驗(yàn)臺(tái)數(shù)據(jù),為數(shù)據(jù)集添加不同信噪比的高斯白噪聲以模擬噪聲輸入,并劃分構(gòu)建相應(yīng)的訓(xùn)練集和測(cè)試集;②構(gòu)建DWResNet,并將所有訓(xùn)練樣本進(jìn)行預(yù)處理,按批量輸入到網(wǎng)絡(luò)中進(jìn)行模型訓(xùn)練;③在訓(xùn)練的過(guò)程中,通過(guò)交叉熵?fù)p失函數(shù)進(jìn)行反向傳播,對(duì)網(wǎng)絡(luò)權(quán)重參數(shù)進(jìn)行優(yōu)化迭代;④將測(cè)試數(shù)據(jù)集輸入訓(xùn)練完成的網(wǎng)絡(luò)中,輸出滾動(dòng)軸承故障診斷結(jié)果。
圖5 所提方法的故障診斷流程Fig.5 Fault diagnosis process of the proposed method
3.1.1實(shí)驗(yàn)一
本文采用德國(guó)帕德博恩大學(xué)(PBU)軸承數(shù)據(jù)集[24]對(duì)所提方法進(jìn)行驗(yàn)證。該試驗(yàn)臺(tái)的詳細(xì)設(shè)置請(qǐng)參考文獻(xiàn)[24]。試驗(yàn)臺(tái)設(shè)置如圖6所示,所有測(cè)試軸承的型號(hào)均為6203,采樣頻率為64 kHz。
圖6 帕德博恩大學(xué)軸承試驗(yàn)臺(tái)[24]Fig.6 The test rig of PBU[24]
本實(shí)驗(yàn)中使用的數(shù)據(jù)集的具體工況設(shè)置如表2所示,本數(shù)據(jù)集包含了5種故障,每個(gè)故障類(lèi)型下的數(shù)據(jù)都處理為表3所示數(shù)據(jù)。當(dāng)軸承的損傷深度為D∈(0,2] mm時(shí),設(shè)置為損傷等級(jí)1;當(dāng)軸承的損傷深度D∈(2.0,4.5] mm時(shí),設(shè)置為損傷等級(jí)2。
表2 帕德博恩大學(xué)軸承數(shù)據(jù)所選工況參數(shù)
表3 帕德博恩大學(xué)軸承數(shù)據(jù)詳細(xì)信息
3.1.2實(shí)驗(yàn)二
為驗(yàn)證本文方法的有效性,本文還采用了動(dòng)力傳動(dòng)故障診斷綜合實(shí)驗(yàn)臺(tái)(drivetrain diagnostic simulator,DDS)[25]所采集的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)臺(tái)設(shè)置如圖7所示,在平行齒輪箱軸承中,設(shè)定電機(jī)固定頻率為20 Hz,采樣頻率為12.8 kHz。每類(lèi)故障工況重復(fù)實(shí)驗(yàn)4次,每次采集各方向的振動(dòng)加速度信號(hào)共204 800個(gè)點(diǎn)。本數(shù)據(jù)集包含了內(nèi)圈、外圈、滾動(dòng)體故障和復(fù)合故障等4種故障類(lèi)型。
圖7 動(dòng)力傳動(dòng)故障診斷綜合實(shí)驗(yàn)臺(tái)[25]Fig.7 Power transmission fault diagnosis comprehensive experimental bench[25]
本實(shí)驗(yàn)中,樣本長(zhǎng)度設(shè)置為4096,通過(guò)滑窗的方式截取樣本。在實(shí)驗(yàn)一中,滑窗步長(zhǎng)與樣本長(zhǎng)度相等,因此樣本之間無(wú)重疊。其中,每類(lèi)樣本1200條,并按1∶1的比例劃分訓(xùn)練集和測(cè)試集,詳細(xì)信息見(jiàn)表3。實(shí)驗(yàn)二中,樣本長(zhǎng)度也設(shè)置為4096,通過(guò)滑窗截取了每類(lèi)樣本600條,滑窗步長(zhǎng)為582,并按1∶1的比例劃分訓(xùn)練集和測(cè)試集。
分別在信噪比(signal to noise ratio,SNR)為-4,-2,0,2,4 dB的高斯白噪聲以及無(wú)人為添加噪聲情況下,對(duì)卷積神經(jīng)網(wǎng)絡(luò)(CNN)[26]、VGG-16[27]、首層寬卷積深度神經(jīng)網(wǎng)絡(luò)(WDCNN)[28]、ResNet、首層寬卷積的殘差網(wǎng)絡(luò)(WResNet)和本文所提方法進(jìn)行了對(duì)比實(shí)驗(yàn),每組實(shí)驗(yàn)的超參數(shù)設(shè)置相同,但在實(shí)驗(yàn)一、實(shí)驗(yàn)二中設(shè)置初始學(xué)習(xí)率分別為0.01和0.1。并且為保證訓(xùn)練精度和損失函數(shù)收斂,在使用CNN和VGG-16方法時(shí)設(shè)置學(xué)習(xí)率為固定值,詳情見(jiàn)表4,每組實(shí)驗(yàn)重復(fù)10次以保證實(shí)驗(yàn)結(jié)果的準(zhǔn)確性。同時(shí),針對(duì)不同大小的寬卷積核,設(shè)置了空洞率d分別為1、2、14、26和38。信噪比的計(jì)算公式如下:
(15)
式中,PSignal、PNoise分別為原始信號(hào)和噪聲的能量。
以正常狀況為例,經(jīng)過(guò)加噪后的部分信號(hào)如圖8所示。實(shí)驗(yàn)運(yùn)行環(huán)境為Windows系統(tǒng)和Intel(R) Xeon(R) Silver 4210R CPU @2.40GHz處理器,使用了基于Python(3.9)的Pytorch 深度學(xué)習(xí)框架構(gòu)建所提方法和對(duì)比方法模型,并采用NVIDIA GeForce RTX 3090 GPU進(jìn)行訓(xùn)練加速。
(a)無(wú)人為添加噪聲 (b)RSNR=4 dB
3.3.1實(shí)驗(yàn)一結(jié)果分析
在實(shí)驗(yàn)一中,根據(jù)實(shí)驗(yàn)結(jié)果得到表5(表中“無(wú)”表示無(wú)人為添加噪聲)。由表5可知,雖然在沒(méi)有人為添加噪聲的情況下,不同方法均能保持較高的診斷準(zhǔn)確率,但是隨著噪聲干擾程度的增加,不同方法的診斷準(zhǔn)確率也隨之降低,說(shuō)明了強(qiáng)噪聲干擾對(duì)模型的抗噪性要求較高,例如CNN的診斷準(zhǔn)確率在RSNR=-4 dB的情況下比無(wú)噪聲情況下降低了11.29個(gè)百分點(diǎn)。區(qū)別于其他的方法,本文所提方法僅降低了1.99個(gè)百分點(diǎn),在各個(gè)不同噪聲情況下,所提方法能夠準(zhǔn)確地提取出滾動(dòng)軸承的振動(dòng)信號(hào)特征,具有更高的穩(wěn)定性。
表5 實(shí)驗(yàn)一診斷準(zhǔn)確率結(jié)果
對(duì)比CNN、VGG-16和ResNet在同一噪聲下的診斷精度可以看出,網(wǎng)絡(luò)深度的增加對(duì)滾動(dòng)軸承故障特征的提取能力和穩(wěn)定性均有一定提高。當(dāng)然,層數(shù)并非越深越好,超過(guò)一定數(shù)量后將造成梯度爆炸或梯度消失等問(wèn)題。對(duì)比CNN、WDCNN和WResNet可以發(fā)現(xiàn),卷積核寬度的增大對(duì)網(wǎng)絡(luò)容噪具有較好的效果。同樣地,需要選擇適當(dāng)?shù)木W(wǎng)絡(luò)寬度和網(wǎng)絡(luò)深度,使得方法能夠在軸承故障診斷上有更有效的結(jié)果。
由對(duì)比實(shí)驗(yàn)結(jié)果可知,本文提出方法具有較優(yōu)的容噪能力,能夠在噪聲環(huán)境下?lián)碛酗@著提高的滾動(dòng)軸承故障分類(lèi)能力和模型的穩(wěn)定性。本文所提方法在不同噪聲水平情況下均有較好的診斷準(zhǔn)確率,特別是在RSNR=-4 dB的強(qiáng)噪聲干擾下,相較于CNN、WDCNN、VGG-16、ResNet和WResNet,診斷準(zhǔn)確率分別提高了17.88、3.65、2.16、2.05和3.35個(gè)百分點(diǎn)。同時(shí),本文所提方法在不同噪聲干擾下的診斷標(biāo)準(zhǔn)差相較于其他方法均較小,表示它在強(qiáng)噪聲下具有較高的模型穩(wěn)定性。
為了探究強(qiáng)噪聲信號(hào)對(duì)模型分類(lèi)邊界形成的影響,以RSNR=-4 dB為例,繪制了本文所提方法在網(wǎng)絡(luò)不同階段所提取故障特征的t-SNE可視化聚類(lèi)圖,如圖9所示。由圖9不難看出,輸入的強(qiáng)噪聲原始信號(hào)呈現(xiàn)極為嚴(yán)重的混淆、重疊現(xiàn)象,導(dǎo)致難以直接聚類(lèi)辨識(shí)。隨著數(shù)據(jù)經(jīng)過(guò)更深層的階段2、3、4,網(wǎng)絡(luò)對(duì)不同健康狀況的分類(lèi)邊界逐漸清晰。階段4時(shí),同類(lèi)故障特征的類(lèi)內(nèi)聚集程度顯著提高,模型的分類(lèi)邊界也最為明顯。這說(shuō)明經(jīng)過(guò)多個(gè)階段的模型訓(xùn)練,所提方法能夠有效提取強(qiáng)噪聲下不同類(lèi)別的故障特征,較小冗余噪聲的干擾,從而提高對(duì)目標(biāo)軸承的診斷精度。
(a)輸入 (b)階段2輸出
同時(shí),為進(jìn)一步展示不同方法對(duì)各個(gè)健康狀況的詳細(xì)辨識(shí)能力,圖10展示了RSNR=-4 dB下不同方法辨識(shí)結(jié)果的混淆矩陣。圖10顯示,不同方法在辨識(shí)分類(lèi)的過(guò)程中對(duì)NC和OR2兩類(lèi)健康狀況是較為容易辨識(shí)的,但是對(duì)OR1、IR1和IR2三類(lèi)故障難以有效辨別,分析其可能的原因是外圈故障和內(nèi)圈故障特征相似,且兩個(gè)不同故障等級(jí)的內(nèi)圈故障特征相似。本文所提出的方法雖然也存在上述情況,但是相較于其他方法,本文方法對(duì)難診斷類(lèi)別的診斷準(zhǔn)確率最高,說(shuō)明了所提方法能夠有效提高不同故障類(lèi)型中判別性特征的辨識(shí)能力,從而提高診斷準(zhǔn)確率。
(a)CNN (b)WDCNN
為了進(jìn)一步分析不同空洞率對(duì)模型診斷效果的影響,以強(qiáng)噪聲RSNR=-4 dB為例,分別設(shè)置空洞率d為1、2、14、26和38,并進(jìn)行相應(yīng)的故障診斷實(shí)驗(yàn),結(jié)果如圖11所示。由圖11不難看出,所提方法在d取14時(shí),得到了高達(dá)98%的診斷準(zhǔn)確率,這說(shuō)明本文所選超參數(shù)較為合適,能使模型具有較高的噪聲魯棒性。由于空洞率的大小直接決定了感受野的大小,這也印證了單一地提高空洞率對(duì)噪聲工況下軸承故障診斷準(zhǔn)確率的提高并不是絕對(duì)的,需要選擇合適的空洞率對(duì)數(shù)據(jù)進(jìn)行更為全面的特征提取,以獲得更豐富的分類(lèi)辨識(shí)信息,進(jìn)而提高軸承故障診斷的準(zhǔn)確率。
圖11 RSNR=-4 dB下不同空洞率下所提方法診斷準(zhǔn)確率Fig.11 Diagnostic accuracy of the proposed method at RSNR=-4dB for different d
3.3.2實(shí)驗(yàn)二結(jié)果分析
根據(jù)實(shí)驗(yàn)二實(shí)驗(yàn)結(jié)果繪制相應(yīng)的精度直方圖,見(jiàn)圖12,可以看出,在各個(gè)不同等級(jí)的RSNR下,本文方法相較于其他方法精度均有一定程度的提高,并且具有較好的穩(wěn)定性。RSNR=-4 dB時(shí)的診斷準(zhǔn)確率相較于無(wú)添加噪聲時(shí),在各個(gè)方法下分別降低16.26、8.16、16.91、8.84、9.53和5.39個(gè)百分點(diǎn),由此可見(jiàn)本文所提方法的診斷效果受到噪聲的影響最小,印證了本文所提方法對(duì)強(qiáng)噪聲的魯棒性。并且本文所提方法在RSNR=-4 dB時(shí)的標(biāo)準(zhǔn)差絕對(duì)值相較于其他方法最小,驗(yàn)證了本文所提方法的穩(wěn)定性。
圖12 實(shí)驗(yàn)二結(jié)果直方圖Fig.12 Histograms of experiment 2 results
針對(duì)滾動(dòng)軸承在強(qiáng)噪聲干擾下故障診斷提取特征能力較差、辨識(shí)能力不足的問(wèn)題,提出了一種基于動(dòng)態(tài)寬卷積殘差網(wǎng)絡(luò)的軸承故障診斷方法。該方法通過(guò)可選擇的寬卷積層對(duì)不同噪聲干擾下的滾動(dòng)軸承監(jiān)測(cè)信號(hào)進(jìn)行故障特征提取,通過(guò)生成的自適應(yīng)權(quán)重自動(dòng)地為網(wǎng)絡(luò)選擇使用卷積核,在網(wǎng)絡(luò)深度加深的同時(shí)保證了網(wǎng)絡(luò)的抗噪能力。
實(shí)驗(yàn)結(jié)果表明,相較于CNN、WDCNN、VGG-16、ResNet和WResNet等網(wǎng)絡(luò),本文所提方法具有更高的診斷準(zhǔn)確率。在無(wú)人為添加噪聲情況下,本文所提方法在實(shí)驗(yàn)一中能夠取得99.99%的診斷準(zhǔn)確率;而在信噪比為-4,-2,0,2,4 dB下,該方法依然可取得99.28%的平均準(zhǔn)確率。并且實(shí)驗(yàn)二的結(jié)果也印證了本文所提方法的有效性。因此,本文所提方法具有較高的辨識(shí)能力、抗噪能力和泛化能力,可為實(shí)際工業(yè)強(qiáng)噪聲干擾條件下的軸承故障診斷提供一定的參考借鑒。