摘要:針對(duì)實(shí)際工況中齒輪箱振動(dòng)信號(hào)復(fù)雜多變,導(dǎo)致傳統(tǒng)基于卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeural Networks, CNN)的齒輪箱故障診斷方法存在診斷精度不高、訓(xùn)練收斂性能差等問(wèn)題,首先,提出一種改進(jìn)的注意力機(jī)制和一種基于注意力機(jī)制的軟閾值激活函數(shù),在此基礎(chǔ)上,構(gòu)建基于改進(jìn)注意力機(jī)制的CNN 故障診斷模型;然后,通過(guò)齒輪箱開源數(shù)據(jù)集的實(shí)驗(yàn)數(shù)據(jù),驗(yàn)證改進(jìn)的注意力機(jī)制和基于注意力機(jī)制的軟閾值激活函數(shù)能否有效提升模型的診斷精度和訓(xùn)練收斂性能;最后,將構(gòu)建的模型應(yīng)用于實(shí)際工況齒輪箱的故障診斷。結(jié)果表明,構(gòu)建的模型滿足某企業(yè)齒輪箱出廠檢測(cè)的需求,在診斷精度和訓(xùn)練收斂性等方面具有優(yōu)勢(shì)。
關(guān)鍵詞:故障診斷;卷積神經(jīng)網(wǎng)絡(luò);注意力機(jī)制;軟閾值激活函數(shù);齒輪箱
中圖分類號(hào):TH132 文獻(xiàn)標(biāo)志碼:A
齒輪箱是通過(guò)齒輪的嚙合傳遞動(dòng)力,改變輸出軸的轉(zhuǎn)速和轉(zhuǎn)矩,從而實(shí)現(xiàn)機(jī)械傳動(dòng)的裝置。由于復(fù)雜的環(huán)境工況,在速度和載荷的多重作用下,齒輪箱易發(fā)生故障而導(dǎo)致設(shè)備劇烈振動(dòng)或失效[1]。因此,開展齒輪箱故障診斷的研究具有重要意義。針對(duì)齒輪箱振動(dòng)信號(hào)復(fù)雜多變的特點(diǎn),傳統(tǒng)的基于信號(hào)處理的方法提取故障特征較為困難?;跀?shù)據(jù)驅(qū)動(dòng)的方法憑借其不需要依賴工程經(jīng)驗(yàn)和普適性好的特點(diǎn),在近些年得到大量研究者的關(guān)注。其中,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN) 由于其能夠提取非線性特征的強(qiáng)大能力,成為齒輪箱故障診斷的主流手段[2]。
然而,基于CNN 的齒輪箱故障診斷方法還存在一定的局限性。一方面通過(guò)卷積得到的齒輪箱信號(hào)特征存在大量冗余信息,阻礙了診斷模型在分類精度和訓(xùn)練收斂性能方面的進(jìn)一步提升[3]。因此,如何在復(fù)雜特征中提取到相關(guān)性更大的信息,成為了進(jìn)一步提高CNN 診斷模型性能的研究重點(diǎn)。為了解決該問(wèn)題, 注意力機(jī)制被引入齒輪箱故障診斷。Liu 等[4] 提出了一種堆疊殘差多注意力網(wǎng)絡(luò)作為振動(dòng)信號(hào)特征提取的手段,實(shí)現(xiàn)了對(duì)齒輪箱的診斷;孔子遷等[5] 結(jié)合了時(shí)頻域分析與注意力機(jī)制,對(duì)齒輪箱進(jìn)行了精準(zhǔn)診斷。但是上述注意力機(jī)制沒(méi)有針對(duì)一維振動(dòng)信號(hào)進(jìn)行特別設(shè)計(jì),其中常規(guī)的池化操作存在特征信息丟失現(xiàn)象[6]。另一方面,齒輪箱振動(dòng)信號(hào)是一種非線性信號(hào)[7],CNN 的非線性表達(dá)能力依賴于激活函數(shù),而常用的線性整流函數(shù)(Rectified LinearUnit,ReLU) 作為一種強(qiáng)制稀疏處理,負(fù)域中的零信號(hào)會(huì)阻礙反向傳播[8-9]。楊文哲等[10] 在一維CNN 中引入了高斯誤差線性單元激活函數(shù)(Gaussian ErrorLinear Units,GELU),實(shí)現(xiàn)了對(duì)齒輪箱的精確診斷,但是GELU 激活函數(shù)計(jì)算量大,參數(shù)調(diào)整困難;李俊卿等[11] 利用可訓(xùn)練的ReLU 激活函數(shù)(Trainable ReLU,TReLU) 改進(jìn)GoogLeNe,實(shí)現(xiàn)了強(qiáng)噪聲下的齒輪箱故障診斷,但是TReLU 線性修正的特點(diǎn)影響了網(wǎng)絡(luò)的非線性表達(dá)能力。
本文提出一種基于CBAM(Convolutional BlockAttention Module)改進(jìn)的(Strengthened-ConvolutionalBlock Attention Module,S-CBAM)注意力模塊,能夠更全面關(guān)注齒輪箱振動(dòng)信號(hào)中的關(guān)鍵特征;同時(shí),結(jié)合注意力機(jī)制和軟閾值函數(shù)構(gòu)造一種輕量級(jí)的軟閾值函數(shù)網(wǎng)絡(luò)(Soft Thresholding Network,ST-Net) 來(lái)作為CNN中的非線性映射函數(shù),更有效地提升齒輪箱故障診斷模型的非線性表達(dá)能力。在此基礎(chǔ)上構(gòu)建基于改進(jìn)注意力機(jī)制的CNN(CNN based on ImprovedAttention Mechanism,IAMCNN) 診斷模型,并用開源數(shù)據(jù)驗(yàn)證模型的有效性,最后應(yīng)用于實(shí)際工況的診斷。
1 理論基礎(chǔ)
1.1 一維卷積神經(jīng)網(wǎng)絡(luò)
一維卷積神經(jīng)網(wǎng)絡(luò)(1D Convolutional NeuralNetwork,1D-CNN) 是卷積神經(jīng)網(wǎng)絡(luò)的一種變體,它具有處理一維時(shí)序信號(hào)的強(qiáng)大能力[12],其核心操作卷積層通過(guò)滑動(dòng)一個(gè)固定大小的卷積核在一維數(shù)據(jù)上進(jìn)行卷積以提取特征,如圖1所示。
1.2 CBAM 注意力模塊
CBAM 模塊[13] 是一種同時(shí)考慮了通道注意力和空間注意力的注意力模塊,卷積層輸出的特征先后經(jīng)過(guò)通道注意力模塊(Channel Attention Module,CAM)和空間注意力模塊(Spatial Attention Module, SAM),計(jì)算加權(quán)之后得到一組新的特征。
如圖2 所示,輸入的特征圖在進(jìn)入通道注意力模塊后分別進(jìn)行全局平均池化(Global AveragePooling,GAP) 和全局最大池化(Global Max Pooling,GMP) 得到兩組通道描述符,然后將它們分別送入一個(gè)參數(shù)共享的兩層感知器(Multilayer Perceptron,MLP),將網(wǎng)絡(luò)的輸出逐元素相加之后通過(guò)Sigmoid函數(shù)激活,可得到一組(0,1)之間的通道注意力權(quán)重。
空間注意力模塊利用最大池化和平均池化對(duì)特征在通道維度上進(jìn)行壓縮,將兩個(gè)池化的結(jié)果拼接之后得到一個(gè)通道數(shù)為2 的特征圖,然后將其送入一個(gè)卷積層壓縮至一個(gè)通道,最后通過(guò)Sigmoid 函數(shù)激活得到空間注意力權(quán)重,其原理如圖3 所示。
1.3 軟閾值函數(shù)
軟閾值函數(shù)是一種信號(hào)處理領(lǐng)域常用的函數(shù),被廣泛應(yīng)用于求解稀疏表示和壓縮感知領(lǐng)域優(yōu)化問(wèn)題的算法中[14]。針對(duì)某一個(gè)正數(shù)閾值T,軟閾值函數(shù)會(huì)將絕對(duì)值小于閾值的輸入x 置零,并將絕對(duì)值大于該閾值的輸入x 也向著零收縮,其處理過(guò)程如式(1)所示。
從計(jì)算公式可以看出,軟閾值函數(shù)的導(dǎo)數(shù)恒為0 或1,與ReLU 函數(shù)相似,可以有效解決神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練時(shí)梯度彌散等問(wèn)題。同時(shí),軟閾值函數(shù)具有更好的抗噪性能,且可以減少信號(hào)的信息丟失[15]。
2 IAMCNN 模型構(gòu)建
以CNN 模型為基礎(chǔ),設(shè)置3 個(gè)一維卷積層和3 個(gè)全連接層,并引入池化層與批歸一化層,以提高網(wǎng)絡(luò)收斂速度和防止過(guò)擬合,構(gòu)建基于CBAM 改進(jìn)的S-CBAM 注意力模塊;同時(shí),結(jié)合注意力機(jī)制和軟閾值函數(shù)構(gòu)造一種輕量級(jí)的軟閾值函數(shù)網(wǎng)絡(luò)來(lái)作為CNN 中的非線性映射函數(shù)。在此基礎(chǔ)上構(gòu)建基于改進(jìn)注意力機(jī)制的CNN 診斷模型。
2.1 改進(jìn)注意力模塊構(gòu)建
為了減少齒輪箱振動(dòng)信號(hào)在通道注意力中因GMP 和GAP 而產(chǎn)生的信息丟失,本文提出基于頻域特征的池化方法,可針對(duì)性地提高CBAM 注意力機(jī)制對(duì)齒輪箱振動(dòng)信號(hào)的特征提取能力。
圖4 和圖5 所示分別為健康狀態(tài)和故障狀態(tài)下齒輪箱振動(dòng)信號(hào)及功率譜圖,可以看出,齒輪箱故障信號(hào)特征不但體現(xiàn)在時(shí)域上,也會(huì)表現(xiàn)在功率譜的分布上。
本文選擇重心頻率S1 和頻率標(biāo)準(zhǔn)差S2 來(lái)構(gòu)建頻域特征池化方法,通過(guò)這兩個(gè)頻域特征,可以表征齒輪箱振動(dòng)信號(hào)的功率譜分布情況[16-17]。S1 和S2 的計(jì)算公式分別如式(2)和式(3)所示:
其中,P(k) 為對(duì)應(yīng)的功率譜值,fk 為對(duì)應(yīng)點(diǎn)的頻率幅值大小。
通過(guò)頻域特征池化改進(jìn)的通道注意力模塊結(jié)構(gòu)如圖6 所示,通過(guò)全局最大池化(GMP)和全局平均池化(GAP)得到齒輪箱信號(hào)特征在時(shí)域上的通道描述符,通過(guò)全局重心頻率池化(GF)和全局頻率標(biāo)準(zhǔn)差池化(FSD)得到齒輪箱信號(hào)特征在頻域上的通道描述符,故改進(jìn)后的通道注意力模塊可以同時(shí)兼顧齒輪箱振動(dòng)信號(hào)的時(shí)域和頻域特征信息。
2.2 ST-Net 激活函數(shù)構(gòu)建
對(duì)于軟閾值函數(shù)來(lái)說(shuō),閾值的選擇是關(guān)鍵,本文采用一種結(jié)合SE 注意力機(jī)制[18] 的特殊網(wǎng)絡(luò)自主學(xué)習(xí)閾值。基于注意力機(jī)制的軟閾值函數(shù)能夠靈活地調(diào)整齒輪箱信號(hào)特征中需要?jiǎng)h除的信息,在實(shí)現(xiàn)ReLU 激活函數(shù)功能的基礎(chǔ)上能夠保留更為豐富的數(shù)據(jù)特征。ST-Net 的網(wǎng)絡(luò)結(jié)構(gòu)如圖7 所示,Abs 為取絕對(duì)值操作,輸入的齒輪箱信號(hào)特征取絕對(duì)值后經(jīng)注意力網(wǎng)絡(luò)處理,得到一組自適應(yīng)的閾值,對(duì)輸入的齒輪箱信號(hào)特征進(jìn)行軟閾值化后得到輸出特征。
針對(duì)齒輪箱振動(dòng)信號(hào),ST-Net 網(wǎng)絡(luò)具有較好的刪除冗余特征的能力。如圖8 所示為齒輪箱故障信號(hào)經(jīng)ST-Net 網(wǎng)絡(luò)處理前后的對(duì)比圖,原始的齒輪箱振動(dòng)信號(hào)含有較多冗余信息,信號(hào)故障特征不明顯;經(jīng)ST-Net 網(wǎng)絡(luò)處理后的信號(hào)刪除了冗余信息,并突出了該信號(hào)的故障特征,有效提高了齒輪箱振動(dòng)信號(hào)的可分性。
2.3 IAMCNN 診斷模型搭建
將上述S-CBAM 注意力模塊和ST-Net 激活函數(shù)引入網(wǎng)絡(luò)模型,搭建IAMCNN 齒輪箱故障診斷模型,模型結(jié)構(gòu)如圖9 所示,在每個(gè)卷積塊中添加STNet激活函數(shù),并將S-CBAM 注意力模塊插入到第3 個(gè)卷積塊之后,通過(guò)分析驗(yàn)證,這種結(jié)構(gòu)可以有效增強(qiáng)卷積層特征提取能力。
3 實(shí)驗(yàn)驗(yàn)證
3.1 開源數(shù)據(jù)集故障診斷分析
3.1.1 實(shí)驗(yàn)數(shù)據(jù)與樣本處理
為驗(yàn)證所構(gòu)建模型的有效性,首先采用東南大學(xué)齒輪箱數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證。該數(shù)據(jù)集通過(guò)在傳動(dòng)系統(tǒng)動(dòng)態(tài)模擬(DDS)系統(tǒng)上模擬實(shí)際工況得到,如圖10 為DDS 實(shí)驗(yàn)平臺(tái)。
該實(shí)驗(yàn)采集了平行齒輪箱和行星齒輪箱x、y、z 方向的振動(dòng)信號(hào),以及電機(jī)z 方向振動(dòng)信號(hào)和扭矩信號(hào),齒輪箱轉(zhuǎn)速為1 200 r/min,采樣頻率為5 120 Hz,模擬了包括健康、斷齒、缺齒、齒根裂紋和齒輪表面磨損在內(nèi)的5 種不同運(yùn)行狀態(tài)[19]。本文利用數(shù)據(jù)集中8 個(gè)通道信號(hào)作為模型輸入,其中包含5 000 個(gè)樣本,每個(gè)樣本有1 024 個(gè)數(shù)據(jù)點(diǎn),可保證每個(gè)樣本包含齒輪箱旋轉(zhuǎn)4 周的故障特征信息。將所有樣本按4∶1 的比例劃分為訓(xùn)練集和測(cè)試集。
3.1.2 消融實(shí)驗(yàn)及結(jié)果分析
為驗(yàn)證本文所構(gòu)建模塊的有效性, 對(duì)模型進(jìn)行消融實(shí)驗(yàn), 對(duì)比說(shuō)明SCBAM注意力模塊和ST-Net 激活函數(shù)對(duì)CNN 模型的改進(jìn)效果。模型訓(xùn)練利用TensorFlow 框架,批處理樣本數(shù)為256,迭代次數(shù)為100,選擇交叉熵作為損失函數(shù),Adam 作為優(yōu)化器,學(xué)習(xí)率設(shè)為0.001。對(duì)比4 種診斷模型的訓(xùn)練和診斷效果,4 個(gè)齒輪箱故障診斷模型設(shè)置分別如下:
(1)同時(shí)采用S-CBAM 注意力模塊和ST-Net 激活函數(shù)對(duì)CNN 模型進(jìn)行改進(jìn),記為IAMCNN;
(2)僅采用S-CBAM 注意力模塊對(duì)CNN 模型進(jìn)行改進(jìn),記為S-CBAM;
(3)僅采用ST-Net 激活函數(shù)對(duì)CNN 模型進(jìn)行改進(jìn),記為ST-Net;
(4)基于傳統(tǒng)CNN 的齒輪箱故障診斷模型,選擇ReLU 函數(shù)作為激活函數(shù),記為CNN。
如圖11 所示為模型訓(xùn)練時(shí)模型在測(cè)試集上的精度曲線,可以看出,S-CBAM 注意力模塊和ST-Net激活函數(shù)對(duì)CNN 模型的訓(xùn)練效果具有較好的改進(jìn)作用。改進(jìn)后的IAMCNN模型能將訓(xùn)練損失降到較低水平,且提高了訓(xùn)練收斂速度;IAMCNN 模型在迭代訓(xùn)練20 次后測(cè)試精度已經(jīng)趨于收斂,其診斷精度和模型的穩(wěn)定性方面都有很大提升。
如圖12 所示為不同模型在測(cè)試集上診斷結(jié)果的混淆矩陣,可以看出,傳統(tǒng)的CNN 模型對(duì)斷齒故障(標(biāo)簽1)診斷精度較低,只有83%;單獨(dú)經(jīng)過(guò)SCBAM注意力模塊或ST-Net 改進(jìn)的CNN 網(wǎng)絡(luò)對(duì)5 種狀態(tài)的診斷精度都能達(dá)到90% 以上;而同時(shí)結(jié)合S-CBAM注意力模塊和ST-Net 的IAMCNN 模型對(duì)4 種故障狀態(tài)的診斷精度都能達(dá)到100%,只有對(duì)健康狀態(tài)識(shí)別精度為96%,存在部分誤判現(xiàn)象,總體精度達(dá)到99.20%,能夠達(dá)到較好的診斷效果。
為更加直觀地對(duì)比不同模型的特征提取能力,在不同模型迭代訓(xùn)練20 次時(shí)的對(duì)特征提取情況進(jìn)行可視化。如圖13 所示為不同模型的t-SNE 可視化情況,可以看出,原始的CNN 模型在迭代訓(xùn)練20 次時(shí)還存在大量特征混雜的情況,無(wú)法對(duì)數(shù)據(jù)進(jìn)行有效分類。單獨(dú)經(jīng)過(guò)S-CBAM 注意力模塊和ST-Net 改進(jìn)的CNN 網(wǎng)絡(luò)分類能力有所加強(qiáng),存在小部分的混雜現(xiàn)象。如圖13(b)和13(c)所示,結(jié)合S-CBAM 注意力模塊的診斷模型有效增大了幾種標(biāo)簽的類間間距,但是其類內(nèi)間距依然較大,結(jié)合ST-Net 改進(jìn)的診斷模型縮小了不同標(biāo)簽的類內(nèi)間距,但其類間間距較小,不利于分類。如圖13(d)所示,同時(shí)結(jié)合S-CBAM注意力模塊和ST-Net 的IAMCNN 模型具有強(qiáng)大的特征提取能力,針對(duì)不同標(biāo)簽的數(shù)據(jù)同時(shí)具有較大的類間間距和較小的類內(nèi)間距,已經(jīng)可以對(duì)數(shù)據(jù)進(jìn)行較好地分類。
3.1.3 對(duì)比實(shí)驗(yàn)及結(jié)果分析
為驗(yàn)證本文所提出的模型在單通道信號(hào)輸入下的魯棒性,選擇數(shù)據(jù)集中故障特征相對(duì)微弱的電機(jī)振動(dòng)信號(hào)作為輸入,并設(shè)置對(duì)比實(shí)驗(yàn)以驗(yàn)證本文所提模型的優(yōu)越性。
實(shí)驗(yàn)設(shè)置了3 種不同結(jié)構(gòu)的CNN 模型作為對(duì)比以說(shuō)明本文提出的改進(jìn)注意力機(jī)制的優(yōu)越性,其中CNN 為原始三層卷積神經(jīng)網(wǎng)絡(luò)模型, SE-Net-CNN 和CBAM-CNN 分別為采用了SE 通道注意力機(jī)制和CBAM 注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)模型。另外還設(shè)置長(zhǎng)短期記憶( Long Short Term Memory, LSTM)神經(jīng)網(wǎng)絡(luò)、BP(Back Propagation, BP) 神經(jīng)網(wǎng)絡(luò)和深度殘差網(wǎng)絡(luò)(Deep residual network, ResNet) 3 種主流診斷模型作為實(shí)驗(yàn)對(duì)比對(duì)象以說(shuō)明本文所提模型的優(yōu)越性。測(cè)試集精度值取10 次實(shí)驗(yàn)平均值,每次實(shí)驗(yàn)?zāi)P偷?xùn)練100 次。
圖14 所示為不同模型在訓(xùn)練時(shí)測(cè)試精度曲線,表1 所示為不同模型在測(cè)試集上平均精度的對(duì)比結(jié)果。由以上結(jié)果可以看出,本文提出的模型在故障特征較為微弱的電機(jī)振動(dòng)單一通道信號(hào)輸入時(shí)仍具有較好的診斷性能,其診斷精度高于其余幾種常見(jiàn)診斷模型。
3.2 IAMCNN 診斷模型的工程應(yīng)用
3.2.1 實(shí)驗(yàn)數(shù)據(jù)與樣本處理
基于某企業(yè)齒輪箱出廠質(zhì)量檢測(cè)的需求,搭建行星齒輪箱實(shí)驗(yàn)平臺(tái)采集數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證,實(shí)驗(yàn)平臺(tái)如圖15 所示。實(shí)驗(yàn)設(shè)置8 種不同運(yùn)行狀態(tài),包括1 種健康狀態(tài)和太陽(yáng)輪齒面碰傷、行星輪齒面碰傷、內(nèi)齒圈齒面碰傷、太陽(yáng)輪精度低、行星輪精度低、內(nèi)齒圈精度低、行星架中心距超差7 種故障狀態(tài)。齒輪箱轉(zhuǎn)速為940 r/min,振動(dòng)加速度傳感器測(cè)點(diǎn)布置在齒輪箱第一級(jí)行星齒輪的軸承支座上,振動(dòng)信號(hào)的采樣頻率為12 800 Hz,將1 s 內(nèi)采集到的振動(dòng)信號(hào),即12 800 個(gè)數(shù)據(jù)點(diǎn)作為一個(gè)樣本,保證每個(gè)樣本包含齒輪箱旋轉(zhuǎn)15 周的故障特征信息,每種運(yùn)行狀態(tài)采集500 個(gè)樣本作為本文實(shí)驗(yàn)數(shù)據(jù)集,并按4∶1 的比例將4 000 個(gè)樣本劃分為訓(xùn)練集與測(cè)試集。
3.2.2 結(jié)果分析
IAMCNN 模型在實(shí)測(cè)行星齒輪箱數(shù)據(jù)集上的表現(xiàn)如圖16~18 所示。由圖16 可以看出模型在經(jīng)過(guò)50 次迭代訓(xùn)練后,在測(cè)試集上精度已經(jīng)穩(wěn)定在99.25% 左右,且不存在過(guò)擬合現(xiàn)象。如圖17所示,從模型在測(cè)試集上輸出的混淆矩陣可以看出,行星輪齒面碰傷(標(biāo)簽2)與內(nèi)齒圈精度低(標(biāo)簽6)兩種故障狀態(tài)存在一定程度的誤診斷現(xiàn)象,其原因在于這兩種故障特征信息較為相似,在如圖18 所示的t-SNE 可視化結(jié)果中可以看出這兩種故障狀態(tài)的類間間距較小,容易出現(xiàn)分類出錯(cuò)的情況。模型對(duì)其余狀態(tài)診斷率都達(dá)到了100%,本文提出的方法在實(shí)測(cè)行星齒輪箱數(shù)據(jù)集上也具有較好的分類效果,可以證明本文所提模型在實(shí)際工程應(yīng)用中具有良好的診斷效果。
為了進(jìn)一步驗(yàn)證本文所提出方法的優(yōu)越性,對(duì)比分析了不同齒輪箱故障診斷模型的應(yīng)用效果。同時(shí),為了比較模型的收斂性能,取不同模型在訓(xùn)練時(shí)測(cè)試精度達(dá)到90% 所需要的時(shí)間為其收斂時(shí)間,以表征不同模型的訓(xùn)練收斂性能。如表2 所示為不同齒輪箱故障診斷模型的測(cè)試集診斷精度和收斂時(shí)間,可以看出,本文提出的齒輪箱故障診斷模型IAMCNN在實(shí)測(cè)齒輪箱數(shù)據(jù)集上診斷精度為99.25%,收斂時(shí)間為69.51s,對(duì)比其余診斷模型具有最高的診斷精度,以及較好的訓(xùn)練收斂性能。其中,CNN 模型雖然具有更短的收斂時(shí)間,但其最高診斷精度比IAMCNN低5.73%。綜合來(lái)看,IAMCNN 模型針對(duì)齒輪箱故障診斷具有最好的性能。
4 結(jié) 論
(1)S-CBAM 注意力模塊和ST-Net 能有效提升卷積神經(jīng)網(wǎng)絡(luò)的診斷精度和收斂性能,IAMCNN 診斷模型在東南大學(xué)齒輪箱開源數(shù)據(jù)集上診斷精度達(dá)到了99.20%,且在20 次迭代訓(xùn)練后模型在測(cè)試集上的精度已經(jīng)收斂,其性能優(yōu)于傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò);
(2)IAMCNN 齒輪箱故障診斷模型具有較好的魯棒性,在故障特征微弱的單一通道輸入時(shí)測(cè)試集精度為97.59%,高于其余幾種常見(jiàn)診斷模型;
(3)IAMCNN 齒輪箱故障診斷模型具有良好的實(shí)際工程應(yīng)用效果。在實(shí)測(cè)行星齒輪箱數(shù)據(jù)集上診斷精度達(dá)到了99.25%,高于其余幾種常用診斷模型;同時(shí),模型診斷精度達(dá)到90% 的時(shí)間為69.51s,收斂時(shí)間較短,綜合診斷精度和收斂性能,IAMCNN 模型具有最好的診斷性能,并滿足某企業(yè)齒輪箱出廠檢測(cè)的需求。
參考文獻(xiàn):
[ 1 ]唐云, 魏昂昂", 童彤等. 面向風(fēng)電機(jī)組行星齒輪箱故障診斷的振動(dòng)監(jiān)測(cè)技術(shù)研究綜述[J]. 風(fēng)能, 2022(8): 92-95.
[ 2 ]GONDAL I, AMAR M, WILSON C. Vibration spectrumimaging: A novel bearing fault classification approach[J].IEEE Transactions on Industrial Electronics, 2014, 62(9):494-502.
[ 3 ]ZHANG Q, JIANG Z, LU Q, et al. Split to be slim: Anoverlooked redundancy in vanilla convolution[EB/OL].(2020-06-22) [2023-12-07]. https://arXiv.org/abs/ 2006.12085.
[ 4 ]LIU S, HUANG J, MA J, et al. SRMANet: Toward aninterpretable neural network with multi-attention mechanismfor gearbox fault diagnosis[J]. Applied Sciences, 2022,12(16): 8388.
[ 5 ]孔子遷, 鄧?yán)伲?湯寶平等. 基于時(shí)頻融合和注意力機(jī)制的深度學(xué)習(xí)行星齒輪箱故障診斷方法[J]. 儀器儀表學(xué)報(bào),2019, 40(6): 221-227.
[ 6 ]駱睿, 朱華生, 藍(lán)宏等. 基于改進(jìn)CBAM 注意力機(jī)制的害蟲分類算法[J]. 南昌工程學(xué)院學(xué)報(bào), 2023, 42(4): 92-99.
[ 7 ]謝孟龍. 變工況齒輪箱振動(dòng)信號(hào)處理與故障診斷方法研究[D]. 石家莊: 河北科技大學(xué), 2013.
[ 8 ]NAIR V, HINTON G E. Rectified linear units improverestricted Boltzmann machines[C]//International Conferenceon Machine Learning(ICML). Madison, WI, USA:Omnipress, 2010: 807–814.
[ 9 ]李一波, 郭培宜, 張森悅. 深度卷積神經(jīng)網(wǎng)絡(luò)中激活函數(shù)的研究[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2021, 31(9): 61-66.
[10]楊文哲, 郝如江, 郭梓良等. 基于一維ConvNeXt 網(wǎng)絡(luò)的齒輪箱故障診斷[J]. 國(guó)防交通工程與技術(shù), 2023, 21(4):28-31, 61.
[11]李俊卿, 劉若堯, 何玉靈. 基于NGO-VMD 和改進(jìn)GoogLeNet 的齒輪箱故障診斷方法[J]. 機(jī)床與液壓,52(12): 193-201.
[12]林偉, 洪容容. 基于多尺度一維卷積神經(jīng)網(wǎng)絡(luò)的入侵檢測(cè)模型[J]. 中國(guó)電子科學(xué)研究院學(xué)報(bào), 2023, 18(7): 656-662,670.
[13]WOO S, PARK J, LEE J Y, et al. CBAM: Convolutionalblock attention module[C]//Computer vision: ECCV 201815th European Conference. Munich, Germany: Spring verlag,2018: 3-19.
[14]DONOHO D L. De-noising by soft-thresholding[J]. IEEETransactions on Information Theory, 2002, 41(3): 613-627.
[15]ZHAO M, ZHONG S, FU X, et al. Deep residual shrinkagenetworks for fault diagnosis[J]. IEEE Transactions on IndustrialInformatics, 2020, 16(7): 4681-4690.
[16]雷亞國(guó), 林京, 何正嘉. 基于多傳感器信息融合的行星齒輪箱故障診斷[C]//2010 年全國(guó)振動(dòng)工程及應(yīng)用學(xué)術(shù)會(huì)議暨第十二屆全國(guó)設(shè)備故障診斷學(xué)術(shù)會(huì)議. 沈陽(yáng): [s.n.],2010.
[17] 吳文臻, 程繼明, 李標(biāo). 礦用帶式輸送機(jī)托輥音頻故障診斷方法[J]. 工礦自動(dòng)化, 2022, 48(9): 25-32.
[18]HU J, SHEN L, SUN G. Squeeze-and-excitationnetworks[C]//2018 IEEE/CVF Conference on ComputerVision and Pattern Recognition. Salt Lake City, UT, USA:IEEE, 2018: 7132-7141.
[19]SHAO S, MCALEER S, YAN R, et al. Highly accurate machinefault diagnosis using deep transfer learning[J]. IEEETransactions on Industrial Informatics, 2019, 15(4): 2446-2455.
(責(zé)任編輯:王曉麗)