摘要為了提高齒輪箱故障診斷的準確率,準確表達齒輪箱的健康狀態(tài),結(jié)合深度學習算法,提出了一種用于齒輪故障診斷的 GAF-inceptionResNet 模型。該模型可以直接將原始一維振動信號經(jīng)過格拉姆角場變換后形成圖像作為模型的輸入,通過 Stem-block 、殘差 Inception 、殘差模塊和分類層相互連接。殘差 Inception 網(wǎng)絡能夠拓寬網(wǎng)絡深度,提升訓練時長及準確率;殘差模塊利用恒等映射可以大幅度降低模型的訓練難度。因此,該模型可有效地挖掘信號特征之間的信息,使模型的特征學習能力增強,從而提高準確率,精準確定故障。實驗結(jié)果表明,該模型能夠達到99.59%的故障診斷精度,有效實現(xiàn)齒輪箱良好的故障識別與分類。
關(guān)鍵詞齒輪箱故障診斷格拉姆角場振動信號深度殘差網(wǎng)絡
Gearbox Fault Diagnosis based on GAF-inceptionResNet
Li Changwen1 Li Peng2,3 Ding Hua2,3
(1 Department of Information Technology,Shanxi Professional College of Finance,Taiyuan 030008,China)
(2 College of Mechanical and Vehicle Engineering,Taiyuan University of Technology,Taiyuan 030024,China)
(3 Shanxi Key Laboratory of Fully Mechanized Coal Mining Equipment,Taiyuan 030024,China)
Abstract In order to improve the accuracy of gearbox fault diagnosis and accurately express the health status of the gearbox,combined with deep learning algorithms,a GAF-inceptionResNet model for gear fault di-agnosis is proposed. The model can directly take the original one-dimensional vibration signal after GAF trans-formation to form photos as the input of the model. Through the stem-block,residual inception,residual mod-ule and classification layer,the residual inception network can broaden the network depth and improve the training time and accuracy,the residual block uses identity mapping to greatly reduce the training difficulty of the model. Therefore,the model can effectively mine the information between the signal features and enhance the feature learning ability of the model,thereby improving accuracy and accurately determine the faults. The test results show that the model can achieve a fault diagnosis accuracy of 99.59%. It can effectively achieve good gearbox fault identification and classification.
Key words Gearbox Fault diagnosis GAF Vibration signal Deep residual network
0引言
齒輪箱是多數(shù)旋轉(zhuǎn)類機械傳動系統(tǒng)的基本部件,長期的高速運轉(zhuǎn)容易發(fā)生故障,嚴重影響系統(tǒng)的運行[1]。因此,對齒輪箱進行狀態(tài)監(jiān)測和故障診斷是一項十分重要的任務。
傳統(tǒng)的故障診斷方法,包括小波分析[2]和經(jīng)驗模態(tài)分析法[3]等利用了振動信號的分析。然而,它們在面對復雜工況下故障多變的復合信號時,診斷結(jié)果表現(xiàn)較差[4]。近年來,卷積神經(jīng)網(wǎng)絡(Convolutional neural networks ,CNN )在故障診斷方面的應用發(fā)展迅速,大幅度提高了故障識別的準確率[5-8]。Fan H 等[9]提出了基于卷積神經(jīng)網(wǎng)絡和遷移學習(Transfer learn- ing ,TL )的故障診斷方法,結(jié)果表明,在4 種圖像生成方法中,以強噪聲影響下滾動軸承振動圖像樣本為研究對象,利用經(jīng)驗模態(tài)分解 Wigner-Ville 分布得到的數(shù)據(jù)分類性能最好。Zhang Z 等[10]提出了一種卷積神經(jīng)網(wǎng)絡和在線序貫極值學習機(Online sequentialextreme learning,OS-ELM)的故障診斷方法,首先對振動信號進行 S變換,然后利用 CNN 自適應提取 S變化譜,建立 OS-ELM故障診斷模型,并采用 OS-ELM 對故障診斷模型進行實時更新,通過逐步增加新樣本,提高了故障診斷模型的動態(tài)適應性和運行效率。
傳統(tǒng)的深度學習模型大多都是基于淺層的,隨著網(wǎng)絡層數(shù)不斷加深,難以對層與層之間的權(quán)重進行優(yōu)化,甚至導致訓練精度下降。為了解決這個問題,He K M等在2015年提出了深度殘差網(wǎng)絡(Resid- ual networks, ResNet)[11],它避免了深層網(wǎng)絡在訓練時所存在的缺陷。Fu S F等[12]提出了一種基于殘差網(wǎng)絡和擠壓激勵網(wǎng)絡(Squeeze and excitation network, SENet)的擠壓激勵殘差網(wǎng)絡(Squeeze and exitation re- sidual networks,SE-ResNet)光伏陣列故障診斷算法,并采用貝葉斯優(yōu)化(Bayesian optimization , BO)對參數(shù)進行優(yōu)化,在視頻監(jiān)控平臺(Promotion video,PV)平臺上進行了全面的故障實驗,結(jié)果表明,該模型在精度、泛化性能、可靠性和訓練效率等方面都取得了較高的綜合性能,具有較強的實用性。但是,將深度殘差網(wǎng)絡應用于基于振動信號的故障診斷時發(fā)現(xiàn),ResNet層數(shù)太高以及卷積核(Kernal size)過大都會導致訓練時間過長。因此,本文中設(shè)計了一種結(jié)合了 Inception 和 ResNet 的 InceptionResNet 模型。該模型解決了深層模型訓練時間過長的問題,通過實驗表明,該模型對齒輪的故障分類可達到99.56%的準確率,證明了模型的有效性。
1 GAF及 InceptionResNet結(jié)構(gòu)
1.1 格拉姆角場
格拉姆角場(Gramian angular field, GAF)[13]是在笛卡兒坐標系下利用一維時間序列進行數(shù)值縮放,有
式(1)轉(zhuǎn)化到極坐標系中,通過運算生成 GAF矩陣,使用 cos 函數(shù)和的運算得到格拉姆角和場(Gramian angular summation field ,GASF),即
使用 cos 函數(shù)差的運算則得到格拉姆角差場(Gramian angular difference field ,GADF),即
深度學習的神經(jīng)網(wǎng)絡較難訓練,一些研究比較難以應用,現(xiàn)存的一維模型,如 CNN 分類效果提升遇到瓶頸。但是, GAF 可以把時間序列轉(zhuǎn)成圖片,可以充分利用機器視覺上的優(yōu)勢進行可視化;而在轉(zhuǎn)換成圖像后,可以利用二維卷積模型進行故障診斷,提升分類精度。
1.2 InceptionResNet 結(jié)構(gòu)
1.2.1 基本結(jié)構(gòu)
卷積層利用多卷積核提取原始信號的主要特征,實現(xiàn)特征降維。其公式為
式中,xj(l)- 1為網(wǎng)絡第 l層的輸入;xj(l)為網(wǎng)絡第 l層的輸出;Mj 為輸入特征矢量(輸入映射的選擇); k ij(l)為卷積核;bj(l)為偏置;l 為網(wǎng)絡的第 l 層;j 為通道。卷積層主要有5個參數(shù),即卷積核的長和寬、橫向和縱向移動步長、卷積核數(shù)量。線性整流激活函數(shù)(ReLu)減少了參數(shù)之間的相互依存關(guān)系,提升了網(wǎng)絡的非線性建模能力,其公式為
1.2.2 改進 Stem-block結(jié)構(gòu)
改進的 Stem-block 結(jié)構(gòu)源于 Inception 系列模型[14],并借鑒了亞歷克斯網(wǎng)絡(AlexNet)第1個大卷積核的思想。其中,第1個卷積層采用寬卷積核,目的是提取短時特征,優(yōu)點是它可以自適應地學習面向故障診斷的特征,提高分類精度。卷積核的大小設(shè)為 64× 64,移動步長設(shè)為16,卷積核數(shù)量設(shè)為32。其余卷積核大小為3 ×3,濾波器數(shù)量分別為32及 64,如圖1所示。
1.2.3 改進 Residual-inception結(jié)構(gòu)
改進的殘差 Inception結(jié)構(gòu)(Residual-inception)首先引入批量歸一化(Batch normalization, BN)層,加快了網(wǎng)絡訓練速度;其次,結(jié)合殘差結(jié)構(gòu)替代了濾波器,能夠改善模型退化的問題;最后,通過改進的 Residual-inception 結(jié)構(gòu)的疊加提升網(wǎng)絡深度與寬度,從而提升分類精度。Residual-inception 結(jié)構(gòu)中,底層卷積核大小為1×1 、濾波器數(shù)量為32的卷積層,之后的卷積層將3×3卷積核分解為3×1 和1×3的兩個卷積核,通過函數(shù)輸出為最終層 Final_layer ,如圖2 所示。
1.2.4 ResNet 結(jié)構(gòu)
深度殘差網(wǎng)絡的核心在于殘差學習模塊,通過恒等映射的設(shè)計,改善了隨網(wǎng)絡深度增加產(chǎn)生的退化現(xiàn)象。殘差學習模塊主要由卷積層、批量歸一化層和激活函數(shù)組成。
在對齒輪進行故障診斷時,采用了殘差學習模塊。首先,通過 BN 將數(shù)據(jù)集中在[0, 1]范圍內(nèi);其次,利用 Relu 進行預激活;最后,通過卷積層對預激活后的數(shù)據(jù)進行卷積運算。殘差學習模塊的最終輸出 y 可表示為
y = x + F ( x,Wc )( 6)
式中,x 為輸入;F ( x , Wc )為包含 BN 層、Relu 和卷積層路徑的非線性函數(shù);Wc 為該路徑要優(yōu)化的參數(shù)。
殘差學習模塊有殘差塊和“瓶頸”殘差塊兩種,如圖3 所示。根據(jù)網(wǎng)絡層數(shù)深度采用不同的殘差塊。
“瓶頸”殘差塊的具體內(nèi)部參數(shù)如表1 所示。
2基于GAF的InceptionResNet診斷模型
2.1 模型結(jié)構(gòu)
構(gòu)建的 InceptionResNet 模型的基本結(jié)構(gòu)由輕量化的柄塊結(jié)構(gòu) Stem-block 、改進的 Residual-inception 結(jié)構(gòu)以及改進的殘差結(jié)構(gòu)組成,如圖4 所示。殘差模塊層由3 個殘差模塊組成。池化層有最大池化層和平均池化層兩種,大小均為2 ×2 ,移動步長均為2,其主要作用是減少了中間層輸出樣本尺寸的大小和后面層參與訓練參數(shù)的數(shù)量,提升了模型訓練速度。同時,為了防止過擬合,在平均池化層后面添加一個 Dropout 層。全連接層將平均池化層輸出的特征矢量展平形成一維向量。Softmax 分類器用于實現(xiàn)多目標故障分類。
2.2 故障診斷算法流程
故障診斷算法流程如圖5 所示。
首先,將實驗得到的原始一維信號樣本進行格拉姆角場變換,得到的可視化圖如圖6 所示。
將輸出的 GAF 圖像數(shù)據(jù)保存,按半重疊的方式分割成多個不同子樣本作為模型的輸入。將子樣本按 8∶2的比例劃分為訓練子樣本和測試子樣本,利用數(shù)據(jù)切割方法(data. split)抽出20%給驗證子樣本。最后,針對不同的子樣本,利用模型的 fit 方法完成模型的訓練和驗證。在模型訓練時,通過實際輸出和期望輸出的誤差來測試模型效果。當誤差不理想時,反向更新權(quán)重;當誤差滿足給定值時,輸出訓練模型。在模型驗證時,算法在每一輪迭代過程中會不斷地調(diào)整網(wǎng)絡的參數(shù),當完成一輪迭代更新后,使用驗證子樣本驗證模型的改進效果。模型測試是將測試子樣本進行模型評估,通過評估驗證模型的優(yōu)劣。
3實驗驗證
3.1 數(shù)據(jù)準備
為了驗證模型的可行性,選取旋轉(zhuǎn)試驗臺對齒輪箱的樣本進行實驗驗證。如圖7 所示,試驗臺由左側(cè)電機,2個位移傳感器, 1個光電傳感器, 1個速度傳感器和電子控制設(shè)備組成。實驗中,加速度傳感器分別安裝在電機側(cè)的輸入端和輸出端以獲取原始振動信號。
試驗臺裝置參數(shù)如表2 所示。實驗設(shè)置的采樣頻率為2 000×2.56 Hz ,齒輪狀態(tài)分別為正常、齒面點蝕、齒面磨損、斷齒和點蝕磨損混合等5 種。齒輪故障及信號圖如圖8 所示。
具體樣本組成信息如表3 所示。由表3 中可知,實驗數(shù)據(jù)由10000個經(jīng)過數(shù)據(jù)增強的樣本組成,樣本長度為1 024。在訓練前,通過半重疊式的樣本切割方式形成10000個子樣本,并將其劃分為6 400個訓練子樣本、1600個驗證子樣本和2 000個測試子樣本。模型訓練采用 Keras 框架,其中,批處理個數(shù)為 128,周期為100。損失函數(shù)采用交叉熵損失函數(shù)(Cross entropy),優(yōu)化器為 Adam 。學習率設(shè)為0.001時模型的分類效果最好。
3.2 實驗結(jié)果與分析
模型訓練后,訓練集和驗證集的準確率曲線如圖 9所示。
從圖9 中可以看出,在模型訓練過程中,隨著訓練周期的不斷增加,訓練集的準確率收斂于1 ;驗證集的準確率總體收斂趨勢表現(xiàn)良好。表明模型在訓練過程中能夠很好學習到不同數(shù)據(jù)的特征關(guān)系。
測試集對齒輪狀態(tài)識別的混淆矩陣如圖10所示。從圖10中可以看出,測試集5 個故障中只有1 個分類識別率為99%,其余4 種齒輪狀態(tài)的識別率為100%,這表明提出的 InceptionResNet 模型具有較高的齒輪故障識別率。
3.3 特征可視化
使用流行學習算法降維可視化算法(T-Distribut-ed stochastic neighbor embedding , t-SNE )[ 15]將模型中具有代表性階段的輸入、柄塊 Stem-block 、Residu-al-inception 模塊、殘差模塊1 等以及平均池化層輸出的高維特征實現(xiàn)低維映射,并將其進行可視化,降維可視化結(jié)果如圖11所示,不同的顏色代表不同的齒輪故障類別。從圖11中可以看出,隨著層數(shù)的不斷加深,相同狀態(tài)的數(shù)據(jù)點能很好地聚集在一塊,不同狀態(tài)的數(shù)據(jù)點逐漸分離。以上結(jié)果表明,深度殘差網(wǎng)絡具有出色的特征提取能力。
3.4 模型對比表4不同模型的分類精度
為了驗證提出的 InceptionResNet 模型與其他故障診斷模型的識別性能,選取了傳統(tǒng)的深度置信網(wǎng)絡(Deep belief network , DBN )和經(jīng)典的卷積神經(jīng)網(wǎng)絡 AlexNet 以及殘差網(wǎng)絡 ResNet18進行對比實驗。其中, DBN 由輸入層、兩個隱藏層和輸出層組成,其神經(jīng)元個數(shù)分別為 1000、 100、 100、 10; AlexNet 由卷積層、最大池化層和全連接層組成。所有對比模型均采用 Softmax 分類器。對比結(jié)果如表4 所示。
從表4 中可以看出,傳統(tǒng) DBN 模型對齒輪狀態(tài)的綜合識別率較差,其原因在于淺層神經(jīng)網(wǎng)絡模型的特征學習能力有限,不能學習到更加有用的特征。相比 DBN 模型, AlexNet 、ResNet 及 InceptionResNet 模型在診斷精度和穩(wěn)定性上均體現(xiàn)出較大的優(yōu)勢,其原因是它通過局部連接和權(quán)值共享保留了重要的參數(shù),減少了大量參與訓練的權(quán)重計算,達到了良好的學習效果。與 ResNet 相比, InceptionResNet 通過 Inception 模塊與殘差模塊的結(jié)合,減少了訓練時長,提升齒輪識別率達到了最高為99.59%。因此, InceptionResNet 模型學習到的特征具備很好的分類特性,能夠很好地運用在齒輪的故障診斷中。
4結(jié)語
為了提高齒輪箱故障診斷的效率,減少診斷耗費的時間,提出了結(jié)合 Inception 和殘差網(wǎng)絡的模型,并將其應用在齒輪箱齒輪的故障診斷中。首先,將經(jīng)過 GAF 變換后的圖像樣本進行半重疊的樣本分割;其次,將分割后的子樣本劃分為訓練子樣本、驗證子樣本和測試子樣本;最后,通過對 InceptionResNet 殘差網(wǎng)絡進行訓練、驗證和測試,實現(xiàn)了齒輪箱的故障分類。經(jīng)過與其他故障診斷模型的對比實驗,表明該模型在齒輪箱的狀態(tài)識別上具有較高的準確率。同時,t-SNE 方法的可視化表明了其具備強大的特征分類能力。
參考文獻
[1 ]劉艷芳,劉尚旺.MED 和分層模糊熵在滾動軸承故障診斷中的應用[J]. 機械設(shè)計與制造,2018(11):49-52.
LIU Yanfang,LIU Shangwang.Application of MED and hierarchical fuzzy entropy to rolling bearing fault diagnosis[J].Machinery Design and Manufacture,2018(11):49-52.
[2 ] CHEN J L,LI Z P,PAN J,et al. Wavelet transform based on innerproduct in fault diagnosis of rotating machinery:a review[J]. Me- chanical Systems and Signal Processing,2016:1-35.
[3 ] VAN M,KANG H J,SHIN K S.Rolling element bearing fault diagno-sis based on non-local means de-noising and empirical mode de-composition[J].IET Science Measurement and Technology,2014,8( 6):571-578.
[4 ]任浩,屈劍鋒,柴毅,等. 深度學習在故障診斷領(lǐng)域中的研究現(xiàn)狀與挑戰(zhàn)[J]. 控制與決策,2017,32(8 ):1345-1358.
REN Hao,QU Jianfeng,CHAI Yi,et al.Deep learning for fault diag-nosis:the state of the art and challenge[J]. Control and Decision,2017,32(8 ):1345-1358.
[5 ] ZHANG W,PENG G L,LI C H,et al.A new deep learning model forfault diagnosis with good anti-noise and domain adaptation ability on raw vibration signals[J].Sensors,2017,17(2 ):425.
[6 ]李恒,張氫,秦仙蓉,等. 基于短時傅里葉變換和卷積神經(jīng)網(wǎng)絡的軸承故障診斷方法[J]. 振動與沖擊,2018,37(19):124-131.
LI Heng,ZHANG Qing,QIN Xianrong,et al.Fault diagnosis method for rolling bearings based on short-time fourier transform and convo-lution neural network[J].Journal of Vibration and Shock,2018,37( 19):124-131.
[7 ] HE C,GE D C,YANG M H,et al.A data-driven adaptive fault diag-nosis methodology for nuclear power systems based on NSGAII-CNN [J].Annals of Nuclear Energy,2021,159(1 ):12.
[8 ]仝鈺,龐新宇,魏子涵. 基于 GADF-CNN 的滾動軸承故障診斷方法[J]. 振動與沖擊,2021,40(5 ):247-253.
TONG Yu,PANG Xinyu,WEI Zihan.Rolling bearing fault diagnosis method based on GADF-CNN [J]. Journal of Vibration and Shock,2021,40(5 ):247-253.
[9 ] FAN H W,XUE C,ZHANG X H,et al. Vibration images-drivenfault diagnosis based on CNN and transfer learning of rolling bearing under strong noise[J].Shock and Vibration,2021(2 ):1-16.
[10] ZHANG Z,F(xiàn)AN Y.Online modeling method of fault diagnosis basedon CNN and OS-ELM [ M ]//Recent Development in Mechatronics and Intelligent Robotics.Berlin:Springer,2020:495-503.
[11] HE K M,ZHANG X Y,REN S Q,et al. Deep residual learning forimage recognition[ C ]//Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition ( CVPR ),June 27-30,2016,Las Vegas,NV,USA.New York:IEEE,2016:770-778.
[12] FU S F,CAI F H,WANG W. Fault diagnosis of photovoltaic arraybased on SE-ResNet [J]. Journal of Physics Conference Series,2020,1682(1 ):012004.
[13] WANG Z G,OATES T.Encoding time series as images for visual in-spection and classification using tiled convolutional neural Networks [ C ].Workshops at the Twenty-ninth AAAI Conference on Artificial Intelligence,2015:40-46.
[14] SZEGEDY C,LOFFE S,VANHOUCKE V,et al. Inception-v4,in-ception-ResNet and the impact of residual connections on learning [J]. 31st AAAI Conference on Artificial Intelligence,2016:4278-4284.
[15] VAN DER MAATEN L ,HINTON G.Visualizing data using t-SNE[J].Journal of Machine Learning Research,2008(9 ):2579-2605.
收稿日期:2021-06-15修回日期:2021-07-14
基金項目:山西省重點研發(fā)項目(201903D121064)
作者簡介:李長文(1979—),男,山西平定人,講師;主要研究方向為深度學習算法智能研究。