張智禹, 尹愛(ài)軍, 譚 建
(1. 重慶大學(xué) 機(jī)械工程學(xué)院 機(jī)械傳動(dòng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,重慶 400044;2. 中國(guó)石油西南油氣田分公司重慶氣礦,重慶 400021)
齒輪箱作為機(jī)械傳動(dòng)系統(tǒng)中關(guān)鍵組件,由于其結(jié)構(gòu)復(fù)雜、工況環(huán)境多變等因素導(dǎo)致其經(jīng)常出現(xiàn)故障,因此齒輪箱故障診斷方法研究引起廣泛關(guān)注[1]。而在變工況條件下,同類故障間的振動(dòng)幅值、能量存在較大差異使得齒輪箱故障診斷更加困難,經(jīng)常出現(xiàn)誤診和漏診問(wèn)題[2]。因此,提出一種針對(duì)變工況下齒輪箱故障診斷方法十分必要。
近年來(lái),基于深度學(xué)習(xí)的故障診斷算法快速發(fā)展, Liu等[3]直接使用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)對(duì)時(shí)域信號(hào)進(jìn)行特征提取,用于診斷旋轉(zhuǎn)機(jī)械故障。張小強(qiáng)等[4]利用時(shí)域與頻域特征結(jié)合進(jìn)行行星齒輪磨損和斷齒的檢測(cè)。Chen等[5]提出結(jié)合時(shí)頻域信號(hào)處理方法離散小波變換與卷積神經(jīng)網(wǎng)絡(luò)用于行星齒輪箱故障診斷。然而時(shí)域、頻域特征由于對(duì)非平穩(wěn)信號(hào)不敏感[6]、特征性能不穩(wěn)定[7]等原因單獨(dú)作為齒輪箱故障診斷特征參數(shù)不適用,時(shí)頻域特征受Heisenberg測(cè)不準(zhǔn)原理對(duì)非平穩(wěn)信號(hào)分析存在局限[8]。因此,為了獲得齒輪箱全面的、多維度的信息,本文提取振動(dòng)信號(hào)的時(shí)域、頻域、小波包時(shí)頻域特征形成高維特征集。
在獲得全面的特征集合后,如何挖掘內(nèi)在信息從而精確識(shí)別變工況條件下齒輪箱故障是至關(guān)重要。部分學(xué)者通過(guò)增加深度學(xué)習(xí)模型層數(shù),通過(guò)大規(guī)模參數(shù)訓(xùn)練來(lái)學(xué)習(xí)齒輪箱故障特征[9-10],由此帶來(lái)網(wǎng)絡(luò)模型訓(xùn)練時(shí)間長(zhǎng)、收斂困難等問(wèn)題[11]。針對(duì)這些問(wèn)題,本文利用深度置信網(wǎng)絡(luò)(deep belief networks, DBN)具有的貪心學(xué)習(xí)優(yōu)勢(shì),分別對(duì)三個(gè)維度特征進(jìn)行深度挖掘;同時(shí)為解決多個(gè)網(wǎng)絡(luò)輸出間串行連接無(wú)權(quán)重分配機(jī)制問(wèn)題[12],結(jié)合注意力機(jī)制,對(duì)變工況齒輪箱狀態(tài)特征自適應(yīng) “注意”。最后改進(jìn)DBN中Softmax損失函數(shù)為余弦損失函數(shù),將損失從歐幾里德空間映射到角空間從而降低對(duì)變工況引起的信號(hào)強(qiáng)度的敏感性。
本文提出了融合注意力機(jī)制的改進(jìn)DBN變工況齒輪箱故障診斷方法,為解決單一故障特征診斷準(zhǔn)確性低的問(wèn)題,提出融合時(shí)域、頻域、小波包時(shí)頻域特征作為故障診斷參數(shù)。使用余弦損失函數(shù)改進(jìn)后的DBN網(wǎng)絡(luò)結(jié)合注意力機(jī)制解決變工況敏感性問(wèn)題及網(wǎng)絡(luò)輸出動(dòng)態(tài)加權(quán)問(wèn)題。試驗(yàn)表明,該方法在變工況齒輪箱故障診斷中具有較好的效果。
DBN是由多個(gè)受限玻爾茲曼機(jī)(restricted Boltzmann machines, RBM)棧式疊加而成[13]。其中RBM可視為一個(gè)無(wú)向圖模型,是一種基于能量函數(shù)的概率建模方法。如圖1所示,RBM包含一個(gè)可見(jiàn)層v=(v1,v2,…,vn)與一個(gè)隱藏層h=(h1,h2,…,hm),層間通過(guò)權(quán)重矩陣Wn×m實(shí)現(xiàn)雙向全連接,層內(nèi)單元無(wú)連接。
圖1 RBM結(jié)構(gòu)
對(duì)于一組給定的狀態(tài)(v,h),其能量函數(shù)定義為
(1)
式中:wij為可見(jiàn)單元vi與隱藏單元hj間的連接權(quán)重;bi為可見(jiàn)層中第i個(gè)神經(jīng)元的偏置;cj為隱藏層中第j個(gè)神經(jīng)元的偏置。
基于能量函數(shù)得到任一組(v,h)的聯(lián)合概率分布為
(2)
當(dāng)給定各可見(jiàn)層單元狀態(tài)v,可得隱藏層單元的激活概率為
(3)
相應(yīng)的給定隱藏單元狀態(tài)h,可得可見(jiàn)層單元激活概率為
(4)
式中,S函數(shù)為Sigmoid函數(shù),定義為
S(x)=1/(1+e-x)
(5)
為訓(xùn)練RBM,通過(guò)最大化訓(xùn)練集上的對(duì)數(shù)似然來(lái)調(diào)整參數(shù),對(duì)于連接權(quán)重wij,其偏導(dǎo)為
(6)
式中, 〈vihj〉d,〈vihj〉m分別為數(shù)據(jù)分布與模型分布的期望。由于〈vihj〉m計(jì)算復(fù)雜度高,因此采用對(duì)比散度(contrastive divergence, CD)方法[14]進(jìn)行梯度估計(jì)。因此權(quán)重參數(shù)wij可以通過(guò)式(7)進(jìn)行更新。
Vwij=η(〈vihj〉d-〈vihj〉r)
(7)
式中: 〈vihj〉r為可見(jiàn)層重構(gòu)的分布期望;η為學(xué)習(xí)率; 相應(yīng)的bi,cj偏置參數(shù)可通過(guò)相同方法進(jìn)行更新。
利用RBM結(jié)構(gòu)擁有的無(wú)監(jiān)督貪婪學(xué)習(xí)優(yōu)勢(shì)及數(shù)據(jù)特征凸顯能力分別對(duì)時(shí)域、頻域、小波包特征進(jìn)行挖掘,學(xué)習(xí)其中對(duì)齒輪箱故障有效的深度特征。
在1.1節(jié)獲得多個(gè)維度的深度特征后,需要結(jié)合這些特征以獲得更全面的故障信息,目前部分學(xué)者在結(jié)合多網(wǎng)絡(luò)輸出、多域特征時(shí)常采用串行連接方式,如圖2所示,此方式明顯忽略了不同特征對(duì)故障診斷結(jié)果貢獻(xiàn)度大小不同的因素。
圖2 傳統(tǒng)結(jié)合多網(wǎng)絡(luò)輸出方式
因此本文引入注意力機(jī)制[15],他是模仿人類在觀察不同事物時(shí),自動(dòng)將注意力轉(zhuǎn)移到自己感興趣部分,而減弱對(duì)無(wú)關(guān)信息的關(guān)注,從而提升信息的獲取能力,本文提出的融合注意力機(jī)制的DBN模型,如圖3所示。
圖3 注意力DBN模型
利用注意力機(jī)制將1.1節(jié)通過(guò)RBM后獲取的時(shí)域、頻域、小波包深度特征結(jié)合形成齒輪箱故障診斷的全局特征計(jì)算為
ui=tanh(Wwhi+bw)
(8)
(9)
(10)
式中:hi分別為時(shí)域、頻域、小波域深度特征;ai為與之相對(duì)應(yīng)的重要性權(quán)值;c為通過(guò)注意力機(jī)制獲得的全局特征。
余弦損失函數(shù)為在Softmax損失函數(shù)基礎(chǔ)上,保留其擴(kuò)大類間差異的優(yōu)勢(shì)[16],但減小其對(duì)不同信號(hào)強(qiáng)度的敏感性,而更加注重向量在方向上的差異,如圖4所示。
圖4 余弦損失示意圖
對(duì)于相同故障信號(hào)q1,q2,其對(duì)于故障標(biāo)簽為p1,在以Softmax作為損失函數(shù)時(shí),得到最終損失函數(shù)Ls如式(11)所示。
(11)
式中:B,N分別為一批次訓(xùn)練樣本數(shù)與故障類別數(shù);x為隱藏層輸出;W為權(quán)重矩陣;θ為其間夾角。由式(11)及圖3可知, Softmax損失與信號(hào)幅值相關(guān)。而以1-余弦相似度作為損失函數(shù),得到最終損失函數(shù)Lc如式(12)所示。
(12)
由式(12)看出,式中‖x‖2可消去,因此余弦損失與信號(hào)幅值無(wú)關(guān)。因此將余弦損失作為齒輪箱故障診斷損失函數(shù),可將損失從歐幾里德空間轉(zhuǎn)換為角空間從而消除信號(hào)幅值影響,降低網(wǎng)絡(luò)的擬合負(fù)擔(dān)。
設(shè)在齒輪箱上采集到的振動(dòng)信號(hào)為s(t),對(duì)s(t)提取時(shí)域、頻域、小波包特征構(gòu)成特征集后分別輸入至改進(jìn)后DBN中,利用注意力機(jī)制結(jié)合各維度深度特征后映射至不同故障類型。完成模型訓(xùn)練后,輸入實(shí)時(shí)采集到的振動(dòng)信號(hào)診斷齒輪箱故障。具體流程如圖5所示。
圖5 融合注意力機(jī)制的改進(jìn)DBN變工況齒輪箱故障診斷流程
由圖5可知,具體步驟為:
步驟1輸入采集的齒輪箱振動(dòng)信號(hào)s(t),提取其峭度、偏度、有效值等11個(gè)時(shí)域特征,提取其均值頻率、一階重心等13個(gè)頻域特征;利用小波包變換提取其能量特征,本文采用db5小波進(jìn)行3層分解;
步驟2利用DBN的貪婪學(xué)習(xí)方法分別對(duì)三個(gè)維度特征進(jìn)行深度挖掘,形成P1,P2,P3三個(gè)深度特征集合;
步驟3利用注意力機(jī)制對(duì)P1,P2,P3進(jìn)行自適應(yīng)動(dòng)態(tài)加權(quán)形成最終特征集合P,并輸入全連接層,完成齒輪箱故障識(shí)別;
步驟4利用改進(jìn)后損失函數(shù)對(duì)模型進(jìn)行訓(xùn)練,完成在訓(xùn)練集上齒輪箱故障精確識(shí)別;
步驟5對(duì)運(yùn)行中的齒輪箱持續(xù)提取振動(dòng)信號(hào)s(t),按照步驟1~步驟3對(duì)其進(jìn)行處理,從而識(shí)別當(dāng)前齒輪箱運(yùn)行狀態(tài),最后輸出齒輪箱故障識(shí)別結(jié)果。
為驗(yàn)證所提方法的有效性,本文采用變工況下齒輪箱多類故障診斷試驗(yàn)進(jìn)行驗(yàn)證。試驗(yàn)臺(tái)如圖6所示,電機(jī)通過(guò)聯(lián)軸器驅(qū)動(dòng)齒輪箱軸1,軸間通過(guò)斜齒輪(模數(shù)= 2.25,壓力角= 20°,螺旋角= 20°,Z1=30,Z2=Z3=45,Z4=80)傳動(dòng),輸出軸3通過(guò)皮帶連接電磁扭矩負(fù)載。在箱體上安裝加速度傳感器采集齒輪箱振動(dòng)信號(hào),最終通過(guò)NI DAQ 6062E采集卡采集數(shù)據(jù),采樣頻率為50 kHz,采樣時(shí)長(zhǎng)為10 s。
圖6 變工況齒輪箱故障識(shí)別裝置
分別在轉(zhuǎn)速為480 r/min,720 r/min,900 r/min、負(fù)載為0,10 V,30 V下,分別測(cè)試Z3點(diǎn)蝕、Z4齒根裂紋、軸承B1內(nèi)圈、外圈、滾動(dòng)體故障等10類故障及一種正常狀態(tài),各故障實(shí)拍圖如圖7所示。
圖7 齒輪箱各故障圖
重復(fù)5次試驗(yàn)完成齒輪箱振動(dòng)數(shù)據(jù)采集,因此共得到9種工況下11類齒輪箱狀態(tài)。為便于分析,對(duì)每一類故障/正常振動(dòng)信號(hào)各取50組作為測(cè)試樣本,100組作為訓(xùn)練樣本對(duì)所提注意力DBN模型進(jìn)行訓(xùn)練。訓(xùn)練完成后,輸入測(cè)試數(shù)據(jù)得到,該方法綜合故障診斷率達(dá)到99.09%,各分類故障診斷結(jié)果如圖8所示。
圖8 注意力DBN的各類故障診斷結(jié)果
為進(jìn)一步驗(yàn)證所提方法的有效性及泛化能力,將機(jī)器學(xué)習(xí)中經(jīng)典故障診斷模型SVM、通用深度學(xué)習(xí)算法BP神經(jīng)網(wǎng)絡(luò)及DBN模型應(yīng)用相同的數(shù)據(jù),分別得到其在訓(xùn)練及測(cè)試階段的齒輪箱故障診斷精度與本文提出的方法診斷精度對(duì)比,如表1所示。
表1 與其他經(jīng)典故障診斷算法的對(duì)比結(jié)果
由表1可知,本文中提出的融合注意力機(jī)制的改進(jìn)DBN變工況齒輪箱故障診斷方法具有最高的診斷精度。同時(shí)根據(jù)訓(xùn)練精度與測(cè)試精度的差值列看出,本文方法(0.18%)相比DBN(1.38%),SVM(1.67%),BP(2.01%)擁有更強(qiáng)的泛化能力。
分別畫(huà)出本文提出的方法與DBN方法訓(xùn)練時(shí)診斷精度隨迭代次數(shù)變化曲線,如圖9所示。
圖9 本文提出的方法與DBN方法訓(xùn)練時(shí)故障診斷率曲線
由圖9可知,本文提出的方法相比DBN更快收斂于較高的診斷精度,因此可減少訓(xùn)練時(shí)間。從試驗(yàn)結(jié)果可以得知,本文方法在相對(duì)提高模型收斂速度與泛化能力的基礎(chǔ)上,對(duì)變工況齒輪箱故障擁有更高的診斷精度。
為驗(yàn)證所提余弦損失函數(shù)關(guān)于降低模型對(duì)振動(dòng)信號(hào)幅值變化敏感性的效果,同時(shí)為與現(xiàn)有研究成果進(jìn)行對(duì)比。本文利用西儲(chǔ)大學(xué)軸承故障試驗(yàn)數(shù)據(jù)再次進(jìn)行驗(yàn)證。試驗(yàn)描述可參見(jiàn)Lu等的研究,本文以2 048個(gè)點(diǎn)長(zhǎng)度截取故障信號(hào),采用負(fù)載工況為2 238 W時(shí)樣本作為訓(xùn)練集,負(fù)載工況分別為0,746 W,1 492 W時(shí)樣本作為測(cè)試集,測(cè)試在變負(fù)載工況下包含不同缺陷大小的各故障模型識(shí)別精度。得到各類故障識(shí)別精度如圖10所示,其中1~4分別代表正常運(yùn)行、內(nèi)圈故障、外圈故障、滾動(dòng)體故障四種運(yùn)行模式。
圖10 不同負(fù)載下軸承各類故障識(shí)別精度
由圖10可知,本文所提方法對(duì)于訓(xùn)練時(shí)未出現(xiàn)過(guò)的負(fù)載工況也有著很高的故障識(shí)別精度。為可視化故障特征學(xué)習(xí)過(guò)程,引入t-SNE對(duì)所提模型的軸承故障特征輸入層、注意力動(dòng)態(tài)加權(quán)輸出層、全連接層特征進(jìn)行三維可視化,結(jié)果如圖11所示。
由圖11可知,隨著故障特征經(jīng)過(guò)注意力動(dòng)態(tài)加權(quán)輸出層、全連接層,不同類別故障間分布邊界逐漸清晰,可分性逐漸增加。在全連接層幾乎全部可分,實(shí)現(xiàn)故障的準(zhǔn)確識(shí)別。
圖11 各層特征的t-SNE可視化
與已發(fā)表的現(xiàn)有研究成果進(jìn)行對(duì)比,對(duì)不同工況下(0~1 492 W)相同故障模式識(shí)別結(jié)果求和取平均后作為該類故障模式的總體識(shí)別精度。表2給出了各類故障識(shí)別方法對(duì)不同故障模式詳細(xì)的識(shí)別結(jié)果。
表2 現(xiàn)有方法與本文所提方法的故障識(shí)別精度對(duì)比
由表2可知,本文所提方法相比深度自編碼器方法、卷積神經(jīng)網(wǎng)絡(luò)方法等具有更高的故障識(shí)別精度,證實(shí)了所提方法的有效性。
針對(duì)在變工況運(yùn)行條件下,齒輪箱故障難以識(shí)別且精度降低的問(wèn)題,本文提出融合注意力機(jī)制的改進(jìn)DBN變工況齒輪箱故障診斷方法。通過(guò)試驗(yàn)驗(yàn)證及與其他常用故障診斷方法對(duì)比,結(jié)果表明:
(1) 該方法在利用時(shí)域、頻域、小波包等多維度特征的基礎(chǔ)上,利用注意力機(jī)制融合深度特征,有效提高了變工況環(huán)境下齒輪箱故障診斷的精確度。
(2) 通過(guò)改進(jìn)DBN模型損失函數(shù),降低了模型對(duì)故障信號(hào)幅值的敏感性,因此減輕了網(wǎng)絡(luò)擬合負(fù)擔(dān)、提高了泛化能力。
在未來(lái)工作中,將對(duì)于實(shí)際生產(chǎn)中數(shù)據(jù)缺乏標(biāo)簽問(wèn)題,利用DBN模型的無(wú)監(jiān)督學(xué)習(xí)能力,搭建半監(jiān)督故障診斷模型,減少對(duì)標(biāo)簽數(shù)據(jù)的依賴。