徐濟(jì)宣,馬 輝,馮小凱
(1.江西交通職業(yè)技術(shù)學(xué)院汽車工程系,江西 南昌330013;2.吉林農(nóng)業(yè)科技學(xué)院,吉林 吉林132101;3.湖南大學(xué),湖南 長沙410082)
滾動軸承是大型自動化設(shè)備中最容易損壞的機(jī)械部件之一,軸承故障會引發(fā)巨大的經(jīng)濟(jì)損失,甚至造成人員傷亡。因此對軸承進(jìn)行實(shí)時(shí)、準(zhǔn)確地監(jiān)測和診斷顯得極為重要[1]。對同一設(shè)備故障狀態(tài)監(jiān)測的多個(gè)傳感器具有互補(bǔ)性,可以彌補(bǔ)單個(gè)信息源數(shù)據(jù)不完整的缺陷。因此,研究多源異構(gòu)數(shù)據(jù)的融合與故障診斷問題具有重要的理論意義和工程價(jià)值。
設(shè)計(jì)多源異構(gòu)數(shù)據(jù)的融合方法,實(shí)現(xiàn)多源數(shù)據(jù)的關(guān)聯(lián)、交叉和互補(bǔ),是多源異構(gòu)數(shù)據(jù)融合的根本問題。多源異構(gòu)數(shù)據(jù)的融合,按照融合級別,可以分為數(shù)據(jù)級融合、特征級融合和決策級融合。數(shù)據(jù)級融合即為原始采集數(shù)據(jù)的融合,包括加權(quán)平均法、金字塔算法等,文獻(xiàn)[2]使用加權(quán)平均法對傳感器位置進(jìn)行融合,此方法簡單易懂、易于實(shí)現(xiàn),但是融合信息的對比度低。特征級融合是提取每個(gè)異構(gòu)數(shù)據(jù)的特征,而后進(jìn)行特征組合,得到多源異構(gòu)數(shù)據(jù)的聯(lián)合特征。文獻(xiàn)[3]將故障數(shù)據(jù)分為靜態(tài)開關(guān)量、動態(tài)電氣量和暫態(tài)電氣量,分別提取故障特征組成聯(lián)合特征,實(shí)現(xiàn)了特征級融合,得到了精確的故障類型和故障位置。這種融合方法過于粗糙,各自孤立的提取各自信息的故障特征,而后組合成特征向量,忽略了異構(gòu)數(shù)據(jù)之間的關(guān)聯(lián)性和互補(bǔ)性。決策級融合是指對多源數(shù)據(jù)建立各自的深度學(xué)習(xí)網(wǎng)絡(luò),決策時(shí)對分類結(jié)果進(jìn)行融合,包括投票法、D-S證據(jù)理論等。文獻(xiàn)[4]在煤礦安全預(yù)警中提出了基于D-S理論的決策級融合方法,建立的安全預(yù)警模型對井下安全具有指導(dǎo)意義,但是D-S理論的理論基礎(chǔ)存在爭議,同時(shí)DS理論存在指數(shù)爆炸問題。
本文研究了軸承多源異構(gòu)故障數(shù)據(jù)的特征融合問題,使用深度神經(jīng)網(wǎng)絡(luò)將多源數(shù)據(jù)特征進(jìn)行有效融合,提取更加能夠表征故障特性的融合特征,達(dá)到提高軸承故障診斷精度的目的。
顧名思義,堆疊自編碼器是由編碼器堆疊而成,因此首先介紹自編碼器。自編碼器(Automotive Encoder,AE)分為編碼和解碼兩個(gè)過程,其中編碼可視為特征提取的過程,解碼可視為數(shù)據(jù)還原的過程[5],其模型結(jié)構(gòu)如圖1所示。
圖1 自動編碼器模型結(jié)構(gòu)Fig.1 Automotive Encoder Model Structure
編碼器輸入記為X,則編碼過程(即隱藏層輸出)為:
式中:σ1—編碼過程激活函數(shù);W—輸入層向隱藏層的傳遞權(quán)值矩陣;b—隱藏層的偏置向量;h—隱藏層激活值,也可以理解為提取的隱藏特征。解碼過程為:
式中:σ2—編碼過程激活函數(shù);W′—隱藏層向輸出層的傳遞權(quán)值矩陣;b′—輸出層的偏置向量;Y—輸入的重構(gòu)值。自動編碼器的重構(gòu)誤差及參數(shù)更新過程[6]為:
式中:J(X,Y)—重構(gòu)誤差,α—學(xué)習(xí)率。
本節(jié)構(gòu)造的深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)由多個(gè)自編碼器堆疊而成,以前一個(gè)自編碼器的隱藏層激活值作為下一個(gè)自編碼器的輸入,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
對于圖2所示的堆疊自編碼器,輸入無標(biāo)簽數(shù)據(jù)X,使用式(1)、式(2)和式(3)進(jìn)行訓(xùn)練,得到AE1的隱藏層特征h1和網(wǎng)絡(luò)參數(shù)θ1={ }W1,b1,W1′,b1′。而后以h1作為AE2的輸入,按照式(3)訓(xùn)練方法,得到AE2的隱藏層特征h2和網(wǎng)絡(luò)參數(shù)θ2={W2,b2,W2′,b2′}。重復(fù)以上過程直至得到自編碼器AEn的隱藏層特征hn和網(wǎng)絡(luò)參數(shù)θn={Wn,bn,Wn′,bn′}。
圖2 自編碼器堆疊而成的深度神經(jīng)網(wǎng)絡(luò)Fig.2 Deep Neutral Network Stacked by Automotive Encoder
最后一層自編碼器得到的隱藏層特征hn即為深度神經(jīng)網(wǎng)絡(luò)獲取的輸入數(shù)據(jù)隱藏特征。將隱藏特征hn輸入到Softmax分類器中,使用有標(biāo)簽的數(shù)據(jù)對Softmax分類器進(jìn)行訓(xùn)練。對于K分類問題,將第m個(gè)觀測樣本x(m)=[x1(m),x2(m),…xk(m)]輸入到堆疊自編碼器中得到隱藏特征hn,將hn輸入到Softmax分類器中,得分類結(jié)果[7]為:
式中:label(m)—分類結(jié)果;θ=[θ1,θ2,…,θK]—Softmax分類器參數(shù)。
為了保證分類的準(zhǔn)確性,通過最小化分類代價(jià)函數(shù)實(shí)現(xiàn)參數(shù)的優(yōu)化與更新,代價(jià)函數(shù)及參數(shù)更新方法為:
式中:M—樣本數(shù)量,K—分類數(shù),θ—Softmax分類器網(wǎng)絡(luò)參數(shù),E(θ)—重構(gòu)誤差。
卷積神經(jīng)網(wǎng)絡(luò)更加適用于二維輸入數(shù)據(jù),比如圖像輸入。卷積神經(jīng)網(wǎng)絡(luò)由輸入層、卷積層、池化層、全連接層和輸出層組成[8]。
(1)卷積層。卷積層將輸入數(shù)據(jù)與卷積核進(jìn)行卷積運(yùn)算生成特征映射,供池化層提取與降維。對于輸入數(shù)據(jù)X,卷積核從輸入數(shù)據(jù)中學(xué)習(xí)到的特征為:
式中:hCNN,i—第i層卷積層的特征輸出,?—卷積,WCNN,i—第i層卷積核權(quán)值,bCNN,i—第i層卷積核偏置,g()—線性整流ReLU激活函數(shù)。
(2)池化層。池化層是為了提取重要的特征信息,達(dá)到降低特征維度的目的。最大池化方式可以獲得與位置無關(guān)的特征,對于軸承周期性振動信號極為適用,因此本文使用最大池化方式最大池化是指對卷積層輸出的特征量hCNN,i,每連續(xù)ψ個(gè)hCNN,i選擇一個(gè)最大值進(jìn)行保留。數(shù)學(xué)描述為:
式中:hCNN,j—第j個(gè)池化層輸出,維度為s,g—池化長度。
(3)全連接層。將最后一級池化層的輸出平鋪,作為全連接層輸入。對輸入數(shù)據(jù)使用ReLU激勵(lì)函數(shù)進(jìn)行激活,得到卷積神經(jīng)網(wǎng)絡(luò)的最終特征參數(shù)hCNN。
卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)使用基于Adam算法的優(yōu)化方法,具體可參考文獻(xiàn)[9]。
當(dāng)前的多源異構(gòu)數(shù)據(jù)特征級融合,大都獨(dú)立地提取各數(shù)據(jù)源的特征,而后拼接成聯(lián)合特征向量,這種粗糙的融合方法忽略了數(shù)據(jù)的互補(bǔ)性和關(guān)聯(lián)性。為了解決這一問題,本文提出了基于深度學(xué)習(xí)的交替優(yōu)化方法。
第一步:使用堆疊自編碼器構(gòu)造的深度神經(jīng)網(wǎng)絡(luò)(DNN)提取1維振動信號的故障特征FDNN。深度神經(jīng)網(wǎng)絡(luò)構(gòu)造為:
式中:NetDNN—訓(xùn)練完畢的深度神經(jīng)網(wǎng)絡(luò);TrDNN—訓(xùn)練完畢的網(wǎng)絡(luò)參數(shù);Feedforward—多隱藏層神經(jīng)網(wǎng)絡(luò)生成函數(shù);θDNN={WDNN,bDNN}—神經(jīng)網(wǎng)絡(luò)參數(shù);MD—隱藏層數(shù);h1~hMD—各隱藏層神經(jīng)元數(shù)量;X1D—輸入的1維振動數(shù)據(jù)。
使用訓(xùn)練得到的深度神經(jīng)網(wǎng)絡(luò)NetDNN,得到1維振動數(shù)據(jù)的特征為:
式中:FDNN—1維數(shù)據(jù)隱藏特征;GDNN—深度神經(jīng)網(wǎng)絡(luò)輸出函數(shù)。
第二步:使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)提取2維圖像數(shù)據(jù)的1維故障特征FCNN。卷積神經(jīng)網(wǎng)絡(luò)構(gòu)造為:
式中:NetCNN—訓(xùn)練完畢的卷積神經(jīng)網(wǎng)絡(luò);TrCNN—訓(xùn)練完畢的網(wǎng)絡(luò)參數(shù);Feedforward—多隱藏層神經(jīng)網(wǎng)絡(luò)生成函數(shù);θCNN={WCNN,bCNN}—網(wǎng)絡(luò)參數(shù);MCL、Mpool—卷積層數(shù)和池化層數(shù);SizeCL、Sizepool—卷積核大小和池化核大小;X2D—輸入的2維圖像數(shù)據(jù)。
使用訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)NetCNN,得到2維圖像數(shù)據(jù)的特征為:
式中:FCNN—2維圖像數(shù)據(jù)得到的1維隱藏特征;GCNN—卷積神經(jīng)網(wǎng)絡(luò)輸出函數(shù)。
第三步:使用堆疊自編碼器構(gòu)造融合網(wǎng)絡(luò)Netfu,用于多源特征的交替優(yōu)化融合,最終獲得多源融合特征Ffu。使用多隱藏層神經(jīng)網(wǎng)絡(luò)生成函數(shù)Feedforward得到融合網(wǎng)絡(luò)Netfu,為:
式中:Netfu—訓(xùn)練完畢的融合網(wǎng)絡(luò);Trfu—訓(xùn)練完畢的網(wǎng)絡(luò)參數(shù);θfu={Wfu,bfu}—神經(jīng)網(wǎng)絡(luò)參數(shù);Mf—隱藏層數(shù);h1~hMf—各隱藏層神經(jīng)元數(shù)量;FDNN、FCNN—輸入數(shù)據(jù)。
將1維振動數(shù)據(jù)隱藏特征FDNN、2維圖像數(shù)據(jù)的隱藏特征FCNN同時(shí)輸入到融合網(wǎng)絡(luò)Netfu中,進(jìn)行交替優(yōu)化,優(yōu)化方法示意圖,如圖3所示。
圖3 交替優(yōu)化示意圖Fig.3 Alternative Optimization Diagram
首先將隱藏特征FDNN輸入到融合網(wǎng)絡(luò)Netfu11中,網(wǎng)絡(luò)參數(shù)初始化方法為:
式中:Q—輸入層神經(jīng)云數(shù)量,hfu1、hfu2、hfu3—隱藏層1、隱藏層2、隱藏層3的神經(jīng)云數(shù)量,Wfu1—輸入層到隱藏層1的權(quán)值,bfu1—隱藏層1的偏置值,Wfu2—隱藏層1到隱藏層2的權(quán)值,bfu2—隱藏層2的偏置值,Wfu3—隱藏層2到隱藏層3的權(quán)值,bfu3—隱藏層3的偏置值;函數(shù)rand(a,b)是指產(chǎn)生a×b矩陣,矩陣值為(0,1)間隨機(jī)數(shù);zeros(a,b)是指產(chǎn)生要素為0的a×b矩陣。
將FDNN輸入到融合網(wǎng)絡(luò)Netfu11中,按照式(1)、式(2)和式(3)進(jìn)行訓(xùn)練,得到訓(xùn)練完畢的參數(shù)Trfu1,1D,利用訓(xùn)練完畢的網(wǎng)絡(luò)提取1維數(shù)據(jù)的融合特征為:
式中:Ffu1,1D—1維數(shù)據(jù)提取的融合特征,Gfu1—融合網(wǎng)絡(luò)Netfu11輸出函數(shù)。
而后以Trfu1,!D作為融合網(wǎng)絡(luò)Netfu12參數(shù)初值,將隱藏特征FCNN輸入到融合網(wǎng)絡(luò)Netfu12中,網(wǎng)絡(luò)參數(shù)的初始化方法和訓(xùn)練方法同融合網(wǎng)絡(luò)Netfu11一致,至此完成了隱藏特征FDNN和FCNN的第一輪交替優(yōu)化。融合網(wǎng)絡(luò)Netfu11對輸入數(shù)據(jù)FDNN的重構(gòu)誤差為:
式中:Rcfu11—融合網(wǎng)絡(luò)Netfu11對FDNN的重構(gòu)值,W′、b′的含義與式(2)一致,為解碼過程參數(shù),φ—激活函數(shù),n—隱藏特征FDNN的數(shù)據(jù)長度,Lfu11—融合網(wǎng)絡(luò)Netfu11對輸入數(shù)據(jù)FDNN的重構(gòu)誤差。以同樣方式計(jì)算融合網(wǎng)絡(luò)Netfu12對輸入數(shù)據(jù)FCNN的重構(gòu)誤差,記為Lfu12,由此得到第1輪交替優(yōu)化誤差L1為:
按照以上過程,重復(fù)地將FDNN與FCNN輸入到融合網(wǎng)絡(luò)中進(jìn)行交替優(yōu)化,直至優(yōu)化誤差L小于設(shè)定值ε。此時(shí)得到訓(xùn)練完畢的融合網(wǎng)絡(luò)Netfu和網(wǎng)絡(luò)參數(shù)Trfu。根據(jù)訓(xùn)練完畢的融合網(wǎng)絡(luò)Netfu,得到多源異構(gòu)數(shù)據(jù)的融合特征Ffu為:
式中:Gfu—融合網(wǎng)絡(luò)的輸出函數(shù)。
使用Softmax分類器進(jìn)行故障類型診斷。將融合特征Ffu作為Softmax分類器輸入,生成Softmax分類器為:
式中:Netsoft—Softmax分類器網(wǎng)絡(luò);θsoft—Softmax網(wǎng)絡(luò)參數(shù);hout—Softmax分類器神經(jīng)元數(shù)量;Ffu—Softmax分類器輸入的融合特征。
基于融合特征的Softmax分類器診斷結(jié)果為:
式中:result—分類結(jié)果;θ=[θ1,θ2,…,θK]—Softmax分類器參數(shù);K-分類種數(shù);p(yi=i|Ffu;θ)—參數(shù)為θ、輸入為Ffu時(shí)分類為k的概率。
對包括Softmax分類器在內(nèi)的融合網(wǎng)絡(luò)進(jìn)行參數(shù)反向調(diào)整時(shí),為了防止模型過擬合和過學(xué)習(xí),將L2正則化懲罰項(xiàng)加入到損失函數(shù)中,為:
式中:JC—損失函數(shù),n—樣本數(shù)量,y—原始標(biāo)簽,y′—識別結(jié)果,α—正則化超參數(shù),w—權(quán)值矩陣列向量。依據(jù)此損失函數(shù),使用梯度下降法對融合網(wǎng)絡(luò)進(jìn)行參數(shù)的反向優(yōu)化。
根據(jù)以上多源異構(gòu)數(shù)據(jù)的特征融合方法,制定基于融合特征的深度神經(jīng)網(wǎng)絡(luò)診斷流程,如圖4所示。
圖4 基于深度神經(jīng)網(wǎng)絡(luò)的診斷流程Fig.4 Diagnosis Flow of Deep Neural Network
基于融合特征的深度神經(jīng)網(wǎng)絡(luò)診斷方法分為離線建模部分和在線診斷部分,離線建模部分主要功能是深度神經(jīng)網(wǎng)絡(luò)建立與參數(shù)訓(xùn)練,在線診斷部分功能是使用訓(xùn)練完畢的深度神經(jīng)網(wǎng)絡(luò)模型,實(shí)時(shí)提取數(shù)據(jù)的融合特征并進(jìn)行故障類型診斷。
本文以美國凱斯西儲大學(xué)提供的軸承試驗(yàn)數(shù)據(jù)為基礎(chǔ)設(shè)計(jì)實(shí)驗(yàn)[10],使用電火花技術(shù)在軸承上加工單點(diǎn)故障,軸承狀態(tài)分為內(nèi)圈故障、外圈故障、滾珠故障和正常狀態(tài)等四類,故障直徑包括0.007英寸、0.014英寸、0.021英寸、0.028英寸和0.04英寸等,數(shù)據(jù)采樣頻率分為12kHZ和48kHz兩種,電機(jī)負(fù)載分為0hp、1hp、2hp、3hp等。本文使用負(fù)載為0hp、采樣頻率為12kHZ、電機(jī)轉(zhuǎn)速為1797RPM狀態(tài)下的實(shí)驗(yàn)數(shù)據(jù),設(shè)計(jì)三組實(shí)驗(yàn)如下。
實(shí)驗(yàn)一:故障直徑均為0.014英寸的內(nèi)圈故障數(shù)據(jù)、外圈故障數(shù)據(jù)、滾珠故障數(shù)據(jù)和正常軸承數(shù)據(jù)。訓(xùn)練樣本規(guī)模為8000,測樣樣本規(guī)模為4000。一維數(shù)據(jù)為一維振動數(shù)據(jù),二維數(shù)據(jù)為監(jiān)控中心監(jiān)視器截屏二維圖像數(shù)據(jù)。
實(shí)驗(yàn)二:故障直徑分別為0.007英寸、0.014英寸、0.021英寸的內(nèi)圈故障數(shù)據(jù)和正常軸承數(shù)據(jù)。訓(xùn)練樣本規(guī)模為8000,測樣樣本規(guī)模為4000。一維數(shù)據(jù)為一維振動數(shù)據(jù),二維數(shù)據(jù)為監(jiān)控中心監(jiān)視器截屏二維圖像數(shù)據(jù)。
實(shí)驗(yàn)三:故障直徑分別為0.007英寸、0.014英寸、0.021英寸的外圈故障數(shù)據(jù)和正常軸承數(shù)據(jù)。訓(xùn)練樣本規(guī)模為8000,測樣樣本規(guī)模為4000。一維數(shù)據(jù)為一維振動數(shù)據(jù),二維數(shù)據(jù)為監(jiān)控中心監(jiān)視器截屏二維圖像數(shù)據(jù)。
為了驗(yàn)證多源異構(gòu)數(shù)據(jù)融合特征的診斷效果,同時(shí)使用一維數(shù)據(jù)提取特征FDNN、二維數(shù)據(jù)提取特征FCNN、融合特征Ffu進(jìn)行故障診斷。用于特征融合的深度神經(jīng)網(wǎng)絡(luò)模型,如表1所示。
表1 融合網(wǎng)絡(luò)模型Tab.1 Fused Network Model
三組實(shí)驗(yàn)的實(shí)驗(yàn)結(jié)果較多,由于篇幅限制,在此僅以圖形的形式對實(shí)驗(yàn)一的診斷結(jié)果進(jìn)行展示,另外兩組實(shí)驗(yàn)的結(jié)果統(tǒng)計(jì)數(shù)據(jù)在后文中以表格形式給出。實(shí)驗(yàn)一的診斷結(jié)果如圖5所示,圖中狀態(tài)0、1、2、3分別表示正常狀態(tài)、滾珠故障、內(nèi)圈故障、外圈故障。
圖5 實(shí)驗(yàn)一的診斷結(jié)果Fig.5 Diagnosis Result of the First Experiment
圖5中,藍(lán)色“O”為測試數(shù)據(jù)的原始標(biāo)簽,紅色“*”為診斷結(jié)果,兩者重合表示診斷結(jié)果正確,兩者不重合表示診斷結(jié)果錯(cuò)誤。對比圖5中三幅圖可以看出,基于融合特征的診斷精度明顯高于兩外兩種方法。
統(tǒng)計(jì)實(shí)驗(yàn)一、實(shí)驗(yàn)二、實(shí)驗(yàn)三分別基于一維數(shù)據(jù)提取特征FDNN、二維數(shù)據(jù)提取特征FCNN、融合特征Ffu的診斷精度,結(jié)果,如表2和圖6所示。
表2 三組實(shí)驗(yàn)診斷結(jié)果Tab.2 Diagnosis Result of the Three Experiments
圖6 三組實(shí)驗(yàn)的診斷結(jié)果Fig.6 Diagnosis Result of the Three Experiments
結(jié)合表2中數(shù)據(jù)和圖6所示的柱狀圖可以看出,在三組實(shí)驗(yàn)中,基于FDNN的診斷精度最低,基于FCNN的診斷精度略高于基于FDNN的診斷精度,約高1~2個(gè)百分點(diǎn);基于融合特征Ffu的診斷精度最高,比另外兩種方法的診斷精度高10%以上。以上數(shù)據(jù)說明了深度神經(jīng)網(wǎng)絡(luò)能夠?qū)DNN和FCNN有效融合,提取出更加能夠表征故障特性的深層次融合特征,從而得到了最高的故障診斷精度。
研究了軸承故障時(shí)的多源異構(gòu)數(shù)據(jù)特征融合問題,提出了基于深度神經(jīng)網(wǎng)絡(luò)的多源特征融合方法,使用Softmax分類器對融合特征進(jìn)行故障分類。經(jīng)驗(yàn)證,得出了以下結(jié)論:(1)深層神經(jīng)網(wǎng)絡(luò)可以將多源異構(gòu)數(shù)據(jù)的特征進(jìn)行有效融合,提取深層次的融合特征;(2)基于融合特征Ffu的診斷精度比單獨(dú)使用FDNN和FCNN的診斷精度高10%以上,驗(yàn)證了本文故障診斷方法的有效性。