陳鵬,趙小強(qiáng)
(1.蘭州石化職業(yè)技術(shù)大學(xué) 電子電氣工程學(xué)院,蘭州 730060;2.蘭州理工大學(xué) 電氣工程與信息工程學(xué)院,蘭州 730050)
滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械的關(guān)鍵部件,在運(yùn)行過(guò)程中極易損傷,為保證軸承的健康運(yùn)行,國(guó)內(nèi)外學(xué)者針對(duì)軸承的狀態(tài)監(jiān)測(cè)和故障診斷方法進(jìn)行了大量的研究[1]?;谛盘?hào)處理和淺層機(jī)器學(xué)習(xí)的故障診斷方法對(duì)變工況下的軸承故障診斷能力不足,深度學(xué)習(xí)方法具有深層架構(gòu)和強(qiáng)特征自提取能力,在軸承故障診斷中得到了初步應(yīng)用。
文獻(xiàn)[2]通過(guò)卷積門控循環(huán)網(wǎng)絡(luò)實(shí)現(xiàn)了軸承的故障診斷,文獻(xiàn)[3]利用獨(dú)立自適應(yīng)學(xué)習(xí)率改進(jìn)深度信念網(wǎng)絡(luò)實(shí)現(xiàn)軸承的故障診斷,文獻(xiàn)[4]將螢火蟲優(yōu)化的核自動(dòng)編碼器應(yīng)用于中介軸承的故障診斷:這些方法直接實(shí)現(xiàn)了端到端的軸承故障診斷,證明了深度學(xué)習(xí)在軸承恒工況下的故障診斷能力較優(yōu)。而在變工況下,文獻(xiàn)[5-6]分別提出了改進(jìn)Alexnet和改進(jìn)殘差神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承變工況故障診斷方法,但其前提都是假設(shè)不同工況下的樣本分布一樣,與實(shí)際工況不符,也不具備很強(qiáng)的泛化能力。因此,本文結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的強(qiáng)大非線特征提取能力和域自適應(yīng)的遷移學(xué)習(xí)能力,提出一種改進(jìn)一維卷積神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承變工況故障診斷方法。
以一維卷積神經(jīng)網(wǎng)絡(luò)(One-Dimensional Convolutional Neural Network,1DCNN)為診斷主框架,將其全連接(Full Connection,F(xiàn)C)層通過(guò)全局均值池化(Global Avearge Pool,GAP)層代替,減少模型的大量參數(shù)訓(xùn)練。同時(shí),在GAP層引入最大均值差異(Maximum Mean Discrepancy,MMD)的域自適應(yīng)(Domin Adaptation,DA)學(xué)習(xí)方法,構(gòu)建基于交叉損失熵和MMD分布差異損失的最小準(zhǔn)則實(shí)現(xiàn)特征的遷移學(xué)習(xí),從而實(shí)現(xiàn)滾動(dòng)軸承的變工況故障診斷。
在傳統(tǒng)1DCNN模型中,卷積層與池化層堆疊之后通過(guò)FC層與softmax分類器連接,這導(dǎo)致1DCNN 網(wǎng)絡(luò)泛化性能較弱,易產(chǎn)生過(guò)擬合。FC層的大量參數(shù)會(huì)增加網(wǎng)絡(luò)訓(xùn)練和測(cè)試的計(jì)算量,導(dǎo)致訓(xùn)練比較耗時(shí)。在此,使用GAP層代替FC層,用于計(jì)算與之連接的上一層輸出特征圖的全局平局值,其優(yōu)點(diǎn)是無(wú)需對(duì)該層參數(shù)進(jìn)行優(yōu)化,避免過(guò)多池化操作導(dǎo)致信息丟失和過(guò)度擬合,從而有效提升模型的泛化性能[8]。GAP的表達(dá)式為
(1)
圖1 改進(jìn)1DCNN的網(wǎng)絡(luò)結(jié)構(gòu)
域自適應(yīng)通過(guò)將源域和目標(biāo)域的數(shù)據(jù)投影到新子空間中同一區(qū)域來(lái)提取跨域不變特征,從源數(shù)據(jù)中學(xué)習(xí)到的知識(shí)可以很好地推廣到目標(biāo)域[9],其原理如圖2所示。
圖2 域自適應(yīng)
領(lǐng)域:一個(gè)領(lǐng)域D相當(dāng)于一種工況,該領(lǐng)域主要由訓(xùn)練數(shù)據(jù)集X及其邊緣概率分布P(X)組成,其中X=[x1,x2,…,xn]∈χ表示訓(xùn)練數(shù)據(jù)集,D={χ,P(X)}。
任務(wù):一個(gè)任務(wù)T主要由分類標(biāo)簽集y和預(yù)測(cè)函數(shù)f(X)組成,預(yù)測(cè)函數(shù)可以從訓(xùn)練集X中學(xué)習(xí)獲得,f(X)為條件概率分布,即
f(X)=Q(Y|X),T={y,f(X)|。
遷移學(xué)習(xí):主要是通過(guò)對(duì)源域Ds和任務(wù)Ts,目標(biāo)域Dt和學(xué)習(xí)任務(wù)Tt的共性知識(shí)進(jìn)行學(xué)習(xí)獲得目標(biāo)域函數(shù)ft(X),實(shí)現(xiàn)對(duì)目標(biāo)任務(wù)的分類,其中Ds≠Dt或Ts≠Tt,當(dāng)Ds=Dt或Ts=Tt時(shí),遷移學(xué)習(xí)就變?yōu)閭鹘y(tǒng)的機(jī)器學(xué)習(xí)。
最大均值差異是用于測(cè)量2種不同分布數(shù)據(jù)集之間差異的指標(biāo),可以估計(jì)非參數(shù)距離,避免計(jì)算分布的中間密度,其定義為再生核希爾伯特空間中邊緣分布核嵌入之間的平方距離,表達(dá)式為
(2)
式中:Xs,Xt為數(shù)據(jù)集,P(Xs)≠P(Xt);φ為非線性映射函數(shù),用于產(chǎn)生再生核空間H。
通過(guò)(2)式可知,2個(gè)分布差異的評(píng)估就是2個(gè)數(shù)據(jù)分布在再生核希爾伯特空間中的距離,其值越接近于零意味著2個(gè)分布越匹配。在遷移學(xué)習(xí)中,最大均值差異被用來(lái)在特征學(xué)習(xí)中重構(gòu)正則化項(xiàng),使得2個(gè)不同分布的學(xué)習(xí)特征更加相似[9]。
在改進(jìn)1DCNN的優(yōu)化目標(biāo)中,主要有源域監(jiān)督和分布差異最小化2個(gè)部分組成。
首先,通過(guò)交叉熵?fù)p失函數(shù)實(shí)現(xiàn)傳統(tǒng)監(jiān)督機(jī)器學(xué)習(xí)中源標(biāo)簽數(shù)據(jù)經(jīng)驗(yàn)分類誤差Ls最小。
(3)
然后,通過(guò)最大均值差異測(cè)量源域與目標(biāo)域中不同分布的差異,最大均值差異的損失函數(shù)Ld被定義為
Ld=Dk(FS,FT),
(4)
式中:FS,F(xiàn)T分別為GAP層中源域、目標(biāo)域?qū)W習(xí)特征的分布。
最后,對(duì)最大均值差異值和交叉熵?fù)p失函數(shù)進(jìn)行優(yōu)化,以達(dá)到改進(jìn)1DCNN模型的優(yōu)化目標(biāo)。最終的優(yōu)化目標(biāo)定義為
minLopt=Ls+αLd,
(5)
式中:α為L(zhǎng)d的系數(shù),α∈(0,1)。
在模型的訓(xùn)練過(guò)程中,其參數(shù)在每次迭代過(guò)程中可以表示為
(6)
式中:β為學(xué)習(xí)率;θ為參數(shù)。
通過(guò)美國(guó)凱斯西儲(chǔ)大學(xué)公開(kāi)軸承數(shù)據(jù)進(jìn)行算法的性能驗(yàn)證,該數(shù)據(jù)集主要為風(fēng)扇端和驅(qū)動(dòng)端軸承分別運(yùn)行在轉(zhuǎn)速和負(fù)載為(1 797 r/min,0hp),(1 772 r/min,1hp),(1 750 r/min,2hp),(1 730 r/min,3hp)工況下的數(shù)據(jù)[11]。每種工況下的軸承故障類型如下:故障直徑為0.178,0.533 mm時(shí),各有內(nèi)圈、鋼球和外圈3,6,12點(diǎn)鐘方向5種故障類型;故障直徑為0.356 mm時(shí),有內(nèi)圈、鋼球和外圈6點(diǎn)鐘方向3種故障類型;故障直徑為0.711 mm時(shí),有內(nèi)圈和鋼球故障2種故障類型。以上15種故障類型與正常運(yùn)行軸承共構(gòu)成16種不同類型的故障數(shù)據(jù)集,所有故障數(shù)據(jù)的采樣頻率均為12 kHz,數(shù)據(jù)集的詳細(xì)劃分見(jiàn)表1。
表1 變工況軸承故障數(shù)據(jù)集的劃分
仿真試驗(yàn)基于深度學(xué)習(xí)的Pytorch框架,編程語(yǔ)言為Python,在Windows7系統(tǒng)、英特爾酷睿i5-5200U處理器和4 GB內(nèi)存的計(jì)算機(jī)上運(yùn)行。采用SGD優(yōu)化算法更新網(wǎng)絡(luò)訓(xùn)練參數(shù),學(xué)習(xí)效率參數(shù)為0.01,迭代批數(shù)為100,每個(gè)迭代批次大小為100。該方法的參數(shù)設(shè)計(jì)類似卷積神經(jīng)網(wǎng)絡(luò),參數(shù)設(shè)置見(jiàn)表2。
表2 改進(jìn)1DCNN的參數(shù)設(shè)置
將改進(jìn)1DCNN,ResNet和1DCNN+DA方法同時(shí)用于未加入人工噪聲的軸承變工況故障診斷,結(jié)果如圖3所示:ResNet屬于傳統(tǒng)的深度學(xué)習(xí)方法,無(wú)法適應(yīng)變工況,軸承故障診斷能力不足;1DCNN與DA相結(jié)合的方法由于引入了DA遷移學(xué)習(xí),在軸承變工況下的故障診斷準(zhǔn)確率相比傳統(tǒng)ResNet模型得到了提高;改進(jìn)1DCNN方法在1—2,1—3,2—3和3—2變工況下的故障診斷準(zhǔn)確率均達(dá)到了100%,故障診斷能力得到了很大提升。綜上可知,在未加入噪聲的變工況下,改進(jìn)1DCNN方法具有較好的診斷效果,可以解決傳統(tǒng)信號(hào)處理方法在復(fù)雜工況下故障診斷能力欠佳的問(wèn)題。
圖3 變工況(未加入噪聲)下不同方法的軸承故障診斷結(jié)果
在上述工況中分別加入信噪比6,9,12 dB的噪聲以進(jìn)一步驗(yàn)證改進(jìn)1DCNN方法在軸承變工況下的故障診斷能力,各方法對(duì)加入不同噪聲振動(dòng)信號(hào)的試驗(yàn)結(jié)果如圖4(圖中數(shù)值為平均故障診斷準(zhǔn)確率)所示:ResNet的診斷結(jié)果表明信噪比對(duì)診斷準(zhǔn)確率有較大的影響,信噪比越低(即加入噪聲越大)診斷準(zhǔn)確率越低,這是由于噪聲大會(huì)導(dǎo)致原始信號(hào)在調(diào)制后被淹沒(méi),從而難以識(shí)別;由于1DCNN模型本身結(jié)構(gòu)相比ResNet結(jié)構(gòu)存在缺陷,DA特征遷移學(xué)習(xí)的引入并未從整體上提高軸承變工況下的故障診斷準(zhǔn)確率,甚至還略有降低;而在1DCNN模型中用GAP代替FC,并與DA遷移學(xué)習(xí)相結(jié)合提高整個(gè)模型的泛化性,使其在軸承變工況下的故障診斷準(zhǔn)確率得到大幅提升,說(shuō)明改進(jìn)1DCNN與DA相結(jié)合的故障診斷方法在變工況下具有一定的優(yōu)越性,可以進(jìn)行推廣和應(yīng)用。
圖4 變工況(加入3,6,9 dB的噪聲)下不同方法的軸承故障診斷結(jié)果
提出了改進(jìn)1DCNN的滾動(dòng)軸承變工況故障診斷方法,使用GAP代替?zhèn)鹘y(tǒng)1DCNN的FC層,解決了傳統(tǒng)1DCNN中訓(xùn)練參數(shù)過(guò)多的問(wèn)題,同時(shí)在GAP層引入DA遷移學(xué)習(xí)機(jī)制,實(shí)現(xiàn)滾動(dòng)軸承變工況下的特征遷移學(xué)習(xí)。通過(guò)改進(jìn)1DCNN故障診斷方法實(shí)現(xiàn)了滾動(dòng)軸承的變工況故障診斷,相比ResNet,以及未改進(jìn)1DCNN與DA結(jié)合的方法,本文所提方法的診斷效果更優(yōu),可以應(yīng)用于不同工況下的軸承故障診斷。但在實(shí)際應(yīng)用中,模型的計(jì)算效率、輕量化等方面還有待進(jìn)一步研究。