趙曉輝,田玉玲
(太原理工大學(xué)信息與計算機學(xué)院,山西晉中 030600)
在旋轉(zhuǎn)機械的故障中,軸承損壞的故障約占30%,滾動軸承的故障診斷是機械設(shè)備故障診斷技術(shù)的重要內(nèi)容。滾動軸承正常運轉(zhuǎn)與否,對于整體機器的精度、可靠性、壽命等有著重要的影響[1]。研究人員在故障診斷方面做了大量的工作,提出了基于信號處理[2]、多元統(tǒng)計分析[3]、深度學(xué)習(xí)[4]等多種診斷方法。研究主要集中在特征提取和模式識別這兩個部分。連續(xù)小波變換(Continuous Wavelet Transform,CWT)作為分析信號時頻特征的重要工具,具有良好的時頻窗口特性,Gao 等人利用連續(xù)復(fù)Morlet 小波變換得到的時頻圖對CNN 進行訓(xùn)練,實現(xiàn)故障識別[5]。Chen 等人利用雙樹復(fù)小波變換和拉普拉斯特征映射結(jié)合的方法實現(xiàn)行星齒輪故障識別[6]。Zhang 等人采用了多個Q 因子的Gabor 小波得到時頻圖特征,并送進分類器進行故障識別[7]。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)作為模式識別中一個重要的特征提取方法,其具有平移不變性、參數(shù)共享性等特點,因此基于CNN的故障診斷研究在近年來不斷地被學(xué)者們研究。Zhao 等人將CNN 提取到的原始信號的局部特征輸入到雙向LSTM 中,從而獲取特征之間的時間依賴關(guān)系,最后實現(xiàn)故障診斷[8]。Liao 等人將數(shù)據(jù)分段重構(gòu),再輸入到改進的GRU 中,從而實現(xiàn)故障分類[9]。Peng 等人利用濾波技術(shù)將信號分解成多個尺度,對多個尺度進行特征融合,從而實現(xiàn)故障診斷[10]。時間領(lǐng)域自適應(yīng)(Domain Adaptation)是遷移學(xué)習(xí)的重要方法,它的核心思想是把不同分布的源域和目標(biāo)域映射到同一個特征空間,并在該空間內(nèi)不斷拉近彼此的距離。Tong 等人通過快速傅里葉變換將原始數(shù)據(jù)進行處理,得到數(shù)據(jù)集,使用最大均值差異作為度量,最小化邊緣分布和條件分布,從而實現(xiàn)故障識別[11]。Li 等人通過人工生成假樣本并使用最大均值差異進行域自適應(yīng),在少量機器故障條件下測試數(shù)據(jù),實現(xiàn)跨域診斷[12]。域?qū)股窠?jīng)網(wǎng)絡(luò)模型(Domain-Adversarial Training of Neural Networks,DATNN)的提出[13],為領(lǐng)域自適應(yīng)方法提供了新的思路。Tang 等人提出了用腦電圖訓(xùn)練域自適應(yīng)網(wǎng)絡(luò),該模型引入了新的條件域判別器與標(biāo)簽分類器進行對抗,學(xué)習(xí)共享特征,從而實現(xiàn)腦電信號的分類[14]。雖然這些遷移模型實現(xiàn)了域的自適應(yīng),但只考慮了域與域之間的整體遷移,仍然存在負(fù)遷移的問題。
針對以上問題,文中提出了結(jié)合小波時頻圖與多對抗域適應(yīng)網(wǎng)絡(luò)(CWT-MADA)結(jié)合的故障診斷模型。模型以CWT 得到的時頻圖為輸入,使用有標(biāo)簽的源域數(shù)據(jù)和無標(biāo)簽的目標(biāo)域數(shù)據(jù)對網(wǎng)絡(luò)進行訓(xùn)練,旨在實現(xiàn)同類的跨域?qū)R,減少整體域遷移造成的誤差,從而實現(xiàn)多工況下的故障診斷。
多工況故障診斷是指利用一個工況下的數(shù)據(jù)來訓(xùn)練標(biāo)簽分類器,并用于其他工況下數(shù)據(jù)的故障分類。對于給定的源域數(shù)據(jù)Ds,其中ns條樣本數(shù)據(jù)xs帶有其對應(yīng)的故障類別標(biāo)簽ys,即目標(biāo)域數(shù)據(jù)集為Dt,其中nt條樣本數(shù)據(jù)xt不帶標(biāo)簽,即分類的任務(wù)是在帶有標(biāo)簽的源域數(shù)據(jù)上學(xué)習(xí)一個魯棒性良好的分類器,并能預(yù)測目標(biāo)域數(shù)據(jù)的故障分類情況。
CWT-MADA 模型結(jié)構(gòu)如圖1 所示。從功能的角度出發(fā),模型可以大致分為三部分,即特征提取器、故障分類器和域分類器。特征提取器Gf由雙流卷積構(gòu)成,用于提取來自源域和目標(biāo)域的數(shù)據(jù)樣本的組合故障特征F;故障分類器Gy由全連接層和Softmax 分類器組成,輸出樣本的類別標(biāo)簽;域分類器=1,…,K,每個分類器被設(shè)計用來匹配與第k個類相關(guān)聯(lián)的源域和目標(biāo)域數(shù)據(jù),域分類器輸出每個樣本的域標(biāo)簽。模型在梯度反轉(zhuǎn)層GRL 的作用下,實現(xiàn)多對抗域適應(yīng)網(wǎng)絡(luò)的結(jié)構(gòu)。
圖1 CWT-MADA跨域故障診斷模型
在這一部分中,采用雙流卷積結(jié)構(gòu)來實現(xiàn)特征提取器,包括基于原始數(shù)據(jù)的一維卷積結(jié)構(gòu)和基于相對應(yīng)時頻圖的二維卷積,這樣的好處在于能夠?qū)颖镜奶卣餍畔⒊浞职l(fā)揮且互為補充,其結(jié)構(gòu)如圖2所示。首先將840×1 的原始數(shù)據(jù)經(jīng)過CWT 并壓縮至64×64×3 大小的時頻圖,把二維時頻圖和一維原始數(shù)據(jù)作為輸入送入特征提取器中,分別得到特征F1和特征F2,然后將兩個特征合并得到特征F,作為特征提取器的輸出,其參數(shù)如表1 所示。
表1 特征提取器參數(shù)
圖2 特征提取器
假設(shè)有K個故障類別,那么就構(gòu)建K個域分類器=1,…,K,每個域分類器對應(yīng)著每個類別,實現(xiàn)同類的跨域?qū)R。然而,由于目標(biāo)域樣本沒有標(biāo)簽,所以每個分類器無法判定樣本特征屬于哪個類別,但可以從故障分類器得到每個樣本實例xi的預(yù)測標(biāo)簽每個反映出每個實例樣本xi屬于第k個類的概率。將分類到對應(yīng)的=1,…,K中,并將其作為特征值的權(quán)重進行訓(xùn)練。
所以,域分類器的目標(biāo)函數(shù)定義為:
其中,n=ns+nt,Gf是特征提取器,Gdk表示第k個域分類器,di表示樣本xi的域標(biāo)簽,表示交叉熵?fù)p失。
多域?qū)咕W(wǎng)絡(luò)通過同一類別的跨域匹配,增強了正遷移,避免了整體遷移的錯誤對其造成的負(fù)遷移。
為了使得源域特征和目標(biāo)域特征混淆,采用最大化域分類器參數(shù)最小化特征提取器參數(shù)與故障分類器參數(shù)θy,實現(xiàn)源域和目標(biāo)域同類的對齊。
故障分類器Gy對應(yīng)的損失定義為:
其中,Gy是故障分類器,yi是源域數(shù)據(jù)樣本xi對應(yīng)的標(biāo)簽,Ly是交叉熵?fù)p失。
綜合所有參數(shù)考量整個模型,其總的目標(biāo)損失函數(shù)定義為:
其中,λ是平衡Ly和Ld的對抗平衡參數(shù)。所以整體最優(yōu)問題就是尋找參數(shù)的最優(yōu)解:
由于最大化在反向傳播更新參數(shù)時,梯度方向與最小化的梯度方向相反,這樣會使得梯度消失,反轉(zhuǎn)層(GRL)的添加使得在反向傳播過程中梯度方向保持一致,其定義如下:
梯度反轉(zhuǎn)層設(shè)置在特征提取器與域分類器之間,在前向傳播過程中實現(xiàn)恒等不變,這樣總的優(yōu)化目標(biāo)都變成了最小。
對于模型最優(yōu)參數(shù)的搜索算法,文中采用動量為0.9 的隨機梯度下降算法,并根據(jù)迭代次數(shù)設(shè)置學(xué)習(xí)率,其更新公式如下:
其中,α0=0.01,β=0.75,p表示迭代訓(xùn)練過程中0 到1 的線性變換,這樣可以提高收斂速度并降低源域和目標(biāo)域的誤差。
實驗采用美國凱斯西儲大學(xué)開放的滾動軸承數(shù)據(jù)集進行實驗驗證[15]。文中所采用的振動數(shù)據(jù)是在4 種不同的的工況下(0、1、2 和3 hp)從電機驅(qū)動端采集的內(nèi)圈故障(IF)、外圈故障(OF)和滾動體故障(BF)的振動數(shù)據(jù)。這3種故障均由電火花加工產(chǎn)生,直徑分別為0.177 8 cm、0.355 6 cm 和0.533 4 cm。因此,考慮了4種負(fù)載下的10種軸承狀態(tài),如表2所示。
表2 軸承狀態(tài)信息
對采集到的樣本進行分割,每個樣本包含840個數(shù)據(jù)點,這樣一個樣本就中包含2 個故障周期,移動步長為400 個采樣點,因此取每種軸承狀態(tài)的145個樣本,每種工況下總共1 450 個樣本數(shù)據(jù),訓(xùn)練樣本數(shù)和測試集樣本數(shù)按照7:3 的比例進行分割,在訓(xùn)練集樣本中3 份作為源域樣本,4 份作為目標(biāo)域樣本。文中設(shè)計的遷移任務(wù)有12 個,分別為T0,1、T0,2、T0,3、T1,0、T1,2、T1,3、T2,0、T2,1、T2,3、T3,0、T3,1、T3,2,其下標(biāo) 直觀地表達(dá)了任務(wù)情況。例如T1,3描述了以1 hp 負(fù)載數(shù)據(jù)集為源域,以3 hp 負(fù)載數(shù)據(jù)集為目標(biāo)域的遷移任務(wù)。
為了驗證提出的模型對目標(biāo)域故障狀態(tài)預(yù)測的有效性,將所提出的方法與現(xiàn)有CNN、雙流CNN、TCA(Transfer Component Analysis)[16]、DAN(Deep Adaptation Netowrk)[17]、JDA(Joint Distribution Adaptation)[18]、DDC(Deep Domain Confusion)[19]、DANN 等研究 方法進 行比較。
表3中展示了各個方法在不同遷移任務(wù)下的診斷結(jié)果,其中文中所提出的模型準(zhǔn)確率平均值為94.99%,相比于其他深度遷移學(xué)習(xí)方法準(zhǔn)確率高出至少2.69%,這是由于文中采用多域?qū)沟姆绞?。從表中可以看出,雙流CNN 的準(zhǔn)確率要比2D-CNN 的準(zhǔn)確率平均值高出4.64%,證明了雙流結(jié)構(gòu)的可靠性。
表3 對比實驗準(zhǔn)確率結(jié)果
綜合以上實驗結(jié)果表明,提出的模型具有良好的故障診斷能力,并取得了較高的實驗準(zhǔn)確率,因此可以說明,該模型能夠有效地減少不同域之間的分布差異,實現(xiàn)域的對齊并最終實現(xiàn)不同工況下的故障診斷。
為了更好地展示所提出模型的可靠性,以任務(wù)T1,3為例,利用t-SNE 算法對提取的特征進行可視化,直觀理解模型的遷移分類過程。特征可視化如圖3所示。圖3(a)是雙流CNN未添加域?qū)箼C制的特征輸出。從圖中可以看出,源域和目標(biāo)域分布不一致,會導(dǎo)致故障分類器分類錯誤。圖3(b)為文中模型填加了多個域分類器的域?qū)菇Y(jié)構(gòu)的特征輸出,可以看出,提取到的源域和目標(biāo)域的特征基本重合,表明在對抗機制下,模型的泛化能力大幅度增加,模型提取到了在工況1 和工況3 下均可以使用的可遷移特征。
圖3 特征t-SNE可視化對比圖
文中在任務(wù)T1,3上展示了幾個基于深度遷移方法的收斂性能,如圖4 所示??梢钥闯?,所比較方法的測試誤差隨著迭代次數(shù)的增加而下降。提出的CWT-MADA 相比于DAN 和DANN 方法具有更好的收斂效果,且收斂穩(wěn)定性能也更好,從而證明了模型的有效性。
圖4 DAN、DANN和CWT-MADA在任務(wù)T1,3的收斂性能比較
文中提出了一種基于連續(xù)復(fù)小波變換和域?qū)惯w移的跨域故障診斷模型。該模型以滾動軸承的一維振動信號和二維小波時頻圖作為輸入,通過雙流CNN 的特征提取,并在域?qū)箼C制的作用下實現(xiàn)了遷移,最終實現(xiàn)了多工況下的滾動軸承故障診斷。通過對比不同的遷移學(xué)習(xí)方法,證明了提出的方法能夠減少了負(fù)遷移帶來的誤差,學(xué)習(xí)到了更為精準(zhǔn)的遷移特征,獲得了更好實驗效果。