關鍵詞:齒輪箱;不同工況;故障診斷;數據融合;域自適應
0 引言
齒輪箱由于其高效率、結構緊湊和高承載能力等優(yōu)點,被廣泛應用于大型旋轉機械設備。但齒輪箱長期在高速、重載等環(huán)境中工作,難免出現性能衰退,甚至運行故障,輕則造成設備停機、停產,重則導致災難性的安全事故,造成生命、財產損失。因此,對齒輪箱進行故障診斷不僅是維持機械運行效率和可靠性的關鍵,更是防止產生重大經濟損失的必要措施[1]。
近年來,隨著工業(yè)自動化和智能化的迅速發(fā)展,深度學習憑借其強大的數據處理能力、自學習和特征提取能力,為故障診斷提供了新解決方案[2]1059-1066,卷積神經網絡[3](ConvolutionalNeuralNetwork,CNN)及其變種網絡[4]547-553[5]在故障診斷領域得到了廣泛應用。然而受限于機械設備運行環(huán)境、溫度、負載等環(huán)境因素的影響,工況多變且運行狀態(tài)監(jiān)測困難,不同工況下的數據分布差異顯著,導致現有基于深度學習診斷模型的性能嚴重下降[6]。
遷移學習通過遷移策略將源域數據訓練的模型更好地泛化到目標域數據上,在處理不同類型數據時兼具靈活性和有效性,在變工況下的故障診斷表現出顯著優(yōu)勢[7]。當前研究主要是在深度學習框架中加入適配層以進行跨域距離度量,如:王琦等[8]在一維卷積神經網絡(One?DimensionalConvolutionalNeuralNetwork,1DCNN)中引入最大均值差異,在目標域存在少量標簽樣本的情況下,實現了變工況故障診斷。朱朋等[9]構建殘差注意力模型弱化模型的強共享條件,并結合子領域自適應實現了時變轉速下滾動軸承故障診斷。沈飛等[10]通過最小化領域均值差異拉近源領域和目標域數據低緯空間距離,提高了變工況下的齒輪箱故障診斷精度。也有一些研究采取“finetune”方式嘗試微調參數進行遷移,其遷移參數受數據量與故障類型影響較大。陳仁祥等[11]127-133構建了深度置信網絡提取故障特征,并結合微調策略實現了不同工況下的齒輪箱故障診斷。最新研究已經開始嘗試采用新的學習模型結合領域自適應思想進行診斷。AN等[12]提出了一種基于對比學習的領域適應模型,以實現跨工況的滾動軸承故障診斷。
上述方法取得了較好的診斷結果,但隨著機械設備結構日益復雜,單一振動信號難以完全表征其復雜的動態(tài)響應特性,不能滿足當前機械設備的高精度診斷要求。相較于單一傳感器信號,多傳感器信號可以捕獲機械設備不同視角的運行狀態(tài)信息,增強模型對判別性特征的完整表達[13]。侯召國等[14]采用信息熵對多傳感器信號進行加權,并結合深度遷移模型實現了源域到目標域的遷移。MAO等[15]119構建了域自適應CNN模型提取振動信號和紅外熱力圖的域不變特征,用于齒輪箱在不同運行條件下的故障診斷。ZHANG等[16]提出了一種多傳感器數據和多尺度特征融合模型,通過捕獲來自多個傳感器的特征,實現了域間知識的有效遷移。
以上方法為故障診斷提供了新思路,但仍存在以下幾個問題:①信號采集:融合多組振動信號雖然提供了空間上的多維信息,但實際工程中受機械設備結構限制,傳感器無法直接在主軸等關鍵位置布置。振動信號本身易受到環(huán)境因素干擾,伴隨著嘈雜環(huán)境、耦合劑和工作溫度等影響,齒輪箱變工況故障診斷難度增加;②信號融合:多源異構信號由不同傳感器采集,在量程、測量范圍和靈敏度等方面差異顯著,直接融合尺度不同的信號易出現信息不平衡,加劇兩域之間的分布差異,使得域間轉移更加困難;③數據特征:由于跨域遷移過程中數據分布和特征表達的動態(tài)性,孤立地考慮特征表示的域對齊和診斷任務的決策邊界,導致遷移效果差。
針對上述問題,提出了一種基于加權子域自適應對抗網絡的齒輪箱變工況故障診斷方法,該方法是一種無監(jiān)督遷移學習方法,通過將振動信號、電流信號和紅外熱力圖進行多源異構數據融合,提高齒輪箱故障信號表達的完整性;其次,構建嵌入高效通道注意力(EfficientChannelAttention,ECA)的自校正卷積神經網絡(Self?calibratedConvolutionsNetwork,SCNet)作為特征提取器自適應地編碼遠距離區(qū)域的信息,平衡源域和目標域中多源異構數據間的尺度差異;在特征提取器和域判別器進行對抗訓練的同時,引入最大均值差異(MaximumMeanDiscrepancy,MMD)和線性判別分析(LinearDiscriminantAnalysis,LDA)衡量當前跨域任務特征表示的域對齊程度及診斷任務決策邊界,以構造動態(tài)平衡因子實時調整域對齊損失和類分辨性損失,有效縮小源域和目標域的分布差異;最后,通過采集的齒輪箱變工況故障數據集進行驗證,所提方法診斷精度均達到95%以上,證明了所提方法的有效性。
1 基本理論
1.1 多源異構數據融合
除振動信號外,電流信號和紅外熱成像作為非侵入式的數據采集手段,有效地降低了設備運行環(huán)境對故障診斷任務的干擾。為將振動信號、電流信號和紅外熱力圖進行融合,需將其轉換為相同維度,因此采用連續(xù)小波變換(ContinuousWaveletTransform,CWT)、格拉姆角場(GramianAngularField,GAF)分別將振動信號、電流信號轉換成時頻矩陣和格拉姆矩陣,以二維矩陣形式展示運行狀態(tài)信息;采用數據融合策略將振動信號時頻矩陣、電流信號格拉姆矩陣以及溫度信號的紅外熱力圖進行通道拼接,構成多通道數據集。
1.2 自校正卷積神經網絡
自校正卷積神經網絡[17]是一種卷積神經網絡的改進模型,自校正卷積在處理每個空間位置的特征時,不僅利用局部信息,還能夠參考由其他卷積路徑提供的信息,使得不同傳感器的故障表征信息之間相互流通,降低因尺度不一而導致的信息不平衡現象出現的頻率。通過顯式和更豐富的信息,幫助模型生成更多差異性特征表示。
自校正卷積將輸入特征圖X∈RC×H×W按通道拆分為尺寸相等的兩部分X1和X2。將這兩部分在兩種不同的尺度下進行特征變換,一種是使用下采樣的潛在空間映射,另一種則是原始比例空間的特征映射,具體步驟如下所示:
1)潛在空間映射:對特征圖X1采用大小為r×r、步長為r的平均池化(Avgpool)進行采樣操作,得到低維特征表示T;其次,通過卷積核K2對低維特征表示T進行卷積操作,并采用雙線性插值進行上采樣。然后,使用sigmoid激活函數對K3卷積提取的特征進行校準輸出特征Y',最后通過K4卷積得到輸出Y1。
1.3 高效通道注意力機制
高效通道注意力機制[18]自適應地強化關鍵通道特征。其實現注意力步驟如下:
對于每個通道的特征圖Xc,首先,進行全局平均池化聚合空間信息;其次,通過卷積核大小為k的一維卷積對跨通道的局部依賴關系進行建模,計算注意力權重;最后,將計算的權重應用于原特征圖,得到通道加權的特征表示。
式中,H、W分別為特征圖的高度和寬度;Xc(i,j)為第c個通道的第i行和第j列的特征值;σ(·)為sigmoid激活函數,用于將注意力權值標準化[0,1]之間,?表示逐元素乘法;fConv1D,k(·)為卷積核大小為k的一維卷積,其卷積核大小k根據式(8)自適應調整。通過這種方式,ECA模塊可以動態(tài)地調整每個通道的重要性,增強或抑制某些通道的特征。
式中,|?|odd為取奇數操作;γ、b分別固定為2和1。
1.4 加權子域自適應對抗網絡
假設來自源域Ds的ns個標記樣本{(xsi,ysi)}nsi=1和來自目標域Dt的nt個未標記樣本{(xtj)}ntj=1邊緣概率分布和條件概率分布均不相同,為學習在源域和目標域之間的一致性特征表示來減少兩個域之間差異,使用特征提取器G和域判別器D進行對抗訓練。特征提取器G旨在從源域樣本xsi和目標域樣本xtj中提取域不變特征,而域判別器D則試圖區(qū)分這些特征來自源域還是目標域,域對齊損失函數具體如下:
式中,Lda(·)為域對抗損失函數;θg、θd分別為特征提取器和域判別器的參數;xsi和xtj分別為輸入的源域和目標域樣本。
領域自適應能夠有效地實現領域對齊,但是并未考慮到具體診斷任務中不同類別的決策邊界,不能有效實現源域和目標域的子域自適應。因此引入3個分類器C、C1、C2,通過訓練最大化分類器之間輸出的差異來檢測遠離源支持的目標樣本,同時,特征生成器學習G生成接近源域的目標特征。這種訓練方式增強了模型對目標域數據的判別能力[19],其損失函數如下:
式中,C、C1、C2為通過源域中有監(jiān)督預訓練的3個分類器。
為避免過度偏向域對齊或類可辨別,分別使用MMD和LDA衡量當前跨域特征表示域對齊程度及類可辨別性,并通過二者構造一個動態(tài)平衡因子τ控制域對齊損失和類分辨性損失,具體實現過程如下:
式中,Lce(·)為交叉熵損失函數。通過等式中的動態(tài)加權,有效地避免由于過度對齊導致點類可分辨性消失或由于過度偏向類可分辨性導致的域偏移現象出現。
2 基于加權子域自適應對抗網絡的齒輪箱變工況故障診斷流程
基于加權子域自適應對抗網絡的齒輪箱變工況故障診斷模型如圖1所示,其診斷具體步驟如下:
1)采用傳感器信號融合策略將不同工況下的振動信號時頻圖、電流信號格拉姆矩陣和紅外熱力圖轉換為多通道數據集,構建源域訓練樣本Ds和目標域樣本Dt作為模型的輸入。
2)構建嵌入ECA的自校正卷積神經網絡作為特征提取器G,平衡多源異構數據尺度差異。
3)通過源域數據由監(jiān)督訓練分類器C、C1、C2固定特征提取器G的參數,最大化目標域中3個分類器輸出的差異。同時,通過訓練G最小化差異,使得提取到的目標域特征具有較強的判別性。
4)將源域和目標域數據輸入到特征提取器G中,進行特征提取器和分類器的對抗訓練,通過動態(tài)加權調節(jié)域對齊損失和類分辨性損失使得源域和目標域的子空間對齊,從而實現對齒輪箱的變工況故障診斷。
3 試驗分析
3.1 試驗數據
試驗數據來自齒輪箱故障試驗臺(圖2)。齒輪包括正常、點蝕、斷齒、裂紋和磨損5種狀態(tài),其中振動信號通過加速度傳感器進行采集、電流信號通過鉗式電流傳感器進行采集、溫度信號通過紅外熱像儀進行采集。
以10kHz的采樣頻率在1000r/min(工況A)、1200r/min(工況B)及1400r/min(工況C)下采集多組故障振動、電流信號。采用無重疊樣本分割方式,對振動信號、電流信號分別以2048個點截取數據樣本,紅外熱力圖則通過幀截取進行劃分。
對每一個工況下(A、B、C)中的3種信號按8∶2比例隨機劃分,訓練集每類400個樣本,共2000樣本,測試集每類100個樣本,共500樣本。如在A→B遷移任務中,源域工況A中的有標簽訓練集樣本2000個,目標域工況B中的無標簽樣本500個,在遷移過程中不使用目標域的標簽信息。
振動信號、電流信號分別使用CWT和GAF轉換為時頻圖和格拉姆矩陣,圖3所示為1000r/min下振動信號時頻圖、電流信號格拉姆矩陣及溫度信號紅外熱力圖的不同故障表現形式。
3.2 參數設置
網絡主要超參數設置如下,優(yōu)化器采用隨機梯度下降算法,初始學習率為0.0001,動量為0.9,權重衰減為10-4,批大小64,迭代輪數150輪。試驗均在CPU為IntelCorei7?11800H,GPU為6GB顯存的NVIDIAGeForceRTX3060,內存為16GB,Python3.8.13上的Pytorch1.10環(huán)境下進行。為驗證所提方法的有效性,將所提方法與深度卷積神經網絡和XGBoost(DeepConvolutionalNeuralNetworkandXGBoost,DCNNXGBoost)算法[2]1059-1066、相關對齊聯合最大均值差異(CorrelationAlignmentJointMaximumMeanDiscrep?ancy,CORAL?JMMD)法[4]547-553、深度置信網絡(DeepBeliefNetwork,DBN)[11]127-133、融合域適應卷積神經網絡(FusionDomainAdaptationConvolutionalNeuralNet?work,FDACNN)[15]119、深度適應網絡(DeepAdaptationNetwork,DAN)[20]分別在同轉速下和不同轉速下的齒輪箱故障數據集上進行對比試驗。
3.3 故障診斷結果與分析
為驗證所提方法在同轉速和不同轉速情況下的故障診斷效果,分別在固定工況(A、B、C)及不同工況(A→B、A→C、B→C、B→A、C→A、C→B)下進行對比試驗,結果如表1所示,表1為不同方法的故障診斷結果。
由表1可知,在3種同工況下DCNN?XGBoost、CORAL?JMMD、DBN、DAN分類準確率均低于FDACNN和本文所提方法,這是因為上述幾種方法僅使用了振動信號進行故障診斷,并不能完整刻畫齒輪箱故障運行狀態(tài)信息,導致精度不佳。而FDACNN方法雖融合了多源異構信號,但由于不同類別間的傳感器信號的尺度信息差異導致融合效果降低,平均診斷精度為97.57%,比所提方法低了1.49%。而所提方法通過嵌入ECA的自校正卷積平衡多源異構數據間的尺度差異,同工況下平均診斷精度達到了99.06%,證明了所提方法在同工況下的診斷性能。
通過進一步對比不同工況下的遷移任務結果可知,DCNN?XGBoost在含有分布差異的變工況數據集上效果最差,準確率僅為89.5%,這是由于未使用任何遷移策略,導致難以在含有數據分布差異的數據集上實現有效的故障診斷。相較于DCNN?XGBoost,CORAL?JMMD和DAN平均分類準確率分別提升了6.28%、3.02%,這是由于這兩個方法添加了適配層,在一定程度上能夠拉進源域和目標域之間的分布,但是這兩個方法只考慮了特征表示的域對齊,卻忽視了診斷任務中不同類別的決策邊界,因而不能保證類間的可區(qū)分性,導致診斷結果不佳。預訓練方法DBN也由于不能適應分布差異導致結果偏低,相較于上述幾種方法,FDACNN方法準確率有所提升,但是該方法直接融合尺度不同的信號且獨立地考慮特征表示的域對齊和類間辨別性,導致遷移效果降低。
而所提方法一方面通過多源異構信號融合充分描述了齒輪箱的運行狀態(tài)信息,并通過自校正卷積跨通道信息交互平衡異構信號的尺度差異;另一方面通過動態(tài)加權領域自適應充分考慮特征表示的域對齊和決策邊界間的交互關系,使得所提方法在遷移任務中取得較高的準確率,證明了所提方法的有效性和泛化性。
為直觀地展示同工況和不同工況下各方法的特征提取效果,分別對1000r/min和A→B遷移任務中各方法的提取到的特征進行t?SNE降維和可視化,如圖4和圖5所示。圖4表示1000r/min下特征分布可視化,圖5表示A→B遷移任務下特征分布可視化。
通過圖4和圖5可知,DCNN?XGBoost、CORAL?JMMD、DBN、DAN在同工況和不同工況下特征分布均出現了大部分重疊,單一的振動信號不能完整地表征齒輪箱全部故障信息。由于FDACNN直接融合尺度不同的信號,忽略了具體診斷任務中不同類別的決策邊界,導致源域和目標域的分布差異加劇,使得其點蝕故障的目標域數據特征分布未能與目標域對齊,遷移效果不如所提方法。所提方法在同工況下和不同工況下的數據特征分布均具有較好的類內聚攏效果,類間分離明顯,進一步說明了所提方法的優(yōu)勢和泛化性。
為展示所提方法解決分布差異的效果,以C→B遷移任務為例,不同方法的概率密度圖如圖6所示,其中DCNN?XGBoost方法由于沒有分布適配能力,因此其源域、目標域概率分布曲線距離最遠,而CORAL?JMMD、DBN、FDACNN、DAN在一定程度上拉近了兩域之間的分布差異,但由于具體診斷任務中不同類別的決策邊界不一,其遷移效果均低于所提方法的遷移效果。
為驗證所提方法中多源異構信號融合對故障診斷結果的影響,在工況B→C的遷移任務上分別針對振動信號、電流信號、溫度信號單獨作為模型的輸入與3種信號融合作為輸入進行對比。結果如表2所示。
為進一步證明所提方法中動態(tài)加權的作用,通過在C→A遷移任務上固定τ值為[0.1,0.3,0.5,0.7,0.9]與動態(tài)更新τ值策略進行試驗對比,結果如圖7所示。
通過圖7可知,固定τ值診斷準確率均低于動態(tài)更新,這是因為在跨域遷移不同訓練階段中特征分布是動態(tài)變化的,固定τ值會導致過度偏向域對齊或類可辨別,進一步影響遷移效果。而所提方法根據當前跨域特征表示的域對齊程度及決策邊界,動態(tài)更新τ值調整域對齊損失和類分辨性損失,證明了所提方法中動態(tài)加權的有效性。
4 結論
基于加權子域自適應對抗網絡的齒輪箱變工況故障診斷方法,將振動信號、電流信號和紅外熱力圖進行多源異構數據融合,并通過加權子域自適應對抗網絡實現了齒輪箱變工況故障診斷。該方法主要優(yōu)勢如下:
1)融合了電流信號、溫度信號和振動信號,能夠完整刻畫齒輪箱運行狀態(tài)信息,提高了故障診斷結果的可靠性。
2)構建了嵌入高效通道注意力機制的自校正卷積神經網絡動態(tài)調整多源異構信號間的相互作用和依賴關系,平衡了多源異構數據間的尺度差異。
3)采用了加權子域自適應對抗方法定量估計源域和目標域對齊程度和決策邊界,適配兩域子空間特征分布差異。通過試驗對比證明了所提方法具有較強診斷性能和泛化性。