熊雋陳林
(瀘州職業(yè)技術(shù)學(xué)院智能制造與汽車工程學(xué)院,四川瀘州 646000)
隨著旋轉(zhuǎn)機(jī)械愈加大型化、復(fù)雜化和精密化,故障發(fā)生概率也隨之提高。如不及時(shí)發(fā)現(xiàn)并排除故障,不僅企業(yè)要因?yàn)橥C(jī)、停產(chǎn)承擔(dān)經(jīng)濟(jì)損失,嚴(yán)重時(shí)還會(huì)釀成重大安全事故。因此,對(duì)旋轉(zhuǎn)機(jī)械的故障診斷具有重要意義。
旋轉(zhuǎn)機(jī)械設(shè)備組在運(yùn)轉(zhuǎn)過程中,受外在摩擦力、溫度、不同激勵(lì)源、工作環(huán)境和工況參數(shù)等因素影響,不可能保持在同一工況下運(yùn)行。不同工況下,可獲得的訓(xùn)練樣本數(shù)目有限,且訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)不滿足獨(dú)立同分布條件,降低了傳統(tǒng)機(jī)器學(xué)習(xí)故障診斷模型(如BP、SVM和KNN等[1])的泛化能力,甚至使得模型不適用。另大型機(jī)械裝備機(jī)組規(guī)模擴(kuò)大,設(shè)備關(guān)鍵部件安裝測(cè)點(diǎn)增多,數(shù)據(jù)采樣頻率變高、設(shè)備從運(yùn)轉(zhuǎn)之初到發(fā)生故障數(shù)據(jù)體量增長(zhǎng),海量數(shù)據(jù)及數(shù)據(jù)間錯(cuò)綜復(fù)雜的聯(lián)系使得深度學(xué)習(xí)、遷移學(xué)習(xí)算法嶄露頭角。結(jié)合深度學(xué)習(xí)與遷移學(xué)習(xí)的機(jī)械設(shè)備故障診斷方法層出不窮,也成為了數(shù)據(jù)時(shí)代眾多學(xué)者研究的熱點(diǎn)。
孔子遷等[2]針對(duì)行星齒輪箱振動(dòng)信號(hào)頻率成分復(fù)雜和時(shí)變性強(qiáng)的問題,提出了基于時(shí)頻融合和注意力機(jī)制的深度學(xué)習(xí)行星齒輪箱故障診斷方法,采用卷積神經(jīng)網(wǎng)絡(luò)融合小波包提取的振動(dòng)數(shù)據(jù)各頻帶特征,實(shí)現(xiàn)了齒輪箱端對(duì)端的故障診斷;其中,注意力機(jī)制與深度神經(jīng)網(wǎng)絡(luò)結(jié)合在同工況診斷中效果顯著,但文章中受限于神經(jīng)網(wǎng)絡(luò)兩個(gè)假設(shè)未能對(duì)異分布數(shù)據(jù)進(jìn)行診斷。蘇靖涵等[3]選取更有利于跨域的時(shí)頻特征,訓(xùn)練得到初始模型參數(shù),再利用目標(biāo)域待識(shí)別樣本對(duì)深度遷移自編碼器模型進(jìn)行微調(diào),最終實(shí)現(xiàn)變工況下滾動(dòng)軸承故障診斷;雖解決了異分布數(shù)據(jù)的分類問題,但采用遷移學(xué)習(xí)Fine-turn思想微調(diào)網(wǎng)絡(luò)權(quán)重的做法,前提是數(shù)據(jù)量足以訓(xùn)練初始網(wǎng)絡(luò),同時(shí)這個(gè)過程是從泛化特征到特化特征的跨越,模型的好壞直接由微調(diào)所使用的數(shù)據(jù)決定。李鋒等[4]利用深度卷積殘差特征提取器進(jìn)行高層特征提取,通過獲得的高層特征和標(biāo)簽信息的克羅內(nèi)克積獲得特征聯(lián)合分布表示并嵌入域分類器中,并進(jìn)行域?qū)褂?xùn)練改進(jìn)其遷移性能,實(shí)現(xiàn)了不同工況下旋轉(zhuǎn)機(jī)械故障診斷;采用深度遷移網(wǎng)絡(luò)適配特征可有效提升識(shí)別精度,但利用張量積進(jìn)行特征學(xué)習(xí)的方式會(huì)造成運(yùn)算量大大增加。實(shí)際工作中旋轉(zhuǎn)機(jī)械運(yùn)行工況復(fù)雜多變,難以獲得有效樣本,或者測(cè)得信號(hào)因?yàn)檎{(diào)制解調(diào)的原因呈現(xiàn)嚴(yán)重的非平穩(wěn)性、非線性,難以提取故障特征[5-6],同時(shí)軸承往往在不同轉(zhuǎn)速、負(fù)載工況改變會(huì)引起振動(dòng)信號(hào)的非線性變化,使得故障發(fā)生位置、嚴(yán)重程度不同的振動(dòng)信號(hào)互相疊加和混合,數(shù)據(jù)分布因此變得更具差異性直接影響甚至增加軸承故障診斷的困難。
所以對(duì)于當(dāng)下旋轉(zhuǎn)機(jī)械故障診斷主要面臨如下挑戰(zhàn):(1)海量數(shù)據(jù)之間存在錯(cuò)綜復(fù)雜的聯(lián)系,造成故障特征精確表征困難。(2)復(fù)雜工況等因素造成數(shù)據(jù)分布差異較大,訓(xùn)練樣本與測(cè)試樣本不滿足獨(dú)立同分布,無法實(shí)現(xiàn)跨域診斷。(3)對(duì)非平穩(wěn)信號(hào)局部特征和移變特征處理不足,無法捕捉數(shù)據(jù)局部特征并關(guān)注其移變性。
針對(duì)上述原因,本文提出了注意力深度遷移聯(lián)合適配的不同工況下旋轉(zhuǎn)機(jī)械故障診斷方法。首先,利用傅里葉變換的可逆性,對(duì)一維原始振動(dòng)數(shù)據(jù)進(jìn)行傅里葉變換得到訓(xùn)練樣本與測(cè)試樣本的頻譜,最大程度保留信號(hào)原始特征。然后,同時(shí)將兩樣本集進(jìn)行快速傅里葉變換,并將結(jié)果輸入CNN中進(jìn)行故障特征提取,獲得兩域樣本的分布式特征表達(dá),并將兩域分布式特征表達(dá)輸入通道注意力機(jī)制(squeeze-and-excitation networks,SE)[7-8]對(duì) 特 征進(jìn)行逐通道調(diào)整,這樣網(wǎng)絡(luò)就可以通過兩域的內(nèi)在聯(lián)系,利用全局特征通道響應(yīng)值加權(quán)選擇有用信號(hào)的特征,同時(shí)抑制無用特征。最后,采用遷移學(xué)習(xí)最大均值差異(maximum mean discrepancy,MMD[9])距離作為度量,最小化兩域樣本的空間分布距離,實(shí)現(xiàn)兩域特征適配,從而最終實(shí)現(xiàn)不同工況下旋轉(zhuǎn)機(jī)械故障診斷。
本文的主要貢獻(xiàn)在于有效結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)特征自提取能力、遷移學(xué)習(xí)跨域特征學(xué)習(xí)思想與通道注意力機(jī)制的優(yōu)勢(shì),方法中在源域樣本與目標(biāo)域樣本經(jīng)深度卷積神經(jīng)網(wǎng)絡(luò)獲取分布式特征通道后,利用通道注意力機(jī)制進(jìn)行兩域特征通道間響應(yīng)值的權(quán)重自適應(yīng)調(diào)節(jié),而不僅以訓(xùn)練樣本單域間通道特征為基準(zhǔn),可有效獲取源域和目標(biāo)域的深度內(nèi)在聯(lián)系,圍繞特征通道自適應(yīng)響應(yīng)值賦予關(guān)鍵特征較高的權(quán)重,篩選出關(guān)鍵故障特征后進(jìn)行遷移適配。
該模型通過源域帶標(biāo)簽數(shù)據(jù)和目標(biāo)域無標(biāo)簽數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,從而實(shí)現(xiàn)目標(biāo)域無標(biāo)簽數(shù)據(jù)的智能故障診斷,主要包括3個(gè)重要環(huán)節(jié):(1)深度特征自提取。(2)通道注意力機(jī)制關(guān)鍵特征獲取。(3)遷移學(xué)習(xí)領(lǐng)域適配。其結(jié)構(gòu)如圖1所示。
圖1 網(wǎng)絡(luò)結(jié)構(gòu)圖
特征提取模塊主要由深度卷積神經(jīng)網(wǎng)絡(luò)構(gòu)成,其基本結(jié)構(gòu)主要包括4部分,如表1所示。
表1 網(wǎng)絡(luò)超參數(shù)
(1)卷積層
以卷積核為單位對(duì)應(yīng)一個(gè)矩陣,以激活函數(shù)作為選擇器整合前一層特征與卷積核進(jìn)行卷積操作得到公式(1),令CNN網(wǎng)絡(luò)第l層作為卷積層。
(2)池化層
為保證特征尺度不變,需要池化層對(duì)式(1)中得到的結(jié)果進(jìn)行降維映射。該過程中以n×n矩陣為例,在經(jīng)過池化下采樣后其輸出矩陣變成變?yōu)樵瓉淼?/n,但其輸出特征矩陣數(shù)量不變。這一過程中避免重復(fù)采樣導(dǎo)致過擬合。當(dāng)池化層l確定后,l-1為卷積層,可得到下式。
式中:d(*)為下采樣函數(shù);中上標(biāo)代表層數(shù),下標(biāo)代表對(duì)應(yīng)的特征矩陣,整體代表在此層第j個(gè)矩陣對(duì)應(yīng)的偏置。
(3)全連接層
全連接層的作用就是整合多次卷積采樣以后的結(jié)果,其表達(dá)數(shù)學(xué)模型為
式中:Y(i)表示類別的概率(i表示第i個(gè)標(biāo)簽類別);P表示以其概率對(duì)該層神經(jīng)元的保留;H代表輸入矩陣經(jīng)過多次降維后的新映射。
(4)Dropout層
如果訓(xùn)練樣本較少是為了避免模型過擬合,則需要考慮隱藏一些神經(jīng)節(jié)點(diǎn),注意隱藏只是在某一次操作中不經(jīng)過該節(jié)點(diǎn)不更新參數(shù),但是在下一次可以繼續(xù)工作。這就是Dropout層的作用。
式中:X代表輸入樣本;W為最終網(wǎng)絡(luò)參數(shù),p表示以其概率對(duì)該層神經(jīng)元的保留。
最大均值差異(maximum mean discrepancy,MMD)是衡量?jī)蓚€(gè)數(shù)據(jù)集分布差異的非參數(shù)距離指標(biāo),用于判斷兩個(gè)分布是否相同,源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)通過CNN特征提取后,兩域的分布差異以提取到特征的形式被保留在全連接層。當(dāng)X經(jīng)過兩層卷積池化之后得到B,首先通過注意力模塊學(xué)習(xí)出每個(gè)通道的權(quán)重得到權(quán)重矩陣?,然后將?與B進(jìn)行相乘從而產(chǎn)生通道域的注意力,得到新的特征U,其中通道注意力機(jī)制包括式(6)擠壓函數(shù)(全局平均池化)、式(7)激勵(lì)函數(shù)和式(8)尺度函數(shù)3個(gè)模塊。
其中:u表示新產(chǎn)生的特征信號(hào),有c個(gè)通道。
式中:δ代表ReLU;σ代表sigmoid;W1、 W2為權(quán)重偏置矩陣,通過訓(xùn)練學(xué)習(xí)這兩個(gè)權(quán)重以一維的形式激活該層通道。
假設(shè)源域和目標(biāo)域的特征集合分別為As和 At,則存在再生核希爾伯特空間(reproducing kernel hilbert space,RKHS),有映射函數(shù)?(·)∈H將CNN所提取特征由原特征空間投影至再生核希爾伯特空間。因此,源域與目標(biāo)域之間的MMD可定義為
將數(shù)據(jù)映射到再生核希爾伯特空間進(jìn)行MMD距離作為空間最近度量表示為
其中:‖·‖H是再生核希爾伯特空間,S和T分別為源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù),n和m分 別為S和T中的數(shù)據(jù)個(gè)數(shù)。
所提模型訓(xùn)練過程中,需要滿足兩個(gè)優(yōu)化目標(biāo):(1)最小化特征提取模塊在源域數(shù)據(jù)上的分類損失。(2)最小化源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)深層次特征知識(shí)的概率分布差異。因此,優(yōu)化目標(biāo)函數(shù)可以表達(dá)為
其中:Lc(θf,θc)是特征提取模塊在源域數(shù)據(jù)上的識(shí)別誤差;D(θf)是源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)深度特征知識(shí)的概率分布差值,μ是懲罰項(xiàng)系數(shù)且μ>0。
所提方法流程圖如圖2所示,具體步驟如下:
圖2 方法流程圖
(1)采集數(shù)據(jù)樣本,利用快速傅里葉變換計(jì)算原始數(shù)據(jù)頻譜,一種工況作為訓(xùn)練樣本(源域),其余工況作為測(cè)試樣本(目標(biāo)域),構(gòu)建不同工況下的數(shù)據(jù)集。
(2)初始化注意力深度遷移聯(lián)合適配網(wǎng)絡(luò)參數(shù),以批量的方式將源域數(shù)據(jù)和目標(biāo)數(shù)據(jù)輸入到模型中。
(3)利用深度卷積神經(jīng)網(wǎng)絡(luò)獲取源域和目標(biāo)域的分布式特征表達(dá),并通過Dropout層調(diào)節(jié)防止過擬合發(fā)生。
(4)通過通道注意力機(jī)制進(jìn)行兩域特征通道交互與關(guān)注,聚焦兩域故障關(guān)鍵特征,并以最大均值差異距離作為度量進(jìn)行源域和目標(biāo)域分布領(lǐng)域適配最小化兩域特征分布差異,以減小不同工況所帶來的域分布差異,獲得更具針對(duì)性的通道關(guān)注特征。
(5)得到訓(xùn)練好的遷移診斷模型,輸入測(cè)試集,利用softmax分類層輸出診斷結(jié)果,完成不同工況下旋轉(zhuǎn)機(jī)械的故障診斷。
實(shí)驗(yàn)平臺(tái)如圖3所示,其中ER-12k型深溝球軸承節(jié)徑28.905 2 mm,8個(gè)滾動(dòng)體,接觸角9.08o,軸直徑為19.05 mm。在不同工況下對(duì)滾動(dòng)軸承故障振動(dòng)信號(hào)進(jìn)行采集,采集時(shí)運(yùn)行轉(zhuǎn)速分別為:(1)工況1:1 800 r/min。(2)工況2:2 000 r/min。(3)工況3:2 400 r/min。加載負(fù)荷均為5 kg。采樣頻率均為25 600 Hz,對(duì)同一類型樣本進(jìn)行4次采樣,采樣間隔設(shè)定10 s,最終數(shù)據(jù)以1 024為分析點(diǎn)數(shù)依次截取數(shù)據(jù)樣本。本文中訓(xùn)練樣本、測(cè)試樣本數(shù)量均為1 000。他們是由4種包含250樣本的故障數(shù)據(jù)(內(nèi)圈、外圈和滾動(dòng)體故障加正常樣本)混合而成。
圖3 試驗(yàn)平臺(tái)
為討論網(wǎng)絡(luò)輸入的優(yōu)勢(shì),本節(jié)試驗(yàn)對(duì)比了原始時(shí)域信號(hào)和頻譜的特征差異。由于傅里葉變換的可逆性,頻譜可充分保留原始信號(hào)中的信息,并相較于時(shí)域信號(hào),可更為清晰地展現(xiàn)各故障狀態(tài),同時(shí),以單邊譜形式,可使輸入點(diǎn)數(shù)相較于時(shí)域信號(hào)縮小一半,有效減小網(wǎng)絡(luò)計(jì)算復(fù)雜度。
限于篇幅,僅展示如圖4所示工況和故障。對(duì)比4b、f、g和h這4種同工況狀態(tài)頻譜,頻譜可以清晰區(qū)分各故障狀態(tài)。然而,圖4d、f不同工況下同種故障特征頻譜特征存在明顯差異,不僅幅值差異明顯,還在第120個(gè)采樣點(diǎn)之前存在顯著不同。這表明頻譜可以很好地反映復(fù)合故障差異,同時(shí)由于傅里葉變換的可逆性,頻譜可以充分保留原始數(shù)據(jù)中的信息[10]。
本節(jié)實(shí)驗(yàn)著重討論了不同工況下各主流診斷方法與所提方法對(duì)比結(jié)果,實(shí)驗(yàn)結(jié)果如表2所示。表中對(duì)比了傳統(tǒng)深度學(xué)習(xí)、遷移學(xué)習(xí)方法以及此類深度遷移文獻(xiàn)常用的遷移方式。如:CNN、ACNN、SE-CNN(通道注意力+卷積神經(jīng)網(wǎng)絡(luò))、CNNMMD(卷積神經(jīng)網(wǎng)絡(luò)+領(lǐng)域適配)、SY-所提算法(原始時(shí)域信號(hào)+所提方法)、DAN[9](deep adaptation network,DAN)、DAN-SE(深度領(lǐng)域適配+通道注意力機(jī)制)、Fine-turn[10]和SY-TCA(原始時(shí)域信號(hào)+傳統(tǒng)遷移學(xué)習(xí)領(lǐng)域適配)。上述方法中均采用相同的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。單獨(dú)添加SE模塊時(shí),SE模塊均放在卷積池化后,且全連接層之前。領(lǐng)域適配距離均以最大均值差異作為度量。通過表2可見添加了MMD適配層的算法CNN-MMD、所提方法、SY+所提方法均好于未加適配層的方法,這說明對(duì)于不同工況下的異分布數(shù)據(jù),兩域分布差異會(huì)影響識(shí)別精度。使用SE模塊的SE-CNN、所提方法和SY+所提方法,均高于CNN,這是因?yàn)镃NN雖也具備特征自提取能力,但難以應(yīng)對(duì)不同工況下的診斷需求,其特征分布仍然均在較大差異。將所提方法與當(dāng)下主流的深度遷移學(xué)習(xí)適配算法進(jìn)行對(duì)比,加入注意力機(jī)制后均有所提升。但是,所提方法將注意力機(jī)制加在全連接層后,領(lǐng)域適配層之前的方式,利用通道注意力機(jī)制進(jìn)行兩域特征通道間響應(yīng)值的權(quán)重自適應(yīng)調(diào)節(jié),而不僅以訓(xùn)練樣本單域間通道特征為基準(zhǔn),可有效獲取源域和目標(biāo)域的深度內(nèi)在聯(lián)系,圍繞特征通道自適應(yīng)響應(yīng)值賦予關(guān)鍵特征較高的權(quán)重,篩選出關(guān)鍵故障特征后進(jìn)行遷移適配,優(yōu)于傳統(tǒng)方法僅使用最大池化或者平均池化結(jié)合全連接層將信息合并的方式,這會(huì)導(dǎo)致關(guān)鍵信息無法被識(shí)別,這點(diǎn)將在下一節(jié)被證明。值得注意的是,采用時(shí)域信號(hào)作為網(wǎng)絡(luò)輸入,雖也取得不錯(cuò)的效果,但由圖4可知,時(shí)域信號(hào)中特征受干擾更大,且以時(shí)域信號(hào)為輸入,網(wǎng)絡(luò)輸入尺寸更大,使得網(wǎng)絡(luò)訓(xùn)練計(jì)算量更大,耗時(shí)更長(zhǎng)(CPU:Intel i5 7 300HQ 2.5 GHz 四核,內(nèi)存8 G,硬盤128 G SSD + 1 TB,耗時(shí)15 min,使用頻譜作為輸入僅需要3 min)。
圖4 原始數(shù)據(jù)及其頻譜
表2 不同工況下滾動(dòng)軸承數(shù)據(jù)對(duì)比結(jié)果
為分析網(wǎng)絡(luò)特征提取層內(nèi)部特征提取效果,將原始輸入、網(wǎng)絡(luò)訓(xùn)練完成后所提取的通道注意力機(jī)制前后特征進(jìn)行熱力圖可視化對(duì)比分析。實(shí)驗(yàn)使用3.1節(jié)展示的3種不同轉(zhuǎn)速下的滾動(dòng)軸承數(shù)據(jù)進(jìn)行試驗(yàn),詳細(xì)展示了特征提取過程中主要特征的捕獲過程實(shí)驗(yàn)中因?yàn)榫W(wǎng)絡(luò)設(shè)計(jì)(參照表1輸出通道值),原始數(shù)據(jù)具有512個(gè)采樣點(diǎn),每個(gè)采樣點(diǎn)作為一個(gè)通道值進(jìn)行輸入,故原始數(shù)據(jù)具有512個(gè)通道值。網(wǎng)絡(luò)結(jié)構(gòu)中注意力機(jī)制前后所提特征均為100個(gè)通道值。以1 800 r/min滾動(dòng)體故障特征為例,圖中橫坐標(biāo)為各通道,縱坐標(biāo)為標(biāo)示值。由圖5中可知,原始數(shù)據(jù)包含512個(gè)通道值,并且能量主要集中在25~40,140~150通道附近,經(jīng)卷積、池化(通道注意力機(jī)制前)所提特征如圖6a所示,雖然在第4~5通道值和20~30通道處保持較高能量與原始數(shù)據(jù)呼應(yīng),但在70~80,90~100通道處仍具有幅值明顯高于前者的能量,形成干擾特征;進(jìn)行通道注意力機(jī)制聚焦通道信息后,特征明顯簡(jiǎn)化且清晰,關(guān)鍵通道值得以保留,并且無關(guān)通道值能量全部減小,這說明利用通道注意力機(jī)制進(jìn)行兩域特征通道間的交互與關(guān)注,可以更有效地捕獲本征特征,根據(jù)各通道響應(yīng)值可以自適應(yīng)調(diào)節(jié),這也是優(yōu)勢(shì)的體現(xiàn)。
圖5 原始數(shù)據(jù)特征熱力圖
圖6 適配前的特征熱力圖
為直觀分析本文所提方法對(duì)于滾動(dòng)軸承智能故障診斷的有效性,可視化不同轉(zhuǎn)速數(shù)據(jù)的特征知識(shí),以遷移故障診斷實(shí)驗(yàn)工況1→2為例,利用t-分布鄰域嵌入(t-distribution stochastic neighbor embedding,t-SNE)[9]算法將提取的故障特征降維至三維空間,并以散點(diǎn)圖的方式呈現(xiàn)出不同轉(zhuǎn)速下不同故障程度數(shù)據(jù)的特征知識(shí),如圖7所示。
從圖7b中可以看出,未使用MMD進(jìn)行適配的方法,其特征分布呈現(xiàn)無序狀態(tài),訓(xùn)練樣本與測(cè)試樣本不重合,這是因?yàn)椴煌r下數(shù)據(jù)分布差異導(dǎo)致特征無法被精確表征,無標(biāo)簽的測(cè)試數(shù)據(jù)無法被準(zhǔn)確地分類。另外,進(jìn)行深度領(lǐng)域適配后的方法7a、c基本實(shí)現(xiàn)了故障分類,但是仍然具有部分特征耦合情況的出現(xiàn),且7a、c之間的細(xì)微差異是由于細(xì)粒度特征無法被有效區(qū)分造成了關(guān)鍵特征無法被識(shí)別。這也說明了加入通道注意力機(jī)制起到了關(guān)鍵作用。
圖7 各對(duì)比算法特征圖
反觀7e增加適配模塊后其結(jié)果呈有序狀態(tài),與7b中未適配的情況差別明顯,這說明了遷移適配層確實(shí)可以解決不同工況下兩域分布差異。且由于所提方法考慮了兩域各自差異,從兩域樣本中提取分布式特征表達(dá),所以其空間區(qū)分度明顯由于7c。而7d中Fine-turn的方式其訓(xùn)練樣本完全被區(qū)分,但是測(cè)試樣本部分無法與訓(xùn)練樣本重合,這說明僅靠微調(diào)可以優(yōu)化網(wǎng)絡(luò),但是其本征特征并未被獲取,其網(wǎng)絡(luò)性能由加入的微調(diào)樣本決定。
為驗(yàn)證適配后兩域分布差異確實(shí)被減小,將適配前和適配后數(shù)據(jù)進(jìn)行概率密度圖比較,其結(jié)果如圖8所示。
圖8 各對(duì)比算法概率密度分布圖
從圖中可以看出,原始數(shù)據(jù)訓(xùn)練樣本與測(cè)試樣本分布差異較大,這是導(dǎo)致不同工況下滾動(dòng)軸承故障分類精度較差的根本原因。為了減小分布差異,嘗試加入MMD最大均值差異適配層進(jìn)行兩域數(shù)據(jù)適配,過程中可以發(fā)現(xiàn)MMD可以有效地拉近兩域分布,且其適配效果由關(guān)鍵特征和特征分布共同決定。另一方面,對(duì)比7c、e發(fā)現(xiàn)加入SE后,概率分布曲線圍繞原點(diǎn)類似脈沖的曲線在“變窄”,這說明特征圍繞某固定值在細(xì)化,導(dǎo)致特征分布概率集中于某一區(qū)間,即通道注意力機(jī)制在此時(shí)起到了對(duì)關(guān)鍵特征的提取作用。在加入MMD以后對(duì)比7f,不僅在“變窄”而且其幅值也在圍繞中心聚集最終兩條不同分布的概率密度曲線幾乎重合,完美地完成了異分布數(shù)據(jù)適配任務(wù)。
綜上所述,通道注意力機(jī)制在全連接層后的設(shè)置,不單單是對(duì)于訓(xùn)練樣本的單一適配,只關(guān)注訓(xùn)練樣本通道進(jìn)行特征學(xué)習(xí),而是建立了兩域特征分布式表達(dá)后,在全連接層整合后加入注意力機(jī)制而后適配,這樣做的效果是明顯的,它既保證了訓(xùn)練樣本和測(cè)試樣本同時(shí)參與特征提取,通道注意力機(jī)制可以關(guān)注全域樣本的特征學(xué)習(xí)。另外,MMD距離與通道注意力機(jī)制結(jié)合,使得特征學(xué)習(xí)過程中伴隨著兩域特征分布適配過程,這標(biāo)志著只有分布距離較小的特征獲得的通道注意力權(quán)重就高,最終細(xì)化了有效特征的表征。
為驗(yàn)證所提方法的泛化性能,采用ERPHM實(shí)驗(yàn)室齒輪箱不同負(fù)載下故障數(shù)據(jù)。其中行星齒輪箱運(yùn)行時(shí)的采樣頻率為30 720 Hz,采樣時(shí)間為2.13 s,采樣點(diǎn)數(shù)為65 536。該數(shù)據(jù)在勻速狀態(tài)下采集負(fù)載電流為0.67 A、0.95 A和1.30 A時(shí)的轉(zhuǎn)速脈沖信號(hào)和振動(dòng)信號(hào)。啟動(dòng)和停止?fàn)顟B(tài)下設(shè)置驅(qū)動(dòng)電機(jī)最高轉(zhuǎn)頻為50 Hz,電機(jī)為勻加速和勻減速過程,整個(gè)加速和減速過程都用時(shí)20 s。其中A工況:負(fù)載電流1.30 A;B工況:負(fù)載電流0.67 A;C工況:負(fù)載電流0.95 A,采集不同負(fù)載下啟動(dòng)和停止過程行星齒輪箱的轉(zhuǎn)速脈沖信號(hào)和振動(dòng)信號(hào)。實(shí)驗(yàn)選擇正常、太陽輪缺齒、太陽輪齒面磨損、太陽輪斷齒和行星輪齒根缺陷等5類故障,各類180個(gè)樣本,故得到訓(xùn)練樣本集數(shù)據(jù)大小900,測(cè)試樣本900。同樣進(jìn)行如軸承的實(shí)驗(yàn)驗(yàn)證。其結(jié)果如表3所示。
表3 不同負(fù)載齒輪箱對(duì)比實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)結(jié)果表明,相對(duì)于軸承故障診斷結(jié)果,各方法診斷準(zhǔn)確率均存在不同程度的下降,其原因是齒輪箱受多激勵(lì)源影響,行星輪與太陽輪多點(diǎn)接觸,導(dǎo)致對(duì)信號(hào)特征干擾較大,無法剝離典型故障特征其主要困難在于多特征耦合這是數(shù)據(jù)特征處理時(shí)需要注意的問題(例如文獻(xiàn)[2]采用小波包分解專門解耦的方式),本文僅輸入頻譜作為特征已經(jīng)得到較好的結(jié)果。所提方法保持90%以上的診斷準(zhǔn)確率,對(duì)實(shí)際工程中仍具備重要的參考價(jià)值。該方法依舊可以有效診斷齒輪箱故障,所提方法精度遠(yuǎn)高于對(duì)比算法。平均精度可以達(dá)到90.41%,標(biāo)準(zhǔn)差在1.25%。進(jìn)一步證明了所提方法的有效性。
綜上所述,注意力深度遷移聯(lián)合適配的不同工況下旋轉(zhuǎn)機(jī)械故障診斷模型,具有較好的診斷精度與魯棒性。
提出了注意力深度遷移適配的不同工況下旋轉(zhuǎn)機(jī)械故障診斷方法,將原始數(shù)據(jù)進(jìn)行快速傅里葉變換以頻譜形式作為輸入,構(gòu)建深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征自提取,提取出不同工況的旋轉(zhuǎn)機(jī)械關(guān)鍵故障特征,通過通道注意力機(jī)制自適應(yīng)調(diào)節(jié)各通道特征權(quán)重在已得到的兩域特征分布式表達(dá)的基礎(chǔ)上有效獲取關(guān)鍵特征,再利用領(lǐng)域適配層,度量?jī)捎蛱卣骺臻g分布距離,以減少不同工況下數(shù)據(jù)的分布差異給故障診斷帶來的影響,并在不同數(shù)據(jù)集上進(jìn)行了對(duì)比驗(yàn)證,通過實(shí)驗(yàn)對(duì)比證明:(1)憑借深度卷積神經(jīng)網(wǎng)絡(luò)特征自提取優(yōu)勢(shì),獲得訓(xùn)練樣本與測(cè)試樣本分布式特征表達(dá),結(jié)合注意力領(lǐng)域適配學(xué)習(xí)可縮小不同工況數(shù)據(jù)域之間特征知識(shí)空間內(nèi)的分布差異,可有效提高遷移故障診斷精度。(2)所提方法是在獲得訓(xùn)練樣本與測(cè)試樣本分布式特征表達(dá)后。再進(jìn)行兩域適配任務(wù),這項(xiàng)工作中訓(xùn)練樣本與測(cè)試樣本均參與其中,使得兩域特征通道間的聯(lián)系加以關(guān)注,大大提升了適配效果,能夠面對(duì)不同工況分布差異劇烈的情況,更適應(yīng)實(shí)際工程中旋轉(zhuǎn)機(jī)械智能故障診斷的應(yīng)用。