溫江濤 張鵬程 孫潔娣 雷 鳴
1.燕山大學(xué)電氣工程學(xué)院,秦皇島,0660042.燕山大學(xué)信息科學(xué)與工程學(xué)院,秦皇島,0660043.燕山大學(xué)河北省信息傳輸與信號處理重點實驗室,秦皇島,066004
軸承振動信號采集相對容易且包含大量有用狀態(tài)信息,因此基于振動信號分析的數(shù)據(jù)驅(qū)動類智能故障診斷方法已成為軸承故障診斷領(lǐng)域的研究熱點[1]。與此同時,深度學(xué)習(xí)理論已在各個領(lǐng)域展現(xiàn)出顯著的應(yīng)用優(yōu)勢,其強(qiáng)大的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可用于自動提取原始振動數(shù)據(jù)的分層表示特征,有效解決傳統(tǒng)機(jī)器學(xué)習(xí)診斷模型存在的一些不足[2-4]。因此,近年來基于深度學(xué)習(xí)理論的智能機(jī)械故障診斷研究受到廣泛關(guān)注,學(xué)者們將深度自編碼網(wǎng)絡(luò)及其變體、深度卷積網(wǎng)絡(luò)等引入旋轉(zhuǎn)機(jī)械故障診斷中。SHAO等[5]提出基于深度自編碼網(wǎng)絡(luò)的故障檢測與識別方法。JIA等[6]提出歸一化稀疏自編碼的典型旋轉(zhuǎn)機(jī)械的故障診斷方法。SUN等[7]提出堆疊稀疏自編碼網(wǎng)絡(luò),實現(xiàn)了對軸承故障的較好識別。JIANG等[8-9]研究了風(fēng)電機(jī)組齒輪箱故障診斷,提出了基于堆疊去噪自編碼網(wǎng)絡(luò)以及多尺度卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型。周奇才等[10]、曲建嶺等[11]針對不同類型的旋轉(zhuǎn)機(jī)械信號,提出基于一維深度卷積神經(jīng)網(wǎng)絡(luò)的原始數(shù)據(jù)學(xué)習(xí)及故障分類方法。WEN等[12]、WANG等[13]利用不同方法將一維振動信號轉(zhuǎn)換為二維形式,進(jìn)一步利用LeNet-5或Alexnet網(wǎng)絡(luò)實現(xiàn)故障自動特征提取及類型識別。雷亞國團(tuán)隊一直致力于機(jī)械裝備故障診斷相關(guān)的研究工作,提出了多種有特色的故障診斷方法[6,14]。
多數(shù)基于深度學(xué)習(xí)的故障診斷方法通常采用實驗室數(shù)據(jù)或運(yùn)行的歷史數(shù)據(jù)訓(xùn)練模型,然后直接用于測試數(shù)據(jù),此類方法在訓(xùn)練集數(shù)據(jù)與測試集數(shù)據(jù)具有相同數(shù)據(jù)分布時效果較好,一旦分布不同則診斷性能下降明顯;此外,深度神經(jīng)網(wǎng)絡(luò)模型通常需要足夠多的有標(biāo)簽數(shù)據(jù)才可以訓(xùn)練出性能良好的分類模型。工業(yè)應(yīng)用場景下,機(jī)械設(shè)備通常運(yùn)行在復(fù)雜多變的環(huán)境下,即使同一設(shè)備的訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)也難以滿足相同分布要求,且真實的故障樣本極為稀少甚至缺失,有監(jiān)督學(xué)習(xí)模式難以適用。為此,本文引入遷移學(xué)習(xí)方法,并通過無監(jiān)督學(xué)習(xí)方式來解決上述問題。遷移學(xué)習(xí)能夠?qū)哪硞€領(lǐng)域或任務(wù)中學(xué)習(xí)到的知識或模式應(yīng)用到不同但相關(guān)的領(lǐng)域或問題中[15]。特征遷移學(xué)習(xí)通過特征變換與處理實現(xiàn)源域和目標(biāo)域的分布差異最小化,從而完成分類模型的有效訓(xùn)練,在故障診斷領(lǐng)域已有一些研究成果[3,16-17]。現(xiàn)有研究成果表明遷移學(xué)習(xí)方法能夠在一定程度上解決數(shù)據(jù)分布差異以及數(shù)據(jù)不平衡等問題。
深度神經(jīng)網(wǎng)絡(luò)類識別方法會隨著網(wǎng)絡(luò)的加深,參數(shù)量急劇增長,導(dǎo)致訓(xùn)練困難、網(wǎng)絡(luò)收斂越來越慢、參數(shù)調(diào)節(jié)難度也隨之增大。為解決以上問題,本文提出一種端到端的基于無監(jiān)督殘差卷積網(wǎng)絡(luò)遷移學(xué)習(xí)的智能診斷方法,該方法主要由一維殘差卷積自編碼(one dimensional residual convolutional auto-encoder, 1D-RCAE)特征提取方法及遷移學(xué)習(xí)域自適應(yīng)分類方法構(gòu)成。1D-RCAE自適應(yīng)學(xué)習(xí)不同工況下軸承運(yùn)行信號的特征,在獲得良好特征提取效果的同時,能夠縮小網(wǎng)絡(luò)訓(xùn)練參數(shù)量,縮短訓(xùn)練時間;遷移學(xué)習(xí)域自適應(yīng)分類方法通過域間差異最小化方法學(xué)習(xí)源域與目標(biāo)域數(shù)據(jù)之間的域不變特征。實驗表明,本文所提出方法具有較高的識別準(zhǔn)確率,同時有效縮小了模型的訓(xùn)練參數(shù)量,加快了網(wǎng)絡(luò)的訓(xùn)練速度,為實現(xiàn)軸承智能故障診斷方法在實際中的應(yīng)用提供了新的思路。
現(xiàn)有的軸承遷移學(xué)習(xí)方法研究中多數(shù)采用有監(jiān)督學(xué)習(xí)方式,并假定有少量帶標(biāo)簽的目標(biāo)域訓(xùn)練樣本可用,但在實際工業(yè)環(huán)境下,帶有標(biāo)簽的目標(biāo)域樣本數(shù)據(jù)獲取代價巨大或者無法獲得。因此,本文研究無監(jiān)督域自適應(yīng)遷移的故障診斷方法,避免網(wǎng)絡(luò)訓(xùn)練過程中對標(biāo)簽數(shù)據(jù)的依賴。軸承振動信號為一維復(fù)雜非平穩(wěn)信號,本文以一維卷積自編碼作為深度網(wǎng)絡(luò)基礎(chǔ)來構(gòu)建診斷網(wǎng)絡(luò)模型。
傳統(tǒng)自編碼器屬于無監(jiān)督式學(xué)習(xí),而一維卷積自編碼器結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)的一維卷積層和池化層,可完全替代傳統(tǒng)自編碼器的全連接層,有效降低了網(wǎng)絡(luò)模型中的參數(shù)數(shù)量,并增強(qiáng)了對高維復(fù)雜數(shù)據(jù)深層特征的提取能力。一維卷積自編碼網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 卷積自編碼網(wǎng)絡(luò)結(jié)構(gòu)
卷積自編碼Encoder部分由輸入層和多個一維卷積層與最大池化層組成,Decoder部分則由輸出層和多個一維反卷積層與上采樣層組成。通過多卷積層堆疊可以實現(xiàn)較好的特征提取效果。
深度卷積神經(jīng)網(wǎng)絡(luò)因優(yōu)越的特征提取性能,在故障診斷領(lǐng)域獲得了廣泛應(yīng)用,但隨著網(wǎng)絡(luò)層數(shù)逐漸增多,參數(shù)量不斷增加,訓(xùn)練難度逐漸增大。而殘差學(xué)習(xí)[18]通過引入更易優(yōu)化的殘差函數(shù),可以在網(wǎng)絡(luò)層數(shù)增加時有效緩解深度網(wǎng)絡(luò)退化以及梯度消失與梯度爆炸問題。同時,在深度殘差網(wǎng)絡(luò)中使用卷積核為1×1的卷積層,可以在不改變網(wǎng)絡(luò)深度的情況下,大幅減少網(wǎng)絡(luò)參數(shù)量。
本文以一維卷積自編碼網(wǎng)絡(luò)為基礎(chǔ),將殘差學(xué)習(xí)引入堆疊的一維卷積自編碼網(wǎng)絡(luò)中,構(gòu)建1D-RCAE網(wǎng)絡(luò)。1D-RCAE可以通過無標(biāo)簽訓(xùn)練數(shù)據(jù)對特征提取器進(jìn)行優(yōu)化訓(xùn)練,再利用少量標(biāo)簽數(shù)據(jù)微調(diào)訓(xùn)練分類器,可以實現(xiàn)較好的域不變特征提取及遷移識別。1D-RCAE網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 1D-RCAE網(wǎng)絡(luò)結(jié)構(gòu)
1D-RCAE在傳統(tǒng)卷積自編碼中引入殘差學(xué)習(xí)塊與瓶頸層,實現(xiàn)網(wǎng)絡(luò)深度增加的同時減少網(wǎng)絡(luò)優(yōu)化參數(shù)量,也改善了梯度消失與網(wǎng)絡(luò)退化等問題,增強(qiáng)了網(wǎng)絡(luò)對深層特征的提取能力。
(1)1D-RCAE網(wǎng)絡(luò)的編碼器部分由輸入層、一維卷積層、最大池化層和瓶頸層構(gòu)成。為實現(xiàn)對輸入數(shù)據(jù)的有效降維,減少網(wǎng)絡(luò)的學(xué)習(xí)參數(shù),一維卷積層卷積核大小為1×3,步幅為2。瓶頸層卷積核大小為1×1,步幅為1,可以靈活改變輸入特征的維度,減少分類器中全連接層的神經(jīng)元個數(shù)。
(2)1D-RCAE網(wǎng)絡(luò)的解碼器部分由輸出層、一維反卷積層、上采樣層和反卷積瓶頸層構(gòu)成。解碼器的目的是通過與編碼器相逆的過程對編碼器輸出特征進(jìn)行還原,使得解碼器輸出與編碼器輸入無限逼近。如圖2所示,1D-RCAE有兩個殘差塊結(jié)構(gòu)。①殘差塊1。編碼器中最大池化層1的輸出通過跳躍連接與解碼器反卷積層3的輸出進(jìn)行加和后生成的新特征作為解碼器上采樣層1的輸入,即上采樣層1的輸入
xu1=P1(C1(xin))+D3(yD2)
(1)
式中,P1為最大池化層1;C1為卷積層1;D3為反卷積層3;xin為原始輸入數(shù)據(jù);yD2為反卷積層2的輸出。
②殘差塊2。編碼器卷積層3的輸出通過跳躍連接與解碼器反卷積層1的輸出進(jìn)行加和后生成的新特征作為解碼器反卷積層2的輸入,即反卷積層2輸入xD2為
xD2=C3(yC2)+D1(yB2)
(2)
式中,C3為卷積層3;D1為反卷積層1;yC2為卷積層2的輸出;yB2為瓶頸層2的輸出。
以1D-RCAE網(wǎng)絡(luò)為基礎(chǔ),搭建無監(jiān)督域自適應(yīng)遷移學(xué)習(xí)網(wǎng)絡(luò)模型,學(xué)習(xí)從源域空間和目標(biāo)域空間到公共映射潛在空間的轉(zhuǎn)換。公共映射特征空間包含源域與目標(biāo)域數(shù)據(jù)的特征表示,可以將源域知識遷移到目標(biāo)域。本文的遷移學(xué)習(xí)診斷模型如圖3所示,將1D-RCAE編碼器部分的輸出作為由兩個全連接層和一個Softmax層構(gòu)成的域自適應(yīng)分類器的輸入。
圖3 無監(jiān)督預(yù)訓(xùn)練遷移學(xué)習(xí)診斷模型
基于單一核函數(shù)的最大均值差異(maximum mean discrepancy, MMD)適配方法目前被廣泛采用,但核函數(shù)的差異會造成計算源域與目標(biāo)域之間的最大分布差異時得到不同的估值,為此本文采用多層多核最大均值差異(multi kernel maximum mean discrepancy, MK-MMD)方法[19-20],用多核核函數(shù)替代單一核函數(shù),降低單一核函數(shù)對遷移學(xué)習(xí)領(lǐng)域適配結(jié)果的影響,并將傳統(tǒng)的核參數(shù)選擇的問題轉(zhuǎn)化為多核核函數(shù)的優(yōu)化問題。通常認(rèn)為深層特征的分布差異保留在域自適應(yīng)分類器的全連接層中,但是在特征提取器訓(xùn)練過程中,學(xué)習(xí)的特征分布也會隨網(wǎng)絡(luò)參數(shù)的更新而變化,為此需要調(diào)整特征提取器學(xué)習(xí)的遷移特征分布。定義遷移學(xué)習(xí)模型代價函數(shù)
(3)
卷積神經(jīng)網(wǎng)絡(luò)中,歸一化操作可以緩解網(wǎng)絡(luò)內(nèi)部協(xié)變量偏移現(xiàn)象??紤]到實際應(yīng)用中,計算機(jī)的內(nèi)存消耗限制只能使用較小的批處理量(batch size),這樣會導(dǎo)致批歸一化BN(batch normalization)的誤差迅速增大,為減小batch size對BN的影響,本文采用組歸一化GN(group normalization)進(jìn)行歸一化處理[21],GN歸一化處理將通道進(jìn)行分組,在每組內(nèi)計算歸一化的均值和方差,其計算與batch size無關(guān)。
本文方法的處理過程如圖4所示,包含數(shù)據(jù)采集與整理、RCAE無監(jiān)督預(yù)訓(xùn)練和域自適應(yīng)遷移學(xué)習(xí)模型訓(xùn)練與測試三個階段,可歸納為如下步驟:
圖4 本文方法處理過程
(3)遷移網(wǎng)絡(luò)模型初始化。將1D-RCAE編碼器部分作為遷移學(xué)習(xí)模型特征提取器,兩層全連接層和一層softmax層作為域適應(yīng)分類器。將1D-RCAE預(yù)訓(xùn)練結(jié)束后得到的網(wǎng)絡(luò)參數(shù)值作為遷移學(xué)習(xí)模型特征提取器的參數(shù)初始值,完成特征提取器初始化。域適應(yīng)分類器部分則對參數(shù)進(jìn)行隨機(jī)初始化。
(5)反向傳播與優(yōu)化。①通過ADAM優(yōu)化器對遷移學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行逐層反向訓(xùn)練以更新網(wǎng)絡(luò)權(quán)值;②返回步驟(4)繼續(xù)執(zhí)行。
實驗均在如下配置的PC端進(jìn)行:Intel Core i9 CPU,32G運(yùn)行內(nèi)存,NVIDIA RTX2080Ti GPU。
為驗證本文方法的有效性,實驗部分選用凱斯西儲大學(xué)(Case Western Reserve University, CWRU)軸承數(shù)據(jù)集[22],文獻(xiàn)[23]使用各種熵和分類方法對CWRU數(shù)據(jù)進(jìn)行全面的基準(zhǔn)分析,對本研究如何選擇CWRU數(shù)據(jù)提供了可參考的建議。本文實驗驗證部分所使用的十類故障振動加速度數(shù)據(jù)同文獻(xiàn)[24]。
本文對CWRU軸承數(shù)據(jù)集采用重疊采樣法來增加有效樣本量,設(shè)置重疊采樣的單個數(shù)據(jù)樣本長度為4096,每種健康狀況包含400個數(shù)據(jù)樣本。實驗過程中從每一類健康狀況數(shù)據(jù)中隨機(jī)取80%樣本數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),剩余20%樣本數(shù)據(jù)作為測試數(shù)據(jù)。CWRU軸承數(shù)據(jù)集數(shù)據(jù)標(biāo)簽處理結(jié)果如表1所示。
表1 CWRU數(shù)據(jù)狀態(tài)分類標(biāo)簽
基于圖3所示網(wǎng)絡(luò)結(jié)構(gòu)搭建1D-RCAE域自適應(yīng)遷移學(xué)習(xí)故障診斷模型,具體參數(shù)設(shè)置如表2所示。
表2 本文網(wǎng)絡(luò)參數(shù)表
基于此模型,以本文構(gòu)造的實驗數(shù)據(jù)集,按照跨域遷移任務(wù)分別進(jìn)行10次重復(fù)實驗,統(tǒng)計得到實驗平均識別準(zhǔn)確率與平均訓(xùn)練時間如表3所示。
表3 本文方法的診斷結(jié)果
由統(tǒng)計結(jié)果可以看出,本文方法在多數(shù)跨域遷移診斷任務(wù)中可保持99.4%以上的故障診斷準(zhǔn)確率,且標(biāo)準(zhǔn)偏差較低。實驗結(jié)果也證明了本文方法在處理CWRU軸承數(shù)據(jù)集的不同負(fù)載遷移的診斷問題時具有較好的結(jié)果。
圖5所示為2hp→0hp跨域遷移診斷任務(wù)中某次實驗遷移診斷模型訓(xùn)練損失與目標(biāo)域測試數(shù)據(jù)識別準(zhǔn)確率隨訓(xùn)練次數(shù)的變化曲線。其中藍(lán)色曲線表示遷移診斷模型訓(xùn)練損失隨訓(xùn)練次數(shù)的變化,紅色曲線表示對應(yīng)跨域遷移診斷任務(wù)中目標(biāo)域測試數(shù)據(jù)的故障識別準(zhǔn)確率隨訓(xùn)練次數(shù)的變化。
圖5 CWRU數(shù)據(jù)集識別準(zhǔn)確率曲線及損失曲線圖
可以看出本文方法在訓(xùn)練過程中遷移診斷模型能夠快速收斂,且目標(biāo)域識別準(zhǔn)確率穩(wěn)步提高,當(dāng)達(dá)到最高識別準(zhǔn)確率后也可以穩(wěn)定保持。
為了更直觀地分析無監(jiān)督遷移學(xué)習(xí)模型的域自適應(yīng)與特征分類能力,圖6給出了2hp→0hp跨域故障診斷的某次實驗在遷移學(xué)習(xí)診斷模型訓(xùn)練過程中領(lǐng)域適配器輸出的源域數(shù)據(jù)特征與目標(biāo)域數(shù)據(jù)特征的T-SNE圖[25],其中,有背景色的圖例表示源域數(shù)據(jù)特征,無背景色的圖例表示目標(biāo)域數(shù)據(jù)特征。
(a)k=0
在無監(jiān)督遷移診斷模型訓(xùn)練初始,特征提取器所提取的目標(biāo)域數(shù)據(jù)特征和源域數(shù)據(jù)特征雜亂無章,無法很好地進(jìn)行聚類,但隨著無監(jiān)督遷移診斷模型迭代訓(xùn)練的不斷進(jìn)行,相同健康狀況數(shù)據(jù)的特征逐漸被聚集在一起,不同健康狀況數(shù)據(jù)的特征得到分離。此外,T-SNE圖還展示出領(lǐng)域適配模塊的設(shè)計可以使特征提取器較好地彌合源域數(shù)據(jù)特征與目標(biāo)域數(shù)據(jù)特征之間的分布距離。
2.3.1診斷模型深度的確定及影響
理論上,網(wǎng)絡(luò)結(jié)構(gòu)越深誤差越小,準(zhǔn)確率越高,但與此同時網(wǎng)絡(luò)復(fù)雜度也會隨之增加,訓(xùn)練更困難。本文設(shè)計的1D-RCAE結(jié)構(gòu)中含有一定量的卷積、池化等層,能夠通過級聯(lián)多個基礎(chǔ)模塊提高診斷性能。筆者綜合目前軸承診斷研究成果中通常采用的網(wǎng)絡(luò)層數(shù),并且考慮計算復(fù)雜度及故障檢測響應(yīng)時間的要求,分別設(shè)計并對比了三種具有不同網(wǎng)絡(luò)深度的一維殘差自編碼網(wǎng)絡(luò)模型,分別記為Net1、Net2、Net3,網(wǎng)絡(luò)結(jié)構(gòu)如表4所示。
表4 不同深度網(wǎng)絡(luò)結(jié)構(gòu)表
為了減小隨機(jī)因素的影響,本次實驗以2hp→0hp跨域遷移診斷任務(wù)為例,分別對上述三個網(wǎng)絡(luò)進(jìn)行10次重復(fù)實驗。圖7展示了上述三種不同深度網(wǎng)絡(luò)10次重復(fù)實驗的識別準(zhǔn)確率結(jié)果。
圖7 不同網(wǎng)絡(luò)深度識別準(zhǔn)確率對比
由統(tǒng)計結(jié)果可以發(fā)現(xiàn),隨著網(wǎng)絡(luò)深度的增加,識別準(zhǔn)確率也在提高,但當(dāng)網(wǎng)絡(luò)深度增加到一定程度后,識別準(zhǔn)確率難以繼續(xù)提高,說明網(wǎng)絡(luò)性能已經(jīng)達(dá)到了飽和。識別準(zhǔn)確率、標(biāo)準(zhǔn)差、網(wǎng)絡(luò)訓(xùn)練時間統(tǒng)計結(jié)果如表5所示。
表5 不同網(wǎng)絡(luò)層數(shù)的診斷結(jié)果
觀察統(tǒng)計結(jié)果可知,采用Net2網(wǎng)絡(luò)結(jié)構(gòu)時識別準(zhǔn)確率最高,由網(wǎng)絡(luò)平均訓(xùn)練時間統(tǒng)計結(jié)果可以看出,隨著網(wǎng)絡(luò)的不斷加深,網(wǎng)絡(luò)性能達(dá)到飽和,并且訓(xùn)練參數(shù)的激增導(dǎo)致訓(xùn)練時間也不斷增加。綜合以上分析,本文選用有兩個殘差塊的Net2實現(xiàn)滾動軸承故障診斷,在保證故障識別準(zhǔn)確度的同時還可以有效縮短網(wǎng)絡(luò)訓(xùn)練時間。
2.3.2卷積核寬度的影響
在卷積神經(jīng)網(wǎng)絡(luò)中,卷積核寬度是一個重要的超參數(shù),表示卷積層輸出特征通道數(shù)。對于一個模型而言,相較于深層網(wǎng)絡(luò)所提取的特征,淺層的特征非常重要,因此網(wǎng)絡(luò)淺層的卷積核寬度是一個較為敏感的系數(shù)。
為了分析卷積核寬度大小對本文模型性能的影響,以CWRU數(shù)據(jù)集2hp→0hp遷移任務(wù)為基礎(chǔ),設(shè)計了以卷積核寬度為變量的對比實驗:分別設(shè)置卷積核寬度為4、16、32、64,每組進(jìn)行10次實驗。某單次實驗中訓(xùn)練損失及目標(biāo)域測試數(shù)據(jù)識別準(zhǔn)確率隨訓(xùn)練次數(shù)變化曲線如圖8所示。
圖8 不同卷積核寬度的訓(xùn)練損失及識別準(zhǔn)確率變化
由訓(xùn)練損失變化曲線可以看出,卷積核寬度為16時模型收斂最快;寬度為32時模型收斂最慢。由目標(biāo)域測試數(shù)據(jù)識別準(zhǔn)確率變化曲線可以看出,卷積核寬度為16時最終識別準(zhǔn)確率最高。
表6列出了不同卷積核寬度條件下,10次實驗的平均識別準(zhǔn)確率、標(biāo)準(zhǔn)差和平均訓(xùn)練時間。
表6 不同卷積核寬度的診斷結(jié)果
由統(tǒng)計結(jié)果可知隨著卷積核寬度的增大,網(wǎng)絡(luò)訓(xùn)練時間也相應(yīng)變長,卷積核寬度為16時平均識別準(zhǔn)確率最高。綜合考慮故障識別準(zhǔn)確率與訓(xùn)練時間消耗等因素,本文設(shè)置網(wǎng)絡(luò)模型的卷積核寬度為16。
基于特征映射的遷移學(xué)習(xí)方法中,需要盡量最小化源域和目標(biāo)域之間的概率分布差異,因此分布差異性度量方法成為影響模型診斷效果的重要因素。以CWRU數(shù)據(jù)集2hp→0hp遷移任務(wù)為例,在相同網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上,對網(wǎng)絡(luò)提取的特征使用不同距離度量方法來計算特征分布差異,主要對比以下方法:MMD[26]、多核MMD[19](MK-MMD)、雙層MK-MMD(MC-MMD1)、三層MK-MMD(MC-MMD2)[27]。單層指計算不同域數(shù)據(jù)FC2輸出特征距離分布差異,雙層指計算不同域數(shù)據(jù)FC1和FC2輸出特征距離分布差異,三層指計算不同域數(shù)據(jù)特征提取器、FC1和FC2輸出特征距離分布差異。統(tǒng)計各網(wǎng)絡(luò)10次實驗結(jié)果的識別準(zhǔn)確率,結(jié)果如圖9所示。
圖9 不同距離適配方案識別準(zhǔn)確率
由統(tǒng)計結(jié)果可以看出MK-MMD性能要優(yōu)于MMD,且不同層數(shù)的MK-MMD對診斷結(jié)果也有較大的影響。其中MC-MMD1平均識別準(zhǔn)確率(99.70%)最高,MC-MMD2平均識別準(zhǔn)確率(99.59%)稍低于MC-MMD1。因此,本文選擇雙層MK-MMD作為最終的距離度量函數(shù)。
以CWRU數(shù)據(jù)集2hp→0hp遷移任務(wù)為例,分別以BN 和GN作為歸一化函數(shù),在batch size為8、16、32、64和128的條件下進(jìn)行10次實驗,目標(biāo)域測試數(shù)據(jù)平均識別準(zhǔn)確率及訓(xùn)練時間結(jié)果如表7所示。
由表7可知,在BN歸一化函數(shù)下,本文模型診斷準(zhǔn)確率隨著樣本批量大小的增大而提高,當(dāng)樣本批量大小為128時平均識別準(zhǔn)確率最高(99.438%),訓(xùn)練時間最短(582 s)。在GN歸一化函數(shù)條件下,識別準(zhǔn)確率受樣本批量大小影響較小,在樣本批量大小為32時平均識別準(zhǔn)確率最高(99.638%)。由網(wǎng)絡(luò)訓(xùn)練時間統(tǒng)計結(jié)果可知,在相同參數(shù)條件下,分別應(yīng)用BN和GN作為歸一化函數(shù),模型訓(xùn)練時間近乎相同,且網(wǎng)絡(luò)訓(xùn)練時間消耗會隨著樣本批量的增大而快速降低。實驗統(tǒng)計結(jié)果表明,利用GN歸一化處理可有效緩解樣本批量大小對跨域遷移診斷結(jié)果的影響,因此綜合考慮網(wǎng)絡(luò)模型的識別準(zhǔn)確率、訓(xùn)練時間及計算機(jī)內(nèi)存消耗等因素,本文采用GN作為歸一化函數(shù),樣本批量大小設(shè)置為32。
表7 不同歸一化函數(shù)的診斷結(jié)果
本文診斷模型采用了一維殘差卷積自編碼網(wǎng)絡(luò),并融合多層多核概率分布適配來約束網(wǎng)絡(luò)學(xué)習(xí)域不變特征,提高了變工況下的軸承故障識別準(zhǔn)確率。為了考察方法的診斷性能,此處給出與其他經(jīng)典方法識別相同故障類型的對比結(jié)果,對比方法包括:基于SAE、CAE、CNN的遷移診斷方法、無域自適應(yīng)的1-DRCAE方法,主要的模型結(jié)構(gòu)如表8所示。
表8 5種對比方法的模型結(jié)構(gòu)
應(yīng)用上述方法對所有跨域遷移故障診斷任務(wù)進(jìn)行10次重復(fù)實驗,平均識別準(zhǔn)確率與訓(xùn)練時間的統(tǒng)計結(jié)果分別如圖10、圖11所示。
圖10 不同方法識別準(zhǔn)確率統(tǒng)計圖
圖11 不同方法訓(xùn)練時間統(tǒng)計結(jié)果
由圖10、圖11可知,本文方法的識別準(zhǔn)確率明顯高于對比方法,訓(xùn)練時間比采用1D-RCAE及SAE方法的長,但短于其余兩種方法的訓(xùn)練時間。究其原因,首先本文方法引入了遷移學(xué)習(xí),對不同工況故障的差異進(jìn)行了域適應(yīng)處理,改善了診斷效果,由統(tǒng)計結(jié)果可以看出,即使都采用1-DRCAE網(wǎng)絡(luò)結(jié)構(gòu),本文采用了遷移處理方法的診斷結(jié)果明顯好于未采用遷移處理的效果。與采用其他網(wǎng)絡(luò)的方法對比,本文方法采用了深層結(jié)構(gòu),相比淺層SAE遷移方法示本文方法在各個跨域診斷任務(wù)中具有明顯優(yōu)勢;相比具有相同網(wǎng)絡(luò)深度的CAE和CNN遷移方法,引入殘差塊結(jié)構(gòu)的1-DRCAE網(wǎng)絡(luò)不但提高了網(wǎng)絡(luò)模型的跨域遷移故障診斷性能、增強(qiáng)了網(wǎng)絡(luò)模型的魯棒性,還可以有效縮減模型訓(xùn)練時間。由以上分析可以看出,本文所提出的無監(jiān)督遷移學(xué)習(xí)故障診斷方案能夠?qū)⒕W(wǎng)絡(luò)從源域所學(xué)習(xí)到的特征知識有效遷移到目標(biāo)域中,有效提高了網(wǎng)絡(luò)模型的跨域故障診斷性能。
實際故障診斷應(yīng)用中,旋轉(zhuǎn)機(jī)械復(fù)雜的運(yùn)行環(huán)境會導(dǎo)致傳感器采集的振動信號與實驗室獲取的典型故障信號存在較大差異,影響基于機(jī)器學(xué)習(xí)算法的故障識別類方法的準(zhǔn)確率。為此,本文提出了基于無監(jiān)督特征知識遷移學(xué)習(xí)的智能故障診斷方法,通過引入一維卷積與殘差學(xué)習(xí)構(gòu)建深度一維殘差卷積自編碼網(wǎng)絡(luò),采用無監(jiān)督域自適應(yīng)方法實現(xiàn)不同負(fù)載條件下軸承故障的識別。實驗結(jié)果表明,本文方法在實現(xiàn)較高準(zhǔn)確率故障識別的同時,相比傳統(tǒng)深度學(xué)習(xí)方法,減少了模型訓(xùn)練參數(shù)數(shù)量,加快了網(wǎng)絡(luò)的訓(xùn)練速度,而且對不同應(yīng)用環(huán)境的遷移識別任務(wù)魯棒性較好。