楊勝康,孔憲光,王奇斌,程 涵,李中權,2
(1.西安電子科技大學 機電工程學院,西安 710071;2.上海杭和智能科技有限公司,上海 201111)
機械故障是風力電設備、航空發(fā)動機、高檔數(shù)控機床等國家大型機械裝備安全可靠運行的“潛在殺手”[1]?,F(xiàn)如今,對于如何準確診斷機械故障已成為裝備故障預測與維護管理的研究熱點。
為及時發(fā)現(xiàn)機械故障,使機器處于正常運行狀態(tài),提出了多種機械故障診斷方法,這些故障診斷方法可分為信號處理方法[2-3]和數(shù)據(jù)驅動方法[4]。信號處理主要是通過小波分解[5]、經驗模態(tài)分解[6]、變分模態(tài)分解[7]等信號處理方法采集振動信號進行時頻特征分析,進行故障特征提取實現(xiàn)故障診斷。隨著大數(shù)據(jù)時代的到來[8],傳統(tǒng)的信號處理方法逐漸被基于機器學習和深度學習技術的數(shù)據(jù)驅動方式所替代。以支持向量機[9],人工神經網絡[10]、決策樹隨機森林[11]等為代表的機器學習方法在故障診斷領域展開應用研究。由于機器學習方法需要大量的有標簽數(shù)據(jù),進行監(jiān)督學習故障特征。而真實的工業(yè)環(huán)境中常常面臨無標簽信息的工業(yè)數(shù)據(jù),機器學習方法無法滿足這種需求,因此以深度置信網絡(deep belief networks,DBN),深度自編碼器等無監(jiān)督特征學習的深度學習技術迅速得到廣泛應用。Shao等[12]利用優(yōu)化后的DBN進行滾動軸承故障診斷方法研究,獲得較好的故障診斷效果。Zhou等[13]對深度自編碼進行改進應用于故障診斷。李濤等[14]利用自適應卷積神經網絡進行旋轉機械故障診斷,增強模型的穩(wěn)定性和適應性。
盡管機器學習和深度學習技術在故障診斷領域有不錯的診斷性能,但是針對不同工況、不同設備之間以及引入新故障模式的故障診斷問題仍然難以達到理想的效果。隨著遷移學習[15]在圖像識別與分類領域的成功應用,近年來,遷移學習在故障診斷領域的應用成為研究熱點。Wen等[16]提出基于堆棧式稀疏自編碼器的深度遷移學習方法,應用不同工況下的滾動軸承故障診斷。Yang等[17]提出基于特征遷移的卷積神經網絡,并引入多層MMD(maximum mean discrepancy)實現(xiàn)特征的域適應,將實驗室軸承故障知識遷移到現(xiàn)場作業(yè)機械環(huán)境的軸承上,實現(xiàn)了不同設備之間故障診斷遷移學習。Zhang等[18]針對引入的新故障問題,提出基于深度神經網絡結構修正的遷移學習故障診斷方法,對訓練好神經網絡結構進行修正并對參數(shù)進行補充,利用少量目標域數(shù)據(jù)進行訓練獲得較好故障診斷分類效果。Xu等[19]針對故障診斷中的樣本不平衡引起的域自適應問題,提出一種卷積遷移特征判別網絡,在變轉速不平衡故障數(shù)據(jù)下具有很好的域適應特征提取能力。Li等[20]針對小樣本數(shù)據(jù)下不同工況不同故障類型的問題,提出基于域對抗學習網絡的遷移學習故障診斷模型。Zhang等[21]提出一種雙判別器生成對抗網絡學習模型提高模型在不平衡數(shù)據(jù)集上的故障診斷精度。Zhang等[22]設計了一種專門的聯(lián)邦學習框架解決在遷移學習過程中數(shù)據(jù)隱私和數(shù)據(jù)孤島問題。Li等[23]提出了一種兩階段遷移對抗遷網絡實現(xiàn)對旋轉機械出現(xiàn)未知新故障的智能診斷。Huang等[24]針對耦合故障診斷問題,建立深度對抗膠囊網絡模型將耦合故障解耦為單一故障,進而提高模型在實際工業(yè)場景中的診斷效果。
以上研究主要是從單源域出發(fā)利用域適應或域對抗學習方法解決變工況、不同設備、新工況故障數(shù)據(jù)不足以及出現(xiàn)未知故障的旋轉機械故障診斷問題。然而在實際工業(yè)場景中,由于單一工況或單一設備的個性,進行單源域遷移學習會出現(xiàn)域不匹配造成負遷移和模型泛化能力不足的現(xiàn)象。而從多種工況的數(shù)據(jù)出發(fā),即進行多源域下遷移學習任務,能夠集成多源域故障特征信息,提取更好的域不變公共特征,學習到故障知識,將對于未知工況下的故障診斷具有較好的診斷效果。因此,本文將結合錨適配器集成和深度神經網絡提出基于多源域深度遷移學習的機械故障診斷方法,利用錨適配器集成,充分集成多源域故障特征信息,學習域不變公共特征,減少源域與目標域之間的分布差異,進而達到較好的診斷效果。
多源域遷移學習故障診斷中,源域和目標域在所有數(shù)據(jù)上可能不是緊密相關的。但是,從源域和目標域的相同鄰近區(qū)域隨機選擇數(shù)據(jù)點,基于這些數(shù)據(jù)點進行遷移學習可以獲得較好的分類效果。因此,Zhuang等[25]基于該思想建立基于錨適配器集成的遷移學習框架,本文將從多源域中隨機選擇錨點進行錨適配器的構建與集成,用于多源域遷移學習故障診斷。
錨適配器的結構如圖1所示,主要包括相似度計算和生成錨適配器矩陣兩部分,其具體的構建流程如下。
圖1 錨適配器構建
(1)
(2)
(3)
因此,最終錨適配器集成分類器輸出的計算公式如式(4)所示
(4)
基于錨適配器集成的遷移學習框架,利用深度神經網絡模型具有挖掘數(shù)據(jù)深層次特征的優(yōu)勢,采用深度神經網絡模型進行多源域故障診斷遷移學習特征提取,進而提出基于多源域深度遷移學習的機械故障診斷方法,其故障診斷模型如圖2所示?;诙嘣从蛏疃冗w移學習的故障診斷模型主要由深度特征提取網絡、源域分類損失和源域與目標域特征分布均值差異三部分組成。深度特征提取采用深度神經網絡(deep neural networks, DNN),為了保證模型能夠盡可能多地提取不同工況下的融合特征,DNN網絡共享權值和偏差,從而降低計算成本。引入最大均值差異損失函數(shù)是為了減小源域和目標域之間的特征分布差異,使得不同轉速下樣本特征的邊際概率分布盡可能一致,使深度特征提取網絡、該遷移學習網絡更好地學習不同工況下的域不變特征。在提取到域不變特征之后,利用有標簽的源域數(shù)據(jù)訓練得到較好的故障分類器,從而用于目標域工況下的故障診斷。
圖2 基于多源域深度遷移學習的故障診斷遷移學習模型
故障模型的深度特征提取網絡采用一個共享參數(shù)的3層深度神經網絡模型進行深層故障特征的提取,分別為輸入層、隱藏層和特征輸出層,最后采用SoftMax分類器進行故障分類。假設x,f為神經網絡的輸入和特征向量,隱藏層輸出向量定義h,則前向過程如下
(5)
式中:W1為輸入層和隱藏層之間的權值矩陣;W2為隱藏層和特征輸出層之間的權值矩陣;b1和b2分別為隱藏層和特征輸出層的偏置。則深度神經網絡模型的分類損失函數(shù)定義
(6)
(7)
基于MMD的定義,多源域故障診斷遷移學習中的MMD計算如下式所示
(8)
因此,DNN的遷移學習故障診斷模型的總損失函數(shù)定義如下
λ·[DMM(Fs1,Ft)+DMM(Fs2,Ft)]
(9)
式中,λ為MMD項的懲罰系數(shù)。該損失函數(shù)由源域的分類損失函數(shù)以及源域和目標域特征分布最大均值差異的損失函數(shù)兩部分組成。其分類損失函數(shù)可以保證模型具有較好的分類性能,MMD損失項可以減小不同域特征分布的差異,提高域特征的相似性和不變性。模型訓練過程通過采用Adam優(yōu)化算法來最小化式(9),Adam算法能夠有效地加速訓練過程,解決大量參數(shù)優(yōu)化的問題。
本文提出的基于多源域深度遷移學習的故障診斷方法流程如圖3所示。
圖3 基于多源域深度遷移的故障診斷方法流程
首先,從多源域中隨機選擇q個樣本作為錨點,計算每個錨點與多源域數(shù)據(jù)和目標域數(shù)據(jù)的相似度,并基于相似度生成新的源域和目標域適配器數(shù)據(jù),并構建基于錨適配器的源域-目標域數(shù)據(jù)對。其次,對每一個數(shù)據(jù)對采用基于深度神經網絡模型的故障診斷遷移學習方法進行模型訓練,得到q個分類器,并利用生成的新目標域數(shù)據(jù)進行故障分類預測,得到q個預測結果。最后,通過采用加權集成的方式,對所有錨適配器對應的分類器進行集成,實現(xiàn)最終故障診斷模型的構建,用于對目標域數(shù)據(jù)進行測試,獲得最終故障診斷結果。
選取凱斯西儲大學實驗室[26]的軸承數(shù)據(jù)集作為試驗數(shù)據(jù)對所提方法進行驗證,試驗設置如圖4所示,主要由感應電機、檢測軸承和加載電機組成,測試軸承支撐電機軸。采用電火花加工方法對電機軸承(6205-2RS JEM SKF)進行了故障植入,分別內圈、滾子元件和外圈處引入直徑0.177 8 mm、0.355 6 mm、0.533 4 mm、0.711 2 mm的單點故障。每個軸承在4種不同的負載(1 797 r/min,1 772 r/min,1 750 r/min,1 730 r/min)下測試。在驅動端附近的外殼上安裝了一個帶有磁吸式底座的加速度計來收集振動信號,采樣頻率為12 kHz。
圖4 軸承故障試驗設置
分別采集4種不同工況下的數(shù)據(jù)對所提方法進行驗證,每一類工況下包含12類的數(shù)據(jù):正常,0.177 8 mm(滾子、內圈、外圈(3點鐘方向、6點鐘方向));0.355 6 mm(滾子、內圈、外圈(6點鐘方向));0.533 4 mm(滾子、內圈、外圈(3點鐘方向、6點鐘方向))。每種工況下每一故障類別數(shù)據(jù)包含300個樣本,每個樣本是一個采集到的振動信號段,由400個樣本點組成,并通過傅里葉變換獲得頻域數(shù)據(jù),從頻域數(shù)據(jù)樣本中隨機選擇225個樣本作為訓練數(shù)據(jù),其余75個樣本作為測試數(shù)據(jù),其數(shù)據(jù)具體劃分如表1所示。
表1 12類軸承數(shù)據(jù)描述
采用錨適配器集成與深度神經網絡結合的多源域遷移學習方法進行多工況下軸承故障診斷,采用模型網絡結構為200-100-50-12,激活函數(shù)采用Sigmoid函數(shù),其網絡模型的學習率為0.02,相關參數(shù)如表2所示。此外,設置錨適配器的個數(shù)n為24,特征相似度的度量MMD的懲罰系數(shù)為2。
表2 DNN模型參數(shù)
3.2.1 單源域與多源域遷移結果對比分析
將4種不同負載(1 797 r/min,1 772 r/min,1 750 r/min,1 730 r/min)的軸承故障數(shù)據(jù)集標記為(Hp0, Hp1, Hp2, Hp3)。將Hp0和Hp1同時作為源域,有標簽,Hp2作為目標域,無標簽,進行多種工況與單一工況遷移學習(Hp0→Hp2、Hp1→Hp2、Hp0-Hp1→Hp2)故障分類,采用所提方法進行5次故障分類試驗,其余任務采用類似方式進行同樣方式進行故障分類,分類結果如表3和圖5所示。
從表3結果進行對比分析,可以發(fā)現(xiàn)單一工況任務的遷移學習任務,如Hp0→Hp3和Hp1→Hp3兩種任務的平均準確率分別為0.917 3和0.984 8,而對于Hp0-Hp1→Hp3的準確率可達0.997 3,其分類準確率明顯高于Hp0、Hp1分別遷移到Hp3兩種單一工況遷移學習任務;此外,通過圖5中可以看出除了任務C1之外的其他任務比較,兩種工況共同進行遷移學習任務的分類準確率明顯高于其中任意單一源域工況遷移到目標域工況的任務,其中,多工況遷移學習的分類精度相比于其中任意一種單一工況的遷移學習最高可提升8.78%;而且通過對比其他單一工況遷移學習和兩種工況共同遷移學習任務的分類精度變化趨勢可以看出多源域遷移學習模型的穩(wěn)定性明顯比較好。
表3 多源域深度遷移故障分類結果
圖5 單源域遷移與多源域遷移故障診斷結果對比圖
單源域遷移學習任務Hp0→Hp3和Hp1→Hp3以及多源域遷移學習任務Hp0-Hp1→Hp3的特征分布,如圖6所示。從圖6中任務Hp0→Hp3的特征分布可知,故障類別7、10沒有完全被區(qū)分,同樣從任務Hp1→Hp3的特征分布看出,故障類別5、7的部分樣本被誤分類到故障類別10中,導致任務Hp0→Hp3和Hp1→Hp3的精度不足;然而從任務Hp0-Hp1→Hp3的特征分布可以看出,12種故障深度特征完全被區(qū)分,使得任務Hp0-Hp1→Hp3的分類準確率率明顯高于對應的單源域遷移學習任務。因此,結合錨適配器集成和深度神經網絡的多源域遷移學習故障診斷方法能夠從不同工況源域數(shù)據(jù)中綜合考慮多種工況下的故障特征信息,可以學習到較為穩(wěn)定的域不變特征,進而對于目標域工況獲得比較好的分類性能,提高模型精度。
(a)Hp0→Hp3
3.2.2 與其他遷移學習方法對比分析
為了更客觀地測試所提方法的性能,與其他遷移學習方法進行對比來證明本文所提方法在故障診斷方面具有更好的穩(wěn)定性和準確率。這些方法主要包括:遷移成分分析(transfer component analysis, TCA)、聯(lián)合分布適應方法(joint distribution adaptation, JDA)、平衡分布適應方法(balanced distribution adaptation, BDA)、公共關系對齊方法(co-relation alignment, CORAL),這些方法的主要參數(shù)描述如表4所示。
表4 不同方法的主要參數(shù)
此外,并與基于卷積神經網絡的遷移學習網絡(deep convolutional transfer learning network, DCTLN)[27]和域對抗神經網絡(domain adversarial neural networks, DANN)[28]兩種方法的診斷結果對比分析。利用以上6種遷移學習方法進行同樣的12類多源域遷移學習故障診斷任務,不同方法在12類任務上的分類結果準確率如表5和圖7所示。
從表5的對比結果可知,基于多源域深度遷移學習故障診斷模型相比于其他方法在12個不同的遷移學習故障診斷任務上具有最好的分類性能,并且該方法的在12個不同任務的平均準確率為0.994 5,而TCA、JDA、BDA、CORAL、DTCLN和DANN的平均準確率分別為0.872 7,0.903 3,0.894 1,0.859 8,0.941 3和0.957 9,通過對比可以看出該方法明顯比其他6種遷移學習方法的性能好。此外,根據(jù)對比標準差分析以及圖6可知,其他6種方法在不同的任務上性能表現(xiàn)不是很穩(wěn)定,尤其是BDA,BDA的標準差為0.051 7,從圖7中也可知對于不同任務其性能波動最大。然而本文方法在12個任務上的標準差為0.003 8,明顯比其他方法小,從圖7可知其性能波動較小,進一步說明該方法在不同的任務能夠呈現(xiàn)出較好的穩(wěn)定性,具有較好的泛化能力。
表5 不同遷移學習方法對于多源域故障診斷的準確率
圖7 不同方法故障診斷準確率對比圖
以多源域遷移學習任務Hp0-Hp1→Hp3為例,進行其他對比方法TCA、JDA、BDA、CORAL、DTCNN和DANN在該任務上的特征分布可視化,如圖8所示。
從圖8可知,TCA、JDA、BDA和CORAL相比于DTCNN和DANN,對于可判別特征學習能力較差,進而可以從表5和圖7可知TCA、JDA、BDA和CORAL在多源域遷移學習任務上的故障診斷效果沒有DTCNN和DANN效果好。盡管DTCNN和DANN有較好的特征學習能力,與本文方法在任務Hp0-Hp1→Hp3上特征分布圖6(c)相比,在域不變特征學習能力方面仍然不足。
對比圖6(c)和圖8可以可看出,本文方法可以從多個域中提取可判別的域不變特征,進而導致本文方法相比于其他不同方法在任務Hp0-Hp1→Hp3上具有較好的故障診斷精度。
(a)TCA
針對單源域遷移學習出現(xiàn)的負遷移和泛化能力差的問題,提出了基于多源域深度遷移學習的機械故障診斷方法,并通過滾動軸承數(shù)據(jù)集驗證所提方法的有效性。主要結論如下:
(1)結合錨適配集成和深度神經網絡的多源域深度遷移學習故障診斷方法,集成了滾動軸承多源域數(shù)據(jù)的故障信息,更好地從源域數(shù)據(jù)中學習公共的域不變故障特征信息。通過滾動軸承故障診斷案例分析,多源域遷移學習相比于其中的任意單源域遷移學習有較好的診斷效果,最高可提升8.78%。
(2)與其他方法相比,本文所提方法對于不同的多源域遷移學習方法具有較好的穩(wěn)定性和診斷效果,提高了模型的泛化能力,為機械故障診斷提供一種新的途徑。