韓特 劉超 沈長青 史紅梅 司瑾 蔣東翔
摘要 傳統(tǒng)數(shù)據(jù)驅(qū)動的機械裝備故障診斷方法依賴目標工況下的完備數(shù)據(jù),而裝備實際運行工況復(fù)雜多變,難以預(yù)測,且數(shù)據(jù)獲取困難。針對上述問題,提出了一種深度嵌入度量網(wǎng)絡(luò)(Deep Embedding Metric Network, DEMN)的機械跨工況故障識別方法,該方法利用裝備在已知工況下的數(shù)據(jù)學習魯棒特征表示,建立適用于未知工況場景下的泛化智能故障識別模型?;诙喑叨染矸e神經(jīng)網(wǎng)絡(luò)(Multiscale Convolutional Neural Network, MCNN)獲取故障信號的深度嵌入特征;用度量學習方法引導判別性特征學習,構(gòu)建特征嵌入空間下的三元組損失(Triplet Loss, TL);利用粒子群算法(Particle Swarm Optimization, PSO)對間隔參數(shù)進行尋優(yōu)。所提方法有效縮小裝備健康狀態(tài)類內(nèi)距離、擴大類間距離,降低工況變化對健康狀態(tài)映射關(guān)系的影響。實驗結(jié)果表明,該方法在齒輪箱跨工況故障診斷實驗中表現(xiàn)出良好的識別精度與泛化性能。
關(guān)鍵詞 故障診斷; 齒輪箱; 卷積神經(jīng)網(wǎng)絡(luò); 度量學習; 跨工況
引 言
機械裝備如風力發(fā)電機、航空發(fā)動機等,正在朝著復(fù)雜化、精密化、大容量的方向發(fā)展。時變轉(zhuǎn)速、復(fù)雜載荷以及大沖擊擾動等惡劣運行工況極易引發(fā)各類故障,嚴重影響了裝備的安全性和可靠性。開發(fā)具有實時數(shù)據(jù)處理、分析、決策的狀態(tài)監(jiān)測與故障診斷系統(tǒng)對于提高機械裝備安全可靠性具有重要的意義[1]。
隨著工業(yè)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,傳感器網(wǎng)絡(luò)實時收集并存儲機械裝備運行數(shù)據(jù),機械大數(shù)據(jù)的時代隨之來臨。近年來,結(jié)合數(shù)據(jù)驅(qū)動和人工智能技術(shù)的機械裝備智能故障診斷理論方法得到了越來越廣泛的研究與實踐,為實時分析機械運行數(shù)據(jù)、監(jiān)測裝備健康狀態(tài)提供了新的思路和解決途徑[2?3]。其中,深度學習方法備受青睞。Zhao等[4]系統(tǒng)綜述了基于深度學習模型的機械健康狀態(tài)監(jiān)測方法,并結(jié)合刀具磨損開展案例研究。Khan等[5]圍繞深度學習在裝備健康管理中的應(yīng)用發(fā)表綜述文章。盡管深度學習的成功案例被不斷報道,但將其靈活應(yīng)用于機械裝備故障診斷中仍然任重道遠?,F(xiàn)有研究通?;趦蓚€假設(shè):①模型訓練數(shù)據(jù)和布署場景中的測試數(shù)據(jù)遵從獨立同分布;②可以獲取大量典型標記的故障數(shù)據(jù)進行模型訓練。
在工程實踐中,上述假設(shè)往往難以成立,究其原因為機械裝備運行工況復(fù)雜,如轉(zhuǎn)速和負載多變。具體而言,① 機械監(jiān)測物理量既攜帶了裝備運行狀態(tài)的信息,如性能和故障特征等,又包含工況信息。二者在監(jiān)測信號中相互耦合。當運行工況發(fā)生改變,測試信號中的故障特征信息也隨之變化[6],即數(shù)據(jù)故障特征分布發(fā)生漂移。故障診斷模型訓練數(shù)據(jù)與目標工況下的測試數(shù)據(jù)之間獨立同分布的假設(shè)很難滿足;② 由于機械裝備在實際運行環(huán)境中工況多變,診斷模型實際布署場景的運行工況未知且難以預(yù)測。目標工況下的可用數(shù)據(jù)獲取困難,無法重新訓練學習故障診斷模型。綜上所述,機械裝備復(fù)雜工況對智能故障診斷方法的有效性提出了挑戰(zhàn)。亟需開展跨工況故障診斷方法研究,即在特定工況數(shù)據(jù)中構(gòu)建診斷模型,并當工況發(fā)生改變時仍能夠準確識別裝備健康狀態(tài)[7]。如何挖掘訓練數(shù)據(jù)中的魯棒特征表示,降低工況變化對健康狀態(tài)映射關(guān)系的影響是跨工況故障診斷方法的核心問題。
為了打破智能故障診斷中訓練數(shù)據(jù)與測試數(shù)據(jù)獨立同分布的假設(shè),開發(fā)適應(yīng)于跨工況乃至跨領(lǐng)域的靈活智能故障診斷方法,基于遷移學習的智能故障診斷方法應(yīng)運而生[8?9]。Lu等[10]首次在深度模型中考慮輔助域和目標域數(shù)據(jù)分布的最大均值差異(Maximum Mean Discrepancy, MMD)最小化,并在軸承與齒輪箱跨工況診斷實驗中進行方法驗證。Zhang等[11]利用Wasserstein距離評估軸承在不同轉(zhuǎn)速下數(shù)據(jù)分布的差異,以對抗訓練(Adversarial Training, AT)的方式學習領(lǐng)域不變性特征表示,實現(xiàn)了在跨工況場景下的軸承故障遷移診斷。Chen等[12]提出了一種領(lǐng)域?qū)惯w移網(wǎng)絡(luò)(Domain Adversarial Transfer Network, DATN), 解決了旋轉(zhuǎn)機械在不同轉(zhuǎn)速條件和噪聲環(huán)境下的跨工況故障診斷問題。遷移學習方法為不同工況下的診斷任務(wù)建立起橋梁,緩解模型對目標工況故障訓練數(shù)據(jù)的依賴。但與此同時,該類方法在工程實踐中依然存在一定局限性,即假設(shè)目標工況已知,且存在一定數(shù)據(jù)進行遷移學習,如少量標記故障數(shù)據(jù)或包含裝備故障信息的無標記數(shù)據(jù)。
針對上述問題,本文將從泛化建模角度開展機械裝備跨工況故障診斷方法研究。僅利用已知工況下的數(shù)據(jù)訓練模型,重點關(guān)注模型在未知目標工況場景下的魯棒性與泛化能力。提出了一種深度嵌入度量網(wǎng)絡(luò)。在深度特征嵌入空間中,利用度量學習挖掘機械裝備不同健康狀態(tài)數(shù)據(jù)的內(nèi)在判別結(jié)構(gòu),構(gòu)建決策邊界泛化的分類模型,準確識別未知目標工況下機械裝備健康狀態(tài)。
1 多尺度卷積神經(jīng)網(wǎng)絡(luò)
1.1 Inception單元模塊
深度學習通過構(gòu)建多層網(wǎng)絡(luò)結(jié)構(gòu)以獲取高度非線性空間變換能力。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)是深度學習中的最重要的模型之一。本文將在CNN框架下開展研究。CNN模型主要由前端卷積?池化模塊f進行特征學習和提取,并由后端分類模塊C進行識別。
傳統(tǒng)CNN模型單個卷積層通常采用單一尺寸的卷積核。由于機械裝備工況信息和故障信息的相互調(diào)制,工況變化會引起故障特征頻率以及尺度的改變。單一尺度的卷積核無法有效捕獲不同時間尺度下的故障特征表達,模型容易過擬合于特定工況訓練數(shù)據(jù)。受GoogLeNet中的Inception單元啟發(fā)[13],可以將多個不同尺寸的卷積核集成,對信號進行卷積操作和多尺度特征提取。不同卷積核的輸出最后被級聯(lián),傳送至下一層。其結(jié)構(gòu)如圖1所示,該模塊分別采用了1×1,1×3和1×5的卷積核。值得注意的是:① 較大的卷積核適用于機械信號中的時間尺度較大的慢變分量,而較小的卷積核則能更加有效地提取信號中的瞬態(tài)成分;② 通道級聯(lián)意味著不同尺度特征的融合;③ 使用1×1卷積核可以改變通道數(shù),降低特征維度;④ 模塊中通過嵌入最大池化操作,進一步增強模型魯棒性。
1.2 基礎(chǔ)網(wǎng)絡(luò)模型設(shè)計
基于上述Inception單元的多尺度特征提取,本文設(shè)計了一種多尺度卷積神經(jīng)網(wǎng)絡(luò),用于不同工況下的機械信號故障特征學習。網(wǎng)絡(luò)輸入為原始一維時域信號。CNN第一層作用類似于Gabor濾波器組,對原始信號在頻域的不同尺度上進行特征提取。鑒于此,網(wǎng)絡(luò)第一層采用16通道的1×128大尺寸卷積核,提取信號中體現(xiàn)故障本質(zhì)特征,如沖擊、諧波等信息,捕獲中低頻段低層特征[14]。然后,網(wǎng)絡(luò)包含兩個多尺度特征提取模塊。由于經(jīng)過第一層大尺寸卷積核的特征仍然具有較高維度,第一個多尺度特征提取模塊首先分別采用1×31和1×15的長卷積核,然后采用1×5卷積核提取抽象特征組合。第二個多尺度特征提取模塊采用了和Inception單元相同的參數(shù)設(shè)置。經(jīng)過前端的多尺度特征提取,可以獲取原始信號在深度模型中的特征嵌入。然后,采用全局平均池化(Global Average Pooling, GAP)對特征嵌入進行降維,并與輸出層進行全連接,輸出裝備健康狀態(tài)識別結(jié)果。所設(shè)計的網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)如圖2所示。
2 深度嵌入度量學習故障診斷方法
2.1 深度嵌入度量損失優(yōu)化
為了進一步建立對未知工況數(shù)據(jù)魯棒的故障診斷模型,需要誘導深度網(wǎng)絡(luò)學習具有強判別性和泛化能力的故障特征表示。本文考慮在深度特征嵌入空間下引入度量學習方法。利用已知工況訓練數(shù)據(jù)和機械健康狀態(tài)監(jiān)督信息,優(yōu)化得到新的特征嵌入空間,使得同類樣本特征之間距離縮小,不同類樣本特征差異增大。
在度量學習方法中,損失函數(shù)設(shè)計至關(guān)重要,其中,三元組損失應(yīng)用較為廣泛[15]。所謂三元組,即為包含錨點樣本(anchor, xai)、正樣本(positive, xpi)和負樣本(negative, xni)的樣本組(xai,xpi,xni)。其中,xai與xpi為同類樣本,xai與xni不屬于同類樣本。通過構(gòu)造上述三元組,并輸入到深度學習模型中,獲得高維空間下的深度特征嵌入(f(xai),f(xpi),f(xni)),其中f(?)表示將原始樣本映射到特征嵌入空間的函數(shù)。模型優(yōu)化將縮小f(xai)與f(xpi)的類內(nèi)距離,擴大f(xai)與f(xni)的類間距離。該過程可以表示為:
式中 α表示間隔參數(shù),保證三元組中類間距離大于類內(nèi)距離。
對于給定訓練數(shù)據(jù),可以構(gòu)造三元組集合,三元組損失定義如下:
式中 Ntr為三元組個數(shù)。
本質(zhì)上,對于特定機械健康狀態(tài),工況變化致使的數(shù)據(jù)分別漂移可視為樣本的類內(nèi)差異?;诖耍谏疃忍卣髑度肟臻g下考慮三元組損失優(yōu)化可以有效降低工況變化對特征分布的影響,建立決策邊界泛化的診斷模型,優(yōu)化過程如圖3所示。
如何構(gòu)造合適的三元組對于模型訓練至關(guān)重要。對于遍歷得到的三元組集合中,可以分為以下三類:① 簡單三元組(Easy triplets):自然滿足式(1);② 半難三元組(Semi?hard triplets):由下式定義:
③ 困難三元組(Hard triplets):由下式定義:
簡單三元組對應(yīng)的損失函數(shù)值為0,因此將忽略此類三元組,重點優(yōu)化半難和困難三元組度量距離損失。
2.2 深度嵌入度量網(wǎng)絡(luò)
在MCNN中考慮上述三元組損失,本文所提的DEMN模型結(jié)構(gòu)如圖4所示。通過多尺度特征提取,獲得原始信號的深度特征嵌入,隨后分別計算由分類器模塊輸出的交叉熵損失與三元組度量損失。網(wǎng)絡(luò)總體損失函數(shù)定義如下:
式中 Lc為交叉熵損失項;Lt為三元組度量損失項,Lweight為網(wǎng)絡(luò)參數(shù)正則化項,用以約束模型復(fù)雜度,避免過擬合;λ和μ為平衡系數(shù),統(tǒng)一取0.01;θ為模型參數(shù)。交叉熵損失計算公式如下:
式中 N表示訓練樣本個數(shù);Nc表示裝備健康狀態(tài)類別個數(shù);(xi,yi)為訓練樣本和對應(yīng)的健康狀態(tài)標簽;P(y?i=j|xi)為網(wǎng)絡(luò)輸出層預(yù)測樣本xi屬于第j類健康狀態(tài)的概率。
2.3 度量間隔參數(shù)尋優(yōu)
度量損失優(yōu)化目標中雖然只有間隔參數(shù)α需要設(shè)定,但其選擇直接影響模型性能。因此,本文利用粒子群算法(Particle Swarm Optimization, PSO)進行自適應(yīng)參數(shù)尋優(yōu)。
一般而言,適應(yīng)度函數(shù)可以選用測試集樣本準確率。由于跨工況故障診斷問題中的目標工況樣本未知,需要利用已知訓練數(shù)據(jù)構(gòu)造適應(yīng)度函數(shù)指導參數(shù)尋優(yōu)??紤]到度量損失優(yōu)化目標中的類內(nèi)差異縮小、類間距離擴大可以有效降低模型分類診斷的不確定性,在交叉驗證意義下,利用訓練集樣本健康狀態(tài)概率分布的信息熵作為PSO算法的適應(yīng)度函數(shù)。計算公式如下:
2.4 跨工況故障診斷方法流程
提出的深度嵌入度量學習故障診斷方法流程如圖5所示,詳細實驗步驟如下:
(1) 利用振動傳感器獲取機械裝備關(guān)鍵部件處的振動信號,并進行降噪、歸一化等預(yù)處理。將振動信號切割成固定大小的樣本,為輸入DEMN做準備。
(2) 將已知工況條件下的數(shù)據(jù)用于模型訓練。待模型訓練完畢,測試樣本為布署場景監(jiān)測數(shù)據(jù)。實際布署場景運行工況未知,假設(shè)不同于訓練數(shù)據(jù)來源工況。
(3) 利用一維多尺度卷積神經(jīng)網(wǎng)絡(luò)進行原始數(shù)據(jù)自適應(yīng)特征提取,獲取深度特征嵌入。
(4) 利用PSO算法對三元組損失中的間隔參數(shù)進行尋優(yōu)。
(5) 基于獲取的最優(yōu)間隔參數(shù),在已知工況數(shù)據(jù)中訓練DEMN模型。
(6) 將目標工況下的測試樣本輸入訓練完成的模型中,得到故障診斷結(jié)果。
3 齒輪箱故障診斷實驗驗證
為了驗證本文提出的DEMN模型對機械跨工況故障識別的有效性與優(yōu)越性,以工業(yè)齒輪箱為對象,分別采用預(yù)診斷與健康管理 (Prognostics and Health Management, PHM) 協(xié)會公開的定軸齒輪箱數(shù)據(jù)[16]、清華大學故障診斷實驗室的HS?200行星齒輪箱數(shù)據(jù)[7]和HD?FD?03X轉(zhuǎn)子齒輪故障模擬實驗臺的行星齒輪故障數(shù)據(jù)進行實驗驗證和對比分析。
3.1 跨工況故障診斷實驗案例
PHM齒輪箱故障數(shù)據(jù)集:該數(shù)據(jù)集實驗裝置如圖6所示。齒輪箱為兩級直齒齒輪箱。齒輪箱振動信號由安裝在箱體上的加速度傳感器測量獲得。本文選取靠近輸出端的加速度信號進行分析。信號采樣頻率為66.67 kHz。經(jīng)過預(yù)處理切割的單個樣本包含4096采樣點。齒輪箱輸出軸轉(zhuǎn)頻分別為30,35,40,45和50 Hz。實驗采集了8種齒輪箱健康狀態(tài)下的運行數(shù)據(jù),包括健康和7種故障類型,詳細健康狀態(tài)描述見參考文獻[16]。
根據(jù)實驗輸入軸轉(zhuǎn)速,設(shè)計了3個跨工況故障診斷實驗E1~E3,如表1所示。以E1為例,表示利用40,45,50 Hz工況下的數(shù)據(jù)訓練模型,利用30,35 Hz工況下數(shù)據(jù)測試模型效果。
清華大學齒輪箱故障數(shù)據(jù)集:第二個案例基于作者開展的行星齒輪箱故障模擬實驗展開[7]。所采用的齒輪箱型號為HS?200減速機。該齒輪箱為單級行星齒輪結(jié)構(gòu),減速比為3.57。利用電機驅(qū)動齒輪箱,輸出端連接風力機風輪作為負載。齒輪箱振動信號由箱體上水平和豎直方向的加速度傳感器進行測量收集,信號采樣頻率為20 kHz。經(jīng)過預(yù)處理切割的單個樣本包含4096采樣點。實驗裝置如圖7所示。實驗采集了9個不同健康狀態(tài)的齒輪箱振動信號。齒輪箱健康狀態(tài)描述如表2所示。齒輪箱輸入軸轉(zhuǎn)速范圍為20~40 Hz,設(shè)計了2個跨工況故障診斷實驗E4和E5,如表1所示。
北京交通大學齒輪箱故障數(shù)據(jù)集:第三個案例數(shù)據(jù)來源于北京交通大學軌道交通智能檢測技術(shù)研究所的HD?FD?03X轉(zhuǎn)子齒輪故障模擬實驗臺。實驗裝置如圖8所示。齒輪箱由電機驅(qū)動,輸出端負載由制動加載器提供。實驗選取了齒輪箱上水平和豎直兩個方向的加速度信號進行分析,信號采樣頻率為20 kHz。經(jīng)過預(yù)處理切割的單個樣本包含2048采樣點。電機轉(zhuǎn)速為2000 r/min,負載分別為0,3和5 N。實驗對5種齒輪箱健康狀態(tài)進行識別,分別為健康,太陽輪磨損,行星輪斷齒,行星輪裂紋,行星輪點蝕。根據(jù)不同負載狀態(tài),設(shè)計了2個跨工況故障診斷實驗E6和E7,如表1所示。
3.2 模型參數(shù)及對比研究
本文提出的DEMN由MCNN基礎(chǔ)網(wǎng)絡(luò)和深度嵌入度量損失優(yōu)化模塊組成。其中MCNN結(jié)構(gòu)參數(shù)如圖2所示,包括前段的大尺寸卷積核、2個多尺度特征提取模塊以及分類模塊。除最后一層激活函數(shù)使用Softmax外,其余各層均使用LeakyReLU。為了避免模型過擬合,在卷積層后加入Dropout。深度嵌入度量損失優(yōu)化模塊無網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)。模型執(zhí)行框架為PyTorch,優(yōu)化器選擇SGD,學習率為0.001,批量大小為32個樣本,模型訓練終止策略采用Early Stopping,Patience選擇20。
為了驗證DEMN模型的優(yōu)越性,實驗選取了四種典型故障診斷模型進行對比研究。詳細介紹如下:① 基于大尺寸卷積核的CNN模型[14] (Deep CNN with Wide First?layer Kernels, WDCNN), 模型包含5個卷積層、5個池化層以及2層全連接,其中第一層卷積層采用大尺寸卷積核提高全局特征提取能力。② MCNN,為DEMN的基礎(chǔ)網(wǎng)絡(luò)。③ 殘差網(wǎng)絡(luò)[17] (Residual Network, ResNet),利用殘差結(jié)構(gòu)有效提高模型深度,增強模型故障特征學習能力,包含1個大尺寸卷積層,4個殘差學習單元,3個全連接層。每個殘差單元包含2層卷積。④ 膠囊網(wǎng)絡(luò)[18] (Capsule Network, CapsuleNet),包含一系列向量神經(jīng)元的膠囊結(jié)構(gòu),保證在特征映射中的時移不變性和特征表示中的同變性,在基于短時傅里葉變換時頻圖信號的軸承故障診斷中表現(xiàn)出良好的泛化能力。
3.3 實驗結(jié)果與討論
3.3.1 跨工況故障診斷實驗結(jié)果分析
各方法在7個跨工況診斷實驗中的故障識別結(jié)果如表3和圖9所示。每次結(jié)果為5次隨機實驗的平均值和標準差??梢钥闯?,所提DEMN在7個跨工況診斷實驗中均表現(xiàn)出最優(yōu)的識別精度。相比于基礎(chǔ)MCNN網(wǎng)絡(luò),考慮了深度嵌入度量損失優(yōu)化后,診斷準確率分別提高:19.2%,13.5%,5.2%,11.2%,13.2%,3.6%,7.3%。實驗結(jié)果表明:考慮度量學習優(yōu)化的深度特征嵌入具有更強的魯棒性和抗工況干擾能力。因此,本文方法在處理跨工況故障診斷問題時具有良好的泛化能力。此外,MCNN的整體表現(xiàn)優(yōu)于WDCNN,多尺度特征提取模塊可以學習不同工況下更加本質(zhì)的機械故障特征。對于另外兩種深度學習模型,ResNet和CapsuleNet平均診斷準確率均在80%附近,較WDCNN和MCNN無明顯優(yōu)勢,表明了現(xiàn)有深度學習模型在跨工況故障診斷問題中的局限性。
3.3.2 跨工況特征分布可視化
為了直觀解釋DEMN方法在跨工況故障診斷場景下的機理,本文利用t分布隨機鄰域嵌入(t?distributed Stochastic Neighbor Embedding, t?SNE)對深度特征嵌入空間向量進行降維,獲得不同工況、不同健康狀態(tài)下的數(shù)據(jù)特征分布。由于篇幅限制,僅對E1和E4展示特征分布可視化,結(jié)果如圖10和11所示,其中□表示已知工況下訓練樣本,×表示目標工況下的測試樣本。不同顏色代表齒輪箱不同健康狀態(tài)。
通過分析圖10和11可知:①在MCNN中,同類健康狀態(tài)的已知工況訓練樣本和目標工況測試樣本的特征分布出現(xiàn)明顯漂移,即模型在訓練樣本中學習的故障特征表示無法有效避免工況干擾。例如,圖10中狀態(tài)3和狀態(tài)4的訓練與測試樣本特征分布差異明顯,且測試樣本分布出現(xiàn)明顯混疊。②通過引入度量損失優(yōu)化,DEMN極大程度上縮小了已知工況數(shù)據(jù)特征分布的類內(nèi)距離、擴大了類間距離。相比于MCNN,同類訓練樣本的聚集性,以及不同類樣本的可分性得到進一步提升。③值得強調(diào)的是,DEMN有效消除了已知工況與目標工況樣本特征分布的漂移。在無目標工況數(shù)據(jù)參與模型訓練的前提下,基本實現(xiàn)遷移學習方法的預(yù)期目標。本質(zhì)上,在已知工況訓練數(shù)據(jù)特征嵌入空間下,類內(nèi)距離縮小、類間距離擴大可以有效增強模型故障特征判別能力,提升決策邊界泛化能力,進而降低工況變化對健康狀態(tài)映射關(guān)系的影響。
圖12采用混淆矩陣對DEMN診斷結(jié)果進行展示。以實驗E1為例,狀態(tài)4和狀態(tài)5的部分樣本被誤識別,這與特征分布可視化結(jié)果一致,即在目標工況下兩種健康狀態(tài)的測試樣本分布接近。總體而言,所提方法在齒輪箱跨工況故障診斷實驗中表現(xiàn)出較高的診斷精度和良好的泛化性能,具有較強的工程實際應(yīng)用價值。
3.3.3 間隔參數(shù)尋優(yōu)對診斷結(jié)果影響
進一步對間隔參數(shù)α的選擇進行討論, PSO算法種群數(shù)量為50,迭代次數(shù)為20,慣性權(quán)重為0.9,學習因子為0.5和0.3,間隔參數(shù)α的優(yōu)化區(qū)間為[0, 100]。在7個跨工況診斷實驗中,分別以人工設(shè)定的間隔參數(shù)和經(jīng)過PSO算法尋優(yōu)后的間隔參數(shù)進行模型訓練,得到的診斷結(jié)果在表4中給出??梢钥闯觯疚姆椒梢杂行нx取最優(yōu)間隔參數(shù),指導三元組構(gòu)建及深度模型訓練,所提DEMN均取得最高的診斷準確率。
3.3.4 不同噪聲環(huán)境下診斷結(jié)果分析
機械裝備運行工況復(fù)雜,外部噪聲往往對監(jiān)測數(shù)據(jù)造成干擾。因此,需要驗證本文方法在不同噪聲環(huán)境下的泛化性能。對測試樣本添加不同程度的高斯白噪聲,其信噪比(Signal?to?Noise Ratio, SNR)范圍為[0 dB, 30 dB],模型訓練樣本不變。以實驗E1和E4為例,基礎(chǔ)模型MCNN和所提DEMN結(jié)果對比如圖13和14所示。
測試樣本進一步加噪后,模型將同時面臨轉(zhuǎn)速、負載變化和噪聲的干擾。訓練樣本與測試樣本的分布漂移將進一步加劇??梢钥闯?,隨著噪聲水平的提高,兩種模型的精度都出現(xiàn)了不同程度的下降。相比于基礎(chǔ)模型MCNN,所提DEMN依然可以抵制一定程度的噪聲干擾,表現(xiàn)出較強的魯棒性。以實驗E4為例,隨著SNR降低,MCNN平均識別準確率持續(xù)降低。而在[10 dB, 30 dB]范圍內(nèi),DEMN表現(xiàn)穩(wěn)定,識別準確率超過91%。在2 dB的低信噪比場景中,MCNN和DEMN識別準確率分別為57.7%和80.4%,較無噪聲場景,模型精度下降比例分別為33.1%和17.5%,DEMN優(yōu)勢明顯。上述結(jié)果表明,基于度量學習優(yōu)化的深度特征嵌入空間在未知噪聲環(huán)境具有更強的泛化能力。
4 結(jié) 論
針對機械裝備工況變化致使的數(shù)據(jù)分布漂移問題,本文提出了一種深度嵌入度量學習的跨工況故障診斷方法。所提方法能夠利用已知工況數(shù)據(jù)構(gòu)建泛化診斷模型,解決機械裝備實際運行工況多變且缺乏相應(yīng)數(shù)據(jù)進行診斷模型訓練的難題。主要結(jié)論如下:
(1) 在深度特征嵌入空間下優(yōu)化度量學習損失,縮小特征類內(nèi)距離,擴大類間差異有利于構(gòu)建泛化決策邊界,降低工況變化對故障映射關(guān)系的影響,有效提高模型在跨工況故障診斷任務(wù)中的識別精度。
(2) 通過PSO算法對度量間隔參數(shù)進行尋優(yōu),指導三元組構(gòu)造及度量損失計算,增強網(wǎng)絡(luò)的判別性特征學習能力。
(3) 在三個齒輪箱故障診斷案例中,相較于現(xiàn)有深度學習模型,所提DEMN在目標工況和噪聲環(huán)境下取得了更優(yōu)的故障識別精度和泛化性能。
參考文獻
1周陳林, 董紹江, 李玲, 等. 滾動軸承多狀態(tài)特征信息的改進型卷積神經(jīng)網(wǎng)絡(luò)故障診斷方法[J]. 振動工程學報, 2020, 33(4): 854-860.
ZHOU Chenlin, DONG Shaojiang, LI Ling, et al. Method to improve convolutional neural network in rolling bearing fault diagnosis with multi-state feature information[J]. Journal of Vibration Engineering, 2020, 33(4): 854-860.
2李霽蒲, 黃如意, 陳祝云, 等.一種用于主軸軸承故障診斷的深度卷積動態(tài)對抗遷移網(wǎng)絡(luò)[J]. 振動工程學報, 2022, 35(2): 446-453.
LI Jipu, HUANG Ruyi, CHEN Zhuyun, et al. A deep convolutional dynamic adversarial transfer network for spindle bearing fault diagnosis[J]. Journal of Vibration Engineering, 2022, 35(2): 446-453.
3雷亞國, 賈峰, 孔德同, 等.大數(shù)據(jù)下機械智能故障診斷的機遇與挑戰(zhàn)[J].機械工程學報, 2018, 54(5): 94-104.
LEI Yaguo, JIA Feng, KONG Detong, et al. Opportunities and challenges of machinery intelligent fault diagnosis in big data era[J]. Journal of Mechanical Engineering, 2018, 54(5): 94-104.
4ZHAO R, YAN R, CHEN Z, et al. Deep learning and its applications to machine health monitoring[J]. Mechanical Systems and Signal Processing, 2019, 115: 213-237.
5KHAN S, YAIRI T. A review on the application of deep learning in system health management[J]. Mechanical Systems and Signal Processing, 2018, 107: 241-265.
6趙明. 變轉(zhuǎn)速下機械動態(tài)信息的自適應(yīng)提取與狀態(tài)評估[D]. 西安:西安交通大學, 2013.
ZHAO Ming. Adaptive dynamic information extraction and state evaluation for machinery under varying speeds[D]. Xi'an: Xi'an Jiaotong University, 2013.
7韓特. 基于深度遷移學習的旋轉(zhuǎn)機械故障診斷方法研究[D]. 北京:清華大學, 2020.
HAN Te. Research on fault diagnosis method for rotating machinery based on deep transfer learning[D]. Beijing: Tsinghua University, 2020.
8沈飛, 陳超, 徐佳文, 等. 基于時間遷移模型的旋轉(zhuǎn)機械實時故障診斷[J].儀器儀表學報, 2019, 40(10): 84-94.
SHEN Fei, CHEN Chao, XU Jiawen, et al. Time transfer model based rotating machine real-time fault diagnosis[J]. Chinese Journal of Scientific Instrument, 2019, 40(10): 84-94.
9YAN R, SHEN F, SUN C, et al. Knowledge transfer for rotary machine fault diagnosis[J]. IEEE Sensors Journal, 2019, 20:8374-8393.
10LU W, Liang B, Cheng Y. Deep model based domain adaptation for fault diagnosis[J]. IEEE Transactions on Industrial Electronics, 2017, 64(3): 2296-2305.
11ZHANG M, WANG D, LU W, et al. A deep transfer model with Wasserstein distance guided multi-adversarial networks for bearing fault diagnosis under different working conditions[J]. IEEE Access, 2019, 7: 65303-65318.
12CHEN Z, HE G, LI J, et al. Domain adversarial transfer network for cross-domain fault diagnosis of rotary machinery[J]. IEEE Transactions on Instrumentation and Measurement, 2020, 69(11): 8702-8712.
13Szegedy C, Ioffe S, Vanhoucke V, et al. Inception-v4: Inception-ResNet and the impact of residual connections on learning[C]. Proceedings of the AAAI Conference on Artificial Intelligence, AAAI 2017. Palo Alto, CA, USA, 2017: 4278-4284.
14ZHANG W, PENG G, LI C, et al. A new deep learning model for fault diagnosis with good anti-noise and domain adaptation ability on raw vibration signals[J]. Sensors, 2017, 17(2): 425.
15Schroff F, Kalenichenko D, Philbin J. FaceNet: a unified embedding for face recognition and clustering[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2015: 815-823.
16Alatat H, Siegel D, Lee J. A systematic methodology for gearbox health assessment and fault classification[J]. International Journal of Prognostics and Health Management, 2011, 2(1): 16-22.
17YANG B, LEI Y, JIA F, et al. A polynomial kernel induced distance metric to improve deep transfer learning for fault diagnosis of machines[J]. IEEE Transactions on Industrial Electronics, 2020, 67(11): 9747?9757.
18ZHU Z, PENG G, CHEN Y, et al. A convolutional neural network based on a capsule network with strong generalization for bearing fault diagnosis[J]. Neurocomputing, 2019, 323: 62?75.
Deep embedding metric learning for machinery fault identification across different working conditions
HAN Te 1 ?LIU Chao 2 ?SHEN Chang-qing 3SHI Hong-mei 4SI Jin 4JIANG Dong-xiang 2
1. Department of Industrial Engineering, Tsinghua University, Beijing 100084, China;
2. Department of Energy and Power Engineering, Tsinghua University, Beijing 100084, China;
3. School of Rail Transportation, Soochow University, Suzhou 215131, China;
4. Key Laboratory of Vehicle Advanced Manufacturing, Measuring and Control Technology of Ministry of Education, Beijing Jiaotong University, Beijing 100044, China
Abstract The complete training data under target working conditions are necessary for the traditional data-driven fault diagnosis methods of machinery. However, the actual working conditions of mechanical equipment are complicated and difficult to predict, and thus it is difficult to obtain sufficient training data. To solve this problem,this paper proposed a deep embedding metric net?work(DEMN)for mechanical fault identification across different working conditions. The proposed method uses the data underknown working conditions to learn robust feature representation, and then establish the generalized fault diagnosis model for the unseen working conditions. First, the deep embedding features of fault signal are extracted by the multiscale convolutional neural network(MCNN). Then, the triplet loss-based metric learning objective is optimized to enhance the discriminant ability of classification boundary. Particle swarm optimization(PSO)algorithm is executed to the search the optimal margin in triplet loss. By facilitating the intra-class compactness and the inter-class separability, the influence of working condition changes to fault relationship mapping is significantly reduced. The experimental results show that the proposed method presents superior accuracy and generalization performance in gearbox fault diagnosis across different working conditions.
Keywords fault diagnosis; gearbox; convolutional neural network; metric learning; across working conditions