鄔娜, 王健, 楊建偉*, 呂百樂
(1.北京建筑大學機電與車輛工程學院, 北京 100044; 2.城市軌道交通車輛服役性能保障北京市重點實驗室, 北京 100044)
目前,旋轉機械正廣泛地用于航空航天、軌道車輛、重型裝備建造等重要的工程領域,這些領域都與國家的發(fā)展息息相關[1]。并且旋轉機械正逐漸走向智能化、自動化、多功能化,所以對其設計精度有著嚴格的要求。開展機械設備的狀態(tài)監(jiān)測、檢測、診斷和預測,從而使機械可以連續(xù)穩(wěn)定運轉,減少因機械停止而導致的經(jīng)濟損失和維修帶來的人工成本浪費,最重要的是降低重大事故發(fā)生的概率,在工業(yè)生產(chǎn)中起著舉足輕重的作用。設備的狀態(tài)可以通過對設備的故障診斷準確判斷出[2]。在旋轉機械設備中,滾動軸承又是最重要的部件之一,通常用來支撐旋轉體,減小摩擦力及保證回轉精度等[3]。并且由于長時間的旋轉,滾動軸承通常會有著各類故障產(chǎn)生,如磨損、變形等[4]。滾動軸承的受損輕則會影響機械設備的性能,重則會導致嚴重的工程問題發(fā)生[5]。所以,軸承的監(jiān)測及故障預測十分必要。在實際進行診斷任務中,由于軸承振動信號特點明確、便于獲取,所以軸承故障診斷大多以振動信號為待檢測樣本進行分析。對于變工況及小樣本條件下的軸承故障診斷方法主要有兩種。第一種是對振動信號處理的方法,如模態(tài)分解[6]、經(jīng)驗模態(tài)分解[7]、奇異值分解[8]等。Jin等[9]提出一種基于參數(shù)優(yōu)化變分模態(tài)分解(variational mode decomposition,VMD)和改進深度信念網(wǎng)絡(deep belief neural,DBN)的列車軸箱軸承微弱故障診斷方法。首先,將非線性收斂因子、Levy飛行理論和貪婪算法優(yōu)化理論引入灰狼優(yōu)化算法(grey wolf optimization,GWO)中,提出了一種基于混合策略的改進GWO算法,以提高算法性能,解決算法的局部最優(yōu)問題。其次,將改進的GWO應用于VMD參數(shù)的優(yōu)化,用于信號分解。并利用多尺度散射熵提取相關系數(shù)最大的模態(tài)分量的故障特征信息。最后,應用改進的GWO算法對DBN參數(shù)進行優(yōu)化,解決了參數(shù)設置問題,并將優(yōu)化后的DBN作為軸承弱故障診斷的模式識別算法。通過實驗對比分析,該方法能有效解決軸箱軸承微弱故障診斷問題,具有較高的診斷精度。李博文等[10]提出通過引入功率譜細化的思想改進小波包變換,再結合布谷鳥搜索(cuckoo search,CS)優(yōu)化反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡的診斷方法。首先,通過改進的小波變換對螺桿泵有功功率分解重構得到特征向量;其次,與瞬時流量、進口回壓等參數(shù)進行歸一化處理,作為BP神經(jīng)網(wǎng)絡的輸出層信息。最后,使用布谷鳥搜索尋優(yōu)得到BP神經(jīng)網(wǎng)絡的權值和閾值,建立CS-BP故障診斷模型;在與其他網(wǎng)絡進行對比實驗中發(fā)現(xiàn)所提網(wǎng)絡具有優(yōu)越性。李夢圓等[11]提出了一種基于鯨魚優(yōu)化算法的共振解調自適應軸承故障診斷方法。首先,利用鯨魚優(yōu)化算法,以峭度和包絡譜峭度構建的復合峭度為優(yōu)化目標,自適應地選擇帶通濾波器的中心頻率和帶寬參數(shù)。然后,利用優(yōu)化搜索得到的最佳中心頻率和帶寬對軸承故障信號進行濾波和分析。最后,對濾波后的信號進行包絡解調,提取故障特征頻率,判斷軸承故障類型。通過對模擬信號和軸承內(nèi)外圈故障信號的分析和診斷,可以證明該方法能夠滿足共振解調方法對共振頻率帶選擇的要求。陳志剛等[12]提出了一種基于蚱蜢優(yōu)化算法(gasshopper optimization algoithm,GOA)和優(yōu)化支持向量機(support vector machines,SVM)的視覺分子動力學(VMD)特征提取方法。故障診斷方法。首先,采用貪婪策略對滾動軸承的振動信號數(shù)據(jù)進行預處理,然后根據(jù)振動信號數(shù)據(jù)的變分模態(tài)分解得到多個本征模態(tài)函數(shù)(inrinsic modefunction,IMF)分量,接著計算每個IMF分量的能量和時頻特征,形成多模態(tài)特征矩陣,最后利用蚱蜢優(yōu)化算法優(yōu)化的支持向量機進行故障診斷和識別。最后,采用蚱蜢算法優(yōu)化的支持向量機來診斷和識別故障。通過實驗測試從大量數(shù)據(jù)中獲得的滾動軸承故障診斷結果表明,VMD-GOA-SVM不僅能識別滾動軸承的不同故障類型,而且與傳統(tǒng)方法相比具有更高的準確性和效率。
第二種為數(shù)據(jù)驅動的故障診斷方法,主要包括基于機器學習、深度學習和遷移學習方法。劉萬宇等[13]將第一層為寬卷積核的深度卷積神經(jīng)網(wǎng)絡(wide convolutional neural network,WDCNN)和深度長短時記憶網(wǎng)絡(deep long long short-term memory,DLSTM)相融合的模型(WDCNN-DLSTM)。WDCNN將傳統(tǒng)的CNN第一層卷積核尺寸加寬,提高了模型對一維振動信號中的空間特征信息的提取能力,DLSTM將多個LSTM模塊進行堆疊,提高了模型對一維振動信號中時序信息的提取能力。慎明俊等[14]針對滾動軸承退化數(shù)據(jù)的復雜性和傳統(tǒng)的壽命預測方法不能充分利用數(shù)據(jù)的相關性從而導致預測精度不高的問題,提出了一種基于融合深度置信神經(jīng)網(wǎng)絡(DBN)和長短時記憶神經(jīng)網(wǎng)絡(LSTM)的剩余壽命預測模型。該模型首先采用帶通濾波降噪對滾動軸承振動數(shù)據(jù)進行去噪,然后依據(jù)均方根特征和峭度特征在軸承全壽命周期內(nèi)的趨勢圖確定模型的預測起始點。其次利用優(yōu)化后的4層DBN網(wǎng)絡完成深度特征提取并用于LSTM的訓練與測試。陳科等[15]提出了一種多種深度學習模型決策融合的故障診斷分類方法,構建了基于卷積神經(jīng)網(wǎng)絡(convolutional neural networks,CNN)和改進堆棧去噪自動編碼器(stacked denoising autoencoders,SDAE)的混合網(wǎng)絡模型,并基于改進的(dempster-shafer,D-S)證據(jù)理論實現(xiàn)了決策級融合診斷。將時頻信號作為CNN的輸入,將頻域信號作為SDAE的輸入,使用Adam優(yōu)化算法以及dropout和批量歸一化技術對混合模型進行訓練。這些方法可自動提取振動信號的特征信息,也有著十分優(yōu)秀的準確率,在軸承故障診斷領域被廣泛使用。
上述方法在解決問題時也有著適用前提:①需要有足夠的待檢測樣本;②訓練數(shù)據(jù)與測試數(shù)據(jù)需滿足獨立分布[16]。然而在實際的工程當中,軸承的運轉是變載荷、變轉速的,不同的載荷及轉速會導致信號的幅值、脈沖間隔等數(shù)值發(fā)生改變。對振動信號的采集有一定干擾,導致故障診斷精度下降[17]。因此,在變工況條件下,僅靠單一的特征提取方法無法滿足變工況下的信號分析。針對變工況問題,主要有實例加權、特征遷移、特征適配等方法。并且,由于各試驗臺數(shù)據(jù)并不完全一致,從而有些特定故障類別的樣本的采集數(shù)量稀少,導致診斷效果較差。若對樣本進行單獨標注又會花費大量時間,并且在以后的診斷任務中可能不會再遇到相似類別,造成人力資源浪費。針對小樣本遷移問題,目前主要有參數(shù)遷移和域適配等方法?,F(xiàn)整理總結了近些年在變工況及小樣本遷移問題的診斷方法,總結其適用條件、所具備優(yōu)勢及不足、歸納現(xiàn)存問題并且對今后的研究方向進行展望,為后續(xù)研究提供一定思路。
Hinton等[18]提出了利用逐層貪婪預訓練和反向調優(yōu)來訓練深度神經(jīng)網(wǎng)絡(deep belief networks,DBN),解決了深度神經(jīng)網(wǎng)絡模型訓練的難題,并提出了深度學習概念[19];Krizhevsky等[20]提出利用模型并行ReLU,Dropout等訓練卷積神經(jīng)網(wǎng)絡(CNN),在ILSVRC—2012競賽上,大幅超越了傳統(tǒng)機器學習方法精度,開啟了深度學習的研究熱潮;Yosinski等[21]利用試驗研究了深度神經(jīng)網(wǎng)絡不同層的可遷移性,對深度遷移學習、提供了非常高的指導意義。Long等[22]提出將深度神經(jīng)網(wǎng)絡與多核最大均值差異(maximum mean discrepancy,MMD)進行多層聯(lián)合適配,是無監(jiān)督域適配領域經(jīng)典遷移學習方案之一。Ganin等[23]提出將深度神經(jīng)網(wǎng)絡與對抗訓練結合進行深度遷移學習,是無監(jiān)督域適配領域經(jīng)典遷移學習方案之一。中外學者在故障診斷中正泛使用遷移學習方法。黃健豪等[24]提出了一種基于核范式最大化和無監(jiān)督遷移學習(transfer learning,TL)的軸承故障診斷方法。該方法使用結構優(yōu)化的深度卷積神經(jīng)網(wǎng)絡(structure optimized deep convolutional neural networks,SOCNN)進行故障特征提取,利用最大均值差異(MMD)提升源域和目標域的分布相似度,并結合快速批核范式最大化(fast batch nuclear-norm maximization,FBNM)來提升目標域批量輸出矩陣的可分辨性和多樣性。丁津律等[25]提出將遷移學習的思想與卷積神經(jīng)網(wǎng)絡(CNN)相結合,以此解決目標域樣本不足導致訓練效果不佳的問題,同時利用主成分分析(principal component analysis,PCA)對時序數(shù)據(jù)進行精簡,提高運行率,形成配電網(wǎng)故障診斷方法。首先分析PCA和CNN的結構特征,模擬不同的故障情況,生成面向CNN的時間序列數(shù)據(jù)。然后通過最大均值差法(MMD)選擇最適合遷移的源域數(shù)據(jù),建立源域故障識別的預訓練模型。最后,利用目標域數(shù)據(jù),在預訓練模型的基礎上進行遷移微調訓練,得到故障診斷模型。
目前,遷移學習是滾動軸承故障診斷的有效方法。在軸承故障診斷過程中主要包括樣本不匹配問題、故障特征較弱問題、變工況導致的遷移效果不理想的問題。
遷移學習主要有實例加權、參數(shù)遷移、特征適配和域自適應等幾種方法。
參數(shù)遷移基于相關任務之間會共享一些相同的簇標簽[26],而相似任務之間會共享一些相同的簇標簽,對于不同任務間的相同簇標簽對應的模型參數(shù)應該是相似的,所以參數(shù)遷移方法指保證在其他數(shù)據(jù)上得到訓練的模型部分參數(shù)不變,調整另一部分參數(shù)已達到對滾動軸承進行故障診斷。參數(shù)遷移主要用于目標任務與原始任務數(shù)據(jù)分布較為相似,源域數(shù)據(jù)和目標域數(shù)據(jù)可以通過函數(shù)表示,并且函數(shù)之間存在某些共同的參數(shù),參數(shù)遷移方法就是尋找源域數(shù)據(jù)和目標域數(shù)據(jù)之間可以共享的參數(shù)信息從而使獲得的知識遷移。邵海東等[26]提出了一種自編碼網(wǎng)絡模型,首先通過現(xiàn)有數(shù)據(jù)理想數(shù)據(jù)對網(wǎng)絡預訓練,并借助少量訓練樣本對網(wǎng)絡參數(shù)調優(yōu),完成網(wǎng)絡優(yōu)化,從而提升小樣本下的網(wǎng)絡準確率。Shao等[27]利用在imageNet上預訓練的AlexNet模型,將振動信號轉為二維圖對網(wǎng)絡參數(shù)調優(yōu)處理,在小樣本情況下提升齒輪和軸承的診斷精度。Chen等[28]提出了可遷移卷積網(wǎng)絡模型,對網(wǎng)絡參數(shù)微調后構建出新的網(wǎng)絡模型,從而實現(xiàn)故障診斷。
特征適配方法指在源域和目標域間尋找典型特征弱化兩域之間的差異來減小源域和目標域數(shù)據(jù)特征分布差異,從而變工況下對知識的遷移應用。雷亞國等[29]受腫瘤靶向治療的啟發(fā),提出故障靶向遷移方法,過假設在目標域數(shù)據(jù)中存在少量的標簽數(shù)據(jù),稱為制導錨點,根據(jù)制導錨點與目標域對應關系,設置共享領域共享特征空間的靶向區(qū)域,最后通過規(guī)劃目標區(qū)域相靶向區(qū)域移動的制導路徑,即制導錨點沿設定的制導路徑“吸附”可對齊的待檢測數(shù)據(jù),并將其“帶至”靶向區(qū)域,共解決以下三個問題。
(1)標簽空間存在較大偏移且互相不對稱。采取措施:引入均值聚類算法,獲取目標域待診斷樣本與制導錨點在深層特征空間中的分布與聚集關系。在深度卷積神經(jīng)網(wǎng)絡模型(deep convolution neural network, DCNN)的迭代訓練過程中添加目標域樣本的聚類損失函數(shù)為
(1)
式(1)能夠迫使待診斷樣本逐漸向與之具有相同簇標簽的制導錨點聚攏,在擴大類間距離的同時,提升樣本與錨點之間的隨動性。
(2)設備數(shù)據(jù)特征分布存在差異。采取措施:①設置靶向區(qū)域,用不同健康狀態(tài)分割特征空間,目標域數(shù)據(jù)移動至對應靶向區(qū)域;②規(guī)劃制導路徑。
(2)
當?shù)趈個待診斷樣本與第i個源域樣本所在的靶向區(qū)域不同時,設置遠距離制導路徑ε→+∞,則特征靶向適配時規(guī)避該路徑??紤]到深層特征空間為單位超球面,樣本間的最長制導路徑為π,因此取ε=10>π。故障診斷流程如下。目標函數(shù)優(yōu)化步驟:①隨機初始化DCNN的模型參數(shù);②提取源域目標域深層特征,用目標域深層特征訓練k均值聚類模型,生成簇標簽并獲取關系矩陣Λ;③從源域與目標域數(shù)據(jù)中隨機抽取批訓練樣本,執(zhí)行交叉熵損失函數(shù)、聚類損失函數(shù)、源域目標域分布差異計算損失函數(shù),選用Adam優(yōu)化算法更新DCNN模型;④重復以上步驟,直至達到設定迭代次數(shù)或損失函數(shù)收斂。經(jīng)驗證,該模型有著十分優(yōu)秀的分類效果。Azamfar等[30]在網(wǎng)絡模型中使用最大均值差異MMD度量方法,提取數(shù)據(jù)的深層特征分布,從而獲得更好的分類精度。Michau等[31]將對抗網(wǎng)絡與遷移學習結合,構建域對抗遷移學習網(wǎng)絡,實現(xiàn)變工況下的滾動軸承故障診斷。
域自適應指源任務和目標任務相似,但是源域和目標域的數(shù)據(jù)分布不同,并且源域有大量的標記好的樣本,目標域只有非常少甚至沒有標記的樣本的遷移學習方法。域自適應主要有數(shù)據(jù)分布、特征選擇和特征變換等角度。
2.3.1 基于數(shù)據(jù)分布角度的域自適應
基于數(shù)據(jù)分布的域自適應前提條件是源域和目標域概率的分布應相似,最小化概率分布差異。
陳仁祥等[32]結合深度注意力機制構建出了一種遷移學習故障診斷方法(deep attention transfer learning,DATL),如圖1所示。
X為原始輸入信號;B為經(jīng)過兩次卷積池化操作后的信號;φ為權重矩陣;U為經(jīng)注意力機制學習后的新的特征;Y為網(wǎng)格生成器生成的采樣信號;V為采樣信號與特征U的乘積圖1 DATL網(wǎng)絡模型[32]Fig.1 DATL network model[32]
通過結合空間域與和通道域注意力機制各自的優(yōu)點,構建出結合空間和通道的注意力如圖2所示,卷積神經(jīng)網(wǎng)絡模型,并將每個通道的空間域信息進行空間變換,從而提取每個通道的關鍵信息,并對源域和目標域的數(shù)據(jù)進行相似度量適配,實現(xiàn)變工況條件下的滾動軸承的故障診斷。Lu等[33]采用自編碼網(wǎng)絡和MMD縮小源域和目標域數(shù)據(jù)的高維分布差異,從而提升遷移學習網(wǎng)絡模型的分類能力。Wen等[34]將源域和目標域的自相關頻譜特征輸入進行稀疏自編碼,并結合MMD損失函數(shù),從而提升網(wǎng)絡模型性能。雷亞國等[35]建立了一種遷移學習模型,將深度殘差網(wǎng)絡與領域適配正則項約束結合,該方法在無健康信息標記情況下仍然可以可有效地進行遷移學習診斷。Zhang等[36]提出了深度適配卷積神經(jīng)網(wǎng)絡診斷模型,利用MMD提升網(wǎng)絡對故障特征的分類能力,提高了滾動軸承故障診斷精度。Wang等[37]將遷移學習方法與殘差網(wǎng)絡、提取器及MMD相結合,對不同列樣本的特征進行相似度量,可有效提升變工況下的軸承故障診斷精度。Han等[38]在模型中引入了梯度反轉層,使網(wǎng)絡進行對抗訓練,通過生成器及判別器的對抗逐步提升網(wǎng)絡的診斷能力。Yang等[39]將遷移學習與多層特征適配和偽標簽學習方法結合,提升了模型的跨設備故障診斷能力。Li等[40]提出了一種多層域適配卷積神經(jīng)網(wǎng)絡,通過引入高斯核函數(shù)并構建損失函數(shù),對不同層的特征進行域適配,經(jīng)過試驗驗證,該網(wǎng)絡有更好的分類能力。Zhu等[41]提出了一種深度遷移學習卷積神經(jīng)網(wǎng)絡,在網(wǎng)絡中加入特征提取器并結合MMD度量方法,用以提升網(wǎng)絡在變工況下的故障分類能力。黃慶卿等[42]提出了多源域子域自適應(multi-source subdomain adaption network,MS-SAN)方法。將源域及目標域數(shù)據(jù)映射到公共特征空間并結合MMD方法實現(xiàn)域自適應最終得到故障診斷結果,在不同工況數(shù)據(jù)的驗證下有著較好的精確度。
圖2 空間注意力機制模塊[32]Fig.2 Spatial attention mechanism[32]
2.3.2 基于特征選擇角度的域自適應
通過提取源域和目標域共享某些特征,選出該部分公共特征并作為模型輸入從而實現(xiàn)基于特征選擇的域自適應。Tang等[43]將長短時記憶網(wǎng)絡(LSTM)與熵增比(entropy gain ratio,EGR)方法結合,建立了熵增益比與半監(jiān)督可轉移長短時記憶網(wǎng)絡(EGR-semi-supervised transferable LSTM,EGR-STLSTM)。首先,ERG專門用于評估旋轉機械特征提取的多域特征。然后,將最優(yōu)特征子集輸入半監(jiān)督可轉移長短時記憶網(wǎng)絡(STLSTM),以獲得預訓練網(wǎng)絡。最后,將半監(jiān)督遷移學習策略(即借助少量目標標注樣本)應用于預訓練模型,從而在目標任務中獲得有競爭力的性能。所提出的EGR-SSTTLM網(wǎng)絡充分利用了旋轉機械的振動特性,并保留了從源領域獲得的專業(yè)知識。利用軸承試驗臺和齒輪箱試驗臺的原始振動信號對故障診斷方法進行了驗證。實驗結果表明,與眾所周知的方法相比,所提出的方法通過重復使用預訓練模型顯著提高了診斷性能,并減少了在多變工況下對大量標注樣本的需求。郭亮等[44]提出了一種跨數(shù)據(jù)集的變工況軸承故障診斷方法。該方法源域數(shù)據(jù)集為實驗室條件下獲取的帶標簽的數(shù)據(jù)集,采用帶領域適配正則約束項的一維卷積神經(jīng)網(wǎng)絡進行特征知識的深度遷移適配,進而訓練模型,最后將在實際工作環(huán)境中測得的數(shù)據(jù)作為目標域進行測試模型,實驗結果驗證了該方法的有效性。Yu等[45]提出一種保留部分特征的診斷方法,該方法通過故障敏感性以及故障特征相關性進行特征選擇,實現(xiàn)故障診斷,經(jīng)過跨設備數(shù)據(jù)試驗驗證了所提方法的可行性。王琦等[46]提出了一種基于一維卷積神經(jīng)網(wǎng)絡遷移學習的滾動軸承故障診斷方法。首先,將采集到的軸承信號按不同工況分為源域和目標域,對源域數(shù)據(jù)進行標注,對目標域數(shù)據(jù)進行部分標注。其次,建立一維卷積神經(jīng)網(wǎng)絡模型并初始化模型參數(shù),用源域數(shù)據(jù)預訓練一維CNN模型并保存預訓練模型,然后將源域和目標域數(shù)據(jù)分別輸入預訓練模型。使用MMD度量預訓練模型中每個卷積層和全連接層上源域數(shù)據(jù)和目標域數(shù)據(jù)的特征分布距離,然后根據(jù)計算出的特征分布距離判斷預訓練模型中的卷積層和全連接層是否遷移,如果沒有遷移,則初始化該層,完成CNN模型。模型構建完成后,利用目標域中帶有標記的部分數(shù)據(jù)對模型進行訓練,得到遷移學習模型,并利用該模型對目標域中的所有數(shù)據(jù)進行分類和識別。故障診斷流程如圖3所示。通過兩個數(shù)據(jù)集對所提網(wǎng)絡進行試驗驗證,分別為凱斯西儲大學(case western reserve university,CWRU)的軸承故障數(shù)據(jù)集[47]和HZXT-DS-001型雙跨綜合故障模擬實驗臺數(shù)據(jù)集(圖4),軸承型號為NSK6038深溝球軸承,運行狀態(tài)包括正常、內(nèi)圈故障、滾動體故障和外圈故障。軸承故障實驗中,振動數(shù)據(jù)的采樣頻率設為8 kHz。其中,將CWRU數(shù)據(jù)集構建為5組,編號分別為A、B、C、D、E,將HZXT-DS-001實驗臺采集到的數(shù)據(jù)按CWRU數(shù)據(jù)集同樣本數(shù)量比例劃分,標號為F。以A組為源域數(shù)據(jù)集,其他組別為目標域數(shù)據(jù)集進行遷移實驗。經(jīng)過試驗驗證可知,基于一維CNN的遷移學習方法在5組遷移實驗中的平均準確率達到了99.72%且有一組實驗準確率為100%,兩組實驗準確率為99.99%,可以體現(xiàn)出該方法具有可行性及優(yōu)越性。
圖3 一維卷積神經(jīng)網(wǎng)絡遷移學習流程圖[46]Fig.3 One-dimensional convolutional neural network migration learning flowchart[46]
圖4 HZXT-DS-001實驗臺[46]Fig.4 HZXT-DS-001 laboratory[46]
2.3.3 基于特征變換角度的域自適應
基于特征分布的域自適應前提條件是源域和目標域在變換后共享某些子特征,并將兩個域變換到相同子空間,實現(xiàn)基于特征變換的域自適應。
Zhang等[48]在故障分類前將故障特征嵌入流行的子空間進行特征轉換,從而減少了域位移現(xiàn)象。劉海寧等[49]采用一維卷積神經(jīng)網(wǎng)絡將源域和目標域的邊緣分布和條件分布對齊后進行特征提取,用于變工況軸承故障診斷。王肖雨等[50]針對故障樣本距離分布不同對網(wǎng)絡的影響,提出了一種類內(nèi)散射正則化的網(wǎng)絡模型,將源域和目標域嵌入流行子空間并動態(tài)對齊流行特征后,結合類內(nèi)散度方法,在減少源域目標域分布差異后增加了相同類別聚集度,從而提升模型精度。
不同滾動軸承故障診斷遷移學習方法的優(yōu)缺點及特點如表1所示。
表1 遷移學習主要方法Table 1 Main methods of transfer learning
由于對實際工業(yè)生產(chǎn)過程中采集到的滾動軸承振動信號進行故障診斷所面臨的情況不同,如電機負載和轉速發(fā)生改變,采集樣本數(shù)目稀缺,不同數(shù)據(jù)間樣本類別不一致等問題。針對這些問題進一步闡述了不同情況下的遷移學習故障診斷方法。
針對樣本稀缺問題,郭盼盼等[51]提出了一種基于增強型卷積神經(jīng)網(wǎng)絡模型的滾動軸承多工況故障診斷方法。根據(jù)滾動軸承轉速和采樣頻率,計算軸承單圈故障信號長度,利用格拉姆角場(Gramian angular field,GAF)編碼技術對計算出的時域信號的完整信息進行編碼,生成相應的特征圖像,從而使神經(jīng)網(wǎng)絡學習時域信號的相關特征,并利用非對稱卷積網(wǎng)絡(asymmetric convolution,ACNet)對ConvNeXt模型的7×7深度進行編碼。非對稱卷積(ACNet)模塊用于重構ConvNeXt模型的7×7深度卷積層,以提高ConvNeXt模型的特征提取效率。接下來,改進ConvNeXt模型中的數(shù)據(jù)增強模塊和學習率衰減策略,提高ConvNeX模型在小樣本訓練下的泛化能力,從而建立增強型深度卷積神經(jīng)網(wǎng)絡模型IConvNeXt,如圖5[51]所示。
圖5 IConvNeXt模型結構Fig.5 IConvNeXt model
所提方法通過兩個數(shù)據(jù)集進行實驗驗證,分別是美國凱斯西儲大學(CWRU)的軸承故障數(shù)據(jù)集、東南大學的滾動軸承復合故障數(shù)據(jù)集和加拿大渥太華的變速軸承故障數(shù)據(jù)集,各數(shù)據(jù)集獨立進行故障診斷。經(jīng)過實驗驗證可知,所提網(wǎng)絡在三數(shù)據(jù)集上的診斷效果均高于對比網(wǎng)絡,證明所提方法具有優(yōu)越性及有效性。
Li等[52]采用dropout技術減少網(wǎng)絡參與的訓練參數(shù)。構建遷移卷積網(wǎng)絡診斷模型,使用源域數(shù)據(jù)集對模型進行訓練。根據(jù)目標域任務類別對網(wǎng)絡中softmax輸出替換為目標域任務類別數(shù)目,利用少量目標域訓練數(shù)據(jù)對網(wǎng)絡參數(shù)調優(yōu)。直至達到設定分類精度或迭代次數(shù),將測試樣本輸入到調優(yōu)的模型中,獲取診斷結果。王曉東[53]提出了從數(shù)字孿生到現(xiàn)實世界的故障診斷遷移方法,通過數(shù)字孿生模擬的虛擬實驗,用虛擬數(shù)據(jù)訓練網(wǎng)絡并將訓練后的網(wǎng)絡應用到實際任務中。張根保等[54]采用棧式稀疏自編碼器(spase autoencoder,SAE)和柔性最大值函數(shù)回歸進行的特征提取及分類。將遷移學習與H高階KL散度(high kullback-leibler,HKL)結合,構建SAE-HKL特征提取網(wǎng)絡和Softmax-HKL特征分類網(wǎng)絡用以獲得源域及目標域數(shù)據(jù)的共同特征,減少域間分布差異。胡向東等[55]提出了孿生域對抗遷移學習的方法,擴充故障樣本數(shù)量,減少正常樣本數(shù)量。通過域對抗方法進行對抗學習以降低樣本間的分布差異,利用孿生神經(jīng)網(wǎng)絡改進卷積層及池化層。采取重采樣方法,利用滾動軸承原始相鄰新號段有重疊的特征獲取訓練樣本。接下來利用m倍降采樣平衡正常樣本。雷春麗等[56]構建了一種基于一維殘差神經(jīng)網(wǎng)絡與擠壓與激勵網(wǎng)絡模型,將擠壓與激勵網(wǎng)絡(residual neural network,ResNet)嵌入一維深度殘差網(wǎng)絡中,構建殘差模塊,搭建改進的殘差網(wǎng)絡模型。將訓練好的模型參數(shù)遷移至目標域,通過少量樣本微調模型,最后得到適用于小樣本故障診斷的網(wǎng)絡模型。劉家瑞等[57]提出了基于孿生深度神經(jīng)網(wǎng)絡Siamse、一維卷積神經(jīng)網(wǎng)絡(one-dimensional, convolutional neural network,1-DCNN)與長短時記憶網(wǎng)絡(LSTM)siamese 1-DCNN-LSTM的診斷方法,提取數(shù)據(jù)時序數(shù)據(jù)局部特征和長期依賴特征,采用對比損失函數(shù)對網(wǎng)絡進行訓練,采用真實標簽進行微調,用真實故障樣本對全連接層參數(shù)進行微調,得到的網(wǎng)絡可以在僅有少量樣本的情況下,實現(xiàn)故障類型的判別。劉飛等[58]提出了短時傅里葉變換(short time Fourier transform,STFT)與偽色彩處理相結合。振動信號轉三通道圖像數(shù)據(jù)法,使用深度殘差網(wǎng)絡(deep residual network,ResNet)預訓練,采用低層網(wǎng)絡結構和參數(shù)凍結。結合遷移學習方法(transfer learning,TL),將其中某一工況下生成的TL-ResNet18的結構與參數(shù)固定,使用另一工況的訓練樣本對網(wǎng)絡參數(shù)微調,并在測試集上進行驗證試驗。
針對變工況導致的遷移效果不理想問題,楊青等[59]提出一種深度殘差變分自編碼器與自注意力機制相結合(deep resnet-variational auto encoder-self- attention mechanism,DR-VAE-SAM)的電機軸承故障診斷方法。首先,在數(shù)據(jù)預處理中使用矢量量化變分自編碼(VQ-VAE)對軸承故障數(shù)據(jù)進行增強,并將訓練完成后生成的故障樣本放回原始樣本中以平衡和增強數(shù)據(jù)集。然后將深度殘差網(wǎng)絡與變分自編碼器結合,增加了遷移學習中最大均值差異(MMD)作為融合標準提升網(wǎng)絡特征適配能力。最后,在編碼與解碼過程中結合自注意力機制最大化的保留特征的關鍵信息。所提方法流程如圖6所示。該方法通過西儲大學和東南大學的軸承數(shù)據(jù)進行試驗驗證,包括不平衡試驗、變工況實驗及泛化實驗。不平衡試驗結果表明提出的網(wǎng)絡與對比網(wǎng)絡相比具有更好的準確率。在變工況實驗中設置了9組遷移實驗,9組實驗均以融合工況數(shù)據(jù)為訓練樣本,以單一工況數(shù)據(jù)為測試樣本。研究結果表明,DR-VAE-AM模型能夠有效提高故障診斷精度,對于未參與融合的數(shù)據(jù)同樣有著良好的診斷能力,且DR-VAE-AM模型具有較好的泛化能力,體現(xiàn)出該方法的優(yōu)越性。夏懿等[60]提出了深度自適應網(wǎng)絡用于跨域條件下軸承故障診斷,提出聯(lián)合自適應網(wǎng)絡結構,結合MMD和wasserstein度量網(wǎng)絡對齊特征邊緣分布和域類別條件分布,從而提升針對無標簽數(shù)據(jù)的分類準確率。徐易蕓等[61]將遷移學習和相似性度量思想相結合。通過相關對齊損失計算變工況故障特征之間的相關性,最小化源域目標域間差異,并將輸入特征與中心特征相似性最大化,提高診斷準確性,減少非相關特征,從而提升模型準確率。吳靜然等[62]通過卷積神經(jīng)網(wǎng)絡進行特征提取,并使局部MMD和分類器最小化損失函數(shù)從而以統(tǒng)一相關子域的分布,用于變工況下的軸承故障診斷。董紹江等[63]利用連續(xù)小波變換將振動信號轉化為時頻圖,利用完成預訓練的Resnet-50網(wǎng)絡提取源域和目標域的共同特征,并利用局部MMD減小特征分布距離,減少域分布差異。祝道強等[64]提出了一種基于一維卷積神經(jīng)網(wǎng)絡的變負載適應軸承故障診斷模型,卷積結構使用小卷積核卷積層堆疊的形式,通過對輸入層進行隨機失活提高網(wǎng)絡對變負載的適應能力,并采用全局平均池化降低模型計算量和減輕過擬合程度。此外提出以兩種近鄰負載條件的軸承數(shù)據(jù)構成變負載數(shù)據(jù)集,驗證了軸承故障診斷的變負載適應性。Shen等[65]提出了一種動態(tài)聯(lián)合分布對齊網(wǎng)絡對條件分布和邊緣分布進行對齊。同時為了加權條件的最大差異,用偽標簽代替輸出標簽來改變條件分布的計算,通過這種方法可以減少條件分布距離,實現(xiàn)可變運行條件下的故障診斷。李偉等[66]提出了一種三層稀疏自動編碼器,并使用最大平均差作為損失值,以提取源域和目標域的共同特征,減少交叉工作條件造成的影響。郭俊峰等[67]利用信號在時頻域的信息,將思想振動信號轉換為時頻圖。并且該方法結合了有監(jiān)督的條件生成對抗網(wǎng)絡(conditional generative adversarial network,CGAN)模型利用條件信息將無監(jiān)督學習轉化為監(jiān)督學習生成多類別數(shù)據(jù)和條件梯度懲罰生成對抗網(wǎng)絡(conditional wasserstein GAN—gradient penalty,CWGAN-GP)模型的優(yōu)點,避免了樣本生成過程中的模式崩潰、梯度消失、收斂緩慢和訓練過程不穩(wěn)定。利用生成的高質量樣本進行數(shù)據(jù)集擴展和平衡,可以解決分類模型訓練過程中因數(shù)據(jù)集不平衡導致的故障分類精度低的問題。張曉彤等[68]提出了一種基于深度遷移特征選擇和平衡分布適應的提升機軸承智能故障診斷方法,該方法提取不同工況下的軸承振動信號的高維深度特征,構建深度特征子集,最后用平衡分布適應方法處理源域和目標域特征,從而減少域間分布差異。
圖6 DR-VAE-SAM方法流程圖[59]Fig.6 Flowchart of DR-VAE-SAM [59]
除上述滾動軸承故障診斷的遷移學習方法外,針對一些特定的問題進行了總結歸納,結果如表2所示。
表2 其他情況下的遷移學習方法Table 2 Transfer learning methods in other cases
如今,雖然遷移學習在滾動軸承故障診斷方面頗有成效,但仍有改進或優(yōu)化的空間,接下來應著重研究以下幾方面。
(1)多類型傳感器融合。在數(shù)據(jù)采集過程中,由于傳感器位置、振動幅值、噪聲大小不同將會導致傳感器之間測得信號不匹配,從而帶來許多問題。但多傳感器數(shù)據(jù)的采集可以得到多維度數(shù)據(jù)信息,因此多傳感器特征融合方法可以獲取到更為準確的特征,有助于提高故障診斷的準確率和魯棒性。并應結合多種傳感器類型,如加速度傳感器、溫度傳感器等。因此,多傳感器特征融合技術值得繼續(xù)研究。
(2)信號采集差異。由于不同實驗臺安裝傳感器的位置與安裝方式均有差異,導致即使是同一實驗臺上的不同傳感器采集到的振動信號也有差異,從而影響到最終故障診斷的結果,對遷移網(wǎng)絡也是一種考驗。
(3)實際工業(yè)數(shù)據(jù)整合。實際工程中,軸承的故障數(shù)據(jù)及類別有區(qū)別于實驗室數(shù)據(jù),且設備發(fā)生故障初期就會及時停止運行更換配件,這就造成了實際工程制造中采集數(shù)據(jù)主要為正常運行時采集的數(shù)據(jù),所采集的故障數(shù)據(jù)尤為稀缺。遷移學習方法雖然解決了跨數(shù)據(jù)集跨工況等問題,但直接用類別差異過大的數(shù)據(jù)訓練模型會導致準確率較低,且由于故障數(shù)據(jù)占所采集的數(shù)據(jù)中一小部分,難以準確找到采集到的正常數(shù)據(jù)與有故障數(shù)據(jù)的分界線,導致最終標注的故障類別與實際數(shù)據(jù)無法準確匹配。若直接用采集數(shù)據(jù)的數(shù)據(jù)訓練模型會導致模型很難提取故障特征,從而使模型學習到為正常運轉下的故障類別的特征,導致過擬合現(xiàn)象發(fā)生。因此該問題還值得繼續(xù)研究。
(4)復合故障判別。針對軸承的故障診斷研究大多為單一故障,但實際軸承故障基本為多種類型,并且不同故障類型之間的組合也會造成診斷網(wǎng)絡的訓練效果較差,從而導致網(wǎng)絡的準確率會大幅下降。因此,多故障類型的軸承故障診斷是一個值得研究的領域。
(5)模型輕量化。目前的網(wǎng)絡大部分過復雜,對于設備的要求過高,且實際工業(yè)生產(chǎn)中所面對的問題較多,需要設計出較為輕量且訓練迅速的網(wǎng)絡模型來面對日益增多的實際工業(yè)問題,所以,模型輕量化也是一個值得研究的方向。
(6)無標簽數(shù)據(jù)診斷。在實際工程問題中采集到的軸承信號通常為無標簽信號,并且軸承健康情況也難以簡單判斷,人工對信號進行標簽標注會浪費大量的人力,造成資源浪費。且直接對無標簽數(shù)據(jù)進行故障診斷也會導致診斷結果的可信度較低。因此,直接對實際問題中的一手數(shù)據(jù)進行故障診斷值得繼續(xù)深入探索。
(7)不同診斷目標的泛化性。目前,現(xiàn)有網(wǎng)絡通常只針對單一目標,無法做到變診斷目標的故障診斷。若解決這一問題,可以節(jié)省大量人力及物力資源,但這對網(wǎng)絡的特征適配能力是一個巨大的考驗,值得繼續(xù)研究。
遷移學習方法憑借優(yōu)秀的泛化能力在故障診斷領域大放異彩,但也面臨諸多挑戰(zhàn)。本文研究主要對滾動軸承故障診斷時不同類別的遷移學習方法和面對不同問題時的遷移學習方法兩個角度進行歸納總結。首先闡述了中外學者在故障診斷領域中提出的深度學習方法和信號處理方法,討論了所提方法的優(yōu)缺點及待改進的方向。接下來著重介紹遷移學習方法,按照不同類別的遷移學習方法介紹,重點介紹3種主要的遷移學習方法,并給出相關研究的典型實例加以分析。同時介紹了不同遷移學習方法的優(yōu)缺點及特點。并根據(jù)故障診斷時所面對的不同問題進行分類討論,介紹了針對滾動軸承故障診斷的遷移方法難點及相對應的解決方法。對兩種主要問題進行多種遷移方法的總結歸納,并給出詳實案例。除此之外還介紹了針對5種更為具體問題的遷移學習方法。最后對未來軸承故障診斷展望了多類型傳感器融合、信號采集差異、實際工業(yè)數(shù)據(jù)整合、復合故障判別、無標簽數(shù)據(jù)診斷、模型輕量化等方面的發(fā)展趨勢。以助于業(yè)界對目前應用于滾動軸承故障診的斷遷移學習方法及面臨問題有較為清晰的認知,對未來研究方向及思路有著一定參考價值。