顏丙生,劉兆亮,劉自然
(河南工業(yè)大學(xué)機(jī)電工程學(xué)院,鄭州 450001)
旋轉(zhuǎn)機(jī)械在現(xiàn)代工業(yè)領(lǐng)域中應(yīng)用廣泛[1]。滾動(dòng)軸承與齒輪作為旋轉(zhuǎn)機(jī)械的關(guān)鍵部件,一旦發(fā)生故障,可能會(huì)帶來(lái)巨大的經(jīng)濟(jì)損失甚至人員傷亡[2]。因此,對(duì)于滾動(dòng)軸承與齒輪箱的故障診斷具有重要的意義。
近年來(lái),深度學(xué)習(xí)在故障診斷領(lǐng)域的應(yīng)用取得了快速的進(jìn)步[3]。然而,基于深度學(xué)習(xí)故障診斷的成功依賴于兩個(gè)條件,一是模型訓(xùn)練需要大量的標(biāo)記樣本,二是訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)要具有相同的類別空間[4-5]。目前研究者更多關(guān)注的是小樣本下的機(jī)械故障診斷,主要包括數(shù)據(jù)擴(kuò)充、遷移學(xué)習(xí)。畢略等[6]將數(shù)據(jù)擴(kuò)充方法應(yīng)用于故障診斷來(lái)增加訓(xùn)練樣本的數(shù)量,提高了模型的診斷性能。李奇等[7]提出了一種基于遷移學(xué)習(xí)的故障診斷模型,解決了數(shù)據(jù)不平衡的問題,具有很好的前景。上述方法雖然可以解決小樣本下的故障診斷問題,但對(duì)于跨機(jī)械部件的故障診斷,即用一個(gè)機(jī)械部件的故障數(shù)據(jù)訓(xùn)練模型,用其他部件故障數(shù)據(jù)進(jìn)行故障診斷時(shí),還沒有相關(guān)研究。
近年來(lái),元學(xué)習(xí)方法受到廣泛關(guān)注,它可以提高模型對(duì)不同分類任務(wù)的泛化能力,更適用于小樣本下的分類問題。典型模型是FINN等[8]提出的模型不可知元學(xué)習(xí)(MAML),其目標(biāo)是尋找對(duì)任務(wù)變化敏感的初始模型參數(shù),實(shí)現(xiàn)用少量的標(biāo)記數(shù)據(jù)就能使模型參數(shù)更新到最優(yōu)的目的。LI等[9]提出一種基于MAML模型的元學(xué)習(xí)故障診斷方法,結(jié)果表明,該方法在復(fù)雜工況下解決小樣本故障分類問題上具有一定優(yōu)勢(shì)。綜上所述,基于元學(xué)習(xí)方法的故障診斷模型可以快速適應(yīng)新的故障類別,具有很強(qiáng)的泛化能力,可以將其應(yīng)用在跨機(jī)械部件的故障診斷問題上。
但基于MAML模型的元學(xué)習(xí)方法是將一維振動(dòng)信號(hào)轉(zhuǎn)換成二維形式再進(jìn)行特征提取,在轉(zhuǎn)換過(guò)程中原始序列中的空間相關(guān)性會(huì)遭到破壞而丟失一些與故障相關(guān)的有用信息,可能造成故障分類不準(zhǔn)確[10]。針對(duì)上述問題,本文提出一種基于元學(xué)習(xí)的多通道一維卷積神經(jīng)網(wǎng)絡(luò)(MC-1DCNNML)的故障診斷方法。建立多通道一維卷積模型(MC-1DCNN),充分提取故障特征而且直接將一維振動(dòng)信號(hào)輸入到模型中保留了信號(hào)的真實(shí)性,將元學(xué)習(xí)方法應(yīng)用到MC-1DCNN模型中,使模型可以快速適應(yīng)新的故障類別,實(shí)現(xiàn)跨機(jī)械部件的故障診斷。
(1)
(2)
跨任務(wù)的元優(yōu)化是通過(guò)隨機(jī)梯度下降實(shí)現(xiàn)的。式(3)為初始模型參數(shù)更新θ的方法,其中β代表元學(xué)習(xí)率。
(3)
圖1為MC-1DCNNML方法的整體故障診斷流程圖。分為數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)集構(gòu)建、模型的訓(xùn)練與測(cè)試4大部分。
圖1 MC-1DCNNML故障診斷流程圖
將綜合故障實(shí)驗(yàn)臺(tái)采集的故障數(shù)據(jù)預(yù)處理成四通道振動(dòng)信號(hào),并將其構(gòu)成元訓(xùn)練集與元測(cè)試集;然后將元訓(xùn)練集分成支持集與測(cè)試集用來(lái)對(duì)MC-1DCNN模型的訓(xùn)練,元測(cè)試集也分成支持集與測(cè)試集用來(lái)對(duì)MC-1DCNN模型的優(yōu)化與測(cè)試,最終實(shí)現(xiàn)故障診斷的目的。
將原始故障信號(hào)經(jīng)CEEMDAN算法分解后得到多個(gè)固有模態(tài)分量(IMF),并利用峭度最大化原則,篩選出故障信息明顯的IMF分量,構(gòu)成多通道振動(dòng)信號(hào),圖2為生成四通道信號(hào)流程圖。根據(jù)試驗(yàn)結(jié)果,本文選取峭度值大小前四的IMF構(gòu)成四通道信號(hào),其包含了原始信號(hào)不同頻率段的故障成分,可以更加全面挖掘振動(dòng)信號(hào)的故障特征信息。
圖2 生成四通道信號(hào)流程圖
CEEMDAN算法是在經(jīng)驗(yàn)?zāi)B(tài)分解算法(EMD)基礎(chǔ)上改進(jìn)的一種信號(hào)處理方法,它克服EMD算法模態(tài)混疊與端點(diǎn)效應(yīng),在故障診斷方向具有一定優(yōu)勢(shì)。因此,得到的多通道信號(hào)并不是傳統(tǒng)意義上的多傳感信號(hào),而是將信號(hào)經(jīng)CEEMDAN分解并篩選得到的多通道振動(dòng)信號(hào)。
圖3所示為創(chuàng)建的MC-1DCNN模型,它由多通道輸入層、一維卷積層、一維池化層、全連接層和分類層構(gòu)成。
多通道輸入層:該層的輸入為原始振動(dòng)信號(hào)經(jīng)CEEMDAN算法分解后篩選得到的四通道信號(hào),相比于單通道一維卷積模型(1DCNN),多通道輸入可以更加全面挖掘振動(dòng)信號(hào)的故障特征信息。
圖3 MC-1DCNN模型
一維卷積層:第一層卷積層有24個(gè)大小為32×1的卷積核,第二層卷積層有48個(gè)大小為3×1的卷積核,第三層卷積層有96個(gè)大小為3×1的卷積核,第四層卷積層有96個(gè)大小為3×1的卷積核。圖4為MC-1DCNN的卷積過(guò)程。卷積層的輸入特征為四通道信號(hào),各通道信號(hào)單獨(dú)進(jìn)行卷積操作提取特征信息,隨后將各通道得到的特征進(jìn)行融合,得到該位置的一維卷積輸出信號(hào),一維卷積層有效地實(shí)現(xiàn)了四通道信號(hào)特征提取與特征融合。
圖4 多通道卷積過(guò)程
一維池化層:采用最大池化方法,式(4)為采樣函數(shù)。
pi,m=maxqi,(m-1)s+n
(4)
式中,pi,m為第i個(gè)振動(dòng)信號(hào)Pi中第m個(gè)單元所對(duì)應(yīng)的采樣數(shù)值;qi,(m-1)s+n為卷積層中第i個(gè)卷積特征中的第(m-1)s+n個(gè)單元的數(shù)值;s為相鄰采樣窗口重疊部分的大小。
全連接層:將之前卷積和池化層提取的特征重新排成一列,式(5)為全連接層輸出結(jié)果。
δi=f(wipi+bi)
(5)
式中,i=1,2,…,k;δi為第i個(gè)輸出,共有k個(gè)輸出;wi和bi分別為第i個(gè)神經(jīng)元的權(quán)值和間值;f(x)為激活函數(shù)。
分類器層:選取Softmax分類器,可以直接完成多分類任務(wù)。
(6)
式中,p(i)為每一個(gè)輸出的概率,所有的p(i)之和為1;K為多分類問題的類別數(shù)。
在MC-1DCNNML模型中,將元學(xué)習(xí)策略引入到所提出的MC-1DCNN模型中來(lái)解決小樣本問題。目的是讓模型可以在幾次訓(xùn)練迭代下,用很少的數(shù)據(jù)快速適應(yīng)新的故障診斷任務(wù)。采用C-Way K-Shot方法對(duì)模型的性能進(jìn)行評(píng)估,具體來(lái)說(shuō),選擇C個(gè)類別,每個(gè)類別有K個(gè)不同實(shí)例用于模型的訓(xùn)練,然后用新的實(shí)例來(lái)測(cè)試與評(píng)估。
圖5 元學(xué)習(xí)過(guò)程
圖5為提出的MC-1DCNNML元學(xué)習(xí)過(guò)程。具體來(lái)說(shuō),該過(guò)程包括訓(xùn)練集任務(wù)Ti中支持集TrS與測(cè)試集TrQ兩個(gè)階段的優(yōu)化。
(7)
(8)
根據(jù)式(7),在經(jīng)過(guò)第m步更新之后,MC-1DCNNML模型參數(shù)更新至式(9)。
(9)
(10)
式中,LMC-1DCNNML為模型預(yù)測(cè)值和數(shù)據(jù)真實(shí)值之間的差距,優(yōu)化的目標(biāo)是通過(guò)最小化總損失LMC-1DCNNML來(lái)找到對(duì)于每個(gè)任務(wù)來(lái)說(shuō)都適合的模型參數(shù)。式(11)表示用元學(xué)習(xí)率β更新初始化參數(shù)θ:
θ=θ-β▽?duì)萀MC-1DCNNML(θi,TrQ)
(11)
在模型測(cè)試階段,通過(guò)測(cè)試集中的支持集對(duì)優(yōu)化過(guò)的模型參數(shù)θ進(jìn)行微調(diào),找到能夠在查詢集上實(shí)現(xiàn)精確故障分類的最優(yōu)模型參數(shù)θ′。
使用凱斯西儲(chǔ)大學(xué)(CWRU)軸承數(shù)據(jù)集和MFS實(shí)驗(yàn)臺(tái)中采集的軸承振動(dòng)數(shù)據(jù)和齒輪數(shù)據(jù)進(jìn)行試驗(yàn)。
從CWRU數(shù)據(jù)庫(kù)中選擇采樣頻率為12 kHz的數(shù)據(jù)來(lái)構(gòu)建數(shù)據(jù)集。選取了兩種位置、3種載荷條件、5種故障類別、4種故障大小的不同軸承條件下的振動(dòng)樣本。選取CWRU軸承的120個(gè)故障類別和每個(gè)類別的100個(gè)樣本來(lái)建立模型的訓(xùn)練集。軸承位置包含F(xiàn)E(風(fēng)扇端)和DE(驅(qū)動(dòng)端),故障類別包含BF(滾珠故障)、IF(內(nèi)圈故障)、N(正常)、OF-3、OF-6、OF-12,其中OF-3表示故障點(diǎn)在軸承外圈3點(diǎn)鐘方向,4種故障直徑分別為0.007、0.014、0.021和0.028 in的單點(diǎn)故障軸承。
圖7 MFS實(shí)驗(yàn)臺(tái)
在測(cè)試階段,用兩種不同振動(dòng)數(shù)據(jù)集來(lái)進(jìn)行驗(yàn)證,一個(gè)是軸承故障數(shù)據(jù),另一個(gè)是齒輪故障數(shù)據(jù),兩種振動(dòng)數(shù)據(jù)集都是在如圖7所示的MFS實(shí)驗(yàn)臺(tái)上進(jìn)行采集。
采集的軸承故障類別是正常(N)、滾珠故障(BF)、外環(huán)故障(OF)、內(nèi)環(huán)故障(IF)以及由滾珠故障和外環(huán)故障(B和OF)組成的復(fù)合故障。采集的齒輪故障類別是裂紋、健康、缺失、斷齒和磨損。表1為數(shù)據(jù)類型及規(guī)格。此外,為了確保實(shí)驗(yàn)結(jié)果的可靠性和準(zhǔn)確性,通過(guò)五次隨機(jī)分配的數(shù)據(jù)進(jìn)行了5次實(shí)驗(yàn)來(lái)驗(yàn)證結(jié)果。
表1 測(cè)試集數(shù)據(jù)類型及規(guī)格
3.2.1 小樣本下不同工況的故障診斷試驗(yàn)
機(jī)器工作中需要不同的工況條件,一個(gè)優(yōu)秀的模型能夠適應(yīng)不同工況條件的變化,為了驗(yàn)證所提出的MC-1DCNNML方法在小樣本下不同工況的模型診斷性能,進(jìn)行了一系列試驗(yàn)。試驗(yàn)數(shù)據(jù)選取凱斯西儲(chǔ)大學(xué)的驅(qū)動(dòng)端軸承數(shù)據(jù)作為試驗(yàn)的訓(xùn)練集與測(cè)試集。表2為構(gòu)建的軸承數(shù)據(jù)集A、B、C,為每個(gè)數(shù)據(jù)集選取50個(gè)樣本。模型在一個(gè)工作條件下訓(xùn)練,在新的工作條件下進(jìn)行測(cè)試,例如,A→B表示模型在數(shù)據(jù)集A上進(jìn)行訓(xùn)練,在數(shù)據(jù)集B上進(jìn)行測(cè)試。
表2 不同工況軸承數(shù)據(jù)集
所有試驗(yàn)都由C-Way K-Shot問題的分類任務(wù)展開。分別做5-Way1-Shot和5-Way5-Shot的不同工況試驗(yàn),即為每個(gè)任務(wù)提取了5個(gè)不同類別的故障數(shù)據(jù),每個(gè)故障類別包含1個(gè)或5個(gè)樣本,圖8為試驗(yàn)結(jié)果。
圖8 1-Shot、5-Shot試驗(yàn)結(jié)果
由圖8可知,在可變工況條件下的6個(gè)試驗(yàn)中,5-Shot的準(zhǔn)確率全部?jī)?yōu)于1-Shot的準(zhǔn)確率,這是因?yàn)槊總€(gè)故障類型5個(gè)樣本包含的故障信息更加全面,可以為模型提供更多方位的故障信息,增強(qiáng)了模型的泛化能力。還可以看出,用數(shù)據(jù)集B訓(xùn)練,用數(shù)據(jù)集A進(jìn)行測(cè)試的準(zhǔn)確率最高,可以達(dá)到99.62%,這是因?yàn)閿?shù)據(jù)集B與數(shù)據(jù)集A工況比較相似,且數(shù)據(jù)集B比數(shù)據(jù)集A更加復(fù)雜,用復(fù)雜的數(shù)據(jù)集訓(xùn)練可以增強(qiáng)模型的泛化能力;同理,用數(shù)據(jù)集A訓(xùn)練,用數(shù)據(jù)集C進(jìn)行測(cè)試的準(zhǔn)確率最低,這是因?yàn)橛孟鄬?duì)簡(jiǎn)單的數(shù)據(jù)集進(jìn)行訓(xùn)練,模型學(xué)習(xí)不到更加全面的故障信息,使模型的泛化能力降低。
將MC-1DCNNML模型與基線一維卷積神經(jīng)網(wǎng)絡(luò)模型(1DCNN)進(jìn)行對(duì)比試驗(yàn),由圖9可知,MC-1DCNNML方法的所有試驗(yàn)結(jié)果都明顯優(yōu)于1DCNN模型,且1DCNN模型準(zhǔn)確率隨工作條件的變化波動(dòng)較大,尤其是在C→A實(shí)驗(yàn)中,MC-1DCNNML模型的準(zhǔn)確率可以達(dá)到98.56%,比1DCNN模型高8.15%,可能是因?yàn)榭勺児r的數(shù)據(jù)分布不同,MC-1DCNNML是基于元學(xué)習(xí)理念的,可以從已知工況中獲取一般軸承故障信息,并將其應(yīng)用于新工況的故障診斷,但1DCNN模型結(jié)構(gòu)簡(jiǎn)單且樣本有限,提取的故障特征很少,難以正確分類新工況的不同故障。
圖9 對(duì)比試驗(yàn)結(jié)果
3.2.2 小樣本下跨機(jī)械部件的故障診斷試驗(yàn)
為了驗(yàn)證MC-1DCNNML模型在小樣本下的泛化性能,進(jìn)行跨機(jī)械部件的故障診斷試驗(yàn)。在訓(xùn)練階段,用凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)集作為訓(xùn)練集訓(xùn)練模型,為每個(gè)任務(wù)選取5個(gè)不同類別的故障數(shù)據(jù),每個(gè)故障類別包含1、3或5個(gè)樣本。在每個(gè)任務(wù)中,每類故障樣本為查詢集提供16個(gè)驗(yàn)證數(shù)據(jù),即對(duì)于每一個(gè)5-Way1-Shot任務(wù),它包含5個(gè)支持樣本和80個(gè)查詢樣本。
在測(cè)試階段,用MFS實(shí)驗(yàn)臺(tái)采集的軸承數(shù)據(jù)集和齒輪數(shù)據(jù)集進(jìn)行驗(yàn)證,圖10為試驗(yàn)結(jié)果。
圖10 新故障類別下分類準(zhǔn)確率
可以看出,當(dāng)模型在軸承數(shù)據(jù)集上進(jìn)行測(cè)試時(shí),5-Way1-Shot、5-Way3-Shot和5-Way5-Shot的故障診斷準(zhǔn)確率分別為83.24%、93.43%和95.12%。說(shuō)明用較少的標(biāo)記數(shù)據(jù)就可以訓(xùn)練出綜合性能較高的模型,隨著支持集樣本的增多,模型性能逐漸提高;當(dāng)測(cè)試集與訓(xùn)練集具有相同的類別空間和不同的概率分布時(shí),MC-1DCNNML模型具有良好的泛化性能。
此外,當(dāng)模型在齒輪數(shù)據(jù)集上進(jìn)行測(cè)試時(shí),5-Way1-Shot、5-Way3-Shot和5-Way5-Shot的故障分類準(zhǔn)確率分別為81.36%、91.68%和93.48%。相比于軸承數(shù)據(jù)集上測(cè)試的結(jié)果,在齒輪數(shù)據(jù)集上進(jìn)行測(cè)試準(zhǔn)確率相對(duì)較低,這是因?yàn)辇X輪測(cè)試集具有與訓(xùn)練集不同的類別空間和不同的概率分布,數(shù)據(jù)差異性相對(duì)較大,但準(zhǔn)確率最高可以達(dá)到93.48%,說(shuō)明MC-1DCNNML模型在小樣本情況下可以實(shí)現(xiàn)對(duì)不同機(jī)械部件的故障診斷。
3.2.3 對(duì)比試驗(yàn)
將MC-1DCNNML方法與基于元學(xué)習(xí)理論的MAML模型、傳統(tǒng)的1DCNN模型進(jìn)行了性能比較。從MFS試驗(yàn)臺(tái)上采集的數(shù)據(jù)集中選取10個(gè)、50個(gè)和100個(gè)標(biāo)記的故障樣本,用于對(duì)模型的訓(xùn)練與測(cè)試。圖11為5-Way5-Shot試驗(yàn)分類結(jié)果。
圖11 不同模型故障診斷結(jié)果
可以看出,MC-1DCNNML方法對(duì)比其他兩種方法均具有較高的準(zhǔn)確率,最高可以達(dá)到94.89%。當(dāng)只有10個(gè)已知故障樣本的情況下,1DCNN模型的分類準(zhǔn)確率僅為37.25%,隨著故障樣本的增多,分類準(zhǔn)確率逐漸提高;而基于元學(xué)習(xí)方法的兩個(gè)模型在故障樣本僅為10個(gè)的情況下,分類準(zhǔn)確率可以達(dá)到78%以上,MC-1DCNNML模型在齒輪數(shù)據(jù)集上的故障分類準(zhǔn)確率為81.27%,在軸承數(shù)據(jù)上的準(zhǔn)確率為83.28%,說(shuō)明MC-1DCNNML模型泛化能力更強(qiáng),更適用于跨機(jī)械部件故障診斷問題。
為了更加直觀的比較MAML和MC-1DCNNML兩個(gè)模型迭代訓(xùn)練后的特征提取能力,選取齒輪集測(cè)試結(jié)果進(jìn)行t-SNE特征可視化,對(duì)比圖12a、圖12b可以看出,MC-1DCNNML模型的特征分類更加集中,說(shuō)明分類效果更好,可分性更強(qiáng)。對(duì)于齒輪磨損和裂紋兩個(gè)故障類型,MAML模型的分類效果不如MC-1DCNNML模型好。
(a) MAML模型 (b) MC-1DCNNML模型
針對(duì)小樣本情況下的變工況特別是跨機(jī)械部件的故障診斷問題,提出一種基于元學(xué)習(xí)的多通道一維卷積神經(jīng)網(wǎng)絡(luò)的MC-1DCNNML模型,結(jié)論如下:
(1)將原始故障信號(hào)處理為多通道一維信號(hào)直接輸入到MC-1DCNN模型中,保證信號(hào)是真實(shí)的,且多通道信號(hào)包含了更多的故障信息成分,使模型可以學(xué)習(xí)到更多真實(shí)的故障信息,提高了模型的性能。
(2)通過(guò)使用3個(gè)不同成分的數(shù)據(jù)集,并與其他兩種神經(jīng)網(wǎng)絡(luò)模型進(jìn)行比較,結(jié)果表明,MC-1DCNNML模型具有更高的分類準(zhǔn)確率和泛化能力,更適用于小樣本情況下的變工況與跨機(jī)械部件的故障診斷問題。