胡若暉, 張 敏,2, 許文鑫
(1. 西南交通大學(xué) 機(jī)械工程學(xué)院,成都 610031;2. 軌道交通運(yùn)維技術(shù)與裝備四川省重點(diǎn)實(shí)驗(yàn)室,成都 610031)
軸承作為旋轉(zhuǎn)型機(jī)械中必不可少的零件之一,一旦發(fā)生故障將對機(jī)械正常運(yùn)行造成嚴(yán)重威脅[1]。合理分析軸承振動信號,對提前預(yù)警機(jī)械故障,減少機(jī)器維護(hù)成本有重要意義。Hu等[2]提出基于支持向量機(jī)的滾動軸承故障模式的識別方法,模型在不同軸承數(shù)據(jù)集上得到驗(yàn)證。Wen等[3]在大數(shù)據(jù)的基礎(chǔ)上,提出基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)的故障診斷方法,網(wǎng)絡(luò)在軸承數(shù)據(jù)集上得到較高故障識別準(zhǔn)確率。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)能高效提取信號數(shù)據(jù)特征,在軸承故障診斷中應(yīng)用廣泛[4-6]。在有大量標(biāo)簽的數(shù)據(jù)集上,智能故障診斷方法能取得良好的診斷效果。
但在軸承發(fā)生故障問題時,多數(shù)機(jī)械設(shè)備都無法提前收集充足的信號數(shù)據(jù)。常用轉(zhuǎn)速和常見故障類型的軸承數(shù)據(jù)容易收集,數(shù)據(jù)量較大;非常用轉(zhuǎn)速和罕見故障類型的軸承數(shù)據(jù)難以收集,數(shù)據(jù)量較少。軸承數(shù)據(jù)集間的樣本數(shù)量不平衡現(xiàn)象在工程問題中普遍存在,給軸承故障識別任務(wù)帶來巨大挑戰(zhàn)。僅有少量可用數(shù)據(jù)時,利用不同轉(zhuǎn)速下充足的軸承信號數(shù)據(jù)(即源域)訓(xùn)練模型,對未知標(biāo)簽的目標(biāo)信號(即目標(biāo)域)進(jìn)行預(yù)測,是應(yīng)對軸承振動信號稀缺的有效方法。但不同工況下測得的軸承振動信號特征概率分布存在差異,導(dǎo)致跨領(lǐng)域故障診斷準(zhǔn)確率較低。消除或縮小這種差異的方法稱為領(lǐng)域自適應(yīng),在訓(xùn)練與測試數(shù)據(jù)存在差異的情況下訓(xùn)練智能模型的方法,稱為遷移學(xué)習(xí)[7-8]。
遷移學(xué)習(xí)模型在語音識別和軸承故障診斷領(lǐng)域已有一定應(yīng)用。Fawaz等[9]提出適用于一維數(shù)據(jù)的遷移學(xué)習(xí)方法,通過試驗(yàn)得出對時序數(shù)據(jù)進(jìn)行遷移學(xué)習(xí),能保留信號完整的高頻和低頻特征,保持信號數(shù)據(jù)對時間的依賴性。Lu等[10]提出將最大均值差異應(yīng)用到軸承故障診斷中,用于解決振動數(shù)據(jù)分布差異問題。Wu等[11]將最大均值差異、卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)結(jié)合用于軸承故障診斷,在跨領(lǐng)域故障識別中取得良好的分類效果。以上方法都是將特征分布差異加入損失函數(shù)構(gòu)建的遷移學(xué)習(xí)網(wǎng)絡(luò),利用算法度量不同領(lǐng)域特征的分布概率固然能將源域和目標(biāo)域特征的差距縮小,但僅適配單個層或某些層特征的遷移方法無法徹底消除不同領(lǐng)域的特征差異。且將預(yù)訓(xùn)練模型和遷移學(xué)習(xí)模型分開訓(xùn)練,將復(fù)雜化網(wǎng)絡(luò)結(jié)構(gòu),增加模型計算代價和訓(xùn)練時間。為更徹底地實(shí)現(xiàn)軸承信號特征遷移,Wang等[12]提出將對抗領(lǐng)域自適應(yīng)網(wǎng)絡(luò)用于軸承故障診斷,可有效適配不同領(lǐng)域的標(biāo)簽數(shù)據(jù)特征。
但上述遷移學(xué)習(xí)模型的訓(xùn)練基于大量無標(biāo)簽?zāi)繕?biāo)域樣本,實(shí)現(xiàn)領(lǐng)域自適應(yīng)需要收集數(shù)量上與源域樣本平衡的目標(biāo)域數(shù)據(jù)。而實(shí)際中不同工況下的軸承振動數(shù)據(jù)量存在嚴(yán)重不平衡現(xiàn)象,導(dǎo)致難以適配不同領(lǐng)域的數(shù)據(jù)特征。Goodfellow等[13]提出生成式對抗網(wǎng)絡(luò),網(wǎng)絡(luò)能人為地生成訓(xùn)練所需的大量標(biāo)簽數(shù)據(jù),生成數(shù)據(jù)和真實(shí)數(shù)據(jù)具有極為相似的局部特征。Zhang等[14]提出用生成式對抗網(wǎng)絡(luò)實(shí)現(xiàn)一維振動信號的數(shù)據(jù)擴(kuò)充,模型在少量軸承信號數(shù)據(jù)集上得到驗(yàn)證。生成式對抗網(wǎng)絡(luò)能有效平衡源域與目標(biāo)域樣本的數(shù)量差距[15-17],但將其用于半監(jiān)督學(xué)習(xí)時[18]沒有采取領(lǐng)域自適應(yīng)手段,將忽略不同工況下的數(shù)據(jù)特征差異[19-20],導(dǎo)致特征分類準(zhǔn)確率下降。
綜上所述,為實(shí)現(xiàn)對軸承不同轉(zhuǎn)速下大量振動信號的有效利用,解決少量目標(biāo)域信號的故障模式識別問題,本文提出一種基于特征知識遷移的滾動軸承故障跨域診斷模型。模型采用深度生成式對抗網(wǎng)絡(luò)(deep convolutional generative adversarial networks,DCGAN)實(shí)現(xiàn)數(shù)據(jù)增強(qiáng),將少量目標(biāo)域標(biāo)簽信號擴(kuò)展到無限,以適應(yīng)網(wǎng)絡(luò)訓(xùn)練對數(shù)據(jù)的大量需求。把對抗領(lǐng)域自適應(yīng)網(wǎng)絡(luò)(domain-adversarial neural networks,DANN)運(yùn)用到軸承故障跨域識別中,將深度特征學(xué)習(xí)、領(lǐng)域自適應(yīng)和標(biāo)簽分類融合為一個訓(xùn)練過程,最小化不同工況下的數(shù)據(jù)特征差異,實(shí)現(xiàn)軸承故障模式跨域智能診斷。
在遷移學(xué)習(xí)任務(wù)中,X={0,1,…,L-1}是有充足標(biāo)簽數(shù)據(jù)源域空間DS中的L類標(biāo)簽集合,Y={0,1,…,L-1}是待測目標(biāo)域空間DT中可能的L類標(biāo)簽集合,DS和DT內(nèi)的數(shù)據(jù)服從兩種不同的數(shù)據(jù)分布。傳統(tǒng)故障診斷模型直接從源域提取標(biāo)簽特征,對目標(biāo)域數(shù)據(jù)進(jìn)行分類,這將默認(rèn)源域和目標(biāo)域標(biāo)簽具有相同的概率分布,忽略了兩種數(shù)據(jù)集間的差異。領(lǐng)域自適應(yīng)[21]要求尋找一種最優(yōu)算法將源域與目標(biāo)域特征映射到同一特征空間,即尋找一個分類器η使X→Y損失最小
RDT(η)=Pr(X,y)~DT[η(X)≠y]
(1)
式中:RDT(η)為理想分類器η損失值;y為樣本X的真實(shí)標(biāo)簽;η(X)為樣本X預(yù)測標(biāo)簽;Pr[·]為η(X)≠y的概率。
本文取源域?yàn)橛袠?biāo)簽數(shù)據(jù),目標(biāo)域?yàn)闊o標(biāo)簽數(shù)據(jù)和少量標(biāo)簽數(shù)據(jù)。源域與目標(biāo)域具有相同的標(biāo)簽空間,每種標(biāo)簽具有不同的邊緣分布概率,即源域與目標(biāo)域標(biāo)簽在原始空間中存在邊緣分布差異。遷移學(xué)習(xí)旨在利用領(lǐng)域自適應(yīng)方法,從源域和目標(biāo)域不平衡數(shù)據(jù)樣本間學(xué)習(xí)到具有領(lǐng)域不變性或領(lǐng)域相似性的標(biāo)簽特征,特征具有相同或相似的邊緣分布概率,將其用于目標(biāo)域無標(biāo)簽數(shù)據(jù)的標(biāo)定。
DCGAN受自由博弈論思想影響,由Alec等[22]提出。網(wǎng)絡(luò)實(shí)現(xiàn)了一個無限數(shù)據(jù)生成器,能夠模仿真實(shí)數(shù)據(jù)特征生成相似但不相同的假數(shù)據(jù)。網(wǎng)絡(luò)由生成器(Generator,G)和判別器(Discriminator,D)組成。模型結(jié)構(gòu)如圖1所示。
圖1 DCGAN結(jié)構(gòu)框架圖
在DCGAN中,生成器負(fù)責(zé)將空間中的隨機(jī)向量Z采樣為振動信號,判別器負(fù)責(zé)分辨信號的“真”與“假”。生成器要盡可能生成以假亂真的振動信號,模型損失均由判別器產(chǎn)生。在模型訓(xùn)練過程中,使用隨機(jī)梯度下降法進(jìn)行參數(shù)更新。通過將不同批次生成器中經(jīng)過上采樣的隨機(jī)向量取出,獲得大量充當(dāng)目標(biāo)域信號的偽樣本。
首先,將生成信號與真實(shí)信號傳入判別器,要求判別器盡可能區(qū)分真實(shí)與生成信號,即最大化目標(biāo)函數(shù)V(D,G)。其次,將生成信號打上真實(shí)標(biāo)簽傳入訓(xùn)練判別器,要求生成數(shù)據(jù)能欺騙判別器,即最小化目標(biāo)函數(shù)V(D,G)。V(D,G)的上升與下降形成對抗,網(wǎng)絡(luò)通過尋找二者之間的平衡,生成更為相似的信號數(shù)據(jù)。則需要優(yōu)化的目標(biāo)函數(shù)為
Ex~Pdata[logD(x)]+Ex~PG[log{1-D[G(Z)]}]
(2)
式中:D(x)為判別器判斷真實(shí)數(shù)據(jù)是否真實(shí)的概率;D[G(Z)]為判別器判斷生成信號是否真實(shí)的概率;Pdata為真實(shí)樣本分布;PG為向量Z的先驗(yàn)分布。
與其他遷移學(xué)習(xí)方法不同,DANN[23]側(cè)重于將領(lǐng)域自適應(yīng)嵌入特征學(xué)習(xí)過程中,使分類決策基于具有領(lǐng)域不變性或領(lǐng)域相似性的特征。訓(xùn)練得到的模型既能對目標(biāo)域進(jìn)行預(yù)測,又不受兩域特征差異的影響。對抗領(lǐng)域自適應(yīng)模型結(jié)構(gòu),如圖2所示。
圖2 DANN結(jié)構(gòu)框架圖
網(wǎng)絡(luò)由特征提取器、標(biāo)簽分類預(yù)測器和領(lǐng)域判別器組成。領(lǐng)域判別器負(fù)責(zé)判別數(shù)據(jù)來自源域還是目標(biāo)域。通過在特征提取器和領(lǐng)域判別器間加入梯度反轉(zhuǎn)層(gradient reversal layer,GRL),實(shí)現(xiàn)在最小化標(biāo)簽分類損失的同時,最大化領(lǐng)域分類損失,使隨機(jī)梯度下降變?yōu)樘荻取吧仙薄?/p>
故障標(biāo)簽分類損失度量了標(biāo)簽分類準(zhǔn)確性,其損失運(yùn)算可表示為
(3)
式中:yi為軸承樣本的二元標(biāo)簽;Gf(xi)為信號xi經(jīng)過特征提取器所映射的輸出;Gy[Gf(xi)]為故障標(biāo)簽經(jīng)Softmax函數(shù)的分類結(jié)果。
(4)
領(lǐng)域分類損失度量了領(lǐng)域自適應(yīng)效果的好壞,其損失運(yùn)算可表示為
(5)
式中:di為領(lǐng)域的二元標(biāo)簽;Gf(xi)為信號經(jīng)過特征提取器所映射的輸出;Gd[Gf(xi)]為領(lǐng)域標(biāo)簽經(jīng)Softmax函數(shù)的分類結(jié)果。
(6)
在分類問題中,使用Softmax作為分類器激活函數(shù)。網(wǎng)絡(luò)將目標(biāo)域標(biāo)簽的分類損失和領(lǐng)域標(biāo)簽的分類損失考慮在內(nèi),模型損失函數(shù)由三部分組成
l=lc(DS,yS)+lc(DT,yT)+λId(DS,DT)
(7)
式中:lc(DS,yS)為源域信號的標(biāo)簽分類損失;lc(DT,yT)為目標(biāo)域生成數(shù)據(jù)的標(biāo)簽分類損失;ld(DS,DT)為領(lǐng)域判別損失;λ為領(lǐng)域損失項影響因數(shù)。
在梯度反轉(zhuǎn)層的作用下,網(wǎng)絡(luò)將損失項ld(DS,DT)最大化。經(jīng)對比測試,模型選擇領(lǐng)域損失項影響因數(shù)λ=0.3。
針對小樣本下軸承變工況故障診斷問題,本文提出DCGAN-DANN(deep convolutional generative adversarial networks and domain-adversarial neural networks)網(wǎng)絡(luò),實(shí)現(xiàn)過程如圖3所示。網(wǎng)絡(luò)有效利用梯度傳播方向,實(shí)現(xiàn)了具有兩次領(lǐng)域自適應(yīng)過程的遷移診斷模型。DCGAN和DANN功能互補(bǔ),前者為跨域特征遷移提供不可或缺的目標(biāo)域樣本數(shù)據(jù),后者利用源域數(shù)據(jù)表征目標(biāo)域特征,使故障分類基于包含多工況信息的特征空間。通過將二者結(jié)合,網(wǎng)絡(luò)實(shí)現(xiàn)了不平衡軸承數(shù)據(jù)集間的特征遷移,完成對小樣本信號的智能故障識別。
圖3 DCGAN-DANN數(shù)據(jù)傳導(dǎo)圖
首先將少量帶有標(biāo)簽的目標(biāo)域信號與空間中的隨機(jī)向量輸入DCGAN,持續(xù)輸出帶有標(biāo)簽的目標(biāo)域偽信號。DCGAN在生成器與判別器的梯度對抗中,將目標(biāo)域信號與空間中的隨機(jī)向量特征映射到同一空間。生成信號將基于目標(biāo)域信號的時序特征,繼承已知信號的標(biāo)簽。網(wǎng)絡(luò)能依據(jù)模型需要,生成與源域樣本數(shù)平衡的目標(biāo)域信號。
將源域標(biāo)簽信號、帶標(biāo)簽的目標(biāo)域偽信號和小樣本目標(biāo)域信號混合,作為DANN網(wǎng)絡(luò)的輸入。網(wǎng)絡(luò)通過混淆領(lǐng)域標(biāo)簽,將生成信號與源域信號特征映射到同一空間,自動適配不同領(lǐng)域的標(biāo)簽特征,對目標(biāo)域中未知標(biāo)簽信號的識別將基于來自源域和目標(biāo)域相似的信號特征。網(wǎng)絡(luò)領(lǐng)域自適應(yīng)與特征學(xué)習(xí)同時進(jìn)行,類別標(biāo)簽的識別將同時受到來自源域標(biāo)簽、目標(biāo)域偽標(biāo)簽和領(lǐng)域標(biāo)簽的影響。
基于DCGAN-DANN網(wǎng)絡(luò)的診斷流程,如圖4所示。首先通過深度生成式對抗網(wǎng)絡(luò)對目標(biāo)域振動信號進(jìn)行樣本擴(kuò)充。然后將生成的目標(biāo)域信號、目標(biāo)域真實(shí)信號和源域信號結(jié)合,劃分訓(xùn)練集和驗(yàn)證集,訓(xùn)練對抗領(lǐng)域自適應(yīng)網(wǎng)絡(luò)。最后在目標(biāo)域測試集上測試模型結(jié)果。
圖4 診斷流程圖
本試驗(yàn)所用數(shù)據(jù)為凱斯西儲大學(xué)(Case Western Reserve University,CWRU)電動機(jī)組滾動軸承數(shù)據(jù)集[24],試驗(yàn)平臺如圖5所示。
圖5 CWRU滾動軸承試驗(yàn)平臺
數(shù)據(jù)包括內(nèi)圈、滾動體和外圈3種故障類型振動信號。試驗(yàn)采用12 kHz驅(qū)動端滾動軸承數(shù)據(jù),數(shù)據(jù)取損傷直徑分別為0.117 8 mm和0.355 6 mm時采集的,包括正常條件的7類振動信號。試驗(yàn)在工作負(fù)載0、0.75 kW、1.50 kW和2.20 kW間劃分源域和目標(biāo)域,根據(jù)不同試驗(yàn)選取目標(biāo)域中不同長度振動信號作為有標(biāo)簽數(shù)據(jù),其余作為無標(biāo)簽測試數(shù)據(jù)。以負(fù)載1.50 kW采集的振動信號為例,數(shù)據(jù)描述如表1所示。
表1 2 HP振動信號數(shù)據(jù)結(jié)構(gòu)
試驗(yàn)所用DCGAN網(wǎng)絡(luò)結(jié)構(gòu)如表2所示。判別器由Discriminator構(gòu)成,生成器由Generator和Discriminator構(gòu)成,其邏輯關(guān)系為
表2 DCGAN架構(gòu)說明
G(x)=Discriminator[Generator(x)]
(8)
網(wǎng)絡(luò)按批次訓(xùn)練,其一個訓(xùn)練批次步驟如下。
步驟1以128個數(shù)據(jù)點(diǎn)為步長對目標(biāo)域有標(biāo)簽信號進(jìn)行重疊采樣,劃分為60個真實(shí)信號樣本,每個樣本均由1 024個數(shù)據(jù)點(diǎn)組成,隨機(jī)取10個樣本作為一個數(shù)據(jù)批次。
步驟2在隨機(jī)空間中生成一組形狀為(10,100)并服從正態(tài)分布的高斯噪聲,將噪聲上采樣為形狀(10,1 024,1)的信號數(shù)據(jù)。
步驟3將生成信號打上標(biāo)簽1,將真實(shí)信號打上標(biāo)簽0,在標(biāo)簽中加入隨機(jī)噪聲。
步驟4將生成信號與真實(shí)信號混合后代入訓(xùn)練判別器。
步驟5在隨機(jī)空間中生成一組形狀為(10,100)并服從正態(tài)分布的高斯噪聲,將這組向量打上標(biāo)簽0。凍結(jié)生成器中Discriminator權(quán)重,將隨機(jī)向量和標(biāo)簽代入訓(xùn)練生成器。
模型生成器和判別器均選用學(xué)習(xí)率為0.000 2的Adam為優(yōu)化器,選用binary_crossentropy為損失函數(shù)。通過在生成器中加入批量歸一化層,在判別器中連續(xù)使用Dropout層防止模型過擬合。特別的是網(wǎng)絡(luò)選用Leaky ReLU代替ReLU作為激活函數(shù),并在標(biāo)簽中加入噪聲,能有效防止模型崩潰現(xiàn)象。在網(wǎng)絡(luò)中不采用池化層,用卷積層代替全連接層,更有利于網(wǎng)絡(luò)學(xué)習(xí)到目標(biāo)域信號的局部特征。
模型每4個批次保存一次生成信號,每種標(biāo)簽生成2 500個樣本,取其中500個充當(dāng)目標(biāo)域數(shù)據(jù)。
對抗領(lǐng)域自適應(yīng)網(wǎng)絡(luò)結(jié)構(gòu),如表3所示。
表3 DANN架構(gòu)說明
首先,將源域信號以128個數(shù)據(jù)點(diǎn)為步長重疊采樣為每類標(biāo)簽500個樣本,每個樣本包含1 024個數(shù)據(jù)點(diǎn)。其次,將源域數(shù)據(jù)與經(jīng)過DCGAN網(wǎng)絡(luò)的生成數(shù)據(jù)結(jié)合并打亂,7類標(biāo)簽共計7 000個樣本。為最大化標(biāo)簽數(shù)據(jù)的利用,在總樣本中加入輔助偽樣本生成的少量目標(biāo)域樣本。經(jīng)重疊采樣,試驗(yàn)統(tǒng)一取目標(biāo)域真實(shí)樣本280個。按照9∶1劃分為訓(xùn)練集和驗(yàn)證集,未知標(biāo)簽?zāi)繕?biāo)域樣本作為測試集。最后,用訓(xùn)練集和驗(yàn)證集訓(xùn)練對抗領(lǐng)域自適應(yīng)遷移模型。
網(wǎng)絡(luò)優(yōu)化器選用RMSprop,選擇ReLU作為激活函數(shù),根據(jù)分類任務(wù)損失函數(shù)選用categorical_crossentropy。經(jīng)調(diào)試和對比后,網(wǎng)絡(luò)循環(huán)迭代次數(shù)選擇150次,批次大小選擇64。
為泛化地顯示模型遷移學(xué)習(xí)效果,分別做A→B、B→C、C→D、D→A、A→C和B→D 6組變工況遷移試驗(yàn)。詳細(xì)試驗(yàn)描述如表4所示。
表4 變工況遷移試驗(yàn)
試驗(yàn)取前一半目標(biāo)域信號為有標(biāo)簽數(shù)據(jù),后一半信號為無標(biāo)簽測試集數(shù)據(jù)。分別選取準(zhǔn)確率、精準(zhǔn)率、召回率和損失值作為模型衡量標(biāo)準(zhǔn)。每組試驗(yàn)進(jìn)行10次并取平均值,結(jié)果如表5所示。
表5 測試集10次試驗(yàn)平均精度
由表5可知,網(wǎng)絡(luò)在不同工況間跨域故障識別精度均能保持平均99%以上,網(wǎng)絡(luò)對7類標(biāo)簽有較強(qiáng)的區(qū)分能力。在源域與目標(biāo)域樣本數(shù)量不平衡時,模型仍能保持較高的故障標(biāo)簽識別率。
以試驗(yàn)A→B為例,模型精度和損失值變化如圖6所示。由圖6可知,隨著訓(xùn)練批次的增加,故障標(biāo)簽分類器訓(xùn)練集精度和驗(yàn)證集精度不斷上升,在40個批次逐漸接近100%并趨于平穩(wěn),說明本試驗(yàn)?zāi)P椭饾u學(xué)習(xí)到7類標(biāo)簽的信號特征,且能夠正確依據(jù)特征判斷故障標(biāo)簽。領(lǐng)域判別器精度同樣逐漸接近100%,在反向梯度層的作用下,領(lǐng)域判別器精度越高,說明模型越分不清數(shù)據(jù)來自源域還是目標(biāo)域,證明網(wǎng)絡(luò)成功將源域和目標(biāo)域特征投射到同一特征空間中。模型損失由三部分構(gòu)成,從損失圖可以看出,模型總損失隨著訓(xùn)練批次的增加逐漸下降,模型不斷向減小源域與目標(biāo)域差異的方向進(jìn)行參數(shù)更新。
圖6 分類精度損失變化圖
將試驗(yàn)A→B目標(biāo)域未知標(biāo)簽測試集數(shù)據(jù)識別結(jié)果顯示在混淆矩陣中,如圖7所示。0~6分別代表了正常和6種故障類型(故障直徑為0.177 8 mm和0.355 6 mm的內(nèi)圈、滾動體和外圈故障),縱坐標(biāo)表示真實(shí)標(biāo)簽,橫坐標(biāo)表示預(yù)測標(biāo)簽。由圖7可知,除了1%的0.355 6 mm滾動體故障被誤診為0.177 8 mm滾動體故障外,其余標(biāo)簽識別準(zhǔn)確率均為100%,說明模型能對無標(biāo)簽測試集信號6類故障進(jìn)行準(zhǔn)確識別。
圖7 混淆矩陣
為清晰展示模型的自適應(yīng)過程,分別對沒有經(jīng)過領(lǐng)域判別器和經(jīng)過領(lǐng)域判別器的分類結(jié)果做t-SNE(t-distributed stochastic neighbor embedding)降維[25]處理。t-SNE通過將原始特征空間的樣本映射到二維空間來可視化高維數(shù)據(jù),結(jié)果如圖8所示。
圖8 領(lǐng)域特征t-SNE可視化
由圖8(a)可知,出源域與目標(biāo)域特征只有小部分重合;由圖8(b)可知在經(jīng)過對抗領(lǐng)域自適應(yīng)網(wǎng)絡(luò)后,源域與目標(biāo)域數(shù)據(jù)有大部分被投射到同一區(qū)域。結(jié)果說明不同工況下的軸承振動信號特征存在一定差異,對抗領(lǐng)域自適應(yīng)網(wǎng)絡(luò)能有效降低特征邊緣分布和聯(lián)合分布差異對跨領(lǐng)域標(biāo)簽分類的影響,網(wǎng)絡(luò)學(xué)習(xí)到來自源域和目標(biāo)域相似的信號特征。
為體現(xiàn)模型利用小樣本數(shù)據(jù)進(jìn)行遷移學(xué)習(xí)的優(yōu)越性,試驗(yàn)進(jìn)一步擴(kuò)大源域與目標(biāo)域樣本數(shù)量上的差距。取采樣頻率12 kHz工作負(fù)載0.75 kW下采集的振動信號數(shù)據(jù)為目標(biāo)域,1.50 kW振動信號數(shù)據(jù)為源域。分別取目標(biāo)域中前1/2、1/4、1/8和1/16個數(shù)據(jù)點(diǎn)作為有標(biāo)簽數(shù)據(jù),其余作為無標(biāo)簽測試集數(shù)據(jù),詳細(xì)試驗(yàn)數(shù)據(jù)描述如表6所示。
試驗(yàn)分別對本文提出的DCGAN-DANN模型與其他3種常用的深度遷移學(xué)習(xí)模型作對比,對比模型分別為DCGAN-CNN(deep convolutional generative adversarial networks-convolutional neural network)、CNN-Finetune(convolutional neural network-finetune)和基于最大均值差異的DDC(deep domain confusion)網(wǎng)絡(luò)。對比模型CNN與DCGAN-DANN特征提取器結(jié)構(gòu)完全相同。其中DCGAN-CNN訓(xùn)練集數(shù)據(jù)由3 150個目標(biāo)域偽樣本和250個目標(biāo)域真實(shí)樣本組成,CNN-Finetune和DDC預(yù)訓(xùn)練模型訓(xùn)練集數(shù)據(jù)由3 150個目標(biāo)域真實(shí)信號和3 150個源域信號組成,經(jīng)重疊采樣和隨機(jī)重復(fù)采樣獲得。無標(biāo)簽?zāi)繕?biāo)域數(shù)據(jù)均在模型測試時使用,每組試驗(yàn)進(jìn)行10次取平均值。
試驗(yàn)測得變工況模型診斷準(zhǔn)確率與其他遷移學(xué)習(xí)方法準(zhǔn)確率對比,如表7所示。從準(zhǔn)確率對比中可以看出,本文提出的DCGAN-DANN網(wǎng)絡(luò)在源域與目標(biāo)域樣本數(shù)量嚴(yán)重不平衡時,仍能以平均98.93%的準(zhǔn)確率識別故障標(biāo)簽。在樣本數(shù)量發(fā)生變化時,本模型準(zhǔn)確率波動幅度不大。相較其他遷移學(xué)習(xí)模型,有平均8.24%的準(zhǔn)確率提升。結(jié)果表明,與其他基于預(yù)訓(xùn)練模型的遷移算法相比,DANN讓特征學(xué)習(xí)和特征遷移同時進(jìn)行,相互影響的機(jī)制,更容易找到具有領(lǐng)域相似性的特征空間。DCGAN-CNN網(wǎng)絡(luò)準(zhǔn)確率波動幅度明顯,說明DCGAN網(wǎng)絡(luò)學(xué)習(xí)目標(biāo)域空間的全部特征同樣需要大量數(shù)據(jù)的支撐,偽樣本特征不能代表整個目標(biāo)域空間,小樣本目標(biāo)域信號不能完全代表所有目標(biāo)域信號,此時施加遷移學(xué)習(xí)手段能在較大程度上提升故障識別準(zhǔn)確率。
表7 不同算法準(zhǔn)確率對比
對比試驗(yàn)測試集準(zhǔn)確率變化如圖9所示。
圖9 對比試驗(yàn)準(zhǔn)確率對比
由圖9可知,隨著目標(biāo)域標(biāo)簽樣本數(shù)量的減少,本文模型仍保持較高的診斷準(zhǔn)確率,其他遷移學(xué)習(xí)方法出現(xiàn)了過擬合現(xiàn)象。說明在數(shù)據(jù)不足時,基于對抗的數(shù)據(jù)生成和遷移學(xué)習(xí)方法能有效緩解過擬合現(xiàn)象,提供較高準(zhǔn)確率的故障診斷結(jié)果,深度生成式對抗網(wǎng)絡(luò)能最大限度地利用有限的標(biāo)簽樣本。
為清晰地展現(xiàn)不同遷移學(xué)習(xí)模型的訓(xùn)練結(jié)果,以1/16試驗(yàn)為例,分別對原始信號數(shù)據(jù)、CNN-Finetune、DDC和DCGAN-DANN網(wǎng)絡(luò)最后一層隱藏層做t-SNE降維處理,將特征映射到二維空間中,可視化結(jié)果如圖10所示。由圖10可知,3種方法都能從原始分布中將故障類別分開,但CNN-Finetune網(wǎng)絡(luò)和DDC網(wǎng)絡(luò)不能完全克服特征邊緣分布差異,模型在可用樣本較少時容易出現(xiàn)負(fù)遷移現(xiàn)象。而本文提出的DCGAN-DANN模型完美地將每類標(biāo)簽投射到同一區(qū)域上,表現(xiàn)出明顯的聚簇性和可分性,足以說明本文提出的網(wǎng)絡(luò)在可用樣本較少時能可靠地進(jìn)行跨域故障診斷。
圖10 對比試驗(yàn)故障特征t-SNE可視化
滾動軸承在發(fā)生故障時難以收集充足振動信號,這在一定程度上限制了智能診斷模型在工業(yè)實(shí)際問題中的應(yīng)用。為充分利用不同工況下采集的軸承數(shù)據(jù)訓(xùn)練智能模型,應(yīng)用于工業(yè)現(xiàn)場問題,本文提出了一種基于特征知識遷移的滾動軸承跨域故障診斷模型。分別通過變工況遷移試驗(yàn)和變樣本數(shù)遷移對比試驗(yàn)證明了方法的有效性。當(dāng)可用數(shù)據(jù)較少時,該方法能可靠地提供用于模型訓(xùn)練的軸承數(shù)據(jù),并有效適配不同工況下的軸承振動信號特征,實(shí)現(xiàn)滾動軸承跨域故障識別任務(wù)。由試驗(yàn)結(jié)果可知,DCGAN-DANN網(wǎng)絡(luò)能人為地生成大量用于領(lǐng)域自適應(yīng)的替代樣本,模型在實(shí)際可用樣本極少時,仍能保持平均98.93%的故障跨域識別準(zhǔn)確率,均優(yōu)于對比的其他遷移學(xué)習(xí)模型。本文提出的故障診斷方法在工程問題中具有一定實(shí)用價值,向其他機(jī)械零件故障診斷擴(kuò)展將是今后的研究重點(diǎn)。