陳纖 鄒龍慶 李明磊 唐友福 繆皓 韓吉程
(1.東北石油大學(xué)機械科學(xué)與工程學(xué)院 2.中國石油天然氣集團(tuán)有限公司工程和物裝管理部 3.大慶鉆探工程公司)
滾動軸承作為旋轉(zhuǎn)機械中的重要承載部件,通常工作在高速、重載、高溫、腐蝕的復(fù)雜惡劣工況下,容易產(chǎn)生磨損、剝落、斷裂等故障,輕則導(dǎo)致設(shè)備加工偏離有效指標(biāo),造成噪音污染、影響生產(chǎn)進(jìn)度及產(chǎn)品質(zhì)量,重則導(dǎo)致設(shè)備損壞,造成重大的經(jīng)濟損失。因此,開展有效的滾動軸承狀態(tài)監(jiān)測與故障診斷研究具有重要意義[1-2]。
目前廣泛應(yīng)用的深度學(xué)習(xí)算法在大數(shù)據(jù)分類和預(yù)測上具有明顯優(yōu)勢。但是由于長期積累的滾動軸承現(xiàn)場監(jiān)測信號往往是以未標(biāo)記的正常樣本為主的大數(shù)據(jù),故障樣本較少而且受噪聲及監(jiān)測誤差的影響,有用故障信息容易淹沒在正常樣本數(shù)據(jù)中,特別在變工況和不同場景下,數(shù)據(jù)集服從不同分布,難以訓(xùn)練出魯棒性好的診斷模型。因此,有必要研究一種基于少量標(biāo)簽樣本建立的可靠診斷模型,對目標(biāo)域數(shù)據(jù)進(jìn)行分類識別。據(jù)此引入遷移學(xué)習(xí)的概念,它是一種半監(jiān)督的學(xué)習(xí)算法,能夠?qū)崿F(xiàn)不同領(lǐng)域或任務(wù)之間的知識轉(zhuǎn)化。但遷移學(xué)習(xí)對數(shù)據(jù)的特征表達(dá)能力不如深度學(xué)習(xí),所建模型無法有效反映滾動軸承故障狀態(tài)的現(xiàn)實情況。為此,如何將深度學(xué)習(xí)和遷移學(xué)習(xí)進(jìn)行有機融合,建立互補的診斷模型是目前國內(nèi)外學(xué)者廣泛深入研究的熱點。YANG B.等[3]提出一種基于特征的遷移神經(jīng)網(wǎng)絡(luò),借助多層域自適應(yīng)和偽標(biāo)簽學(xué)習(xí)減小源域與目標(biāo)域之間的特征差異,能用海量未標(biāo)注數(shù)據(jù)有效診斷滾動軸承故障。LI X.等[4]提出利用多核最大均值差異法構(gòu)造一種多層域自適應(yīng)卷積網(wǎng)絡(luò),將源域中學(xué)習(xí)到的表示適配到目標(biāo)域中應(yīng)用,并準(zhǔn)確預(yù)測不同電機負(fù)載下的滾動軸承故障等級。陳祝云等[5]提出一種增強遷移卷積神經(jīng)網(wǎng)絡(luò)來改進(jìn)機械設(shè)備在變工況下的診斷精度和泛化能力。孫燦飛等[6]提出了結(jié)合域?qū)古c深度編碼網(wǎng)絡(luò)的自適應(yīng)域?qū)股疃冗w移故障診斷方法,解決軸承故障診斷在變負(fù)載以及強噪聲下的診斷難題。WU Z.H.等[7-8]提出一種利用長短期記憶網(wǎng)絡(luò)進(jìn)行軸承故障診斷的遷移學(xué)習(xí)方法,通過聯(lián)合分布自適應(yīng)來減小源域數(shù)據(jù)集和目標(biāo)域數(shù)據(jù)集之間的概率分布差異,該方法對噪聲具有很強的魯棒性,并且在不同的噪聲水平下具有出色的性能。WANG X.等[9]通過優(yōu)化殘差網(wǎng)絡(luò)構(gòu)建多尺度特征學(xué)習(xí)器,縮短2個域之間的條件分布距離,該模型可以從2個域中提取判別性和強大的特征,避免信息的丟失。ZHAO Z.B.等[10]提出一種聯(lián)合分布領(lǐng)域?qū)咕W(wǎng)絡(luò)模型,并應(yīng)用于凱斯西儲大學(xué)滾動軸承故障的診斷。LIU J.等[11]提出一種自注意力小樣本遷移學(xué)習(xí)模型,以較小的訓(xùn)練樣本實現(xiàn)更高的準(zhǔn)確性,該方法不能實現(xiàn)端到端訓(xùn)練。LI Q.F.等[12]結(jié)合知識圖譜,提出了一種基于對抗網(wǎng)絡(luò)的軸承故障診斷遷移學(xué)習(xí)方法,結(jié)果表明所提方法證明了理想的泛化能力,但其分類識別準(zhǔn)確率有待提高。CHEN P.等[13]提出一種聯(lián)合切片Wasserstein距離的無監(jiān)督域自適應(yīng),以提供端到端訓(xùn)練和更高的精度。
以上方法雖然取得一定的診斷效果,但是由于未能同時考慮減少不同數(shù)據(jù)邊緣分布距離和條件分布距離,模型可遷移、泛化能力以及識別的準(zhǔn)確率未能達(dá)到理想效果。為此,筆者提出一種深度遷移學(xué)習(xí)算法——聯(lián)合對抗深度遷移方法,并將其應(yīng)用于滾動軸承的故障診斷。該方法能夠有效實現(xiàn)現(xiàn)場滾動軸承大數(shù)據(jù)小樣本的診斷識別,自適應(yīng)和泛化能力較強,可為設(shè)備的預(yù)知性智能維護(hù)與健康管理提供有力支持。
假設(shè)在實驗室設(shè)備中獲得的數(shù)據(jù)或真實場景上帶有標(biāo)簽的數(shù)據(jù)被記作有標(biāo)記的源域(data obtained in laboratory equipment,DLE),而由其他實驗室設(shè)備或真實場景測量的未標(biāo)記數(shù)據(jù)被用作目標(biāo)域(data in the real-case scenarios,DRS),顯然2個域具有不同的特征分布。受對抗網(wǎng)絡(luò)的啟發(fā),提出一種聯(lián)合對抗深度遷移模型,其總體框架如圖1所示,主要包括特征生成器、聯(lián)合特征、領(lǐng)域判別器和分類器。其中,特征生成器由具有批量歸一化層的卷積神經(jīng)網(wǎng)絡(luò)來實現(xiàn),以提取域不變特征,加速訓(xùn)練過程和提高網(wǎng)絡(luò)泛化性能,并更好地保留每個域的不同特征分布。聯(lián)合特征結(jié)構(gòu)是利用前K個相關(guān)標(biāo)簽生成DRS的標(biāo)簽,以此計算數(shù)據(jù)條件分布,提高標(biāo)簽的預(yù)測精度,動態(tài)域?qū)R用于平衡邊緣分布和條件分布,以提高模型的可遷移能力,再利用聯(lián)合廣義切片Wasserstein距離準(zhǔn)則計算聯(lián)合分布,以減少計算量和提高模型的訓(xùn)練速度。域判別器用于區(qū)分不同的域以進(jìn)行更全面的域適應(yīng),這形成了對抗性的域損失函數(shù)。分類器用于預(yù)測最終標(biāo)簽。
(1)特征生成。特征生成器由一個4層卷積網(wǎng)絡(luò)組成,輸入大小為1×1 024的一維振動信號,經(jīng)過第一層卷積核大小為15×1的卷積層,輸出的信號大小為16×1 010。第二、三、四層的卷積核大小都設(shè)置為3×1,最終全連接層的輸出大小為256。卷積神經(jīng)網(wǎng)絡(luò)的層數(shù)及大小設(shè)置如表1所示。
表1 卷積網(wǎng)絡(luò)參數(shù)
(1)
假設(shè)有5個有著相似特征的樣本,經(jīng)分類器預(yù)測后有的標(biāo)簽值ypred存在錯誤,為降低發(fā)生錯誤的概率將這5個樣本按相似性從大到小排列。若K=3,即選擇前3個最相似樣本對應(yīng)的預(yù)測,最后選擇出現(xiàn)頻率最高的標(biāo)簽值作為最終待測樣本標(biāo)簽值,記作M(yK)。該方法可以明顯降低對目標(biāo)域標(biāo)簽值預(yù)測的錯誤率并且能準(zhǔn)確計算特征條件分布。目標(biāo)域標(biāo)簽損失可以寫成:
(2)
為實現(xiàn)特征條件分布更精準(zhǔn)的度量,本文提出廣義切片Wasserstein距離,該距離基于原始Wasserstein距離演變而來。傳統(tǒng)Wasserstein距離存在難以測量高維分布的瓶頸,目前研究學(xué)者提出許多方法來改善Wasserstein距離的計算,例如切片Wasserstein距離[14],其通過線性分片與拉東變換相關(guān)的概率分布來計算。雖然切片Wasserstein距離需要較少的計算復(fù)雜度,但是隨機選擇的線性投影的數(shù)量非常大,并且不能保證所選擇的線性投影將提供特征分布距離的有效評估。受廣義拉東變換的啟發(fā),通過將概率測度的線性切片擴展到非線性切片,提出一種新的測度距離——廣義切片Wasserstein距離。
廣義拉東變換由經(jīng)典拉東變換發(fā)展而來。經(jīng)典拉東變換是將超平面上的積分推廣到流形超曲面上的積分,其定義如下:
(3)
式中:RPS/T表示在超平面Rd上將高維分布投影到低維分布上的無窮積分集;PS/T表示源域和目標(biāo)域的概率分布函數(shù)。Sd-1表示超平面Rd-1中的單位球面,?w∈Sd-1,?t∈R,δ()表示一維狄拉克函數(shù)。廣義拉東變換可表示為:
(4)
當(dāng)g(x,w)=〈x,w〉時,經(jīng)典拉東變換是廣義拉東變換的特例。進(jìn)一步地,廣義切片Wasserstein距離表達(dá)式可定義為:
GSW(PS,PT)=
(5)
式中:PS、PT(PS/T)分別表示源域和目標(biāo)域的概率分布函數(shù)。
利用該廣義切片Wasserstein距離度量訓(xùn)練樣本和測試樣本特征概率分布距離,首先計算源域和目標(biāo)域之間的聯(lián)合分布差異。聯(lián)合分布由邊際分布和條件分布組成,2個域之間的邊緣分布差異Dmar表達(dá)式為:
Dmar=GSW(PS,PT)
(6)
本文采用前K個相關(guān)標(biāo)簽來標(biāo)記目標(biāo)域數(shù)據(jù),2個域之間的條件分布差異Dcon表達(dá)式為:
(7)
因此,上述的聯(lián)合分布可以定義為:
Dj=Dmar+Dcon=GSW(PS,PT)+
(8)
以往的許多方法只分別考慮了邊緣分布對齊和條件分布對齊,或者將邊緣分布和條件分布以一種比重相同的方式對齊,沒有考慮到這2種方式在實際應(yīng)用中的重要性可能不同,從而產(chǎn)生了2個不同領(lǐng)域之間的傳遞遷移能力下降的問題。針對上述問題,本文通過一個平衡因子的計算動態(tài)對齊邊際分布和條件分布,該平衡因子μ∈[0,1]。動態(tài)域?qū)R的表達(dá)式為:
(9)
為了評估所提出的方法在機械故障診斷領(lǐng)域中的可遷移能力,將其應(yīng)用于不同數(shù)據(jù)集進(jìn)行試驗驗證,2個標(biāo)準(zhǔn)數(shù)據(jù)集具體見表2和表3?,F(xiàn)場軸承數(shù)據(jù)是從現(xiàn)場實際工作的往復(fù)壓縮機上采集得到,其負(fù)載和運行條件不斷發(fā)生變化,故障類別通常為疲勞、點蝕、塑性變形等,具體可見表4。
表2 凱斯西儲大學(xué)軸承數(shù)據(jù)(CWRU)
表3 西安交通大學(xué)軸承數(shù)據(jù)(XJTU-SY)
表4 現(xiàn)場實際軸承數(shù)據(jù)
表2中:IF為滾動軸承內(nèi)圈故障;RF為滾動軸承滾動體故障;OF為滾動軸承外圈故障。
表3中:CF為滾動軸承保持架故障。
Lc(Fc(Fg(xs)),ys)=
(10)
域判別器學(xué)習(xí)函數(shù)Fd對輸入數(shù)據(jù)進(jìn)行域分類,域判別器的損失函數(shù)可表示為:
Ld[Fg(xs),F(xiàn)g(xt)]=
(11)
最后,應(yīng)用上文提出的動態(tài)分布域?qū)R來平衡特征邊緣分布和條件分布,以提高模型的泛化能力,域?qū)R損失表示如下:
+λ[μDmar+(1-μ)Dcon]
(12)
圖2 計算流程圖
文中提出模型的整體目標(biāo)函數(shù)表示如下:
L=Lc+LK+Ld+LDA
(13)
選擇凱斯西儲大學(xué)數(shù)據(jù)集和西安交通大學(xué)數(shù)據(jù)集作為DLE,不同工況下的遷移任務(wù)和從DLE到DRS的遷移任務(wù)如表5、表6和表7所示。將本文提出方法與原始卷積(S-only)、多核最大平均差異度量[15](multikernel maximum mean discrepancy,MK-MMD)、領(lǐng)域?qū)股窠?jīng)網(wǎng)絡(luò)[16](domain adversarial neural network,DANN)、特征對齊[17](correlation alignment,CORAL)和聯(lián)合最大平均差異[18](joint maximum mean discrepancy,JMMD)等進(jìn)行比較。
表5 基于凱斯西儲大學(xué)軸承數(shù)據(jù)遷移任務(wù)
表6 基于西安交通大學(xué)軸承數(shù)據(jù)遷移任務(wù)
表7 DLE到DRS的遷移任務(wù)
不同工作條件遷移結(jié)果如圖3~圖5所示。顯然,本文提出的JGSWD方法在6個任務(wù)上優(yōu)于其他比較方法。其中S-only的準(zhǔn)確率最低,JGSWD作為域自適應(yīng)對抗方法,取得了比DANN更好的性能。隨機選擇B→C和E→F遷移學(xué)習(xí)任務(wù)作為t-SNE可視化的對象,它們的特征可視化結(jié)果如圖6和圖7所示。在圖6和圖7中,10種顏色代表10個類別,圓形點代表源域,相反,叉點代表目標(biāo)域。對比其他方法,JGSWD方法的可視化結(jié)果圖能夠較好將圓形和十字形點聚集在一起,使源域和目標(biāo)域的特征分布更加一致,且10種顏色分類更加清晰明朗,該方法實現(xiàn)了更好的聚類。
圖3 凱斯西儲大學(xué)軸承數(shù)據(jù)A→B遷移分類預(yù)測準(zhǔn)確率
圖4 西安交通大學(xué)軸承數(shù)據(jù)D→E遷移分類預(yù)測準(zhǔn)確率
圖5 軸承分類預(yù)測準(zhǔn)確率雷達(dá)圖
圖6 B→C遷移任務(wù)的可視化
圖7 E→F遷移任務(wù)的可視化
DLE到DRS的遷移結(jié)果表明:該試驗的挑戰(zhàn)在于故障軸承數(shù)據(jù)是在不同的機械設(shè)備中獲得的,并且目標(biāo)域是未標(biāo)記的數(shù)據(jù),導(dǎo)致DLE和DRS的分布差異更大。試驗中本文所提出的方法分類性能如圖8~圖10所示,分類準(zhǔn)確率高達(dá)97%,具有很好的特征可視化性能,并且預(yù)測測試樣本故障類型的時間大大減少。
圖8 CWRU→DRS的遷移任務(wù)分類預(yù)測準(zhǔn)確率
圖9 XJTU-SY→DRS的遷移任務(wù)分類預(yù)測準(zhǔn)確率
圖10 DLE到DRS遷移任務(wù)的可視化
為了更好地證明每一項創(chuàng)新點在分類準(zhǔn)確性上的有效性,對其進(jìn)行消融試驗。G:廣義切片Wasserstein距離;K:前K個相關(guān)標(biāo)簽;DA:動態(tài)域?qū)R?!癑GSWD-G/DA/K”表示沒有廣義切片Wasserstein距離、前K個相關(guān)標(biāo)簽和動態(tài)域?qū)R的故障診斷模型。消融試驗如圖11所示。很明顯,本文所提出的JGSWD方法每一個創(chuàng)新點都有效地提高了模型遷移泛化性能和分類預(yù)測的準(zhǔn)確性。
圖11 消融試驗
本文提出了一種基于領(lǐng)域自適應(yīng)的滾動軸承故障診斷聯(lián)合對抗深度遷移學(xué)習(xí)方法,主要解決DRS和DLE聯(lián)合特征分布不同的問題,并通過動態(tài)平衡邊緣分布和條件分布來最小化2個領(lǐng)域之間的聯(lián)合差異,采用廣義切片Wasserstein距離,極大減少了復(fù)雜計算量,提高了故障診斷的速度。此外,采用前K個相關(guān)偽標(biāo)簽計算目標(biāo)域標(biāo)簽值提高了條件分布計算準(zhǔn)確率和模型遷移泛化能力。JGSWD模型的有效性通過CWRU軸承數(shù)據(jù)集、XJTU-SY軸承數(shù)據(jù)集和往復(fù)壓縮機軸承數(shù)據(jù)集得到了驗證。在CWRU軸承數(shù)據(jù)集和XJTU-SY軸承數(shù)據(jù)集上的試驗結(jié)果表明,JGSWD方法的平均分類準(zhǔn)確率約為99%。從DLE到DRS的遷移試驗結(jié)果表明,JGSWD方法的平均分類準(zhǔn)確率約為97.56%,JMMD約為93.13%,DANN、MK-MMD和CORAL約為91%,S-only僅約為83%。JGSWD方法比其他方法具有更高的分類精度和更好的遷移性能,可為滾動軸承故障診斷提供一種新的有效方法。