董紹江 周存芳 陳里里 徐向陽(yáng)
摘要:針對(duì)不同工況下采集的滾動(dòng)軸承振動(dòng)數(shù)據(jù)特征分布不一致且噪聲成分難以去除的問(wèn)題,提出一種基于判別性特征提取和雙重域?qū)R的深度遷移學(xué)習(xí)故障診斷方法。首先,將帶標(biāo)簽的振動(dòng)信號(hào)和未帶標(biāo)簽的振動(dòng)信號(hào)通過(guò)固定長(zhǎng)度的數(shù)據(jù)分割方法制作成數(shù)據(jù)集;其次,為了減少實(shí)際工況中噪聲信號(hào)的干擾,采用通道注意力機(jī)制SENet(squeeze-and-excitation networks)及判別損失項(xiàng)來(lái)輔助特征提取器提取具有區(qū)分度的特征;再次,為了解決數(shù)據(jù)特征分布不一致的問(wèn)題,采用最大均值差異來(lái)對(duì)齊源域和目標(biāo)域的全局域分布,并采用條件對(duì)抗方法來(lái)對(duì)齊兩域的子領(lǐng)域分布,實(shí)現(xiàn)雙重域?qū)R。最后,在兩個(gè)公開(kāi)變工況滾動(dòng)軸承故障數(shù)據(jù)集上進(jìn)行試驗(yàn)驗(yàn)證,結(jié)果表明,所提方法平均識(shí)別準(zhǔn)確率達(dá)到98%以上,并將其與不同診斷方法進(jìn)行了對(duì)比分析,證明了所提方法的有效性與優(yōu)越性。
關(guān)鍵詞:滾動(dòng)軸承;故障診斷;遷移學(xué)習(xí);判別性特征;最大均值差異
中圖分類(lèi)號(hào):TH133.33
DOI:10.3969/j.issn.1004-132X.2023.15.010
Cross-domain Fault Diagnosis of Bearings Based on Discriminant Feature Extraction and Dual-domain Alignment
DONG Shaojiang ZHOU Cunfang CHEN Lili XU Xiangyang
School of Mechanical,Electrical and Vehicle Engineering,Chongqing Jiaotong University,Chongqing,400074
Abstract: A deep transfer learning method was proposed to address the challenge of inconsistent feature distributions and difficulties in removing noise components in vibration data collected under different operating conditions for rolling bearings. The method utilized a combination of discriminative feature extraction and dual-domain alignment. Firstly, the labeled vibration signals and unlabeled vibration signals were segmented into fixed-length data sets using a data segmentation method. To mitigate the interference of noise signals in practical operating conditions, a channel attention mechanism known as SENet was employed. Additionally, a discriminative loss term was incorporated to assist the feature extractor in extracting features that exhibit discriminative properties. To handle the issue of inconsistent data feature distributions, the MMD was utilized to align the global domain distributions between the source and target domains. Furthermore, conditional adversarial learning techniques were employed to align the sub-domain distributions, resulting in dual-domain alignment. Experimental validation was conducted on two publicly available rolling bearing fault datasets collected under different operating conditions. The results show that the proposed method achieves an average recognition accuracy of over 98%. Comparative analyses with different diagnostic methods further demonstrate the effectiveness and superiority of the proposed method.
Key words: rolling bearing; fault diagnosis; transfer learning; discriminant feature; maximum mean discrepancy(MMD)
0 引言
滾動(dòng)軸承是大多數(shù)旋轉(zhuǎn)機(jī)械中的關(guān)鍵機(jī)械零部件[1]。滾動(dòng)軸承在工作時(shí)一旦出現(xiàn)故障問(wèn)題,輕則會(huì)造成經(jīng)濟(jì)損失,重則會(huì)引起人員傷亡,因此,滾動(dòng)軸承故障診斷方面的研究具有重要意義[2]。
近年來(lái)通過(guò)深度學(xué)習(xí)模型進(jìn)行故障診斷逐漸成為新的熱點(diǎn)問(wèn)題。張龍等[3]通過(guò)構(gòu)建雙通道特征融合網(wǎng)絡(luò)進(jìn)行齒輪箱和軸承的故障診斷,這種端到端的方法極大地提高了故障診斷的效率。ZHANG等[4]將原始的時(shí)間信號(hào)作為深度神經(jīng)網(wǎng)絡(luò)的輸入,實(shí)現(xiàn)了對(duì)滾動(dòng)軸承故障的精準(zhǔn)分類(lèi)。然而,以上都是針對(duì)單一的工況下滾動(dòng)軸承故障診斷的方法,但在實(shí)際工作條件下,滾動(dòng)軸承的運(yùn)行工況是復(fù)雜多變的,不同工況下相同故障的特征表征也有所不同,這將導(dǎo)致訓(xùn)練樣本和測(cè)試樣本產(chǎn)生較大的特征分布差異。因此,通過(guò)訓(xùn)練數(shù)據(jù)訓(xùn)練得到的網(wǎng)絡(luò)應(yīng)用于測(cè)試數(shù)據(jù)時(shí),模型性能將急劇下降,所以需要更有效的方法來(lái)利用一種工況下的標(biāo)記訓(xùn)練數(shù)據(jù)來(lái)診斷另一種工況下的未標(biāo)記測(cè)試數(shù)據(jù)。
最近,遷移學(xué)習(xí)在解決跨工況的任務(wù)上得到了廣泛的應(yīng)用[5-7]。YANG等[8]將卷積神經(jīng)網(wǎng)絡(luò)結(jié)合多層最大均值差異(maximum mean discrepancy,MMD),通過(guò)最小化MMD距離來(lái)減小源目標(biāo)域與源域之間的分布差異,實(shí)現(xiàn)特征的域適應(yīng)。WEN等[9]提出了一種頂層深度適應(yīng)方法,該方法使用三層稀疏自動(dòng)編碼器(sparse auto encoder,SAE)提取功率譜的特征,并應(yīng)用MMD項(xiàng)來(lái)適應(yīng)特征數(shù)據(jù)之間的分布差異。
主流的遷移學(xué)習(xí)故障診斷往往存在以下問(wèn)題:①在實(shí)際工業(yè)環(huán)境下,采集到的數(shù)據(jù)可能由于噪聲或其他干擾,導(dǎo)致不同的故障特征因噪聲的混入而難以被區(qū)分開(kāi)來(lái),使得分類(lèi)器的決策邊界處往往存在難以區(qū)分的樣本;②大多數(shù)遷移學(xué)習(xí)的策略?xún)H對(duì)齊源域和目標(biāo)域的全局域分布來(lái)進(jìn)行遷移,忽略了全局空間下的子領(lǐng)域?qū)R,導(dǎo)致相同故障類(lèi)型的子領(lǐng)域不能夠充分對(duì)齊,訓(xùn)練的模型精度不高。
為了克服上述問(wèn)題,本文提出了一種基于判別性特征提取和雙重域?qū)R的軸承跨域故障診斷的方法。首先提出了一種注意力機(jī)制和判別損失項(xiàng),將信號(hào)中的噪聲部分去除。其次采用域?qū)购陀蜻m應(yīng)的雙重對(duì)齊方法,縮小不同工況下的數(shù)據(jù)分布差異。
1 理論基礎(chǔ)
1.1 領(lǐng)域自適應(yīng)
目前遷移學(xué)習(xí)的思想通常是將源域和目標(biāo)域的樣本映射到特征空間中,在這個(gè)特征空間內(nèi)尋找一個(gè)度量準(zhǔn)則,來(lái)使源域和目標(biāo)域的特征分布盡可能地相近,即領(lǐng)域自適應(yīng)。
MMD可以用來(lái)度量源域和目標(biāo)域之間的距離,直觀判斷兩個(gè)數(shù)據(jù)的分布。假設(shè)源域數(shù)據(jù)集Xs={xs1,xs2,…,xsn}和目標(biāo)域數(shù)據(jù)集Xt={xt1,xt2,…,xtm}滿(mǎn)足不同的分布,存在一個(gè)再生Hilbert空間和一個(gè)映射函數(shù)φ(·),可以將數(shù)據(jù)集從原始空間映射到Hilbert空間。則MMD損失的定義如下:
其中,n、m分別為源域和目標(biāo)域的樣本數(shù)量。高斯核函數(shù)具有可以映射無(wú)窮維空間的優(yōu)勢(shì),所以本文采用高斯核函數(shù)作為映射函數(shù)φ(·)。
1.2 條件領(lǐng)域?qū)褂蜻m應(yīng)
除了采用度量準(zhǔn)則來(lái)進(jìn)行領(lǐng)域自適應(yīng)的方法之外,采用對(duì)抗性思想進(jìn)行域適應(yīng)也是遷移學(xué)習(xí)的一種方法,主要的代表性工作是GANIN等[10]提出的領(lǐng)域?qū)股窠?jīng)網(wǎng)絡(luò)(domain adversarial training of neural network,DANN)。WANG等[11]將DANN引入跨域故障診斷。DANN網(wǎng)絡(luò)由以下三部分組成:特征提取器F、領(lǐng)域判別器D和標(biāo)簽預(yù)測(cè)器G。在前向傳播過(guò)程中,F(xiàn)=F(x)中x為輸入的數(shù)據(jù),F(xiàn)為輸入數(shù)據(jù)的特征。G=G(F)中G為輸入特征所預(yù)測(cè)的標(biāo)簽。D是一個(gè)二元分類(lèi)器,用于指示特征是來(lái)自源域還是目標(biāo)域。
F的主要用途是它的參數(shù)被訓(xùn)練成最大化Ld來(lái)混淆D,Ld為領(lǐng)域判別損失。而D的參數(shù)被訓(xùn)練成最小化Ld來(lái)正確預(yù)測(cè)域標(biāo)簽。通過(guò)這種對(duì)抗性的訓(xùn)練過(guò)程,很難區(qū)分源特征和目標(biāo)特征,從而減少了它們的分布差異。整個(gè)網(wǎng)絡(luò)的損失由標(biāo)簽分類(lèi)器損失Lg和領(lǐng)域判別損失Ld組成:
其中,E為期望,nc為類(lèi)的數(shù)量,Gc(fsi)為將第i個(gè)源樣本的特征預(yù)測(cè)到第c類(lèi)的概率。fsi表示第i個(gè)源樣本的特征。D(fsi)取值范圍為0~1,表示fsi來(lái)自源域還是目標(biāo)域。領(lǐng)域?qū)股窠?jīng)網(wǎng)絡(luò)的總體優(yōu)化目標(biāo)為
其中,λ1是一個(gè)權(quán)衡參數(shù),用于平衡Lg和Ld之間的貢獻(xiàn)。特征提取器F的參數(shù)通過(guò)最大化Ld來(lái)優(yōu)化,D的參數(shù)通過(guò)最小化Ld來(lái)優(yōu)化,G和F的參數(shù)通過(guò)最小化Lg來(lái)優(yōu)化。利用上述優(yōu)化目標(biāo)訓(xùn)練模型后,可以使用標(biāo)記源數(shù)據(jù)訓(xùn)練的標(biāo)簽預(yù)測(cè)器來(lái)正確分類(lèi)未標(biāo)記的目標(biāo)數(shù)據(jù)。
在故障診斷領(lǐng)域中,同一故障類(lèi)型之間的標(biāo)簽預(yù)測(cè)比不同故障類(lèi)型之間的標(biāo)簽預(yù)測(cè)更接近。考慮到標(biāo)簽預(yù)測(cè)器G含有預(yù)測(cè)的標(biāo)簽信息,將預(yù)測(cè)結(jié)果G同特征F聯(lián)合起來(lái)輸入領(lǐng)域判別器D中,可以更好地對(duì)齊屬于同一類(lèi)別的源域和目標(biāo)域的特征。
據(jù)分布背后的多模態(tài)結(jié)構(gòu)以及特征和分類(lèi)器預(yù)測(cè)之間的乘法交互,故本文使用多線(xiàn)性映射來(lái)對(duì)F和G進(jìn)行聯(lián)結(jié):
1.3 判別損失項(xiàng)
在計(jì)算機(jī)視覺(jué)領(lǐng)域,已經(jīng)出現(xiàn)改進(jìn)特征識(shí)別的算法來(lái)提高模型的泛化性能。WEN等[12]提出聯(lián)合優(yōu)化SoftMax損失函數(shù)和中心損失函數(shù),用于最小化特征的類(lèi)內(nèi)距離,以獲得更加高效有用的特征和魯棒的卷積神經(jīng)網(wǎng)絡(luò)。但僅縮小特征的類(lèi)內(nèi)距離是不夠的,還應(yīng)該使不同故障的特征之間離得越遠(yuǎn)越好,特征才會(huì)更加具有區(qū)分度。
為了獲得更加具有區(qū)分度的特征,本文提出一種判別損失項(xiàng),如圖1所示。判別損失項(xiàng)本質(zhì)上是一種損失函數(shù),該損失函數(shù)作用在源域上,對(duì)源域的特征進(jìn)行約束,判別損失項(xiàng)模塊的作用是使同一類(lèi)別的特征更加緊湊,不同類(lèi)別的特征更加分散,使得特征變得更加具有區(qū)分度,那么相應(yīng)的目標(biāo)域的數(shù)據(jù)進(jìn)行對(duì)齊后也會(huì)更加具有區(qū)分度。
損失計(jì)算公式為
式中,β為權(quán)衡參數(shù);nbs為批次大??;fsi為提取的深度特征;ci、cj為通過(guò)平均當(dāng)前批次的源域特征計(jì)算的當(dāng)前批次的類(lèi)中心;cyi為源特征的第i個(gè)類(lèi)別的全局類(lèi)中心。
全局類(lèi)中心cyi在每次迭代中更新如下:
其中,γ為cyi進(jìn)行參數(shù)更新時(shí)的學(xué)習(xí)率,t為迭代次數(shù)。cyi被初始化為第一批的全局類(lèi)中心。隨著迭代次數(shù)的增加,cyi將更接近全局類(lèi)中心。
1.4 注意力機(jī)制
滾動(dòng)軸承在運(yùn)行狀況下所采集的信號(hào)中由于周邊環(huán)境等其他因素的影響會(huì)包含噪聲信號(hào)在內(nèi),而這些噪聲信號(hào)可能會(huì)被當(dāng)成有用的信息被提取出來(lái),這些信息會(huì)影響網(wǎng)絡(luò)的性能,本文采用SENet(squeeze-and-excitation networks)[13]注意力模塊,該模塊可以通過(guò)模型的訓(xùn)練來(lái)自動(dòng)地學(xué)習(xí)一組權(quán)重系數(shù),學(xué)習(xí)到的權(quán)重系數(shù)通過(guò)加權(quán)的方法來(lái)提高對(duì)特征重要的通道的權(quán)值,同時(shí)低權(quán)重系數(shù)會(huì)減弱干擾信息帶來(lái)的負(fù)面影響。
注意力機(jī)制的流程如圖2所示,整個(gè)模塊包含三個(gè)主要步驟:Fsq為壓縮(squeeze)操作,F(xiàn)ex為激勵(lì)(excitation)操作,F(xiàn)scale 為乘積(reweight)操作。具體流程為將H×W×C維的特征圖通過(guò)壓縮操作和激勵(lì)操作變?yōu)镃個(gè)權(quán)重系數(shù),將得到的權(quán)重系數(shù)與原有的特征進(jìn)行Fscale 操作后即可得到反映通道重要性的新的特征矩陣,從而完成對(duì)原有特征在通道維度的重新加權(quán)。
首先Fsq壓縮操作是對(duì)特征圖的每個(gè)通道進(jìn)行全局平均池化,將H×W×C維的特征圖壓縮成1×1×C的特征向量,其中每個(gè)通道的二維特征矩陣被壓縮成一個(gè)具有全局感受野的特征響應(yīng)值。計(jì)算過(guò)程如下:
式中,VC為特征圖中第C個(gè)通道的特征向量。
接下來(lái)進(jìn)行Fex激勵(lì)操作,激勵(lì)操作主要是通過(guò)兩層全連接層和一個(gè)Sigmoid激活函數(shù)來(lái)實(shí)現(xiàn),通過(guò)兩層全連接更好地融合輸入的特征信息,Sigmoid則是輸入的特征映射為0~1之間的歸一化權(quán)重,計(jì)算過(guò)程如下:
zC′=Fex(zC)=σ(ω2(ω1(zC)))(11)
式中,σ為Sigmoid函數(shù);ω1、ω2為2個(gè)全連接層的權(quán)重;zC′為Fex激勵(lì)操作后的輸出。
最后的Fscale 乘積操作是將壓縮、激勵(lì)后得到的權(quán)重與原有的特征圖通道的特征矩陣進(jìn)行點(diǎn)乘運(yùn)算,得到重新標(biāo)定后的特征:
整個(gè)過(guò)程中,特征圖的尺寸和通道維度都未改變。
2 網(wǎng)絡(luò)模型
2.1 判別性特征提取和雙重域?qū)R網(wǎng)絡(luò)模型
本文提出的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3所示。
本文優(yōu)化的具體計(jì)算公式為
F的參數(shù)通過(guò)最大化Ld來(lái)優(yōu)化,D的參數(shù)通過(guò)最小化Ld′來(lái)優(yōu)化,G和F的參數(shù)通過(guò)最小化Lg、Lc和LMMD來(lái)優(yōu)化。θf(wàn)為特征提取器參數(shù),θg為標(biāo)簽預(yù)測(cè)器參數(shù),θd為領(lǐng)域判別器參數(shù),η為學(xué)習(xí)率。參數(shù)θf(wàn)、θg、θd通過(guò)反向傳播更新,公式如下:
2.2 雙重對(duì)齊域自適應(yīng)神經(jīng)網(wǎng)絡(luò)模型診斷流程
首先,通過(guò)傳感器獲得旋轉(zhuǎn)機(jī)械系統(tǒng)振動(dòng)信號(hào)并進(jìn)行數(shù)據(jù)分割處理,制作成樣本。其次,將有標(biāo)簽的源數(shù)據(jù)和沒(méi)有標(biāo)簽的目標(biāo)數(shù)據(jù)用于模型的訓(xùn)練,將源數(shù)據(jù)和目標(biāo)數(shù)據(jù)同時(shí)輸入特征提取器中,獲得提取到的特征;之后將提取的特征進(jìn)行判別性特征損失計(jì)算,目的是獲得高效有用的特征;再次特征被輸送到雙重對(duì)齊域自適應(yīng)網(wǎng)絡(luò)中,計(jì)算領(lǐng)域判別器的損失和域?qū)R器的損失。目標(biāo)函數(shù)LMMD、Lg、Ld′、Lc和總目標(biāo)函數(shù)分別由式(1)、式(2)和式(6)、式(7)、式(13)計(jì)算得到,采用反向傳播算法更新所有參數(shù),最后,softmax分類(lèi)器對(duì)無(wú)標(biāo)簽的目標(biāo)域數(shù)據(jù)進(jìn)行故障診斷。故障診斷流程如圖4所示。
當(dāng)網(wǎng)絡(luò)模型訓(xùn)練完成后,選取分類(lèi)準(zhǔn)確率最高的網(wǎng)絡(luò)模型進(jìn)行參數(shù)保存,將保存好的參數(shù)放入特征提取器和標(biāo)簽預(yù)測(cè)器中,之后將未標(biāo)記標(biāo)簽的原始振動(dòng)數(shù)據(jù)通過(guò)特征提取器實(shí)現(xiàn)特征提取,然后在此基礎(chǔ)上通過(guò)分類(lèi)器進(jìn)行特征信息的分類(lèi),最后得到的標(biāo)簽也就是網(wǎng)絡(luò)模型認(rèn)為輸送的數(shù)據(jù)最有概率的類(lèi)別,便完成了模型的診斷應(yīng)用。模型應(yīng)用流程如圖5所示。
3 實(shí)驗(yàn)分析
3.1 實(shí)驗(yàn)一:凱斯西儲(chǔ)大學(xué)(CWRU)軸承故障數(shù)據(jù)驗(yàn)證
3.1.1 數(shù)據(jù)集介紹
美國(guó)凱斯西儲(chǔ)大學(xué)(CWRU)軸承故障數(shù)據(jù)集[14]的采樣頻率為12 kHz,對(duì)于軸承的故障,采用的方法是電火花加工,通過(guò)電火花加工將3種不同尺寸的單點(diǎn)故障分別加工在軸承的內(nèi)圈、外圈、滾動(dòng)體上。本文所使用的振動(dòng)數(shù)據(jù)是通過(guò)安裝在電機(jī)外殼驅(qū)動(dòng)端上的加速度計(jì)采集的,數(shù)據(jù)描述見(jiàn)表1。實(shí)驗(yàn)中采用了四種電機(jī)負(fù)載,分別為0、745 W、1470 W、2205 W。
3.1.2 遷移任務(wù)設(shè)置
設(shè)0、1、2、3分別表示0、745 W、1470 W、2205 W的電機(jī)負(fù)載。通過(guò)對(duì)四種操作條件的排列,構(gòu)建了12個(gè)傳輸任務(wù):0-1、0-2、0-3、1-0、1-2、1-3、2-0、2-1、2-3、3-0、3-1、3-2。例如,0-1表示源域數(shù)據(jù)在0負(fù)載下采集,目標(biāo)域數(shù)據(jù)在745 W負(fù)載下采集。源域和目標(biāo)域數(shù)據(jù)的每一類(lèi)都包含400個(gè)樣本,因此有10個(gè)類(lèi)的4000個(gè)標(biāo)記源樣本和4000個(gè)未標(biāo)記目標(biāo)樣本可供訓(xùn)練。每個(gè)由1024個(gè)點(diǎn)組成的樣本是原始時(shí)域振動(dòng)信號(hào)的一段。
3.1.3 對(duì)比實(shí)驗(yàn)方法介紹
為了對(duì)比本文方法與其他方法的優(yōu)越性,在數(shù)據(jù)集上使用了以下四種方法進(jìn)行比較。方法一:使用18層的ResNet,輸入為一維時(shí)間序列,
只使用源數(shù)據(jù)訓(xùn)練模型,不考慮目標(biāo)數(shù)據(jù)。然后直接用訓(xùn)練好的模型對(duì)未標(biāo)記的目標(biāo)數(shù)據(jù)進(jìn)行測(cè)試。方法二:在方法一的特征提取器和標(biāo)簽預(yù)測(cè)器之間增加了一個(gè)適應(yīng)層,并在優(yōu)化目標(biāo)中增加了MMD距離損失。方法三:根據(jù)DANN[11]的領(lǐng)域?qū)顾枷?,引入領(lǐng)域判別器D以及梯度反轉(zhuǎn)層。方法四:在方法三的基礎(chǔ)上進(jìn)一步改進(jìn),加入了多線(xiàn)性映射以及熵權(quán)重。本文方法:采用添加注意力機(jī)制的特征提取器和標(biāo)簽預(yù)測(cè)器(SE-Resnet18),采用基于MMD距離度量和條件對(duì)抗方法的雙重對(duì)齊方法,并在優(yōu)化目標(biāo)中加入特征判別損失。
3.1.4 實(shí)驗(yàn)參數(shù)設(shè)置
為保證本文方法與對(duì)比方法在訓(xùn)練時(shí)的一致性,所有方法均采用等效超參數(shù)。使用動(dòng)量為0.9的小批SGD,每個(gè)域的批大小設(shè)置為128。學(xué)習(xí)率的調(diào)整公式為η=0.01(1+10p)-0.75,其中p是訓(xùn)練進(jìn)度從0到1的線(xiàn)性變化。其他參數(shù)經(jīng)過(guò)多次預(yù)實(shí)驗(yàn)確定。λ1設(shè)置為0.01,λ2設(shè)置為0.005,γ=0.01,β固定為0.5。
3.1.5 實(shí)驗(yàn)結(jié)果分析
不同模型的準(zhǔn)確率見(jiàn)表2,遷移任務(wù)0-1表示0負(fù)載數(shù)據(jù)為源域,745 W負(fù)載數(shù)據(jù)為目標(biāo)域。
(1)由對(duì)比模型的準(zhǔn)確率可以看出,采用遷移學(xué)習(xí)思想的方法均高于方法一,說(shuō)明引入遷移學(xué)習(xí)的思想可以有效地解決針對(duì)軸承跨域故障診斷的問(wèn)題。
(2)由表2可知,方法二的精度略低于對(duì)抗方法的精度,原因是:方法二僅對(duì)齊了全局域分布,故精度較低;僅僅使用一層MMD對(duì)齊會(huì)導(dǎo)致特征不能充分地對(duì)齊,使得模型識(shí)別精度不高。
(3)方法四的精度要高于方法三的精度,說(shuō)明在進(jìn)行域?qū)R的時(shí)候,盲目對(duì)齊全局域分布是不夠的,還應(yīng)該考慮子領(lǐng)域的對(duì)齊。
(4)由表2可知方法四的精度略低于本文方法的精度,究其原因是方法四沒(méi)有注意力機(jī)制和判別損失項(xiàng)來(lái)提取關(guān)鍵特征,同時(shí)導(dǎo)致網(wǎng)絡(luò)在特征提取過(guò)程中特征丟失,從而影響故障診斷結(jié)果。
綜上所述,本文方法平均精度達(dá)99.88%,是所有模型中效果最好的,具有更高的特征表征能力且具有一定的遷移診斷精度。一方面,針對(duì)采集的數(shù)據(jù),在提取特征的時(shí)候引入注意力機(jī)制和判別損失項(xiàng),使得提取的特征更加高效有用,增強(qiáng)了模型的泛化能力;另一方面,在進(jìn)行遷移學(xué)習(xí)的過(guò)程中采用了雙重對(duì)齊的方法,該方法能夠明顯縮小不同工況下數(shù)據(jù)之間的分布差異。
3.1.6 結(jié)果可視化分析
為了更加直觀地看到本文方法對(duì)軸承跨域診斷的有效性,選擇遷移任務(wù)為3-0,利用t-分布鄰域嵌入(t-distribution stochastic neighbor embedding,t-SNE)[15]算法將提取的目標(biāo)域和源域的特征降至二維平面進(jìn)行可視化,如圖6所示。
由圖6可知,方法一效果最差,因?yàn)椴⑽催M(jìn)行遷移操作,所以源域和目標(biāo)域之間不同的故障類(lèi)別發(fā)生了嚴(yán)重的混疊。
方法二與本文方法相比較,發(fā)現(xiàn)存在特征混疊現(xiàn)象,這是由于方法二僅僅對(duì)齊了兩域的全局域分布,忽略子領(lǐng)域的對(duì)齊。
由表2的對(duì)比結(jié)果可知,方法三的分類(lèi)性能要明顯優(yōu)于方法二,但缺點(diǎn)同樣是只對(duì)齊了全局域分布而沒(méi)有考慮細(xì)粒度的區(qū)分。由方法四的可視化圖可以看出,由于方法四考慮了子領(lǐng)域的對(duì)齊,效果比前三種方法要好,但由圖6的可視化特征圖明顯可以看到,本文特征的類(lèi)內(nèi)緊湊型和類(lèi)間可分性要好于方法四,說(shuō)明方法四模型泛化能力較弱。
結(jié)合表2及圖6,證明了本文方法通過(guò)雙重域?qū)R將來(lái)自源域和目標(biāo)域相同故障種類(lèi)樣本更緊密地聚類(lèi)在一起;其次在判別損失項(xiàng)及注意力機(jī)制的輔助下,使得提取的特征更加高效有用,間接增強(qiáng)了模型的泛化性。
3.2 實(shí)驗(yàn)二:江南大學(xué)軸承故障數(shù)據(jù)驗(yàn)證
3.2.1 數(shù)據(jù)集介紹
江南大學(xué)數(shù)據(jù)集[16]為江南大學(xué)獲取的軸承數(shù)據(jù)集。對(duì)NA(正常)、IF(內(nèi)圈故障)、OF(外圈故障)和BF(滾動(dòng)體故障)4種不同狀態(tài)進(jìn)行了測(cè)試。在三種轉(zhuǎn)速(600 r/min、800 r/min和1000 r/min)下采樣振動(dòng)信號(hào),采樣頻率為50 kHz。數(shù)據(jù)描述見(jiàn)表3。
3.2.2 遷移任務(wù)設(shè)置
設(shè)置為600 r/min、800 r/min和1000 r/min的三個(gè)轉(zhuǎn)速被認(rèn)為是不同的任務(wù),分別表示任務(wù)0、任務(wù)1和任務(wù)2,見(jiàn)表4。通過(guò)對(duì)三個(gè)任務(wù)的排列,總共有六種遷移學(xué)習(xí)設(shè)置,分別為0-1、0-2、1-0、1-2、2-0、2-1。
3.2.3 實(shí)驗(yàn)結(jié)果分析
為了驗(yàn)證本文方法的有效性,設(shè)置對(duì)比實(shí)驗(yàn),對(duì)比實(shí)驗(yàn)的模型以及模型參數(shù)與3.1節(jié)中的實(shí)驗(yàn)一保持一致,得到表5所示的診斷精度。
分析表5可知,在所有的遷移任務(wù)中,方法一的準(zhǔn)確率低于其他遷移學(xué)習(xí)方法的準(zhǔn)確率,說(shuō)明遷移學(xué)習(xí)的確能夠解決跨工況的問(wèn)題。方法二效果弱于方法三,是由于方法二只是對(duì)最后一層全連接進(jìn)行了MMD對(duì)齊,并未充分對(duì)齊,而方法三是自適應(yīng)的對(duì)齊,所以其效果好于方法二。方法四在大多情況下要優(yōu)于方法三,原因是方法四算法考慮了子領(lǐng)域的對(duì)齊。
本文方法平均精度為98.32%,是所有模型中精度最高的,說(shuō)明本文方法在特征提取方面能夠有效地提取有用的特征,同時(shí)在域?qū)R階段能夠有效地減小源域和目標(biāo)域的差異,使其充分對(duì)齊。
3.2.4 結(jié)果可視化分析
為了更好地展現(xiàn)本文模型的效果,針對(duì)遷移任務(wù)中的1-0,采用T-sne可視化方法對(duì)提取的特征進(jìn)行二維可視化,如圖7所示??梢钥闯?,本文方法效果明顯高于其他模型,并且聚類(lèi)效果好,各類(lèi)特征之間距離較遠(yuǎn),說(shuō)明模型泛化能力強(qiáng)。
3.3 實(shí)驗(yàn)三:模型泛化性能驗(yàn)證
為了驗(yàn)證本文提出的判別損失項(xiàng)及注意力機(jī)制能夠有效地抑制噪聲,提取有用特征,采用的驗(yàn)證方法是對(duì)原有的信號(hào)進(jìn)行加噪處理。本文所添加的噪聲是高斯白噪聲。選取4種信噪比情況下的噪聲數(shù)據(jù),即-4 dB,-2 dB,2 dB,4 dB。取3HP作為源域數(shù)據(jù),0HP作為目標(biāo)域數(shù)進(jìn)行模型訓(xùn)練,在本次實(shí)驗(yàn)中,采用含噪聲的信號(hào)作為訓(xùn)練集輸送到網(wǎng)絡(luò)進(jìn)行訓(xùn)練,然后使用不含噪聲的測(cè)試集進(jìn)行測(cè)試,得到不同方法的實(shí)驗(yàn)精度結(jié)果,見(jiàn)表6,精度對(duì)比如圖8所示。
由表6和圖8可知,本文方法的精度在不同噪聲含量的信號(hào)中均最高,這是由于本文采用了判別損失項(xiàng)和注意力機(jī)制,注意力機(jī)制可以使網(wǎng)絡(luò)關(guān)注信號(hào)的重要成分,而判別損失項(xiàng)則是通過(guò)度量的思想,使得同一類(lèi)別的特征變得更加緊湊,
不同類(lèi)別的特征更加分散,也就意味著本模型能夠有效地提取信號(hào)中的有用特征,消除了噪聲特征,進(jìn)而提高了模型的診斷精度。
4 結(jié)論
(1)本文方法在CWRU軸承故障診斷數(shù)據(jù)集和江南大學(xué)軸承數(shù)據(jù)集兩個(gè)數(shù)據(jù)集驗(yàn)證后的表現(xiàn)都達(dá)到了最高的精度,并且由可視化圖可以看出,本文方法能夠充分減小跨域的分布差異,提取有效特征,增強(qiáng)模型的泛化能力。
(2)本文方法通過(guò)雙重域?qū)R,使特征在對(duì)齊全局域分布的條件下,也同時(shí)對(duì)齊子領(lǐng)域分布,提高了模型識(shí)別精度。
(3)通過(guò)實(shí)驗(yàn)三的實(shí)驗(yàn)驗(yàn)證,本文所提的基于注意力和判別損失項(xiàng)的特征提取網(wǎng)絡(luò)能夠提取更加有效的特征,在強(qiáng)噪聲的環(huán)境下仍然具有較高的診斷精度。
參考文獻(xiàn):
[1] MA Z H, WANG S P, SHI J, et al. Fault Diagnosis of an Intelligent Hydraulic Pump Based on a Nonlinear Unknown Input Observer[J]. Chinese Journal of Aeronautics, 2018, 31(2):385-394.
[2] 雷亞國(guó), 賈峰, 孔德同, 等. 大數(shù)據(jù)下機(jī)械智能故障診斷的機(jī)遇與挑戰(zhàn)[J]. 機(jī)械工程學(xué)報(bào), 2018, 54(5):94-104.
LEI Yaguo, JIA Feng, KONG Detong, et al. Opportunities and Challenges of Mechanical Intelligent Fault Diagnosis under Big Data[J]. Journal of Mechanical Engineering, 2018, 54(5):94-104.
[3] 張龍, 甄燦壯, 易劍昱, 等. 雙通道特征融合CNN-GRU齒輪箱故障診斷[J]. 振動(dòng)與沖擊, 2021, 40(19):239-245.
ZHANG Long, ZHEN Canzhuang, YI Jianyu, et al. Fault Diagnosis of Dual-channel Feature Fusion CNN-GRU Gearbox[J]. Vibration and Shock, 2021, 40(19):239-245.
[4] ZHANG W, LI C H, GAO L, et al. A Deep Convolutional Neural Network with New Training Methods for Bearing Fault Diagnosis under Noisy Environment and Different Working Load[J]. Mechanical Systems and Signal Processing, 2018, 100:439-453.
[5] 雷亞國(guó), 楊彬, 杜兆鈞, 等. 大數(shù)據(jù)下機(jī)械裝備故障的深度遷移診斷方法[J]. 機(jī)械工程學(xué)報(bào), 2019, 55(7):1-8.
LEI Yaguo, YANG Bin, DU Zhaojun, et al. Deep Migration Diagnosis Method of Mechanical Equipment Fault under Big Data[J]. Journal of Mechanical Engineering, 2019, 55(7):1-8.
[6] 雷亞國(guó), 楊彬, 李乃鵬, 等. 跨設(shè)備的機(jī)械故障靶向遷移診斷方法[J]. 機(jī)械工程學(xué)報(bào), 2022, 58(12):1-9.
LEI Yaguo, YANG Bin, LI Naipeng, et al. Diagnostic Method of Cross-equipment Mechanical Fault Targeted Migration[J]. Journal of Mechanical Engineering, 2022, 58(12):1-9.
[7] ZHENG H, WANG R, YANG Y, et al. Cross-domain fault Diagnosis Using Knowledge Transfer Strategy:a Review[J]. IEEE Access, 2019, 7:129260-129290.
[8] YANG B, LEI Y G, JIA F, et al. An Intelligent Fault Diagnosis Approach Based on Transfer Learning from Laboratory Bearings to Locomotive Bearings[J]. Mechanical Systems and Signal Processing, 2019, 122:692-706.
[9] WEN L, GAO L, LI X. A New Deep Transfer Learning Based on Sparse Auto-encoder for Fault Diagnosis[J]. IEEE Transactions on Systems, Man, and Cybernetics:Systems, 2019, 49(1):136-144.
[10] GANIN Y, USTINOVA E, AJAKAN H, et al. Domain-adversarial Training of Neural Networks[J]. Journal of Machine Learning Research, 2017, 17(1):2096-2030.
[11] WANG Q, MICHAU G, FINK O. Domain Adaptive Transfer Learning for Fault Diagnosis[C]∥ Prognostics and System Health Management Conference(PHM-Paris). Paris, 2019:18821345.
[12] WEN Y, ZHANG K, LI Z, et al. A Discriminative Feature Learning Approach for Deep Face Recognition[C]∥European Conference on Computer Vision. Cham, 2016:499-515.
[13] HU J, SHEN L, SUN G. Squeeze-and-excitation Networks[C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City, 2018:7132-7141.
[14] Case Western Reserve University. Case Western Reserve University(CWRU)Bearing Data Center[EB/OL]. https:∥csegroups. case. edu/bearingdatacenter/pages/download-data-file/.
[15] LAURENS V D M, HINTON G. Visualizing Data Using t-SNE[J]. Journal of Machine Learning Research, 2008, 9(86):2579-2605.
[16] LI Ke, PING Xueliang, WANG Huaqing, et al. Sequential Fuzzy Diagnosis Method for Motor Roller Bearing in Variable Operating Conditions Based on Vibration Analysis[J]. Sensors, 2013, 13(6):8013-8041.