杜康寧,寧少慧
(太原科技大學(xué)機(jī)械工程學(xué)院,山西太原 030024)
滾動軸承是旋轉(zhuǎn)機(jī)械的重要組成部件,在工業(yè)裝備中得到了廣泛的應(yīng)用。由于它長期處于復(fù)雜多變的載荷環(huán)境和高速運(yùn)轉(zhuǎn)過程中,經(jīng)常受到機(jī)械磨損、沖擊載荷,從而產(chǎn)生各種故障。然而在滾動軸承故障產(chǎn)生的早期,其周期性振動信號十分微弱,易被其他噪聲覆蓋,使得故障發(fā)現(xiàn)不及時,造成設(shè)備損毀,甚至是人員傷亡的事故發(fā)生。因此,對滾動軸承進(jìn)行及時、可靠的狀態(tài)監(jiān)測具有重要工程意義[1-2]。WANG等[3]提出一種子域自適應(yīng)遷移學(xué)習(xí)方法,用于解決滾動軸承故障診斷在遷移學(xué)習(xí)中目標(biāo)域自適應(yīng)的邊緣分布和條件分布偏差,使得故障診斷模型在目標(biāo)域與源域概率分布不同時仍能保持高診斷精度。黃包裕等[4]提出一種基于布谷鳥搜索算法和最大二階循環(huán)平穩(wěn)盲解卷積的滾動軸承故障診斷方法,該方法使用布谷鳥搜索算法優(yōu)化最大二階循環(huán)平穩(wěn)盲解卷積,使其能夠高效、精確地尋找出故障特征頻率以及合適的濾波器長度。張?jiān)茝?qiáng)等[5]提出一種基于雙時域微弱故障特征增強(qiáng)的軸承早期故障智能識別方法,通過廣義S變換和Fourier逆變換將軸承振動信號變換為雙時域二維時間序列,提取二維時間序列的主對角元素之后,構(gòu)建增強(qiáng)的軸承故障信號,采用脈沖耦合神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)對增強(qiáng)后的軸承故障信號進(jìn)行識別與診斷,解決了軸承早期微弱故障難以準(zhǔn)確識別的問題。
在眾多故障診斷方法中,基于深度學(xué)習(xí)的故障診斷方法因端到端的學(xué)習(xí)范式以及強(qiáng)大特征提取能力而被廣泛應(yīng)用。雷亞國等[6]建立了基于深度殘差網(wǎng)絡(luò)ResNet的機(jī)械故障深度遷移診斷方法,解決了試驗(yàn)裝備故障至工程實(shí)際裝備故障的遷移診斷問題。黃磊等人[7]利用GoogLeNet識別軸承故障樣本,驗(yàn)證了GoogLeNet網(wǎng)絡(luò)的強(qiáng)大特征提取能力。張西寧等[8]對卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了改進(jìn),利用小尺度卷積層代替池化層,提高了診斷精度。盡管上述研究取得了很好的效果,但大多是在忽略復(fù)合故障的數(shù)據(jù)集上構(gòu)建和驗(yàn)證的,現(xiàn)有智能故障診斷也大多基于軸承只發(fā)生單一故障的假設(shè),對于復(fù)合故障的診斷很少涉及其中,實(shí)際情況下經(jīng)常會發(fā)生滾動軸承多個元件同時損傷的故障情形[9]。
復(fù)合故障特征與現(xiàn)場的噪聲和干擾信號源復(fù)合,使得常規(guī)方法難以識別滾動軸承的復(fù)合故障特征[10]。當(dāng)前,對于復(fù)合故障的診斷方法主要分為以下兩類:一類是基于時域、頻域的時頻分析方法,將信號進(jìn)行剝離處理,將混合故障信號分離為單一故障信號,包括總體平均經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)、局部特征尺度分解(Local Characteristic-scale Decomposition,LCD)、變分模態(tài)分解(Variational Mode Decomposition,VMD)等;另一類是基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)分類方法,利用神經(jīng)網(wǎng)絡(luò)自身的特征提取能力對混合故障進(jìn)行診斷,包括一維卷積神經(jīng)網(wǎng)絡(luò)等方法。在混合故障診斷處理上,已有許多學(xué)者進(jìn)行了相關(guān)研究和探索。王玉娟[11]提出一種基于總體平均經(jīng)驗(yàn)?zāi)B(tài)分解 (EEMD)的獨(dú)立分量分析 (Independent Component analysis,ICA)算法,將復(fù)合信號通過EEMD分解、ICA、包絡(luò)分析實(shí)現(xiàn)了對故障類型的診斷識別。趙慶恩等[12]提出一種基于小波包與決策樹的滾動軸承混合故障診斷方法,小波包能量方法對故障信號進(jìn)行了特征提取,用決策樹故障模型對故障進(jìn)行分類。CHEN等[13]提出一維卷積神經(jīng)網(wǎng)絡(luò)作為分類器,對混合故障進(jìn)行識別。通過研究,從時頻分析的層面進(jìn)行故障診斷,需要復(fù)雜的數(shù)據(jù)處理算法和專業(yè)的數(shù)據(jù)處理經(jīng)驗(yàn),同時,模型與基于深度學(xué)習(xí)建立的模型相比,缺乏泛化性和端到端的學(xué)習(xí)能力。
本文作者從基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)分類方法入手,結(jié)合實(shí)際工況中軸承健康信號樣本豐富、復(fù)合故障樣本較少的特點(diǎn),提出一種基于有監(jiān)督遷移學(xué)習(xí)的ConvNeXt滾動軸承多工況混疊故障診斷模型。首先,通過SMOTE方法實(shí)現(xiàn)平衡數(shù)據(jù)集的重構(gòu),解決混合故障樣本少導(dǎo)致的類別失衡問題;其次,通過有監(jiān)督遷移學(xué)習(xí)方法改進(jìn)ConvNeXt網(wǎng)絡(luò)模型因訓(xùn)練集數(shù)據(jù)不足導(dǎo)致的模型收斂性差的問題;通過格拉姆角場(Gramian Angular Field,GAF)將一維平衡數(shù)據(jù)集信號轉(zhuǎn)換為二維RGB圖像輸入模型,通過預(yù)訓(xùn)練-微調(diào)方法訓(xùn)練模型全連接層的權(quán)重,通過Grad-CAM可視化方法,查看模型識別錯誤的RGB圖像,分析原因,調(diào)整輸入模型的數(shù)據(jù)量與超參數(shù);最后,將診斷準(zhǔn)確率最高的模型用于實(shí)測,檢驗(yàn)?zāi)P蛯?shí)際工況下的工作性能。
在滾動軸承的實(shí)際應(yīng)用中,由于其正常工作狀態(tài)占整個壽命周期的絕大部分,導(dǎo)致了在滾動軸承故障診斷的樣本數(shù)據(jù)集中,軸承健康樣本十分豐富而故障樣本缺乏,在此條件下訓(xùn)練的網(wǎng)絡(luò)模型容易學(xué)習(xí)到軸承的健康狀態(tài)特征,這與訓(xùn)練神經(jīng)網(wǎng)絡(luò)使它最大程度地識別故障信息的初衷背離。
文中基于SMOTE方法實(shí)現(xiàn)平衡數(shù)據(jù)集的重構(gòu),解決實(shí)際工況中故障樣本與健康樣本分布不均衡的問題,通過SMOTE方法對稀疏的故障樣本進(jìn)行過采樣,使故障樣本數(shù)量與健康樣本數(shù)量達(dá)到均衡狀態(tài),在數(shù)據(jù)輸入故障診斷模型前做系統(tǒng)而嚴(yán)謹(jǐn)?shù)奶幚?,提高模型對于軸承故障的診斷能力。
對于軸承故障中的類不平衡診斷問題,采用SMOTE方法主動獲取更多的滾動軸承混疊故障樣本,實(shí)現(xiàn)樣本的擴(kuò)充,其實(shí)現(xiàn)步驟如下:
(1)設(shè)滾動軸承內(nèi)圈、滾動體、保持架混疊故障樣本中每一個樣本為α,以歐氏距離為標(biāo)椎,計(jì)算這一樣本到滾動軸承內(nèi)圈、滾動體、保持架混疊故障樣本集中所有樣本的距離,得到其k近鄰。
(2)依據(jù)滾動軸承內(nèi)圈、滾動體、保持架混疊故障樣本集與健康樣本集的不平衡比例,確定采樣倍率m。
(3)滾動軸承內(nèi)圈、滾動體、保持架混疊故障樣本中每一個樣本為α,從其k近鄰中隨機(jī)選擇n個樣本,設(shè)選擇的樣本為βm。
(4)對每一個隨機(jī)選擇的β,分別與原樣本按照如下公式構(gòu)建新樣本,其中R[0,1]表示從0~1之間選擇隨機(jī)數(shù)值。
αnew=α+R[0,1]·|α-βm|
(1)
在遷移學(xué)習(xí)中,“領(lǐng)域”是學(xué)習(xí)的主體對象,由數(shù)據(jù)和生成這些數(shù)據(jù)的概率分布構(gòu)成,用D表示。D中的一個樣本數(shù)據(jù)包括輸入u和輸出v,其概率分布為P(u,v);樣本數(shù)據(jù)所處的特征空間和標(biāo)簽為X和Y,對于領(lǐng)域D中的每一個數(shù)據(jù)樣本都有u∈X,v∈Y。用Ds表示源域,Dt表示目標(biāo)域。遷移學(xué)習(xí)的過程即為,在Ds≠Dt的前提下,利用源域樣本學(xué)習(xí)一個目標(biāo)域的預(yù)測函數(shù)g(),使得g()在目標(biāo)域Dt上有最小的預(yù)測誤差,即
g*=argminE(u,v)∈Dt∈(f(u),v)
(2)
文中所提TConvNeXt網(wǎng)絡(luò),其源域?yàn)镮mageNet 22K圖像數(shù)據(jù)集,目標(biāo)域?yàn)檩S承故障數(shù)據(jù)集,所以Xs≠Xt,Ys≠Yt,并且概率分布Ps(u,v)≠Pt(u,v)。由于軸承故障的診斷數(shù)據(jù)集有標(biāo)簽,故提出有監(jiān)督遷移學(xué)習(xí)。
基于遷移學(xué)習(xí)的ConvNeXt 網(wǎng)絡(luò)應(yīng)用于故障診斷優(yōu)勢明顯,包括:(1)不需要針對不同種類的軸承從頭開始訓(xùn)練此類軸承的診斷模型,節(jié)省了時間成本;(2)模型是在共2.2萬類、約1 500萬張帶標(biāo)簽的二維圖像數(shù)據(jù)集完成的預(yù)訓(xùn)練,擴(kuò)充了軸承故障診斷網(wǎng)絡(luò)模型的訓(xùn)練數(shù)據(jù),使得模型更具有魯棒性、泛化能力更強(qiáng)。
ConvNeXt神經(jīng)網(wǎng)絡(luò)模型[14]是由Facebook人工智能實(shí)驗(yàn)室(Facebook AI Research)和加州大學(xué)伯克利分校(UC Berkeley)在2022年提出的用于計(jì)算機(jī)視覺任務(wù)的網(wǎng)絡(luò)模型,其目的之一是測試“純卷積神經(jīng)網(wǎng)絡(luò)”在計(jì)算機(jī)視覺任務(wù)所能達(dá)到的極限,原因是2020年Vision-Transformer模型[15]的出現(xiàn),使得卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺等領(lǐng)域逐步被替代,作者希望研究人員能夠重新思考卷積網(wǎng)絡(luò)在計(jì)算機(jī)視覺等任務(wù)中的重要性。TConvNeXt故障診斷模型主要結(jié)構(gòu)與原理如圖1所示。
采用深度卷積層的原因之一是因?yàn)槠渚哂惺股窠?jīng)網(wǎng)絡(luò)計(jì)算量輕量化的優(yōu)勢,深度卷積層在2017年HOWARD等[16]提出的輕量級神經(jīng)網(wǎng)絡(luò)MobileNet中已經(jīng)有了成功的運(yùn)用。有別于傳統(tǒng)卷積層,深度卷積層的卷積核個數(shù)、輸入特征矩陣通道數(shù)以及輸出特征矩陣通道數(shù)三者相等;每個卷積核的深度為1,卷積層中每個卷積核負(fù)責(zé)提取輸入特征矩陣一個通道上的信息。而傳統(tǒng)卷積層中輸出特征矩陣的通道數(shù)與輸入特征矩陣的通道數(shù)二者沒有必然聯(lián)系。
通過以下計(jì)算說明深度卷積層與傳統(tǒng)卷積層在計(jì)算量上的差別:
設(shè)卷積核的大小為κ×κ,輸入特征矩陣的大小為λ×λ,通道數(shù)為μ;輸出特征矩陣的通道數(shù)為ν。
傳統(tǒng)卷積層計(jì)算量為:κ2×μ×ν×λ2
(3)
深度卷積層計(jì)算量為:κ2×μ×λ2
(4)
由公式(3)(4)可知傳統(tǒng)卷積層的計(jì)算量是深度卷積層的ν倍。
在TConvNeXt神經(jīng)網(wǎng)絡(luò)中對深度卷積層進(jìn)行了擴(kuò)張率r=3的擴(kuò)張,使卷積層的感受野擴(kuò)大。設(shè)擴(kuò)張后的卷積核大小為κm,則:
κm=κ+(κ-1)(r-1)
(5)
擴(kuò)張卷積能夠在不增加網(wǎng)絡(luò)模型深度和計(jì)算量的前提下增大感受野,使卷積層提取到的樣本中包含更多的特征信息。
深度擴(kuò)張卷積層處于每個TConvNeXt模塊的第一層,如圖1所示。
如圖1所示,TConvNeXt模塊由卷積核大小為7×7、步距為1、擴(kuò)張率為3的深度擴(kuò)張卷積層,歸一化層(LayerNorm),卷積核大小為7×7、步距為1的傳統(tǒng)卷積層,GELU激活函數(shù)等構(gòu)成;下采樣模塊由歸一化層(LayerNorm)與卷積核大小為2×2、步距為2的卷積層構(gòu)成。
文中以一維原始振動信號為基礎(chǔ),完成故障診斷模型從訓(xùn)練到實(shí)際檢測的全過程,實(shí)現(xiàn)步驟如下:
(1)將采用SMOTE方法重構(gòu)的平衡數(shù)據(jù)集中的一維時間序列數(shù)據(jù)樣本,通過格拉姆角場編碼為三通道的RGB二維圖像數(shù)據(jù)集;
(2)對于完成預(yù)訓(xùn)練的ConvNeXt網(wǎng)絡(luò),凍結(jié)除全連接層之外其他層的權(quán)重,用編碼后的二維圖像訓(xùn)練集訓(xùn)練全連接層的權(quán)重,完成對TConvNeXt網(wǎng)絡(luò)的預(yù)訓(xùn)練-微調(diào)過程;
(3)通過Grad-CAM分析TConvNeXt網(wǎng)絡(luò)對于滾動軸承故障的各個類別所關(guān)注的區(qū)域,繪制熱力圖;對完成預(yù)訓(xùn)練-微調(diào)的TConvNeXt網(wǎng)絡(luò)使用測試集測試對各種故障的診斷精度;
(4)將完成測試的TConvNeXt故障診斷模型用于真實(shí)故障的診斷中,檢驗(yàn)其實(shí)際工作性能。流程如圖1所示,包括數(shù)據(jù)處理部分、預(yù)訓(xùn)練-微調(diào)、熱力圖繪制、測試集測試、實(shí)測。
為驗(yàn)證TConvNeXt故障診斷模型的實(shí)用性與泛化性,使用3組滾動軸承數(shù)據(jù)集,其中數(shù)據(jù)集B凱斯西儲大學(xué)軸承數(shù)據(jù)集與數(shù)據(jù)集C西安交通大學(xué)軸承數(shù)據(jù)集(XJTU-SY軸承數(shù)據(jù)集[17])為公開數(shù)據(jù)集,其目的是與其他診斷模型的診斷性能做公平對比。
選用的數(shù)據(jù)集由3個滾動軸承數(shù)據(jù)集包括:實(shí)驗(yàn)室軸承數(shù)據(jù)集A、凱斯西儲大學(xué)軸承數(shù)據(jù)集B、西安交通大學(xué)軸承數(shù)據(jù)集C。該診斷數(shù)據(jù)集的詳細(xì)信息見表1。
表1 故障診斷數(shù)據(jù)集
數(shù)據(jù)集A來源于軸承故障信號采集試驗(yàn)臺,實(shí)驗(yàn)裝置如圖2所示,該試驗(yàn)臺主要由三相電機(jī)、支撐軸承、實(shí)驗(yàn)用滾動軸承等組成。數(shù)據(jù)集的振動樣本采自實(shí)驗(yàn)用滾動軸承 NTN6205-2RS,包括正常狀態(tài)、內(nèi)圈故障、外圈故障及滾動體故障4種健康狀態(tài)。采樣頻率為25.6 kHz,滾動體故障RF1與RF2的載質(zhì)量分別為150、500 kg,模擬實(shí)際軸承故障診斷中工況的不同。數(shù)據(jù)集B來自美國凱斯西儲大學(xué)的軸承數(shù)據(jù)中心,采樣頻率設(shè)置為 12 kHz,滾動體故障RF1、RF2對應(yīng)滾動體故障直徑分別為0.177 8、0.355 6 mm。
圖2 軸承故障信號采集試驗(yàn)臺
數(shù)據(jù)集C來自西安交通大學(xué)機(jī)械工程學(xué)院。該數(shù)據(jù)集中的振動樣本采自LDK UER204型滾動軸承,包括內(nèi)圈故障(IF)、外圈故障(OF1與OF2)、保持架故障(CF)和內(nèi)圈、保持架、滾動體混疊故障(MF)4種故障類型。采樣頻率設(shè)置為25.6 kHz。外圈故障OF1對應(yīng)工況為轉(zhuǎn)速2 100 r/min、徑向力12 kN,OF2對應(yīng)工況為轉(zhuǎn)速2 400 r/min、徑向力12 kN。數(shù)據(jù)集C中每類故障數(shù)據(jù)的采集是軸承從正常狀態(tài)到故障狀態(tài)的振動信號,選取前期含有微弱故障的信號組成數(shù)據(jù)集,摒棄了后期軸承具有明顯故障所采集到的信號,以訓(xùn)練模型學(xué)習(xí)軸承早期故障特征。
5.2.1 遷移學(xué)習(xí)對TConvNeXt故障診斷模型的性能影響
通過故障診斷數(shù)據(jù)集訓(xùn)練模型,使模型能夠識別軸承的故障。所取得的實(shí)驗(yàn)結(jié)果如表2所示:模型1不使用遷移學(xué)習(xí),將數(shù)據(jù)集A輸入模型,經(jīng)過100次迭代,準(zhǔn)確率為55.7%;模型2使用遷移學(xué)習(xí),經(jīng)過10次迭代,準(zhǔn)確率為96.6%。由此可知:即使經(jīng)過極少次數(shù)的訓(xùn)練,所提方法仍能達(dá)到對軸承故障的判別要求,能夠利用學(xué)習(xí)到的判別經(jīng)驗(yàn)識別故障。圖3所示為模型1和模型2對數(shù)據(jù)集A的診斷可視化結(jié)果。表3和表4給出了不同模型下每一類故障的精確率、召回率、特異度,可以得出:模型1和模型2都對內(nèi)圈故障IF達(dá)到100%的診斷精度:對于滾動體故障1,模型1在200個測試樣本中只正確識別一個樣本,召回率僅0.5%,模型2僅在10次迭代中達(dá)到87.0%的召回率,在200個測試樣本中正確識別174個樣本。
表2 遷移學(xué)習(xí)實(shí)驗(yàn)結(jié)果對比
表3 不使用遷移學(xué)習(xí)實(shí)驗(yàn)結(jié)果
表4 使用遷移學(xué)習(xí)實(shí)驗(yàn)結(jié)果
圖3 性能對比
5.2.2 TConvNeXt故障診斷模型對于混疊故障的診斷性能與實(shí)際應(yīng)用情況
將TConvNeXt故障診斷模型用于對數(shù)據(jù)集C的診斷,共測試5次,每次實(shí)驗(yàn)迭代10輪,各次實(shí)驗(yàn)測試結(jié)果如圖4所示,表5為每次實(shí)驗(yàn)的診斷準(zhǔn)確率及各次實(shí)驗(yàn)中每類故障的診斷精確率、召回率等信息。
表5 TConvNeXt故障診斷模型5次實(shí)驗(yàn)結(jié)果
圖4 混合故障診斷結(jié)果
由表5可知:5次測試實(shí)驗(yàn)中最低準(zhǔn)確率為92.5%,表明TConvNeXt故障診斷模型對于混疊故障具有高診斷精度。為測試提出模型在實(shí)際應(yīng)用中是否有效,將上述實(shí)驗(yàn)中具有94.5%的TConvNeXt故障診斷模型用于實(shí)際故障測試,從數(shù)據(jù)集C中隨機(jī)選取5段故障信號,通過格拉姆角場分別轉(zhuǎn)換為5張RGB圖像,輸入TConvNeXt故障診斷模型得出診斷結(jié)果。由表6可知:在實(shí)際故障診斷環(huán)境中,TConvNeXt故障診斷模型能夠達(dá)到要求的診斷精度,模型輸出對于故障的診斷結(jié)果,概率值表示故障屬于此類故障的概率,這為旋轉(zhuǎn)機(jī)械提供了故障判定依據(jù)。對于早期發(fā)現(xiàn)的軸承故障應(yīng)該對軸承運(yùn)行環(huán)境做以下檢查以避免軸承嚴(yán)重失效:(1)軸承裝配的預(yù)緊力;(2)軸承潤滑狀態(tài);(3)軸承座支撐情況;(4)軸與軸承內(nèi)圈以及軸承座與軸承外圈的配合精度。
表6 TConvNeXt故障診斷模型實(shí)際應(yīng)用結(jié)果
為直觀分析提出方法的有效性,利用Grad-CAM方法[18]將網(wǎng)絡(luò)提取的故障特征以二維熱力圖的方式呈現(xiàn)。Grad-CAM方法能夠進(jìn)一步分析說明網(wǎng)絡(luò)模型對于某種故障所關(guān)注的區(qū)域,查看網(wǎng)絡(luò)模型是否學(xué)習(xí)到正確的特征或信息。圖5所示為內(nèi)圈故障樣本,圖中顯示了TConvNeXt網(wǎng)絡(luò)模型最后一個卷積層對于該樣本的重點(diǎn)關(guān)注區(qū)域,其中圖5(a)為模型在測試過程中診斷正確時重點(diǎn)關(guān)注區(qū)域,圖5(b)為模型在測試過程中診斷錯誤時重點(diǎn)關(guān)注區(qū)域。
圖5 Grad-CAM熱力圖重點(diǎn)關(guān)注區(qū)域
由圖5可知:圖(b)所關(guān)注區(qū)域偏離主對角線,重點(diǎn)關(guān)注的特征不是主要區(qū)分故障的關(guān)鍵。通過Grad-CAM方法,可以發(fā)現(xiàn)模型診斷精度不高的具體原因,為下一步調(diào)整模型預(yù)訓(xùn)練過程中的平衡數(shù)據(jù)集大小以及網(wǎng)絡(luò)的學(xué)習(xí)率等超參數(shù)提供指導(dǎo)。
5.2.3 與其他神經(jīng)網(wǎng)絡(luò)的對比實(shí)驗(yàn)
為進(jìn)一步說明提出方法的優(yōu)勢,對比分析了提出方法與其他3種方法的診斷結(jié)果,如圖6所示。
圖6 診斷結(jié)果對比
(1)Vision-Transformer網(wǎng)絡(luò)[15]。該網(wǎng)絡(luò)與提出方法輸入數(shù)據(jù)方式相同,訓(xùn)練次數(shù)相同,使用測試集測試其診斷性能,對于數(shù)據(jù)集A的診斷準(zhǔn)確率為40.98%,對于數(shù)據(jù)集B的診斷準(zhǔn)確率為36.61%,對于數(shù)據(jù)集C的診斷準(zhǔn)確率為23.72%。結(jié)果表明:Vision-Transformer網(wǎng)絡(luò)對于滾動軸承健康狀態(tài)的識別精度不高,究其原因是網(wǎng)絡(luò)深層缺乏對于滾動軸承數(shù)據(jù)特征的提取能力。
(2)Swin Transformer網(wǎng)絡(luò)[19]。該網(wǎng)絡(luò)相較于Vision-Transformer網(wǎng)絡(luò),對于滾動軸承數(shù)據(jù)特征的學(xué)習(xí)能力較強(qiáng),對數(shù)據(jù)集B的診斷準(zhǔn)確率達(dá)到了77.07%,但在處理具有混疊故障的數(shù)據(jù)集C時準(zhǔn)確率下降明顯,究其原因是網(wǎng)絡(luò)缺乏預(yù)訓(xùn)練-微調(diào)過程,網(wǎng)絡(luò)各層需要重新確定相應(yīng)權(quán)重,需要大量數(shù)據(jù)訓(xùn)練。
(3)EfficientNetV2網(wǎng)絡(luò)[20]。與前2種網(wǎng)絡(luò)不同,EfficientNetV2網(wǎng)絡(luò)是一個純卷積網(wǎng)絡(luò),與具有自注意力機(jī)制的Vision-Transformer網(wǎng)絡(luò)相比具有更好的故障識別性能,但在各個數(shù)據(jù)集中都無法達(dá)到軸承故障診斷要求。對比提出方法的診斷結(jié)果可知:提出方法具有更高的泛化性與故障診斷精度。它一方面能夠識別單一故障,并且能正確識別不同工況下的同一故障,這為判斷故障嚴(yán)重程度提供了依據(jù)。另一方面在混疊故障的診斷中,具有可靠的診斷精度,通過遷移學(xué)習(xí)使網(wǎng)絡(luò)模型學(xué)習(xí)到足夠的先驗(yàn)經(jīng)驗(yàn);凍結(jié)除全連接層之外的全部權(quán)重,僅訓(xùn)練全連接層適合于滾動軸承故障數(shù)據(jù)缺乏的現(xiàn)實(shí)情況。
文中基于平衡數(shù)據(jù)集重構(gòu)與改進(jìn)的深度卷積神經(jīng)網(wǎng)絡(luò)模型,同時從數(shù)據(jù)預(yù)處理層面與網(wǎng)絡(luò)體系設(shè)計(jì)層面開展研究,解決實(shí)際應(yīng)用中由于復(fù)合故障樣本與健康樣本類別不平衡導(dǎo)致診斷精度低的問題。通過重采樣方法將不平衡數(shù)據(jù)集重構(gòu)為平衡數(shù)據(jù)集,在實(shí)際數(shù)據(jù)沒有增加的情況下,讓有限的數(shù)據(jù)發(fā)揮出更大的價值,使模型同樣適用于小樣本情形下的應(yīng)用。
通過有監(jiān)督遷移學(xué)習(xí)與預(yù)訓(xùn)練-微調(diào)方法,充分發(fā)揮深度學(xué)習(xí)網(wǎng)絡(luò)特征提取能力的同時,訓(xùn)練網(wǎng)絡(luò)對于滾動軸承數(shù)據(jù)集的學(xué)習(xí)能力,實(shí)現(xiàn)對軸承混合故障的診斷。通過平衡數(shù)據(jù)集訓(xùn)練集對所提模型進(jìn)行充分訓(xùn)練,之后使用平衡數(shù)據(jù)集的測試集測試模型在實(shí)驗(yàn)室環(huán)境下診斷軸承故障所獲得的準(zhǔn)確率。為檢驗(yàn)?zāi)P驮趯?shí)際工作中對于滾動軸承混合故障的診斷效果,將測試準(zhǔn)確率最高的模型用于實(shí)測,實(shí)測結(jié)果表明:該方法能夠很好地識別混合故障,具有廣泛的應(yīng)用前景。