黃曉玲, 周 磊, 張德平
1(南京航空航天大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 南京 211106)
2(北京中船信息科技有限公司, 北京 100044)
滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械中易發(fā)故障的零件. 在旋轉(zhuǎn)機(jī)械中由軸承損壞引起的故障約占30%. 因此, 滾動(dòng)軸承故障診斷對(duì)旋轉(zhuǎn)機(jī)械設(shè)備的狀態(tài)監(jiān)測(cè)與維護(hù)有著重要意義[1].
傳統(tǒng)的機(jī)器學(xué)習(xí)故障診斷方法流程包括: 數(shù)據(jù)獲取, 人工設(shè)計(jì)特征, 特征提取和選擇, 分類器訓(xùn)練. 然而,在數(shù)據(jù)預(yù)處理階段, 機(jī)器學(xué)習(xí)故障診斷存在一定的局限性: 為復(fù)雜操作條件下的數(shù)據(jù)人工設(shè)計(jì)特征需要耗費(fèi)大量人力, 并且嚴(yán)重依賴領(lǐng)域?qū)I(yè)知識(shí), 難度較高.此外, 特征挖掘和決策是分開設(shè)計(jì)的, 這種不同步的優(yōu)化將消耗大量時(shí)間并限制模型的性能.
作為機(jī)器學(xué)習(xí)的一個(gè)分支, 深度學(xué)習(xí)方法旨在構(gòu)建非線性轉(zhuǎn)換的深度神經(jīng)網(wǎng)絡(luò), 挖掘數(shù)據(jù)深層特征. 與傳統(tǒng)數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法相比, 深度學(xué)習(xí)無(wú)需大量專業(yè)知識(shí)即可自動(dòng)從原始輸入的簡(jiǎn)單表示中學(xué)習(xí)到隱藏的高級(jí)層次特征, 是一種端到端的模型. 基于這些優(yōu)點(diǎn), 深度學(xué)習(xí)在過(guò)去幾年中引發(fā)了智能故障診斷的浪潮. 陳志剛等[2]提出一種改進(jìn)集成深層自編碼器方法, 設(shè)計(jì)了3種小波卷積自編碼器對(duì)軸承振動(dòng)信號(hào)進(jìn)行無(wú)監(jiān)督預(yù)訓(xùn)練和有監(jiān)督微調(diào), 最后, 為保證診斷結(jié)果的準(zhǔn)確性和穩(wěn)定性, 用加權(quán)平均法輸出診斷結(jié)果. 楊平等[3]基于卷積膠囊網(wǎng)絡(luò), 使用帶有兩個(gè)卷積層的卷積網(wǎng)絡(luò)直接對(duì)原始一維時(shí)域信號(hào)進(jìn)行特征提取, 然后將其送入膠囊網(wǎng)絡(luò), 輸出故障診斷結(jié)果. 周陳林等[4]基于提出的改進(jìn)型卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)基本準(zhǔn)則, 挖掘原始信號(hào)的特征, 直接用卷積神經(jīng)網(wǎng)絡(luò)在滾動(dòng)軸承原始振動(dòng)信號(hào)上進(jìn)行“端到端”的學(xué)習(xí)訓(xùn)練. Ramu等[5]提出一種基于希爾伯特變換和人工神經(jīng)網(wǎng)絡(luò)的電機(jī)故障診斷方法, 首先提取信號(hào)的幅值和頻率成分, 然后以最小均方誤差為優(yōu)化目標(biāo), 訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)故障的高精度識(shí)別. Li等[6]通過(guò)小波包變換, 將小波包系數(shù)轉(zhuǎn)化為矩陣形式進(jìn)而轉(zhuǎn)化為像素, 形成灰度圖輸入到二維卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行故障診斷.
在實(shí)際工業(yè)環(huán)境中, 不同的工作負(fù)載會(huì)導(dǎo)致同類型故障信號(hào)的內(nèi)部特征分布存在巨大差異, 使得模型在某個(gè)工況下訓(xùn)練完成后, 在另一工況下的數(shù)據(jù)上表現(xiàn)不佳. 這種因數(shù)據(jù)分布不同而引起的模型性能下降現(xiàn)象被稱為域適應(yīng)問(wèn)題. 深度學(xué)習(xí)要想應(yīng)用到工業(yè)領(lǐng)域, 必須具有良好的域適應(yīng)能力, 能夠在變化的工況下實(shí)現(xiàn)高精度故障診斷. 目前, 針對(duì)深度學(xué)習(xí)故障診斷的域適應(yīng)問(wèn)題, 大多數(shù)研究采用遷移學(xué)習(xí)理論. Wen等[7]提出帶有 51 個(gè)卷積層的 TCNN網(wǎng)絡(luò)用于故障診斷. 該方法與遷移學(xué)習(xí)結(jié)合, 用預(yù)訓(xùn)練的ResNet-50 網(wǎng)絡(luò)對(duì)原始二維振動(dòng)信號(hào)進(jìn)行故障診斷; 院老虎等[8]將收集到的原始振動(dòng)數(shù)據(jù)轉(zhuǎn)換為振動(dòng)信號(hào)圖作為訓(xùn)練樣本, 用預(yù)訓(xùn)練的AlexNet網(wǎng)絡(luò)進(jìn)行訓(xùn)練和微調(diào), 完成故障診斷任務(wù). 陳仁祥等[9]提出一種自適應(yīng)正則化遷移學(xué)習(xí),首先訓(xùn)練基分類器預(yù)測(cè)目標(biāo)樣本的偽標(biāo)簽, 然后利用聯(lián)合分布對(duì)齊兩域分布, 最后使用結(jié)構(gòu)風(fēng)險(xiǎn)最小化框架建立的分類器完成不同工況下的故障診斷. 但是以上文獻(xiàn)中應(yīng)用的遷移學(xué)習(xí)方法仍然依賴于測(cè)試集樣本的統(tǒng)計(jì)信息, 微調(diào)模型需要的參數(shù)量大, 且調(diào)參步驟復(fù)雜, 不具備很好的應(yīng)用性. 此外, 這些研究因?yàn)橹攸c(diǎn)關(guān)注模型的遷移能力而忽略了對(duì)數(shù)據(jù)特征的充分預(yù)處理過(guò)程, 沒(méi)有從數(shù)據(jù)的角度挖掘出能增強(qiáng)網(wǎng)絡(luò)識(shí)別能力的判別性工況特征, 缺少全面性.
因此, 針對(duì)當(dāng)前研究中存在的數(shù)據(jù)預(yù)處理不充分和深度學(xué)習(xí)故障診斷方法在域適應(yīng)上的局限性, 本文提出一種基于特征融合和混類增強(qiáng)的故障診斷方法.貢獻(xiàn)如下:
(1) 針對(duì)故障數(shù)據(jù)特征提取不足的問(wèn)題, 提出一種特征融合方法, 在數(shù)據(jù)預(yù)處理階段, 綜合考慮原始振動(dòng)信號(hào)的時(shí)頻域特征、工況特征和時(shí)間差分特征, 并將這些特征與原始信號(hào)融合在一起形成新的特征向量,增加特征多樣性.
(2) 針對(duì)變工況下數(shù)據(jù)分布差異大導(dǎo)致模型故障識(shí)別率低的問(wèn)題, 提出一種混類增強(qiáng)策略拓展訓(xùn)練數(shù)據(jù)分布, 增大訓(xùn)練集規(guī)模, 增加訓(xùn)練樣本的多樣性, 使模型學(xué)習(xí)到數(shù)據(jù)的本質(zhì)特征, 提高模型域適應(yīng)能力.
(3) 在CWRU數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明, 該方法在同工況下的預(yù)測(cè)精度高達(dá)100%, 在變工況下的平均預(yù)測(cè)精度高達(dá)93.28%, 域適應(yīng)性強(qiáng).
本文提出的基于特征融合和混類增強(qiáng)的深度滾動(dòng)軸承故障診斷方法框架如圖1所示.
圖1上方虛線框是訓(xùn)練過(guò)程, 下方虛線框是測(cè)試過(guò)程. 上方信號(hào)和下方信號(hào)來(lái)源于不同的工況, 即樣本的分布不同. 在訓(xùn)練過(guò)程中, 原始一維振動(dòng)信號(hào)經(jīng)多特征融合后形成新的一維特征向量, 再經(jīng)相空間重構(gòu)轉(zhuǎn)換成二維圖像信號(hào), 通過(guò)本文提出的混類增強(qiáng)策略拓展訓(xùn)練數(shù)據(jù)的分布, 提高模型在對(duì)抗樣本上的魯棒性.最終, 訓(xùn)練好的模型可以在訓(xùn)練樣本分布之外的測(cè)試樣本上進(jìn)行高精度故障診斷. 整個(gè)故障診斷流程可以概括為以下5步:
圖1 特征融合和混類增強(qiáng)故障診斷方法框架
(1) 對(duì)原始信號(hào)采用時(shí)頻分析方法提取時(shí)頻特征,并根據(jù)工況條件構(gòu)建工況特征, 再計(jì)算時(shí)間差分特征,然后將這3類特征與原始一維信號(hào)融合, 得到新的一維特征向量;
(2) 基于相空間重構(gòu)理論, 將新的一維信號(hào)樣本轉(zhuǎn)換為二維圖像格式, 作為神經(jīng)網(wǎng)絡(luò)的輸入;
(3) 對(duì)轉(zhuǎn)換后的訓(xùn)練樣本做混類增強(qiáng), 構(gòu)造新的虛擬樣本和虛擬標(biāo)簽, 擴(kuò)充訓(xùn)練樣本分布;
(4) 用混類增強(qiáng)后得到的樣本作為訓(xùn)練集輸入ResNet18網(wǎng)絡(luò)中訓(xùn)練模型;
(5) 將訓(xùn)練完畢的模型在未做過(guò)混類增強(qiáng)的樣本上測(cè)試, 獲得故障診斷分類結(jié)果.
得益于硬件的高速發(fā)展, 現(xiàn)代工業(yè)設(shè)備的歷史數(shù)據(jù)大多由傳感器記錄保存. 但是, 傳感器獲取的數(shù)據(jù)可能會(huì)存在異常值, 適當(dāng)?shù)墓收咸卣魈崛】梢詼p輕異常值對(duì)故障診斷的負(fù)面影響.
由于機(jī)械故障信號(hào)存在周期性脈沖, 因此提取具有信息性和判別性的時(shí)頻域特征有助于提高故障數(shù)據(jù)的質(zhì)量[10]. 另一方面, 故障數(shù)據(jù)的原始特征通常是固定的, 當(dāng)設(shè)備在單一工況下運(yùn)行時(shí), 這些特征用于故障診斷是足夠的. 當(dāng)設(shè)備在變化的負(fù)載中工作時(shí), 深度學(xué)習(xí)模型無(wú)法僅利用單工況下的固定特征掌握數(shù)據(jù)的本質(zhì)信息. 由傳感器在不同操作條件下觀測(cè)到的幀間動(dòng)態(tài)變化數(shù)據(jù)中包含大量的設(shè)備降級(jí)信息[11], 因此, 獲取工況特征和時(shí)間差分特征也是有必要的.
綜上所述, 本文提出一種新的特征融合方法, 在將原始信號(hào)輸入模型前對(duì)數(shù)據(jù)進(jìn)行預(yù)處理, 從多個(gè)角度提取多個(gè)特征, 包括時(shí)頻特征、工況特征和時(shí)間差分特征, 實(shí)現(xiàn)多特征融合, 增加特征多樣性和全面性, 為網(wǎng)絡(luò)提供高質(zhì)量的輸入. 以下是對(duì)這些特征的具體描述:
(1) 原始特征: 原始一維振動(dòng)信號(hào), 由加速度計(jì)獲得, 未經(jīng)過(guò)任何處理, 形式為時(shí)間序列.
(2) 時(shí)頻特征: 時(shí)窗信號(hào)的最大值、均值、方差、均方根值、偏度、峰度、峰值、譜偏態(tài)系數(shù)、譜峰態(tài)系數(shù)、小波系數(shù). 對(duì)于小波系數(shù), 本文使用db1進(jìn)行8級(jí)小波包分解, 得到與故障特征頻率相關(guān)的能量較高的小波系數(shù). 每個(gè)時(shí)頻特征是一個(gè)統(tǒng)計(jì)值, 統(tǒng)計(jì)出的多個(gè)時(shí)頻特征可以構(gòu)建形成新的一維時(shí)頻特征向量.表1給出了各個(gè)時(shí)頻特征的計(jì)算公式.
表1 時(shí)頻特征計(jì)算公式
(3) 工況特征: 當(dāng)前工作條件的獨(dú)熱(one-hot)編碼. 以本文實(shí)驗(yàn)的4種工況為例, 獨(dú)熱編碼對(duì)應(yīng)的特征向量分別為 [1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0], [0, 0,0, 1].
(4) 時(shí)間差分特征: 由于樣本是時(shí)間序列, 將每個(gè)樣本看成一個(gè)時(shí)間窗, 計(jì)算該時(shí)間窗內(nèi)的變化幅度特征, 構(gòu)成時(shí)間差分特征向量. 具體地, 定義一個(gè)時(shí)間窗的時(shí)間序列為:
X=(x1,x2,···,xm)
以第一個(gè)時(shí)間點(diǎn)為起點(diǎn), 依次從后往前求后一個(gè)時(shí)間點(diǎn)對(duì)應(yīng)值相對(duì)于前一個(gè)時(shí)間點(diǎn)對(duì)應(yīng)值的變化幅度,作為新的特征, 即:
最終得到新的時(shí)間差分特征向量為:
為解決新的時(shí)間序列與原始時(shí)間序列的時(shí)間點(diǎn)錯(cuò)位問(wèn)題(新時(shí)間序列的第i個(gè)點(diǎn)表示的是原始特征序列的第i+1個(gè)點(diǎn)相對(duì)前一時(shí)間點(diǎn)的變化幅度), 通過(guò)時(shí)間窗進(jìn)行序列劃分時(shí), 從第2個(gè)時(shí)間窗開始, 其起始時(shí)間為上一時(shí)間窗結(jié)束時(shí)間, 這樣可以保證數(shù)據(jù)變化特征的連續(xù)性.
經(jīng)過(guò)以上步驟后, 將提取的時(shí)頻特征向量、工況特征向量和時(shí)間差分特征向量與原始一維信號(hào)拼接形成新的一維特征向量, 該向量增加了特定工況下的判別性信息, 更具全面性, 如圖2所示.
圖2 新的特征向量
本文設(shè)計(jì)的一維振動(dòng)信號(hào)到二維時(shí)頻特征圖像的轉(zhuǎn)換過(guò)程如圖3所示, 包括兩個(gè)步驟:
圖3 故障信號(hào)到圖像的轉(zhuǎn)換
(1) 一維振動(dòng)信號(hào)采樣, 經(jīng)第1.1節(jié)的特征融合方法形成新的一維特征向量;
(2) 一維特征向量重構(gòu)為二維圖像.
以一維格式為輸入數(shù)據(jù)的故障診斷方法受感受野限制, 在學(xué)習(xí)的過(guò)程中很難提取到設(shè)備故障固有模式的相關(guān)特征. 與一維信號(hào)相比, 圖像是二維數(shù)據(jù)矩陣,能夠承載更強(qiáng)大的信息, 表示更復(fù)雜的結(jié)構(gòu)分布. 為了捕獲周期性信號(hào)的特征并利用深度神經(jīng)網(wǎng)絡(luò)在圖像分類上的強(qiáng)大特征提取能力, 本文基于相空間重構(gòu)理論,將特征融合后的一維信號(hào)重構(gòu)為二維圖像格式作為深度神經(jīng)網(wǎng)絡(luò)的輸入, 具體轉(zhuǎn)換過(guò)程為:
(1) 將原始一維信號(hào)劃分為n個(gè)相等的部分;
(2) 每個(gè)部分按信號(hào)圖像的行順序排列:
其中,I表示重構(gòu)后的信號(hào)圖像,x(t)是t時(shí)刻的振動(dòng)信號(hào). 得到二維圖像格式的樣本后, 對(duì)每個(gè)樣本歸一化處理并賦予像素值:
其中,pi表 示當(dāng)前樣本的第i個(gè)采樣點(diǎn),pmin和pmax分別表示當(dāng)前樣本所有采樣點(diǎn)的最小值和最大值. 轉(zhuǎn)換后的圖像格式為單通道, 為了滿足本文選用神經(jīng)網(wǎng)絡(luò)模型的輸入格式, 將單通道拓展為3通道, 每個(gè)通道擁有相同的信息.
深度學(xué)習(xí)的另一個(gè)局限性在于: 網(wǎng)絡(luò)深度的增加會(huì)帶來(lái)許多優(yōu)化相關(guān)問(wèn)題, 如梯度爆炸、消失等. 深度殘差網(wǎng)絡(luò)(residual network, ResNet)[12]的提出有效緩解了深度神經(jīng)網(wǎng)絡(luò)模型增加層數(shù)后帶來(lái)的退化問(wèn)題,從根本上杜絕了梯度消失現(xiàn)象, 分類和收斂性能均優(yōu)于普通的深層網(wǎng)絡(luò)結(jié)構(gòu). 因此本文采用深度殘差網(wǎng)絡(luò)作為故障診斷訓(xùn)練模型.深度殘差網(wǎng)絡(luò)由殘差模塊構(gòu)建, 圖4展示了殘差網(wǎng)絡(luò)塊的結(jié)構(gòu).
如圖4所示, 在殘差塊中, 輸入可通過(guò)跨層的數(shù)據(jù)線路更快地向前傳播, 不會(huì)給網(wǎng)絡(luò)增加額外的參數(shù)和計(jì)算量. 殘差網(wǎng)絡(luò)通過(guò)采用這樣一種跳躍連接的結(jié)構(gòu),學(xué)習(xí)信號(hào)的差值, 在保持網(wǎng)絡(luò)深度的同時(shí)提高了模型準(zhǔn)確率, 并且易于優(yōu)化. 由于工業(yè)落地環(huán)境要求神經(jīng)網(wǎng)絡(luò)模型有速度快、體型小的特點(diǎn), ResNet18網(wǎng)絡(luò)相較于其他ResNet50、ResNet101等網(wǎng)絡(luò)更為輕量, 并且足夠完成實(shí)驗(yàn)中數(shù)據(jù)場(chǎng)景, 因此本文選用ResNet18網(wǎng)絡(luò)作為訓(xùn)練模型, 該網(wǎng)絡(luò)有17個(gè)卷積層和1個(gè)全連接層.
圖4 殘差網(wǎng)絡(luò)塊結(jié)構(gòu)示意圖
深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練、更新參數(shù)的依據(jù)來(lái)源于給定的訓(xùn)練數(shù)據(jù), 但是在故障診斷領(lǐng)域, 單一工況下的訓(xùn)練數(shù)據(jù)只涵蓋整個(gè)數(shù)據(jù)分布的一部分, 導(dǎo)致訓(xùn)練出來(lái)的網(wǎng)絡(luò)只能在擁有類似分布的數(shù)據(jù)上表現(xiàn)良好, 在分布差異大的數(shù)據(jù)上表現(xiàn)不佳. 為了充分利用有限數(shù)據(jù), 更好地描述數(shù)據(jù)的整個(gè)分布, 提高模型的域適應(yīng)能力, 有必要進(jìn)行數(shù)據(jù)增強(qiáng)[13]. 在計(jì)算機(jī)視覺(jué)領(lǐng)域, 傳統(tǒng)的數(shù)據(jù)增強(qiáng)方式通過(guò)對(duì)圖像進(jìn)行裁剪、旋轉(zhuǎn)、縮放等幾何變換生成新的訓(xùn)練樣本, 圖像標(biāo)簽保持不變. 然而, 這樣的數(shù)據(jù)增強(qiáng)方法存在以下局限性[14]:
(1) 生成的新樣本局限于同一類別;
(2) 不同類別不同樣本之間的關(guān)系沒(méi)有被建模;
(3) 由于先驗(yàn)知識(shí)有限, 能拓展的分布也有限, 模型仍然可能會(huì)產(chǎn)生過(guò)擬合現(xiàn)象.
為解決上述問(wèn)題, 本文提出一種新的混類增強(qiáng)方法, 改善故障診斷模型在變工況下由于數(shù)據(jù)分布不一致表現(xiàn)出的域適應(yīng)性差的問(wèn)題. 該方法是一種非常規(guī)的數(shù)據(jù)增強(qiáng)方式, 通過(guò)線性插值得到新的拓展數(shù)據(jù), 即來(lái)源于訓(xùn)練樣本鄰近分布的虛擬訓(xùn)練樣本和標(biāo)簽.混類增強(qiáng)對(duì)樣本的處理過(guò)程如下:
其中,xi和xj代表從訓(xùn)練數(shù)據(jù)中隨機(jī)抽取的兩個(gè)樣本,yi和yj代表對(duì)應(yīng)的標(biāo)簽獨(dú)熱編碼. λ ~Beta[α,α],α∈(0,∞). 從式(4)和式(5)可以看出, 新的樣本——標(biāo)簽數(shù)據(jù) (x?,y?)由兩個(gè)樣本——標(biāo)簽數(shù)據(jù)對(duì)以凸組合的方式線性疊加生成. 該方法使得新樣本來(lái)源于訓(xùn)練樣本的鄰近分布, 不同樣本間的分布更為平滑, 規(guī)范了模型的線性表達(dá), 加強(qiáng)了模型抵御分布外的對(duì)抗樣本的能力. 混類增強(qiáng)實(shí)際可以看作對(duì)模型的一種正則化方案. 此外, 混類增強(qiáng)的實(shí)現(xiàn)簡(jiǎn)單而有效, 符合奧卡姆剃刀原理.
混類增強(qiáng)具體算法如算法1.
算法1. 混類增強(qiáng)算法D={(xi,yi)}Ni=1輸入: 數(shù)據(jù)集 批次大小M D={(?xi,?yi)}Ni=1輸出: 數(shù)據(jù)集{xi,yi}Mi=1←Sample(D,M)1) #按批次采樣樣本;Shuffle({xi,yi}Mi=1)2) #隨機(jī)打亂順序;3) #隨機(jī)配對(duì)樣本;for{(xi,yi),(xj,yj)}inPairData{(xi,yi)Mi=1,(xj,yj)Mj=1}do λ←Beta(α,α)4) #采樣樣本的混類因子;?x=λxi+(1-λ)xj 5) #按式(2)合成虛擬樣本;?y=λyi+(1-λ)yj 6) #按式(3)合成虛擬標(biāo)簽.
為了驗(yàn)證本文提出方法的有效性, 在美國(guó)凱斯西儲(chǔ)大學(xué)(CWRU)軸承實(shí)驗(yàn)數(shù)據(jù)上進(jìn)行了測(cè)試. 關(guān)于數(shù)據(jù)集更詳細(xì)的信息可在文獻(xiàn)[15]中查看. 該數(shù)據(jù)來(lái)源于驅(qū)動(dòng)端軸承, 由加速度傳感器計(jì)以12 kHz的頻率采集得到. 滾動(dòng)軸承有4種故障類型: 內(nèi)圈故障、滾動(dòng)體故障、外圈故障、正常. 每種故障類型的故障直徑分別為0.017 78 cm, 0.035 56 cm和0.053 34 cm, 因此, 共有10種故障標(biāo)簽. 表2為滾動(dòng)軸承數(shù)據(jù)集的具體描述.數(shù)據(jù)集A為在轉(zhuǎn)速1 772 RPM、負(fù)載1馬力下收集的振動(dòng)信號(hào), 數(shù)據(jù)集B為在轉(zhuǎn)速1 750 RPM、負(fù)載2馬力下收集的振動(dòng)信號(hào), 數(shù)據(jù)集C為在轉(zhuǎn)速1 730 RPM、負(fù)載3馬力下收集的振動(dòng)信號(hào), 數(shù)據(jù)集D為在轉(zhuǎn)速1 772 RPM、1 750 RPM、1 730 RPM和負(fù)載1、2、3馬力下收集的混合振動(dòng)信號(hào).
表2 數(shù)據(jù)集描述
實(shí)驗(yàn)以1 024個(gè)采樣點(diǎn)作為一個(gè)樣本, 每種故障類型采樣2 200個(gè)樣本. 訓(xùn)練時(shí), 長(zhǎng)度為1 024的樣本會(huì)被重塑為32×32大小的矩陣, 以二維圖像格式作為ResNet18網(wǎng)絡(luò)的輸入. 訓(xùn)練集、驗(yàn)證集、測(cè)試集的劃分比例為6:2:2. 模型訓(xùn)練的參數(shù)設(shè)置如表3所示.
表3 參數(shù)設(shè)置
本文實(shí)驗(yàn)在Windows 10 的64位操作系統(tǒng)下進(jìn)行, 內(nèi)存為16 GB, 處理器為Intel(R) Core(TM) i7-9750H CPU. 所用深度學(xué)習(xí)框架為TensorFlow和Keras,編程語(yǔ)言為Python 3.6.
為了驗(yàn)證本文所提方法的優(yōu)越性, 將其與流行的WDCNN[16]、TICNN[17]、LeNet-5網(wǎng)絡(luò)[18]和孿生神經(jīng)網(wǎng)絡(luò)模型[19]在同一實(shí)驗(yàn)環(huán)境下進(jìn)行單一工況、變工況對(duì)比分析. 表4給出了不同模型在單一工況下的準(zhǔn)確率對(duì)比.
表4 單一工況結(jié)果對(duì)比 (%)
由表4可知, 在單一工況下, WDCNN、TICNN、LeNet-5和孿生神經(jīng)網(wǎng)絡(luò)模型的平均分類精度都可達(dá)到97%以上, 但是本文的混類增強(qiáng)模型的平均分類精度可達(dá)到100%, 優(yōu)于現(xiàn)有的流行方法.
表5為變工況下域適應(yīng)方案設(shè)置的具體描述. 其中, 源域指打上標(biāo)簽的訓(xùn)練數(shù)據(jù), 目標(biāo)域指未打標(biāo)簽的測(cè)試數(shù)據(jù). 根據(jù)3種不同工況下數(shù)據(jù)集的組合, 共有6種域適應(yīng)方案設(shè)置.
表5 域適應(yīng)方案設(shè)置
表6給出了變工況下各個(gè)模型在數(shù)據(jù)集A、B、C的6種域適應(yīng)設(shè)置方案上對(duì)滾動(dòng)軸承故障分類準(zhǔn)確率的對(duì)比分析結(jié)果.
表6 變工況結(jié)果對(duì)比 (%)
由表6可知, WDCNN、TICNN和孿生神經(jīng)網(wǎng)絡(luò)模型在域適應(yīng)方案設(shè)置中的平均精度在80%以上,LeNet-5模型的平均精度最低, 僅有66%. 受變工況操作條件影響, 這幾種模型的精度與在單一工況下相比都下降了很多. 而本文方法的平均精度達(dá)到了93.28%,比WDCNN提高了3.6%, 比One-shot提高了11.52%,比Five-shot提高了11.43%, 比TICNN提高了8.35%,比LeNet-5提高了27.28%, 明顯改善了模型的域適應(yīng)性, 提高了模型的泛化能力. 實(shí)驗(yàn)結(jié)表表明, 在跨域分類問(wèn)題上, 基于特征融合和混類增強(qiáng)的深度學(xué)習(xí)滾動(dòng)軸承故障診斷方法抗干擾能力強(qiáng), 有效解決了故障診斷在實(shí)際工業(yè)中因跨域?qū)е绿卣鞑町惔蠖鵁o(wú)法識(shí)別的問(wèn)題.
本節(jié)設(shè)計(jì)消融實(shí)驗(yàn)分別探索特征融合和混類增強(qiáng)對(duì)故障診斷精度提升的貢獻(xiàn), 表7為具體對(duì)比方案. 其中, 方案1對(duì)一維信號(hào)做特征融合, 在訓(xùn)練模型時(shí)不加入混類增強(qiáng)策略; 方案2用原始一維信號(hào)重構(gòu)二維圖像, 不加入特征融合, 在模型訓(xùn)練時(shí)采用混類增強(qiáng); 方案3即本文提出方法, 對(duì)一維信號(hào)做特征融合形成新的特征向量, 重構(gòu)成二維圖像后在訓(xùn)練時(shí)采用混類增強(qiáng)策略.
表7 方案對(duì)比
其中, 方案1對(duì)一維信號(hào)做特征融合, 在訓(xùn)練模型時(shí)不加入混類增強(qiáng)策略; 方案2用原始一維信號(hào)重構(gòu)二維圖像, 不加入特征融合, 在模型訓(xùn)練時(shí)采用混類增強(qiáng); 方案3即本文提出方法, 對(duì)一維信號(hào)做特征融合形成新的特征向量, 重構(gòu)成二維圖像后在訓(xùn)練時(shí)采用混類增強(qiáng)策略.
表8和表9分別展示了方案1、方案2、方案3在單一工況和變工況下的模型故障診斷分類結(jié)果.
表9 變工況結(jié)果對(duì)比 (%)
由表8可知, 在單一工況下, 方案1和方案2都可以達(dá)到99%以上的分類精度, 但是方案3可以使模型提高到100%的分類精度, 證明了特征融合和混類增強(qiáng)結(jié)合的有效性, 在單工況條件下表現(xiàn)極佳.
表8 單一工況結(jié)果對(duì)比 (%)
由表9可知, 在域適應(yīng)方案設(shè)置中, 方案3的平均分類精度分別比方案1、方案2的平均分類精度高8.13%和10.8%. 在域適應(yīng)設(shè)置C→A和C→B中, 方案3相較于方案1和方案2, 分類精度提升十分明顯,最大提升跨度可達(dá)28.57%.
綜上, 可得出結(jié)論: 特征融合和混類增強(qiáng)結(jié)合的方法比僅做特征融合和僅做混類增強(qiáng)的方法在單一工況和變工況下具有更好的分類性能和域適應(yīng)能力. 本文提出的特征融合和混類增強(qiáng)結(jié)合的方法對(duì)提高模型同工況下的分類精度和變工況下的域適應(yīng)能力具有顯著效果.
第2節(jié)以準(zhǔn)確率為評(píng)價(jià)指標(biāo), 通過(guò)比較網(wǎng)絡(luò)分類層的最終預(yù)測(cè)標(biāo)簽與真實(shí)標(biāo)簽獲得模型的精度, 以此評(píng)估模型的有效性. 本節(jié)從網(wǎng)絡(luò)的中間層出發(fā), 用特征可視化來(lái)展示神經(jīng)網(wǎng)絡(luò)對(duì)樣本特征的學(xué)習(xí)過(guò)程, 驗(yàn)證本文提出方法對(duì)不同故障類別的識(shí)別能力, 增加網(wǎng)絡(luò)的可解釋性.
本節(jié)采用t-SNE (t-distributed stochastic neighbor embedding)方法[20]對(duì)故障樣本的分類過(guò)程進(jìn)行降維和特征可視化. t-SNE方法可以將高維數(shù)據(jù)映射到適合人類直覺(jué)觀察的低維空間, 是一種出色的非線性降維方法, 非常適合數(shù)據(jù)探索和可視化分析.
圖5(a)–圖5(f)以數(shù)據(jù)集D為例, 展示了測(cè)試樣本在已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)結(jié)構(gòu)上從中間層到最后一個(gè)全連接層的特征分布. 圖中每種顏色類別代表一類故障標(biāo)簽, 共有10類.
圖5可以看出, 在早期的一些層中, 從圖5(a)到圖5(c), 特征是重疊聚合在一起的, 無(wú)法輕易區(qū)分. 從圖5(d)到圖5(f), 隨著層數(shù)的逐漸加深, 每個(gè)類別的特征點(diǎn)開始聚類在一起, 10個(gè)故障的類別特征變得越來(lái)越可分割, 說(shuō)明訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型分類效果顯著.
圖5 特征可視化示意圖
t-SNE可視化直觀形象地展示了神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中層與層之間逐步提取更深層次數(shù)據(jù)內(nèi)部特征的步驟, 增加了網(wǎng)絡(luò)的可解釋性, 同時(shí)驗(yàn)證了本文提出方法能夠很好地學(xué)習(xí)到樣本特征, 實(shí)現(xiàn)高精度的故障診斷.
針對(duì)深度學(xué)習(xí)滾動(dòng)軸承故障診斷模型數(shù)據(jù)預(yù)處理不充分和域適應(yīng)性差的問(wèn)題, 本文提出了一種基于特融合和混類增強(qiáng)的故障診斷方法. 該方法在深度學(xué)習(xí)的基礎(chǔ)上加入了特征工程, 在數(shù)據(jù)預(yù)處理階段綜合考慮原始信號(hào)的時(shí)域特征、工況特征和時(shí)間差分特征,
豐富特征表示, 改善訓(xùn)練數(shù)據(jù)的質(zhì)量. 在模型訓(xùn)練階段,提出一種混類增強(qiáng)策略構(gòu)造虛擬樣本和標(biāo)簽, 拓展訓(xùn)練數(shù)據(jù)分布, 增加訓(xùn)練集多樣性, 并利用ResNet18強(qiáng)大的特征提取能力學(xué)習(xí)數(shù)據(jù)的本質(zhì)特征. 實(shí)驗(yàn)結(jié)果表明, 該方法有效緩解了深度學(xué)習(xí)故障診斷在不同工況下故障識(shí)別率低的問(wèn)題, 提高了滾動(dòng)軸承故障診斷模型的域適應(yīng)能力, 適合變工況下故障診斷. 在未來(lái)工作中, 將嘗試優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu), 進(jìn)一步提高模型收斂速度.