黃凱
(江蘇徐工信息技術(shù)股份有限公司 江蘇省徐州市 221000)
隨著工業(yè)大數(shù)據(jù)和物聯(lián)網(wǎng)在工業(yè)4.0 背景下的快速發(fā)展,工業(yè)設(shè)備的預(yù)測(cè)和健康管理(PHM)變得越來(lái)越重要,導(dǎo)致工業(yè)設(shè)備的智能維護(hù)系統(tǒng)越來(lái)越多[1]。而軸承是現(xiàn)代機(jī)械中必不可少的部件,因此保證軸承的正常運(yùn)行十分必要[2]。
基于機(jī)器學(xué)習(xí)的軸承故障診斷中存在特征難以提取、人員經(jīng)驗(yàn)要求高以及準(zhǔn)確率低等問(wèn)題。隨著科學(xué)技術(shù)的發(fā)展,人工智能領(lǐng)域在各個(gè)方向中漸漸嶄露頭角,將傳統(tǒng)的軸承故障診斷與人工智能相結(jié)合,迅速成為故障診斷研究領(lǐng)域的熱點(diǎn)[3][4]。然而在采煤機(jī)實(shí)際運(yùn)行過(guò)程中不僅工作場(chǎng)景和工況條件不同而且軸承數(shù)據(jù)在不同條件下分布也不同,新采集的數(shù)據(jù)往往標(biāo)簽缺失,甚至無(wú)法標(biāo)記,因此需要通過(guò)無(wú)監(jiān)督遷移學(xué)習(xí)來(lái)解決這一問(wèn)題[5]。
針對(duì)傳統(tǒng)軸承面臨的一些問(wèn)題,專家們提出了運(yùn)用深度學(xué)習(xí)的方法來(lái)解決傳統(tǒng)軸承故障問(wèn)題。莊雨旋等[6]提出一種基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的故障診斷方法;趙敬嬌等[7]利用殘差連接卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行故障診斷。針對(duì)故障數(shù)據(jù)少,黃南天等[8]提出非平衡小樣本軸承對(duì)抗診斷,生成大量故障數(shù)據(jù)。但以上方法都無(wú)法徹底解決不同場(chǎng)景條件下的軸承數(shù)據(jù)無(wú)標(biāo)簽問(wèn)題,基于此提出了一種基于無(wú)監(jiān)督深度遷移學(xué)習(xí)的軸承故障診斷的方法。
遷移學(xué)習(xí)在目前各個(gè)領(lǐng)域研究中都受到了廣泛關(guān)注,并且在計(jì)算機(jī)視覺(jué)中取得巨大成功,而特征遷移學(xué)習(xí)是遷移學(xué)習(xí)中最熱門的研究方法。通過(guò)在實(shí)驗(yàn)室可以獲得大量有標(biāo)記的源域數(shù)據(jù),然后通過(guò)建立的分類器模型對(duì)不同場(chǎng)景中不同工況條件下采集的無(wú)標(biāo)簽軸承數(shù)據(jù)進(jìn)行預(yù)測(cè)分類。將實(shí)驗(yàn)室獲取的源域數(shù)據(jù)設(shè)為其中xi是源域中的第i 個(gè)樣本,Xs是所有源域樣本的集合。新采集的數(shù)據(jù)為目標(biāo)域Xt是所有目標(biāo)域樣本的集合,xj是目標(biāo)域第j 個(gè)樣本。ni、mj為標(biāo)簽的樣本總數(shù)。遷移學(xué)習(xí)通過(guò)源域的軸承故障數(shù)據(jù)和標(biāo)簽去建立一個(gè)樣本到標(biāo)簽的分類器函數(shù)f(.),然后對(duì)目標(biāo)域的標(biāo)簽進(jìn)行預(yù)測(cè)分類。
2015年提出的深度殘差網(wǎng)絡(luò)(ResNet)在當(dāng)年ImageNet 數(shù)據(jù)集分類中獲得了比賽冠軍[9]。ResNet 解決了當(dāng)時(shí)深度網(wǎng)絡(luò)退化問(wèn)題,而且還具有較強(qiáng)的特征提取能力。盡管ResNet50 和ResNet101出鏡率很高,但綜合考慮數(shù)據(jù)集的大小,選取了ResNet18 作為特征提取器,ResNet18 網(wǎng)絡(luò)含有四個(gè)殘差塊,結(jié)構(gòu)如圖1所示,具體網(wǎng)絡(luò)結(jié)構(gòu)包括卷積層( Convolutional Layer,Conv) 、批標(biāo)準(zhǔn)化(Batch Nor-malization,BN),線性修正單元 (Rectified LinearUnit,ReLu),ReLu 是一種激活函數(shù),全連接層(Fully Con-nected Layer,FC)[10]。
圖1:殘差塊內(nèi)部結(jié)構(gòu)
多核最大平均差異(MultiKerner-Maximum Mean Discrepancy,MK-MMD)是基于單核最大差異(MMD)變換而來(lái),目的是為了解決不同內(nèi)核的參數(shù)選擇。因?yàn)樵趯?shí)際應(yīng)用過(guò)程中,各種內(nèi)核的參數(shù)和表征能力不同,每種內(nèi)核的選擇都會(huì)對(duì)映射的最終性能起到至關(guān)重要的影響,因此選用MK-MMD 來(lái)度量再生核希爾伯特空間的分布距離,提升自適應(yīng)的效率得到更好的表征能力。通過(guò)在無(wú)監(jiān)督深度遷移學(xué)習(xí)的軸承故障診斷模型中的損失函數(shù)中加入MK-MMD來(lái)衡量源域與目標(biāo)域之間的邊緣分布差異。損失函數(shù)定義如下:
選取ResNet18 作為特征提取器,將源域與目標(biāo)域的數(shù)據(jù)送入到訓(xùn)練好的ResNet18 中,為了更好的實(shí)現(xiàn)特征的提取,選用MKMMD 作為優(yōu)化目標(biāo)來(lái)減少源域與目標(biāo)域之間的特征分布差異,同時(shí)源域與目標(biāo)域之間參數(shù)共享。將經(jīng)過(guò)MK-MMD 空間映射過(guò)的數(shù)據(jù)作為全連接的輸入,在經(jīng)過(guò)softmax 函數(shù),最后得到標(biāo)簽的預(yù)測(cè)分類。模型的設(shè)計(jì)如圖2所示。
圖2:無(wú)監(jiān)督深度遷移學(xué)習(xí)故障診斷模型
圖中骨干網(wǎng)絡(luò)為ResNet18,但是對(duì)于無(wú)監(jiān)督深度遷移學(xué)習(xí)故障診斷,目標(biāo)域中的數(shù)據(jù)無(wú)法進(jìn)行標(biāo)記導(dǎo)致目標(biāo)域標(biāo)簽不可用,因此使用瓶頸層,瓶頸層由Fc 層、ReLu 激活函數(shù)和Droput 層組成。從圖中可知我們僅使用源域的樣本進(jìn)行模型的訓(xùn)練,而沒(méi)有使用目標(biāo)域的樣本,訓(xùn)練后的模型直接測(cè)試目標(biāo)域中的樣本,源域與目標(biāo)源模型和參數(shù)共享。
首先將實(shí)驗(yàn)臺(tái)中采集的振動(dòng)數(shù)據(jù)進(jìn)行簡(jiǎn)單的預(yù)處理,將原始的振動(dòng)信號(hào)通過(guò)快速傅里葉(FFT)變換到頻域,由于頻譜系數(shù)是對(duì)稱的,每個(gè)樣本長(zhǎng)度為512。將數(shù)據(jù)集劃分為訓(xùn)練集、測(cè)試集和評(píng)估集。
為保證軸承故障診斷方法的真實(shí)有效性,選取美國(guó)凱斯西儲(chǔ)大學(xué)(Case Western ReserveUniversity,CWRU)的軸承故障診斷數(shù)據(jù)集。實(shí)驗(yàn)工作臺(tái)包括電機(jī)、軸承、轉(zhuǎn)矩傳感器、編碼器等其他電子設(shè)備,數(shù)據(jù)集按照采樣頻率和軸承端可分為12kHz 驅(qū)動(dòng)端、48kHz 驅(qū)動(dòng)端、12kHz 風(fēng)扇端。數(shù)據(jù)中內(nèi)圈、外圈、滾動(dòng)體的損傷按照損傷的直徑大小可分為0.007inch、0.014inch、0.021inch 三種。每種采樣頻率的數(shù)據(jù)集中各包含一個(gè)健康的軸承,因此數(shù)據(jù)集中包含10 種不同的故障種類,10 種類別描述如表1所示。
表1:10 種類別描述
CWRU 數(shù)據(jù)集中按照電機(jī)轉(zhuǎn)速的不同可分為0HP、1HP、2HP、3HP。我們將不同的馬力之間相互遷移,數(shù)據(jù)集中共有12 個(gè)遷移學(xué)習(xí)策略。
在Pytorch中對(duì)無(wú)監(jiān)督深度遷移學(xué)習(xí)的軸承故障診斷進(jìn)行實(shí)驗(yàn)。每個(gè)模型的訓(xùn)練次數(shù)為300 個(gè)epoch,在訓(xùn)練過(guò)程中,將源域樣本先訓(xùn)練預(yù)訓(xùn)練模型,然后在進(jìn)行遷移學(xué)習(xí)的訓(xùn)練。使用Adam 進(jìn)行反向傳播,batchsize 選取64。設(shè)初試學(xué)習(xí)率為0.001,在訓(xùn)練到100 和200epoch 時(shí)。學(xué)習(xí)率分別乘以一個(gè)衰減系數(shù)0.1,實(shí)驗(yàn)結(jié)果如表2所示。
表2:遷移實(shí)驗(yàn)結(jié)果
為了更直觀的比較12kHz 驅(qū)動(dòng)端、12kHz 風(fēng)扇端和48kHz 驅(qū)動(dòng)端的不同工況相互遷移分類情況,采用了柱狀圖和雷達(dá)圖共同表示分類結(jié)果。柱狀圖如圖3所示,雷達(dá)圖如圖4所示。
圖3:不同工況相互遷移分類結(jié)果
圖4:不同工況相互遷移分類結(jié)果
從圖3 中遷移分類結(jié)果可以看出分類準(zhǔn)確率最高為12kHz 驅(qū)動(dòng)端,平均準(zhǔn)確率達(dá)到了99.9%;其次為12kHz 風(fēng)扇端平均準(zhǔn)確率為95.6%;最低的為48kHz 驅(qū)動(dòng)端只有92.4%。隨著采樣頻率的提升可知不同工況遷移準(zhǔn)確率在下降,從圖4 中可以直觀的看出采樣頻率為12kHz 驅(qū)動(dòng)端在各種遷移分類的準(zhǔn)確率都比12kHz 風(fēng)扇端和48kHz 驅(qū)動(dòng)端要高。而且從圖4 中可以看出在1HP 到2HP、2HP到1HP、2HP 到3HP 和3HP 到2HP 這四種工況遷移結(jié)果在三種采樣頻率和驅(qū)動(dòng)端都有較好的表現(xiàn)。
本文針對(duì)采煤機(jī)在實(shí)際運(yùn)行過(guò)程中因?yàn)椴煌墓ぷ鲌?chǎng)景和不同的工況分布而造成無(wú)法對(duì)采集的軸承數(shù)據(jù)進(jìn)行標(biāo)記的問(wèn)題,提出了一種基于無(wú)監(jiān)督深度遷移學(xué)習(xí)的軸承故障診斷的方法。將源域與目標(biāo)域中的數(shù)據(jù)通過(guò)ResNet18 提取特征,然后將ResNet18 提取到的特征通過(guò)MK-MMD 空間映射后作為全連接的輸入,輸入的數(shù)據(jù)經(jīng)過(guò)交叉熵?fù)p失函數(shù),最后得到標(biāo)簽的預(yù)測(cè)分類。并在CWRU 數(shù)據(jù)集中進(jìn)行了驗(yàn)證,證明該方法的有效性。