高 晗,毛 闐,韋榮陽,張建中,黃立榮,楊 健
(1.浙江大學 化工機械研究所,浙江 杭州 310027;2.浙江大學 平衡建筑研究中心,浙江 杭州 310028;3.浙江大學 建筑設(shè)計研究院有限公司,浙江 杭州 310028;4.杭州元創(chuàng)新型材料科技有限公司,浙江 杭州311500)
軸承是高速旋轉(zhuǎn)機械的核心工作部件,設(shè)備出現(xiàn)的故障有很大比例來源于軸承的磨損[1]。
目前,高速旋轉(zhuǎn)機械被應(yīng)用于各行各業(yè),例如在建筑材料制造行業(yè)中用于板材定厚加工的雙輥式砂光機。
建筑節(jié)能裝飾一體化板的關(guān)鍵加工裝備—雙輥式砂光機通過定厚輥的高速旋轉(zhuǎn),帶動砂帶加工出厚度均勻的板材。定厚輥的深溝球軸承在高速旋轉(zhuǎn)下容易磨損,使定厚輥振幅逐漸加劇,造成砂帶與工作臺的相對距離不斷變化,導致板材加工不均勻,嚴重影響板材質(zhì)量。因此,在軸承損傷出現(xiàn)的早期對其進行故障診斷具有重要意義。
雖然故障發(fā)生時會伴隨較為明顯的數(shù)據(jù)異常,但在故障早期,無法直接通過觀察數(shù)據(jù)變化來判斷設(shè)備健康狀態(tài),需要對數(shù)據(jù)進行處理分析,然后才能得出結(jié)果。
2006年“深度學習”的概念被提出后[2],得益于硬件計算能力的提升,針對深度學習的研究得到了高速發(fā)展;因其對數(shù)據(jù)的分析處理能力,深度學習逐漸在軸承故障診斷領(lǐng)域取得了許多成果[3]。
袁建虎等人[4]將振動信號變換后得到的時頻灰度圖作為二維卷積神經(jīng)網(wǎng)絡(luò)的輸入,利用卷積神經(jīng)網(wǎng)絡(luò)的圖像處理能力,識別出了對應(yīng)的軸承健康狀態(tài),從而實現(xiàn)了對故障進行診斷的目的。QIAN Wei-wei等人[5]提出了一種自適應(yīng)堆疊卷積神經(jīng)網(wǎng)絡(luò),建立了小樣本訓練集下的軸承故障分類模型。PAN Hong-hu等人[6]將一維卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)結(jié)合在一起,提出了一種新的軸承故障診斷方法,通過卷積神經(jīng)網(wǎng)絡(luò)進行了特征處理,再由LSTM作為分類器,輸出故障類型。
以上方法取得了一定效果,但為滿足客戶的需求,設(shè)備需切換多種工作模式,雙輥式砂光機為了加工不同表面要求的板材,需要更換不同粗糙度的砂帶。加工時,不同砂帶對軸作用的扭矩發(fā)生了變化,軸的負載功率也隨之變化,而軸承在不同工況中運行時的振動信號存在數(shù)據(jù)分布差異,模型的變工況診斷準確率并不理想。
遷移學習[7]是深度學習中提升模型泛化性的重要研究分支,其原理是將源領(lǐng)域或任務(wù)(即源工況)上學到的知識或模型,通過某種遷移方法應(yīng)用到不同但相關(guān)的領(lǐng)域或問題中,以提升目標領(lǐng)域或任務(wù)(即目標工況)的模型性能。
遷移方法通常分為樣本、模型、特征、關(guān)系遷移等方法[8],這些方法都需要使用目標工況的樣本。其中,特征遷移學習僅需要無故障標簽的樣本,數(shù)據(jù)獲取成本更低,也更容易應(yīng)用實現(xiàn)。
特征遷移法適用于源工況和目標工況任務(wù)一致而振動信號數(shù)據(jù)分布不一致的情況;其研究內(nèi)容是:將目標工況與源工況的數(shù)據(jù)映射到一個共同的特征空間中,使兩個工況的數(shù)據(jù)在新的特征空間中近似為同一分布,以消除工況間的差異,之后利用有故障標簽的源工況樣本訓練出模型,并對無標簽的目標工況樣本進行更準確地診斷分類。
尋找相似分布特征空間,本質(zhì)上是減少兩個分布之間的差異,例如:將兩個分布的多核最大平均差異(multikerner-maximum mean discrepancy, MK-MMD)[9]引入模型損失函數(shù)中進行訓練;使用領(lǐng)域?qū)股窠?jīng)網(wǎng)絡(luò)(domain-adversarial neural network, DANN),并借鑒了生成對抗網(wǎng)絡(luò)(generative adversarial networks, GAN)[10]的生成器和判別器的對抗訓練博弈策略,把生成器替換為特征提取器,在博弈中逐漸消除兩個分布之間的差異。
在深度學習模型訓練過程中,故障類別不均衡的訓練樣本會嚴重影響模型的表現(xiàn)效果,難以學習到少數(shù)類的特征表示[11]。為了確保遷移模型的訓練效果,選擇的訓練樣本數(shù)量應(yīng)該遵循故障類別同等比例的原則。因此,針對源工況和目標工況的采樣方法至關(guān)重要。因為工程應(yīng)用中無法直接判斷目標工況下無故障標簽樣本的故障類別,所以對遷移學習方法在工程中的應(yīng)用提出了新的挑戰(zhàn)。許多研究軸承故障診斷的遷移學習方法的論文[9,12,13]在進行實驗驗證時,直接采用了故障類別等比例數(shù)量的目標工況樣本,但并未對采樣方法做出說明。
針對以上變工況軸承故障診斷的特征遷移學習方法在工程應(yīng)用中的不足,筆者提出一種能在無標簽樣本條件下實現(xiàn)均衡采樣的方法,并結(jié)合DANN框架設(shè)計神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)以建立診斷模型,最后在故障模擬實驗數(shù)據(jù)的基礎(chǔ)上設(shè)置對照方法,對比驗證所提出方法的有效性和優(yōu)越性。
筆者提出的基于模型采樣(MBS)的采樣方法流程如圖1所示。
圖1 MBS采樣法流程
MBS方法用于在特征遷移前對目標工況的無故障標簽樣本進行采樣,以采集與故障類別等比例數(shù)量的樣本。
在采樣前,需要先建立預訓練模型,預訓練模型不考慮目標工況樣本,僅使用帶故障標簽的源工況樣本進行訓練,但目標工況的采樣效果依賴于模型在目標工況的泛化性能,因此,對預訓練模型的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計十分重要,輸出層必須為SoftMax層,以滿足輸出為各類別故障概率分布的要求,概率最高的類別即為模型診斷類別。
當通過類別數(shù)量和訓練樣本總數(shù)量確認了每一類別故障的樣本理想數(shù)量后,MBS采樣法可從大量無故障標簽的目標工況樣本中進行采樣,具體可概括為3個環(huán)節(jié):
(1)將所有樣本輸入到預訓練模型中,記錄每個樣本由SoftMax層輸出的概率分布,并為其打上最高概率對應(yīng)的類別標簽;
(2)根據(jù)每個類別在對應(yīng)標簽樣本中的平均概率過濾低概率樣本,以排除可能混淆在該類別的其他類別樣本;設(shè)置的0.95閾值是為了在過濾過程中,防止某些在預訓練模型中表現(xiàn)很好的類別故障樣本被過濾,保留每個類別樣本的多樣性;
(3)重采樣環(huán)節(jié)是為了在某些類別樣本采樣數(shù)量達不到理想數(shù)量時仍實現(xiàn)數(shù)據(jù)類別均衡,保障最終診斷模型的表現(xiàn)效果。
筆者設(shè)計的DANN由3個網(wǎng)絡(luò)構(gòu)成,分別是特征提取網(wǎng)絡(luò)F、工況判別網(wǎng)絡(luò)D、故障判別網(wǎng)絡(luò)C。
特征提取網(wǎng)絡(luò)F可將源工況和目標工況映射到相似分布的特征空間,工況判別網(wǎng)絡(luò)D可判別經(jīng)特征映射后的樣本來自哪一個工況,故障判別網(wǎng)絡(luò)C可判別經(jīng)特征映射后的樣本來自哪一類別故障。
DANN網(wǎng)絡(luò)的框架及訓練過程如圖2所示。
圖2 DANN結(jié)構(gòu)及訓練過程示意圖
從圖2中可以看到:3個網(wǎng)絡(luò)同時進行訓練,使F和D同時不斷增強,直到D的精度穩(wěn)定在50%左右,即認為F映射的特征空間不再含有不同工況間的差異,目標工況和源工況在特征空間中屬于同一分布;此外,F在訓練過程中也需要考慮到診斷效果。
DANN在訓練過程中分為兩個完整的網(wǎng)絡(luò):F與C構(gòu)成源工況的故障診斷網(wǎng)絡(luò),輸入帶標簽的源工況樣本,反向傳播時對F和C都進行參數(shù)調(diào)整;F與D構(gòu)成了源工況和目標工況的工況判別對抗網(wǎng)絡(luò),輸入無標簽的目標工況和源工況樣本,反向傳播調(diào)整D的參數(shù)以提高工況的判別準確率,值得一提的是,在調(diào)整F的參數(shù)時需要引入梯度翻轉(zhuǎn)層(gradient reversal layer,GRL)[14],反向強化F的特征提取能力,以騙過D的工況判別能力,從而實現(xiàn)對抗訓練。
C、D、F這3個神經(jīng)網(wǎng)絡(luò)的參數(shù)更新過程分別如下:
(1)
(2)
(3)
式(1~3)中:θC,θD,θF—C,D,F的網(wǎng)絡(luò)參數(shù);LC,LD—C,D的損失函數(shù);μ—學習率;-λ—梯度翻轉(zhuǎn)因子。
由于定厚輥軸承上并未布置振動信號采集及通信等設(shè)備,短期內(nèi)難以獲得故障類別豐富的振動數(shù)據(jù)。同時,因少量類別故障診斷的任務(wù)過于簡單,而無法體現(xiàn)出MBS-DANN方法的優(yōu)越性(相較于其他深度學習方法)。
軸承作為旋轉(zhuǎn)機械的通用部件,在實驗條件下,改變軸承所受負載,以此來模擬雙輥式砂光機的不同工況,仍能達到對筆者所提出的方法進行驗證的目的。
筆者選用故障類別豐富,且軸承類型同為深溝球軸承的美國凱斯西儲大學軸承數(shù)據(jù)中心的電機驅(qū)動端測試軸承[15],以此來研究所提出的基于MBS-DANN的軸承故障診斷方法。
筆者以負載1 hp(馬力)工況作為源工況,以負載0 hp、2 hp、3 hp作為目標工況,并分別用各工況(包含正常狀態(tài)在內(nèi))的14個不同故障類型、程度及位置的故障振動信號數(shù)據(jù)作為診斷模型的實驗樣本,來驗證該方法的有效性和優(yōu)越性。
筆者對各類別故障的定義及標簽如表1所示。
表1 軸承故障類別的定義及標簽
在軸承故障模擬實驗中,筆者通過對軸承進行電火花加工,人為制造深度0.279 4 mm但直徑不同(例:0.177 8 mm、0.355 6 mm、0.533 4 mm)的滾珠、內(nèi)圈、外圈損傷。作為不同故障類別,對于在運行中相對于基座屬于靜止的外圈,其故障中還包含3點鐘、6點鐘、12點鐘方向的位置信息。
筆者將每個工況下每個故障類別的樣本切割為長度1 024個數(shù)據(jù)點、混疊512個點的200個樣本,即每個工況下含有2 800個樣本。
為了消除不同樣本初始相位的不同,以及信號混疊的影響,筆者使用快速傅里葉變換,將原始的時域振動信號轉(zhuǎn)換為頻域振動信號的512個數(shù)據(jù)點,作為模型輸入。
該研究設(shè)計的驗證實驗步驟流程如圖3所示。
圖3 實驗步驟
圖3中,實線表示步驟流轉(zhuǎn),兩種不同的虛線分別表示源工況和目標工況樣本的數(shù)據(jù)流。MBS的預訓練模型選擇卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)。
首先,筆者使用帶故障標簽的源工況樣本訓練CNN模型;之后,通過MBS對無故障標簽的目標工況樣本進行采樣,并將采樣樣本與源工況樣本用于訓練DANN模型;最后,使用模型對目標工況樣本進行診斷,以驗證方法的有效性和優(yōu)越性。
CNN的網(wǎng)絡(luò)結(jié)構(gòu)及超參數(shù)配置如表2所示。
表2 CNN網(wǎng)絡(luò)結(jié)構(gòu)及超參數(shù)配置
DANN的網(wǎng)絡(luò)結(jié)構(gòu)及超參數(shù)配置如表3所示。
表3 DANN網(wǎng)絡(luò)結(jié)構(gòu)及超參數(shù)配置
在CNN模型中,筆者用交叉熵作為損失函數(shù),用Adam作為優(yōu)化器,以64個樣本為一個batch,進行模型的批訓練,共訓練迭代100次;
筆者在DANN模型中,用交叉熵作為C和D的損失函數(shù),用SGDM作為優(yōu)化器,以128個樣本為一個batch,進行模型的批訓練,共訓練迭代500次。
CNN模型表現(xiàn)出了較為不錯的泛化能力,平均準確率達到96.9%,這為后續(xù)的MBS采樣奠定了良好的基礎(chǔ)。其中,在2 hp工況下泛化性最佳,準確率達到了99.5%;在0 hp工況下的準確率為94.39%,主要存在將不同程度的滾珠故障混淆的問題;在3 hp工況下的準確率為96.82%,主要存在將不同程度的內(nèi)圈故障混淆的問題,說明CNN模型在不同程度故障識別上的泛化性仍存在不足。
由于0 hp和3 hp工況還存在一定的上升空間,因此,筆者選擇0 hp和3 hp工況的樣本數(shù)據(jù),驗證MBS-DANN模型的有效性和優(yōu)越性。
此處以0 hp工況為例說明MBS的采樣結(jié)果。MBS方法在重采樣前采集到的各診斷類別樣本數(shù)量,如圖4所示。
圖4 0 hp-MBS重采樣前的各診斷類別樣本數(shù)量
圖4中,出現(xiàn)類別不均衡情況的原因是:0 hp工況下使用的樣本為每個類別同等數(shù)量200個樣本,共2 800個樣本,正好滿足故障類別等比例的樣本數(shù)量要求(在工程應(yīng)用中幾乎不可能出現(xiàn)同等數(shù)量的樣本情況,此處是為了便于對比),最為理想的情況下無需重采樣,MBS即可采樣得到每個類別200個樣本,也就說明CNN模型對0 hp工況下的故障診斷準確率已經(jīng)達到了100%,無需再進行遷移學習。
但如前文所述,CNN模型在0 hp的表現(xiàn)效果還有進一步優(yōu)化空間,因此該現(xiàn)象是正常的。
繼續(xù)完成重采樣,MBS方法最終采樣到的樣本的實際類別樣本數(shù)量,如圖5所示。
圖5 0 hp-MBS采樣樣本的實際類別樣本數(shù)量
MBS方法最后的重采樣是為了彌補基于模型采樣的不足。經(jīng)過重采樣后,每個類別理論上(即CNN模型診斷的類別)都達到了200個樣本。
從圖5中可看出:僅在9號故障中有4個6號故障樣本混入,采樣的準確率達到99.86%,保障了類別均衡。其在一定程度上驗證了MBS采樣法的有效性。
同樣,筆者以0 hp工況為例說明DANN的訓練過程。工況判別準確率變化曲線如圖6所示。
圖6 0 hp-工況判別準確率變化曲線
從圖6可以看到:工況的判別準確率經(jīng)過500次迭代后,逐漸穩(wěn)定在50%振蕩,D已經(jīng)無法分辨出經(jīng)F映射后的特征來自于哪一工況,從而實現(xiàn)了從目標工況到源工況的特征遷移。
0 hp工況在DANN模型上表現(xiàn)的故障診斷混淆矩陣,如圖7所示。
圖7 0 hp-DANN模型故障診斷混淆矩陣
由圖7可知:不同程度故障混淆的情況得到了較大改善,整體準確率提升到98.43%。此外,3 hp工況下的整體準確率也提升到98.39%,驗證了MBS-DANN方法的有效性。
為了驗證MBS-DANN模型在變工況軸承故障早期診斷問題中的有效性和優(yōu)越性,筆者設(shè)了4個對照方法:(1)未遷移的模型(即CNN模型);(2)同樣使用無標簽目標工況樣本進行深度學習的卷積自編碼器(convolution auto-encoder,CAE)[16]與MBS采樣法結(jié)合;(3)基于理想采樣法的DANN模型;(4)基于隨機采樣法的DANN模型[17]。
其中,理想采樣是指采樣的最理想情況,即每個類別同等數(shù)量采樣200個樣本;隨機采樣是指不對目標工況下的無標簽樣本進行任何先驗判斷,而直接采樣。
隨機采樣的各類別樣本數(shù)量如圖8所示。
圖8 隨機采樣的各類別樣本數(shù)量
筆者采用的隨機采樣模擬方法是先隨機生成各故障類別的采樣比例,之后根據(jù)樣本總數(shù)量(共計2 800個),從對應(yīng)類別樣本中隨機采樣相應(yīng)數(shù)量的樣本。由于在該實驗中,每個類別樣本只有200個,因此,超過200個的類別采用隨機重采樣的方式補齊樣本數(shù)量。
不同對照方法與MBS-DANN的模型跨工況軸承故障早期診斷準確率對比結(jié)果,如表4所示。
表4 不同對照方法與MBS-DANN的診斷準確率對比
由表4可知:
相較于MBS-CAE模型,實驗結(jié)果驗證了DANN模型的優(yōu)越性;相較于隨機采樣和理想采樣的DANN模型,理想采樣法表現(xiàn)效果最佳,說明了采樣對特征遷移法的重要性,隨機采樣法與MBS采用法的準確率差距也驗證了MBS采樣法的有效性;相較于未遷移的CNN模型,平均準確率提升了2.8%,驗證了MBS-DANN模型的有效性和優(yōu)越性。
針對傳統(tǒng)深度學習方法在變工況下的軸承故障診斷準確率較低,以及特征遷移學習方法在工程應(yīng)用中無標簽樣本采樣方法缺失的問題,筆者提出了一種基于MBS-DANN的軸承故障診斷方法,即采用基于預訓練CNN模型的MBS方法,保障了采樣樣本數(shù)量的類別均衡,將DANN作為神經(jīng)網(wǎng)絡(luò)框架,并在軸承故障模擬實驗數(shù)據(jù)上,進行了多種方法的實驗對比分析。
研究結(jié)果表明:
(1)在理想采樣法和隨機采樣法下,實驗數(shù)據(jù)分別達到99.4%、87.98%的平均準確率,證明了建模前無標簽樣本類別均衡采樣方法的重要性;
(2)MBS方法克服了在無標簽目標工況下,實現(xiàn)類別均衡采樣的困難;相比隨機采樣法,MBS方法平均準確率提高了超過10%,而僅比理想采樣法低不到1%,充分驗證了MBS方法的有效性;
(3)MBS方法與DANN網(wǎng)絡(luò)結(jié)合,達到了98.41%的診斷平均準確率,在對比實驗中,僅次于理論采樣-DANN,充分驗證了MBS-DANN方法的優(yōu)越性。
由于時間和條件有限,仍有工作可在后續(xù)的研究中進行開展:筆者僅在模擬實驗條件下進行了該方法的驗證,后續(xù)可針對實際應(yīng)用場景對該方法進行驗證和進一步優(yōu)化;除了工況會影響振動信號數(shù)據(jù)分布,軸承的潤滑、溫升等情況也會導致數(shù)據(jù)分布差異,后續(xù)筆者擬將該方法在更多場景中進行驗證及應(yīng)用。