阮宇豪
(三峽大學(xué)機(jī)械與動(dòng)力學(xué)院,湖北 宜昌 443002)
農(nóng)業(yè)機(jī)械是農(nóng)業(yè)發(fā)展的加速器,農(nóng)業(yè)機(jī)械的使用既降低了農(nóng)業(yè)人力成本,又提高了農(nóng)業(yè)經(jīng)濟(jì)效益[1]。安全維護(hù)對(duì)于農(nóng)業(yè)機(jī)械有著重要作用。在現(xiàn)代農(nóng)業(yè)機(jī)械生產(chǎn)管理過程中,一旦發(fā)生意外事件就會(huì)降低生產(chǎn)和工作的效率[2]。滾動(dòng)軸承是農(nóng)業(yè)機(jī)械的重要零部件,農(nóng)業(yè)機(jī)械長(zhǎng)期在強(qiáng)沖擊、高負(fù)載、高溫高壓的環(huán)境下運(yùn)行,導(dǎo)致軸承時(shí)常發(fā)生損壞,因此,對(duì)農(nóng)業(yè)機(jī)械的軸承狀態(tài)進(jìn)行監(jiān)控和故障診斷十分必要。
在軸承故障診斷領(lǐng)域,由軸承產(chǎn)生的數(shù)據(jù)量巨大,有效信息稀少,導(dǎo)致傳統(tǒng)的信號(hào)處理方法難以對(duì)其進(jìn)行有效和快速的處理。深度學(xué)習(xí)在處理大數(shù)據(jù)方面具有廣泛的應(yīng)用,許多學(xué)者將其應(yīng)用于軸承故障診斷,取得了良好的效果。Ye等提出了一種采取雙通道形態(tài)濾波,結(jié)合峭度篩選的信號(hào)融合方法,成功應(yīng)用于齒輪箱故障診斷中[3]。Wang等將振動(dòng)數(shù)據(jù)和聲學(xué)數(shù)據(jù)同時(shí)輸入一維卷積神經(jīng)網(wǎng)絡(luò),并對(duì)其進(jìn)行數(shù)據(jù)融合,實(shí)現(xiàn)對(duì)軸承的故障診斷[4]。
然而,在實(shí)際情況中,大量數(shù)據(jù)是無標(biāo)簽的,使得監(jiān)督學(xué)習(xí)方法效果較差。為適應(yīng)工業(yè)情況,Zhang等提出了一種以長(zhǎng)短時(shí)記憶單元為基礎(chǔ)的自編碼器,用于提取數(shù)據(jù)中的時(shí)間特征信息,通過對(duì)其特征信息進(jìn)行空間嵌入表達(dá),成功進(jìn)行化學(xué)設(shè)備的故障診斷[5]。Tanha等提出了一種結(jié)合有監(jiān)督訓(xùn)練和自訓(xùn)練的半監(jiān)督方法,通過比較兩個(gè)序列的輸出,對(duì)符合要求的數(shù)據(jù)進(jìn)行偽標(biāo)簽轉(zhuǎn)化,實(shí)現(xiàn)數(shù)據(jù)集的擴(kuò)充和數(shù)據(jù)分類[6]。本文提出了一種結(jié)合空間嵌入和對(duì)比學(xué)習(xí)策略的半監(jiān)督學(xué)習(xí)方法,將軸承故障特征通過對(duì)比學(xué)習(xí)的方式進(jìn)行深度訓(xùn)練,提高不同軸承故障類型的辨識(shí)度,再充分利用少量有標(biāo)簽數(shù)據(jù)對(duì)整個(gè)模型進(jìn)行調(diào)整,提高網(wǎng)絡(luò)精度,最終實(shí)現(xiàn)對(duì)軸承的故障診斷。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)采取權(quán)重共享和核函數(shù)平滑移動(dòng)的方式,能夠有效提取故障特征,相較于全連接神經(jīng)網(wǎng)絡(luò),極大地減少了參數(shù)量,提高了運(yùn)算效率和網(wǎng)絡(luò)性能。
本文網(wǎng)絡(luò)由兩個(gè)特征提取層、兩個(gè)全連接層以及一個(gè)分類層組成,其中特征提取層由卷積層、池化層和歸一化層組成,投影層由兩個(gè)全連接層組成,具體結(jié)構(gòu)和參數(shù)如表1所示。
表1 網(wǎng)絡(luò)結(jié)構(gòu)與超參數(shù)
模型通過對(duì)數(shù)據(jù)的深度挖掘,在特征層面對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,提高了數(shù)據(jù)利用率,促使網(wǎng)絡(luò)生成更具有代表性的特征。最終模型對(duì)空間嵌入模塊輸出的嵌入特征zi和由分類層輸出的分類概率向量pi進(jìn)行優(yōu)化,實(shí)現(xiàn)網(wǎng)絡(luò)的訓(xùn)練。
式中,f(xi,θ)為空間嵌入模塊,由特征提取層和投影層組成,xi和θ分別為訓(xùn)練數(shù)據(jù)和訓(xùn)練參數(shù);g(zi,φ)為分類層,φ為分類層的參數(shù)。
少量的有標(biāo)簽數(shù)據(jù)用于對(duì)網(wǎng)絡(luò)的初步訓(xùn)練和網(wǎng)絡(luò)的調(diào)整,并采用交叉熵?fù)p失函數(shù)Cross Entory,對(duì)網(wǎng)絡(luò)預(yù)測(cè)輸出pi進(jìn)行優(yōu)化,使其更貼合真實(shí)標(biāo)簽,最終有標(biāo)簽數(shù)據(jù)訓(xùn)練采用交叉熵?fù)p失函數(shù),具體公式如下:
式中,labeli為有標(biāo)簽數(shù)據(jù)xi的真實(shí)標(biāo)簽。
無標(biāo)簽數(shù)據(jù)因其缺乏對(duì)應(yīng)的標(biāo)簽信息,無法直接用于故障診斷,故需要對(duì)其進(jìn)行一定的數(shù)據(jù)增強(qiáng),從而獲取樣本間關(guān)系。
對(duì)比學(xué)習(xí)方法通過對(duì)無標(biāo)簽數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng),獲取同一樣本多視圖下的不同表征,再將數(shù)據(jù)表征進(jìn)行組合,形成樣本對(duì)。樣本對(duì)中,兩個(gè)表征同源的樣本對(duì)為正對(duì),表征來源不同的樣本對(duì)為負(fù)對(duì)。
為獲取樣本對(duì)中樣本間的相似程度,采取余弦距離函數(shù)計(jì)算樣本間相似度,相似度取值范圍為[-1, 1],即同源樣本對(duì)取值為1,異源樣本對(duì)取值為-1。對(duì)于兩個(gè)樣本,余弦相似度計(jì)算如下:
為提高正對(duì)樣本間相似度,降低負(fù)對(duì)樣本間相似度,促使網(wǎng)絡(luò)提高樣本類別鑒別能力。結(jié)合實(shí)際數(shù)據(jù)情況,參考對(duì)比學(xué)習(xí)方法[7],采用優(yōu)化噪聲對(duì)比估計(jì)(Noise Contrastive Estimation, Info NCE)損失函數(shù),用于實(shí)現(xiàn)正對(duì)和負(fù)對(duì)間的優(yōu)化。最終對(duì)比損失函數(shù)構(gòu)造如下:
式中,t為溫度系數(shù),取t=0.02。
為實(shí)現(xiàn)對(duì)模型的整體優(yōu)化,將有標(biāo)簽損失函數(shù)與無標(biāo)簽損失函數(shù)進(jìn)行求和,再通過Adam優(yōu)化器對(duì)網(wǎng)絡(luò)的參數(shù)進(jìn)行優(yōu)化,提高網(wǎng)絡(luò)特征表達(dá)能力和網(wǎng)絡(luò)訓(xùn)練準(zhǔn)確率。最終整體網(wǎng)絡(luò)的損失函數(shù)如下:
式中,λ為權(quán)重系數(shù),且隨訓(xùn)練周期衰減,衰減系數(shù)α=0.015。
本文利用對(duì)比學(xué)習(xí)方法,充分利用無標(biāo)簽數(shù)據(jù)中各樣本間關(guān)系,促進(jìn)網(wǎng)絡(luò)更好地鑒別樣本類別,最終實(shí)現(xiàn)對(duì)軸承的故障診斷。損失函數(shù)計(jì)算流程如圖1所示。具體的診斷流程如下:
圖1 損失函數(shù)計(jì)算流程
1)利用有標(biāo)簽數(shù)據(jù)訓(xùn)練模型,獲取交叉熵?fù)p失;
2)將無標(biāo)簽數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng);
3)將無標(biāo)簽數(shù)據(jù)和增強(qiáng)后的數(shù)據(jù)輸入模型,通過特征提取模塊獲取數(shù)據(jù)特征;
4)依據(jù)樣本來源,構(gòu)建正負(fù)對(duì),計(jì)算對(duì)比損失;
5)將1)和4)中的損失加權(quán)求和,并通過梯度下降算法優(yōu)化模型;
6)循環(huán)1)至5)步,直至訓(xùn)練完成,并用測(cè)試集測(cè)試模型性能。
在軸承故障診斷中,凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)集[8]是得到廣泛認(rèn)可和應(yīng)用的軸承數(shù)據(jù)集,試驗(yàn)臺(tái)由驅(qū)動(dòng)電機(jī)、扭矩傳感器、測(cè)功機(jī)和電子控制設(shè)備組成,試驗(yàn)臺(tái)具體結(jié)構(gòu)如圖2所示。
圖2 凱斯西儲(chǔ)大學(xué)軸承試驗(yàn)臺(tái)
對(duì)數(shù)據(jù)集進(jìn)行切斷劃分,并使用12 kHz采樣頻率,故障深度為0.007英寸,負(fù)載為0 HP下的軸承數(shù)據(jù),包含外圈故障、內(nèi)圈故障、滾動(dòng)體故障和正常四種軸承狀態(tài),每種軸承故障類型含100條樣本,樣本長(zhǎng)度為1 024個(gè)采樣點(diǎn)。并將數(shù)據(jù)按照2∶7∶1的比例劃分為有標(biāo)簽數(shù)據(jù)、無標(biāo)簽數(shù)據(jù)和測(cè)試數(shù)據(jù)。
為了構(gòu)造對(duì)比學(xué)習(xí)樣本,選擇對(duì)無標(biāo)簽數(shù)據(jù)進(jìn)行裁剪并打亂順序,然后進(jìn)行拼接,從而增強(qiáng)數(shù)據(jù),產(chǎn)生正對(duì)和負(fù)對(duì),具體拼接方法如圖3所示。
圖3 數(shù)據(jù)裁剪拼接
為了評(píng)估本文方法在軸承故障診斷上的有效性,選擇與CNN這種在故障診斷上具有良好效果的有監(jiān)督網(wǎng)絡(luò)和noise-student[9]與self-train[10]這兩種經(jīng)典的半監(jiān)督學(xué)習(xí)方法在訓(xùn)練50個(gè)周期下進(jìn)行對(duì)比,最終診斷結(jié)果如圖4所示。
圖4 各方法準(zhǔn)確率對(duì)比
通過對(duì)比可以看出,相較于其他網(wǎng)絡(luò),本文提出的方法在最終測(cè)試集準(zhǔn)確率和準(zhǔn)確率達(dá)到峰值的速度方面均為第一,體現(xiàn)出本文方法的有效性和診斷快速性。同時(shí),其他三個(gè)網(wǎng)絡(luò)在訓(xùn)練過程中準(zhǔn)確率提升不平穩(wěn),難以適用于工業(yè)領(lǐng)域。
相較于農(nóng)業(yè)機(jī)械的實(shí)際工作環(huán)境,由試驗(yàn)臺(tái)所獲得的數(shù)據(jù)噪聲干擾小,信號(hào)辨識(shí)度高,無法真正應(yīng)用于農(nóng)業(yè)機(jī)械的故障診斷。故選擇在數(shù)據(jù)集中添加一定比例的高斯白噪聲,用于模擬真實(shí)的農(nóng)業(yè)機(jī)械工作環(huán)境,同時(shí)檢驗(yàn)網(wǎng)絡(luò)的抗噪性。各網(wǎng)絡(luò)取5次平均測(cè)試集準(zhǔn)確率作為最終結(jié)果,各網(wǎng)絡(luò)準(zhǔn)確率隨數(shù)據(jù)信噪比(SNR)變化結(jié)果如表2所示。
由表2可知,進(jìn)行對(duì)比的四種方法在信噪比較高的情況下,均取得了較高的準(zhǔn)確率,本文方法達(dá)到了97.5%的診斷準(zhǔn)確率。同時(shí),隨著信噪比不斷降低,信號(hào)中噪聲加大,所有方法的準(zhǔn)確率呈現(xiàn)下降趨勢(shì),在信噪比為-2的強(qiáng)噪聲下,本文所提出的方法依舊具有67.5%的準(zhǔn)確率,證明其抗噪能力強(qiáng)。
表2 抗噪性對(duì)比
針對(duì)農(nóng)業(yè)機(jī)械的軸承故障診斷過程中,無標(biāo)簽數(shù)據(jù)多、對(duì)數(shù)據(jù)進(jìn)行標(biāo)記困難的問題,本文提出了一種結(jié)合對(duì)比學(xué)習(xí)的半監(jiān)督故障診斷方法,通過對(duì)比學(xué)習(xí)方法在特征層面對(duì)神經(jīng)網(wǎng)絡(luò)的標(biāo)簽預(yù)測(cè)進(jìn)行修正,充分利用了無標(biāo)簽數(shù)據(jù)中的信息,促使網(wǎng)絡(luò)能更準(zhǔn)確地進(jìn)行分類。此外,相較于其他方法,本文所提出的結(jié)合對(duì)比學(xué)習(xí)的半監(jiān)督方法,具有較強(qiáng)的抗噪能力,能更好地適應(yīng)農(nóng)業(yè)機(jī)械工作環(huán)境,具有較強(qiáng)的適應(yīng)性。