劉 偉,單雪垠,李雙喜*,張志華,姚思雨
(1.北京化工大學(xué) 機(jī)電工程學(xué)院,北京 100029;2.石河子大學(xué) 機(jī)械電氣工程學(xué)院,新疆 石河子 832003)
滾動軸承是現(xiàn)代機(jī)械設(shè)備,尤其是旋轉(zhuǎn)機(jī)械中常用的零部件,其通常工作在高溫、高壓和高速旋轉(zhuǎn)的惡劣環(huán)境中,所以極易發(fā)生故障。據(jù)有關(guān)部門的統(tǒng)計,在工業(yè)領(lǐng)域,由滾動軸承失效引起的機(jī)械設(shè)備故障占比達(dá)41%[1]。
采用故障診斷技術(shù),不僅可以對機(jī)械設(shè)備的運(yùn)行狀態(tài)進(jìn)行實(shí)時監(jiān)測,還可以對故障的部位和損傷程度進(jìn)行識別,提高機(jī)械設(shè)備的可靠性和穩(wěn)定性。因此,開發(fā)以滾動軸承為研究對象的故障診斷技術(shù),對于提高整個機(jī)械系統(tǒng)的安全性意義重大。
隨著現(xiàn)代機(jī)械設(shè)備逐漸向復(fù)雜化和智能化方向發(fā)展,針對滾動軸承運(yùn)行狀態(tài)的監(jiān)測也進(jìn)入了“大數(shù)據(jù)”時代。為了取得較好的診斷效果,傳統(tǒng)的故障診斷技術(shù)需要復(fù)雜的信號處理方法和專業(yè)的背景知識。而面對“大數(shù)據(jù)”時代海量的數(shù)據(jù),這個過程通常需要大量的人力,這在一定程度上制約了傳統(tǒng)技術(shù)的應(yīng)用前景。
近年來,隨著人工智能技術(shù)的迅猛發(fā)展,基于深度學(xué)習(xí)理論的故障診斷技術(shù)得到了廣泛應(yīng)用。該技術(shù)尤其適用于解決復(fù)雜場景中的軸承故障診斷問題[2,3]。在此背景下,許多學(xué)者已經(jīng)開展了大量的研究工作。
韓濤等人[4]首先對滾動軸承振動信號進(jìn)行了多小波變換(multi-wavelet transform,MWT)處理,得到了相應(yīng)的多小波系數(shù)分支,在此基礎(chǔ)上構(gòu)造了特征圖,建立了卷積神經(jīng)網(wǎng)絡(luò)(CNN)分類器模型,實(shí)現(xiàn)了對滾動軸承復(fù)合故障的智能診斷。吳春志等人[5]提出了一種基于一維CNN的齒輪箱故障診斷模型,可以直接從原始振動信號中學(xué)習(xí)特征,并完成了對齒輪箱故障的診斷。張向陽等人[6]針對滾動軸承故障激勵下的機(jī)匣微弱故障特征,使用連續(xù)小波尺度譜法將一維原始信號轉(zhuǎn)化為二維圖像信號,并將其輸入CNN網(wǎng)絡(luò)中,對滾動軸承故障進(jìn)行了識別。王海龍等人[7]結(jié)合了經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)與CNN方法,將滾軸承信號經(jīng)EMD處理得到的模態(tài)分量,與原始振動信號一起構(gòu)建了二維特征圖,再將特征圖輸入到CNN中,取得了較好的滾動軸承診斷結(jié)果。針對滾動軸承振動信號存在噪聲干擾等問題,董紹江等人[8]提出了一種抗噪多核卷積神經(jīng)網(wǎng)絡(luò),并在網(wǎng)絡(luò)中添加了dropout層,提高了模型的抗干擾能力。劉紅軍等人[9]通過格拉姆角差場,將一維時序振動信號轉(zhuǎn)化為二維圖像,提取出了其圖像特征,并將其輸入到改進(jìn)的CNN模型中,再通過Adam小批量優(yōu)化法對其進(jìn)行了迭代訓(xùn)練,最后取得了理想的故障檢測精度。
傳統(tǒng)的基于CNN的軸承故障診斷技術(shù)主要使用振動信號的時域信息或者頻域信息,但是都沒有將二者有效地結(jié)合起來,并加以更好地利用。
基于上述原因,筆者提出一種基于并行1DCNN(一維卷積神經(jīng)網(wǎng)絡(luò))的滾動軸承故障診斷方法。首先對滾動軸承振動信號進(jìn)行處理,然后構(gòu)建由兩個通道組成的并行1DCNN模型,一個通道學(xué)習(xí)振動信號時域信息,另一個通道學(xué)習(xí)振動信號頻域信息,由此加快信號處理速度,并減少運(yùn)算量,以有效提高軸承信號中故障特征信息的利用率,增強(qiáng)模型的故障識別精度。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種多層次的結(jié)構(gòu)模型,由輸入層、卷積層、池化層、全連接層和輸出層組成[10]。
(1)輸入層。作為CNN的第一層,輸入層用來接收訓(xùn)練和預(yù)測的樣本,并對輸入樣本的大小和格式等進(jìn)行校驗(yàn)。
(2)卷積層。卷積層是CNN的核心[11],通過卷積運(yùn)算可以有效提取輸入圖像數(shù)據(jù)的特征信息。
卷積層的具體運(yùn)算如下:
(1)
需要說明的是,從卷積層的輸入到輸出是線性映射,無法逼近復(fù)雜函數(shù)。為了使卷積層具有非線性輸出能力,通常引入激活函數(shù),其作用是對卷積層的輸出進(jìn)行非線性映射,一般采用修正線性單元(rectified linear unit,ReLu)作為一維CNN的激活函數(shù)。
(3)池化層。池化層的作用是對網(wǎng)絡(luò)進(jìn)行下采樣,降低數(shù)據(jù)的維度,從而減少CNN中需要訓(xùn)練的參數(shù)。網(wǎng)絡(luò)參數(shù)過多不僅會降低訓(xùn)練速度,而且容易引起過擬合[12]。因此,通常在某些卷積層后添加池化層進(jìn)行下采樣。池化一般有3種策略,即均值池化、最大池化和最小池化。目前,CNN廣泛使用的是后兩種,即:
(2)
(3)
(4)全連接層。全連接層將前幾層處理得到的二維特征進(jìn)行拼接,得到一個一維特征,并和分類器配合使用,實(shí)現(xiàn)分類功能[13,14]。
(5)輸出層。輸出層包含分類器,其作用是對訓(xùn)練特征進(jìn)行分類,并在訓(xùn)練時將與目標(biāo)函數(shù)的誤差反饋給CNN來迭代更新權(quán)重。
傳統(tǒng)的1DCNN網(wǎng)絡(luò)模型如圖1所示。
圖1 1DCNN網(wǎng)絡(luò)模型
由于該模型僅使用了信號的時間域相關(guān)信息,為了能充分利用頻域信息,筆者提出一種并行的1DCNN網(wǎng)絡(luò)模型。
由于滾動軸承產(chǎn)生的振動信號為一維時序信號,因此,在此處筆者主要研究一維CNN。
并行1DCNN由兩個通道組成,可以分別獲取振動信號的時域信息和頻域信息。提取時域信息時使用相對較小的卷積核,提取頻域信息時使用相對較大的卷積核,其目的是保證在獲取故障特征信息的同時,可以加快網(wǎng)絡(luò)的訓(xùn)練速度。
與傳統(tǒng)單通道CNN模型相比,由于并行1DCNN模型可以充分利用所提取的時域和頻域特征信息,具有更加出色的故障診斷能力。
并行1DCNN的模型結(jié)構(gòu)如圖2所示。
圖2 并行1DCNN網(wǎng)絡(luò)模型
圖2中,第一個卷積層針對時域信息和頻域信息分別使用了小卷積核和大卷積核,之后都使用較小的卷積核;同時,在每個卷積層中都設(shè)置補(bǔ)零操作,目的是確保卷積層的輸入和輸出具有相同的維度,有利于保護(hù)信號的邊緣信息。
在對軸承信號進(jìn)行處理的過程中,小卷積核參數(shù)參照傳統(tǒng)的1DCNN模型,大卷積核參數(shù)根據(jù)CNN感受野的相關(guān)公式確定。
CNN的感受野示意圖如圖3所示。
圖3 感受野示意圖
圖3中,輸入信號中的黑色神經(jīng)元表示最后一個池化層的神經(jīng)元在輸入信號中的感受野。構(gòu)建CNN的核心是確定感受野,即一個神經(jīng)元在其下層網(wǎng)絡(luò)中的感知范圍[15]。由于機(jī)械振動信號具有周期性,且每一個輸入信號的相位不一定相同。為了使網(wǎng)絡(luò)學(xué)習(xí)到位移無關(guān)的特征,應(yīng)確保最后一個池化層的神經(jīng)元在輸入信號中的感受野大小要大于一個信號周期。
設(shè)并行1DCNN中,R(0)為最后一個池化層的神經(jīng)元在輸入信號中的感受野,T為信號采集時一個周期的樣點(diǎn)數(shù),L為一維時序信號的長度,則感受野R(0)應(yīng)該滿足T≤R(0)≤L,其計算過程如下:
最后一個池化層的神經(jīng)元在第K個池化層的感受野R(K)與在第K-1個池化層的感受野R(K-1)之間滿足如下關(guān)系:
R(K-1)=S(K)(P(K)R(K)-1)+W(K)
(4)
式中:S(K)—第K個卷積層的步長;W(K)—第K個卷積核的寬度;P(K)—第K個池化層降采樣點(diǎn)的個數(shù)。
文中,當(dāng)層數(shù)K>1時,S(K)=1,W(K)=3,P(K)=2,則式(4)可簡化為:
R(K-1)=2R(K)+2
(5)
當(dāng)K=n時,R(n)=1,則最后一個池化層在第一個池化層的感受野為:
R(1)=2n-1×3-2
(6)
根據(jù)上述關(guān)系可以計算出最后一個池化層的神經(jīng)元在輸入信號上的感受野為:
R(0)=S(1)(P(1)R(1)-1)+W(1)=
2S(1)(2n-1×3-2)+W(1)-S(1)≈
S(1)(2n×3-4)
(7)
由于T≤R(0)≤L,T≤S(1)(2n×3-4)≤L,同時步長S(1)應(yīng)該能夠整除信號長度L。此處輸入信號的長度為1 024,周期T為400,當(dāng)卷積層數(shù)為5時,S(1)選定為8,卷積寬度不小于3倍步長。因此,此處第一次卷積核寬度選為24。為了同時提取滾動軸承振動信號中的時域和頻域信息,并行1DCNN的另一通道使用較小的卷積核。
需要說明的是,在傳統(tǒng)的1DCNN中通常使用全連接層。然而全連接層的缺點(diǎn)是訓(xùn)練參數(shù)較多,降低了模型的訓(xùn)練速度,容易導(dǎo)致過擬合[16,17]。為此,在并行1DCNN模型中,筆者使用全局最大池化層替換了全連接層。
另外,為了提高故障的診斷效率,筆者在并行1DCNN模型中使用了回調(diào)函數(shù),確保當(dāng)損失不再發(fā)生變化時停止訓(xùn)練。筆者結(jié)合了Model Checkpoint與Early Stopping回調(diào)函數(shù),當(dāng)監(jiān)控目標(biāo)指數(shù)在設(shè)定的輪次內(nèi)不再改變,可以用EarlyStoppin終止模型訓(xùn)練,同時ModelCheckpoint在訓(xùn)練的過程中可以不斷保存模型,以獲得最佳模型。
為了驗(yàn)證并行1DCNN模型的有效性,筆者使用美國凱斯西儲大學(xué)(case western reserve university,CWRU)的軸承數(shù)據(jù)集進(jìn)行仿真模擬。
CWRU實(shí)驗(yàn)臺如圖4所示。
圖4 CWRU實(shí)驗(yàn)臺
在所使用的數(shù)據(jù)集中,工作臺轉(zhuǎn)速為1 772 r/min,一個周期內(nèi)可以采集400個樣點(diǎn)。軸承故障包括內(nèi)圈、外圈和滾動體故障,每種故障對應(yīng)3種不同的損傷程度,且故障尺寸分別為0.007 ft、0.014 ft、0.021 ft。
筆者分別選取3組不同損傷程度的內(nèi)圈故障數(shù)據(jù)、3組不同損傷程度的外圈故障數(shù)據(jù)、3組不同損傷程度的滾動體故障數(shù)據(jù)和1組正常數(shù)據(jù),并將上述所有數(shù)據(jù)按照56%、14%、30%的比例,劃分為訓(xùn)練集、驗(yàn)證集和測試集。
數(shù)據(jù)詳細(xì)使用情況如表1所示。
表1 數(shù)據(jù)集描述
為了防止因數(shù)據(jù)集樣本過少,從而導(dǎo)致在訓(xùn)練過程中網(wǎng)絡(luò)模型出現(xiàn)欠擬合現(xiàn)象[18],在實(shí)驗(yàn)中,筆者采用重采樣方法來增加數(shù)據(jù)樣本的數(shù)量[19]。
信號重采樣示意圖如圖5所示。
圖5 信號重采樣示意圖
重采樣是一種數(shù)據(jù)增強(qiáng)的方法。它通過重疊讀取振動信號,來增強(qiáng)樣本之間的相關(guān)性,使模型通過學(xué)習(xí)來增強(qiáng)其魯棒性。此處選取的信號長度為1 024,采樣間隔為200。
2.1.1 網(wǎng)絡(luò)中間層可視化
中間層可視化能夠展現(xiàn)網(wǎng)絡(luò)模型提取軸承振動信號故障特征的過程,以便更好地理解并行1DCNN模型。筆者以內(nèi)圈故障信號為例來展示并行1DCNN的中間層可視化結(jié)果。
內(nèi)圈故障信號的波形圖如圖6所示。
圖6 內(nèi)圈故障信號
筆者將故障信號輸入并行1DCNN模型,然后提取不同卷積層的中間輸出結(jié)果,并將其做可視化處理。
軸承內(nèi)圈故障信號卷積層可視化結(jié)果如圖7所示。
圖7 內(nèi)圈故障信號卷積層可視化
從圖7中可以看出:當(dāng)信號通過卷積層后,不同的通道可以提取不同的特征(例如,第2個卷積層的第6通道對振動信號某一區(qū)域沖擊部分敏感;而第3個卷積層13通道對另一段振動信號的沖擊部分敏感)。
由于不同的通道可以檢測軸承不同段的沖擊信號,網(wǎng)絡(luò)模型可以通過識別信號不同區(qū)域的沖擊,來學(xué)習(xí)不同故障的規(guī)律,并由此識別軸承的故障類別與故障深度。
2.1.2 t-SNE可視化
t-SNE(t-distributed stochastic neighbor embedding)是一種非線性降維技術(shù),主要用來對高維數(shù)據(jù)進(jìn)行可視化[20]。通過t-SNE降維,可以將高維數(shù)據(jù)降為二維平面散點(diǎn)圖,通過散點(diǎn)圖就可以直觀地反映深度學(xué)習(xí)模型的故障分類情況。
并行1DCNN模型中,輸入層的分類結(jié)果如圖8所示。
圖8 輸入樣本的分布
從圖8中可以看出:正常數(shù)據(jù)和故障數(shù)據(jù)具有較明顯的分隔;但同時不同故障類型的數(shù)據(jù)又完全疊合在一起,無法得到很好區(qū)分。
并行1DCNN模型中,輸出層的分類結(jié)果如圖9所示。
圖9 并行1DCNN模型的輸出
從圖9中可以看出:經(jīng)過并行1DCNN處理后,10種數(shù)據(jù)實(shí)現(xiàn)較好區(qū)分,且每種數(shù)據(jù)結(jié)構(gòu)更加緊湊,只有個別類別9被錯誤預(yù)測為類別7;該情況說明,對于滾動體故障而言,損壞尺寸所導(dǎo)致的振動信號間的差異較為相似。
并行1DCNN針對訓(xùn)練集和驗(yàn)證集的精度如圖10所示(迭代次數(shù)為30次)。
圖10 訓(xùn)練和驗(yàn)證精度
并行1DCNN針對訓(xùn)練集和驗(yàn)證集的損失如圖11所示(迭代次數(shù)為30次)。
圖11 訓(xùn)練和驗(yàn)證損失
在圖10和圖11中,黑色線條表示訓(xùn)練集的精度與損失,灰色線條表示驗(yàn)證集的精度和損失。
從圖10和圖11中可以看出:當(dāng)批次大于15時,模型的分類精度已接近100%,同時損失值也隨著批次的增加而逐漸降低。
為了避免偶然性,在實(shí)驗(yàn)中需要平行訓(xùn)練并行1DCNN模型5次,在測試集上獲得故障診斷精度為0.996 9。
此外,筆者在實(shí)驗(yàn)中也測試了小卷積核網(wǎng)絡(luò)和大卷積核網(wǎng)絡(luò)的診斷精度,并將該結(jié)果與采用并行1DCNN模型獲得的診斷精度進(jìn)行了對比,結(jié)果如表2所示。
表2 平行訓(xùn)練模型5次得到的模型精度
從表2可以明顯看出,并行1DCNN模型的故障診斷精度均高于其他2種模型的診斷精度。
針對3種網(wǎng)絡(luò)模型的精度箱型圖如圖12所示。
圖12 精度箱形圖
由圖12可知:并行1DCNN模型取得了更優(yōu)的故障診斷效果,且5次運(yùn)行的精度均高于0.996,最高可達(dá)0.998。
為了充分利用時域和頻域中的故障特征信息,筆者提出了一種新的軸承故障診斷模型,即并行1DCNN(一維卷積神經(jīng)網(wǎng)絡(luò))模型。
采用該模型對軸承故障進(jìn)行診斷時,首先對滾動軸承振動信號進(jìn)行處理,然后構(gòu)建由兩個通道組成的并行1DCNN模型,一個通道學(xué)習(xí)振動信號時域信息,另一個通道學(xué)習(xí)振動信號頻域信息,由此加快了信號處理速度,提高了軸承信號中故障特征信息的利用率,增強(qiáng)了模型的故障識別精度。
由于1DCNN是針對傳統(tǒng)CNN的一種改進(jìn),它具有更加出色的故障診斷能力。與其他智能診斷模型相比,并行1DCNN具有如下優(yōu)勢:
(1)并行1DCNN通過兩個具有不同卷積核大小的通道,來學(xué)習(xí)滾動軸承振動信號的時域信息和頻域信息,能夠充分利用振動信號所包含的故障信息;
(2)模型的輸入更加簡單,直接對一維時序信號進(jìn)行處理,無需將其轉(zhuǎn)化為二維圖像,由此加快了信號處理速度,并且減少了運(yùn)算量;
(3)與傳統(tǒng)的CNN模型相比,并行1DCNN能夠有效提高軸承信號中故障特征信息的利用率,極大地提高模型的故障識別精度。
在未來的研究中,筆者將重點(diǎn)探索環(huán)境噪聲對并行1DCNN穩(wěn)定性的影響,并提出相應(yīng)的解決方案。