李長文, 程澤銀, 張小剛, 丁華
(1.山西金融職業(yè)學(xué)院 信息技術(shù)系, 山西 太原 030008;2.太原理工大學(xué) 機械與運載工程學(xué)院, 山西 太原 030024;3.煤礦綜采裝備山西省重點實驗室, 山西 太原 030024)
采煤機是煤礦采煤工作面的核心設(shè)備之一,搖臂是采煤機切割煤層的關(guān)鍵動力部件,承受著采煤機截割載荷及搖臂傳動系統(tǒng)非線性內(nèi)激勵,是采煤機的薄弱環(huán)節(jié)[1]。采煤工作面環(huán)境惡劣,采煤機搖臂傳動系統(tǒng)的齒輪極易發(fā)生故障,不但影響煤炭開采效率,造成企業(yè)經(jīng)濟上的損失,更為嚴(yán)重的還會造成人員傷亡事故。由于搖臂傳動系統(tǒng)具有傳動鏈長、齒輪類型多及所處環(huán)境噪聲強的特點,給其齒輪故障診斷帶來了極大挑戰(zhàn)。
國內(nèi)學(xué)者對采煤機故障診斷技術(shù)開展了諸多研究。付家才等[2]結(jié)合小波分析和神經(jīng)網(wǎng)絡(luò)的方法有效地檢測了搖臂故障信號的發(fā)生時間,并準(zhǔn)確地診斷出故障的嚴(yán)重程度。D. Zhang等[3]在采煤機傳動系統(tǒng)的齒輪箱表面安裝2個加速度傳感器,通過對獲得的振動信號進行功率譜分析,預(yù)測了齒輪箱發(fā)生故障的可能性。Z. Li等[4]提出的變模型分解-頻譜回歸優(yōu)化的核費舍爾判別(VMD-SRKFD)方法實現(xiàn)了采煤機傳動系統(tǒng)中齒輪混合故障的檢測。都玉輝等[5]針對采煤機齒輪箱運行過程中容易發(fā)生潤滑不良或異常磨損等故障的問題,提出了一種基于偏最小二乘回歸的采煤機齒輪箱故障診斷方法,實驗表明該方法可以準(zhǔn)確地判斷出齒輪的磨損狀態(tài)。任眾等[6]利用粒子群算法對支持向量機的相關(guān)參數(shù)進行優(yōu)化,并利用優(yōu)化后的支持向量機分類器對采煤機截割部行星齒輪減速器故障進行實時診斷。郝尚清等[7]采用盲源分離算法對采煤機搖臂的軸承進行故障預(yù)測,該算法能夠很好地分離故障信號,且識別率較高。上述文獻中的方法大多通過少量、小規(guī)模數(shù)據(jù)分析實現(xiàn),在面對采煤機多工況交替、故障信息不明的海量信號時,存在分析結(jié)果片面、準(zhǔn)確率差、效率低等問題。
近年來,深度學(xué)習(xí)在故障診斷方面的應(yīng)用發(fā)展迅猛,相對于傳統(tǒng)故障診斷方法有著突破性的優(yōu)勢,能夠擺脫對大量信號處理技術(shù)與診斷經(jīng)驗的依賴,避免了人工提取特征所帶來的不確定性,可完成特征的自適應(yīng)提取,顯著提高了故障識別準(zhǔn)確率。其中具有代表性的深度學(xué)習(xí)模型如深度置信網(wǎng)絡(luò)(Deep Belief Network, DBN)、稀疏自編碼器(Sparse Auto-Encoder, SAE)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)被成功地應(yīng)用于故障診斷領(lǐng)域[8-12]。上述研究大多基于淺層深度學(xué)習(xí)模型,隨著網(wǎng)絡(luò)層數(shù)的增加,層與層之間的權(quán)重不能隨之更新,易導(dǎo)致精度不變或下降。為了克服該缺陷,K. He等[13]在2015年提出了深度殘差網(wǎng)絡(luò)(Deep Residual Network,ResNet)模型,并在故障診斷領(lǐng)域取得了良好的應(yīng)用效果。M. Zhao等[14]設(shè)計了一種具有動態(tài)加權(quán)小波系數(shù)的ResNet,以一系列不同頻段的小波包系數(shù)為輸入,通過動態(tài)加權(quán)層自適應(yīng)調(diào)整小波包系數(shù)的權(quán)重,找出一組識別特征,最終實現(xiàn)了行星齒輪箱的故障診斷。汪久根等[15]利用殘差網(wǎng)絡(luò)模型對RV減速器進行故障診斷,并通過實驗驗證了該模型的有效性。
針對傳統(tǒng)的采煤機搖臂齒輪故障診斷方法不能自主提取特征,導(dǎo)致齒輪故障診斷精度和效率不佳等問題,構(gòu)建了基于ResNet的采煤機搖臂齒輪故障診斷模型,并進行了實驗驗證和對比分析。
ResNet結(jié)構(gòu)的核心在于殘差單元模塊,其主要思想是在訓(xùn)練深層卷積神經(jīng)網(wǎng)絡(luò)的過程中保存部分原始輸入信息,從而轉(zhuǎn)移學(xué)習(xí)目標(biāo),避免由網(wǎng)絡(luò)深度加大引起的分類精度飽和問題。殘差單元學(xué)習(xí)模塊如圖1所示,其中X為輸入,F()為殘差函數(shù)。
圖1 殘差單元模塊
殘差單元模塊主要通過“捷徑連接”的方式,直接把輸入X傳到輸出作為初始結(jié)果,輸出H(X)=F(X)+X,當(dāng)F(X)=0時,H(X)=X,即圖1中的恒等映射。殘差單元模塊改變了學(xué)習(xí)目標(biāo),不需要學(xué)習(xí)完整的輸出,只需學(xué)習(xí)輸入和輸出之間有差別的部分,即殘差F(X)=H(X)-X。其訓(xùn)練目標(biāo)是將殘差F(X)逼近于0,使得ResNet的準(zhǔn)確率不再隨著深度的不斷加大而下降。殘差單元模塊的跳躍式結(jié)構(gòu)改變了傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)某一層的輸出只能作為其下一層輸入的慣例,使某一層的輸出可以直接跨越多層作為后面某一層的輸入,為網(wǎng)絡(luò)層數(shù)增加引發(fā)模型精確度下降的難題提供了新的解決思路。深度殘差單元主要通過以下公式來執(zhí)行:
zl+1=f(yl)
(1)
yl=h(zl)+F(zl+ωl)
(2)
式中:zl+1為第l個殘差單元的輸出特征;f()為線性整流函數(shù)(Rectified Linear Unit,ReLU)的激活函數(shù);h為恒等映射函數(shù),h(zl)=zl,zl為第l個殘差單元的輸入特征;ωl為與第l個殘差單元相關(guān)的權(quán)重。
在ResNet中,殘差單元模塊主要有原始?xì)埐顔卧K和預(yù)激活殘差單元模塊2種,如圖2所示。殘差單元模塊主要由權(quán)重層、批量歸一化(Batch Normalization,BN)層和ReLU組成。權(quán)重層用于提取特征,BN層用于加快網(wǎng)絡(luò)訓(xùn)練速度,ReLU用于減少參數(shù)之間的相互依存關(guān)系,提升網(wǎng)絡(luò)的非線性建模能力,防止出現(xiàn)過擬合現(xiàn)象。Addition代表求和運算。
(a) 原始?xì)埐顔卧K
原始?xì)埐顔卧K中,第1層直接對振動數(shù)據(jù)進行卷積運算,增加了網(wǎng)絡(luò)訓(xùn)練的計算復(fù)雜度,使訓(xùn)練網(wǎng)絡(luò)速度變慢。預(yù)激活殘差單元模塊采用預(yù)激活連接方式,降低了模型的復(fù)雜度,使模型收斂速度更快,因此本文選用預(yù)激活殘差單元模塊。
ResNet主要包括卷積層、池化層和分類層,如圖3所示。
圖3 ResNet結(jié)構(gòu)
2.2.1 卷積層
卷積層主要利用多個不同的卷積核提取原始振動信號的主要特征,得到多個特征向量,實現(xiàn)特征降維。卷積層計算公式為
(3)
卷積層包含卷積核大小、移動步長和卷積核數(shù)量3個參數(shù)。ResNet共有9個卷積層。為了提取短時特征,第1個卷積層采用寬卷積核,寬卷積核可以自適應(yīng)地學(xué)習(xí)面向故障診斷的特征,提高分類精度[16]。該層卷積核大小為64×1,移動步長為16,卷積核數(shù)量為32。其余卷積層都包含在殘差單元模塊中,每個殘差單元模塊中卷積層的具體參數(shù)見表1。
表1 殘差模塊中卷積層參數(shù)設(shè)置
2.2.2 池化層
池化層可以減小中間層輸出樣本尺寸,減少后面各層參與訓(xùn)練的參數(shù)數(shù)量,加快模型訓(xùn)練速度,使模型在訓(xùn)練時能夠更加深層次地挖掘數(shù)據(jù)的有用信息。因此,在ResNet的第1個卷積層后面添加1個最大池化層,在最后一個殘差單元模塊后面添加1個平均池化層。池化層的大小均為5×1,移動步長均為5。
2.2.3 分類層
分類層主要由全連接層和Softmax回歸分類器組成。其中,全連接層實現(xiàn)對池化層輸出特征的“展平”操作,即將所有特征向量首尾連接組成一維向量。Softmax回歸分類器主要實現(xiàn)目標(biāo)故障分類。
基于ResNet的故障診斷算法由數(shù)據(jù)重組、模型訓(xùn)練、模型驗證和模型測試4個部分組成,具體流程如圖4所示。首先對原始樣本進行數(shù)據(jù)重組,然后將重組后的子樣本按8∶2的比例劃分為訓(xùn)練子樣本和測試子樣本,最后將訓(xùn)練子樣本按4∶1的比例劃分為實際訓(xùn)練子樣本和驗證子樣本。
圖4 基于ResNet的故障診斷算法流程
數(shù)據(jù)重組:主要目的是實現(xiàn)原始一維振動信號樣本的擴充。將原始樣本按1/20重疊的方式分割成多個不同子樣本,作為ResNet模型的輸入。
模型訓(xùn)練:將80%的訓(xùn)練子樣本作為實際訓(xùn)練子樣本用于模型的訓(xùn)練。在迭代過程中,比較實際輸出和期望輸出的誤差。當(dāng)誤差大于給定閾值時,對訓(xùn)練模型反向更新權(quán)重;當(dāng)誤差小于給閾值時,輸出訓(xùn)練模型。
模型驗證:將20%的訓(xùn)練子樣本作為驗證子樣本用于模型的驗證。算法在每一輪迭代過程中均會更新網(wǎng)絡(luò)連接中各層的權(quán)重值,每完成一輪迭代更新,會使用驗證子樣本進行一次驗證,以測試模型的改進效果,更好地評估模型的優(yōu)劣。
模型測試:將20%的子樣本作為測試子樣本用于模型的測試。將測試子樣本直接作為訓(xùn)練模型的輸入,通過Softmax回歸分類器實現(xiàn)故障分類。
采煤機工作環(huán)境惡劣,搖臂傳動系統(tǒng)的齒輪故障數(shù)據(jù)不易采集,故利用采煤機搖臂加載實驗臺對搖臂傳動系統(tǒng)中的齒輪故障進行模擬實驗。采煤機搖臂加載實驗臺由電渦流測功機、陪試搖臂、測試搖臂、連接組件、聯(lián)軸器和機械緊固裝置組成,如圖5所示。電渦流測功機負(fù)責(zé)提供搖臂加載所需的負(fù)載轉(zhuǎn)矩。陪試搖臂內(nèi)設(shè)有電動機,可將低轉(zhuǎn)速大轉(zhuǎn)矩轉(zhuǎn)換為高轉(zhuǎn)速小轉(zhuǎn)矩。測試搖臂內(nèi)含有電動機,是實驗臺運轉(zhuǎn)的動力源。聯(lián)軸器將陪試搖臂和測試搖臂連接在一起,以傳遞轉(zhuǎn)矩。機械緊固裝置用于支撐和固定陪試搖臂和測試搖臂。
圖5 采煤機搖臂加載實驗臺
測試搖臂傳動原理如圖6所示,Z1—Z14為齒輪。截割部電動機的輸出軸通過細(xì)長柔性扭矩軸與齒輪Z1相連,電動機輸出轉(zhuǎn)矩通過齒輪Z1—Z8傳到第1級行星減速器,第1級行星減速器的行星架將動力傳給第2級行星減速器,第2級行星減速器輸出的動力傳給方形聯(lián)接套,最后傳到截割滾筒。測試搖臂傳動齒輪參數(shù)見表2。
圖6 測試搖臂傳動原理
采煤機搖臂加載實驗過程:
(1) 將加載的雙搖臂固定在支架上,通過連接組件將陪試搖臂的輸出端和電渦流測功機的輸入端連接固定,通過聯(lián)軸器將陪試搖臂的輸入端和測試搖臂的輸出端連接固定,并進行適當(dāng)調(diào)節(jié),使連接固定的各部件回轉(zhuǎn)中心盡量保持一致,防止搖臂產(chǎn)生振動。
表2 測試搖臂傳動齒輪參數(shù)
(2) 利用加速度傳感器實現(xiàn)采煤機搖臂直齒輪不同狀態(tài)下的振動信號采集。振動能量在搖臂中的傳遞途徑可以通過功率流表述,因此,傳感器的布置點可以根據(jù)功率流在搖臂中的分布來選取。采集齒輪振動信號時,監(jiān)測點選擇在軸與殼體的支承附近時效果較好[17],因此,加速度傳感器安裝在搖臂直齒輪側(cè)附近的殼體上。同時,將加速度傳感器與振動信號采集設(shè)備連接。設(shè)采樣頻率為12 kHz,靈敏度為500 mV/g,加速度傳感器安裝位置及數(shù)據(jù)采集設(shè)備如圖7所示。
(a) 加速度傳感器安裝位置
(3) 加載平臺和測試系統(tǒng)安裝完畢后,給測試搖臂里的電動機接入電源,進行加載實驗。通過調(diào)節(jié)電渦流測功機加載量按鈕,分別將加載量調(diào)節(jié)至25%,50%和75%。每種加載量的加載時間均設(shè)為1 h。在加載時間范圍內(nèi),采集搖臂振動信號并保存至計算機。
(4) 重復(fù)以上步驟,分別采集搖臂直齒輪正常、磨損、斷裂、點蝕和裂紋5種狀態(tài)下的振動信號。
通過觀察不同加載量的振動信號,發(fā)現(xiàn)搖臂在50%加載量下的故障振動信號較為明顯。因此,選擇加載量為50%時的5種狀態(tài),繪制各種齒輪狀態(tài)下的振動信號波形,如圖8所示。
(a) 齒輪正常
從圖8可看出:搖臂齒輪正常狀態(tài)下振動信號加速度變化不大,其值在-0.2~0.2 m/s2內(nèi)波動,沖擊振動較少;當(dāng)齒輪發(fā)生點蝕故障時,振動信號加速度變化范圍有所增大,但增加幅度不大,沒有出現(xiàn)明顯的沖擊振動信號;當(dāng)齒輪發(fā)生磨損故障時,加速度波動幅度開始增大,沖擊振動較為明顯;當(dāng)齒輪發(fā)生裂紋和斷齒故障時,加速度變化范圍大幅增大,并且出現(xiàn)了非常明顯和規(guī)律的沖擊振動信號。因此,從時域信號分析來看,齒輪5種狀態(tài)下的振動信號特征具有明顯差異,有利于實現(xiàn)后續(xù)齒輪故障分類。
選取50%加載量下齒輪各狀態(tài)的振動數(shù)據(jù)進行實驗,樣本長度設(shè)為40 000。訓(xùn)練前,首先將5種狀態(tài)下的一維原始振動信號以1/20的重疊方式分割成2 455個總樣本,然后將2 455個樣本按8∶2的比例分割為1 964個訓(xùn)練子樣本和491個測試子樣本,最后將1 964個訓(xùn)練子樣本按8∶2的比例劃分為1 571個實際訓(xùn)練子樣本和393個驗證子樣本。
采用Python軟件中的Keras框架構(gòu)建ResNet模型,隱藏層激活函數(shù)為ReLU,損失函數(shù)為交叉熵?fù)p失函數(shù),優(yōu)化器、分類器分別為Adam和Softmax,具體訓(xùn)練參數(shù)見表3。Dropout是一種針對神經(jīng)網(wǎng)絡(luò)模型的正則化方法,即在訓(xùn)練過程中隨機地忽略部分神經(jīng)元,以減弱節(jié)點間的聯(lián)合適應(yīng)性,增強模型泛化能力,經(jīng)驗證,Dropout概率為0.5時效果最好。Epochs表示一個完整的數(shù)據(jù)集通過神經(jīng)網(wǎng)絡(luò)1次并且返回1次的過程。
表3 模型訓(xùn)練參數(shù)
在訓(xùn)練100輪后,模型訓(xùn)練集和驗證集的準(zhǔn)確率如圖9所示。從圖9可看出,在前50輪Epochs,驗證集的準(zhǔn)確率比訓(xùn)練集收斂得快。在后50輪Epochs,驗證集和訓(xùn)練集的準(zhǔn)確率都接近于1.0。這表明構(gòu)建的ResNet模型在訓(xùn)練集上的自主學(xué)習(xí)能力隨著Epochs輪數(shù)的增加而逐漸增強。
圖9 模型訓(xùn)練集和驗證集的準(zhǔn)確率曲線
為了更加清晰地體現(xiàn)搖臂齒輪不同狀態(tài)的分類狀況,對測試集的混淆矩陣進行可視化分析,如圖10所示。其中,對角線值為各齒輪狀態(tài)被正確預(yù)測的測試樣本個數(shù)。從圖10可看出,在齒輪磨損(類型標(biāo)簽為1)測試樣本中,有1個樣本被誤測為齒輪裂紋(類型標(biāo)簽為3),有1個樣本被誤測為齒輪斷齒(類型標(biāo)簽為4);在齒輪點蝕(類型標(biāo)簽為2)測試樣本中,有1個樣本被誤測為齒輪正常(類型標(biāo)簽為0),有1個樣本被誤測為齒輪裂紋。其余3種齒輪狀態(tài)的測試樣本識別率均為100%。這表明ResNet模型能夠很好地實現(xiàn)采煤機搖臂齒輪故障分類。
圖10 測試集混淆矩陣
為了進一步證明ResNet模型的優(yōu)越性,選取深度神經(jīng)網(wǎng)絡(luò)(DNN)和LeNet-5與ResNet進行對比實驗。DNN由輸入層、2個隱藏層和輸出層組成,神經(jīng)元個數(shù)分別為1 000,100,100,10。LeNet-5由輸入層、2個5×1的卷積層、2個2×1的池化層、神經(jīng)元個數(shù)分別為120和84的2個全連接層及輸出層組成。在訓(xùn)練100輪后,不同模型的測試集訓(xùn)練所耗費的時間及分類效果見表4。機器學(xué)習(xí)中的分類模型常以精確率和召回率為評估指標(biāo),但在大規(guī)模數(shù)據(jù)集合中,這2個指標(biāo)往往相互制約,故引出F-score作為綜合權(quán)衡二者的調(diào)和值。
表4 各模型訓(xùn)練所耗費時間及分類效果
從表4可看出,因為DNN模型中層與層之間通過全連接的方式連接所有神經(jīng)元,所以在訓(xùn)練時參與計算的權(quán)重數(shù)量最多,使模型訓(xùn)練速度降低,耗費時間增加。而LeNet-5模型中的神經(jīng)元通過局部連接和權(quán)值共享的方式減少了參與計算的權(quán)重數(shù)量,減少了模型的訓(xùn)練時間。與LeNet-5模型相比,ResNet模型采用預(yù)激活殘差單元模塊的方式,保留了部分原始輸入信息,僅需學(xué)習(xí)輸入和輸出之間有差別的部分,簡化了學(xué)習(xí)目標(biāo),降低了模型的復(fù)雜度,從而使模型的訓(xùn)練時間大大縮短,有助于提升搖臂齒輪狀態(tài)的識別效率。
DNN模型表現(xiàn)最差,其綜合識別率和F-score都在80%以下,其中F-score僅為75.53%,說明模型的穩(wěn)定性較差。LeNet-5的綜合識別率和F-score分別為95.36%和96.08%,均高于DNN模型。與LeNet-5相比,ResNet模型的綜合識別率提高了4%左右,F(xiàn)-score提高了3%左右。綜上所述,ResNet模型的分類效果更加顯著,且穩(wěn)定性更好。
為了更加清晰地體現(xiàn)ResNet模型中每一層特征的輸出分類狀況,采用t-SNE技術(shù)[18]對ResNet模型的最大池化層、預(yù)激活殘差單元模塊和全連接層輸出的高維特征進行降維和可視化,可視化效果如圖11所示,其中不同的顏色代表不同的齒輪狀態(tài),數(shù)字與類型標(biāo)簽相對應(yīng)。
(a) 最大池化層
從圖11可看出,在經(jīng)過最大池化層和第1個殘差單元模塊后,齒輪各狀態(tài)信號分布雜亂無章,無規(guī)律性。此時,模型的特征提取能力較弱。經(jīng)過第2個殘差單元模塊后,齒輪各狀態(tài)信號逐漸開始向同一個位置聚集,但是仍不能明確地區(qū)分齒輪不同狀態(tài)。經(jīng)過第3個殘差單元模塊后,齒輪磨損、齒輪裂紋和齒輪斷齒信號逐漸開始與其他2種齒輪狀態(tài)的信號分離。經(jīng)過第4個殘差模塊后,各狀態(tài)信號能夠各自聚集在一起。當(dāng)經(jīng)過全連接層后,齒輪點蝕信號與其他4種齒輪狀態(tài)信號能夠較好地分離。
通過分析搖臂齒輪的降維可視化過程,說明隨著模型層數(shù)不斷增加,ResNet模型的非線性表達能力逐漸增強,能夠?qū)⒉豢煞值奶卣饔成涞椒蔷€性可分空間,說明ResNet模型在采煤機搖臂齒輪故障分類應(yīng)用中具有較強的特征提取能力。
(1) 構(gòu)建了基于ResNet的采煤機搖臂齒輪故障診斷模型,通過采煤機搖臂加載實驗臺和加速度傳感器,采集搖臂直齒輪正常、磨損、斷裂、點蝕和裂紋5種狀態(tài)下的振動信號,得出其特征具有明顯差異,有利于實現(xiàn)后續(xù)齒輪故障分類。
(2) 對測試集的混淆矩陣進行可視化分析,結(jié)果如下:有1個樣本被誤測為齒輪裂紋,有1個樣本被誤測為齒輪斷齒;在齒輪點蝕測試樣本中,有1個樣本被誤測為齒輪正常,有1個樣本被誤測為齒輪裂紋。其余3種齒輪狀態(tài)的測試樣本識別率均為100%。這表明ResNet模型能夠很好地實現(xiàn)采煤機搖臂齒輪故障分類。
(3) 以綜合識別率和F-score作為評價指標(biāo),將ResNet模型與DNN模型和LeNet-5模型進行對比。結(jié)果表明,ResNet模型具有更高的故障診斷精度和效率,綜合識別率和F-score分別達到99.19%和99.05%。
(4) 利用t-SNE技術(shù)對ResNet模型的最大池化層、預(yù)激活殘差單元模塊和全連接層的輸出進行降維可視化,驗證了ResNet模型具有較強的特征提取能力。