張名武,李舜酩,2,程龍歡
(1.南京航空航天大學(xué) 能源與動力學(xué)院, 南京 210016;2.南通理工學(xué)院 汽車工程學(xué)院, 江蘇 南通 226002)
齒輪箱作為機械傳動系統(tǒng)的重要核心部件,越來越受到我國科技部門的重視[1],在日常機械設(shè)備上也得到廣泛應(yīng)用。齒輪箱中的齒輪、軸承等部件因為其運轉(zhuǎn)時間長、工作環(huán)境復(fù)雜,加之受到潤滑、溫度等因素影響,齒輪會發(fā)生斷齒、磨損、點蝕故障,軸承的內(nèi)圈、外圈和滾動體也會損壞。齒輪箱長時間工作運轉(zhuǎn)會使得損傷不斷積累,當(dāng)發(fā)生故障時,導(dǎo)致機械設(shè)備的損壞,甚至誘發(fā)工業(yè)事故,造成巨大的經(jīng)濟損失和人員傷亡。
齒輪箱故障診斷流程通常包括3個部分,信號獲取及處理[2]、故障特征提取[3]和故障類型診斷。齒輪箱的振動信號包含故障件在運行狀況下的大量特征,經(jīng)常作為不同故障診斷模型的輸入信息。傳統(tǒng)的故障特征提取方法[4]依賴于人工的經(jīng)驗且提取的特征效果有時并不明顯,深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)的提出有效地解決了傳統(tǒng)齒輪箱故障診斷方法的弊端。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)作為典型的深度神經(jīng)網(wǎng)絡(luò),憑借較強的特征提取能力[5]被廣泛應(yīng)用于圖像識別、語音識別和目標(biāo)跟蹤等方面,也有學(xué)者成功地將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在機械故障診斷中?;谛盘柼幚砑夹g(shù)和CNN模型相結(jié)合的故障診斷方法[6-7],診斷效果好壞依賴信號處理特征的質(zhì)量,增加了故障分析的不確定性,降低了深度學(xué)習(xí)的智能性。改造CNN模型直接提取振動信號的特征能更加準(zhǔn)確地反映機械設(shè)備的健康狀態(tài)[8-9],但是CNN模型直接對一維振動信號進(jìn)行處理分析時,原始序列的空間相關(guān)性會被破壞,故障的相關(guān)信息會缺失。此外,使用單通道CNN進(jìn)行故障診斷,雖然可以減少網(wǎng)絡(luò)參數(shù),但沒有充分發(fā)揮CNN提取信號特征的能力,不能充分挖掘設(shè)備故障特征信息。
針對上述問題,本文嘗試建立一種MC-FFCNN的模型并將其應(yīng)用在齒輪箱故障診斷上,該方法不僅完全不依賴于人工特征提取和專家知識,而且不同轉(zhuǎn)速下的故障診斷準(zhǔn)確率均較高,比未融合的數(shù)據(jù)網(wǎng)絡(luò)更高。
在智能故障診斷方面,如果能夠?qū)⒁痪S序列數(shù)據(jù)轉(zhuǎn)化為二維數(shù)據(jù)(灰度圖像),那么可以起到很好的故障診斷效果[10]。目前,轉(zhuǎn)換為二維數(shù)據(jù)的主要方法有格拉米角場方法等。本文使用格拉米角場進(jìn)行數(shù)據(jù)增維,其原理簡單且計算量較小。
格拉米角場將一維序列數(shù)據(jù)縮放,再從直角坐標(biāo)系統(tǒng)轉(zhuǎn)換到極坐標(biāo)系統(tǒng),然后考慮不同點之間的角度和或者角度差以識別不同時間點的時間相關(guān)性。角度和、角度差對像素值數(shù)據(jù)的規(guī)律性影響幾乎一樣,本文選擇角度和(gramian angular summation field,GASF)做角度變換。
格拉米角場的實現(xiàn)步驟如圖1所示。首先,對一維序列數(shù)據(jù)做歸一化處理,利用minmax歸一化方法將一維數(shù)據(jù)映射到[0,1];其次,將縮放后的時間序列數(shù)據(jù)在極坐標(biāo)中轉(zhuǎn)換,即將數(shù)值看作夾角余弦值;然后,對在極坐標(biāo)中轉(zhuǎn)換后的角度數(shù)據(jù)做角度和變換。如果原始時間序列數(shù)據(jù)的長度為2n,經(jīng)過GASF轉(zhuǎn)換后,得到了尺寸為[2n,2n]的矩陣;接著采用分段聚合近似(piecewise aggregation approximation,PAA)的方法將序列長度減小,平均將每個段內(nèi)的子序列壓縮為一個數(shù)值。
經(jīng)過分塊后的矩陣減少了計算量,并且保留了原有的信號特征。這些矩陣數(shù)據(jù)的數(shù)值在[-1,1]之間,可以作為振動故障信號的灰度圖數(shù)據(jù)。
圖1 格拉米角場增維
MC-FFCNN網(wǎng)絡(luò)屬于卷積神經(jīng)網(wǎng)絡(luò)的一種,其結(jié)構(gòu)包含卷積層、池化層、全連接層以及Softmax分類層,在最后一層池化層和全連接層間加入融合層。MC-FFCNN智能故障診斷算法的主要結(jié)構(gòu)包括2個部分:信號擴維和神經(jīng)網(wǎng)絡(luò)診斷模型。
多個傳感器獲取的故障數(shù)據(jù),采用格拉米角場擴維成二維矩陣數(shù)據(jù),將這些數(shù)據(jù)作為灰度圖的像素值,從多個通道輸入到神經(jīng)網(wǎng)絡(luò)中。多傳感器采集的振動信號輸入模型如圖2所示。
圖2 多傳感器采集的信號輸入模型
MC-FFCNN故障診斷模型包含3層卷積層、3層池化層、1層融合層,最后用全連接層以及Softmax回歸對融合結(jié)果進(jìn)行故障分類。
3層卷積層以滑動窗口的形式提取原始數(shù)據(jù)特征,卷積核以一定規(guī)則與圖像上相應(yīng)區(qū)域的數(shù)據(jù)做卷積運算,當(dāng)所有區(qū)域計算完成后,所有數(shù)據(jù)的特征都被提取出來。3層最大池化層可以保留計算目標(biāo)的關(guān)鍵信息,去除冗余信息,降低神經(jīng)網(wǎng)絡(luò)的計算量。最后一層池化層提取灰度圖特征后,在融合層中采用加權(quán)融合方法融合特征信息。對于振動信號的二維數(shù)組,由于各個通道提取的特征圖存在差異,每個通道對特征圖的貢獻(xiàn)度也不一樣,采用信號峭度值來衡量每個通道的貢獻(xiàn)度及權(quán)重。全連接層是將融合層的結(jié)果進(jìn)行整合處理,每個連接可以有不同的權(quán)重參數(shù)。它的作用是將前面卷積層和池化層提取的目標(biāo)關(guān)鍵特征進(jìn)行整合。分類器Softmax回歸是一種指數(shù)函數(shù),可以實現(xiàn)歸一化。因為它以概率的形式展現(xiàn),所以針對不同的故障類型,可以達(dá)到較好的分類效果。決定卷積神經(jīng)網(wǎng)絡(luò)模型迭代計算參數(shù)更新快慢的是激活函數(shù)。常用的激活函數(shù)有Sigmoid函數(shù)、tanh函數(shù)、ReLu函數(shù)和Leaky ReLu函數(shù)。Sigmoid函數(shù)是便于求導(dǎo)的平滑函數(shù),但是運算耗時間。Tanh函數(shù)解決了Sigmoid函數(shù)的非zero-centered問題,但是它存在梯度消失和冪運算的問題。ReLu函數(shù)收斂速度比Sigmoid和tanh函數(shù)快,計算難度低,不需要進(jìn)行指數(shù)運算。Leaky ReLu函數(shù)解決了ReLu函數(shù)帶來的神經(jīng)壞死的問題,但其表現(xiàn)并不穩(wěn)定。本研究中選擇ReLu函數(shù),所使用的卷積神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖3所示,卷積神經(jīng)網(wǎng)絡(luò)參數(shù)如表1所示。
圖3 卷積神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
表1 卷積神經(jīng)網(wǎng)絡(luò)參數(shù)
其中,c是故障的數(shù)量,m是通道數(shù),F(xiàn)是卷積核的數(shù)量,f1是卷積核的形狀,s是步長,P是池化層的形狀,W1,W2和W3分別是各個通道的權(quán)重,Kp表示全連接層層數(shù)。
數(shù)據(jù)融合[11-12]包含了3種融合方式,分別是數(shù)據(jù)級融合方式、特征級融合方式和決策級融合方式。本文在融合層使用了特征融合的方法。多通道的特征融合方式如圖4所示。相比于單通道的振動信號處理效果,多通道的灰度圖融合可以全面地表達(dá)故障特征。融合后的特征圖每個位置的像素值為3個通道融合前的特征圖相應(yīng)位置的像素值與其分配權(quán)重乘積之和。
圖4 多通道的特征融合方式
本文試驗中錐齒輪箱傳動試驗臺如圖5所示。傳感器布置方式如圖6所示,3個接觸式加速度傳感器獲取輸入軸、中間軸、輸出軸的振動信號。
圖5 錐齒輪箱傳動試驗臺
圖6 錐齒輪箱傳感器布置方案
選取的數(shù)據(jù)有10種,分別用C1—C10表示,10種數(shù)據(jù)包括齒輪箱正常、內(nèi)圈裂紋、外圈裂紋、齒輪斷齒、齒輪點蝕(4個)、齒輪點蝕(6個)、齒輪裂紋(0.25倍齒厚)、齒輪裂紋(0.5倍齒厚)、齒輪磨損(0.4倍齒厚)和齒輪磨損(0.8倍齒厚)。
學(xué)習(xí)率是訓(xùn)練網(wǎng)絡(luò)的重要參數(shù),訓(xùn)練剛開始時,使用較大的學(xué)習(xí)率可以加快訓(xùn)練速度,訓(xùn)練到達(dá)一定程度后使用較小的學(xué)習(xí)率可以提高精度。設(shè)定初始學(xué)習(xí)率為0.001,當(dāng)?shù)螖?shù)大于12時,測試的準(zhǔn)確率增長變得緩慢,為了提高測試的精度,將學(xué)習(xí)率調(diào)低至0.000 8。當(dāng)?shù)螖?shù)超過30時,網(wǎng)絡(luò)的測試準(zhǔn)確率已經(jīng)穩(wěn)定。設(shè)定每一次訓(xùn)練測試的迭代次數(shù)為30次,在迭代次數(shù)12及以下時,學(xué)習(xí)率為0.001,在13次到30次之間,學(xué)習(xí)率為0.000 8。
峭度值對大幅值敏感,可以作為一個權(quán)重指標(biāo),融合層的權(quán)重可以根據(jù)每個傳感器的原始數(shù)據(jù)的峭度值特征而確定。
選取試驗中700、900、1 100、1 300 r/min的試驗數(shù)據(jù),將圖像數(shù)據(jù)導(dǎo)入搭建的卷積神經(jīng)網(wǎng)絡(luò)融合模型和未融合的卷積神經(jīng)網(wǎng)絡(luò)模型,可以得到各轉(zhuǎn)速下的測試準(zhǔn)確率,如表2所示。
表2 不同網(wǎng)絡(luò)各轉(zhuǎn)速下的診斷準(zhǔn)確率
在同樣的轉(zhuǎn)速數(shù)據(jù)集中,融合數(shù)據(jù)的網(wǎng)絡(luò)診斷準(zhǔn)確率比非融合數(shù)據(jù)網(wǎng)絡(luò)高,且不同轉(zhuǎn)速的故障診斷的準(zhǔn)確率波動也較小,這表明本文提出的融合數(shù)據(jù)網(wǎng)絡(luò)的優(yōu)越性。另外,同一網(wǎng)絡(luò)診斷準(zhǔn)確率最好的是1 100 r/min,最差的是1 300 r/min,另外2種轉(zhuǎn)速的準(zhǔn)確率次之。這是因為電機的額定轉(zhuǎn)速是1 500 r/min,1 300 r/min是最接近的,對數(shù)據(jù)的采集影響較大,轉(zhuǎn)速太低獲取的數(shù)據(jù)也有一定影響。
故障準(zhǔn)確率雖然可以反映模型的整體診斷效果,但是不能反映每種故障的診斷情況?;煜仃嚳梢詫⒉煌愋偷墓收系脑\斷效果在一張圖中表示出來。圖7是轉(zhuǎn)速為700 r/min時融合模型的混淆矩陣,700 r/min的C2的真實標(biāo)簽和預(yù)測標(biāo)簽相似度最高,可達(dá)0.97。C1的真實標(biāo)簽和預(yù)測標(biāo)簽相似度最低,只有0.87,預(yù)測的標(biāo)簽存在誤判為C4、C5、C6、C8的情況。圖8是轉(zhuǎn)速為700 r/min時未融合模型的混淆矩陣,其網(wǎng)絡(luò)診斷的效果要差一些。在700 r/min轉(zhuǎn)速下,未融合神經(jīng)網(wǎng)絡(luò)的C2、C5、C6、C7、C8和C10的診斷準(zhǔn)確率均低于融合神經(jīng)網(wǎng)絡(luò)的診斷準(zhǔn)確率。
圖7 700 r/min轉(zhuǎn)速下融合模型的混淆矩陣
圖8 700 r/min轉(zhuǎn)速下未融合模型的混淆矩陣
采用故障分類圖可以直觀地展現(xiàn)單個故障間的聚類情況以及各個故障間的分類情況。700 r/min 轉(zhuǎn)速下融合數(shù)據(jù)與未融合數(shù)據(jù)結(jié)果的故障分類圖如圖9和圖10所示。
圖9和圖10的橫縱坐標(biāo)都是表示降維到二維的數(shù)據(jù)特征,不同的顏色代表不同類別的故障標(biāo)簽,每一種顏色可以清晰地展現(xiàn)單個故障內(nèi)的聚類程度,不同顏色間也可以明確地區(qū)分不同故障間的差異。
圖9 700 r/min轉(zhuǎn)速下融合模型的聚類圖
在700 r/min轉(zhuǎn)速下,在未融合數(shù)據(jù)集的分類結(jié)果中,C1和C8有較多的重合,這也間接說明了C1和C8的故障診斷準(zhǔn)確率低,另外,C3和C7,C4和C6有較少的交叉,這也導(dǎo)致了這些標(biāo)簽間的匹配問題。在融合數(shù)據(jù)集的分類結(jié)果中,除了C2和C5之間會有部分的交叉影響,其他的故障標(biāo)簽之間都是有某1個或2個樣本的跳動,對故障診斷的結(jié)果影響很小。
1) 對原始振動信號采用了格拉米角場增維處理,處理后的矩陣元素數(shù)值均為0到1之間的數(shù),不僅保持了原有信號的時序性,還可以加快訓(xùn)練網(wǎng)絡(luò)的收斂性。
2) 采用了多通道的卷積神經(jīng)網(wǎng)絡(luò)模型,克服了單個傳感器信號不能全面反映故障特征的弊端,將多個信號通過圖像轉(zhuǎn)換后的圖片作為卷積融合神經(jīng)網(wǎng)絡(luò)的輸入,有效提高了故障診斷的準(zhǔn)確率。
3) 該模型充分利用了CNN的特征提取能力,能夠準(zhǔn)確識別齒輪箱數(shù)據(jù)的10種不同故障狀態(tài),相較于單通道CNN的故障診斷方法,本文提出的基于MC-FFCNN模型的齒輪箱故障診斷方法準(zhǔn)確率更高。
下一步的研究重點為研究模型參數(shù)對診斷結(jié)果的影響,提高算法的運算效率。