莊雨璇,李 奇,楊冰如,陳 良,沈長青
(1.蘇州大學(xué) 機電工程學(xué)院,江蘇 蘇州215006;2.蘇州大學(xué) 軌道交通學(xué)院,江蘇 蘇州215006)
滾動體軸承是機械傳動系統(tǒng)的基本組成部件。軸承故障與失靈直接導(dǎo)致設(shè)備無法正常運行,造成經(jīng)濟損失,甚至危害工作人員的安全。因此,及時、準(zhǔn)確地診斷出軸承的故障具有重要的意義。軸承的故障診斷一直備受學(xué)者們關(guān)注與研究,傳統(tǒng)方法是將時域數(shù)據(jù)轉(zhuǎn)換成頻域數(shù)據(jù),進(jìn)行軸承的檢測與診斷。鄭紅等提出一種基于譜峭度與雙譜的軸承故障診斷方法,通過計算低頻矩形區(qū)域的局部雙譜圖進(jìn)行故障診斷[1]。楊青,孫佰聰?shù)壤眯〔ò夹g(shù)進(jìn)行多層次特征提取,通過結(jié)合小波包熵和聚類分析方法對軸承進(jìn)行故障診斷[2]。付云驍、賈利民等從多維時頻域特征的角度,運用BP神經(jīng)網(wǎng)絡(luò)對滾動體軸承進(jìn)行故障診斷[3]。姜濤等改進(jìn)小波神經(jīng)網(wǎng)絡(luò)模型[4],解決基于BP算法的故障診斷收斂速度慢、易陷入局部極小值等問題。LI等通過層次模熵方法提取故障特征[5],運用拉普拉斯變換細(xì)化故障特征,改進(jìn)基于支持向量機的二叉樹方法,診斷軸承故障。向丹等運用經(jīng)驗?zāi)B(tài)分解、核主元分析方法提取原始振動信號特征并進(jìn)行與信息融合,運用支持向量機診斷軸承的故障[6]。上述傳統(tǒng)方法將原始時域信號轉(zhuǎn)換成頻域信號或提取頻域特征,無法直接通過時域數(shù)據(jù)進(jìn)行軸承故障的檢測與診斷。
近年來,深度學(xué)習(xí)的出現(xiàn)為軸承故障診斷提供了新方法、新思路?;谏疃葘W(xué)習(xí)的故障診斷方法最初以卷積神經(jīng)網(wǎng)絡(luò)CNN為主,將振動信號轉(zhuǎn)換成二維空間上的數(shù)據(jù)圖譜[7],然后輸入到CNN 模型中診斷軸承故障。WEN 等基于LeNet-5 提出一種CNN 模型[8],無需手工選取特征即可進(jìn)行軸承故障診斷。WANG 等提出一種復(fù)合診斷模型[9],將短時傅里葉變換與CNN 結(jié)合,通過CNN 自適應(yīng)地提取頻域特征來表示信號與健康狀態(tài)之間的復(fù)雜映射關(guān)系,進(jìn)行軸承故障診斷。提出的方法綜合了CNN模型和改進(jìn)特征融合算法的優(yōu)點[10],能對不同負(fù)載條件下的軸承進(jìn)行故障診斷。GUO 等提出一種基于CNN 的分層故障診斷方法[11],在故障模式識別和故障尺寸評估方面體現(xiàn)了令人滿意的性能。
基于CNN 的新方法極大地提高了軸承故障診斷的準(zhǔn)確性,但將振動信號轉(zhuǎn)換成二維空間圖譜的做法缺乏理論依據(jù)??紤]到振動信號本質(zhì)上是一個時間序列,如果能夠直接將時域信號輸入一個故障診斷模型,則算法會更簡潔,更自然,更易于實際應(yīng)用。目前,文獻(xiàn)中已有相關(guān)報道,以下研究利用深度神經(jīng)網(wǎng)絡(luò)直接通過軸承原始時域信號進(jìn)行故障特征提取與故障診斷。張西寧等通過對比傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型用于軸承故障診斷的結(jié)果,說明卷積自編碼器CAE對軸承故障具有較高的識別精度[12]。劉正平等搭建基于堆棧降噪自編碼SDAE的故障診斷模型分析不同的電機負(fù)載對軸承故障診斷的影響[13]。李巍華等利用DBN 從原始振動信號中提取軸承的分布式特征進(jìn)行故障診斷與識別[14]。趙光權(quán)等提出一種基于DBN的軸承故障診斷方法,能有效識別多種工況下的軸承故障,具有較強適應(yīng)性和通用性[15]。
綜上所述,深度學(xué)習(xí)模型已經(jīng)逐步被應(yīng)用于軸承故障診斷的研究,具有兩個明顯的優(yōu)勢:一是可以直接利用時域信號,二是深度神經(jīng)網(wǎng)絡(luò)具有優(yōu)異的故障特征提取能力,從而擺脫傳統(tǒng)方法對人工特征選取的依賴。然而,上述的研究仍存在一個明顯的不足:為實現(xiàn)較好的診斷識別效果,上述故障診斷方法往往是復(fù)合方法,一般是由2種及2種以上的機器學(xué)習(xí)模型組成的混合結(jié)構(gòu)。復(fù)合診斷模型在架構(gòu)上過于復(fù)雜,表現(xiàn)為多層次、多步驟、多算法集成[11]。這些方法泛化能力弱,只對特定場景下的軸承故障診斷有效,且計算量大、訓(xùn)練過程比較漫長、實時性欠佳。
因此,針對以上缺點提出一種直接輸入時域信號且具備端到端故障診斷能力的新方法e2e-LSTM,即end-to-end Long Short Term Memory Network。相比其他神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),LSTM 所建模型屬于時間序列模型,能夠有效提取軸承振動信號的時間和空間特征,進(jìn)一步提高軸承故障診斷的精度。LSTM 能夠進(jìn)行全局化處理和持續(xù)記憶多時刻的信息,易發(fā)現(xiàn)數(shù)據(jù)信息在時間上的相關(guān)特性。LSTM的上述特點對具有時序特征和周期性特征的軸承振動信號具有重要意義,因此,選取LSTM 作為診斷模型相比CNN 等其他神經(jīng)網(wǎng)絡(luò),對于軸承故障診斷更有優(yōu)勢。e2e-LSTM通過一個長短時記憶網(wǎng)絡(luò)(包含3個LSTM 層、2 個全連接層、1 個softmax 層),輸入原始時域數(shù)據(jù),可以一次性、接近100%診斷出滾動體軸承的故障類型與故障尺寸。該方法避免多步驟、分層次地診斷故障,將故障特征提取和故障分類合二為一,極大地縮短模型訓(xùn)練和算法運行的時間,有助于實際工業(yè)化應(yīng)用。
1997年,Hochreater 和Schmidhuber 提出LSTM的網(wǎng)絡(luò)結(jié)構(gòu),LSTM 模型是一種特殊的RNN 循環(huán)體結(jié)構(gòu),它能夠解決RNN模型中遇到的梯度爆炸和梯度消失問題[16]。LSTM 的主要特點是通過“門”結(jié)構(gòu)控制神經(jīng)網(wǎng)絡(luò)中每個時刻的信息狀態(tài)。
LSTM的單元模型內(nèi)部數(shù)據(jù)操作如圖1所示。
圖1 LSTM的單元結(jié)構(gòu)圖
xt表示當(dāng)前時刻的輸入,ct-1表示此刻之前的長期記憶向量,ht-1表示前一單元的輸出量,ct表示當(dāng)前時刻的長期記憶向量,ht表示當(dāng)前時刻的輸出量。操作過程如下:
(1)將前一時刻的輸出向量與當(dāng)前時刻的輸入向量拼接成一個向量Z;
(2)利用激活函數(shù)將向量Z分別與不同狀態(tài)的參數(shù)W、b進(jìn)行矩陣相乘,得到gf、gi、go,同時得到c't;
(3)gf與前一時刻ct-1組合成nt,實現(xiàn)對前一時刻狀態(tài)的記憶或遺忘效果;gi與c't組成mt,形成輸入門對輸入向量的控制;將mt與nt結(jié)合形成ct;
(4)用Tanh 激活函數(shù)對ct操作,與go向量組合成ht,形成對輸出向量的控制,得到ht;
(5)將ct、ht作為當(dāng)前時刻的狀態(tài)向量與輸出向量輸入到下一個LSTM單元模型中。
本研究提出的端到端故障診斷方法e2e-LSTM的框架圖如圖2所示。
首先將原始數(shù)據(jù)集分為訓(xùn)練集和測試集,訓(xùn)練集用于訓(xùn)練e2e-LSTM,更新模型參數(shù)來優(yōu)化模型;測試集輸入到已訓(xùn)練好的e2e-LSTM 模型中,用來檢測模型的故障診斷能力。
圖2 e2e-LSTM的模型框架圖
圖3 e2e-LSTM的模型原理
e2e-LSTM 包含3 個LSTM 基礎(chǔ)單元模型層、2個全連接層和1 個邏輯回歸層。圖3為e2e-LSTM的具體模型構(gòu)成,通過LSTM 基礎(chǔ)單元將輸入特征向量與之前的輸出記憶向量高效融合,不斷傳遞和處理信息,輸出一維特征信息狀態(tài)[h0,h1,……,hn]。
e2e-LSTM方法包含特征提取和分類2個過程,3個LSTM層對軸承數(shù)據(jù)進(jìn)行特征提取,全連接層通過對軸承特征進(jìn)行加權(quán)計算實現(xiàn)特征空間轉(zhuǎn)換,全連接層的層數(shù)與模型的復(fù)雜度、診斷能力密切相關(guān),過多的全連接層會導(dǎo)致模型參數(shù)急劇增多,過少的全連接層會限制模型的非線性表達(dá)能力。本研究搭建激活函數(shù)為Tanh 函數(shù)的2 個全連接層,將前幾層網(wǎng)絡(luò)經(jīng)過訓(xùn)練取得的分布式特征映射到樣本標(biāo)記空間,最后通過softmax層輸出該模型預(yù)測結(jié)果。
表1給出了e2e-LSTM模型的主要參數(shù)。
表1 e2e-LSTM模型的參數(shù)值
在e2e-LSTM 的訓(xùn)練過程中,首先輸入一維向量X,經(jīng)過3個LSTM層,再經(jīng)過2個全連接層,提取到的特征被映射到樣本標(biāo)記空間,最后通過softmax層,e2e-LSTM 模型將輸出預(yù)測值Y’。計算預(yù)測值Y’與真實值Y之間的交叉熵?fù)p失函數(shù)值,通過多次迭代,運用ADAM 優(yōu)化算法更新e2e-LSTM 網(wǎng)絡(luò)中的參數(shù)W、b,使得損失函數(shù)值逐漸減小,從而使得e2e-LSTM具有較好的診斷能力。
實驗數(shù)據(jù)來自美國凱斯西儲大學(xué)的軸承故障數(shù)據(jù)集[17]。在不同的電機負(fù)載場景下使用加速度計測量驅(qū)動端、扇葉端軸承的振動信號,如表2所示。
該實驗中的負(fù)載是可變的,分別有0、1 hp、2 hp、3 hp 4種設(shè)定。在實驗中,每種負(fù)載條件下的數(shù)據(jù)集構(gòu)成一個特定的場景。如圖2所示,每種場景包含健康軸承和3種故障類型(內(nèi)圈故障IR、滾動體故障B、外圈故障OR),每種故障類型包含3 種故障尺寸(輕度故障007、中度故障014、重度故障021)。
表2 軸承數(shù)據(jù)場景
每個軸承故障診斷樣本是一個包含1 200 個采樣點的時間序列,實驗中共采用1 000 個樣本。其中,500個樣本作為訓(xùn)練集,500個樣本作為測試集。在訓(xùn)練過程中,采用批量梯度下降法訓(xùn)練e2e-LSTM模型。首先將500個訓(xùn)練樣本分成50組,每組10個樣本輸入到e2e-LSTM模型中,通過3個LSTM模型和2 個全連接層對數(shù)據(jù)特征進(jìn)行提取和處理,最后通過softmax層進(jìn)行分類。
實驗結(jié)果表明,針對CWRU 的實驗平臺,e2e-LSTM對軸承故障的識別率最高可達(dá)100%,平均準(zhǔn)確率達(dá)到99.8%。圖4是電機負(fù)載為0 時的軸承故障診斷結(jié)果,由圖可知,500 個測試樣本輸入到e2e-LSTM模型中,僅有1個樣本被診斷錯誤。
圖4 基于e2e-LSTM的軸承故障診斷結(jié)果
目前文獻(xiàn)上已有的軸承故障診斷方法大多只適用于特定應(yīng)用場景,在可變負(fù)載的情況下泛化能力欠佳。本文提出的e2e-LSTM 方法在變負(fù)載場景下的故障診斷結(jié)果如圖5所示。
結(jié)果表明在電機負(fù)載分別是0、1 hp、2 hp、3 hp的4種場景下,e2e-LSTM方法均具有較高的故障診斷能力。實驗中,每個場景有500個測試樣本,一共有13 個故障樣本診斷錯誤,識別準(zhǔn)確率達(dá)到99.4%。
圖5 CWRU軸承數(shù)據(jù)的故障診斷結(jié)果
為進(jìn)一步說明e2e-LSTM 方法的有效性,文中對比了Conv-LSTM[18]、Bi-LSTM[19]等方法在不同負(fù)載場景下的故障診斷能力。圖6為基于Conv-LSTM混合網(wǎng)絡(luò)模型的軸承故障診斷結(jié)果,Conv-LSTM對不同場景的診斷能力相差較大,其中電機負(fù)載為3 hp 時的故障識別率達(dá)到91.4%,而電機負(fù)載為2 hp時的故障識別率僅有79.2%,該混合模型對不同場景的診斷能力較不穩(wěn)定。
圖6 在不同場景下基于Conv-LSTM的故障診斷結(jié)果
Bi-LSTM 采用的是一個分步驟方法:先診斷軸承的故障類型,再診斷軸承的故障尺寸,軸承的故障診斷過程復(fù)雜,圖7為在不同場景下基于Bi-LSTM的故障診斷結(jié)果,相比e2e-LSTM效果較差。
表3為3種軸承故障診斷方法的結(jié)構(gòu)對比,e2e-LSTM包含3個LSTM層,Conv-LSTM是由2個卷積層、3個LSTM層組成的混合神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu),Bi-LSTM 是包含3 個雙向LSTM 層的復(fù)合故障診斷方法。在識別準(zhǔn)確率方面,e2e-LSTM對不同場景的故障診斷平均識別率達(dá)到99.4 %,高于Conv-LSTM、Bi-LSTM故障診斷方法的故障識別準(zhǔn)確率。
圖7 Bi-LSTM在不同場景下的故障診斷結(jié)果
表3 3種軸承故障診斷方法的結(jié)構(gòu)對比
e2e-LSTM 方法對不同負(fù)載場景下的軸承故障識別具有較強的泛化能力。從表4中可以看到,相比Conv-LSTM、Bi-LSTM 方法,在不改變模型任何參數(shù)的情況下,e2e-LSTM 對不同的軸承故障場景均具有較好的診斷識別能力。此外,e2e-LSTM 的迭代次數(shù)為600 次,訓(xùn)練時間為46 min,是Conv-LSTM所用時間的67%,Bi-LSTM方法所用時間的12%,極大縮短運行時間,提高故障診斷效率。
表4 3種故障診斷方法的結(jié)果對比
建有的軸承故障診斷實驗平臺,如圖8所示,該平臺由驅(qū)動電機、測試軸承、測功機、加速度計、數(shù)據(jù)采集系統(tǒng)等裝置組成。加速度計分別在不同負(fù)載情況下采集軸承的振動信號,包含健康軸承和3 種軸承故障類型(健康、內(nèi)圈故障、滾動體故障和外圈故障),每一種軸承故障類型包含3種故障尺寸(2 mm、4 mm、6 mm)。該實驗包含4種不同負(fù)載(0、1 kN、2 kN、3 kN),每組實驗隨機選取500 個樣本作為訓(xùn)練集,500個樣本作為測試集。
圖8 軸承實驗數(shù)據(jù)采集平臺
圖9至圖12分別為在不同負(fù)載下的軸承故障診斷結(jié)果,2 000個測試樣本中有29個軸承樣本被錯誤識別,準(zhǔn)確率達(dá)到98.55%。
通過可視化分析可以發(fā)現(xiàn),本文方法具有較強的故障識別和分類能力。以負(fù)載為0 時為例,將軸承振動信號數(shù)據(jù)輸入到e2e-LSTM 模型中進(jìn)行故障診斷時,獲取最后一個全連接層的特征,利用t-SNE方法對這些特征進(jìn)行降維與聚類可視化。
圖9 負(fù)載為0 時的軸承故障診斷結(jié)果
圖10 負(fù)載為1 kN時的軸承故障診斷結(jié)果
如圖13所示。對于10 種軸承故障分別用不同顏色表示其降維后的特征聚類情況,由圖可見,e2e-LSTM能夠有效提取軸承的故障特征,并根據(jù)故障類型與故障尺寸有效分類,減少誤診斷。
圖11 負(fù)載為2 kN時的軸承故障診斷結(jié)果
圖12 負(fù)載為3 kN的軸承故障診斷結(jié)果
圖13 基于e2e-LSTM的軸承故障特征三維圖
文中提出的e2e-LSTM 方法實現(xiàn)了端到端模式的軸承故障診斷,通過美國凱斯西儲大學(xué)的CWRU數(shù)據(jù)集與自有實驗平臺的軸承數(shù)據(jù)集,證明了e2e-LSTM方法能夠準(zhǔn)確識別不同負(fù)載場景下的軸承故障類型和故障尺寸。與Conv-LSTM、Bi-LSTM等復(fù)合診斷模型相比,該方法具有結(jié)構(gòu)簡潔、迭代次數(shù)少、運行時間短、泛化能力強等特點,這些都表明e2e-LSTM 方法對軸承故障診斷的適應(yīng)性和實用價值。