江旭耀,林群煦,侯至丞,張 弓,張金越,楊 根
(1.五邑大學(xué) 軌道交通學(xué)院,廣東 江門 529020;2.廣州先進(jìn)技術(shù)研究所,廣東 廣州 511458;3.中國科學(xué)院大學(xué),北京 100086;4.廣東技術(shù)師范大學(xué),廣東 廣州 510665)
機(jī)械故障預(yù)測與健康管理技術(shù)最早屬于軍事領(lǐng)域,被應(yīng)用于軍用設(shè)備的維護(hù)。相比以往的修復(fù)性維修和預(yù)防性維護(hù),預(yù)測性維護(hù)能明顯提升設(shè)備的有效利用率并降低維護(hù)成本,但對機(jī)械狀態(tài)的監(jiān)測和健康度的判斷提出了更高的要求。
傳統(tǒng)的預(yù)測性維護(hù)方法分為兩種,即基于物理模型的預(yù)測性維護(hù)法(簡稱“物理模型法”)和基于數(shù)據(jù)驅(qū)動的預(yù)測性維護(hù)法(簡稱“數(shù)據(jù)驅(qū)動法”)[1]。物理模型法是利用固有系統(tǒng)故障機(jī)制構(gòu)建物理退化模型,再根據(jù)該模型來評估當(dāng)前健康狀態(tài)和預(yù)測剩余壽命,其包括基于力學(xué)的物理退化模型[2]、基于隨機(jī)退化的經(jīng)驗(yàn)?zāi)P停?]和基于確定性模型[4]等。數(shù)據(jù)驅(qū)動法則是通過傳感器獲取大量機(jī)械運(yùn)轉(zhuǎn)數(shù)據(jù),并利用Teager能量算子[5]、小波變換[6]、經(jīng)驗(yàn)?zāi)B(tài)分解[7]和希爾伯特包絡(luò)[8]等方法來提取故障特征,再建立數(shù)學(xué)模型或神經(jīng)網(wǎng)絡(luò)模型來評估機(jī)械狀態(tài)和預(yù)測剩余壽命。
對于簡單機(jī)械,物理模型法尚可行;但面對結(jié)構(gòu)復(fù)雜、參數(shù)相互耦合的現(xiàn)代工業(yè)生產(chǎn)設(shè)備,物理模型法會導(dǎo)致建模難度成倍增大,甚至無法得到精確的物理模型,且預(yù)測效果不佳。經(jīng)驗(yàn)?zāi)P秃痛_定性模型等根據(jù)概率論建立的模型除了會遇到物理模型相同的問題外,還可能遇到機(jī)械材料的更迭、內(nèi)部材料的差異和外部環(huán)境的不斷變化等因素所導(dǎo)致的不同材料間相互作用、互相影響的問題,致使準(zhǔn)確的模型難以被獲得且預(yù)測效果不佳。而數(shù)據(jù)驅(qū)動法則需要人工從大量數(shù)據(jù)中尋找出機(jī)械故障特征,對單一故障而言,其尚且能找到故障特征;但面對復(fù)合故障導(dǎo)致的故障特征相互耦合的狀況時,尋找故障特征的過程則會變得非常繁瑣。
針對傳統(tǒng)預(yù)測性維護(hù)方法存在的不足,本文提出一種基于級聯(lián)長短期記憶(long short term memory,LSTM)神經(jīng)網(wǎng)絡(luò)的方法來估計(jì)機(jī)械健康度衰減曲線,并與共振解調(diào)法提取的健康度曲線進(jìn)行對比。結(jié)果顯示,該方法能通過神經(jīng)網(wǎng)絡(luò)有效自動地提取相應(yīng)數(shù)據(jù)特征;且面對復(fù)合故障時,該方法同樣有較好的效果,能有效解決人工處理數(shù)據(jù)尋找故障特征繁瑣以及提取復(fù)合故障特征困難的問題。文章最后根據(jù)此方法搭建了神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)健康度判斷和剩余使用壽命預(yù)測,并證明其有效性。
神經(jīng)網(wǎng)絡(luò)作為一種模擬人腦學(xué)習(xí)能力的新式模型搭建方法近年來被廣泛應(yīng)用[9]。其最早被Kunihiko Fukushima用于貓視覺實(shí)驗(yàn)中以模擬類似人腦神經(jīng)元的多層結(jié)構(gòu)認(rèn)知體[10];而后,伴隨著BP算法[11]的提出和基于GPU神經(jīng)網(wǎng)絡(luò)的搭建[12],其在工程應(yīng)用上有了突破。文獻(xiàn)[13]中提出的AlexNet神經(jīng)網(wǎng)絡(luò)在圖像分類方面取得了驚人的效果[13]。除了這類在圖像識別上具有優(yōu)勢的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)外,循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)在處理振動加速度、語義及音頻等時間維度數(shù)據(jù)上具有十分顯著的優(yōu)勢[14]。
RNN最大的特點(diǎn)是按時序輸入與輸出,隱藏層中參數(shù)也隨時序流動而逐級傳遞;但其存在梯度彌散和梯度爆炸的問題,對于長時間的數(shù)據(jù)依賴存在一定困難?;赗NN的LSTM神經(jīng)網(wǎng)絡(luò)則通過引入自循環(huán)的方式提供給梯度長時間流動的路徑,有效改善了梯度彌散和梯度爆炸問題。文獻(xiàn)[15]利用LSTM神經(jīng)網(wǎng)絡(luò)來預(yù)測腦電信號,進(jìn)而預(yù)測抑郁癥的發(fā)病趨勢。文獻(xiàn)[16]利用LSTM神經(jīng)網(wǎng)絡(luò)和Bi-LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行了風(fēng)電場的風(fēng)速預(yù)測。文獻(xiàn)[17]則提出了一種利用LSTM神經(jīng)網(wǎng)絡(luò)對DDoS攻擊進(jìn)行判別的方法。
LSTM神經(jīng)網(wǎng)絡(luò)對處理時序數(shù)據(jù)的有效性得益于門控自循環(huán)的設(shè)計(jì),圖1示出LSTM的神經(jīng)元結(jié)構(gòu)。圖中,F(xiàn)(t)為遺忘門輸入,S(t)代表當(dāng)前細(xì)胞狀態(tài),I(t)為輸入門,X(t)為神經(jīng)元輸入為候選向量,O(t)為神經(jīng)元輸出為輸出門,具體計(jì)算如式(1)~式(6)所示。
圖1 LSTM神經(jīng)網(wǎng)絡(luò)神經(jīng)元結(jié)構(gòu)Fig.1 Neuron structure of LSTM neural network
式中:σ——sigmoid激活函數(shù);tanh——激活函數(shù);Wf、Wi、Wc、Wo——分別為遺忘門、輸入門、候選向量和輸出門的權(quán)重;bf、bi、bc、bo——分別為遺忘門、輸入門、候選向量和輸出門的偏置項(xiàng)。
LSTM神經(jīng)網(wǎng)絡(luò)除了具有RNN神經(jīng)網(wǎng)絡(luò)的時序數(shù)據(jù)流動特點(diǎn)外,還增加了細(xì)胞狀態(tài)傳入的路徑,使得有價值的信息可以通過更新細(xì)胞狀態(tài)的方式按時序傳遞至網(wǎng)絡(luò)后面任意時刻的神經(jīng)元內(nèi),實(shí)現(xiàn)了有益數(shù)據(jù)的長時間持續(xù)流動。
傳統(tǒng)軸承健康度判別法中應(yīng)用最廣的是共振解調(diào)技術(shù)[18],其通過希爾伯特變換和包絡(luò)分析提取故障特征信號(圖2)。共振解調(diào)時,首先對軸承的振動數(shù)據(jù)進(jìn)行希爾伯特變換,見式(7);然后通過包絡(luò)分析,獲得其多階解調(diào)譜特征,見式(8),實(shí)現(xiàn)故障特征頻率從振動數(shù)據(jù)中分離;最后通過分析故障特征頻率的變化,提取軸承健康度曲線。
式中:H[X(t)]——對信號X(t)進(jìn)行希爾伯特變換;Z(t)——對應(yīng)的包絡(luò)信號。
圖2希爾伯特包絡(luò)分析Fig.2 Hilbert envelope analysis
本文將以兩級級聯(lián)的LSTM神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)進(jìn)行軸承狀態(tài)評估和預(yù)測剩余壽命。使用均方根誤差(RMSE)分析第一層模型的預(yù)測結(jié)果,得到當(dāng)前軸承的系統(tǒng)健康度,并對比利用希爾伯特包絡(luò)的共振解調(diào)法,驗(yàn)證神經(jīng)網(wǎng)絡(luò)對提取軸承特征的優(yōu)越性;提取健康度曲線,搭建第二個LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行健康度判斷和剩余壽命預(yù)測,以驗(yàn)證本方法的可行性。
滾動軸承在運(yùn)行過程中,軸承的內(nèi)圈、滾珠、外圈以及外部機(jī)械結(jié)構(gòu)之間都會產(chǎn)生周期性的正常沖擊[19],在轉(zhuǎn)速、負(fù)載、外部環(huán)境相同的工況下,這種振動規(guī)律可被神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)并預(yù)測未來的振動曲線。如果軸承結(jié)構(gòu)存在著擦傷、點(diǎn)蝕、裂紋、崩裂等損傷,則在軸承運(yùn)轉(zhuǎn)中通過這些損傷點(diǎn)處會產(chǎn)生更強(qiáng)的沖擊現(xiàn)象,導(dǎo)致振動能量的突變。單一損傷點(diǎn)的振動在軸承工作工況相同的情況下其能量會快速衰減;復(fù)合損傷點(diǎn)導(dǎo)致的振動會因沖擊能量而出現(xiàn)共振、諧振等現(xiàn)象,具有高度的耦合性。
搭建第一層神經(jīng)網(wǎng)絡(luò)的目的在于通過學(xué)習(xí)固定工況下軸承振動的周期性規(guī)律,并根據(jù)上一時刻的數(shù)據(jù)預(yù)測下一時刻的振動曲線。設(shè)置時間窗(圖3),對數(shù)據(jù)集進(jìn)行處理。時間窗每向前滑動步長Step,將其后長度為“Input+Output”的數(shù)據(jù)劃分為一個時間窗數(shù)據(jù)(其中Input為模型的輸入,Output為模型的輸出),滑動劃分出滑動時間窗數(shù)據(jù)集。
圖3 滑動時間窗劃分?jǐn)?shù)據(jù)集Fig.3 Sliding time window partition dataset
輸入數(shù)據(jù)集:
輸出數(shù)據(jù)集:
用滑動時間窗可以有效地?cái)U(kuò)充訓(xùn)練數(shù)據(jù),解決數(shù)據(jù)不足的問題;但過短的步長容易因數(shù)據(jù)重復(fù)程度過大而導(dǎo)致模型訓(xùn)練效果變差和預(yù)測結(jié)果準(zhǔn)確度下降。
第一個模型訓(xùn)練的時間窗數(shù)據(jù)僅為軸承正常運(yùn)行時的振動數(shù)據(jù)。對數(shù)據(jù)歸一化處理后導(dǎo)入神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)本身會進(jìn)行特征提取和曲線的預(yù)測。按照時間窗劃分?jǐn)?shù)據(jù)并歸一化處理后,將其中80%納入訓(xùn)練集,20%納入驗(yàn)證集,搭建如圖4所示的LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行模型的訓(xùn)練。
當(dāng)軸承狀態(tài)正常時,預(yù)測值和真實(shí)值的偏差相對較小;而當(dāng)軸承狀態(tài)異常時,其振動信號與正常振動數(shù)據(jù)間存在差異,這種差異可以通過神經(jīng)網(wǎng)絡(luò)表現(xiàn)為預(yù)測值與真實(shí)值間偏差的增大。預(yù)測值與真實(shí)值的誤差與異常振動和正常振動之間的差異呈現(xiàn)正相關(guān),因此將模型的預(yù)測偏差歸一化后作為軸承的健康度。通過第一層LSTM神經(jīng)網(wǎng)絡(luò),判斷所得到的軸承全壽命周期健康度曲線應(yīng)符合滾動軸承典型的故障發(fā)展過程[20],其由正常狀態(tài)和軸承損傷發(fā)展的4個階段構(gòu)成,包括安全、衰退(磨損)、潛在故障、故障和失效5個健康等級。
在得到健康度曲線后,將每個時間窗的健康度和實(shí)際剩余壽命作為標(biāo)記,如圖4所示,導(dǎo)入并構(gòu)建訓(xùn)練第二層LSTM神經(jīng)網(wǎng)絡(luò)。第二層LSTM神經(jīng)網(wǎng)絡(luò)對輸入數(shù)據(jù)和健康度進(jìn)行關(guān)聯(lián)。根據(jù)當(dāng)前軸承振動數(shù)據(jù)和對應(yīng)的機(jī)械健康度,學(xué)習(xí)軸承的機(jī)械退化相關(guān)特征,其目的是得到能根據(jù)輸入的振動數(shù)據(jù)對當(dāng)前機(jī)械健康度進(jìn)行評估并預(yù)測剩余壽命的模型。
圖4 級聯(lián)LSTM神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練路徑Fig.4 Training pat of the cascaded LSTMneural network model
本文選用西安交通大學(xué)的滾動軸承加速壽命試驗(yàn)數(shù)據(jù)集[21],圖5所示平臺被用于采集不同工況下LDK-UER204型滾動軸承的加速壽命數(shù)據(jù)。實(shí)驗(yàn)中,通過調(diào)整軸承的轉(zhuǎn)速和負(fù)載的徑向力,獲取水平方向和垂直方向的振動加速度數(shù)據(jù)。該數(shù)據(jù)包含了實(shí)驗(yàn)軸承的全壽命周期振動數(shù)據(jù)和故障失效位置信息。其中,Bearing1_1,Bearing1_2和Bearing1_3為軸承在徑向負(fù)載為12 kN和轉(zhuǎn)速為2 100 r/min的工況下外圈故障數(shù)據(jù);Bearing1_4為保持架故障數(shù)據(jù),該數(shù)據(jù)無法體現(xiàn)軸承全壽命周期,故本實(shí)驗(yàn)不采用該組數(shù)據(jù);Bearing1_5是相同工況下內(nèi)圈和外圈復(fù)合故障數(shù)據(jù)。本文采用單一故障的Bearing1_1,Bearing1_2,Bearing1_3數(shù)據(jù)和復(fù)合故障Bearing1_5數(shù)據(jù)驗(yàn)證所提方法的可行性。
圖5 西安交通大學(xué)滾動軸承試驗(yàn)平臺[21]Fig.5 Rolling bearing test platform of Xi'an Jiaotong University
實(shí)驗(yàn)采用Bearing1_1數(shù)據(jù)集的垂直振動數(shù)據(jù)進(jìn)行模型訓(xùn)練,截取數(shù)據(jù)集前部正常狀態(tài)數(shù)據(jù),設(shè)置步長step=20,Input=4 000和Output=200,劃分?jǐn)?shù)據(jù)集作為模型的輸入和輸出。
模型預(yù)測效果如圖6所示,當(dāng)軸承處于正常運(yùn)轉(zhuǎn)狀態(tài)時,模型預(yù)測值與真實(shí)振動值基本吻合;當(dāng)測試軸承經(jīng)過一段時間的運(yùn)轉(zhuǎn)、出現(xiàn)損傷且損傷逐步增大時,預(yù)測值與真實(shí)值的偏差也隨之增大。隨著損傷程度的加劇,軸承的健康度隨之降低,呈現(xiàn)明顯的階段性下降趨勢。
預(yù)測值與實(shí)際值的偏差使用均方根誤差(RMSE)進(jìn)行分析,見式(11)。計(jì)算該偏差值,得出健康度曲線。由于該曲線具有一定程度的波動,不適合直接用于第二層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,因此需對其進(jìn)行歸一化處理后再使用曲線擬合。本文使用最小二乘法對其進(jìn)行18階曲線擬合,得到故障頻率變化曲線F(x),圖6的軸承健康度曲線為1-F(x)。
圖6 第一層模型預(yù)測效果Fig.6 Prediction effect of the first layer model
為評估神經(jīng)網(wǎng)絡(luò)提取軸承健康度曲線的效果,利用共振解調(diào)法分析Bearing1_2數(shù)據(jù)進(jìn)行對比。按時間順序以每周期采樣數(shù)據(jù)的長度(25.6 kHz)為標(biāo)準(zhǔn)將軸承數(shù)據(jù)集劃分為固定長度的時間窗數(shù)據(jù),求得每個周期的希爾伯特包絡(luò)頻譜,如圖7(a)所示。軸承外圈故障振動頻率為108 Hz,將每個時間窗數(shù)據(jù)的108 Hz頻率值按時間順序提取,所得曲線為軸承全壽命周期的外圈故障頻率變化曲線,如7(b)所示。
通過曲線擬合得故障頻率變化曲線G(x),歸一化并計(jì)算得出健康度衰減曲線1-G(x)。將3個單一故障數(shù)據(jù)集的健康度曲線分別用兩種方式提取并進(jìn)行對比(表1)??梢钥闯?,相比共振解調(diào)法,采用神經(jīng)網(wǎng)絡(luò)提取健康度曲線的方法效果更好,所提取的軸承健康度衰減曲線更加平滑且階段層次分明。此外,共振解調(diào)法需要找到故障特征頻率才能使用,只適用于單一故障;對于軸承的復(fù)合故障,故障頻率會相互耦合,相應(yīng)的故障特征難以被提取。
表1 共振解調(diào)法與神經(jīng)網(wǎng)絡(luò)法結(jié)果對比Tab.1 Result comparison between resonance demodulation method and neural network method
圖8示出屬于內(nèi)圈、外圈復(fù)合故障的Bearing1_5數(shù)據(jù)集??梢钥闯?,面對復(fù)合故障情況,軸承故障特征頻率會隨之改變,共振解調(diào)法需要重新尋找特征頻率,而神經(jīng)網(wǎng)絡(luò)法則能很好地從數(shù)據(jù)中提取出能反映軸承狀態(tài)的健康度曲線。
圖8 軸承復(fù)合故障情況的健康度評估曲線Fig.8 Composite-fault condition of bearing
為了量化評價健康度曲線的優(yōu)劣,從單調(diào)性、魯棒性和趨勢性3個方面對共振解調(diào)法和神經(jīng)網(wǎng)絡(luò)法的使用效果進(jìn)行評價,利用最小二乘法進(jìn)行曲線擬合,將健康度曲線分為趨勢值xT(t)和殘差xR(t)兩部分:
單調(diào)性指標(biāo)M用于評價健康度曲線是否呈現(xiàn)持續(xù)增加或減小的趨勢,具體如下:
式中:n——數(shù)據(jù)量;N+和N-——分別為相鄰健康度微分為正和為負(fù)的計(jì)數(shù)值。
魯棒性指標(biāo)R用于反映健康度曲線是否存在大幅度波動的異常值,具體如下:
趨勢性指標(biāo)T反映了健康度曲線下降趨勢與測量時間的線性關(guān)系,具體如下:
這3個評價指標(biāo)越接近1,健康度曲線性能越優(yōu)異。表2示出經(jīng)實(shí)驗(yàn)得到的健康度曲線性能指標(biāo)。
表2 健康度曲線性能指標(biāo)Tab.2 Health curve performance indices
由表2所示實(shí)驗(yàn)數(shù)據(jù)可知,神經(jīng)網(wǎng)絡(luò)法的健康度評估指標(biāo)相比共振解調(diào)法的有明顯提升,尤其在魯棒性方面,4個數(shù)據(jù)集分別提升了11.2%、18.2%、15.6%和13.1%(特征頻率為436 Hz);在趨勢性方面,其性能指標(biāo)比共振解調(diào)法的呈現(xiàn)出更加穩(wěn)定的下降趨勢。根據(jù)單調(diào)性、魯棒性和趨勢性3個指標(biāo)構(gòu)建健康度融合評價指標(biāo)I,具體如下:
綜上,對于單一故障,神經(jīng)網(wǎng)絡(luò)法的健康度評估指標(biāo)比共振解調(diào)法的分別提升了12%、24.8%和5%;對于復(fù)合故障,在理論故障頻率108 Hz下,健康度曲線的評價指標(biāo)提升了12.2%,在實(shí)際特征頻率436 Hz下,評價指標(biāo)提升了15.1%。
根據(jù)上文獲得的軸承健康度曲線和每個時間窗距離失效的剩余時間,訓(xùn)練第二層LSTM神經(jīng)網(wǎng)絡(luò)。該模型可以通過采集一個時間窗長度的數(shù)據(jù)進(jìn)行健康度的評估和剩余壽命預(yù)測,數(shù)據(jù)集Bearing1_3的實(shí)驗(yàn)結(jié)果如圖9所示。
圖9 Bearing1_3的每個時間窗數(shù)據(jù)的預(yù)測結(jié)果Fig.9 Data prediction results of Bearing1_3 in each time window
軸承的損傷階段分為故障發(fā)展階段、帶障運(yùn)行階段和失效階段。損傷的產(chǎn)生具備一定的隨機(jī)性。由實(shí)驗(yàn)結(jié)果可以看出,當(dāng)軸承處于正常工作階段時,預(yù)測損傷發(fā)生的時間點(diǎn)是困難的;而當(dāng)軸承損傷已發(fā)生且處于損傷逐步擴(kuò)大階段時,預(yù)測其剩余壽命則是可行的;損傷發(fā)展到一定程度后會磨合,進(jìn)入相對穩(wěn)定而緩慢發(fā)展的帶障運(yùn)行階段,此時軸承是不健康的,隨時可能進(jìn)入最終的失效階段,且難以預(yù)測該時間點(diǎn),在此階段應(yīng)盡早給予軸承相應(yīng)的維護(hù)或直接更換。
為了能更快采集到軸承的全壽命周期數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)集中使用的徑向負(fù)載屬于理論極限負(fù)載。根據(jù)國家標(biāo)準(zhǔn)GB/T 6391-2010[22],該工況的理論計(jì)算壽命是5.6 h至9.677 h;實(shí)際實(shí)驗(yàn)中,軸承壽命均未超過3 h[21]。壽命預(yù)測真正能起到作用的階段只有在損傷發(fā)生之后,故模型能學(xué)習(xí)到的壽命時間僅針對這種極限工況。而實(shí)際生產(chǎn)活動中,軸承通常不會運(yùn)行于極限負(fù)載工況,若能采集到完整的軸承全壽命周期數(shù)據(jù),實(shí)現(xiàn)更早的剩余壽命預(yù)測是可行的。
本文提出了一種基于級聯(lián)LSMT神經(jīng)網(wǎng)絡(luò)的軸承復(fù)合故障預(yù)測方法,其通過搭建兩級LSTM神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)軸承健康度評估和剩余使用壽命預(yù)測,并以西安交通大學(xué)滾動軸承試驗(yàn)平臺數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),驗(yàn)證了方法的有效性。該方法利用LSTM網(wǎng)絡(luò)學(xué)習(xí)數(shù)據(jù)一定周期內(nèi)的自相似性,這種思路也可拓展應(yīng)用于電流、電壓和溫度等時序變化數(shù)據(jù)的分析。
但該方法仍存在一定的局限性:一方面,其健康度評估只能針對單一工況的振動數(shù)據(jù),剩余使用壽命預(yù)測需要完整周期的振動數(shù)據(jù),而在實(shí)際生產(chǎn)活動中,很多時候難以獲得完整壽命周期的數(shù)據(jù)或者獲取成本很高;另一方面,其壽命預(yù)測精度有待提升,需要進(jìn)行進(jìn)一步的深入研究。