李海浪, 劉永志, 鄒益勝, 劉彥濤, 宋小欣
(西南交通大學 機械工程學院,成都 610031)
由于制造業(yè)的快速發(fā)展,旋轉機械的應用場景變得越來越復雜,軸承作為大型旋轉機械的關鍵零部件,對整個機械系統(tǒng)的可靠運行起著至關重要的作用[1]。根據(jù)相關統(tǒng)計分析的結果,約30%的旋轉機械故障是由滾動軸承的異常運行引起的。預測和健康管理(prognostics and health management, PHM)是近年來一項新型的技術,剩余使用壽命預測是PHM中的重要部分。精準地預測軸承剩余使用壽命能及時發(fā)現(xiàn)運行故障,排除安全隱患,及時更換軸承更能提高設備使用過程中的經(jīng)濟性[2]。剩余壽命預測方法主要可以分為兩大類:一是基于模型的預測方法;二是基于數(shù)據(jù)驅動的預測方法?;谀P偷念A測方法是根據(jù)失效機理來建立數(shù)學或者物理模型,但是在現(xiàn)實中,由于系統(tǒng)的復雜性和隨機性,理解所有的故障模型和退化過程無疑是困難的,這限制了基于模型方法的適用性?;跀?shù)據(jù)驅動的預測方法是根據(jù)傳感器采集的數(shù)據(jù),利用機器學習和概率統(tǒng)計等方法,建立樣本數(shù)據(jù)和剩余使用壽命之間的映射關系。基于數(shù)據(jù)驅動方法的優(yōu)勢是可以在沒有太多先驗知識的情況下,從輸入數(shù)據(jù)中提取特征,同時進行剩余壽命預測。近年來隨著深度學習和工業(yè)大數(shù)據(jù)的快速發(fā)展,基于數(shù)據(jù)驅動的預測方法已經(jīng)逐漸成為主流[3]。
基于數(shù)據(jù)驅動的預測方法主要分為三步:數(shù)據(jù)采集、特征提取和剩余壽命預測。盡管基于數(shù)據(jù)驅動的預測方法已經(jīng)取得了不錯的成果,但還是面對眾多挑戰(zhàn),首要問題便是如何有效提取特征[4]。特征的好壞直接影響后續(xù)模型的預測精度。目前在特征提取工作上,學者們提出了許多模型和方法,例如卷積神經(jīng)網(wǎng)絡[5-6]、深度信念網(wǎng)絡[7]、自編碼等。其中,自編碼作為一種無監(jiān)督學習方法,目的是在保證重要特征不丟失的情況下,降低輸入信息的維度,在自動提取特征上十分有效,目前在軸承剩余使用壽命預測上取得了眾多進展。陳仁祥等[8]提出了一種加噪樣本擴展深度稀疏自編碼,完成壽命特征的自動提取與表達,同時抑制了網(wǎng)絡過擬合并提升網(wǎng)絡魯棒性。李華新等[9]用分層稀疏自編碼提取特征,更加準確地識別數(shù)據(jù)內部信息,提高了預測精度。張繼冬等[10]提出一種基于全卷積變分自編碼網(wǎng)絡的軸承剩余壽命預測方法,增強了特征提取過程中的抗干擾能力,從而提升整體網(wǎng)絡的預測穩(wěn)定性。王久健等提出了一種無需先驗知識的基于空間卷積長短時記憶神經(jīng)網(wǎng)絡,可直接從采集到的原始信號中挖掘反映退化程度的特征。Kaji等[11]利用卷積自編碼構造了一個軸承健康指標。試驗結果表明,該指標表現(xiàn)出單調遞增的退化趨勢,并在軸承的早期退化階段具有良好的性能。
以上方法所提取的性能退化特征雖然可以從某個方面反映性能退化過程,但是他們都尚未考慮退化特征的軸承個體差異性,即忽略了同一特征的變化趨勢在不同軸承上是具有差異的。軸承由于制造工藝以及運行環(huán)境的不同,不同軸承的退化過程是不一致的。即便是工藝參數(shù)和工況相同,軸承運行時由于受到諸多復雜因素的影響,其狀態(tài)有著不確定性、非線性和時變性,退化過程也很難相同。退化過程的不同便會導致退化特征具有個體差異性,最終造成預測模型的預測效果不佳。已經(jīng)有相當多的學者已經(jīng)提出在進行可靠度預測的同時也要考慮軸承的個體差異,減少軸承特征的個體差異性有利于增強預測方法的適用性,以及提升預測精度[12-14]。劉彈等[15]提出在評價退化特征時,需要明確退化特征的變化趨勢是否具有一致性,趨勢一致性越好的特征更能反映軸承的性能退化過程。Zhao等[16]提出使不同軸承的壽命周期性能退化特征曲線呈現(xiàn)一致性趨勢,可以提升剩余壽命預測模型的準確性。提升特征的趨勢一致性,實際上也是降低了退化特征在時間方向上的軸承個體差異性,是有利于預測的。
綜上所述,為了解決在提取特征時對退化特征的軸承個體差異性考慮不足的問題,本文通過構造特征趨勢一致性約束,再結合卷積自編碼強大的特征提取能力,最終提出了趨勢一致性約束卷積編碼(trend consistency convolutional auto-encoder, TC-CAE)特征提取模型。該模型在自動提取特征的同時,有利于促進同一特征在不同軸承上的趨勢一致性,從而提升預測精度。具體預測流程為,先利用快速傅里葉變換將時域信息轉化為頻域信息,再用TC-CAE模型提取特征,最后用長短期記憶網(wǎng)絡(long short-term memory, LSTM)進行預測。
自編碼是深度學習中的一種無監(jiān)督算法,主要目標是對輸入數(shù)據(jù)進行表征學習,常應用于特征提取。自編碼包含編碼器和解碼器兩部分,其中編碼器由輸入層和中間隱藏層組成,解碼器由中間隱藏層和輸出層組成。編碼層的輸入節(jié)點和解碼層輸出節(jié)點個數(shù)相等,目的是通過學習一個恒等函數(shù),使輸出等于輸入,以此實現(xiàn)隱藏層特征提取。
卷積神經(jīng)網(wǎng)絡具有局部感知和參數(shù)共享兩個特點:局部感知即卷積神經(jīng)網(wǎng)絡的節(jié)點僅僅和其前一層的部分節(jié)點相連接,只用來學習局部特征,然后在更高層將這些局部的信息進行合并,從而得到全部表征信息;參數(shù)共享網(wǎng)絡結構類似于生物神經(jīng)網(wǎng)絡,降低了網(wǎng)絡模型的復雜度,減少了權值的數(shù)量,同時能解決自編碼網(wǎng)絡因為層數(shù)增加,參數(shù)呈指數(shù)增長的問題。傳統(tǒng)的自編碼器一般使用全連接層,結合自編碼和卷積神經(jīng)網(wǎng)絡的優(yōu)點,用卷積池化層代替編碼器和解碼器中的全連接層,由此誕生了卷積自編碼(convolutional autoencoder,CAE)。卷積自編碼結構如圖1所示。
圖1 卷積自編碼結構Fig.1 Convolutional autoencoding structure
在輸出維度和輸入維度相同的情況下,損失函數(shù)L(·),例如均方誤差(mean-square error,MSE)可以用于在訓練階段更新網(wǎng)絡權重。
(1)
利用快速傅里葉變換將原始振動數(shù)據(jù)從時域信號轉換為頻域信號。每個訓練軸承數(shù)據(jù)按照采集的先后順序各自整理成(m×n)的數(shù)組,其中:m為采集總次數(shù);n為對應時間點的數(shù)據(jù)量。軸承的壽命標簽采用百分比標簽yi,標簽值在1~0,yi計算表達式如式(2)所示。這實則上也是對壽命標簽進行歸一化處理,便于神經(jīng)網(wǎng)絡在優(yōu)化時使用梯度下降算法進行求解,同時弱化了軸承在不同工況、不同壽命數(shù)值之間的差異,有利于提高剩余使用壽命的預測精度。在預測應用時可根據(jù)已服役的壽命值與對應的標簽還原出實際剩余壽命值。
(2)
式中:j為該行對應的行數(shù);m為總行數(shù)。
卷積自編碼的數(shù)據(jù)輸入,常規(guī)方式是將一個訓練軸承的數(shù)據(jù)按照批量(batch size)依次輸入,完畢后輪換下一個訓練軸承。提取特征時,為了對同一特征在不同軸承間的趨勢一致性進行計算,然后通過約束增強特征的趨勢一致性,需要將所有軸承的數(shù)據(jù)并行輸入。具體方式是將每個軸承訓練集按照各自數(shù)據(jù)采集次數(shù)的總數(shù)mi分為x等份,即x個[int(mi/x)×n]數(shù)組,int(·)表示取整函數(shù)。此處關于x可以根據(jù)實際的情況取相應的值,本文以x=50為例來說明訓練集數(shù)據(jù)的構建方式。由于各訓練軸承的采集次數(shù)mi不同,因此不同軸承每等份樣本數(shù)目[int(mi/x)]是不一致的,但是對應的壽命標簽區(qū)間長度都為0.02。將各軸承相同壽命標簽區(qū)間的數(shù)據(jù)按照順序進行拼接,組成每次卷積自編碼網(wǎng)絡的輸入訓練數(shù)據(jù),其樣本總數(shù)目為網(wǎng)絡的bitchsize,表達式如式(3)所示。具體操作如圖2所示。
(3)
式中:h為訓練軸承的總個數(shù);mi為各軸承所對應的采集次數(shù);x為均分數(shù)目;int(·)為取整函數(shù)。
圖2 訓練集構建方式Fig.2 Training set construction method
將處理好的數(shù)據(jù)輸入到CAE中,得到每個軸承的隱藏特征。通過對每維特征在不同軸承上的趨勢一致性不斷進行局部約束,從而實現(xiàn)全局約束。設隱藏特征中某軸承的一個特征序列為X1=(α1,α2,α3,…,αk),在另一個軸承上對應同一特征序列為X2=(β1,β1,β1,…,βk)。借助相關性計算公式計算同一特征在不同軸承之間的趨勢一致性,相關性計算公式如式(4)所示,其中K表示序列的長度。
Corr(X1,X2)=
(4)
利用相關性公式計算時,需保證兩個序列具有相同的長度。但是由于軸承壽命具有離散性的特點,這導致了不同軸承同一特征之間的序列長度有很大差異,無法運用相關性公式對不經(jīng)處理的特征進行計算。在不改變特征整體變化規(guī)律的前提下,將不同軸承的同一特征壓縮至相同長度。如圖3所示,特征A具有長度a1和數(shù)值范圍b。通過等區(qū)間取平均值的降采樣方法,在不改變特征整體趨勢的前提下,將特征A長度從a1壓縮至a2。具體示意圖如圖3所示,m和q分別表示降采樣前后的樣本數(shù)量,本文q取5。
圖3 降采樣Fig.3 Down sampling
(5)
對式(6)計算出的上三角矩陣取平均值,平均值作為該列特征的趨勢一致性大小Cr。Cr計算方式如式(6)。所有特征的趨勢一致性大小TC也是取平均值,計算方式如式(7)。
(6)
(7)
式中,h為降維后特征的維數(shù)。
自編碼提取訓練軸承特征時,自編碼的主要損失函數(shù)是原始數(shù)據(jù)與重構數(shù)據(jù)的誤差,從而使得所提取的特征盡可能地保留原有數(shù)據(jù)的大部分信息。在卷積自編碼的重構損失中加入趨勢一致性約束,在提取特征時,通過最小化帶有趨勢一致性約束項的損失函數(shù)來增強同一特征在不同軸承上的趨勢一致性。設趨勢一致性約束為TC,TC值越大表明特征趨勢一致性越好,而卷積自編碼的重構損失越小,表明隱藏特征越能表征原數(shù)據(jù)。在趨勢一致性約束前增添一個負號來保持整體損失函數(shù)的減小,那么TC-CAE模型的損失函數(shù)可以表達為式(8)。TC-CAE模型原理如圖4所示。
(8)
圖4 TC-CAE模型原理圖Fig.4 Schematic diagram of TC-CAE model
軸承振動信號往往是多維數(shù)據(jù)而且含有噪聲,預測模型會面臨特征維數(shù)災難和提取特征不佳的問題。在頻域信號中,頻帶是按照頻率大小進行排列,比原始振動信號的分布更為規(guī)律,且這種按頻率大小順序排列的特點使得輸入層的單個網(wǎng)絡單元的輸入數(shù)據(jù)是固定頻率的信號,不再像原始振動信號一樣屬于振動周期中隨機時間的信號,可以有效降低卷積自編碼網(wǎng)絡重構信號的難度,所以更適合作為卷積自編碼網(wǎng)絡的輸入。因此對原始軸承振動時域信號作快速傅里葉變換,轉化為頻域信號,隨后用TC-CAE網(wǎng)絡提取特征。深度學習模型有更強的特征學習能力,能夠更充分地學習到很多淺層網(wǎng)絡學習不到的特征,因此TC-CAE網(wǎng)絡設置了三層卷積層與三層反卷積層,其結構如圖5所示。
圖5 TC-CAE模型Fig.5 TC-CAE model
在軸承性能退化的過程中,振動信號的變化與時間有關,軸承振動數(shù)據(jù)間的時序信息是一種潛在的信息。深度學習中的LSTM可以處理較長的時間序列數(shù)據(jù),能夠利用這種時序信息提高軸承壽命的預測精度,因此采用多層的LSTM網(wǎng)絡作為預測模型[17]。LSTM結構如圖6所示。全連接層將輸出結果映射到1~0。由于預測RUL結果之間的獨立性,預測結果的連續(xù)性較差。實際情況表明,軸承的RUL往往是連續(xù)的,因此對預測的RUL結果進行平滑可以使預測結果更符合實際情況。整個模型包含三層LSTM網(wǎng)絡層和一層全連接,同時對輸出的預測結果進行加權平滑。
圖6 LSTM結構Fig.6 LSTM structure
綜上,預測總流程為:首先利用快速傅里葉變換,將軸承原始振動時域信息轉化為頻域信息;再用TC-CAE網(wǎng)絡提取特征;最后構建LSTM模型進行軸承壽命預測??偮肪€如圖7所示。
圖7 總流程Fig.7 Overall process
試驗數(shù)據(jù)為滾動軸承加速壽命臺架試驗采集的振動加速度數(shù)據(jù),來源于電氣和電子工程師協(xié)會2012年舉辦的PHM數(shù)據(jù)挑戰(zhàn)賽[18]。試驗數(shù)據(jù)來自于PRONOSTIA試驗平臺,該試驗臺能夠對軸承在數(shù)個小時的時間內完成性能退化試驗。數(shù)據(jù)集共包含3種工況下的17個滾動軸承的全生命周期振動數(shù)據(jù),數(shù)量分別為7、7和3,分別命名為Bearing1-1~Bearing1-7,Bearing2-1~Bearing2-7和Bearing3-1~Bearing3-3。數(shù)據(jù)采樣頻率為25.6 kHz,每間隔10 s采集一次,采集時間長度為0.1 s,一次采集的振動數(shù)據(jù)為2 560個振動加速度,直到滿足數(shù)據(jù)說明中的振動加速度達到設定閾值軸承失效條件就停止采集。
圖8 PRONOSTIA試驗平臺Fig.8 PRONOSTIA test platform
本文在該軸承數(shù)據(jù)集中每種工況下隨機選擇了幾個軸承進行試驗,并選取工況1中的Bearing1-3和工況2中的Bearing2-4作為測試軸承,具體如表1所示。將每個軸承的試驗數(shù)據(jù)按照采集先后順序分別整理成數(shù)組。其中,Bearing1-3一共采集了2 375次,每次采集2 560個振動加速度,其壽命為23 750 s,經(jīng)過快速傅里葉變換后將其整理為(2 375×1 280)的數(shù)組。所對應的剩余壽命標簽為1~0的等差數(shù)列,以第200條數(shù)據(jù)為例,其對應的壽命標簽為0.916。同理Bearing2-4經(jīng)過快速傅里葉變換后整理成(751×1 280)的數(shù)組。
表1 試驗軸承數(shù)據(jù)Tab.1 Experimental bearing data
將每個訓練軸承的頻域數(shù)據(jù)縱向均分為50份,剩余壽命標簽區(qū)間為0.02,然后TC-CAE網(wǎng)絡的batchsize,其中Bearing1-3和Bearing2-4的batchsize分別為302和344。根據(jù)輸入數(shù)據(jù)的長度尺寸,特征提取模型的參數(shù)設置如表2所示。將數(shù)組(batchsize×1 280)的頻域特征壓縮為數(shù)組(batchsize×160)的隱層特征,計算趨勢一致性時將隱層特征降采樣為10個(5×160)的數(shù)組。
模型訓練時,訓練步數(shù)為10 000,并使用衰減學習率保證前期訓練速度的同時防止后期難以收斂。模型訓練完成之后,使用平整層將卷積層3的輸出數(shù)據(jù)扁平化為一維的數(shù)據(jù),其長度為160。將訓練集和測試集分別輸入訓練完成的網(wǎng)絡模型,分別獲得訓練集特征與測試集特征。
表2 模型參數(shù)Tab.2 Model parameters
三層LSTM隱藏神經(jīng)元數(shù)目分別設置為:170,40,10,步長選擇為5。全連接層的神經(jīng)元數(shù)量為1,激活函數(shù)采用relu函數(shù)。模型訓練時,采用的優(yōu)化器為Adam,訓練步數(shù)為10 000,初始學習率為0.005,并且采用衰減學習率的方式,學習率衰減因子設置為0.95。最后采用加權平均的方法對預測結果進行平滑處理。
在試驗過程中,為了驗證TC-CAE網(wǎng)絡在增強特征趨勢一致性上的有效性,與不加趨勢一致性約束的普通卷積自編碼網(wǎng)絡進行對比,網(wǎng)絡采用相同的參數(shù)。模型訓練完畢以后,分別用TC-CAE和CAE模型獲得Bearing1-3和Bearing2-4的特征,并計算得到對應的160維特征的趨勢一致性值。由于文章篇幅有限,只展示了Bearing1-3作為測試集時部分特征的趨勢,每個工況選擇了一個訓練軸承。采用圖片的方式展示訓練集中Bearing1-1、Bearing2-7和Bearing3-1中第61維特征,如圖9~圖14所示。
圖9 CAE Bearing1-1第61維特征Fig.9 CAE Bearing1-1 61st dimension features
圖10 CAE Bearing2-7第61維特征Fig.10 CAE Bearing2-7 61st dimension features
圖11 CAE Bearing3-1第61維特征Fig.11 CAE Bearing3-1 61st dimension features
圖12 TC-CAE Bearing1-1第61維特征Fig.12 TC-CAE Bearing1-1 61st dimension feature
圖13 TC-CAE Bearing2-7第61維特征Fig.13 TC-CAE Bearing2-7 61st dimension features
圖14 TC-CAE Bearing3-1第61維特征Fig.14 TC-CAE Bearing3-1 61st dimension feature
從圖9~圖14分析中可以發(fā)現(xiàn),圖12~圖14的特征趨勢一致性是優(yōu)于圖9~圖11的,說明TC-CAE模型相比于CAE模型,所提取的第61維特征趨勢一致性更好,驗證了TC-CAE特征提取模型確實是有利于促進同一特征在不同軸承上的趨勢一致性。表3展示了TC-CAE模型第61維特征在所有訓練軸承上的相關性系數(shù),計算結果精確到小數(shù)點后三位。
表3 第61維特征的相關性值Tab.3 Correlation value of the 61st dimension feature
為了更加定量地說明TC-CAE模型的有效性,計算了第61維特征對應的趨勢一致性數(shù)值,其中TC-CAE上該維特征的Cr值為0.857,CAE上該維特征的Cr值僅為0.423。Bearing1-3作為測試集時,所有特征的趨勢一致性TC值在CAE上為0.466,在TC-CAE為0.684。TC值越大表明特征的趨勢一致性越好,說明TC-CAE模型的確增強了所提特征的趨勢一致性。
本文模型主要由TC-CAE特征提取網(wǎng)絡與LSTM預測網(wǎng)絡組成,為了驗證TC-CAE特征提取網(wǎng)絡的有效性,將該網(wǎng)絡與卷積自編碼特征提取網(wǎng)絡進行對比,預測模型均采用相同參數(shù)的LSTM網(wǎng)絡。同時,進一步與當前主流的軸承剩余壽命預測方法進行了對比,即特征評價[19]和CNN[20]。
以Bearing1-3和Bearing2-4依次作為測試軸承進行試驗,采用上述4種方法分別對測試軸承進行剩余壽命預測。Bearing1-3和Bearing2-4的預測結果分別如圖15和圖16所示。圖中橫坐標表示數(shù)據(jù)序號,實則代表的是使用時間,縱坐標為當前時間點對應的剩余壽命占總壽命的百分比,黑色實線為真實的壽命值,其他線條為各種方法預測的壽命值。
圖15 Bearing1-3預測結果Fig.15 Forecast results of Bearing1-3
從圖15和圖16可以看出,無論是在Bearing1-3還是Bearing2-4中,本文所提方法相比CAE-LSTM預測效果是有提升的,更加接近真實的壽命線。此現(xiàn)象可以說明在提取特征時,增強同一特征在不同軸承上的趨勢一致性確實是有利于提升預測精度,TC-CAE是可行的。同時對比其余兩種參考方法,也是優(yōu)于它們的,能夠取得更好的預測結果。為了更加精確地描述以上4種方法的預測結果,按照式(9)對兩種方法預測結果的平均誤差emean進行了計算,計算結果如表4所示。
(9)
圖16 Bearing2-4預測結果Fig.16 Forecast results of Bearing2-4
表4 各方法預測結果平均誤差Tab.4 Average error of prediction results of each method
通過計算:對于Bearing1-3,本文方法相比CAE-LSTM預測模型的平均誤差下降了47.7%,相比特征評價和CNN分別下降了71.1%和75.1%;對于Bearing2-4,分別下降了62.4%,83.2%和66.7%。上述結果表明本文所提方法比CAE-LSTM、特征評價和CNN模型的預測誤差更小,有利于提升軸承剩余壽命的預測精度。
為了更全面地驗證該方法的有效性和適用性,采用留一法進行預測試驗。留一法即每次只采用一個軸承作為測試集,其余軸承作為訓練集,模型訓練完畢后,利用測試集進行測試。4種模型的平均誤差emean如表5所示。
表5 留一法試驗結果Tab.5 Leave one experiment results
表6 綜合平均誤差Tab.6 Combined average error
圖17 留一法試驗Fig.17 Leave one experiment
分析表6中的數(shù)據(jù),本文方法TC-CAE的綜合平均誤差也是以上幾種方法中最小的,相比于CAE-LSTM的預測結果,綜合平均誤差降低了21.1%,相比于特征評價和CNN分別降低了35.6%和25.9%。進一步分析以上結果,TC-CAE用深度卷積自編碼來提取特征,結合了卷積神經(jīng)網(wǎng)絡的表征學習能力與深度自編碼的強大重構能力,因此相比于CNN會有更好的預測效果。而相比于CAE,由于TC-CAE在提取特征時加入了趨勢一致性約束,促進同一特征在不同軸承上的趨勢一致性,降低了退化特征的軸承個體差異性,因此在CAE的基礎上提升了預測精度。
在預測軸承剩余壽命時,眾多特征提取方法忽略了退化特征的軸承個體差異性。為了減小退化特征的軸承個體差異,促進同一特征在不同軸承上的趨勢一致性,從而提升預測精度,提出了一種基于TC-CAE的軸承剩余壽命預測方法,并得到了以下結論:
(1) 通過提出趨勢一致性約束以及TC-CAE特征提取模型,TC-CAE模型在自動提取特征的同時,有利于促進同一特征在不同軸承上的趨勢一致性。
(2) 增強特征的趨勢一致性有利于提升預測精度。TC-CAE模型相比CAE模型,預測結果的綜合平均誤差降低了21.1%,在不同的工況下也表現(xiàn)出了較好的適用性。