蘭杰,李志寧,呂建剛
(陸軍工程大學石家莊校區(qū),石家莊 050003)
軸承是旋轉機械設備的核心部件,其健康狀態(tài)直接影響整個設備的運行狀態(tài)。軸承在運行過程中長期承受交變載荷和高溫作用,其內部零件易發(fā)生磨損、剝落和破裂。大量試驗數(shù)據表明,軸承從早期故障發(fā)生到失效一般歷時較短;因此,實施精準的早期故障檢測并研究軸承的退化規(guī)律,有助于幫助設備維修人員及時維護或更換故障軸承,防止引發(fā)設備其他部件的損傷,對于節(jié)約設備維修成本,避免發(fā)生安全事故具有重要意義。
精準檢測早期故障的關鍵在于構建對早期故障敏感的健康指標。傳統(tǒng)健康指標構建方法一般利用現(xiàn)代信號處理技術對軸承振動信號或聲信號進行降噪分解后提取時域、頻域或時頻域等統(tǒng)計特征,在對多特征進行降維或融合后構建表征健康狀態(tài)的指標。如文獻[1]對軸承振動信號進行變分模態(tài)分解后,選取了變化趨勢明顯的本征模量奇異值、均方根和樣本熵組成綜合特征指標,用于軸承的早期故障診斷;文獻[2]提出一種基于多維度排列熵的軸承故障特征提取方法,與SVM相結合實現(xiàn)了軸承早期故障診斷。
傳統(tǒng)特征提取方法依賴于復雜的信號處理過程,在特征表達能力方面具有較大的局限性。隨著深度學習理論的發(fā)展,基于自編碼器(Auto Encoder,AE)的自適應特征提取方法逐漸被應用于軸承的故障診斷、異常檢測和狀態(tài)評估。與傳統(tǒng)特征提取方法相比,基于自編碼的故障診斷方法將特征提取與模式識別結合為整體,實現(xiàn)了端對端的診斷,極大簡化了診斷流程。文獻[3]采用最大相關熵損失函數(shù)設計深度自編碼器,從軸承原始振動信號中提取出判別性更強的深度特征,實現(xiàn)了軸承的早期故障診斷;文獻[4]利用堆疊式稀疏自動編碼器從軸承聲信號頻譜圖中自動提取故障特征,并采用softmax回歸實現(xiàn)故障模式分類;文獻[5]用深度自編碼神經網絡對原始特征進行壓縮提取,選取趨勢明顯的特征作為健康指標實現(xiàn)了軸承健康狀態(tài)的評估;文獻[6]利用歸一化稀疏自編碼器構建局部連接網絡提取數(shù)據的深度特征并實現(xiàn)早期故障診斷;文獻[7]采用變分自編碼器從軸承振動信號頻域信息中學習潛在的狀態(tài)概率分布,用于評估軸承的狀態(tài)。
隨著機械設備的構造和運行過程的復雜性不斷提高,如何利用在線樣本實施快速、精準的故障診斷和異常檢測成為故障診斷領域的新課題。傳統(tǒng)診斷方法大多基于離線診斷,難以滿足在線診斷和異常檢測的需求。極限學習機(Extreme Learning Machine,ELM)因較快的訓練速度和良好的泛化能力被廣泛應用于機械故障在線診斷領域[8]。文獻[9]提出一種基于稀疏和近鄰的流行正則化深度極限學習機,以電動機的電路信號作為輸入實現(xiàn)了滾動軸承的故障診斷;文獻[10]提出一種在線貫序極限學習機的故障診斷方法,實現(xiàn)了樣本的在線更新和診斷;文獻[11]為克服單個ELM模型分類精度不高和隨機設置輸入權值導致結果不穩(wěn)定的問題,提出一種集成極限學習機,提高了滾動軸承多故障模式識別的準確率。
自編碼器網絡在實現(xiàn)數(shù)據重構的過程中,會自適應學習到訓練樣本的狀態(tài)分布特征,輸入測試樣本后,網絡會依據訓練樣本的狀態(tài)分布重構測試樣本,若測試樣本與訓練樣本的狀態(tài)分布不一致,則自編碼器網絡對測試樣本的泛化能力會變弱,表現(xiàn)為重構誤差增大。軸承在退化過程中,故障樣本必然會逐漸偏離健康樣本的分布,且偏離程度與故障程度呈正相關。基于上述原理,本文選擇軸承健康狀態(tài)樣本訓練自編碼器,而后對軸承的在線樣本進行測試,以在線樣本的重構誤差作為健康指標以反映軸承與健康狀態(tài)的偏離程度。為提高網絡的訓練速度以適應在線檢測的需求,將自編碼器與極限學習相結合,構建極限學習機自編碼器(ELM-AE)用于樣本重構,并采用滑動t檢驗檢測健康指標發(fā)生突變的時間點,從而實現(xiàn)軸承的智能化早期故障檢測。
自編碼器是一種無監(jiān)督的神經網絡,在訓練時無需設置標簽,而是以輸入作為網絡標簽進行訓練,訓練好的自編碼器可以實現(xiàn)輸入數(shù)據的重構并進行抽象特征提取[12]。自編碼器結構如圖1所示,由編碼器和解碼器2部分組成,編碼器實現(xiàn)輸入向量x向隱含層的非線性映射h,解碼器則將隱含層特征重構為原始向量x′,整個網絡以輸入和輸出的誤差作為損失函數(shù)L,并通過損失函數(shù)的反向傳播不斷調整網絡參數(shù),使損失函數(shù)最小。
圖1 自編碼器結構圖
h=g(w1x+b1),
(1)
x′=g(w2h+b2),
(2)
(3)
式中:w1,b1分別為輸入的權值和偏置;g為非線性激活函數(shù);w2,b2分別為隱含層輸出的權值和偏置;x′為訓練過程中的輸出向量。
極限學習機是對單隱藏層前饋神經網絡算法的改進[13],其結構如圖2所示,圖中x和t分別為輸入向量和輸出標簽,w,b分別為輸入層與隱含層的權值和偏置,β為隱含層與輸出層的權值。與采用梯度下降訓練的BP神經網絡不同,極限學習機訓練時輸入層與隱含層的權值隨機生成且無需再調整,隱含層與輸出層之間的權值則通過最小二乘法直接求解,計算公式為
Hβ=T,
(4)
β=H+T,
(5)
式中:H為隱含層向量hi(i=1,2,…,n)構成的隱含層矩陣;n為輸入樣本的數(shù)量;T為樣本標簽向量構成的矩陣;H+為H的廣義逆矩陣?;谧钚《朔?,整個算法的求解過程無需反饋迭代調整,既實現(xiàn)了單隱藏層前饋神經網絡的函數(shù)逼近能力[14],又具備訓練參數(shù)少,學習速度快和泛化能力強的優(yōu)點。
圖2 極限學習機結構
傳統(tǒng)自編碼器是基于梯度下降求解的神經網絡,當各層神經元數(shù)量較多時,網絡訓練耗時較長且容易陷入局部最優(yōu)解。ELM也是單隱層神經網絡,將其輸出用輸入表示時,可通過訓練實現(xiàn)自編碼器的功能且能夠克服傳統(tǒng)自編碼器的不足,顯著提升模型的泛化能力和訓練速度[15]。
假定極限學習機自編碼器的輸入樣本數(shù)為n,輸入節(jié)點和輸出節(jié)點數(shù)均為l,隱含層節(jié)點數(shù)為m,則對于輸入樣本矩陣X=[x1,x2,…,xn],x∈Rl且可在訓練過程中作為網絡輸出向量。ELM-AE的隱藏層單元向量為
h=g(W·x+b),
(6)
為提高模型的泛化能力,一般將隨機生成的輸入權重和偏置做正交化處理,即(W,b)需滿足
WWT=I,bbT=I。
(7)
隱含層h與輸出x′之間的關系為
hβ=x′,
(8)
式中:x′為ELM-AE訓練時的輸出。
將ELM-AE損失函數(shù)設定為
(9)
對β求導可得輸出權值β的最優(yōu)解,即
(10)
式中:C為正則化系數(shù),其值直接影響ELM的泛化性能。
軸承處于健康狀態(tài)時,其振動信號的頻譜會保持相對穩(wěn)定,在進入性能退化階段后,故障特征頻率所對應的基頻和倍頻在頻譜中的幅值會隨著故障加深而增大,由此導致頻譜成分發(fā)生變化。因此,本文選取軸承健康狀態(tài)下振動信號的希爾伯特包絡頻譜作為樣本訓練ELM-AE,然后利用訓練好的ELM-AE對軸承在線振動信號包絡譜進行檢測,并將真實頻譜與重構頻譜的誤差作為健康指標。
早期故障發(fā)生時,軸承的頻譜與健康狀態(tài)有明顯差異,導致重構誤差突然增大。為更好地實現(xiàn)軸承的智能化早期故障預警,避免人為干預,采用滑動t檢驗獲取健康指標首次突增的時間?;瑒觮檢驗是一種常用于檢驗氣候時間序列是否發(fā)生突變的異常數(shù)據檢驗方法,其通過檢驗時間序列中2段子序列均值差異的顯著性水平反映2段子序列的差異,當均值差異超過給定的顯著性水平時,認為序列有突變發(fā)生。
(11)
(12)
統(tǒng)計量t服從自由度為v=n1+n2-2的t分布。在給定顯著性水平α下,若|t|≥tα,則認為該序列在基準點處發(fā)生了突變。當通過滑動t檢驗檢測到健康指標發(fā)生突變,可判定軸承發(fā)生早期故障。
如圖3所示,將軸承的性能退化分析和早期故障檢測過程分為離線和在線2個階段。
離線階段:獲取軸承健康狀態(tài)下的多段振動信號,取每段信號希爾伯特包絡譜的前1 280個幅值作為樣本訓練ELM-AE,這是由于軸承故障特征頻率一般處于低頻帶,前1 280個幅值所代表的低頻信息即可表征軸承的故障特征。
在線階段:
1)在線獲取軸承的振動信號并計算每段信號的希爾伯特包絡譜,采樣頻率和采樣時長與離線樣本一致。
2)將每段信號包絡譜的前1 280個幅值作為測試樣本,即xi=(fi1,fi2,…,fi1 280),按時間順序依次將xi輸入訓練好的ELM-AE中,網絡輸出重構數(shù)據x′i=(f′i1,f′i2,…,f′i1 280),計算測試樣本的重構誤差ei,即
ei=‖xi-x′i‖2。
(13)
3)將ei作為軸承的健康指標,按時間順序生成健康指標序列e。利用滑動t檢驗逐步檢測e是否產生突變,產生突變后可判定軸承早期故障發(fā)生,軸承進入性能退化階段。
圖3 軸承早期故障檢測流程圖
采用XJTU-SY 軸承數(shù)據集進行試驗驗證。試驗平臺設計如圖4所示,試驗軸承為LDKUER204,振動信號采樣頻率為25.6 kHz,采樣間隔為1 min,每次采樣時長為1.28 s。當振動信號最大幅值超過10Ah時認定軸承失效并終止試驗,Ah為軸承正常運行階段的最大振動幅值[16]。該試驗共設計了3類工況(表1),每類工況包含5種水平和垂直的軸承全壽命振動數(shù)據,且明確標注了每套軸承的具體失效部位,數(shù)據集的具體描述見表2。
圖4 軸承壽命加速試驗平臺
表1 軸承壽命加速試驗工況表
表2 XJTU-SY軸承數(shù)據集表
由于試驗均從軸承完好狀態(tài)開始進行,因此認為軸承運行初期處于健康狀態(tài),選取3-1數(shù)據集前100次采樣的振動信號包絡譜作為健康樣本訓練ELM-AE。ELM-AE的網絡泛化能力受隱含層神經元數(shù)m和正則化系數(shù)C的影響,為使ELM-AE測試其他工況軸承數(shù)據時的重構誤差最小,利用1-1和1-2數(shù)據集各前100個樣本共同作為測試樣本,以測試樣本健康指標之和作為優(yōu)化參數(shù),采用網格化搜索方式優(yōu)化ELM-AE的隱含層神經元數(shù)和正則化系數(shù)設置m為{500,600,…,3 000},C為{10-3,10-2,…,104},則m和C在不同取值下重構誤差的網格化結果如圖5所示:
“風云莫測”一類的話語,用在內蒙的云上可能最是貼切。例如第四天在曼陀山邊達日罕小鎮(zhèn)“龍泉賓館”早起出發(fā)時晨晨說“天不好,沒云;多半會一路暴曬了”;可此話后不過一個時辰,就無中生有地無意間積聚了甚多的云,開始還是羞答答貼著地平線或地平線一帶的平矮低山溜達,爾后隨著太陽的高升和氣溫的提升開始變得越來越登堂入室、越來越肆無忌憚,像往日一般東一抹西一抹地步步拉高,最終是布滿湛藍的天庭。
圖5 重構誤差網格化圖
重構誤差隨隱含層神經元數(shù)量增多而逐漸減小, 正則化系數(shù)對重構誤差的影響相對較小,由于模型訓練和測試時間會隨隱藏層神經元數(shù)量增多而明顯增長,綜合考慮后選取隱藏層神經元數(shù)量為2 000,網絡正則化系數(shù)為0.001。
不同工況下,由上述健康指標建立的軸承退化曲線如圖6所示:各工況下軸承的健康指標均在運行初期保持平穩(wěn),隨著運行時間增長在某一時刻突然升高,而后持續(xù)增長,最后在失效階段急劇升高。退化過程表明,軸承運行初期處于健康平穩(wěn)狀態(tài),在指標突變處發(fā)生早期故障,而后進入退化階段直至失效。圖中多套軸承的健康指標在進入退化階段后并非一直呈現(xiàn)單調遞增趨勢,如軸承2-5運行200 min后的健康指標呈下降趨勢,這是由于軸承進入退化階段后,由于高溫和載荷的作用,會對磨損、剝落等表面損傷形成撫平作用,導致軸承在退化階段的故障程度有所減弱,表現(xiàn)為健康指標下降,此類傷口撫平作用可能會在退化過程中多次發(fā)生,因此健康指標在軸承退化階段出現(xiàn)階段性下降符合工程實際。
圖6 不同工況下各試驗軸承的性能退化趨勢
為減少人為干預,實現(xiàn)軸承的智能化早期故障預警,采用滑動t檢驗獲取健康指標發(fā)生異常突變的時間。對于滑動t檢驗,需確定2個滑動子序列的長度n和顯著性水平α,n選值過大會造成早期故障預警的遲滯,α過大則導致tα過小,無法過濾指標在穩(wěn)態(tài)下的正常波動,造成提前誤警。選定檢測基準點前后子序列長度均為5(即自由度ν=8),顯著性水平α為0.000 5(查表可得tα=5.041 3)。工況1和工況2下,試驗軸承首次突變的檢驗結果如圖7所示:在顯著性水平為0.000 5時,所設置的tα閾值可有效檢測健康指標發(fā)生突變的時間,適用于軸承早期故障在線預警。其中,軸承1-4的健康指標未超過閾值,是由于采樣數(shù)據中該軸承在最后1 min才進入退化階段,運行過程中未出現(xiàn)突變。
圖7 工況1,2下各試驗軸承的異常檢驗結果
軸承的早期故障一般是因長期承載和潤滑失效所致的局部點狀磨損、疲勞剝落和裂紋等,故障初期的損傷面較小,微弱故障導致的周期性沖擊分量容易被噪聲淹沒,在對信號進行降噪分解前難以直接在原始振動信號中觀測到沖擊分量。發(fā)生早期故障后,各故障部位對應的特征頻率或其倍頻在頻譜中的幅值會明顯增加,因此可通過分析頻譜變化檢驗是否發(fā)生早期故障。
分別以軸承1-2,2-4,2-1為例進行分析,各軸承不同時刻振動信號的包絡譜如圖8所示:
1)軸承1-2第32 min時健康指標發(fā)生突變,其第1,31 min時刻包絡譜的成分和幅值并無明顯變化,頻譜峰值對應的頻率為轉速的基頻(35 Hz),表明該時間段內軸承為健康狀態(tài);第32 min時的頻譜峰值對應頻率變化為860.0 Hz,近似于外圈故障特征頻率(107.9 Hz)的8倍頻,次峰值對應頻率為216.4 Hz,近似于外圈故障特征頻率的2倍頻,說明軸承在第32 min時出現(xiàn)外圈故障。
2)軸承2-4第31 min的頻譜峰值變?yōu)?89.8 Hz,對應于外圈故障特征頻率(115.6 Hz)的6倍頻,說明軸承在31 min發(fā)生了外圈早期故障。
3)軸承2-1第454 min的頻譜中出現(xiàn)了365.6 Hz的成分,近似于軸承內圈故障特征頻率(184.4 Hz)的2倍頻,但整體幅值與第1 min的頻譜相比并無明顯變化;第455 min時頻譜峰值顯著增加,且出現(xiàn)了近似于于內圈故障特征頻率5倍頻的934.4 Hz,說明此時內圈已經開始出現(xiàn)故障,但故障比較微弱。
上述分析表明:基于ELM-AE重構誤差所建立的軸承健康指標對軸承早期故障比較敏感,能夠準確描述軸承的退化過程,利用滑動t檢驗可以準確獲取軸承發(fā)生早期故障的時間。
軸承1-2全壽命振動信號的標準差、峭度和均方根及其突變點檢測結果如圖9所示,峭度指標的單調性較差,不能準確描述軸承退化過程, 均方根和標準差在第31 min時的變化并不明顯。采用滑動t檢驗獲取峭度、均方根和標準差的突變時間點,結果表明這3個指標獲取的突變時間點均滯后于本文健康指標的檢測結果。
(a)軸承1-2
(b)軸承2-4
(c)軸承2-1
(a)標準差 (b)峭度 (c)均方根
為說明本文方法在軸承在線檢測方面的有效性和優(yōu)勢性,與同樣采用無監(jiān)督構建健康指標的方法[17]進行對比,2種方法對軸承早期故障的預警結果見表3,本文方法對軸承2-5的早期故障預警時間早于文獻[17],其他預警時間基本一致。文獻[17]采用深度可分離卷積自編碼器構建軸承深度特征提取模型,訓練好模型后用于提取在線樣本的深度特征,計算在線樣本深度特征與健康狀態(tài)深度特征的Bray-Curtis 距離,在平滑濾波后采用3σ原則實現(xiàn)早期故障預警;需要建立多層復雜的特征提取模型,訓練模型時需采集多套軸承的全壽命數(shù)據集作為樣本,導致其訓練時間長。本文方法僅需采集軸承健康狀態(tài)下的少量樣本訓練模型即可,模型結構為單隱層的ELM-AE,而且 ELM的訓練速度具有極大優(yōu)勢,在同等故障預警精度下,本文模型具有訓練樣本少,訓練速度快的優(yōu)點。
表3 早期故障預警結果對比
針對軸承早期故障檢測和性能退化過程描述問題,基于軸承在線監(jiān)測數(shù)據的動態(tài)變化,提出了一種基于無監(jiān)督ELM-AE的健康指標構建方法,并用XJTU-SY 軸承數(shù)據集進行了試驗驗證,主要結論如下:
1)基于極限學習機自編器重構誤差所構建的健康指標能較好描述軸承的性能退化過程,對軸承的早期故障比較敏感,能明顯區(qū)分軸承的健康狀態(tài)和退化階段。
2)采用的滑動t檢驗可有效獲取軸承健康指標首次發(fā)生突變的時間,適用于軸承的在線智能故障預警。
3)與基于深度神經網絡的模型相比,本文方法具有模型結構簡單,訓練樣本少,訓練速度快和精度高的優(yōu)點。