穆麗蓉,胡磊,b,c
(武漢理工大學 a.能源與動力工程學院;b.船舶動力工程技術交通行業(yè)重點實驗室; c.船舶與海洋工程動力系統(tǒng)國家工程實驗室,武漢 430063)
軸承是軸系和旋轉機械的重要部件,其運行狀態(tài)直接影響系統(tǒng)的可用性和可靠性,隨著軸承載荷的增加,其發(fā)生故障的可能性也越來越大。目前,軸承狀態(tài)監(jiān)測主要采用振動法[1],根據故障機理提取相關特征參數,通過閾值或概率進行故障診斷,但基于機理的振動信號判據與軸承的結構和類型密切相關,通用性不好。充分利用基于機理的多維振動特征參數,融合機理與數據驅動診斷方法,研究具有一定通用性的診斷算法,實現軸承狀態(tài)的自動識別,對提高軸承健康管理和故障預測(prognostic and health management,PHM)水平具有重要意義。
本文首先以滾動軸承為對象,通過時頻分析提取振動信號特征參數,經標準化處理后,選擇T-SNE降維技術,獲得訓練樣本,研究基于隨機森林的故障診斷模型,以識別滾動軸承運行狀態(tài),最后將該方法應用于滑動軸承,驗證方法的適用性。
目前振動法廣泛應用于滾動軸承故障診斷與預測,常用的振動信號特征參數有時域特征和頻域特征。傳統(tǒng)的診斷方法在于對特征參數進行閾值或概率判斷[2],而基于機器學習的診斷方法,可以通過刪減或選擇從多維特征參數中提取有效特征參數[3]。在試驗中,測取驅動端和風扇端的軸承振動信號,并分別提取9個時域特征參數與3個頻域特征參數共24維樣本數據,分別為均值、RMS值、時域峰值、方差、峭度、峰值因子、波形因數、脈沖指標、裕度系數、基頻振幅、0.5倍頻振幅和2倍頻振幅等[4-5]。
由于各特征參數之間數量級差距過大,會影響故障診斷結果,降低診斷準確度,需對特征參數進行標準化處理,將有量綱的特征參數變成無量綱的標量。本文采用min-max標準化方法,將特征值歸一化為0~1之間的量綱一的量數字,如式(1)所示。
Xnor=(X-Xmin)/(Xmax-Xmin)
(1)
式中:X為標準化前的特征參數值;Xnor為標準化之后的特征參數值;Xmax為該列特征參數的最大值;Xmin為該列特征參數的最小值。
特征參數選取包括特征選擇與數據降維。
特征選擇通常根據特征的貢獻率,從大到小排序得到累積貢獻率超過k值的前n個特征值,刪除其他貢獻率低于1-k的特征值。
特征降維是通過相關算法對高維數據進行融合,獲得新的低維特征參數標量。本文采用T-SNE流形學習方法對高維數據進行降維分析。T-SNE降維是t分布與隨機鄰接嵌入(SNE)的融合,降維之后的數據看作t分布,較高斯分布而言,t分布峰值更低、尾端更高,分布更平緩,可避免將距離較大的數值簇通過分布概率降維后距離拉近,解決了擁擠問題。
隨機森林是監(jiān)督學習常用方法之一,為了提高診斷率,選用KNN、決策樹、SVM、隨機森林4種方法進行對比。KNN是基于訓練數據之間的歐氏距離進行分類,對測試樣本的標簽劃分進行投票,票數多的一類即為測試樣本標簽類別;決策樹通過二分法對樣本數據進行逐步分類,通過自學習內部節(jié)點及分支,輸出若干葉節(jié)點,直到每個葉節(jié)點代表一類標簽;SVM是在若干樣本之間找到分類超平面,通過距離最大的原則找到超平面與樣本之間的支持向量,從而實現最優(yōu)分類[6];隨機森林則是Bagging套袋法與決策樹的結合,Bagging在原始訓練樣本集中隨機選擇若干個訓練樣本,進行k輪選擇,建立k個小樣本集,并且每個小樣本之間相互獨立,樣本元素可重復,每個小樣本都訓練一個分類模型,最終分類結果由每個分類模型投票決定[7],而在隨機森林中,每個小樣本的分類模型為決策樹模型,具有極高的準確率,訓練速度快,不容易實現過擬合。故障診斷技術路線見圖1。
圖1 故障診斷技術路線
本文引用凱斯西儲大學滾動軸承故障模擬實驗數據[8],該試驗臺架包含1個1.5 kW機、1個轉矩傳感器和其他電子設備,見圖2。測試的振動信號來自于支撐電機的軸承處,軸承類型為SKF滾動軸承。使用電火花加工技術在如圖2所示驅動端軸承內圈、滾動體和外圈的3個方向上模擬單點故障,故障點直徑分別為0.18、0.36和0.54 mm,共設置13種故障狀態(tài),每種狀態(tài)單獨運行4種轉速,采樣率為12 kHz,采樣時間10~11 s,故障設置見表1。
圖2 試驗臺架及軸承結構
表1 驅動端軸承故障設置
每種故障狀態(tài)下的振動時域特征信號是不同的,僅依靠時域波形并不能明顯區(qū)分各種故障狀態(tài),表中部分故障狀態(tài)下采集的時域信號見圖3。
圖3 故障狀態(tài)時域信號
軸承旋轉2轉提取一組樣本數據,每個轉速提取145個樣本,每種狀態(tài)145×4=580個樣本,共有580×13=7 540個樣本。對24維特征參數貢獻率進行排序,選擇累積貢獻率超過90%的特征,共13個特征參數,分別為:驅動端RMS值、時域峰值、方差、峭度、峰值因子、裕度系數,風扇端RMS值、時域峰值、方差、峰值因子、波形因數、脈沖指標、裕度系數。
選擇PCA線性降維與T-SNE非線性降維方法,將24維數據降為二維和三維并進行可視化見圖4。二維圖中的坐標x、y和三維圖中的坐標x、y、z均為降維之后量綱一的量的標量數據,每個標號及其顏色代表一種故障狀態(tài)。
圖4 降維樣本分類
由圖4可見,PCA降維方法與T-SNE降維方法都可以將訓練樣本數據的狀態(tài)分離,但PCA降維使得同類狀態(tài)的樣本間距離不緊湊,不同類狀態(tài)的樣本間距離不分散,而T-SNE恰好相反,能夠將同類樣本聚集,不同類樣本分散,且三維比二維在空間中樣本數據的分散性更好一些。
對特征參數進行降維之后,分別選擇KNN、SVM、決策樹、隨機森林4種分類算法進行故障診斷,共有樣本數7 540,選取其3/4為訓練樣本,1/4為測試樣本,分類效果見表2。
表2 故障診斷準確率 %
由表2可見,選用T-SNE降三維之后的隨機森林故障診斷效果最佳。
為了驗證此診斷算法的通用性,使用滑動軸承狀態(tài)數據進行驗證。采用柴油機滑動主軸承磨損實驗數據[9],通過添加紫銅片的方法模擬4120SG型柴油機第4檔主軸承的3種不同軸承間隙(0.16,0.25,0.32 mm),并測取每種軸承間隙下的振動信號,采樣頻率為40 kHz。按照模型流程先對數據進行時頻分析,提取12維振動特征參數,共提取3個狀態(tài)的6 239個樣本;對每一維特征參數進行貢獻率分析,使用累積貢獻率超過90%選擇了六維特征參數,分別為:RMS值、峭度、峰值因子、裕度指標、基頻振幅、2倍頻振幅;對六維特征參數進行歸一化和T-SNE降三維處理,可視化圖形見圖5。
圖5 降維樣本分類
對6 239個樣本進行劃分,選取3/4為訓練樣本,1/4為測試樣本,輸入隨機森林故障診斷模型中,得到狀態(tài)診斷準確率為94.615%。
1)采用T-SNE降維方法能夠對振動多維特征參數進行良好的融合,能夠更好區(qū)分不同類型樣本數據,使得類別分界線更加清晰。
2)振動特征參數對軸承的狀態(tài)變化較為敏感,在對特征參數進行分析與處理后,隨機森林算法診斷效果相對較優(yōu)。
3)研究表明:T-SNE降維與隨機森林算法相結合的軸承故障診斷方法具有通用性,體現了基于機理與數據驅動混合診斷的優(yōu)越性。