李子涵,張營,,左洪福
(1.南京林業(yè)大學汽車與交通工程學院,江蘇南京 210037;2.南京航空航天大學民航學院,江蘇南京 211106)
軸承在伺服電機中起到了至關重要的作用,軸承故障是伺服電機故障的主要原因之一。軸承本身就是易損部件,尤其在經(jīng)過長期高強度的運行之后很容易發(fā)生故障,進而影響伺服電機的性能[1]。因此,滾動軸承的早期故障診斷和壽命預測對伺服電機的預測維護和工業(yè)安全運行具有重要意義[2-5]。
現(xiàn)有的故障預測方法可分為三大類:物理模型預測法、數(shù)據(jù)驅(qū)動模型預測法以及物理模型數(shù)據(jù)驅(qū)動模型混合預測法[6]。其中數(shù)據(jù)驅(qū)動方法在機械設備的壽命預測中應用較為廣泛;WANG等[7]提出了基于PCA和多傳感器物聯(lián)網(wǎng)的滾動軸承狀態(tài)健康監(jiān)測與壽命預測研究,并利用IMS滾動軸承試驗數(shù)據(jù)驗證其有效性。馬云飛等[8]通過改進小波包頻帶稀疏編碼對滾動軸承進行壽命預測。王奉濤等[9]基于LSTM網(wǎng)絡對滾動軸承進行了壽命預測分析,長短期記憶網(wǎng)絡通過改變隱藏層結構可有效解決RNN中的梯度消失與梯度爆炸問題[10]。張成龍等[11]基于改進后的PSO-SVR算法對滾動軸承RUL(Remaining Useful Life)進行預測。 ZHU等[12]利用隱馬爾可夫模型有效驗證了轉(zhuǎn)移剩余使用壽命(RUL )預測的有效性。由于軸承的退化過程易受到外界因素干擾,因此,同一軸承模型的不同部件,即使在相同工況下,其退化過程也有可能具有不同的數(shù)據(jù)分布特征[13]。此外大部分特征指標并不能清晰地表征軸承的運行狀態(tài)且容易忽略原始特征之間的聯(lián)系,容易導致預測精度較差等問題[14]。
針對上述問題,本文作者提出一種基于皮爾遜相關系數(shù)(Pearson)和核主成分分析(KPCA)的LSTM滾動軸承RUL預測方法,首先提取了軸承原始全壽命周期的時、頻域特征,在融合之前對所提取的時、頻域信息進行皮爾遜相關性分析,在此基礎上采用KPCA 進行特征融合、凝練特征,獲得信息互補精簡的特征[15]。將KPCA提取的若干主成分及對應的剩余壽命序列輸入到LSTM中對滾動軸承進行壽命預測。最后,通過IMS軸承數(shù)據(jù)集驗證了該方法的有效性和準確性。
時域信號具有直觀、易于理解的特點,是機械故障診斷與預測的原始依據(jù)[15]。因此本文作者獲取了12個時域特征:方差、均方值、均方根值、偏度、峭度、峰峰值、波形指標、裕度指標、峰值指標、脈沖指數(shù)、最大值、最小值。
頻域分析常被應用于軸承振動信號處理,軸承健康狀態(tài)的變化會在頻率上表現(xiàn)出來[15]。不同的頻域分析指標反映軸承運轉(zhuǎn)狀態(tài)的不同方面,因此,本文作者提取了4個頻域特征:頻率方差、頻率均方根、平均頻率、中心頻率。時、頻域信號提取如圖1所示。
圖1 時、頻域信號提取
皮爾遜相關系數(shù)最初是在統(tǒng)計學領域用來解讀兩個變量之間的相關性,被廣泛用于衡量兩個變量之間的相關性[15]。皮爾遜相關系數(shù)計算公式如(1)所示:
(1)
其中:Corr(X,T)表特征X與特征T之間的相關性。因為提取了16個不同類型軸承振動信號特征,所以每個特征需要與其他15個特征計算一次相關性,記第一個特征與第二個特征相關性為r1.2,最終將會得到一個 16×16 的特征評價矩陣,如公式(2)所示:
(2)
主成分分析是一種從高維數(shù)據(jù)集中提取內(nèi)在結構的強大技術(Bishop,1995)。然而,主成分分析是一種線性技術,無法捕捉數(shù)據(jù)集中的非線性結構。因此,人們提出了非線性泛化,特別是基于核理論的KPCA,用于計算非線性映射到高維特征空間的數(shù)據(jù)集的主成分。KPCA是一種非線性PCA方法。KPCA的實現(xiàn)過程為:首先使用非線性映射將所有樣本轉(zhuǎn)換到新空間;然后在新空間中進行主成分分析,并在新空間中提取樣本的低維特征。
假設向量x1,x2,…,xN,訓練樣本已通過非線性函數(shù)φ。因此,可以使用φ(x1),…,φ(xN)表示特征空間中的訓練樣本。如果特征空間中的樣本具有零均值,則協(xié)方差矩陣為
(3)
引用Γ(φ)作為特征空間的生成矩陣。根據(jù)PCA方法,特征空間中最有用的特征向量應該是Γ(φ)的大特征值對應的特征向量。最有用的特征向量應該是Γ(φ)的大λi對應的解μi,ui=λiμi。利用核函數(shù)k(xi,xj)表示點積,即k(xi,xj)=φ(xi)Tφ(xj),可以得到如下特征值方程:
Kα=λα
(4)
K是所謂的克矩陣,它有一個元素Kij=k(xi,xj),α是特征向量?;谔卣髦凳?4)的主成分分析方法稱為KPCA。
針對梯度消失和RNN不能解決長期依賴問題,選擇長短時記憶網(wǎng)絡(LSTM)。LSTM的特點是用內(nèi)存模塊替換普通的隱藏節(jié)點,保證梯度在大量時間步長后不會消失或爆炸,并能保持長期信息。LSTM網(wǎng)絡由多個LSTM單元鏈接組成,典型的LSTM單元包括寫入記憶、從記憶中讀取、重置記憶三大主要功能。LSTM作為一種非線性模型,也可以作為網(wǎng)絡中的復雜非線性元素來構建更大的深度神經(jīng)網(wǎng)絡。此外,在訓練階段加入dropout以避免過擬合,提高計算效率。LSTM網(wǎng)絡的核心思想為門控邏輯,公式(5)—(9)表示了LSTM單元中3個控制門(遺忘門、記憶門、輸出門)的操作:
ft=σ(wf×[ht-1,xt]+bf)
(5)
it=σ(wi×[ht-1,xt]+bi)
(6)
(7)
Ot=σ(Wo×[ht-1,xt]+bO)
(8)
ht=Ot×tanh(Ct)
(9)
式(5)中:ft是遺忘門;wf是遺忘的權重項;bf是偏差項。公式(6)—(7)為輸入門;公式(8)—(9)為輸出門。Ot由輸出門獲得,ht為隱藏層的輸出,在LSTM中采用sigmoid函數(shù)作為激勵函數(shù),具體函數(shù)公式如(10)所示:
(10)
LSTM的基本結構單元如圖2所示。
圖2 LSTM基本結構單元
為了基于實際信號預測伺服電機滾動軸承的剩余壽命,提出一種基于皮爾遜相關系數(shù)(Pearson)和核主成分分析(KPCA)的LSTM伺服電機滾動軸承壽命預測。圖3為Pearson-KPCA-LSTM預測模型流程。
圖3 Pearson-KPCA-LSTM預測模型流程
(1)提取原始軸承全壽命周期的時、頻域信號。
(2)利用移動平均法(MA)對時、頻域信號進行平滑處理并進一步提取特征信息。
(3)將平滑后的特征信號利用皮爾遜相關系數(shù)遍歷選取高度相關的特征值。
(4)將高度相關的特征值利用核主成分分析(KPCA)降維并選取若干主成分,通過第一主成分選取對應的剩余壽命序列作為測試集對滾動軸承進行RUL預測,利用第一主成分作為LSTM模型的輸入并在LSTM中加入Dropout防止過擬合。
(5)二階多項式擬合。
此次實驗數(shù)據(jù)來自美國國家科學基金會NSF I/UCR智能維修系統(tǒng)中心(IMS)進行的軸承失效測試。實驗間隔20 min采集一次數(shù)據(jù),采樣頻率為20 kHz,驅(qū)動電機轉(zhuǎn)速為2 000 r/min,采樣點為4 096,一共984組數(shù)據(jù),共獲得3組單獨的軸承壽命實驗數(shù)據(jù)[16],每組數(shù)據(jù)都表示一個軸承從完好到失效的狀態(tài)。其中數(shù)據(jù)集2中的軸承1出現(xiàn)外圈故障。實驗設備如圖4所示。
圖4 實驗裝置
首先提取了軸承原始全壽命周期的時、頻域共計16個信號,通過移動平均法(MA)對所提取的時、頻域信號進行平滑處理,可以看出平滑后的特征信號特征趨勢更為明顯。圖5為部分用移動平均法(MA)平滑過后的特征信號。
圖5 MA平滑后的時、頻域信號
由于時域中的無量綱指標過于嘈雜,部分特征值對早期故障不敏感以及無性能退化趨勢體現(xiàn)[17],且原始特征集中存在一些單調(diào)性不好和反映性能退化過程相對效果差的特征,因此需要對原始特征集進行特征篩選[18]。利用皮爾遜相關系數(shù)對平滑后的16個特征信號進行相關性分析,通過皮爾遜相關系數(shù)分析得出相關系數(shù)矩陣并得出高度相關特征圖(見圖6)。一般情況下,相關性r的取值在(-1,1)之間,其中當相關性|r|≥0.8時,視為高度相關[15]。通過設定閾值為0.8選取了方差、均方值、最大值、最小值、均方根值、峰峰值、頻率方差7個高度相關特征指標。表1為高度相關系數(shù)矩陣。
表1 相關系數(shù)矩陣
圖6 高度相關特征圖
利用核主成分分析(KPCA)對所選取的9個高維特征進行加權融合和降維處理,并選取若干主成分,其各主成分的貢獻率如表2所示。根據(jù)各主成分的貢獻率可得出第一主成分包含了軸承全面的退化信息,因此選取第一主成分作為LSTM模型的輸入。第一主成分如圖7所示。
表2 各主成分貢獻率
圖7 第一主成分
根據(jù)第一主成分分析,其后500個點上升趨勢較為明顯,因此選取第一主成分后500個點及其對應的剩余壽命序列作為測試集輸入到LSTM中并預測滾動軸承的RUL。
在LSTM中加入 dropout防止過擬合,文中的dropout比率設置為0.2。為更好地反映滾動軸承RUL,設定0-1直線為軸承的理想退化趨勢,其中0表示軸承處于健康狀態(tài),1代表軸承發(fā)生故障。圖8為軸承的RUL預測曲線,可看出:預測值圍繞著理想退化趨勢上下波動。
圖8 滾動軸承RUL曲線
為了直觀反映被測軸承的剩余使用壽命,通過二階多項式擬合對所得預測曲線進行擬合。從圖9可以看出:擬合曲線與理想退化趨勢相比十分逼近,表明了該模型對伺服電機滾動軸承剩余使用壽命預測的有效性。
圖9 RUL二次擬合曲線
為驗證文中提出的模型的準確性,采用RMSE和R2作為評估指標對滾動軸承RUL預測結果進行評價。將最終得到的實驗結果與LSTM和BP神經(jīng)網(wǎng)絡對比,如表3所示。評估公式如下:
表3 實驗結果對比
(11)
(12)
通過對比可以看出:所提出的預測方法較LSTM和BP神經(jīng)網(wǎng)絡相比有更高的精度,為伺服電機滾動軸承零件剩余壽命預測提供一種新思路[19]。
(1)由于單一的特征難以真實反映軸承的性能退化狀態(tài)且為避免忽略原始特征之間的聯(lián)系,本文作者提取了滾動軸承的16個時、頻域特征指標,通過皮爾遜相關系數(shù)遍歷選取了9個高度相關的特征指標,利用核主成分分析對所提取的9個高度相關特征指標進行降維,降維后的主成分能充分表征軸承性能退化過程。
(2)在LSTM中加入dropout可有效防止過擬合,通過IMS數(shù)據(jù)集驗證了該方法的可行性。與LSTM及BP神經(jīng)網(wǎng)絡的對比結果表明,該方法的預測精度更高且具有更小的預測誤差。