李海浪, 鄒益勝, 曾大懿, 劉永志, 趙市教, 宋小欣
(西南交通大學(xué) 機(jī)械工程學(xué)院,成都 610031)
滾動(dòng)軸承作為一種機(jī)械標(biāo)準(zhǔn)件,被廣泛應(yīng)用于各類機(jī)器中。軸承故障會(huì)引起整個(gè)機(jī)械系統(tǒng)發(fā)生故障,在實(shí)際的工業(yè)生產(chǎn)中容易引發(fā)安全事故,不僅影響生產(chǎn),而且嚴(yán)重者會(huì)危及人員安全[1]。因此,研究軸承剩余使用壽命十分有意義。軸承剩余壽命的研究方向有兩種:基于數(shù)據(jù)驅(qū)動(dòng)的方法和基于模型的方法[2]。近年來隨著人工智能和深度學(xué)習(xí)的快速發(fā)展,基于數(shù)據(jù)驅(qū)動(dòng)的軸承壽命預(yù)測方法逐漸成為主流[3]。
軸承剩余使用壽命的預(yù)測包括3個(gè)步驟,即信息獲取、特征提取和建立模型預(yù)測,能否有效提取特征是準(zhǔn)確預(yù)測軸承剩余壽命的關(guān)鍵之一[4]。提取的特征常會(huì)出現(xiàn)一種不理想的狀況:特征子集中存在與預(yù)測目標(biāo)無關(guān)的特征量,此類特征對(duì)于后續(xù)模型的預(yù)測無用。針對(duì)這種狀況,可以采用特征選擇方法剔除這類特征。按照是否獨(dú)立于后續(xù)的學(xué)習(xí)算法,特征選擇方法可以分成兩類框架:過濾式(Filter)特征選擇方法和封裝式(Wrapper)特征選擇方法[5]。Filter方法與后續(xù)學(xué)習(xí)算法無關(guān),一般使用檢驗(yàn)準(zhǔn)則對(duì)特征進(jìn)行篩選,作為特征預(yù)處理步驟。特征評(píng)價(jià)是常用的Filter方法之一,納入相關(guān)性指標(biāo)進(jìn)行選擇,以此來移除那些與目標(biāo)函數(shù)不相關(guān)的特征。Wrapper方法結(jié)合后續(xù)的學(xué)習(xí)算法,尋找所有特征中能使后續(xù)學(xué)習(xí)算法達(dá)到較高性能的子集。但是對(duì)于大型或中型數(shù)據(jù)集,Wrapper方法計(jì)算復(fù)雜度是指數(shù)型的,執(zhí)行時(shí)間更長[6]。特征評(píng)價(jià)獨(dú)立于后續(xù)的學(xué)習(xí)算法,因而適合大規(guī)模數(shù)據(jù)集,可以快速移除大量不相關(guān)特征,通用性較強(qiáng)。同時(shí)特征評(píng)價(jià)可解釋性更強(qiáng),所選出的優(yōu)良特征可以為軸承設(shè)備的檢查、維修提供一定的指導(dǎo),在實(shí)際工程應(yīng)用中更具價(jià)值。
目前已有眾多學(xué)者在特征評(píng)價(jià)中將相關(guān)性作為特征的評(píng)價(jià)標(biāo)準(zhǔn)之一,在設(shè)備壽命預(yù)測上取得了不錯(cuò)的成果:谷廣宇等[7]在特征評(píng)價(jià)中納入相關(guān)性指標(biāo),選取與運(yùn)行狀態(tài)相關(guān)的特征,實(shí)現(xiàn)了對(duì)發(fā)動(dòng)機(jī)使用壽命的預(yù)測;劉勝蘭等[8]在特征評(píng)價(jià)中考慮相關(guān)性的基礎(chǔ)上,提出了一種自適應(yīng)順序的特征選取方法,并有效預(yù)測了軸承的剩余使用壽命。盡管通過特征評(píng)價(jià)選出的特征和剩余壽命的相關(guān)性比較高,但對(duì)所選特征之間的相關(guān)性高低考慮不足。一些高相關(guān)性特征會(huì)造成特征冗余,繼而影響后續(xù)模型的預(yù)測精度。通過分析不同特征之間的相關(guān)性并進(jìn)行特征聚類,可以把高度相關(guān)的特征聚在同一類中。在聚類之后,從每一個(gè)特征簇中挑選出具有高相關(guān)、代表性的子集,最終剔除冗余特征達(dá)到降低所選特征之間相關(guān)性的目的。因此提出了Corr-Kmeans聚類算法,同時(shí)為了避免Corr-Kmeans隨機(jī)初始聚類中心導(dǎo)致聚類結(jié)果不穩(wěn)定,對(duì)初始聚類中心確定方法進(jìn)行了優(yōu)化。Corr-Kmeans聚類算法和特征評(píng)價(jià)結(jié)合的方法使提取的特征和軸承剩余壽命保持高相關(guān)性同時(shí),降低特征之間的相關(guān)性。
綜上,先用卷積自編碼對(duì)頻域信息提取初始特征;然后利用Corr-Kmeans算法按照相關(guān)性將初始特征分為K個(gè)類;再基于相關(guān)性、單調(diào)性和魯棒性構(gòu)成的綜合評(píng)價(jià)指標(biāo),按照篩選閾值分別在每類中選出優(yōu)良特征,組成特征子集;最后采用LSTM網(wǎng)絡(luò)對(duì)軸承剩余壽命進(jìn)行預(yù)測。
一個(gè)良好的特征子集應(yīng)該滿足兩點(diǎn)條件[9]:① 所選特征和目標(biāo)函數(shù)之間高相關(guān);② 子集中特征之間的關(guān)聯(lián)性很低。這樣的特征子集在預(yù)測模型上會(huì)取得比較好的預(yù)測效果。對(duì)于軸承壽命預(yù)測特征提取,目前常用的特征評(píng)價(jià)方法在選取特征時(shí),只考慮了特征子集和剩余壽命之間的高相關(guān)性,卻忽略了特征之間高相關(guān)性帶來的影響,所以容易出現(xiàn)以下問題:某些特征它們之間的相關(guān)性很高,但是和剩余壽命之間相關(guān)性也很高,于是這些特征都被選入最優(yōu)特征子集中,導(dǎo)致最優(yōu)特征子集中存在大量冗余特征[10]。這些冗余特征包含的信息量相當(dāng),對(duì)于后續(xù)模型的預(yù)測效果沒有增益,甚至?xí)档皖A(yù)測性能[11],因此降低所選特之間的相關(guān)性也是很有必要的。
特征評(píng)價(jià)只考慮了前者,為了同時(shí)滿足這兩個(gè)條件,采取以下方式:依照相關(guān)性聚類可以將具有較大相關(guān)性的特征聚在一起,將初始特征聚為類間相關(guān)度低、類內(nèi)相關(guān)度高的幾個(gè)類;隨后對(duì)每類特征使用納入相關(guān)性的特征評(píng)價(jià)來進(jìn)行特征選擇,挑選出各類中的優(yōu)良特征組成特征子集。其處理過程如圖1所示。
圖1 聚類和特征評(píng)價(jià)
為了實(shí)現(xiàn)將特征按照相關(guān)性的高低進(jìn)行分類的思路,借鑒聚類方法中的Kmeans算法,用皮爾遜相關(guān)系數(shù)代替歐式距離對(duì)特征之間的相關(guān)性進(jìn)行度量,以此提出Corr-Kmeans聚類算法。將特征聚類后,結(jié)合特征評(píng)價(jià)方法,使用相關(guān)性、單調(diào)性和魯棒性3個(gè)評(píng)價(jià)指標(biāo)構(gòu)成的綜合指標(biāo)來對(duì)特征評(píng)價(jià),并按照篩選閾值分別在每類特征中篩選出優(yōu)良特征組成特征子集。提出的Corr-Kmeans算法和特征評(píng)價(jià)方法相結(jié)合的方法,綜合考慮了特征之間的相關(guān)性以及評(píng)價(jià)指標(biāo)下特征的優(yōu)良程度,旨在有效識(shí)別并移除特征集中的冗余特征,挑選出有利于后續(xù)預(yù)測的特征子集。
傳統(tǒng)的Kmeans算法使用歐式距離來度量數(shù)據(jù)間的相似性[12],將數(shù)據(jù)劃分為類內(nèi)相似度盡可能高、類間相似度盡可能低的K類。為了將特征按照相關(guān)性進(jìn)行聚類,啟發(fā)式地基于Kmeans聚類的原理,以皮爾遜相關(guān)系數(shù)取代歐氏距離,來度量特征之間的相關(guān)性,由此產(chǎn)生了Corr-Kmeans算法。Corr-Kmeans算法能將特征分為類間特征相關(guān)性低、類內(nèi)特征相關(guān)性高的K類。
Corr-Kmeans算法的輸入是需要聚類的特征和聚類數(shù)目K,具體步驟為:首先在特征中確定K個(gè)特征作為初始聚類中心(類心);然后計(jì)算其余特征與每個(gè)類心的皮爾遜相關(guān)系數(shù)絕對(duì)值,將其分配給相關(guān)系數(shù)最大的類心代表的類;隨后按照每類中的特征取平均值更新類心,重復(fù)前兩個(gè)步驟直至每類包含的特征不再變化或者達(dá)到迭代次數(shù)為止。皮爾遜相關(guān)系數(shù)絕對(duì)值計(jì)算方式如式(1),其值在[0,1]之間,越接近1表示二者相關(guān)性越高。整個(gè)算法流程具體如表1所示。
(1)
表1 Corr-Kmeans算法
式中:Cov(X,Y)表示X、Y之間的協(xié)方差;σX、σY分別表示X、Y的標(biāo)準(zhǔn)差。
Kmeans算法是一種應(yīng)用廣泛的經(jīng)典聚類算法,但其存在缺陷,即對(duì)初始聚類中心敏感。通常情況下Kmeans算法的聚類中心是隨機(jī)選取,而隨機(jī)的初始化聚類中心會(huì)導(dǎo)致聚類結(jié)果不穩(wěn)定[13],極度容易陷入局部最優(yōu)解。選擇相互距離最遠(yuǎn)的K個(gè)處于高密度區(qū)域的點(diǎn)作為初始聚類中心,能有效地降低這種敏感性[14],獲得更穩(wěn)定的聚類結(jié)果。基于此思路,在已有Corr-Kmeans算法的基礎(chǔ)上提出了一種改進(jìn)的初始中心確定方法,描述如下:
步驟1從輸入的數(shù)據(jù)中隨機(jī)選取一個(gè)點(diǎn)作為第一個(gè)聚類中心;
步驟2對(duì)于數(shù)據(jù)集中的每一個(gè)點(diǎn),計(jì)算它與相關(guān)性最高的聚類中心的皮爾遜相關(guān)性絕對(duì)值,并與1作差:D(xi)=1-|ρx,Oi|,其中Oi表示與之相關(guān)性最高的聚類中心;
步驟3選擇一個(gè)新的數(shù)據(jù)點(diǎn)作為第二個(gè)聚類中心,選擇的原則是:D(x)較大的點(diǎn),被選作聚類中心的概率較大;
步驟4重復(fù)(2)和(3)直至K個(gè)聚類中心被選出來。
軸承剩余壽命預(yù)測屬于回歸預(yù)測,軸承的退化過程本質(zhì)上是一個(gè)連續(xù)變化的隨機(jī)過程,一個(gè)優(yōu)良的軸承特征應(yīng)該滿足下列條件:
(1) 特征隨著軸承的運(yùn)作退化而發(fā)生變化,即特征和軸承的剩余使用壽命有一定的相關(guān)性;
(2) 軸承退化是一個(gè)不可逆的單調(diào)過程,因此特征的變化也應(yīng)該具有一定的單調(diào)性;
(3) 采集的軸承數(shù)據(jù)含有噪聲,所提特征應(yīng)該具有一定的抗干擾能力,即魯棒性。
本文采用文獻(xiàn)[15]提出的3個(gè)軸承特征評(píng)價(jià)指標(biāo):相關(guān)性、單調(diào)性和魯棒性,以此對(duì)特征進(jìn)行評(píng)價(jià)。首先使用平滑方法將特征分為趨勢項(xiàng)和殘差項(xiàng),如式(2)所示
X(tK)=XT(tK)+XR(tK)
(2)
式中:X(tK)表示在時(shí)刻tK的特征;XT(tK)是趨勢項(xiàng);XR(tK)是殘差項(xiàng)。
特征的相關(guān)性(Corr)、單調(diào)性(Mon)和魯棒性(Rob)分別按照式(3)~(5)計(jì)算。單獨(dú)的指標(biāo)只能片面地評(píng)價(jià)特征在某一方面的優(yōu)異性,為了綜合利用3個(gè)評(píng)價(jià)指標(biāo)選擇出最優(yōu)特征子集,將3個(gè)指標(biāo)線性加權(quán)作為最終的特征篩選依據(jù)。計(jì)算如式(6)所示。
Corr(X,T)=
(3)
(4)
(5)
Score=w1Corr(X,T)+w2Mon(X)+w3Rob(X)
(6)
式中:K是總采集時(shí)間;δ(·)是階躍函數(shù)。
在線性加權(quán)融合之后對(duì)特征綜合指標(biāo)根據(jù)Min-Max法歸一化到[0,1]之間,然后將所有特征按照綜合評(píng)價(jià)指標(biāo)的大小排序,并按照設(shè)定的閾值選取特征。
試驗(yàn)數(shù)據(jù)為滾動(dòng)軸承加速壽命臺(tái)架試驗(yàn)采集的振動(dòng)加速度數(shù)據(jù),來源于電氣和電子工程師協(xié)會(huì)(IEEE)2012年舉辦的PHM數(shù)據(jù)挑戰(zhàn)賽[16],該數(shù)據(jù)集共包含3種工況下的17個(gè)滾動(dòng)軸承的全生命周期振動(dòng)數(shù)據(jù),其中第1、2種工況各7個(gè)軸承,第3種工況3個(gè)軸承,它們分別命名為Bearing1-1~Bearing1-7,Bearing2-1~Bearing2-7和Bearing3-1~Bearing3-3。數(shù)據(jù)采樣頻率為25.6 kHz,每間隔10 s采集一次,采集時(shí)間長度為0.1 s,一次采集的振動(dòng)數(shù)據(jù)為2 560個(gè)振動(dòng)加速度,直到滿足數(shù)據(jù)說明中的振動(dòng)加速度達(dá)到設(shè)定閾值軸承失效條件就停止采集。軸承數(shù)據(jù)采集試驗(yàn)平臺(tái)如圖2所示。
圖2 軸承數(shù)據(jù)采集試驗(yàn)平臺(tái)
在進(jìn)行模型訓(xùn)練時(shí),從數(shù)據(jù)集中選取一個(gè)軸承作為測試集,其余16個(gè)軸承作為訓(xùn)練集。隨機(jī)取軸承Bearing1-3和Bearing2-4依次作為測試集,其余的16個(gè)軸承作為訓(xùn)練集訓(xùn)練模型,來驗(yàn)證所提方法的有效性。每個(gè)軸承樣本按照{(diào)(xi,yi)}的方式構(gòu)建數(shù)據(jù)集,xi為某軸承第某次采集的振動(dòng)加速度,yi為該次采集時(shí)所對(duì)應(yīng)的剩余壽命,該剩余壽命的定義為當(dāng)前時(shí)刻距離失效時(shí)刻間時(shí)長占起始時(shí)刻到失效時(shí)刻時(shí)長的比例。按照行數(shù)等于采集的次數(shù)n,列數(shù)等于采集一次的數(shù)據(jù)的長度2 560,將每個(gè)軸承數(shù)據(jù)集整理為n行,每行長度為2 560的矩陣。第i行的2 560個(gè)振動(dòng)加速度數(shù)據(jù)表示為xi,對(duì)應(yīng)的yi計(jì)算公式如下所示
(7)
式中:i代表該行的行數(shù);n代表總行數(shù)。
Bearing1-3一共采集了2 375次,每次采集2 560個(gè)振動(dòng)加速度,其壽命為23 750 s;Bearing2-4一共采集了751次,每次采集2 560個(gè)振動(dòng)加速度,其壽命為7 510秒。按照上述介紹,若樣本Bearing1-3第500次采集數(shù)據(jù),其剩余壽命為18 750 s,對(duì)應(yīng)的標(biāo)簽yi=0.789 8。這樣的標(biāo)簽劃分方式客觀上也是對(duì)預(yù)測標(biāo)簽進(jìn)行了歸一化,能夠降低預(yù)測模型的學(xué)習(xí)難度,更好地?cái)M合輸入和標(biāo)簽之間的關(guān)系。
軸承振動(dòng)信號(hào)往往是多維數(shù)據(jù)而且含有噪聲,預(yù)測模型會(huì)面臨特征維數(shù)災(zāi)難和提取特征不佳的問題??紤]到頻域信號(hào)是按照頻率大小進(jìn)行排列,相比于原始振動(dòng)信號(hào)的分布更為規(guī)律,因此對(duì)原始軸承振動(dòng)時(shí)域信號(hào)作快速傅里葉變換,轉(zhuǎn)化為頻域信號(hào)[17]。卷積自編碼網(wǎng)絡(luò)作為常用的無監(jiān)督學(xué)習(xí)方法,具有強(qiáng)大的特征自提取能力,利用卷積自編碼來提取初始特征,其網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 卷積自編碼網(wǎng)絡(luò)結(jié)構(gòu)
其中,卷積自編碼的輸入是1 280×1的頻域信號(hào),編碼器包括三層卷積層,卷積核的數(shù)目分別為8、16和32,卷積核的大小分別為11×1、9×1和9×1,卷積的步幅為(8,1)、(4,1)和(4,1)。解碼器包括三層反卷積層,其中卷積核的數(shù)目分別為32、8和1,卷積核的大小分別為9×1、9×1和11×1,卷積的步幅為(4,1)、(4,1)和(8,1),與解碼過程相對(duì)應(yīng)。模型訓(xùn)練時(shí),訓(xùn)練步數(shù)為20 000,并使用衰減學(xué)習(xí)率保證前期訓(xùn)練速度的同時(shí)防止后期難以收斂。
將卷積自編碼提取的320維特征作為初始特征,使用Corr-Kmeans算法對(duì)初始特征按照特征之間的相關(guān)性聚類,截止迭代次數(shù)為150次。本文以K=3為例進(jìn)行試驗(yàn),按照相關(guān)性把初始特征劃分為3個(gè)類,其中ntrain表示訓(xùn)練集的樣本總數(shù)。示意圖如圖4所示。
圖4 Corr-Kmeans聚類
對(duì)每類特征進(jìn)行特征評(píng)價(jià)時(shí),為了保證所選特征和標(biāo)簽之間的高相關(guān)性,給予相關(guān)性較大的權(quán)重,剩下的權(quán)重兩個(gè)評(píng)價(jià)指標(biāo)平均分配,因此3個(gè)評(píng)價(jià)指標(biāo)的權(quán)重設(shè)定為[18]:w1=0.6,w2=0.2,w3=0.2。計(jì)算出綜合得分后,將每類中所有特征得分歸一化到[0,1]之間。由于綜合得分是線性的,和每個(gè)指標(biāo)正相關(guān),所以綜合得分越大,表明此特征對(duì)軸承剩余壽命預(yù)測越有效,應(yīng)該保留。按照閾值為0.5的標(biāo)準(zhǔn),挑選出大于閾值的特征組成特征子集。需要注意的是,在聚類和特征評(píng)價(jià)兩個(gè)階段,應(yīng)當(dāng)保留所選優(yōu)良特征子集包含的特征在初始特征中所對(duì)應(yīng)的列序號(hào),作為測試集選擇特征子集的準(zhǔn)則。
LSTM單元為三層LSTM加一層全連接。三層LSTM隱藏神經(jīng)元數(shù)目分別設(shè)置為:170,40,10,步長選擇為5。全連接層的神經(jīng)元數(shù)量為1,激活函數(shù)采用relu函數(shù)。模型訓(xùn)練時(shí),采用的優(yōu)化器為adam,訓(xùn)練步數(shù)為11 000,初始學(xué)習(xí)率為0.005,并且采用衰減學(xué)習(xí)率的方式,學(xué)習(xí)率衰減因子設(shè)置為0.95。最后采用加權(quán)平均的方法對(duì)預(yù)測結(jié)果進(jìn)行平滑處理。
整個(gè)軸承壽命預(yù)測流程圖如圖5所示。
圖5 總流程圖
為了有效避免Corr-Kmeans聚類算法隨機(jī)選取初始中心導(dǎo)致聚類結(jié)果不穩(wěn)定的問題,本文設(shè)計(jì)了一種新的初始聚類中心選擇算法。為了證明其有效性,按照文獻(xiàn)[19]計(jì)算方法計(jì)算聚類結(jié)果不穩(wěn)定性,計(jì)算結(jié)果用lnstab值表示,其值越低表示該算法聚類結(jié)果越穩(wěn)定,計(jì)算方法如式(8)和(9)所示。對(duì)兩組訓(xùn)練集以本文方法和隨機(jī)確定初始聚類中心方法分別聚類20次,兩種方法的lnstab值計(jì)算結(jié)果如表2所示。
(8)
(9)
表2 聚類結(jié)果穩(wěn)定性
式中:b表示聚類次數(shù),b=20;Ci表示第i次聚類結(jié)果;d(Ci,Cj)表示兩個(gè)聚類結(jié)果之間的距離;n表示樣本數(shù)目,n=320;Ci(Xk)表示Ci聚類結(jié)果中樣本Xk所對(duì)應(yīng)的標(biāo)簽。
從表2可以看出,在兩個(gè)測試軸承上,本文所提的聚類中心初始算法的lnstab值均比隨機(jī)初始化聚類中心的lnstab值低,說明了本文所提方法能夠獲得更加穩(wěn)定的聚類效果。
卷積自編碼提取特征后,得到320維初始特征。經(jīng)過Corr-Kmeans算法按照相關(guān)性劃分成3類,對(duì)每類特征進(jìn)行特征評(píng)價(jià),挑選出優(yōu)良特征組成組成最終的特征子集。特征評(píng)價(jià)挑選出的3類優(yōu)良特征為A、B和C。為了驗(yàn)證Corr-Kmeans算法按照相關(guān)性聚類的有效性,計(jì)算類內(nèi)每維特征與其他特征的皮爾遜相關(guān)系數(shù)絕對(duì)值,得到相關(guān)系數(shù)三角矩陣[20],如式(10)所示,并取矩陣中的平均值作為類內(nèi)特征相關(guān)性系數(shù);依次計(jì)算某類特征中的每維特征跟另一類特征中的每維特征的皮爾遜相關(guān)系數(shù)絕對(duì)值,得到相關(guān)性系數(shù)矩陣,取矩陣的平均值作為類間特征相關(guān)性系數(shù)。以Bearing1-3和Bearing2-4測試時(shí),得到各自的類內(nèi)特征相關(guān)性系數(shù)和類間特征相關(guān)性系數(shù),如表3所示。
(10)
式中:n代表此類中的特征數(shù)量;|ρ12|是此類中的第一維特征跟第二維特征之間的皮爾遜相關(guān)性系數(shù)絕對(duì)值,以此類推。
表3中A表示A類的類內(nèi)特征相關(guān)性系數(shù),A-B表示A類和B類的類間特征相關(guān)性系數(shù),以此類推。從表3中可以看出,類間特征相關(guān)性系數(shù)均低于相對(duì)應(yīng)的類內(nèi)特征相關(guān)性系數(shù),表明Corr-Kmeans算法在將特征按照相關(guān)性劃分是有效的,能將特征劃分為類內(nèi)相關(guān)性高、類間相關(guān)性低的3個(gè)類。Corr-Kmeans算法結(jié)合特征評(píng)價(jià),目的在于使所選特征子集和時(shí)間序列保持高相關(guān)的同時(shí),降低特征子集內(nèi)部之間的相關(guān)性。為了進(jìn)一步驗(yàn)證其在降低特征子集內(nèi)部之間的相關(guān)性上的有效性,與初始特征只經(jīng)過特征評(píng)價(jià)的方法作對(duì)比。在Bearing1-3和Bearing2-4上,分別計(jì)算最終特征子集的類內(nèi)特征相關(guān)性系數(shù),得到的結(jié)果如表4所示。
表3 類內(nèi)和類間特征相關(guān)性系數(shù)
表4 特征子集相關(guān)性系數(shù)
從表4中可以得知,Corr-Kmeans算法在一定程度上能夠降低最終所選特征子集的相關(guān)性,表明此方法是可行的。
本文對(duì)于初始特征的進(jìn)一步篩選主要由Corr-Kmeans算法和特征評(píng)價(jià)兩部分組成。為了驗(yàn)證該方法相比特征評(píng)價(jià)的優(yōu)勢性,將其與初始特征只經(jīng)過特征評(píng)價(jià)的方法對(duì)比,同時(shí)與主流的基于相關(guān)性評(píng)價(jià)方法進(jìn)行比較[21];為了驗(yàn)證Corr-Kmeans算法改進(jìn)的有效性,也設(shè)置了一組傳統(tǒng)Kmeans結(jié)合特征評(píng)價(jià)的對(duì)比試驗(yàn);最后設(shè)置了一組僅用初始特征做預(yù)測的對(duì)比試驗(yàn),用于驗(yàn)證整個(gè)特征篩選環(huán)節(jié)的優(yōu)勢性。預(yù)測模型均采用同一參數(shù)的LSTM網(wǎng)絡(luò)。
以軸承Bearing1-3和Bearing2-4依次作為測試集進(jìn)行試驗(yàn),采用上述5種方法提取的特征分別對(duì)軸承進(jìn)行剩余壽命預(yù)測。Bearing1-3的預(yù)測結(jié)果如表5所示,Bearing2-4的預(yù)測結(jié)果如表6所示。圖中橫坐標(biāo)表示數(shù)據(jù)序號(hào),實(shí)則代表的是使用時(shí)間,縱坐標(biāo)為當(dāng)前時(shí)間點(diǎn)對(duì)應(yīng)的剩余壽命占總壽命的百分比,實(shí)線為預(yù)測的壽命值,虛線為實(shí)際的壽命值。
從表5和表6中可以看出,無論對(duì)于測試集Bearing1-3還是Bearing2-4,對(duì)初始特征使用了特征評(píng)價(jià)后,預(yù)測效果在整體上都有一定的提升,在軸承的壽命晚期表現(xiàn)得更加明顯,單一的相關(guān)性評(píng)價(jià)方法反而使得預(yù)測精度不佳。在特征評(píng)價(jià)的基礎(chǔ)上,配合Corr-Kmeans聚類算法,預(yù)測效果又有了進(jìn)一步的提升,在軸承的壽命晚期預(yù)測值也向真實(shí)值貼緊得更密切,可以證明Corr-Kmeans算法結(jié)合特征評(píng)價(jià)相比單一的特征評(píng)價(jià)是有優(yōu)勢的。同時(shí)傳統(tǒng)的Kmeans結(jié)合特征評(píng)價(jià)并沒有顯著的提升,由此證明了Corr-Kmeans的有效性。整個(gè)現(xiàn)象說明Corr-Kmeans算法結(jié)合特征評(píng)價(jià)的方法是有效的,對(duì)于軸承剩余壽命預(yù)測精度有提升。為了更加精確地描述種方法的預(yù)測結(jié)果,按照式(11)和(12)對(duì)兩種方法預(yù)測結(jié)果的平均誤差emean和最大誤差emax進(jìn)行了計(jì)算,計(jì)算結(jié)果如表7所示。
表6 Bearing2-4不同方法的預(yù)測結(jié)果對(duì)比
(13)
通過對(duì)表7的分析,按照式(13)計(jì)算誤差相對(duì)下降百分比。對(duì)于Bearing1-3,本文方法相比于其余4種方法預(yù)測精度的平均誤差分別降低了53.2%、78.6%、44.1%和46.9%,最大誤差分別降低了46.7%、77.8%、33.5%和43.7%;對(duì)于Bearing2-4,平均誤差分別降低了65.5%、78.6%、31.9%和46.4%,最大誤差分別降低了31.1%、39.2%、1.8%和3.1%。
表7 不同方法的預(yù)測誤差
上述結(jié)果表明,本文方法預(yù)測精度優(yōu)于單一特征評(píng)價(jià)方法,同時(shí)誤差是5種方法中最低的,證明了本文所提方法提取的特征更有利于軸承的剩余壽命預(yù)測,有更好的預(yù)測效果。
上述5種方法所需的訓(xùn)練時(shí)長與預(yù)測時(shí)長如表8所示。其中訓(xùn)練時(shí)長包括數(shù)據(jù)的讀取與預(yù)處理,以及模型訓(xùn)練;預(yù)測時(shí)長指的是加載預(yù)訓(xùn)練模型對(duì)某一時(shí)刻采集的信號(hào)進(jìn)行軸承剩余壽命預(yù)測。
表8 訓(xùn)練時(shí)長與預(yù)測時(shí)長
由于Corr-Kmeans聚類算法用皮爾遜相關(guān)系數(shù)來度量兩個(gè)樣本之間的相關(guān)性,計(jì)算量較大,所以在數(shù)據(jù)預(yù)處理階段所耗時(shí)間長于其他4種方法,但后續(xù)的模型訓(xùn)練與預(yù)測時(shí)間是基本相同的。盡管本文方法前期的數(shù)據(jù)預(yù)處理花費(fèi)時(shí)間較長,而在線預(yù)測時(shí)間還是遠(yuǎn)小于信號(hào)獲取過程中的時(shí)間間隔的,因此較長的離線訓(xùn)練并不會(huì)影響模型的實(shí)時(shí)性。同時(shí)在實(shí)際應(yīng)用中,往往更加注重模型的預(yù)測時(shí)間與預(yù)測精度,因此還是具有一定的優(yōu)勢性的。
為了更全面地驗(yàn)證該方法的有效性和適用性,采用留一法進(jìn)行預(yù)測試驗(yàn)。留一法即每次只采用一個(gè)軸承作為測試集,其余軸承作為訓(xùn)練集,模型訓(xùn)練完畢后,利用測試集進(jìn)行測試。3種方法的平均誤差emean和最大誤差emax如表9所示。
表9 留一法試驗(yàn)結(jié)果
表10 綜合試驗(yàn)誤差統(tǒng)計(jì)
進(jìn)一步分析表10的結(jié)果,可以看出本文方法的預(yù)測精度是優(yōu)于單一特征評(píng)價(jià)方法的,相比其余幾種方法,綜合平均誤差和綜合最大誤差也都是最低的,說明本方法是有效的。
為了進(jìn)一步探究不同的Corr-Kmeans聚類數(shù)目K對(duì)預(yù)測精度的影響,分別進(jìn)行了K值為2,4和5時(shí)的試驗(yàn),綜合誤差結(jié)果如表11所示。
表11 不同K值綜合誤差統(tǒng)計(jì)
分析表11和表10中的結(jié)果,可見K=3或者K=4時(shí),其預(yù)測效果是優(yōu)于其他幾種方法的,綜合誤差和平均誤差均低于所對(duì)比的方法。
在預(yù)測軸承剩余壽命時(shí),針對(duì)單一的特征評(píng)價(jià)方法在對(duì)軸承特征進(jìn)行選擇時(shí),僅考慮了所選特征與時(shí)間序列的高相關(guān)性,對(duì)特征之間高相關(guān)性的考慮不足的問題,提出了一種基于特征聚類和評(píng)價(jià)的軸承壽命預(yù)測新方法,并得到了以下結(jié)論:
(1) 提出了一種Corr-Kmeans聚類算法,該算法能夠?qū)⑻卣靼凑障嚓P(guān)性進(jìn)行聚類;提出了一種改進(jìn)的Corr-Kmeans初始聚類中心確定方法,相比于隨機(jī)初始聚類中心,聚類結(jié)果更加穩(wěn)定。
(2) Corr-Kmeans聚類算法和特征評(píng)價(jià)相結(jié)合的方法,能使特征與時(shí)間序列保持高相關(guān)性的同時(shí),降低特征之間的相關(guān)性,最終所選的特征子集更有利于軸承剩余壽命預(yù)測。
(3) 該方法相比單一的特征評(píng)價(jià)方法和用初始特征直接預(yù)測等方法精度均有一定的提升,同時(shí)在不同的工況下也表現(xiàn)出了較好的適用性。