高 謙 肖 維
(1.河海大學(xué) 南京 210000)(2.深圳大學(xué) 深圳 518000)
液壓缸的復(fù)雜工況導(dǎo)致其具有故障多發(fā)、壽命短暫的特點(diǎn),工程作業(yè)中液壓缸的失效將導(dǎo)致工程事故或停產(chǎn),進(jìn)而造成一定的經(jīng)濟(jì)損失[1]。因此,建立可靠的壽命預(yù)測系統(tǒng)對液壓缸的壽命進(jìn)行精確預(yù)測以提前更換即將失效的液壓缸可有效地避免這些問題。由于系統(tǒng)需采集液壓缸整個(gè)生命周期的數(shù)據(jù),且各監(jiān)測點(diǎn)的采樣頻率較高,因此系統(tǒng)采集到的數(shù)據(jù)規(guī)模很大,致使液壓缸的壽命預(yù)測需要用大數(shù)據(jù)的方法解決[2]。
深度學(xué)習(xí)是大數(shù)據(jù)分析技術(shù)中的杰出代表,但是在液壓設(shè)備壽命預(yù)測領(lǐng)域中應(yīng)用較少[3]。因此,本文提出了基于深度學(xué)習(xí)的液壓缸壽命預(yù)測方法。該方法相比傳統(tǒng)的機(jī)器學(xué)習(xí)方法,其優(yōu)勢在于:通過建立深度學(xué)習(xí)模型,擺脫了對大規(guī)模數(shù)據(jù)處理技術(shù)和行業(yè)專家知識的依賴,直接從大量數(shù)據(jù)中自適應(yīng)地進(jìn)行特征提取與特征選擇,實(shí)現(xiàn)更具魯棒性與泛化能力的液壓缸壽命預(yù)測方法[4]。
深度學(xué)習(xí)區(qū)別于傳統(tǒng)的模式識別方法在于它能夠從大規(guī)模數(shù)據(jù)中自適地進(jìn)行特征提取與特征選擇,而非采用人工方法[5]。特征提取與特征選擇都是通過改變數(shù)據(jù)分布的方法從原始特征中尋求最有效的特征,以提高模式識別系統(tǒng)的性能。而特征提取與特征選擇的區(qū)別在于:特征提取的方法通過改變屬性間的關(guān)系來改變數(shù)據(jù)分布,原有的特征空間發(fā)生了變化;特征選擇的方法則是從原始特征集中選擇出最有效的特征子集,原有的特征空間沒有發(fā)生變化[7]。
在液壓缸壽命預(yù)測領(lǐng)域,BP 神經(jīng)網(wǎng)絡(luò)模型應(yīng)用最為廣泛。其單隱層的淺層結(jié)構(gòu)限制了分類器的特征提取與特征選擇的能力,而采用具有多隱層的深度結(jié)構(gòu)會導(dǎo)致訓(xùn)練出的分類器易陷入局部最優(yōu)。深度學(xué)習(xí)將底層特征進(jìn)行組合并構(gòu)成更加抽象的高層表示,以挖掘出更加有效的特征表示,使得深層網(wǎng)絡(luò)的訓(xùn)練問題有了很大的改善。深度學(xué)習(xí)用于液壓缸壽命預(yù)測的方法:先以非監(jiān)督學(xué)習(xí)算法對網(wǎng)絡(luò)模型進(jìn)行預(yù)訓(xùn)練,以獲得更加有效的信號特征表示。然后利用監(jiān)督學(xué)習(xí)算法對信號特征進(jìn)行分類,使得網(wǎng)絡(luò)結(jié)構(gòu)具有預(yù)測能力[8]。本文使用DAE 算法作為預(yù)訓(xùn)練階段的非監(jiān)督算法,并將Adaboost算法作為分類階段的監(jiān)督算法。
DAE(Denoising autoencoder)算法模型又被稱為降噪自動(dòng)編碼機(jī),該模型通過在訓(xùn)練數(shù)據(jù)中加入隨機(jī)噪聲來訓(xùn)練神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)可以習(xí)得無噪聲的輸入特征以及噪聲的主要特征[9]。該方法能夠使神經(jīng)網(wǎng)絡(luò)在測試數(shù)據(jù)中表現(xiàn)出更強(qiáng)的泛化性,使得神經(jīng)網(wǎng)絡(luò)具有去噪以獲取無噪聲數(shù)據(jù)的能力。因此,本文選擇DAE 作為特征提取算法的目的在于提高模式識別系統(tǒng)對噪聲的魯棒性。
DAE 算法的結(jié)構(gòu)如圖1 所示,其訓(xùn)練過程:加噪網(wǎng)絡(luò)通過噪聲函數(shù)fθ向輸入樣本XR中加入隨機(jī)噪聲,獲得含噪樣本:
tf為加噪網(wǎng)絡(luò)的激活函數(shù);θ為加噪網(wǎng)絡(luò)的參數(shù)集,且θ={W,b};R為樣本的特征維度。然后編碼網(wǎng)絡(luò)通過編碼函數(shù)hφ對含噪樣本進(jìn)行編碼,獲得編碼樣本:
sh為編碼網(wǎng)絡(luò)的激活函數(shù);φ為編碼網(wǎng)絡(luò)的參數(shù)集,且φ={V,d};R'為編碼樣本的維度,此過程中,樣本維度發(fā)生了改變。然后解碼網(wǎng)絡(luò)通過解碼函數(shù)對編碼樣本進(jìn)行解碼重構(gòu),獲得解碼樣本:
為解碼網(wǎng)絡(luò)的激活函數(shù),φ'為解碼網(wǎng)絡(luò)的參數(shù)集,且φ'={V',d'} ;經(jīng)過解碼重構(gòu),解碼樣本的維度與輸入樣本XR的維度一致。最后,網(wǎng)絡(luò)將根據(jù)輸入樣本XR與解碼樣本X^R計(jì)算出重構(gòu)誤差
圖1 DAE算法模型結(jié)構(gòu)
Adaboost 算法的思想是合并多個(gè)弱分類器的輸出構(gòu)成強(qiáng)分類器以獲得更加有效的分類,本文選擇BP 神經(jīng)網(wǎng)絡(luò)模型作為弱分類器,經(jīng)Adaboost 算法合并構(gòu)成BP-Adaboost 強(qiáng)分類器作為深度網(wǎng)絡(luò)分類階段特征選擇的監(jiān)督算法[10],其結(jié)構(gòu)如圖2 所示。
該方法需按規(guī)則將訓(xùn)練數(shù)據(jù)進(jìn)行分組,并將各組數(shù)據(jù)輸入多個(gè)弱分類器進(jìn)行迭代運(yùn)算,對于分類失敗的樣本個(gè)體賦予較大的權(quán)值,下一次迭代運(yùn)算時(shí)將著重關(guān)注。強(qiáng)分類器則采用加權(quán)多數(shù)表決的方法合并弱分類器,分類結(jié)果越好的弱分類器,其對應(yīng)的權(quán)重越大[11]。該算法的訓(xùn)練過程如下。
1)給出特征維度為R 的樣本空間(XR,Y),從中搜索出 2R-1 個(gè)可能的非空特征子集{Xt} =(X1,t,X2,t,…,Xs,t),并將 (Xt,Y)作為各弱分類器的訓(xùn)練數(shù)據(jù)集,其滿足:
t為各訓(xùn)練數(shù)據(jù)集和對應(yīng)弱分類器的序列,且t=1,2,…,2R-1;s 為樣本空間中的樣本個(gè)數(shù),均布各訓(xùn)練數(shù)據(jù)集的初始權(quán)值:
然后根據(jù)特征子集的維度確定各BP神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)以及迭代次數(shù)N。
2)使用權(quán)值為Dn,t的訓(xùn)練數(shù)據(jù)集進(jìn)行學(xué)習(xí),得到弱分類器Gn(X),n為迭代序列,且n=1,2,…,N。
3)計(jì)算Gn(X)的在訓(xùn)練數(shù)據(jù)集上的分類誤差:
4)計(jì)算Gn(X )在強(qiáng)分類器中的權(quán)值:
5)計(jì)算下一輪迭代運(yùn)算的權(quán)值:
Bn為權(quán)值系數(shù),可使權(quán)值的比例與總和保持不變;Xi,t∈{Xt} ,且i=1,2,…,s。
6)將弱分類器函數(shù)進(jìn)行加權(quán)合并獲得強(qiáng)分類器函數(shù):
有效的特征數(shù)據(jù)所訓(xùn)練出的弱分類器分類效果較好,在強(qiáng)分類器加權(quán)合并時(shí)將獲得較大的權(quán)值,以此達(dá)到特征選擇的目的[12]。而攜帶噪聲的樣本在弱分類器迭代運(yùn)算時(shí)將會表現(xiàn)出較差的分類效果,并會被賦予較大的權(quán)值,進(jìn)而對分類器的性能產(chǎn)生不良影響[13]。因此,利用DAE 算法對數(shù)據(jù)進(jìn)行去噪聲預(yù)處理,可有效解決這一問題。
圖2 強(qiáng)分類器結(jié)構(gòu)
提出方法將多個(gè)DAE 模型逐層堆疊作為深度網(wǎng)絡(luò)預(yù)訓(xùn)練階段的無監(jiān)督算法[14],并將訓(xùn)練結(jié)果輸入BP-Adaboost 強(qiáng)分類器,作為分類階段的監(jiān)督訓(xùn)練數(shù)據(jù),深度網(wǎng)絡(luò)的結(jié)構(gòu)如圖3所示。
本文以液壓缸的壽命預(yù)測方法為研究對象,所以應(yīng)采集液壓缸整個(gè)生命周期的數(shù)據(jù)用來訓(xùn)練深度網(wǎng)絡(luò)[14]。通過對液壓缸壽命影響因素及表現(xiàn)形式進(jìn)行分析,提出將安裝在液壓缸上的傳感器所監(jiān)測到的數(shù)據(jù)作為深度網(wǎng)絡(luò)的輸入變量,其形式可以表示為X={x1,x2,x3,x4,x5} 各元素含義如表 1 所示;將液壓缸的生命周期按時(shí)間降序分級作為深度網(wǎng)絡(luò)的輸出變量,表示為Y={y1,y2,y3,y4,y5,y6} ,各元素含義如表2所示。
圖3 深度網(wǎng)絡(luò)的結(jié)構(gòu)
表1 深度網(wǎng)絡(luò)輸入變量
表2 深度網(wǎng)絡(luò)輸出變量
本次實(shí)驗(yàn)從客戶端的液壓缸采集了2000 組均布在整個(gè)生命周期內(nèi)的數(shù)據(jù),隨機(jī)選取其中的1600 組對深度網(wǎng)絡(luò)進(jìn)行訓(xùn)練,利用剩余數(shù)據(jù)對學(xué)習(xí)器進(jìn)行測試。
為了驗(yàn)證提出方法的特征提取性能,利用主成分分析法提取數(shù)據(jù)特征的前三個(gè)主成分[14],分析結(jié)果如圖4 所示。圖4(a)為提出方法特征提取的主成分散點(diǎn)圖,可以看出液壓缸的同一壽命等級散點(diǎn)很好地聚集在一起,不同的壽命等級散點(diǎn)被有效的分離,可知提出方法的特征提取效果顯著。圖4(b)為多隱層BP 神經(jīng)網(wǎng)絡(luò)模型特征提取的主成分散點(diǎn)圖,可觀察到,部分同一壽命等級的散點(diǎn)聚集較好,但是與不同壽命等級散點(diǎn)之間存在交叉,因此多隱層BP 神經(jīng)網(wǎng)絡(luò)的特征提取性能存在不足。圖4(c)為單隱層BP神經(jīng)網(wǎng)絡(luò)模型特征提取的主成分散點(diǎn)圖,可以看出不同壽命等級的散點(diǎn)相互交叉,分布的規(guī)律性較差,因而單隱層BP神經(jīng)網(wǎng)絡(luò)模型特征提取性能最差。
上述分析表明,DAE算法可根據(jù)傳感器信號自適應(yīng)地提取有效的特征,而BP 神經(jīng)網(wǎng)絡(luò)由于其結(jié)構(gòu)的限制,特征提取性能較差[15]。
圖4 主成分分析散點(diǎn)圖
為了驗(yàn)證提出方法的特征選擇性能,在Matlab環(huán)境下對BP-Adaboost 強(qiáng)分類器與BP 弱分類器進(jìn)行仿真實(shí)驗(yàn),并對比兩者的測試結(jié)果,測試結(jié)果如圖5 所示。橫坐標(biāo)為測試樣本的編號;縱坐標(biāo)為分類器預(yù)測誤差的絕對值,分類器的預(yù)測值為液壓缸的壽命值,范圍為[0 , 100 ];星形標(biāo)識代表強(qiáng)分類器的預(yù)測結(jié)果;圓形標(biāo)識表示弱分類器的預(yù)測結(jié)果。從圖中可以看出,對于絕大部分的測試樣本,強(qiáng)分類器的預(yù)測誤差遠(yuǎn)小于弱分類器的預(yù)測誤差。且強(qiáng)分類器的預(yù)測誤差值大都小于5,可得強(qiáng)分類器的預(yù)測精度可到達(dá)95%,該精度可滿足實(shí)際工程應(yīng)用的要求。因此,提出方法的特征選擇性能可靠。
圖5 分類器測試結(jié)果
論文簡述了深度學(xué)習(xí)理論的特點(diǎn),指出傳統(tǒng)機(jī)器學(xué)習(xí)在液壓缸壽命預(yù)測方面的不足。并提出基于特征提取與特征選擇的深度學(xué)習(xí)方法,該方法改善了傳統(tǒng)機(jī)器學(xué)習(xí)算法在處理深層網(wǎng)絡(luò)時(shí)的不足,可以更準(zhǔn)確地對液壓缸的壽命狀況進(jìn)行預(yù)測。