楊偉新,王 平,,李舜酩
(1.中國航發(fā)湖南動(dòng)力機(jī)械研究所,湖南 株洲 412002; 2.南京航空航天大學(xué),南京 21000)
齒輪箱滾動(dòng)軸承故障信號的譜峭度、信息熵[1-2]等故障特征是機(jī)械系統(tǒng)狀態(tài)的重要特征信息,該特征信息對系統(tǒng)狀態(tài)變化規(guī)律反應(yīng)敏感,可通過將這些特征量作為最小二乘支持向量機(jī)[3](Least Squares Support Vector Machine,LSSVM)分類器的輸入來實(shí)現(xiàn)齒輪箱滾動(dòng)軸承故障的識別。然而當(dāng)齒輪箱滾動(dòng)軸承發(fā)生故障時(shí),因受到剛度非線性、間隙和外部載荷等因素的影響,振動(dòng)信號常表現(xiàn)為非平穩(wěn)、非線性的特征,另外,軸承故障信號往往被齒輪箱內(nèi)部結(jié)構(gòu)其他部件和環(huán)境激發(fā)的振動(dòng)噪聲信號所污染,會(huì)導(dǎo)致軸承故障特征向量間存在嚴(yán)重的相關(guān)性,這些問題都會(huì)影響LSSVM分類的準(zhǔn)確性,使得識別軸承故障的難度加大。LSSVM分類器需要獲得更高的分類性能就必須先消除輸入向量間的相關(guān)性,核獨(dú)立分量分析(Kernel Independent Component Analysis,KICA)是非線性特征抽取工具,其分離過程不受信噪比的影響,其關(guān)鍵是利用非線性核函數(shù)將原始特征空間映射到核特征空間[4],通過去掉不同故障特征間的冗余,從而消除特征向量間的相關(guān)性。廣義辨別分析(Generalized Discriminant Analysis,GDA)方法,可有效地將各故障特征進(jìn)行了非線性融合[5],融合后的特征向量將包含有更多的故障類別信息。本文通過齒輪箱滾動(dòng)軸承故障診斷實(shí)例,說明了KICA-GDA和LSSVM的故障診斷方法的有效性。
核獨(dú)立分量分析(KICA)是一種非線性特征抽取方法[6],是通過利用非線性核函數(shù)將原始特征空間映射到再生核希爾伯特空間(Reproducing Kernel Hilbert Space,RKHS)中,并在RKHS空間利用典型相關(guān)分析(Kernel Canonical Correlation Analysis,KCCA)算法得到原始特征向量的最大相關(guān)系數(shù)。
文獻(xiàn)[6]中指出,假設(shè)輸入空間的樣本xk∈RN,k=1,2,…,l被某各非線性映射Φ到某一特征空間H,得到Φ(x1),Φ(x2),…,Φ(xl),那么輸入空間的點(diǎn)積形式在特征空間就可以用Mercer核表示為K(xi,xj)=(Φ(xi)·Φ(xj)),一般常見的Mercer核函數(shù)包括:
1)多項(xiàng)式核
2)高斯核
設(shè)有輸入特征向量集X={x1,x2,…,xn}且x∈Rn,定義x1和x2為特征向量集中兩隨機(jī)變量。首先通過非線性核函數(shù)K(·,x)映射到RKHS空間形成的映射向量Φ={φ(x1),φ(x2),…,φ(xn)),且 有Φ(x)=K(·,x),設(shè)F為映射的核函數(shù)空間,其中核函數(shù)采用多項(xiàng)式核函數(shù),然后利用KCCA方法計(jì)算隨機(jī)變量f1(x1)和f2(x2)之間的最大相關(guān)系數(shù)ρF,相關(guān)系數(shù)可表示為
利用再生核希爾伯特空間的重構(gòu)特性來計(jì)算ρF,可得
則有
設(shè)隨機(jī)變量x1和x2的N個(gè)觀測值組成的向量分別為xk1和xk2,兩都在空間F的映射向量為Φ(xk1)和Φ(),k=1,2,…N,若映射到空間的數(shù)據(jù)已進(jìn)行過中心化,則Bach在文獻(xiàn)[6]中提出
因此,求解上式可等價(jià)于求解下式的特征值。
式中:K1和K2是基于觀察數(shù)據(jù)x1和x2的Gram矩陣。式(5)可以推廣到多個(gè)變量的情況
廣義辨別分析GDA[7]的核心是通過一種非線性核映射函數(shù),將低維輸入空間中的線性不可分特征映射到一個(gè)高維的特征空間H,然后運(yùn)用線性Fisher判別準(zhǔn)則求解出此高維空間最優(yōu)映射方向α。設(shè)有特征樣本X={x1,x2,…xn}且x∈Rn,樣本類別數(shù)量為C。第i類樣本子集為Xi,樣本數(shù)量為ni,第i類樣本的均值。經(jīng)非線性映射函數(shù)Φ映射后的樣本向量Φ(x)∈H(即高維空間),在H空間樣本的類內(nèi)離散矩陣SΦW、類間離散矩陣SΦB為
高維空間H中的Fisher判別準(zhǔn)則為
式中:ω∈H為特征核映射后的特征向量;ωopt是通過求解的特征值并按從大到小排序獲得的前r個(gè)主要特征向量,從而實(shí)現(xiàn)降維,并且ω滿足=0,j=1,…,r,也一定位于H空間中所有訓(xùn)練樣本Φ(x)張成的空間內(nèi);J(ωopt)表示ωopt所對應(yīng)的適應(yīng)度值。根據(jù)再生核理論,解得
式中:α為H空間中ω的最佳核判別方向。將式(9)與式(10)聯(lián)合可得
式中:Kb、KW是依據(jù)核距離μi計(jì)算出來的數(shù)值,無量綱。μi定義為
H空間中的正交約束條件式等價(jià)于
因而可以推導(dǎo)得
式中:K(xi,x)為核函數(shù)。由式(14)可知樣本特征向量x映射到H空間的非線性映射過程的全部運(yùn)算,實(shí)際上是由核函數(shù)來代替完成的,本文GDA采用核函數(shù)為多項(xiàng)式核函數(shù),多項(xiàng)式核函數(shù)代數(shù)式見式(2)。
支持向量機(jī)(Square Support Vector Machine,SVM)能夠解決小樣本、非線性和高維數(shù)等實(shí)際問題,并成功應(yīng)用于旋轉(zhuǎn)機(jī)械的故障分類[8-9]。最小二乘支持向量機(jī)LSSVM算法[3]對SVM算法進(jìn)行了一些優(yōu)化,LSSVM利用等式約束條件代替SVM的不等式約束條件,優(yōu)化了Lagrange乘子αi求解;另外,LSSVM算法將求解二次規(guī)劃問題轉(zhuǎn)化為求解線性方程組,降低了計(jì)算的復(fù)雜度并提高了程序的運(yùn)算速度。
對于樣本數(shù)據(jù)(xi,yj),(i=1,…,n),其中xi為輸入,yj為輸出。LSSVM可描述為求解如下優(yōu)化問題
式中:J為目標(biāo)函數(shù);w為權(quán)向量;b為偏置;ξ為松弛變量;f為平衡分類誤差和算法復(fù)雜度的懲罰因子,非線性變換函數(shù)φ(x)可將樣本x從原空間的非線性問題變換為高維特征空間的線性問題。
該優(yōu)化問題對應(yīng)的Lagrange方程為
根據(jù)優(yōu)化條件
消去w和ξ可化為解以下線性方程組
式中:l=[1,1,…,1]T1×n,I為單位矩陣。通過解方程組(18)可得到LSSVM分類決策函數(shù)
基于KICA-GDA與LSSVM的齒輪箱滾動(dòng)軸承故障診斷方法流程如圖1所示。
圖1 KICA-GDA與LSSVM故障診斷方法流程圖
診斷步驟如下:
1)分別測取傳動(dòng)齒輪箱滾動(dòng)軸承在不同運(yùn)行狀態(tài)下(外圈故障、內(nèi)圈故障及保持架故障)的振動(dòng)信號;
2)選擇合適的時(shí)間間隔,分別將3種故障狀態(tài)下的振動(dòng)數(shù)據(jù)分成若干段,對每段數(shù)據(jù)先進(jìn)行歸一化處理,然后并計(jì)算每段數(shù)據(jù)的譜峭度K={K1,K2,…,Kk}、信息熵H={H1,H2,…,Hk}、功率譜密度指數(shù)FC={FC1,FC2,…,FCk}等10種特征值(特征值選取見表1)作為原始特征向量,其中,將表1中的第一行特征值作為第一特征,第二行特征值作為第二特征;對原始特征向量間的相關(guān)性進(jìn)行分析,并將其直接作為LSSVM分類器的輸入,得到故障分類準(zhǔn)確率;
3)利用KICA-GDA方法對原始特征向量進(jìn)行處理,并對處理后特征向量間的相關(guān)性進(jìn)行分析;
4)將經(jīng)KICA-GDA方法處理后的特征向量作為LSSVM分類器的輸入,得到故障分類準(zhǔn)確率;
測取傳動(dòng)齒輪箱的振動(dòng)信號,實(shí)驗(yàn)裝置由三相電機(jī),齒輪箱,及其連接機(jī)構(gòu)組成,核心設(shè)備是齒輪箱,內(nèi)部結(jié)構(gòu)示意圖如圖1所示。采樣頻率恒定為8 000 Hz,旋轉(zhuǎn)速度從150 r/min到1 800 r/min,故障包括外圈故障,內(nèi)圈故障及保持架故障。三類故障各選取13段數(shù)據(jù),每段數(shù)據(jù)有1 024個(gè)點(diǎn),每段數(shù)據(jù)計(jì)算10種特征值(故障特征值表見圖1),因此每一類故障130個(gè)特征,以其中110個(gè)作為訓(xùn)練集,其余20個(gè)作為測試集。
圖2 變速箱內(nèi)部示意圖
計(jì)算三類故障特征相關(guān)性矩陣,如圖3所示。
圖3 原始特征值相關(guān)矩陣圖
由相關(guān)矩陣圖可知各特征值之間存在較強(qiáng)相關(guān)性;3種故障特征值在特征空間的分布如圖4所示。
可以看出有重疊部分,其聚類效果較差,這是由于齒輪箱結(jié)構(gòu)故障,部件產(chǎn)生的振動(dòng)之間耦合性強(qiáng),造成了各個(gè)故障之間振動(dòng)信號表征比較相似,從而使其特征不能準(zhǔn)確地聚類到每一故障類別中。
將原始故障特征向量輸入LSSVM進(jìn)行分類,其分類正確率為63.72%,預(yù)測計(jì)算結(jié)果示意如圖5所示。
采用KICA-GDA方法對上述故障特征進(jìn)行處理,通過該方法去掉了不同故障特征間冗余,并對故障特性進(jìn)行非線性融合,處理后的特征間相關(guān)矩陣如圖6所示。
表1 軸承故障特征值表
圖4 特征值空間分布
圖5 不經(jīng)處理的特征進(jìn)行預(yù)測示意圖
圖6 處理后的特征相關(guān)矩陣
與圖3相比,其不同特征間相關(guān)性降低;經(jīng)處理后的3種故障特征空間分布如圖7所示,與圖4相比,類間距離增大,無重疊部分,分類效果得到明顯的提升。
盒型圖[10]可以說明每個(gè)特征的特征值所處的位置及其誤差,因此將經(jīng)KICA-GDA處理后的特征之間的關(guān)系用盒型圖表示出來,如圖8所示。
其中紅色十字點(diǎn)表示異常點(diǎn),黑色線表示上下誤差,藍(lán)色框表示絕大數(shù)點(diǎn)都在這個(gè)范圍內(nèi),另外,每個(gè)特征值都進(jìn)行了歸一化處理。因此,從圖8中可以得知,不同故障類型在每個(gè)故障特征下都能較明顯地分開。將處理后的故障特征向量輸入LSSVM分類器進(jìn)行分類,其分類正確率為99.54%,與直接將故障信號的原始特征向量作為LSSVM分類器輸入進(jìn)行分類的效果比較,其分類精確度大大提高,預(yù)測示意圖如圖9所示。
圖7 處理后的特征分布
圖8 不同故障間的盒型圖
圖9 KICA-GDA處理后預(yù)測結(jié)果示意圖
影響齒輪箱滾動(dòng)軸承振動(dòng)信號因素較多,尤其在故障運(yùn)行時(shí),振動(dòng)信號往往表現(xiàn)為非線性非平穩(wěn)性特性,使得直接采用LSSVM分類器對故障進(jìn)行分類得不到理想的效果。本文將KICA與GDA相結(jié)合,提供了一種非線性非平穩(wěn)性信號的處理方法,采用該方法對故障信號進(jìn)行預(yù)處理,去除了故障特征間的冗余,提取了不同部分的特征,在一定程度上減弱了故障造成各部件固有振動(dòng)影響,從而提高了分類性能。試驗(yàn)結(jié)果表明,將KICA-GDA與LSSVM相結(jié)合對齒輪箱滾動(dòng)軸承實(shí)測故障信號進(jìn)行分類,與單獨(dú)使用支持向量機(jī)分類器(LSSVM)的故障分類準(zhǔn)確率(63.72%)相比,提高了齒輪箱滾動(dòng)軸承故障分類準(zhǔn)確率(99.54%),驗(yàn)證了本文方法的有效性。