李 鋒,湯寶平,郭 胤
(1.四川大學(xué) 制造科學(xué)與工程學(xué)院,成都 610065;2.重慶大學(xué) 機(jī)械傳動(dòng)國家重點(diǎn)實(shí)驗(yàn)室,重慶 400044;3.四川航天技術(shù)研究院 總體設(shè)計(jì)部,成都 610100)
Laplacian雙聯(lián)最小二乘支持向量機(jī)用于早期故障診斷
李 鋒1,湯寶平2,郭 胤3
(1.四川大學(xué) 制造科學(xué)與工程學(xué)院,成都 610065;2.重慶大學(xué) 機(jī)械傳動(dòng)國家重點(diǎn)實(shí)驗(yàn)室,重慶 400044;3.四川航天技術(shù)研究院 總體設(shè)計(jì)部,成都 610100)
提出基于Laplacian雙聯(lián)最小二乘支持向量機(jī)(Laplacian Twin Least Squares Support Vector Machine, Lap-TLSSVM)半監(jiān)督模式識(shí)別的新型早期故障診斷方法。用時(shí)、頻域特征集廣泛收集旋轉(zhuǎn)機(jī)械不同早期故障的特征信息,再用提升半監(jiān)督局部Fisher判別分析(Enhanced Semi-Supervised Local Fisher Discriminant Analysis, ESSLFDA)將高維時(shí)、頻域特征集約簡為具有更好類區(qū)分度的低維特征向量,并輸入到Lap-TLSSVM中進(jìn)行早期故障診斷。Lap-TLSSVM引入了包含大量無標(biāo)簽數(shù)據(jù)信息的流形規(guī)則實(shí)現(xiàn)半監(jiān)督學(xué)習(xí);其目標(biāo)函數(shù)只含等式約束條件,且用共軛梯度法求解目標(biāo)函數(shù)的線性方程組以加速訓(xùn)練過程。所提出的方法在訓(xùn)練樣本非常稀少的情況下具有較高的診斷精度和計(jì)算效率。深溝球軸承早期故障診斷實(shí)驗(yàn)驗(yàn)證了該方法的有效性。
旋轉(zhuǎn)機(jī)械;流形學(xué)習(xí);Laplacian雙聯(lián)最小二乘支持向量機(jī);半監(jiān)督學(xué)習(xí);故障診斷
軸承、轉(zhuǎn)子、齒輪等旋轉(zhuǎn)部件是機(jī)械裝備的重要組成部分,起到支撐載荷、傳遞運(yùn)動(dòng)和動(dòng)力的關(guān)鍵作用。然而這些旋轉(zhuǎn)部件一旦出現(xiàn)故障得不到及時(shí)診斷和處理,任由其發(fā)展、擴(kuò)大,將會(huì)引起整臺(tái)機(jī)械裝備的重大事故以及代價(jià)高昂的長期停工。因此,及時(shí)準(zhǔn)確地診斷出處于早期發(fā)生階段的微弱或潛在故障意義重大,這有助于及早掌握旋轉(zhuǎn)機(jī)械性能退化的征兆,對(duì)故障的發(fā)生發(fā)展起到防微杜漸的作用[1]。然而,旋轉(zhuǎn)機(jī)械的早期故障總是被強(qiáng)噪聲淹沒,具有癥狀不明顯、特征信息微弱等特點(diǎn),不易識(shí)別[2-3]。由于流形學(xué)習(xí)比傳統(tǒng)的信號(hào)分析和數(shù)據(jù)挖掘方法更能體現(xiàn)復(fù)雜觀測(cè)數(shù)據(jù)的本質(zhì),在獲取主要變量的同時(shí)還可優(yōu)化原始觀測(cè)空間的拓?fù)浣Y(jié)構(gòu)[4-5],為準(zhǔn)確提取含有強(qiáng)噪聲干擾、微弱、非線性的旋轉(zhuǎn)機(jī)械早期故障特征提供了新思路?;诹餍螌W(xué)習(xí)維數(shù)化簡的早期故障診斷方法實(shí)現(xiàn)模式如下:用多征兆域特征融合方法廣泛收集早期故障特征信息→用流形學(xué)習(xí)對(duì)高維多征兆域特征集維數(shù)化簡→對(duì)低維主特征量模式識(shí)別[6]。
本文延用文獻(xiàn)[7]中提出的時(shí)、頻域特征參數(shù)集來廣泛挖掘旋轉(zhuǎn)機(jī)械不同早期故障的特征信息。常用的對(duì)高維多征兆域特征集維數(shù)化簡的流形學(xué)習(xí)方法多采用無監(jiān)督或有監(jiān)督學(xué)習(xí)機(jī)制。無監(jiān)督學(xué)習(xí)機(jī)制就是只利用基于歐幾里得幾何測(cè)度的流形局部幾何結(jié)構(gòu),而未利用訓(xùn)練樣本的類標(biāo)簽判別信息進(jìn)行流形解耦和分類的學(xué)習(xí)機(jī)制;有監(jiān)督學(xué)習(xí)機(jī)制是利用訓(xùn)練樣本的類標(biāo)簽判別信息和流形局部幾何結(jié)構(gòu)來指導(dǎo)所有樣本(包括訓(xùn)練樣本和待測(cè)樣本)分類的學(xué)習(xí)機(jī)制。前者對(duì)樣本中的噪聲比較敏感,投影后低維子流形仍然會(huì)發(fā)生嚴(yán)重混疊現(xiàn)象,造成線性不可分;后者在訓(xùn)練樣本稀少情況下,分類性能也會(huì)明顯衰退[8-9]。而積累用于訓(xùn)練的機(jī)械裝備早期故障標(biāo)準(zhǔn)樣本主要通過實(shí)驗(yàn)室模擬或加速試驗(yàn)、真實(shí)現(xiàn)場試驗(yàn)這兩種試驗(yàn)方法解決。這兩種試驗(yàn)的完成都需要花費(fèi)大量長期的時(shí)間與人力,因此收集充足的有類標(biāo)簽樣本在實(shí)際應(yīng)用中通常是困難的[10]。本文采用新型半監(jiān)督流形學(xué)習(xí)(半監(jiān)督學(xué)習(xí)機(jī)制就是主要依靠待測(cè)樣本(即無類標(biāo)簽樣本)的流形局部幾何結(jié)構(gòu),并以訓(xùn)練樣本的類標(biāo)簽判別信息和流形局部幾何信息為輔助來指導(dǎo)樣本分類的學(xué)習(xí)機(jī)制)理論:提升半監(jiān)督局部Fisher判別分析(Enhanced Semi-Supervised Local Fisher Discriminant Analysis, ESSLFDA) 來解決現(xiàn)有流形學(xué)習(xí)方法在有類標(biāo)簽樣本稀少情況下分類性能衰退的問題,ESSLFDA在待測(cè)樣本的局部幾何信息和訓(xùn)練樣本的類標(biāo)簽雙重指導(dǎo)下分類,且施加了不相關(guān)約束使輸出的基向量統(tǒng)計(jì)不相關(guān),因此在訓(xùn)練樣本稀少條件下也能產(chǎn)生較好的分類效果。
ESSLFDA輸出的仍是收斂性不足、尚有一定空間維度、不易分析的特征向量,要更為簡潔、準(zhǔn)確地呈現(xiàn)早期故障診斷結(jié)果,還須借助模式識(shí)別技術(shù)建立降維后的特征向量與早期故障之間的推理邏輯,以明確結(jié)論的形式導(dǎo)出特征向量所屬的早期故障類別。經(jīng)典的模式識(shí)別方法主要有:連續(xù)隱Markov 模型(Continuous Hidden Markov Model, CHMM)[11],k-近鄰分類器(K-Nearest Neighbor Classifier, KNNC)[12]、最小二乘支持向量機(jī)(Least Squares Support Vector Machine, LSSVM)、小波最小二乘支持向量機(jī)(Wavelet Least Squares Support Vector Machine, WLSSVM)[13]等。然而,以上方法都采用有監(jiān)督學(xué)習(xí)機(jī)制,過多依賴訓(xùn)練樣本的拓?fù)浣Y(jié)構(gòu)和類信息對(duì)待測(cè)樣本分類決策而忽視了待測(cè)樣本中潛在的分布信息對(duì)模式識(shí)別的作用[14]。因此,它們的推理特性在訓(xùn)練樣本數(shù)量不充足情況下會(huì)受到限制,且與半監(jiān)督流形學(xué)習(xí)方法ESSLFDA在理論架構(gòu)上極不協(xié)調(diào)。本文研究了與ESSLFDA相配套的新型半監(jiān)督模式識(shí)別方法:Laplacian雙聯(lián)最小二乘支持向量機(jī)(Laplacian Twin Least Squares Support Vector Machine, Lap-TLSSVM)。Lap-TLSSVM為樣本尋找兩個(gè)非平行超平面使每個(gè)超平面盡可能靠近樣本隸屬的類別,并遠(yuǎn)離異類;還引入了包含大量無類標(biāo)簽樣本信息的流形規(guī)則實(shí)現(xiàn)半監(jiān)督學(xué)習(xí);且其目標(biāo)函數(shù)只含等式約束條件,并嵌入了共軛梯度算法求解目標(biāo)函數(shù)的線性方程組以加速訓(xùn)練過程。這使Lap-TLSSVM在訓(xùn)練樣本稀少情況下仍具有較高的模式識(shí)別精度,同時(shí)消耗較少的計(jì)算時(shí)間。
本文提出的基于Lap-TLSSVM半監(jiān)督模式識(shí)別的早期故障診斷方法集成了時(shí)、頻域特征集,ESSLFDA和Lap-TLSSVM的優(yōu)勢(shì),適用于訓(xùn)練樣本稀少條件下的旋轉(zhuǎn)機(jī)械早期故障診斷問題。
1.1 半監(jiān)督流形規(guī)則學(xué)習(xí)框架
為彌補(bǔ)有監(jiān)督學(xué)習(xí)機(jī)制在訓(xùn)練樣本稀少條件下的不足,本文改用半監(jiān)督學(xué)習(xí)框架,半監(jiān)督學(xué)習(xí)可同時(shí)利用大量無標(biāo)簽樣本和相對(duì)較少的有標(biāo)簽樣本建構(gòu)分類器。由于流形學(xué)習(xí)能保持?jǐn)?shù)據(jù)的幾何信息,因此為實(shí)現(xiàn)半監(jiān)督學(xué)習(xí),本文引入流形規(guī)則項(xiàng)
(1)
在再生核Hilbert空間(Reproducing Kernel Hilbert Spaces, RKHS)選取適當(dāng)?shù)暮撕瘮?shù)κ(·,·)之后,則半監(jiān)督流形規(guī)則框架可通過最小化式(2)建立起來
(2)
1.2 線性Lap-TLSSVM
Lap-TLSSVM旨在利用嵌入在全體樣本集(包括待測(cè)樣本)中的潛在幾何信息建構(gòu)半監(jiān)督學(xué)習(xí)機(jī)制下的分類器。線性Lap-TLSSVM搜索以下兩個(gè)非平行超平面
(3)
(4)
和
(5)
式中,c1,c2>0為經(jīng)驗(yàn)風(fēng)險(xiǎn)懲罰參數(shù),用于維持式(4)和式(5)中損失項(xiàng)之間的平衡。
考慮RKHS規(guī)則項(xiàng)
(6)
以及流形規(guī)則項(xiàng)
(7)
式中:L為Laplacian矩陣;X∈R(l+u)×n為所有樣本集。再引入松弛變量ξ*,ξ,η*和η,則Lap-TLSSVM的主問題可表示為
s.t.Aw1+e1b1=ξ*
Bw1+e2b1+e2=ξ
(8)
和
s.t.Bw2+e2b2=η*
Aw2+e1b2+e1=η
(9)
式中,λ1,λ2∈(0 1]為調(diào)節(jié)參數(shù)。
在優(yōu)化以上兩問題之前,需要給出它們的幾何解釋。例如,對(duì)于式(8),目標(biāo)函數(shù)中的第一項(xiàng)用于最小化A(標(biāo)簽為“+1”的樣本集)的函數(shù)值f1(x)的平方和,使有標(biāo)簽樣本集A盡可能逼近“+1”的超平面f1(x)。優(yōu)化第二項(xiàng)使得B(標(biāo)簽為“-1”的樣本集)與f1(x)的距離至少為1。式(8)中的第三項(xiàng)(即RKHS項(xiàng))是RKHS中f1(x)的范數(shù),用于控制Lap-TLSSVM的模型復(fù)雜性避免過學(xué)習(xí)。最后一項(xiàng)(即流形規(guī)則項(xiàng))利用所有樣本X(包括待測(cè)樣本)內(nèi)部的幾何信息,迫使f1(x)沿著本征流形M方向變得更為平滑。另外,引入了調(diào)節(jié)參數(shù)λ1以平衡RKHS項(xiàng)和流形規(guī)則項(xiàng)。λ1越小表示越側(cè)重、越依賴流形規(guī)則項(xiàng),反之亦然。
由于式(9)中的優(yōu)化問題與式(8)類似,因此主要聚焦式(8)的求解。將等式約束條件代入目標(biāo)函數(shù),則二次規(guī)劃問題(8)變?yōu)?/p>
(10)
將式(10)對(duì)w1和b1的偏導(dǎo)數(shù)設(shè)置為0,則得到
w1L=A′(Aw1+e1b1)+c1B′(Bw1+e2b1+e2)+
λ1w1+(1-λ1)X′L(Xw1+eb1)=0
(11)
λ1b1+(1-λ1)e′L(Xw1+eb1)=0
(12)
用矩陣形式整理、合并式(11)和式(12)后得到
(13)
Pv1=-c1G′e2
(14)
式中,P=H′H+c1G′G+λ1I+(1-λ1)J′LJ。
同理,二次規(guī)劃問題(9)的解可由式(15)求得
Qv2=c2H′e1
(15)
Lap-TLSSVM的解可通過求解線性方程式(14)和式(15)直接得到,而不用像SVM那樣需要求解更為復(fù)雜的二次規(guī)劃問題得到。此外,采用功能強(qiáng)大的共軛梯度(Conjugate Gradient, CG)算法高效地求解以上線性方程組。共軛梯度法是最實(shí)用的求解大型線性方程組的迭代方法之一,其形式為
Ax=b
(16)
式中:x為待求解;A為對(duì)稱正定矩陣;b為向量。完整的求解過程如算法1所述。
算法1 用于Lap-TLSSVM的共軛梯度算法。
輸入:矩陣A和b向量;指定的收斂常量ε;初始近似解x0。
① 初始化殘余向量r0=b-Ax0和搜索路徑p0=r0。
② 開始當(dāng)條件 (‖rk+1‖<ε) 循環(huán)
④ 修正最新解xk+1=xk+αkpk
⑤ 更新殘余向量rk+1=rk-αkApk
⑦ 修改下一步的搜索路徑pk+1=rk+1+βkpk
⑧ 增加迭代次數(shù)k=k+1
⑨ 結(jié)束當(dāng)條件循環(huán)。
輸出:問題式(14)和式(15)的最優(yōu)解x*(即v1或v2)≈xk+1。
優(yōu)化問題式(8)和式(9)的解(w1,b1)和(w2,b2)由算法1得出后,則新的待測(cè)數(shù)據(jù)x∈Rn就可以根據(jù)它更靠近兩個(gè)超平面式(3)中的哪一個(gè)來分配類標(biāo)簽i(“i=+1”或“-1”),即
(17)
1.3 非線性Lap-TLSSVM
為將Lap-TLSSVM模型延伸到非線性領(lǐng)域,需得到以下兩個(gè)核生成超平面
f1(x):κ(x′,X′)u1+b1=0
f2(x):κ(x′,X′)u2+b2=0
(18)
式中:X∈R(l+u)×n為所有樣本集(包括待測(cè)樣本);κ(·,·)為適當(dāng)選取的內(nèi)核,例如RBF內(nèi)核,κ(u,v)=e-γ‖u-v‖2,γ>0。則非線性Lap-TLSSVM的優(yōu)化問題可表示為
s.t.κ(A,X′)u1+e1b1=ξ*
κ(B,X′)u1+e2b1+e2=ξ
(19)
和
s.t.κ(B,X′)u2+e2b2=η*
κ(A,X′)u2+e1b2-e1=η
(20)
式中:K為κ(X,X′),c1,c2>0為經(jīng)驗(yàn)風(fēng)險(xiǎn)懲罰參數(shù),λ1,λ2∈(0 1] 為調(diào)節(jié)參數(shù);L為Laplacian矩陣。
將約束條件代入目標(biāo)函數(shù)之后,二次規(guī)劃問題式(19)和式(20)變?yōu)?/p>
(21)
和
(22)
二次規(guī)劃問題式(21)和式(22)的解可分別由式(23)和式(24)導(dǎo)出
(23)
和
(24)
其中,
(25)
(26)
式中:Jφ=[Ke] ;Hφ=[κ(A,X′)e1];Gφ=[κ(B,X′)e2]。
與線性情況類似,借助共軛梯度(CG)算法(即算法1)求解式(23)和式(24)。問題式(19)和式(20)的解(u1,b1)和(u2,b2)一求出,則新待測(cè)數(shù)據(jù)x∈Rn就可根據(jù)它更靠近兩個(gè)超平面式(18)中的哪一個(gè)來分配類標(biāo)簽i(“i=+1”或“-1”),即
(27)
Lap-TLSSVM是兩類分類器,但實(shí)際解決的往往是多類問題。本文采用多類分類思想,即對(duì)于k類樣本,采用k-1層Lap-TLSSVM進(jìn)行逐層分類(見圖1),并對(duì)輸出分類模式進(jìn)行編碼,使Lap-TLSSVM可以直接輸出早期故障的模式編號(hào)(例如1、2、3等)。
圖1 Lap-TLSSVM逐層分類模型Fig.1 Layer by layer classification model of Lap-TLSSVM
早期故障診斷方法“時(shí)、頻域特征集→ESSLFDA→Lap-TLSSVM”實(shí)現(xiàn)流程如圖2,步驟如下:
步驟1 對(duì)表征不同早期故障特征的訓(xùn)練樣本和待測(cè)樣本信號(hào)分別構(gòu)造11個(gè)時(shí)域特征參數(shù)和13個(gè)頻域特征參數(shù),并將11個(gè)時(shí)域特征參數(shù)和13個(gè)頻域特征參數(shù)合并成24維的時(shí)、頻域特征參數(shù)集。
步驟2 將訓(xùn)練樣本和待測(cè)樣本的時(shí)、頻域特征參數(shù)集并列輸入ESSLFDA用于訓(xùn)練,求出轉(zhuǎn)換矩陣。
步驟3 利用訓(xùn)練成功的ESSLFDA對(duì)訓(xùn)練樣本和待測(cè)樣本化簡維數(shù),得出d維特征向量,d為最優(yōu)化簡維數(shù),且1≤d<24(當(dāng)nk×C≥24時(shí),nk為每類早期故障的訓(xùn)練樣本數(shù),這里nk取定值,即每類早期故障的訓(xùn)練樣本數(shù)目取相同值,C為早期故障種類數(shù)目)或1≤d 步驟4 將訓(xùn)練樣本和待測(cè)樣本的d維特征向量導(dǎo)入多類Lap-TLSSVM,對(duì)多類Lap-TLSSVM進(jìn)行訓(xùn)練。 步驟5 由訓(xùn)練好的多類Lap-TLSSVM來判別待測(cè)樣本的早期故障類型。 圖2 早期故障診斷方法“時(shí)、頻域特征集→ESSLFDA→Lap-TLSSVM”實(shí)現(xiàn)流程Fig.2 Implementation process of early fault diagnosis method “Time-frequency domain early fault feature set→ESSLFDA→Lap-TLSSVM” 11個(gè)時(shí)域特征參數(shù)和13個(gè)頻域特征參數(shù)的構(gòu)建依據(jù)和過程詳見文獻(xiàn)[7],這里不做贅述。由11個(gè)時(shí)域特征參數(shù)和13個(gè)頻域特征參數(shù)組合而成的24維時(shí)、頻域特征參數(shù)集可較廣泛地包容旋轉(zhuǎn)機(jī)械各類早期故障的特征信息。ESSLFDA是一種新型半監(jiān)督流形學(xué)習(xí)方法,它在待測(cè)樣本的局部幾何信息和訓(xùn)練樣本的類標(biāo)簽雙重指導(dǎo)下最小化同類流形的離散度并最大化異類流形的離散度以實(shí)現(xiàn)類判別,還施加了不相關(guān)約束使所提取的特征統(tǒng)計(jì)不相關(guān),因此在訓(xùn)練樣本稀少條件下也能產(chǎn)生較好的分類效果,有關(guān)ESSLFDA的理論探討詳見文獻(xiàn)[5]。 以深溝球軸承早期故障診斷實(shí)例驗(yàn)證所提出方法的有效性。實(shí)驗(yàn)中使用的是外徑為52 mm,內(nèi)徑為25 mm,厚度為15 mm的6205-2RS型深溝球軸承。實(shí)驗(yàn)臺(tái)如圖3所示,由PC機(jī)、信號(hào)采集儀、電荷放大器、壓電式加速度傳感器、扭矩傳感器/譯碼器、扭矩加載器、轉(zhuǎn)軸、電器控制裝置、電動(dòng)機(jī)等組成。電動(dòng)機(jī)驅(qū)動(dòng)輸入軸,轉(zhuǎn)速約為1 770 r/min,輸出軸驅(qū)動(dòng)載荷。分別在3個(gè)軸承的外圈、內(nèi)圈、滾動(dòng)體上加工深度約為0.16 mm、直徑約為0.09 mm的小凹槽以模擬軸承外圈、內(nèi)圈、滾動(dòng)體的早期輕微裂紋故障。用加速度傳感器、電荷放大器和信號(hào)采集儀采集3類早期故障及正常狀態(tài)的振動(dòng)數(shù)據(jù)各50組,每組數(shù)據(jù)的時(shí)間長度為0.1 s,采樣頻率設(shè)定為48 kHz。圖4示出正常狀態(tài)和3種早期故障待測(cè)樣本的時(shí)域波形。 圖3 深溝球軸承故障辨識(shí)實(shí)驗(yàn)裝置Fig.3 Experimental equipment of fault diagnosis for deep groove ball bearings 在用所提出的方法對(duì)6205-2RS型深溝球軸承的正常狀態(tài)和3種早期故障進(jìn)行辨識(shí)之前,對(duì)該方法中可以預(yù)先設(shè)定的相關(guān)參數(shù)說明或設(shè)置如下:因時(shí)域和頻域特征參數(shù)總數(shù)為24,故ESSLFDA的輸入樣本的維數(shù)亦為m=24;ESSLFDA的鄰域大小設(shè)定為k=d,而最優(yōu)化簡維數(shù)d的估計(jì)方法如第2節(jié)所述,ESSLFDA中的局部縮放比例參數(shù)σ設(shè)定為σ=1。由于Lap-TLSSVM的經(jīng)驗(yàn)風(fēng)險(xiǎn)懲罰參數(shù)c1,c2的變化對(duì)模式識(shí)別的精度沒有顯著的負(fù)面影響,故將c1,c2固定為c1=c2=1;針對(duì)非線性Lap-TLSSVM,其RBF核參數(shù)定為γ=0.5;為方便起見,設(shè)置Lap-TLSSVM的調(diào)節(jié)參數(shù)λ1=λ2=λ,λ在區(qū)間(0 1]中取值。早期故障類型(含正常狀態(tài))與3層Lap-TLSSVM期望輸出的對(duì)應(yīng)關(guān)系設(shè)為:正常狀態(tài)→1、外圈早期輕微裂紋→2、內(nèi)圈早期輕微裂紋→3、滾動(dòng)體早期輕微裂紋→4。這里從50組數(shù)據(jù)中分別隨機(jī)抽取nk=6、5、4、3、2、1 (k=1,…,C,C=4)組作為訓(xùn)練樣本,則剩余的44、45、46、47、48、49組樣本用作待測(cè)樣本;每組訓(xùn)練和待測(cè)樣本的數(shù)據(jù)點(diǎn)長度都為4 096(數(shù)據(jù)截取長度的選取遵循既大致覆蓋各類早期故障的振動(dòng)周期/頻率又不過度增加早期故障辨識(shí)方法計(jì)算量的兼顧原則)。所提出的基于Lap-TLSSVM半監(jiān)督模式識(shí)別的早期故障診斷方法的實(shí)現(xiàn)流程參考第2節(jié)所述,它在nk=5、4、3、2、1這5種條件下對(duì)深溝球軸承的正常狀態(tài)和3類早期故障的診斷精度如表1~表5所示。為了將Lap-TLSSVM的診斷精度與CHMM、KNNC、LSSVM、Shannon小波LSSVM等經(jīng)典的采用有監(jiān)督學(xué)習(xí)機(jī)制的模式識(shí)別方法做比較,以評(píng)估Lap-TLSSVM在訓(xùn)練樣本稀少條件下的診斷特性,表1~表5同時(shí)提供了后4個(gè)方法在以上5種訓(xùn)練樣本稀少條件下的分類精度,其中特征挖掘環(huán)節(jié)使用的時(shí)、頻域特征參數(shù)集和維數(shù)化簡環(huán)節(jié)使用的ESSLFDA維持不變。 圖4 深溝球軸承正常狀態(tài)、外圈輕微裂紋、內(nèi)圈輕微裂紋、滾動(dòng)體輕微裂紋待測(cè)信號(hào)波形Fig.4 Waveform of the testing signals of normal state, minor outer race crack, minor inner race crack and minor ball crack 對(duì)表1~表5分析得知,隨著訓(xùn)練樣本數(shù)的逐步遞減,CHMM、KNNC、LSSVM、Shannon小波LSSVM等有監(jiān)督機(jī)制下的模式識(shí)別方法對(duì)正常狀態(tài)和3種早期故障的診斷精度及平均診斷精度都出現(xiàn)了明顯下滑;當(dāng)每類早期故障(或正常狀態(tài))的訓(xùn)練樣本數(shù)降至nk=1時(shí),CHMM、KNNC、LSSVM、Shannon小波LSSVM的分類決策能力已完全失效。而對(duì)于Lap-TLSSVM而言,在訓(xùn)練樣本數(shù)遞減情況下只要適當(dāng)減小調(diào)節(jié)參數(shù)λ(即增大包含大量無標(biāo)簽樣本信息的流形規(guī)則項(xiàng)的權(quán)重),Lap-TLSSVM對(duì)深溝球軸承的正常狀態(tài)和3類早期故障的診斷精度仍維持較高水平。這表明由于Lap-TLSSVM尋找一對(duì)非平行超平面來聚集同類、區(qū)隔異類,同時(shí)在目標(biāo)函數(shù)中嵌入了流形規(guī)則項(xiàng),使得只要適當(dāng)調(diào)節(jié)流形規(guī)則項(xiàng)的權(quán)重,就能使Lap-TLSSVM的分類能力在訓(xùn)練樣本稀少且待測(cè)樣本數(shù)據(jù)結(jié)構(gòu)復(fù)雜的條件下仍具有優(yōu)良的魯棒性,因此Lap-TLSSVM比CHMM、KNNC、LSSVM、Shannon小波LSSVM等有監(jiān)督學(xué)習(xí)機(jī)制更適用于訓(xùn)練樣本不足條件下的旋轉(zhuǎn)機(jī)械早期故障診斷問題。由于RBF內(nèi)核的卓越的非線性映射能力,使得非線性Lap-TLSSVM的診斷精度在nk=6、5、4、3、2、1六種情況下又總是略高于線性Lap-TLSSVM。 表1 6種模式識(shí)別方法的早期故障診斷精度對(duì)比(nk=5) 表2 6種模式識(shí)別方法的早期故障診斷精度對(duì)比(nk=4) 表3 6種模式識(shí)別方法的早期故障診斷精度對(duì)比(nk=3) 表4 6種模式識(shí)別方法的早期故障診斷精度對(duì)比(nk=2) 表5 6種模式識(shí)別方法的早期故障診斷精度對(duì)比(nk=1) 為體現(xiàn)驗(yàn)證過程中所抽取的訓(xùn)練樣本和待測(cè)樣本的隨機(jī)性和多樣性,這里再用交叉驗(yàn)證法從深溝球軸承的3類早期故障及正常狀態(tài)的各50組振動(dòng)數(shù)據(jù)中隨機(jī)抽取nk=1 (k=1,…,C,C=4)組作為訓(xùn)練樣本,從剩余的所有(50-nk)×C=96組樣本中用交叉驗(yàn)證法隨機(jī)抽取總共10組樣本作為待測(cè)樣本,結(jié)果在待測(cè)樣本中含有4組外圈早期輕微裂紋的樣本和6組內(nèi)圈早期輕微裂紋的樣本,不含正常狀態(tài)和滾動(dòng)體早期輕微裂紋的樣本,每組訓(xùn)練和待測(cè)樣本的數(shù)據(jù)點(diǎn)長度仍為4 096。將訓(xùn)練和待測(cè)樣本導(dǎo)入所提出的早期故障診斷方法(Lap-TLSSVM的權(quán)重調(diào)節(jié)參數(shù)λ=0.1)進(jìn)行識(shí)別,得到對(duì)外圈早期輕微裂紋和內(nèi)圈早期輕微裂紋待測(cè)樣本的診斷結(jié)果如表6所示。 如表6所示,無論是非線性Lap-TLSSVM還是線性Lap-TLSSVM,它們對(duì)4組外圈早期輕微裂紋待測(cè)樣本和6組內(nèi)圈早期輕微裂紋待測(cè)樣本的診斷精度都較高。 表6 所提出方法對(duì)10組待測(cè)樣本的早期故障診斷結(jié)果(nk=1) 另一方面,本文比較了Lap-TLSSVM與CHMM、KNNC、LSSVM、Shannon小波LSSVM的計(jì)算效率。圖5所示為在nk=6時(shí),用3層非線性Lap-TLSSVM、3層線性Lap-TLSSVM、CHMM、KNNC、LSSVM、Shannon小波LSSVM對(duì)深溝球軸承的正常狀態(tài)和3類早期故障分別做10次早期故障診斷實(shí)驗(yàn)所消耗的平均訓(xùn)練時(shí)間(實(shí)驗(yàn)是在4G RAM、3GHZ Intel Core i5-2320 CPU和Matlab 2009的計(jì)算機(jī)配置條件下開展的)。3層非線性Lap-TLSSVM和3層線性Lap-TLSSVM對(duì)訓(xùn)練樣本的平均訓(xùn)練時(shí)間分別僅為0.000 608 s和0.000 567 s,遠(yuǎn)低于CHMM、KNNC、LSSVM和Shannon小波LSSVM所消耗的平均訓(xùn)練時(shí)間。表明Lap-TLSSVM的目標(biāo)函數(shù)采用的等式約束條件以及求解目標(biāo)函數(shù)所使用的共軛梯度算法都有效加速了訓(xùn)練過程,使其計(jì)算效率要顯著高于后四種模式識(shí)別方法。 圖5 (a) 非線性Lap-TLSSVM;(b) 線性Lap-TLSSVM;(c) CHMM;(d) KNNC;(e) LSSVM;(f) Shannon小波LSSVM的平均訓(xùn)練時(shí)間Fig.5 Mean training times of (a) Nonlinear Lap-TLSSVM;(b) Linear Lap-TLSSVM;(c) CHMM;(d) KNNC;(e) LSSVM; (f) Shannon wavelet LSSVM (1) ESSLFDA在待測(cè)樣本的局部幾何信息和訓(xùn)練樣本的類標(biāo)簽雙重指導(dǎo)下進(jìn)行類判別,還施加了不相關(guān)約束使所提取的特征統(tǒng)計(jì)不相關(guān),因此在訓(xùn)練樣本稀少條件下也能產(chǎn)生較好的分類效果。 (2) Lap-TLSSVM尋找兩個(gè)非平行超平面使每個(gè)超平面靠近樣本隸屬的類別,并遠(yuǎn)離異類;引入了包含大量待測(cè)樣本信息的流形規(guī)則實(shí)現(xiàn)半監(jiān)督學(xué)習(xí);且目標(biāo)函數(shù)只含等式約束條件,并嵌入了共軛梯度算法求解目標(biāo)函數(shù)的線性方程組以加速訓(xùn)練過程。這使Lap-TLSSVM在訓(xùn)練樣本稀少情況下具有較高的模式識(shí)別精度,且訓(xùn)練速度更快。 (3) 基于時(shí)、頻域特征參數(shù)集、ESSLFDA和Lap-TLSSVM的理論優(yōu)勢(shì),所提出的旋轉(zhuǎn)機(jī)械早期故障診斷方法在訓(xùn)練樣本非常稀少的條件下具有較高的診斷精度和計(jì)算效率。 [ 1 ] TANG H F, CHEN J, DONG G M. Sparse representation based latent components analysis for machinery weak fault detection [J]. Mechanical Systems and Signal Processing, 2014, 46 (2): 373-388. [ 2 ] WANG Y, XU G H, LIANG L, et al. Detection of weak transient signals based on wavelet packet transform and manifold learning for rolling element bearing fault diagnosis [J]. Mechanical Systems and Signal Processing, 2015, 54/55: 259-276. [ 3 ] 王國彪,何正嘉,陳雪峰,等. 機(jī)械故障診斷基礎(chǔ)研究“何去何從”[J]. 機(jī)械工程學(xué)報(bào), 2013, 49(1):63-72. WANG Guobiao, HE Zhengjia, CHEN Xuefeng, et al. Review of life prediction for mechanical major equipments [J]. Chinese Journal of Mechanical Engineering, 2013, 49(1):63-72. [ 4 ] LI W, RUAN Q Q, WAN J. Dimensionality reduction using graph-embedded probability-based semi-supervised discriminant analysis [J]. Neurocomputing, 2014, 138:283-296. [ 5 ] HUANG H, LI J W, LIU J M. Enhanced semi-supervised local fisher discriminant analysis for face recognition [J]. Future Generation Computer Systems, 2012, 28 (1): 244-253. [ 6 ] LI F, WANG J X, CHYU M K, et al. Weak fault diagnosis of rotating machinery based on feature reduction with supervised orthogonal local fisher discriminant analysis [J]. Neurocomputing, 2015, 168:505-519. [ 7 ] LI F, CHYU M K, WANG J X, et al. Life grade recognition of rotating machinery based on supervised orthogonal linear local tangent space alignment and optimal supervised fuzzy c-means clustering [J]. Measurement, 2015, 73: 384-400. [ 8 ] JIANG L, XUAN J P, SHI T L. Feature extraction based on semi-supervised kernel Marginal Fisher analysis and its application in bearing fault diagnosis [J]. Mechanical Systems and Signal Processing, 2013, 41(1/2): 113-126. [ 9 ] ZHANG S W, LEI Y K, WU Y H. Semi-supervised locally discriminant projection for classification and recognition [J]. Knowledge-Based Systems, 2011, 24(2): 341-346. [10] 張小麗,陳雪峰,李兵,等. 機(jī)械重大裝備壽命預(yù)測(cè)綜述[J]. 機(jī)械工程學(xué)報(bào), 2011, 47 (11):100-116. ZHANG Xiaoli, CHEN Xuefeng, LI Bing, et al. Review of life prediction for mechanical major equipments [J]. Journal of Mechanical Engineering, 2011, 47 (11):100-116. [11] ANTONUCCI A, ROSA R D, GIUSTI A, et al. Robust classification of multivariate time series by imprecise hidden Markov models [J]. International Journal of Approximate Reasoning, 2015, 56: 249-263. [12] ZOUHAL L M, DENOEUX T. An evidence-theoretic k-NN rule with parameter optimization [J]. IEEE Transactions on Systems, Man, and Cybernetics, 1998, 28 (2): 263-271. [13] 李鋒,湯寶平,宋濤. 基于Shannon小波支持矢量機(jī)二級(jí)決策的故障診斷[J]. 機(jī)械工程學(xué)報(bào), 2010, 46 (17): 42-47. LI Feng, TANG Baoping, SONG Tao. Fault diagnosis based on the second class decision making through Shannon wavelet support vector machine [J]. Journal of Mechanical Engineering, 2010, 46 (17): 42-47. [14] CHEN W J, SHAO Y H, DENG N Y, et al. Laplacian least squares twin support vector machine for semi-supervised classification [J]. Neurocomputing, 2014, 145: 465-476. [15] BELKIN M, NIYOGI P, SINDHWANI V. Manifold regularization: a geometric framework for learning from labeled and unlabeled examples [J]. Journal of Machine Learning Research, 2006, 7(1): 2399-2434. Early fault diagnosis using Laplacian twin least squares support vector machine LI Feng1,TANG Baoping2,GUO Yin3 (1.School of Manufacturing Science and Engineering, Sichuan University, Chengdu 610065, China;2.The State Key Laboratory of Mechanical Transmission, Chongqing University, Chongqing 400044, China;3.The General Design Department, Sichuan Academy of Aerospace Technology, Chengdu 610100, China) A novel early fault diagnosis method based on semi-supervised pattern recognition with Laplacian twin least squares support vector machine (Lap-TLSSVM) was proposed in this paper. In this method, the time-frequency domain feature set was first used to widely collect the feature information of various early faults. Then, the enhanced semi-supervised local Fisher discriminant analysis (ESSLFDA) was utilized to reduce the high-dimensional time-frequency domain feature sets of training and testing samples to the low-dimensional eigenvectors with better category segregation. Finally, the low-dimensional eigenvectors of all samples were input into the introduced Lap-TLSSVM to conduct early fault diagnosis. In Lap-LSTSVM, the manifold regularization with large amounts of unlabeled data information was introduced to achieve semi-supervised learning. In addition, the twin objective functions of Lap-LSTSVM have only equality constraints and an efficient conjugate gradient (CG) algorithm was embedded in Lap-LSTSVM to solve the linear equations of objective functions for speeding up the training procedure. The proposed early fault diagnosis method has high diagnosis accuracy and computation efficiency even if the training sample set is small. Experimental results of early fault diagnosis on deep groove ball bearings confirm the effectiveness of the proposed method. rotating machinery; manifold learning; Laplacian twin least squares support vector machine; semi-supervised learning; fault diagnosis 國家自然科學(xué)基金青年基金(51305283);中國博士后科學(xué)基金第60批面上資助項(xiàng)目(2016M602685) 2016-04-29 修改稿收到日期: 2016-06-06 李鋒 男,博士,副教授,碩士生導(dǎo)師,1982年5月生 郭胤 男,博士,工程師,1984年6月生 TH165.3;TN911.2 A 10.13465/j.cnki.jvs.2017.16.0143 實(shí)驗(yàn)分析
4 結(jié) 論