胡 峰,王傳桐,吳雨川,范良志,余聯(lián)慶
(武漢紡織大學(xué)機(jī)械工程與自動(dòng)化學(xué)院,武漢 430074)
基于改進(jìn)監(jiān)督LLE算法的故障特征提取方法
胡 峰,王傳桐,吳雨川,范良志,余聯(lián)慶
(武漢紡織大學(xué)機(jī)械工程與自動(dòng)化學(xué)院,武漢 430074)
針對(duì)現(xiàn)有監(jiān)督局部線性嵌入算法在低維輸出向量重構(gòu)過程中監(jiān)督學(xué)習(xí)能力弱,不利于故障特征提取的問題,通過利用訓(xùn)練樣本類標(biāo)簽信息擴(kuò)大不同類樣本間平均距離的方式,增加低維輸出向量重構(gòu)模型的監(jiān)督學(xué)習(xí)能力,強(qiáng)化同類樣本的聚集性和異類樣本的互斥性?;谝?guī)范切割準(zhǔn)則和低維輸出向量重構(gòu)誤差,應(yīng)用離散粒子群優(yōu)化算法優(yōu)化折中系數(shù)α和β、以及嵌入維數(shù)和鄰域等參數(shù),提高故障特征提取精度。將改進(jìn)的監(jiān)督局部線性嵌入方法應(yīng)用于軸承故障特征提取,結(jié)果表明推薦方法的特征提取精度較高。
故障;特征提??;監(jiān)督局部線形嵌入;局部幾何結(jié)構(gòu);規(guī)范切割
高維度、非線性和強(qiáng)耦合的機(jī)械故障信號(hào)會(huì)嚴(yán)重影響機(jī)械故障的診斷正確率[1-2]。監(jiān)督局部線性嵌入算法(Supervised Locally Linear Embedding,SLLE)通過調(diào)節(jié)樣本間的局部鄰域結(jié)構(gòu)實(shí)現(xiàn)監(jiān)督學(xué)習(xí),能強(qiáng)化同類樣本的聚集性和異類樣本的互斥性,實(shí)現(xiàn)故障特征流形的解耦與分類及新增樣本的增量處理,提高故障辨識(shí)精度和計(jì)算效率[3-6]。但是,現(xiàn)有SLLE方法存在:①低維輸出向量在重構(gòu)過程中監(jiān)督學(xué)習(xí)能力弱;②參數(shù)優(yōu)化能力不足等問題。導(dǎo)致SLLE對(duì)故障特征提取精度差。針對(duì)上述問題,需要對(duì)SLLE進(jìn)行改進(jìn)。
SLLE根據(jù)類標(biāo)簽尋找每個(gè)訓(xùn)練樣本xi∈X的k個(gè)同類鄰近點(diǎn),采用放大異類樣本間歐式距離,保持同類樣本間距離不變的方法來拉大異類樣本之間的距離,用公式[3-7]
將不同類樣本分別映射到低維空間,保證鄰域中同類點(diǎn)占多數(shù)的狀態(tài)。其中S=‖xi-xj‖為未考慮類標(biāo)簽信息時(shí)的歐式距離,max(S)=maxi,j‖xi-xj‖為樣本間的最大距離,S′為融入類標(biāo)簽信息的距離。若xi和xj屬于異類,則δ(xi,xj)=0;否則,δ(xi,xj)=1。α∈[0,1]為折中系數(shù),用于控制類信息的融入程度。
采用式(1)構(gòu)造訓(xùn)練樣本集中每個(gè)樣本點(diǎn)xi的k個(gè)最近鄰點(diǎn)集合,運(yùn)用
為使輸出向量yi在低維空間盡量保持高維空間的拓?fù)浣Y(jié)構(gòu),代價(jià)函數(shù)[8]
必須最小。yi是矩陣Y的列向量;式中yij(j=1,2,…,k)是yi在嵌入空間的k鄰近點(diǎn)。且必須滿足
式中I是單位矩陣。在計(jì)算式(3)的最優(yōu)解時(shí),ε(Y)可寫成[8]
式中M是一個(gè)n×n的對(duì)稱矩陣,其表達(dá)式[8]為
式(3)最小解為矩陣M的d個(gè)最小特征值所對(duì)應(yīng)的特征向量構(gòu)成的矩陣Y,則Y的列向量維數(shù)為d。
針對(duì)現(xiàn)有SLLE方法在低維輸出向量重構(gòu)過程中監(jiān)督學(xué)習(xí)能力不足的問題,利用訓(xùn)練樣本類標(biāo)簽信息擴(kuò)大不同類樣本之間平均距離的方式構(gòu)造監(jiān)督學(xué)習(xí)機(jī)制,增強(qiáng)SLLE的特征提取精度。
圖1 改進(jìn)SLLE監(jiān)督學(xué)習(xí)原理示意圖Fig.1 Learningmechanism of improved supervised locally linear embedding algorithm
式(3)與式(10)具有相同表達(dá)形式。通過最小化兩式的和,求取低維輸出向量。但是,兩式目標(biāo)值大小和數(shù)量級(jí)存在差異,故設(shè)立折中系數(shù)β進(jìn)行協(xié)調(diào)。
式中φ(y,β)最小時(shí),即式(3)與式(10)兩式分別最小時(shí),獲得的低維輸出向量y即為所求。式(12)進(jìn)一步改寫為
設(shè)新樣本為xnew,它在訓(xùn)練樣本集中的k個(gè)最近鄰點(diǎn)為xj,j=1,2,…,k。yj為xj的低維輸出向量。令X=[xi,x2,…,xk],Y=[y1,y2,…,yk]?,F(xiàn)有SLLE方法利用公式[3-4,9]:
計(jì)算映射矩陣A。然后通過矩陣A計(jì)算新樣本的低維輸出向量。但是,當(dāng)XT為不滿秩矩陣時(shí),如:鄰近點(diǎn)數(shù)目k小于高維空間維數(shù)D時(shí),矩陣A計(jì)算困難。
LLE方法必須滿足兩個(gè)前提假設(shè):在高維空間滿足[8]
本文推薦的方法是先找出新樣本在訓(xùn)練樣本集中的k個(gè)鄰近點(diǎn)xj,j=1,…,k,計(jì)算xnew和xj間的權(quán)值wij。由于yj已經(jīng)利用改進(jìn)SLLE計(jì)算得到,使用式(16)可計(jì)算出ynew,注意使用式(16)時(shí),要求重構(gòu)誤差較小。
式(1)和式(13)中的折中系數(shù)α和β,以及嵌入維數(shù)d和鄰域大小k都會(huì)影響故障特征的提取精度[10],需要進(jìn)行優(yōu)化。
4.1 改進(jìn)SLLE參數(shù)的優(yōu)化準(zhǔn)則
本文推薦采用規(guī)范切割(簡(jiǎn)稱Ncut)準(zhǔn)則和重構(gòu)誤差作為參數(shù)優(yōu)化準(zhǔn)則。Ncut準(zhǔn)則能用于衡量類可分性的優(yōu)劣。設(shè)樣本點(diǎn)能劃分為K類,Ci是屬于類i的樣本點(diǎn)集合,則Ncut準(zhǔn)則[11-13]為
式中d(xi,xj)是頂點(diǎn)xi和xj間的歐式距離,σi(σj)是頂點(diǎn)xi(xj)與鄰域點(diǎn)的平均距離。如果邊(xi,xj)?E,則S=0。由式(18)可知S∈[0,1],使不同維度空間計(jì)算得到的邊權(quán)值具有可比性,進(jìn)一步使衡量類可分性的Ncut值在不同子空間具有可比性。
新樣本通過式(16)提取故障特征,為了使新樣本具有較高的故障特征提取精度,式(3)中重構(gòu)誤差ε越小越好。
4.2 基于離散粒子群的參數(shù)優(yōu)化算法
式中:i=1,2,…,L,j=1,2,…,N;r1j,r2j和ρ是[0,1]上均勻分布的隨機(jī)數(shù);ω,c1和c2是權(quán)重及加速度系數(shù)。
基于離散粒子群的參數(shù)優(yōu)化算法如下:
步驟1 初始化粒子群參數(shù)。設(shè)置種群大小、粒子維數(shù);
步驟2 計(jì)算每個(gè)粒子適應(yīng)度值。將二值粒子轉(zhuǎn)化為十進(jìn)制參數(shù)值,利用改進(jìn)SLLE算法計(jì)算訓(xùn)練樣本的低維輸出向量。將式(3)和式(17)同時(shí)作為適應(yīng)度函數(shù),分別計(jì)算兩式的值。步驟3 計(jì)算個(gè)體適應(yīng)度最好位置第t+1次迭代后,粒子xi(t+1)的適應(yīng)度值比它歷史最好位置的適應(yīng)度值小時(shí),即:目前計(jì)算得到的重構(gòu)誤差和Ncut值同時(shí)小于或等于歷史最好位置的重構(gòu)誤差和Ncut值的情況下,更新粒子xi的歷史最好位置xpi。
步驟4 計(jì)算全局最好位置。利用全局最好位置計(jì)算得到的重構(gòu)誤差和Ncut值要同時(shí)小于或等于個(gè)體最好位置的重構(gòu)誤差和Ncut值。
步驟5 利用式(18)~式(20)更新粒子速度和位置。
步驟6 檢測(cè)是否達(dá)到終止條件。如果達(dá)到則停止,否則返回步驟2。
5.1 實(shí)驗(yàn)?zāi)康暮头椒?/p>
在相同條件下,與現(xiàn)有方法進(jìn)行對(duì)比實(shí)驗(yàn)研究,證明改進(jìn)SLLE方法提取的故障特征向量靈敏度更高;特征向量維數(shù)更小。
對(duì)比實(shí)驗(yàn)中涉及的方法有:①改進(jìn)SLLE方法。該方法在軸承故障特征提取中同時(shí)應(yīng)用重構(gòu)誤差和Ncut準(zhǔn)則作為適應(yīng)度函數(shù),應(yīng)用離散粒子群算法優(yōu)化折中系數(shù)α和β、以及嵌入維數(shù)和鄰域大小,應(yīng)用式(16)提取新樣本故障特征。②SLLE方法[3-4]。該方法在軸承特征提取過程中應(yīng)用局部協(xié)方差矩陣的特征值來確定嵌入維數(shù),用十折交叉驗(yàn)證法確定鄰域大小和折中系數(shù)α,應(yīng)用式(14)提取新樣本的故障特征。③LLE方法和基于相關(guān)熵的局部線形嵌入算法(CCLLE)[13]。兩種方法在軸承故障特征提取中應(yīng)用Ncut準(zhǔn)則優(yōu)化嵌入維數(shù)和鄰域大小,應(yīng)用式(16)提取新樣本故障特征。
5.2 實(shí)驗(yàn)數(shù)據(jù)來源
實(shí)驗(yàn)數(shù)據(jù)來源和原始特征集的構(gòu)造方法與文獻(xiàn)[13]相同。選擇美國Case Western Reserve University電氣工程實(shí)驗(yàn)室提供的SKF6205型深溝球軸承在正常和不同故障狀態(tài)下的振動(dòng)信號(hào)數(shù)據(jù)進(jìn)行分析研究。從軸承振動(dòng)信號(hào)中提取波峰指標(biāo)、峭度指標(biāo)、偏度指標(biāo)、裕度指標(biāo)、標(biāo)準(zhǔn)差、均方根和峰值等7個(gè)時(shí)域特征。采用小波包函數(shù)將不同狀態(tài)下的滾動(dòng)軸承振動(dòng)信號(hào)進(jìn)行p層正交小波包分解,得到由全頻帶均勻劃分的2p個(gè)子頻帶的濾波信號(hào),將各頻帶信號(hào)的能量作為原始特征集[13]。原始特征集由時(shí)域特征和頻域特征共同構(gòu)成,共計(jì)7+2p個(gè)特征。
5.3 實(shí)驗(yàn)過程
在不同轉(zhuǎn)數(shù)、采樣頻率和故障尺寸情況下,選取正常狀態(tài)、滾珠故障、內(nèi)圈故障和外圈故障等4種狀態(tài)下的軸承振動(dòng)信號(hào)。
(1)實(shí)驗(yàn)一
信號(hào)采樣頻率為48 kHz,轉(zhuǎn)速1 750 r/min,故障尺寸0.036 cm,進(jìn)行p=7層正交小波包分解,得到135個(gè)特征。每種狀態(tài)樣本數(shù)為29,樣本長(zhǎng)度為16 384,計(jì)算原始特征集。首先,在每種狀態(tài)中隨機(jī)選取15個(gè)樣本組成訓(xùn)練樣本集,其余作測(cè)試樣本。需要特別指出:應(yīng)用SLLE方法時(shí),如果按十折交叉驗(yàn)證法要求,將訓(xùn)練樣本分成10個(gè)測(cè)試子集,每個(gè)測(cè)試子集中每類樣本平均只有1.5個(gè),數(shù)量太少。為提高每個(gè)測(cè)試子集不同類樣本的數(shù)量,實(shí)驗(yàn)中將訓(xùn)練樣本分成5折。鄰域和折中系數(shù)α的步長(zhǎng)與文獻(xiàn)[3-4]一致。改進(jìn)SLLE算法中離散粒子群的迭代次數(shù)為400。然后,計(jì)算訓(xùn)練樣本的低維輸出向量,并將結(jié)果用于訓(xùn)練概率神經(jīng)網(wǎng)絡(luò)分類器;接下來,提取新樣本的低維輸出向量;最后,將新樣本低維輸出向量輸入概率神經(jīng)網(wǎng)絡(luò)分類器分類。所有實(shí)驗(yàn)中,分類器參數(shù)不變。識(shí)別正確率和優(yōu)化參數(shù)見表1。
表2 實(shí)驗(yàn)二結(jié)果Tab.2 Classification result of Experiment 2
(2)實(shí)驗(yàn)二
信號(hào)采樣頻率為12 kHz,轉(zhuǎn)速1 730 r/min,故障尺寸0.018 cm,每種狀態(tài)樣本數(shù)為58,樣本長(zhǎng)度為2 048。計(jì)算原始特征集時(shí),進(jìn)行p=5層正交小波包分解,小波特征和時(shí)域特征共計(jì)39個(gè)。首先,在每種狀態(tài)中隨機(jī)選取40個(gè)樣本組成訓(xùn)練樣本集,其余作為驗(yàn)證樣本。應(yīng)用SLLE方法時(shí),將訓(xùn)練樣本分成10個(gè)測(cè)試子集。其它實(shí)驗(yàn)步驟和實(shí)驗(yàn)一相同,識(shí)別結(jié)果見表2。
5.4 實(shí)驗(yàn)結(jié)果分析
通過改進(jìn)SLLE方法的低維輸出向量重構(gòu)模型、新樣本的特征提取方法和參數(shù)優(yōu)化方法,能提高軸承故障特征的特征提取精度,同時(shí)獲得較小的維數(shù)。通過實(shí)驗(yàn)證明相對(duì)于局部協(xié)方差特征法和十折交叉法,Ncut準(zhǔn)則更適合用于對(duì)嵌入維數(shù)和鄰域進(jìn)行優(yōu)化,即使沒有引入監(jiān)督學(xué)習(xí)機(jī)制,Ncut準(zhǔn)則通過有效測(cè)量低維輸出向量的類可分離性,也能提高新樣本的特征提取精度。同時(shí)將重構(gòu)誤差和Ncut值作為參數(shù)優(yōu)化準(zhǔn)則,有利于新樣本特征的提取精度。
[1]栗茂林,王孫安,梁霖.利用非線性流形學(xué)習(xí)的軸承早期故障特征提取方法[J].西安交通大學(xué)學(xué)報(bào),2010,44(5):45-49.
LIMao-lin,WANG Sun-an,LIANG Lin.Feature extraction for incipient fault diagnosis of rolling bearings based on nonlinearmanifold learnging[J].Journal of Xian Jiao Tong University,2010,44(5):45-49.
[2]張紹輝,李巍華.可變近鄰參數(shù)的局部線性嵌入算法及其在軸承狀態(tài)識(shí)別中的應(yīng)用[J].機(jī)械工程學(xué)報(bào),2013,49 (1):81-87.
ZHANG Shao-hui,LIWei-hua.Variable nearest neighbor locally linear embedding and applications in bearing condition recognition[J].Journal of Mechanical Engineering,2013,49 (1):81-87.
[3]李鋒,田大慶,王家序,等.基于有監(jiān)督增量式局部線形嵌入的故障辨識(shí)[J].振動(dòng)與沖擊,2013,32(23):82-88.
LI Feng,TIANG Da-qing,WANG Jia-xu,et al.Fault identification method based on supervised incremental locally linear embedding[J].Journal of Vibration and Shock,2013,32(23):82-88.
[4]Li Ben-wei,Zhang Yun.Supervised locally linear embedding projection(SLLEP)for machinery fault diagnosis[J].Mechanical systems and Signal Processing,2011,25:3125-3134.
[5]閻慶,梁棟,張晶晶.基于Fisher變換的植物葉片圖像識(shí)別監(jiān)督LLE算法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2012,43(9):179-183.
YAN Qing,LIANG Dong,ZHANG Jing-jing.Recognition method of plant leaves based on fisher projection-supervised LLE algorithm[J].Transactions of the Chinese Society for Agricultural Machinery,2012,43(9):179-183.
[6]Zhao Ling-xiao,Zhang Zhen-yue.Supervised locally linear embedding with probability-based distance for classification [J].Computers and Mathematics with Applications,2009,57:919-926.
[7]Ridder D D,Kouropteva O,Okun O.Supervised locally linear embedding[C]//Proceedings of the Joint International Conference,ICANN/ICONIP.Lecture Notes in Computer Science,Springer,Heidelberg,2003:333-341.
[8]Roweis ST,Saul L K.Nonlinear dimensionality reduction by locally linear embedding[J].Science,2000,290(5500):2323-2326.
[9]Nichols J M,Bucholtz F,Nousain B.Automated,rapid classification of signals using locally linear embedding[J].Expert Systemswith Applications,2011,38:13472-13474.
[10]Kouropteva O,Okun O,Pietikainen M.Selection of the optimal parameter value for the locally linear embedding algorithm[C]//In:Fisrt Internat.Conf.on Fuzzy Systems and Knowledge Discovery,2002.
[11]Shi Jian-bo,Malik J.Normalized cuts and image segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(8):888-905.
[12]Tabatabaei S S,Coates M,Rabbat M.GANC:Greedy agglomerative normalized cut for graph clustering[J].Pattern Recognition,2012,45:831-843.
[13]胡峰,蘇訊,劉偉,等.基于改進(jìn)局部線性嵌入算法的故障特征提取方法[J].振動(dòng)與沖擊,2015,34(15):211-215.HU Feng,SU Xun,LIUWei,et al.Fault feature extraction based on improved locally linear embedding[J].Journal of Vibration and Shock,2015,34(15):211-215.
[14]Liu Yan,Gu Xue-ping.Skeleton-network reconfiguration based on topological characteristics of scale-free networks and discrete particle swarm optimization[J].IEEE Transactions on Power Systems,2007,22(3):1267-1274.
[15]Alberto G V,Rafael P.Introducing dynamic diversity into a discrete particle swarm optimization[J].Computer and Operation Research,2009,36(3):951-966.
Fault features extraction based on im proved supervised locally linear embedding
HU Feng,WANG Chuan-tong,WU Yu-chuan,F(xiàn)AN Liang-zhi,YU Lian-qin
(School of Mechanical Science and Automation,Wuhan Textile University,Wuhan 430074,China)
Aiming at the shortage of weak learning ability of the supervised locally linear embedding(SLLE)algorithm being unfavorable to fault feature extraction in reconstructing lower-dimensional output vectors,the learning ability of reconstructedmodel of output vectorswas improved via utilizing the information of class labels of training samples to increase the average distance between sampleswith different class labels.The aggregation of the same class samples and themutual exclusion of sampleswith different class labelswere enhanced.In order to enhance extraction precision of fault features,the binary particle swarm optimal(PSO)algorithm,the normalized cut or Ncut criterion and the reconstruction error were employed to optimize compromise coefficients,embedding dimension and neighborhood size.The improved SLLE was employed in the fault feature extraction of rolling bearings.The test results for fault diagnosis of rolling ball bearings showed that compared with other approaches,ISLLE ismore effective to extract the fault features form vibration signals,and enhance the classification ability of failure pattern.
fault;features extraction;SLLE;normalized cut criterion;PSO
TH17
A
10.13465/j.cnki.jvs.2015.21.021
國家自然科學(xué)基金資助項(xiàng)目(51205294,61271008,51275363)
2014-09-16 修改稿收到日期:2014-11-19
胡峰男,博士,副教授,碩士生導(dǎo)師,1979年生