鄧 韜, 林建輝, 黃晨光, 靳 行
(1. 西南民族大學(xué) 電氣信息工程學(xué)院, 成都 610041; 2. 西南交通大學(xué) 牽引動(dòng)力國(guó)家重點(diǎn)實(shí)驗(yàn)室,成都 610031)
高速列車輪對(duì)軸承故障檢測(cè)的重點(diǎn)在于其早期故障預(yù)警。聲發(fā)射檢測(cè)作為一種故障早期檢測(cè)手段其信號(hào)比振動(dòng)加速度頻率范圍寬、包含的信息量大,能捕捉軸承微小的故障信號(hào)。軸承內(nèi)部運(yùn)動(dòng)狀態(tài)復(fù)雜,滾動(dòng)體與保持架、內(nèi)外圈、擋邊之間呈現(xiàn)高度復(fù)雜的運(yùn)動(dòng)關(guān)系,故障信號(hào)易出現(xiàn)雙沖擊混疊等,加上其他噪聲干擾給聲發(fā)射信號(hào)特征提取及其故障診斷帶來(lái)一定困難[1]。輪軸故障的診斷實(shí)際上就是對(duì)故障信號(hào)進(jìn)行模式分類,提高分類器的工程實(shí)用性是高性能分類器研究的重要目標(biāo)之一。
目前對(duì)高速列車軸承故障的多級(jí)、多態(tài)分辨仍存在困難。如采用人工神經(jīng)網(wǎng)絡(luò)易陷入局部極小值,其結(jié)構(gòu)類型依賴于經(jīng)驗(yàn)[2]。SVM方法在多分類時(shí)難以保證內(nèi)部所有的二分類器核參數(shù)及懲罰因子選取的最優(yōu)性。近年采用稀疏表示的分類方法(Sparse Representation-based Classification, SRC)在圖像、語(yǔ)音分類上表現(xiàn)優(yōu)異,無(wú)需多個(gè)二分類器組合[3],僅通過(guò)樣本在字典下稀疏解的重構(gòu),就可實(shí)現(xiàn)理想的多分類效果。研究軸承故障聲發(fā)射信號(hào)的SRC分類,對(duì)高速列車運(yùn)營(yíng)安全有積極意義。
文獻(xiàn)[4]揭示了SRC優(yōu)異性能更多是基于樣本間協(xié)作而非稀疏性, 并以L2范數(shù)替換L1范數(shù)設(shè)計(jì)了協(xié)作表示分類器(Collaborative Representation Classifer, CRC)提升分類速度,但未考慮樣本類標(biāo)簽。Majumdar等[5]提出采用L1L2混合范數(shù)求解的組稀疏分解模型(Group SRC),可減小稀疏系數(shù)分散,實(shí)現(xiàn)最佳相關(guān)原子選取。此外,基于核協(xié)作表示分類器[6]和加權(quán)的組稀疏算法[7](Weighted GSR)也相繼出現(xiàn),前者通過(guò)核空間取代字典原子和信號(hào)的內(nèi)積運(yùn)算來(lái)解決范數(shù)歸一化問(wèn)題,對(duì)非線性成分更敏感,但分類效果和優(yōu)化機(jī)制還有待驗(yàn)證。后者通過(guò)距離加權(quán)做約束,但復(fù)雜信號(hào)匹配差,且距離約束方法與組范數(shù)特性相違背。
本文針對(duì)軸承故障的組稀疏分類,設(shè)計(jì)了一種帶索引的故障冗余字典,利用信號(hào)多尺度排列熵為原子構(gòu)成索引字典,實(shí)現(xiàn)快速預(yù)匹配以縮小故障類范圍,加快收斂速度。通過(guò)在組LASSO算法中結(jié)合鄰近梯度與最優(yōu)一階優(yōu)化來(lái)減小計(jì)算量;在字典原子獲取上,利用改進(jìn)EEMD結(jié)合VMD方法對(duì)輪對(duì)信號(hào)作分解,實(shí)現(xiàn)原子自適應(yīng)獲取,以保留故障非線性特征。同時(shí)設(shè)計(jì)了一種原子區(qū)間平移稀疏編碼方法來(lái)提高原子匹配性。
定義一個(gè)超完備字典D=[d1,d2,…,dK],D∈Rm×n,D中內(nèi)部原子數(shù)為n,m代表每個(gè)原子的長(zhǎng)度,di代表每個(gè)類別原子集合。設(shè)X∈Rm是待稀疏分類的目標(biāo)信號(hào),則基于字典D對(duì)X進(jìn)行稀疏逼近可通過(guò)下式表述
(1)
式中:C為稀疏分解系數(shù)向量,稀疏分類的前提是基于足夠多的原子,目標(biāo)信號(hào)能用其所屬類別中原子的某種線性組合進(jìn)行表述。當(dāng)一個(gè)超完備字典包含數(shù)個(gè)不同類別原子時(shí),目標(biāo)信號(hào)稀疏表示的非零值將主要對(duì)應(yīng)其所屬類別原子,稀疏逼近誤差為
(2)
尋找稀疏重構(gòu)誤差最小的那類就可判斷目標(biāo)信號(hào)的分類,即
identity(X)=argmin(εi)
(3)
要獲得最終分類結(jié)果,實(shí)際上是解決凸優(yōu)化問(wèn)題。
凸優(yōu)化求解主要有基追蹤(BP)、匹配追蹤(MP)、正交匹配追蹤(OMP)和基于迭代回歸的凸松弛算法(LASSO)等[8]。以L0范數(shù)求解最優(yōu)稀疏模型是個(gè)NP難問(wèn)題,LASSO算法最初由Tibshirani等對(duì)特征系數(shù)通過(guò)L1范數(shù)約束來(lái)計(jì)算,通過(guò)對(duì)稀疏系數(shù)絕對(duì)值懲罰,使絕對(duì)值之和小于某常數(shù)而不相關(guān)原子系數(shù)接近零來(lái)求解。但字典內(nèi)部特征之間存在的組效應(yīng)使L1范數(shù)求解存在稀疏系數(shù)分散問(wèn)題,于是考慮采用L2范數(shù)的組LASSO進(jìn)行GSRC求解。對(duì)一個(gè)組分類問(wèn)題,設(shè)字典D共有K類n個(gè)樣本構(gòu)成,則第i類樣本矩陣為
Di=[di,1,di,2,…,di,ni]∈Rm×ni
(4)
所有類別構(gòu)成的組稀疏向量為
C=[0,…,0,ci,1,ci,2,…,ci,ni,0,…,0]T∈Rn
(5)
給定一種分類信號(hào),不失一般,僅有若干特征對(duì)這一信號(hào)具有區(qū)別性,即從中所提取的特征對(duì)某一特定信號(hào)而言是冗余的。式(5)中除與第i類樣本對(duì)應(yīng)的系數(shù)外其余系數(shù)均為0或逼近0,體現(xiàn)出了同類樣本的集中性和其他類樣本的稀疏性?;贚1L2混合范數(shù)約束的GSRC模型可表述為
(6)
該模型可減小在多相關(guān)類中零散選擇樣本的情況,強(qiáng)化在同一相關(guān)類中原子選擇的集中性,同時(shí)實(shí)現(xiàn)各組內(nèi)原子的最優(yōu)選擇。
LASSO優(yōu)化求解常采用最小角回歸、快速乘法交替方向、塊稀疏匹配追蹤和梯度下降法。梯度下降法在計(jì)算復(fù)雜度上有一定優(yōu)勢(shì),是利用迭代公式和局部梯度信息計(jì)算的一種一階方法,即
(7)
(8)
梯度步長(zhǎng)求解鄰近運(yùn)算有
(9)
通過(guò)鄰近梯度法獲得ck展開的目標(biāo)函數(shù)為
(10)
式中:ρ∈[0,1]為正則化參數(shù),以平衡過(guò)擬合與稀疏性,搜索點(diǎn)bi為bi=ci+ωi(ci-ci-1)其中ωi為調(diào)節(jié)系數(shù)。對(duì)式(10)采用最優(yōu)一階加速算法有
(11)
通過(guò)設(shè)定軟閾值即可求解,可明顯減小計(jì)算量。
字典可分為參數(shù)化的分析字典和基于訓(xùn)練的學(xué)習(xí)字典。前者通過(guò)參數(shù)波形函數(shù)獲取原子,如Fourier字典、Gabor字典和基于小波時(shí)間尺度字典等,其理論成熟構(gòu)造簡(jiǎn)單,但適應(yīng)性和稀疏性差。學(xué)習(xí)型字典通過(guò)學(xué)習(xí)和訓(xùn)練獲得與目標(biāo)信號(hào)在結(jié)構(gòu)和形態(tài)上更匹配的原子庫(kù),如采用K-SVD方法對(duì)字典原子逐列更新,但配性能仍依賴初始原子。
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)無(wú)需基函數(shù)就可實(shí)現(xiàn)信號(hào)的自適應(yīng)拆分,前期在文獻(xiàn)[9]中提出了一種軸承故障聲發(fā)射信號(hào)提取的改進(jìn)噪聲加入EEMD方法,分解效果較好。若把包含聲發(fā)射特征頻段的幾個(gè)高頻模態(tài)作為字典初始原子,將獲得稀疏性很高且原子都為自適應(yīng)獲取的字典。但從原子體積和復(fù)雜度上看該分解并不充分,IMF內(nèi)部復(fù)雜構(gòu)成和噪聲干擾將弱化其匹配性,因此有必要對(duì)IMF作進(jìn)一步拆分。
VMD作為一種新的信號(hào)拆分新手段,通過(guò)不同頻率中心及帶寬迭代搜尋變分模型自適應(yīng)對(duì)信號(hào)進(jìn)行分離,本質(zhì)是尋找所設(shè)定的K個(gè)固有模態(tài)函數(shù)估計(jì)帶寬之和達(dá)到最小??紤]約束變分問(wèn)題
(12)
式中:{uk}是模態(tài)集合,{wk}是其中心頻率集合,σ(t)為脈沖函數(shù);對(duì)uk分別作Hilbert變換并與指數(shù)函數(shù)e-jwkt相乘可估算uk中心頻率wk。計(jì)算wk在基頻帶調(diào)制信號(hào)梯度L2范數(shù),可估計(jì)uk帶寬。引入一個(gè)擴(kuò)展Lagrange函數(shù)
(13)
(14)
(15)
(16)
式中:τ為步長(zhǎng),若滿足收斂條件c則停止更新,即
(17)
VMD方法雖然是自適應(yīng)進(jìn)行的,但結(jié)果受分量個(gè)數(shù)K和懲罰參數(shù)α影響。根據(jù)經(jīng)驗(yàn),α可參考信號(hào)采樣率進(jìn)行設(shè)置,不應(yīng)偏離太多。K過(guò)小會(huì)出現(xiàn)欠分解,過(guò)大則易出現(xiàn)虛假模態(tài)。虛假模態(tài)與相鄰模態(tài)中心頻率相隔很近,因此考慮以各模態(tài)分量中心頻率的最小間距限定K取值上限來(lái)避免過(guò)分解,即設(shè)定較大初始K值逐次遞減做計(jì)算,直至中心頻率間隔滿足要求。
利用EMD分解剔除低頻干擾后對(duì)剩余IMF做VMD分解易提取出較低能量的高頻信息,且IMF相對(duì)窄的帶寬可降低K值。把分解出的若干窄帶模態(tài)作為字典原子,原子復(fù)雜性顯著降低,因整個(gè)過(guò)程是自適應(yīng)的,所以仍可保障匹配稀疏性。
軸承故障一般呈現(xiàn)周期性,從訓(xùn)練數(shù)據(jù)和待分類數(shù)據(jù)中截?cái)嗵崛颖倦y以確保故障沖擊波形總是位于截?cái)鄶?shù)據(jù)的正中心,這種故障信號(hào)在時(shí)間軸上偏移造成的匹配誤差會(huì)影響稀疏分解效果。
Smith等提出的移不變稀疏編碼方法(Shift Invariant Sparse Coding, SISC),把同一模式沿時(shí)間軸平移當(dāng)做獨(dú)立事件,利用基函數(shù)的移不變性,即字典中原子與稀疏系數(shù)通過(guò)卷積運(yùn)算實(shí)現(xiàn)信號(hào)逼近,每一近似波形都通過(guò)同一原子的任意時(shí)移來(lái)表達(dá)。SISC對(duì)周期信號(hào)的匹配性更強(qiáng),但求解稀疏基計(jì)算量較大。對(duì)此有學(xué)者提出如差分求導(dǎo)或轉(zhuǎn)化為頻域求和來(lái)簡(jiǎn)化計(jì)算[10]。受SISC算法啟發(fā),為進(jìn)一步簡(jiǎn)化計(jì)算,提出一種原子區(qū)間平移稀疏編碼方法(Interval Translation Sparse Coding,ITSC)。定義平移系數(shù)?,平移后原子為di?。圖1給出了平移操作計(jì)算步驟示意,具體步驟如下:
(2) 確定平移方向后,平移范圍變?yōu)?-0,+a),平移中點(diǎn)變?yōu)?b,繼續(xù)按步驟1中內(nèi)積做判斷。
(3) 依次做平移計(jì)算,直至迭代后新原子與信號(hào)內(nèi)積無(wú)明顯增加時(shí)停止,此時(shí)獲得最終平移系數(shù)?。
圖1 區(qū)間平移構(gòu)建新原子Fig.1 New atom from ITSC
即使原子特征波形與待分解信號(hào)偏移量大于原子長(zhǎng)度一半,只需適當(dāng)放寬a值大小,做一次迭代就可大幅修正偏移。為簡(jiǎn)化計(jì)算,迭代平移次數(shù)可根據(jù)原子長(zhǎng)度設(shè)定為一恒定值。該方法針對(duì)旋轉(zhuǎn)件故障信號(hào)放寬了在數(shù)據(jù)段截取上的要求,實(shí)質(zhì)上是一種簡(jiǎn)便快速的基函數(shù)平移稀疏求解方法。
字典體積過(guò)大會(huì)導(dǎo)致多組類分類計(jì)算量很大。若能以長(zhǎng)度很短的樣本信號(hào)某一“特征”作為原子構(gòu)成故障字典的“索引”,經(jīng)過(guò)“索引”預(yù)先提取“最相關(guān)類”組成新字典再進(jìn)行故障匹配,則無(wú)需字典中所有類別都參與計(jì)算。只要這一特征能較好區(qū)別各故障,與待分類信號(hào)匹配的原子所屬“類”將只占整個(gè)字典類的很小部分,從而加快分類速度。
索引字典原子長(zhǎng)度越小,其匹配時(shí)間越短。當(dāng)待分類信號(hào)特征索引與索引字典原子逐一匹配后,滿足不大于給定誤差εsy的索引原子所指向的故障字典類被選中,εsy足夠小時(shí),選中的相關(guān)類字典組體積將遠(yuǎn)小于整個(gè)故障字典組。
構(gòu)建索引字典的核心是尋找適合的字典原子。排列熵(Permutation Entropy,PE)作為一種序列隨機(jī)性和動(dòng)力學(xué)突變的檢測(cè)方法指標(biāo),能有效反應(yīng)信號(hào)內(nèi)部特征,相比條件熵和樣本熵其抗噪能力更強(qiáng)。但單一尺度排列熵還難以揭示復(fù)雜信號(hào)內(nèi)部豐富信息。多尺度排列熵(Multiscal PE)能在多尺度下反應(yīng)信號(hào)復(fù)雜性,噪聲魯棒性更好,在各尺度下都只輸出一個(gè)無(wú)量綱參數(shù),數(shù)據(jù)很短,故本文嘗試將其作為故障聲發(fā)射信號(hào)特征來(lái)構(gòu)建索引字典。
考慮一個(gè)故障序列{X(i):i=1,2,…,L},首先對(duì)X作粗粒化處理,然后計(jì)算各尺度下排列熵。粗?;蛄锌杀硎緸閧Y^ε(I):I=1,2,…,L/ε},其中
(18)
對(duì)Yε(I)進(jìn)行相空間重構(gòu),嵌入維數(shù)為m,延遲時(shí)間為t,有
(19)
式中:每行表示一個(gè)重構(gòu)分量,重構(gòu)個(gè)數(shù)為k,k=L-(m-1)t,j=1,2,…,k。將尺度I下Yε的m個(gè)數(shù)據(jù)按升序重新排列,可獲得如下符號(hào)序列
Sl=(j1,j2,…,jm)
(20)
(21)
Pl為1/m!時(shí)有最大值ln(m!),歸一化排列熵為
(22)
排列熵中有3個(gè)重要參數(shù),嵌入維數(shù)m、數(shù)據(jù)長(zhǎng)度L和時(shí)延t。一般建議嵌入維數(shù)取3~7,m過(guò)小,重構(gòu)序列會(huì)因包含狀態(tài)太少而失去意義;m過(guò)大,會(huì)使相空間重構(gòu)序列均勻化,運(yùn)算量增大的同時(shí)降低對(duì)細(xì)微變化的敏感性。L,m和t之間應(yīng)該根據(jù)信號(hào)實(shí)際采樣率決定,L和m的取值應(yīng)盡量保持正相關(guān),t對(duì)數(shù)據(jù)序列的影響很小[11],一般取固定值1。
圖2給出了基于索引組合冗余字典的GSRC輪對(duì)軸承故障狀態(tài)分類流程。
圖2 索引組合冗余字典GSRC分類流程Fig.2 The classification process of GSRC
故障樣本經(jīng)改進(jìn)EEMD分解后選取包含典型聲發(fā)射頻段的IMF分量做VMD分解。以含特征頻帶主能量的分量重構(gòu)并計(jì)算各尺度排列熵作為索引字典原子,所有分量直接作為對(duì)應(yīng)故障類初始原子。重構(gòu)信號(hào)多尺度排列熵受不相關(guān)頻段影響小,而以全部分量作為故障類原子是為了方便信號(hào)重構(gòu)。
待分類信號(hào)經(jīng)同樣方法分解,其多尺排列熵與索引字典原子匹配后,選中滿足給定誤差范圍的索引原子對(duì)應(yīng)類別構(gòu)成新的相關(guān)類字典。為強(qiáng)化字典性能,故障類字典中原子可采用K-SVD優(yōu)化。以最優(yōu)一階加速組LASSO算法結(jié)合ITSC對(duì)待分類模態(tài)重構(gòu)信號(hào)做組稀疏匹配即可獲得分類結(jié)果。
索引字典采用逐一匹配方式,各類間差異較大時(shí),誤差εsy應(yīng)適當(dāng)放寬來(lái)防止類別漏選。差異較小且各類間排列熵分布較一致時(shí),εsy需盡量小,以確保選中相關(guān)類字典緊湊性,減小不相關(guān)類選中概率。
采用輪對(duì)跑合臺(tái)獲取列車輪對(duì)軸承故障聲發(fā)射信號(hào),如圖3所示。WSa型聲發(fā)射傳感器固定于軸箱側(cè)方呈上下放置,采樣率1 Msps,放大倍率20 dB,試驗(yàn)速度0~200 km/h。詳細(xì)制作故障設(shè)置,見表1。
圖3 試驗(yàn)驗(yàn)證Fig.3 Experimental platform表1 七種故障軸承設(shè)置Tab.1 Fault setting
編號(hào)故障類型故障說(shuō)明1外圈內(nèi)表面故障3凹痕寬深1 mm,等角分布2保持架故障滾動(dòng)體間保持架斷裂3滾動(dòng)體故障2滾動(dòng)體凹痕寬深1 mm,間隔分布4故障1、2、3復(fù)合故障5故障1、2復(fù)合故障6故障1、3復(fù)合故障7故障2、3復(fù)合故障
聲發(fā)射數(shù)據(jù)段以包絡(luò)線峭度變化結(jié)合等時(shí)間隔抽取獲得。圖4為200 km/h下單故障和三類復(fù)合故障聲發(fā)射波形,除缺陷沖擊波形外還伴有許多其他干擾,表明軸承內(nèi)各部件運(yùn)動(dòng)聲發(fā)射信號(hào)的復(fù)雜性。
圖4 200 km/h速度級(jí)下故障時(shí)域圖Fig.4 The 200 km/h test signals
圖5為一段滾動(dòng)體聲發(fā)射信號(hào)經(jīng)改進(jìn)EEMD分解的IMF2波形圖,中心頻率309 kHz,頻率范圍272~353 kHz。對(duì)其做VMD分解,按中心頻率平均間隔8 kHz設(shè)定起始分量數(shù)K=10,在290 kHz、310 kHz、330 kHz和340 kHz存在相近中心頻率,見圖6(a)。K值依次遞減到6,中心頻率見圖6(b),此時(shí)相近頻率模態(tài)消失。圖7為分解得到的6個(gè)模態(tài),判斷前三個(gè)分量含特征頻帶主能量,據(jù)此重構(gòu)計(jì)算多尺度排列熵獲取索引字典原子,所有6個(gè)分量直接作為滾動(dòng)體裂紋故障類中初始原子。
圖5 滾動(dòng)體裂紋改進(jìn)EEMD分解后IMF2波形Fig.5 The IMF2 of a Rolling body crack signals use MEEMD
(a)
(b)圖6 K取10和6時(shí)各模態(tài)中心頻率Fig.6 The modal center frequency(K=10,K=6)
圖7 K=6時(shí)初始原子Fig.7 The initial atoms(K=6)
分別對(duì)七類故障數(shù)據(jù)做改進(jìn)EEMD分解,為減小誤差,同類故障字典訓(xùn)練樣本取自相同速度級(jí)。對(duì)100~400 kHz包含典型聲發(fā)射頻段的前四個(gè)IMF經(jīng)VMD分解和特征頻段重構(gòu),排列熵值基本在嵌入維數(shù)為6和7時(shí)進(jìn)入相對(duì)穩(wěn)態(tài),在嵌入維數(shù)取7、時(shí)延t=1時(shí)計(jì)算前12個(gè)尺度下排列熵如圖8所示。第2和第3個(gè)重構(gòu)IMF多尺度排列熵變化曲線差異最明顯,選取2、3分量的多尺度排列熵作為索引原子可獲得最好的索引性能。
圖9(a)和9(b)分別為隨機(jī)抽取的10組單一滾動(dòng)體故障和12組包含三類復(fù)合故障的多尺度排列熵。單一故下分布一致性好,表明多尺度排列熵作為索引字典原子是可行的,其他單一故障也有類似分布,限于篇幅此處未給出。復(fù)合故障存在幾個(gè)不同的排列熵分布,說(shuō)明信號(hào)內(nèi)個(gè)組分變化多,字典訓(xùn)練需要更多的樣本來(lái)涵蓋可能出現(xiàn)的各類故障。排列熵計(jì)算中,沖擊信號(hào)較弱時(shí)應(yīng)縮短計(jì)算數(shù)據(jù)長(zhǎng)度,否則AE信號(hào)占比過(guò)少將影響計(jì)算結(jié)果。
圖8 各故障前四個(gè)IMF-VMD特征頻率多尺度排列熵
Fig.8 The multiscal PE of first 4 IMF-VMD
(a)
(b)圖9 單一滾動(dòng)體故障及三種復(fù)合故障多尺度排列熵Fig.9 The multiscal PE of the Rolling body crack and the Combination failure
為驗(yàn)證原子區(qū)間平移稀疏編碼(ITSC)效果,每類故障各取25個(gè)樣本做識(shí)別,平移范圍設(shè)為原子長(zhǎng)度一半,以分析字典原子個(gè)數(shù)對(duì)分類識(shí)別率影響。因復(fù)合故障隨機(jī)抽取的數(shù)據(jù)段中可能只出現(xiàn)單一故障波形,故此時(shí)分類到所屬單一故障視為正確識(shí)別。對(duì)比結(jié)果如圖10(a)和10(b)所示,觀察字典尺寸,本文提出的ITSC方法在原子利用率上優(yōu)勢(shì)明顯,在較少訓(xùn)練樣本下通過(guò)原子平移和迭代尋找最佳匹配減小了訓(xùn)練樣本提取壓力,利用較少原子就能實(shí)現(xiàn)較高精度的匹配和分類。
(a)
(b)圖10 采用ITSC前后字典尺寸與識(shí)別率的關(guān)系Fig.10 ITSC impact on dictionary size and recognition rate
同一故障在100 km/h、150 km/h、200 km/h三種速度級(jí)下聲發(fā)射信號(hào)存在一定差異,為進(jìn)一步檢驗(yàn)本文方法分類性能,對(duì)不同速度級(jí)下單一故障各取40組數(shù)據(jù),復(fù)合故障各取80組數(shù)據(jù)進(jìn)行分類試驗(yàn),訓(xùn)練樣本和待分類樣本按3∶1劃分。圖11給出了幾組待分類樣本在不同正則化參數(shù)以及是否采用ITSC編碼時(shí)稀疏系數(shù)分布和重構(gòu)誤差情況。
正則化參數(shù)ρ=0.6時(shí)采用ITSC獲得七個(gè)正確分類結(jié)果,其中單一故障選中原子種類比復(fù)合故障少,整體誤差也更小,分析原因是單一故障字典中原子少且匹配性能較好,復(fù)合故障受限于訓(xùn)練樣本個(gè)數(shù)以及字典體積,在原子匹配和重構(gòu)誤差上會(huì)受影響??紤]聲發(fā)射信號(hào)具有瞬時(shí)性和局部性,復(fù)合故障的故障點(diǎn)難以同時(shí)被傳感器捕捉,此時(shí)基于排列熵的索引比對(duì)可能指向單一故障類字典。為驗(yàn)證此時(shí)分類性能,根據(jù)聲發(fā)射沖擊間隔和波形比對(duì),對(duì)包含三種復(fù)合故障軸承截取一段只包含滾動(dòng)體故障的數(shù)據(jù),采用單一滾動(dòng)體故障類字典作匹配,其稀疏系數(shù)分布見圖第4行第3列。稀疏性較第3行單一故障差,原因可能是復(fù)合故障中其他缺陷產(chǎn)生的高頻沖擊信號(hào)并未完全衰減,存在波形疊加。試驗(yàn)中復(fù)合故障訓(xùn)練樣本已經(jīng)包含三類單一故障信號(hào),所以分類結(jié)果并未出錯(cuò),檢驗(yàn)了方法的識(shí)別性能。
圖11 稀疏系數(shù)分布和重構(gòu)誤差Fig.11 Sparse coefficient distribution and reconstruction error
進(jìn)一步分析原子區(qū)間平移稀疏匹配問(wèn)題,圖中第3行第3列為常規(guī)方法計(jì)算的稀疏系數(shù),在分類誤差相近的情況下稀疏性明顯較ITSC方法差。
分析正則化參數(shù)對(duì)組稀疏分類結(jié)果的影響,圖中第4行圓點(diǎn)為正則化參數(shù)ρ=0且未采用索引字典計(jì)算的稀疏系數(shù)分布,此時(shí)重構(gòu)精度較高,但原子選取類別跨度大。ρ=1時(shí)有最佳稀疏性(第6行方框),但重構(gòu)誤差較大。所以本文選取正則化參數(shù)為0.6以平衡組間稀疏性和重構(gòu)性。
表2為三種速度級(jí)下幾種分類方法對(duì)比,均采用基于最優(yōu)一階加速的組LASSO算法求解,運(yùn)行CPU為2.4 G-I5,內(nèi)存8 G。本文方法提取的原子單個(gè)原子長(zhǎng)度較長(zhǎng),但字典原子數(shù)比采用Gabor原子學(xué)習(xí)字典少的多,原子匹配能力更強(qiáng),稀疏性也更好,識(shí)別率明顯高于Gabor字典。采用索引組合字典時(shí),雖然需要計(jì)算數(shù)據(jù)排列熵,且增加了一個(gè)字典用于索引,但在未明顯降低識(shí)別率情況下仍縮減了計(jì)算時(shí)間。通過(guò)結(jié)合本文提出的ITSC方法,分類整體計(jì)算時(shí)間雖有所增加,但識(shí)別精度顯著提高,平均重構(gòu)誤差在所有方法中最低。
表2 幾種方法分類對(duì)比Tab.2 Classification performance comparison
(1) 改進(jìn)EEMD結(jié)合VMD方法能夠自適應(yīng)獲得與故障信號(hào)高度相關(guān)的字典原子,相比傳統(tǒng)字典構(gòu)造方法能更好的保留故障信號(hào)內(nèi)部信息。
(2) 多尺度排列熵能反應(yīng)故障的內(nèi)部信息,其構(gòu)成的小體積索引字典能快速實(shí)現(xiàn)故障的預(yù)匹配,縮小故障類范圍,從而加快分類速度。
(3) 原子區(qū)間平移稀疏編碼算法可大幅擴(kuò)展原子匹配性能,降低樣本數(shù)據(jù)截取數(shù)量和截取要求,在字典緊湊性和分解稀疏性上優(yōu)勢(shì)明顯。
(4) 本文提出的GSRC方法用于軸承故障聲發(fā)射信號(hào)分類識(shí)別,無(wú)需復(fù)雜參數(shù)設(shè)置,對(duì)經(jīng)驗(yàn)依賴小,實(shí)現(xiàn)了較高的分類精度。