申永軍, 段春宇, 王杜娟,楊紹普
(1.石家莊鐵道大學(xué)機(jī)械工程學(xué)院 石家莊, 050043)(2.中國中鐵工程裝備集團(tuán)有限公司 鄭州, 450016)
?
基于α穩(wěn)定分布和支持向量機(jī)的軸承模式分類*
申永軍1, 段春宇1, 王杜娟2,楊紹普1
(1.石家莊鐵道大學(xué)機(jī)械工程學(xué)院 石家莊, 050043)(2.中國中鐵工程裝備集團(tuán)有限公司 鄭州, 450016)
針對滾動軸承發(fā)生故障時振動信號表現(xiàn)出來的脈沖特性,提出了一種基于α穩(wěn)定分布和支持向量機(jī)的模式分類方法。介紹了α穩(wěn)定分布的定義和概率密度函數(shù),并與故障軸承振動信號的概率密度函數(shù)曲線進(jìn)行比較,證明了具有脈沖特性的軸承振動信號符合α穩(wěn)定分布。用小波包分解技術(shù)對不同類型的軸承實(shí)測數(shù)據(jù)進(jìn)行分解,并提取相應(yīng)特征參數(shù)作為特征向量,建立支持向量機(jī)診斷模型,進(jìn)行特征模式分類。通過與傳統(tǒng)的基于峭度和方差的模式分類方法進(jìn)行比較,表明該方法具有較高的診斷準(zhǔn)確性。
α穩(wěn)定分布; 小波包分解; 支持向量機(jī); 故障診斷
α穩(wěn)定分布又被稱作非高斯穩(wěn)定分布和重尾分布,是滿足廣義中心極限定理的一類分布。α穩(wěn)定分布概念提出后,在信號處理領(lǐng)域得到了廣泛的關(guān)注。不同領(lǐng)域的人員進(jìn)行了大量關(guān)于α穩(wěn)定分布噪聲下的信號處理研究[1-5],也在故障診斷領(lǐng)域進(jìn)行了一定研究。李長寧等[6]提出了α穩(wěn)定分布的擬合方法并初步用于滾動軸承故障診斷。師寧寧等[7]提出了利用α穩(wěn)定分布對齒輪進(jìn)行故障識別的新方法。
機(jī)械故障診斷用到了很多信號處理和特征提取方法[8-9]。在機(jī)械故障診斷領(lǐng)域,關(guān)于α穩(wěn)定分布理論的研究還不深入,實(shí)際應(yīng)用的很少。滾動軸承發(fā)生故障時反映到振動信號上最明顯的就是脈沖特性,表現(xiàn)出極強(qiáng)的非線性和非平穩(wěn)特征。這種具有脈沖特性的故障振動信號的概率密度分布需要更高精度的處理技術(shù)去擬合,而α穩(wěn)定分布能夠精確地描述具有脈沖特性的信號?;诖?,筆者提出了用α穩(wěn)定分布來擬合具有脈沖特性的滾動軸承振動信號的思路,進(jìn)一步利用小波包分解技術(shù)獲得不同頻段信號,得到了不同故障軸承振動信號的特征參數(shù)并作為特征向量,應(yīng)用支持向量機(jī)進(jìn)行故障模式分類。
如果隨機(jī)變量X存在參數(shù)0<α≤2,γ≥0,-1≤β≤1和實(shí)數(shù)a,使其特征函數(shù)具有式(1)的形式,則隨機(jī)變量X服從穩(wěn)定分布[10]
(1a)
(1b)
其中:α為特征指數(shù),決定該分布的脈沖特性程度;β為對稱參數(shù),表征α穩(wěn)定分布概率密度曲線的偏斜程度;a為位置參數(shù);γ為分散系數(shù),表示α穩(wěn)定分布圍繞位置參數(shù)的分散程度。
當(dāng)α=2時,α穩(wěn)定分布退化為高斯分布,即高斯分布僅是α穩(wěn)定分布的一個特例。一般的α穩(wěn)定分布的概率密度函數(shù)沒有統(tǒng)一的封閉表達(dá)式,但可以得到標(biāo)準(zhǔn)的α穩(wěn)定分布(a=0,γ=1)的概率密度函數(shù)的冪級數(shù)展開式。特別是當(dāng)β=0時,稱為對稱α穩(wěn)定分布(symmetricalαstable distribution, 簡稱SαS分布)。標(biāo)準(zhǔn)SαS分布的概率密度函數(shù)為
(2)
圖1給出不同α值所產(chǎn)生的標(biāo)準(zhǔn)SαS分布噪聲隨機(jī)序列;圖2給出了不同α值所對應(yīng)的α穩(wěn)定分布的概率密度函數(shù)曲線及其拖尾細(xì)節(jié)。
圖1 不同α值產(chǎn)生的隨機(jī)序列
從圖1可以看出,服從α穩(wěn)定分布的樣本具有明顯的脈沖特性,非常適合描述滾動軸承等機(jī)械部件中的沖擊型故障信號。從圖2可以看出,α穩(wěn)定分布的PDF曲線比高斯分布的PDF曲線有更顯著的尖峰,卻比高斯分布有更厚重的拖尾,且α值越小,拖尾越厚。因此,α穩(wěn)定分布相比于高斯分布更適合描述脈沖沖擊型的隨機(jī)變量。
2.1 仿真信號處理
由于滾動軸承的故障信號具有明顯的脈沖特性,在統(tǒng)計(jì)信號處理方法的研究中,將其假設(shè)為高斯分布則會帶來較大誤差。以一組滾動軸承故障仿真信號為例,畫出它的概率密度曲線圖,分析其與高斯分布曲線的差異。
圖2 不同α值的概率密度函數(shù)曲線及拖尾細(xì)節(jié)
用兩個諧波頻率調(diào)制一個指數(shù)衰減的脈沖來仿真滾動軸承的脈沖信號,仿真表達(dá)式為
x(k)=e-qt'(sin2πf1kT+1.2sin2πf2kT)
(3)
其中:t'=mod(kT,1/fm);q=550;fm=100 Hz;f1=3 000 Hz;f2=8 000 Hz;采樣間隔T=1/25 ks;q,fm,f1,f2分別表示指數(shù)頻率、調(diào)制頻率和兩個載波頻率。
仿真信號時域波形如圖3所示。
圖3 未加噪聲仿真信號時域波形
利用對數(shù)法估計(jì)得到α=0.22;γ=0.001 8。圖4給出了仿真信號、高斯分布和α穩(wěn)定分布的PDF曲線。從圖中可以看出,α穩(wěn)定分布能夠更準(zhǔn)確地反映滾動軸承振動信號的概率密度分布。
圖4 仿真信號概率密度分布與高斯分布及α穩(wěn)定分布的擬合曲線
2.2 實(shí)驗(yàn)數(shù)據(jù)處理
筆者采用QPZZ-Ⅱ機(jī)械故障模擬及實(shí)驗(yàn)平臺進(jìn)行實(shí)驗(yàn)。選取滾動軸承的型號為NU205EM,在無故障的滾動軸承上進(jìn)行加工,制造出內(nèi)圈故障、外圈故障和滾子故障來模擬實(shí)驗(yàn)。對內(nèi)外圈故障分別在250~1 100 r/min轉(zhuǎn)速過程中采集到28組實(shí)驗(yàn)數(shù)據(jù),然后從中隨機(jī)抽取1組進(jìn)行分析,得到處理結(jié)果如圖5和圖6所示(選取的信號轉(zhuǎn)速為912 r/min)。
圖5 內(nèi)圈故障信號概率密度分布與高斯分布及α穩(wěn)定分布的擬合曲線
圖6 外圈故障信號概率密度分布與高斯分布及α穩(wěn)定分布的擬合曲線
由圖4~圖6可知,無論是仿真信號還是實(shí)際采集到的滾動軸承故障信號,都可以很明顯地觀察到滾動軸承故障信號的脈沖特性。在相同轉(zhuǎn)速下,外圈故障的脈沖性要強(qiáng)于內(nèi)圈故障的脈沖性,其信號分布更集中(信號分布區(qū)間更小),概率密度的尖峰更大。對于實(shí)驗(yàn)數(shù)據(jù)概率密度曲線的擬合,α穩(wěn)定分布的擬合精度要比高斯分布高得多,即脈沖沖擊下的滾動軸承振動信號更符合α穩(wěn)定分布。
3.1 支持向量機(jī)
支持向量機(jī)(support vector machine,簡稱SVM)是從線性可分情況下最優(yōu)分類平面發(fā)展而來,其核心思想是建立一個超平面作為決策曲面,使正反例之間的隔離邊緣最大化[11]。
(4)
該優(yōu)化問題的約束條件為
yi[ωTΦ(xi)]-1+ζi≥0
(5)
其中:ζi為松弛因子(ζi≥0);C為懲罰因子;b為分類閾值;Φ為非線性變換函數(shù)。
松弛變量的值實(shí)際上反映了對應(yīng)的點(diǎn)到底離群有多遠(yuǎn),值越大,點(diǎn)就越遠(yuǎn)。C用來衡量最大間隔和最小分類誤差,太小起不到懲罰作用,太大則由于誤差的影響會導(dǎo)致錯誤。Φ將樣本從原空間映射到高維特征空間,并在高維特征空間中求最優(yōu)分類面。
按照泛函理論,如果一核函數(shù)K(xi,yi)滿足Mercer條件,它就對應(yīng)某一變換空間的內(nèi)積K(xi,yi)=Φ(xi)Φ(yi),因此在高維特征空間只需進(jìn)行內(nèi)積運(yùn)算,而不必知道Φ的具體形式。
SVM中不同的內(nèi)積核函數(shù)可構(gòu)造實(shí)現(xiàn)輸入空間中不同類型的非線性決策面的學(xué)習(xí)機(jī),從而形成不同的算法。常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)和sigmoid核函數(shù)等,筆者采用的是徑向基核函數(shù)(radial basis function,簡稱RBF)。
3.2 特征提取
分析α穩(wěn)定分布中的4個參數(shù),其中對稱系數(shù)對于滾動軸承信號來說,一般情況下等于0或近似等于0,而對于位置參數(shù)也可以通過去均值法使其為0。因此,有效的特征參數(shù)只剩下特征指數(shù)α和分散系數(shù)γ,用對數(shù)法估計(jì)出α和γ,將α和γ作為特征進(jìn)行提取。
3.3 實(shí)驗(yàn)分析
將上述特征提取方法應(yīng)用于軸承的故障診斷實(shí)驗(yàn)中,分別對正常、內(nèi)圈故障、外圈故障、滾子(深)故障和滾子(淺)故障在轉(zhuǎn)速為640~650 r/min進(jìn)行數(shù)據(jù)采集,采樣頻率為4 kHz,采樣點(diǎn)數(shù)為65 536,得到5類樣本數(shù)據(jù),其振動信號的波形如圖7所示。
圖7 滾動軸承振動信號
分別對每類信號估計(jì)特征指數(shù)和分散系數(shù),可以得到2個條件屬性??紤]到每個信號是平穩(wěn)的并且足夠長,因此可以將數(shù)據(jù)分段。筆者將每個信號分成30段,每段數(shù)據(jù)長度為2 000,這樣每種類型的故障就擁有了30個信號,從而產(chǎn)生30組2維向量。每組數(shù)據(jù)對應(yīng)的狀態(tài)類型分別表示如下:1為正常狀態(tài);2為內(nèi)圈故障;3為外圈故障;4為滾子故障(淺);5為滾子故障(深)。從每個類型的30組特征向量中任意選取20組,作為訓(xùn)練樣本,剩下的10組用于檢測,數(shù)據(jù)集的詳細(xì)描述如表1所示。
首先,按照LIBSVM工具箱所要求的格式準(zhǔn)備數(shù)據(jù)集;然后,選用RBF作為核函數(shù),獲得支持向量機(jī)模型;最后,利用獲取的模型進(jìn)行測試。根據(jù)懲罰因子C的不同得到如表2所示結(jié)果。
表1 滾動軸承數(shù)據(jù)集
表2 不同參數(shù)下各種狀態(tài)類型的故障診斷結(jié)果
Tab.2 The fault diagnosis results of various types with different parameters
Cg準(zhǔn)確率/%12345 10.7 6070100100400.076070100100400.0076070100100400.0007607010010040100.7 9070100100400.077070100100400.0076070100100400.00076070100100401000.7 10070100100400.079070100100400.0079070100100400.000790701001004010000.7 10070100100500.0710070100100400.0079070100100400.0007907010010040100000.7 10070100100500.0710070100100500.00710070100100400.0007907010010040
實(shí)驗(yàn)結(jié)果表明:直接應(yīng)用特征指數(shù)和分散系數(shù)進(jìn)行分類,對于外圈故障和滾子故障(淺)的故障分離效果相當(dāng)明顯;懲罰因子對實(shí)驗(yàn)結(jié)果具有一定的影響,通過改變懲罰因子可以提高故障診斷的準(zhǔn)確率;g對結(jié)果的影響不是很大。為了對比基于特征指數(shù)和分散系數(shù)的分類方法與基于峭度和方差的分類方法的效果,筆者做了基于峭度和方差的支持向量機(jī)故障診斷實(shí)驗(yàn),結(jié)果如表3所示。
相比于基于峭度和方差的支持向量機(jī)故障診斷實(shí)驗(yàn)效果,基于α穩(wěn)定分布的支持向量機(jī)故障診斷方法的效果相當(dāng)明顯。然而對于內(nèi)圈故障和滾子(深)故障并不能通過選擇最優(yōu)懲罰因子得到很好的分離效果。究其原因,是僅此兩個特征參數(shù)所構(gòu)成的向量維數(shù)過少,無法滿足分類要求。
表3 基于峭度和方差的故障診斷結(jié)果
Tab.3 The fault diagnosis results of various types based on kurtosis and variance
Cg準(zhǔn)確率/%1234510.7 50508040300.0750508060400.00740508060400.00073040808040100.7 50507040400.0750508060400.00730508050400.0007504080100401000.7 60606040300.0750506060400.00750408060400.0007304070904010000.7 60705040400.0750508060300.00750507060400.00073060706040100000.7 70805020400.0740506060300.00750508050400.00073050807040
3.4 改進(jìn)方法
為了提高分類效果,引入小波包變換,即通過小波包分解的方式進(jìn)行預(yù)處理。應(yīng)用小波包分解技術(shù)[12]將原始信號頻帶進(jìn)行多層次劃分,進(jìn)一步對多分辨分析中未做細(xì)分的高頻部分進(jìn)行分解,使信號更為精細(xì),同時擴(kuò)充了向量維數(shù)。該方法的流程如下。
1) 小波包分解。利用小波包對原始信號進(jìn)行雙層分解,選擇db2作為小波基函數(shù),這樣可以得到4個反映原信號不同頻段特征的信號,此處給出內(nèi)圈故障的小波包分解信號,如圖8所示。
圖8 滾動軸承內(nèi)圈故障小波包分解信號
2) 特征參數(shù)提取。將小波包分解得到的4個信號分別用對數(shù)法估計(jì)其特征指數(shù)α和分散系數(shù)γ,組成一個8維的特征向量。不同工況全部特征指數(shù)α和分散系數(shù)γ的均值和標(biāo)準(zhǔn)差如表4所示。
表4 訓(xùn)練數(shù)據(jù)集不同工況下特征指數(shù)α和分散系數(shù)γ的比較
從表4可以看出,5種工況的特征指數(shù)α和分散系數(shù)γ的標(biāo)準(zhǔn)差都很小,說明比較穩(wěn)定,而且在不同頻段α和γ并不相同,因此α和γ可以作為滾動軸承故障診斷的特征。進(jìn)行上述實(shí)驗(yàn)步驟,利用支持向量機(jī)進(jìn)行分類,得到改進(jìn)后的實(shí)驗(yàn)結(jié)果如表5所示。
利用改進(jìn)后方法能夠很精確地提取故障類型,尤其是正常狀態(tài)、外圈故障和滾子故障(淺),幾乎不受懲罰因子的影響,正確率都能達(dá)到100%;而通過改變懲罰因子,內(nèi)圈故障和滾子故障(深)的正確率也能達(dá)到100%。
為了說明α穩(wěn)定分布在滾動軸承故障診斷中的優(yōu)越性,筆者也在小波包分解的基礎(chǔ)上進(jìn)行了基于峭度和方差的支持向量機(jī)故障診斷實(shí)驗(yàn),結(jié)果如表6所示。
表5 改進(jìn)后不同懲罰因子下各種狀態(tài)類型的故障診斷結(jié)果
Tab.5 Improved results of fault diagnosis of various types with different penalty factors
Cg準(zhǔn)確率/%12345 10.7 10040100100800.0710040100100800.00710030100100800.00071003010010080100.7 100701001001000.07100701001001000.007100601001001000.0007100601001001001000.7 100801001001000.07100801001001000.007100801001001000.00071008010010010010000.7 1001001001001000.071001001001001000.0071001001001001000.0007100100100100100100000.7 1001001001001000.071001001001001000.0071001001001001000.0007100100100100100
表6 基于峭度和方差的不同懲罰因子下各種類型故障診斷結(jié)果
Tab.6 The fault diagnosis results of various types with different penalty factors based on kurtosis and variance
Cg準(zhǔn)確率/%12345 10.7 10100101000.0740010501000.00750040501000.00076070805040100.7 1000101000.0750020501000.00760040501000.000770605050501000.7 10100101000.0750020501000.00760040501000.0007806040505010000.7 10100101000.0750020501000.00760040501000.00078060405050100000.7 10100101000.0750020501000.00760040501000.00077060405050
通過表6能夠發(fā)現(xiàn),基于峭度和方差的分類方法總是有兩類(或幾類)故障特征較為接近,不能很好地反映兩者(或多者)之間的差異,即便再增大懲罰因子,也不能獲得更為準(zhǔn)確的判斷,分類效果不甚理想。表2中,內(nèi)圈故障和滾子故障(深)診斷準(zhǔn)確率遠(yuǎn)低于其他狀態(tài)類型,也恰恰說明了兩類故障特征相近,不易區(qū)分;但α穩(wěn)定分布的特征指數(shù)α和分散系數(shù)γ還是比傳統(tǒng)的峭度和方差更準(zhǔn)確地表達(dá)了故障特征。表5充分展示了經(jīng)過改進(jìn)后方法的優(yōu)越性,不僅能對特征較鮮明的正常信號、外圈故障和滾子故障(淺)進(jìn)行準(zhǔn)確分類,還精確地分離出了較難區(qū)分的內(nèi)圈故障和滾子故障(深)。
筆者通過對軸承故障信號的概率密度函數(shù)擬合,證明了軸承故障信號更符合α穩(wěn)定分布,并在此基礎(chǔ)上提取出了能夠反映特征信息的相關(guān)特征參數(shù),通過小波包分解理論和特征參數(shù)構(gòu)成特征向量,進(jìn)而利用支持向量機(jī)對故障進(jìn)行了分類。該方法計(jì)算簡單,故障分類準(zhǔn)確率高,在故障診斷和狀態(tài)監(jiān)測中應(yīng)用前景廣闊。
[1] Rajan A, Epedelenlioglu C T.Diversity combining over rayleigh fading channels with symmetric alpha-stable noise[J]. IEEE Transactions on Wireless Communications, 2010, 9(9): 2968-2976.
[2] Li Sen, Qiu Tianshuang, Zha Daifeng. Adaptive blind equalization for MIMO systems under α-stable noise environment[J]. IEEE Communications Letters, 2009, 13(8): 609-611.
[3] Ma Shuang, Zhao Chunhui, Wang Ying. Fractional low order cyclostationary spectrum sensing based on eigenvalue matrix in alpha-stable distribution noise[C]∥The First International Conference on Pervasive Computing Signal Processing and Applications. Harbin, China:IEEE Computer Society,2010:500-503.
[4] 顧陳, 何勁, 朱曉華. 沖擊噪聲背景下基于最小歸一化均方誤差的波束形成算法[J]. 電子學(xué)報(bào), 2010, 38(6): 1430-1433.
Gu Chen, He Jin, Zhu Xiaohua. Minimum mean square normalized-error beamforming amid heavy-tailed impulsive noise of unknown statistics[J]. Chinese Journal of Electronics, 2010, 38(6): 1430-1433.(in Chinese)
[5] Xia Weijuan, Zhu Lidong, Xiong Xingzhong. Fractional lower order statistics based generalized constant modulus algorithm for blind multi-user detection in DS/CDMA systems[C]∥International Conference on Wireless Communications and Signal Processing. Suzhou, China:IEEE Communication Society,2010: 1-6.
[6] Li Changning, Yu Gang. A new statistical model for rolling element bearing fault signals based on alpha-stable distribution[C]∥ 2010 Second International Conference on Computer Modeling and Simulation.Sanya,China:IEEE Computer Society,2010: 384-390.
[7] Yu Gang. Shi Ningning. Gear fault signal modeling and detection based on alpha stable distribution[C]∥International Symposium on Instrumentation & Measurement, Sensor Network and Automation. Sanya,China:IEEE Communication Society,2012: 471-474.
[8] 申永軍, 張光明, 楊紹普, 等.基于Gabor變換的欠定盲信號分離新方法[J].振動、測試與診斷, 2011, 31(3): 309-313.
Shen Yongjun, Zhang Guangming, Yang Shaopu, et al.New method for blind source separation in under-determined mixtures based on Gabor transform[J].Journal of Vibration, Measurement & Diagnosis, 2011, 31(3): 309-313.(in Chinese)
[9] 胡愛軍, 孫敬敬, 向玲.經(jīng)驗(yàn)?zāi)B(tài)分解中的模態(tài)混疊問題[J].振動、測試與診斷, 2011, 31(4): 429-434.
Hu Aijun, Sun Jingjing, Xiang Ling.Mode mixing in empirical mode decomposition[J].Journal of Vibration, Measurement & Diagnosis, 2011, 31(4): 429-434.(in Chinese)
[10]邱天爽, 張旭秀, 李小兵,等. 統(tǒng)計(jì)信號處理-非高斯信號處理及其應(yīng)用[M].北京:電子工業(yè)出版社, 2004:139-172.
[11]袁勝發(fā), 褚福磊. 支持向量機(jī)及其在機(jī)械故障診斷中的應(yīng)用[J]. 振動與沖擊, 2007,26(11): 36-40.
Yuan Shengfa, Chu Fulei. Support vector machines and its applications in machine fault diagnosis[J]. Journal of Vibration and Shock, 2007,26(11): 36-40.(in Chinese)
[12]曾蕓, 武和雷. 基于小波包的頻帶能量特征提取及智能診斷[J]. 計(jì)算技術(shù)與自動化, 2008, 27(4) : 115-117.
Zeng Yun, Wu Helei. The energy characteristics on the frequency bands extracted eased on the wavelet packet and intelligent diagnosis[J]. Computing Technology and Automation, 2008, 27(4): 115-117.(in Chinese)
10.16450/j.cnki.issn.1004-6801.2015.06.011
*國家自然科學(xué)基金資助項(xiàng)目(11072158, 11372198);教育部新世紀(jì)優(yōu)秀人才支持計(jì)劃資助項(xiàng)目(NCET-11-0936);河北省高等學(xué)校創(chuàng)新團(tuán)隊(duì)領(lǐng)軍人才計(jì)劃資助項(xiàng)目(LJRC018);河北省高等學(xué)校高層次人才科學(xué)研究資助項(xiàng)目(GCC2014053);河北省高層次人才資助項(xiàng)目(A201401001)
2014-09-15;
2015-01-07
TH17; TN911
申永軍,男,1973年12月生,博士、教授、博士生導(dǎo)師。主要研究方向?yàn)闄C(jī)械系統(tǒng)的非線性動力學(xué)、振動控制與故障診斷。曾發(fā)表《基于分?jǐn)?shù)Fourier變換的自適應(yīng)信號降噪方法》(《振動工程學(xué)報(bào)》2009年第22卷第3期)等論文。 E-mail:shenyongjun@126.com