汪 亮,王紅軍
WANG Liang1,2 , WANG Hong-jun1,2
(1.北京信息科技大學 現(xiàn)代測控技術(shù)教育部重點實驗室,北京 100192;2.北京信息科技大學 機電工程學院,北京 100192)
故障診斷在現(xiàn)代制造業(yè)當中地位越來越重要,對于設(shè)備健康運行具有重要的意義[1]。振動信號是故障信息常見的信息載體,對其進行各種分析是故障診斷的常用方法。機電系統(tǒng)振動信號大部分是非線性、非平穩(wěn)信號,傳統(tǒng)的信號處理方法對其處理存在一定的局限性。針對非線性、非平穩(wěn)信號,近年來出現(xiàn)了很多信號處理方法,如小波變換[2],小波包變換,經(jīng)驗模式分解(EMD),集合經(jīng)驗模式分解(EEMD)[3],隨機共振,盲源分離[4],局部均值分解(LMD)[5]等。
經(jīng)驗模式分解(Empirical mode decomposition,EMD)是由HUANG[6]提出的一種針對非線性、非平穩(wěn)隨機信號的分析方法。但是,該分解方法存在模態(tài)混疊現(xiàn)象,WU[7]等將高斯白噪聲加入信號,提出集合經(jīng)驗模式分解(Ensemble empirical mode decomposition,EEMD)方法,能夠有效地克服模態(tài)混疊現(xiàn)象,廣泛地應用于機械故障診斷當中。竇東陽[8]等在旋轉(zhuǎn)機械故障診斷當中運用了EEMD方法,證實了其與EMD算法相比其具有其優(yōu)越性。李寧[9]等將EEMD應用于汽油機故障診斷當中,能夠有效地提取爆震特征。張玲玲[10]等利用EEMD分解后的邊際譜曲線有效地提取出了柴油機故障特征信息,應用在柴油機故障診斷當中。
支持向量機(Support Vector Machine,SVM)是Vapnik[11]提出來的機器學習算法,廣泛應用于模式識別、回歸分析等領(lǐng)域。姜萬錄[12]等提出了基于小波包和SVM的故障診斷當中,故障診斷率較高。成鈺龍[13]等人對于齒輪多類故障建立了小波變化與SVM故障診斷模型。萬鵬[14]等人提出一種LSTA與SVM相結(jié)合的故障診斷模型,對轉(zhuǎn)子實驗臺多類故障的診斷精度很高。
本文提出一種集合經(jīng)驗模式分解能量分布與支持向量機的故障診斷模型。首先對采集的振動信號進行小波濾波,經(jīng)過EEMD分解后獲得各個IMF分量,并計算其能量相對值。不同狀態(tài)下的相對能量分布往往有所不同,其中包含有各種狀態(tài)的敏感特征,以能量相對值構(gòu)建故障特征的特征向量,作為訓練集和測試集,然后對SVM參數(shù)進行尋優(yōu),構(gòu)建故障診斷模型。該模型能夠應用于機電系統(tǒng)的故障診斷以及狀態(tài)識別當中。對轉(zhuǎn)子實驗臺進行故障診斷,證實了該方法的有效性。
集合經(jīng)驗模式分解(EEMD)是信號的自適應時頻分析方法,將信號從高頻到低頻逐步分解得到具有實際物理意義的IMF分量[15]。通過對原始信號添加各個具有均勻頻率的白噪聲,使信號、具有連續(xù)性。對信號x(t)的EEMD分解過程[16]如圖1所示。
圖1 EEMD分解流程圖
1)在原始信號x(t)中加入白噪聲n(t),組成新的信號y(t);
2)對y(t)進行EMD分解,得到各IMF分量;
3)重復步驟1)、2),但是每次加入的是一系列不同的頻率均勻分布的白噪聲;
4)將所有對應的各個IMF分量相加取平均;
5)得到EEMD分解后的IMF分量。
建立支持向量機(SVM)模型過程包括:1)確定訓練集,測試集,訓練集標簽和測試集標簽;2)利用訓練集數(shù)據(jù)對支持向量機進行訓練,確定支持向量機模型的參數(shù),確定最優(yōu)分類超平面,得到SVM模型;3)根據(jù)SVM模型對測試集數(shù)據(jù)進行預測,并得到預測準確度,判斷模型的優(yōu)劣。SVM的主要步驟如圖2所示。
圖2 建立SVM模型流程圖
SVM常用核函數(shù)有:線性核函數(shù),多項式核函數(shù),徑向基核函數(shù)。對于多分類問題,常采用徑向基函數(shù)作為核函數(shù),SVM的主要方法是將低維輸入樣本集映射到新的高維特征空間,在該空間內(nèi)尋找最優(yōu)超平面。在使用SVM時,分類效果的好壞很大程度取決于參數(shù)的選擇,其中最重要的參數(shù)是懲罰系數(shù)c和gamma函數(shù)參數(shù)g。參數(shù)c是懲罰系數(shù),代表對分類誤差的寬容度。其值過大,說明精度要求太高,會過分看重經(jīng)驗風險最小化,使得網(wǎng)絡(luò)復雜性增加,增加訓練時間;其值過小,則SVM誤差較大。g是反映在徑向基函數(shù)選為核函數(shù)時,樣本數(shù)據(jù)在該高維特征空間的分布。其值對SVM的學習能力和預測能力有很大關(guān)系。因此在使用SVM進行故障分類之前必須對其參數(shù)進行優(yōu)化,使得SVM分類效果最佳。
SVM分類是對于常見的二分類問題的分類效果很好。在對于多分類問題,常采用“一對一法”[17]?!耙粚σ环ā本褪窃谒袃深悩颖局g建立一個SVM,因此對于n分類問題,需要設(shè)計n(n-1)/2個SVM模型。
為建立一個有效的故障診斷模型,對于輸入特征向量的選擇十分重要,選取集合經(jīng)驗模式分解后的IMF分量的相對能量作為模型的輸入,對SVM參數(shù)優(yōu)化,經(jīng)過訓練后建立EEMD能量分布與SVM的故障診斷模型,其流程圖如圖3所示。
圖3 故障診斷模型流程圖
具體步驟如下:
1)采集多類故障狀態(tài)下的振動信號。
2)利用小波濾波器對振動信號進行預處理,減少噪聲對信號的干擾,提高信噪比。
3)對降噪后的信號采用EEMD分解,得到若干個IMF分量,選取前n個主要IMF分量作為研究對象。
4)計算前n個IMF分量的相對能量值:
式中,ei為第i個IMF分量的相對能量;
n為選取IMF分量的個數(shù);
Ai為第i個IMF分量的幅值。
構(gòu)造特征向量
利用遺傳算法對SVM參數(shù)c和g進行尋優(yōu),獲得最優(yōu)參數(shù);
利用特征向量組成的訓練集和測試集對SVM進行訓練和檢驗,最終得到有效的故障診斷模型。
本文采用轉(zhuǎn)子試驗臺,分別對正常,碰磨,不對中三種狀態(tài)進行實驗。實驗過程中,轉(zhuǎn)子實驗臺轉(zhuǎn)速為960r/min,采樣頻率為1024Hz,分別記錄三種狀態(tài)下的振動信號,設(shè)定采樣時間為4s,一共采集到4096個數(shù)據(jù)點,并設(shè)定其標簽分別為0,1,2。實驗采集到的正常、碰磨、不對中狀態(tài)下的濾波后的振動信號如圖4所示。
圖4 不同狀態(tài)下時域波形圖
把每組數(shù)據(jù)分成八組,每組512個數(shù)據(jù)點。分別對其進行EEMD分解,得到十個IMF分量。圖5是一組正常狀態(tài)下的信號經(jīng)過EEMD分解的結(jié)果。從圖5可以看出EEMD分解是一種基于主成分分解方法,其信號的主要能量集中于前幾個IMF分量。分別計算每個IMF分量的能量,利用式(1)計算得到其相對能量,可以看出其能量主要分布在前6個IMF分量當中,不同狀態(tài)下前6個IMF分量相對能量值如表1所示。每種狀態(tài)任取一組特征數(shù)據(jù),其能量分布如圖6所示。
從圖6可以看出,不同狀態(tài)下的相對能量分布是各不相同的,在故障情況下,其能量分布較為集中;在正常狀態(tài)下,其能量分布較為分散;不同故障狀態(tài)下的能量分布也各不相同。因此,EEMD分解后的各IMF相對能量可以作為不同狀態(tài)下特征,選取各狀態(tài)下的前6個IMF相對能量作為特征值,建立24×16維特征矩陣。
由“一對一 ”法多分類方法可知,共建立3個SVM模型,每個模型選取不同兩種狀態(tài)下的12組特征向量,其中隨機選取9組作為訓練集,剩余3組作為測試集,對SVM模型進行訓練與測試。
圖5 正常狀態(tài)下EEMD分解結(jié)果
圖6 三種不同狀態(tài)下的能量分布圖
表1 不同狀態(tài)下各樣本前6個IMF相對能量分布
利用遺傳算法對SVM的參數(shù)(c,g)進行優(yōu)化,其中約束條件為訓練集和測試集的準確度最大,(c,g)兩參數(shù)的尋優(yōu)范圍為2-10~210,搜索步長為0.5。參數(shù)優(yōu)化結(jié)果如圖7所示。
圖7 遺傳算法參數(shù)尋優(yōu)結(jié)果圖
從圖7可以看出,遺傳算法的種群數(shù)目為20,當進化代數(shù)達到10以后,適應度結(jié)果較好,當進化代數(shù)達到50時,其平均適應度為98.4%,最佳適應度為100%,此時,訓練集和測試集的訓練準確度最高。因此,SVM的參數(shù)(c,g)取值為(0.49,1.12)。
對于測試的特征向量,分別用三個SVM模型對其狀態(tài)進行預測,每次的預測狀態(tài)記為1,其他狀態(tài)記為0,得分最多的即為其實際狀態(tài)。隨機選取6組作為最后的測試集,測試結(jié)果為準確率達到100%。因此,集合經(jīng)驗模式分解的能量分布和SVM故障診斷模型對于不同的故障診斷是十分有效的。
1)集合經(jīng)驗模式分解是一種新的自適應信號處理方法,由于EMD分解容易產(chǎn)生模態(tài)混疊問題,通過對其進行白噪聲疊加,能夠有效地消除EMD的模態(tài)混疊問題,能夠有效地提取故障的敏感特征。
2)針對實際情況下,故障數(shù)據(jù)樣本小的問題,由于SVM算法特別適合小樣本集的數(shù)據(jù)處理,因此利用已有的小樣本故障數(shù)據(jù)建立SVM故障診斷模型。在建立SVM模型時,參數(shù)(c,g)值的選取對于預測的準確率影響很大,因此選用遺傳算法對其進行參數(shù)尋優(yōu),得到最優(yōu)參數(shù)建立SVM模型。由于傳統(tǒng)的SVM主要針對兩分類問題,因此采用“一對一法”建立多分類SVM模型。
3)對于不同狀態(tài)下的振動信號,經(jīng)過EEMD分解后的IMF分量的能量相對分布是各不相同的,因此可以選取分解后的相對能量分布作為特征向量建立集合經(jīng)驗模式分解的能量分布和SVM故障診斷模型。結(jié)合轉(zhuǎn)子實驗臺數(shù)據(jù)說明該模型能夠有效地對故障診斷是十分有效的。
[1]王國彪,何正嘉,陳雪峰,等.機械故障診斷基礎(chǔ)研究“何去何從”[J].機械工程學報,2013,01:63-72.
[2]李建勛,柯熙政,郭華.小波方差與小波熵在信號特征提取中的應用[J].西安理工大學學報,2007,04:365-369.
[3]張文斌,蘇艷萍,普亞松,郭德偉,滕瑞靜.基于集合經(jīng)驗模式分解能量分布與灰色相似關(guān)聯(lián)度的齒輪故障診斷[J].機械工程學報,2014,07:70-77.
[4]李宏坤,張學峰,徐福健,劉洪軼,練曉婷.基于時頻分析的欠定信號盲分離與微弱特征提取[J].機械工程學報,2014,18:14-22.
[5]Smith J S.The Local Mean Decomposition and Its Application to EEG Perception Data[J].Journal of the Royal Society Interface,2005,2(5):443-454.
[6]HUANG N E,SHEN Z,LONG S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time and analysis[C].Proc.R.Soc.Lond.A,1998,454:903-995.
[7]WU Z H,HUANG N E.Ensemble empirical mode decomposition:A noise-assisted data analysis method[J].Advances in Adaptive Data Analysis,2009,1(1):1-41.
[8]竇東陽,趙英凱.集合經(jīng)驗模式分解在旋轉(zhuǎn)機械故障診斷中的應用[J].農(nóng)業(yè)工程學報,2010,02:190-196.
[9]李寧,楊建國,周瑞.基于集合經(jīng)驗模式分解的汽油機爆震特征提取[J].機械工程學報,2015,02:148-154.
[10]張玲玲,駱詩定,肖云魁,等.集合經(jīng)驗模式分解在柴油機機械故障診斷中的應用[J].科學技術(shù)與程,2010,27:6745-6749.
[11]VAPNIK V N.Statisticallearning theory[M].Wiley Press,2004.
[12]姜萬錄,吳勝強.基于SVM和證據(jù)理論的多數(shù)據(jù)融合故障診斷方法[J].儀器儀表學報,2010,08:1738-1743.
[13]成鈺龍,程剛,沈利華,等.基于特征信息融合的離散小波SVM齒輪故障診斷方法研究[J].組合機床與自動化加工技術(shù),2012(8):70-73.
[14]萬鵬,王紅軍,徐小力.局部切空間排列和支持向量機的故障診斷模型[J].儀器儀表學報,2012,12:2789-2795.
[15]高清清,賈民平.基于EEMD的奇異譜熵在旋轉(zhuǎn)機械故障診斷中的應用[J].東南大學學報(自然科學版),2011,05:998-1001.
[16]張燁,田雯,劉盛鵬.基于集合經(jīng)驗模式分解的火災時間序列預測[J].計算機工程,2012,24:152-155.
[17]曹兆龍.基于支持向量機的多分類算法研究[D].華東師范大學,2007.