伍偉嘉,楊 儉,袁天辰,邵志慧
(上海工程技術(shù)大學(xué) 城市軌道交通學(xué)院,上海 201620)
我國高速鐵路運營里程的增長速度逐年增加,由高速、重載引起的軌枕空吊等病害嚴(yán)重影響列車的運行安全,該問題已引起了研究人員的廣泛關(guān)注。現(xiàn)有的軌道結(jié)構(gòu)病害檢測手段主要有:超聲波回彈法、地質(zhì)雷達(dá)法、探測儀檢測鋼筋混泥土法、瞬變電磁法[1]等。這些方法主要依賴人工操作,檢測效率低且無法實現(xiàn)在線檢測。因此,建立高效的檢測軌道結(jié)構(gòu)病害的方法對于保障列車安全平穩(wěn)運行具有重要的意義。
近年來,國內(nèi)外學(xué)者在機(jī)械結(jié)構(gòu)和大型土木工程結(jié)構(gòu)故障模式識別方面做了大量研究。文獻(xiàn)[2]建立了基于模糊C均值聚類算法的風(fēng)電機(jī)組齒輪箱故障預(yù)警模型,有效解決了多組振動信號導(dǎo)致的報警結(jié)果不一致的問題。但是在樣本數(shù)量有限的條件下,這種基于模糊聚類的模式識別方法的分類精度較低。針對這一問題,研究者利用神經(jīng)網(wǎng)絡(luò)算法[3-4]進(jìn)行模式識別。文獻(xiàn)[5]以橋梁結(jié)構(gòu)模態(tài)分析所得的前4個固有頻率為輸入,基于人工神經(jīng)網(wǎng)絡(luò)和分類回歸樹,建立了橋梁傷損預(yù)測模型,克服了現(xiàn)有基于視覺檢查的傷損檢測方法的局限性。但該方法在面對小樣本和高緯度數(shù)據(jù)時容易陷入局部最優(yōu),從而影響模式識別精度。針對這一問題,研究人員又開發(fā)了基于支持向量機(jī)(Support Vector Machine,SVM)算法[6-8]的模式識別方法。該方法具有很強(qiáng)的泛化能力,可以有效地處理小樣本和高緯度數(shù)據(jù)。因此,本文采用支持向量機(jī)算法對軌道結(jié)構(gòu)病害進(jìn)行模式識別。
本文基于支持向量機(jī)算法實現(xiàn)了對軌道結(jié)構(gòu)故障的識別。本文首先采用時域統(tǒng)計和離散小波變換對軌道結(jié)構(gòu)病害下的軌枕振動加速度數(shù)據(jù)進(jìn)行特征提取;然后提取香農(nóng)特征熵并做歸一化處理,剔除了無關(guān)信息使提取到的特征容易被支持向量機(jī)算法所利用;將提取到的特征向量集分為訓(xùn)練集和測試集,通過支持向量機(jī)算法對訓(xùn)練集進(jìn)行學(xué)習(xí)并對測試集進(jìn)行預(yù)測分類;最后,利用網(wǎng)格搜索方法優(yōu)化支持向量機(jī)參數(shù),實現(xiàn)了對軌道結(jié)構(gòu)病害的準(zhǔn)確識別。
本文采用文獻(xiàn)[9]所提出的車輛-軌道耦合動力學(xué)模型,其結(jié)構(gòu)如圖1所示,其中車輛采用四軸二系懸掛的客車模型。在軌道模型中,軌下基礎(chǔ)以各軌枕支點為單元沿縱向進(jìn)行離散化處理,其中每個支承單元為雙質(zhì)量、三層彈簧-阻尼模型。本文根據(jù)道床錐體受荷假設(shè)把道床模擬為錐體。當(dāng)模型中軌道的計算長度大于100 m時,軌枕的振動加速度幾乎不受影響,故本文模型中的軌道長度l取120 m,軌枕間距l(xiāng)s取0.6 m。文獻(xiàn)[9]中指出,軌枕空吊、道床板結(jié)、扣件失效等軌下基礎(chǔ)缺陷屬于動力型軌道剛度不平順,若要對其進(jìn)行模擬,只需改變模型中所對應(yīng)的剛度和阻尼即可,例如軌枕完全空吊即完全失去工作能力,可以設(shè)Kbi=Cbi=0;對于道床板結(jié),設(shè)置K′bi=ηkKbi以及C′bi=ηcCbi,其中ηk和ηc分別表示道床的剛度和阻尼變化系數(shù)。對于不同程度的病害,ηk和ηc可以在1~10之間取值。
圖1 車輛-軌道垂向耦合模型
在本文的工況仿真計算中,設(shè)置車輛行駛速度為200 km·h-1。選取軌道結(jié)構(gòu)中心的第51~150共100根軌枕進(jìn)行研究,并對不同程度軌枕空吊和道床板結(jié)工況下的軌枕振動進(jìn)行了仿真。仿真方案見表1,圖2為軌道結(jié)構(gòu)不同病害程度的對比。
表1 軌道結(jié)構(gòu)在不同工況條件下的模擬
從圖2可以看出,不同程度軌枕空吊下的軌枕振動加速度的幅值有較大的變化,而不同程度道床板結(jié)下的軌枕振動加速度的數(shù)據(jù)差異并不明顯。如果直接將未經(jīng)處理的軌枕振動加速度數(shù)據(jù)進(jìn)行分類識別,會因為數(shù)據(jù)特征不明顯和冗余影響分類效果,因此需要對振動信號進(jìn)行特征提取。
(a)
對于一個振動信號(A={Ai},i=1~N,N為采樣點數(shù))來說,常用的時域特征有16個,可分為有量綱特征和無量綱特征。有量綱特征包括:最大值、最小值、均值、絕對均值、峰峰值、峰值、標(biāo)準(zhǔn)差、方差、方根幅值和均方根值。無量綱特征包括:偏度、峭度、波形因子、峰值因子、裕度因子和脈沖因子[10]。有量綱的特征值往往有具體的物理意義,是最為常用的時域特征指標(biāo),但其數(shù)值大小會受其他物理量的影響。
2.1.1 有量綱特征
(1)最大值A(chǔ)max與最小值A(chǔ)min。通過獲取振動信號數(shù)據(jù)中數(shù)值最大和最小的值可以了解信號的振動幅值范圍,計算式如下所示;
Amax=max(Ai)
(1)
Amin=min(Ai)
(2)
(2)均值A(chǔ)mean與絕對均值A(chǔ)ave。均值是指振動信號幅值的算數(shù)平均,也被稱為信號的一階矩。絕對均值是指振動信號幅值的絕對值的算數(shù)平均。
(3)
(4)
均值和絕對均值都可以用于描述振動信號的穩(wěn)定分量,它們的值反映了振動信號波動能量的大??;
(3)峰值A(chǔ)p與峰峰值A(chǔ)pp。峰值是指振動信號波形的最大瞬時值,如下所示。
Ap=|max(Ai)|
(5)
峰峰值指的是在一個周期內(nèi)信號的最大值與最小值之間的差值,它反映了振動信號振幅的變化范圍,計算式如下;
App=max(Ai)-min(Ai)
(6)
(4)標(biāo)準(zhǔn)差A(yù)std與方差A(yù)var。標(biāo)準(zhǔn)差是指振動數(shù)據(jù)中的各個元素與這組數(shù)據(jù)的平均數(shù)之差的算數(shù)平方和的平均數(shù);方差則是標(biāo)準(zhǔn)差的平方。兩者都可以描述振動信號的波動程度,是一種反應(yīng)振動信號能量動態(tài)分量的特征參數(shù)。方差也被稱為振動信號的二階中心矩;
(7)
(8)
(5)均方根值A(chǔ)rms與方根幅值A(chǔ)r。均方根值又叫有效值,它是描述振動信號強(qiáng)度的重要指標(biāo)。振動信號的均方根值和方根幅值既可以反應(yīng)信號的振動平均值,又可以反應(yīng)振動信號的波動和離散度。
(9)
(10)
2.1.2 無量綱特征
(1)峭度Akurt與偏度Askew。峭度是振動信號四階中心矩與標(biāo)準(zhǔn)差的4次方的比值。偏度又叫偏斜度或者偏態(tài),它是振動信號三階中心矩與標(biāo)準(zhǔn)差的3次方的比值。
(11)
(12)
峭度和偏度都是描述振動信號分布特性的特征參數(shù)。峭度反應(yīng)了振動信號波形的平緩程度,對振動信號中的沖擊成分比較敏感。偏度描述的是振動信號的非對稱性;
(2)波形因子Asf、峰值因子Acf、脈沖因子Aif、裕度因子Aclf。波形因子被定義成均方根值與平均值的絕對值之間的比值,物理意義為實際振動波形與標(biāo)準(zhǔn)正弦振動波形的畸變和差異。
(13)
峰值因子指的是振動信號峰值與均方根值的比值,它描述的是振動信號峰值在波形中的極端程度,常用于檢測振動信號中是否有沖擊。但是由于振動信號峰值在不同時刻的變動較大,所以檢測穩(wěn)定性效果不佳。
(14)
脈沖因子是振動信號峰值與絕對均值之間的比值。與峰值因子一樣,脈沖因子也可以用于振動沖擊的檢測。
(15)
從脈沖因子和峰值因子的定義可以看出它們比較相似,對于同一振動信號來說絕對均值總小于均方根值,故振動信號的脈沖因子大于峰值因子。
裕度因子是指峰值與方根幅值之間的比值。
(16)
小波變換以其多尺度特性在信號處理、圖像分析和故障診斷等領(lǐng)域得到大量運用。離散小波變換(Discrete Wavelet Transform,DWT)作為小波變換的重要分支被廣泛用于特征提取。與傅立葉變換(Fourier Transform,F(xiàn)T)有連續(xù)傅立葉變換[11]和離散傅里葉變換[12](Discrete Fourier Transform,DFT)類似,連續(xù)小波變換[13-15](Continuous Wavelet Transform,CWT)也有其對應(yīng)的離散小波變換[16-17]。離散小波變換實際上是對連續(xù)小波變換的尺度和位移按照2的冪次離散化得到的。DWT的具體定義為
(17)
式中,x(·)是母小波;y(n)為初始信號;a0和b0為縮放和平移參數(shù);通過改變m和n實現(xiàn)1,1/a,1/a2,…的幾何縮放和0,n,2n,…的平移。通過數(shù)學(xué)變換可以把式(17)化為關(guān)于m和n的計算式,即
(18)
通過觀察可以發(fā)現(xiàn)式(18)與有限脈沖響應(yīng)(Finite Impulse Response,F(xiàn)IR)數(shù)字濾波器[18]的卷積方程有很大的相似性
(19)
其中,g(n-k)為FIR濾波器的脈沖響應(yīng)。通過對比可知DWT的濾波器的脈沖響應(yīng)方程為
(20)
令a0=1/2,b0=1,則a0m=1,1/2,…,1/2m,這樣就可以使用以母小波作為低通濾波器的多級濾波器l(n)及其對偶濾波器h(n)來實現(xiàn)把信號分解為低頻信號和高頻信號的目的。
支持向量機(jī)是一種主要用于解決二分類問題的算法。它的核心思想是以訓(xùn)練集為研究對象,在樣本空間中找到一個超平面使得兩類數(shù)據(jù)的邊緣點與該超平面的距離盡可能遠(yuǎn),如圖3所示。
圖3 支持向量機(jī)原理圖
對于線性可分的情況,給定訓(xùn)練樣本集A:(xi,yi),1≤i≤N,xi∈Rd,y∈{-1,1},其中N為樣本長度,d為數(shù)據(jù)的維度。那么針對樣本A的超平面可以定義為
Wxi+b=0
(21)
式中,W為超平面的法向量;b為超平面的“截距”。
對于樣本空間中任意的樣本點x,都可以用W和b表示為
(22)
為了讓超平面可以使樣本空間中所有數(shù)據(jù)盡可能實現(xiàn)分類,W和b需要滿足如下約束
(23)
此時分類間隔即兩類樣本與超平面最近距離之和等于2/‖W‖,因此求解最優(yōu)化超平面的問題就可以轉(zhuǎn)化為一個凸優(yōu)化問題,即
(24)
為了便于求解可將上述最大值問題轉(zhuǎn)化為最小值問題,即
(25)
可以看出式(25)是一個凸二次規(guī)劃問題,此類問題可以構(gòu)造Lagrange函數(shù)進(jìn)行求解。
(26)
將上式分別對W、b、k求偏導(dǎo)數(shù)并令其等于0,整理后代入式(26)中即可將求解最優(yōu)超平面的凸二次規(guī)劃問題轉(zhuǎn)化為下式
(27)
假設(shè)k′=(k′1,k2′,…,k′N)≥0為最優(yōu)解,則最優(yōu)化超平面的函數(shù)可以表示為式(28)。
(28)
對于線性不可分的情況,可以通過核函數(shù)將樣本變換到高維空間,轉(zhuǎn)化為在高維空間上的線性問題。核函數(shù)的思想就是直接計算向量在特征空間Z中的內(nèi)積,即找到一個函數(shù)k(x,y)使得k(x,y)=φ(x)φ(y),其中φ(·)為映射函數(shù)。這樣在不需要知道φ(·)具體形式的情況下就可以實現(xiàn)由線性不可分向線性可分的轉(zhuǎn)換。根據(jù)Hilbert-Schmidt[19]理論可知,任何對稱函數(shù)k(x,y)只需滿足Mercer條件就可以作為核函數(shù)使用,于是線性不可分情況下的最優(yōu)化超平面問題可以變?yōu)槭?29)。
(29)
核函數(shù)的選擇在很大程度上會影響SVM算法的分類準(zhǔn)確率,SVM最常用的核函數(shù)為:
(1)多項式核函數(shù)
K(x,y)=(xTy+1)d
(30)
(2)Sigmoid核函數(shù)
K(x,y)=tanh(xTy+c)
(31)
(3)徑向基函數(shù)
K(x,y)=esp(-‖x-y‖2/δ2)
(32)
其中多項式核函數(shù)屬于全局性核函數(shù),當(dāng)數(shù)據(jù)維度較高時,SVM識別準(zhǔn)確率會大幅下降。徑向基函數(shù)對樣本的維度和大小都沒有要求,且學(xué)習(xí)能力強(qiáng)。通過選取合理的參數(shù)(懲罰因子C和核函數(shù)參數(shù)δ)即可實現(xiàn)對任意數(shù)據(jù)的準(zhǔn)確分類,因此本文選取的SVM的核函數(shù)為徑向基函數(shù)。
支持向量機(jī)的分類識別性能主要由懲罰因子C和核函數(shù)參數(shù)δ決定。用于確定上述兩個參數(shù)的方法有粒子群算法、遺傳算法、蟻群算法等,但這些算法往往容易陷入局部最優(yōu)解的情況。本文選擇網(wǎng)格搜索法對SVM模型參數(shù)進(jìn)行最優(yōu)化選擇。
網(wǎng)格搜索算法的原理是將待優(yōu)化的SVM參數(shù)C和δ的可行區(qū)間按設(shè)定好的步長劃分為若干個小區(qū)間。對于確定的C和δ,將訓(xùn)練集輸入到支持向量機(jī)中,利用交叉驗證的思想計算分類準(zhǔn)確率,最終選取分類準(zhǔn)確率最高的C和δ作為最優(yōu)參數(shù)。交叉驗證是將訓(xùn)練集分成k組,并將其中的k-1組子集作為訓(xùn)練集,然后用訓(xùn)練出的支持向量機(jī)模型去測試剩下的那個子集,取k次測試的分類準(zhǔn)確率的平均值作為此組參數(shù)C和δ對應(yīng)的準(zhǔn)確率。這種估值方法可以有效避免出現(xiàn)過擬合或者欠擬合的發(fā)生,基于網(wǎng)格搜索的支持向量機(jī)算法的具體流程如圖4所示。
圖4 支持向量機(jī)算法流程圖
把章節(jié)1.2中仿真得到的不同工況條件下的軌枕振動加速度數(shù)據(jù)分成訓(xùn)練集和測試集,其中訓(xùn)練集90組、測試集10組。隨后,對它們進(jìn)行時頻域聯(lián)合特征提取(時域統(tǒng)計、離散小波變換),其中離散小波變換選取db7作為母小波,分解層數(shù)為4層。將信號在一定尺度下進(jìn)行分解,然后提取他們的香農(nóng)特征熵并做歸一化處理。將訓(xùn)練集輸入到支持向量機(jī)中進(jìn)行訓(xùn)練,并利用網(wǎng)格搜索算法對支持向量機(jī)的參數(shù)進(jìn)行選優(yōu)。利用訓(xùn)練得到的支持向量機(jī)模型對測試集進(jìn)行分類識別,所得到的結(jié)果如圖5所示,所對應(yīng)的識別準(zhǔn)確率分別為86.67%、90%和84%。
(a)
從圖5(b)和圖5(d)可以看出,該算法對于不同程度軌枕空吊或者道床板結(jié)的識別效果比較明顯。從圖5(f)可以看出把不同類型的故障放在一起進(jìn)行識別時,算法的準(zhǔn)確率較差。
本文利用時頻分析方法提取了不同軌道結(jié)構(gòu)病害下的振動特征,并在此基礎(chǔ)上利用支持向量機(jī)算法進(jìn)行模式識別,并對支持向量機(jī)的參數(shù)進(jìn)行了優(yōu)化。仿真結(jié)果驗證了該方法對軌道結(jié)構(gòu)病害識別的有效性。具體內(nèi)容包括以下方面:(1)利用車軌耦合動力學(xué)模型對不同軌道結(jié)構(gòu)病害進(jìn)行建模,仿真得到了車速為200 km·h-1的正常狀態(tài)、軌枕空吊以及道床板結(jié)條件下的軌枕振動加速度,并對比了不同程度軌枕空吊及道床板結(jié)下軌枕振動加速度的變化趨勢;(2)利用振動信號的時域分析和離散小波變換提取了軌道結(jié)構(gòu)病害的特征,建立了軌道結(jié)構(gòu)病害特征矩陣,解決了軌枕振動數(shù)據(jù)維數(shù)高、信息較冗余的問題,為軌道結(jié)構(gòu)病害識別奠定了基礎(chǔ);(3)將軌道結(jié)構(gòu)病害特征矩陣分為訓(xùn)練集和測試集作為支持向量機(jī)算法的輸入,并利用網(wǎng)格搜索算法對支持向量機(jī)算法關(guān)鍵參數(shù)進(jìn)行選優(yōu)。結(jié)果表明,對于不同道床板結(jié)病害,識別準(zhǔn)確率為86.67%;對于軌枕空吊病害,識別準(zhǔn)確率為90%;對于不同類型病害混合的情況,識別準(zhǔn)確率為84%。本文所提出的基于支持向量機(jī)的軌道結(jié)構(gòu)病害識別方法,實現(xiàn)了對不同程度軌道結(jié)構(gòu)病害的識別,為軌道結(jié)構(gòu)病害智能診斷提供了一種可行方案。