丁 闖,張兵志,2,馮輔周,吳守軍
(1.陸軍裝甲兵學(xué)院 車輛工程系,北京 100072; 2.北方特種車輛研究所,北京 100072)
符號動力學(xué)信息熵(Symbolic Dynamic Entropy,SDE)能夠有效檢測振動信號時間序列的動力學(xué)特性[1],因此,SDE在特征提取及故障診斷中的應(yīng)用越來越引起人們的重視。SDE具有計算速度快、對數(shù)據(jù)量要求小且能捕捉到時間序列的非平穩(wěn)特性、能夠快速有效提取振動信號的運行狀態(tài)等特征。
然而,SDE的計算結(jié)果受自身參數(shù)的影響比較大,參數(shù)的選擇主要依靠人為經(jīng)驗,限制了SDE的應(yīng)用。本文將對參數(shù)確定的2種觀點進(jìn)行闡述,對比了2種觀點中參數(shù)確定的典型方法,并通過對比優(yōu)化參數(shù),提高SDE作為特征的算法效率和敏感度。
SDE最早由Kurths等提出[2],計算方法過程如下:
設(shè)振動信號序列X={x(i),i=1,2,…N},即時域信號由N個采樣點元素組成。
(1)振動信號符號化。將時間序列X轉(zhuǎn)化到符號域S={s(i),i=1,2,…,N},即s(i)代表符號域S中的第i個元素。符號域中符號使用si表示,其中,si∈{0,1,2,3},此處si代表符號{0,1,2,3}的具體某個符號,具體轉(zhuǎn)化方法為
式中:μ為時間序列X的平均值,α為權(quán)重,一般取α=0.1[3]。
(2)相空間重構(gòu)。對符號域的時間序列S=進(jìn)行相空間重構(gòu),得到矩陣S0
其中:m為嵌入維數(shù),τ為延遲時間,j=1,2,3,…,K,其中,K=N-(m-1)τ。重構(gòu)矩陣中的每一行S0(j)為一個重構(gòu)分量,重構(gòu)矩陣中共有K個重構(gòu)分量。
重構(gòu)矩陣中每個重構(gòu)分量為一個獨立的狀態(tài)模式,由于S0(j)有m個元素,每個元素的符號共有4種可能,因此共有n=4m種狀態(tài)模式。
(3)計算各狀態(tài)模式出現(xiàn)的概率。統(tǒng)計各狀態(tài)模式出現(xiàn)的次數(shù),記為Z(l)(l=1,2,3,…,n),并計算其出現(xiàn)的概率,記為
(4)計算符號動力學(xué)信息熵。
根據(jù)SDE原理,相空間重構(gòu)是算法中的關(guān)鍵一步,其延遲時間和嵌入維數(shù)的選擇對SDE的計算結(jié)果有較大的影響。
相空間重構(gòu)最早由Takens在1981年提出[4],關(guān)于延遲時間τ和嵌入維數(shù)m的選擇,相關(guān)學(xué)者進(jìn)行了大量的研究[5]。
目前對于參數(shù)選擇有兩種觀點:
(1)延遲時間和嵌入維數(shù)的選擇互不相關(guān),即兩者獨立確定,通常使用互信息法和偽近鄰法相結(jié)合,首先使用互信息法確定延遲時間,然后在延遲時間確定后,使用偽近鄰法確定嵌入維數(shù);
(2)延遲時間和嵌入維數(shù)的選擇存在聯(lián)系,即兩個參數(shù)的選擇相互依賴,通常使用關(guān)聯(lián)積分法(即CC算法),通過構(gòu)造統(tǒng)計變量和延遲時間的關(guān)系確定最佳延遲時間和嵌入窗寬,根據(jù)嵌入窗寬確定嵌入維數(shù)。針對不同的應(yīng)用需要根據(jù)其具體效果確定參數(shù)選擇的具體方法。
對于設(shè)備不同運行狀態(tài)下的時域振動信號,采用相同參數(shù)對其進(jìn)行相空間重構(gòu),將得到不同的SDE。因此,可使用系統(tǒng)正常狀態(tài)下的振動信號確定的參數(shù),對系統(tǒng)不同狀態(tài)下的振動信號進(jìn)行SDE計算,將熵值作為特征用于判斷系統(tǒng)的運行狀態(tài),從而達(dá)到特征提取的目的。
(1)基于互信息法確定延遲時間
對于振動信號序列X={x(i),i=1,2,…M},其符號域的時間序列S={s(i),1,2,…,N},為了研究s(i)與s(i+τ)的相關(guān)性,選取延遲序列s(i+τ)構(gòu)成新的序列Q={q(i),i=1,2,…M},將S與Q的相關(guān)性大小作為確定延遲時間τ的依據(jù)。根據(jù)信息論理論,兩個時間序列的互信息可表示為
式中:Ps(si)和Pq(qi)分別為對應(yīng)的符號域時間序列中事件si和qj的概率,Psq(si,qj)為事件si和qj的聯(lián)合分布概率,此處事件si和qj分別對應(yīng)相應(yīng)序列的各個符號。
對于某一特定符號域時間序列S,其與延遲后的時間序列Q的互信息值只與延遲時間有關(guān),令
式中:I(τ)的大小代表了在已知時間序列S與時間延遲后時間序列Q的相關(guān)性。當(dāng)I(τ)=0時,表示S和Q完全不相關(guān);當(dāng)I(τ)取極小值時,表示S和Q最大可能的不相關(guān),重構(gòu)過程中,使用I(τ)的第一個極小值對應(yīng)的延遲時間τ作為最優(yōu)延遲時間[6],記為τ0。
(2)基于偽近鄰法確定嵌入維數(shù)
偽近鄰法(False Nearest Neighbor,F(xiàn)NN)是確定最小嵌入維數(shù)的一種有效方法,其計算過程為:若嵌入維數(shù)為m時的重構(gòu)相空間的近鄰點仍然為嵌入維數(shù)為m+1的近鄰點,則此點為真近鄰點,反之若嵌入維數(shù)為m時的重構(gòu)相空間的近鄰點不是嵌入維數(shù)為m+1的近鄰點,則此點為偽近鄰點。當(dāng)嵌入維數(shù)處于某個值m時,偽近鄰點百分比(False Nearest Neighbor Percent,F(xiàn)NNP)將突變下降至0或接近0,且隨著m的增大不再變化,此突變點對應(yīng)的m值即為所求嵌入維數(shù),記為m0。
偽近鄰法確定嵌入維數(shù)的具體步驟如下:
當(dāng)嵌入維度為m時,針對相空間中的任一重構(gòu)分量S0(j),在重構(gòu)向量中,與S0(j)歐式距離最近的重構(gòu)向量稱之為S0(j)的最近鄰點,記為SN0N(j)
此時,有
式中:j≠i,其與重構(gòu)分量S0(j)的距離為
同理,求得嵌入維數(shù)為m+1時,其重構(gòu)分量S0′(j)與其最近鄰點SN0,Nm+1(j)的距離為Dm+1(j),此時可得
引入兩個偽近鄰點判據(jù)
式中:為符號域時間序列Q的均值,Rtol和Atol為選取的閾值。判據(jù)(1)通常用于有限長無噪聲的數(shù)據(jù),判據(jù)(2)通常用于含噪聲的數(shù)據(jù)。
由此可知,重構(gòu)矩陣中的K個重構(gòu)分量對應(yīng)K個最近鄰點,若K個最近鄰點有l(wèi)個偽近鄰點,則此時偽近鄰百分比(即偽近鄰率)為
在實際計算過程中,將嵌入維數(shù)m從2開始依次增加,計算偽近鄰點百分比,直到偽近鄰點百分比小于5%或不再下降時,此時的嵌入維數(shù)即為最小嵌入維數(shù)[8],記為m0。
延遲時間和嵌入維數(shù)的聯(lián)合確定通常使用關(guān)聯(lián)積分法(C-C算法),該方法最早由Broomhead和Kim提出,是一種同時確定最佳延遲時間和最佳嵌入維數(shù)的算法。其基本思想是通過嵌入時間序列的關(guān)聯(lián)積分構(gòu)造能夠代表非線性時間序列相關(guān)性的統(tǒng)計量,根據(jù)其和延遲時間的關(guān)系確定最佳延遲時間和嵌入窗寬,進(jìn)而確定嵌入維數(shù)。C-C算法是根據(jù)大量的統(tǒng)計規(guī)律中得到的,具有一定的優(yōu)勢。
對于時間序列X對應(yīng)的符號域時間序列S={s(i),1,2,…,N},其相空間中的重構(gòu)分量為S0(j),得出嵌入時間序列的關(guān)聯(lián)積分方程為
式中:K為相空間矩陣中重構(gòu)向量的數(shù)量,即K=N-(m-1)τ;r為參考半徑,即為閾值;dij為重構(gòu)向量中任一兩個重構(gòu)分量S0(i)和S0(j)的距離,即dij=‖S0(i)-S0(j)‖ ;H(u)為Heaviside函數(shù),其取值為
對于任意的參考半徑r,C(m,τ,N,r)代表任意兩個重構(gòu)分量的距離小于r的個數(shù)占總數(shù)的C2K中的比例。對于符號域時間序列S,首先將時間序列進(jìn)行劃分,分成τ個長度相等的時間序列,τ為延遲時間。然后構(gòu)造一個與延遲時間τ相關(guān)的關(guān)聯(lián)方程:
當(dāng)延遲時間τ=1時為單個時間序列本身,而此時,有
當(dāng)延遲時間τ=2時,有2個時間序列,為和{s(2),s(4),…,s(N)} ,長度為,而此時,有
以此類推,可得出當(dāng)延遲時間τ為任意自然數(shù)時,其關(guān)聯(lián)方程為F(m,τ,N,r)。
當(dāng)N→∞時,則
由上式可知,當(dāng)時間序列中的點為獨立分布且N→∞時,所有的F(m,τ,r)均為零。然而實際序列的長度為有限值,且時間序列中的點是相關(guān)的,因此F(m,τ,r)并不是總為零。若參考半徑r為任意值、F(m,τ,r)均為極小值點時,時間序列最接近均勻分布。此處,將F(m,τ,r)的最大值和最小值的差定義為
在求解過程中,Brock等通過對各種分布的研究,得出結(jié)論:當(dāng)時間序列的長度N≥500時,對于嵌入維數(shù)m,一般取2≤m≤5,對于參考半徑r,一般取為時間序列的標(biāo)準(zhǔn)差),可得到較好的結(jié)果。而將其應(yīng)用于符號動力學(xué)信息熵特征提取時,若嵌入維數(shù)取2,得出的信息熵難以區(qū)分故障模式,因此,在計算時,可取1,2,3,4。然后構(gòu)造以下3個統(tǒng)計量
為了檢驗并對比參數(shù)優(yōu)化方法的有效性,在SDE取不同參數(shù)條件下對行星齒輪箱振動信號進(jìn)行特征提取。行星齒輪箱試驗臺如圖1所示。
圖1 行星齒輪箱試驗臺
試驗臺主要由變頻電動機(jī)、行星齒輪箱、渦流測功機(jī)組成,變頻電動機(jī)提供動力,由渦流測功機(jī)加載,行星齒輪箱的參數(shù)如表1所示。
表1 行星齒輪箱參數(shù)
分別對行星齒輪箱齒輪正常、太陽輪輪齒局部裂紋故障、行星輪輪齒局部裂紋故障等3種狀態(tài)信號進(jìn)行分析[7-9]。
此試驗中2種狀態(tài)的振動信號均在有負(fù)載情況下完成,其中,變頻電機(jī)輸入轉(zhuǎn)速為2400 r/min,采樣頻率為5120 Hz。正常信號、太陽輪裂紋故障、行星輪裂紋故障時域波形如圖2所示。
圖23 種狀態(tài)振動信號的時域波形
(1)SDE信息熵參數(shù)確定
首先利用互信息法計算正常狀態(tài)下振動信號符號域時間序列的延遲時間τ與互信息之間的關(guān)系,如圖3所示。
圖3 振動仿真信號互信息與延遲時間的關(guān)系
由圖3可知,互信息第一次取得極小值時,最佳延遲時間τ0=8。
當(dāng)輸入延遲時間τ0=8時,使用偽近鄰法求解時間序列的嵌入維數(shù),使用判據(jù)(2),選擇閾值A(chǔ)tol=2,求出此時間序列的偽近鄰率與嵌入維數(shù)的關(guān)系如圖4所示,由圖4可知,最佳嵌入維數(shù)m0=3。
使用聯(lián)合積分法即C-C方法確定延遲時間和嵌入維數(shù),圖5為由聯(lián)合積分法得出的相關(guān)參數(shù)變化曲線。
由圖5可知,當(dāng)圖中)變化曲線取第1個零點或接近零點時,τ0=20,且Fcor(τ)變化曲線取最小值時,最佳嵌入窗寬τw=25,此時根據(jù)式(21)可得,m=3;當(dāng)圖中(τ)變化曲線取第一個極小值時,τ0=35,同理得m=2。由前文可知,嵌入維數(shù)至少大于2,因此,得出最佳延遲時間τ0=20,最佳嵌入維數(shù)m0=3。
圖4 振動仿真信號偽近鄰率與嵌入維數(shù)的關(guān)系
圖5 聯(lián)合積分法各參數(shù)的變化曲線
(2)特征提取
取齒輪正常、太陽輪裂紋故障、行星輪裂紋故障各20個樣本,使用SDE計算3種狀態(tài)下各個樣本的熵值。使用獨立方法和聯(lián)合積分法確定參數(shù)的各狀態(tài)下SDE如圖6、圖7所示。
圖6 根據(jù)獨立確定方法確定參數(shù)的各狀態(tài)SDE
圖7 根據(jù)聯(lián)合積分法確定參數(shù)的各狀態(tài)SDE
為進(jìn)一步突出本文2種方法確定參數(shù)的實際應(yīng)用效果,在實際計算中,增加任意選定的參數(shù)計算,任意選定延遲時間τ0=4,嵌入維數(shù)m0=3,此參數(shù)下各狀態(tài)下SDE如圖8所示。
圖8 任意給定參數(shù)的各狀態(tài)SDE
由圖6、圖7、圖8可知,使用獨立方法確定的參數(shù)計算得到的3種狀態(tài)下的SDE值相差最大,即分類效果最好,且同種狀態(tài)下的SDE較穩(wěn)定。因此使用互信息法確定延遲時間,根據(jù)偽近鄰法確定嵌入維數(shù),具有更好的分類效果。
本文重點研究符號動力學(xué)信息熵參數(shù)優(yōu)化確定方法。根據(jù)其算法原理,使用相空間重構(gòu)的方法確定算法參數(shù),克服了人為主觀或憑經(jīng)驗確定算法參數(shù)的不確定性。根據(jù)當(dāng)前確定相空間參數(shù)的兩種不同觀點,介紹了2種方法中典型參數(shù)確定方法的基本原理,并利用行星齒輪箱實測信號對所提參數(shù)優(yōu)化方法進(jìn)行了驗證。結(jié)果表明,相空間重構(gòu)參數(shù)的獨立確定方法比聯(lián)合確定方法更優(yōu),這為符號動力學(xué)信息熵算法中參數(shù)的確定奠定了基礎(chǔ)。