鄧 韜, 劉哲潮, 汪華章, 何 磊
(1.西南民族大學(xué) 電氣工程學(xué)院,四川 成都 610041;2.石家莊鐵道大學(xué)交通工程結(jié)構(gòu)力學(xué)行為與系統(tǒng)安全國家重點實驗室,河北 石家莊 050043)
高速列車在長期運行過程中受輪軌沖擊載荷及交變壓力波等因素作用,車體鋁合金結(jié)構(gòu)可能出現(xiàn)疲勞損傷。聲發(fā)射用于車體結(jié)構(gòu)探傷無需脫漆及掃查作業(yè),但受油漆、膩子、保護涂料等其他材料裂紋和檢測環(huán)境影響,實際聲發(fā)射信號組份和波模式較復(fù)雜,對這類強非線性的多源含噪信號準確表征和識別分類是檢測的難點。
改進噪聲加入完備聚合經(jīng)驗?zāi)B(tài)分解方法(complete ensemble empirical mode decomposition adaptive noise,CEEMDAN)[1,2]無需指定分解中心頻率,自適應(yīng)噪聲加入較經(jīng)典EEMD及CEEMD固有模態(tài)(intrinsic mode function,IMF)間混疊更小,對包含復(fù)雜頻率和波模式的聲發(fā)射信號表征性更強,探索降低計算量是其運用的一大關(guān)鍵問題。
稀疏表示分類(sparse representation-based classification, SRC)近年來發(fā)展迅速,在生物與健康信息學(xué)、故障分類和圖像識別等領(lǐng)域均有成功運用[3~5]。SRC通過選取過完備字典中有限個原子對目標信號進行線性表示,將重構(gòu)殘差最小的類標簽作為判別輸出。這種不依賴標準基函數(shù)的近似化表示方法使稀疏結(jié)果更具解釋性和魯棒性[6],為聲發(fā)射信號分類提供了新思路。Zhang等揭示了SRC優(yōu)異性能更多是基于樣本間協(xié)作而非稀疏性,以L2范數(shù)替換L1范數(shù)設(shè)計了協(xié)作表示分類器(collaborative representation classifer, CRC)來提升分類效果,同SRC一樣,CRC未考慮樣本中可能存在的類組標簽和結(jié)構(gòu)化信息[7]。Majumdar等以組間稀疏組內(nèi)協(xié)作思想提出基于L12組合范數(shù)約束的組稀疏分類器(group sparse classifier,GSC)來減小稀疏系數(shù)分散,性能明顯優(yōu)于SRC和CRC[8]。考慮樣本自身結(jié)構(gòu)特性,Huang等通過大腦結(jié)構(gòu)的樹約束關(guān)系,以樹組稀疏結(jié)構(gòu)對多頻帶腦電中的精神分裂癥信號進行分類[9]。練秋生等在單次曝光相位成像中考慮圖像全變差的重疊組結(jié)構(gòu)稀疏,利用最速下降法進行圖像重構(gòu)[10]。此外,基于加權(quán)的組稀疏分類(weighted GSC, WGSC)、核稀疏分類(kerne SRC, KSRC)、核協(xié)作分類(kerne CRC, KCRC)及核加權(quán)組稀疏分類(KWGSC)也相繼出現(xiàn)[11~14]。加權(quán)方法通過距離加權(quán)約束實現(xiàn)保局性,但簡單距離約束與組范數(shù)特性相違背,難以直觀反應(yīng)數(shù)據(jù)分布特征。核算法通過核空間取代字典原子和信號的內(nèi)積運算解決范數(shù)歸一化問題,有更好的非線性適應(yīng)力,其優(yōu)化機制還有待進一步驗證。
本文針對噪聲影響下車體鋁合金聲發(fā)射信號多源、寬頻和特征頻率重疊問題,設(shè)計了一種優(yōu)化分解計算的本征模態(tài)分解方法提取分類樣本,提出混合重疊組稀疏(mixed overlapping group sparse, MOGS)模型用于聲發(fā)射源分類。本征模態(tài)突出了聲源特征與類間差異,MOGS模型的類間原子重疊同時兼顧組內(nèi)、組間稀疏,具備更佳的樣本內(nèi)部結(jié)構(gòu)匹配性,可提升多源及含噪情況下聲發(fā)射信號的鑒別能力。
復(fù)雜對象聲發(fā)射信號源識別常在較寬頻帶采集數(shù)據(jù),波模式混疊和類間共有的中低頻成分會弱化類間差異。提取包含聲發(fā)射主要特征頻帶的窄帶信號作為分類樣本能減小寬頻段干擾及低頻趨勢項影響。采用CEEMDAN分解可通過式(1)表示:
(1)
為提高CEEMDAN分解效率,建立一個I×N階隨機白噪聲EMD預(yù)分解矩陣如下:
(2)
式中:聚合次數(shù)I在計算前給定;nij(t)表示第i次聚合中第j階白噪聲分量;噪聲矩陣中的每一行代表一個隨機白噪聲的完整EMD分解結(jié)果。預(yù)先獲取的參與聲發(fā)射信號分解時無需多次對每個樣本添加的白噪聲做模態(tài)拆分,因此可顯著減小計算量。為了和待分解信號階次數(shù)相匹配,模態(tài)總階次數(shù)N將隨待分解信號和篩分停止條件而變化,預(yù)先計算噪聲預(yù)分解矩陣還需固定N的取值。
圖1為白噪聲分別迭代8次和4 096次的EMD分解結(jié)果,后者只增加IMF8和IMF9兩個高階模態(tài),且IMF9趨于平緩,而高階分量是與聲發(fā)射信號關(guān)聯(lián)度小的低頻成分,無繼續(xù)分解必要,因此分解階次數(shù)N限制在10左右即可滿足計算需求。
圖1 不同迭代次數(shù)白噪聲分解結(jié)果
該改進算法記為CEEMDPAN(CEEMD prepara-tive adaptive noise),保留了噪聲幅值系數(shù)比ξ在分解各階段的可調(diào)性,其取值范圍通常為0.01~0.3。Wu等研究發(fā)現(xiàn)信號頻率越高添加噪聲幅值應(yīng)越小,反之應(yīng)適當加大[15]??紤]以上因素,結(jié)合EMD分解的二進濾波器特性及IMF分量有效階次數(shù),進一步提出一種各階加噪幅值策略:
(3)
式中:ξj為添加的第j階噪聲幅值系數(shù)比;ξmax和ξmin為設(shè)定的最大和最小值,階次數(shù)j越大ξj越小。因此對預(yù)先確定的有效階次數(shù)N只需設(shè)定加噪幅值范圍即可計算出各階噪聲幅值強度。
對聲發(fā)射信號進行稀疏表示分類,其基本思想是在原子集中尋找一系列系數(shù),以盡量少的非零元素線性組合來表示目標聲發(fā)射信號,類別標簽由每個類別重構(gòu)值之間的最小殘差確定。
(4)
式中:第一項為線性回歸模型損失函數(shù);第二項為對所求線性變換施加的結(jié)構(gòu)化稀疏約束;λ為正則化約束參數(shù),用于平衡重構(gòu)誤差和系數(shù)值之間的重要程度。通過引入L2,1范數(shù)約束,GSC在不同類別樣本間施加L1范數(shù)約束實現(xiàn)組間稀疏,而對同類樣本以L2范數(shù)約束來減小稀疏系數(shù)分散。
考慮各類獨立采樣的聲發(fā)射信號,通常只需保證待分類樣本信號與字典D中某一類組訓(xùn)練樣本信號具有高同源性,依靠類間差異即可滿足組稀疏分類要求。但列車車體結(jié)構(gòu)和材料復(fù)雜,聲發(fā)射加載測試過程還需考慮異源波形混疊、波達路徑時差及噪聲影響,考慮圖2中多源過程,各通道信號與傳感器、聲發(fā)射源及噪聲相對位置高度相關(guān),最終波形取決于波源、波達時差和幅值衰減等因素。此時傳感器接收到的信號可能隸屬于由獨立采樣訓(xùn)練獲得字典中的多個組,各組原子間可能存在重疊現(xiàn)象。同時,來自不同聲發(fā)射源的寬頻應(yīng)力波在局部波模式和特征頻率分布上不一定存在顯著差異,將進一步加劇組間原子重疊。
圖2 多源含噪聲發(fā)射信號
顯然,組稀疏模型假設(shè)各子字典類組間原子互不相交,未考慮組間原子重疊,組稀疏套索在具有重疊原子的正則化計算過程中無法有效選擇最佳原子。引入組間原子重疊這一先驗信息,設(shè)字典D內(nèi)包含的K類分組為c1,…,ck,其中組索引集ck?{1,…,p}允許各類組間原子重疊,p為字典整體原子數(shù),所有類組索引集的集合為C={ck|k=1,…,p},且∪ck∈Cck={1,…,p}。令θck為對應(yīng)組ck的子系數(shù)向量,引入類組加權(quán)思想以評估各類樣本重構(gòu)待測樣本時的重要程度,于是考慮組間原子重疊的組套索模型為:
(5)
式中:ωck為ck權(quán)值,表示Y到單類重構(gòu)子字典空間的距離,即由子字典Dk表示的準確程度,對其規(guī)范化取值計算有:
(6)
式中:通過帶寬參數(shù)σ1調(diào)整重構(gòu)權(quán)值ωck衰減速度。
為兼顧組套索帶來的組間稀疏和套索帶來的組內(nèi)稀疏,對式(5)引入一個獨立的L1范數(shù)約束以凸顯組內(nèi)稀疏性,得到混合重疊組稀疏(mixed overlapping group sparse, MOGS)套索模型:
(7)
在MOGS分類規(guī)則上,對類別重疊依賴小的樣本可按最小重構(gòu)誤差作為分類依據(jù);當考慮類間重疊時,應(yīng)當以類間重構(gòu)貢獻度作為分類依據(jù)。
(8)
其中誘導(dǎo)稀疏的正則化罰項λψ(X)需與稀疏模型相匹配,于是針對MOGS模型提出基于層次稀疏的組套索罰:
(9)
式中:xi[ck]為xi對應(yīng)ck組索引集的子系數(shù)向量,字典學(xué)習問題可進一步表示為:
(10)
以高斯隨機矩陣進行各列歸一化作為初始字典D0,依據(jù)式(10)采用K-SVD(K-singular value decomposition)對字典原子逐列更新[16],通過迭代計算尋求與原樣本誤差最小化。MOGS模型可兼顧原子重疊,但原始信號樣本含有的共性干擾成分易導(dǎo)致類間原子出現(xiàn)過重疊,因此可篩選核心模態(tài)分量為樣本進行訓(xùn)練以強化字典類間差異?;趯哟蜗∈杞M套索罰的K-SVD算法流程如圖3所示。
圖3 層次稀疏組套索罰K-SVD算法流程
組套索模型求解可采用組最小角回歸、投影梯度、交替方向乘子、塊坐標下降及塊坐標梯度下降等方法??紤]MOGS套索模型求解問題,組最小角回歸方法依賴解的分段線性特性,限制較大;投影梯度法計算量相對較大;交替方向乘子法適用面廣,但其MOGS套索模型的增廣拉格朗日形式復(fù)雜;塊坐標下降基于塊坐標可分離前提,用于經(jīng)典組套索目標函數(shù)求解時各組與坐標塊一一對應(yīng),設(shè)定收斂條件后通過鎖定非目標組子模型向量值可完成迭代求解,計算效率較高。但MOGS模型組間原子重疊不滿足獨立相加性,是塊坐標不可分離和不光滑的,因此該方法也無法直接采用。
為使塊坐標可分離,可對式(7)中重疊罰項引入如下對偶范數(shù)[17]
(11)
此時重疊罰項為:
(12)
(13)
于是MOGS套索模型可寫為:
(14)
式(14)已轉(zhuǎn)化為組間和組內(nèi)混合稀疏求解問題,可采用內(nèi)外雙層坐標下降算法進行求解[18],即組間和組內(nèi)分別采用塊坐標下降和坐標下降以分別滿足組和組內(nèi)的稀疏性,進而實現(xiàn)對MOGS套索模型求解。多源聲發(fā)射信號識別整體流程如圖4所示。
圖4 多源聲發(fā)射信號識別流程
稀疏分類及重構(gòu)效果可從分類準確率、計算時間、稀疏度及殘差等方面做比較。波形特征參數(shù)是目前廣泛采用的經(jīng)典聲發(fā)射信號表征方法,以稀疏性和誤差為準則重構(gòu)的聲發(fā)射信號與原始樣本波形特征參數(shù)一致性問題還需進一步分析。連續(xù)波形采樣比突發(fā)聲發(fā)射采樣信息更全,因此同樣可圍繞簡化波形參數(shù)展開比較。表1給出了一組基于連續(xù)波形稀疏重構(gòu)分類和簡化波形參數(shù)評價指標。
表1 聲發(fā)射信號稀疏重構(gòu)評價指標
其中類別穩(wěn)定性指標(category stability index, CSI)衡量最優(yōu)類和次優(yōu)類間的差異,定義為:
(15)
振鈴計數(shù)差(different of count rate, DCR)衡量重構(gòu)前后通過門檻值的波峰個數(shù)變化情況;門檻能量比偏差(different of threshold energy percentage, DTEP)衡量重構(gòu)前后門檻值以上波形能量與總能量之比的差異;上升時間差(different of rise time, DRT)表示波形重構(gòu)前后最大振幅偏移情況。
為驗證算法有效性,以某型動車設(shè)備艙鋁合金橫梁為實驗對象,采集鋁合金裂紋擴展、膩子壓裂、漆層壓裂、斷鉛共4類聲發(fā)射信號作為原始樣本,以步進電機傳動機構(gòu)作為噪聲源,通過距離改變模擬不同強度背景噪聲。如圖5所示,聲發(fā)射傳感器放置于橫梁頂部,前置放大倍率40 dB,連續(xù)波形采樣率3 Msps。加載位置均勻分布于傳感器間10 cm×25 cm的矩形網(wǎng)格區(qū)域。兩傳感器中信號波形首次連續(xù)10次大于1.2倍實測噪聲平均幅值定為聲發(fā)射數(shù)據(jù)段起始時刻,數(shù)據(jù)截取時長3 ms,同步截斷時刻以保留不同波達路徑時差信息。
圖5 聲發(fā)射信號采集
4類聲發(fā)射信號主幅值介于0.11~0.32 V之間,選取同一傳感器10 cm處獨立加載的幾類聲發(fā)射信號各20組,干擾噪聲平均幅值0.03 V,對EEMD、CEEMDAN和CEEMDPAN算法展開對比。實驗以單變量原則進行,聚合次數(shù)I=30,加噪幅值系數(shù)比ξ=0.2,兩類改進噪聲分解方法分解階次數(shù)取10并按式(14)計算各階加噪幅值。根據(jù)聚合次數(shù),噪聲預(yù)分解矩陣維數(shù)為30×10。圖6給出同一鋁合金裂紋信號前兩階分解結(jié)果對比,兩類改進方法具備較好一致性(僅紅圈內(nèi)微小差異),而EEMD分解波形與前兩者差異更顯著,這表明在不同加噪策略下極值點和殘余噪聲的變化直接影響分解結(jié)果。
圖6 IMF1(左)IMF2(右)波形對比
圖7統(tǒng)計了80組分解數(shù)據(jù)的前四階IMF頻率分布。3種方法均呈現(xiàn)二進濾波器組特性,EEMD模態(tài)頻段重疊度和單一模態(tài)頻帶寬度均略高。CEEMDAN和CEEMDPAN各模態(tài)頻率分布較接近,頻帶重疊更小。CEEMDAN平均分解時間為31 s,CEEMDPAN為16 s,EEMD為13 s,可見CEEMDPAN在抗模態(tài)混疊和計算速度上具備優(yōu)勢。
圖8給出噪聲干擾下4類聲發(fā)射信號希爾伯特時頻譜。電機及傳動機構(gòu)摩擦噪聲主能量在20 kHz以下,低于傳感器敏感頻帶,而高頻信號可延伸至700 kHz,因此噪聲源具備一定代表性。漆層壓裂信號主要分布于20 kHz附近及46 kHz到120 kHz之間。膩子壓裂信號主要分布于23 kHz附近及40~140 kHz之間。斷鉛信號在24~500 kHz頻率段上有明顯分布,主能量集中在100 kHz內(nèi),31 kHz幅值最高,96、236 kHz附近有局部峰值。鋁合金裂紋擴展信號主要分布于24~800 kHz,在90 kHz附近能量最高,160、300,650 kHz存在局部峰值。參考圖7可知,第一階IMF頻寬最寬,頻帶復(fù)雜。二三階IMF頻寬有所收窄,但仍包含幾類聲發(fā)射信號大部分峰值頻段,因此可考慮作為分類目標樣本。
圖8 4類含噪聲發(fā)射信號希爾伯特時頻譜
分別在干擾噪聲平均幅值約為0.03、0.06、0.11 V工況下對4類聲發(fā)射信號各獨立采集100次。隨機抽取30對截斷信號作為訓(xùn)練樣本,其余為測試樣本。以鋁合金裂紋擴展信號為主,同步加載不同位置的幾類聲發(fā)射源作為多源測試樣本,各工況獨立進行分類試驗。對比算法包括SRCF(帶標記訓(xùn)練)、CRC、GSC、WSRC、WCRC、WGSC以及對應(yīng)的核化方法KSRCF、KWCRC、KWGSC,均采用高斯核函數(shù),核空間映射內(nèi)積帶寬參數(shù)設(shè)定為輸入特征距離矩陣的均值。正則化參數(shù)λ一般在取值區(qū)間(10-1,10-4)具備較高識別率和穩(wěn)定性,本文MOGS算法取λ1=λ2=0.01,與對比算法保持一致。MOGS類間重構(gòu)權(quán)值帶寬參數(shù)σ1取測試樣本與輸入特征的平均距離方差。
以O(shè)、P、L、A分別表示漆層、膩子、斷鉛和鋁合金信號。表2顯示了平均干擾噪聲幅值0.03 V時,單源目標分別以原信號和經(jīng)CEEMDPAN分解后前三階IMF分量為樣本時不同算法的識別率結(jié)果,其中黑體下劃線為最優(yōu)識別率,下劃線為次優(yōu)識別率。觀察表2數(shù)據(jù),KWGSC和MOGS明顯優(yōu)于其他算法,前者以8個最優(yōu)和5個次優(yōu)展現(xiàn)出最佳識別性能,后者為6個最優(yōu)和4個次優(yōu)??傮w上原始信號為樣本時分類效果最差,以IMF2和IMF3為樣本時識別率各有高低,漆層、膩子聲發(fā)射信號中高頻能量較小,拆分掉低頻分量后仍有較好的分類效果,說明經(jīng)CEEMDPAN拆分后的中高頻模態(tài)有效保留了信號各自特征,反應(yīng)出局部窄帶信號分類的良好適應(yīng)力,且整體上IMF2分類效果更優(yōu)。以KWGSC為例,IMF2為樣本時4類信號識別率分別為92.9%、94.3%、100%、100%,較原始信號的63.6%、66.4%、72.9%、67.1%分別提升了29.3%、27.9%、27.1%和32.9%。MOGS在IMF2代替原信號后識別率分別提升了34.3%、30.8%、29.3%和32.1%,說明以單一模態(tài)信號代替原始信號降低了類間字典原子的過度重疊,顯著提升了區(qū)分性能。
表2 不同樣本識別率對比(平均噪聲0.03 V)
表3顯示不同噪聲強度下,對單源及多源混合信號以第二階模態(tài)為樣本輸入時的識別率結(jié)果,多源樣本分類識別目標為鋁合金聲發(fā)射信號。結(jié)合表2,SRCF略優(yōu)于CRC表明此類聲發(fā)射分類問題協(xié)作性并不占優(yōu),GSC好于前兩種算法體現(xiàn)出非單一范數(shù)約束的顯著優(yōu)勢,WGSC重構(gòu)冗余加權(quán)的引入也有更優(yōu)效果,幾類核化算法實現(xiàn)了比單純距離加權(quán)更好的識別效果。在多源含噪識別中,KWGSC和MOGS明顯優(yōu)于其他算法。MOGS以16個最優(yōu)、2個次優(yōu)表現(xiàn)出最佳分類效果,且識別率都在80%以上,對比算法識別率隨噪聲和聲源增多均有顯著降低。參考平均計算時間,單純距離加權(quán)耗時最長,基于CRC的算法運行效率最高,核化算法重構(gòu)系數(shù)結(jié)合距離加權(quán)能顯著加快收斂,MOGS在經(jīng)塊坐標可分離和罰函數(shù)平滑處理后,采用雙層坐標下降方法也實現(xiàn)了較快的收斂。
表3 不同噪聲強度下以IMF2為樣本的識別率對比(多源信號時為鋁合金識別率)
圖9給出表3中幾類較優(yōu)算法正確分類時的類別穩(wěn)定性指標(CSI均值)。對比算法在低噪聲時CSI顯著低于MOGS算法,但隨噪聲強度增強而大幅增加。MOGS低噪聲下較高的CSI值本質(zhì)上是由類間原子重疊引起,其大小取決于類別貢獻度,需注意這一指標并不直接影響分類結(jié)果。事實上,得益于類間原子重疊時距離加權(quán)和獨立類內(nèi)L1范數(shù)約束,其CSI在單源及多源測試樣本下隨噪聲干擾變化較小且穩(wěn)定在可接受范圍, 這是MOGS在強噪聲干擾下仍具備較好分類性能的根本原因。
以波形峰值為閾值統(tǒng)計幾類算法的IMF2重構(gòu)波形簡化參數(shù)指標,如表4所示,振鈴計數(shù)差(DCR)和門檻能量比偏差(DTEP)為統(tǒng)計的百分比均值,上升時間差(DRT)為重構(gòu)前后峰值偏移點數(shù)絕對值取平均。同對比算法比較,MOGS在3類指標中均有最優(yōu)結(jié)果,說明原子重疊重構(gòu)能更好貼近原始波形內(nèi)部組分和結(jié)構(gòu),其波形還原優(yōu)勢可為高噪聲、多源環(huán)境下利用經(jīng)典聲發(fā)射參數(shù)指標實現(xiàn)特定目標的缺陷評估和源的精確定位提供方法參考。
基于組稀疏分類架構(gòu),提出一種具備原子重疊的混合組稀疏模型(MOGS)用于噪聲干擾下列車車體缺陷多源聲發(fā)射信號識別。設(shè)計了一種優(yōu)化噪聲加入的完備聚合經(jīng)驗?zāi)B(tài)分解算法(CEEMDPAN)提取分類樣本,通過實驗對比,得出以下結(jié)論:
1) 本文提出的CEEMDPAN分解算法通過噪聲預(yù)分解矩陣實現(xiàn)了與CEEMDAN分解效果相近的低模態(tài)混疊結(jié)果,平均計算時間減少了48%。
2) MOGS模型通過在字典訓(xùn)練和重構(gòu)過程引入原子重疊來貼近聲發(fā)射信號的多源組成,有更強的分類魯棒性。以包含特征頻段的模態(tài)為分類樣本能顯著提高類間差異。在3種噪聲工況下,MOGS模型識別率較次優(yōu)方法平均提升了16.4%、10.3%和23.86%。
3) 本文方法仍有許多值得改進和研究的地方,如:正則化參數(shù)和重構(gòu)權(quán)值帶寬參數(shù)的最優(yōu)化問題;從結(jié)構(gòu)化稀疏角度實現(xiàn)弱聲發(fā)射源同步識別問題;基于重構(gòu)波形實現(xiàn)多源干擾條件下的特定目標聲發(fā)射源定位問題;拓展對應(yīng)核化算法,尋找快速稀疏求解方法等。