鄒瑛珂, 賈云飛, 劉素蕓
(1. 南京理工大學機械工程學院,江蘇 南京 210094; 2. 山西北方興安化學工業(yè)有限公司,山西 太原 030008)
近年來,隨著安全形勢的變化以及傳感器技術的不斷成熟,自動化預警、“無人值守”概念在安保領域和軍事領域越來越受重視。作為周界安防系統(tǒng)的一環(huán),對地面目標的識別需求最為廣泛;因此,如何從傳感器所采集到的含噪音地面地震動信號中提取需要的信息來實現(xiàn)對人車目標的識別就顯得尤為重要。其中,研究在復雜振動信號中提取有用的特征值的方法對解決地震動信號人車識別問題具有重要意義。針對此問題所開展的研究相對較少,目前比較主流的傳統(tǒng)方法是以短時過零點[1]、峭度[2]、小波變換、經驗模態(tài)分解為代表的方法;在國內,針對人車信號的專門研究比較少,類似問題的前沿方法包括由陶良小等提出的基于線性陣列包絡線偏移疊加的檢測方法[3],吳甄非等提出的HHT變換[4]來幫助識別人車信號。在國外,針對類似震動信號,Muralidharan等也提出了一種基于隨機森林和變分模態(tài)分解的震動信號特征提取方法[5]。劉自然提出一種基于改進經驗小波變換的沖擊信號特征提取方法[6]。這些方法在平坦且震動傳導良好的水泥路面、實驗室環(huán)境中表現(xiàn)出色。但在野外環(huán)境中,由于土質、天氣、地下生物活動等因素影響,地震動信號常常包含著許多噪音,且往往需要探測較遠距離的目標,這些因素造成整個信號信噪比偏低,且后兩者計算量偏大,不易進行實際應用。因此上述方法雖然在實驗環(huán)境表現(xiàn)出色,但在野外松軟土質環(huán)境中識別率較低?;诃h(huán)境和被測信號的特征兩個因素,本文使用希爾伯特變換提取包絡線來實現(xiàn)一次降噪,并將一次降噪后的信號利用改進型的EMD分解方法來獲得具有高信噪比的IMF分量,然后通過互相關函數(shù)、統(tǒng)計學量等方法獲得特征值,最后投入隨機森林分類器中進行分類從而實現(xiàn)較遠距離人車信號的識別。
希爾伯特變換是一種常用的提取信號包絡線的方法。該變換方法可以看做是一個正交濾波器,可將所有的正頻率分量移相–90°,對負頻率分量移相90°,從而能將一個實信號變換為一個復信號的虛部。通過求解該復信號的幅值即可求得原信號的包絡從而將其低頻分量解調出來[7]。
一個實信號x(t)的希爾伯特變換定義為:
將原信號作為實部,式(1)信號作為虛部,可得到一個解析復信號:
得到該復信號后,通過求其幅值則可得到其復包絡信號:
經驗模態(tài)分解方法(EMD)是依據(jù)數(shù)據(jù)自身的時間尺度特征來進行信號分解而無須預先設定任何基函數(shù)。正是這樣的特性,使EMD 方法在理論上可以應用于任何類型的信號的分解, 因而在處理非平穩(wěn)及非線性數(shù)據(jù)上,具有非常明顯的優(yōu)勢和很高的信噪比。
EMD分解步驟可歸類為如下幾步[8]:
1)找出原始信號所有極值點。
4)原始信號減均值包絡線,得到中間信號:
5)判斷該中間信號是否滿足IMF的兩個條件:
①在整個數(shù)據(jù)段內,極值點的個數(shù)和過零點的個數(shù)必須相等或相差最多不能超過一個。
②在任意時刻,由局部極大值點形成的上包絡線和由局部極小值點形成的下包絡線的平均值為零,即上、下包絡線相對于時間軸局部對稱。
如果滿足,該信號就是一個IMF分量IMFi(n),用原始信號減去該IMF,作為新的原始信號,返回第一步。
重復步驟1)~5)k次,直到滿足IMF篩選停止的原則。IMF篩選停止原則為:
EMD分解的優(yōu)點是克服了基函數(shù)無自適應性的問題,對于一段信號可以不進行事先的復雜分析或參數(shù)調整就可直接分解出所需的特征信號,且運算量相對小波分析等算法來說更較小,這是其可運用在下位機上的關鍵優(yōu)勢。但其算法本身的原理會導致其分解出來的IMF出現(xiàn)模態(tài)混疊現(xiàn)象甚至造成信號失真;并且在低信噪比的信號中分解出來的IMF信噪比也會較低,導致這種現(xiàn)象會被進一步放大,從而影響后續(xù)識別的結果。雖然有人也提出了包括EEMD[9]等改進方法,但針對此類問題的效果提升不大。因此需要對EMD分解進行改進。
針對低信噪比信號的EMD分解方法,本文提出了一種名為協(xié)方差疊加經驗模態(tài)分解(covariance superposition empirical mode decomposition, CSEMD)的改進型EMD方法。其基本原理是對信號中具有高相關性的信號進行加重,低相關性的信號(一般為噪音)進行減重。在此基礎上進行EMD分解,從而得到擁有較高信噪比的IMF分量。CSEMD分解可歸類為如下幾步:
1)對信號x(n)進行EMD分解。
2)將EMD分解所得出的IMF信號IMFi(n)與原始信號x(n)進行協(xié)方差運算。所得到的協(xié)方差矩陣為:
3)將所得協(xié)方差標準化后進行排序,取協(xié)方差最大的IMF信號為IMFmax(n),取協(xié)方差最小的IMF信號為IMFmin(n)。二者相減并取其平均值,將值加至原始信號得到高信噪比信號x'(n)。其公式為:
4)對x'(n)再次進行EMD分解,可得高信噪比IMF。
隨機森林算法是機器學習、計算機視覺等領域內應用較為廣泛的一個分類器,也可以作為一種數(shù)據(jù)降維的手段[10]。通過集成學習的思想,將原本作為弱分類器的通過不同訓練集訓練出來多個決策樹算法集成到一起從而形成一個強分類器,實現(xiàn)復雜的分類。
隨機森林在變量(列)的使用和數(shù)據(jù)(行)的使用上進行隨機化,生成很多分類樹,每個樹都是一個獨立的判斷分支,互相之間彼此獨立。其中生成分類樹的算法本文中采用基尼指數(shù)[11]:
當在基于某屬性對一個新的對象進行分類判別時,隨機森林中的每一棵樹都會給出自己的分類選擇,并由此進行加權輸出。本算法相比其他機器算法優(yōu)點是不易過擬合,不用進行相關參數(shù)的調整,其算法理解起來較容易,可以很好地移植到下位機上進行獨立運算,且判斷過程的運算量較低,不用運算復雜的矩陣。
下文將通過人員和車輛兩種仿真信號各自使用希爾伯特變換+CSEMD與希爾伯特變換+EMD算法進行分解,并將所得的特征信號在信噪比和模態(tài)混疊現(xiàn)象方面進行對比。
根據(jù)特點分析,可以將人員信號看作是一種類沖擊信號,其特征是不連續(xù)出現(xiàn)但是信號本身頻率較高。由于在野外環(huán)境下人員信號會受到土壤中某些高頻振動信號(如風吹樹導致樹根震動、地下動物的活動)的干擾,因此在信號中會有能量較高的高頻震動信號和幅值較低的隨機信號。根據(jù)分析生成如下信號,長度為1024個數(shù)據(jù)點,采樣頻率為1000 Hz。其中人員仿真信號方程為:
式中:N——數(shù)據(jù)點位置;
f——需要提取的特征信號;
rand——絕對值介于0到0.25的高斯白噪音。
其中,260 圖1 人員仿真信號 利用希爾伯特變換提取的包絡線如圖2所示。 圖2 人員仿真信號包絡線 可以看出包絡線雖然提取出了沖擊信號,但由于毛刺過多會嚴重影響后續(xù)算法的準確性。直接使用CSEMD提取人員腳步特征結果如圖3所示。 圖3 包絡線CSEMD分解結果IMF3 通過IMF3模態(tài)可以看出雖然CSEMD可以提取出腳步信號,但其信噪比較低,且有比較嚴重的模態(tài)混疊現(xiàn)象,不利于后續(xù)包括均值、方差、峭度等特征量的提取。因此必須對包絡線進行平滑處理。由于人行走信號是一種類沖擊信號,幅值較大。因此進行的平滑處理不可以過濾該類信號。同時觀察到包絡線中的毛刺主要是圍繞某個值所產生的上下小范圍跳變,是高頻低幅值噪音,使用滑動平均濾波效果好??紤]到二者性質,使用滑動平均濾波可使信號平滑的同時保留沖擊信號特征[12]。其濾波公式為: 其中n為幀長。此處步長取1。 通過滑動平均濾波平滑處理后的包絡線信號如圖4所示。 圖4 人員仿真信號包絡線(平滑后) 可以看出在保留了沖擊信號的同時過濾掉了絕大多數(shù)的毛刺信號,便于后續(xù)的算法分解。使用EMD和CSEMD提取人員腳步特征結果如圖5和圖6所示。 圖5 平滑后包絡線EMD分解結果 圖6 平滑后包絡線CSEMD分解結果IMF3 對比圖3,可以看出對平滑后的包絡線進行分解后獲得的腳步信號信噪比更高,更有利于對包括翹度、方差等特征量提取。但其中EMD分解提取出的第一個腳步信號有所失真。只有平滑后的包絡線通過CSEMD分解提取出的腳步信號在保證信號不失真的同時擁有更高信噪比,模態(tài)混疊現(xiàn)象影響較小,更有利于從中提取特征量從而完成識別。 根據(jù)特點分析,車輛信號可以看做是一種連續(xù)低頻信號。且由于技術指標要求車輛探測距離較遠,因此幅值較低。在野外環(huán)境下會受到土壤中某些高頻振動信號(如風吹樹導致樹根震動、地下動物的活動)的干擾,因此在信號中會有能量較高的高頻震動信號和幅值較低的隨機信號。生成信號如圖7所示,長度為 900個數(shù)據(jù)點,采樣頻率為 1000 Hz。由于車輛震動信號也與人行走震動信號一樣是自身產生的震動信號與地面中的高頻信號的疊加。因此車輛仿真信號方程為: 圖7 車輛仿真信號 參照人員信號,對其進行希爾伯特變換,所得包絡線如圖8所示。 圖8 車輛仿真信號包絡線 直接使用CSEMD從中提取車輛腳步特征結果如圖9和圖10所示。 圖9 車輛仿真信號包絡線CSEMD分解結果IMF3 圖10 包絡線CSEMD分解結果IMF3瞬時頻率 可以觀察到由于大量毛刺的影響,使用CSEMD進行信號分解有比較嚴重的模態(tài)混疊。由于車輛信號屬于一種低頻信號,進行滑動平均濾波處理對車輛信號的影響較小。因此同樣使用滑動平均濾波,所得圖像如圖11所示。 圖11 車輛仿真信號包絡線(平滑后) 使用EMD和CSEMD對平滑后的包絡線提取車輛特征結果如圖12和圖13所示。 圖12 車輛仿真信號平滑后包絡線EMD分解結果IMF3 圖13 車輛仿真信號平滑后包絡線CSEMD分解結果IMF3 由于在時域上二者的對比不是很明顯,因此觀察二者的瞬時頻率結果如圖14和圖15所示。 圖14 平滑后包絡線EMD分解結果IMF3瞬時頻率 圖15 平滑后包絡線CSEMD分解結果IMF3瞬時頻率 從瞬時頻率圖中與圖10相比可以看出,通過CSEMD提取出的車輛信號的IMF3模態(tài)可改善模態(tài)混疊。雖然對連續(xù)車輛信號的提取改善相較于EMD沒有腳步信號明顯,但對其進行特征提取仍然是有利的。 綜上所述,本文提出的希爾伯特+CSEMD算法對人員腳步信號的提取相對于傳統(tǒng)希爾伯特+EMD算法在提高信噪比、防止提取信號失真和抑制模態(tài)混疊方面有明顯正面促進作用。在針對連續(xù)車輛信號方面也有一定改善。因此本算法對于提取人車信號是有效的。 在晴天、低速風(風速不高于3級)、均質土壤的環(huán)境中通過采集卡和VAS-100地震動傳感器獲得人車原始信號,采集頻率為 1000 Hz。地震動傳感器插入地表以下約20 cm處,測試車輛為某品牌SUV在距離傳感器100 m以20 km/h勻速向著傳感器方向行駛,測試人員為單人從距離傳感器50 m處向著傳感器方向正常勻速行走。車輛和人員的部分原始信號如圖16和圖17所示。 圖16 車輛原始信號 圖17 人員原始信號 由于信噪比較低,進行傅里葉變換后其簡單的時域特征量(包括平均數(shù),中位數(shù),方差,最大最小值等)和頻譜功率譜的各個特征量(包括平均數(shù),中位數(shù),方差,最大最小值等)都較為相近,因此無法單純從頻域上進行識別。而運用一些較為復雜的頻域特征提取算法如小波變換等計算量又過大,無法在下位機中實現(xiàn)。因此需要在時域或時頻域上尋找其他計算量相對較小又能夠提取其特征的方式來實現(xiàn)目標功能。 處理數(shù)據(jù)為上述實地采集的車輛人員地震動數(shù)據(jù),其中車輛數(shù)據(jù)為距離傳感器100 m處開始向著傳感器方向接近的過程,人員數(shù)據(jù)為距離傳感器50 m處向著傳感器方向接近的過程,采樣頻率F=1000 Hz,2048個點為一幀數(shù)據(jù)。使用本文提出的希爾伯特變換+CSEMD算法和希爾伯特變換+EMD算法進行處理并比較結果。 首先通過希爾伯特變換提取二者的包絡線相當于對原信號進行了解調。去掉包絡線偏置,對其進行EMD分解,可得到EMD分量如圖18和圖19所示。 圖18 人員信號EMD分解 圖19 車輛信號EMD分解IMF1-5 再將信號的IMF與原始信號進行協(xié)方差運算,篩選出協(xié)方差最大和最小的IMF進行相減取平均,并加在原始信號中,再對其進行EMD分解,得到的CSEMD分量如圖20和圖21所示。 圖20 人員信號 CSEMD分解 圖21 CSEMD車輛信號IMF1-5 可以看出,EMD分解人車信號所得的IMF2與CSEMD的IMF1等效,且都包含了顯著的特征信號:人員信號對應的IMF有效提取出了人員腳步行走較離散的特征信號,車輛信號對應的IMF提取出了車輛運動較為連續(xù)的特征信號。同時,車輛信號的幅值都提高了50%以上。 但其模態(tài)混疊段的幅值均出現(xiàn)了下降。其中人員信號的模態(tài)混疊幅值降低了。其中人員信號模態(tài)混疊段幅值降低了80%,車輛信號模態(tài)混疊段幅值降低了50%。EMD的IMF2與CSEMD的IMF1如圖22~圖25所示。 圖22 EMD人員信號IMF2模態(tài)混疊段 圖23 CSEMD人員信號IMF1模態(tài)混疊段 圖24 EMD車輛信號IMF2模態(tài)混疊段 圖25 CSEMD車輛信號IMF1模態(tài)混疊段 最后,可采用CSEMD分解得到的IMF1與IMF2進行統(tǒng)計學方面的分析,從而得出特征指標。筆者在本文中使用方差閾值、平均值、中位數(shù)、峭度、自動編碼器算法來提取特征。將2S信號分幀為20段,計算每段的特征值。方差超過閾值的點則視為一次有效腳步信號。將信號的腳步信號量作為一個特征量。同時,使用互相關函數(shù)對分幀信號進行特征提取。若相關系數(shù)大于閾值,則將該幀視為腳步信號,同樣也可作為一個特征量。經過大量數(shù)據(jù)比對和統(tǒng)計,車輛由于是連續(xù)信號且信號頻率不穩(wěn)定,其腳步特征量一般小于人行走信號。而人行走無論快慢,每秒步頻大約為3~4步,因此腳步信號量值較高且穩(wěn)定。 總結前面的步驟,整個算法流程圖如圖26所示。 圖26 算法流程圖 將本文算法所得的兩個特征量、過零點與峭度、直接EMD分解所得特征量投入隨機森林算法中進行訓練并測試,車輛訓練樣本數(shù)量為100組,人員訓練樣本數(shù)量為100組,車輛測試樣本數(shù)量為100組,人員測試樣本數(shù)量為100組,測試樣本和訓練樣本相互獨立。其中樣本均為在陰天與小雨,風力不高于6級,在擁有均勻硬土質地的公園所采集。其中車輛信號為2噸家用小轎車以40 km/h的速度從距離傳感器150~10 m處勻速駛近時采集的各距離樣本,人員信號為體重為80 kg的單人以正常步行速度從距離50~5 m處勻速走進時采集的各距離樣本。 所得結果如表1所示。 表1 本文算法與傳統(tǒng)算法識別結果比較 由表1可知,在使用同一種分類算法的情況下,最簡單最傳統(tǒng)的零點+峭度算法從結果來看完全無法在野外環(huán)境中識別人員和車輛。兩個特征量在遠場和近場環(huán)境中其結果完全不同甚至所得結果相反,造成這種現(xiàn)象的原因是遠場信噪比較近場更低,因此在遠場環(huán)境中所得到的特征量更偏向于是噪音本身的特征量。 而使用EMD分解所得特征量識別率偏低,且識別成功的樣本多為近場樣本,實用性偏低。 直接對遠場信號進行EMD分解會造成比較嚴重的模態(tài)混疊,從而影響后續(xù)的特征量提取,最后造成信號識別結果錯誤。同理,使用希爾伯特變換提取包絡線后再對包絡線進行EMD分解雖然可以改善模態(tài)混疊的現(xiàn)象,但其仍然對識別率有較大影響。使用本文算法可以有效改善模態(tài)混疊現(xiàn)象,使識別成功率得到較大提升,在遠場和近場環(huán)境下均有良好表現(xiàn)。且相對其他方法計算量并沒有太大提升。 本文針對在野外環(huán)境中對人車地震動信號進行正確識別這一問題,提出了通過希爾伯特變換提取包絡線來實現(xiàn)降噪,并將降噪后的信號利用改進型EMD分解方法——CSEMD分解來獲得具有特征量的IMF分量,再利用一些統(tǒng)計學方法提取特征量并將其送入隨機森林分類算法中進行人車識別。實驗結果表明:本文使用的識別算法相比于傳統(tǒng)算法結果更好,更可用于實際,且具有較好的抗噪性能。下一步工作準備在此基礎上嘗試使用其他機器學習算法,進一步優(yōu)化CSEMD分解算法效率并改進包絡線提取算法,從而降低運算量同時提升識別正確率;優(yōu)化算法準確度,使其可以在惡劣天氣(如下雨大風等情況)進行檢測;同時將該算法應用于諸如無人機飛行噪聲等其他目標探測中,提高其泛用性。2.2 人員仿真信號實驗
2.3 車輛仿真信號生成
2.4 車輛仿真信號實驗
3 實際信號實驗與結果分析
3.1 人員與車輛信號樣本說明
3.2 實際信號實驗
3.3 實驗結果與分析
4 結束語