李成娟,易 強(qiáng),李寶清,王國(guó)輝
(1.中國(guó)科學(xué)院 上海微系統(tǒng)與信息技術(shù)研究所 微系統(tǒng)技術(shù)重點(diǎn)實(shí)驗(yàn)室,上海 201800; 2.中國(guó)科學(xué)院大學(xué),北京 100049)
無(wú)線傳感器網(wǎng)絡(luò)憑借其通信能力強(qiáng)大、記錄信息全面、無(wú)需人工值守等優(yōu)點(diǎn),廣泛應(yīng)用于軍事、農(nóng)業(yè)、商業(yè)等各個(gè)領(lǐng)域[1-2]。無(wú)線傳感器網(wǎng)絡(luò)通常由圖像、聲音、紅外、震動(dòng)傳感器等幾種類(lèi)型的傳感器構(gòu)成[3]。聲音傳感器有不易被察覺(jué)、便于布設(shè)、不易受地形影響的優(yōu)點(diǎn),被廣泛使用。
根據(jù)車(chē)輛行進(jìn)過(guò)程中采集的聲音信號(hào),對(duì)野外車(chē)輛目標(biāo)進(jìn)行識(shí)別,一般分為2個(gè)步驟:1)提取聲音傳感器采集的聲信號(hào)特征;2)設(shè)計(jì)分類(lèi)器得到判別結(jié)果。目前常用的特征有基于小波包變換提取的特征,線性預(yù)測(cè)倒譜系數(shù)[4],梅爾倒譜系數(shù)(MFCC, mel-frequency cepstral coefficient)[5],基于經(jīng)驗(yàn)?zāi)B(tài)分解提取的特征[6-7]等。其中,MFCC較常見(jiàn),被廣泛用于語(yǔ)種識(shí)別、說(shuō)話人識(shí)別、聲紋識(shí)別等領(lǐng)域,近年來(lái)被成功應(yīng)用于車(chē)輛目標(biāo)分類(lèi)識(shí)別[8-10]。但由于MFCC對(duì)噪聲敏感[11-13],在車(chē)輛識(shí)別領(lǐng)域的應(yīng)用場(chǎng)景受限。
為提高特征抗噪能力,增強(qiáng)特征穩(wěn)健性,能夠體現(xiàn)野外車(chē)輛信號(hào)自身特征,提出一種改進(jìn)的MFCC特征。根據(jù)車(chē)輛目標(biāo)信號(hào)的頻譜特征,自適應(yīng)增加車(chē)輛基頻信息在特征中的比重。然后進(jìn)行F比加權(quán),以降低同種車(chē)輛類(lèi)別特征間的區(qū)分度,增大不同車(chē)輛類(lèi)別特征之間的差別,從而提高特征在野外環(huán)境下的魯棒性。使用高斯混合模型(GMM, gaussian mixture model)作為分類(lèi)器,檢驗(yàn)識(shí)別效果。提取傳統(tǒng)MFCC特征,基頻自適應(yīng)MFCC特征,加權(quán)基頻自適應(yīng)MFCC特征作對(duì)比試驗(yàn),期望獲得更高的識(shí)別準(zhǔn)確率,為野外環(huán)境的車(chē)輛識(shí)別,提供一種魯棒特征提取方法。
人耳對(duì)聲音信號(hào)的感知,與頻率呈非線性關(guān)系。隨著聲音信號(hào)的頻率降低,人耳接收信號(hào)的能力愈發(fā)敏感[14]。為使人耳對(duì)信號(hào)敏感程度與信號(hào)頻率呈現(xiàn)線性關(guān)系,MFCC參數(shù)將信號(hào)頻譜作映射處理,映射后的刻度稱(chēng)作梅爾刻度。映射函數(shù)的表達(dá)式如下
(1)
式中:M(f)為梅爾頻率;f為頻率。
第一步,提取車(chē)輛目標(biāo)聲信號(hào)的MFCC,首先需要在時(shí)域尺度對(duì)其進(jìn)行分幀、加窗、預(yù)加重等預(yù)處理。為減小頻譜泄漏,窗函數(shù)選取旁瓣衰減較大的漢明窗。預(yù)加重,實(shí)際是讓信號(hào)通過(guò)一個(gè)高通濾波器,目的是濾除車(chē)輛聲音信號(hào)中的低頻干擾成分,增加高頻成分的比重[15]。
第二步,為了將信號(hào)從時(shí)域尺度轉(zhuǎn)換為頻域尺度,作快速傅里葉變換,且計(jì)算每幀信號(hào)的能量譜。
第三步,對(duì)能量譜進(jìn)行三角濾波。梅爾三角濾波器由公式(2)計(jì)算得出。
(2)
式中:Hi(k)表示濾波器參數(shù);fi表示三角濾波器的中心頻率。濾波后取對(duì)數(shù),得到對(duì)數(shù)能量。
最后,進(jìn)行離散余弦變換,得到MFCC。為了獲取動(dòng)態(tài)信息,提取語(yǔ)音信號(hào)的MFCC特征時(shí),通常包含動(dòng)態(tài)差分步驟。與語(yǔ)音信號(hào)相比,車(chē)輛聲音信號(hào)頻帶窄,周期性強(qiáng),沒(méi)有必要獲取動(dòng)態(tài)特性,因此特征提取算法省略動(dòng)態(tài)差分步驟。
傳統(tǒng)的MFCC在識(shí)別純凈聲音信號(hào)時(shí),可得到很好識(shí)別結(jié)果,但對(duì)噪聲的敏感度很高,當(dāng)采集的實(shí)際聲音信號(hào)包含噪聲信息時(shí),識(shí)別效果易受干擾,難以預(yù)測(cè)識(shí)別效果是否符合實(shí)際需求。而且,當(dāng)風(fēng)力等級(jí)變化時(shí),很容易造成訓(xùn)練樣本集與測(cè)試樣本集不匹配。為降低噪聲對(duì)識(shí)別效果的干擾,減少應(yīng)用場(chǎng)景的限制,對(duì)傳統(tǒng)MFCC特征提取算法進(jìn)行改進(jìn)。
由于不同車(chē)型的傳動(dòng)系統(tǒng)、排氣系統(tǒng)、發(fā)動(dòng)機(jī)及其氣缸數(shù)不同,不同車(chē)輛聲信號(hào)的頻域特性存在差異。不同車(chē)輛聲信號(hào)頻譜圖如圖1所示。 從圖中可看出不同車(chē)型車(chē)輛聲音信號(hào)的基頻是不同的,因此車(chē)輛聲音信號(hào)的基頻可以作為車(chē)輛目標(biāo)識(shí)別特征。將車(chē)輛聲音信號(hào)的MFCC參數(shù)與基頻特征結(jié)合,得到基頻自適應(yīng)梅爾倒譜系數(shù)。
圖1 不同車(chē)輛聲信號(hào)頻譜圖Fig. 1 Different vehicles’ spectrograms
提取傳統(tǒng)的MFCC時(shí),梅爾三角濾波器組中心頻率根據(jù)梅爾刻度獲得,隨著頻率提升,中心頻率的密度逐漸降低。在野外情況風(fēng)噪較大時(shí),信號(hào)頻譜中含有較多干擾頻率,傳統(tǒng)梅爾三角濾波器組有可能削弱基頻在頻譜中的比重,加大無(wú)關(guān)頻率的干擾。為了更好體現(xiàn)車(chē)輛自身信號(hào)的頻譜特征,在傳統(tǒng)的濾波器組中,增添一個(gè)三角濾波器。該濾波器的中心頻率為車(chē)輛信號(hào)的基頻,通過(guò)此方法提取出來(lái)的特征稱(chēng)為基頻自適應(yīng)梅爾倒譜系數(shù)。改進(jìn)的MFCC提取過(guò)程如圖2所示。
圖2 改進(jìn)MFCC特征提取算法框圖Fig. 2 Flowchart of improved MFCC
自適應(yīng)的梅爾三角濾波器組具體設(shè)計(jì)方法如下。假設(shè)傳統(tǒng)梅爾三角濾波器組包含N個(gè)濾波器,其中心頻率組成向量F=(f1,f2,…,fN)。提取車(chē)輛信號(hào)的基頻fb,將fb與三角濾波器組的中心頻率按升序排列,組合構(gòu)成新的向量Fb=(f1,f2,…,fb,…,fN+1)。將Fb向量的各維分量作為濾波器的中心頻率,代入式(2),即可得到自適應(yīng)的三角濾波器組。傳統(tǒng)梅爾三角濾波器組與基頻自適應(yīng)的三角濾波器組如圖3所示。
圖3 三角濾波器組Fig. 3 Triangular filter-bank
為了得到基頻自適應(yīng)梅爾濾波器組,進(jìn)一步獲得基頻自適應(yīng)梅爾倒譜系數(shù),需要選擇合適的基頻提取方法,準(zhǔn)確提取車(chē)輛聲音信號(hào)的基頻。
自相關(guān)函數(shù)法提取單基頻時(shí),為了降低共振峰干擾,需要先對(duì)信號(hào)進(jìn)行帶通濾波。然后對(duì)信號(hào)進(jìn)行加窗、分幀,計(jì)算短時(shí)自相關(guān)函數(shù)。設(shè)車(chē)輛聲音信號(hào)第i幀的時(shí)間序列為datai(m),其短時(shí)自相關(guān)函數(shù)Ri(k)由式(3)得到
(3)
由于信號(hào)短時(shí)自相關(guān)函數(shù)周期與信號(hào)周期相同,因此基因周期可以取短時(shí)自相關(guān)函數(shù)的最大延遲量。對(duì)基因周期曲線進(jìn)行平滑處理,使之通過(guò)中值和線性組合濾波,得到車(chē)輛的單基頻信息。
圖4 譜減法流程圖Fig. 4 Flowchart of spectral subtraction
為了進(jìn)一步滿(mǎn)足野外環(huán)境的實(shí)際應(yīng)用需求,將單基頻提取算法改進(jìn)為多基頻提取算法。運(yùn)動(dòng)目標(biāo)在行駛過(guò)程中生成的聲信號(hào),可由其發(fā)聲主要部件產(chǎn)生的聲信號(hào)表示,其余部件產(chǎn)生的聲信號(hào)比較微弱,可忽略不計(jì)。履帶車(chē)產(chǎn)生聲信號(hào)的主要部件為履帶和引擎,輕型輪式車(chē)和輪式裝甲車(chē)產(chǎn)生聲信號(hào)的主要部件是排氣系統(tǒng)和引擎,因此車(chē)輛運(yùn)動(dòng)過(guò)程中的聲信號(hào)可由2個(gè)主要成分表示,每個(gè)主要成分產(chǎn)生一條基頻。下面簡(jiǎn)要介紹多基頻提取算法。
首先提取車(chē)輛聲信號(hào)的2條基頻,可參照單基頻提取方法。然后,將車(chē)輛的2個(gè)基頻進(jìn)行融合,得到一個(gè)新的基頻fbnew(t)。設(shè)某條車(chē)輛聲信號(hào)第t幀的2個(gè)基頻,其中較大的數(shù)值為fb1(t)、較小的數(shù)值為fb2(t),則fbnew(t)可由式(4)得到[18]
(4)
MFCC的每一維分量對(duì)表征特征的貢獻(xiàn)率不同,為增加不同車(chē)型特征之間差距,使同一車(chē)型的特征更為緊湊,在基頻自適應(yīng)梅爾倒譜特征基礎(chǔ)上,進(jìn)行F比加權(quán)。F比參數(shù),是在Fisher準(zhǔn)則基礎(chǔ)上提出的[19],由類(lèi)間離散度與類(lèi)內(nèi)離散度之比得到,可定量分析特征向量每一維分量有效性。設(shè)數(shù)據(jù)集包含M種車(chē)輛類(lèi)別的車(chē)輛聲音信號(hào),其中第i個(gè)類(lèi)型包含Ni條樣本信號(hào),則特征參數(shù)第k維特征分量的F比具體計(jì)算公式如下
(5)
特征參數(shù)中某維分量的F比參數(shù)數(shù)值越小,表明該特征分量在同類(lèi)目標(biāo)之間方差較大,在不同類(lèi)目標(biāo)之間方差較小,對(duì)表征信號(hào)特征的貢獻(xiàn)率也越低。以F比為權(quán)重,對(duì)特征向量的每一維分量加權(quán),能夠削弱貢獻(xiàn)率較低的特征分量干擾,提高貢獻(xiàn)率較高分量的作用,從而提取更能體現(xiàn)不同車(chē)輛類(lèi)別間差異的特征。
實(shí)驗(yàn)采用MATLAB R2015b平臺(tái)仿真,樣本信號(hào)采用ICS40720傳聲器設(shè)備進(jìn)行采集,采樣率為8 192 Hz。外場(chǎng)實(shí)驗(yàn)場(chǎng)景如圖5所示,目標(biāo)車(chē)輛從起始位置行駛到終止位置,麥克風(fēng)便采集到一條完整的樣本。
圖5 實(shí)驗(yàn)場(chǎng)景圖Fig. 5 Experimental scenario
仿真實(shí)驗(yàn)?zāi)康氖歉鶕?jù)野外無(wú)線傳感器網(wǎng)絡(luò)中聲音傳感器采集的信號(hào),檢驗(yàn)不同特征提取方法對(duì)車(chē)輛識(shí)別效果的影響。為了更貼近無(wú)線傳感器網(wǎng)絡(luò)的實(shí)際應(yīng)用場(chǎng)景,聲音傳感器布設(shè)位置,距離道路中心不超過(guò)50 m,起始位置到終止位置的車(chē)輛行駛總長(zhǎng)度限制在800 m以?xún)?nèi)。當(dāng)野外風(fēng)噪聲非常大時(shí),無(wú)線傳感器網(wǎng)絡(luò)中識(shí)別車(chē)型主要通過(guò)圖像和震動(dòng)傳感器,聲音傳感器難以采集到有效車(chē)輛聲音信號(hào)。因此去掉數(shù)據(jù)集中風(fēng)力級(jí)在6級(jí)以上采集的聲音信號(hào),保留數(shù)據(jù)對(duì)應(yīng)的風(fēng)力級(jí)主要集中在1~5級(jí)。
為驗(yàn)證改進(jìn)的特征提取算法的實(shí)際識(shí)別效果,共采集硬土路、砂石路、水泥路及草地4種不同路面的車(chē)輛聲音信號(hào)作為樣本。車(chē)輛類(lèi)型包含一種小型車(chē),兩種大型車(chē),不同車(chē)型的行駛速度范圍不同。小型車(chē)運(yùn)動(dòng)速度為25~60 km/h,代表車(chē)型為輕型輪式車(chē),如卡車(chē)。大型車(chē)運(yùn)動(dòng)速度為10~20 km/h,代表車(chē)型為重型輪式車(chē)、履帶車(chē),如坦克。按照實(shí)際需求以及聲音信號(hào)的特征,在實(shí)驗(yàn)中將車(chē)輛分為履帶車(chē)、輪式裝甲車(chē)和輕型輪式車(chē)3種類(lèi)型。樣本集中每種車(chē)輛類(lèi)別樣本數(shù)和總幀數(shù)如表1所示, 將樣本數(shù)按照70%和30%的比例隨機(jī)分為訓(xùn)練集和測(cè)試集,用于仿真實(shí)驗(yàn)。
表1 野外車(chē)輛樣本數(shù)
采集數(shù)據(jù)后進(jìn)行手工裁剪或拼接,由于存在人工誤差,樣本殘留了部分噪聲段。為獲得更準(zhǔn)確實(shí)驗(yàn)數(shù)據(jù),對(duì)信號(hào)進(jìn)行端點(diǎn)檢測(cè),得到有效運(yùn)動(dòng)目標(biāo)數(shù)據(jù)后,再進(jìn)行特征提取和分類(lèi)識(shí)別。譜熵是聲音信號(hào)的一種特征參數(shù),對(duì)噪聲不敏感,具有較好穩(wěn)健性,因此,采用能熵比法對(duì)車(chē)輛信號(hào)進(jìn)行端點(diǎn)檢測(cè)。
檢測(cè)到有效數(shù)據(jù)段后,首先提取維度為23的MFCC特征,然后提取維度為24的基頻自適應(yīng)梅爾倒譜特征,最后對(duì)其進(jìn)行F比加權(quán)。
表2 野外車(chē)輛識(shí)別結(jié)果
F比加權(quán)的基頻自適應(yīng)梅爾倒譜參數(shù)與傳統(tǒng)的MFCC相比,識(shí)別準(zhǔn)確率提高7.10%,漏警率降低7.10%,相對(duì)值降低56.62%,虛警率降低3.93%,相對(duì)值降低61.70%,有更高的魯棒性,更適用于野外環(huán)境中車(chē)輛識(shí)別。
雖然F比加權(quán)的梅爾倒譜特征具有較好魯棒性,但在進(jìn)行特征提取之前,對(duì)野外采集的信號(hào)進(jìn)行增強(qiáng)并降噪也非常重要。如何有效去除運(yùn)動(dòng)目標(biāo)聲信號(hào)中包含的噪聲,將是下一步研究的重點(diǎn)內(nèi)容。