(上海大學 通信與信息工程學院,上海 200444)
實現(xiàn)車輛類型的自動識別可以在現(xiàn)實中帶來很多的益處,比如軍事攻防、智慧城市等方面。對于車型識別的研究,很多都是基于圖像處理所進行的[1-2],但是基于圖像的車輛識別可能受到遮擋、光照、隱蔽性不足等等影響,因此本文的研究主要是通過聲頻來進行車輛目標類型的分類識別。
在模式識別中,分類算法起到了至關(guān)重要的作用。稀疏表示分類(SRC)[3]在人臉識別領(lǐng)域的應用取得了很大的成功,基于SRC發(fā)展的算法在很多模式識別領(lǐng)域展開了廣泛的研究:Wen[4]等提出了一種基于新型字典的SRC方法用于人臉識別;張[5]等結(jié)合了多特征融合和SRC用于農(nóng)業(yè)害蟲識別;在聲頻車輛目標識別領(lǐng)域,Wang[6]等采用SRC得到了不錯的分類識別結(jié)果等等。但是,SRC類型的算法可能在識別過程中比較耗時,Zhang[7-8]等在研究中發(fā)現(xiàn),在實際的人臉識別問題中,協(xié)同表示在稀疏表示分類算法中發(fā)揮了更大的作用,因此提出了協(xié)同表示分類(CRC)算法,相比于SRC,明顯地提高了人臉識別速度。同時,CRC算法框架還改進了傳統(tǒng)框架中重構(gòu)殘差的計算公式,可一定程度提升分類精度。由于CRC的高效性,眾多圍繞著CRC的模式識別研究相繼展開:Yang[9]等提出了核版本的協(xié)同表示分類方法用于圖像分類;李[10]等提出了使用CRC來進行步態(tài)的識別;王[11]等采用聲頻和振動信號多任務聯(lián)合的CRC來進行車輛識別等等。
在SRC的研究中,Lu[12]等發(fā)現(xiàn)將每一個訓練樣本和測試信號的相似性考慮進分類算法中將提升SRC的識別精度,因此提出了加權(quán)稀疏表示分類(WSRC)方法并在人臉識別中取得了較好的效果。保局性[13-14]對于分類器具有十分重要的意義,類似的,將保局性考慮進CRC的加權(quán)類型的協(xié)同表示分類算法被廣泛的提出用于圖像領(lǐng)域的模式識別研究中[15-17]。
在采用聲頻進行車輛類型識別的領(lǐng)域,羅[18]等基于Lu[12]等的思想,提出了基于WSRC的車輛識別,證明了在聲頻車輛類型識別中,其基于保局性的加權(quán)編碼方式仍然可以對分類識別精度的提升起到很好的作用。由于保局性在聲頻車輛識別中的良好表現(xiàn)和CRC理論所展現(xiàn)出的高效性,本文在聲頻車輛目標識別中,將加權(quán)編碼引入到CRC方法框架中,提出了在聲頻無線傳感器網(wǎng)絡(luò)下基于加權(quán)協(xié)同表示分類(WCRC)的車輛識別,用以提高車輛識別速度和精度。同時對于使用歐氏距離進行加權(quán)編碼[18]造成的樣本相似性判斷不足,本文將曼哈頓距離引入加權(quán)編碼中以提升識別精度,進一步提出了基于曼哈頓距離加權(quán)協(xié)同表示分類(本文稱之為Manhattan-WCRC)的聲頻車輛目標識別。通過實驗,本文將在同等條件下通過和WSRC、CRC、SRC作對比,來驗證Manhattan-WCRC、WCRC在采用聲頻特征信號進行車輛目標類型識別中的可行性和優(yōu)勢。
通過聲波來識別車輛目標類型是可行的,但是車輛在行駛過程中產(chǎn)生的原始信號包含了大量的噪聲,所以在分類識別前需要進行很多步驟的處理,本文總結(jié)了聲頻傳感器網(wǎng)絡(luò)下的車輛目標識別框架。
圖1 聲頻車輛目標識別模型
如圖1模型所示,具體分類識別過程由以下幾步組成:
1)需要采集到車輛行駛過程中產(chǎn)生的有效聲波信號??梢酝ㄟ^在需要檢測的車輛目標的行駛道路上搭建基于聲頻的無線傳感器網(wǎng)絡(luò)進行聲頻信號的采集,再采用恒虛警率(CFAR)[19]算法,獲得原始聲頻數(shù)據(jù)中真正的有效信號。
2)對采集到的經(jīng)過CFAR算法檢測的有效信號,進行相關(guān)方面的預處理(主要包括預加重、分幀和加窗、以及端點檢測)。
3)對于已經(jīng)預處理好后的聲頻車輛目標信號使用MFCC[6](梅爾頻率倒譜系數(shù))進行聲頻信號的特征提取。其中,MFCC算法是在聲音識別領(lǐng)域中最常見且行之有效的特征提取算法。
4)將特征提取后的信號輸入到分類算法(包括訓練集和待測信號),從而預測待測信號的所屬類別,以實現(xiàn)車輛類型識別的目的。由于分類算法在聲頻車輛目標識別中占有非常重要的地位,本文主要研究了分類算法在車輛識別中的性能。
稀疏表示分類實質(zhì)上是通過將所有訓練信號構(gòu)成字典,然后通過字典來對測試信號進行稀疏表示得到測試信號的系數(shù)向量(字典對測試信號進行稀疏表示后的向量),再將每個類的系數(shù)向量和每個類的字典進行重構(gòu)與原測試信號求殘差,殘差最小那一類便是測試信號所歸屬的那一類。
聲頻車輛目標識別中的稀疏表示分類(SRC)方法框架總結(jié)如下:
1)輸入包含了L個類別的訓練集字典D(其中:信號特征維度為M,信號的個數(shù)為N,構(gòu)成了一個M×N矩陣):
D=[D1,…,Di,…,DL]∈RM×Ni=1,2,…,L
(1)
其中:每一類訓練樣本Di包含n個同類別的測試樣本:
(2)
接下來輸入一個要判斷類別的測試樣本x∈RM,和正則化參數(shù)λ。(下文中測試樣本x和訓練字典D都以此為準,不再做詳細描述。)
(3)
在適當?shù)摩?ε為信號的噪聲水平)和λ參數(shù)條件下,等價于以下的式子:
(4)
3)各類重構(gòu)殘差計算:
(5)
4)輸出識別結(jié)果:
(6)
Zhang[7-8]等指出在人臉識別中通常都是小樣本的問題,其每一類的字典都是欠完備的,通過每一類的欠完備字典單獨來表示測試樣本是不穩(wěn)定的??梢酝ㄟ^兩種方式來解決這個問題:1)將每一類訓練字典都引入足夠多的樣本來構(gòu)成超完備字典,但是這在上述實際問題中已經(jīng)難以實現(xiàn)。2)在SRC中,實際上可以在一定1-范數(shù)稀疏約束下,通過所有類一起來協(xié)同表示測試樣本。
其中Zhang[7-8]等分析指出,在SRC中對于提高分類識別率起主要作用的是協(xié)同表示,而不是1正則化項:
(7)
但是,當樣本數(shù)變大時,式(7)將會變的不穩(wěn)定,因此SRC中通過施加1-范數(shù)稀疏約束來得到穩(wěn)定的解,但是求解1-范數(shù)最小化問題會比較耗時,可以采用2-范數(shù)來正則化系數(shù)向量的解(使得解穩(wěn)定,同時注入一定的稀疏性),從而大幅度降低運算時間,同時得到相對接近的識別結(jié)果。在CRC中,給出基于正則化最小二乘法的系數(shù)向量解法:
(8)
其中式(6)可以改寫為:
(9)
其中:
P=(DTD+λ·I)-1DT
(10)
這里I為單位矩陣,矩陣P可以通過已知的訓練字典提前計算好,加之矩陣計算的速度是非常快的,因此CRC的識別速度得到了明顯的提高。
(11)
聲頻車輛目標識別中的協(xié)同表示分類(CRC)方法框架總結(jié)如下:
1)輸入訓練字典D、正則化參數(shù)λ。
2)提前計算矩陣P:
P=(DTD+λ·I)-1DT
4)各類重構(gòu)殘差計算:
5)輸出識別結(jié)果:
SRC在全局的表示過程中,忽略了輸入信號局部的分布結(jié)構(gòu),而局部保持特性(以下稱之為保局性)[13]在分類器里卻起到了比較有益的作用[14]。為了彌補SRC對于保局性的重視程度不足,Lu[12]等在人臉識別領(lǐng)域提出了加權(quán)稀疏表示分類(WSRC)算法,并且在精度上有不錯的提高。以上主要是針對圖像領(lǐng)域的工作,羅[18]等提出將WSRC引入了聲頻車輛目標識別領(lǐng)域,通過測試信號和每一個訓練樣本之間的相似度(基于歐氏距離)將稀疏表示后的系數(shù)向量添加不同的權(quán)值來提升識別效果。基于以上所做的工作,本文將聲頻無線傳感器網(wǎng)絡(luò)下車輛識別中的WSRC的加權(quán)編碼方法總結(jié)如下:
2)計算權(quán)值W。W為對角矩陣,其對角元素為:
(12)
其中:
(13)
3)分配權(quán)重,得到加權(quán)后的系數(shù)向量:
(14)
加權(quán)后的系數(shù)向量中,測試信號所歸屬類的系數(shù)向量部分和該類字典的重構(gòu)率會更好,相反的,和測試信號相似度更小(距離值更大)類部分對應的系數(shù)向量和該類字典的重構(gòu)率會越差(即殘差會越大),從而拉開了兩者重構(gòu)率之間的差距,以達到提高識別率的目的。為方便對比,本文給出聲頻車輛目標識別中的WSRC方法框架總結(jié)如下:
1)輸入測試信號x、訓練字典D、正則化參數(shù)λ。
4)各類重構(gòu)殘差計算:
(15)
5)輸出識別結(jié)果:
1)輸入訓練字典D、正則化參數(shù)λ。
2)提前計算矩陣P:
P=(DTD+λ·I)-1DT
5)各類重構(gòu)殘差計算:
(16)
6)輸出識別結(jié)果:
曼哈頓距離(Manhattan distance)又稱作城市街區(qū)距離(City Block distance),以二維空間為例,如圖2可以看到,在擁有眾多街區(qū)的紐約曼哈頓,從A點到B點最短的距離為歐氏距離,但是實際的情況(因為街區(qū)房子的阻隔,不能直接由A到B抵達終點)可能需要經(jīng)過1或2路線的距離長度(其中路線1和路線2的長度是等價的)。其中路線1或2所代表的距離長度可能比路線3帶有更多的實際信息。受此啟發(fā),類比到聲頻車輛目標識別領(lǐng)域,在加權(quán)編碼中引入曼哈頓距離來取代歐氏距離,從而提高測試信號和訓練信號之間相似度的判斷能力,以提高加權(quán)協(xié)同表示分類方法的識別率。
圖2 曼哈頓距離平面示意圖
原加權(quán)編碼方法中基于歐氏距離進行編碼:
(17)
接下來給出采用基于曼哈頓距離的加權(quán)編碼:
(|a1-b1|+…+|ah-bh|+…|aM-bM|)S
(18)
其中,歐式距離(‖.‖2)對應的為2-范數(shù),曼哈頓距離(‖.‖1)對應的為1-范數(shù)。
由式(17)、(18)可以看出,當聲頻測試和訓練特征信號之間的距離向量中存在一些較大的分量時,使用歐氏距離計算距離時,將會忽視掉一些較小值,但是這較小的分量仍然保持了一些相似性的判斷信息。使用曼哈頓距離計算車輛聲頻特征信號的距離時,會使得這些較小分量仍然可以一定程度地貢獻本身所包含的相似信息,從而提升加權(quán)效果。
基于以上分析,本文提出了聲頻傳感器網(wǎng)絡(luò)下基于曼哈頓距離加權(quán)協(xié)同表示分類(Manhattan-WCRC)的車輛識別方法。下面給出本節(jié)所提方法框架的總結(jié)如下:
1)輸入訓練字典D、正則化參數(shù)λ。
2)提前計算矩陣P:
P=(DTD+λ·I)-1DT
4)將表3中加權(quán)編碼方法的式(13)更新為采用曼哈頓距離加權(quán)編碼的式(18)。
6)各類重構(gòu)殘差計算:
7)輸出識別結(jié)果:
為了驗證以上理論,本文進行了采用聲頻特征信號進行車輛目標類型識別的Matlab仿真實驗,主要研究了不同分類算法的識別性能。本實驗數(shù)據(jù)集和文獻[18]一樣,主要包括兩種軍事車輛類型:重型輪式卡車(DW)和履帶車(AAV)??偣矠?80個經(jīng)過聲頻車輛目標識別框架處理(特征提取后,分類算法前)后的數(shù)據(jù)。
在分類識別實驗設(shè)置中,AAV總共包括90個特征信號樣本,DW也包括90個特征信號樣本。實驗中,將每一個AAV數(shù)據(jù)和DW數(shù)據(jù)分別設(shè)為標簽0和1。隨機取每一類的n個樣本來作為訓練集,剩下的每一類的90-n個樣本來作為測試集。這里,訓練集總大小為2n,測試集總大小為2*(90-n)個,下文中以每一類訓練樣本大小n來指代訓練集大小。其中,n依次設(shè)置為20、30、40、50、60、70。以上的實驗框架如果只進行單次實驗將會有誤差,最終實驗采用將以上實驗框架循環(huán)100次再取平均的辦法來獲得最終實驗結(jié)果。
5.2.1 實驗一
表1 SRC和不同殘差計算方式下的CRC識別率 %
5.2.2 實驗二
由于局部適配參數(shù)S在不同的分類器和樣本集上會有不同的尺度和對應值,實驗中將WSRC、WCRC、Manhattan-WCRC的S值統(tǒng)一設(shè)為以下的尺度范圍值:S=0.001、0.005、0.01、0.05、0.1、0.5、1、5、10。并且基于以上實驗設(shè)置,給出了 WSRC、WCRC、Manhattan-WCRC不同S值下,訓練集大小為n=20、30、40、50、60、70時的識別率。識別精度趨勢圖分別如圖3~5所示。
圖3 不同S值下WSRC識別率趨勢圖
圖4 不同S值下WCRC識別率趨勢圖
圖5 不同S值下Manhattan-WCRC識別率趨勢圖
由以上實驗可以看出:在訓練集大小n為20、30、40、50、60、70時,WSRC的識別率在S=5附近取得較好的效果;在訓練集大小n為20、30、40、50、60、70時,WCRC在S=1左右效果較好;在訓練集大小n為20、30、40時,Manhattan-WCRC在S=1附近取得較好精度,在訓練集大小n為50、60、70時,Manhattan-WCRC在S=0.5附近取得較好精度。
5.2.3 實驗三
由實驗二可以得到WSRC、WCRC、Manhattan-WCRC不同的S值。在本實驗中,WSRC在n為20、30、40、50、60、70時的S值設(shè)為5,WCRC在n為20、30、40、50、60、70時的S值設(shè)為1,Manhattan-WCRC在n為20、30、40時的S值設(shè)為1,在n為50、60、70時的S值設(shè)為0.5。
下面給出了SRC、CRC、WSRC、WCRC、Manhattan-WCRC在每一類訓練集大小n分別為20、30、40、50、60、70時的識別率(單位為%),如表2所示。
表2 不同分類算法的識別率 %
接下來,給出SRC、CRC、WSRC、WCRC、Manhattan-WCRC在n分別為20、30、40、50、60、70時,平均一個測試信號的識別速度(單位為ms),如表9所示。其中CRC類型算法中的矩陣P是可以根據(jù)訓練集提前計算的(只需要在識別時輸入即可),因此矩陣P的計算在實驗中不計入識別所消耗時間。
表3 不同分類算法的識別速度 ms
從以上實驗結(jié)果可以看出,本文提出的在聲頻無線傳感器網(wǎng)絡(luò)下基于WCRC的車輛識別方法的識別速度明顯快于WSRC、SRC,接近于CRC(比CRC略差,主要是因為WCRC引入加權(quán)編碼,增加了小部分的計算負擔,這一點在WSRC對比于SRC的運算時間損耗也可以看出),從而驗證了WCRC對于WSRC、SRC的計算速度優(yōu)勢。同時,本文進一步所提的基于Manhattan-WCRC的車輛識別方法在仿真實驗中的識別速度和WCRC非常接近,證明了Manhattan-WCRC在車輛識別中仍然擁有很好的實時性。
本文提出的聲頻傳感器網(wǎng)絡(luò)下基于加權(quán)協(xié)同表示分類(WCRC)的車輛識別方法相比于傳統(tǒng)的CRC方法精度上有了較大幅度的提升,并且在識別速度上沒有太大的影響(接近于CRC的識別速度)。與此同時,WCRC相較于WSRC、SRC在運算速度上有著非常明顯的加速,以及不錯的精度提升。以上結(jié)果驗證了將局部加權(quán)編碼引入CRC的可行性和優(yōu)勢。同時,本文進一步提出的聲頻傳感器網(wǎng)絡(luò)下基于曼哈頓距離加權(quán)協(xié)同表示分類(Manhattan-WCRC)的車輛識別方法也有很好的表現(xiàn),對比WCRC,WSRC,CRC,SRC取得了最高的識別精度,同時識別速度和WCRC非常接近(明顯快于WSRC、SRC),驗證了將曼哈頓距離引入加權(quán)編碼的可行性和優(yōu)勢。在Matlab仿真模擬實驗中,Manhattan-WCRC,WCRC在擁有較好的識別精度下,又擁有非??斓淖R別速度。這對于在實際的聲頻傳感器網(wǎng)絡(luò)下進行車輛類型的識別是非常有益的,可以在既保證精度的情況下,又能很好地加強識別的實時性,在推廣到實際應用中將會有不錯的應用前景。