陳 拓 ,蔡惠智,吳永清 ,呂曜輝
(1.中國科學(xué)院聲學(xué)研究所,北京100190;2.北京中科海訊數(shù)字信號處理技術(shù)有限公司,北京100095)
基于頻域典型相關(guān)分析的水下目標(biāo)回波識別
陳 拓1,蔡惠智2,吳永清1,呂曜輝1
(1.中國科學(xué)院聲學(xué)研究所,北京100190;2.北京中科海訊數(shù)字信號處理技術(shù)有限公司,北京100095)
水下目標(biāo)回波的特征提取與分類識別是當(dāng)前主動聲納關(guān)鍵技術(shù)之一。采用基于回波頻域特性的典型相關(guān)分析算法(CCA:Canonical Correlation Analysis)提取回波的特征,這些特征集中體現(xiàn)了不同目標(biāo)回波的綜合相關(guān)特性。設(shè)計合適的支持向量機(jī)分類器,并獲得識別結(jié)果。利用這一方法對湖試中的不同目標(biāo)回波進(jìn)行分類識別,分析了不同接收信噪比條件下的性能,獲得了理想的結(jié)果。
特征提??;典型相關(guān)分析;支持向量機(jī)
水下目標(biāo)回波的分類識別問題已經(jīng)成為主動聲納信號處理領(lǐng)域中的一項關(guān)鍵技術(shù)。由于水聲環(huán)境的復(fù)雜特性,聲納回波往往經(jīng)歷不同程度的衰減與失真,其程度受目標(biāo)距離與具體環(huán)境的影響。有效的識別算法不僅能夠獲取不同目標(biāo)回波信號的關(guān)鍵信息,而且對一定程度的失真與衰減具有魯棒性。
完整的識別算法包括特征提取與分類器設(shè)計兩部分。特征提取獲得回波的一些具有強(qiáng)判別能力的信息,而分類器則根據(jù)這些特征決定信號的類別歸屬[1]。較早的水聲信號特征提取方法有適用于高頻信號的亮點(diǎn)模型、反映目標(biāo)形狀與材料特征的極點(diǎn)模型、共振散射理論[2]等,它們的建模方法比較復(fù)雜,而且適用范圍較窄。近些年采用的水聲信號特征提取方法許多來自于模式識別領(lǐng)域,例如廣泛應(yīng)用于語音識別的主成分分析方法、隱馬爾科夫模型[3],以及小波變換[4]等。這些方法具有良好的適用范圍,建模方法也較為簡單,但模型參數(shù)的選擇難度較大。
為了能夠簡化建模過程,獲得更加精簡且具有較強(qiáng)判別力的特征,采用CCA對頻域信息作進(jìn)一步處理。CCA是一種衡量信號綜合相關(guān)特性的算法,不僅考慮了信號間的相關(guān)性,而且考慮了信號內(nèi)部的結(jié)構(gòu)特性。經(jīng)由該算法能夠獲得一系列簡潔的相關(guān)系數(shù),它們包含了大部分的相關(guān)性信息[5-7]。通過基于頻域信息的典型相關(guān)分析獲取回波的關(guān)鍵特征,并利用支持向量機(jī)實(shí)現(xiàn)歸類識別。根據(jù)湖試數(shù)據(jù)的分析結(jié)果,表明該算法是可行的。
CCA不僅能夠單獨(dú)用于特征提取,也可以做為一種特征選擇方法,對原本高維度的特征進(jìn)行提煉。由于同時考慮了向量的內(nèi)部特性與互相關(guān)特性,CCA能夠更加充分地利用發(fā)射信號的特點(diǎn)。下面將簡單介紹CCA的基本原理以及相應(yīng)的特征提取流程。
假定用于典型相關(guān)分析的兩組向量分別為X1,X2,…,Xp與 Y1,Y2,…,Yq,其中 p≥q>1。令兩個線性變換 ωx,ωy,它們分別將原向量組變換至新的向量組U1,U2,…,Uq與V1,V2,…,Vq。令corr(a,b)表示向量a與b之間的簡單相關(guān)系數(shù),其表達(dá)式為:
那么典型相關(guān)分析的根本目標(biāo)就是尋找線性變換ωx,ωy,使得corr(Ui,Vi),i=1,2,…,q達(dá)到最大值,并且滿足如下條件:
U1,U2,…,Uq與 V1,V2,…,Vq被稱為 X1,X2,…,Xp與 Y1,Y2,…,Yq對應(yīng)的典型變量。
式(1)可以等價為求解如下問題:
令:
可以得到相應(yīng)的格朗日表達(dá)式:
令 λx=λy=λ,可以解得:
可以證明式(6)中的兩個方程具有相同的非零實(shí)λ解,這些λ值即為兩個向量組之間的典型相關(guān)系數(shù)。
采用基于頻域特性的CCA特征提取算法,對回波信號的頻域特征進(jìn)行CCA特征選擇,獲得少量更加凝練的特征,最后用支持向量機(jī)進(jìn)行分類識別。特征提取的流程如圖1。
圖1 特征提取流程圖
首先獲得不同回波信號的頻域信息,然后按照合適的規(guī)則將其轉(zhuǎn)換成多維的樣本矩陣,最后對樣本矩陣進(jìn)行CCA處理,獲得與其維度一致的特征向量。根據(jù)發(fā)射信號的帶寬、系統(tǒng)采樣率等參數(shù),選擇合適的樣本矩陣維度,盡可能利用回波的頻域特征。
試驗(yàn)數(shù)據(jù)來自于2009年千島湖的湖試,基陣采用收發(fā)合置的形式,其中發(fā)射陣為線陣,接收陣為圓弧陣。發(fā)射信號形式為HFM,中心頻率30 kHz,帶寬8 kHz,采樣率192 kHz,脈寬8 ms。
兩個似雷目標(biāo)被固定放置于水中,基陣收集它們的回波。目標(biāo)的形狀如圖2所示,其中柱形目標(biāo)的長度為2 m,直徑0.5 m,目標(biāo)強(qiáng)度-7.5 dB;球形目標(biāo)的直徑0.9 m,目標(biāo)強(qiáng)度-16.5 dB?;嚺c目標(biāo)的實(shí)際吊放情況如圖3所示。圖4給出了部分信噪比條件下兩個目標(biāo)回波經(jīng)過歸一化后的時域波形。
圖2 湖試中采用的兩個似雷目標(biāo)
圖3 基陣與目標(biāo)的吊放情況,球目標(biāo)的吊放方式與圖中相同
圖4 不同信噪比下兩個目標(biāo)回波的時域波形
在保持吊放深度不變的條件下,通過調(diào)整發(fā)射聲源級和目標(biāo)與基陣的距離,可以獲得不同信噪比的回波信號。為了能夠充分利用試驗(yàn)數(shù)據(jù),選取朝向目標(biāo)方位的部分陣元域數(shù)據(jù)進(jìn)行處理。將這些回波信號按照圖1的流程進(jìn)行特征提取,選擇合適的樣本矩陣維度,獲得一系列特征向量。采用支持向量機(jī)(SVM:Support Vector Machine)分類器[8-10]對這些特征向量進(jìn)行分析,獲得它們的類別歸屬。
整個分類識別過程分兩步進(jìn)行:(1)SVM的訓(xùn)練與驗(yàn)證,即根據(jù)部分回波的特征向量來確定SVM的參數(shù),并計算能夠有效區(qū)分不同類別特征的分割面;(2)SVM的測試,即提取不同條件下獲得的接收信號的特征,使用訓(xùn)練完畢的SVM對其進(jìn)行歸類。SVM的訓(xùn)練、驗(yàn)證與測試準(zhǔn)確度是衡量整個識別算法有效性的標(biāo)準(zhǔn)。
首先,分別選取兩個目標(biāo)各300個回波數(shù)據(jù)用于SVM的訓(xùn)練,它們擁有較高的信噪比(14 dB左右),且不具有多普勒頻移。圖5給出了部分提取特征的分布情況。圖5(a)、圖5(b)表明兩個似雷目標(biāo)回波的前二維特征具有明顯的類別可分離性,柱目標(biāo)對應(yīng)的特征值要略高于球目標(biāo),而且柱目標(biāo)的特征值浮動較小,穩(wěn)定性更佳。然而正如圖5(c)所示,兩類目標(biāo)的前三維特征在空間上并不是完全線性可分,也就是說不存在線性SVM能夠?qū)蓚€特征集合完全區(qū)分。將這600個三維的特征向量作為SVM的訓(xùn)練數(shù)據(jù),并采用線性準(zhǔn)則進(jìn)行計算。訓(xùn)練完畢后的SVM分類器對兩類目標(biāo)特征的正確識別率分別為:柱目標(biāo)91.7%,球目標(biāo)90.7%。
圖5 訓(xùn)練數(shù)據(jù)的特征分布情況
圖6 兩類目標(biāo)的分類識別測試結(jié)果
然后,基于訓(xùn)練完畢的SVM,另取近似條件下的回波數(shù)據(jù)進(jìn)行驗(yàn)證。在相同的布放條件下,重新記錄接收數(shù)據(jù),獲得一組新的目標(biāo)回波,并進(jìn)行特征提取。將特征向量輸入現(xiàn)有的SVM,獲得每個樣本的分類結(jié)果,然后將其與真實(shí)情況進(jìn)行比對。最終的驗(yàn)證結(jié)果為:柱目標(biāo)識別率92.3%,球目標(biāo)識別率90.3%。驗(yàn)證結(jié)果表明:提出的特征提取方法能夠獲得目標(biāo)回波的穩(wěn)定特性,具有良好的魯棒性。
圖7 信噪比變化對于兩類目標(biāo)識別率的影響
圖8 兩類目標(biāo)的分類識別測試結(jié)果
為了進(jìn)一步驗(yàn)證特征提取算法的有效性,使用大量不同信噪比條件下的回波數(shù)據(jù)對已有的SVM進(jìn)行測試,測試過程與前述的驗(yàn)證過程基本相同。在保持布放深度的基本條件下,改變目標(biāo)與基陣的距離、相對方位角,獲得不同接收條件下的回波。不同信噪比條件下,兩類目標(biāo)回波的正確識別率如圖6。從圖6中可以獲得幾點(diǎn)結(jié)論:(1)隨著接收信噪比的增加,正確識別率將越接近SVM的訓(xùn)練結(jié)果,且當(dāng)信噪比在9 dB以上時能夠獲得理想的識別率;(2)在低信噪比條件下,柱目標(biāo)回波的識別率下降很快,而球目標(biāo)回波的識別率則始終保持在一個較高水平。產(chǎn)生這一現(xiàn)象的原因可以由圖7解釋。以二維特征空間為例,方形表示柱目標(biāo)的特征區(qū)域,圓形表示球目標(biāo)的特征區(qū)域,那么線性SVM會產(chǎn)生分割線將不同特征區(qū)域進(jìn)行劃分??梢钥吹剑捎谔卣鲄^(qū)域彼此有交疊,因此并不能進(jìn)行完全分離。當(dāng)接收信噪比降低時,獲得的特征取值將減小,對應(yīng)的特征區(qū)域呈現(xiàn)低取值方向的移動。區(qū)域移動的結(jié)果就是柱目標(biāo)的特征區(qū)域?qū)⒂懈嗦湓陬悇e2中,從而產(chǎn)生更多的錯誤分類,而球目標(biāo)正好相反。為了解決這一問題,重新選擇訓(xùn)練數(shù)據(jù),用低信噪比(8.8 dB)的柱目標(biāo)回波代替原先高信噪比(14 dB)的樣本。那么訓(xùn)練完畢后的SVM分類器對兩類目標(biāo)特征的正確識別率分別為:柱目標(biāo)90.0%,球目標(biāo)86.3%。驗(yàn)證結(jié)果為:柱目標(biāo)89.3%,球目標(biāo)85.3%??梢奡VM的訓(xùn)練性能有一定的降低?;谶@一SVM進(jìn)行測試,獲得的結(jié)果如圖8。可見采用第二種方法能夠獲得更高的整體性能,但是SVM的訓(xùn)練精度降低。
對于水下目標(biāo)回波識別問題而言,關(guān)鍵之處在于獲得不同特性目標(biāo)回波的特殊信息,同時保證對干擾具有一定的魯棒性。實(shí)際情況中兩者可能是矛盾的,因?yàn)樵绞蔷_的模型對干擾越是敏感,圖6與圖8的結(jié)果體現(xiàn)了這一問題。因此理想的識別算法需要兼顧分類器的準(zhǔn)確度與泛化能力(可以理解為抗干擾能力,或者魯棒性),獲得最合適的整體性能。從湖試數(shù)據(jù)的分析結(jié)果來看,基于頻域特性的CCA特征提取算法與線性SVM分類器的組合是相當(dāng)有效的,通過合適的訓(xùn)練數(shù)據(jù)能夠獲得優(yōu)良的識別性能,有效接收信噪比為7 dB左右。
基于頻域特性的CCA是一種優(yōu)秀的特征提取算法,能夠獲得不同目標(biāo)回波的關(guān)鍵信息。湖試數(shù)據(jù)的相關(guān)仿真與分析表明:在目標(biāo)回波的頻域信息基礎(chǔ)上,采用CCA獲得的特征向量能夠提供良好的類別可分離性,并且通過線性SVM能夠獲得理想的訓(xùn)練與測試結(jié)果。在一定信噪比條件下,采用該識別算法能夠有效區(qū)分兩個不同形狀的似雷目標(biāo),并且對于變化的水聲環(huán)境具有良好的魯棒性。
[1]Jain A K,Duin R P W,Jianchang Mao.Statistical pattern recognition:a review[J].IEEE Transactions on Pattern Anal-ysis and Machine Intelligence,2000,22(1):4-37.
[2]章新華.水下目標(biāo)自動識別的核心技術(shù)[J].兵工學(xué)報,1998,19(3):275-280.
[3]吳朝暉,楊瑩春.說話人識別模型與方法[M].北京:清華大學(xué)出版社,2009.
[4]Azimi-Sadjadi MR,De Yao,Qiang Huang,et al.Underwater target classification using wavelet packets and neural networks[J].IEEE Transactions on Neural Networ-ks,2000,11(3):784-794.
[5]Pezeshki A,Azimi-Sadjadi MR,ScharfLL.Undersea target classification usingcanonical correlation analysis[J].IEEE Journal of Oceanic Engineering,2007,32(4):948-955.
[6]ScharfLL,Mullis CT.Canonical coordinates and the geometryofinference,rate,and capacity[J].IEEE Transa-actions on Signal Processing,2000,48(3):824-831.
[7]David R H,Sandor Szedmak,John Shawe-Taylor.Canonical correlation analysis:an overviewwith applicat-ion tolearningmethods[J].Neural Computation,2004,16(12):2639-2664.
[8]Burges CJ C.Atutorial on support vector machines for pattern recognition[J].Data Miningand Knowledge Discovery,1998,2(2):121-167.
[9]John C P.Fast Training of Support Vector Machines using Sequential Minimal Optimization[J].Advances in kernel methods:support vector learning,1999:185-208.
[10]Rong-En Fan,Pai-Hsuen Chen,Chih-Jen Lin.WorkingSet Selection UsingSecond Order Information for TrainingSupport Vector Machines[J].Machine LearningResearch,2005,6:1889-1918.
Echo Identification of Underwater Target Based on Frequency Domain Canonical Correlation Analysis
CHEN Tuo1,CAI Hui-zhi2,WU Yong-qing1,LV Yao-hui1
(1.Institute of Acoustics,Chinese Academy of Sciences,Beijing 100190,China;2.Beijing Zhong Ke Hai Xun Digital Signal Processing Co Ltd,Beijing 100095,China)
Feature extraction and classification for underwater target echoes is one of key technologies for active sonar.Efficient features will be extracted using frequency-based canonical correlation analysis,which represent the comprehensive correlation characteristics between echoes from different targets.Support vector machine is used as a classifier to get final results.The proposed method is used for classification of different underwater targets in the lake and verified to be efficient according to numerical analysis results.
feature extraction;canonical correlation analysis;support vector machine
P733.2
B
1003-2029(2012)01-0014-05
2011-09-02
“十一五”預(yù)研基金(4010501050104)資助項目
陳拓(1985-),男,博士研究生,研究方向?yàn)樾盘柵c信息處理。