冷家旭 黃惠明 龍 方
(北京跟蹤與通信技術(shù)研究所 北京 100094)
高分辨一維距離像(High Resolution Range Profiles,HRRP)是目標(biāo)多散射中心在雷達(dá)徑向距離上的一維分布圖,它包含了目標(biāo)沿距離向精細(xì)的幾何結(jié)構(gòu)特征,對(duì)目標(biāo)分類識(shí)別十分有價(jià)值。目前,HRRP目標(biāo)識(shí)別系統(tǒng)的關(guān)鍵技術(shù)主要集中在特征提取與選擇、分類器設(shè)計(jì)兩方面。其中,分類器設(shè)計(jì)作為識(shí)別系統(tǒng)中最具決定性的環(huán)節(jié),近年來(lái)得到了廣泛、深入的研究。在基于統(tǒng)計(jì)決策理論的眾多分類方法中,支持向量機(jī)(Support Vector Machines,SVM)在解決小樣本、非線性及高維模式識(shí)別問題時(shí)表現(xiàn)出明顯的優(yōu)勢(shì)[1~2],并成功應(yīng)用在雷達(dá)目標(biāo)識(shí)別領(lǐng)域[3]。
相對(duì)于其他分類方法,SVM分類精度高、泛化能力強(qiáng)。在訓(xùn)練階段,SVM依靠訓(xùn)練集內(nèi)的一部分向量(即:支持向量,SV)在核函數(shù)定義的高維空間F中構(gòu)建一個(gè)最大邊界超平面。在測(cè)試階段,判決輸出前SVM需要將測(cè)試樣本與每一個(gè)SV結(jié)合構(gòu)成核函數(shù)。然而在HRRP目標(biāo)識(shí)別中,經(jīng)常會(huì)出現(xiàn)提取的訓(xùn)練樣本特征在分類邊界附近混迭的現(xiàn)象,使得SVM訓(xùn)練時(shí)產(chǎn)生的SV數(shù)目較大,影響識(shí)別速度,而且還會(huì)干擾SVM判決函數(shù)的準(zhǔn)確性。同時(shí),核函數(shù)參數(shù)與SVM懲罰因子的取值也直接影響著識(shí)別性能。因此,本文提出一種剪輯支持向量機(jī)(Edit Support Vector Machines,ESVM)分類方法—首先利用聚類算法從大量訓(xùn)練樣本中選擇最具代表性的訓(xùn)練樣本,再通過循環(huán)剪輯法去除分類邊界附近混迭的訓(xùn)練樣本,然后以理想核函數(shù)矩陣為參考標(biāo)準(zhǔn)確定高斯核函數(shù)參數(shù)與SVM懲罰因子,最后進(jìn)行SVM訓(xùn)練與測(cè)試。相比于傳統(tǒng)SVM,剪輯SVM的分類面更明顯,訓(xùn)練過程計(jì)算復(fù)雜度更低,分類精度更高。另外,本文還針對(duì)低信噪情況,在預(yù)處理中采用小波去噪提高回波信噪比,進(jìn)而提高目標(biāo)識(shí)別率。外場(chǎng)實(shí)測(cè)數(shù)據(jù)的計(jì)算仿真實(shí)驗(yàn),也進(jìn)一步驗(yàn)證了上述方法的可行性與有效性。
在實(shí)際的工作環(huán)境中,受各種因素的影響,雷達(dá)回波中包含目標(biāo)信號(hào)以及各種噪聲信號(hào),具有非平穩(wěn)的特性。傳統(tǒng)的Fourier變換對(duì)平穩(wěn)信號(hào)有較好的分析能力,而對(duì)非平穩(wěn)信號(hào),由于存在保護(hù)信號(hào)局部特征和抑制噪聲之間的矛盾,無(wú)法得到理想效果。小波變換則具有多分辨分析的特性和良好的時(shí)頻局部化分析能力,能夠很好的兼顧去噪和保護(hù)突變信號(hào),有效抑制噪聲[4]。因此,在目標(biāo)識(shí)別前本文首先對(duì)受高斯加性噪聲污染的HRRP進(jìn)行小波變換,獲得多層次小波分解系數(shù),再利用自適應(yīng)閾值對(duì)高頻系數(shù)進(jìn)行量化處理,最后進(jìn)行反變換獲得降噪后的HRRP。
在實(shí)際應(yīng)用中,采用小波閾值降噪主要需要考慮四方面的內(nèi)容:小波母函數(shù)的選擇、信號(hào)分解層數(shù)的選擇、門限閾值的確定以及閾值處理函數(shù)的選擇。結(jié)合HRRP的非平穩(wěn)、不連續(xù)特性,考慮降噪效果以及計(jì)算復(fù)雜度問題,本文使用sym8小波基函數(shù),分解層數(shù)為5層,采用試探法無(wú)偏風(fēng)險(xiǎn)準(zhǔn)則確定門限閾值,并使用硬閾值處理函數(shù)對(duì)小波分解系數(shù)進(jìn)行量化處理。圖 1給出了某型飛機(jī)實(shí)測(cè)H RRP在信噪比5dB時(shí)利用小波閾值去噪處理后的結(jié)果對(duì)比。去噪前H RRP與原始 HRRP的相關(guān)系數(shù)為0.7595,均方誤差為0.004。去噪后HRRP與原始HRRP的相關(guān)系數(shù)為0.9440,均方誤差為2.1191×10-4??梢?小波去噪能夠較好的保留原始信號(hào)的有用信息,消除噪聲。
圖1 小波去噪前后HRRP成像效果對(duì)比
SVM的主要思想是使用核函數(shù)將觀測(cè)樣本從輸入空間映射到高維的特征空間,并在這個(gè)空間構(gòu)造最優(yōu)分類超平面。
其中,x為待分類樣本,SV為支持向量集,b*為分類閾值。
對(duì)于線性不可分問題,可引入函數(shù)松弛因子ξi,求以下廣義最優(yōu)分類超平面問題。類似上述推導(dǎo),可得線性不可分問題的廣義最優(yōu)分類判決函數(shù)為
對(duì)于非線性可分問題,超平面的分類能力有限,為此SVM 引入非線性映射 φ(x):Rd→E,將數(shù)據(jù)映射到更高維特征空間,從而能夠線性可分。根據(jù)Mercer條件,用內(nèi)積運(yùn)算代替原空間最優(yōu)判別函數(shù)的點(diǎn)積運(yùn)算,可以得到新的特征空間中的最優(yōu)判決函數(shù)
而對(duì)于L(L>2)多類問題,本文使用“一對(duì)多”的方式,將其轉(zhuǎn)化為L(zhǎng)-1個(gè)兩類問題。
在解決非線性可分問題時(shí),SVM引入核函數(shù),把低維空間中線性不可分問題轉(zhuǎn)化為高維空間中的線性可分問題,但是由于核函數(shù)類型及參數(shù)選取的局限性,往往在映射后的高維空間也無(wú)法完全實(shí)現(xiàn)線性可分。因此SVM又引入了懲罰因子Cs vm,將問題轉(zhuǎn)化為求解高維空間的廣義最優(yōu)分類超平面。文獻(xiàn)[5]給出樣本集X(M)線性可分的充分條件是Hess矩陣G滿秩(其中:Gij=yiyjKij,Kij=K(xi?xj)=〈φ(xi)?φ(xj)〉為核矩陣)。并說(shuō)明了在處理訓(xùn)練數(shù)據(jù)非線性可分情況時(shí),引入懲罰因子Csvm相對(duì)于在原有的Hess矩陣對(duì)角線中增加一個(gè)常數(shù)1/Cs vm(即:Gc=G+(1/Csvm)I),使其滿秩,即使得訓(xùn)練樣本在核空間中變得線性可分。
Hess矩陣相似度S的值越大說(shuō)明Gc越接近理想情況,可分性越好。本文使用高斯型核函數(shù),因此只需確定σ和Csvm兩個(gè)參數(shù)。圖2(a)為Csvm=∞時(shí)不同高斯核參數(shù)σ下S變化情況,使用數(shù)據(jù)是3類目標(biāo)H RRP實(shí)測(cè)數(shù)據(jù)的頻譜幅度經(jīng)過線性判決分析(LDA)獲得的特征。S最大時(shí)對(duì)應(yīng)的σ*即為最佳映射核參數(shù),本實(shí)驗(yàn)中σ*=0.8400。不難計(jì)算出σ*對(duì)應(yīng)的核矩陣非滿秩,因此還需確定Csvm。圖2(b)為σ*=0.8400時(shí)不同懲罰因子Csvm下S變化情況??梢?S隨的增加而增加,并最終趨于平穩(wěn)。但是的取值并非使S越大越好,過大時(shí)SVM訓(xùn)練過程將變得非常耗時(shí);過小時(shí)Gc趨向于單位陣,將導(dǎo)致過度擬和。因此需在S與訓(xùn)練時(shí)耗之間折衷選擇一個(gè)合適的,如本實(shí)驗(yàn)中可以選擇=100。
圖2 高斯核參數(shù)與SVM懲罰因子對(duì)樣本線性可分性的影響
從式(5)不難看出,由于引入了計(jì)算復(fù)雜度與樣本個(gè)數(shù)有關(guān)的核函數(shù),SVM僅適用于小訓(xùn)練樣本情況。但是小數(shù)目的訓(xùn)練樣本無(wú)法保證能夠完好的表征該類目標(biāo)的分布特征。另外,SVM判決函數(shù)運(yùn)算復(fù)雜度取決于支持向量的個(gè)數(shù),對(duì)于小樣本問題,支持向量的個(gè)數(shù)總是遠(yuǎn)小于樣本數(shù)目,分類決策時(shí)的計(jì)算代價(jià)無(wú)需過多考慮。然而在訓(xùn)練階段,分類面附近混迭的訓(xùn)練樣本會(huì)增加支持向量的個(gè)數(shù)與計(jì)算復(fù)雜度,并影響SVM判決函數(shù),進(jìn)而影響識(shí)別性能。針對(duì)上述問題,本文提出一種新的SVM學(xué)習(xí)方法—剪輯SVM(ESVM)。
對(duì)于小樣本表征目標(biāo)分布問題,ESVM對(duì)每類目標(biāo)的大量訓(xùn)練樣本進(jìn)行聚類,以聚類中心為ESVM所使用的訓(xùn)練樣本。對(duì)于分類面混迭問題,ESVM通過循環(huán)剪輯最近鄰法[6]清理類間邊界,去掉類別混雜的樣本,使類邊界更清晰。對(duì)于參數(shù)取值問題,ESVM采用基于矩陣相似度的選優(yōu)方法。
設(shè)X(N)={xi,yi}(i=1,2,…,N)為原始訓(xùn)練樣本集,xi為樣本特征,yi={1,2,…,C}為類別標(biāo)記,C為目標(biāo)類別數(shù),N為訓(xùn)練樣本數(shù)目。ESVM訓(xùn)練算法如下:
1)對(duì)各類目標(biāo)樣本分別進(jìn)行聚類(本文使用k均值聚類算法),由M個(gè)聚類中心X(M)={xk,yk},(k=1,2,…,M)組成新訓(xùn)練樣本集;
2)將樣本集 X(M)隨機(jī)地劃分為s個(gè)子集:X(M)={X1,X2,…,Xs}(s≥3),并保證每個(gè)子集內(nèi)均包含C類的訓(xùn)練樣本;
3)用最近鄰法,以 X(p+1)mods為參照集,對(duì)Xp中的樣本進(jìn)行分類,其中p=1,2,…,s;
4)去掉在3)中被錯(cuò)分類的樣本,用所留下的樣本構(gòu)成新的樣本集X(ME);
5)如果經(jīng)過q次迭代后再?zèng)]有樣本被剪輯掉則轉(zhuǎn)到6);否則轉(zhuǎn)到2);
6)對(duì)于最終訓(xùn)練樣本集X(ME),利用3.2節(jié)的方法確定高斯核參數(shù)σ與SVM懲罰因子Csvm;
7)利用 X(ME)與6)中求得的參數(shù) σ、Csvm,訓(xùn)練SVM分類器。
如圖3(a)所示,3類目標(biāo)HRRP實(shí)測(cè)數(shù)據(jù)的頻譜幅度經(jīng)過線性判決分析(LDA)獲得的特征分布圖(2維),每類目標(biāo)有6000個(gè)樣本。圖3(b)為經(jīng)過k均值聚類得到的聚類中心分布圖,每類目標(biāo)有500個(gè)聚類中心??梢钥闯?經(jīng)過聚類,數(shù)目較小的聚類中心樣本集合能夠很好的表征原始樣本的分布情況。圖3(c)為經(jīng)過循環(huán)剪輯最近鄰獲得的樣本分布圖,不難發(fā)現(xiàn),經(jīng)過循環(huán)剪輯,原始混迭的分界變得清晰。圖3(b)與圖3(c)中的黑色實(shí)線表示由圖中特征訓(xùn)練SVM得到的分界面,黑色空心點(diǎn)為相應(yīng)的支持向量。表1列出了聚類后使用ESVM與SVM進(jìn)行訓(xùn)練的支持向量個(gè)數(shù)及訓(xùn)練時(shí)耗。可見,ESVM無(wú)論在訓(xùn)練時(shí)間還是判決函數(shù)準(zhǔn)確度等方面均優(yōu)于傳統(tǒng)SVM。
表1 ESVM與SVM訓(xùn)練性能與時(shí)耗比較
圖3 聚類與剪輯處理對(duì)訓(xùn)練樣本分布情況及SVM訓(xùn)練結(jié)果的影響
為了檢驗(yàn)上述方法的有效性,本文使用雷達(dá)實(shí)測(cè)飛機(jī)數(shù)據(jù)進(jìn)行了仿真識(shí)別。該數(shù)據(jù)是取自國(guó)內(nèi)某研究所寬帶實(shí)驗(yàn)雷達(dá)的ISAR測(cè)量飛機(jī)數(shù)據(jù),試驗(yàn)飛機(jī)有三種(T1,T2,T3),均為噴氣式飛機(jī)。本文以5度姿態(tài)角間隔為一個(gè)角域單元,取相鄰3個(gè)(目標(biāo)近似徑向飛行時(shí)為2個(gè))角域單元內(nèi)的樣本進(jìn)行訓(xùn)練生成36個(gè)模板庫(kù),每類目標(biāo)每個(gè)模板庫(kù)內(nèi)包含6000個(gè)訓(xùn)練樣本。測(cè)試樣本取自其它段數(shù)據(jù)。
圖4 仿真算法流程
為克服HRRP的平移敏感性并有效壓縮特征維數(shù),本文采用基于頻譜幅度特征的線性判別分析算法(LDA)提取特征。具體識(shí)別流程如圖4所示。其中:小波去噪使用sym8小波基函數(shù),分解層數(shù)為5,使用試探法無(wú)偏風(fēng)險(xiǎn)準(zhǔn)則確定門限閾值,并采用硬閾值處理函數(shù);K均值聚類的聚類中心數(shù)為500。
圖5 小波去噪對(duì)ESVM識(shí)別性能的影響
圖5比較了在不同信噪比情況下小波去噪對(duì)目標(biāo)識(shí)別率的影響,分類器采用ESVM。從圖中可以看出,在低信噪比(SNR<10dB)情況下,利用小波去噪可以有效抑制噪聲,顯著提高識(shí)別性能。但在較高信噪比情況下,小波去噪后的目標(biāo)識(shí)別率反而有所降低。這是由于目標(biāo)回波有用信號(hào)的能量主要集中在低頻區(qū),而噪聲能量遍布整個(gè)頻譜,在低信噪比情況下噪聲能量較強(qiáng),通過對(duì)高頻系數(shù)進(jìn)行自適應(yīng)閾值處理可有效去除回波的高頻噪聲分量,提高回波信噪比;而在高信噪比情況下噪聲能量相對(duì)較弱,此時(shí)對(duì)高頻系數(shù)進(jìn)行處理反而會(huì)去除有用信號(hào)的部分高頻細(xì)節(jié)信息,引起信號(hào)失真,進(jìn)而降低識(shí)別性能。因此在實(shí)際應(yīng)用中,可以先估計(jì)目標(biāo)H RRP的信噪比,低于某設(shè)定門限時(shí)才進(jìn)行小波去噪預(yù)處理,高于門限的直接進(jìn)行分類識(shí)別。
圖6給出了未去噪與小波去噪后,ESVM、SVM、1NN三種分類器的識(shí)別率隨信噪比的變化情況。實(shí)驗(yàn)中,1NN使用原始訓(xùn)練樣本進(jìn)行訓(xùn)練,ESVM和SVM使用聚類后的類心樣本進(jìn)行訓(xùn)練。不同于SVM,ESVM還進(jìn)行了循環(huán)剪輯處理。由圖中數(shù)據(jù)可以看出,未進(jìn)行去噪處理時(shí)ESVM的識(shí)別性能明顯優(yōu)于SVM、1NN,這是由于ESVM通過剪輯處理使分類面更清晰,降低了最優(yōu)分類面的計(jì)算難度,也減少了分類面附近混迭的樣本點(diǎn)對(duì)SVM判決函數(shù)的干擾,因此其性能優(yōu)于傳統(tǒng)SVM與1NN分類器。同時(shí)還需要看到,小波去噪后三種分類器的性能差別變小,特別是低信噪情況下,這說(shuō)明小波去噪對(duì)ESVM識(shí)別性能的提高幅度低于傳統(tǒng)SVM和1NN,即:ESVM具有相對(duì)較強(qiáng)的噪聲魯棒性。實(shí)際上,這也是剪輯處理的作用結(jié)果,通過剪輯去除掉分類面混迭的樣本,使類間距離更大,提高了最優(yōu)分類面的計(jì)算精度,進(jìn)而增強(qiáng)了分類器的推廣能力。
SVM分類器具有性能出色、結(jié)構(gòu)簡(jiǎn)單、泛化能力強(qiáng)等優(yōu)點(diǎn),在解決小樣本、非線性及高維模式識(shí)別問題中表現(xiàn)出明顯的優(yōu)勢(shì)。但當(dāng)出現(xiàn)訓(xùn)練樣本存在數(shù)目過大、分界面混迭等問題時(shí)SVM的訓(xùn)練時(shí)耗、識(shí)別性能都受到影響。據(jù)此,本文提出一種剪輯SVM分類器—訓(xùn)練階段通過聚類壓縮樣本數(shù)目,利用循環(huán)剪輯使邊界清晰,并采用基于Hess矩陣相似度優(yōu)選參數(shù)法選擇合適的核參數(shù)與懲罰因子,進(jìn)而降低SVM訓(xùn)練難度、提高分類精度;識(shí)別階段又利用小波去噪提高低信噪比情況下的識(shí)別性能?;趯?shí)測(cè)數(shù)據(jù)的實(shí)驗(yàn)結(jié)果表明,本文方法識(shí)別性能優(yōu)于傳統(tǒng)SVM與最近鄰分類器,而且訓(xùn)練時(shí)耗也明顯少于傳統(tǒng)SVM,是一種有效可行的H RRP目標(biāo)分類方法。
[1]Vapnik N.The Nature of Statistical Learning Theory[M].New York:Springer Verlag,1995:1~188
[2]Schwenker,Hierarchical F.Support Vector Machines for Multi-class Pattern Recognition[C]//the Fourth International Conference on Knowledge-Based Intelligent Engineering Systems and Allied technologies,Brihton,UK,2000
[3]孟繼成,楊萬(wàn)麟.基于核函數(shù)的雷達(dá)一維距離像目標(biāo)識(shí)別[J].電子與信息學(xué)報(bào),2005,27(3):462~466
[4]Donoho D L.Denoising by soft-thresholding[J].IEEE Trans on Information Theory,1995,41(3):613~627
[5]郭雷,肖懷鐵,付強(qiáng).目標(biāo)識(shí)別中SVM 線性可分性研究[J].電子與信息學(xué)報(bào),2009,31(3):570~573
[6]孫即祥.現(xiàn)代模式識(shí)別[M].長(zhǎng)沙:國(guó)防科技大學(xué)出版社,2002