李 陽 劉藝辰 張 亮 王彥華,5
(1.北京理工大學(xué)雷達(dá)技術(shù)研究院,北京 100081;2.嵌入式實(shí)時信息處理技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100081;3.CEMEE國家重點(diǎn)實(shí)驗(yàn)室電磁感知研究中心,北京 100081;4.北京理工大學(xué)重慶創(chuàng)新中心,重慶 401135;5.北京理工大學(xué)前沿技術(shù)研究院,山東濟(jì)南 250300)
自動目標(biāo)識別技術(shù)是雷達(dá)對地探測的一項重要技術(shù)支撐手段[1]。近年來,通常采用高分辨技術(shù)獲取目標(biāo)精細(xì)電磁散射信息,從而改善識別性能?,F(xiàn)有手段可獲取一維高分辨距離像(High Resolution Range Profile,HRRP)和合成孔徑雷達(dá)圖像(Synthetic Aperture Radar,SAR)[2]。由于SAR成像過程對運(yùn)動軌跡、積累時間等有嚴(yán)格要求,成像質(zhì)量受運(yùn)動誤差影響大,而且處理過程對計算和存儲能力要求高,導(dǎo)致實(shí)際應(yīng)用受到諸多限制。因此,基于HRRP的目標(biāo)識別技術(shù)在對地探測中擁有重要應(yīng)用價值。
為提升HRRP 地面識別性能,現(xiàn)有研究工作可分為兩大類:提取手工特征并輸入傳統(tǒng)機(jī)器學(xué)習(xí)分類器和基于深度學(xué)習(xí)的識別方法[3-6]。盡管上述方法均在某些場景下表現(xiàn)出色,但受限于實(shí)際應(yīng)用場景以下幾方面因素:目標(biāo)類別繁多,場景中存在各種車輛目標(biāo)或者自然干擾;采集姿態(tài)不完備,難以建立目標(biāo)全姿態(tài)下的特征數(shù)據(jù)庫;目標(biāo)類別數(shù)量不平衡,不同目標(biāo)的采集得到的回波樣本量差異較大[7]。因此,現(xiàn)有研究工作難以取得良好的應(yīng)用性能。
現(xiàn)有HRRP 識別方法通常采用平面決策機(jī)制,即采用統(tǒng)一標(biāo)準(zhǔn)不加區(qū)別的優(yōu)選特征并單次決策最終類別。然而,平面決策機(jī)制難以在類別繁多且類別不平衡目標(biāo)識別任務(wù)中決策目標(biāo)的型號,而且平面決策機(jī)制難以同時捕捉區(qū)分相似型號目標(biāo)的精細(xì)散射特性差異以及不同種類目標(biāo)的顯著散射特性差異。
層次化分類被認(rèn)為是類別繁多、類別不平衡數(shù)據(jù)集下實(shí)現(xiàn)型號辨識的有效手段[8]。該方法通過樹形層次組織多個局部分類器,處理不同的特征集,將一個復(fù)雜的細(xì)粒度識別任務(wù)拆解為多個分層次的簡單識別子任務(wù);每個子任務(wù)待處理的類別較少,更容易保證樣本的平衡。此外,針對每個識別子任務(wù),層次化分類方法可以對原始特征進(jìn)行個性化優(yōu)選與利用,從而挖掘目標(biāo)特征中隱含的共性與個性規(guī)律。在此基礎(chǔ)上,加以匹配適合識別子任務(wù)的分類器模型,以增強(qiáng)局部分類器的性能,從而提高層次方法的準(zhǔn)確性和魯棒性。
盡管層次化分類在計算機(jī)視覺、文本分割領(lǐng)域取得良好效果[9-13],但是將層次分類應(yīng)用于HRRP識別依然存在以下難點(diǎn)問題:由于HRRP 受采集姿態(tài)影響較大,層次分類的樹形層次結(jié)構(gòu)在自動化構(gòu)建時,最終獲取的類別特征表示也會有巨大差別,導(dǎo)致構(gòu)建穩(wěn)定性差的樹形層次。
針對上述難點(diǎn)問題,本文提出了一種新的層次分類方法——語義引導(dǎo)的層次化雷達(dá)目標(biāo)識別方法。通過將語義信息引入樹形層次結(jié)構(gòu)的構(gòu)建,改善了樹形層次的穩(wěn)定性,提高了層次分類方法的識別性能。首先,考慮姿態(tài)敏感性,數(shù)據(jù)在類別標(biāo)簽的基礎(chǔ)上,增加了姿態(tài)標(biāo)簽,并將各個標(biāo)簽之間的相似性關(guān)系量化為語義相似度指標(biāo)。然后,將各個標(biāo)簽下的HRRP的相似性關(guān)系量化為數(shù)據(jù)相似度指標(biāo);隨后,聯(lián)合語義相似度指標(biāo)與數(shù)據(jù)相似度指標(biāo),設(shè)計類別相似度指標(biāo),并依據(jù)該指標(biāo)自動化的構(gòu)建樹形層次。
本文提出的樹形層次構(gòu)建方法帶來了以下三點(diǎn)優(yōu)勢:(1)由于姿態(tài)與類別語義信息的約束,樹形層次對數(shù)據(jù)的依賴性降低;(2)相似度高的細(xì)粒度類別聚集到同一樹形節(jié)點(diǎn),可看作是這些細(xì)粒度類別被打上了粗粒度標(biāo)簽,區(qū)分粗粒度標(biāo)簽的難度大大降低;(3)而在細(xì)粒度標(biāo)簽區(qū)分節(jié)點(diǎn),可匹配關(guān)注精細(xì)差別的特征子集和分類器,提高識別精度。
層次分類器是多分類器系統(tǒng)(MCS,Multiclassifier System)方法的一種[14]。MCS 方法根據(jù)特定的組合方式組織多個分類器并輸出最終類別。典型的分類器融合方法分為串聯(lián)、并聯(lián)、層次化三種。該方法綜合多個分類器的輸出以獲取互補(bǔ)信息,提高識別準(zhǔn)確率。文獻(xiàn)[15]中,Y.Li 等提出了一個兩階段結(jié)構(gòu),首先識別跟蹤車輛數(shù)據(jù),再使用SVM 分類器進(jìn)一步分類。文獻(xiàn)[16]中,Pilcher等則設(shè)計了一個結(jié)合三種分類器的非線性規(guī)則,提高了VV 和HH 極化范圍的性能。文獻(xiàn)[17]中,X.Yu 等提出了一個融合三個分類器的系統(tǒng),該系統(tǒng)在MSTAR數(shù)據(jù)集上的表現(xiàn)優(yōu)于傳統(tǒng)方法。這些MCS方法主要采用串聯(lián)或并行的策略。然而,上述方法主要采用串聯(lián)和并聯(lián)的融合策略,較少考慮層次融合方式。
層次分類器常按照兩種方式組織[8]:1)樹和2)有向無環(huán)圖(DAG)。由于樹形層次結(jié)構(gòu)更為通用,本文以該結(jié)構(gòu)作為組織方式。圖1 為樹形層次結(jié)構(gòu)示意圖,其中灰色節(jié)點(diǎn)表示葉子節(jié)點(diǎn),存儲最終輸出目標(biāo)類別;白色節(jié)點(diǎn)分為“根節(jié)點(diǎn)”和中間節(jié)點(diǎn),每個白色節(jié)點(diǎn)上存儲了該節(jié)點(diǎn)的類別,與一個用以區(qū)分該節(jié)點(diǎn)的子節(jié)點(diǎn)類別的局部分類器。
圖1 樹形層次結(jié)構(gòu)示意圖Fig.1 Diagram of tree hierarchy
層次化分類器的兩大關(guān)鍵技術(shù)分別為樹形層次結(jié)構(gòu)構(gòu)建和局部分類器訓(xùn)練[8-19]?,F(xiàn)有的樹形層次構(gòu)建方法包括基于先驗(yàn)語義信息的人工構(gòu)建和基于數(shù)據(jù)的自動化構(gòu)建。基于先驗(yàn)語義信息人工構(gòu)建方法是指基于領(lǐng)域?qū)<艺J(rèn)知的目標(biāo)類別語義信息構(gòu)建,其先驗(yàn)語義信息通常與識別任務(wù)需求相關(guān)。然而由于目標(biāo)識別是基于特征空間進(jìn)行的,該方法忽略了各類別之間的特征分布,因此識別性能受到限制。基于數(shù)據(jù)的自動化構(gòu)建方法是通過計算不同類別數(shù)據(jù)在特征空間的相似度,然后利用聚類的方式遞歸的獲取樹形層次結(jié)構(gòu),盡可能地將數(shù)據(jù)相似度高的類別組織到同一節(jié)點(diǎn)基分類器完成分類,在現(xiàn)有的目標(biāo)數(shù)據(jù)充足且完備時有較好的識別效果。然而,實(shí)際識別場景中,地面環(huán)境十分復(fù)雜,目標(biāo)類別繁雜多樣,難以對于各個目標(biāo)類別獲取充足完備的數(shù)據(jù)。基于數(shù)據(jù)的自動化構(gòu)建方法存在不可控因素多、性能穩(wěn)定性不足、對數(shù)據(jù)適應(yīng)能力差等問題。針對上述問題,本文提出了一種語義知識引導(dǎo)的自動層次結(jié)構(gòu)生成方法,由于增加了語義知識的約束,自動化構(gòu)建方法對數(shù)據(jù)依賴性降低,且更穩(wěn)定。
局部分類器訓(xùn)練環(huán)節(jié),鑒于只有部分特征對分類具有決定性作用,研究者通常在模型訓(xùn)練前進(jìn)行特征選擇,旨是降低計算復(fù)雜度并增強(qiáng)分類的精確度。完成特征選擇后,根據(jù)不同的子任務(wù)識別需求選擇最合適的機(jī)器學(xué)習(xí)模型。例如,SVM在處理二分類問題上有著顯著的優(yōu)勢,而深度學(xué)習(xí)模型在數(shù)據(jù)量充裕的精細(xì)分類任務(wù)上表現(xiàn)更為出色。
層次化分類器的一大核心挑戰(zhàn)是差錯傳播問題[3,13,19],即父節(jié)點(diǎn)分類錯誤會傳播給子節(jié)點(diǎn),影響整個分類系統(tǒng)的性能。針對這一問題,通常有兩種改進(jìn)策略:一是優(yōu)化層次化分類器的層次結(jié)構(gòu),通過將相似的子節(jié)點(diǎn)聚集在同一父節(jié)點(diǎn)下,從而有效降低在每個父節(jié)點(diǎn)進(jìn)行分類的難度。這種方法能夠改善父節(jié)點(diǎn)的識別性能,因?yàn)槊總€父節(jié)點(diǎn)處理的子節(jié)點(diǎn)在特征上更為相似,從而降低了分類的復(fù)雜性。二是加入差錯傳播層,對層次化分類結(jié)果加以修正。本文采用第一種研究思路,在樹形層次構(gòu)建時,盡可能地將相似的子節(jié)點(diǎn)聚集到同一父節(jié)點(diǎn),以提高整個層次化分類器的識別性能。
圖2 展示了本文提出的HRRP 目標(biāo)識別方法的整體結(jié)構(gòu)。整體結(jié)構(gòu)包括樹形層次構(gòu)建模塊、訓(xùn)練模塊和測試模塊三個部分組成。在樹形層次構(gòu)建模塊,首先獲取HRRP數(shù)據(jù)集的語義知識,其次根據(jù)計算各類別HRRP 數(shù)據(jù)的相似度關(guān)系,隨后融合數(shù)據(jù)相似度矩陣與語義知識,計算得到類別相似度矩陣,最后基于類別相似度矩陣構(gòu)建樹形層次結(jié)構(gòu)T?;贖RRP 數(shù)據(jù)集提取人工特征,將特征樣本集分為訓(xùn)練集和測試集。訓(xùn)練集輸入訓(xùn)練模塊,在樹形層次結(jié)構(gòu)T中的各個節(jié)點(diǎn)優(yōu)選特征,并匹配局部分類器,訓(xùn)練各個局部分類器,得到分類器模型F。測試集輸入測試模塊,將各個局部分類器以樹形層次組織成層次化分類器,層次化分類器預(yù)測輸出測試樣本的最終類別。下面將對本文方法進(jìn)行詳細(xì)介紹。
圖2 層次化HRRP目標(biāo)識別整體框圖Fig.2 The overall structure of the proposed model for HRRP target recognition
3.2.1 語義知識提取
本節(jié)將領(lǐng)域?qū)<腋兄降念悇e之間的語義關(guān)系與采集姿態(tài)信息,量化為語義知識矩陣表示。這種方法為后續(xù)的樹狀層次構(gòu)建添加了約束,從而避免了由于HRRP的姿態(tài)敏感性導(dǎo)致的類別節(jié)點(diǎn)的誤分類。
語義知識通常與應(yīng)用場景相關(guān)。本文的語義知識源于領(lǐng)域?qū)<谊P(guān)于雷達(dá)目標(biāo)識別任務(wù)的認(rèn)知[3],可以分為三個層次,以復(fù)雜地面環(huán)境車輛目標(biāo)識別為例:第一層次:目標(biāo)鑒別(Target discrimination),主要實(shí)現(xiàn)目標(biāo)屬性的判別,將車輛目標(biāo)與各類地面干擾物進(jìn)行區(qū)分;第二層次:目標(biāo)分類(Target classification),主要實(shí)現(xiàn)目標(biāo)種類的判定,例如運(yùn)輸車、工程車等;第三層次:目標(biāo)辨識(Target identification),主要實(shí)現(xiàn)目標(biāo)具體型號的確定。此外,考慮到HRRP 的姿態(tài)敏感性,本文在上述三個層次上增加姿態(tài)信息,根據(jù)上述定義,本文構(gòu)建了一個具有4 個層次的語義層次樹,表示屬性、種類、型號和姿態(tài),如圖3所示。
圖3 語義層次結(jié)構(gòu)Fig.3 Semantic Tree Hierarchy
其次,將語義知識表示為語義相似度矩陣。本文依據(jù)節(jié)點(diǎn)在圖3所示樹形結(jié)構(gòu)中的距離遠(yuǎn)近來判定不同標(biāo)簽的語義相似關(guān)系。兩節(jié)點(diǎn)在樹形結(jié)構(gòu)中的距離越近,即從根節(jié)點(diǎn)出發(fā),到達(dá)兩節(jié)點(diǎn)路徑的公共節(jié)點(diǎn)越多,說明兩節(jié)點(diǎn)存儲標(biāo)簽的語義相似度越大;兩節(jié)點(diǎn)在樹形結(jié)構(gòu)中的距離越遠(yuǎn),即從根節(jié)點(diǎn)出發(fā),到達(dá)兩節(jié)點(diǎn)路徑的公共節(jié)點(diǎn)越少,語義相似度越小。任意兩種標(biāo)簽之間的語義相似度在(0,1]之間。根據(jù)上述思路,對于類別A 和類別B,可將兩者之間的語義相似度計算公式表示如下:
其中,path(A)表示從根節(jié)點(diǎn)到包含有型號A 的葉節(jié)點(diǎn)的路徑,path(A ∩B)表示兩條路徑的公共節(jié)點(diǎn),length(·)表示路徑的節(jié)點(diǎn)個數(shù),avg(·)表示路徑節(jié)點(diǎn)個數(shù)的平均值。假設(shè)訓(xùn)練數(shù)據(jù)包含C個類別,則可獲得一個對稱的維數(shù)為C×C的語義相似度矩陣Kc。
3.2.2 數(shù)據(jù)相似度
首先,針對每個類別提取有效的特征表示。其中,葉子節(jié)點(diǎn)的特征樣本集即為該節(jié)點(diǎn)類別的特征樣本集,而其余節(jié)點(diǎn)的特征樣本集為該節(jié)點(diǎn)相連子節(jié)點(diǎn)特征樣本集的并集。本文采用主動采樣算法[20]設(shè)計典型性指標(biāo)和多樣性指標(biāo)評估特征樣本集中的所有特征樣本,搜索最具代表性的樣本作為該類別的特征表示。典型性指標(biāo)用于評估特征樣本集中每個樣本的代表性程度。具體來說,這個指標(biāo)反映了一個特定樣本與同類別其他樣本的相似性。在特征樣本集中,典型性指標(biāo)較高的樣本表明它與該類別中的多數(shù)樣本具有相似的特征,從而可以被認(rèn)為是這一類別的典型代表。多樣性指標(biāo)用于量化特征樣本集內(nèi)部樣本之間的差異程度。這一指標(biāo)幫助本文理解在給定類別內(nèi)樣本的變異性和多樣性水平。如果一個樣本的多樣性指標(biāo)高,這通常說明該樣本在所考慮的特征集合中與其他樣本有著較大的差異性。
假設(shè)類別A 的特征樣本集X包含M條樣本,可表示為X={xi,i=1,…,M},xi表示X中一條樣本的特征向量。xi的典型性指標(biāo)R(xi)與多樣性指標(biāo)D(xi)的定義如下式所示。
其中,Ni為xi鄰近樣本集,δR為高斯核帶寬,|Ni|代表的是這個鄰近樣本集合中樣本的總數(shù)。依據(jù)典型性指標(biāo)與多樣性指標(biāo)對X中的所有樣本進(jìn)行評估,輸出滿足以下條件的樣本:
將該樣本作為類別A的特征表示r(A)。依據(jù)上述過程,分別計算各類別的特征表示。
隨后,計算各類別樣本數(shù)據(jù)的相似關(guān)系。本文依據(jù)不同類別在特征空間的距離來判定不同類別的數(shù)據(jù)相似關(guān)系。兩類別在特征空間的距離用兩類別的特征表示向量之間的歐式距離來表示。若兩類別的特征表示向量之間的歐式距離越小,則兩類別之間的數(shù)據(jù)相似度越大;反之,若兩類別的特征表示向量之間的歐式距離越小,則兩類別之間的數(shù)據(jù)相似度越大。對于類別A 和類別B,兩者之間的數(shù)據(jù)相似度計算公式如下:
其中,d(·)表示歐式距離,r(A)為類別A的特征表示,r(B)為類別B的特征表示。
假設(shè)訓(xùn)練數(shù)據(jù)包含C個類別,則可獲得一個對稱的維數(shù)為C×C的數(shù)據(jù)相似度矩陣Kd。
3.2.3 類別相似度
本文采用多核學(xué)習(xí)方法[21],融合語義相似度矩陣與數(shù)據(jù)相似度矩陣獲取類別相似度度量指標(biāo)。多核學(xué)習(xí)的核心目的是探索基核矩陣的最適合的結(jié)合策略,實(shí)現(xiàn)矩陣的有效融合。在基核矩陣的結(jié)合方法上,有線性和非線性兩種選擇。由于非線性結(jié)合在計算上較為復(fù)雜,并且其可解釋性不佳,因此本文選擇使用線性結(jié)合。具體的融合步驟如下:假設(shè)共有C個類別,可獲得C×C的語義相似度矩陣Kc與數(shù)據(jù)相似度矩陣Kd。對Kc和Kd進(jìn)行歸一化處理得到,定義優(yōu)化目標(biāo)函數(shù)為:
其中I為單位矩陣,w1、w2為常數(shù)系數(shù)。學(xué)習(xí)上述優(yōu)化目標(biāo)函數(shù)可得到組合系數(shù)w1和w2,用于計算融合相似度度量矩陣。選擇這個優(yōu)化目標(biāo)是為了讓融合后的核心矩陣盡量靠近單位矩陣,其目的主要有兩點(diǎn):首先,單位矩陣的對角線上的元素值為1,其他位置的元素值為0,這確保了同一類別內(nèi)部的相似度最大,而不同類別之間的相似度最?。黄浯?,由于在目標(biāo)函數(shù)中對權(quán)重的總和有限制,這意味著融合后的相似度所描述的類別關(guān)系與融合前的每個基核矩陣所描述的類別關(guān)系是一致的。
最后,計算類別相似度矩陣Ks:
3.2.4 自動化層次構(gòu)建
采用3.2.3 節(jié)得到的類別相似度矩陣Ks,通過Kmeans 聚類算法[22]自適應(yīng)構(gòu)建樹形層次結(jié)構(gòu)T。首先,將類別相似度矩陣轉(zhuǎn)化為距離矩陣;其次,隨機(jī)選擇K個數(shù)據(jù)點(diǎn)作為初始聚類中心,根據(jù)距離矩陣為每個數(shù)據(jù)點(diǎn)分配最近的中心;隨后,重新計算每個聚類的中心點(diǎn),上述過程會重復(fù),直到聚類中心不再發(fā)生顯著變化或達(dá)到預(yù)定的迭代次數(shù)。Kmeans 的目的是最小化每個數(shù)據(jù)點(diǎn)到其分配的中心的距離之和,以此達(dá)到數(shù)據(jù)的聚類效果。圖4 給出了樹形層次結(jié)構(gòu)構(gòu)建的流程圖。其中,樹形結(jié)構(gòu)中的灰色節(jié)點(diǎn)表示葉子節(jié)點(diǎn),白色節(jié)點(diǎn)分為“根節(jié)點(diǎn)”和中間節(jié)點(diǎn)。中間節(jié)點(diǎn)中的字符指代該節(jié)點(diǎn)存儲的類別個數(shù),表示為Nfi{i=1,2,3,…,W,…,P,…,M}。葉子節(jié)點(diǎn)只存儲單個類別,所以節(jié)點(diǎn)中的數(shù)字為“1”。
圖4 樹形層次結(jié)構(gòu)構(gòu)建流程Fig.4 Tree hierarchy construction process
對于圖4展示的構(gòu)建流程的詳細(xì)說明如下:
(1)采用類別相似度矩陣Ks,基于Kmeans 算法可將父節(jié)點(diǎn)f 中包含的所有目標(biāo)類別集合Jf聚類為Q個子集合Jci{i=1,2,3,…,Q},并將各個子集合Jci存儲到父節(jié)點(diǎn)相連的子節(jié)點(diǎn)ci{i=1,2,3,…,Q}。層次結(jié)構(gòu)父子節(jié)點(diǎn)關(guān)系示意圖如圖5所示。為了優(yōu)選聚類子集合個數(shù)Q,本文選用輪廓系數(shù)作為聚類評估的指標(biāo),采用輪廓系數(shù)達(dá)到最高值時對應(yīng)的子集合個數(shù)作為Q。
圖5 層次結(jié)構(gòu)父子節(jié)點(diǎn)關(guān)系示意圖Fig.5 Hierarchical structure parent-child relationship diagram
(2)從“根”節(jié)點(diǎn)開始執(zhí)行上述劃分過程,基于類別相似度矩陣Ks聚類得到多個子集合,并存儲到相連子節(jié)點(diǎn);然后對所有的子集合遞歸執(zhí)行上述劃分過程,每次劃分后,所得到的子集合中的標(biāo)簽數(shù)目更少,直至所有劃分的子集合中僅有一個目標(biāo)標(biāo)簽,將單個目標(biāo)標(biāo)簽存儲到葉子節(jié)點(diǎn)。以圖4為例,從“根”節(jié)點(diǎn)開始,每次遞歸劃分過程都僅對紅色虛線框圈住的節(jié)點(diǎn)執(zhí)行操作,在第N次遞歸劃分過程后,生成的節(jié)點(diǎn)只存儲了單個標(biāo)簽,最終完成樹形層次結(jié)構(gòu)的構(gòu)建,并將所構(gòu)建的樹形層次記作T。
如圖2中訓(xùn)練模塊所示,首先,將多個基分類器按照3.2 節(jié)所構(gòu)建的樹形層次T組織。如圖1 所示,白色節(jié)點(diǎn)既存儲了該節(jié)點(diǎn)的訓(xùn)練數(shù)據(jù),又存儲了用于區(qū)分其子節(jié)點(diǎn)類別的局部分類器,灰色節(jié)點(diǎn)僅僅存儲了其最終的目標(biāo)類別。
其次,在各個節(jié)點(diǎn)的局部分類器中輸入訓(xùn)練數(shù)據(jù),根據(jù)訓(xùn)練數(shù)據(jù)優(yōu)選特征子集。本文采用了Sklearn中提供的基于模型的特征選擇(Model-based feature selection)方法[23]。此處不再詳細(xì)贅述。
隨后,分別將各分類節(jié)點(diǎn)的優(yōu)選特征子集輸入對應(yīng)節(jié)點(diǎn)存儲的局部分類器模型,在各局部分類器中訓(xùn)練,訓(xùn)練參數(shù)模型記作F。不同的識別子任務(wù)將匹配不同的機(jī)器學(xué)習(xí)算法模型。各個分類節(jié)點(diǎn)所設(shè)置的分類器可以選用SVM 等常用機(jī)器學(xué)習(xí)模型。
輸入樣本u到訓(xùn)練參數(shù)模型F;從根節(jié)點(diǎn)開始,沿著從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的路徑進(jìn)行搜索,以此確定最終輸出類別。具體來講,當(dāng)測試樣本經(jīng)過節(jié)點(diǎn)v 時,節(jié)點(diǎn)v 存儲的局部分類器將決定測試樣本應(yīng)該經(jīng)過的下一個節(jié)點(diǎn)。如果下一個節(jié)點(diǎn)是葉子節(jié)點(diǎn),則該葉子節(jié)點(diǎn)的類別就是測試樣本的分類結(jié)果。但如果下一個節(jié)點(diǎn)是非葉子節(jié)點(diǎn),那么測試樣本將繼續(xù)由該節(jié)點(diǎn)存儲的局部分類器來決定其下一個要經(jīng)過的節(jié)點(diǎn),上述過程會持續(xù),直到測試樣本到達(dá)葉子節(jié)點(diǎn)為止。
在本實(shí)驗(yàn)中,本文采用了一臺雙極化寬帶雷達(dá)進(jìn)行數(shù)據(jù)收集。該雷達(dá)發(fā)射水平線性極化(H)信號,并同時接收水平(H)和垂直(V)正交極化信號。該雷達(dá)系統(tǒng)工作在W 頻段范圍內(nèi),采用步進(jìn)頻率線性頻率調(diào)制信號,具有1250 MHz 的合成帶寬,從而生成高分辨率目標(biāo)的HRRP。實(shí)驗(yàn)數(shù)據(jù)集包含了2 種干擾和8 種車輛。其中,干擾物包括變電箱和高壓塔。車輛包括5 種乘用車、3 種運(yùn)輸車輛。數(shù)據(jù)集中車輛目標(biāo)極化HRRP 數(shù)據(jù)采集自迎頭、左/右正側(cè)、尾追、左/右前斜和左/右后斜8 種不同姿態(tài),圖6 以卡車目標(biāo)為例對其進(jìn)行了展示。表1 給出了各個目標(biāo)的訓(xùn)練樣本與測試樣本說明,該數(shù)據(jù)集存在嚴(yán)重的樣本類別不平衡問題,訓(xùn)練樣本數(shù)目最小的類別SUV 只有1880 個樣本,而訓(xùn)練樣本數(shù)目最大的類別皮卡車包含104431個樣本。
表1 數(shù)據(jù)集說明Tab.1 Dataset description
圖6 各個采集姿態(tài)下卡車的HRRPFig.6 HRRP of the truck under various acquisition poses
基于HRRP 實(shí)測數(shù)據(jù)集,本文提取了36 個人工特征[24-26],表2給出了所提特征的說明。
表2 人工特征說明Tab.2 Handcrafted Feature description
隨后,本文在各個節(jié)點(diǎn)利用交叉驗(yàn)證方法比較SVM、決策樹、多層感知機(jī)[27]等常用分類器的識別性能,優(yōu)選性能最優(yōu)的分類模型作為節(jié)點(diǎn)的局部分類器。表3 給出了本文選用的常用分類器,以及交叉驗(yàn)證時的調(diào)參范圍。
表4展示了為各個節(jié)點(diǎn)優(yōu)選的局部分類器的參數(shù)配置。由此可見,由于每個節(jié)點(diǎn)所要處理的識別子任務(wù)有所區(qū)別,因此根據(jù)各自的特性選擇的局部分類器也存在差異。此外,SVM更適用于二分類任務(wù),而決策樹更適用于區(qū)分干擾物和車輛目標(biāo)的種類,多層感知機(jī)則更適用于精細(xì)化識別任務(wù),即區(qū)分同一種類目標(biāo)的具體型號。
表4 局部分類器參數(shù)設(shè)置Tab.4 Local classifier parameter settings &recognition results comparison
4.3.1 可視化結(jié)果分析
訓(xùn)練特征數(shù)據(jù)集的可視化效果如圖7 所示,訓(xùn)練特征數(shù)據(jù)集的分布表現(xiàn)得相當(dāng)復(fù)雜。各類目標(biāo)之間的邊界并不明顯,在特征空間中高度重疊,為目標(biāo)識別帶來了更大的挑戰(zhàn)。
圖7 訓(xùn)練特征數(shù)據(jù)集t-SNE可視化結(jié)果Fig.7 T-SNE visualization results of the training feature dataset
本文依據(jù)關(guān)于雷達(dá)目標(biāo)識別任務(wù)的認(rèn)知而定義的語義知識如下:第一層實(shí)現(xiàn)目標(biāo)鑒別,區(qū)分車輛目標(biāo)和地面干擾。第二層實(shí)現(xiàn)目標(biāo)分類,區(qū)分運(yùn)輸車和乘用車。第三層實(shí)現(xiàn)目標(biāo)辨識,區(qū)分多種型號的運(yùn)輸車,廂式貨車、貨車、大巴車;還有多種型號的乘用車,SUV、敞篷車、MPV 等;以及多種地面干擾,變電箱和高壓塔。依據(jù)上述語義知識,按照3.2.1構(gòu)建的語義相似度矩陣如圖8所示。
圖8 語義相似度矩陣構(gòu)建結(jié)果Fig.8 Results of Semantic Similarity Matrix
融合語義相似度與數(shù)據(jù)相似度矩陣,構(gòu)建的類別相似度矩陣如圖9所示。
針對待分類數(shù)據(jù),依據(jù)該類別相似度矩陣,按照3.2.4 節(jié)方法構(gòu)建樹形層次。所構(gòu)建的樹形層次如圖10(b)所示。此外,為了方便后續(xù)表達(dá),本文用圖10(b)中的各個分類節(jié)點(diǎn)上的數(shù)字用以指代該節(jié)點(diǎn)。由于各個類別下的姿態(tài)標(biāo)簽較多,且由于增加了語義約束,利用本文方法構(gòu)建的同一類別的各個姿態(tài)標(biāo)簽依然被劃分為同一父節(jié)點(diǎn)下分類,因此圖10并未展示姿態(tài)標(biāo)簽。對比圖10(a)和(b),在語義樹形層次的基礎(chǔ)上,本文的方法對乘用車節(jié)點(diǎn)進(jìn)行了進(jìn)一步的劃分。劃分后,乘用車A 和乘用車B節(jié)點(diǎn)待分類的數(shù)據(jù)類別更少、區(qū)分度更高,緩解了類別不平衡問題。
圖10 語義樹形層次與本文方法構(gòu)建的樹形層次結(jié)果比較Fig.10 Comparison between the semantic tree hierarchy and the tree hierarchy constructed by this study
圖11 展現(xiàn)了各個節(jié)點(diǎn)上特征的可視化效果。觀察可得,各節(jié)點(diǎn)的任務(wù)區(qū)分難度已明顯降低。此外,層次化方法還為本文提供了一種更為直觀的方式來理解和解釋數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和相似性。
圖11 各節(jié)點(diǎn)訓(xùn)練特征數(shù)據(jù)集t-SNE可視化結(jié)果Fig.11 t-SNE visualization results of the training feature dataset for each tree node
4.3.2 識別性能比較
首先,開展消融實(shí)驗(yàn)驗(yàn)證本文所構(gòu)建的樹形層次的有效性。結(jié)果如表5 所示,三種方法的不同之處在于其樹形層次結(jié)構(gòu)。其中,Hier-Sem 是依據(jù)圖10(a)中語義層次組織形成的層次分類器;Hier-Data 是依據(jù)HRRP 數(shù)據(jù)自動化構(gòu)建的樹形層次組織形成的層次分類器。表5采用識別率作為評估各方法識別性能的指標(biāo)。識別率由預(yù)測正確的樣本比上所有樣本計算得到的。表5中各個方法的第一列表示種類識別率,即運(yùn)輸車、乘用車、干擾等類別標(biāo)簽的識別率。第二列表示型號識別率,即T1、T2、T3 等型號標(biāo)簽的識別率。而最后一行的識別率是由測試集所有預(yù)測正確的樣本比上測試集所有樣本計算得到的。分析表5中結(jié)果可得:本文方法優(yōu)于僅依據(jù)語義層次或者數(shù)據(jù)相似度組織的層次化分類器,這說明了本文在層次結(jié)構(gòu)構(gòu)建上的有效性,本文方法不僅考慮了類別間的語義關(guān)系,還有效地融合了數(shù)據(jù)特性,從而實(shí)現(xiàn)了更精準(zhǔn)的分類結(jié)果。
表5 識別結(jié)果比較(%)Tab.5 Recognition Results Comparison(%)
其次,本文與多種平面分類方法進(jìn)行了比較,包括2 種多分類器融合方法,以及3 種深度學(xué)習(xí)方法。多分類器融合方法為Flat-SVM 和Flat-DT,分別由支持向量機(jī)(SVM)與決策樹(DT)以平面結(jié)構(gòu)組織而成,F(xiàn)lat-DT又可看作隨機(jī)森林方法。深度學(xué)習(xí)方法包括CNN[27]、VGG-11[28]、AlexNet[29]三種。
表6 給出了上述多種方法的識別結(jié)果。表6 也采用識別率作為評估各方法識別性能的指標(biāo)。與表5相同,表6中各個方法的第一列表示種類識別率,第二列表示型號識別率。可以得到以下幾點(diǎn)結(jié)論:
表6 識別結(jié)果比較(%)Tab.6 Recognition Results Comparison(%)
(1)無論是型號識別率還是種類識別率,層次分類方法的表現(xiàn)均優(yōu)于平面分類方法。該結(jié)果充分證明了層次分類方法的有效性。在處理復(fù)雜的分類任務(wù)時,層次分類方法通過將問題分解為更小的、更易于管理的子任務(wù),從而實(shí)現(xiàn)了更高的識別精度和效率。
(2)雖然深度學(xué)習(xí)方法在一些方面優(yōu)于傳統(tǒng)的分類器方法,但在本次實(shí)驗(yàn)中,其識別結(jié)果卻不如層次分類方法。這可能是由于深度學(xué)習(xí)方法在處理種類繁雜、類別不平衡的型號辨識識別任務(wù)時,還需要更精細(xì)的特征提取和網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化。
針對地面目標(biāo)識別應(yīng)用需求,本文采用層次化識別的思路,提出了一種基于語義引導(dǎo)層次化分類的雷達(dá)地面目標(biāo)識別方法。具體而言,本文所提出的層次分類框架關(guān)注樹形層次構(gòu)建。在樹形層次構(gòu)建環(huán)節(jié),同時考慮了不同類別的HRRP 和語義之間的相似關(guān)系,并設(shè)計相似度量化指標(biāo)。隨后,利用聚類算法根據(jù)相似度量化指標(biāo)自動化的構(gòu)建樹形層次,使得相似度高的細(xì)粒度類別聚集到同一樹形節(jié)點(diǎn),可看作是這些細(xì)粒度類別被打上了粗粒度標(biāo)簽,任務(wù)區(qū)分難度進(jìn)一步降低。本方法在實(shí)測數(shù)據(jù)和仿真數(shù)據(jù)上完成了驗(yàn)證。實(shí)驗(yàn)結(jié)果表明了本文方法處理細(xì)粒度識別任務(wù)的有效性。
未來圍繞層次化分類的研究可從兩方面進(jìn)行:一方面,通過分析手工特征的物理含義,為特定的分類任務(wù)提供更加準(zhǔn)確和有針對性的特征選擇方法;另一方面,將層次分類方法與深度學(xué)習(xí)網(wǎng)絡(luò)相結(jié)合,利用深度學(xué)習(xí)的強(qiáng)大學(xué)習(xí)能力,進(jìn)一步提升細(xì)粒度識別的效率和精確度。