唐吉深,覃少華
(1.河池學(xué)院,廣西 河池 546300;2.廣西多源信息挖掘與安全重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541004;3.廣西師范大學(xué)計(jì)算機(jī)科學(xué)與信息工程學(xué)院,廣西 桂林 541004)
自20世紀(jì)90年代以來,合成孔徑雷達(dá)(synthetic aperture radar, SAR)圖像目標(biāo)識(shí)別問題在世界范圍內(nèi)得到廣泛研究并產(chǎn)出了大量的成果[1-2]。SAR目標(biāo)識(shí)別系統(tǒng)通過檢測(cè)、鑒別和分類的三個(gè)階段從大場(chǎng)景圖像中獲取感興趣的目標(biāo)并判定其類別。現(xiàn)有公開的SAR目標(biāo)識(shí)別算法主要集中在對(duì)分類算法的研究,即在已經(jīng)剔除虛警后的感興趣目標(biāo)區(qū)域(region of interest,ROI)的基礎(chǔ)上對(duì)其類別進(jìn)行決策(后文將其稱為SAR目標(biāo)識(shí)別)。一般的SAR目標(biāo)識(shí)別算法主要設(shè)計(jì)特征提取和分類決策兩個(gè)環(huán)節(jié)。前者通過分析目標(biāo)幾何形狀、灰度分布以及電磁散射等特點(diǎn)獲取低維特征矢量,實(shí)現(xiàn)對(duì)目標(biāo)核心特性的有效描述。文獻(xiàn)[3—5]以目標(biāo)區(qū)域、輪廓等為基本特征設(shè)計(jì)SAR目標(biāo)識(shí)別算法。文獻(xiàn)[6—9]采用主成分分析(principal component analysis,PCA)、非負(fù)矩陣分解(non-negative matrix factorization,NMF)、單演信號(hào)分解等手段獲取SAR圖像的不變特征。文獻(xiàn)[10—11]基于屬性散射中心設(shè)計(jì)SAR目標(biāo)識(shí)別方法,通過散射中心的一一配對(duì)考察目標(biāo)可能出現(xiàn)的局部變化。分類決策階段,根據(jù)提取特征的不同規(guī)律和特點(diǎn),選用相適應(yīng)的分類機(jī)制。目前,在SAR目標(biāo)識(shí)別中廣泛運(yùn)用的分類器包括K近鄰(K-NN)[6]、支持向量機(jī)(support vector machine,SVM)[12]、稀疏表示分類(sparse representation-based classification,SRC)[13]以及深度網(wǎng)絡(luò)[14-15]等。
稀疏表示目前已在模式識(shí)別領(lǐng)域獲得到廣泛運(yùn)用。Wright等人[16]首次將稀疏表示運(yùn)用于人臉識(shí)別并根據(jù)各訓(xùn)練類別的重構(gòu)誤差進(jìn)行決策;Thiagaraianm等人[13]將稀疏表示分類引入SAR目標(biāo)識(shí)別;后續(xù),稀疏表示分類成為SAR目標(biāo)識(shí)別中廣泛運(yùn)用的分類器之一,對(duì)于多種特征均有良好的適應(yīng)性。這些算法多是基于最小重構(gòu)誤差準(zhǔn)則進(jìn)行分類決策。文獻(xiàn)[17]提出基于最大系數(shù)能量的決策方法,其基本思想是計(jì)算各個(gè)類別上系數(shù)的能量和,根據(jù)最大能量的準(zhǔn)則進(jìn)行決策。無論是最小重構(gòu)誤差準(zhǔn)則還是最大系數(shù)能量準(zhǔn)則,它們的應(yīng)用并沒有深入分析SAR目標(biāo)識(shí)別這一問題的特殊性。與光學(xué)圖像不同的是,SAR目標(biāo)圖像對(duì)于方位角變化具有很強(qiáng)的敏感性[18]。因此,在稀疏表示過程中,只有與測(cè)試樣本具有相近方位角訓(xùn)練樣本才是有效的,其余樣本的引入容易造成更大的誤差。文獻(xiàn)[19]正是利用SAR圖像的方位角敏感性設(shè)計(jì)了方位角區(qū)間內(nèi)的稀疏表示方法(SRCA)并應(yīng)用于目標(biāo)識(shí)別。本文針對(duì)當(dāng)前相關(guān)研究存在的問題提出全局稀疏表示系數(shù)下局部最優(yōu)重構(gòu)的SAR目標(biāo)識(shí)別方法。
稀疏表示的基本思想是采用預(yù)先構(gòu)建的字典對(duì)特性位置的樣本進(jìn)行稀疏重構(gòu),從而根據(jù)表示稀疏的分布規(guī)律對(duì)未知樣本的特性進(jìn)行有效評(píng)估。具體在目標(biāo)分類鄰域,字典一般由類別確定的訓(xùn)練樣本構(gòu)建然后對(duì)待分類的測(cè)試樣本進(jìn)行表示。假設(shè)D=[D1,D2,…,DC]∈Rd×N為來自C個(gè)類別的全局字典,其中Di為來自第i類別的Ni個(gè)訓(xùn)練樣本,對(duì)測(cè)試樣本y的稀疏表示過程可描述如下:
(1)
式(1)中,x為待求解的稀疏表示系數(shù)矢量,ε為重構(gòu)誤差的約束門限。式(1)中的優(yōu)化問題難以直接求解。為此,研究人員通過1范數(shù)等效[16]或貪婪算法(如正交匹配追蹤算法(orthogonal matching pursuit,OMP))[13]獲得近似解。
在獲得稀疏表示系數(shù)的基礎(chǔ)上,按照式(2)計(jì)算各個(gè)類別對(duì)于測(cè)試樣本的重構(gòu)誤差。
(2)
式(2)中,xi為對(duì)應(yīng)于第i類的系數(shù);r(i)為相應(yīng)的重構(gòu)誤差。
傳統(tǒng)的稀疏表示分類大多根據(jù)重構(gòu)誤差的大小進(jìn)行類別判定,即具有最小重構(gòu)誤差的訓(xùn)練類別為測(cè)試樣本的目標(biāo)類別。后續(xù),也有研究人員根據(jù)各類別系數(shù)能量的大小作為判決依據(jù)。需要指出的是,這些方法都在所有非零表示系數(shù)上進(jìn)行決策,缺乏對(duì)獨(dú)立原子的考察。實(shí)際上,由于SAR圖像自身具有的特性,對(duì)稀疏表示系數(shù)進(jìn)行更深層次考察和分析有利于獲得更為準(zhǔn)確的分類結(jié)果。
SAR圖像具有較強(qiáng)的方位角敏感性,即當(dāng)目標(biāo)和雷達(dá)平臺(tái)的方位向視角變化較大時(shí),圖像中的目標(biāo)特性表現(xiàn)出很大的差異。這一特性導(dǎo)致了同一目標(biāo)的不同方位角SAR圖像之間的差異往往超過了不同類別之間的某些圖像差異,給識(shí)別問題帶來較大的混淆。同時(shí),在多視角樣本可利用的條件下,方位角敏感性又為多視角識(shí)別方法提供了更充分的信息。不同視角之間相互補(bǔ)充從而為目標(biāo)類別的確認(rèn)提供了更強(qiáng)的鑒別力,文獻(xiàn)[20—22]正是基于此設(shè)計(jì)了多種多視角SAR目標(biāo)識(shí)別方法。
傳統(tǒng)基于稀疏表示的SAR目標(biāo)識(shí)別方法的決策思路與光學(xué)圖像識(shí)別一致,并沒有考慮到SAR圖像的方位角敏感性。實(shí)際上,對(duì)于SAR圖像測(cè)試樣本,與其高度相關(guān)的原子(無論是來自正確類別還是錯(cuò)誤類別)應(yīng)當(dāng)與其具有相近的方位角。因此,針對(duì)SAR目標(biāo)識(shí)別的稀疏表示系數(shù)應(yīng)該具有明顯的方位角區(qū)間特性。這一特性的引入有利于進(jìn)一步增強(qiáng)稀疏表示系數(shù)以及重構(gòu)誤差區(qū)分不同類別的能力,從而提高目標(biāo)識(shí)別性能。
本文在全局稀疏表示的基礎(chǔ)上提出局部最優(yōu)重構(gòu)方法。本方法通過SAR圖像方位角敏感性的引入進(jìn)一步考察各訓(xùn)練類別對(duì)于測(cè)試樣本的真實(shí)表征能力。對(duì)于全局字典,按照方位角升序的方式對(duì)其中各個(gè)類別的訓(xùn)練樣本分別進(jìn)行排列。對(duì)于求解的稀疏表示系數(shù)矢量,選取其中P個(gè)最大的系數(shù),記為x(P)。這一步的目的主要是剔除大量無關(guān)原子(即與測(cè)試樣本的方位角差異很大)的影響。根據(jù)選取的原子及其對(duì)應(yīng)的系數(shù),分別在各個(gè)類別上對(duì)測(cè)試樣本進(jìn)行重構(gòu):
(3)
saz(i)=var([k1,k2,…,kMi])
(4)
式(4)中,函數(shù)var()計(jì)算方差。當(dāng)選取原子之間聚集性較差時(shí),方差相對(duì)較大;反之,方差相對(duì)較小。據(jù)此對(duì)式(3)中的重構(gòu)誤差進(jìn)行加權(quán)修正,得到最終的決策變量如下:
dv(i)=exp(saz(i))·rL(i)
(5)
式(5)計(jì)算得到的決策變量與重構(gòu)誤差具有一致的含義。通過方位角聚集系數(shù)的引入使得最終的決策變量更具可靠性。分類階段,根據(jù)式(5)計(jì)算的各類別對(duì)應(yīng)的決策變量,采用最小誤差原則進(jìn)行目標(biāo)識(shí)別。因此,相比于傳統(tǒng)的全局稀疏表示,本文方法的目標(biāo)是在局部字典上通過利用方位角的敏感性獲得最優(yōu)重構(gòu),并通過分析稀疏系數(shù)的分布規(guī)律進(jìn)一步突出真實(shí)類別與虛假類別之間的差異,從而提升最終的識(shí)別性能。
本文主要是在傳統(tǒng)稀疏表示的基礎(chǔ)上針對(duì)SAR目標(biāo)圖像的特性進(jìn)行改進(jìn),設(shè)計(jì)了更適用于SAR目標(biāo)識(shí)別的新方法。圖1為提出方法的基本流程。對(duì)于測(cè)試樣本,首先在全局字典上對(duì)其進(jìn)行稀疏表示,獲取系數(shù)矢量;根據(jù)當(dāng)前識(shí)別問題的規(guī)模(待識(shí)別的類別數(shù)量)選取少量的最大系數(shù)并在各個(gè)類別上對(duì)測(cè)試樣本進(jìn)行重構(gòu);最后,按照式(4)計(jì)算各類別上系數(shù)的方位角聚集系數(shù)并對(duì)重構(gòu)誤差進(jìn)行修正,獲取最終的決策矢量進(jìn)行目標(biāo)識(shí)別。方法的具體實(shí)施中,從全局稀疏表示系數(shù)中選取P=5C個(gè)最大系數(shù);采用經(jīng)典的PCA對(duì)測(cè)試和訓(xùn)練樣本進(jìn)行特征提取,從而降低計(jì)算復(fù)雜度。
圖1 方位角敏感性約束下局部最優(yōu)重構(gòu)的SAR目標(biāo)識(shí)別方法流程Fig.1 Procedure of SAR target recognition based on local optimal reconstruction under the constraint of azimuthal sensitivity
為驗(yàn)證提出方法的有效性,基于MSTAR數(shù)據(jù)集開展實(shí)驗(yàn)。該數(shù)據(jù)集中包含如圖2所示的10類車輛目標(biāo),各類目標(biāo)圖像由X波段SAR傳感器采集,成像模式為聚束模式,分辨率0.3 m。對(duì)于任一類目標(biāo),其SAR圖像樣本的相鄰方位角間隔約為1°~2°?,F(xiàn)階段,大多數(shù)公開文獻(xiàn)中的SAR目標(biāo)識(shí)別算法均是基于MSTAR數(shù)據(jù)集進(jìn)行性能測(cè)試,表明其權(quán)威性。
標(biāo)準(zhǔn)操作條件(standard operating condition)和擴(kuò)展操作條件(extended operating condition)是SAR目標(biāo)識(shí)別中兩類情形。標(biāo)準(zhǔn)操作條件指的是當(dāng)前測(cè)試樣本與構(gòu)建的訓(xùn)練(模板)樣本差距較小,可近似認(rèn)為采集自相同的條件。反之,擴(kuò)展操作條件則是指由于測(cè)量條件(包括背景環(huán)境、目標(biāo)自身、傳感器等因素)的變化,測(cè)試樣本與訓(xùn)練樣本存在較大的差異。典型的擴(kuò)展操作條件包括型號(hào)變化、俯仰角變換、噪聲干擾等。為了充分驗(yàn)證提出方法的性能,本文在后續(xù)實(shí)驗(yàn)中分別在標(biāo)準(zhǔn)操作條件和部分?jǐn)U展操作條件下對(duì)其進(jìn)行測(cè)試。同時(shí),選用若干對(duì)比方法進(jìn)行同步測(cè)試,分別為文獻(xiàn)[13]中基于最小重構(gòu)誤差分類原則的SRC方法(記為“最小誤差-SRC”),文獻(xiàn)[17]中基于最大系數(shù)能量的SRC方法(基于 “最大能量-SRC”),文獻(xiàn)[19]中基于SRCA的方法,文獻(xiàn)[12]基于SVM的方法以及文獻(xiàn)[14]中基于全卷積神經(jīng)網(wǎng)絡(luò)(A-ConvNets)的方法。其中,前兩個(gè)對(duì)比方法與本文方法一樣,采用SRC作為基礎(chǔ)分類器,但其具體的決策準(zhǔn)則與本文不同。
圖2 10類目標(biāo)的光學(xué)圖像Fig.2 Optical images of the ten targets
標(biāo)準(zhǔn)操作條件下的識(shí)別問題相對(duì)簡(jiǎn)單,但它是對(duì)SAR目標(biāo)識(shí)別算法的基本考核。表1給出了當(dāng)前基于MSTAR數(shù)據(jù)集設(shè)置的一種典型標(biāo)準(zhǔn)操作條件,包含了其中全部10類目標(biāo)。其中,訓(xùn)練和測(cè)試樣本來自相同的目標(biāo)型號(hào),唯一的區(qū)別為2°的俯仰角差異(兩者分別來自17°和15°俯仰角)。圖3顯示了提出方法在標(biāo)準(zhǔn)操作條件下的分類結(jié)果,各類目標(biāo)的正確識(shí)別率如對(duì)角線所列,綜合得到10類目標(biāo)的平均識(shí)別率為98.74%。
表2對(duì)比了各類方法在標(biāo)準(zhǔn)操作條件下的識(shí)別性能。在識(shí)別精度方面,本文方法的平均識(shí)別率略低于A-ConvNets方法而優(yōu)于其他方法。在標(biāo)準(zhǔn)操作條件下,訓(xùn)練樣本與測(cè)試樣本相似高,能夠較好覆蓋測(cè)試樣本中出現(xiàn)中的各種情形。因此,訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)分類能力很強(qiáng),能夠取得很高的識(shí)別率。與其他三類基于SRC的方法相比,本文方法的識(shí)別率有一定的提高,表明通過局部最優(yōu)重構(gòu)能夠有效改善識(shí)別性能。方位角約束下的SRCA方法相比最小誤差-SRC和最大能量-SRC具有更高的識(shí)別率,表明充分利用SAR圖像的方位角敏感性有利于提升整體識(shí)別性能。在相同的硬件平臺(tái)上對(duì)各類方法進(jìn)行測(cè)試并計(jì)算它們識(shí)別單個(gè)測(cè)試樣本所需的時(shí)間消耗。從表中可以看出,本文方法的效率低于最小誤差-SRC和最大能量-SRC方法但高于其他方法。由于本文方法在決策變量的計(jì)算中充分考慮了稀疏系數(shù)矢量的局部特性因此相比簡(jiǎn)單最小重構(gòu)誤差和最大系數(shù)能量需要更多的時(shí)間消耗。對(duì)于SVM和A-ConvNets方法,它們則需要分類器的訓(xùn)練時(shí)間。綜合來看,本文方法在標(biāo)準(zhǔn)操作條件下的性能較優(yōu),能夠較好地完成多類目標(biāo)的識(shí)別任務(wù)。
表1 標(biāo)準(zhǔn)操作條件的典型實(shí)驗(yàn)設(shè)置Tab.1 Typical experimental setup under SOC
圖3 本文方法在標(biāo)準(zhǔn)操作條件下的分類結(jié)果Fig.3 Classification results of the proposed method under SOC
表2 各方法標(biāo)準(zhǔn)操作條件下的性能比較Tab.2 Performance comparison of different methods under SOC
3.3.1 型號(hào)變化
目標(biāo)自身型號(hào)變化時(shí)SAR目標(biāo)識(shí)別中一種典型擴(kuò)展操作條件,主要是指測(cè)試樣本的目標(biāo)型號(hào)與訓(xùn)練樣本存在差異。表3給出了基于MSTAR數(shù)據(jù)集設(shè)置的型號(hào)變化條件下的訓(xùn)練和測(cè)試集。其中,BMP2和T72的測(cè)試型號(hào)與訓(xùn)練樣本完全不同;BTR70的引入主要是為了進(jìn)一步增加識(shí)別問題的難度。表4對(duì)比了各類方法在型號(hào)變化條件下的平均識(shí)別率,本文方法性能最優(yōu)。當(dāng)訓(xùn)練樣本與測(cè)試樣本存在一定差異時(shí),訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)分類性能出現(xiàn)下降,這也是當(dāng)前基于深度學(xué)習(xí)方法的方法對(duì)于大量訓(xùn)練樣本的依賴性。與其余兩類SRC方法相比,本文方法在型號(hào)變化條件下仍然能進(jìn)一步提高識(shí)別穩(wěn)定性,表明了設(shè)計(jì)的局部最優(yōu)重構(gòu)算法的有效性。
表3 型號(hào)變化下的典型實(shí)驗(yàn)設(shè)置Tab.3 Typical experimental setup under configruation differences
表4 各方法型號(hào)變化下的平均識(shí)別率Tab.4 Average recogntion rates of differnet methods under configuration differences
3.3.2 俯仰角變化
隨著訓(xùn)練和測(cè)試樣本俯仰角差距的不斷增大,識(shí)別問題也不再是標(biāo)準(zhǔn)操作條件。由于較大俯仰角差異帶來的SAR圖像差異使得識(shí)別問題尤為困難?;贛STAR數(shù)據(jù)集設(shè)置如表5所示的訓(xùn)練和測(cè)試集,3類目標(biāo)以17°俯仰角下的圖像作為訓(xùn)練集分別對(duì)30°和45°俯仰角下的測(cè)試樣本進(jìn)行分類。各類方法在不同俯仰角的平均識(shí)別率如圖4所示。顯然,由于俯仰角差異相對(duì)較小,30°下的識(shí)別性能遠(yuǎn)遠(yuǎn)優(yōu)于45°下的性能,主要是因?yàn)?8°的大幅俯仰角變化使得測(cè)試樣本和訓(xùn)練樣本出現(xiàn)了很大的差異。對(duì)比各類方法,本文方法在兩個(gè)角度下都取得了最佳的性能,驗(yàn)證其對(duì)于俯仰角差異的穩(wěn)健性。在俯仰角變化較大的情況下,可用于表征測(cè)試樣本的訓(xùn)練樣本不斷減少。因此,通過選取合適的訓(xùn)練樣本進(jìn)行最優(yōu)重構(gòu)有利于避免無效樣本的影響從而提高決策的可靠性。
表5 俯仰角變化下的典型實(shí)驗(yàn)設(shè)置Tab.5 Typical experimental setup under depression angle differences
圖4 各方法在不同俯仰角下的平均識(shí)別率Fig.4 Average recognition rates of different methods at different depression angles
3.3.3 噪聲干擾
噪聲伴隨著SAR數(shù)據(jù)采集以及成像的整個(gè)過程。盡管現(xiàn)階段已經(jīng)有了一些SAR圖像噪聲抑制算法,但噪聲仍然是影響SAR目標(biāo)識(shí)別性能的重要因素。原始MSTAR數(shù)據(jù)集信噪比(signal-to-noise ratio,SNR)較高,難以直接考察目標(biāo)識(shí)別算法在低噪聲水平下的性能。為此,本文首先按照文獻(xiàn)[10]中的策略向表1中的訓(xùn)練樣本添加噪聲,然后基于構(gòu)造的噪聲樣本測(cè)試各方法在噪聲干擾條件下的分類性能。圖5為各類方法在不同信噪比下的識(shí)別率曲線。顯然, 噪聲水平的不斷提高導(dǎo)致各類方法的識(shí)別性能均出現(xiàn)了明顯的下降。對(duì)比可見,本文方法對(duì)于噪聲干擾具有更強(qiáng)的穩(wěn)健性。此外,基于SRC的四類方法對(duì)于噪聲干擾表現(xiàn)出更好的適應(yīng)性,尤其在低信噪比的條件下,性能優(yōu)勢(shì)更強(qiáng),這與文獻(xiàn)[16]中的實(shí)驗(yàn)結(jié)果具有一致性。對(duì)于A-ConvNets方法,受噪聲干擾影響,基于高信噪比(原始)訓(xùn)練樣本訓(xùn)練的網(wǎng)絡(luò)對(duì)于低信噪比的SAR圖像的適應(yīng)性較差。
圖5 各方法在噪聲干擾下的平均識(shí)別率Fig.5 Average recognition rates of different methods under noise corruption
在局部重構(gòu)中,按照升序排列的相鄰原子方位角間隔對(duì)算法性能存在影響。采用原始MSTAR數(shù)據(jù)集時(shí),相鄰原子方位角間隔約為1°~2°,此時(shí)兩幅SAR圖像具有較高的相似性。隨著這一間隔的增大,相鄰圖像的相關(guān)性降低,會(huì)一定程度破壞稀疏系數(shù)的局部聚集性規(guī)律。為此,本實(shí)驗(yàn)在原始局部字典的基礎(chǔ)上通過去除部分原子的思路,考察方位角間隔的影響。具體的,在基于表1設(shè)置的實(shí)驗(yàn)條件下,對(duì)局部字典中的原子進(jìn)行抽樣,并統(tǒng)計(jì)識(shí)別結(jié)果如表6所示。其中,“隔1取1”表示在原始局部字典中間隔1個(gè)保留下1個(gè),去除中間的原則,其余條件同理。從結(jié)果可以看出,隨著方位角間隔的不斷增大,各類方法的性能均出現(xiàn)下降。對(duì)于幾類對(duì)比方法,它們性能下降主要是由于可用訓(xùn)練樣本的規(guī)模減小,導(dǎo)致分類器的可靠性下降。本文方法除了上述原因外,還存在大方位角間隔條件下局部原子結(jié)構(gòu)的破壞,導(dǎo)致性能下降。總體來看,本文方法在“隔1取1”和“隔3取1”兩種條件下還可以保持最高識(shí)別率,但在“隔5取1”條件下性能不再是最優(yōu)。這樣反映了方位角間隔增大對(duì)所提方法的影響。
表6 各方法在方位角間隔變化條件下的平均識(shí)別率Tab.6 Average recogntion rates of differnet methods under variation of azimuthal interval
本文提出稀疏表示下局部最優(yōu)重構(gòu)的SAR目標(biāo)識(shí)別算法。該算法通過在全局字典上求解得到的稀疏表示系數(shù)選取若干最大的系數(shù);然后,根據(jù)選取的系數(shù)分別在各個(gè)訓(xùn)練類別上對(duì)于測(cè)試樣本進(jìn)行重構(gòu);同時(shí),根據(jù)SAR圖像的方位角敏感性對(duì)各類別上的系數(shù)結(jié)構(gòu)進(jìn)行分析,并與各類別的重構(gòu)誤差進(jìn)行結(jié)合,獲得最終的決策變量完成目標(biāo)識(shí)別。實(shí)驗(yàn)結(jié)果表明,該方法在標(biāo)準(zhǔn)操作條件和擴(kuò)展操作條件下均可以取得更好的性能。