劉 飛, 高紅艷, 衛(wèi)澤剛, 劉亞軍, 錢(qián) 郁
(1. 寶雞文理學(xué)院 物理與光電技術(shù)學(xué)院,陜西 寶雞 721013;2. 寶雞文理學(xué)院 寶雞先進(jìn)鈦合金與功能涂層協(xié)同創(chuàng)新研發(fā)中心,陜西 寶雞 721013)
通過(guò)對(duì)合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)獲得的高分辨率圖像進(jìn)行處理,可實(shí)現(xiàn)對(duì)聚焦區(qū)域或感興趣目標(biāo)的分析解譯。SAR目標(biāo)識(shí)別技術(shù)可用于偵察以及情報(bào)解譯[1-2]。自20世紀(jì)90年代以來(lái),隨著模式識(shí)別、人工智能技術(shù)的發(fā)展,SAR目標(biāo)識(shí)別方法不斷豐富,取得了長(zhǎng)足的進(jìn)步。主流SAR目標(biāo)識(shí)別方法通常運(yùn)用特征提取和分類(lèi)階段的兩級(jí)流程實(shí)現(xiàn)未知樣本的類(lèi)別確認(rèn)。SAR圖像典型目標(biāo)特征包括幾何形狀、投影變換以及電磁散射等類(lèi)別。以目標(biāo)輪廓、區(qū)域、陰影等為代表性的形狀特征,具備區(qū)分不同類(lèi)別的能力[3-6]。投影變換算法包括數(shù)學(xué)投影和變換域分解等,前者包括矩陣分解、流形學(xué)習(xí)等[7-9],后者包括小波、單演信號(hào)、模態(tài)分解等[10-12]。電磁散射特征體現(xiàn)目標(biāo)的后向散射特性,如峰值、散射中心、極化方式等[13-14]。分類(lèi)決策階段與特征提取緊密耦合,利用特征的差異性判定輸入樣本的所屬類(lèi)別。近鄰分類(lèi)器(最近鄰、多近鄰等)[15]、支持向量機(jī)(Support Vector Machine,SVM)[16]、稀疏表示分類(lèi)(Sparse Representation based Classification,SRC)[17]是現(xiàn)有SAR目標(biāo)識(shí)別方法運(yùn)用最為廣泛的分類(lèi)器。隨著近年來(lái)深度學(xué)習(xí)技術(shù)的迅猛發(fā)展,以卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)[18-20]為代表的深度學(xué)習(xí)模型已成為SAR目標(biāo)識(shí)別中的主流算法。
本文在現(xiàn)有研究的基礎(chǔ)上提出了結(jié)合深度學(xué)習(xí)模型和傳統(tǒng)分類(lèi)機(jī)制的SAR目標(biāo)識(shí)別方法。在特征學(xué)習(xí)階段采用深度殘差網(wǎng)絡(luò)(Deep Residual Networks,Res-Net)[21-22]進(jìn)行目標(biāo)多層次的特征圖學(xué)習(xí)。相比傳統(tǒng)的手工設(shè)計(jì)特征,基于Res-Net訓(xùn)練得到的特征圖具有描述能力更強(qiáng)的優(yōu)勢(shì),可為決策階段提供更充分的鑒別力信息??紤]到SAR目標(biāo)識(shí)別中廣泛存在擴(kuò)展操作條件(Extended Operating Condition,EOC),即測(cè)試樣本與訓(xùn)練樣本存在較大的差異,待識(shí)別樣本經(jīng)過(guò)Res-Net獲得的多層次特征圖中可能存在若干無(wú)效成分。剔除這些無(wú)效成分有利于提高識(shí)別算法的整體效率和精度。為此,本文采用結(jié)構(gòu)相似性準(zhǔn)則計(jì)算各個(gè)特征圖與原始樣本的相關(guān)性[23],并通過(guò)門(mén)限法提出低相似度的部分。對(duì)于判決保留的特征圖,基于聯(lián)合稀疏表示模型[11-12]進(jìn)行表征分類(lèi)。在實(shí)驗(yàn)中,基于MSTAR數(shù)據(jù)集設(shè)置標(biāo)準(zhǔn)操作條件(Standard Operating Condition,SOC)和擴(kuò)展操作條件對(duì)方法進(jìn)行測(cè)試驗(yàn)證,結(jié)果證實(shí)了其有效性和穩(wěn)健性。
Res-Net由Kaiming He提出并在多項(xiàng)圖像檢測(cè)、分割等大賽中得到了充分驗(yàn)證[21-22]。隨著網(wǎng)絡(luò)層數(shù)的不斷增加,其學(xué)習(xí)得到的特征愈加豐富,更能反映圖像中感興趣目標(biāo)的多方面特性,但同時(shí)也會(huì)導(dǎo)致嚴(yán)重的梯度消失問(wèn)題。為此,Res-Net提出殘差學(xué)習(xí)克服網(wǎng)絡(luò)優(yōu)化困難的問(wèn)題。假設(shè)H(x)表示最佳映射,利用堆疊的非線(xiàn)性層獲得新的映射F(x)=H(x)-x,進(jìn)而獲得當(dāng)前最佳映射F(x)=H(x)+x。F(x)+x可在前饋網(wǎng)絡(luò)增加“快捷連接”操作獲得。該操作具有高效穩(wěn)健的優(yōu)勢(shì),不會(huì)帶來(lái)額外的運(yùn)算復(fù)雜度。
現(xiàn)有研究成果已經(jīng)驗(yàn)證了Res-Net在圖像處理(如目標(biāo)檢測(cè)、識(shí)別)領(lǐng)域的有效性。為此,本文將其引入SAR目標(biāo)識(shí)別,主要用于多層次深度特征的學(xué)習(xí)和獲取。圖1顯示了本文應(yīng)用于SAR圖像特征學(xué)習(xí)的Res-Net結(jié)構(gòu),共包含20層。相比一般卷積神經(jīng)網(wǎng)絡(luò),Res-Net可實(shí)現(xiàn)輸入與后續(xù)非相鄰層的直接連接,從而最大程度減少信息丟失以及損耗等問(wèn)題。Res-Net簡(jiǎn)化了網(wǎng)絡(luò)學(xué)習(xí)的難度并提高了整體訓(xùn)練效率?;趫D1可學(xué)習(xí)獲得SAR圖像多層次的特征圖。這些深度特征可從不同側(cè)面反映圖像中目標(biāo)的各類(lèi)特性,可為目標(biāo)識(shí)別提供有效的鑒別力信息。
圖1 Res-Net結(jié)構(gòu)示意圖Fig.1 Architecture of designed Res-Net
基于Res-Net學(xué)習(xí)的SAR圖像多層次特征圖能夠從不同方面反映目標(biāo)的特性。然而,SAR目標(biāo)識(shí)別中存在多種擴(kuò)展操作條件,當(dāng)測(cè)試樣本與訓(xùn)練集差異較大時(shí),其學(xué)習(xí)的深度特征可能存在若干無(wú)效成分。為此,本文基于結(jié)構(gòu)相似性進(jìn)行有效深度特征的篩選,并用于后續(xù)的分類(lèi)決策[23]。
記參考圖像和輸入圖像分別為I1和I2,并具有相同尺寸。結(jié)構(gòu)相似性指數(shù)(SSIM)從亮度、對(duì)比度、結(jié)構(gòu)3個(gè)方面評(píng)價(jià)兩幅圖像的相關(guān)性[23],定義如下:
SSIM(I1,I2)=l(I1,I2)·c(I1,I2)·s(I1,I2),
(1)
式中,l(I1,I2),c(I1,I2),s(I1,I2)分別對(duì)應(yīng)亮度、對(duì)比度以及結(jié)構(gòu)比較函數(shù),定義如下:
(2)
(3)
(4)
式中,(μ1,σ1)、(μ2,σ2)分別為I1和I2均值和方差;σ12代表兩者之間的協(xié)方差;C1、C2和C3均為大于零的常數(shù)。
本文基于結(jié)構(gòu)相似性進(jìn)行Res-Net深度特征的篩選。分別計(jì)算各個(gè)層次的特征圖與輸入圖像的結(jié)構(gòu)相似性指數(shù)。對(duì)于相似性較高,認(rèn)為其能夠保持原始圖像的特性,予以保留并用于后續(xù)的分類(lèi);反之,則剔除。本文設(shè)置相似性門(mén)限T,對(duì)于結(jié)構(gòu)相似性大于門(mén)限的予以保留。
聯(lián)合稀疏表示模型是傳統(tǒng)SRC分類(lèi)器的拓展延伸,具備同時(shí)處理多個(gè)稀疏表示問(wèn)題的能力。假設(shè)經(jīng)過(guò)結(jié)構(gòu)相似性準(zhǔn)則篩選得到K個(gè)深度特征矢量,記為[y(1)y(2)…y(K)],采用稀疏表示對(duì)它們進(jìn)行表征的基礎(chǔ)模型如下:
y(k)=A(k)α(k)+ε(k)(k=1,2,…,K),
(5)
式中,A(k)為對(duì)應(yīng)k深度特征的全局字典,通過(guò)對(duì)所有訓(xùn)練樣本的處理獲得;α(k)為系數(shù)矢量。
聯(lián)合稀疏表示框架下,采用式(6)對(duì)K個(gè)稀疏表示問(wèn)題進(jìn)行統(tǒng)一考察:
(6)
式中,β=[α(1)α(2)…α(K)]。
不足的是,式(6)的優(yōu)化過(guò)程并沒(méi)有體現(xiàn)同一SAR圖像不同層次深度特征之間的關(guān)聯(lián),影響系數(shù)矢量的求解精度,經(jīng)典的聯(lián)合稀疏表示模型調(diào)整優(yōu)化目標(biāo)函數(shù)如下:
(7)
在l1/l2范數(shù)的約束下,式(7)中的矩陣β各列中的系數(shù)矢量?jī)A向相同的分布規(guī)律,體現(xiàn)不同深度特征的內(nèi)在關(guān)聯(lián)。針對(duì)上述問(wèn)題,較為成熟的求解算法包括多任務(wù)貝葉斯壓縮感知、同時(shí)正交匹配追蹤等。根據(jù)求解結(jié)果,按照式(10)計(jì)算不同訓(xùn)練類(lèi)別對(duì)測(cè)試樣本(相應(yīng)的深度特征矢量)的重構(gòu)誤差并判定其類(lèi)別。
(8)
根據(jù)前文論述,構(gòu)設(shè)如圖2所示的方法流程,描述本文方法的主要步驟。首先,采用所有訓(xùn)練樣本對(duì)圖1所示的Res-Net進(jìn)行訓(xùn)練,獲得可用于特征學(xué)習(xí)的模型。對(duì)于測(cè)試樣本,將其輸入訓(xùn)練后的Res-Net獲得多層次深度特征,進(jìn)而根據(jù)結(jié)構(gòu)相似性準(zhǔn)則選取若干高鑒別力深度特征(結(jié)構(gòu)相似性門(mén)限T設(shè)置為0.6)。此時(shí),對(duì)訓(xùn)練樣本的深度特征進(jìn)行對(duì)應(yīng)成分選取并分別構(gòu)建全局字典。最終,在聯(lián)合稀疏表示模型的處理下,獲得各個(gè)訓(xùn)練樣本對(duì)于測(cè)試樣本的重構(gòu)誤差,進(jìn)而獲得目標(biāo)類(lèi)別。
圖2 基于結(jié)構(gòu)相似性的深度特征篩選及SAR目標(biāo)識(shí)別流程圖Fig.2 Flowchart of SAR target recognition based on selected deep features by structural similarity
實(shí)驗(yàn)中以MSTAR公開(kāi)數(shù)據(jù)集為基礎(chǔ),構(gòu)設(shè)典型測(cè)試場(chǎng)景對(duì)所提方法進(jìn)行測(cè)試。該數(shù)據(jù)集包含外形尺寸相近的10類(lèi)目標(biāo)(圖3)不同條件下獲取的數(shù)千幅SAR圖像。據(jù)此,可設(shè)置訓(xùn)練和測(cè)試樣本開(kāi)展訓(xùn)練和分類(lèi)。表1給出了基于MSTAR數(shù)據(jù)集設(shè)置的一種代表性測(cè)試場(chǎng)景,常視為標(biāo)準(zhǔn)操作條件。其中囊括了全部10類(lèi)目標(biāo),訓(xùn)練樣本俯仰角為17°,訓(xùn)練樣本俯仰角為15°。除此之外,還可設(shè)置擴(kuò)展操作條件對(duì)方法的穩(wěn)健性進(jìn)行考察,包括后續(xù)實(shí)驗(yàn)中的俯仰角差異(測(cè)試場(chǎng)景2)和噪聲干擾(測(cè)試場(chǎng)景3)。
實(shí)驗(yàn)過(guò)程中,選用當(dāng)前文獻(xiàn)中較為常見(jiàn)的幾類(lèi)方法進(jìn)行比較,包括SVM[16]、SRC[17]、A-ConvNet[18]以及Res-Net(直接用于分類(lèi),不經(jīng)過(guò)特征選取和聯(lián)合表征)。這幾類(lèi)方法主要是采用了不同的分類(lèi)機(jī)制,其中A-ConvNet和Res-Net采用CNN作為基礎(chǔ)分類(lèi)器,但在網(wǎng)絡(luò)結(jié)構(gòu)上有所區(qū)別。與Res-Net方法比較,本文主要是在特征學(xué)習(xí)之后進(jìn)行了篩選,并利用聯(lián)合稀疏表示進(jìn)行最終分類(lèi)。為定量對(duì)比不同方法的性能,本文定義平均識(shí)別率如下:
(9)
式中,Nc和Nt分別表示正確分類(lèi)以及全部測(cè)試樣本數(shù)目。
圖3 MSTAR目標(biāo)示意圖Fig.3 Illustration of MSTAR targets
表1 場(chǎng)景1~10類(lèi)目標(biāo)標(biāo)準(zhǔn)操作條件Tab.1 Scenario 1 ~ 10 targets under SOC
基于表1中的測(cè)試和訓(xùn)練樣本對(duì)所提方法在標(biāo)準(zhǔn)操作條件下進(jìn)行測(cè)試。圖4顯示了所提方法對(duì)10類(lèi)目標(biāo)的混淆矩陣,其中縱坐標(biāo)為樣本的實(shí)際類(lèi)別,其與橫坐標(biāo)對(duì)應(yīng)類(lèi)別的元素對(duì)應(yīng)分類(lèi)精度。因此,圖4中的對(duì)角線(xiàn)元素反映了不同類(lèi)別的正確識(shí)別率,按照式(9)計(jì)算得到10類(lèi)目標(biāo)的平均識(shí)別率為99.02%,表明了方法的有效性。表2為所有方法在當(dāng)前場(chǎng)景下的結(jié)果統(tǒng)計(jì)。4類(lèi)對(duì)比方法的平均識(shí)別率依次為98.16%(SVM)、98.32%(SRC)、98.78%(A-ConvNet)和98.80%(Res-Net),均低于所提方法。特別地,與兩類(lèi)基于CNN的方法相比,本文通過(guò)有效選取Res-Net多層次深度特征并利用聯(lián)合稀疏表示進(jìn)行分類(lèi),進(jìn)一步提升了最終性能。表2同時(shí)對(duì)比了各類(lèi)方法的時(shí)間消耗。SVM和SRC由于分類(lèi)器相對(duì)簡(jiǎn)單,其效率處于優(yōu)勢(shì)水平。與直接運(yùn)用Res-Net的方法相比,本文由于進(jìn)一步引入了深度特征構(gòu)造和聯(lián)合稀疏表示,增加了時(shí)間消耗。
圖4 場(chǎng)景1下所提方法對(duì)各類(lèi)別識(shí)別結(jié)果Fig.4 Recognition results of each class by the proposed method under scenario 1
表2 場(chǎng)景1下結(jié)果統(tǒng)計(jì)Tab.2 Results under scenario 1
在測(cè)試場(chǎng)景1時(shí),設(shè)置的測(cè)試與訓(xùn)練集俯仰角十分接近。實(shí)際過(guò)程中,SAR傳感器可能工作在不同的高度,這導(dǎo)致待識(shí)別樣本可能來(lái)自于訓(xùn)練樣本差異較大的俯仰角?;贛STAR數(shù)據(jù)集的SAR圖像樣本,本實(shí)驗(yàn)設(shè)置如表3所示的測(cè)試場(chǎng)景,包含3類(lèi)目標(biāo)。其中,訓(xùn)練樣本均為17°俯仰角下的SAR圖像;測(cè)試樣本區(qū)分30°和45°兩個(gè)子集。圖5統(tǒng)計(jì)了各類(lèi)方法對(duì)兩個(gè)子集樣本的平均識(shí)別率。對(duì)比而言,在45°俯仰角時(shí),因測(cè)試樣本與訓(xùn)練樣本差異過(guò)大,導(dǎo)致各性能顯著降低。分別比較兩個(gè)角度下的結(jié)果,可驗(yàn)證所提方法的識(shí)別最高,穩(wěn)健性最強(qiáng)。本文采用結(jié)構(gòu)相似性選擇有效選取了對(duì)于適宜當(dāng)前測(cè)試條件的深度特征,通過(guò)聯(lián)合稀疏表示得到的識(shí)別結(jié)果更為可靠,對(duì)于俯仰角差異的穩(wěn)健性更強(qiáng)。
表3 場(chǎng)景2—俯仰角差異Tab.3 Scenario 2 — depression angle variance
圖5 場(chǎng)景2下的結(jié)果統(tǒng)計(jì)Fig.5 Results under scenario 2
雷達(dá)成像過(guò)程中,可能受到自然或人為的干擾,導(dǎo)致最終獲得的圖像信噪比(Signal-to-Noise Ratio,SNR)降低。此時(shí),正確識(shí)別目標(biāo)類(lèi)別的難度大大加劇。MSTAR數(shù)據(jù)集中原始SAR圖像均來(lái)自合作測(cè)試條件,信噪比相對(duì)較高,且保持在相近水平。為測(cè)試所提方法對(duì)于噪聲干擾的有效性,本實(shí)驗(yàn)對(duì)表1中的測(cè)試樣本按照文獻(xiàn)[13]的策略條件不同程度的噪聲,進(jìn)而測(cè)試方法在不同信噪比下的平均識(shí)別率,并將此條件記為“測(cè)試場(chǎng)景3”。如圖6所示,所提方法在-10,-5,0,5,10共5個(gè)噪聲水平下均保持最高的識(shí)別率,顯示其噪聲穩(wěn)健性。與SVM、A-ConvNet和Res-Net方法相比,SRC方法在低于0 dB的噪聲水平時(shí)性能更優(yōu),表明稀疏表示機(jī)制對(duì)于噪聲為適應(yīng)性。本文通過(guò)有效的特征篩選并結(jié)合聯(lián)合稀疏表示對(duì)于噪聲干擾的適應(yīng)性進(jìn)一步提升了方法的整體性能。
圖6 場(chǎng)景3下的結(jié)果統(tǒng)計(jì)Fig.6 Results under scenario 3
本文基于Res-Net和聯(lián)合稀疏表示設(shè)計(jì)SAR圖像目標(biāo)識(shí)別方法。對(duì)于測(cè)試樣本,采用Res-Net選取其多層次深度特征,并基于結(jié)構(gòu)相似性準(zhǔn)則選取其中的高鑒別力成分。通過(guò)聯(lián)合稀疏表示進(jìn)行表征及分類(lèi)。實(shí)驗(yàn)在MSTAR數(shù)據(jù)集上設(shè)置并開(kāi)展,綜合分析識(shí)別效率、識(shí)別精度和識(shí)別穩(wěn)健性,結(jié)果證明了所提方法的有效性。后續(xù)研究中,本文將從Res-Net的結(jié)構(gòu)優(yōu)化以及深度特征的選取策略方面進(jìn)一步深化成果。