李廣帥,蘇娟,李義紅
(火箭軍工程大學(xué) 核工程學(xué)院,西安710025)
合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)與光學(xué)和紅外等被動式傳感器相比,具有全天時、全天候、高分辨率的獨特優(yōu)勢,在戰(zhàn)場態(tài)勢感知、典型目標(biāo)識別和精確制導(dǎo)等軍事領(lǐng)域具有突出的戰(zhàn)略意義。飛機作為一種典型的人造目標(biāo),軍事價值極其重要,高效、準(zhǔn)確獲取機場、空域等位置的飛機目標(biāo)信息,對實時獲取戰(zhàn)場軍事情報、制定作戰(zhàn)計劃具有重要意義。
恒虛警率(Constant False Alarm Rate,CFAR)檢測器是傳統(tǒng)SAR圖像目標(biāo)檢測最常用的檢測算法[1],基于像素級水平進(jìn)行檢測,并衍生出多種改進(jìn)算法,如平均CFAR算法[2]、雙參數(shù)CFAR算法[3]等。文獻(xiàn)[4]提出一種基于級聯(lián)CFAR的檢測算法,可快速實現(xiàn)對SAR目標(biāo)的檢測,以滿足實時要求。文獻(xiàn)[5]提出了一種基于可變窗的CFAR算法,采用多尺度局部對比度和可變窗以實現(xiàn)對SAR目標(biāo)的精確檢測。此外,還有基于注意模型的檢測算法等。文獻(xiàn)[6]提出了一種基于視覺注意和學(xué)習(xí)策略的SAR圖像目標(biāo)檢測算法,文獻(xiàn)[7]提出了一種基于多尺度顯著性特征的SAR目標(biāo)檢測算法。傳統(tǒng)的檢測算法能夠自適應(yīng)閾值,為飛機檢測提供了較好的思路,缺點是僅利用像素級對比度進(jìn)行檢測,難以適應(yīng)復(fù)雜背景下檢測要求,容易造成虛警,影響檢測結(jié)果。
深度學(xué)習(xí)具有強大的視覺目標(biāo)檢測能力,基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的目標(biāo)檢測算法成為了當(dāng)前主流算法[8]。典型檢測算法有單階段檢測算法SSD[9](Single ShotmultiBox Detector)、YOLO[10](You Only Look Once)、YOLOv2[11]、YOLOv3[12]等,以及雙階段檢測算法R-CNN[13](Region-Convolutional Neural Network)、Fast R-CNN[14]、Faster RCNN[15]等。目前,基于深度學(xué)習(xí)進(jìn)行飛機目標(biāo)檢測的算法大多應(yīng)用于可見光圖像。文獻(xiàn)[16]提出了一種基于Faster R-CNN模型的遙感圖像飛機目標(biāo)檢測,采用遷移學(xué)習(xí)方法進(jìn)行訓(xùn)練,使得查全率達(dá)到95%以上,但對于一些小而聚集、輪廓相似目標(biāo)易出現(xiàn)漏警、虛警現(xiàn)象。文獻(xiàn)[17]提出了一種級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于遙感影像飛機目標(biāo)檢測,先利用小尺度淺層全卷積神經(jīng)網(wǎng)絡(luò)快速獲取飛機興趣區(qū)域,再利用深層的卷積神經(jīng)網(wǎng)絡(luò)對目標(biāo)進(jìn)行更精確的檢測,但該算法對于部分小目標(biāo)仍然無法有效檢測。文獻(xiàn)[18]提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的高分辨率SAR圖像飛機目標(biāo)檢測算法,利用改進(jìn)的顯著性預(yù)檢測快速粗定位飛機目標(biāo),基于LeNet-5[19]網(wǎng)絡(luò)對目標(biāo)進(jìn)行精確檢測,利用數(shù)據(jù)增強擴大數(shù)據(jù)集,最終取得了96.36%的檢測正確率。由于數(shù)據(jù)增強采用有監(jiān)督方法,難以適應(yīng)不同任務(wù)的差異性,并且LeNet-5網(wǎng)絡(luò)較淺,對于SAR圖像深層次語義特征表征不夠。本文將深度學(xué)習(xí)檢測算法引入SAR圖像飛機檢測,直接遷移應(yīng)用Faster R-CNN算法進(jìn)行檢測時發(fā)現(xiàn),對于機場周圍小像素飛機目標(biāo)易出現(xiàn)漏警,對車輛、建筑物等人造目標(biāo)易出現(xiàn)虛警。針對該問題及SAR圖像飛機目標(biāo)的特點,本文對Faster R-CNN算法進(jìn)行適應(yīng)性改進(jìn),主要包括淺層特征增強結(jié)構(gòu)、上下文信息融合、重設(shè)預(yù)設(shè)錨點框和引入RoI Align單元。此外,本文針對SAR圖像飛機目標(biāo)數(shù)據(jù)匱乏問題,構(gòu)建了一個用于SAR圖像飛機目標(biāo)檢測的數(shù)據(jù)集(SAR Aircraft Dataset,SAD),對算法進(jìn)行驗證。
Ren等[15]在2015年提出了Faster R-CNN算法,最大的創(chuàng)新是提出了區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network,RPN),通過共享卷積層將RPN網(wǎng)絡(luò)和Fast R-CNN統(tǒng)一至一個網(wǎng)絡(luò)中,解決了RCNN、Fast R-CNN算法中候選框生成耗時問題,極大地提高了雙階段檢測算法的效率。
R-CNN的基本網(wǎng)絡(luò)框架如圖1所示,主要由卷積層單元、RPN單元、RoI池化單元及分類和回歸單元4部分組成。
1)卷積層單元。利用一系列的卷積、激活和池化層基礎(chǔ)組合,提取圖像特征圖(Feature Map),RPN層和Fast R-CNN模塊共享該單元生成的權(quán)值參數(shù)。
2)RPN單元。通過在特征圖上滑動窗口產(chǎn)生候選框,設(shè)置尺寸為8、16、32,比例為1∶2、1∶1、2∶1,共組合為9種錨點框(Anchor Boxes),錨點框示意圖如圖2所示,為特征圖上每個像素提供基礎(chǔ)候選框,通過對候選框和真實標(biāo)注框回歸得到目標(biāo)候選框。設(shè)置IOU閾值篩選標(biāo)定正例、負(fù)例錨點框,采用非極大值抑制(Non-Maximum Suppression,NMS)及Top-N分析法篩選出N個目標(biāo)候選框。
圖1 Faster R-CNN檢測流程Fig.1 Faster R-CNN detection flowchart
圖2 錨點框示意圖Fig.2 Schematic diagram of anchor box
3)RoI池化單元。將每個候選框均勻分成m×n塊,對每塊進(jìn)行最大值池化(Max Pooling),將不同大小的輸入映射到一個固定尺度的特征向量,使得輸入圖片不要求固定尺寸。
4)分類和回歸單元。用于判斷目標(biāo)候選框的類別并預(yù)測其準(zhǔn)確位置。
Faster R-CNN網(wǎng)絡(luò)采用多任務(wù)損失,對一個圖像的損失函數(shù)定義為
式中:λ為損失權(quán)重因子;L為總損失函數(shù);Lcls表示分類損失函數(shù),即目標(biāo)或者非目標(biāo)的對數(shù)損失;Ncls為分類損失歸一化權(quán)值;Lreg為回歸損失函數(shù);Nreg為回歸損失歸一化權(quán)值;pi表示第i個邊框是前景的概率;為1或0(邊框為正樣本時=1,為負(fù)樣本時=0);ti和分別表示預(yù)測框和真實框的坐標(biāo);R為smoothL1(x)函數(shù)。
Faster R-CNN算法在VOC數(shù)據(jù)集上檢測效果較好,達(dá)到78.8%的檢測率。經(jīng)實驗驗證,直接將Faster R-CNN算法應(yīng)用于SAR圖像飛機目標(biāo)檢測中,效果不佳,原因在于:①Faster R-CNN算法僅使用最深層特征圖提取特征進(jìn)行檢測,而SAR圖像成像原理與可見光不同,SAR圖像飛機目標(biāo)背景相對簡單,深層特征表達(dá)的語義信息沒有可見光豐富,使得檢測效果不佳;②SAR圖像飛機目標(biāo)多樣化,飛機目標(biāo)尺寸與VOC數(shù)據(jù)有所差異,使得錨點框設(shè)定難以適應(yīng)飛機目標(biāo),造成漏檢問題;③SAR圖像中,機場周圍存在車輛、建筑物等人造目標(biāo),表現(xiàn)為強散射,對飛機目標(biāo)檢測容易造成誤檢,飛機目標(biāo)成像效果較差時,易造成漏檢問題;④RoI池化單元2次進(jìn)行池化量化時,將浮點數(shù)取整,造成特征圖像素映射偏差,影響后面的回歸定位效果。針對以上問題,本文采取以下方法進(jìn)行改進(jìn):①引用殘差網(wǎng)絡(luò)ResNet101作為特征提取網(wǎng)絡(luò),搭建更深網(wǎng)絡(luò)層增強特征提取能力,同時在檢測中引用多層(Layer2、Layer5)特征信息;②利用改進(jìn)k-means算法對數(shù)據(jù)集中SAR圖像飛機目標(biāo)進(jìn)行聚類分析,重新設(shè)計錨點框尺寸,以更好地適應(yīng)SAR圖像飛機尺寸;③利用多支路、多卷積核尺寸對淺層(Layer2)進(jìn)行增強,同時對Layer5信息進(jìn)行上采樣,以擴大感受野,融合更多上下文信息,增強對小目標(biāo)的檢測效果;④使用RoIAlign單元,利用插值方法保留浮點數(shù)以提高檢測精度。
與傳統(tǒng)的監(jiān)督式機器學(xué)習(xí)算法相比,深度卷積神經(jīng)網(wǎng)絡(luò)計算資源耗費大,從頭開始訓(xùn)練是最理想的網(wǎng)絡(luò)訓(xùn)練方式,但是由于SAR圖像數(shù)據(jù)集難以獲取且數(shù)量較小,從頭開始訓(xùn)練容易造成過擬合,陷入局部最優(yōu)解,并且耗時、計算成本高。本文應(yīng)用遷移學(xué)習(xí)的方法,引用ImageNet上訓(xùn)練好的殘差網(wǎng)絡(luò)ResNet101來替代VGG16網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò),去除Layer5后面的全連接(FC)層和分類層。網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
相比于VGG16網(wǎng)絡(luò),ResNet101采用bottleneck結(jié)構(gòu)搭建更深的網(wǎng)絡(luò)層,bottleneck結(jié)構(gòu)示意圖如圖4所示。增強學(xué)習(xí)能力,同時利用1×1的卷積減少通道數(shù)以降低計算量,采用恒等快捷連接(Identity Shortcut Connection)實現(xiàn)跳層連接,加快收斂速度,使得網(wǎng)絡(luò)模型更容易優(yōu)化。
圖3 VGG16、ResNet101結(jié)構(gòu)示意圖Fig.3 Schematic diagram of VGG16 and ResNet101 structure
圖4 bottleneck結(jié)構(gòu)示意圖Fig.4 Schematic diagram of bottleneck structure
此外,ResNet101在卷積層后會添加一個BN[20]層,對每層輸入先做歸一化處理(歸一化至均值為0、方差為1的正態(tài)分布),使得分布均勻,可以加快收斂,以提高訓(xùn)練階段的效率。歸一化公式如下。
每層d維輸入:
歸一化每一維:
式中:E[*]為期望運算;Var[*]為方差運算。
Faster R-CNN算法直接應(yīng)用于SAR圖像飛機目標(biāo)檢測,檢測效果不佳,特別是對SAR圖像中像素占比小的飛機目標(biāo),經(jīng)4次下采樣后,原圖16×16的區(qū)域范圍在特征圖中僅映射為1×1像素點,漏檢問題較嚴(yán)重。SAR圖像中,飛機目標(biāo)不像車輛、艦船、坦克等人造目標(biāo),外形輪廓較為簡單、規(guī)律,飛機目標(biāo)種類繁多且外形輪廓較為復(fù)雜,姿態(tài)敏感性較高,再加上背景復(fù)雜且其他人造目標(biāo)的干擾,導(dǎo)致誤檢問題突出。Faster R-CNN算法為了節(jié)省運算量、提高檢測效率,僅利用最深層特征圖進(jìn)行檢測。最深層特征圖語義信息較為豐富,能更好地反映圖像全局化的特征,但是空間分辨率低;而低層的特征圖,能更好地表達(dá)淺層特征,如輪廓、邊緣等,且空間分辨率高,所包含的位置信息更為豐富,利于對小目標(biāo)的定位與檢測。通過上述分析,本文提出一種基于Faster R-CNN的淺層特征增強與上下文信息融合的檢測算法,為兼顧檢測速度,采用單尺度檢測,檢測框架流程如圖5所示。
ResNet101網(wǎng)絡(luò)通過增加網(wǎng)絡(luò)層深以挖掘圖像深層語義特征,同時利用殘差塊以減少層深帶來的計算量負(fù)擔(dān)。與可見光圖像相比,SAR圖像背景相對簡單,深層信息不如可見光圖像豐富,通過增加網(wǎng)絡(luò)層深帶來的收益不大。為此,本文借鑒inception模塊思想,引入淺層特征增強結(jié)構(gòu),通過拓展網(wǎng)絡(luò)寬度,利用多路不同尺度卷積核(1×1、3×3、5×5)對Layer2輸出進(jìn)行卷積,以獲取不同感受野,增強對弱小飛機目標(biāo)的特征表達(dá),利用1×1卷積將多路特征進(jìn)行聚合,同時引入BN處理,使數(shù)據(jù)規(guī)范到N(0,1)的正態(tài)分布,能夠加快訓(xùn)練速度并提高網(wǎng)絡(luò)的泛化能力。Layer4輸出相比Layer2要多經(jīng)過27×(4+23)層殘差塊,會挖掘更深層次的語義信息,但會丟失更多的低層特征和位置信息,Layer2經(jīng)過卷積層數(shù)減少,可以保留更多的位置信息,并經(jīng)過淺層特征增強模塊,利用2個3×3卷積核,設(shè)置滑動步長stride=2以實現(xiàn)下采樣,輸出特征圖大小為38×57。下采樣后經(jīng)過3×3卷積,以消除混疊效應(yīng),得到特征圖F4。
Layer5中有4個殘差塊,并下采樣2倍,輸出的特征圖為原始圖像的1/32,相比于Layer4的輸出F1,有著更大的感受野。感受野越大,映射到原圖的視野越廣,可以引入更豐富的上下文信息。利用雙線性插值法進(jìn)行上采樣得到特征圖F2,其大小恢復(fù)至57×38,以實現(xiàn)與Layer4的輸出F1進(jìn)行特征融合,并經(jīng)過3×3卷積,以消除混疊效應(yīng)得到特征圖F3。將F3和F4進(jìn)行融合,得到最終的特征圖,輸入至RPN網(wǎng)絡(luò)和RoIA lign單元中,實現(xiàn)后續(xù)的分類與回歸任務(wù)。
圖5 改進(jìn)的Faster R-CNN結(jié)構(gòu)Fig.5 Structure of improved Faster R-CNN
此外,F(xiàn)aster R-CNN網(wǎng)絡(luò)對輸入圖片的要求為:限制最小邊大于600像素,最大邊小于1 000像素,即
式中:w和h分別為圖像的寬度和高度。本文網(wǎng)絡(luò)輸入圖像的尺寸為900×600。
VOC數(shù)據(jù)集中,目標(biāo)尺寸較大且種類豐富,F(xiàn)aster R-CNN算法采用3種尺度(8,16,32)和3種長寬比(1∶2,1∶1,2∶1)共9種錨點框。SAD數(shù)據(jù)集中飛機目標(biāo)尺寸相比較小,且長寬比近似為1∶1,直接遷移應(yīng)用原始預(yù)設(shè)錨點框,覆蓋飛機目標(biāo)的效果不佳,且人工設(shè)計預(yù)設(shè)錨點框,需要進(jìn)行大量實驗進(jìn)行驗證,并且設(shè)計不合理對檢測結(jié)果會造成一定影響。
本文采用改進(jìn)k-means算法,以交并比為距離度量對數(shù)據(jù)集中飛機目標(biāo)聚類,根據(jù)聚類結(jié)果重新設(shè)定anchor,以改進(jìn)預(yù)設(shè)錨點框大小,使之更適應(yīng)飛機目標(biāo)尺寸。距離度量公式如下:
式中:D(b,c)為預(yù)測框b和聚類中心c之間的距離;bp為預(yù)測框;bg為實際框。使用D(b,c)=1-IOU(b,c)作為度量,保證預(yù)設(shè)錨點框到聚類中心的距離越小,且IOU值越大。
針對SAR圖像飛機目標(biāo)形狀特點,聚類中心設(shè)置為9,通過15次聚類分析,取得平均聚類結(jié)果為:{(42,36),(48,54),(63,72),(70,48),(96,75),(101,102),(129,120),(168,141),(228,210)}。2種預(yù)設(shè)錨點框示意圖如圖6所示。對比圖6(a)和圖6(b)可知,聚類得到的預(yù)設(shè)錨點框更能適應(yīng)飛機目標(biāo)尺寸。此外,該方法去除人工設(shè)計預(yù)設(shè)錨點框的復(fù)雜環(huán)節(jié),一定程度上減輕了人工設(shè)計不合理對檢測結(jié)果造成的影響。
圖6 預(yù)設(shè)錨點框范圍示例Fig.6 Example range of preset anchor box
Faster R-CNN中使用RoI池化層使得生成的候選框映射產(chǎn)生固定尺寸的特征圖,故Faster RCNN對輸入圖像不再要求是固定尺寸。使用VGG16網(wǎng)絡(luò)進(jìn)行特征提取時,會進(jìn)行4次最大值池化,使得特征圖尺寸縮小16倍,在特征圖上進(jìn)行平均值池化,輸出尺寸均為7×7。RoI池化層經(jīng)過2次浮點數(shù)取整量化,會使得特征圖上映射的區(qū)域建議框產(chǎn)生偏差,引起的“不匹配問題”會造成精度損失,這種像素偏差會使得后續(xù)回歸定位的準(zhǔn)確性下降。
針對上述問題,本文采用Mask R-CNN[21]算法中提出的思想,引入RoI Align方法進(jìn)行池化,改進(jìn)RoI池化層帶來的量化偏差,利用雙線性插值法進(jìn)行插值,保留浮點數(shù),避免取整帶來的精度損失,以提高空間對稱性(Alignment),故取名為“RoIAlign”。RoI池化、RoI Align結(jié)構(gòu)示意圖如圖7所示,兩者具體實現(xiàn)過程如下:
1)第1次量化。假設(shè)SAR圖像中目標(biāo)尺寸為300×280,經(jīng)過特征提取網(wǎng)絡(luò)后,區(qū)域建議框變?yōu)樵瓐D的1/16,大小為18.75×17.5。ROI Align第1次量化(保留浮點數(shù))后,區(qū)域建議框尺寸變?yōu)?8.75×17.5,而RoI池化第1次量化(取整)后尺寸變?yōu)?8×17。
2)第2次量化。區(qū)域建議框經(jīng)過池化固定為7×7尺寸,將區(qū)域建議框劃分為49(7×7)個等子區(qū)域,RoIAlign第2次量化(保留浮點數(shù))每個子區(qū)域取2.68×2.5(18.75/7=2.68、17.5/7=2.5);RoI池化第2次量化(取整)子區(qū)域取2×2(18/7=2.57≈2、17/7=2.43≈2)。
圖7 RoI池化、RoIAlign示意圖Fig.7 Schematic diagram of RoIPooling and RoIAlign
3)最大值池化。每個子區(qū)域取最大值作為該區(qū)域的“代表”值,輸出的49個值組成7×7大小的特征圖。
由上可知,RoI池化經(jīng)過2次取整量化,原本在特征圖上映射的18×17大小的區(qū)域建議框,偏差為14×14大小,產(chǎn)生的像素偏差對后續(xù)的回歸定位會產(chǎn)生影響。RoI池化利用插值法保留浮點數(shù),有效解決了像素映射偏差帶來的定位誤差問題。
實驗使用的操作系統(tǒng):Ubuntu 16.04 LTS,使用CUDA8.0和cuDNN5.0加速訓(xùn)練;使用的GPU:NVIDIA TITAN Xp GPU(12 GB顯存);使用的編程語言:Python語言和C語言;使用的網(wǎng)絡(luò)開發(fā)框架:Pytorch;使用的處理器:inter?CoreTM7-6850K CPU@3.60GHz×12;Faster R-CNN框架鏈接:https://github.com/jwyang/faster-rcnn.pytorch。
本文按照VOC數(shù)據(jù)集格式制作了一個用于SAR圖像飛機目標(biāo)檢測的數(shù)據(jù)集SAD,數(shù)據(jù)集中共647幅圖片,包含多類型、多尺寸的飛機目標(biāo)2 294個。SAR圖像數(shù)據(jù)來源為高分三號衛(wèi)星、TerraSAR-X衛(wèi)星、機載SAR 等,圖像分辨率從0.5m到3m不等。
VOC數(shù)據(jù)集中含圖像9 963幅,共20類目標(biāo),各類目標(biāo)包含圖像數(shù)如圖8所示。VOC數(shù)據(jù)集中20類目標(biāo)中有15類目標(biāo)圖像數(shù)量小于647幅,因此只有一類目標(biāo)的SAD數(shù)據(jù)集滿足SAR飛機目標(biāo)檢測算法性能的檢測要求。
圖8 VOC數(shù)據(jù)集中各目標(biāo)圖像數(shù)量Fig.8 Number of various target images of VOC dataset
SAD數(shù)據(jù)集中飛機目標(biāo)信息統(tǒng)計直方圖如圖9所示。每幅圖像所含飛機數(shù)量的統(tǒng)計直方圖如圖9(a)所示,各飛機與全圖像素占比的統(tǒng)計直方圖如圖9(b)所示。每幅圖像平均包含3.5架飛機目標(biāo),且飛機像素占比大多數(shù)在0.05以下,飛機目標(biāo)較小,一定程度上增加檢測任務(wù)的難度。SAD數(shù)據(jù)集中飛機目標(biāo)寬度、高度、標(biāo)注框面積及其占比的統(tǒng)計參數(shù)如表1所示。
圖9 飛機目標(biāo)信息統(tǒng)計直方圖Fig.9 Statistical histogram of aircraft target information
表1 飛機目標(biāo)統(tǒng)計參數(shù)Table 1 Statistical param eters of aircraft target
圖10 SAD數(shù)據(jù)集中部分SAR飛機圖像Fig.10 Some SAR aircraft images in SAD dataset
圖10為SAD數(shù)據(jù)集中幾種典型場景的飛機目標(biāo),包含密集型飛機目標(biāo)與稀疏型飛機目標(biāo),且飛機類型不一、尺寸和朝向多樣。每幅圖片裁成900×600的尺寸,并使用開源軟件“LabelImg”對飛機目標(biāo)進(jìn)行標(biāo)注,采用“留出法”將SAD數(shù)據(jù)集劃分為互斥的訓(xùn)練集S和測試集T,并按照8∶2的比例劃分訓(xùn)練集和測試集。
訓(xùn)練參數(shù)設(shè)置:使用在ImageNet數(shù)據(jù)集上預(yù)先訓(xùn)練好的ResNet101模型,訓(xùn)練的batch_size取1,初始學(xué)習(xí)率(Lnitial Learning Rate)取0.001,權(quán)重衰減系數(shù)(Weight Decay)取0.000 5,訓(xùn)練代數(shù)epoch取300,參數(shù)更新方法采用梯度下降法(Stochastic Gradient Descent,SGD),動量因子(Momentum)設(shè)為0.9,利用平移、旋轉(zhuǎn)、縮放方法將訓(xùn)練樣本擴充至1 169幅。
使用平均檢測精度(AP)、每秒處理圖像的幀數(shù)即檢測速度、準(zhǔn)確率-召回率(Precision-Recall,PR)曲線作為評價指標(biāo)。平均檢測精度的定義為
式中:AP為平均檢測精度;R為召回率;P為準(zhǔn)確率。
召回率和準(zhǔn)確率的定義如下:
式中:TP代表預(yù)測為正的正樣本;FN代表預(yù)測為負(fù)的正樣本;FP代表預(yù)測為正的負(fù)樣本。
利用構(gòu)建的SAD數(shù)據(jù)集,驗證本文提出的改進(jìn)Faster R-CNN算法對SAR圖像飛機目標(biāo)的檢測性能。從表2可以看出,本文算法的平均檢測精度相比于前3種算法,本文算法的平均檢測精度最高,達(dá)到了88.5%,召回率由78.1%提升至89.5%,準(zhǔn)確率由77.0%提升至85.9%,檢測速度相比于其他算法有所降低,主要原因是本文算法在殘差網(wǎng)絡(luò)Layer2后添加了多支路特征增強結(jié)構(gòu),并增加了上下文信息的利用,導(dǎo)致計算量增加。
表2 實驗結(jié)果對比Table 2 Com parison of experim ental results
由圖11可知,本文算法的P-R曲線位置最高,且下降最為緩慢,相比于另外3種算法,在保持相同召回率的同時,能夠保持較高的檢測精度,表明淺層特征增強模塊和上下文信息融合對提高檢測精度有積極作用。本文算法的P-R曲線與兩坐標(biāo)軸包圍的面積更大,證明了算法對SAR圖像飛機目標(biāo)的檢測性能更好。
圖11 不同算法P-R曲線比較Fig.11 P-R curves comparison among different algorithms
圖12為SAD數(shù)據(jù)集部分檢測結(jié)果對比。為方便對比檢測結(jié)果,用不同顏色框進(jìn)行區(qū)分:綠色和黃色框為算法檢測結(jié)果,黃色為虛警框,藍(lán)色為漏警框。
圖12中,(1)為飛機目標(biāo)成像效果較差的情形,飛機區(qū)域亮度顯示微弱,容易造成漏檢。圖12(b)的(1)中,右側(cè)2架飛機誤檢測為1架飛機,圖12(c)的(1)、圖12(d)的(1)中,對中間的飛機均造成了漏檢,本文算法實現(xiàn)了對3架飛機的檢測。(2)為單一建筑物干擾情形,建筑頂部材料形成強散射,對飛機目標(biāo)的檢測造成干擾,前3種算法對2架飛機均造成了漏檢,本文算法對淺層特征進(jìn)行增強,實現(xiàn)了較好的檢測。(3)為復(fù)雜建筑物干擾情形。在圖12(b)的(3)中,以VGG16為特征提取網(wǎng)絡(luò),層深較淺,特征挖掘不足,對最上方和最下方飛機目標(biāo)造成漏檢(藍(lán)色框),并出現(xiàn)一處誤檢(黃色框);圖12(c)的(3)中,采用ResNet101網(wǎng)絡(luò)提取特征,更深的網(wǎng)絡(luò)有利于提出圖像深層次語義信息,故將5架飛機全部檢測出,但造成了4處誤檢(黃色框);圖12(d)的(3)中,通過聚類分析訓(xùn)練集中飛機目標(biāo)的尺寸后,對預(yù)設(shè)錨點框進(jìn)行設(shè)置,很好地降低了誤檢,但只檢測出4架飛機,造成1處漏檢(藍(lán)色框);本文算法對5架飛機全部檢測出,并未造成誤檢。(4)中存在多處小型人造目標(biāo)干擾,圖像中表現(xiàn)為“十”字型亮斑,容易引起誤檢,前3種算法均存在不同程度的誤檢與漏檢,本文算法利用k-means聚類設(shè)定錨點框和融合上下文信息,可以很好地解決對“十”字型亮斑的誤檢,同時Layer2后搭建淺層特征增強結(jié)構(gòu),消除了對右下角飛機的漏檢,實現(xiàn)了對飛機的全部檢測。從實驗結(jié)果來看,本文算法提高了對SAR圖像飛機目標(biāo)的檢測能力,達(dá)到了預(yù)期的檢測效果。
圖12 檢測結(jié)果對比Fig.12 Comparison of detection results
原始Faster R-CNN算法直接應(yīng)用于SAR圖像飛機檢測效果不佳,為此本文提出了一種改進(jìn)的Faster R-CNN算法。主要改進(jìn)如下:
1)遷移模型的應(yīng)用,以更好地提取圖像特征和節(jié)省計算成本。
2)錨點框的重新設(shè)定和RoI Align的引入,使算法更適應(yīng)于SAR圖像飛機目標(biāo)形狀特點,減少定位誤差。
3)改進(jìn)特征提取網(wǎng)絡(luò),進(jìn)一步提升了檢測效果。
在SAD數(shù)據(jù)集中,改進(jìn)的算法有效降低了對干擾目標(biāo)的誤檢和對弱小飛機目標(biāo)的漏檢,使得平均檢測精度提高了7.4%。由于改進(jìn)的算法復(fù)雜度有所增加,導(dǎo)致檢測速度略有下降,降低了約4 fps,在接受范圍內(nèi)。本文實驗證明了應(yīng)用于可見光數(shù)據(jù)集的Faster R-CNN目標(biāo)檢測算法遷移至SAR圖像數(shù)據(jù)集的可行性,并針對SAR圖像飛機目標(biāo)進(jìn)行適應(yīng)性改進(jìn),提高了算法的檢測精度,對后續(xù)的SAR圖像飛機目標(biāo)檢測研究具有重要意義。