陳 冬, 句彥偉
(南京電子技術(shù)研究所, 江蘇 南京 210013)
人工智能的興起引發(fā)了計(jì)算機(jī)視覺(jué)領(lǐng)域的快速發(fā)展,深度學(xué)習(xí)在光學(xué)圖像諸多任務(wù)(如分類(lèi)、檢測(cè)、分割等)上取得了突破性的進(jìn)展,而其在合成孔徑雷達(dá)(synthetic aperture radar,SAR)圖像上的運(yùn)用遠(yuǎn)未普及,在精度、速度等方面均存在著嚴(yán)重的限制。
SAR圖像艦船目標(biāo)檢測(cè)具有極廣的應(yīng)用,在民用領(lǐng)域上,有助于海運(yùn)檢測(cè)與管理;在軍事領(lǐng)域上,有利于戰(zhàn)術(shù)部署,提高海防預(yù)警能力。傳統(tǒng)的SAR圖像艦船目標(biāo)檢測(cè)方法多采用恒虛警率法[1]、模板匹配法[2]、尾跡檢測(cè)法[3]等。這些方法多依賴(lài)于人工手動(dòng)設(shè)計(jì)提取復(fù)雜的特征,且取得的效果泛化能力較差。
神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)在于自動(dòng)提取特征而不需要手動(dòng)設(shè)計(jì),這對(duì)于未來(lái)的雷達(dá)智能感知來(lái)說(shuō)具有重要的意義。基于深度學(xué)習(xí)的新興SAR圖像艦船檢測(cè)依賴(lài)于計(jì)算機(jī)視覺(jué)已取得的成果,然而SAR圖像與光學(xué)圖像特性存在諸多不同,因此研究基于神經(jīng)網(wǎng)絡(luò)的SAR圖像艦船檢測(cè)仍有許多科學(xué)問(wèn)題需要解決。
當(dāng)前光學(xué)圖像中目標(biāo)檢測(cè)方法主要有以下兩種:雙階段檢測(cè)、單階段檢測(cè)。以R-CNN系列[4-6]為代表的雙階段檢測(cè)方法具有非常高的檢測(cè)精度,主要思想是先對(duì)輸入的圖像進(jìn)行區(qū)域劃分,獲取候選框,對(duì)每個(gè)候選框分類(lèi),相同類(lèi)別的合并,回歸出最終每個(gè)目標(biāo)的檢測(cè)框。其存在的主要問(wèn)題是區(qū)域劃分耗時(shí)耗力,Faster R-CNN[6]通過(guò)卷積網(wǎng)絡(luò)實(shí)現(xiàn)區(qū)域劃分,第一次實(shí)現(xiàn)了R-CNN[4]系列的端到端訓(xùn)練,降低了檢測(cè)時(shí)間。盡管如此,Faster R-CNN檢測(cè)速依舊較慢。
單階段的檢測(cè)方法具有非常高的檢測(cè)速度,典型代表有SSD系列[7-9]與YOLO系列[10-12]。其主要思想通過(guò)神經(jīng)網(wǎng)絡(luò)直接回歸出目標(biāo)的類(lèi)別、可信度以及坐標(biāo)框,由于未采用二階段候選框生成的概念,雖然檢測(cè)速度取得了很大的提升,但檢測(cè)精度卻有所下降。而YOLOv3[12]檢測(cè)方法的出現(xiàn)改變了這一狀況,其在取得快速檢測(cè)的同時(shí)保證了檢測(cè)精度。
以上提及的方法大部分基于錨框(anchor)的思想,即預(yù)先設(shè)定大小的框。這一anchor的設(shè)定亦成為了檢測(cè)速度再次提高的桎梏,當(dāng)前,已有研究提出無(wú)錨框(anchor free)的概念。最先提及該概念并用于檢測(cè)中的是百度提出的人臉檢測(cè)方法DenseBox[13],現(xiàn)如今出現(xiàn)的方法有FCOS[14]、CornerNet[15]。雖然其是未來(lái)檢測(cè)的趨勢(shì),但當(dāng)前其發(fā)展運(yùn)用遠(yuǎn)不及基于anchor的方法。
深度學(xué)習(xí)在SAR圖像上的檢測(cè)目前已取得相當(dāng)?shù)某晒?基于Faster R-CNN的思想,文獻(xiàn)[16]提出了改進(jìn)模型,檢測(cè)精度達(dá)到了78.8%;基于SSD的思想,文獻(xiàn)[17]提出了一個(gè)改進(jìn)型模型,適用于小艦船目標(biāo)檢測(cè),精度可達(dá)到88.1%;基于輕量化模型、注意力機(jī)制等思想,文獻(xiàn)[18]設(shè)計(jì)了一個(gè)新的艦船檢測(cè)模型,降低了參數(shù)量,可實(shí)現(xiàn)檢測(cè)的實(shí)時(shí)性。
相較于光學(xué)圖像,SAR圖像中不包含豐富的特征信息,艦船目標(biāo)尺寸變化大、干擾源多,這些對(duì)檢測(cè)都會(huì)產(chǎn)生一定的影響。YOLOv3的方法在光學(xué)圖像中取得了很好的效果,但光學(xué)圖像和SAR圖像的成像原理存在著本質(zhì)上的區(qū)別,直接將該方法運(yùn)用到SAR圖像中存在識(shí)別不準(zhǔn)確、召回率低、檢測(cè)框偏移較大等問(wèn)題?;诔R?guī)卷積方案的原YOLOv3模型無(wú)法對(duì)艦船目標(biāo)尺寸適應(yīng)性地調(diào)整且網(wǎng)絡(luò)過(guò)深不適用于SAR圖像,同時(shí)可能會(huì)引起過(guò)擬合問(wèn)題,因此很有必要對(duì)其特征提取部分進(jìn)行改進(jìn)。
本文的創(chuàng)新點(diǎn)主要如下:
(1)YOLOv3的方法本身對(duì)于小目標(biāo)檢測(cè)有很好的效果,本文將該方法引入到SAR圖像艦船目標(biāo)檢測(cè)中,重新設(shè)計(jì)了特征提取網(wǎng)絡(luò),有效地提高了檢測(cè)精度,降低了虛警概率和漏檢概率。
(2)本文采用參數(shù)量較少的ResNet50來(lái)實(shí)現(xiàn)特征提取并防止過(guò)擬合,避免無(wú)用以及重復(fù)特征的提取。為進(jìn)一步降低參數(shù)以及提高性能,在跳躍連接過(guò)程中使用了平均池化,具有計(jì)算量更少、檢測(cè)更快的優(yōu)點(diǎn)。
(3)為在特征提取過(guò)程中引入更多的艦船形狀等信息,本文在特征提取網(wǎng)絡(luò)部分加入了可變形卷積,通過(guò)與檢測(cè)任務(wù)的共同學(xué)習(xí),適應(yīng)性地改變采樣點(diǎn),使其獲得類(lèi)艦船目標(biāo)形狀的感受野范圍,能夠更好地幫助網(wǎng)絡(luò)實(shí)現(xiàn)檢測(cè)。
(4)使用ShuffleNetv2對(duì)YOLOv3特征提取網(wǎng)絡(luò)進(jìn)行輕量化設(shè)計(jì),在犧牲些許精度的情況下,擁有了更快的檢測(cè)速度,為輕量化研究提供參考。
本文的改進(jìn)方案對(duì)于YOLOv3網(wǎng)絡(luò)效果很好的部分進(jìn)行保留:其一,融合了特征金字塔結(jié)構(gòu)[19]可以在多尺度進(jìn)行預(yù)測(cè),有助于識(shí)別不同尺度的艦船目標(biāo);其二,損失函數(shù)對(duì)小目標(biāo)的偏重思想,可以防止小艦船目標(biāo)預(yù)測(cè)錯(cuò)誤對(duì)整體損失函數(shù)并沒(méi)有太大影響,使網(wǎng)絡(luò)注意到小艦船目標(biāo)。本文的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,其可大體分為兩部分:特征自動(dòng)提取網(wǎng)絡(luò)與目標(biāo)檢測(cè)分類(lèi)(特征解碼)網(wǎng)絡(luò)。
圖1 本文網(wǎng)絡(luò)結(jié)構(gòu)
1.1.1 艦船ResNet50-d特征提取
對(duì)于光學(xué)圖像采用的神經(jīng)網(wǎng)絡(luò)而言,一般情況下,網(wǎng)絡(luò)越深,提取特征的能力越強(qiáng),感受視野范圍越大,獲取的高級(jí)語(yǔ)義信息越多。但由于網(wǎng)絡(luò)過(guò)深,梯度反向傳播過(guò)程中過(guò)小以致網(wǎng)絡(luò)難以迭代更新,因此不能簡(jiǎn)單的對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行堆疊。ResNet[20]網(wǎng)絡(luò)采用殘差連接的方式解決了神經(jīng)網(wǎng)絡(luò)增加深度的同時(shí)梯度消失的問(wèn)題,使得訓(xùn)練數(shù)百層的神經(jīng)網(wǎng)絡(luò)成為了可能。
ResNet按照網(wǎng)絡(luò)層數(shù)不同主要分為5類(lèi),其中最常用的是50層結(jié)構(gòu)的ResNet50(見(jiàn)圖2)。由于ResNet50網(wǎng)絡(luò)具有比較好的特征提取能力,且網(wǎng)絡(luò)相對(duì)于Darknet53而言層數(shù)少,參數(shù)量更小,運(yùn)用也更加靈活;同時(shí)考慮到SAR圖像不同于包含豐富特征信息的光學(xué)圖像,本文最終采用ResNet50網(wǎng)絡(luò)的基本結(jié)構(gòu)作為特征提取網(wǎng)絡(luò),相比較于原YOLOv3可以有效地降低參數(shù)量和重復(fù)特征數(shù)量。
圖2 ResNet50結(jié)構(gòu)
另外,本文參照文獻(xiàn)[21]使用了ResNet50-d的思想,將在跳躍連接過(guò)程中使用的通過(guò)步長(zhǎng)進(jìn)行降維的方法更改為平均池化形式(對(duì)比見(jiàn)圖3)。平均池化即對(duì)鄰域內(nèi)的特征點(diǎn)求平均值,往往能夠很好地保留背景信息,有助于網(wǎng)絡(luò)對(duì)特征的提取,另一方面也可以有效地降低參數(shù)量,節(jié)約算力。
圖3 ResNet50與ResNet50-d降維對(duì)比
1.1.2 適用于艦船檢測(cè)的可變形卷積
艦船目標(biāo)尺度不統(tǒng)一,目標(biāo)形狀多變,采用普通的卷積神經(jīng)網(wǎng)絡(luò)對(duì)于大尺度和未知形狀的艦船目標(biāo)檢測(cè)存在固有的缺陷,該缺陷來(lái)源于卷積神經(jīng)網(wǎng)絡(luò)固有的幾何結(jié)構(gòu):卷積核對(duì)輸入特征圖的固定位置進(jìn)行采樣;池化層以固定的比例進(jìn)行池化。
本文采用的可變形卷積[22]對(duì)普通卷積進(jìn)行修改,其基本思想對(duì)采樣點(diǎn)學(xué)習(xí)一個(gè)偏移,使卷積核專(zhuān)注于感興趣區(qū)域或者目標(biāo)而不是固定位置的采樣。普通卷積采樣和可變形卷積采樣的對(duì)比如圖4所示。
圖4 普通卷積與可變形卷積對(duì)比
定義膨脹率為1的普通3×3卷積,R={(-1,-1),(-1,0),…,(0,1),(1,1)}。對(duì)于輸入特征圖x,對(duì)應(yīng)的特征圖位置p0的輸出y有
(1)
式中,w為每個(gè)采樣值的權(quán)重。
而對(duì)于可變形卷積來(lái)說(shuō),額外增加了一個(gè)偏移值:
(2)
實(shí)際操作中,對(duì)得到的非規(guī)則抽樣位置進(jìn)行限定,使其保持在特征圖內(nèi)。由于偏移值Δpn通常是小數(shù),可采用雙線性插值法進(jìn)行實(shí)現(xiàn)??勺冃尉矸e的實(shí)現(xiàn)依賴(lài)于不規(guī)則的抽樣位置,可通過(guò)平行的卷積網(wǎng)絡(luò)對(duì)特征圖進(jìn)行偏移位置的學(xué)習(xí),再通過(guò)雙線性插值實(shí)現(xiàn)端到端的訓(xùn)練。
由于可變形卷積打破了常規(guī)的抽樣區(qū)域形狀,在模型運(yùn)用過(guò)程中可能會(huì)將采樣點(diǎn)拓展至感興趣區(qū)域之外的部分,納入更多的無(wú)關(guān)信息與上下文信息,影響模型的性能。因此,可變形卷積v2[22]提出改進(jìn)方案,平行網(wǎng)絡(luò)不僅僅學(xué)習(xí)每個(gè)位置的偏移值,還學(xué)習(xí)每個(gè)采樣點(diǎn)的權(quán)重,避免極端抽樣點(diǎn)對(duì)網(wǎng)絡(luò)特征提取的影響。通過(guò)權(quán)重的控制可以有效地降低過(guò)多上下文信息的影響,增加了更大的自由度,對(duì)于可能不需要的采樣點(diǎn)權(quán)重可以學(xué)習(xí)成為零。其計(jì)算公式變?yōu)?/p>
(3)
通過(guò)平行的卷積神經(jīng)網(wǎng)絡(luò)可將采樣點(diǎn)偏移值和權(quán)重值納入網(wǎng)絡(luò)學(xué)習(xí)的過(guò)程中,由最終檢測(cè)的損失函數(shù)監(jiān)督學(xué)習(xí)最佳的偏移值和權(quán)重值。假設(shè)平行網(wǎng)絡(luò)的輸入特征圖為N通道,采樣點(diǎn)偏移部分對(duì)應(yīng)于兩個(gè)維度的偏移值,因此輸出通道數(shù)對(duì)應(yīng)于2N;而權(quán)重網(wǎng)絡(luò)是每個(gè)采樣點(diǎn)的權(quán)重值,通道數(shù)對(duì)應(yīng)于輸入通道數(shù)N,其實(shí)現(xiàn)的框圖見(jiàn)圖5。
圖5 可變形卷積實(shí)現(xiàn)
可變形卷積雖能適應(yīng)性地提取特征信息,但引入一個(gè)平行網(wǎng)絡(luò)加入了很多額外的計(jì)算量。若全采用可變形卷積設(shè)計(jì)網(wǎng)絡(luò),會(huì)導(dǎo)致參數(shù)量的巨大、網(wǎng)絡(luò)難以訓(xùn)練等問(wèn)題。
綜合考慮,本文對(duì)改進(jìn)的ResNet50-d特征提取網(wǎng)絡(luò)最后一個(gè)降采樣階段(見(jiàn)圖1特征提取部分)使用可變形卷積(DCNv2),在特征提取與參數(shù)量之間取得一個(gè)比較好的平衡。
在網(wǎng)絡(luò)實(shí)現(xiàn)過(guò)程中,目標(biāo)檢測(cè)分類(lèi)網(wǎng)絡(luò)可分為3部分:類(lèi)別解碼、置信度解碼和坐標(biāo)框解碼。SAR圖像艦船檢測(cè)僅為艦船一類(lèi)可不考慮類(lèi)別解碼;置信度解碼可在輸出維度中占據(jù)固定位置,使用sigmoid函數(shù)激活,限制在區(qū)間0~1。
檢測(cè)的關(guān)鍵點(diǎn)在于坐標(biāo)框的解碼,本文采用YOLOv3方案的解碼結(jié)構(gòu),通過(guò)網(wǎng)絡(luò)得到的坐標(biāo)值(tx,ty,tw,th)并不是最終的坐標(biāo)框結(jié)果,而是經(jīng)過(guò)網(wǎng)絡(luò)編碼的形式,因此需要對(duì)該形式進(jìn)行解碼。解碼公式如下:
bx=σ(tx)+cx
(4)
by=σ(ty)+cy
(5)
bw=pwetw
(6)
bh=pheth
(7)
式中,cx和cy代表的是檢測(cè)中心點(diǎn)所處網(wǎng)格區(qū)域的左上角坐標(biāo);pw和ph代表的是anchor的寬和高,σ(tx)和σ(ty)代表的是檢測(cè)中心點(diǎn)和左上角的偏移值(使用sigmoid激活函數(shù)將范圍限定在當(dāng)前網(wǎng)格區(qū)域內(nèi));etw和eth代表預(yù)測(cè)的寬高偏移量。
得到的bw和bh即為最終坐標(biāo)框的寬和高,再將檢測(cè)的bx和by乘以所采用的采樣率(8、16、32)即得到坐標(biāo)框的中心坐標(biāo)。
單階段目標(biāo)檢測(cè)過(guò)程中的損失函數(shù)由3部分組成:框位置損失、目標(biāo)性損失以及分類(lèi)損失。對(duì)于SAR圖像艦船目標(biāo)檢測(cè)不需要對(duì)其進(jìn)行分類(lèi),因此損失函數(shù)應(yīng)由前兩者組成。
框位置損失即檢測(cè)框位置帶來(lái)的損失,由檢測(cè)框相較于特征圖位置的損失和高寬損失組成,前者損失為
(8)
寬度和高度損失為
(9)
為了提升小目標(biāo)所占比重,權(quán)衡大框和小框之間的框坐標(biāo)損失,最終采用的框位置損失函數(shù)乘以一個(gè)系數(shù),即
w=2.0-tw×th
(10)
式中,w為框位置損失函數(shù)的系數(shù);tw和th分別代表網(wǎng)絡(luò)模型預(yù)測(cè)的編碼寬和高(見(jiàn)式(6)和式(7))。編碼寬和高越大對(duì)應(yīng)檢測(cè)框越大,框損失函數(shù)系數(shù)越小;編碼寬和高越小,框損失函數(shù)系數(shù)越大,由此動(dòng)態(tài)調(diào)整大框和小框的不同比重。
目標(biāo)性損失即置信度帶來(lái)的誤差,損失函數(shù)形式為
(11)
最終的損失函數(shù)形式為
l=w×(lxy+lwh)+lobj
(12)
本文基于百度AI Studio云端實(shí)驗(yàn)室,采用百度paddlepaddle的深度學(xué)習(xí)框架,在jupyter notebook中完成實(shí)驗(yàn)。實(shí)驗(yàn)的云端硬件配置為8核CPU,內(nèi)存為32 GB,顯卡為Nvidia Tesla V100,顯存為16 G。
本文方法主要采用的數(shù)據(jù)集是海軍航空大學(xué)李健偉教授等公開(kāi)的SSDD[23-26]。該數(shù)據(jù)集包含1 160張圖像、2 358只艦船目標(biāo),單張圖像包含艦船數(shù)從1到29,平均每張圖像中有2.03只艦船,包含7像素×7像素的小目標(biāo)艦船到211像素×298像素的大目標(biāo)艦船。該數(shù)據(jù)集中的圖像具有多種極化模式、不同分辨率、遠(yuǎn)近海場(chǎng)景等,能夠較好地驗(yàn)證算法有效性。由于當(dāng)前該數(shù)據(jù)集并沒(méi)有統(tǒng)一的劃分形式,諸多其他文獻(xiàn)提供的算法均依照其本身實(shí)驗(yàn)需要對(duì)數(shù)據(jù)集進(jìn)行劃分。本文所提算法均采用統(tǒng)一劃分方式,可提現(xiàn)算法效果的提升。
SSDD數(shù)據(jù)集按照7∶2∶1的比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,其中測(cè)試集包含267個(gè)艦船目標(biāo),相較于其他文獻(xiàn)提及的數(shù)據(jù)劃分,訓(xùn)練目標(biāo)更少且包含更多的測(cè)試目標(biāo)。訓(xùn)練過(guò)程中,采用RMSProp[27]優(yōu)化器,設(shè)置的初始學(xué)習(xí)率為0.001。該優(yōu)化器的特點(diǎn)是可以自適應(yīng)地調(diào)整學(xué)習(xí)率,用于解決使用Adagrad[28]后,模型訓(xùn)練中后期學(xué)習(xí)率急劇下降的問(wèn)題。
所有模型訓(xùn)練過(guò)程中均采用了遷移訓(xùn)練中預(yù)訓(xùn)練模型[29],訓(xùn)練200個(gè)epoch,訓(xùn)練的batch size取32。訓(xùn)練過(guò)程中,epoch為4的倍數(shù)或者超過(guò)150時(shí),對(duì)模型進(jìn)行驗(yàn)證,保存驗(yàn)證結(jié)果最優(yōu)的模型直至訓(xùn)練完成。另外,保存最后一次訓(xùn)練模型,可加載進(jìn)行再訓(xùn)練。
所有模型均使用了數(shù)據(jù)增廣方法,其主要增加訓(xùn)練數(shù)據(jù)集,使得數(shù)據(jù)盡可能的多樣化,有助于訓(xùn)練所得模型具有更強(qiáng)的泛化能力,主要采用了翻轉(zhuǎn)、旋轉(zhuǎn)、縮放、裁剪、平移、加噪聲、改變對(duì)比度等隨機(jī)方案。
圖6展示的是本文改進(jìn)之后的方案ResNet50-d-DCN在SSDD數(shù)據(jù)集上的部分預(yù)測(cè)結(jié)果,圖中的綠色框是真實(shí)標(biāo)注的目標(biāo)框,紅色框是算法檢測(cè)的結(jié)果。圖6(a)展示了近海岸檢測(cè)情況,圖6(b)展示了遠(yuǎn)海小目標(biāo)檢測(cè)情況,圖6(c)展示了遠(yuǎn)海大目標(biāo)檢測(cè)情況??梢钥闯?本文的算法能夠很好地檢測(cè)出目標(biāo),在遠(yuǎn)海小目標(biāo)、近海小目標(biāo)、陸地背景干擾下依舊取得很好的效果。
圖6 基于本文方案的SSDD數(shù)據(jù)集檢測(cè)結(jié)果
表1和表2中的模型即是本文逐步改進(jìn)提升的驗(yàn)證結(jié)果,其中Darket53指的是原YOLOv3模型,ShuffleNetv2即輕量化設(shè)計(jì)YOLOv3模型,ResNet50以及ResNet50-d是本文最終方法ResNet50-d-DCN的中間模型。表1展示了在數(shù)據(jù)測(cè)試集上檢測(cè)的基本情況,表2展示了評(píng)價(jià)指標(biāo)結(jié)果。
表1 各模型檢測(cè)效果統(tǒng)計(jì)結(jié)果
表2 SSDD數(shù)據(jù)集檢測(cè)結(jié)果評(píng)價(jià)指標(biāo)
表1中TP(true positives)為正確檢測(cè)數(shù)目,FN(false negatives)為漏檢數(shù)目,FP(false positives)為虛警數(shù)目,GT(ground truth)為真實(shí)數(shù)目。
表2中Pd為檢測(cè)概率,PMA為漏檢概率,PFA為虛警概率,Recall為召回率,Precision為精確度,MAP(mean average precision)為平均精度。
此處采用的MAP為積分形式:
(13)
式中,P(R)指的是精度-召回率曲線。由于此處只有艦船一種檢測(cè)目標(biāo),不需要對(duì)各類(lèi)別AP求平均,因此MAP=AP。
從表1中可以看出,本文改進(jìn)算法在SSDD測(cè)試集中,共有125張圖像,267個(gè)艦船目標(biāo),正確檢測(cè)出261個(gè)目標(biāo),漏檢6個(gè)目標(biāo),虛警29個(gè)目標(biāo);而原YOLOv3模型正確檢測(cè)出255個(gè)目標(biāo),漏檢12個(gè)目標(biāo),虛警32個(gè)目標(biāo)。
從表2中可以清楚地看出,一方面,相較于采用Darknet53的原YOLOv3模型,本文使用的算法ResNet50-d-DCN在SSDD測(cè)試集上mAP提高至96.64%,模型大小降低至172 MB;另一方面,同樣可以清楚地看到,通過(guò)ShuffleNetv2輕量化設(shè)計(jì)的模型在檢測(cè)效果上稍微下降了些,但考慮到模型大小僅為27 MB,對(duì)比于大小為234 MB的原YOLOv3模型,其可實(shí)現(xiàn)移動(dòng)端嵌入式的使用。
對(duì)比Darknet53與ResNet50的模型可以發(fā)現(xiàn),參數(shù)量較多的Darknet53檢測(cè)效果反而比ResNet50的效果差,這與光學(xué)圖像中檢測(cè)的結(jié)果是截然相反的。一方面考慮到可能是數(shù)據(jù)集劃分以及訓(xùn)練集目標(biāo)過(guò)少的原因,使得參數(shù)量大的模型難以更好的訓(xùn)練;另一方面,考慮到SAR圖像本身的特性以及圖像中所包含的有用信息,光學(xué)圖像檢測(cè)方法運(yùn)用于SAR圖像中應(yīng)該適當(dāng)?shù)亟档蛥?shù),避免重復(fù)以及無(wú)用的特征提取,這也是本文接下來(lái)的主要研究?jī)?nèi)容。
為了進(jìn)一步驗(yàn)證算法的有效性,本文額外使用了中國(guó)科學(xué)院空天信息研究院王超研究員團(tuán)隊(duì)公開(kāi)的SAR圖像船舶檢測(cè)數(shù)據(jù)集[26](SAR-Ship-Dataset)進(jìn)行檢測(cè)效果的驗(yàn)證,部分檢測(cè)結(jié)果如圖7所示。
圖7(a)展示了近海岸多目標(biāo)檢測(cè)情況,圖7(b)展示了遠(yuǎn)海多目標(biāo)檢測(cè)效果,圖7(c)展示了復(fù)雜背景下艦船目標(biāo)檢測(cè)情況,而圖7(d)展示了多尺度目標(biāo)檢測(cè)效果。從圖7(c)中可以看出,本文算法具有很好的抗干擾特性,在復(fù)雜背景情況下依舊能正確識(shí)別艦船目標(biāo);從圖7(d)中可以看出,本文方法即使在艦船目標(biāo)與背景不成比例情況下,對(duì)于小目標(biāo)檢測(cè)效果依舊非常好。
圖7 基于本文方案的SAR-Ship-Dataset檢測(cè)結(jié)果
圖8顯示了本文ResNet50-d-DCN算法在兩個(gè)測(cè)試集檢測(cè)中的漏檢與虛警情況,圖8(a)為SSDD數(shù)據(jù)集,圖8(b)為SAR-Ship-Dataset數(shù)據(jù)集,對(duì)于近海岸目標(biāo)和島嶼等目標(biāo)存在著識(shí)別問(wèn)題。
圖8 虛警與漏檢情況
分析原因可知:一方面,近海岸目標(biāo)背景過(guò)于復(fù)雜,且目標(biāo)和遠(yuǎn)海目標(biāo)數(shù)據(jù)類(lèi)型不均衡,對(duì)檢測(cè)訓(xùn)練造成一定的影響;另一方面,部分島嶼與艦船目標(biāo)具有相似的特征,神經(jīng)網(wǎng)絡(luò)無(wú)法忽略部分相似島嶼是不是艦船目標(biāo),對(duì)置信度閾值的設(shè)置會(huì)導(dǎo)致識(shí)別的最終不同結(jié)果:過(guò)低的閾值導(dǎo)致虛警,而過(guò)高的閾值導(dǎo)致漏檢。
本文基于深度學(xué)習(xí)的方法提出用于SAR圖像艦船檢測(cè)的改進(jìn)型YOLOv3模型,不同于常規(guī)卷積的方法,采用了可依據(jù)艦船形狀與尺寸自適應(yīng)采樣的可變形卷積等方法。經(jīng)SSDD數(shù)據(jù)集驗(yàn)證,相比較于原YOLOv3模型,在檢測(cè)效果方面,有效地降低了虛警概率和漏檢概率,提高了檢測(cè)精度;在模型大小方面,基于ShuffleNetv2的思想,對(duì)原YOLOv3進(jìn)行輕量化設(shè)計(jì),該模型大小僅為27 MB,對(duì)于未來(lái)網(wǎng)絡(luò)的輕量化研究具有重要的意義。
本文的下一步工作,將考慮如何在非直接遷移光學(xué)圖像檢測(cè)方法的前提下,將輕量化與精度統(tǒng)一起來(lái),在有效提取目標(biāo)特征的同時(shí)保持模型的輕便結(jié)構(gòu)。進(jìn)一步探討小樣本學(xué)習(xí)情況下,如何基于有限的數(shù)據(jù)集提升SAR圖像艦船檢測(cè)的效果并使其具有良好的泛化能力。