王昌安,田金文,張強(qiáng),張英輝
(1.華中科技大學(xué) 人工智能與自動(dòng)化學(xué)院,武漢 430074;2. 北京空間飛行器總體設(shè)計(jì)部,北京 100086)
可見(jiàn)光遙感影像中的近岸艦船的檢測(cè)在海域安全、軍事偵查等方面具有重要的意義,相比于海洋背景下的艦船定位,近岸艦船的背景環(huán)境更加復(fù)雜,且船只往往緊密相鄰,尺度變化范圍大,在檢測(cè)問(wèn)題上更為困難;近岸艦船的細(xì)粒度識(shí)別有助于實(shí)現(xiàn)港口的精細(xì)化監(jiān)視、打擊隱藏于民船中的敵方艦船,但不同類(lèi)別的艦船目標(biāo)通常形態(tài)、顏色區(qū)分度不大,要實(shí)現(xiàn)準(zhǔn)確的細(xì)粒度判別具有很高的難度。
現(xiàn)有的近岸艦船檢測(cè)和識(shí)別方法大致可分為2類(lèi):基于先驗(yàn)知識(shí)的傳統(tǒng)方法和基于分布式特征表示的深度學(xué)習(xí)方法。在傳統(tǒng)檢測(cè)方法的典型研究中,李軒等[1]利用海陸二值分割圖,結(jié)合直線段提取和船首定位進(jìn)行艦船檢測(cè),最后基于幾何先驗(yàn)知識(shí)進(jìn)行目標(biāo)確認(rèn);Li等[2]通過(guò)先檢測(cè)特征明顯的船頭,然后確定艦船主方向并進(jìn)行艦船輪廓的提取來(lái)實(shí)現(xiàn)近岸艦船檢測(cè)。近年來(lái),基于深度學(xué)習(xí)的方法由于優(yōu)異的特征提取能力得到人們的廣泛關(guān)注,其中,Lin等[3]利用全卷積網(wǎng)絡(luò)的語(yǔ)義分割框架,將遙感影像分為海洋、陸地、船身和船首尾4類(lèi),然后進(jìn)行艦船區(qū)域的提??;Yang等[4]改進(jìn)了有向目標(biāo)檢測(cè)網(wǎng)絡(luò),提出利用密集連接的旋轉(zhuǎn)特征金字塔網(wǎng)絡(luò)實(shí)現(xiàn)了端到端的艦船檢測(cè)。綜合上述,已有的方法中常常受限于嚴(yán)格的先驗(yàn)知識(shí)以及較弱的特征表達(dá),難以處理復(fù)雜背景環(huán)境的干擾,且不能實(shí)現(xiàn)艦船目標(biāo)的細(xì)粒度識(shí)別。因此,針對(duì)上述問(wèn)題,開(kāi)展相關(guān)研究是十分必要的。
本文提出了一種端到端的近岸艦船目標(biāo)檢測(cè)和細(xì)粒度識(shí)別算法框架。針對(duì)短邊較小的艦船目標(biāo)難以有效檢測(cè)的問(wèn)題,提出了角度致密化的預(yù)設(shè)框設(shè)置策略和旋轉(zhuǎn)方位敏感型區(qū)域插值池化模塊;采用基于注意力機(jī)制的區(qū)域級(jí)特征融合方法,提高了艦船目標(biāo)細(xì)粒度判別能力,通過(guò)引入遷移學(xué)習(xí)方法進(jìn)一步提升了模型性能。實(shí)驗(yàn)結(jié)果表明,所提算法可以有效識(shí)別多類(lèi)近岸艦船目標(biāo),對(duì)目標(biāo)方向變化及背景干擾等都具有良好的魯棒性。
本文的算法流程如圖1所示,首先針對(duì)艦船類(lèi)目標(biāo)角度分布多樣性的特點(diǎn),使用旋轉(zhuǎn)候選區(qū)域生成網(wǎng)絡(luò)(rotation region proposal network,RRPN)[5]提取艦船目標(biāo)候選區(qū)域;然后通過(guò)旋轉(zhuǎn)區(qū)域池化模塊分別提取候選區(qū)域的局部和全局特征并進(jìn)行融合;最后進(jìn)行目標(biāo)分類(lèi)、檢測(cè)框調(diào)整和角度回歸,從而實(shí)現(xiàn)檢測(cè)框的定位和類(lèi)別的判別。該算法的網(wǎng)絡(luò)框架如圖2所示。
圖1 本文算法流程圖
圖2 本文算法的網(wǎng)絡(luò)框架
該網(wǎng)絡(luò)采用端到端的訓(xùn)練方式,第一階段和第二階段的損失函數(shù)形式一致,如式(1)~式(4)所示。
(1)
Lcls(p,y)=-lnpy
(2)
Lreg=smoothL1(t-t*)
(3)
(4)
式中:B為mini-batch集合;Lcls為分類(lèi)交叉熵?fù)p失函數(shù);Lreg為坐標(biāo)偏差損失;p為預(yù)測(cè)的概率分布;y為對(duì)應(yīng)樣本的真實(shí)標(biāo)簽;t和t*分別對(duì)應(yīng)預(yù)測(cè)的坐標(biāo)偏移量和真實(shí)坐標(biāo)偏差。有向檢測(cè)框的參數(shù)化形式和回歸偏差的定義與文獻(xiàn)[5]保持一致。
下文將分別介紹本文提出的網(wǎng)絡(luò)框架所涉及的各個(gè)子模塊,包括使用角度致密化來(lái)生成候選區(qū)域、有利于建模艦船局部特征的方位敏感型區(qū)域插值池化模塊、基于注意力機(jī)制的特征融合子網(wǎng)絡(luò)以及利用預(yù)測(cè)層的權(quán)重映射來(lái)實(shí)現(xiàn)遷移學(xué)習(xí)的訓(xùn)練方法。
在典型的目標(biāo)檢測(cè)任務(wù)中,真實(shí)目標(biāo)往往會(huì)存在于圖像中的任意位置,并具有任意大小的尺度,傳統(tǒng)方法主要通過(guò)多尺度的滑動(dòng)窗口來(lái)實(shí)現(xiàn)目標(biāo)檢測(cè)。基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法,引入了預(yù)設(shè)框來(lái)對(duì)空間和尺度進(jìn)行離散化。但由于空間和尺度本質(zhì)的連續(xù)性,離散化容易使小尺度目標(biāo)匹配不到足夠多的預(yù)設(shè)框,從而無(wú)法召回。在艦船目標(biāo)的檢測(cè)中,也存在著類(lèi)似的問(wèn)題,如圖3(a)所示,艦船類(lèi)目標(biāo)通常具有較小短邊尺度(16~64),同樣會(huì)由于與預(yù)設(shè)框的匹配程度較低而難以召回。
為了檢測(cè)任意方向的艦船目標(biāo),我們?cè)诳臻g上新增加了一個(gè)維度的離散化,即角度離散化。但現(xiàn)有的方法[4]往往針對(duì)所有尺度的預(yù)設(shè)框設(shè)置相同密度的角度離散化,使得小尺度目標(biāo)匹配到的預(yù)設(shè)框數(shù)量不足的問(wèn)題更加嚴(yán)重。如圖3(b)所示,對(duì)于相同幅度的角度變化,小尺度目標(biāo)與預(yù)設(shè)框的交并比(intersection over union,IoU)變化更為敏感。因此為了增加短邊較小的艦船目標(biāo)匹配到的預(yù)設(shè)框數(shù)量,進(jìn)而提升小型艦船目標(biāo)的檢測(cè)率,本文創(chuàng)新性地提出角度致密化的預(yù)設(shè)框設(shè)置策略,即將短邊長(zhǎng)度最小的6個(gè)預(yù)設(shè)框增加一倍的角度,如圖4(a)所示,其中虛線表示新增加的預(yù)設(shè)框。經(jīng)過(guò)角度致密化,小尺度艦船匹配到的預(yù)設(shè)框平均數(shù)量大大增加,如圖4(b)所示。
圖3 艦船目標(biāo)特性分析
圖4 角度致密化及其影響
區(qū)域池化模塊被廣泛應(yīng)用在兩階段目標(biāo)檢測(cè)網(wǎng)絡(luò)中,用于從各種大小的感興趣區(qū)域(region of interest,RoI)中提取固定長(zhǎng)度的特征。區(qū)域池化模塊RoIPooling最初由He等[6]提出,并應(yīng)用在金字塔池化中,Mask RCNN[7]中對(duì)其進(jìn)行了改進(jìn),提出了RoIAlign,利用坐標(biāo)插值的方式消除了坐標(biāo)整數(shù)量化帶來(lái)的誤差。R-FCN[8]將RoIPooling改進(jìn)為位置敏感型池化(position sensitive roi pooling,PsRoIPooling),通過(guò)將位置信息編碼到不同的特征通道內(nèi),既實(shí)現(xiàn)了不同候選區(qū)域的計(jì)算共享,也有利于候選區(qū)域局部特征的建模。LightHead RCNN[9]將位置敏感型池化改進(jìn)為PsRoIAlign,提升了池化精度。為了適應(yīng)任意方向目標(biāo)候選區(qū)域的角度多樣性,Ma等[5]提出了RotateRoIPooling,其對(duì)應(yīng)的可插值改進(jìn)版RotateRoIAlign被應(yīng)用在文獻(xiàn)[4]中,但都無(wú)法有效地建模艦船區(qū)域的局部特征。文獻(xiàn)[10]提出方位敏感型平均池化模塊(rotate position sensitive roi average pooling,RotatePsRoIAvgPooling)緩解了這個(gè)問(wèn)題,卻仍存在坐標(biāo)整數(shù)量化帶來(lái)的誤差問(wèn)題,同時(shí)由于在格子內(nèi)進(jìn)行采樣前,對(duì)格子進(jìn)行了矩形近似,這會(huì)在候選區(qū)域傾斜角度很大或者短邊尺度較小時(shí)帶來(lái)誤差。
結(jié)合以上研究,本文提出了方位敏感型區(qū)域插值池化模塊RotatePsRoIAlign來(lái)更精確地建模艦船目標(biāo)的局部特征。如圖5所示,其中+表示采樣點(diǎn),箭頭表示采樣順序,該模塊具有以下特點(diǎn):
1)旋轉(zhuǎn)不變。每個(gè)格子的采樣起始點(diǎn)和采樣方向與區(qū)域旋轉(zhuǎn)方向無(wú)關(guān),確保學(xué)習(xí)過(guò)程的一致性。
2)不規(guī)則采樣。由于艦船目標(biāo)長(zhǎng)寬比較大,與目前多數(shù)池化模塊7像素×7像素的采樣大小不同,本模塊采用10像素×5像素的不規(guī)則采樣大小。
3)位置敏感。每個(gè)采樣格子在輸入特征圖的不同通道進(jìn)行采樣,顯式建模目標(biāo)不同位置的差異。
4)無(wú)整數(shù)量化。采樣時(shí)不對(duì)采樣坐標(biāo)進(jìn)行整數(shù)量化,而是通過(guò)雙線性插值得到采樣點(diǎn)特征值。
圖5 方位敏感型插值區(qū)域池化模塊
對(duì)于細(xì)粒度類(lèi)別的艦船檢測(cè)和識(shí)別問(wèn)題,除了定位精度以外,艦船區(qū)域特征的判別能力對(duì)最終性能也有很大影響。為了提升艦船區(qū)域特征的細(xì)粒度判別能力,本文提出了基于注意力機(jī)制的區(qū)域級(jí)特征融合子網(wǎng)絡(luò),如圖2所示。
該特征融合模塊主要由2個(gè)分支組成:主分支采用可以編碼上下文信息的旋轉(zhuǎn)區(qū)域插值池化模塊RotateRoIAlign,提取全局特征;輔助分支采用能夠建模局部信息的方位敏感型旋轉(zhuǎn)區(qū)域插值池化模塊RotatePsRoIAlign,提取局部特征,這兩類(lèi)特征往往具有很強(qiáng)的互補(bǔ)特性[11]。此外,由于不同細(xì)粒度類(lèi)別的艦船通常只有部分區(qū)域具有顯著差別。為了在沒(méi)有局部標(biāo)注信息的情況選出更具判別力的局部特征來(lái)進(jìn)行細(xì)粒度的識(shí)別,本文首先利用局部特征學(xué)習(xí)不同區(qū)域的重要性權(quán)重,然后基于注意力機(jī)制[12]對(duì)全局特征進(jìn)行重新加權(quán),從而將2種特征有機(jī)地融合在一起。融合后的特征既有豐富的上下文信息,又具有局部的判別信息,能夠更好地完成細(xì)粒度識(shí)別的任務(wù)。為了減少該模塊的計(jì)算量,輔助分支的共享卷積層使用了大卷積核的可分離卷積層,卷積核大小分別為7像素×1像素和1像素×7像素。同時(shí)該模塊還引入殘差連接,以減輕Sigmoid函數(shù)的飽和性帶來(lái)的梯度消失問(wèn)題,從而幫助網(wǎng)絡(luò)的學(xué)習(xí)和優(yōu)化。
本文算法使用端到端的訓(xùn)練方式,根據(jù)艦船目標(biāo)的形狀和尺度分布,將超參數(shù)設(shè)置如下。
1)預(yù)設(shè)框尺度設(shè)置為64、128、256、512,長(zhǎng)寬比設(shè)置為3∶1、5∶1、7∶1,旋轉(zhuǎn)角度改為9個(gè)(-35°~125°平均劃分)。
2)第一階段與任一真實(shí)目標(biāo)IoU超過(guò)0.5且角度偏差小于15°的預(yù)設(shè)框設(shè)為正樣本;與所有真實(shí)目標(biāo)IoU都小于0.2的預(yù)設(shè)框設(shè)為負(fù)樣本。
3)第二階段批量大小設(shè)為256,正負(fù)樣本比例設(shè)為1∶1,正樣本IoU閾值設(shè)為0.4,池化大小改為10像素×5像素,全連接層隱藏單元大小為1 024。
4)訓(xùn)練圖像短邊設(shè)為640,初始學(xué)習(xí)率為0.001,使用動(dòng)量隨機(jī)梯度下降優(yōu)化算法迭代6 W步,學(xué)習(xí)率衰減系數(shù)為0.1,衰減步數(shù)為4 W、5 W、5.5 W、5.8 W步,權(quán)重衰減系數(shù)為5E-4。
研究[13]表明,相關(guān)任務(wù)之間的遷移學(xué)習(xí)可以加速目標(biāo)任務(wù)的學(xué)習(xí),并提高目標(biāo)域的泛化能力,在目標(biāo)域數(shù)據(jù)集規(guī)模相對(duì)較小時(shí),遷移學(xué)習(xí)可以有效地提升目標(biāo)任務(wù)的性能。本文提出了一種同類(lèi)任務(wù)間的預(yù)測(cè)層權(quán)重遷移方法,可以用遙感影像中其他類(lèi)別的目標(biāo)標(biāo)注信息[14](源域)輔助艦船類(lèi)目標(biāo)(目標(biāo)域)的檢測(cè)任務(wù)。由于源域和目標(biāo)域目標(biāo)的尺度和長(zhǎng)寬比分布不一致,因此我們?cè)赗RPN階段采用了不同的預(yù)設(shè)框設(shè)置,并使用獨(dú)立的預(yù)測(cè)權(quán)重生成候選區(qū)域。針對(duì)源域和目標(biāo)域類(lèi)別數(shù)不同的問(wèn)題,本文在第二階段使用了權(quán)重遷移的方法進(jìn)行參數(shù)共享,如圖6所示,首先提取源域的預(yù)測(cè)層權(quán)重,通過(guò)可學(xué)習(xí)的線性映射變換為目標(biāo)域預(yù)測(cè)權(quán)重,最后在目標(biāo)域使用映射權(quán)重進(jìn)行艦船檢測(cè)和識(shí)別。除RRPN預(yù)測(cè)層權(quán)重進(jìn)行隨機(jī)初始化外,網(wǎng)絡(luò)其余部分的權(quán)重直接從源域遷移到目標(biāo)域。
圖6 權(quán)重遷移預(yù)測(cè)模塊
由于沒(méi)有標(biāo)準(zhǔn)的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)結(jié)果性能評(píng)價(jià),本文實(shí)驗(yàn)利用了實(shí)驗(yàn)室自建的影像數(shù)據(jù),圖像分辨率為1 m左右,每張圖像長(zhǎng)寬比在1 000~3 000之間,對(duì)數(shù)據(jù)集進(jìn)行隨機(jī)數(shù)據(jù)增強(qiáng),引入顏色變換、旋轉(zhuǎn)變換、區(qū)域裁切等操作(分辨率保持不變),最終獲取有效訓(xùn)練樣本4 926張,大小均為480像素×640像素。
實(shí)驗(yàn)數(shù)據(jù)集中所有標(biāo)注船只被分成了包括軍艦、航母、民船等在內(nèi)的25個(gè)類(lèi)別,表1列出了訓(xùn)練數(shù)據(jù)集中的主要一些細(xì)分類(lèi)別及對(duì)應(yīng)的實(shí)例數(shù)量。圖7展示了各細(xì)分類(lèi)別的典型樣本縮略圖(其中尺度經(jīng)過(guò)了歸一化縮放),可見(jiàn)各類(lèi)別樣本間存在較高類(lèi)間相似性,尺度變化范圍也比較大,這就要求算法需要具備對(duì)小尺度目標(biāo)的精確定位能力,以及足夠強(qiáng)的細(xì)粒度類(lèi)別的判別能力。
表1 訓(xùn)練數(shù)據(jù)集的主要類(lèi)別
圖7 實(shí)驗(yàn)數(shù)據(jù)集各類(lèi)別樣本縮略圖(類(lèi)別編號(hào)自左向右,自上往下)
由于本文主要研究細(xì)粒度多類(lèi)別的艦船檢測(cè)與識(shí)別問(wèn)題,因此采用類(lèi)似自然場(chǎng)景目標(biāo)檢測(cè)[15]中的評(píng)測(cè)指標(biāo)對(duì)算法性能進(jìn)行量化。算法運(yùn)行速度的量化指標(biāo)為單幅640像素×480像素大小,來(lái)測(cè)試圖像的處理時(shí)間。測(cè)試環(huán)境為:64位Linux操作系統(tǒng),GTX1080Ti顯卡,CUDA8.0,CPU型號(hào)Intel Xeon E5-2620。首先,將本文網(wǎng)絡(luò)框架的第二階段子網(wǎng)絡(luò)只保留全局池化分支,并把池化模塊替換為RotateRoIPooling,以此作為基準(zhǔn)算法,如表2所示,基準(zhǔn)算法的平均精度(mAP)僅為51.8%。為了驗(yàn)證在池化過(guò)程中對(duì)采樣點(diǎn)進(jìn)行插值的必要性,我們將模塊RotateRoIPooling換為對(duì)應(yīng)的插值模塊RotateRoIAlign,模型性能得到了大幅提升(62.0% mAP),可見(jiàn)區(qū)域特征的精確提取對(duì)艦船目標(biāo)的精確定位和準(zhǔn)確識(shí)別非常重要。
之后,驗(yàn)證方位敏感型插值區(qū)域池化模塊的性能。在將RotateRoIAlign替換為本文提出的RotatePsRoIAlign模塊后,算法的平均精度下降到60.2%,經(jīng)過(guò)分析這主要是單個(gè)RoI的特征維度的量級(jí)差距懸殊導(dǎo)致的。如表2所示,RotateRoIAlign單個(gè)RoI區(qū)域的參數(shù)量為512×10×5=25 600,而本文的RotatePsRoIAlign單個(gè)RoI區(qū)域的參數(shù)量?jī)H為10×10×5=500,特征參數(shù)量相差近2個(gè)數(shù)量級(jí),使得RotateRoIAlign在性能上占有優(yōu)勢(shì)。為了公平驗(yàn)證RotatePsRoIAlign模塊的有效性,我們?cè)黾恿艘唤M實(shí)驗(yàn)。在使用RotateRoIAlign模塊的共享卷積層前增加一個(gè)降維卷積,從而使二者每個(gè)RoI的參數(shù)量保持在同一個(gè)數(shù)量級(jí),實(shí)驗(yàn)結(jié)果參見(jiàn)表2中RotateRoIAlign-Light,此時(shí)性能與本文模塊接近一致,從而表明本文提出的RotatePsRoIAlign模塊在特征提取能力上是令人滿意的,而占用的模型參數(shù)量是最低的,并且后續(xù)實(shí)驗(yàn)將表明,該模塊在對(duì)艦船局部信息的建模上更具優(yōu)勢(shì)。
我們以RotatePsRoIAlign模塊的單分支模型為基礎(chǔ),對(duì)本文提出的其他結(jié)構(gòu)進(jìn)行了逐一的驗(yàn)證,如表3所示。通過(guò)使用角度致密化的預(yù)設(shè)框設(shè)置策略,小尺度艦船可以匹配到更多的預(yù)設(shè)框,從而模型召回率得到了較大提升,模型整體性能也提升了2% mAP,并且參數(shù)量基本保持不變。由于預(yù)設(shè)框數(shù)量的增加,對(duì)候選區(qū)域進(jìn)行過(guò)濾時(shí)需要更多計(jì)算量,從而使得算法運(yùn)行時(shí)間增加,運(yùn)行速度略有下降。
表2 區(qū)域池化模塊分析
表3 對(duì)比分析
在加入基于注意力機(jī)制的區(qū)域特征融合后,模型平均精度提升到63.4%,可見(jiàn)RotatePsRoIAlign所提取到的特征與RotateRoIAlign模塊具有一定的互補(bǔ)性,且本文提出的融合方法較大地提升了最終特征的判別能力。但融合模型的運(yùn)行速度略有下降,同時(shí)由于新增加了殘差映射和注意力建模2個(gè)全連接層,模型參數(shù)量也有增加。值得注意的是,在該模型的基礎(chǔ)上再次加入角度致密化,模型性能提升較小,僅為0.6% mAP,這很可能是由于融合特征判別能力的增加,使得第二階段分類(lèi)器對(duì)候選區(qū)域篩選和調(diào)整更加高效,在一定程度上掩蓋了角度致密化帶來(lái)的候選區(qū)域質(zhì)量的提高。最后,通過(guò)在DOTA數(shù)據(jù)集上對(duì)本文提出的網(wǎng)絡(luò)框架進(jìn)行3 W步的預(yù)訓(xùn)練,并將訓(xùn)練權(quán)重遷移到艦船數(shù)據(jù)集上繼續(xù)訓(xùn)練,可以帶來(lái)0.9% mAP的提升。
影響本文算法性能的相關(guān)因素,主要包括類(lèi)別判別困難程度、尺度大小、樣本數(shù)量3個(gè)方面。本文用尺度大小和樣本數(shù)量2個(gè)因素對(duì)性能的影響進(jìn)行了分析,如圖8所示。結(jié)論如下。
1)對(duì)于本文算法無(wú)法檢測(cè)到的目標(biāo),主要是4種情況:樣本數(shù)量極少,如類(lèi)別24;樣本數(shù)量較少且類(lèi)內(nèi)差異較大,如類(lèi)別10;與其他某類(lèi)差異很小,如類(lèi)別18;與尺度大小沒(méi)有必然聯(lián)系。
圖8 算法性能的影響因素分析
2)對(duì)于本文算法容易檢測(cè)的目標(biāo),主要是尺度偏大且類(lèi)別特征明顯,如類(lèi)別20和類(lèi)別25。
3)大部分類(lèi)別的檢測(cè)性能與樣本數(shù)量和尺度大小基本呈正相關(guān),樣本數(shù)量少的類(lèi)別在訓(xùn)練時(shí)梯度信息容易被多數(shù)樣本覆蓋;而尺度較小使得目標(biāo)本身對(duì)定位精度要求很高。
圖9展示了本文算法的可視化檢測(cè)結(jié)果。圖9(a)原圖大小為1 379像素×1 199像素,檢測(cè)速度為0.582 4 s;圖9(b)原圖大小為2 041像素×1 302像素,檢測(cè)速度為0.637 s,可見(jiàn)本文算法能夠較好地處理陸地復(fù)雜背景環(huán)境的干擾。圖10組圖則從不同角度對(duì)算法的性能進(jìn)行了展示:第1列展示了算法對(duì)不同亮度變化影響的魯棒性;第2列展示了算法對(duì)不同大小的貨船檢測(cè)的穩(wěn)定性;第3列展示了檢測(cè)算法對(duì)多種類(lèi)別艦船的判別能力,以上可視化結(jié)果均為正確檢測(cè)的結(jié)果;第4列集中展示了本文算法的典型檢測(cè)錯(cuò)誤,包括類(lèi)別判別錯(cuò)誤(類(lèi)別5和類(lèi)別9具有較高的類(lèi)間相似性)造成的虛警、檢測(cè)框不準(zhǔn)確(背景區(qū)域與艦船區(qū)域具有較高的相似性)和部分漏檢(艦船排列過(guò)于緊密)。以上結(jié)果表明本文算法在近岸艦船檢測(cè)和識(shí)別上具有良好的魯棒性和較高的檢測(cè)率。
圖9 本文算法可視化檢測(cè)結(jié)果示例1
圖10 本文算法可視化檢測(cè)結(jié)果示例2
本文研究了基于深度學(xué)習(xí)的近岸艦船檢測(cè)和識(shí)別算法,提出了一種端到端的細(xì)粒度近岸艦船目標(biāo)檢測(cè)和識(shí)別框架。針對(duì)小型艦船對(duì)預(yù)設(shè)框角度變化敏感的問(wèn)題,提出角度致密化的策略,提升了小型艦船的檢測(cè)率;針對(duì)傳統(tǒng)的區(qū)域池化算法帶來(lái)的量化誤差問(wèn)題,采用改進(jìn)的方位敏感型區(qū)域插值池化模塊,可以更精確地建模艦船區(qū)域的局部特征;針對(duì)細(xì)粒度艦船分類(lèi)的問(wèn)題,利用基于注意力機(jī)制的局部和全局特征相融合的結(jié)構(gòu),增強(qiáng)了區(qū)域特征的類(lèi)別判別能力;針對(duì)樣本稀缺性問(wèn)題,提出預(yù)測(cè)層的權(quán)重遷移模塊,使用遷移學(xué)習(xí)進(jìn)一步提升了模型性能。實(shí)驗(yàn)結(jié)果表明,本文算法在細(xì)粒度近岸艦船目標(biāo)數(shù)據(jù)集上達(dá)到了較高的檢測(cè)性能和識(shí)別精度,但由于近岸艦船目標(biāo)背景環(huán)境復(fù)雜、類(lèi)別多樣、樣本稀缺以及部分區(qū)域艦船排列緊密等問(wèn)題,算法仍存在漏檢或某些類(lèi)別判別錯(cuò)誤的情況,如何針對(duì)性地改進(jìn)這些不足是未來(lái)的研究重點(diǎn)。