王 磊,高 揚(yáng),張 慧,郝永平
(沈陽理工大學(xué)機(jī)械工程學(xué)院,遼寧 沈陽 110159)
紅外小目標(biāo)檢測(cè)被廣泛應(yīng)用于紅外制導(dǎo)、預(yù)警等軍事領(lǐng)域[1]。紅外小目標(biāo)的像素與整張圖的像素比不超過圖像整體的0.15%,成像面積只有幾個(gè)像素到十幾個(gè)像素,在復(fù)雜背景的情況下,小目標(biāo)往往只含有少量的語義特征。由于目標(biāo)在成像系統(tǒng)較遠(yuǎn)處,紅外輻射的能量在距離上顯著衰弱狀態(tài),紅外小目標(biāo)易淹沒在背景之中,目標(biāo)檢測(cè)難度較大,在此條件下的檢測(cè)能力具有理論意義和應(yīng)用價(jià)值。
為提升小目標(biāo)的檢測(cè)能力,國(guó)內(nèi)外學(xué)者通過深度學(xué)習(xí)的計(jì)算機(jī)視覺技術(shù)在目標(biāo)檢測(cè)領(lǐng)域獲得了重大進(jìn)展[2-11]。目前,基于卷積神經(jīng)網(wǎng)絡(luò)[4]的深度學(xué)習(xí)檢測(cè)算法成為主流,按照是否存在候選區(qū)可分為一階段目標(biāo)檢測(cè)[5]和兩階段目標(biāo)檢測(cè)[6]算法。兩階段算法是在產(chǎn)生候選框的前提下在對(duì)候選區(qū)域內(nèi)目標(biāo)進(jìn)行分類和回歸,如CNN[7],R-CNN[8],Fast R-CNN[9]等,算法雖精度高,實(shí)時(shí)性差,檢測(cè)小目標(biāo)效果差;一階段算法不對(duì)候選區(qū)進(jìn)行提取,只用一級(jí)網(wǎng)絡(luò)完成了分類和回歸,這類算法主要有SSD[10],YOLO[11]等,算法雖實(shí)時(shí)性高,但檢測(cè)精度低。
針對(duì)紅外小目標(biāo)識(shí)別過程受到復(fù)雜背景的干擾,目標(biāo)特征不明顯,易丟失等問題,提出了一種基于改進(jìn)SSD與DSST方法的紅外小目標(biāo)檢測(cè)算法,通過通道-空間注意力機(jī)制與FPN特征金字塔結(jié)構(gòu)改進(jìn)SSD網(wǎng)絡(luò),采用DSST對(duì)目標(biāo)下一幀目標(biāo)進(jìn)行位置和尺度預(yù)測(cè)。在PC端與ZYNQ嵌入式平臺(tái)聯(lián)合搭建了目標(biāo)融合模擬系統(tǒng),可將待測(cè)小目標(biāo)融入到復(fù)雜背景下,實(shí)現(xiàn)預(yù)定場(chǎng)景模擬,對(duì)所提算法進(jìn)行評(píng)估和驗(yàn)證。
傳統(tǒng)SSD卷積網(wǎng)絡(luò)特征非線性程度不夠,僅靠目標(biāo)訓(xùn)練不能獲得理想的識(shí)別精度[11]。在主干檢測(cè)網(wǎng)絡(luò)生成特征圖階段引入注意力機(jī)制,使檢測(cè)網(wǎng)絡(luò)更加關(guān)注特征圖中目標(biāo)可能存在的位置區(qū)域,提高卷積對(duì)特征圖的遍歷速度和小目標(biāo)識(shí)別準(zhǔn)確率。同時(shí)增加目標(biāo)上下文信息,縮小檢測(cè)范圍,提升紅外小目標(biāo)的檢測(cè)能力算法原理為:通過CBAM機(jī)制對(duì)網(wǎng)絡(luò)生成的特征圖Z分別產(chǎn)生一維通道注意力、二維空間注意力共兩個(gè)尺度的特征圖,推斷出特征圖的注意力權(quán)重系數(shù)。特征圖中每一個(gè)通道作為一個(gè)特征檢測(cè)器,選擇利用最大池化和平均池化的方法學(xué)習(xí)目標(biāo)的判別性特征,將特征送入一個(gè)共享的多層感知機(jī)(MLP)網(wǎng)絡(luò)中得到通道注意力權(quán)重,將每個(gè)通道的權(quán)重與原卷積的特征加權(quán)融合[11]來提取目標(biāo)特征信息,通道注意力參數(shù)矩陣為:
Mc(Z)=σ(W1(W0(Zavg,c))+W1(W0(Zmax,c)))
(1)
其中:Z為輸入特征圖;σ為激活函數(shù);Zavg,c和Zmax,c分別表示平均池化和最大池化;W0,W1為兩個(gè)全連接層各自的權(quán)重參數(shù)。
對(duì)于空間注意力機(jī)制關(guān)注特征圖中重要信息的位置,將通道注意力產(chǎn)生的特征圖拼接起來,對(duì)拼接起來的特征圖上進(jìn)行卷積操作產(chǎn)生最終的空間注意力特征圖,空間注意力參數(shù)矩陣為:
Ms(Z)=σ(f7×7(Zavg,c;Zmax,c))
(2)
其中f表示卷積核為7×7的卷積核。
將通道注意力機(jī)制生成的通道注意力矩陣與輸入特征圖進(jìn)行元素級(jí)相乘得到Z′,再將Z′與空間注意力矩陣進(jìn)行元素級(jí)相乘得到輸出特征圖Z″,如式(3)、式(4)所示,式中?表示元素級(jí)相乘。
Z′=Mc(Z)?Z
(3)
Z″=Ms(Z)?Z′
(4)
針對(duì)紅外圖像對(duì)比度較低、分辨細(xì)節(jié)能力差、目標(biāo)特征不明顯問題,以及傳統(tǒng)SSD卷積網(wǎng)絡(luò)模型中并沒有使用原始圖像的底層特征,其深層特征的語義信息無法與淺層結(jié)構(gòu)信息融合,造成目標(biāo)細(xì)節(jié)信息丟失。
利用FPN算法將檢測(cè)網(wǎng)絡(luò)的淺層次特征與高層次特征在“自下而上”的數(shù)據(jù)流向基礎(chǔ)上采用橫向連接,把高層語義信息傳遞給淺層檢測(cè)網(wǎng)絡(luò),實(shí)現(xiàn)多尺度的信息融合,豐富底層特征圖的語義信息,提升小目標(biāo)的檢測(cè)能力。FPN算法改進(jìn)的SSD網(wǎng)絡(luò)架構(gòu)如圖1所示。
圖1 FPN算法改進(jìn)SSD網(wǎng)絡(luò)架構(gòu)圖Fig.1 Improved SSD network architecture of FPN algorithm
以VGG16的SSD網(wǎng)絡(luò)為基礎(chǔ)對(duì)卷積網(wǎng)絡(luò)進(jìn)行改進(jìn),紅色箭頭代表Conv1×1卷積核的卷積操作,意在改變特征的輸出個(gè)數(shù)的同時(shí),不改變特征尺度,將反卷積和卷積輸出的特征圖保持?jǐn)?shù)據(jù)一致性。綠色箭頭代表上采樣,通過反卷積操作使進(jìn)行反卷積之后的深層特征圖與鄰近上一層特征圖保持大小和通道數(shù)相同?!皑挕北硎緦⑸喜蓸雍虲onv1×1卷積后的特征圖對(duì)應(yīng)元素線性疊加,所疊加兩個(gè)特征圖的寬度、高度以及通道數(shù)均相等。改進(jìn)網(wǎng)絡(luò)輸出6種不同尺度的特征圖,利用3×3卷積核對(duì)融合疊加結(jié)果進(jìn)行卷積計(jì)算來解決上采樣的混疊效應(yīng)。
上述的空間-通道注意力機(jī)制與FPN算法改進(jìn)的SSD檢測(cè)網(wǎng)絡(luò)對(duì)紅外小目標(biāo)的檢測(cè)能力有明顯提高,但在復(fù)雜背景下易受其他目標(biāo)干擾,導(dǎo)致小目標(biāo)丟失和誤檢。為解決問題,將DSST算法與改進(jìn)的SSD檢測(cè)網(wǎng)絡(luò)相結(jié)合,利用上一幀對(duì)目標(biāo)當(dāng)前幀位置和尺度進(jìn)行精確估計(jì),實(shí)現(xiàn)目標(biāo)檢測(cè)。通過給改進(jìn)的SSD檢測(cè)網(wǎng)絡(luò)設(shè)置閾值來判別檢測(cè)是否準(zhǔn)確,將檢測(cè)不準(zhǔn)確的圖像輸入到DSST算法進(jìn)行二次檢測(cè),此方法有效避免改進(jìn)的SSD網(wǎng)絡(luò)誤檢和漏檢問題?;诟倪M(jìn)SSD網(wǎng)絡(luò)與DSST的紅外小目標(biāo)檢測(cè)算法總流程圖如圖2所示。
圖2 改進(jìn)SSD網(wǎng)絡(luò)與DSST的紅外小目標(biāo)檢測(cè)流程圖Fig.2 Flow chart of improving SSD network and DSST infrared small target detection