張銘津 臧 璠 岳 珂 許嘉敏 李云松 高新波
在紅外圖像目標(biāo)檢測中,盡早識別并鎖定目標(biāo)具有重要意義[1],因此,智能化紅外探測系統(tǒng)對小目標(biāo)的檢測與識別能力至關(guān)重要.然而在紅外探測系統(tǒng)成像過程中,由于探測距離較遠且目標(biāo)存在一定的反檢測技術(shù),圖像中的目標(biāo)通常表現(xiàn)為缺乏尺度、形狀、紋理等特征信息的少像素目標(biāo),甚至?xí)霈F(xiàn)只占一個像素的極端情況,再加上復(fù)雜背景干擾的存在,如大氣云層、紅外輻射、目標(biāo)紅外干涉手段等,如何準(zhǔn)確、快速、有效地檢測復(fù)雜場景下的紅外小目標(biāo)成為技術(shù)難點之一.因此,解決復(fù)雜背景下低信噪比的紅外小目標(biāo)檢測問題具有深遠意義.
在傳統(tǒng)的紅外小目標(biāo)檢測算法中,常用算法是使用簡單空域高通濾波器的Top-hat[2].該算法利用紅外小目標(biāo)與背景間灰度值的差異進行檢測,但并不能較好地濾除孤立的噪點,導(dǎo)致檢測率較低.
基于人類視覺系統(tǒng)機制(Human Visual System, HVS)的紅外小目標(biāo)檢測算法模擬人眼感知,將目光對準(zhǔn)小目標(biāo)導(dǎo)致的局部紋理變化.Chen等[3]充分利用局部區(qū)域中小目標(biāo)顯著性的特點,采用LCM(Local Contrast Measure)進行檢測,但存在不適合暗目標(biāo)、耗時較長等問題.針對文獻[3]的缺陷,Han等[4]結(jié)合DoG(Difference of Gaussians)與LCM,提出ILCM(Improved Local Contrast Measure).Wei等[5]提出MPCM(Multiscale Patch-Based Contrast Measure),達到進一步增強目標(biāo)、抑制背景的效果,但仍存在對暗目標(biāo)不敏感、耗時較長等問題.Gao等[6]提出IPI(Infrared Patch-Image Model)[6],但在面對復(fù)雜的紅外背景時,存在模糊的小目標(biāo)會過度收縮、有較強的背景物邊緣的問題,導(dǎo)致檢測率降低.Dai等[7]提出NIPPS(Non-negative Infrared Patch-Image Model Based on Partial Sum Minimization of Singular Values),采用奇異值的部分代替低階背景塊圖像,提供更準(zhǔn)確的背景估計,并且?guī)缀跸纸饽繕?biāo)圖像的殘差.Dai等[8]還提出RIPT(Single-Frame Small Target Detection Framework with Re-weighted Infrared Patch-Tensor Mo-del),使用稀疏的權(quán)重和局部的權(quán)重代替全局權(quán)重.Zhang等[9]采用新的非凸低秩約束,引入改進的局部先驗地圖,同時編碼目標(biāo)相關(guān)信息和背景相關(guān)信息,提出PSTNN(Partial Sum of Tensor Nuclear Norm).上述傳統(tǒng)的紅外小目標(biāo)檢測算法大多嚴(yán)重依賴于手工設(shè)計的特性和超參數(shù)的調(diào)整,并且魯棒性較差.
自2014年以來,深度學(xué)習(xí)在計算機視覺各領(lǐng)域迅速發(fā)展[10-11],學(xué)者們也將目光投向基于神經(jīng)網(wǎng)絡(luò)的紅外小目標(biāo)檢測算法的研究,并將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)和生成對抗網(wǎng)絡(luò)(Generative Adversarial Network, GAN)應(yīng)用到紅外小目標(biāo)檢測領(lǐng)域中,取得不錯性能[12].Lin等[11]利用深度卷積神經(jīng)網(wǎng)絡(luò)本身固有的多尺度、多層次結(jié)構(gòu),構(gòu)造FPN(Feature Pyramid Network),設(shè)計一種自頂向下的多尺度特征提取結(jié)構(gòu),提取不同級別的語義特征.Dai等[13]提出ACM(Asymmetric Contex-tual Modulation),同時利用自上而下(Top-Down)的全局注意力調(diào)制和自下而上(Bottom-Up)的局部注意力調(diào)制交換多尺度上下文信息,以便對語義信息和空間細(xì)節(jié)進行更豐富的編碼,但未關(guān)注網(wǎng)絡(luò)對不同層級特征的需求,不能充分提取圖像信息.2021年,Dai等[14]將膨脹卷積的概念引入紅外小目標(biāo)檢測中,提出ALCNet(Attentional Local Contrast Net-work),將局部對比度度量的方法模塊化為一個無參數(shù)的優(yōu)化網(wǎng)絡(luò)層,并以此打破小卷積核帶來的感受野限制,實現(xiàn)長距離的上下文信息互動.2022年,Zhang等[15]探索紅外小目標(biāo)檢測的特征補償和跨級別相關(guān)性,提出FC3-Net,其中,F-MFC(Fine-Detail Guided Multi-level Feature Compensation)探索精細(xì)細(xì)節(jié)引導(dǎo)的多層次特征聚合,補償下采樣和池化層中丟失的目標(biāo)特征,允許小目標(biāo)的特征完全轉(zhuǎn)移到深層中.2023年,Zhang等[16]提出CHFNet(Curvature Half-Level Fusion Network),設(shè)計HLF(Half-Level Fu-sion),在兩個層次的特征之間挖掘半層特征,曲率注意分支計算圖像的加權(quán)平均曲率,獲得邊界注意,再將其與各層次的特征融合.此外,Zhang等[17]提出Dim2Clear,設(shè)計基于SFA(Spatial and Frequency Atten-tion)的CMD(Context Mixer Decoder),根據(jù)生成的頻率注意圖進一步調(diào)制特征,同時提取空間上下文信息和頻率上下文信息.
上述網(wǎng)絡(luò)為紅外小目標(biāo)檢測性能帶來突破,很多神經(jīng)網(wǎng)絡(luò)的層次結(jié)構(gòu)是根據(jù)經(jīng)典結(jié)構(gòu)進行改進,依賴于實際經(jīng)驗,網(wǎng)絡(luò)結(jié)構(gòu)的可解釋性較差.由于紅外小目標(biāo)與背景之間信噪較低,仍存在難于在復(fù)雜背景下提取清晰的細(xì)節(jié)特征、容易丟失小目標(biāo)特征等問題造成的漏檢和虛警,檢測性能仍有待提高.
針對上述問題,本文在U-Net結(jié)構(gòu)基礎(chǔ)上,設(shè)計高階微分方程啟發(fā)的紅外小目標(biāo)檢測網(wǎng)絡(luò)(Infrared Small Target Detection Network Inspired by High-Order Differential Equation, HODE-Net).首先,聯(lián)系高階差分方程與神經(jīng)網(wǎng)絡(luò),利用四階Adams方程作為常微分方程的求解方法,設(shè)計四階Adams引導(dǎo)的特征融合模塊(Fourth-Order Adams Based Feature Fusion Mo-dule, FAM),對賦予特征權(quán)重因子聚合的多尺度特征圖進行更深層次的學(xué)習(xí),抑制特征疊加帶來的冗雜信息,實現(xiàn)更強的特征提取能力和特征復(fù)用效果.然后,設(shè)計目標(biāo)特征增強模塊(Target Feature En-hancement Module, TFEM),通過線性放大,從不同感受野獲得多尺度特征,與原始特征進行差分,獲得多尺度增益,抑制原始特征圖中復(fù)雜的背景噪聲,為特征提取主網(wǎng)絡(luò)提供增強的目標(biāo)信息.在SIRST數(shù)據(jù)集[8]上進行的大量實驗表明,HODE-Net具有較優(yōu)的檢測性能.
本文提出高階微分方程啟發(fā)的紅外小目標(biāo)檢測網(wǎng)絡(luò)(HODE-Net),網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,圖中,Fin表示來自SIRST數(shù)據(jù)集的輸入紅外圖像,Fout表示由語義分割網(wǎng)絡(luò)生成的分割結(jié)果.
圖1 HODE-Net結(jié)構(gòu)圖
HODE-Net在U-Net的基礎(chǔ)上進行改進,添加目標(biāo)特征增強模塊(TFEM)、四階Adams方程引導(dǎo)的特征融合模塊(FAM)和預(yù)測模塊.骨干網(wǎng)絡(luò)為ResNet-20再加兩個轉(zhuǎn)置卷積層,各層詳細(xì)信息如表1所示.TFEM使用不同感受野的特征對原始特征進行補償,旨在增強目標(biāo)和抑制背景,提供特征提取主網(wǎng)絡(luò)更有利的特征.四階Adams引導(dǎo)的FAM用于融合和學(xué)習(xí)U-Net中低層、中層和高層的不同尺度信息,獲取豐富的上下文信息,彌補下采樣操作容易丟失的細(xì)節(jié)特征.預(yù)測模塊包含順次連接的卷積層、歸一化層、ReLU激活層、隨機失活層和卷積層,獲得紅外小目標(biāo)檢測結(jié)果.
表1 骨干網(wǎng)絡(luò)的詳細(xì)信息
單一尺度的特征包含的信息是有限的,因此需要挖掘多尺度特征間的內(nèi)在聯(lián)系.利用不同尺度的特征進行交互指導(dǎo)可以達到這一目的,但如果只是簡單使用交互相關(guān)進行層級間的特征融合往往效果不佳.低級特征一般具有更高的分辨率、更詳細(xì)的位置信息和邊緣信息,即小目標(biāo)的大部分細(xì)節(jié)信息都包含在低級特征中.而高級特征一般含有的背景噪聲更小、語義信息更豐富,因此多尺度特征進行融合可得到同時具有豐富細(xì)節(jié)信息和高級語義信息的特征.
現(xiàn)有多尺度特征融合方法大多是通過相乘、相加和通道拼接等方式,利用特征之間的互補性進行融合,得到的融合特征具有各尺度特征的優(yōu)點.例如:FC3-Net[15]中的F-MFC將下采樣階段每層的輸入與輸出的不同尺度特征進行特征融合,獲取i層特征與i+1層特征,i層特征為低級特征,i+1層特征為中級特征,i+1層特征進行下采樣得到高級特征,將從不同層提取特征不斷補償進中級特征,得到的融合特征傳播到深層網(wǎng)絡(luò)中.CFC(Cross-Level Feature Correlation)將上采樣階段三層輸出的不同尺度特征進行特征融合,利用高級特征抑制中層特征中的背景噪聲,獲得純凈的目標(biāo)特征,再與低層次特征進行融合,但同時不可避免地產(chǎn)生冗雜信息,大幅影響網(wǎng)絡(luò)檢測性能,導(dǎo)致虛警率較高.
針對上述問題,本文提出的四階Adams引導(dǎo)的特征融合模塊(FAM),將下采樣階段最后一層的輸出與上采樣階段兩層的輸出進行特征融合,利用自適應(yīng)權(quán)重因子進行特征融合,減少冗雜信息的產(chǎn)生,并且利用四階Adams方法啟發(fā)式網(wǎng)絡(luò)加強目標(biāo)特征,去除產(chǎn)生的冗雜信息,最終獲得噪聲更小、細(xì)節(jié)信息和語義信息更豐富的特征.FAM結(jié)構(gòu)如圖2所示.
圖2 FAM結(jié)構(gòu)圖
FAM輸入是具有3個不同維度、不同語義層次的特征,即細(xì)節(jié)信息豐富但語義特征較弱的中級特征Fm和低級特征Fl、缺乏細(xì)節(jié)信息但語義特征較強的高級特征Fh.首先,將不同尺度特征統(tǒng)一尺度,以便后續(xù)融合,通過上采樣操作將所有不同尺度的特征映射到低層特征尺度,調(diào)整為與低層特征相同尺度的特征:
Fm→l=Upsample(Fm),Fh→l=Upsample(Fh),
其中Upsample(·)表示上采樣操作.統(tǒng)一尺度后的三層特征圖,經(jīng)過大小為1×1的卷積層,得到初始因子:
ωl=Conv(Fl),ωm=Conv(Fm→l),ωh=Conv(Fh→l),
其中Conv(·)表示卷積操作.
然后,為了抑制特征融合帶來的背景混疊現(xiàn)象,引入自適應(yīng)學(xué)習(xí)各尺度特征融合的特征權(quán)重因子:
θl、θm、θh的取值范圍都在[0,1]內(nèi).該權(quán)值反映網(wǎng)絡(luò)對不同級別特征映射的需求.
對獲得不同權(quán)重的不同層次特征圖進行聚合,得到抗混疊特征:
Ff=θlFl+θmFm→l+θhFh→l.
抗混疊特征Ff包含豐富的上下文信息,語義特征較強、細(xì)節(jié)信息豐富,有利于提高檢測性能.
在抑制背景混疊的同時也會削弱小目標(biāo)區(qū)域特征,因此再采用四階Adams方法啟發(fā)式網(wǎng)絡(luò)進行更深層的學(xué)習(xí),使多尺度特征圖具有更詳細(xì)準(zhǔn)確的特征.四階Adams方法啟發(fā)式網(wǎng)絡(luò)借鑒數(shù)學(xué)領(lǐng)域的思想改進網(wǎng)絡(luò)結(jié)構(gòu),Weinan等[18]觀察ResNet和常微分方程(Ordinary Differential Equations, ODE)之間的關(guān)系,將深層神經(jīng)網(wǎng)絡(luò)嵌入離散動力系統(tǒng),確定ResNet和ODE的離散化之間的相似性.Chen等[19]利用神經(jīng)常微分方程(Neural ODE, NODE),解釋普通微分方程的一階歐拉離散法,用于構(gòu)建神經(jīng)網(wǎng)絡(luò),動態(tài)調(diào)整不同輸入的結(jié)構(gòu)或參數(shù),進一步提升性能.
具體來說,此類方法利用有限差分方程實現(xiàn)ODE的離散化,其中偏導(dǎo)數(shù)可以使用一組近似差分代替.由于四階Adams隱式方程的ODE精度高于歐拉方法,本文的四階Adams方法啟發(fā)式網(wǎng)絡(luò)采用四階Adams隱式方程求解的ODE設(shè)計得到.網(wǎng)絡(luò)由三個殘差塊組成,每個殘差塊的結(jié)構(gòu)為順序連接的卷積層-激活層-卷積層-激活層,卷積層的卷積核大小為3×3,填充和步長均為1,激活函數(shù)均采用ReLU函數(shù),具體設(shè)計過程如下.
四階Adams隱式公式可表示為
定義
f=y-x,
并令h=1,得
(1)
將xn、yn看作某一模塊的輸入和輸出,xn也表示前一模塊的輸出yn-1,即xn=yn-1,類似地,
xn+1=yn,xn-1=yn-2,xn-2=yn-3,
則式(1)可改寫為
(2)
為了方便深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,采用殘差學(xué)習(xí)的思想,使用Δyn表示yn和yn-1之間的殘差,即
Δyn=yn-yn-1,
類似地,
Δyn-1=yn-1-yn-2,Δyn-2=yn-2-yn-3,
則式(2)可改寫為
上式建立yn+1、yn、yn-1、yn-2和yn-3這五項之間的關(guān)系,將上述方程應(yīng)用于3個殘差中,構(gòu)建更強大的可解釋網(wǎng)絡(luò).高階差分方程計算四階Adams方法啟發(fā)式網(wǎng)絡(luò)的輸入特征和輸出特征之間的殘差,再在輸出特征中進行補償,在更多特征項之間建立聯(lián)系,減少信息在網(wǎng)絡(luò)傳播過程中的流失,具有更強的特征提取能力和更高效的特征復(fù)用.在FAM中,四階Adams方法啟發(fā)式網(wǎng)絡(luò)可以作為一個信息瓶頸以抑制高頻噪聲,同時通過反傳播梯度加強目標(biāo)特征.
在特征提取主網(wǎng)絡(luò)之前,目標(biāo)特征增強模塊(TFEM)對原始特征圖進行增強目標(biāo)、抑制背景噪聲的初步處理,具體結(jié)構(gòu)如圖3所示.
圖3 TFEM結(jié)構(gòu)圖
TFEM首先使用大小為3×3的卷積層Conv3×3和5×5的卷積層Conv5×5,從不同空間大小提取特征信息,越小的卷積核越傾向于關(guān)注小尺度的特征.兩個卷積層得到的特征在通道維度上串聯(lián),得到合并特征:
Fcat=Cat[Conv3×3(Fenter),Conv5×5(Fenter)],
其中Cat(·)表示Concat連接.通過一個1×1的卷積層Conv1×1進行融合,得到多尺度特征:
Fs=Conv1×1(Fcat).
然后,將多尺度特征與原始特征進行差分,獲得多尺度增益:
FΔ=Fs-Fenter.
通過線性標(biāo)度增強有用的多尺度特征,可在抑制背景噪聲的同時增強目標(biāo)特征.最后,利用增強后的多尺度特征對原始特征映射進行補償,得到具有豐富小目標(biāo)特征的特征圖,便于后續(xù)網(wǎng)絡(luò)檢測的紅外小目標(biāo)的信息更加完整.具體特征圖為:
Fi=βReLU(FΔ)+Fenter,
其中,ReLU(·)表示ReLU激活函數(shù),β表示線性放大因子.
本文實驗使用公開可用的SIRST數(shù)據(jù)集[8].數(shù)據(jù)集包含427幅紅外圖像和480個具有精確注釋的實例,并將50%的圖像作為訓(xùn)練集,30%的圖像作為驗證集,20%的圖像作為測試集.本文使用ACM[13]和ALCNet[14]中的數(shù)據(jù)集劃分方法,確保數(shù)據(jù)集的一致性.此外,文中所有對比實驗和消融實驗都以相同的方式劃分?jǐn)?shù)據(jù)集,確保實驗的公平性.
本文使用交并比(Intersection over Union, IoU)、歸一化交并比(Normalization IoU, nIoU)、受試者工作特性曲線(Receiver Operating Characteris-tic Curve, ROC)、檢測率(Pd)和虛警率(Fa)這5個評價指標(biāo).IoU、nIoU定義為
其中,T表示真值像素,P表示預(yù)測為正確的像素,TP表示預(yù)測為正確且是真值的像素數(shù)量.nIoU是專門為紅外小目標(biāo)檢測設(shè)計的指標(biāo),更適合評估紅外小目標(biāo)檢測的性能.
Pd表示被預(yù)測為正確的真值占總真值的比例:
其中FN表示預(yù)測為錯誤且是真值的像素數(shù)量.Fa表示被正確預(yù)測的假值占總假值的比例:
其中,FP表示預(yù)測為正確且是假值的像素,TN表示預(yù)測為錯誤且是假值的像素,Pd也稱作真陽性率(True Positive Rate, TPR),Fa也稱作假陽性率(False Positive Rate, FPR),ROC曲線描述真陽性率與假陽性率之間的動態(tài)關(guān)系.
本文實驗使用AdaGrad作為優(yōu)化器,學(xué)習(xí)速率為0.05,權(quán)值初始化策略采用He等[20]提出的一種魯棒初始化方法.
訓(xùn)練過程共包含3 000個迭代周期,權(quán)值衰減為10-4,批次大小為32.
HODE-Net采用無需預(yù)訓(xùn)練的隨機初始化,在保證網(wǎng)絡(luò)性能的前提下,實現(xiàn)網(wǎng)絡(luò)輕量化.
本節(jié)對HODE-Net的各模塊進行消融實驗,驗證各模塊對提高網(wǎng)絡(luò)性能的有效性.
在相同的實驗參數(shù)下,將FAM分別應(yīng)用于FPN[11]和U-Net上,研究FAM對紅外小目標(biāo)檢測任務(wù)檢測性能的影響,結(jié)果如表2所示.從表中可以看到,在加入FAM后,網(wǎng)絡(luò)檢測性能有明顯提升,相比單一FPN,加入FAM后網(wǎng)絡(luò)的IoU和nIoU值分別提升3.83%和4.05%.相比單一U-Net,加入FAM后網(wǎng)絡(luò)的IoU和nIoU值分別提升4.68%和4.50%.綜上所述,FAM能夠合理利用特征信息,具有較高的特征提取能力,可大幅提升網(wǎng)絡(luò)性能.
表2 各模塊對方法性能的影響
將TFEM分別應(yīng)用于ACM+U-Net、ACM+FPN、U-Net+FAM和FPN+FAM上,進行四組消融實驗,結(jié)果如表2所示.由表中可得到,加入TFEM后網(wǎng)絡(luò)的IoU和nIoU值均得到較大提升,驗證TFEM對提升網(wǎng)絡(luò)性能的有效性.
從表2還可得到,相比單一FAM,FAM和TFEM共同應(yīng)用于網(wǎng)絡(luò)上,性能提升更多.相比單一FPN,加入FAM和TFEM后網(wǎng)絡(luò)的IoU和nIoU值分別提升6.08%和5.71%,相比單一U-Net,加入FAM和TFEM后網(wǎng)絡(luò)的IoU和nIoU值分別提升6.35%和6.12%.同時可以得到,相比FPN+FAM+TFEM,U-Net+FAM+TFEM的IoU和nIoU值更高,因此選擇U-Net作為基礎(chǔ)網(wǎng)絡(luò)的性能更優(yōu).
上述實驗結(jié)果能夠驗證FAM和TFEM二者相輔相成,TFEM在基礎(chǔ)網(wǎng)絡(luò)前進行特征初步處理,FAM在基礎(chǔ)網(wǎng)絡(luò)后有效融合多尺度特征,進而達到增強有用信息、抑制無用信息、消除干擾信息的效果.
FAM的特征可視化結(jié)果如圖4所示.對比抗混疊特征、低級特征、中級特征和高級特征可以發(fā)現(xiàn),抗混疊特征包含的背景噪聲最少且目標(biāo)特征最清晰.對比FAM的輸出特征與抗混疊特征可發(fā)現(xiàn),抗混疊特征在經(jīng)過更深層的學(xué)習(xí)之后,目標(biāo)區(qū)域得到增強,輸出特征具有更詳細(xì)準(zhǔn)確的目標(biāo)特征.
(a)低級特征
在TFEM中,β為線性放大因子,β值對重構(gòu)特征圖的質(zhì)量具有較大影響.定義β=0,1,2,3,4,相應(yīng)的HODE-Net的IoU和nIoU值如表3所示.
表3 β不同時HODE-Net的指標(biāo)值對比
由表3可以得到,相比β=0,當(dāng)β=1時,HODE-Net的IoU和nIoU值均有所提高,說明放大多尺度目標(biāo)特征確實能提升檢測性能.特別地,當(dāng)β=2時,IoU和nIoU值均達到最大值,檢測性能最優(yōu),當(dāng)β=3,4時,IoU值提高,nIoU值降低,這是由于在β值較高時,進一步放大多尺度目標(biāo)信息的同時也會放大與紅外小目標(biāo)物理特性相似的高亮噪聲,從而導(dǎo)致nIoU值下降.
本節(jié)選擇如下對比網(wǎng)絡(luò):Top-hat[2],文獻[3]網(wǎng)絡(luò),ILCM[4],MPCM[5],IPI[6],NIPPS[7],PSTNN[9],FPN[11],ACM[13],ALCNet[14],FC3-Net[15],CHF-Net[16],GAU(Gated Attention Unit)[21],SK(Selective Ker-nel)[22].各網(wǎng)絡(luò)的IoU、nIoU、Pd和Fa結(jié)果如表4所示.
表4 各網(wǎng)絡(luò)的指標(biāo)值對比
由表4可知,HODE-Net的指標(biāo)值顯著高于其它網(wǎng)絡(luò),檢測性能最優(yōu).
當(dāng)數(shù)據(jù)集上的正樣本和負(fù)樣本之間存在不平衡時,ROC是一種平衡評估方法,反映IoU和nloU在固定閾值下的分割性能.ALCNet、PSTNN、FC3-Net、IPI、HODE-Net的ROC曲線如圖5所示.由圖可以看出,HODE-Net的性能最優(yōu).由此表明HODE-Net可大幅提升紅外小目標(biāo)檢測性能.
圖5 各網(wǎng)絡(luò)的ROC曲線
目前性能最優(yōu)的GAU、ACM、ALCNet、FC3-Net、CHFNet與HODE-Net在SIRST數(shù)據(jù)集上檢測的部分視覺結(jié)果如圖6所示.
(a)紅外圖像
從圖6可以看出,對于真實紅外圖像,現(xiàn)有網(wǎng)絡(luò)都能檢測出小目標(biāo),但檢測的小目標(biāo)與標(biāo)簽真實值仍具有較大差異,并且出現(xiàn)虛警現(xiàn)象,而HODE-Net的視覺結(jié)果明顯更優(yōu),能夠檢測與標(biāo)簽真實值相似的輪廓,保留小目標(biāo)的角度和細(xì)節(jié)信息.綜上所述,HODE-Net的視覺效果較優(yōu).
本文提出高階微分方程啟發(fā)的紅外小目標(biāo)檢測網(wǎng)絡(luò)(HODE-Net).首先,在可解釋的理論指導(dǎo)下設(shè)計四階Adams引導(dǎo)的特征融合模塊,將特征提取主網(wǎng)絡(luò)獲得的低級特征、中級特征、高級特征賦予自適應(yīng)的權(quán)重因子再融合,進行更精細(xì)的特征提取,抑制特征融合時產(chǎn)生的冗雜信息,減少特征信息的丟失.然后,設(shè)計的目標(biāo)特征增強模塊對原始特征進行處理,通過放大不同感受野獲得的目標(biāo)特征補償原始特征圖,在增強目標(biāo)特征的同時抑制背景噪聲.最后,在公開的SIRST數(shù)據(jù)集上進行大量實驗,通過消融實驗驗證四階Adams方程引導(dǎo)的特征融合模塊和目標(biāo)特征增強模塊的有效性.對比多種現(xiàn)有紅外小目標(biāo)檢測方法,HODE-Net的客觀評估指標(biāo)與視覺結(jié)果均更優(yōu).今后將考慮對邊緣細(xì)節(jié)進行更細(xì)致的提取與處理,提高檢測準(zhǔn)確率,并構(gòu)建更輕量化的模型.