白 皓,白廷柱
(北京理工大學(xué) 光電學(xué)院,北京 100081)
紅外成像技術(shù)是根據(jù)輻射原理成像而得到紅外圖像,圖像的亮度表征物體表面的溫度。由于具有隱蔽性好、全天候、適應(yīng)雨霧等特殊氣象條件等優(yōu)良特性,因此得到了廣泛應(yīng)用[1-4]。然而受制于紅外圖像的成像機(jī)理、成像系統(tǒng)特性的影響,紅外圖像通常具有信噪比低、分辨率低和邊緣模糊的特點(diǎn),圖像中往往缺少細(xì)節(jié),這限制了紅外圖像的進(jìn)一步應(yīng)用。因此,如何提高圖像分辨率并增強(qiáng)紅外圖像中的細(xì)節(jié),成為了重要需求。
超分辨率(super resolution,SR)算法[5]是指從同一場景的一個(gè)或多個(gè)低分辨率觀測結(jié)果中恢復(fù)高分辨率圖像的任務(wù)。根據(jù)輸入的低分辨率圖像(low resolution,LR)的數(shù)量,可以將超分辨率算法(super resolution,SR)分為單圖像超分辨率(single-imagesuper-resolution,SISR)和多圖像超分辨率(multipleimage-super-resolution,MISR)。與MISR 相比,SISR因其高效而廣受歡迎。由于具有高感知質(zhì)量的HR(high resolution,HR)圖像具有更多有價(jià)值的細(xì)節(jié),因此它被廣泛用于許多領(lǐng)域,例如醫(yī)學(xué)成像,衛(wèi)星成像和安全成像[6-8]。典型的SISR 框架中,LR 圖像建模如下:
式中:IHR是對應(yīng)的是模型輸入的原始場景高分辨率圖像;Mk表示運(yùn)動(dòng)位移矩陣;Dk為降采樣矩陣;n表示噪聲向量。圖像的超分辨率重建就是根據(jù)圖像的退化模型進(jìn)行的逆過程。通常低分辨圖像可以被認(rèn)為是降質(zhì)模型的輸出;在超分辨率算法中,研究者們試圖從ILR中恢復(fù)出高分辨圖像ISR盡可能地接近原始的退化前的高分辨圖像IHR,過程如公式表示為:
式中:F代表超分辨率重建模型;θ是模型中的參數(shù)。但該等式并不是唯一的,因?yàn)楦叻直鎴D像的退化可能同時(shí)受到多個(gè)退化因素的影響,圖像超分辨率重構(gòu)過程中也無法確定退化因素的種類,因此該公式的解不是唯一的,即在圖像超分辨率重建過程中一個(gè)低分辨的輸出可能獲取多個(gè)高分辨的輸入。因而超分辨率重構(gòu)問題也被看作是一個(gè)病態(tài)問題。
傳統(tǒng)SISR 的算法主要分為3 類:基于插值的超分辨率方法、基于重構(gòu)的超分辨率方法和基于學(xué)習(xí)的超分辨率方法。基于插值的超分辨率方法原理簡單,其重構(gòu)效果不是很好,在超分辨率領(lǐng)域應(yīng)用有限。基于重構(gòu)的超分辨率方法是從輸入圖像中提取所有有用信息,整個(gè)超分辨率過程等于信息提取和信息融合過程,以輸入圖像先驗(yàn)知識和全局重構(gòu)限制作為正則項(xiàng),構(gòu)建代價(jià)函數(shù)求解逆運(yùn)算,此方法能保持清晰的圖像邊緣,但不能有效恢復(fù)紋理細(xì)節(jié)信息?;趯W(xué)習(xí)的超分辨率技術(shù)是借助機(jī)器學(xué)習(xí)知識,以大量的訓(xùn)練圖像學(xué)習(xí)先驗(yàn)?zāi)P?,用學(xué)習(xí)過程中獲得的知識對低分辨率圖像中丟失的高頻細(xì)節(jié)信息進(jìn)行預(yù)測和補(bǔ)充,它能生成豐富的高頻細(xì)節(jié)部分和紋理信息,但難以控制偽像失真。
隨著深度學(xué)習(xí)的發(fā)展,基于深度學(xué)習(xí)[8]的SISR 算法顯示出優(yōu)于其他基于學(xué)習(xí)的方法的性能。SRCNN[9]是第一種使用深度學(xué)習(xí)方法的超分辨率算法,該方法表現(xiàn)出遠(yuǎn)超傳統(tǒng)方法的學(xué)習(xí)能力,但該算法是先將圖像進(jìn)行上采樣而后再利用卷積層進(jìn)行學(xué)習(xí),因而其結(jié)果中可能會出現(xiàn)將噪聲和有價(jià)值信號同時(shí)放大的情況,影響重構(gòu)結(jié)果的信噪比。VDSR(very deep super resolution)[10]是SISR 算法中第一種深層網(wǎng)絡(luò),該網(wǎng)絡(luò)由20 層VGG 組成,通過學(xué)習(xí)插值結(jié)果和高分圖像之間的殘差,以代替原來的直接映射。SRGAN(semi-supervised learning with generative adversarial networks)[11]將GAN 網(wǎng)絡(luò)應(yīng)用超分辨網(wǎng)絡(luò),構(gòu)建一個(gè)具有感知損失的更深層網(wǎng)絡(luò)的生成對抗網(wǎng)絡(luò)以構(gòu)造逼真的超分圖像。
EDSR(enhanced deep residual networks)[12]在ResNet[13]基礎(chǔ)上設(shè)計(jì)了一種新的模塊,擴(kuò)大模型的尺寸來提升結(jié)果質(zhì)量。ESPCN(efficient sub-pixel convolutional neural network)[14]使用亞像素上采樣的方法對圖像進(jìn)行快速的超分辨率重建,僅在最后階段將低分辨率圖像放大為高分辨率圖像,是一種高效、快速的像素重排列的超分辨率算法。
上述方法對SISR 表現(xiàn)出良好的效果,但應(yīng)用于紅外圖像時(shí)仍需改進(jìn):
一方面,卷積層提取特征時(shí)會很好地保留低頻信息,高頻信息會作為冗余信息舍棄,進(jìn)而在重構(gòu)圖像中造成細(xì)節(jié)缺失,由于紅外圖像中信息量少相比可見光圖像影響更大;另一方面,大多數(shù)的SISR 中的網(wǎng)絡(luò)模塊對其他層的特征利用較少,無法避免卷積層在使用過程中的信息損失。
根據(jù)以上分析,本文針對紅外圖像特點(diǎn)提出深度殘差神經(jīng)網(wǎng)絡(luò)的超分辨率重構(gòu)算法,結(jié)合密集網(wǎng)絡(luò)、殘差結(jié)構(gòu)以及亞像素上采樣等結(jié)構(gòu)優(yōu)點(diǎn),得到高質(zhì)量紅外重構(gòu)圖像,為后續(xù)的語義分割、目標(biāo)識別等創(chuàng)造條件。
基于深度學(xué)習(xí)的超分辨率模型專注于研究低分辨率圖像與原始高分辨率圖像之間的差異,雖然網(wǎng)絡(luò)模型之間差異巨大,但本質(zhì)上是一些模塊的組合,比如模型框架、上采樣方法等。因此,我們可以根據(jù)特定用途將這些模塊集成起來構(gòu)造出一個(gè)超分辨率模型。本文設(shè)計(jì)的深度卷積殘差網(wǎng)絡(luò)結(jié)構(gòu)由殘差單元構(gòu)成深度殘差強(qiáng)化模塊,上采樣部分我們使用亞像素上采樣層。
紅外圖像信息量少,分辨率低,網(wǎng)絡(luò)需要學(xué)習(xí)到足夠的圖像中的信息才能保證重構(gòu)圖像質(zhì)量。即使是網(wǎng)絡(luò)中少量信息損失都可能會影響最終的重構(gòu)圖像質(zhì)量。對于超分辨率算法來說,網(wǎng)絡(luò)深度增加意味著網(wǎng)絡(luò)會損失更多的高頻細(xì)節(jié),在重構(gòu)圖像中圖像細(xì)節(jié)會有相應(yīng)的損失。在語義分割、目標(biāo)識別等高級圖像任務(wù)中,ResNet 被用來解決卷積神經(jīng)網(wǎng)絡(luò)深度加深時(shí)會產(chǎn)生梯度爆炸的現(xiàn)象,但由于圖像超分辨率任務(wù)是圖像到圖像的映射任務(wù),僅需研究輸入圖像與目標(biāo)圖像高度相關(guān)僅學(xué)習(xí)它們之間的差異即可,一些模塊在超分辨率任務(wù)中并不是必要的,因而不能直接套用到超分辨這種低級視覺問題上。比如BN 層主要應(yīng)用于輸入圖像的數(shù)據(jù)分布和輸出數(shù)據(jù)的分布不一致的情況。對于超分辨率任務(wù)來說,輸入和輸出的數(shù)據(jù)分布非常接近。因此一些研究保留了ResNet 的跳線結(jié)構(gòu)并去掉了BN 層,有效地降低了網(wǎng)絡(luò)的計(jì)算量。如圖1所示,EDSR 提出的這個(gè)殘差塊(residual block)沒有應(yīng)用池化層和批量歸一化(batch normalization,BN)層,去掉后的網(wǎng)絡(luò)就可以堆疊更多的網(wǎng)絡(luò)層或者使每層提取更多的特征,從而得到更好的性能表現(xiàn)。由于大多數(shù)的殘差區(qū)域接近零,模型的復(fù)雜性和學(xué)習(xí)難度大大降低。而跳線連接方式的保留本身就可以減輕由于網(wǎng)絡(luò)深度不斷增加而導(dǎo)致的降級問題,減少訓(xùn)練難度并提高學(xué)習(xí)能力。
圖1 幾種殘差學(xué)習(xí)模塊結(jié)構(gòu)對比Fig.1 Comparison of the several residual learning modules
針對紅外圖像中信息量少的特點(diǎn),我們改變原有ResNet 中的激活函數(shù)。ReLU(可以按公式(3)計(jì)算)保留了階躍函數(shù)的生物啟發(fā)(即只有當(dāng)輸入超過閾值時(shí)神經(jīng)元才會被激活),允許基于梯度的學(xué)習(xí)(盡管在x=0 時(shí),導(dǎo)數(shù)未定義)。因?yàn)楹瘮?shù)及其導(dǎo)數(shù)都不包含復(fù)雜的數(shù)學(xué)運(yùn)算,所以此函數(shù)計(jì)算過程非??臁5钱?dāng)輸入小于零或梯度為零時(shí),其權(quán)重?zé)o法更新,此時(shí)ReLU 的學(xué)習(xí)速度會變慢,甚至可能使神經(jīng)元直接失效。Leaky ReLU 函數(shù)(Leaky Rectified Linear Unit,LeakyReLU)(可按公式(4)計(jì)算)是經(jīng)典ReLU 激活函數(shù)的變體。其中a 需人工設(shè)置,一般為0.01 或0.001數(shù)量級的較小正數(shù)。當(dāng)輸入為負(fù)時(shí),這個(gè)函數(shù)的輸出仍然有一個(gè)小的斜率。當(dāng)導(dǎo)數(shù)非零時(shí),可以減少沉默神經(jīng)元的出現(xiàn),允許基于梯度的學(xué)習(xí)(雖然會很慢),從而解決ReLU 函數(shù)進(jìn)入負(fù)區(qū)間后神經(jīng)元不學(xué)習(xí)的問題。與ReLU 相比,LeakyReLU 具有更大的激活范圍。
紅外探測器相比可見光探測器像元數(shù)量少,獲取的紅外圖像的分辨率低,為便于顯示多采用插值法以提高圖像分辨率。一般插值法是通過目標(biāo)函數(shù)在若干點(diǎn)的函數(shù)值或者導(dǎo)數(shù)值附近構(gòu)造一個(gè)與目標(biāo)函數(shù)相近似的低次插值多項(xiàng)式。該方法增加了圖像的美觀性,但在某種程度上喪失了部分?jǐn)?shù)據(jù)的真實(shí)性,沒有考慮到原有像素間的分布特點(diǎn),僅能針對局部小區(qū)域進(jìn)行運(yùn)算并且運(yùn)算量巨大,在某種程度上喪失了部分?jǐn)?shù)據(jù)的真實(shí)性,因而在重構(gòu)圖像中可能會出現(xiàn)紋理?xiàng)l紋或者局部模糊甚至對求梯度優(yōu)化有害。
亞像素上采樣層又稱像素混合層(pixel-shuffle layer)不同于基于插值的上采樣方法,該層的插值函數(shù)隱含在前一個(gè)卷積層中,可以自動(dòng)學(xué)習(xí)。在本文中,亞像素層可以表示為:
其中PS 代表亞像素上采樣運(yùn)算,WL代表卷積操作。
式中:mod()表示在最后一層的前一層進(jìn)行的卷積操作;s是比例因子。
亞像素上采樣層是一個(gè)端到端的上采樣層,執(zhí)行上采樣通過卷積產(chǎn)生多個(gè)通道然后重塑它們。在這一層中,假設(shè)輸入尺寸為h×w×c,則輸出尺寸為h×w×s2。之后,進(jìn)行變形操作以產(chǎn)生大小sh×sw×c輸出。這里的卷積操作是在低分辨率圖像,因而亞像素上采樣的效率將高于雙三次上采樣和反卷積。使用這種端到端的上采樣方式得到的子像素層提供更多的上下文信息以幫助生成更多現(xiàn)實(shí)的細(xì)節(jié)。然而,因?yàn)闃?gòu)造亞像素點(diǎn)時(shí)利用的信息來源于同一卷積層,其感受野的大小是相同的,實(shí)現(xiàn)了相互獨(dú)立的塊狀區(qū)域預(yù)測。但由于構(gòu)造過程缺少全局信息,獨(dú)立預(yù)測塊狀區(qū)域中的相鄰像素可能會導(dǎo)致輸出不平滑。
在超分辨率重構(gòu)過程中的信息損失可以分為兩部分:一部分源于卷積層在進(jìn)行卷積操作時(shí)造成的中心區(qū)域外的信息損失;另一部分是在超分辨率重構(gòu)過程中,高頻信息被作為冗余信息舍棄。在前文設(shè)計(jì)的深度殘差模塊可避免卷積層使用過程中的信息損失,可通過堆疊該模塊增加網(wǎng)絡(luò)深度。但是,模塊僅能利用這個(gè)模塊內(nèi)部信息,其他模塊的信息無法充分利用。并且結(jié)構(gòu)中缺少對于低分辨率圖像中信息的利用。
在本文中,我們構(gòu)建了深度密集殘差結(jié)構(gòu)。結(jié)構(gòu)中包含6 個(gè)改進(jìn)的殘差塊,每個(gè)殘差塊用以提取局部特征。為了充分利用每個(gè)模塊提取的信息,每個(gè)殘差塊的輸出可以遞進(jìn)地傳遞到下一個(gè)殘差塊的各層并與那一層的特征進(jìn)行融合,從而保證特征信息連續(xù)傳遞。這種局部特征融合策略通過自適應(yīng)地保存信息來提取局部密集特征,在實(shí)現(xiàn)密集網(wǎng)絡(luò)的同時(shí)用于解決梯度消失問題,有效地保證了網(wǎng)絡(luò)對于紅外圖像的學(xué)習(xí)能力。
在提取多層局部密集特征后,我們進(jìn)一步進(jìn)行全局特征融合以傳輸全局上下文特征,作為對重建圖像的指導(dǎo)。通過連接輸入和輸出圖像將全局特征傳輸?shù)絹喯袼厣喜蓸訉樱磒ixel-shuffle layer),實(shí)現(xiàn)對于全局殘差特征的利用。如圖2所示,亞像素上采樣層可以直接訪問原始的低分辨率輸入,避免由于卷積層大量使用造成的局部上下文信息缺失引起的重建錯(cuò)誤。局部特征融合和全局特征融合也可以起到減少高頻信息損失的作用。
圖2 密集特征傳遞連接設(shè)計(jì)Fig.2 Dense feature transfer connection
在網(wǎng)絡(luò)中,我們選用L2 loss(即最小化誤差)作為網(wǎng)絡(luò)的損失函數(shù)。該函數(shù)是真實(shí)值和預(yù)測值之間所有平方差的總和,公式如(7)所示:
式中:ytrue代表真實(shí)值;ypredicted代表預(yù)測值。
實(shí)驗(yàn)中我們使用中國科技大學(xué)提出的地/空背景下紅外圖像弱小飛機(jī)目標(biāo)檢測跟蹤數(shù)據(jù)集[15]。紅外數(shù)據(jù)集中每個(gè)紅外數(shù)據(jù)段的原始數(shù)據(jù)為視頻格式,為了后續(xù)數(shù)據(jù)加工的方便,在數(shù)據(jù)預(yù)處理階段將每個(gè)數(shù)據(jù)段的視頻格式數(shù)據(jù)轉(zhuǎn)換為8 bit 位深的Windows 位圖格式的多文件的圖像序列。圖像分辨率為10~100 m。
測試集中我們使用了中波紅外熱像儀提取的圖像,該熱像儀能見度為8 km,視場角為17°×13°,圖像原始分辨率為768×564。
我們使用來自NVIDIA 1080Ti GPU 的隨機(jī)樣本訓(xùn)練所有網(wǎng)絡(luò),為了優(yōu)化,我們使用b=0.9、且學(xué)習(xí)率為10-4的ADAM。由于GPU 內(nèi)存限制,我們調(diào)整了數(shù)據(jù)集中圖像的大小,我們將圖像裁剪為512×512像素,這可以保證網(wǎng)絡(luò)有足夠的數(shù)據(jù),防止模型過擬合,提高其魯棒性。測試圖像尺寸為256×256 像素。為客觀公平進(jìn)行比較,所有基于深度學(xué)習(xí)模型的超分辨率算法都采用相同的訓(xùn)練集進(jìn)行訓(xùn)練。
為了模擬低分辨率圖像,我們首先按比例因子圖像進(jìn)行下采樣,將對應(yīng)的圖像大小改為原來的1/比例因子,作為超分辨率網(wǎng)絡(luò)的輸入。我們設(shè)置的比例因子為2、3 和4。實(shí)驗(yàn)中使用PSNR 和SSIM 作為客觀評價(jià)標(biāo)準(zhǔn)。
PSNR 的定義可以表示為:
式中:n是每個(gè)像素的位數(shù);X是原始圖像;Y是超分辨圖像。H和W是圖像的寬度和高度。
SSIM 值的公式為:
式中:μx是圖像x的平均值;μy是圖像y的平均值;σx2是x的方差;σy2是y的方差;σxy是x和y的協(xié)方差。c1=(k1L)2和c2=(k2L)2是維持穩(wěn)定的函數(shù);L是像素值動(dòng)態(tài)范圍,k1=0.01,k2=0.03。
在對比實(shí)驗(yàn)中,采用了3 種經(jīng)典的基于深度學(xué)習(xí)的超分辨率算法與本文算法進(jìn)行定性定量比較:EDSR(enhanced deep-networks for super-resolution),超分卷積神經(jīng)網(wǎng)絡(luò)(super-resolution convolutional neural network,SRCNN),ESPCN(efficient sub-pixel convolutional neural network)。本文同時(shí)選擇了常用的雙線性插值法(Bicubic)作為實(shí)驗(yàn)結(jié)果中主觀評價(jià)的結(jié)果之一。為客觀公平進(jìn)行比較,所有基于深度學(xué)習(xí)模型的超分辨率算法都采用相同的訓(xùn)練集進(jìn)行訓(xùn)練。
對比的實(shí)驗(yàn)結(jié)果分別列在表1~2 以及圖3~4中。從表1 和表2 的結(jié)果來看,本文設(shè)計(jì)的超分辨率方法在所有尺度因子下均獲得較高的PSNR 與SSIM。實(shí)驗(yàn)結(jié)果表明,本文提出的方法在PSNR 和SSIM 等客觀評價(jià)指標(biāo)上優(yōu)于其他算法。相比于其他幾種算法,本文設(shè)計(jì)的深度殘差神經(jīng)網(wǎng)絡(luò)的重構(gòu)紅外圖像效果明顯優(yōu)于其他幾種算法,圖像更加自然,與原圖像相比改善了部分區(qū)域的紋理細(xì)節(jié),實(shí)現(xiàn)了高質(zhì)量的紅外圖像重構(gòu)。
表1 使用4 種方法對紅外圖像的PSNR 與SSIM 評價(jià)結(jié)果1Table1 PSNR evaluation results of infrared images using four methods
表2 使用4 種方法對紅外圖像的PSNR 與SSIM 評價(jià)結(jié)果2Table 2 PSNR evaluation results of infrared images using four methods
圖3 紅外圖像的超分辨率重構(gòu)圖像對比1Fig.3 Super-resolution reconstruction image comparison of infrared images 1
從表1 和表2 可以看出,本文算法的SSIM 值與ESPCN 的SSIM 值非常接近,PSNR 值提升相對較多。這表明本文設(shè)計(jì)的算法在增加網(wǎng)絡(luò)深度的同時(shí)并沒有造成超分辨率重構(gòu)結(jié)果質(zhì)量的降低。與EDSR 算法的對比表明,本文提出的算法在SSIM 和PSNR 值上有所提高,這表明本文設(shè)計(jì)的密集網(wǎng)絡(luò)結(jié)構(gòu)中關(guān)于局部特征融合和全局特征融合的設(shè)計(jì)可以有效地改善重構(gòu)圖像質(zhì)量。
在圖3 和圖4 中可以看出,所有算法的重建質(zhì)量相比雙線性插值有一定的提升,對于具有明顯邊界的區(qū)域夠得到清晰的紋理。所有算法的重建質(zhì)量相比雙線性插值有一定的提升,對于具有明顯邊界的區(qū)域能夠得到清晰的紋理。
圖4 紅外圖像的超分辨率重構(gòu)圖像對比2Fig.4 Super-resolution reconstruction image comparison of infrared images 2
在圖3 中,圖3(b)為雙線性上采樣方法,重建圖像中部分勻質(zhì)區(qū)域過于平滑,缺少細(xì)節(jié)真實(shí)感。圖3(c)是SRCNN 的結(jié)果,由于網(wǎng)絡(luò)只有3 層,學(xué)習(xí)能力有限,圖像中出現(xiàn)大量虛假紋理信息,在均勻區(qū)域容易出現(xiàn)偽影;圖3(d)是EDSR 的結(jié)果,該網(wǎng)絡(luò)堆疊更多的殘差模塊以提高網(wǎng)絡(luò)學(xué)習(xí)能力,因此重構(gòu)結(jié)果明顯優(yōu)于SRCNN,但是網(wǎng)絡(luò)缺少對于其他層信息的利用,圖像中出現(xiàn)大量紋理?xiàng)l紋;圖3(e)中的ESPCN 算法采用了亞像素上采樣層,其效果與EDSR 近似,但相比EDSR 層數(shù)較少,圖像中的景物輪廓不夠清晰,白點(diǎn)的無人機(jī)輪廓也并不清晰;圖3(f)是本文設(shè)計(jì)的方法,圖像細(xì)節(jié)明顯,尤其是林地、草地等具有不規(guī)則形狀的區(qū)域重建效果較好。圖4 中可以看出,本文提出的網(wǎng)絡(luò)對復(fù)雜的雜亂紋理的重建效果較好,尤其是草地上的雜亂區(qū)域的重構(gòu)圖像比較清晰,細(xì)節(jié)豐富。
得益于深度殘差模塊的使用以及亞像素上采樣模塊的引入,本文所提出的模型可以獲得更加理想的高分辨圖像,解決了不規(guī)則紋理的模糊問題。尤其是通過采用密集特征連接結(jié)構(gòu),該網(wǎng)絡(luò)可以有效地加深網(wǎng)絡(luò)結(jié)構(gòu),提高網(wǎng)絡(luò)的學(xué)習(xí)能力。這表明我們提出的方法在提取信息和高頻信息保留方面效果較好。
針對紅外圖像特點(diǎn),本文提出了一種基于深度殘差神經(jīng)網(wǎng)絡(luò)的超分辨率重構(gòu)算法。該模型利用改進(jìn)的殘差模塊有效地增加了網(wǎng)絡(luò)深度,提高了網(wǎng)絡(luò)的學(xué)習(xí)能力,通過使用密集特征連接提高了網(wǎng)絡(luò)對高頻信息的利用,并有效地增加了對于網(wǎng)絡(luò)結(jié)構(gòu)中不同層的信息利用。仿真實(shí)驗(yàn)結(jié)果表明本文模型能夠生成具有豐富細(xì)節(jié)并且目標(biāo)輪廓邊界清晰的圖像,有效地補(bǔ)充了原圖中的細(xì)節(jié)??傮w來看,本文中設(shè)計(jì)的算法在保持較高精度的同時(shí),還可以很好地處理目標(biāo)的尺度變化和目標(biāo)周圍的環(huán)境,說明算法中加入的密集網(wǎng)絡(luò)結(jié)構(gòu)、深度殘差強(qiáng)化模塊等發(fā)揮了良好的作用。