黃燦
摘要:本文首先對卷積神經(jīng)網(wǎng)絡SAR圖像識別計算流程展開分析,而后進一步討論了當前常見的幾種模型的表現(xiàn)特征。
關鍵字:卷積神經(jīng)網(wǎng)絡;SAR;圖像識別
合成孔徑雷達(SAR,Synthetic Aperture Radar)在實際應用中有著良好的表現(xiàn),其能夠有效穿透云霧和植被,實現(xiàn)全天候的對地檢測。作為一種電磁波相干成像系統(tǒng),SAR圖像會隨著目標姿態(tài)、俯仰角度、周圍環(huán)境的微小變化而發(fā)生較大的變化,在圖像穩(wěn)定性方面表現(xiàn)狀態(tài)并不好,并且具有較強的相干斑噪聲,這些都成為影響SAR圖像識別工作的重要不良因素。在針對SAR展開目標識別這一問題相關領域中,眾多相關技術層出不窮,熱卷積神經(jīng)網(wǎng)絡在這個領域中則有著不錯的應用表現(xiàn)。
一、卷積神經(jīng)網(wǎng)絡SAR圖像識別計算流程分析
在SAR圖像識別領域引入的卷積神經(jīng)網(wǎng)絡,其作為一種端對端的處理方式,可以直接將原始圖像進行輸入,在一定程度上降低了對圖像數(shù)據(jù)預處理的要求,復雜的特征工程也因此得以避免,且卷積神經(jīng)網(wǎng)絡本身的自動學習數(shù)據(jù)的分層特征相比人工設計特征提取規(guī)則可以對原始數(shù)據(jù)進行更本質的刻畫。卷積神經(jīng)網(wǎng)絡在SAR圖像識別領域的優(yōu)勢不容忽視,對應的研究也應當更加深入,才能不斷實現(xiàn)識別的優(yōu)化。
SAR圖像識別的卷積神經(jīng)網(wǎng)絡計算流程參見圖1。
圖1 卷積神經(jīng)網(wǎng)絡計算流程示意圖
結合圖1展開對于SAR圖像識別過程中卷積神經(jīng)網(wǎng)絡算法流程的考察,可以發(fā)現(xiàn),大體可以分為三個流程。首先是數(shù)據(jù)輸入,即將SAR系統(tǒng)捕獲到的各類地面圖像輸入到卷積神經(jīng)網(wǎng)絡中,準備展開識別。其二為特征提取,即利用卷積層、下采樣層和非線性層來實現(xiàn)對于待識別圖像目標切片的特征提取。卷積層以及緊隨其后的ReLU非線性層在這個環(huán)節(jié),能夠有效對梯度消失的問題進行解決,并且因此而加速網(wǎng)絡本身的訓練和學習速度。隨后需要依據(jù)特征展開對于圖像的分類,采用Softmax分類器,輸入上一個階段獲取到的對應特征圖,隱含層的神經(jīng)元則使用sigmoid函數(shù)作為非線性函數(shù)。使用交叉熵代價函數(shù)評價模型的分類結果,并使用批量梯度下降算法(BGD,Batch Gradient Descent)進行反向傳播,不斷地調整優(yōu)化網(wǎng)絡參數(shù),提高目標識別的準確率。
二、卷積神經(jīng)網(wǎng)絡模型分類概述
雖然卷積神經(jīng)網(wǎng)絡的計算流程相對固定,但是具體到算法細節(jié)上,模型之間仍然存在顯著差異。不同的模型會在實際應用中表現(xiàn)出不同的特征,而對于這些模型的選擇,則需要切實依據(jù)實際情況來謹慎確定。
1.AlexNet
AlexNet是一個八層卷積神經(jīng)網(wǎng)絡,包括五個卷積層以及三個全連接層共同構成,最后通過softmax層來實現(xiàn)分類評分。此種卷積模型的突出特征在于,它采用了修正線性單元(ReLU,Rectified Linear Units)作為激活函數(shù),更加符合神經(jīng)元信號激勵原理,也因此會收獲更快速的訓練效果。除此以外,此種模型引入Dropout和數(shù)據(jù)增強等策略,對于降低神經(jīng)元復雜的互適應關系,對于模型魯棒性也有提升。除此以外,AlexNet采用兩塊GTX 580 GPU并行訓練,兩個GPU可以不用經(jīng)過主機內存直接讀寫彼此的內存,大幅提高了網(wǎng)絡訓練速度。
2.VGGNet
VGGNet從誕生開始,其研究方向就瞄準了卷積神經(jīng)網(wǎng)絡的深度與其性能之間的關系,并且證明了才采用很小卷積的時候,增加網(wǎng)絡深度可以有效提升整體模型性能。并且VGGNet在網(wǎng)絡優(yōu)化方面同樣展開了深入的研究,其采用尺度抖動的方法對原始圖片展開處理,獲取到尺寸具有一定差異的圖片,并且據(jù)此進行訓練,有助于增強模型的魯棒性和泛化能力。除此以外,VGGNet模型還引入了預訓練的概念,其首先對淺層網(wǎng)絡進行訓練,而后進一步利用訓練好的參數(shù)對深層網(wǎng)絡進行初始化,有助于加速整個模型的收斂。并且相對于AlexNet而言,VGGNet將局部響應歸一化策略剔除掉,也有助于進一步縮減計算時間,對于內存的占用也因此得到一定程度的優(yōu)化。
3.GoogleNet
GoogleNet是一個基于Inception結構的22層深度卷積神經(jīng)網(wǎng)絡,其最突出的特征在于利用密集成分來近似最優(yōu)的局部稀疏結構,增加了網(wǎng)絡深度,并且引入了Inception模塊拓寬了網(wǎng)絡寬度。具體而言,GoogleNet采用了不同尺度的卷積核來進行圖像處理,并且對相應的結果進行聚合,從而讓模型可以從不同的尺度運算結果中獲取到更多圖片特征,因此增強了系統(tǒng)的學習能力。此種工作方式讓GoogleNet的參數(shù)比AlexNet涉及到的參數(shù)大大縮減,但準確率卻更高。
4.ResNet
VGGNet面世之后,網(wǎng)絡深度成為諸多學者的關注點,希望可以通過這一途徑實現(xiàn)性能的提升。但是網(wǎng)絡深度的增加,會帶來梯度彌散/爆炸等問題,梯度下降法卻難以有效落實深層網(wǎng)絡而帶來的退化,因此網(wǎng)絡訓練和測試的誤差也隨之上升。在這樣的背景下,ResNet應運而生,這是一個152層的殘差網(wǎng)絡結構,如果某層原始期望映射輸出可以被描述為H(x),對應的x為輸入,則可以通過快捷連接在網(wǎng)絡環(huán)境中加入一個恒等映射,相當于從輸入端旁邊開設了一個通道使得輸入可以直達輸出,對應的優(yōu)化目標也從原來的輸出,變成輸出和輸入之間的差,即H(x)-x。相對于將一個映射逼近另一個非線性層而言,對殘差的優(yōu)化要簡單的多,因此這樣的計算方式有效降低了網(wǎng)絡參數(shù)優(yōu)化的速度,也能解決退化問題。
5.DenseNet
ResNet的本質在于建立一個跨層連接來連通網(wǎng)路中前后層,而DenseNet模型則在此基礎之上進一步設計了一種具有密集連接的卷積神經(jīng)網(wǎng)絡,其網(wǎng)絡的每一層輸入,都是前面所有網(wǎng)絡層輸入的并集。并且每一個層所學習的特征圖也會被直接傳給其后面所有層作為輸人,通過密集連接實現(xiàn)特征的重復利用,增強了網(wǎng)絡的泛化能力。此種模型能夠有效減弱梯度消失的問題,強化特征傳播能力,并且有效限制參數(shù)的數(shù)量。
6.SENet
此種模型是從卷積神經(jīng)網(wǎng)絡特征通道之間的關系角度入手,引入包括壓縮和激發(fā)操作的SE模塊。其中壓縮操作將每個二維特征通道變成一個實數(shù)來實現(xiàn)全局代表的感受野,并且輸出的維度和輸入的特征通道數(shù)相閃配。而激發(fā)操作則是一個類似于循環(huán)神經(jīng)網(wǎng)絡中門的機制,通過對應參數(shù)來確定不同特征通道的權重,用來顯式地建模特征通道間的相關性。而后展開權重的重新標定,將激發(fā)環(huán)節(jié)的輸出權重視為進行過特征選擇后每個特征通道的重要性水平,并且通過乘法逐通道加權到先前的特征上,對有用的特征進行權重提升,并且壓制作用有限的特征。
三、結論
卷積圣經(jīng)網(wǎng)絡在SAR目標識別領域中的價值不可忽視,并且有著極為深厚的潛力可供發(fā)掘。實際應用中唯有深入考證多種模型的表現(xiàn)特征,謹慎測試,才能獲取良好效果。
參考文獻:
[1] 徐豐,王海鵬,金亞秋.深度學習在SAR目標識別與地物分類中的應用[J].雷達學報,2017,6(2):136-148.
[2] 李君寶,楊文慧,許劍清,等.基于深度卷積網(wǎng)絡的SAR圖像目標檢測識別[J].導航定位與授時,2017,4(1):60-66