劉鵬謝春華安文韜崔艷榮李良偉
(1.國家衛(wèi)星海洋應(yīng)用中心 北京 100081;2.自然資源部空間海洋遙感與應(yīng)用研究重點(diǎn)實(shí)驗(yàn)室 北京 100081;3.國家海洋環(huán)境預(yù)報(bào)中心 北京 100081;4.上海海洋大學(xué)海洋科學(xué)學(xué)院 上海 201306)
我國是海洋大國,海島眾多,海岸線漫長(zhǎng),海島海岸帶資源豐富。加快建設(shè)海洋強(qiáng)國對(duì)海島海岸帶的科學(xué)管理、合理保護(hù)和適度開發(fā)利用提出更高的要求,及時(shí)和準(zhǔn)確地掌握海島海岸帶的自然環(huán)境、資源分布和開發(fā)利用狀況對(duì)于實(shí)現(xiàn)海島海岸帶的精細(xì)化管理具有重要意義。
由于海島海岸帶的自然環(huán)境十分復(fù)雜,傳統(tǒng)調(diào)查手段難以滿足科學(xué)管理的需求。自20世紀(jì)60年代以來,隨著遙感技術(shù)的不斷發(fā)展,遙感圖像的時(shí)空分辨率不斷提高,遙感逐漸成為發(fā)達(dá)國家調(diào)查研究海島海岸帶的必要手段。與可見光遙感相比,微波遙感具有不受云雨影響,可以全天候和全天時(shí)工作的優(yōu)點(diǎn),但空間分辨率較低。合成孔徑雷達(dá)(SAR)可以獲得較高的空間分辨率,被廣泛應(yīng)用于環(huán)境監(jiān)測(cè)、資源勘查、態(tài)勢(shì)評(píng)估和區(qū)域規(guī)劃等領(lǐng)域[1-2]。精準(zhǔn)和高效地從SAR 圖像中提取地物信息,已成為各國的研究熱點(diǎn)。
根據(jù)在海岸帶土地利用分類系統(tǒng)具有較大影響力的美國海岸帶變化分析計(jì)劃(C-CAP),海岸帶土地利用類型可分為建設(shè)用地、農(nóng)業(yè)用地、草地、林地、灌叢地、荒地、沼澤濕地、河口濕地、水域和水淹地[3]。目前許多國家和機(jī)構(gòu)擁有非常先進(jìn)的海島海岸帶監(jiān)測(cè)技術(shù),如美國國家海洋與大氣管理局(NOAA)、日本國立環(huán)境研究所(NIES)以及英國、荷蘭、芬蘭、瑞典、德國和法國的各種政府或商業(yè)研究中心。
國外學(xué)者對(duì)SAR 遙感海島海岸帶地物信息提取方法的研究起步較早,方法也相對(duì)成熟。在研究初期,海岸帶地物信息的提取方法是最大似然法和ISODATA 等基于像元的方法,這些方法對(duì)于中低空間分辨率的SAR 圖像來說效果尚可,而高分辨率SAR 圖像單個(gè)像元的紋理特征不足以反映地物的形狀特征,且各像元之間的拓?fù)潢P(guān)系有限,無法準(zhǔn)確地反映真實(shí)的地物信息。Yamagata等[4]利用灰度共生矩陣,對(duì)ERS-1和JERS-1的單極化圖像進(jìn)行紋理分析,完成對(duì)海岸帶濕地植被系統(tǒng)較高精度的地物分類;Lee等[5]提出基于Wishart分布的最大似然有監(jiān)督分類算法,通過地物目標(biāo)的電磁散射機(jī)制,極化SAR 數(shù)據(jù)可分解出很多能反映地物目標(biāo)的特征;Cloude等[6]提出無監(jiān)督分類算法,通過極化分解得到散射熵H和散射角α,從而對(duì)目標(biāo)地物進(jìn)行分類,已成為應(yīng)用最廣泛的分類算法之一;Ghedira等[7]首次采用神經(jīng)網(wǎng)絡(luò)方法,對(duì)Radarsat衛(wèi)星SAR 圖像的海岸帶地物信息進(jìn)行提取,取得不錯(cuò)的效果;Moghaddam 等[8]將基于規(guī)則的決策樹算法用于單極化SAR 圖像的海岸帶地物分類;Arzandeh等[9]改進(jìn)灰度共生矩陣紋理分析方法,對(duì)單時(shí)相Radarsat衛(wèi)星圖像的海岸帶濕地進(jìn)行分類,顯著地提高分類精度;Taft等[10]利用SAR 圖像的極化特征,實(shí)現(xiàn)坦桑尼亞候鳥冬季棲息地海岸帶地物信息的提取;Yamaguchi等[11]在Freeman-Durden 分解的基礎(chǔ)上,為表征螺旋體散射的分量增加第四個(gè)分量即螺旋散射分量,得到Y(jié)amaguchi散射模型,從而更準(zhǔn)確地反映目標(biāo)地物的散射特性。自2006年以來,深度學(xué)習(xí)理論的應(yīng)用推動(dòng)SAR 圖像地物信息提取技術(shù)的發(fā)展。例如:H?nsch 等[12]利用復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)進(jìn)行極化SAR 的分類,取得不錯(cuò)的效果;Geng等[13]提出深度監(jiān)督壓縮神經(jīng)網(wǎng)絡(luò),用于提取SAR 圖像地物信息,網(wǎng)絡(luò)的監(jiān)督懲罰機(jī)制能充分挖掘特征與標(biāo)簽之間的相關(guān)信息,壓縮約束可以增強(qiáng)網(wǎng)絡(luò)的魯棒性,與傳統(tǒng)方法相比具有更好的分類性能。
國內(nèi)應(yīng)用SAR 圖像進(jìn)行海島海岸帶地物信息提取的研究起步較晚,但也取得較好的成果。曹永鋒等[14]引入主動(dòng)學(xué)習(xí)方法,通過對(duì)北卡羅來納州華盛頓縣海岸帶的全極化SAR 數(shù)據(jù)進(jìn)行實(shí)驗(yàn),驗(yàn)證主動(dòng)學(xué)習(xí)對(duì)地物信息提取的有效性和可行性;Xie等[15]將稀疏自編碼器應(yīng)用于極化SAR 的地物分類,該方法可以學(xué)習(xí)多層次特征,從而提高分類精度;Chen 等[16]利用改進(jìn)的FCM 算法并結(jié)合Cloude-Pottier分解,探究SAR 圖像在江蘇沿海灘涂分類中的應(yīng)用能力;Liu等[17]提出新型的受限玻爾茲曼機(jī)即WBRBM,結(jié)合SAR 圖像局部的鄰域信息,模型可以更快地收斂,從而提高訓(xùn)練速度和縮短訓(xùn)練時(shí)間;折小強(qiáng)等[18]提出基于極化熵結(jié)合混合廣義極值分布模型的全極化SAR 數(shù)據(jù)的潮間帶地物信息提取方法,并成功應(yīng)用于上海崇明東灘潮間帶地物信息的提取;徐夢(mèng)竹等[19]利用Freeman分解和Cloude-Pottier 分解提取的極化特征,與Shannon熵結(jié)合構(gòu)建特征集,并通過自編碼器提取深層特征,使數(shù)據(jù)更具可分性,研究結(jié)果表明引入Shannon熵可顯著提高海水、沙灘和泥灘等不同地物的區(qū)分度,從而實(shí)現(xiàn)對(duì)全極化SAR 圖像中不同海島地物的有效區(qū)分。
目前國內(nèi)外學(xué)者對(duì)SAR 遙感海島海岸帶地物信息提取的研究大多基于圖像的極化特征和紋理特征,雖已取得豐碩成果,但仍存在亟待解決的問題。例如:①不同類別濕地植被的后向散射系數(shù)重疊,大部分基于閾值分割的地物分類方法精度不高,尤其是對(duì)河口森林濕地和河口灌木濕地的區(qū)分;②表面粗糙度不同的沙灘與泥灘雖可用相同極化方式的SAR 圖像進(jìn)行區(qū)分,但對(duì)干濕條件的要求較高,難以區(qū)分潮間帶的沙灘與泥灘;③采用交叉極化方式的圖像能較好地識(shí)別海岸線,但難以判別表面粗糙度不同的沙灘與泥灘;④多時(shí)相和多源的SAR 數(shù)據(jù)體量巨大,面對(duì)海量和冗雜的海島海岸帶數(shù)據(jù),須應(yīng)用更快速和更智能的算法挖掘其潛藏特征,從而更精確地提取海島海岸帶地物信息。
SAR 的成像原理如圖1所示。
圖1 SAR 成像原理
SAR 之所以能獲得較高的空間分辨率,主要是因?yàn)槠淅枚嗥绽招?yīng)。雷達(dá)發(fā)射電磁波的頻率和相對(duì)頻率分別為f0和f',電磁波的波長(zhǎng)為λ,衛(wèi)星與被觀測(cè)點(diǎn)之間的距離為r。衛(wèi)星與被觀測(cè)點(diǎn)之間存在相對(duì)運(yùn)動(dòng),相對(duì)速度w'為衛(wèi)星速度矢量w在波束方向(方位角為ψ)上的投影,即w'=w ×cosψ。電磁波的傳播速度為c,雷達(dá)回波的多普勒頻率由相對(duì)運(yùn)動(dòng)引起的接收頻率和發(fā)射頻率之差即多普勒頻移Ω,由上式可得由于衛(wèi)星速度遠(yuǎn)小于電磁波傳播速度,可進(jìn)一步推出多普勒頻移與方位角的關(guān)系,即,經(jīng)微分可得頻移分辨率在整個(gè)采樣時(shí)間ts內(nèi),衛(wèi)星移動(dòng)距離XD =wts,可得SAR 的方位分辨率就相當(dāng)于真實(shí)SAR的孔徑尺度D,這樣就通過合成孔徑技術(shù)獲得較大的天線孔徑,并提高方位分辨率。脈沖持續(xù)時(shí)間為τ,入射角為θ,可得距離分辨率;由于雷達(dá)脈沖寬度越窄,脈沖持續(xù)時(shí)間越短且距離分辨率越高,通過減小脈沖寬度和縮短脈沖持續(xù)時(shí)間,就可獲得較高的距離分辨率,從而提高雷達(dá)的空間分辨率。
采集到的SAR 數(shù)據(jù)屬于原始的二維數(shù)據(jù),還不能稱之為圖像。在經(jīng)過初步處理后即可轉(zhuǎn)化為單視復(fù)數(shù)據(jù)(SLC)和多視復(fù)數(shù)據(jù)(MLC)形式的圖像,SLC和MLC 又可進(jìn)一步處理并轉(zhuǎn)化成極化SAR數(shù)據(jù)。
電磁波發(fā)射和接收的極化分為水平和垂直2種方式,根據(jù)電磁波發(fā)射和接收的組合方式,SAR 數(shù)據(jù)可分為單極化數(shù)據(jù)、多極化數(shù)據(jù)和全極化數(shù)據(jù)。如果SAR 傳感器對(duì)電磁波的發(fā)射和接收均為水平極化方式,其產(chǎn)生的SAR 數(shù)據(jù)為HH 單極化數(shù)據(jù);同理,如果SAR 傳感器對(duì)電磁波的發(fā)射和接收均為垂直極化方式,其產(chǎn)生的SAR 數(shù)據(jù)為VV 單極化數(shù)據(jù);如果發(fā)射和接收的組合方式為水平極化與垂直極化的兩兩完全組合,其產(chǎn)生的SAR 數(shù)據(jù)為全極化數(shù)據(jù),其他組合方式產(chǎn)生的SAR 數(shù)據(jù)即多極化數(shù)據(jù)[20]。與單極化數(shù)據(jù)和多極化數(shù)據(jù)相比,全極化數(shù)據(jù)的信息量更加豐富,可展現(xiàn)更細(xì)致的地物信息,已成為重點(diǎn)研究對(duì)象。
由于SAR 圖像具有數(shù)據(jù)量大、多時(shí)相性、多源性、模糊性和空間維數(shù)高等特點(diǎn),從SAR 圖像中準(zhǔn)確獲取地物信息以及對(duì)SAR 圖像進(jìn)行高效的特征提取仍存在一些問題。與此同時(shí),隨著計(jì)算機(jī)技術(shù)的發(fā)展,人工智能理論逐漸成熟并得到廣泛應(yīng)用,Hinton等[21]提出深度學(xué)習(xí)的概念。近年來,隨著網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn)和處理器性能的提高,計(jì)算機(jī)對(duì)大數(shù)據(jù)的高速處理技術(shù)日漸成熟,深度學(xué)習(xí)網(wǎng)絡(luò)在圖像處理、語音識(shí)別和自然語言處理領(lǐng)域取得突出成績(jī)[22]。利用深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)海量SAR 數(shù)據(jù)進(jìn)行處理,增強(qiáng)對(duì)不同數(shù)據(jù)來源和不同地物目標(biāo)的適應(yīng)性,可很好地表示SAR 圖像的空間特征和極化特征,實(shí)現(xiàn)準(zhǔn)確和快速的解譯,有效對(duì)地物進(jìn)行分類和識(shí)別。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)最常用的網(wǎng)絡(luò)之一,是專門用來處理數(shù)據(jù)結(jié)構(gòu)并與網(wǎng)格類似的神經(jīng)網(wǎng)絡(luò)。SAR 圖像可被視為二維像素網(wǎng)格,在直接輸入SAR 圖像后,通過選擇合適的卷積核對(duì)圖像進(jìn)行變換,可減少圖像預(yù)處理的工作量,同時(shí)可更好地利用圖像特征以及提高圖像分類的精度和魯棒性。此外,引入卷積神經(jīng)網(wǎng)絡(luò)理論和模型還能更好地應(yīng)對(duì)地物目標(biāo)的非線性混合[23],對(duì)解決海島海岸帶地物信息提取中存在的不同地物混合等問題具有重要意義。
卷積神經(jīng)網(wǎng)絡(luò)是由多個(gè)模塊組成的全局可訓(xùn)練的人工神經(jīng)網(wǎng)絡(luò)模型,每個(gè)模塊由卷積層、非線性激活層和池化層3個(gè)部分組成,最后由全連接層輸出結(jié)果?;窘Y(jié)構(gòu)如圖2所示。
圖2 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
卷積層用于提取特征,通過對(duì)網(wǎng)絡(luò)中的各子區(qū)域進(jìn)行更深入的學(xué)習(xí),得到更加本質(zhì)和更加抽象的特征。由于卷積是線性運(yùn)算,通過卷積提取的特征也是線性的。為實(shí)現(xiàn)目標(biāo)的非線性可分,須采用激活函數(shù)增加非線性映射運(yùn)算提取非線性特征。常用的激活函數(shù)包括Sigmoid 函數(shù)、Tanh 函數(shù)和Re LU 函數(shù)3種。
(1)Sigmoid激活函數(shù)為:
該函數(shù)的輸出值為0~1,可以表示概率。該函數(shù)是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)最常用的激活函數(shù)之一,但也存在弊端。當(dāng)輸入值偏向曲線兩側(cè)時(shí),神經(jīng)元的梯度值約為0,使得每次迭代參數(shù)的更新值非常小,梯度消失,網(wǎng)絡(luò)無法學(xué)習(xí);當(dāng)函數(shù)的輸出均值不為0時(shí),后層節(jié)點(diǎn)的輸入均值必不為0,導(dǎo)致梯度值和參數(shù)更新的方向出現(xiàn)偏差,收斂速度緩慢。
(2)Tanh激活函數(shù)為:
該函數(shù)的輸出均值為0,收斂速度較快。但與Sigmoid函數(shù)存在同樣的問題,即當(dāng)輸入值偏向曲線兩側(cè)時(shí),易導(dǎo)致梯度消失。
(3)ReLU 激活函數(shù)為:
當(dāng)x為負(fù)值時(shí),導(dǎo)數(shù)恒為0,硬飽和;當(dāng)x為正值時(shí),導(dǎo)數(shù)恒為1,不會(huì)導(dǎo)致梯度消失。因此,該函數(shù)可在不依賴無監(jiān)督的情況下,直接有監(jiān)督地同時(shí)訓(xùn)練多層網(wǎng)絡(luò)。
上述3種函數(shù)的曲線如圖3所示。
圖3 常用的激活函數(shù)
卷積后圖像的特征維度很大。例如:對(duì)于60×60(維)的圖像,若定義60個(gè)5×5(維)的卷積核提取圖像特征,每個(gè)卷積核得到的特征圖維度為(60-5+1)×(60-5+1)=3 136(維),60個(gè)卷積核將得到60×3 136=188 160(維)的特征向量。分類器很難學(xué)習(xí)如此高維的特征,且易過擬合,池化層即針對(duì)此類問題而產(chǎn)生。池化層又稱下采樣層,通過對(duì)特征圖進(jìn)行稀疏處理,擴(kuò)大感受野,保留最佳特征,降低特征圖維度,減小計(jì)算量,避免網(wǎng)絡(luò)過擬合,保持圖像的旋轉(zhuǎn)不變性。經(jīng)過多次卷積池化操作后,須通過全連接層對(duì)網(wǎng)絡(luò)提取的特征進(jìn)行合并整合,并輸出最終的結(jié)果。
3.2.1 網(wǎng)絡(luò)結(jié)構(gòu)
早期的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)比較簡(jiǎn)單,如經(jīng)典的Le Net-5模型[24]主要應(yīng)用于手寫體識(shí)別等相對(duì)單一的視覺識(shí)別領(lǐng)域。Krizhevsky 等[25]提出Alex Net模型,對(duì)局部神經(jīng)元的活動(dòng)創(chuàng)建競(jìng)爭(zhēng)機(jī)制,增強(qiáng)模型的泛化能力;使用CUDA 加速網(wǎng)絡(luò)訓(xùn)練,縮短訓(xùn)練時(shí)間;首次將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于Image Net大規(guī)模視覺識(shí)別挑戰(zhàn)賽,并一舉摘得桂冠。
隨后,卷積神經(jīng)網(wǎng)絡(luò)備受各方關(guān)注,學(xué)者們根據(jù)各自的研究目的和應(yīng)用領(lǐng)域,改進(jìn)和優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)。Simonyan等[26]探究卷積神經(jīng)網(wǎng)絡(luò)的深度并提出VGG 模型,通過對(duì)不同層數(shù)的網(wǎng)絡(luò)在圖像分類中的結(jié)果,證明提升網(wǎng)絡(luò)深度可有效提高圖像分類精度。也有學(xué)者通過增加網(wǎng)絡(luò)寬度來提升卷積神經(jīng)網(wǎng)絡(luò)的性能,但參數(shù)的增加不僅會(huì)大大增加計(jì)算量,而且會(huì)使網(wǎng)絡(luò)陷入過擬合。Google團(tuán)隊(duì)提出名為Inception的新型結(jié)構(gòu)[27],不僅能保持網(wǎng)絡(luò)稀疏性,而且能充分利用密集矩陣的計(jì)算性能。Inception結(jié)構(gòu)在原模型的基礎(chǔ)上對(duì)卷積層進(jìn)行分塊,使用3個(gè)不同大小的卷積核結(jié)合1個(gè)池化層構(gòu)成新的卷積層,有效避免由于網(wǎng)絡(luò)模型密集導(dǎo)致的過擬合,同時(shí)也能解決傳統(tǒng)神經(jīng)網(wǎng)絡(luò)使用隨機(jī)稀疏鏈接而產(chǎn)生的計(jì)算性能下降等問題,為卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展提供很好的結(jié)構(gòu)依據(jù)(圖4)。
圖4 Inception結(jié)構(gòu)
Springenberg等[28]對(duì)卷積神經(jīng)網(wǎng)絡(luò)池化層的存在必要性提出質(zhì)疑,并設(shè)計(jì)不含池化層的“完全卷積網(wǎng)絡(luò)”。這種網(wǎng)絡(luò)在結(jié)構(gòu)上比其他卷積神經(jīng)網(wǎng)絡(luò)更簡(jiǎn)單,但性能可與其他卷積神經(jīng)網(wǎng)絡(luò)相匹敵。He等[29]提出按一定的規(guī)則用卷積層堆疊不同的殘差模塊構(gòu)建深度殘差網(wǎng)絡(luò),從而解決退化問題,訓(xùn)練誤差隨層數(shù)的增大而減小,誤差率遠(yuǎn)低于VGG模型。
對(duì)于卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的研究具有廣闊的前景,目前主要形成兩大趨勢(shì)。①增加卷積神經(jīng)網(wǎng)絡(luò)的深度,重點(diǎn)解決深層網(wǎng)絡(luò)存在的痼疾(如梯度消失),從而解決深層網(wǎng)絡(luò)的訓(xùn)練問題;②優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),降低深層網(wǎng)絡(luò)的復(fù)雜度,增強(qiáng)對(duì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的認(rèn)識(shí),開發(fā)更加簡(jiǎn)潔和高效的網(wǎng)絡(luò),提升網(wǎng)絡(luò)性能。
3.2.2 訓(xùn)練方法
由于卷積神經(jīng)網(wǎng)絡(luò)屬于多層的前饋神經(jīng)網(wǎng)絡(luò),可用反向傳播算法及其衍生算法進(jìn)行訓(xùn)練[30]。然而越來越復(fù)雜的模型結(jié)構(gòu)使得訓(xùn)練所需的樣本集越來越大,反向傳播算法已不能滿足新模型的需求。近年來,學(xué)者們提出新方法來加速網(wǎng)絡(luò)訓(xùn)練,根據(jù)加速機(jī)制可大致分為基于CPU 或GPU 的硬加速方法以及基于加速算法的軟加速方法。
硬加速方法是采用CPU 或GPU 等處理器編程實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)快速訓(xùn)練的算法。Krizhevsky等[25]提出的著名的Alex Net模型即采用GPU 加速訓(xùn)練,從而減少訓(xùn)練時(shí)間;Rajeswar等[31]提出的CPU 和GPU 訓(xùn)練方法的訓(xùn)練速度可比傳統(tǒng)訓(xùn)練方法提高10~12倍。近年來,學(xué)者們還提出基于云計(jì)算的加速方法,如基于Apache Spark云計(jì)算環(huán)境的訓(xùn)練方法[32]對(duì)卷積操作的加速效果明顯,訓(xùn)練速度可比傳統(tǒng)訓(xùn)練方法提高40~250倍。
軟加速方法通過加速算法提高訓(xùn)練速度。Cong等[32]基于Strassen矩陣乘法的思想,通過降低卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算量來減少訓(xùn)練時(shí)間,取得不錯(cuò)的效果。Kim 等[33]在池化層前加入1個(gè)附加層,采用基于極限學(xué)習(xí)機(jī)的改進(jìn)反向傳播算法對(duì)附加層中的參數(shù)進(jìn)行優(yōu)化,不僅極大地減少訓(xùn)練時(shí)間,而且對(duì)小規(guī)模的樣本集訓(xùn)練也有較高的準(zhǔn)確率。
SAR 與光學(xué)傳感器的成像機(jī)制不同,SAR 圖像的亮暗可反映地物后向散射回波的強(qiáng)弱,即圖像越亮則回波越強(qiáng),圖像越暗則回波越弱。地物表面越粗糙,SAR 接收的后向散射越強(qiáng),圖像越亮,如海面和潮灘等表面相對(duì)光滑的地物在圖像上偏暗,而建筑和基巖海岸等表面相對(duì)粗糙的地物在圖像上偏亮。盡管某些地物的目視亮暗差異不明顯,但通過對(duì)訓(xùn)練集的學(xué)習(xí),卷積神經(jīng)網(wǎng)絡(luò)能夠提取更本質(zhì)和更抽象的特征,從而準(zhǔn)確地分類地物。目前針對(duì)海島海岸帶地物信息提取的卷積神經(jīng)網(wǎng)絡(luò)研究較少,但已有較好的成果。Bentes等[34]構(gòu)建可重疊去噪和自動(dòng)編碼的卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)海洋目標(biāo)的分類;馬麗媛[35]采用基于復(fù)數(shù)輪廓波的卷積神經(jīng)網(wǎng)絡(luò)提取舊金山海灣地區(qū)的地物信息,在不同方向和不同尺度上逼近待分類的圖像,得到對(duì)SAR 圖像更稀疏的表示,整體精度提升5.29%;李金鑫[36]對(duì)比樣本集切片的大小對(duì)分類結(jié)果的影響,驗(yàn)證卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于SAR 地物分類的高效性;Bentes等[37]利用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)Terra SAR-X 高分辨率圖像提供的港口、油輪、貨船、海上平臺(tái)和風(fēng)力發(fā)電機(jī)5個(gè)目標(biāo)數(shù)據(jù)集的分類,并得到廣泛的應(yīng)用??梢?卷積神經(jīng)網(wǎng)絡(luò)用于SAR 遙感海島海岸帶地物信息提取具有較大發(fā)展?jié)摿ΑEc傳統(tǒng)方法相比,基于卷積神經(jīng)網(wǎng)絡(luò)的地物信息提取方法精度更高,魯棒性和泛化能力更強(qiáng)。
現(xiàn)有的基于極化特征和紋理特征的海島海岸帶地物信息提取方法雖取得不錯(cuò)的進(jìn)展,但仍有一些尚未解決的問題。近年來,隨著深度學(xué)習(xí)浪潮席卷而來,卷積神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域的表現(xiàn)尤為亮眼。其通過提取圖像中地物的深層特征,可檢測(cè)出地物的細(xì)微差別以及應(yīng)對(duì)地物目標(biāo)的非線性混合。卷積神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展對(duì)提高海島海岸帶地物分類的準(zhǔn)確率以及解決不同地物混合的問題具有重要價(jià)值。
卷積神經(jīng)網(wǎng)絡(luò)在地物信息提取中的優(yōu)勢(shì)大致可分為5個(gè)方面:①卷積層可以提取更本質(zhì)和更抽象的特征,檢測(cè)出SAR 圖像中相似地物之間的細(xì)微差別;②應(yīng)對(duì)非線性的優(yōu)勢(shì)有助于解決不同地物混合的問題;③池化層可以篩選出最有價(jià)值的特征和減少冗余的特征,從而減小計(jì)算量;④結(jié)構(gòu)簡(jiǎn)單,網(wǎng)絡(luò)權(quán)值共享的特性可以極大地減少參數(shù)數(shù)量;⑤可直接將SAR 圖像的原始像素作為輸入值,而無須預(yù)先提取圖像特征,避免重復(fù)和煩瑣的圖像數(shù)據(jù)預(yù)處理工作。
基于目前卷積神經(jīng)網(wǎng)絡(luò)在SAR 遙感海島海岸帶地物信息提取中的應(yīng)用現(xiàn)狀,未來應(yīng)在3個(gè)方面開展嘗試和探究。①由于卷積神經(jīng)網(wǎng)絡(luò)在小規(guī)模樣本集中的優(yōu)勢(shì)不明顯,可選取一些已經(jīng)在大規(guī)模樣本集上訓(xùn)練好的泛化能力強(qiáng)的模型,再輸入少量的研究樣本微調(diào)參數(shù),從而減小工作量,且在理論上并不影響精度;②根據(jù)我國不同地區(qū)海島海岸帶的環(huán)境特異性,確定合適的結(jié)構(gòu)參數(shù),包括卷積核大小、卷積層數(shù)和學(xué)習(xí)率等;③嘗試構(gòu)建較大規(guī)模的海島海岸帶SAR 圖像樣本集,更好地訓(xùn)練所用的卷積神經(jīng)網(wǎng)絡(luò),為相關(guān)研究人員或業(yè)務(wù)部門提供樣本數(shù)據(jù)支持,為我國海島海岸帶監(jiān)管提供精細(xì)化服務(wù)。