范吉延,柯長青,姚國慧,王梓霏
南京大學(xué) 地理與海洋科學(xué)學(xué)院,南京 210000
來自喜馬拉雅山脈的冰川融水為周邊地區(qū)居住的人口提供了至關(guān)重要的淡水資源(Immerzeel等,2010)。近年來喜馬拉雅山脈的冰川在加速萎縮(聶勇 等,2010;Scherler 等,2011)。通過監(jiān)測冰川獲取冰川融水情況已經(jīng)成為評估周邊國家水資源可用性和提供區(qū)域氣候反饋的重要方式。
冰川識別是冰川監(jiān)測的重要組成部分,而使用遙感圖像能夠快速、準(zhǔn)確的提取冰川邊界以顯示冰川變化與研究冰川物質(zhì)平衡(Harris等,2009;Paul 等,2015)。雖然使用光學(xué)遙感影像能夠準(zhǔn)確的識別出冰川邊界,但由于其受到云層的影響,云及云影下冰/雪信息重建面臨困難,且冰川表面積雪消融變化特征在光學(xué)影像上難以觀測,無法在固定區(qū)域研究冰川變化的時(shí)間序列問題。合成孔徑雷達(dá)(SAR)具有穿透云層的能力,而L 波段的SAR 有比X 和C 波段SAR 更長的波長,能夠穿透更厚的雪(Takeuchi和Oguro,2003),因此更適合于冰川識別與變化監(jiān)測。從20 世紀(jì)80 年代后期開始L 波段SAR 影像就開始被用于冰川識別,Shi和Dozier(1993)使用AIRSAR 數(shù)據(jù)對冰川進(jìn)行識別,并探究了L波段SAR與C波段SAR在冰川識別中的效果。
全極化SAR 數(shù)據(jù)具有比傳統(tǒng)SAR 以及單極化SAR 數(shù)據(jù)更豐富的信息,而極化分解可以量化表面和內(nèi)部后向散射的貢獻(xiàn),提高對不同位置冰川的識別能力(Sharma 等,2011)。極化分解的特征參數(shù)不僅增加了雷達(dá)圖像的信息量,而且擴(kuò)大了SAR 數(shù)據(jù)在冰川遙感中的應(yīng)用維度(Singh 等,2014;Thakur 等,2017)。Thakur 等(2017)利用Pauli 極化分解特征,基于支持向量機(jī)(SVM)實(shí)現(xiàn)了表磧冰川的識別。除此之外,人們發(fā)現(xiàn)在用極化雷達(dá)數(shù)據(jù)識別冰川時(shí),加入地形數(shù)據(jù)能夠大幅提升識別精度(Usami 等,2016)。Callegari 等(2016)在采用后向散射值時(shí),將局部入射角作為支持向量機(jī)(SVM)的輸入特征,得到的分類精度最高。Yao 等(2020)將局部入射角與多種極化分解特征參數(shù)相結(jié)合,分類精度得到顯著提升。
近年來,深度學(xué)習(xí)發(fā)展迅速,在AlexNet 基礎(chǔ)上發(fā)展出的VGG(Simonyan 和Zisserman,2015)神經(jīng)網(wǎng)絡(luò)大大提高了圖像的分類精度,全卷積神經(jīng)網(wǎng)絡(luò)模型U-net(Ronneberger 等,2015)的出現(xiàn)使影像在實(shí)現(xiàn)像素級分類的同時(shí)能夠獲取更深層次的語義信息,這些網(wǎng)絡(luò)憑借其優(yōu)良的紋理特征提取能力應(yīng)用廣泛,在冰川識別方面也展現(xiàn)出其優(yōu)勢。Parrella等(2016)使用經(jīng)過微調(diào)的Alex-Net從Sentinel-2 圖像中提取特征,并使用主成分分析(PCA)進(jìn)行降維,然后輸入到隨機(jī)森林分類器(RF)中識別出冰川,精度達(dá)到96.02%;Xie 等(2020)使用基于深度學(xué)習(xí)改進(jìn)的GlacierNet 圖像分割方法,將Landsat 8 影像作為特征進(jìn)行輸入以識別冰川,精度達(dá)到99.36%。由以上方法可以發(fā)現(xiàn),使用圖像分割能夠?qū)崿F(xiàn)更高的識別精度。雖然以上方法在冰川識別中達(dá)到了很高的精度,但多光譜影像數(shù)據(jù)受制于氣候條件。因此,本文采用全極化SAR 影像作為數(shù)據(jù)源,并在此基礎(chǔ)上生成極化相干矩陣,使用Freeman-Durden、H/A/α、Pauli、VanZyl、Yamaguchi 這5 種極化分解特征參數(shù)以及極化相干矩陣對角線元素共計(jì)19 個(gè)特征參數(shù),并結(jié)合基于U-net開發(fā)出的適用于全極化SAR影像的VGG16-unet 進(jìn)行冰川識別。在此過程中探究多種極化特征參數(shù)在冰川識別中的作用,進(jìn)而獲取最優(yōu)的特征組合方式;探究冰川與非冰川地區(qū)地形差異對冰川識別的影響,并將地形數(shù)據(jù)與極化特征參數(shù)相結(jié)合提升冰川的識別精度。與以往研究相比,使用具有更多特征的全極化影像,并與地形因子結(jié)合作為VGG16-unet 的輸入進(jìn)行冰川識別,探究了全極化影像在全卷積神經(jīng)網(wǎng)絡(luò)中對冰川邊界識別的適用性。
研究區(qū)位于喜馬拉雅山脈西端克什米爾,區(qū)域內(nèi)包含典型的中緯度、高海拔冰川,大部分地區(qū)高程處于3200—6500 m。該地區(qū)多數(shù)大型冰川地勢起伏大,平均坡度處于17°左右,同一冰川內(nèi)不同區(qū)域坡度具有明顯差異(Vijay 和Braun,2018)。研究區(qū)總面積7613.678 km2,其中冰川面積1909.047 km2,G1 冰川面積16.484 km2,區(qū)域內(nèi)月平均氣溫在-8.4 ℃—17.5 ℃(Rai等,2016)。由于其獨(dú)特的地形條件,大部分冰川如G1 冰川內(nèi)地表類型豐富,包含表磧覆蓋冰川、含有裸冰與雪的純凈冰川以及冰川外圍的裸露巖石,且冰川的大小、狀態(tài)以及幾何形狀差異較大(Brun 等,2017)。
采用ALOS2-PALSAR全極化數(shù)據(jù)。ALOS-2衛(wèi)星搭載的PALSAR 是一種SAR 傳感器,向地面物體發(fā)射L波段雷達(dá)波,并接收其后向散射信號。與ALOS-PALSAR 相比,它在時(shí)間和空間分辨率、觀測波段、極化方式以及數(shù)據(jù)傳輸?shù)臅r(shí)間間隔方面有顯著的提升。特別是全極化模式可以獲取目標(biāo)的所有極化特性,大大提高了成像雷達(dá)對目標(biāo)信息的獲取能力。本文使用了條帶模式下的同一軌兩景全極化SAR 影像,空間分辨率為5 m。成像時(shí)間為2020年10月2日。
SRTM(Shuttle Radar Topography Mission)數(shù)據(jù)是由美國航空航天局(NASA)和國防部國家測繪局(NIMA)聯(lián)合測量的,雷達(dá)影像數(shù)據(jù)覆蓋全球陸地表面的80%以上,精度有1 arc-second 和3 arcseconds 兩種,即30 m 與90 m 空間分辨率的數(shù)據(jù)。本文選取SRTM 30 m 空間分辨率的數(shù)據(jù)作為原始數(shù)據(jù),用來對SAR 數(shù)據(jù)進(jìn)行地理編碼并計(jì)算雷達(dá)波在冰川表面的局部入射角以及地表的坡度信息。
GLIMS(Global Land Ice Measurements from Space)是一項(xiàng)使用光學(xué)衛(wèi)星數(shù)據(jù)監(jiān)測世界冰川的計(jì)劃,而RGI(Randolph Glacier Inventory)是對GLIMS 的補(bǔ)充,它將曾經(jīng)的冰川地圖和有用的屬性相結(jié)合。RGI 包含了全球的冰川輪廓,使用RGI 6.0(2017 年7 月28 日)作為訓(xùn)練樣本的標(biāo)簽數(shù)據(jù)。選取2020年10月21日的Landsat 8影像作為精度驗(yàn)證數(shù)據(jù)。
SAR 影像,DEM 與冰川邊界數(shù)據(jù)按照圖2 所示的流程進(jìn)行處理。整個(gè)過程細(xì)分為3 個(gè)部分:SAR 數(shù)據(jù)處理、神經(jīng)網(wǎng)絡(luò)分類、精度評價(jià)。下面對這3個(gè)部分進(jìn)行詳細(xì)說明。
3.1.1 數(shù)據(jù)預(yù)處理
SAR 數(shù)據(jù)預(yù)處理分為4個(gè)部分,包括極化矩陣生成、極化濾波、極化分解和地理編碼(紅色虛線矩形,圖2)。
極化雷達(dá)影像中的每一個(gè)像素的信息能夠通過Sinclair散射矩陣表示。
式中,S是描述散射體對入射波散射現(xiàn)象的2×2 散射矩陣,SHV表示發(fā)射的水平H 極化波和接收的垂直V 極化波的目標(biāo)后向散射系數(shù)。為了從散射矩陣中提取物理信息,將矩陣轉(zhuǎn)換為字典矩陣基表示的目標(biāo)散射向量k:
基于以上的等式,與極化相關(guān)的散射矩陣的二階乘積可以定義為相干矩陣[T3](Cloude,1985),如式(3)所示。
相干斑是SAR 成像中的一種散射現(xiàn)象,含有相干斑的后向散射系數(shù)影像不利于圖像解譯。為了消除相干斑的影響,使用Improved Lee sigma 濾波器(Lee 等,2009)對影像進(jìn)行濾波,以保證極化SAR影像的清晰度和極化信息。
當(dāng)雷達(dá)波與地面目標(biāo)相互作用時(shí)極化狀態(tài)會發(fā)生變化,這種變化受到目標(biāo)的介電常數(shù)、結(jié)構(gòu)、粗糙度和化學(xué)成份影響。通過對表面和體積分量的分解能夠推斷出冰面和冰內(nèi)特性的獨(dú)立信息,而極化分解可以量化表面和體積后向散射的貢獻(xiàn),從而提高區(qū)分不同冰川帶的能力(Sharma等,2010)。
由于雷達(dá)的成像機(jī)制,地形因素會使影像產(chǎn)生幾何畸變,并對雷達(dá)接收的后向散射產(chǎn)生一定影響(Paul等,2017)。因此,采用DEM 對遙感影像進(jìn)行地理配準(zhǔn),并將DEM 及其衍生出的局部入射角、坡度與極化特征相結(jié)合以消除影響。
3.1.2 極化特征組合
為了探究不同極化特征在冰川識別中的作用,選取了Pauli 分解(Cloude 和Pottier,1996)、Freeman-Durden 分解(Freeman 和Durden,1998)、Yamaguchi 分解(Yamaguchi 等,2005)、Van Zyl分解(van Zyl等,2011)和H/A/α 分解(Cloude 和Pottier,1996)5 種極化分解方式生成的特征以及具有物理散射信息的極化矩陣3 個(gè)對角線元素T11,T22,T33(趙泉華 等,2018)共計(jì)19個(gè)特征(表1)。按照兩種方法對特征進(jìn)行劃分,第1種方法是根據(jù)特征的生成方式對數(shù)據(jù)進(jìn)行劃分(圖2綠色虛線部分),第2 種方式是根據(jù)單特征輸入網(wǎng)絡(luò)后的整體精度、特征的所屬類別進(jìn)行選取,將特征劃分為3種類別,表面散射、偶次散射、體散射,選取每種類別中整體精度最高的特征并進(jìn)行組合。按照上述方式共劃分為7組數(shù)據(jù)。
表1 19個(gè)極化特征的描述與計(jì)算式Table 1 Description and calculation formula of the 19 polarization features
3.2.1 輸入數(shù)據(jù)處理
輸入數(shù)據(jù)處理如圖2 中藍(lán)色虛線框圖部分所示。采用直方圖均衡化以增強(qiáng)輸入圖像的信息。采用RGI 6.0 矢量數(shù)據(jù)作為冰川的標(biāo)簽數(shù)據(jù),將標(biāo)簽與遙感影像裁剪為512×512 像素大小的數(shù)據(jù)塊(圖3),然后對標(biāo)簽與影像進(jìn)行水平、垂直以及對角線旋轉(zhuǎn)增強(qiáng)數(shù)據(jù)以增加數(shù)據(jù)量(圖4),并對增強(qiáng)后的數(shù)據(jù)進(jìn)行線性歸一化處理。按照1833∶611∶611即6∶2∶2的小訓(xùn)練集經(jīng)典比例將數(shù)據(jù)集劃分成訓(xùn)練集、驗(yàn)證集、測試集(圖5)。
3.2.2 網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
U-net 網(wǎng)絡(luò)呈U 形結(jié)構(gòu),主要包括編碼器和解碼器部分,編碼器通過卷積和池化對影像降維并提取特征,解碼器采用上采樣且與特征部分相同尺度的圖像進(jìn)行拼接,將淺層特征和深層特征結(jié)合起來,更有利于提取目標(biāo)。為了使網(wǎng)絡(luò)用于冰川識別,在U-net 的基礎(chǔ)上設(shè)計(jì)了VGG16-unet,并對其中的參數(shù)進(jìn)行修改以確定最佳參數(shù)(表2)。選取T11,T22,T33這3 個(gè)特征進(jìn)行組合作為網(wǎng)絡(luò)的輸入數(shù)據(jù),過程中發(fā)現(xiàn)多層卷積層配合小卷積核能夠得到更高的精度,最終確定了如圖7 所示的VGG16-unet 結(jié)構(gòu),具有4 層池化層,卷積核大小為3×3,起始層卷積核數(shù)量32,編碼器內(nèi)部卷積層數(shù)分別為2,2,3,3,3。VGG16-unet 編碼和解碼的結(jié)構(gòu)是對稱的,每個(gè)編碼器都有一個(gè)對應(yīng)的解碼器。通過編碼器提取的特征輸入到解碼器內(nèi)進(jìn)行分類。在編碼器內(nèi)部,存在卷積層、批標(biāo)準(zhǔn)化層、Relu 激活函數(shù)層、最大池化層以及Dropout層,在解碼器內(nèi)部存在卷積層、上采樣層。影像作為輸入數(shù)據(jù)輸入卷積層,輸出特征圖。輸入層與輸出層通過補(bǔ)零后具有相同的分辨率。卷積后得到的特征圖傳入批標(biāo)準(zhǔn)化層,以加快網(wǎng)絡(luò)的學(xué)習(xí)速度,降低對網(wǎng)絡(luò)初始化的敏感性。為防止網(wǎng)絡(luò)中梯度的消失,對神經(jīng)網(wǎng)絡(luò)使用Relu 函數(shù)進(jìn)行激活,并引入Dropout層屏蔽參與訓(xùn)練的神經(jīng)元,避免過擬合。編碼器使用最大池化層(圖6)以保持平移不變性(Badrinarayanan等,2017),解碼器使用去池化層恢復(fù)到經(jīng)過池化之前的大?。▓D6),輸入值返回到其對應(yīng)最大值的原始位置。不充足的池化層會提取無關(guān)的信息,過多的池化層會丟失部分信息。實(shí)驗(yàn)得到4層池化分類精度最高(表2)。
表2 VGG16-unet神經(jīng)網(wǎng)絡(luò)測試參數(shù)Table 2 VGG16-unet neural network test parameters
用于精度評價(jià)的冰川邊界數(shù)據(jù)是在Landsat 8 5,4,3 波段合成的影像上參考RGI 6.0 邊界進(jìn)行目視解譯修改得到。精度評價(jià)的方法都是基于冰川識別結(jié)果與目視解譯冰川輪廓來進(jìn)行對比分析,包括精確度(P)、召回率(R)、F1 分?jǐn)?shù)(F1)、交并比(IoU)、平均交并比(mIoU)、整體精度(OA)。
式中,TP 是預(yù)測結(jié)果為正類,實(shí)際是正類;FP 是預(yù)測結(jié)果為正類,實(shí)際是負(fù)類;TN 是預(yù)測結(jié)果為負(fù)類,實(shí)際是負(fù)類;FN 是預(yù)測結(jié)果為負(fù)類,實(shí)際是正類;n為類別總數(shù),i為類別序號。
將19 個(gè)特征參數(shù)單獨(dú)輸入神經(jīng)網(wǎng)絡(luò)中進(jìn)行識別對比整體精度(表3),發(fā)現(xiàn)散射功率較高的表面散射與體散射特征(Huang等,2014)在識別冰川時(shí)的整體精度高于散射功率較低的偶次散射特征。根據(jù)整體精度及召回率,選取Surfyama、Dblpauli、Volpauli作為新的特征組合(SDV)輸入網(wǎng)絡(luò)中。
表3 19種極化分解特征整體精度及召回率對比Table 3 Comparison of the overall accuracy of 19 polarization decomposition features %
利用SDV 組合進(jìn)行識別的整體精度最高,達(dá)到93.3%,平均用戶交并比(mIoU)達(dá)到80.91%,召回率達(dá)到76.89%(表4)?;谖锢砩⑸錂C(jī)制的Freeman-Durden、Pauli、VanZyl、Yamaguchi 極化分解特征與極化相干矩陣的T11,T22,T33整體精度均高于基于統(tǒng)計(jì)特征的H/A/α 極化分解特征,其中廣泛適用于許多不同類型地表(Huang 等,2014)的Pauli 分解特征精度最高,整體精度92.54%,平均用戶交并比(mIoU)達(dá)到78.78%,召回率達(dá)到73.03%,雖然Yamaguchi 有4 個(gè)極化分解特征,但在基于物理散射機(jī)制的特征中精度最低,這可能是因?yàn)槠涞?特征表示的螺旋散射并不適用于自然地表的分類(Yamaguchi等,2005),加入第4特征會降低冰川識別的精度。雖然利用熵值(H),各向異性值(A),極化散射角(α)單獨(dú)進(jìn)行識別時(shí)的整體精度均大于81%,但H/A/α特征組合識別冰川時(shí)的精度最低,整體精度89.83%,用戶交并比(mIoU)75.62%,召回率70.02%,這可能是由于熵值(H)與極化散射角(α)具有很高的相關(guān)性(Yao等,2020),組合輸入時(shí)導(dǎo)致了特征的冗余。
表4 7種極化特征組合冰川識別精度對比(不含地形數(shù)據(jù))Table 4 Comparison of glacier recognition accuracy for seven combinations of polarization features(topographic data not included) %
為了進(jìn)一步分析冰川識別精度與極化特征的關(guān)系,選取包含巖石、表磧、冰、雪多種地表類型的G1 冰川區(qū)域作為樣本,對該區(qū)域內(nèi)多種極化特征進(jìn)行分析(圖8)。由于Yamaguchi分解中的螺旋散射特征不適用于自然地表的分類(Yamaguchi 等,2005),因此僅計(jì)算4 種地物類型的18 個(gè)極化特征參數(shù)并生成散點(diǎn)圖(圖9)。在Freeman-Durden、Pauli、VanZyl、Yamaguchi 與極化相干矩陣對角元素構(gòu)成的散點(diǎn)圖中,巖石與其余3種地物的點(diǎn)位分布具有明顯的差異,而H/A/α構(gòu)成的散點(diǎn)圖中,4種地物的點(diǎn)位較聚集,無法進(jìn)行清楚的區(qū)分,結(jié)合表5 的結(jié)果顯示,具有高分離度的Pauli 分解特征與相干矩陣對角元素在冰川識別中也具有較高的精度,因此不同地物的特征分離度可能是影響VGG16-unet的因素之一。
表5 7種不同極化特征組合冰川識別精度對比(?為地形數(shù)據(jù))Table 5 Comparison of glacier recognition accuracy for seven different combinations of polarization features(? is topographic data) /%
加入局部入射角、坡度、DEM 數(shù)據(jù)后7 組特征的冰川識別精度均有顯著提升,選取一張512×512 像素影像觀察不同極化特征加入地形因子后的分類情況(圖10)。通過表5 可以看出,整體精度從90.65%—93.3%提升至93.51%—94.98%,平均用戶交并比(mIoU)從73.81%—80.91%提升至81.1%—85.67%,召回率從61.41%—84.13%提升至74.77%—85.54%。具有最高精度的Surfyama、Dblpauli、Volpauli(SDV)組合整體精度從93.3%提升至94.98%,平均用戶交并比(mIoU)從80.91%提升至85.67%,召回率從76.89%提升至85.54%,精度最低的組合由H/A/α變?yōu)闃O化相干矩陣。
圖1 克什米爾冰川地理位置及其分布Fig.1 Location and distribution of Kashmir glaciers
圖2 基于深度學(xué)習(xí)的ALOS2-PALSAR影像冰川識別流程Fig.2 Deep learning based glacier recognition process for ALOS2-PALSAR images
圖3 ALOS2-PALSAR影像及地形數(shù)據(jù)的合成與裁剪Fig.3 Synthesis and cropping of ALOS2-PALSAR images and topographic data
圖4 神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)增強(qiáng)Fig.4 Neural network data enhancement
圖5 VGG16-unet訓(xùn)練、驗(yàn)證及測試數(shù)據(jù)分布Fig.5 Regional distribution of VGG16-unet train,validation and test data
圖6 VGG16-unet池化與去池化過程Fig.6 VGG16-unet pooling and unpooling process
圖7 VGG16-unet網(wǎng)絡(luò)結(jié)構(gòu)及其參數(shù)Fig.7 Structure and parameters of VGG16-unet network
圖8 18種極化特征實(shí)例及樣本點(diǎn)分布Fig.8 Examples of 18 polarization characteristics and sample point distribution
圖9 不同冰川地表類型中巖石、表磧、冰、雪的18個(gè)極化特征分布Fig.9 Distribution of 18 polarization features of bare rock,debris,ice and snow in different glacial surface types
圖10 不同極化特征組合冰川識別結(jié)果對比Fig.10 Comparison of glacier identification results for different combinations of polarization features
通過表5可以看出地形對冰川的識別精度有一定的影響,因此,選取地形變化明顯的G1 冰川進(jìn)行剖面分析生成曲線(圖11),其中P1 位于裸巖部分,是剖面線終點(diǎn);P2是裸巖與表磧的交界點(diǎn);P3 位于雪覆蓋冰川部分,為剖面線起點(diǎn)。由于輸入神經(jīng)網(wǎng)絡(luò)前對數(shù)據(jù)進(jìn)行了歸一化,圖12中高程、坡度與局部入射角的范圍均在0—1 且無單位。圖12 中可以看出在冰川與非冰川部分曲線具有明顯差異。高程值(DEM)曲線在P1—P3 段呈穩(wěn)定上升趨勢,且P1—P2 非冰川段高程值小于P2—P3冰川段高程值。在P1—P2 非冰川段,局部入射角與坡度曲線波動(dòng)較大,整體呈現(xiàn)先上升后下降的趨勢,局部入射角總體分布約為0.36,坡度約為0.21。在P2—P3 冰川段,局部入射角與坡度曲線比P1—P2 段更加穩(wěn)定,局部入射角總體分布約為0.29,坡度約為0.10。這些曲線的變化表明,非冰川區(qū)與冰川區(qū)的地形在數(shù)值與變化趨勢上都存在差異,因此將地形數(shù)據(jù)作為輔助特征輸入神經(jīng)網(wǎng)絡(luò)時(shí)不僅能夠降低局部入射角、坡度等對地物后向散射強(qiáng)度造成的影響,還能擴(kuò)大非冰川區(qū)與冰川區(qū)特征的差異,從而進(jìn)一步提高冰川識別的精度。除此之外,結(jié)合圖9可以看出,地形數(shù)據(jù)的加入還會降低特征分離度對冰川識別精度的影響,使具有高特征分離度相干矩陣的冰川識別精度最低。
圖11 G1冰川剖面線分布(背景數(shù)據(jù)采用Landsat 8 5,4,3波段)Fig.11 Distribution of profile lines in G1 glacier(The background data were using the 5,4,3 bands of Landsat 8)
圖12 G1冰川地形因子剖面分析曲線Fig.12 G1 Glacier topographic factor profile analysis curve
圖13是SDV特征結(jié)合地形數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)得到的冰川識別結(jié)果,可以看出,較大型純凈冰川內(nèi)部的冰與雪能夠很好的識別(圖13Ⅱ區(qū)域),表磧型冰川中段與末端也能較為準(zhǔn)確的識別(圖13 中區(qū)域Ⅲ—Ⅳ),面積小于0.1 km2的小型冰川與周圍巖石具有相似的特征,識別的準(zhǔn)確性較差(圖13中區(qū)域Ⅰ—Ⅱ)??傮w看來除部分面積較小的冰川外,表磧、冰、雪等具有顯著紋理特征的大型冰川識別效果良好,VGG16-unet 提取的冰川邊界與驗(yàn)證數(shù)據(jù)邊界基本一致。
圖14 是SDV 特征結(jié)合地形數(shù)據(jù)按照相同的樣本輸入VGG16-unet、隨機(jī)森林、支持向量機(jī)得到的冰川識別結(jié)果,精度如表6所示??梢钥闯鲭S機(jī)森林(圖14(c))會將裸巖識別為表磧,并且對于小型冰川的識別結(jié)果較差,識別的總體精度為73.69%,平均用戶交并比(mIoU)為58.28%,召回率為74.19%。支持向量機(jī)(圖14(d))能夠較好的區(qū)分裸巖與表磧,但對于小型冰川的識別結(jié)果很差,裸巖與冰川幾乎無法區(qū)分,識別的總體精度為89.91%,平均用戶交并比(mIoU)為60.89%,召回率為61.33%。VGG16-unet 在冰川識別中相較于以上兩種機(jī)器學(xué)習(xí)方法有顯著的優(yōu)勢,除部分碎塊冰川無法準(zhǔn)確識別外,對冰川的表磧、冰、雪部分識別準(zhǔn)確,總體精度為93.41%,平均用戶交并比(mIoU)為87.58%,召回率為95.23%。
表6 VGG16-unet與機(jī)器學(xué)習(xí)冰川識別精度對比Table 6 Comparison of glacier recognition accuracy between VGG16-unet and machine learning /%
圖14 VGG16-unet與機(jī)器學(xué)習(xí)冰川識別結(jié)果對比Fig.14 Comparison of glacier recognition results between VGG16-unet and machine learning
為了驗(yàn)證VGG16-unet 方法在冰川識別上的可遷移性,選取位于藏東南地區(qū)左貢縣旺達(dá)鎮(zhèn)(圖15)附近4景ALOS1-PALSAR全極化影像(3景2011年4 月15 日,1 景2011 年3 月19 日),按照與圖2 中ALOS2-PALSAR 影像相同的處理步驟進(jìn)行冰川邊界提取,得到圖16所示的結(jié)果。
圖15 基于ALOS1-PALSAR的VGG16-unet訓(xùn)練、驗(yàn)證及測試數(shù)據(jù)分布Fig.15 VGG16-unet train,validation and test data distribution based on ALOS1-PALSAR
圖16 基于深度學(xué)習(xí)的旺達(dá)鎮(zhèn)ALOS1-PALSAR影像冰川識別分類結(jié)果Fig.16 Deep learning based classification results for glacier identification in ALOS1-PALSAR images of Wangda town
冰川識別精度如表7 所示,可以看到ALOS1-PALSAR 比ALOS2-PALSAR 整體精度(OA)降低1.74%,平均用戶交并比(mIoU)降低4.45%,召回率(Recall)降低5.54%。這是由于ALOS1-PALSAR的幾何畸變較嚴(yán)重,影像質(zhì)量低于ALOS2-PALSAR影像質(zhì)量,并且參與模型建立樣本對數(shù)量僅為1027對。盡管如此,使用VGG16-unet基于ALOS1-PALSAR 對冰川的整體精度(OA)仍能夠達(dá)到93.24,平均用戶交并比(mIoU)能夠達(dá)到81.22%,這說明VGG16-unet結(jié)合全極化SAR數(shù)據(jù)中Surfyama、Dblpauli、Volpauli波段及地形因子進(jìn)行冰川邊界提取的方法具有良好的可遷移性。
表7 ALOS2與ALOS1冰川識別精度比較Table 7 Comparison of glacier recognition accuracy between ALOS-2 and ALOS-1 images /%
本文基于ALOS2-PALSAR全極化影像數(shù)據(jù),利用VGG16 與全卷積神經(jīng)網(wǎng)絡(luò)模型U-net 結(jié)合生成的VGG16-unet,對19 個(gè)極化特征進(jìn)行對比、分析與組合,并結(jié)合地形數(shù)據(jù)進(jìn)行冰川邊界的識別,得到的結(jié)果顯示(1)VGG16-unet 神經(jīng)網(wǎng)絡(luò)對冰川區(qū)地物物理特性的差異更加敏感,結(jié)合物理特性相關(guān)的Pauli、Freeman-Durden、VanZyl、Yamaguchi、T矩陣對角元素進(jìn)行識別能夠得到更高的冰川識別精度,通過篩選得到的SDV 組合特征精度最高,加入地形因子后冰川的識別精度能夠達(dá)到94.98%;將19 種極化分解特征輸入神經(jīng)網(wǎng)絡(luò)時(shí),冰川散射機(jī)制中占主導(dǎo)的表面散射與體散射的識別精度高于偶次散射的識別精度,雖然與統(tǒng)計(jì)特性相關(guān)的H、A、α 都能得到較高的精度,但進(jìn)行組合輸入時(shí)由于特征冗余,使得其冰川識別精度最低;將地形數(shù)據(jù)作為輔助特征與極化特征相結(jié)合輸入神經(jīng)網(wǎng)絡(luò)能夠大幅提升冰川的識別精度,但是會影響極化特征分離度在冰川識別中的作用;特征是冰川識別的關(guān)鍵,特征顯著的表磧、冰、雪等大型冰川能夠得到良好的識別,而與巖石相似的小型冰川識別效果較差。(2)綜上所述,利用全極化SAR 影像結(jié)合神經(jīng)網(wǎng)絡(luò)進(jìn)行冰川邊界的識別能夠有效彌補(bǔ)光學(xué)影像受云層影響導(dǎo)致的云及云影下冰/雪信息的缺失。與Yao 等(2020)在文中的實(shí)驗(yàn)相比較,本文在證實(shí)其提出的加入地形數(shù)據(jù)能夠提升識別精度的觀點(diǎn)的同時(shí),采用了更加先進(jìn)的深度學(xué)習(xí)方法,相較于其實(shí)驗(yàn)精度有1.2%的提升,并且本文實(shí)驗(yàn)方法具有更好的遷移性和普適性,為不同地區(qū)進(jìn)行光學(xué)影像云下冰雪信息重建提供了可行的方案。(3)文中還存在一些不足,例如神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)不足,僅使用兩景SAR 影像作為數(shù)據(jù)源;數(shù)據(jù)源單一,僅利用SAR 影像與地形因子作為神經(jīng)網(wǎng)絡(luò)的特征輸入;網(wǎng)絡(luò)結(jié)構(gòu)單一,在U-net 框架下僅探究VGG16 在冰川識別中的適用性。在以后的研究中可以嘗試增加參與網(wǎng)絡(luò)訓(xùn)練的數(shù)據(jù)量,提升網(wǎng)絡(luò)的穩(wěn)定性與準(zhǔn)確性;使用多源遙感影像,擴(kuò)大特征的數(shù)量與維度;基于更多樣的神經(jīng)網(wǎng)絡(luò)模型如Deeplab、PSP-net 等對數(shù)據(jù)集進(jìn)行訓(xùn)練,更多元地提取影像中的特征,從而進(jìn)一步提高冰川的識別精度。