趙金龍,李劍萍,李萬春
(1.中國氣象局旱區(qū)特色農(nóng)業(yè)氣象災(zāi)害監(jiān)測預(yù)警與風(fēng)險管理重點(diǎn)實(shí)驗(yàn)室,寧夏 銀川 750002; 2.寧夏氣象防災(zāi)減災(zāi)重點(diǎn)實(shí)驗(yàn)室,寧夏 銀川 750002)
汛期降水天氣較多,持續(xù)暴雨會導(dǎo)致湖泊、河流、水庫水位上漲,嚴(yán)重時會引發(fā)漫灘、洪澇等自然災(zāi)害,威脅人民群眾生命財產(chǎn)安全。利用衛(wèi)星遙感技術(shù)及時有效地掌握滯洪區(qū)水體時空動態(tài)變化對防洪、防汛措施制定乃至科學(xué)利用洪水資源具有重要意義。傳統(tǒng)水體信息遙感提取方法主要有單波段閾值法、譜間關(guān)系法和指數(shù)法等,其中指數(shù)法提取精度較高,使用較為廣泛。例如:Mcfeeters[1]利用歸一化差異水體指數(shù)(normalized difference water index,NDWI)提取了內(nèi)布拉斯加州西部地區(qū)的水體信息;徐涵秋[2]在NDWI的基礎(chǔ)上提出了改進(jìn)的NDWI(modified normalized difference water index,MNDWI),可以有效抑制建筑物的干擾;Feyisa等[3]通過在世界各地選取不同類型水體進(jìn)行大量試驗(yàn)構(gòu)建了自動水體指數(shù)(automated water extraction index,AWEIsh)。
隨著機(jī)器學(xué)習(xí)、人工智能技術(shù)在遙感影像智能解譯領(lǐng)域的應(yīng)用,水體信息提取逐漸由傳統(tǒng)方法向智能化、自動化方向發(fā)展。傳統(tǒng)機(jī)器學(xué)習(xí)算法如支持向量機(jī)、隨機(jī)森林等,存在調(diào)參過程復(fù)雜、人工篩選特征煩瑣、精度有限等不足,相較于傳統(tǒng)算法,深度學(xué)習(xí)人工神經(jīng)網(wǎng)絡(luò)能夠自動挖掘目標(biāo)潛在特征,并建立自下而上、由淺層到深層的特征間相互聯(lián)系。近年來,U-Net卷積神經(jīng)網(wǎng)絡(luò)模型(以下簡稱“U-Net模型”)在房屋建筑物提取[4]、城市綠地分類[5]、農(nóng)林植被分類[6]等方面的廣泛應(yīng)用,為遙感影像水體語義分割提供了新思路,但受地形、生態(tài)環(huán)境以及數(shù)據(jù)源空間分辨率等因素影響,經(jīng)典U-Net模型在不同場景的適用性有待探究。
本文基于Sentinel-1合成孔徑雷達(dá)衛(wèi)星(以下簡稱“Sentinel-1衛(wèi)星”)和Sentinel-2多光譜衛(wèi)星(以下簡稱“Sentinel-2衛(wèi)星”)協(xié)同的全天候、高分辨率觀測優(yōu)勢,針對經(jīng)典U-Net模型在賀蘭山東麓滯洪區(qū)水體提取中存在的過擬合、泛化能力不足等問題,通過引入殘差塊并簡化網(wǎng)絡(luò)結(jié)構(gòu),提出了一種適用于賀蘭山東麓滯洪區(qū)水體信息提取的卷積神經(jīng)網(wǎng)絡(luò)(water body information extraction U-Net,WEU-Net)模型,以期為賀蘭山東麓防洪措施制定以及洪水資源科學(xué)利用提供參考。
賀蘭山東麓(105°45′39″E~106°27′35″E,37°43′0″N~39°5′3″N)南起中衛(wèi)市沙坡頭區(qū)黑山嘴溝,北至石嘴山市麻黃溝,西自寧蒙省界,東至黃河,面積為5371km2[7],屬于典型的大陸性氣候[8],多年平均徑流量為0.645億m3,汛期(6—9月)降水量占年降水量的74.23%[7]。
近年來,寧夏持續(xù)加強(qiáng)賀蘭山東麓重點(diǎn)防洪區(qū)域監(jiān)測站網(wǎng)建設(shè),對區(qū)域農(nóng)業(yè)灌溉、湖泊濕地、水產(chǎn)養(yǎng)殖、生態(tài)環(huán)境改善意義重大。本文選取賀蘭山東麓重點(diǎn)滯洪區(qū)為研究區(qū),面積約777.96km2,重點(diǎn)水體為星海湖、鎮(zhèn)朔湖、沙湖(圖1)。
圖1 研究區(qū)Sentinel-2衛(wèi)星影像
以Sentinel-1和Sentinel-2衛(wèi)星影像為數(shù)據(jù)源。Sentinel-1和Sentinel-2衛(wèi)星由歐盟和歐洲空間局“哥白尼計劃”研制,各有A、B兩顆星,雙星組網(wǎng)重訪周期分別為6d和5d。Sentinel-1衛(wèi)星搭載一臺5.404GHz的C波段合成孔徑雷達(dá),最大幅寬為400km,包含SM、IW、EW和WV成像模式。Sentinel-2衛(wèi)星攜帶一臺多光譜成像儀,含13個較窄波段,能夠更好地區(qū)分地物的光譜響應(yīng)特性差異[9],影像幅寬為290km。
基于Google Earth Engine(GEE)云平臺對Sentinel-1和Sentinel-2衛(wèi)星影像進(jìn)行預(yù)處理。其中,Sentinel-1衛(wèi)星影像選擇地距影像(GRD)產(chǎn)品數(shù)據(jù)集(COPERNICUS/S1_GRD),該數(shù)據(jù)集經(jīng)過了熱噪聲去除、輻射校正、地形校正處理,本文在此基礎(chǔ)上對GRD產(chǎn)品中的BVV、BVH后向散射數(shù)據(jù)進(jìn)行Refined Lee斑點(diǎn)濾波和區(qū)域裁剪、數(shù)據(jù)類型轉(zhuǎn)換處理。Sentinel-2衛(wèi)星影像選擇云量小于1%并經(jīng)過sen2cor大氣校正的L2A級地表反射率數(shù)據(jù)集(COPERNICUS/S2_SR),選取其中空間分辨率為10m的藍(lán)(Band2)、綠(Band3)、紅(Band4)和近紅外(Band8)波段,并對其進(jìn)行區(qū)域裁剪、數(shù)據(jù)類型轉(zhuǎn)換處理。Sentinel-1和Sentinel-2衛(wèi)星影像起止日期為2019年4月1日至10月31日。
經(jīng)典U-Net模型是由Ronneberger等[10]于2015年提出的一種改進(jìn)的全卷積網(wǎng)絡(luò)(fully convolutional network,FCN)模型。模型由兩部分組成:左側(cè)為編碼部分,由卷積層和下采樣層組成,用于特征提取;右側(cè)為解碼部分,由卷積層和上采樣層組成,用于恢復(fù)特征圖的維度。編碼器與解碼器進(jìn)行4次長跳躍連接,使得模型在編碼器部分學(xué)習(xí)的細(xì)粒度特征能夠用于解碼器部分構(gòu)建圖像。該模型最初是面向生物學(xué)領(lǐng)域的,主要研究對象為透射電子顯微鏡圖像中的細(xì)胞分割。
由于衛(wèi)星影像與顯微鏡圖像存在較大的空間尺度差異,圖像特征信息不匹配。本文針對經(jīng)典U-Net模型在衛(wèi)星遙感圖像水體語義分割方面的不足,提出WEU-Net模型,模型結(jié)構(gòu)如圖2所示(圖中D表示隨機(jī)失活層處理結(jié)果)。左側(cè)編碼過程中,輸入圖像大小為256×256像素,參照經(jīng)典U-Net模型結(jié)構(gòu),在卷積和殘差塊操作后,采用修正線性單元函數(shù)(rectified linear unit,ReLU)進(jìn)行激活,采用2×2最大池化方法進(jìn)行下采樣。右側(cè)的解碼過程中,逐層進(jìn)行2×2上采樣,并通過跳躍連接與左側(cè)對應(yīng)層級的特征圖進(jìn)行融合。同時借鑒文獻(xiàn)[4-5]的方法,在每層網(wǎng)絡(luò)的卷積操作后增加批標(biāo)準(zhǔn)化(batch normalization,BN)處理,規(guī)范網(wǎng)絡(luò)層的輸入。在網(wǎng)絡(luò)第4層2個殘差塊后分別添加概率為0.25的隨機(jī)失活層,通過丟棄25%概率的神經(jīng)元減少數(shù)據(jù)過擬合現(xiàn)象。在網(wǎng)絡(luò)最后一層采用1×1卷積和softmax激活函數(shù)得到與輸入圖像空間分辨率一致的輸出圖像。
圖2 WEU-Net模型結(jié)構(gòu)
本文提出的WEU-Net模型較經(jīng)典U-Net模型的主要改進(jìn)之處:①減少了原始網(wǎng)絡(luò)結(jié)構(gòu)中編碼器與解碼器的跳躍連接;②對每層卷積核數(shù)量減半以簡化模型;③采用引入殘差塊增強(qiáng)特征提取的策略以實(shí)現(xiàn)對模型編碼過程的優(yōu)化。
Sentinel-1衛(wèi)星具備在云霧干擾天氣條件下的監(jiān)測優(yōu)勢。由于Sentinel-1衛(wèi)星后向散射數(shù)據(jù)有限,考慮到深度學(xué)習(xí)模型對數(shù)據(jù)特征的挖掘能力較強(qiáng),借鑒文獻(xiàn)[11-12]的方法,構(gòu)建了適用于賀蘭山東麓滯洪區(qū)的Sentinel-1水體指數(shù),并將構(gòu)建的水體指數(shù)與BVV、BVH后向散射數(shù)據(jù)融合,以豐富原始數(shù)據(jù)特征。Sentinel-1水體指數(shù)計算步驟如下:
a.光學(xué)遙感水體指數(shù)篩選。采用Sentinel-2衛(wèi)星影像數(shù)據(jù)計算NDWI、MNDWI、基于藍(lán)光的NDWI(normalized difference water index based on blue light,NDWI-B)[13]、AWEIsh、增強(qiáng)型水體指數(shù)(enhanced water index,EWI)[14],并對比篩選適用于賀蘭山東麓水體提取的指數(shù)。
b.Sentinel-1后向散射指標(biāo)計算。對原始BVV、BVH后向散射指標(biāo)進(jìn)行數(shù)學(xué)變換,得到4種衍生指標(biāo)BVH2、BVV2、BVV×VH、BVV+VH。
c.Sentinel-1水體指數(shù)構(gòu)建。根據(jù)水體表面在Sentinel-1和Sentinel-2衛(wèi)星影像上顏色、亮度差異特征,以6種Sentinel-1后向散射指標(biāo)為自變量,以Sentinel-2水體指數(shù)為因變量,利用逐步回歸法,采用通過顯著性檢驗(yàn)的指標(biāo)構(gòu)建Sentinel-1水體指數(shù)。
選擇2019年4—10月覆蓋賀蘭山東麓重點(diǎn)滯洪區(qū)的Sentinel-1和Sentinel-1-2衛(wèi)星影像作為WEU-Net模型構(gòu)建的數(shù)據(jù)源。由于Sentinel-2衛(wèi)星影像上水體輪廓易于人工判識,因此首先采用Adobe Photoshop 22.1.0和GDAL 3.3.1通過目視解譯方法對Sentinel-2衛(wèi)星影像中的水體進(jìn)行標(biāo)注,并對每個影像和標(biāo)簽組合隨機(jī)裁剪。數(shù)據(jù)增強(qiáng)對于訓(xùn)練模型所需的不變性和魯棒性至關(guān)重要[10],因此對裁剪后的圖像進(jìn)行幾何變換增強(qiáng)(水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)、對角鏡像),最終得到8400個Sentinel-2衛(wèi)星影像和標(biāo)簽組合。按照3∶1∶1的比例劃分為訓(xùn)練集、驗(yàn)證集和測試集,建立基于Sentinel-2衛(wèi)星影像的WEU-Net模型。從模型預(yù)測結(jié)果中選取與Sentinel-1衛(wèi)星影像相同或相近日期的圖像作為Sentinel-1衛(wèi)星影像的水體標(biāo)簽,采用與Sentinel-2衛(wèi)星影像相同的處理方式獲得9600個Sentinel-1衛(wèi)星影像和標(biāo)簽組合,建立基于Sentinel-1衛(wèi)星影像的WEU-Net模型。基于Sentinel-1和Sentinel-2衛(wèi)星影像建模所選影像日期如表1所示。
表1 建模影像日期和標(biāo)簽日期
試驗(yàn)平臺采用Intel(R)Xeon(R)Gold 6126 CPU@2.60GHz 2.59GHz 24核雙處理器,配置256G內(nèi)存,搭載NVIDIA Tesla P100-PCIE 16GB顯卡。在軟件環(huán)境方面,采用Windows Server 2012 R2 Standard 64位操作系統(tǒng),使用Python 3.6編程語言,采用TensorFlow 1.9后端的深度學(xué)習(xí)框架Keras 2.1.6作為模型搭建工具,使用CUDA 9.0版本的GPU運(yùn)算平臺以及NVIDIA深度神經(jīng)網(wǎng)絡(luò)庫cuDNN 7.6.5訓(xùn)練模型。cuDNN是經(jīng)GPU加速的深度神經(jīng)網(wǎng)絡(luò)基元庫,可大幅優(yōu)化用于前向傳播和反向傳播的卷積層、池化層、歸一化層和激活層的運(yùn)算效率。
在模型預(yù)測過程中,為防止內(nèi)存溢出,一般將待分類圖像裁剪為多幅較小的圖像分別輸入網(wǎng)絡(luò)進(jìn)行預(yù)測。借鑒文獻(xiàn)[4]的方法,采用忽略邊緣預(yù)測的策略,即有重疊地裁剪圖像進(jìn)行預(yù)測,再按照裁剪的順序?qū)㈩A(yù)測結(jié)果圖像逐個拼接,拼接時忽略相鄰圖像重疊部分的像素得到最終結(jié)果圖像。研究表明,當(dāng)進(jìn)行拼接的圖像面積占實(shí)際裁剪圖像面積的比例(r)為0.5(即相鄰裁剪圖像的重疊比例1-r1/2為30%)時,模型預(yù)測精度最佳[4],因此設(shè)定重疊率為30%。
學(xué)習(xí)率是神經(jīng)網(wǎng)絡(luò)訓(xùn)練中重要的超參數(shù),控制了權(quán)重更新的幅度,以及訓(xùn)練的速度和精度。學(xué)習(xí)率太大容易導(dǎo)致目標(biāo)(代價)函數(shù)波動較大從而難以找到最優(yōu)解,而學(xué)習(xí)率太小則會導(dǎo)致模型收斂慢、耗時長。經(jīng)反復(fù)試驗(yàn),發(fā)現(xiàn)當(dāng)初始學(xué)習(xí)率設(shè)定為0.00001,并采取當(dāng)3次迭代后驗(yàn)證集的損失值不再降低、學(xué)習(xí)率減少75%的調(diào)整策略時,獲得的模型預(yù)測效果最佳。
為定量評估水體提取精度,采用總體精度(POA)、F1分?jǐn)?shù)(PF1)作為模型精度評價指標(biāo)??傮w精度表示對每一個隨機(jī)樣本,所分類的結(jié)果與參考數(shù)據(jù)所對應(yīng)區(qū)域的實(shí)際類型相一致的概率[4],計算公式為
(1)
式中:xi為圖像中像元正確分類的個數(shù);N為圖像中像元總數(shù)。
F1分?jǐn)?shù)是反映精確率(precision)與召回率(recall)的綜合評價指標(biāo),反映模型對正負(fù)樣本的識別和區(qū)分能力[5],計算公式為
PF1=(1+β2)PpPr/β2(Pp+Pr)
(2)
式中:Pp為精確率,表示正確預(yù)測為正例的樣本像元數(shù)在正例像元真實(shí)總數(shù)中所占的比例;Pr為召回率,表示正確預(yù)測為正例的樣本像元數(shù)在全部被預(yù)測為正例像元總數(shù)中所占的比例;β為權(quán)重,反映精確率和召回率對F1分?jǐn)?shù)的重要程度,本文取β=1。
將5040幅256×256像素的Sentinel-2衛(wèi)星影像及標(biāo)簽作為訓(xùn)練數(shù)據(jù),1680幅256×256像素的Sentinel-2衛(wèi)星影像及標(biāo)簽作為驗(yàn)證數(shù)據(jù),輸入經(jīng)典U-Net和WEU-Net模型,取學(xué)習(xí)率為0.00001,批處理尺寸(batch size)為16,使用Adam優(yōu)化算法進(jìn)行后向傳播迭代200次,逐層優(yōu)化模型參數(shù),經(jīng)過多次迭代試驗(yàn),得到最優(yōu)參數(shù)結(jié)果,并輸出1680幅256×256像素水體預(yù)測結(jié)果圖用于評估模型預(yù)測精度。從WEU-Net模型在Sentinel-2衛(wèi)星影像數(shù)據(jù)集迭代過程的精度變化曲線來看,準(zhǔn)確率(圖3(a))在前10次迭代整體呈快速增大趨勢,經(jīng)過60次迭代逐漸平穩(wěn),訓(xùn)練集和驗(yàn)證集準(zhǔn)確率分別趨于0.990和0.975;損失值(圖3(b))在前20次迭代整體呈明顯下降趨勢,經(jīng)過50次迭代訓(xùn)練集損失值逐漸趨于平穩(wěn),最小值在0.025左右,驗(yàn)證集損失值在0.08左右平穩(wěn)波動。而經(jīng)典U-Net模型的訓(xùn)練集準(zhǔn)確率與損失值變化趨勢與WEU-Net模型相似,準(zhǔn)確率曲線趨于平穩(wěn)后甚至高于WEU-Net。但從驗(yàn)證集曲線來看,經(jīng)過20次迭代后,損失值由下降迅速轉(zhuǎn)為上升趨勢,模型出現(xiàn)過擬合,說明引入批標(biāo)準(zhǔn)化層、隨機(jī)失活層和殘差塊的WEU-Net模型可以有效防止過擬合,模型的魯棒性和泛化能力明顯增強(qiáng)。從模型訓(xùn)練效率和預(yù)測精度看(表2,圖4),與經(jīng)典U-Net模型相比,WEU-Net模型的訓(xùn)練時長縮短了49.30%,并且模型預(yù)測總體精度為98.19%、F1分?jǐn)?shù)為0.9469,分別較經(jīng)典U-Net模型提高了0.3577%和0.9488%,對于水草、農(nóng)田等干擾區(qū)域的預(yù)測結(jié)果更好。此外,與幾種常用的水體指數(shù)提取結(jié)果相比,WEU-Net模型的預(yù)測精度更高,對于魚塘、水渠等細(xì)小水體的分割更完整。雖然卷積神經(jīng)網(wǎng)絡(luò)模型在初期模型訓(xùn)練階段需要大量樣本輸入,耗時較長,但從模型的可遷移性和遙感圖像智能解譯的有效性、發(fā)展趨勢來看,卷積神經(jīng)網(wǎng)絡(luò)模型較傳統(tǒng)水體指數(shù)法更具有優(yōu)勢。
表2 不同水體提取方法精度對比
圖3 經(jīng)典U-Net模型與WEU-Net模型迭代過程準(zhǔn)確率和損失值變化曲線
圖4 不同水體提取方法提取結(jié)果
首先篩選適用于研究區(qū)的光學(xué)遙感水體指數(shù)。由于近紅外波段對水體具有較強(qiáng)的吸收作用和敏感性,因此采用指數(shù)法識別水體時,適宜選擇含有NIR、SWIR1、SWIR2波段的指數(shù)。
最大類間方差法(Otsu)[15]是一種無參數(shù)、無監(jiān)督的閾值分割算法[16],在水庫[17]、河流漫灘[18]、城市地表[19-20]等水體信息提取方面應(yīng)用廣泛。趙金龍等[21]研究發(fā)現(xiàn),Otsu閾值分割算法在提取水體時,對無植被生長以及土壤濕度和鹽分環(huán)境復(fù)雜區(qū)域的剔除效果較好,因此本文采用Otsu閾值分割算法對Sentinel-2水體指數(shù)進(jìn)行二值化閾值分割,得到水體提取結(jié)果。表3對比了5種水體指數(shù)在Sentinel-2衛(wèi)星影像上提取星海湖、沙湖、黃河石嘴山部分河段的總體精度。多數(shù)光學(xué)遙感水體指數(shù)易混淆的地物類型為工廠房屋、橋梁、沙地、農(nóng)田、水陸邊界、蘆葦、河心島、細(xì)小河道、池塘、鹽堿地等。但NDWI和MNDWI對非水體離散像元的抑制性更強(qiáng),對水體的識別總體精度較其他指數(shù)更高,總體精度最大值分別為91.00%和84.00%。因此,初步確定NDWI和MNDWI為適用于研究區(qū)的光學(xué)遙感水體指數(shù)。
表3 研究區(qū)典型水體提取結(jié)果總體精度
盡管合成孔徑雷達(dá)衛(wèi)星具有全天時、全天候觀測優(yōu)勢,但由于C波段單極化合成孔徑雷達(dá)數(shù)據(jù)的噪聲特性,使Sentinel-1衛(wèi)星在水體分類方面誤差高于光學(xué)衛(wèi)星[22-23]。許多研究表明,Sentinel-1和Sentinel-2衛(wèi)星協(xié)同觀測在洪澇區(qū)制圖[24]、淹沒河段長度估算[25]、河流流量監(jiān)測[26]中發(fā)揮了重要作用。為充分利用合成孔徑雷達(dá)衛(wèi)星不受云霧影響的優(yōu)勢,彌補(bǔ)光學(xué)衛(wèi)星觀測能力的不足,獲取汛期滯洪區(qū)高頻次、高精度水體空間分布數(shù)據(jù),本文將水體分類精度較高的Sentinel-2衛(wèi)星影像與高時間分辨率Sentinel-1衛(wèi)星影像融合,構(gòu)建Sentinel-1水體指數(shù)。使用的Sentinel-1衛(wèi)星后向散射指標(biāo),除原始的BVV、BVH外,還包括由BVV、BVH相加、相乘得到的4個衍生指標(biāo)。圖5為研究區(qū)不同后向散射指標(biāo)樣例圖,可以看出,BVH(圖5(a))、BVV(圖5(b))、BVV+VH(圖5(f))在水體區(qū)域呈深色調(diào),非水體區(qū)域?yàn)闇\色調(diào),而BVH2(圖5(c))、BVV2(圖5(d))、BVV×VH(圖5(e))與之相反。
圖5 研究區(qū)不同后向散射指標(biāo)樣例
分別以Sentinel-2水體指數(shù)NDWI、MNDWI為因變量,以BVH、BVV、BVH2、BVV2、BVV×VH、BVV+VH后向散射指標(biāo)為自變量,利用逐步回歸法選取通過p<0.01顯著性檢驗(yàn)的因子建立Sentinel-1水體指數(shù)S1-NDWI(R2=0.4698)、S1-MNDWI(R2=0.6077)回歸模型如下:
I1=(ρgreen-ρNIR)/(ρgreen+ρNIR)
(3)
I2=(ρgreen-ρSWIR)/(ρgreen+ρSWIR)
(4)
I3=-0.0727041+0.0154083BVH+0.0775993BVV+0.0038813BVV×VH
(5)
I4=-0.0822525-0.0516677BVH+0.0008788BVV2+0.0029097BVV×VH+0.0651039BVV+VH
(6)
式中:I1、I2分別為Sentinel-2水體指數(shù)NDWI、MNDWI;I3、I4分別為Sentinel-1水體指數(shù)S1-NDWI、S1-MNDWI;ρgreen、ρNIR、ρSWIR分別為Sentinel-2綠光波段(Band3)、近紅外波段(Band8)和短波紅外波段(Band11)的反射率。
通過對比,最終選取R2較大的S1-MNDWI作為融合特征構(gòu)建Sentinel-1衛(wèi)星水體提取數(shù)據(jù)集。此外,從研究區(qū)S1-MNDWI圖像(圖6(a))及其像素值頻率分布直方圖(圖6(b))看,雖然研究區(qū)非水體像素占比較大,干擾因素較多,但經(jīng)過指數(shù)計算后背景地物類型相對單一區(qū)域的水體輪廓得到明顯增強(qiáng),表明本文建立的水體指數(shù)S1-MNDWI不僅可用于卷積神經(jīng)網(wǎng)絡(luò)模型的特征融合,還為復(fù)雜天氣條件下僅利用Sentinel-1衛(wèi)星單極化數(shù)據(jù)和Otsu閾值分割算法開展滯洪區(qū)水體快速識別創(chuàng)造了有利條件。
圖6 研究區(qū)S1-MNDWI圖像及其像素值頻率分布直方圖
將5760幅256×256像素Sentinel-1衛(wèi)星影像及標(biāo)簽作為訓(xùn)練數(shù)據(jù),1920幅256×256像素Sentinel-1衛(wèi)星影像及標(biāo)簽作為驗(yàn)證數(shù)據(jù),輸入WEU-Net模型,經(jīng)后向傳播迭代200次,得到模型準(zhǔn)確率(圖7(a))、損失值(圖7(b))變化曲線,并輸出1920幅256×256像素水體預(yù)測結(jié)果圖用于評估模型預(yù)測精度。從整體趨勢來看,融合S1-MNDWI前后模型精度變化趨勢基本相似,在迭代初期均表現(xiàn)為準(zhǔn)確率快速升高、損失值快速降低的變化趨勢。但從穩(wěn)定性來看,與BVV、BVH單波段后向散射數(shù)據(jù)集相比,融合S1-MNDWI后,雖然模型訓(xùn)練時長增加了1.91%(表4),但模型收斂速度更快,訓(xùn)練集和驗(yàn)證集的準(zhǔn)確率、損失值分別在45次迭代和50次迭代后趨于穩(wěn)定,預(yù)測總體精度和F1分?jǐn)?shù)分別提高了0.51%和3.16%(表4),模型的魯棒性、穩(wěn)定性得到增強(qiáng),對于水體邊緣的識別效果更好(圖8)。
表4 不同數(shù)據(jù)集模型訓(xùn)練時長與預(yù)測精度對比
圖7 水體指數(shù)融合前后迭代過程準(zhǔn)確率和損失值變化曲線
圖8 不同數(shù)據(jù)集對應(yīng)的水體提取結(jié)果
本文針對經(jīng)典U-Net模型在賀蘭山東麓滯洪區(qū)水體識別中適用性不足的問題,基于Sentinel-1和Sentinel-2衛(wèi)星影像提出了一種適用于賀蘭山東麓水體信息提取的模型——WEU-Net模型。通過減少編碼器與解碼器的跳躍連接及卷積核數(shù)量實(shí)現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)簡化,同時在編碼階段引入殘差塊增強(qiáng)特征提取能力,避免因連接層和卷積核數(shù)量減少可能導(dǎo)致的模型泛化能力降低的風(fēng)險。在此基礎(chǔ)上,試驗(yàn)對比了提出的WEU-Net模型與經(jīng)典U-Net模型在Sentinel-2衛(wèi)星影像上的水體提取精度,同時針對Sentinel-1影像特征豐富度有限的問題,構(gòu)建了水體指數(shù)S1-MNDWI,并作為融合特征提高了Sentinel-1衛(wèi)星影像水體提取精度。與經(jīng)典U-Net模型相比,WEU-Net模型的魯棒性和泛化能力明顯增強(qiáng),可以有效防止過擬合,測試集總體精度和F1分?jǐn)?shù)較經(jīng)典U-Net模型分別提高了0.3577%和0.9488%,訓(xùn)練時長僅為原來的50.70%;融合S1-MNDWI后,WEU-Net模型測試集總體精度和F1分?jǐn)?shù)較融合前分別提高了0.51%和3.16%。