李 寧 郭志順 毋 琳* 趙建輝
①(河南大學(xué)計(jì)算機(jī)與信息工程學(xué)院 開封 475004)
②(河南省智能技術(shù)與應(yīng)用工程技術(shù)研究中心 開封 475004)
③(河南省大數(shù)據(jù)分析與處理重點(diǎn)實(shí)驗(yàn)室 開封 475004)
大型河流穩(wěn)定行河對(duì)人民安居樂(lè)業(yè)有著舉足輕重的作用。近年來(lái),國(guó)內(nèi)水患頻發(fā),準(zhǔn)確、及時(shí)地檢測(cè)河流健康狀況對(duì)洪澇預(yù)警、災(zāi)后評(píng)估有重要意義。隨著遙感技術(shù)的迅猛發(fā)展,衛(wèi)星遙感技術(shù)已成為研究人員對(duì)自然環(huán)境的日常檢測(cè)和對(duì)災(zāi)害的及時(shí)感知的重要手段[1,2]。相比實(shí)地勘察,遙感手段在節(jié)省大量人力物力的同時(shí),還避免了實(shí)地調(diào)研過(guò)程中的各種風(fēng)險(xiǎn)。因此,基于衛(wèi)星遙感技術(shù)開發(fā)相應(yīng)的河流檢測(cè)方法具有重要的應(yīng)用價(jià)值。
與光學(xué)影像不同,合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)能夠提供全天時(shí)全天候的觀測(cè)數(shù)據(jù)[3,4]。其主動(dòng)發(fā)射的微波可穿透云與霧,已在道路提取[5]、艦船檢測(cè)[6]等方面大放異彩。同時(shí)SAR發(fā)出的微波對(duì)于水和陸地散射特性有差異,可以為湖泊水域分割、海岸線提取等任務(wù)提供較好的數(shù)據(jù)資源[7,8]?;赟AR這一特點(diǎn),對(duì)現(xiàn)代河流和湖泊的諸多研究工作頗有成效[9,10]。傳統(tǒng)水域分割方法有閾值分割法、主動(dòng)輪廓模型法、聚類分割法等。自適應(yīng)閾值分割算法[11,12]通過(guò)圖像不同區(qū)域的灰度值分布來(lái)自動(dòng)生成閾值,該類方法運(yùn)算效率高,但易受SAR圖像中相干斑噪聲的影響;主動(dòng)輪廓模型法[13,14]一般先對(duì)水域進(jìn)行粗分割,再根據(jù)梯度信息對(duì)粗分割結(jié)果多次迭代,最終得到更加精確的分割結(jié)果,但該類算法運(yùn)算量較大且易受粗分割精度的影響;聚類算法[15]根據(jù)數(shù)據(jù)的分布按照某種距離(歐氏距離、曼哈頓距離等)來(lái)評(píng)估當(dāng)前像素與類別中心之間的相似程度,如K-means,Wishart分類器,該類方法可實(shí)現(xiàn)較為高效的無(wú)監(jiān)督分類,但仍易受相干斑噪聲的影響。
以上傳統(tǒng)算法的本質(zhì)是人工設(shè)計(jì)一種映射或判據(jù),并以此判定圖像中像素點(diǎn)的類別。對(duì)于存在大量相干斑噪聲的SAR圖像來(lái)說(shuō),這些映射很難適應(yīng)整幅SAR圖像中所有的像素。而神經(jīng)網(wǎng)絡(luò)技術(shù)通過(guò)不停迭代模型中的共享權(quán)值,最終構(gòu)建出能夠適應(yīng)所有像素的映射模型。近年來(lái),深度神經(jīng)網(wǎng)絡(luò)技術(shù)在遙感領(lǐng)域大放異彩[16,17]。越來(lái)越多的學(xué)者開始對(duì)相關(guān)模型進(jìn)行一定的改進(jìn),使其更適合SAR遙感影像的分類、目標(biāo)檢測(cè)、語(yǔ)義分割等任務(wù)。2012年,文獻(xiàn)[18]提出脈沖耦合神經(jīng)網(wǎng)絡(luò)(Pulse Coupled Neural Networks,PCNN),并探討了該模型在C波段和X波段SAR圖像中提取海岸線的能力。2015年,文獻(xiàn)[19]提出了全卷積神經(jīng)網(wǎng)絡(luò)(Fully Convolution Networks,FCN)模型,隨著該模型的出現(xiàn),神經(jīng)網(wǎng)絡(luò)技術(shù)開始具備實(shí)現(xiàn)像素級(jí)端到端語(yǔ)義分割任務(wù)的能力,如文獻(xiàn)[20]曾利用 FCN 模型在印度沿海地區(qū) SAR 影像中成功分割出了當(dāng)?shù)睾恿鳌H欢?,盡管 FCN中有多層上采樣操作,但是其對(duì)于淺層網(wǎng)絡(luò)所提取的圖像特征信息沒(méi)有充足的利用。2015年,隨著U型神經(jīng)網(wǎng)絡(luò)(U-Net)的提出[21],淺層網(wǎng)絡(luò)的特征信息通過(guò)跳躍連接傳遞到深層網(wǎng)絡(luò)與對(duì)應(yīng)的特征信息融合起來(lái),如文獻(xiàn)[22]以遷移學(xué)習(xí)的方式將U-Net應(yīng)用于SAR圖像水域分割;文獻(xiàn)[23]利用U-Net和DeepLab對(duì)印度沿海地區(qū)部分河流進(jìn)行識(shí)別,但存在邊界信息缺失現(xiàn)象。2019年,文獻(xiàn)[24]結(jié)合可分離式卷積和擴(kuò)張卷積搭建網(wǎng)絡(luò)模型進(jìn)行SAR圖像水域分割,使得網(wǎng)絡(luò)能夠參考更多的語(yǔ)義信息,從而達(dá)到更好的分割表現(xiàn)。
然而,上述方法更多關(guān)注模型設(shè)計(jì),而忽略了河流本身幾何特性與網(wǎng)絡(luò)模型之間的聯(lián)系。本文針對(duì)河道的精確提取問(wèn)題,提出一種改進(jìn)的卷積核(Refined-Lee Kernel,RLK)。進(jìn)而提出一種更加精確地提取河道的語(yǔ)義分割模型River-Net,用于提取SAR圖像中的河道。最后以黃河為實(shí)施例,基于黃河語(yǔ)義分割結(jié)果來(lái)判斷黃河在7·20暴雨后的行河情況。本文的主要貢獻(xiàn)總結(jié)如下:
(1) 提出了一種新型卷積核RLK,可以根據(jù)目標(biāo)幾何特點(diǎn)來(lái)強(qiáng)化自身特征提取能力。
(2) 設(shè)計(jì)了一種新型的水域分割網(wǎng)絡(luò)River-Net,可以對(duì)SAR圖像中的河流執(zhí)行更加精細(xì)的語(yǔ)義分割任務(wù)。
(3) 利用所提網(wǎng)絡(luò)模型,以檢測(cè)黃河河道為實(shí)施例,分析了黃河在7·20暴雨后的行河情況。
DeepLab模型[25]以空洞卷積(Dilated convolution)的形式增加卷積層感受野,從而獲得更多的上下文語(yǔ)義信息。在深度卷積神經(jīng)網(wǎng)絡(luò)模型中,下采樣過(guò)程往往伴隨著分辨率的丟失,而空洞卷積可實(shí)現(xiàn)不增加參數(shù)量的前提下提高感受野。
如圖1所示,在正常卷積中引入“擴(kuò)張率”作為超參數(shù),該參數(shù)定義了卷積核處理數(shù)據(jù)時(shí)權(quán)值之間的間距。該方法能有效提高模型的感受野,使得模型能學(xué)習(xí)更多的上下文信息。然而,Kernel的不連續(xù)可能導(dǎo)致輸入圖像的一些像素點(diǎn)不參與計(jì)算,模型輸出結(jié)果中類別邊界“鋸齒”效應(yīng)嚴(yán)重。因此在DeepLab模型末端通常引入條件隨機(jī)場(chǎng)(Conditional Random Field,CRF),通過(guò)二元?jiǎng)莺瘮?shù)描述像素點(diǎn)與像素點(diǎn)之間的關(guān)系,鼓勵(lì)“距離”相近的像素分配相同的標(biāo)簽,而相差較大的像素分配不同標(biāo)簽,而這個(gè)“距離”的定義與像素值和實(shí)際相對(duì)距離有關(guān)。CRF能夠使空洞卷積在分割邊界導(dǎo)致的鋸齒效應(yīng)得到較大的改善。
圖1 一般卷積與空洞卷積對(duì)比圖Fig.1 Comparison diagram of convolution and dilated convolution
在神經(jīng)網(wǎng)絡(luò)執(zhí)行語(yǔ)義分割任務(wù)中,一些特殊場(chǎng)景很容易使得網(wǎng)絡(luò)模型產(chǎn)生錯(cuò)誤的判斷,如汽車在岸邊可能被網(wǎng)絡(luò)判定為船,電腦顯示器與電視機(jī)顯示器容易存在類別混淆。此時(shí)需要引入更多的上下文語(yǔ)義信息來(lái)解決問(wèn)題。當(dāng)判定層能夠考慮更多的全局語(yǔ)義信息時(shí),出現(xiàn)誤判的可能性就會(huì)低很多。與DeepLab網(wǎng)絡(luò)模型采用空洞卷積增加感受野的方式不同,PSPNet[26]通過(guò)金字塔池化(Spatial Pyramid Pooling,SPP)模塊來(lái)增加感受野,從而使得網(wǎng)絡(luò)模型能兼顧更多的上下文信息。
如圖2所示,SPP模塊融合了幾種不同尺度下的特征。SPP模塊中不同層級(jí)輸出不同尺度的特征圖,為了保持全局特征的權(quán)重,在每個(gè)金字塔層級(jí)后使用1×1的卷積核,當(dāng)某個(gè)層級(jí)維數(shù)為n時(shí),即可將語(yǔ)境特征的維數(shù)降到原始特征的1/n。然后,通過(guò)雙線性插值直接對(duì)低維特征圖進(jìn)行上采樣,使其與原始特征圖尺度相同。最后,將不同層級(jí)的特征圖拼接為最終的金字塔池化全局特征。
圖2 金字塔池化操作示意圖Fig.2 The schematic diagram of spatial pyramid pooling
以上神經(jīng)網(wǎng)絡(luò)模型中卷積核被認(rèn)為是感知圖像特征的“眼睛”,其機(jī)制類似于人眼的感受野。從數(shù)學(xué)的角度看,卷積核本質(zhì)上是一種參數(shù)可訓(xùn)練的濾波算子。和其他濾波方式類似,其運(yùn)算方式具有很關(guān)鍵的特點(diǎn)——線性且具有平移不變性。同時(shí)它還有一般濾波器所不具備的特點(diǎn),即權(quán)值共享特性。
現(xiàn)有的研究[24]更多地關(guān)注卷積核的感受野,以求獲取更多有效的上下文信息,然而卻忽略了卷積核的線性平移不變性。另外,由于河流在SAR圖像中多為連續(xù)的細(xì)長(zhǎng)曲線,對(duì)于河流相關(guān)的語(yǔ)義分割任務(wù)來(lái)說(shuō),河流邊界信息是首要的。而且SAR圖像中相干斑噪聲隨處可見(jiàn),精致Lee濾波也常常被用來(lái)過(guò)濾該噪聲、保留SAR圖像中目標(biāo)的邊界信息。
于是,借用精致Lee濾波的思想,本文提出了RLK模塊,基于卷積核的濾波器特性來(lái)更有效地提取圖像特征,保留目標(biāo)更多的邊界信息。
精致Lee濾波通過(guò)定義8種非正方形局部窗口,將均勻區(qū)域像素值等于其平均值,將非均勻區(qū)域近似于局部窗口中心像素值?;诰翷ee濾波的思想改進(jìn)卷積核,增強(qiáng)其邊界特征提取能力。定義8種非正方形局部窗口,如圖3所示,通過(guò)定義中心像素的鄰域來(lái)提高邊界估計(jì)的準(zhǔn)確性。
圖3 精致 Lee 濾波 8 種模板示意圖Fig.3 Schematic diagram of refined Lee filter template
濾波后的卷積核權(quán)值可以寫為
圖4 RLK 模塊Fig.4 RLK module
其中,L代表濾波運(yùn)算,c onv代 表卷積運(yùn)算,F(xiàn)代表濾波器,k ernel 代表卷積核,Iinput為輸入圖像。
對(duì)于濾波運(yùn)算,有
其中,w為輸入圖像I的寬度,h為輸入圖像I的高度,k為卷積核的長(zhǎng)度,I(i,j)為 以第i行、第j列個(gè)像素點(diǎn)為中心,k×k大小的圖像切片。
由于L(*)為線性運(yùn)算,則式(2)可寫為
在河道提取任務(wù)中,如何充分發(fā)掘河道在SAR圖像中的幾何特性是所提深度神經(jīng)網(wǎng)絡(luò)模型的關(guān)鍵。另外,河道周圍的水池、魚塘等獨(dú)立水域在SAR圖像中往往與河道特性相似,對(duì)分割結(jié)果有一定的干擾作用。因此,要求分割網(wǎng)絡(luò)能夠參考更多的上下文語(yǔ)義信息。于是本文提出了基于RLK模塊的River-Net模型,其網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。
圖5 River-Net 結(jié)構(gòu)示意圖Fig.5 River-Net structure
River-Net模型主要由4個(gè)模塊構(gòu)成,即1個(gè)RLK模塊,2個(gè)連續(xù)的Resnet Block (RB)模塊和1個(gè)SPP模塊。
在RLK模塊中,卷積核尺寸為 7×7,個(gè)數(shù)為64,精致Lee濾波窗口也為7×7,這使得精致Lee濾波可以直接作用于該卷積核。另外,網(wǎng)絡(luò)淺層位置的卷積核所提取的圖像特征多為輪廓、紋理等淺層特征,這意味著將精致Lee濾波作用于淺層卷積核能夠發(fā)揮其更大的作用。
然后是兩個(gè)連續(xù)的RB模塊,每個(gè)RB模塊包含兩個(gè)殘差塊,每個(gè)殘差塊由卷積、正則化(Batch Normalization,BN)、激活函數(shù)ReLU、卷積、BN操作構(gòu)成。其中第1個(gè)RB模塊中,兩個(gè)殘差塊中卷積層分別有64和128個(gè) 3×3卷積核,為了使得網(wǎng)絡(luò)模型中各層參數(shù)在量級(jí)上無(wú)太大差別,避免訓(xùn)練過(guò)程中出現(xiàn)梯度消失或過(guò)擬合現(xiàn)象,在數(shù)據(jù)傳入下一層之前,要進(jìn)行BN處理,使得數(shù)據(jù)均值為0,方差為1。該操作可以表示為
重蔬食:“吾謂飲食之道,膾不如肉,肉不如蔬,亦以其漸近自然也?!崩顫O認(rèn)為“重蔬食”有益人體健康,應(yīng)該發(fā)揚(yáng)上古“重蔬食,遠(yuǎn)肥膩”的遺風(fēng),方能崇儉以養(yǎng)生。
其中,X為輸入向量,為輸入向量均值,為輸入向量方差,ε為足夠小的接近于0的常數(shù),γ和β均為可訓(xùn)練參數(shù)。
同樣為了避免過(guò)擬合,BN操作后采用ReLU單側(cè)抑制神經(jīng)元,使得網(wǎng)絡(luò)模型保持一定的稀疏性。ReLU定義為
單個(gè)RB模塊中的兩個(gè)殘差塊后都有一個(gè)跳躍連接,使得該層網(wǎng)絡(luò)能夠參考更多淺層的語(yǔ)義信息。該連接可定義為
其中,x為淺層特征,F(xiàn)(x)為 當(dāng)前層特征,H(x)為融合后的特征。
需要注意的是,第2個(gè)RB模塊中,兩個(gè)殘差塊中卷積層分別有256和512個(gè)3×3卷積核。每個(gè)殘差塊的兩個(gè)卷積層后都伴隨BN層進(jìn)行正則化處理,且第1個(gè)卷積層后伴隨ReLU操作。
在上述3個(gè)模塊后,緊接著是SPP模塊。SPP模塊融合了4種不同尺度的圖像特征,4種尺度分別將特征圖劃分為1個(gè)、4個(gè)、9個(gè)、36個(gè)子區(qū)域。對(duì)每個(gè)區(qū)域進(jìn)行全局池化操作。然后對(duì)池化后的結(jié)果執(zhí)行卷積操作,卷積核大小為1 × 1。由于同時(shí)采用了4層池化層,所以需要該卷積操作將通道數(shù)減少到原來(lái)的1/4。接著,對(duì)上一步的每一個(gè)特征圖利用雙線性插值上采樣得到原特征圖相同的尺寸,然后利用跳躍連接將原特征圖和上采樣得到的特征圖進(jìn)行Concat,得到的通道數(shù)是SPP模塊之前的兩倍。
最后再執(zhí)行卷積操作,卷積核大小為1 × 1,得到語(yǔ)義分割結(jié)果。
如圖6所示,在2021年鄭州7·20特大暴雨背景下,為檢測(cè)鄭州以北暴雨前后黃河徑流情況,本文將所研究黃河河段定為鄭州市滎陽(yáng)市以北桃花峪黃河大橋至開封黃河渡口浮橋。該河段總長(zhǎng)約110 km。研究區(qū)域范圍為113°26′10′′E—114°22′35′′E,34°50′56′′N—35°1′40′′N。黃河以桃花峪為界,往東為下游游蕩式河段。自古以來(lái)該河段水患無(wú)窮,由于大量泥沙淤積,河道逐年抬高,部分河段河床高出地面10 m,是世界上著名的“地上懸河”。鄭州特大暴雨事件,在17~20日3天過(guò)程降雨量617.1 mm。彼時(shí),與鄭州毗鄰的黃河下游游蕩式河段曾一度“河懸一線”。
圖6 研究區(qū)域示意圖Fig.6 Region of interest
本文所用SAR數(shù)據(jù)來(lái)源于歐洲航天局在2014年4月3日發(fā)射的C波段Sentinel-1衛(wèi)星。采用數(shù)據(jù)的工作模式為干涉寬掃描帶(Interferometric Wideswath,IW)模式,分辨率為5 m × 20 m,幅寬為250 km。Sentinel-1衛(wèi)星能夠提供重訪周期為12天的地球觀測(cè)數(shù)據(jù),其周期重訪能力有利于及時(shí)跟蹤自然災(zāi)害,適用于此次黃河徑流檢測(cè)實(shí)例。本文采用了兩景Sentinel-1衛(wèi)星Level 1-GRD產(chǎn)品SAR影像,獲取時(shí)間分別是2021年7月15日10點(diǎn)21分和2021年7月27日10點(diǎn)21分。兩景影像均能有效覆蓋研究區(qū)域。
在執(zhí)行語(yǔ)義分割任務(wù)前對(duì)所獲取的兩景SAR數(shù)據(jù)進(jìn)行預(yù)處理操作,主要步驟為:軌道矯正、輻射定標(biāo)、相干斑濾波和地形矯正。其中,為了平滑相干斑噪聲的同時(shí)不對(duì)實(shí)驗(yàn)造成干擾,所用濾波方法為 均值濾波,窗口大小為3×3。
在所獲取的兩景Sentinel-1影像中可以看出,除河道外,還存在大量冗余場(chǎng)景,河道僅在其中占很小一部分。因此,本文截取了影像中包含研究區(qū)域的部分來(lái)制作數(shù)據(jù)集。
對(duì)于7月15日SAR影像,感興趣區(qū)域ROI能夠直接提供的樣本數(shù)量較少。為了解決上述問(wèn)題,本文首先對(duì)SAR圖像中研究區(qū)域進(jìn)行無(wú)重疊圖像切片操作,切片尺寸為2 56×256,得到包含河道的圖像為71張,不含河道圖像175張。目標(biāo)樣本占總樣本比例為28.86%,樣本集存在不平衡現(xiàn)象。為解決這一問(wèn)題,本文又選取研究區(qū)域中5個(gè)包含河道的位置進(jìn)行滑窗切片操作,如圖7紅色正方形所示,窗口大小為2 56×256,滑窗水平和垂直步長(zhǎng)均為16個(gè)像素。并在此基礎(chǔ)上進(jìn)一步做數(shù)據(jù)增強(qiáng),對(duì)所截取的所有圖像切片進(jìn)行0°,90°,180°,270°旋轉(zhuǎn)、水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)。然后為所有的訓(xùn)練樣本和測(cè)試樣本制作標(biāo)簽圖。最終數(shù)據(jù)集中共包含1131個(gè)樣本,其中608個(gè)樣本包含河道,523個(gè)樣本不包含河道,目標(biāo)樣本占總樣本比例升至53.76%。選擇其中5個(gè)位置(如圖7黃色窗口)作為驗(yàn)證模型性能的圖片。為保證結(jié)果的獨(dú)立性,驗(yàn)證圖片與訓(xùn)練集樣本沒(méi)有像 素交集。
圖7 數(shù)據(jù)集制作示意圖Fig.7 Schematic diagram of generating data set
本文采取神經(jīng)網(wǎng)絡(luò)語(yǔ)義分割任務(wù)中常見(jiàn)的4種評(píng)價(jià)指標(biāo)來(lái)評(píng)估所提模型的表現(xiàn)。分別是精度Precision,召回率Recall,F(xiàn)1度量值F1-score,以及交并比IoU。對(duì)于神經(jīng)網(wǎng)絡(luò)測(cè)試結(jié)果來(lái)說(shuō),每個(gè)像素點(diǎn)都存在如表1所示的混淆矩陣。
如表1所示,TP (True Positives)為模型預(yù)測(cè)正確河道所占的像素個(gè)數(shù),F(xiàn)N (False Negative)為模型預(yù)測(cè)錯(cuò)誤河道所占的像素個(gè)數(shù),F(xiàn)P (False Positive)為模型預(yù)測(cè)錯(cuò)誤背景所占的像素個(gè)數(shù),TN (True Negative)為模型預(yù)測(cè)正確背景所占的像素個(gè)數(shù)。
表1 混淆矩陣Tab.1 Confusion matrix
以此為基礎(chǔ),河道提取的Precision定義為
基于Sentinel-1影像數(shù)據(jù),本文訓(xùn)練了River-Net模型,用于提取黃河河道。為了驗(yàn)證RLK模塊的特征強(qiáng)化效果,本文在圖8中展示了圖像經(jīng)過(guò)RLK模塊之后得到的特征圖,并以傳統(tǒng)的卷積操后的特征圖作為對(duì)比實(shí)驗(yàn)。對(duì)River-Net結(jié)構(gòu)中第1層卷積層來(lái)說(shuō),64個(gè)7×7的卷積核生成的特征圖如圖8(d)所示。本文對(duì)比了兩個(gè)特征圖組的第2,6,16和37張?zhí)卣鲌D,其中紅色標(biāo)注為傳統(tǒng)卷積操作得到的結(jié)果,而青色標(biāo)注表示RLK模塊得到的特征圖。從圖8(e)可以看出,與傳統(tǒng)卷積操作得到的特征圖相比,RLK模塊提取的特征邊界更加清晰,且目標(biāo)特征更加明顯。
圖8 不同網(wǎng)絡(luò)的特征圖提取與對(duì)比Fig.8 Feature map extraction and comparison of different networks
為了進(jìn)一步驗(yàn)證基于RLK模塊搭建的深度模型River-Net的有效性。本文采用了多種水域分割方法作為對(duì)比實(shí)驗(yàn),選取圖7中包含河流和陸地的5個(gè)黃色窗口對(duì)應(yīng)的圖像切片進(jìn)行語(yǔ)義分割。分割結(jié)果圖中白色區(qū)域代表陸地,黑色區(qū)域代表河道。對(duì)于傳統(tǒng)水域分割方法,本文選用OTSU,ACM,K-means算法作為對(duì)比實(shí)驗(yàn),對(duì)于神經(jīng)網(wǎng)絡(luò)水域分割方法,本文選取U-Net,DeepLab,PSPNet模型作為對(duì)比實(shí)驗(yàn)。此外,為了驗(yàn)證RLK模塊對(duì)網(wǎng)絡(luò)模型特征提取的增強(qiáng)作用,本文以U-Net,PSPNet作為基礎(chǔ)模型,將這兩個(gè)模型中首個(gè)特征提取層替換為RLK模塊來(lái)驗(yàn)證該模塊的適用性。由于Deep-Lab模型所用卷積核為空洞卷積,RLK模塊對(duì)其不適配,因此不對(duì)該模型植入RLK模塊。
上述各個(gè)對(duì)比模型的河道提取效果圖如圖9所示。傳統(tǒng)的分割方法中,OTSU和K-means聚類算法對(duì)應(yīng)的結(jié)果圖中有許多孤立的誤判點(diǎn),表明這兩類算法受SAR圖像相干斑噪聲影像較大;ACM算法對(duì)噪聲不敏感,然而在測(cè)試圖像T5中,河道內(nèi)灘整體被誤判為水域,這種誤判對(duì)于河內(nèi)淺灘較多的黃河來(lái)說(shuō)是不能接受的。7種深度學(xué)習(xí)水域分割方法表現(xiàn)良好,這是由于該類方法可訓(xùn)練共享權(quán)值的特點(diǎn),可以構(gòu)建出適應(yīng)所有像素點(diǎn)的映射模型,即便像素點(diǎn)被噪聲覆蓋,也可以根據(jù)該像素本身特點(diǎn)和像素間的空間信息來(lái)對(duì)噪聲像素構(gòu)建映射。在SAR圖像中,黃河周圍小面積孤立水域與河道特征較為相似,在測(cè)試圖像T3中,U-Net和DeepLab模型將其誤判為河道的一部分。而PSPNet和River-Net相關(guān)的模型可以有效地區(qū)分周圍池塘與黃河河道,這是由于這些模型都包含SPP模塊,使得更多的空間信息被引入,有效解決了圖像中容易產(chǎn)生語(yǔ)義歧義的場(chǎng)景。
圖9 不同網(wǎng)絡(luò)分割結(jié)果對(duì)比Fig.9 Comparison with segmentation results of different networks
原始U-Net,PSPNet和不含RLK模塊的River-Net在驗(yàn)證圖像T5中識(shí)別纖細(xì)的黃河支流有缺陷,在T4中無(wú)法識(shí)別黃河支流。U-Net+RLK,PSPNet+RLK以及River-Net模型與不含RLK模塊的對(duì)應(yīng)模型相比,對(duì)于纖細(xì)彎曲的河道更加敏感,分割效果更好。而River-Net借助RLK模塊所提取的特征圖輪廓更加清晰,因此對(duì)纖細(xì)河道的提取表現(xiàn)更好。
為了定量分析所提方法的有效性,本文基于5.2節(jié)介紹的評(píng)價(jià)指標(biāo),對(duì)所提方法進(jìn)行評(píng)估,同時(shí)對(duì)比了3種傳統(tǒng)水域分割方法和6種神經(jīng)網(wǎng)絡(luò)模型,所得結(jié)果為5幅圖像對(duì)應(yīng)計(jì)算結(jié)果的均值,結(jié)果如表2所示。在傳統(tǒng)方法中,K-means算法表現(xiàn)最好,準(zhǔn)確率高達(dá)95.1%,但各項(xiàng)指標(biāo)均不如深度學(xué)習(xí)算法。而在深度學(xué)習(xí)算法中,RLK模塊分別使U-Net,PSPNet精度增加了0.52%和1.11%,召回率增加了2.15%和0.51%?;赗LK模塊搭建的River-Net分割精度最高,達(dá)到97.32%。另外,River-Net模型參數(shù)量為16.7M,單幅圖像平均處理時(shí)間為3.571s,所用設(shè)備CPU型號(hào)為Intel(R)Xeon(R) Gold 6126 CPU @ 2.60GHz,128GB內(nèi)存,顯卡為NVIDIA TITAN V。
表2 分割結(jié)果評(píng)價(jià)Tab.2 Evaluation of segmentation results
基于上述已訓(xùn)練的River-Net模型,本文提取了黃河7·20暴雨前后的河道情況。如圖10所示,對(duì)比鄭州市轄范圍內(nèi)黃河在暴雨前后SAR影像中的分割結(jié)果來(lái)看,該段黃河在7月27日基本恢復(fù)至暴雨前行河狀態(tài)。桃花峪、桃花島、花園口和陡門鄉(xiāng)附近有部分水域擴(kuò)張。黃河在桃花峪分流入沁河,7月21日9時(shí),桃花峪至花園口區(qū)間降特大暴雨,沁河河道流量不斷上漲,沁河河口村水庫(kù)超汛限水位,黃河水利委員會(huì)啟動(dòng)黃河中下游水旱災(zāi)害防御Ⅲ級(jí)應(yīng)急響應(yīng)。根據(jù)河南水文水資源局公布的數(shù)據(jù),7月23日凌晨3時(shí)12分沁河武陟水文站流量漲至1510 m3/s,達(dá)到1982年以來(lái)最大洪水流量。根據(jù)River-Net對(duì)黃河河道提取結(jié)果,黃河7月27日較7·20暴雨前水域擴(kuò)張多在桃花峪至花園口區(qū)間,與官方公布結(jié)果相符。
圖10 鄭州 7·20 暴雨前后部分黃河提取結(jié)果Fig.10 Part extraction results of the Yellow River before and after the Zhengzhou 7·20 rainstorm
針對(duì)傳統(tǒng)深度模型提取特征能力不足的問(wèn)題,面向河道提取、水域分割等應(yīng)用。本文提出了RLK模塊,它具備根據(jù)目標(biāo)幾何特點(diǎn)來(lái)強(qiáng)化自身特征提取的能力。然后,本文根據(jù)該模塊搭建了深度神經(jīng)網(wǎng)絡(luò)River-Net,它具有更強(qiáng)的特征提取能力和上下文信息融合能力。本文以檢測(cè)鄭州7·20暴雨前后部分黃河的行河情況為實(shí)施例,驗(yàn)證了所提模型的有效性。因此,所提模型具有高精度提取SAR圖像中的河流邊界的應(yīng)用潛力。