羅壯,李明,張德朝
1.太原理工大學(xué) 數(shù)學(xué)學(xué)院,晉中 030600;2.太原理工大學(xué) 大數(shù)據(jù)學(xué)院,晉中 030600;3.清華大學(xué) 地球系統(tǒng)科學(xué)系,北京 100084
建筑信息廣泛應(yīng)用于災(zāi)害監(jiān)測(cè),數(shù)字城市建設(shè)和流行病監(jiān)控等。高分辨率光學(xué)影像是建筑提取的重要數(shù)據(jù)源。高分辨率影像提供豐富的光譜特征,突出物體的結(jié)構(gòu)、紋理等信息。同時(shí)高空間分辨率也帶來(lái)了更多的圖像噪聲和“異物同譜”等問(wèn)題(明冬萍等,2005)。此外因建筑結(jié)構(gòu)的多樣性和背景環(huán)境的復(fù)雜性,從高分辨率圖像中準(zhǔn)確檢測(cè)建筑仍然是一個(gè)挑戰(zhàn)。
中小尺寸的建筑物是城市的主體,在因人口聚集而土地稀缺的城市密集排列,常表現(xiàn)為大量大小相似的建筑物,位置非常接近。這類(lèi)場(chǎng)景的遙感影像建筑物提取主要有兩個(gè)問(wèn)題:(1)精度不高,受建筑物結(jié)構(gòu)的多樣化和周邊環(huán)境(特別是相鄰建筑)的影響,容易誤判,降低分類(lèi)結(jié)果精度。(2)建筑邊界不清晰,常出現(xiàn)多個(gè)建筑物“粘連”為一個(gè)。使用帶掩模分支的目標(biāo)識(shí)別框架(如Mask R-CNN(He 等,2017))和語(yǔ)義分割網(wǎng)絡(luò)(如U-net(Ronneberger 等,2015))識(shí)別時(shí)各有不足。目標(biāo)識(shí)別允許對(duì)象之間有重疊(Goldman等,2019),不適合建筑實(shí)例提取。不加約束和處理的單純語(yǔ)義分割算法,常將多個(gè)建筑分割為一個(gè)區(qū)域?qū)ο蟆?/p>
建筑檢測(cè)的算法和理論,可以分為傳統(tǒng)面向?qū)ο蟮膱D像分析方法和深度學(xué)習(xí)方法。傳統(tǒng)方法使用光譜、紋理(譚衢霖,2010;Wu等,2014)、形態(tài)輪廓(Lv 等,2014)等特征提取建筑,用多尺度方法(Tian 等,2016;Liu 等,2005)、先驗(yàn)知識(shí)(如陰影(Dosovitskiy 等,2015;Liow 和Pavlidis,1990))提升精度。相較于傳統(tǒng)方法,深度學(xué)習(xí)的主要優(yōu)勢(shì)是學(xué)習(xí)特征表達(dá)的自適應(yīng)性及較強(qiáng)的泛化能力。如DeepGlobe 挑戰(zhàn)(Demir 等,2018)和INRIA 建筑檢測(cè)比賽(Maggiori 等,2017) 的前5名方案均基于神經(jīng)網(wǎng)絡(luò)。當(dāng)前建筑檢測(cè)技術(shù)在精度上還有較大進(jìn)步空間,特別是邊界定位準(zhǔn)確度需要提高。
針對(duì)密集建筑區(qū)域內(nèi),建筑提取精度不足和邊界模糊兩個(gè)問(wèn)題,根據(jù)文獻(xiàn)成果,加入邊緣檢測(cè)網(wǎng)絡(luò)(Wu等,2018)或邊緣檢測(cè)分支(Marmanis等,2018),優(yōu)化邊界損失函數(shù)(Bokhovkin 和Burnaev,2019)可改進(jìn)遙感影像的語(yǔ)義分割,受其啟發(fā),本文提出了一個(gè)完整的建筑檢測(cè)方案。結(jié)合神經(jīng)網(wǎng)絡(luò)和自下而上分組的分水嶺算法,對(duì)數(shù)據(jù)標(biāo)簽預(yù)處理,生成兩類(lèi)輔助標(biāo)簽-邊界標(biāo)簽和相鄰建筑分割線標(biāo)簽,在性能較優(yōu)的建筑檢測(cè)框架ICT-Net網(wǎng)絡(luò)(Chatterjee 和Poullis,2019) 基礎(chǔ)上改進(jìn),使用更適合建筑特性和3類(lèi)標(biāo)簽的新?lián)p失函數(shù),提升精度,以基于分水嶺算法和梯度提升回歸樹(shù)(Ke等,2017)的后處理,從“粘連”的多個(gè)建筑掩模中,提取單體建筑。實(shí)驗(yàn)證明本文檢測(cè)方案容易訓(xùn)練,既顯著提高建筑檢測(cè)精度,又使提取的建筑邊界更準(zhǔn)確。
本文的建筑檢測(cè)總流程如圖1 所示,分3 個(gè)階段,數(shù)據(jù)預(yù)處理、監(jiān)督分類(lèi)和后處理。數(shù)據(jù)預(yù)處理就是轉(zhuǎn)換原始建筑樣本標(biāo)簽,生成建筑、邊界和相鄰建筑分割線3類(lèi)標(biāo)簽。監(jiān)督分類(lèi)使用轉(zhuǎn)換后的訓(xùn)練樣本訓(xùn)練本文網(wǎng)絡(luò),預(yù)測(cè)3類(lèi)別概率。后處理階段,對(duì)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果應(yīng)用基于分水嶺算法和梯度提升回歸樹(shù)的后處理,從密集建筑掩模中提取建筑實(shí)例。
圖1 建筑提取流程圖Fig.1 The workflow of building detection
本文使用的數(shù)據(jù)源是INRIA 數(shù)據(jù)集中的芝加哥(Maggiori等,2017),共36張0.3 m空間分辨率的彩色正射校正航空影像和對(duì)應(yīng)的建筑掩模標(biāo)簽,每景影像為5000像素×5000像素,面積約81 km2。
數(shù)據(jù)預(yù)處理就是對(duì)數(shù)據(jù)標(biāo)簽的預(yù)處理,形成3 類(lèi)標(biāo)簽:原建筑標(biāo)簽、邊界標(biāo)簽、相鄰建筑分割線標(biāo)簽,前兩類(lèi)存在于每一個(gè)建筑,第3類(lèi)分割線僅存在于緊湊相鄰的建筑物之間。
圖2為數(shù)據(jù)與預(yù)處理示例,每個(gè)建筑標(biāo)簽區(qū)域(建筑像素為1,非建筑像素為0)對(duì)應(yīng)一個(gè)單體建筑,數(shù)據(jù)預(yù)處理的流程如下(其中形態(tài)學(xué)腐蝕尺寸、膨脹尺寸和鄰域范圍是根據(jù)圖像特點(diǎn)設(shè)置的經(jīng)驗(yàn)值):
圖2 3類(lèi)標(biāo)簽Fig.2 The label of three categories
(1)對(duì)建筑標(biāo)簽應(yīng)用形態(tài)學(xué)腐蝕操作(腐蝕尺寸設(shè)置為3×3),腐蝕后的建筑掩模與原建筑掩模的差,作為邊界標(biāo)簽;
(2)對(duì)建筑標(biāo)簽應(yīng)用形態(tài)學(xué)膨脹操作(膨脹尺寸設(shè)置為9×9),并減去原建筑標(biāo)簽區(qū)域,形成分割線標(biāo)簽的候選點(diǎn)集合;
(3)對(duì)原建筑標(biāo)簽做區(qū)域標(biāo)號(hào),遍歷候選點(diǎn)集合,若該像素鄰域范圍(尺寸設(shè)置為7×7)內(nèi)存在至少2 個(gè)不同建筑物,則該像素作為分割線標(biāo)簽。
本文考慮建筑物的特點(diǎn),改進(jìn)原ICT-Net網(wǎng)絡(luò)。ICT-Net(Chatterjee 和Poullis,2019)屬于完全卷積網(wǎng)絡(luò),基于U-net網(wǎng)絡(luò)(Ronneberger等,2015),結(jié)合Dense blocks 與Squeeze-and-Excitation 的組合(這里簡(jiǎn)稱(chēng)FRDB 模塊,圖3 顯示ICT-Net 網(wǎng)絡(luò)結(jié)構(gòu),細(xì)節(jié)參考Chatterjee和Poullis(2019)。
圖3 ICT-Net網(wǎng)絡(luò)結(jié)構(gòu)(無(wú)箭頭虛線表示由FRDB,串聯(lián),下(上)采樣組成的模塊的重復(fù))Fig.3 The structure of ICT-Net(where dotted line without arrow is repetition of the module consisting of FRDB,Concatenation and Down(Up)sampling)
首先修改網(wǎng)絡(luò)最后一層為三通道,分別對(duì)應(yīng)建筑、邊界、分割線3 個(gè)類(lèi),應(yīng)用Sigmoid 激活函數(shù)獲得每個(gè)類(lèi)的概率,并裁剪預(yù)測(cè)結(jié)果的4條邊各24 個(gè)像素寬的邊緣,以避免邊界效應(yīng)(Iglovikov等,2017),被裁剪的邊緣不參與網(wǎng)絡(luò)優(yōu)化,減少后向傳播的計(jì)算量。
其次,本文使用了更適合建筑提取和更有利于邊界準(zhǔn)確的損失函數(shù),焦點(diǎn)損失(Lin 等,2017)、骰子損失和Jaccard 損失(Iglovikov 等,2017)。各損失計(jì)算公式如下:
式中,真實(shí)像素標(biāo)簽ygt∈{0,1},預(yù)測(cè)概率ypd∈[0,1]。由計(jì)算公式,焦點(diǎn)損失從像素層次優(yōu)化網(wǎng)絡(luò),骰子損失和Jaccard 損失作為IOU 微分形式的變體,從圖像層次優(yōu)化網(wǎng)絡(luò),根據(jù)Iglovikov 等(2017),使用3個(gè)損失加權(quán)比單個(gè)損失有優(yōu)勢(shì),因此本文對(duì)每個(gè)類(lèi)應(yīng)用3個(gè)損失并加權(quán),更好地優(yōu)化網(wǎng)絡(luò)。
語(yǔ)義分割領(lǐng)域常用的交叉熵?fù)p失,骰子損失等對(duì)線狀對(duì)象(如邊界)的錯(cuò)誤匹配不敏感:當(dāng)預(yù)測(cè)結(jié)果與真實(shí)標(biāo)簽偏移5—10個(gè)像素,上述損失數(shù)值無(wú)顯著變化。為正確解釋邊界信息,指導(dǎo)網(wǎng)絡(luò)優(yōu)化,本文對(duì)邊界類(lèi)和分割線類(lèi)添加邊界損失(Bokhovkin 和Burnaev,2019),記作LBoundary,計(jì)算如下:
式中,掩模標(biāo)簽Ygt由元素ygt∈{0,1}構(gòu)成,預(yù)測(cè)掩模Ypd由元素ypd∈[0,1]構(gòu)成, *,*F表示矩陣點(diǎn)積求和運(yùn)算,pool(*,pool_size)表示最大池化,pool_size為池化尺寸。建筑類(lèi)、邊界類(lèi)、分割線類(lèi)的損失分別是
式中,β1,β2,β3,β4為各損失項(xiàng)的權(quán)重。權(quán)衡建筑類(lèi)和兩個(gè)輔助類(lèi)的重要性,網(wǎng)絡(luò)總損失為
式中,α1,α2,α3表示3個(gè)類(lèi)的權(quán)重。
后處理是將網(wǎng)絡(luò)輸出的建筑、分割線和邊界3 類(lèi)概率值轉(zhuǎn)化為建筑區(qū)域標(biāo)記的過(guò)程。首先合成3 類(lèi)概率為一個(gè)值,使預(yù)測(cè)結(jié)果合成為一個(gè)灰度圖,合成公式為
式中,Pdurban,Pdline,Pdborder∈[0,1]分別表示建筑概率、分割線概率和邊界概率;(1 -Pdline)表示分割線約束,建筑不應(yīng)與分割線重疊;(1 -kPdborder)表示邊界約束,處于建筑邊界的像素屬于建筑的可能性較小,參數(shù)k控制邊界約束的權(quán)重。
后處理也分為訓(xùn)練和預(yù)測(cè)兩個(gè)部分。訓(xùn)練階段的流程如下:
(1)對(duì)Gp圖,以較小的閾值l0二值化,形成建筑標(biāo)記L0(像素值大于l0標(biāo)記為建筑,其余標(biāo)為非建筑)。對(duì)建筑標(biāo)記L0和Gp圖采用基于標(biāo)記的分水嶺分割算法,獲得預(yù)測(cè)圖P0。
(2)在P0建筑標(biāo)記范圍內(nèi),分別以從小到大的閾值l1,l2,l3對(duì)Gp圖二值化,形成初步建筑標(biāo)記L1,L2,L3,并分別結(jié)合Gp圖分水嶺分割,形成相應(yīng)的分割結(jié)果P1,P2,P3,都是在P0建筑標(biāo)記范圍內(nèi)的建筑細(xì)分。
(3)對(duì)分割結(jié)果P0,P1,P2,P3中每一個(gè)連通區(qū)域(視作一個(gè)建筑),計(jì)算與真實(shí)標(biāo)簽的IOU=若IOU 小于0.5 的,IOU 值改為0;其中TP 表示正確檢測(cè)(True Positive);FP 表示誤檢(False Positive);FN表示漏檢(False Negative)。
(4)以上一步的建筑區(qū)域的IOU 為目標(biāo)值,對(duì)每個(gè)建筑區(qū)域,分別經(jīng)驗(yàn)性選取面積、面積周長(zhǎng)比、長(zhǎng)短軸、鄰域信息等41 個(gè)常用區(qū)域及鄰域相關(guān)的描述特征,訓(xùn)練梯度提升回歸樹(shù)。特征計(jì)算依賴于skimge 庫(kù)(Van Der Walt 等,2014)的regionprops函數(shù),該函數(shù)為每一個(gè)連通區(qū)域計(jì)算囊括上述特征的數(shù)十個(gè)屬性值。
預(yù)測(cè)階段,后處理流程如下:
(1)對(duì)Gp圖,經(jīng)訓(xùn)練階段的第1—2 步處理,獲得分割結(jié)果P0,P1,P2,P3,對(duì)結(jié)果的每一個(gè)連通區(qū)域,用訓(xùn)練階段第4步的同樣特征和訓(xùn)練好的回歸樹(shù)預(yù)測(cè)IOU。
(2) 對(duì)于P0的每一個(gè)連通區(qū)域,選取P0,P1,P2,P3中的IOU 平均值最大的分割結(jié)果,替換原連通區(qū)域,形成最終分割結(jié)果。
(3)對(duì)最終分割結(jié)果的每一個(gè)區(qū)域,若對(duì)應(yīng)的IOU 大于接受閾值t1,或該區(qū)域概率均值大于概率閾值t2,則該區(qū)域標(biāo)記為建筑。
本論文實(shí)驗(yàn)環(huán)境是Linux系統(tǒng)下以Tensorflow為后端的keras框架(Chollet,2015)。根據(jù)多次實(shí)驗(yàn)結(jié)果,設(shè)置建筑、邊界、分割線的損失權(quán)重α1,α2,α3=1,0.4,0.4,焦點(diǎn)損失、骰子損失、Jaccard損失、邊界損失的權(quán)重β1,β2,β3,β4=1/3,1/3,1/3,1。網(wǎng)絡(luò)使用Nadam(Dozat,2016)優(yōu)化器,初始學(xué)習(xí)率設(shè)置為5×10-4,在第10、50 個(gè)周期,學(xué)習(xí)率除以5。網(wǎng)絡(luò)總共訓(xùn)練80 個(gè)周期,每個(gè)周期迭代250 次,共2萬(wàn)次迭代。網(wǎng)絡(luò)的輸入尺寸為196×196,批尺寸為16。后處理中,融合處理參數(shù)k= 1,建筑標(biāo)記閾值l0,l1,l2,l3= 0.55,0.65,0.75,0.85,閾值t0,t1,t2=0.45,0.5,0.85。實(shí)驗(yàn)數(shù)據(jù)已在2.1 節(jié)介紹。本文采用四折交叉驗(yàn)證比較實(shí)驗(yàn)效果,即每一次交叉驗(yàn)證使用27 張尺寸5000×5000 的圖像為訓(xùn)練集,剩余9張為測(cè)試集,分別訓(xùn)練和評(píng)估,并且所有實(shí)驗(yàn)使用相同的隨機(jī)數(shù)。
根據(jù)經(jīng)驗(yàn)(Maggiori 等,2017),本文使用召回率Recall,準(zhǔn)確率Precision,F(xiàn)1- score 和IOU 等指標(biāo)衡量網(wǎng)絡(luò)性能,計(jì)算公式如下:
式中,TP表示正確檢測(cè)(True Positive);FP表示誤檢(False Positive);FN表示漏檢(False Negative)。召回率反映真實(shí)樣本遺漏比率,準(zhǔn)確率反映預(yù)測(cè)結(jié)果誤檢比率。F1- score 是精確度和召回率的綜合測(cè)量值。IOU是預(yù)測(cè)結(jié)果與真實(shí)標(biāo)簽的重疊比率。
本文使用新指標(biāo)評(píng)估后處理結(jié)果。對(duì)建筑標(biāo)簽中每一個(gè)建筑,計(jì)算其與預(yù)測(cè)結(jié)果中每一個(gè)建筑的IOU,并將最大值作為該建筑實(shí)例的IOU,若IOU>0.5,視為該建筑實(shí)例被檢測(cè);計(jì)算其與預(yù)測(cè)結(jié)果中每一個(gè)建筑的重疊面積,占該建筑面積的比例,并將最大值記為該建筑實(shí)例的Cover 值。由此延伸實(shí)例召回率Recallc(Hosang 等,2016)、覆蓋比例Pc及IOUunit指標(biāo):
式中,Rc為實(shí)例召回率,Pc為覆蓋比例,gti表示真實(shí)標(biāo)簽的第i個(gè)建筑掩模,pdj表示預(yù)測(cè)結(jié)果的第j個(gè)建筑掩模,N為建筑總數(shù),Ⅱ(*)為示性函數(shù)。根據(jù)IOUi與Coveri的定義,若真實(shí)標(biāo)簽的建筑A與預(yù)測(cè)結(jié)果的建筑B的IOU>0.5,則建筑A至少50%像素與建筑B重疊,即覆蓋比例是實(shí)例召回率的上界。
本節(jié)探究數(shù)據(jù)預(yù)處理、邊界損失與網(wǎng)絡(luò)性能的關(guān)系,比較建筑類(lèi)網(wǎng)絡(luò),無(wú)邊界損失的網(wǎng)絡(luò),本文網(wǎng)絡(luò)和基準(zhǔn)網(wǎng)絡(luò)的建筑預(yù)測(cè)圖。由Chatterjee和Poullis(2019),基準(zhǔn)網(wǎng)絡(luò)使用原始的ICT-Net,網(wǎng)絡(luò)最后一層僅預(yù)測(cè)建筑類(lèi)別,使用交叉熵作為損失函數(shù);建筑類(lèi)網(wǎng)絡(luò),與基準(zhǔn)網(wǎng)絡(luò)結(jié)構(gòu)相同,使用Lurban作為損失函數(shù);未應(yīng)用邊界損失的網(wǎng)絡(luò),與本文網(wǎng)絡(luò)結(jié)構(gòu)相同,修改邊界損失權(quán)重β4為0。
表1顯示比較結(jié)果,與基準(zhǔn)、建筑類(lèi)和無(wú)邊界損失的網(wǎng)絡(luò)相比,本文網(wǎng)絡(luò)在IOU、召回率和F1-score 表現(xiàn)較優(yōu),其中本文網(wǎng)絡(luò)相比基準(zhǔn)網(wǎng)絡(luò)提高IOU 約1%,對(duì)于IOUunit和實(shí)例召回率,本文網(wǎng)絡(luò)高于前三者至少2.8%和5.7%,表明應(yīng)用了數(shù)據(jù)預(yù)處理和邊界損失的本文網(wǎng)絡(luò)能更準(zhǔn)確地檢測(cè)建筑實(shí)例。
表1 不同方案下網(wǎng)絡(luò)性能的指標(biāo)比較Table 1 The results of different networks
本節(jié)選取兩個(gè)子區(qū)域進(jìn)一步比較,如圖4,相較于其他3種網(wǎng)絡(luò),本文網(wǎng)絡(luò)提取的建筑邊界形態(tài)更接近真實(shí)標(biāo)簽。
圖4 不同方案的預(yù)測(cè)結(jié)果比較Fig.4 The results of different networks
本文選取一典型示例,闡明后處理的具體步驟。
如圖5,將圖5(a)遙感影像輸入網(wǎng)絡(luò),預(yù)測(cè)3 類(lèi)概率,其中對(duì)圖5(c)網(wǎng)絡(luò)預(yù)測(cè)的建筑類(lèi)概率,以0.5 二值化形成圖5(d)建筑預(yù)測(cè)圖。同時(shí)合成3類(lèi)概率形成圖5(e)Gp圖,以標(biāo)記閾值l0形成圖5(f)預(yù)測(cè)圖P0。以標(biāo)記閾值l1形成圖5(g)建筑標(biāo)記L1。采用基于標(biāo)記的分水嶺分割算法以Gp圖和L1分割P0,形成建筑實(shí)例,每個(gè)實(shí)例以回歸樹(shù)預(yù)測(cè)IOU。將每一個(gè)IOU 大于接受閾值的實(shí)例標(biāo)記為建筑,形成圖5(h)后處理預(yù)測(cè)圖,其中不同顏色表示不同建筑實(shí)例。
圖5 后處理示例Fig.5 An example of postprocess
為驗(yàn)證后處理性能,比較本文網(wǎng)絡(luò)、合成處理和后處理的結(jié)果:建筑預(yù)測(cè)圖、預(yù)測(cè)圖P0和后處理預(yù)測(cè)圖,并與基準(zhǔn)網(wǎng)絡(luò)的建筑預(yù)測(cè)圖比較。對(duì)比結(jié)果如表2,后處理與本文網(wǎng)絡(luò)相比,提高實(shí)例召回率10.5%,提高IOUunit4.5%,與基準(zhǔn)網(wǎng)絡(luò)相比,提高實(shí)例召回率22.9%,提高IOUunit10.7%,表明后處理在本文網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)一步提高建筑檢測(cè)精度。
表2 本文方法不同階段的結(jié)果比較Table 2 The results at different stages
本文以兩個(gè)典型例子展示本文方法各階段的結(jié)果,進(jìn)一步說(shuō)明后處理的作用,如圖6,紅色框展示結(jié)果改善的區(qū)域。圖6(e)中藍(lán)色建筑顯示后處理從“粘連”的掩模中區(qū)分建筑實(shí)例,其檢測(cè)結(jié)果與參考標(biāo)簽基本吻合。綠色建筑處于陰影或樹(shù)蔭下,未能被本文網(wǎng)絡(luò)和后處理檢測(cè)。
圖6 本文方法不同階段的結(jié)果比較Fig.6 The results at different stages
本節(jié)討論網(wǎng)絡(luò)結(jié)構(gòu)的性能差異,選用U-net和FC-DenseNet56 (Jégou 等,2017),如2.2 節(jié)對(duì)ICT-Net 修改,改變網(wǎng)絡(luò)最后一層結(jié)構(gòu),并應(yīng)用3類(lèi)標(biāo)簽和邊界損失。
表3, 顯示ICT-Net相較于U-net 和FCDenseNet56,在準(zhǔn)確率、F1- score 和IOU 上較優(yōu),圖7呈現(xiàn)訓(xùn)練過(guò)程中的損失和指標(biāo),間接證明了上述結(jié)論。
表3 網(wǎng)絡(luò)結(jié)構(gòu)比較Table 3 Comparison of different networks
圖7 訓(xùn)練過(guò)程的損失圖和IOU指標(biāo)圖Fig.7 The loss and IOU in training phase
由2.3 節(jié)所述,合成公式參數(shù)k和建筑標(biāo)記閾值l0,l1,l2,l3對(duì)后處理性能有較大影響,本節(jié)討論參數(shù)的選取。
針對(duì)建筑標(biāo)記閾值threshold,固定合成公式參數(shù)k= 1,選取建筑標(biāo)記閾值threshold ∈{0.05,0.1,…,0.95 共19 個(gè)值,生成預(yù)測(cè)圖P0,計(jì)算實(shí)例召回率和覆蓋比例。如圖8(a)所示,隨著建筑標(biāo)記閾值的提高,覆蓋比例逐漸減小,實(shí)例召回率逐漸增大。當(dāng)建筑標(biāo)記閾值較小時(shí),實(shí)例召回率較低,后處理無(wú)法充分利用網(wǎng)絡(luò)輸出的概率信息,且覆蓋比例與召回率的差距過(guò)大,易帶來(lái)過(guò)多噪音和預(yù)測(cè)負(fù)擔(dān);當(dāng)建筑標(biāo)記閾值過(guò)大時(shí),后處理傾向于對(duì)預(yù)測(cè)圖過(guò)度分割,覆蓋比例衰減較大,覆蓋比例作為實(shí)例召回率的上界限制了后處理的提升。權(quán)衡實(shí)例召回率和覆蓋比例,本文選取四個(gè)建筑標(biāo)記閾值l0,l1,l2,l3=0.55,0.65,0.75,0.85,以l0= 0.55 對(duì)應(yīng)的建筑標(biāo)記形成預(yù)測(cè)圖P0,以l1,l2,l3= 0.65,0.75,0.85 形成的建筑標(biāo)記對(duì)預(yù)測(cè)圖P0進(jìn)一步分割。
針對(duì)參數(shù)k,固定建筑標(biāo)記閾值threshold =0.55,選取k∈{0,0.1,…,1}共11個(gè)值,生成預(yù)測(cè)圖P0,計(jì)算實(shí)例召回率和覆蓋比例。如圖8(b),實(shí)例召回率隨k逐漸增大,而覆蓋比例下降較小,本文選取k=1。
圖8 參數(shù)選取Fig.8 Parameters selection
本文針對(duì)密集建筑區(qū)域的建筑檢測(cè),提出了一種結(jié)合神經(jīng)網(wǎng)絡(luò)自下而上分組的分水嶺算法。該方法通過(guò)數(shù)據(jù)預(yù)處理,利用原建筑標(biāo)簽生成兩類(lèi)輔助掩模標(biāo)簽;在性能較優(yōu)的ICT-Net 基礎(chǔ)上,修改網(wǎng)絡(luò)結(jié)構(gòu)和損失函數(shù),針對(duì)兩類(lèi)輔助標(biāo)簽添加邊界損失;然后在網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的基礎(chǔ)上,通過(guò)一個(gè)結(jié)合分水嶺算法和梯度提升回歸樹(shù)的后處理完成建筑實(shí)例的準(zhǔn)確檢測(cè)。實(shí)驗(yàn)表明,在中小建筑密集的城市區(qū)域,本文檢測(cè)方案能有效解決密集建筑掩模“粘連”的問(wèn)題,準(zhǔn)確定位建筑邊界,檢測(cè)建筑實(shí)例,檢測(cè)效果明顯優(yōu)于原始的ICT-Net網(wǎng)絡(luò)。本文方法的優(yōu)勢(shì)如下:
(1)數(shù)據(jù)預(yù)處理生成的兩類(lèi)輔助標(biāo)簽,注重邊界特征,可豐富邊界信息。
(2)經(jīng)修改的網(wǎng)絡(luò)結(jié)構(gòu)、添加的邊界損失函數(shù)充分考慮建筑物特點(diǎn)和邊界優(yōu)化的需要,相較于基準(zhǔn)網(wǎng)絡(luò),本文網(wǎng)絡(luò)提取的建筑邊界形態(tài)更接近真實(shí)標(biāo)簽。
(3)后處理借助分水嶺分割算法可利用網(wǎng)絡(luò)預(yù)測(cè)的概率信息進(jìn)一步優(yōu)化建筑邊界,采用梯度提升回歸樹(shù)可篩選最優(yōu)的分割結(jié)果,因此后處理在本文網(wǎng)絡(luò)的基礎(chǔ)上可使建筑實(shí)例的檢測(cè)精度更高。
本文方法目前僅引入了建筑邊界信息,未考慮建筑的內(nèi)部結(jié)構(gòu),今后將在這一方面深入探索。