趙福軍,樊雅婧
(黑龍江科技大學(xué) 計算機(jī)與信息工程學(xué)院,哈爾濱 150022)
2017年8月8日,四川省九寨溝縣發(fā)生了7.0級大地震,震源深度高達(dá)20 km,人員傷亡慘重,財產(chǎn)損失嚴(yán)重,此次地震誘發(fā)了大量的滑坡體,造成道路的生命線破損,無法實(shí)地調(diào)查和應(yīng)急救援,影響災(zāi)情調(diào)查與評估?;掳l(fā)生后,利用遙感數(shù)據(jù)展開調(diào)查,該方法很好地結(jié)合影像特征(色調(diào)、色彩)和空間特征(紋理、光譜、形狀、大小)等,能夠與專業(yè)人員的知識經(jīng)驗(yàn)和非遙感數(shù)據(jù)相結(jié)合分析推理,信息提取和識別的精度較高。但當(dāng)滑坡數(shù)量較多時,造成工作量龐大、耗時耗力等問題。而基于像元的計算機(jī)圖像分類方法容易出現(xiàn)同譜異物、同物異譜和混合像元情況,處理結(jié)果存在大量椒鹽噪聲,錯分、漏分和誤分現(xiàn)象,影響影像分類精度。1999 年,M. Baatz等[1]提出了面向?qū)ο笥跋穹治龇椒?。該方法又稱面向?qū)ο笥跋穹诸?,是將光譜、紋理、形狀等特征相似的像元組合成對象,然后,根據(jù)地物在實(shí)際生活分布情況和在遙感影像中分布狀況,選擇對象特征,建立分類規(guī)則體系,最后,以對象為基本單元,綜合實(shí)際情況,選取恰當(dāng)分類算法,分類地物[2],目前,該方法在影像分割階段,最優(yōu)分割尺度參數(shù)都是人為調(diào)整,耗時耗力,無法滿足實(shí)際需要,提取的特征大多為低層和中層特征,無法對高層語義特征信息進(jìn)行相應(yīng)的描述。
筆者旨在快速精確的識別滑坡災(zāi)害,將面向?qū)ο笥跋穹治龇椒ㄅc深度卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,在多尺度分割中利用改進(jìn)的最優(yōu)分割尺度方法確定最優(yōu)分割尺度,深度卷積神經(jīng)網(wǎng)絡(luò)提取滑坡災(zāi)害的高層語義深度特征,識別高空間分辨率遙感影像中的滑坡災(zāi)害,提高滑坡識別效率與識別精度。
在獲取滑坡遙感影像之后,利用多尺度分割方法分割影像,利用改進(jìn)的最優(yōu)分割模型選取最優(yōu)分割參數(shù),采用深度卷積神經(jīng)網(wǎng)絡(luò)分類影像,通過總體精度和 Kappa 系數(shù)值來評價分類結(jié)果的精度和質(zhì)量,技術(shù)路線如圖1所示。
多尺度分割方法[3]是自上而下基于異質(zhì)性最小原則的區(qū)域合并技術(shù),異質(zhì)性和分割尺度共同決定遙感影像對象層創(chuàng)建,多尺度分割算法中,分形網(wǎng)絡(luò)演化法最為普遍經(jīng)典。運(yùn)用多尺度分割方法進(jìn)行分割時,當(dāng)確定了最佳分割尺度后,異質(zhì)性也影響分割的效果,其中影像的平均總體異質(zhì)性又可以分為形狀異質(zhì)性hs和光譜異質(zhì)性hc的公式為
f=wc×hc+(1-wc)×hs,
式中:f——對象異質(zhì)性;
wc——自定義光譜異質(zhì)性權(quán)重,取值為0到1之間。
形狀異質(zhì)性由光滑度hm和緊致度ht表示為
hs=wt×ht+(1-wt)×hm,
式中,wt——緊致度權(quán)重,取值是0到1之間。
圖1 滑坡識別技術(shù)流程Fig. 1 Flow of landslide identification technology
由于分割尺度不同,影像中的像元組合而成的影像對象大小也不同,閾值尺度參數(shù)的選取也會影響識別效果,以分形網(wǎng)絡(luò)進(jìn)化法為基礎(chǔ)提取最優(yōu)分割尺度參數(shù)。
在面向?qū)ο蠖喑叨确指钪凶顑?yōu)分割尺度的確定至關(guān)重要,它將直接影響影像的分割和分類效果。而每一種地物都有其對應(yīng)的最優(yōu)分割尺度,只有在該地物的最優(yōu)分割尺度上提取地物信息,才能達(dá)到最佳的分類效果。否則,在影像分割中將伴隨有“過分割”、“分割不足”或“邊緣不匹配”的現(xiàn)象。目前,國內(nèi)外關(guān)于最優(yōu)分割尺度確定有三種方法:一是人為經(jīng)驗(yàn)來選取[4-6],經(jīng)過大量的實(shí)驗(yàn)調(diào)整尺度,得到不同尺度對應(yīng)的分割影像,目視來確定最理想的分割尺度,人為經(jīng)驗(yàn)選取,帶有人為主觀因素;二是選擇鑒別指標(biāo)來評定尺度選取的好壞,比如最大面積法,均值方差法、矢量距離法等,鑒別指標(biāo)的選取有很多的不確定性,指標(biāo)選取較難;三是通過特定的模型來計算[7-9]。
最優(yōu)分割尺度是影像通過分割而產(chǎn)生的對象還能準(zhǔn)確的表示地物特征,不同的地物不會出現(xiàn)混淆,影像對象多邊形邊界清晰、平滑。目前的計算模型主要考慮對象之間的異質(zhì)性以及對象內(nèi)部的同質(zhì)性,并沒有很好考慮到提取目標(biāo)紋理信息,提出一種綜合考慮異質(zhì)性、同質(zhì)性和紋理信息的最優(yōu)分割尺度模型。
為了使類內(nèi)同質(zhì)性和類間異質(zhì)性盡可能地大,分割尺度的選取是關(guān)鍵,因此,在前人基礎(chǔ)上[6-8],綜合考慮將類內(nèi)同質(zhì)性、類間異質(zhì)性和基于GLCM紋理均值法相結(jié)合,構(gòu)建最優(yōu)分割尺度模型,選取最優(yōu)分割尺度。
1.2.1 類內(nèi)同質(zhì)性與類間異質(zhì)性描述
描述類內(nèi)同質(zhì)性用標(biāo)準(zhǔn)差[6]為
(1)
式中:CLi——對象第i個像元的灰度值;
CL——影像對象的灰度均值;
n——對象中總的像元個數(shù)。
由式(1)可知,σl值越小,表示類內(nèi)的異質(zhì)性較小,即同質(zhì)性較大。
類間異質(zhì)性表示相鄰類間的差異程度,對于任意波段L,任意對象,通過計算相鄰對象間的平均差分絕對值,反映類間的異質(zhì)性,表達(dá)式為
(2)
式中:l——所選影像對象邊界長度;
lsi——第i個對象與相鄰的對象的公共邊的長度;
n——相鄰對象個數(shù),分割以后總的對象個數(shù)。
由式(2)可知,ΔCL值越低,對象間相關(guān)性越小,相鄰對象差異越大,即異質(zhì)性更高、更加可分。
1.2.2 GLCM的紋理均值
紋理特征在遙感影像中也尤為重要,在影像分類中應(yīng)用也較廣泛,考慮到常用灰度共生矩陣(GLCM)描述紋理特征[8],其均值計算公式為
(3)
(4)
式中:Nε——灰度化后能夠得到的最大灰度級;
M——影像分割后對象個數(shù);
P(i,j)——灰度值是i、j的像元在方向θ和像元距離d時的共生概率,文中取d=1,θ為0°、45°、90°、145°;
Pm——第m個對象的紋理均值;
P——所有分割體紋理均值。
1.2.3 最優(yōu)分割尺度計算模型
在式(2)~(4)基礎(chǔ)上,最優(yōu)分割尺度計算公式
(5)
F(σl,ΔCL)越小,分割尺度越好,通過構(gòu)建插值函數(shù)尋找以尺度x作為自變量的最優(yōu)分割模型,進(jìn)行n次分割實(shí)驗(yàn)將會得到n個F值,用這些值可以構(gòu)造如下插值函數(shù),得出最優(yōu)分割尺度模型為
gn(xi)=a0+a1x+a2x2+,…,+anxn,
式中:x——自變量代表分割尺度;
gn(xi)——插值函數(shù)。
gn(xi)=F(σl,ΔCL,P)在進(jìn)行n+1次實(shí)驗(yàn)以后,通過上述式子計算,就可以獲取n+1個F(σl,ΔCL,PV)值,進(jìn)而用插值點(diǎn)計算得出a0,a1,…,an值,進(jìn)而得到最優(yōu)分割尺度,即當(dāng)g最小時所對應(yīng)的x。
將上述模型程序化,可以多尺度分割任何高分辨率影像,得到其最優(yōu)分割尺度,使最終的地物提取結(jié)果更加精確。
文中的數(shù)據(jù)來源于中國地震局無人機(jī)航拍所得的四川省九寨溝縣遙感影像,影像分辨率為0.14 m,如圖2所示。
圖2 不同分割尺度對比Fig. 2 Comparison of different segmentation scales
文中使用的是多尺度分割方法中的分形化網(wǎng)絡(luò)演化算法,經(jīng)過大量反復(fù)實(shí)驗(yàn)驗(yàn)證,參數(shù)取值如下,光譜的異質(zhì)性權(quán)重wc=0.65,緊致度權(quán)重wt=0.5,形狀異質(zhì)性權(quán)重ws=0.3,光滑度權(quán)重wm=0.1,設(shè)置好參數(shù)后,從20~100(10個單元逐漸遞增)分割尺度對圖像進(jìn)行分割,當(dāng)分割尺度低于20時,分割過于破碎,高于100時,目視的最佳分割尺度是40,利用上述最優(yōu)分割尺度的計算模型可以得出分割尺度為35時,gn(xi)值最小,此時的分割尺度在理論上達(dá)到最好效果。
高分辨率遙感滑坡影像具有多尺度特征,語義信息豐富,基于淺層特征的遙感影像分類已經(jīng)不能滿足現(xiàn)階段的需求。近年來,卷積神經(jīng)網(wǎng)絡(luò)在圖像分類上取得了較好效果,卷積神經(jīng)網(wǎng)絡(luò)的提取特征能力越來越強(qiáng)[9],以影像分割對象為單元,采用深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)提取影像一些深層特征,主要有形狀、光譜、紋理、植被和地形地貌特征等。滑坡一般呈簸箕型、舌形、疊瓦形或不規(guī)則形等11種形態(tài),滑坡對植被覆蓋度廣的地方破壞性極強(qiáng),周圍植被破壞嚴(yán)重,滑坡的巖土松散,裸露在地表,其紋理、光譜特征較明顯,且滑坡體所在處起伏不平,尤其在新生滑坡附近,光譜反射能力較強(qiáng),使得巖土多呈現(xiàn)為白色調(diào)或淺色調(diào)[10],自動識別這些深層特征的滑坡災(zāi)害。
最基本卷積神經(jīng)網(wǎng)絡(luò)包含三層[11-12]如圖3所示,輸入層、隱含層和輸出層,其中隱含層又可以分為卷積操作、池化操作、激活函數(shù)以及全連接層。
(1)卷積層是通過卷積核進(jìn)行卷積運(yùn)算來提取特征,獲得其下一層特征圖。
(2)池化層是將通過卷積運(yùn)算得到的特征圖進(jìn)行過濾,保留其重要特征,實(shí)際是使參數(shù)大量減少,通過池化操作可以達(dá)到降維的目的,從而避免過擬合。
(3)激活函數(shù)是引入了非線性函數(shù)以此解決復(fù)雜問題,目前常用的激活函數(shù)有sigmoid、tanh和Relu函數(shù)[13],但是sigmoid函數(shù)與tanh函數(shù)易造成梯度消失,Relu具有分段線性特征,很好地避免梯度爆炸與消失。
(4)全連接層經(jīng)卷積和池化操作得到的特征圖后進(jìn)行高度綜合,在全連接層會丟失其三維結(jié)構(gòu),將特征圖線性拉伸成一維向量,通過激活函數(shù)計算傳遞給下一層,最后一層全連接層的結(jié)果送入分類器中,進(jìn)行分類。
圖3 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 3 Structure of convolution neural network
文中使用的DCNN模型一共有8層,其中,有5層卷積層、3層全連接層,如圖4所示。第一個卷積層只能提取低級的淺層特征,層數(shù)的增加,非線性計算能力越來越強(qiáng),提取的特征也更加復(fù)雜,全連接層對高度綜合這些特征,拉伸為一維向量,提交給Softmax分類器。網(wǎng)絡(luò)層數(shù)并不是越多越好,層數(shù)如果太多,計算時間會加長,效率低下,且容易出現(xiàn)過擬合現(xiàn)象,和一般的卷積神經(jīng)網(wǎng)絡(luò)比較,文中的DCNN可以提高模型的泛化能力與學(xué)習(xí)能力,并且兼顧計算時間與效率,在進(jìn)行卷積運(yùn)算時,輸入影像為上述方法分割完后的256×256大小的影像,步長為1,采用全0填充,使用Relu激活函數(shù),最后,全連接層得到的特征圖輸入Softmax分類器中,得到分類結(jié)果。
圖4 DCNN模型Fig. 4 DCNN model
采用多種方法對數(shù)據(jù)進(jìn)行擴(kuò)增,包括轉(zhuǎn)置、水平鏡像變化、裁剪,隨機(jī)飽和度、對比度和色相變換。深度學(xué)習(xí)對計算機(jī)硬件設(shè)置要求較高,由于遙感影像所占內(nèi)存大,計算機(jī)配置有限,一般無法將一景影像直接送入網(wǎng)絡(luò)中訓(xùn)練,所以將原始影像進(jìn)行了裁剪,統(tǒng)一都裁剪為500張256×256大小的影像,將裁剪的圖像經(jīng)過分割以后成批輸入網(wǎng)絡(luò)中訓(xùn)練。隨機(jī)飽和度、對比度和色相變換都是隨機(jī)增加或降低影像的亮度,對比度、飽和度。數(shù)據(jù)增強(qiáng)圖像如5所示,擴(kuò)增后的數(shù)據(jù)集約有5 000張,將其中80%作為訓(xùn)練集,20%作為測試集。
圖5 數(shù)據(jù)增強(qiáng)圖像Fig. 5 Data enhanced image
文中采用Relu函數(shù)為激活函數(shù)
Relu=max(0,x)。
(6)
函數(shù)可以很好地避免梯度消失問題,提升模型收斂的速度。在所有的全連接層之后,添加一個Dropout層,Dropout函數(shù)隨機(jī)地刪除了神經(jīng)網(wǎng)絡(luò)中許多隱藏神經(jīng)元,將網(wǎng)絡(luò)進(jìn)行前向與后向傳播,不斷進(jìn)行迭代更新,以此來防止網(wǎng)絡(luò)模型過擬合現(xiàn)象。在加入損失函數(shù)時,加入正則化項(xiàng),其目的是在數(shù)據(jù)參數(shù)量不變的前提下,減小參數(shù)值,以此解決噪聲問題[14]。
采用Python基于Tensorflow的keras框架下用GPU對樣本進(jìn)行訓(xùn)練,經(jīng)過多次的實(shí)驗(yàn)反復(fù)驗(yàn)證得到實(shí)驗(yàn)過程中的一些參數(shù):批大小batch為5,初始學(xué)習(xí)率r設(shè)置為0.01,訓(xùn)練迭代15個epoch之后學(xué)習(xí)率調(diào)整為0.001,將Adam算法作為優(yōu)化算法。
使用深度卷積神經(jīng)網(wǎng)絡(luò)來對影像進(jìn)行分類,充分使用了高分辨率影像的紋理空間信息。應(yīng)用該方法與基于像元方法與深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)合以及面向?qū)ο笈c支持向量機(jī)(SVM)分類方法結(jié)合進(jìn)行了對比分析。不同方法對高分辨率滑坡影像的分類效果如圖6所示。
圖6 不同分類方法結(jié)果Fig. 6 Results of different classification methods
采用混淆矩陣、Kappa系數(shù)和總體精度三個指標(biāo)對分類結(jié)果進(jìn)行精度評價,混淆矩陣是一張矩陣表格,衡量分類精度直觀簡單的一種方法,文中方法分類結(jié)果的混淆矩陣如表1所示。表中,TT、WT、BT、LT和DT分別表示植被、水體、裸地、滑坡和道路的真實(shí)值,TP、WP、BP、LP和DP為相對應(yīng)的預(yù)測值。
表1 混淆矩陣
由表1可以看出,每種地物都有其他地物類別來對分類結(jié)果進(jìn)行干擾,這是由于這些類別在光譜、紋理等特征上具有一定相似性所致,特別是道路、裸地在顏色光譜顏色特征上很多表現(xiàn)為灰色,這些很容易造成誤判,影響最后的分類結(jié)果,而植被和水體特征明顯,所以誤分概率相對較低。
總體分類精度表示分類正確的樣本數(shù)占所有樣本比例,計算公式為
式中:TP——模型分類正確的正樣本;
FN——被模型分類錯誤的正樣本;
FP——被模型分類錯誤的負(fù)樣本;
TN——被模型分類正確的負(fù)樣本。
Kappa系數(shù)是基于混淆矩陣的精度評價,取值-1到1,然而,實(shí)際中取值為0-1,其值越高,表示分類精度越高,計算公式為
式中:p——總樣本數(shù);
n——類別數(shù);
pii——混淆矩陣中第i行第i列的值,即左上到右下對角線的值;
pi+——第i列值的總和;
p+i——第i行值的總和。
三種分類方法的精度對比如表2所示。
表2 不同方法精度比較
從圖6和表2可以看出,基于像元的分類方法存在噪聲、水體、巖土、滑坡出現(xiàn)了許多錯分現(xiàn)象,面向?qū)ο蠛蚐VM分類方法結(jié)合起來椒鹽噪聲減少,但是也存在錯分、漏分現(xiàn)象,實(shí)驗(yàn)結(jié)果表明,在視覺上面向?qū)ο蠓诸惙椒ū然谙裨诸惙椒ㄐЧ?,從分類器角度來看,基于深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)的方法優(yōu)于傳統(tǒng)SVM方法。
(1)選用多尺度分割方法對影像進(jìn)行分割,利用光譜因子和形狀因子(主要是面積和周長)表達(dá)類內(nèi)同質(zhì)性和類間異質(zhì)性。為充分考慮滑坡影像的紋理信息,引入紋理均值,構(gòu)造出改進(jìn)的最優(yōu)分割尺度模型對影像進(jìn)行分割。
(2)針對傳統(tǒng)基于中低分辨率的像元分類方法存在椒鹽噪聲問題,結(jié)合無人機(jī)快速獲取高分影像的優(yōu)勢,將面向?qū)ο蠓诸惻c深度學(xué)習(xí)方法融合對四川省九寨溝滑坡遙感影像進(jìn)行自動識別。與基于像元與深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)合或面向?qū)ο蠓诸惻cSVM結(jié)合的影像分類方法對比,對滑坡體進(jìn)行提取總體精度高達(dá)87.68%,Kappa系數(shù)為86.34%,識別精度優(yōu)于傳統(tǒng)方法,提高了滑坡地震災(zāi)害識別和震后救援的時效性。