陳 斌,王宏志,徐新良,王首泰,張亞慶
(1. 華中師范大學(xué)城市與環(huán)境科學(xué)學(xué)院地理過程分析與模擬湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430079; 2. 中國科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室,北京 100101)
近年來,伴隨著人工智能技術(shù)的應(yīng)用推廣及卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)的不斷優(yōu)化,深度學(xué)習(xí)技術(shù)在圖像識別[1-3]、模式識別[4-5]、語音識別[6-7]、自然語言處理[8-10]等領(lǐng)域取得了一系列研究進(jìn)展,這使得學(xué)術(shù)界不少地理學(xué)者開始關(guān)注深度學(xué)習(xí)這一研究領(lǐng)域。當(dāng)前,國內(nèi)外已有部分學(xué)者將深度學(xué)習(xí)技術(shù)應(yīng)用于遙感分類研究之中[11-15],借助深度學(xué)習(xí)技術(shù)開展地物遙感分類研究已逐漸成為現(xiàn)代地理學(xué)遙感領(lǐng)域的研究熱點(diǎn)之一。
當(dāng)前,基于衛(wèi)星影像分類方法大致可劃分為兩類:一類是傳統(tǒng)基于像素值遙感分類方法,其實(shí)質(zhì)即根據(jù)地物光譜特征差異對像元進(jìn)行空間聚類分析,并將亮度值差異較小的像元?dú)w屬為同一類別,多用于中低分辨率遙感影像分類研究[16-18];另一類是面向?qū)ο蟮倪b感分類方法,它將待分類影像視為有聯(lián)系的地塊單元,不再局限于單個像元[19],在分類過程中不僅考慮地物光譜特征,還引入地物形狀、結(jié)構(gòu)及紋理等信息特征參與分類,多用于中高分辨率遙感影像分類研究[20-21]。
以上兩種方法雖然能滿足現(xiàn)代地理學(xué)遙感分類研究的基本需要,但由于中分辨率遙感影像分類過程中同譜異物和同物異普現(xiàn)象的存在,使得傳統(tǒng)基于像素遙感分類結(jié)果中常會出現(xiàn)不同程度的椒鹽噪聲。雖然面向?qū)ο蠓诸惙椒茉谝欢ǔ潭壬蠝p少椒鹽噪聲的出現(xiàn),但其在執(zhí)行分類操作之前需要手動篩選出最優(yōu)特征值,建立起分類規(guī)則。分類規(guī)則的建立通常需要反復(fù)嘗試且執(zhí)行分類操作過程耗時較長?;谶@一思考,本文擬選用武漢市為研究區(qū),基于GoogleNet模型中的Inception V3網(wǎng)絡(luò)結(jié)構(gòu),借助遷移學(xué)習(xí)方法構(gòu)建出遙感分類模型,并利用該模型實(shí)現(xiàn)對研究區(qū)地物的自動化分類提取,同時將分類結(jié)果與傳統(tǒng)ML分類結(jié)果進(jìn)行對比分析。研究表明:基于深度學(xué)習(xí)技術(shù)的遙感分類方法,在中分辨率影像中的分類精度明顯優(yōu)于ML分類精度,且有效抑制了傳統(tǒng)像素分類方法過程中可能出現(xiàn)的地物混分問題,實(shí)現(xiàn)了機(jī)器對衛(wèi)星影像的智能化自動分類提取過程。
武漢市位于江漢平原東部的長江中下游平原,東臨鄂州、西接孝感、南連咸寧、北通黃岡,長江和漢江貫穿而過,“兩江三鎮(zhèn)”形成了武漢最基本的地理分布格局。武漢市現(xiàn)轄13個區(qū),包括7個中心城區(qū)和6個遠(yuǎn)郊城區(qū)。本區(qū)屬于亞熱帶季風(fēng)濕潤性氣候,冬季盛行偏北風(fēng),夏季則盛行偏南風(fēng)。氣候溫暖而濕潤,年平均氣溫在18.1℃,年均降水量900~1400 mm,四季分明,雨熱同期。地勢整體呈現(xiàn)西高東低態(tài)勢,平原丘陵交錯分布,地貌類型主要以平原為主。區(qū)內(nèi)自然資源豐富,河流湖泊眾多,水熱組合條件優(yōu)越,農(nóng)業(yè)自然資源稟賦得天獨(dú)厚,因而享有“魚米之鄉(xiāng)”的美譽(yù)。
本文選取研究區(qū)2016年5月12日Landsat 7 ETM+衛(wèi)星影像和2016年2月2日高分2號影像作為研究基礎(chǔ)數(shù)據(jù)(來源于中國科學(xué)院資源環(huán)境科學(xué)數(shù)據(jù)中心,http:∥www.resdc.cn)。與Landsat 5 TM影像相比,Landsat 7 ETM+衛(wèi)星影像不僅增加了空間分辨率為15 m的PAN全色波段,同時第6波段空間分辨率也由TM 5的120 m提高到了60 m。高分二號衛(wèi)星擁有兩臺成像光譜相機(jī):一臺空間分辨率為1 m的全色光譜相機(jī),星下點(diǎn)空間分辨率達(dá)0.8 m;另一臺為空間分辨率4 m的多光譜相機(jī),星下點(diǎn)空間分辨率為3.2 m。數(shù)據(jù)預(yù)處理主要包含Landsat影像的幾何校正、配準(zhǔn)及對精校正后的高分二號影像的多光譜和全色影像進(jìn)行融合處理,得到研究區(qū)分辨率為0.8 m的高分遙感影像。
根據(jù)研究區(qū)地物類型結(jié)構(gòu)特征將用地類型劃分成不透水層、植被、水體和其他用地(主要指裸土及灘涂)等4類。在執(zhí)行遙感分類之前通常需要建立起樣本數(shù)據(jù)集,而樣本數(shù)據(jù)集選取是否準(zhǔn)確且具有代表性將直接影響到后期模型訓(xùn)練效率與模型分類精度的高低,因此本研究借助與遙感影像成像時間相對接近的高分影像和歷史谷歌影像,通過目視解譯方法,分亮度分區(qū)域選取上述4種類型用地樣本各500塊,再分別按照3∶1∶1隨機(jī)選取訓(xùn)練樣本,驗(yàn)證樣本和測試樣本數(shù)據(jù)集。
首先對研究區(qū)Landsat 7影像進(jìn)行多尺度分割,結(jié)果如圖1所示,借助研究區(qū)高分影像進(jìn)行目視解譯驗(yàn)證,選取分割參數(shù)為30,形狀因子權(quán)重和緊湊度因子權(quán)重參數(shù)分別為0.4和0.6的矢量分割結(jié)果對影像進(jìn)行批量裁剪,得到待分類影像斑塊;然后,通過機(jī)器對訓(xùn)練樣本進(jìn)行分層學(xué)習(xí),提取樣本影像中的底層特征形成抽象的高層屬性特征數(shù)據(jù)集,再利用特征數(shù)據(jù)集訓(xùn)練分類模型;最后利用模型對研究區(qū)影像斑塊進(jìn)行自動提取。
GoogleNet深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡潔,其最大特點(diǎn)在于它的Inception網(wǎng)絡(luò)結(jié)構(gòu)(如圖2(a)所示),與傳統(tǒng)Inception結(jié)構(gòu)GoogleNet模型相比,它不僅減少了過濾器及模型訓(xùn)練參數(shù)個數(shù),而且最大限度地增加了網(wǎng)絡(luò)深度及寬度,使得模型性能較引入Inception結(jié)構(gòu)之前提升了2到3倍。而Inception V3(如圖2(b)所示)在Inception Module結(jié)構(gòu)的基礎(chǔ)上進(jìn)一步優(yōu)化,它通過分解因式思想將Inception Module中的多維卷積層拆分成多個較小的一維卷積層,從而實(shí)現(xiàn)了在縮減模型參數(shù)的同時,也有效抑制了模型在訓(xùn)練過程中可能出現(xiàn)的過擬合問題。
在深度學(xué)習(xí)遙感分類模型構(gòu)建中,訓(xùn)練樣本數(shù)量、卷積神經(jīng)網(wǎng)絡(luò)的寬度、深度等都會影響到模型最終分類精度高低。若訓(xùn)練樣本數(shù)量過少,模型很容易出現(xiàn)過擬合現(xiàn)象;若樣本數(shù)量滿足要求,增加網(wǎng)絡(luò)模型深度,模型訓(xùn)練參數(shù)數(shù)量便會成倍上漲,模型訓(xùn)練耗費(fèi)的時間成本也隨之增加,而且越到后期下降梯度也越容易消失,使得模型難以進(jìn)行優(yōu)化。為此,本研究借助遷移學(xué)習(xí)方法,從GoogleNet模型中的Inception V3網(wǎng)絡(luò)結(jié)構(gòu)中提取卷積層和池化層作為分類模型的特征處理器來提取樣本數(shù)據(jù)集特征,再將提取到的特征集傳入Logistic分類器中參入訓(xùn)練,通過訓(xùn)練樣本訓(xùn)練網(wǎng)絡(luò)模型,并用驗(yàn)證樣本去驗(yàn)證模型精度,不斷調(diào)整模型學(xué)習(xí)率、Batches和Epochs等參數(shù)大小,省去了模型中大量參數(shù)的重新構(gòu)建,從而極大地提升了分類模型的構(gòu)建效率。
深度學(xué)習(xí)模型常由5部分組成,即輸入層、卷積層、池化層、全連接層和輸出層。其中卷積和池化層是深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)隱藏層的核心組成部分,卷積層主要通過卷積核對要素特征進(jìn)行自動提取,而池化操作主要是在卷積操作的基礎(chǔ)上,對目標(biāo)要素的特征進(jìn)行二次采樣,這進(jìn)一步提高了模型算法的穩(wěn)健性?;谏疃葘W(xué)習(xí)方法遙感自動分類即通過模型中的卷積和池化等操作,實(shí)現(xiàn)對影像斑塊特征集的抽樣提取,形成影像斑塊特征數(shù)據(jù)集矩陣,隨后指導(dǎo)模型對特征數(shù)據(jù)集進(jìn)行深度學(xué)習(xí),最終利用從特征數(shù)據(jù)集中學(xué)習(xí)到的“經(jīng)驗(yàn)矩陣”指導(dǎo)模型對影像斑塊進(jìn)行自動分類的過程。
為驗(yàn)證本文研究方法在中分辨率遙感影像分類中的可行性,將其分類結(jié)果(如圖3(a)所示)與傳統(tǒng)ML法分類結(jié)果(如圖3(b)所示)進(jìn)行對比分析。由圖3可知,傳統(tǒng)ML方法分類結(jié)果中,地物斑塊多呈破碎狀分布,而且由于同譜異物或同物異譜現(xiàn)象的存在,地物像元混分現(xiàn)象較為嚴(yán)重,而本文提出的基于深度學(xué)習(xí)技術(shù)的遙感分類方法則有效抑制了地物混分現(xiàn)象;同時也在一定程度上減少了分類過程中出現(xiàn)的椒鹽噪聲。由此可見該方法在中分辨率遙感影像地物分類應(yīng)用研究中具備較高的可行性,能夠滿足研究的基本需要。
本研究采用隨機(jī)抽樣方法對分類結(jié)果進(jìn)行精度評價[22],在研究區(qū)范圍內(nèi)隨機(jī)生成300個驗(yàn)證樣本點(diǎn),結(jié)合研究區(qū)高分影像和歷史谷歌影像,通過人工目視解譯人機(jī)交互模式對結(jié)果進(jìn)行精度驗(yàn)證和評價見表1。
表1 ML和深度學(xué)習(xí)分類方法分類結(jié)果混淆矩陣
總體分類精度和Kappa系數(shù)是用來評價遙感分類結(jié)果的量化指標(biāo),總體分類精度即為樣本中所有被正確分類的樣本數(shù)量之和與驗(yàn)證樣本總數(shù)的比值,被正確分類樣本類別數(shù)量即沿混淆矩陣的對角線分布。本研究中的驗(yàn)證樣本總數(shù)大小為300,Kappa系數(shù)取值范圍在0~1之間,越接近1,表明分類的精度越高。本文分別對兩種方法的遙感影像總體分類精度、Kappa系數(shù)進(jìn)行綜合分析和評價。Kappa系數(shù)計算公式為
(1)
式中,N為驗(yàn)證樣本總數(shù);Aij為驗(yàn)證結(jié)果混淆矩陣中第i行第j列的樣本數(shù)量;Ai+和Ai-分別為第i行和第i列總像素個數(shù);n為研究區(qū)樣本類型數(shù)量。采用混淆矩陣得到兩種分類方法精度評價結(jié)果見表2。由結(jié)果可知,本文研究方法總體分類精度高達(dá)88.33%,Kappa系數(shù)為0.834 2,總體分類精度和Kappa系數(shù)均高于傳統(tǒng)ML方法總體分類精度83%和Kappa系數(shù)0.755 0。傳統(tǒng)ML方法分類結(jié)果中(見表2),除其他用地制圖精度較低外,其余3種類型用地制圖精度均在80%以上,其中不透水層分類精度最高,為88.07%;其次為水體和植被,分別為87.67%、83.33%??傮w來看,不透水層、植被和水體的分類精度較高,而其他用地錯分誤差相對較大,這是由于研究區(qū)其他用地面積整體占比較小,而且多是以灘涂和裸土地為主,而裸土與不透水層之間的光譜特征差異不如植被和水體顯著,因而錯分或漏分現(xiàn)象較多。而不透水層、植被和水體三者間的光譜特征差異較大,因此各類型的分類精度較高。在基于深度學(xué)習(xí)方法遙感分類結(jié)果中,不同地物類型邊界相對清晰且整齊劃一,較少出現(xiàn)破碎狀圖斑,而且各類型用地分類精度均優(yōu)于ML方法。
本研究基于中分辨率衛(wèi)星影像,分別運(yùn)用深度學(xué)習(xí)方法與ML分類方法對武漢市主城區(qū)4類典型地物進(jìn)行分類提取研究,并對分類結(jié)果進(jìn)行精度驗(yàn)證和評價。本文主要結(jié)論如下:
(1) 基于深度學(xué)習(xí)技術(shù)的遙感分類方法總體精度高達(dá)88.33%,明顯優(yōu)于ML法分類精度83%,表明該方法在中分辨率遙感影像分類提取研究中具備較高的可行性,能夠滿足遙感影像分類研究的基本需要。
表2 ML方法和深度學(xué)習(xí)方法的錯分誤差、漏分誤差、制圖精度與用戶精度
(2) 在研究區(qū)4種典型地物類型分類研究中,ML方法分類結(jié)果中不透水層、植被和水體的錯分和漏分誤差整體均低于其他類型用地,這是由于這3類地物像元亮度差異較大,而其他用地主要指裸土及灘涂,裸土地與不透水層的光譜特征較為接近,僅僅根據(jù)地物光譜特征差異很難將它們區(qū)分開,最終導(dǎo)致總體分類精度不高。深度學(xué)習(xí)方法在地物光譜特征的基礎(chǔ)上加入形狀、結(jié)構(gòu)及紋理等特征參入分類,使得各用地類型分類精度均有不同程度的提升,這表明引入形狀及紋理結(jié)構(gòu)特征對分類精度的提升是有效的。
(3) 基于深度學(xué)習(xí)技術(shù)的遙感分類方法不僅有效抑制了傳統(tǒng)方法在分類過程中產(chǎn)生的椒鹽噪聲,而且在一定程度上減少了地物像元混分現(xiàn)象。表明在中尺度遙感影像分類研究中,深度學(xué)習(xí)分類方法比傳統(tǒng)ML方法具備更高的可行性及適用性,這也為今后遙感影像智能化解譯研究提供了一種新的視角。
與傳統(tǒng)ML分類方法相比,深度學(xué)習(xí)分類方法在中分辨率影像地物分類研究中取得了較好結(jié)果,但這是建立在對研究區(qū)遙感影像取得較為理想分割參數(shù)基礎(chǔ)之上的,畢竟遙感影像分割參數(shù)選取是否合理,將直接影響到模型最終分類精度的高低。通常不同類型傳感器和不同空間分辨率衛(wèi)星影像分割參數(shù)之間存在較大差異,如何針對不同研究區(qū)域和不同空間分辨率的衛(wèi)星影像選取合適的分割參數(shù),還有待進(jìn)一步研究。