賀丹 張靜
摘? 要:高分一號(GF-1)遙感影像具有分辨率高、光譜信息豐富、紋理清晰等特征,利用GF-1影像研究地物識別具有重要的現(xiàn)實(shí)意義。本文以東莞市松山湖地區(qū)為研究區(qū)域,基于GF-1遙感影像數(shù)據(jù),分別采用最大似然法、支持向量機(jī)、深度學(xué)習(xí)(隨機(jī)森林)等方法對研究區(qū)的地物進(jìn)行識別。實(shí)驗(yàn)結(jié)果表明:采用深度學(xué)習(xí)方法對地物分類的總精度為92.24%,Kappa系數(shù)為0.91,與最大似然法和支持向量機(jī)相比,基于深度學(xué)習(xí)方法的分類精度更高,分類結(jié)果更能體現(xiàn)土地實(shí)際利用情況。
關(guān)鍵詞:深度學(xué)習(xí)? 松山湖? 地物分類? 遙感? 高分一號
中圖分類號:TN957.52;TP391.41? ? ? ? 文獻(xiàn)標(biāo)識碼:A? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2020)11(c)-0021-05
The Application of Deep Learning Method in the Feature Classification of Songshan Lake Area
HE Dan*? ZHANG Jing
(School of Computer and Information, City College of DongGuan University of Technology, Dongguan, Guangdong Province, 523000 China)
Abstract: GF-1 remote sensing image is characterized by high resolution, rich spectral information and clear texture, etc. Therefore, it is of great practical significance to use GF-1 image to study ground object recognition. Based on GF-1 remote sensing image data, this paper takes Songshan Lake area of Dongguan city as the research area, and adopts maximum likelihood method, support vector machine, deep learning(Random Forest, RF) and other methods to identify ground objects in the research area. The experimental results show that the total accuracy of ground objects classification using deep learning method is 90.24%, and the Kappa coefficient is 0.91. Compared with the maximum likelihood method and support vector machine, the classification based on deep learning method has a higher accuracy, and the classification results can better reflect the actual land use.
Key Words: Deep learning; Songshan lake; Feature classification; Remote sensing; GF-1
在城市化的發(fā)展進(jìn)程中,城市土地利用情況可以為城市化的下一步規(guī)劃提供指導(dǎo)意見,因此掌握城市地物的分布情況對一個城市的長遠(yuǎn)發(fā)展具有重要意義[1]。遙感影像作為檢測地物情況最直接的途徑,在地物分布情況的研究過程中發(fā)揮了重要作用,遙感影像在土地覆蓋檢測、森林覆蓋檢測、草地覆蓋檢測、濕地覆蓋檢測等領(lǐng)域已經(jīng)得到廣泛的應(yīng)用[2]。
隨著高分遙感技術(shù)的不斷進(jìn)步和發(fā)展,中國航天事業(yè)也迎來了發(fā)展的新階段,國產(chǎn)高分辨率遙感衛(wèi)星技術(shù)迅速提升,一系列國產(chǎn)高分遙感衛(wèi)星陸續(xù)發(fā)射并投入使用,國產(chǎn)高分衛(wèi)星的發(fā)射推動了我國遙感行業(yè)的蓬勃發(fā)展。自從2013年發(fā)射國產(chǎn)高分一號衛(wèi)星以來,我國相繼發(fā)射了高分二號、高分三號等高分系列衛(wèi)星。其中,國產(chǎn)高分一號衛(wèi)星(GF-1)是中國高分辨率對地觀測系統(tǒng)的首發(fā)星,突破了高空間分辨率、多光譜與寬覆蓋相結(jié)合的光學(xué)遙感等關(guān)鍵技術(shù)[3]。目前,高分一號遙感數(shù)據(jù)被廣泛應(yīng)用于城市土地應(yīng)用[4]、城市發(fā)展[5]、地物提取[6-7]等領(lǐng)域。本文以東莞市松山湖地區(qū)為主要研究區(qū)域,重點(diǎn)研究深度學(xué)習(xí)方法在高分遙感影像地物分類中的應(yīng)用。
1? 研究區(qū)域及影像數(shù)據(jù)
1.1 研究區(qū)域
東莞市位于中國華南地區(qū),廣東省中南部,地處珠江口東岸,介于東經(jīng)113°31′~114°15′,北緯22°39′`23°09′之間,東北與惠州市接壤,南接深圳市,西北與廣州市相鄰。東莞市既是珠三角中心城市之一,又是粵港澳大灣區(qū)重點(diǎn)城市之一。
松山湖地區(qū)是東莞市政府將大嶺山鎮(zhèn)、寮步鎮(zhèn)、大朗鎮(zhèn)三鎮(zhèn)靠近松山湖的部分邊緣地帶劃分出來與湖泊區(qū)域重新組合形成新的國家級高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)。東莞市松山湖地區(qū)地處東莞市的幾何中心,區(qū)域面積72km2,包括8km2的淡水湖和14km2的生態(tài)綠地,生態(tài)環(huán)境保持良好,研究松山湖地區(qū)的地物分布情況對松山湖區(qū)域未來發(fā)展具有重要意義。本文選取松山湖地區(qū)極具代表性的矩形區(qū)域作為研究對象,松山湖地區(qū)的位置信息如圖1所示,該區(qū)域?yàn)閬啛釒Ъ撅L(fēng)氣候,主要土地類型包括林地、耕地、水體、建設(shè)用地等,地物類型豐富。
1.2 影像數(shù)據(jù)
遙感技術(shù)是一種非接觸遠(yuǎn)距離的探測技術(shù),一般是通過利用傳感器對物體的電磁波的輻射和反射特性進(jìn)行探測,通過物體表面反射、輻射或散射的電磁波信息對物體信息進(jìn)行提取、判定、分析和應(yīng)用。2013年4月,國產(chǎn)高分一號衛(wèi)星(GF-1)發(fā)射成功之后,為國土資源管理部門提供了高精度、多光譜的遙感影像,從而在城市規(guī)劃和土地利用情況中發(fā)揮了重要作用。
本研究的GF-1影像數(shù)據(jù)從遙感集市數(shù)據(jù)中心(http://www.rscloudmart.com/dataProduct/)獲取,該影像數(shù)據(jù)采集于2017年9月16日,研究區(qū)域所選影像云量為0%。使用ENVI5.2軟件對GF-1遙感影像數(shù)據(jù)進(jìn)行處理,主要包括正射校正、影像融合、大氣校正、裁剪等影像預(yù)處理操作。預(yù)處理之后,研究區(qū)域的地理狀況和GF-1遙感影像如圖2所示。
2? 地物分類研究方法
2.1 地物分類方法總覽
遙感影像通過亮度值或像元值的高低差異(反映地物的光譜信息)及空間變化(反映地物的空間信息)來表示不同地物的差異,這是區(qū)分不同圖像地物的物理基礎(chǔ)[8]。遙感圖像分類技術(shù)就是依據(jù)遙感影像中各類地物的光譜信息和空間信息對地物情況進(jìn)行分析,通常地物分類方法包括監(jiān)督分類和非監(jiān)督分類,在ENVI5.2中,監(jiān)督分類器包括平行六面體、最小距離、馬氏距離、最大似然法、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法,非監(jiān)督分類器包括ISODATA和K-ean兩種。本文選取監(jiān)督分類中的最大似然法和支持向量機(jī),并運(yùn)用深度學(xué)習(xí)方法,實(shí)現(xiàn)松山湖地區(qū)的地物分類研究。
2.2 最大似然法
最大似然法(Maximum Likelihood Classification)是通過使用一個概率模型,根據(jù)遙感影像中像元的歸屬概率對地物類型進(jìn)行分類。假設(shè)每一個波段的每一類統(tǒng)計(jì)都呈正太分布,計(jì)算給定像元屬于某一訓(xùn)練樣本的似然度,像元最終被歸到似然度最大的一類中[8]。在使用最大似然法對地物進(jìn)行分類時(shí),一開始便假定各地物分類呈正太分布,但是實(shí)際情況往往與假定有一定差距,因此在采用最大然法時(shí),對實(shí)驗(yàn)選取的訓(xùn)練樣本有較高要求。
2.3 支持向量機(jī)
支持向量機(jī)(Support Vector Machine, SVM)是一種建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的機(jī)器學(xué)習(xí)方法,使用了鉸鏈損失函數(shù)來計(jì)算經(jīng)驗(yàn)風(fēng)險(xiǎn),同時(shí)加入了正則化項(xiàng)來優(yōu)化結(jié)構(gòu)風(fēng)險(xiǎn),具有稀疏性和穩(wěn)健性的特點(diǎn)。SVM可以自動化尋找那些對分類有較大區(qū)分能力的支持向量,并構(gòu)造出相應(yīng)的分類器,可以將類與類之間的間隔最大化,從而有較好的推廣性和較高的分類準(zhǔn)確率[8]。通常情況下,使用SVM進(jìn)行地物分類時(shí),能取得較好的分類效果,但是對某些數(shù)據(jù)集而言,損失函數(shù)中相關(guān)參數(shù)的設(shè)置、核函數(shù)參數(shù)的設(shè)置對SVM分類器的分類效果影響較大,這種情形下需要通過多次交叉驗(yàn)證試驗(yàn)才能找到最佳的參數(shù)設(shè)置,實(shí)驗(yàn)代價(jià)較大。
2.4 深度學(xué)習(xí)之隨機(jī)森林
深度學(xué)習(xí)方法(Deep Learning, DL)是機(jī)器學(xué)習(xí)(Machine Learning, ML)中的新分支,深度學(xué)習(xí)方法被廣泛的應(yīng)用于自然語言處理、語音識別、人臉識別等領(lǐng)域。隨著深度學(xué)習(xí)方法研究的不斷深入,深度學(xué)習(xí)方法在遙感影像處理領(lǐng)域的應(yīng)用也取得了較好的效果。深度學(xué)習(xí)方法常用的算法包括:卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)、長短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory Network, LSTM)、隨機(jī)森林(Random Forest, RF)等。
本文選取深度學(xué)習(xí)方法中的隨機(jī)森林進(jìn)行地物分類研究,與傳統(tǒng)的監(jiān)督學(xué)習(xí)分類方法不同,隨機(jī)森林是一種包含多個決策樹的分類器,其輸出的地物類別是由個別樹輸出的地物類別的眾數(shù)而決定。在隨機(jī)森林中采用CART決策樹為基本分類器,構(gòu)造一個集成學(xué)習(xí)模型,不僅克服了決策樹中較常出現(xiàn)的過擬合問題,而且對噪聲數(shù)據(jù)和異常數(shù)據(jù)有較好的容忍性,對較高維數(shù)據(jù)有可擴(kuò)展性,既能處理離散數(shù)據(jù)也能處理連續(xù)數(shù)據(jù)。隨機(jī)森林結(jié)構(gòu)如圖3所示。
3? 研究過程
3.1 地物分類流程
采用監(jiān)督分類方法對地物進(jìn)行分類時(shí),一般的流程包括4個步驟:定義訓(xùn)練樣本集、執(zhí)行監(jiān)督分類、評價(jià)分類結(jié)果和分類后處理[8]。針對本文的研究重點(diǎn),結(jié)合ENVI5.2中遙感影像處理的一般步驟和流程,將地物分類的流程主要分成如下4個步驟:遙感影像數(shù)據(jù)預(yù)處理、執(zhí)行遙感影像地物分類、地物分類結(jié)果匯總與評價(jià)、地物分類結(jié)果后處理。在遙感影像數(shù)據(jù)預(yù)處理時(shí),主要執(zhí)行GF-1遙感影像獲取、遙感影像預(yù)處理(包括正射校正、影像融合、大氣校正、裁剪等操作)、地物類型確定、訓(xùn)練樣本集定義等操作。在執(zhí)行遙感影像地物分類時(shí),分別采用最大似然法、支持向量機(jī)、隨機(jī)森林三種方式對松山湖地區(qū)遙感影像執(zhí)行地物分類,并記錄分類結(jié)果。在地物分類結(jié)果匯總與評價(jià)階段,分別從制圖精度、用戶精度、總體分類精度、Kappa系數(shù)等角度對3種方式地物分類結(jié)果進(jìn)行算法評價(jià),并對比這3種方式的地物分類結(jié)果。在分類后處理階段,將通過Majority/Minority分析、聚類處理、分類統(tǒng)計(jì)等操作對分類結(jié)果進(jìn)行處理。
3.2 遙感影像數(shù)據(jù)預(yù)處理
在獲取GF-1遙感影像之后,借助ENVI5.2軟件對松山湖地區(qū)遙感影像執(zhí)行正射校正、影像融合、大氣校正、裁剪等一系列操作,在執(zhí)行研究區(qū)域選取時(shí),盡量選取地物類型豐富、地物特征分明的區(qū)域。
根據(jù)2017年11月1日由國土資源部組織修訂的國家標(biāo)準(zhǔn)《土地利用現(xiàn)狀分類》(GB/T 21010-2017)[9],結(jié)合東莞市松山湖地區(qū)的土地利用情況,將地物分為林地、水體、建設(shè)用地、道路、其他用地,在本文的研究中,將重點(diǎn)研究上述五種地物類型的分布情況。
在ENVI5.2軟件中借助ROI工具選取出各個類型地物的樣本點(diǎn)[10],其中林地樣本點(diǎn)為320個,水體樣本點(diǎn)為410個,建設(shè)用地樣本點(diǎn)為380個,道路樣本點(diǎn)為260個,其他用地樣本點(diǎn)為105個,5種地物樣本數(shù)據(jù)數(shù)量均在100個以上,滿足實(shí)驗(yàn)要求。同時(shí),通過ENVI軟件為每一個感興趣區(qū)域組合計(jì)算Jeffries-Matusita距離和轉(zhuǎn)換分離度,五類地物的可分離性值均在1.9以上,樣本之間的可分離性良好。此外,隨機(jī)選取各類樣本點(diǎn)中的80%為訓(xùn)練樣本集,剩下的20%樣本點(diǎn)為測試樣本集。
3.3 執(zhí)行遙感影像地物分類實(shí)驗(yàn)
ENVI5.2中的Toolbox工具箱中提供了分類器選擇功能,為遙感影像分別選用最大似然法、支持向量機(jī)兩種方法執(zhí)行地物分類。
采用深度學(xué)習(xí)方法中的隨機(jī)森林方法執(zhí)行地物分類步驟為:首先,將ENVI5.2軟件中選取的ROI區(qū)域按照地物類型分別保存為CSV格式的文件;接著,使用Python語言實(shí)現(xiàn)CSV文件的讀取,借助Google推出的Tensorflow框架實(shí)現(xiàn)隨機(jī)森林算法模型,并利用訓(xùn)練樣本集對模型進(jìn)行訓(xùn)練,通過測試樣本集對隨機(jī)森林算法的分類精度進(jìn)行評估。
4? 實(shí)驗(yàn)結(jié)果
4.1 松山湖地區(qū)地物分類結(jié)果匯總與評價(jià)(3種方法對比)
在完成遙感影像數(shù)據(jù)預(yù)處理、執(zhí)行遙感影像地物分類兩個步驟之后,分別使用最大似然法、支持向量機(jī)、隨機(jī)森林3種算法對遙感影像數(shù)據(jù)進(jìn)行地物分類實(shí)驗(yàn),并在實(shí)驗(yàn)之后統(tǒng)計(jì)出分類結(jié)果,將這些實(shí)驗(yàn)數(shù)據(jù)匯總?cè)绫?所示。
從表1中松山湖地區(qū)地物分類結(jié)果匯總情況可知,基于最大似然法的地物分類方法道路的用戶精度為78.58%,林地的用戶精度為78.46%,地物分類過程中錯分和漏分的比例較高。支持向量機(jī)的分類方法比基于最大似然法的分類方法在總體分類精度上有所提高,提高了4.06%,Kappa系數(shù)提高了0.06。但是支持向量機(jī)的分類方法在道路、其他用地上的用戶精度分別為83.55%、78.16%,分類精度仍有待提高。
表1中基于隨機(jī)森林的地物分類方法在地物分類中體現(xiàn)了較高的分類精度,其中水體、林地的用戶精度分別高達(dá)97.25%、95.25%,且總體分類精度為92.24%,Kappa系數(shù)為0.91。與最大似然法、支持向量機(jī)相比,基于隨機(jī)森林的方法地物分類總體精度分別提高了:7.74%、3.68%,Kappa系數(shù)分別提高:0.13、0.07。
從分類結(jié)果可知,深度學(xué)習(xí)方法更適用于松山湖地區(qū)地物分類研究,其中隨機(jī)森林方法在地物分類中體現(xiàn)出明顯的分類精度優(yōu)勢。同時(shí),深度學(xué)習(xí)的方法發(fā)展速度較快,應(yīng)用場景廣泛,更適合用于遙感地物分類。
4.2 地物分類結(jié)果后處理
在通過最大似然法、支持向量機(jī)、隨機(jī)森林等方法執(zhí)行GF-1遙感影像地物分類實(shí)驗(yàn)后,得到的是地物分類的初步結(jié)果,初步結(jié)果一般情況下還不能達(dá)到最終的應(yīng)用目的,因此,在得到初步分類結(jié)果之后,需要進(jìn)行一系列的地物分類結(jié)果后處理操作。在本文中,通過Majority/Minority分析、聚類處理、分類統(tǒng)計(jì)等操作對分類結(jié)果進(jìn)行處理。
5? 結(jié)語
本文以東莞市松山湖地區(qū)為研究區(qū)域,利用GF-1高分遙感影像,分別基于最大似然法、支持向量機(jī)、深度學(xué)習(xí)之隨機(jī)森林三種算法對遙感影像數(shù)據(jù)進(jìn)行地物分類,其中隨機(jī)森林算法總體分類精度為92.24%,Kappa系數(shù)為0.91,比最大似然法的分類精度提高了7.74%,比支持向量機(jī)的分類精度提高了3.68%。深度學(xué)習(xí)方法能更好的利用訓(xùn)練數(shù)據(jù)集訓(xùn)練模型,并清楚地記錄不同地物的特征,從而展現(xiàn)出更好的地物分類效果。因而,深度學(xué)習(xí)方法在松山湖地區(qū)地物分類中發(fā)揮了較好的作用,為松山湖地區(qū)的城市規(guī)劃和建設(shè)提供了參考依據(jù)。
城市地物分布情況對城市的未來發(fā)展提供了重要依據(jù),而高分遙感影像為地物提取提供了數(shù)據(jù)支撐,在今后的研究中需要在地物分類算法的精度上不斷加強(qiáng)。同時(shí)隨著城市化進(jìn)程的加快,在實(shí)際應(yīng)用中,一方面城市地物類型的分布情況是十分復(fù)雜的,另一方面對城市地物分類精度的要求也在不斷提高,因此,基于高分遙感影像的影像預(yù)處理、地物分類、地物識別等算法還有待加強(qiáng),在今后的研究過程中將研究出更高效的地物分類算法,構(gòu)建更高精度的地物分類模型。
參考文獻(xiàn)
[1] 袁靜文,武辰,杜博,等.高分五號高光譜遙感影像的城市土地利用景觀格局分析[J].遙感學(xué)報(bào),2020,24(4):465-478.
[2] 遙感影像[DB/OL].[2020-02-07]https://baike.baidu.com/item/遙感影像/9861856?fr=aladdin.
[3] 高分一號衛(wèi)星[DB/OL].[2020-05-24]https://baike.baidu.com/item/高分一號衛(wèi)星/1669034?fr=aladdin.
[4] 高晨.基于高分一號影像和POI數(shù)據(jù)的土地功能分類方法研究[D].阜新:遼寧工程技術(shù)大學(xué),2017.
[5] 馬建如,裴亮.基于高分一號衛(wèi)星的城市擴(kuò)張變化監(jiān)測研究[J].測繪與空間地理信息,2017,40(6):61-64.
[6] 孫嘉悅.基于集成學(xué)習(xí)的高分辨率遙感影像地表水體信息提取[D].長春:吉林大學(xué),2020.
[7] 胡建青.面向?qū)ο蟮母叻直媛蔬b感影像道路信息提取[D].北京:北京交通大學(xué),2019.
[8] 鄧書斌,陳秋錦,杜會建,等.ENVI遙感圖像處理方法[M].2版.北京:高等教育出版社,2014.
[9] 土地利用現(xiàn)狀分類(GB/T 21010-2017)[DB/OL].[2017-11-1] https://m.wang1314.com/doc/webapp/topic/20936079.html.
[10] 王義慧,宋磊.基于Landsat8的濟(jì)南市土地利用分類及變化監(jiān)測[J].科技創(chuàng)新導(dǎo)報(bào),2020,17(14):52,54.