摘" 要:遙感技術(shù)的大面積、實(shí)時(shí)、多時(shí)相對(duì)地觀測(cè)優(yōu)勢(shì),為遙感監(jiān)督分類提供便利,準(zhǔn)確的土地覆被信息是土地資源管理和監(jiān)測(cè)的基礎(chǔ),應(yīng)及時(shí)研發(fā)一種簡(jiǎn)單、快速和高精度的分類方法。該文選取吉林西部的白城市為研究案例,基于隨機(jī)森林分類方法,以Sentinel-2高分辨率衛(wèi)星影像作為數(shù)據(jù)源,在GEE云計(jì)算平臺(tái),進(jìn)行樣本點(diǎn)選取,并將樣本點(diǎn)數(shù)據(jù)集與多波段合成影像添加到隨機(jī)森林分類器中,將影像分為耕地、水體、鹽堿地、城鎮(zhèn)和濕地5類。分類混淆矩陣的分類誤差均小于0.15,其中鹽堿地分類精度最高,耕地分類精度最低??傮w分類精度為94.20%,Kappa系數(shù)為0.926 9。該分類方法簡(jiǎn)單高效、適用于中小型地區(qū)高精度快速分類。
關(guān)鍵詞:Sentinel-2;土地利用分類;隨機(jī)森林;GEE;土地覆被
中圖分類號(hào):TP751 " " 文獻(xiàn)標(biāo)志碼:A" " " " " 文章編號(hào):2095-2945(2023)15-0039-04
Abstract: The advantages of large-area, real-time, and multi-time relative earth observation of remote sensing technology provide convenience for remote sensing supervision and classification. Accurate land cover information is the basis of land resource management and monitoring. A simple, fast, and high-precision method should be developed in time. Classification. This paper selects Baicheng City in the west of Jilin Province as a research case. Based on the random forest classification method, using Sentinel-2 high-resolution satellite images as the data source, the sample point is selected on the GEE cloud computing platform, and the sample point data set is combined with the multi-band The synthetic image is added to the random forest classifier, and the image is divided into five categories: cultivated land, water body, saline-alkali land, town, and wetland. The classification errors of the classification confusion matrix were all less than 0.15, among which the classification accuracy of saline-alkali land was the highest, and that of cultivated land was the lowest. The overall classification accuracy is 94.20% and the Kappa coefficient is 0.926 9%. The classification method is simple, efficient and suitable for high-precision and fast classification in small and medium-sized areas.
Keywords: Sentinel-2; land use classification; random forest; GEE; land cover
傳統(tǒng)的土地利用分類消耗大量的人力和物力,近些年因人類活動(dòng)和氣候變化的增強(qiáng),土地利用類型發(fā)生較大變化,隨著遙感技術(shù)的普及發(fā)展,基于遙感影像的分類是當(dāng)今主要的研究方法,機(jī)器學(xué)習(xí)的分類算法被廣泛應(yīng)用,包括:回歸樹(Classification And Regression Tree,CART)、隨機(jī)森林(Random Forest)、支持向量機(jī)(Support Vector Machine,SVM),其中隨機(jī)森林是較為熱門的一個(gè)算法,其準(zhǔn)確率極高、引入了隨機(jī)性可以避免過擬合、能夠有效在大數(shù)據(jù)集上運(yùn)行、具有較好的抗噪聲能力。因此隨機(jī)森林算法被大多數(shù)學(xué)者應(yīng)用在遙感影像分類中。如胡叢慧基于 GEE和Landsat 8 OLI影像的土地覆被分類研究分類總體精度為85.31%,Kappa系數(shù)為0.81;竇世卿等基于隨機(jī)森林的高分影像分類及土地利用變化檢測(cè)其中2017年和2020年影像的總體分類精度分別為98.616%、98.138%,Kappa系數(shù)分別為0.977,0.949;盧獻(xiàn)健基于GEE平臺(tái)廣西桉樹快速提取研究其中分類總體精度為81%,Kappa系數(shù)為0.81。
Sentinel-2衛(wèi)星星座是歐空局發(fā)射的Sentinel系列衛(wèi)星中重要的遙感平臺(tái),空間分辨率為10 m且同地區(qū)重訪周期為5 d,為土地利用分類和監(jiān)督提供了高質(zhì)量的數(shù)據(jù)源。本研究直接在Google Earth Engine(GEE)平臺(tái)上調(diào)用研究區(qū)在2020年4月20日的Sentinel-2影像,產(chǎn)品等級(jí)為L(zhǎng)2A級(jí),根據(jù)官方發(fā)布的 Sentinel-2影像數(shù)據(jù)說明,L2A級(jí)產(chǎn)品均為經(jīng)過輻射定標(biāo)、大氣校正以及正射校正處理過的圖像。只需通過在線編寫代碼可實(shí)現(xiàn)篩選圖像含云量、批量去云和研究區(qū)矢量裁剪等一系列數(shù)據(jù)預(yù)處理。Google Earth Engine(GEE)是當(dāng)前比較先進(jìn)的云地理信息處理平臺(tái),可為用戶實(shí)現(xiàn)科學(xué)分析和可視化,在平臺(tái)上直接調(diào)用包括 Landsat、MODIS、Sentinel等遙感數(shù)據(jù)后,通過云端的高性能計(jì)算可以快速、批量處理數(shù)量眾多的影像,具有存檔數(shù)據(jù)時(shí)間跨度長(zhǎng)、運(yùn)行穩(wěn)定、計(jì)算效率高、上手難度低和使用成本低等優(yōu)點(diǎn),也為大規(guī)模遙感數(shù)據(jù)的挖掘分析提供可能。目前已有學(xué)者結(jié)合隨機(jī)森林和GEE進(jìn)行分類,研究結(jié)果精度較高,表明隨機(jī)森林算法分類適用于各種土地類型的分類。
為了進(jìn)一步研究各地區(qū)土地利用分類情況,該研究選取吉林西部地區(qū)的白城市為例,同時(shí)白城市也是我國(guó)重要的糧食產(chǎn)區(qū),因此開展白城市土地利用類型分類研究具有重要意義。
1" 研究區(qū)概況與數(shù)據(jù)源
1.1" 研究區(qū)概況
吉林西部地區(qū)經(jīng)緯度范圍為121°38′~126°11′E,43°59′~46°18′N,位于松嫩平原的西南部,包括了白城和松原2市,本研究區(qū)主要選取在白城市(圖1),這里西接大興安嶺山地、東臨嫩江和第二松花江,南有松遼分水嶺(松嫩平原與遼河平原的分界),北與黑龍江省的泰來接壤,白城市地處我國(guó)東北地區(qū)的內(nèi)陸,屬于中溫帶大陸性季風(fēng)氣候區(qū),年平均降水量在300~500 mm,年蒸發(fā)量遠(yuǎn)大于降水量,同時(shí)也屬于半濕潤(rùn)-半干旱過渡性的氣候。自20世紀(jì)60年代以來,吉林省西部的生態(tài)環(huán)境逐漸惡化,土地鹽漬化問題日益嚴(yán)重,自然生態(tài)系統(tǒng)脆弱,土地覆蓋類型處于快速變化的狀態(tài)。
1.2" Sentinel-2數(shù)據(jù)
Sentinel-2包含2顆衛(wèi)星:Sentinel-2A和Sentinel-2B(分別于2015年6月23日和2017年3月7日發(fā)射),2顆相同的Sentinel-2衛(wèi)星在平均海拔786 km的太陽軌道上同步運(yùn)行,重訪周期為3~5 d,每顆衛(wèi)星都配備了最先進(jìn)的多光譜成像儀(Multi Spectral Instrument),包含藍(lán)光波段、綠光波段、紅光波段和植被紅邊波段等13個(gè)波段,可提供空間分辨率為10 m的光學(xué)影像。較短的重訪周期和較高的空間分辨率為大尺度遙感空間制圖提供了良好的條件。GEE(Google Earth Engine)平臺(tái)能夠直接調(diào)用Sentinel-2 level-1C (L1C)和 level-2A(L2A)兩個(gè)處理級(jí)別的數(shù)據(jù)產(chǎn)品。本研究使用的是Sentinel-2 Level-2A級(jí)產(chǎn)品,該產(chǎn)品主要包含經(jīng)過大氣校正的大氣底層反射率數(shù)據(jù)(Bottom-of-Atmosphere corrected reflectance)。
2" 研究方法與實(shí)驗(yàn)結(jié)果
2.1" 隨機(jī)森林分類
隨機(jī)森林(Random Forests)是一種監(jiān)督分類方法,對(duì)原始樣本中抽取多個(gè)樣本,每個(gè)樣本依賴于熵降低最快原則構(gòu)建決策樹,然后組合決策樹森林的預(yù)測(cè),因?yàn)闆Q策樹森林的抗干擾能力較強(qiáng),所以利用決策樹森林可以避免數(shù)據(jù)較為復(fù)雜情況下出現(xiàn)過擬合現(xiàn)象,并通過決策樹森林投票結(jié)果的眾數(shù)決定了最優(yōu)的分類結(jié)果。在土地利用分類、土地變化檢測(cè)、生物及生態(tài)科學(xué)等領(lǐng)域大范圍應(yīng)用,并具有極好的準(zhǔn)確率。
隨機(jī)森林分類主要是利用隨機(jī)森林對(duì)訓(xùn)練樣本的隨機(jī)化,生成單棵決策樹,構(gòu)建決策樹森林,并統(tǒng)計(jì)投票結(jié)果最多的為分類結(jié)果。具體流程如圖2所示。
2.2" 樣本點(diǎn)選取
本研究數(shù)據(jù)集在谷歌地球(Google Earth Engine)平臺(tái)上完成選點(diǎn)采集,數(shù)據(jù)集樣本是遙感影像監(jiān)督分類基礎(chǔ),監(jiān)督分類精度與樣本點(diǎn)的質(zhì)量的好壞有關(guān),質(zhì)量好的樣本點(diǎn)可以顯著增加分類精度,本研究采集樣點(diǎn)1 420個(gè),其中耕地點(diǎn)350個(gè),水體點(diǎn)310個(gè),鹽堿地點(diǎn)300個(gè),城鎮(zhèn)點(diǎn)300個(gè),濕地點(diǎn)160個(gè)。具體流程:首先進(jìn)入GEE調(diào)Sentinel-level-2A級(jí)遙感影像數(shù)據(jù)作為底圖,點(diǎn)擊添加標(biāo)記,創(chuàng)建一個(gè)新的圖層,本研究創(chuàng)建5個(gè)圖層,對(duì)圖層輸入樣本點(diǎn)名稱及賦予響應(yīng)屬性,如Plough(耕地)、Water(水體)、Saline-alkali land(鹽堿地)、Town(城鎮(zhèn))和Wetland(濕地)。因?yàn)镾entinel-2的空間分辨率為10 m,樣本數(shù)據(jù)紋理特征明顯,所以我們通過目視解譯進(jìn)行選點(diǎn),提高了作業(yè)效率;同時(shí)解決了樣本點(diǎn)野外實(shí)地采集耗時(shí)耗力等問題,為大尺度遙感提供便利。樣本點(diǎn)選取完成后復(fù)制import中代碼,粘貼到隨機(jī)森林分類器中作為訓(xùn)練樣本。該研究選取79%為訓(xùn)練樣本,21%為驗(yàn)證驗(yàn)本(表1)。
2.3" 分類過程
首先使用Java script語言在GEE平臺(tái)構(gòu)建隨機(jī)森林分類模型,在Sentinel-2衛(wèi)星影像中使用的光譜變量為藍(lán)光波段、綠光波段、紅光波段和植被紅邊波段,利用光譜計(jì)算,選取植被指數(shù)(NDVI、DVI、EVI)和土壤指數(shù)(SAVI),作為特征波段加入Sentinel-2衛(wèi)星影像,作為分類基礎(chǔ)影像,提高分類精度,利用隨機(jī)森林對(duì)土地利用類型進(jìn)行分類。
分類結(jié)果如圖3所示,分類結(jié)果與目視解譯選取的數(shù)據(jù)集基本一致,其中水體特征識(shí)別準(zhǔn)確,輪廓清晰,研究區(qū)耕地面積較大,主要集中在中上地區(qū),濕地特征也較為明顯,主要集中在中下地區(qū),總體分類結(jié)果清晰,得益于Sentinel-2高分辨率遙感影像,湖泊輪廓也能輕易判別。
進(jìn)一步采用混淆矩陣的方式分析了該分類的精度(表2),本研究方法的混淆矩陣分類誤差均小于0.15,分類結(jié)果表明鹽堿地分類精度最高,耕地的分類精度最低,原因可能是Sentinel-2衛(wèi)星獨(dú)特的紅邊波段,增強(qiáng)了對(duì)鹽堿地識(shí)別分類的精度,濕地大面積的植被覆蓋對(duì)分類造成了干擾,導(dǎo)致濕地與耕地出現(xiàn)誤分,城鎮(zhèn)樓頂?shù)念伾灰?,光學(xué)反射會(huì)出現(xiàn)誤差,且與耕地臨近,導(dǎo)致分類錯(cuò)誤,水體特征最為明顯,因此在光學(xué)影像的分類結(jié)果中清晰可見。
3" 結(jié)論
基于GEE平臺(tái),本文選用隨機(jī)森林分類算法在空間分辨率為10 m的Sentinel-2衛(wèi)星影像上對(duì)吉林西部的白城市進(jìn)行土地覆被分類,將研究區(qū)土地利用類型分成5類,5類土地利用類型分類精度見表3。
實(shí)驗(yàn)結(jié)果表明,GEE平臺(tái)可以實(shí)現(xiàn)高效率、高精度的機(jī)器學(xué)習(xí)方法,計(jì)算評(píng)價(jià)指標(biāo)為總體分類精度( Overall Ac-curacy)和Kappa系數(shù)(Kappa Coefficient)??傮w分類精度等于被正確分類的像元總和除以總像元數(shù)。Kappa系數(shù)是一種比例,代表著分類與完全隨機(jī)的分類產(chǎn)生錯(cuò)誤減少的比例[2]。本研究采樣的隨機(jī)森林算法總體分類精度為94.20%,Kappa系數(shù)為0.926 9。分類精度達(dá)到預(yù)期要求,其中鹽堿地的分類效果較為突出,生產(chǎn)者精度和用戶精度最高,說明在Sentinel-2上的紅邊波段對(duì)土壤鹽漬化地區(qū)具有很好的識(shí)別效果。雖然本研究分類結(jié)果精度較高,但仍然有很多不足,例如對(duì)濕地特征識(shí)別仍不夠準(zhǔn)確,城鎮(zhèn)與耕地接壤的地方容易出現(xiàn)誤分現(xiàn)象,下一步應(yīng)嘗試使用Sentinel-2時(shí)間序列數(shù)據(jù)并加入更多特征波段,去獲取更好的分類模型,降低地塊的碎片化。
有效使用GEE平臺(tái)的隨機(jī)森林分類算法進(jìn)行人工監(jiān)督采樣,可以高效率地完成中小地區(qū)的土地利用類型分類,本研究分類數(shù)據(jù)結(jié)果準(zhǔn)確,空間格局清晰明朗,操作簡(jiǎn)單,樣本點(diǎn)選取便捷且更新速度快,可作為典型地區(qū)分類的通用流程進(jìn)行應(yīng)用推廣。
參考文獻(xiàn):
[1] 胡叢慧.基于GEE和Landsat 8 OLI影像的土地覆被分類研究[J].科學(xué)技術(shù)創(chuàng)新,2021(35):58-60.
[2] 竇世卿,宋瑩瑩,徐勇,等.基于隨機(jī)森林的高分影像分類及土地利用變化檢測(cè)[J].無線電工程,2021,51(9):901-908.
[3] 張衛(wèi)春,劉洪斌,武偉.基于隨機(jī)森林和Sentinel-2影像數(shù)據(jù)的低山丘陵區(qū)土地利用分類——以重慶市江津區(qū)李市鎮(zhèn)為例[J].長(zhǎng)江流域資源與環(huán)境,2019,28(6):1334-1343.
[4] 史敏偉,李慶.基于隨機(jī)森林的GF-2影像土地利用分類研究[J].北京測(cè)繪,2019,33(12):1513-1517.
[5] 盧獻(xiàn)健,黃俞惠,晏紅波,等.基于GEE平臺(tái)廣西桉樹快速提取研究[J].林業(yè)資源管理,2019(5):52-60,75.
[6] 姜伊蘭,陳保旺,黃玉芳,等.基于Google Earth Engine和NDVI時(shí)序差異指數(shù)的作物種植區(qū)提取[J].地球信息科學(xué)學(xué)報(bào),2021,23(5):938-947.
[7] 李平,吳曼喬,曾聯(lián)明.支持向量機(jī)技術(shù)在土地利用監(jiān)測(cè)的應(yīng)用研究[J].測(cè)繪通報(bào),2010(8):28-30,67.
[8] DIHKAN M,GUNEROGLU N,KARSLI F,et al. Remote sens-ing of tea plantations using an SVM classifier and pattern-based accuracy assessment technique[J]. International Journal of Re-mote Sensing,2013,34(23):8549-8565.
[9] 趙萍,傅云飛,鄭劉根,等.基于分類回歸樹分析的遙感影像土地利用/覆被分類研究[J].遙感學(xué)報(bào),2005(6):708-716.
[10] FENG Q,LIU J,GONG J. UAV remote sensing for urban vege-tation mapping using random forest and texture analysis[J]. Re-mote Sensing,2015,7(1):1074-1094.
[11] 馬玥,姜琦剛,孟治國(guó),等.基于隨機(jī)森林算法的農(nóng)耕區(qū)土地利用分類研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2016,47(1):297-303.
[12] 秦海超,駱煥成,王笑.基于GEE和Sentinel-2影像的臨沂市土地利用/覆被分類信息提取[J].工程勘察,2021,49(8):69-73.
[13] 何昭欣,張淼,吳炳方,等.Google Earth Engine支持下的江蘇省夏收作物遙感提取[J].地球信息科學(xué)學(xué)報(bào),2019,21(5):752-766.
[14] 彭壯壯,武永斌,朱夢(mèng)豪,等.基于時(shí)序Sentinel-2影像的農(nóng)作物分類研究[J].測(cè)繪與空間地理信息,2021,44(12):81-84.