王剛,王加勝,苗旺元,陳波
(1.云南師范大學(xué)信息學(xué)院,昆明650500;2.西部資源環(huán)境地理信息技術(shù)教育部工程研究中心,昆明650500)
山區(qū)園地的提取在國內(nèi)國外的相關(guān)研究普遍比較少,利用遙感技術(shù)對(duì)山區(qū)園地的提取也比較難。近年來,果園的提取主要是用光譜特征和植被指數(shù)來操作的。例如羅等人[1]把環(huán)境衛(wèi)星遙感影像作為數(shù)據(jù)基礎(chǔ)影像,把NDVI、波段、高程和紋理信息等作為提取果園的特征,然后使用決策樹的分類模型對(duì)研究區(qū)的果園進(jìn)行遙感提取和分類。李等人[2]和Immitzer等人[3]綜合了光譜信息提取并且對(duì)其進(jìn)行分類。因?yàn)榈孛嫣卣飨鄬?duì)來說比較復(fù)雜,結(jié)合光譜和植被指數(shù)特征的果樹提取精度通常是比較低的,容易出現(xiàn)分類錯(cuò)誤和遺漏的現(xiàn)象[4-5]。為了提高分類精度,國內(nèi)外的學(xué)者運(yùn)用了光譜結(jié)合紋理特征的提取方法進(jìn)行果樹研究[6-7]。例如岳等人[8]把不同高精度分辨率的高分一號(hào)遙感數(shù)據(jù)作為基礎(chǔ)影像,把光譜和紋理特征作為提取特征,分別使用多種遙感分類模型對(duì)研究區(qū)主要栽培的果樹進(jìn)行遙感識(shí)別分類。PU等人[9]和Dian等人[10]把空間信息和光譜特征作為提取特征對(duì)果樹進(jìn)行遙感提取分類,證明了把空間信息和光譜特征結(jié)合起來可以很大地提高果樹分類的準(zhǔn)確性。宋等人[11]把QuickBird影像作為基礎(chǔ)遙感影像,先利用小波變換的方法對(duì)紋理信息進(jìn)行提取,然后使用隨機(jī)森林這個(gè)分類方法自動(dòng)提取出獼猴桃果園。郝等人[12]利用面向?qū)ο蟮母叻直媛视跋窠Y(jié)合紋理特征對(duì)耕地進(jìn)行提取。黃等人[13]從紋理、形狀和對(duì)象的角度來進(jìn)行提取和分析影像的特征,在這個(gè)基礎(chǔ)上,用三個(gè)分辨率比較高的對(duì)影像有實(shí)際應(yīng)用的案例來驗(yàn)證自己提出的方法。陳等人[14]利用高分辨率影像,把光譜和紋理特征作為提取特征數(shù)據(jù),通過比較選取最好的紋理特征組合,使用決策樹這個(gè)分類方法進(jìn)行分類。
綜上所述,在現(xiàn)有的果園提取方法中,結(jié)合光譜與植被指數(shù)特征的果樹提取精度相對(duì)較低,然而后來提出的一種把光譜和紋理特征作為提取特征的方法,很好地提升了對(duì)遙感影像的分類精度。但是因?yàn)檫b感影像空間分辨率的限制和制約,對(duì)影像的分類精度來說仍然具有比較大的提高空間。為此,亟需開展基于高分辨影像、融合光譜、地形、紋理等多特征的園地提取研究。
GEE(Google Earth Engine)是一個(gè)綜合科學(xué)分析和地理信息數(shù)據(jù)可視化的平臺(tái)。本身存儲(chǔ)了近40年來主要公開的遙感影像數(shù)據(jù)集,并每天不斷進(jìn)行更新,使得GEE用戶可以方便地提取、調(diào)用和分析海量的遙感大數(shù)據(jù)資源。與常規(guī)影像處理軟件相比,GEE可以實(shí)現(xiàn)更加快速、在線批量處理大數(shù)據(jù)等功能,對(duì)各種植被指數(shù)、水體指數(shù)具有快速且精確計(jì)算的特點(diǎn)。
本文擬以云南省昭通市昭陽區(qū)為研究區(qū)域,以GEE為軟件平臺(tái),把Landsat 8 OLI遙感影像作為基礎(chǔ)的數(shù)據(jù)影像,地形圖等地理數(shù)據(jù)作為輔助,對(duì)園地的特征進(jìn)行提取,主要包括了光譜特征、紋理特征、地形特征和纓帽變換特征,然后采用隨機(jī)森林(Random For-est)這個(gè)比較常見的分類方法進(jìn)行分類并且采用決策樹(Decision Tree)的分類方法和支持向量機(jī)(Support Vector Machine)的分類方法進(jìn)行提取2019年以昭陽區(qū)為研究區(qū)的園地并加以對(duì)比。
昭陽區(qū)隸屬于昭通市,在昭通市的西南方向,金沙江的南邊,在27.1°N-27.6°N、103.1°E-103.9°E之間,位于云貴高原的西北部(如圖1所示)。東、南、西、北邊分別與貴州省的威寧縣、昭通市的魯?shù)榭h、四川省的金陽縣、昭通市的彝良縣,大關(guān)縣和永善縣三縣相鄰,是昭通市最富裕的縣區(qū),占地總面積大約2167平方公里,占昭通市總面積的9.4%。昭陽區(qū)的氣候類型屬于北緯高原大陸季風(fēng)氣候,春夏秋冬四季的溫差比較小,干季濕季差別比較明顯,垂直差異比較大。全年無霜期約為220天,相對(duì)北方來說比較長,全年平均氣溫約為11.6攝氏度,比較適合水果的生長,全年平均降水量約為735毫米,全年平均日照時(shí)間約為1902.02小時(shí),晝夜的溫差較大,日溫差也比較大。該地區(qū)以紅壤為主,多為山區(qū),山區(qū)占64.3%,境內(nèi)水系發(fā)達(dá)。獨(dú)特的水文氣候條件,造就了“昭通蘋果”等水果品牌。
(1)Landsat 8 OLI數(shù)據(jù)。
根據(jù)昭陽區(qū)果園生長期以及影像的質(zhì)量等因素,選取來自GEE(https://earthengine.google.com/)平臺(tái)的28景Landsat 8 OLI遙感影像數(shù)據(jù)。時(shí)間是從2019年2月1日到2019年10月31日,包括果樹的發(fā)芽期、開花期、幼果期、膨大期、著色期和成熟期,分辨率為30m。首先對(duì)在GEE上獲取的Landsat 8 OLI遙感衛(wèi)星數(shù)據(jù)進(jìn)行數(shù)據(jù)的預(yù)處理工作,由于GEE中的Landsat 8 OLI遙感數(shù)據(jù)已經(jīng)進(jìn)行了大氣校正的工作,所以后續(xù)的預(yù)處理主要包括影像去云,影像融合鑲嵌,影像裁剪等過程,然后進(jìn)行特征提取。
圖1 研究區(qū)位置示意圖
(2)SRTM數(shù)據(jù)。
本文使用SRTMGL1_003數(shù)據(jù),空間分辨率30 m。運(yùn)用STRM數(shù)據(jù)進(jìn)行特征提取,包括DEM、坡度、坡向和陰影等信息。
(3)樣本數(shù)據(jù)。
選擇合適的樣本點(diǎn)是提高植被分類結(jié)果的可靠性以及精度的前提。根據(jù)昭陽區(qū)的地形圖,土地利用方式和分布,將研究區(qū)的主要的土地作物種植類型化分成6種,分別為水體、草地、耕地、林地、建筑用地和園地,這6種土地作物種植類型在Google Earth平臺(tái)本身提供的高分辨率影像上具有非常明顯的識(shí)別特征。通過Google Earth平臺(tái)提供的2019年左右的高分辨率影像,利用目視解譯的辦法得到所有土地類型的樣本數(shù)據(jù),收集得到的樣本點(diǎn)隨機(jī)且均勻分布于整個(gè)昭陽區(qū)。把目標(biāo)年份的樣本數(shù)據(jù)先進(jìn)行隨機(jī)的分配,比例按照7:3來分配,其中采集到的70%的樣本數(shù)據(jù)放入三種分類器進(jìn)行分類訓(xùn)練,而剩下的30%的樣本數(shù)據(jù)用來進(jìn)行混淆矩陣的精度評(píng)價(jià)。樣本數(shù)如表1所示。
研究技術(shù)路線如圖2所示。首先要對(duì)Landsat 8 OLI遙感影像進(jìn)行預(yù)處理的工作,由于GEE上的Land-sat數(shù)據(jù)已經(jīng)進(jìn)行了大氣校正,所以在這里主要進(jìn)行其他的一些預(yù)處理,包括影像去云、影像融合鑲嵌和影像裁剪等一系列過程,然后結(jié)合地形圖作為輔助數(shù)據(jù)進(jìn)行特征信息提取,包括物候特征、地物光譜特征、紋理特征、地形特征和纓帽變換特征,最后采用RF、CART、CART這三種常見的分類模型進(jìn)行分類并且進(jìn)行精度評(píng)價(jià)。
圖2 技術(shù)路線圖
特征變量的選擇對(duì)遙感分類來說非常重要,把不同的特征變量有機(jī)的組合起來可以使遙感分類的準(zhǔn)確性有比較明顯的改善[15]。本文綜合利用光譜特征、紋理特征、纓帽變換特征和地形特征進(jìn)行果園的遙感提取。
(1)光譜特征。
本文的光譜特征主要使用了一些多光譜波段和一些光譜指數(shù)[16]來表示的,光譜指數(shù)發(fā)展到今天有很多,本文使用了一些方便區(qū)分園地的光譜指數(shù),分別是歸一化植被指數(shù)(NDVI)、歸一化濕度指數(shù)(NDMI)、調(diào)整土壤亮度的植被指數(shù)(SAVI)、比值植被指數(shù)(RVI)和差值植被指數(shù)(DVI)。計(jì)算公式如表2所示。
表2 光譜指數(shù)公式
其中L表示的是土壤調(diào)整系數(shù),當(dāng)L=0時(shí),SAVI=NDVI,在研究中,L=0.5,植覆蓋度處于中等水平。
(2)紋理特征。
本文使用的紋理特征主要是通過灰度共生矩陣(GLCM)[17]計(jì)算得到的,分別是二階矩、對(duì)比度、相關(guān)性、方差和熵,計(jì)算公式如表3所示。
表3 紋理特征和公式
(3)纓帽變換特征。
纓帽變換是根據(jù)固定的變換矩陣將原始影像投影綜合變換到具有物理意義的亮度(Brightness)、綠度(Greenness)和濕度(Wetness)特征向量的三維特征空間,分別反映了裸土巖石、植被覆蓋度和水分信息。這個(gè)變換的過程達(dá)到了減少特征維數(shù)、增強(qiáng)影像信息的效果。其變換公式如下:
式中,X、Y分別為變換前后的多光譜空間的像元矢量;C為變換矩陣;b表示的是避免出現(xiàn)負(fù)值所添加的常數(shù)。Landsat 8 OLI影像下纓帽變換矩陣系數(shù)如表4所示[18]。
表4 Landsat 8 OLI影像下纓帽變換矩陣系數(shù)
(4)地形特征。
地形特征包括基于SRTM的數(shù)字化高程模型(DEM)及其衍生產(chǎn)品(坡度、坡向、陰影)[19],引入地形特征作為限定條件,增加部分限定條件以提升精度。
隨機(jī)森林分類算法是一種包含多個(gè)決策樹(CART)的機(jī)器學(xué)習(xí)算法,已被大量應(yīng)用在許多領(lǐng)域,例如土地利用變化圖等,這種分類方法在分類特征比較多的情況下被認(rèn)為具有比較好的分類效果[20-21]。隨機(jī)森林主要包括2個(gè)階段,分別是訓(xùn)練和分類。在訓(xùn)練這個(gè)階段,首先對(duì)輸入的數(shù)據(jù)通過每棵樹自舉重的方法對(duì)采集樣本進(jìn)行采樣,隨機(jī)重復(fù)抽取N個(gè)新的樣本集合來替代原來的訓(xùn)練樣本集合,然后通過這個(gè)樣本集合生成幾個(gè)獨(dú)立的CART決策樹。在分類這個(gè)階段,通過算術(shù)平均計(jì)算所有樹產(chǎn)生各種類別的概率,由每棵樹的分類結(jié)果通過投票得到[22-23]。最后通過GEE這個(gè)二次開發(fā)平臺(tái),使用隨機(jī)森林分類算法對(duì)2019年目標(biāo)年份的所有輸入的特征集合來進(jìn)行分類得到分類結(jié)果。
在分類精度檢驗(yàn)與評(píng)估中,遙感分類結(jié)果需要使用參數(shù)指標(biāo)來片判別分類結(jié)果與實(shí)際土地類型的差異程度。把混淆矩陣(也稱誤差矩陣)作為評(píng)價(jià)分類的指標(biāo)[24]來展示結(jié)果的好壞,包括總體分類精度(OA)、Kap-pa系數(shù)(KC)、錯(cuò)分誤差(CE)、漏分誤差(OE)、用戶精度(UA)和生產(chǎn)者精度(PA)等,遙感影像分類的準(zhǔn)確性就是用這些評(píng)價(jià)指標(biāo)從不同的方面來表現(xiàn)出來的[25-26]。本文運(yùn)用了混淆矩陣中總體分類精度與Kappa系數(shù)來衡量試驗(yàn)區(qū)分類結(jié)果質(zhì)量。用驗(yàn)證樣本來計(jì)算目標(biāo)年份分類結(jié)果的OA、KC、UA、PA,用這些結(jié)果的好壞來評(píng)估果園遙感提取的準(zhǔn)確性。評(píng)價(jià)指標(biāo)如表5所示。
表5 評(píng)價(jià)指標(biāo)
用相同的樣本集合進(jìn)行SVM和CART的分類來評(píng)估RF算法的分類性能的好壞。3種算法的分類結(jié)果如表6所示。
目標(biāo)年份的果園提取結(jié)果利用分類精度評(píng)價(jià)參數(shù)來評(píng)估。由表6可知,RF分類的OA、Kappa系數(shù)、UA和PA高于相同特征下的SVM和CART分類結(jié)果,與CART分類相比OA、KAPPA系數(shù)、UA和PA分別提升2%、3%、7%和6%,與SVM分類相比OA、Kappa系數(shù)、UA和PA分別提升6%、8%、11%和15%,表明RF提取果園的效果和穩(wěn)定性比較好。
表6 分類結(jié)果
圖3表示的是通過不同的分類算法獲得的昭陽區(qū)的土地利用分類圖。可以明顯的看出,SVM分類結(jié)果中果園和耕地草地之間的錯(cuò)分現(xiàn)象較為嚴(yán)重,CART分類結(jié)果中果園分布完整性較好,與其他地物類型的混分狀況有較大改善。由圖3可以看出,CART分類與RF分類結(jié)果相對(duì)來說比較相似,但是果園和耕地之間錯(cuò)分漏分的現(xiàn)象有所增加。綜合三種分類結(jié)果表明,采用RF分類算法提取的果園與其他兩種分類方案相比具有更好的連續(xù)性,影像的整體分類效果在果園的提取上有明顯的提高,這與表6中的定量分析相符。經(jīng)統(tǒng)計(jì),基于RF分類算法提取的果園面積為318.9hm2。2019年果園分布圖顯示,昭陽區(qū)果園主要集中分布與灑漁、永豐、舊圃、北閘、小龍洞等鎮(zhèn)。
經(jīng)統(tǒng)計(jì),基于隨機(jī)森林分類算法提取的果園面積為318.9hm2,占昭陽區(qū)總面積的14.7%。2019年果園分布圖(如圖4所示)表明,昭陽區(qū)果園主要集中分布于灑漁、永豐、舊圃、北閘、小龍洞等鎮(zhèn)。
本文通過GEE平臺(tái),選用覆蓋昭陽區(qū)的2019年共28個(gè)時(shí)相的Landsat 8 OLI遙感衛(wèi)星影像并完成數(shù)據(jù)的預(yù)處理,構(gòu)建包括光譜、紋理、地形、纓帽特征在內(nèi)的分類特征集,使用隨機(jī)森林分類算法,對(duì)昭陽區(qū)進(jìn)行園地信息提取,最終得到了2019年昭通區(qū)果園空間分布情況,對(duì)研究區(qū)園地栽種面積進(jìn)行估算,提取精度較高。研究得到的主要結(jié)論如下:
圖3 三種分類方法結(jié)果圖
圖4 果園分布圖
(1)通過比較RF、CART和SVM這三種分類器的分類性能,結(jié)果表明,在相同分類特征下,RF算法的分類結(jié)果最好,OA和Kappa系數(shù)比其他兩種分類器要高,與CART分類相比OA提高了2%,與SVM分類相比OA提高了6%。
(2)根據(jù)RF分類方法提取的園地結(jié)果,制作了昭陽區(qū)的園地分布圖,結(jié)果顯示,昭陽區(qū)園地總面積為318.9 hm2,占昭陽區(qū)總面積的14.7%,RF分類的OA達(dá)到96%,Kappa系數(shù)達(dá)到0.95,分類效果相對(duì)其他兩種分類器來說比較好。
(3)在昭陽區(qū)各鎮(zhèn)均分布有園地,其中,灑漁鎮(zhèn)園地分布最多,果業(yè)為該鎮(zhèn)農(nóng)業(yè)產(chǎn)業(yè)中的主導(dǎo)產(chǎn)業(yè)。
但是,基于像元的分類將無法避免導(dǎo)致“椒鹽現(xiàn)象”的發(fā)生,如何確定最佳的影像分割閾值,如何更有效地選取訓(xùn)練區(qū)域樣本,以及如何更準(zhǔn)確地選擇分類指標(biāo)與規(guī)則,都需要在后面繼續(xù)積極探索。