張靜懿,王金亮,2,胡文英,2*,張 碩,王 帆
(1.云南師范大學(xué) 地理學(xué)部,云南 昆明 650500;2.云南省高校資源與環(huán)境遙感重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500;3.云南廣廈規(guī)劃建筑設(shè)計(jì)院有限公司,云南 楚雄 675000;4.云南師范大學(xué) 生命與科學(xué)學(xué)院,云南 昆明 650500)
遙感數(shù)據(jù)具有快速、準(zhǔn)確、宏觀、及時(shí)更新等特點(diǎn),應(yīng)用遙感影像可以方便快捷地提取大量地表信息[1]。利用多波段衛(wèi)星遙感影像進(jìn)行土地利用分類是提取土地利用信息的重要方法之一,也是開展土地利用時(shí)空演化、動(dòng)態(tài)變化等研究的基礎(chǔ)。目前流行的監(jiān)督分類、非監(jiān)督分類、神經(jīng)網(wǎng)絡(luò)分類[2]以及模糊分類[3]等都是以地物光譜特征為基礎(chǔ)的分類方法,在分類過(guò)程中會(huì)因“同物異譜、異物同譜”而引發(fā)漏分、錯(cuò)分問(wèn)題[4]。面向?qū)ο蟮臎Q策樹分類方法依據(jù)分割后圖像地物的紋理、光譜和形狀特征進(jìn)行土地利用分類,可以很好地解決上述問(wèn)題,分類效果較好。目前,一些學(xué)者基于遙感影像開展面向?qū)ο蟮牡匚锓诸愐讶〉昧艘欢ǔ尚В鐚O建偉[5]等基于ZY-3號(hào)遙感數(shù)據(jù),采用CART決策樹分類法對(duì)湖北省荊州八嶺山鎮(zhèn)進(jìn)行了土地利用分類;張睎偉[6]等采用決策樹分類法提取了中衛(wèi)市沙坡頭區(qū)的沙地信息;李恒凱[7]等采用模糊分類和CART決策樹分類相結(jié)合的方法提取了東江流域土地利用分類信息?;谶b感影像的土地利用分類研究已應(yīng)用于土地資源管理規(guī)劃、環(huán)境評(píng)估等各個(gè)領(lǐng)域,其研究結(jié)果有利于政府和科研人員了解土地利用分布現(xiàn)狀[8]。基于上述研究,本文采用面向?qū)ο蟮腃ART決策樹分類方法,結(jié)合光譜、形狀和紋理特征對(duì)鹿城鎮(zhèn)進(jìn)行土地利用分類研究,挖掘適宜構(gòu)建CART決策樹開展土地利用分類研究的特征變量;同時(shí)將二級(jí)分類體系與一級(jí)分類體系的分類結(jié)果進(jìn)行比較,探索解決一級(jí)地類中相似地物因光譜、紋理不同而產(chǎn)生地物錯(cuò)分問(wèn)題。
鹿城鎮(zhèn)位于楚雄市東北部,地理范圍為24°30′~25°15′N、100°35′~101°48′E,包含山區(qū)、壩區(qū)和城區(qū),總面積為370 km2,地勢(shì)東南低西北高;氣候溫和濕潤(rùn),年均氣溫為15.7℃,年均降雨量為813.8 mm,平均空氣相對(duì)濕度為68%。鹿城鎮(zhèn)是楚雄市唯一的一類鄉(xiāng)鎮(zhèn),下轄東興、北浦、萬(wàn)家壩等19個(gè)社區(qū),各項(xiàng)經(jīng)濟(jì)指標(biāo)均處于全州前列,其經(jīng)濟(jì)發(fā)展一直以來(lái)都對(duì)楚雄市產(chǎn)生巨大影響。
國(guó)產(chǎn)GF-1號(hào)衛(wèi)星WFV數(shù)據(jù)回訪周期短、幅寬大,適用于大范圍土地利用變化檢測(cè)。本文采用向云南高分中心申請(qǐng)的2013年WFV數(shù)據(jù),云量不超過(guò)1,包含藍(lán)、綠、紅和近紅外4個(gè)波段,分辨率為16 m。輔助數(shù)據(jù)為從地理空間數(shù)據(jù)云獲取的Landsat8 OLI影像、GDEMV2 30 m分辨率的DEM數(shù)據(jù)以及鹿城鎮(zhèn)邊界矢量數(shù)據(jù)。GF-1號(hào)遙感影像的預(yù)處理包括輻射定標(biāo)、大氣校正、正射校正和圖像裁剪等,需從中國(guó)資源衛(wèi)星應(yīng)用中心(http://www.cresda.com/CN/sjfw/zxsj/index.shtml)下載定標(biāo)參數(shù)和WFV波譜響應(yīng)文件輔助輻射定標(biāo)和大氣校正。實(shí)驗(yàn)采用的影像數(shù)據(jù)如表1所示。
表1 影像類型與獲取時(shí)間
本文的研究過(guò)程主要包括多尺度分割、CART決策樹分類和精度驗(yàn)證3個(gè)部分。首先,以2013年GF-1號(hào)數(shù)據(jù)為數(shù)據(jù)源進(jìn)行數(shù)據(jù)預(yù)處理,利用影像的光譜和空間特征尋找最優(yōu)分割尺度,生成圖像對(duì)象[9];再結(jié)合植被指數(shù)、波段均值、紋理和長(zhǎng)寬比等特征,在二級(jí)分類體系下采用面向?qū)ο蟮腃ART決策樹分類方法對(duì)鹿城鎮(zhèn)進(jìn)行土地利用分類研究。技術(shù)路線如圖1所示。
圖1 技術(shù)路線圖
根據(jù)研究區(qū)實(shí)際地表情況,參考GB/T 21010-2007《土地利用現(xiàn)狀分類》的分類系統(tǒng)[8],將鹿城鎮(zhèn)的土地利用類型分為耕地、草地、裸地、林地、建設(shè)用地、水體和道路7個(gè)一級(jí)地類。在eCognition9.1中進(jìn)行土地利用分類時(shí)發(fā)現(xiàn),一級(jí)地類中相似地物因光譜、紋理不同會(huì)產(chǎn)生錯(cuò)分的情況,因此需建立更詳細(xì)的二級(jí)分類體系,并確立目視解譯標(biāo)志(表2)。本文首先按照二級(jí)分類體系進(jìn)行分類,再利用ArcGIS將二級(jí)地類歸并到一級(jí)地類,由此得到鹿城鎮(zhèn)的土地利用分類結(jié)果。為了更好地反映二級(jí)分類體系對(duì)分類精度的影響,本文進(jìn)行了一級(jí)分類體系下的土地利用分類,并比較了其精度。
表2 分類體系與解譯標(biāo)志
多尺度分割是開展面向?qū)ο蠓诸惖幕A(chǔ),利用影像對(duì)象的光譜和形狀特征,基于影像對(duì)象間的最小異質(zhì)性合并相鄰像素,最終把影像劃分為多個(gè)不重疊的對(duì)象。分割效果的好壞將決定地物分離的效果,分割不足與過(guò)度分割都會(huì)導(dǎo)致分類精度下降。因此,分割尺度的選擇對(duì)于獲取高精度的土地利用分類至關(guān)重要。
本文通過(guò)ESP工具[10]尋找最優(yōu)尺度,設(shè)置起始尺度為10、20、40,步長(zhǎng)為1、10、100,結(jié)合局部方差變化率中較明顯的幾個(gè)峰值,尋找最佳形狀因子(形狀因子包括緊致度和平滑度)和光譜因子。經(jīng)反復(fù)試驗(yàn)得到,各波段權(quán)重為1、分割尺度為26、形狀因子為0.3、緊致度為0.2時(shí),分割得到的影像對(duì)象輪廓最貼近實(shí)際地物。
分割得到的影像對(duì)象含有相似的屬性特征[11],通過(guò)構(gòu)建特征空間將屬性相似的地物篩選出來(lái)即可達(dá)到地物分類的目的[12]。本文主要利用3個(gè)方面的特征來(lái)建立地物識(shí)別的特征空間。
1)光譜特征。運(yùn)用多光譜數(shù)據(jù)可提取植被指數(shù),其指數(shù)大小能反映地表植被覆蓋程度的高低,不同地物計(jì)算得到的植被指數(shù)差別也較大。利用eCognition9.1軟件中的波段均值計(jì)算植被指數(shù),可輔助地物進(jìn)行分類,本文采用的植被指數(shù)及其計(jì)算公式見(jiàn)表3。除了植被指數(shù)外,還可運(yùn)用4個(gè)波段均值、Brightnes、Max.diff和Standard Deviation等光譜特征參數(shù)輔助分類,如植被呈墨綠色或淡黃色,水體呈青色,建筑物呈白色、紅色或藍(lán)色;建筑物亮度較高,山坡背陰面亮度較低等,不同地物所含有的光譜特征均有所差別。
表3 植被指數(shù)統(tǒng)計(jì)表
2)形狀特征。形狀指數(shù)的運(yùn)用可快速準(zhǔn)確地識(shí)別出幾何特征差異明顯的地物,如研究區(qū)道路長(zhǎng)寬比較大,運(yùn)用形狀指數(shù)Length/Width可快速識(shí)別道路;在水體分類過(guò)程中,由于山體背陰面和水體的光譜特征極為相似,運(yùn)用光譜特征很難區(qū)分開,而河流和湖泊的形狀特征明顯,塊狀湖泊的長(zhǎng)寬比接近1,條狀河流的長(zhǎng)寬比遠(yuǎn)遠(yuǎn)大于1,因此通過(guò)形狀指數(shù)就可識(shí)別出河流和湖泊。
3)紋理特征。紋理反映了影像灰度級(jí)的空間分布與聯(lián)系,利用紋理特征可將光譜特征相似的地物很好地區(qū)分開。通過(guò)目視解譯可知,耕地形狀規(guī)則,其條帶狀和塊狀紋理較明顯。紋理特征分析方法中灰度共生矩陣提供了圖像灰度相鄰間隔、變化幅度以及關(guān)于方向等的綜合信息[13]。本文采用均值(Mean)、均一性(Homogeneity)、二階矩(Second Moment)、非相似性(Dissimilarity)、標(biāo)準(zhǔn)差(StdDev)、相關(guān)性(Correlation)、對(duì)比度(Contrast)和熵(Entropy)8個(gè)紋理特征輔助分類,可準(zhǔn)確識(shí)別紋理特征明顯的地物。紋理特征參數(shù)及其計(jì)算公式見(jiàn)表4。
表4 紋理特征參數(shù)及其計(jì)算公式
基于面向?qū)ο蟮腃ART決策樹分類可充分利用特征信息進(jìn)行土地利用分類。經(jīng)過(guò)反復(fù)分類嘗試,本文最終確定用來(lái)分類的特征為波段均值(B1-B4)、Brightnes、Max.diff、Standard Deviation、植 被 指 數(shù)(NDVI、RVI、DVI)、形狀指數(shù)Length/Width、紋理特征(Mean、Homogeneity、Second Moment、StdDev)等共計(jì)19個(gè)。
在實(shí)際分類中,不同的分類方法具有不同的適宜性。為了避免GF-1號(hào)影像“同物異譜、異物同譜”現(xiàn)象對(duì)分類精度的影響,本文采用面向?qū)ο蟮腃ART決策樹分類方法。該方法能充分利用分割圖像中包含的光譜、形狀和紋理信息,使分類結(jié)果更接近現(xiàn)實(shí)。CART決策樹具有超強(qiáng)的分析解譯功能,自動(dòng)化程度較高,在每一步分類中,利用“是”或“否”將數(shù)據(jù)分為兩類,通過(guò)多次遞歸分割完成土地利用分類[14]。CART決策樹分類方法以基尼系數(shù)(Gini Index)為閾值分割依據(jù),其定義為:
式中,P(j h)、ni(h)分別為訓(xùn)練樣本集中測(cè)試變量為h時(shí),屬于j類的概率和樣本數(shù);j為類別數(shù);n(h)為訓(xùn)練樣本中測(cè)試變量為h時(shí)的樣本數(shù)[4]。
CART決策樹是一種特殊的監(jiān)督分類方法,分類前需選取學(xué)習(xí)樣本集進(jìn)行決策樹的構(gòu)造并評(píng)估。本文采用eCognition9.1構(gòu)建CART決策樹進(jìn)行分類,實(shí)驗(yàn)簡(jiǎn)單且容易實(shí)現(xiàn)[10]。根據(jù)分割所得的影像對(duì)象,選取訓(xùn)練樣本,測(cè)試變量為植被指數(shù)(NDVI、RVI、DVI)、4個(gè)波段均值、Brightnes、Max.diff、Standard Deviation、8個(gè)紋理特征(Mean、Homogeneity、Second Moment、StdDev等)和形狀指數(shù)長(zhǎng)寬比Length/Width,目標(biāo)變量為河流、水庫(kù)、湖泊、旱地、水田、建設(shè)用地、道路、林地等12個(gè)地類。CART決策樹在eCognition9.1軟件中生成并進(jìn)行分類,部分分類規(guī)則如表5所示,可以看出,分類過(guò)程充分應(yīng)用了光譜、形狀和紋理特征的統(tǒng)計(jì)指標(biāo)。利用分類規(guī)則推理得到的部分CART決策樹如圖2所示。
圖2 部分CART決策樹
表5 CART決策樹部分分類規(guī)則
利用所建CART決策樹對(duì)鹿城鎮(zhèn)進(jìn)行土地利用分類,可以清楚地看到鹿城鎮(zhèn)土地利用類型分為林地、天然草地、人造草地、水田、旱地等14個(gè)二級(jí)地類。在ArcGIS10.4軟件中,根據(jù)數(shù)據(jù)屬性信息,將二級(jí)地類歸并到一級(jí)地類,得到一級(jí)地類的分類結(jié)果如圖3所示。為了比較二級(jí)分類體系對(duì)分類精度的影響,本文基于同樣的分類規(guī)則,按照一級(jí)分類體系直接進(jìn)行CART決策樹分類,得到的分類結(jié)果如圖4所示。
圖3 鹿城鎮(zhèn)二級(jí)分類體系下土地利用分類結(jié)果
圖4 鹿城鎮(zhèn)一級(jí)分類體系下土地利用分類結(jié)果
本文采用隨機(jī)采樣、分類檢驗(yàn)的方法開展精度評(píng)價(jià)。隨機(jī)選取的樣本點(diǎn)需滿足兩方面要求:①樣本點(diǎn)應(yīng)包含所有地類且數(shù)量合理;②選取的樣本點(diǎn)應(yīng)具有普遍性和隨機(jī)性,包含同一土地利用類型下的所有地物特征,不能單純選擇特征突出的地物。本文共采集751個(gè)檢驗(yàn)樣本點(diǎn),其中耕地289個(gè)、林地170個(gè)、草地33個(gè)、建設(shè)用地143個(gè)、水體35個(gè)、道路44個(gè)、裸地37個(gè)。本文依據(jù)所選的樣本點(diǎn)在eCognition9.1軟件中建立混淆矩陣,計(jì)算Kappa系數(shù)和總體精度,對(duì)面向?qū)ο蟮腃ART決策樹分類結(jié)果進(jìn)行精度評(píng)價(jià),并對(duì)一級(jí)分類體系和二級(jí)分類體系的分類結(jié)果進(jìn)行比較。驗(yàn)證結(jié)果如表6所示,可以看出,選取19個(gè)特征變量開展的面向?qū)ο驝ART決策樹分類效果較好,Kappa系數(shù)達(dá)到了86.84%,總體精度達(dá)到了90.22%,其中林地的分類精度最高,其次是建設(shè)用地和耕地;二級(jí)分類系統(tǒng)的應(yīng)用明顯提高了耕地、裸地的分類精度,二級(jí)分類體系下CART決策樹分類的總體精度提高了7.06%,Kappa系數(shù)提高了8.71%。
表6 各分類體系下面向?qū)ο驝ART決策樹分類精度/%
本文基于2013年GF-1號(hào)數(shù)據(jù),采用多尺度分割面向?qū)ο蟮腃ART決策樹分類方法,運(yùn)用二級(jí)分類體系在光譜特征的基礎(chǔ)上融入形狀特征和紋理特征,選取19個(gè)特征變量,將楚雄市鹿城鎮(zhèn)的土地利用類型分為草地、道路、耕地、建設(shè)用地、林地、裸地、水體7類,得到的結(jié)論為:
1)影像對(duì)象是開展面向?qū)ο驝ART決策樹分類研究的基礎(chǔ)。本文經(jīng)過(guò)多次嘗試發(fā)現(xiàn),當(dāng)最優(yōu)分割尺度為26、波段權(quán)重為1、形狀因子為0.3、光譜因子為0.7、緊致度因子為0.2、平滑度因子為0.8時(shí),分割得到的影像對(duì)象輪廓更加貼近實(shí)際地物。
2)本文運(yùn)用多尺度分割下影像對(duì)象所包含的光譜、形狀和紋理信息對(duì)鹿城鎮(zhèn)開展面向?qū)ο蟮腃ART決策樹分類,挖掘出有利于識(shí)別各類地物的19個(gè)特征變量。通過(guò)精度驗(yàn)證可知,該方法所得的土地利用分類效果較好,Kappa系數(shù)為86.84%,總體精度達(dá)到90.22%。從各地類的分類精度來(lái)看,林地的分類效果最好,其次是耕地、裸地和建設(shè)用地。
3)二級(jí)分類體系的構(gòu)建與應(yīng)用有效解決了一級(jí)地類中耕地、裸地等相似地物因光譜、紋理不同而產(chǎn)生的錯(cuò)分問(wèn)題,提高了土地利用分類精度,總體精度提高了7.06%,Kappa系數(shù)提高了8.71%。
基于19個(gè)特征變量開展的面向?qū)ο驝ART決策樹分類效果總體較好,但草地、道路、水體的分類效果不是很理想,易產(chǎn)生錯(cuò)分情況。鹿城鎮(zhèn)的草地占地面積較小,與裸地、耕地的地理位置相近,光譜特征也較相似,受耕地和裸地的影響,其在二級(jí)分類體系下得到的分類精度較低。今后可進(jìn)一步分析造成地物錯(cuò)分的原因,深入探索其他特征變量,以提高草地、道路、水體的分類精度。