嘎力巴 臧淑英 李苗 吳長山
摘要:本研究以哈爾濱市為研究區(qū),采用Landsat-8多光譜影像為數(shù)據(jù)源,計(jì)算出水體指數(shù)、植被指數(shù)、建筑指數(shù)和土壤指數(shù)等共20個(gè)地物光譜指數(shù);基于指數(shù)的決策樹分類方法提取土地覆被類型,并對分類結(jié)果進(jìn)行精度驗(yàn)證,對比分析不同指數(shù)對分類精度的影響。經(jīng)過精度對比、篩選五組數(shù)據(jù)作為變量用決策樹方法進(jìn)行分類,并與于單純地物光譜的(普通)決策樹分類結(jié)果和最大似然法相比較。結(jié)果顯示:五組基于指數(shù)的決策樹分類結(jié)果都比普通決策樹分類和傳統(tǒng)的最大似然法分類精度高,分類精度最高的一組與以上兩種分類結(jié)果相比,總精度分別提高了2.59%和9.55%,Kappa系數(shù)分別提高了0.08和0.15。本研究呈現(xiàn)了基于指數(shù)的決策樹分類方法在土地利用信息提取中的優(yōu)勢,為更好協(xié)調(diào)哈爾濱市土地利用與城市擴(kuò)展提供研究依據(jù)。
關(guān)鍵詞:決策樹分類;指數(shù);信息提取;土地利用
中圖分類號:X144 文獻(xiàn)標(biāo)識碼:A 文章編號:2095-672X(2016)05-0043-06
DOI:10.16647/j.cnki.cn15-1369/X.2016.05.0010
Decision Tree classification of remote sensing images based on index
Galiba1,2, Zang Shuying2, Li Miao1,2, Wu Changshan1,2
(1.School of Geographical Science,Harbin normal university,Heilongjiang 150025;
2.Key Laboratory of remote sensing monitoring of geographic environment,College of Heilongjiang Province, Harbin 150025)
Abstract:In order to study the advantage of decision tree based on index in land use information extracted, taking Harbin as a resample,there are 20 spectral indexes was calculated,including water index,vegetation,construction and soil type index and so on,using Landsat-8 multispectral images. According to the validation sample verifies the accuracy of the result of the classification,and then comparison and analysis the influence of different index on classification accuracy.Based on this,the higher precision index was classified into 5 groups to extract the area land use type,the classification result compared with decision tree classification based on spectral and maximum likelihood method.The result indicates that five groups based on the index of decision tree classification precision were better than the decision tree classification based on spectral and the maximum likelihood classification,one group was highest among five groups,which total precision improved by 2.59% and 9.55%,the Kappa coefficient increased 0.08 and 0.15,respectively.This paper presents the advantage of the decision tree based on index in land use information extraction,which provide basic data for better coordination of Harbin city of land use and urban expansion.
Key words:Decision tree classification;Indexes;Information extraction;Land use
引言
社會和經(jīng)濟(jì)的快速發(fā)展加劇了城市擴(kuò)展與土地資源的矛盾。因此,準(zhǔn)確提取城市土地覆被類型是研究城市擴(kuò)張的基礎(chǔ)。遙感影像為土地信息提取提供了有利的數(shù)據(jù)支持?;谶b感技術(shù)最早并且研究最多的一項(xiàng)基礎(chǔ)性工作是土地利用現(xiàn)狀調(diào)查,為更好的研究土地分布狀況及數(shù)量提供基礎(chǔ)數(shù)據(jù)[1]。遙感影像分類方法從最初的目視判讀到現(xiàn)在的計(jì)算機(jī)自動(dòng)分類,分類精度與速度不斷的在提高。由于判讀完全是人工操作,很容易受到工作人員的主觀隨意性的影響,大規(guī)模的、需要快速獲取分類結(jié)果的信息提取不適合使用此方法,且工作效率低。而計(jì)算機(jī)自動(dòng)分類對遙感圖像地物屬性的分類和識別是模擬了人類的識別能力來分的計(jì)算機(jī)技術(shù) [2]。但是傳統(tǒng)的分類方法只基于光譜特征差異識別地物,分類結(jié)果因“同物異譜”和“同譜異物”,易出現(xiàn)較多的誤分、漏分情況,從而影響分類精度。隨著遙感技術(shù)的發(fā)展,80年代以來新的方法和理論不斷的被引進(jìn)到遙感技術(shù)當(dāng)中[3]。其中決策樹是常用的遙感技術(shù)之一。決策樹有運(yùn)算效率高、分類速度快、分類結(jié)果直觀且清晰等優(yōu)點(diǎn),與傳統(tǒng)的分類方法相比,決策樹彈性和魯棒性更好,能有效提高分類精度[4,5,6]。近些年,決策樹分類的研究成果較多:McCauley 等[7]利用決策樹分類法對美國Montgomery的土地利用進(jìn)行分類制圖,結(jié)果表明:決策樹分類法在提取土地利用方面具有很大的潛力。Muchoney等[8]人基于MODIS數(shù)據(jù),利用決策樹、神經(jīng)網(wǎng)絡(luò)、最大似然法對美國中部進(jìn)行土地覆蓋分類,結(jié)果顯示決策樹分類精度最高。趙萍等[9]以南方地區(qū)SPOT影像為數(shù)據(jù)源,用決策樹方法提取居民地,與傳統(tǒng)監(jiān)督分類方法相比,用戶精度、生產(chǎn)精度和Kappa系數(shù)都有很大的提高。裴歡[10]等以吐魯番SPOT-5 1B級數(shù)據(jù)為數(shù)據(jù)源,利用多地表特征參數(shù)的決策樹分類法,總精度達(dá)到87.9%,與傳統(tǒng)分類方法進(jìn)行對比,分類精度明顯提高。以上研究大多基于光譜特征差異識別地物,未考慮地物指數(shù)對提高分類精度的作用。何祺勝[11]等基于渭干河-庫車河三角洲的TM影像,結(jié)合歸一化植被指數(shù)(Normalized Differential Vegetation Index ,NDVI)、改進(jìn)歸一化差異水體指數(shù)(Modified Normalized Difference Water Index , MNDWI )、K-L變換前三主成分特征,使用決策樹分類方法提取鹽漬地信息,總體精度達(dá)到94%。
近年來,使用決策樹獲取城市土地利用的方法已經(jīng)成熟,但很少有研究將各類地物光譜指數(shù)應(yīng)用到分類器中,并比較他們的優(yōu)缺點(diǎn)。本研究以哈爾濱市為研究區(qū),分析水體指數(shù)、植被指數(shù)、建筑指數(shù)和土壤指數(shù)對決策樹分類精度的影響。以總精度、耕地用戶精度、居民地用戶精度為指標(biāo);在各類指數(shù)中篩選出三類指標(biāo)最高的三個(gè)指數(shù),分別組成三組特征變量;在以各類指數(shù)中比較常用的指數(shù)組成一組特征變量以及全部指數(shù)共五組特征變量;并對比分類精度,挑選出的最佳分類變量是:各類指數(shù)中總精度最高的特征變量組,水體指數(shù)中的改進(jìn)歸一化水體指數(shù)(MNDWI)、 植被指數(shù)中的修改土壤調(diào)整植被指數(shù)(Modified Soil Adjustment Vegetation Index ,MSAVI) 、建筑指數(shù)中的改進(jìn)歸一化裸露指數(shù)(Modified Normalized Difference Barren Index ,MNDBI)和土壤指數(shù)中的裸土指數(shù)(Bare Soil Index ,BSI)組成。而且基于指數(shù)的決策樹分類方法成功的提高了分類精度,為城市土地合理利用、有效規(guī)劃和可持續(xù)發(fā)展提供參考數(shù)據(jù)。
1 研究區(qū)概況與數(shù)據(jù)
1.1 研究區(qū)概況
哈爾濱市是黑龍江省省會,也是黑龍江省政治、經(jīng)濟(jì)、科技中心。它位于中國東北的北部,松嫩平原東部,松花江右岸,地域范圍為125°42′~130°10′E、44°04′~46°40′N之間,總面積為5.31萬km2。哈爾濱屬中溫帶大陸性季風(fēng),四季分明,冬季漫長寒冷,夏季短暫涼爽,年平均氣溫3.4℃,年平均無霜期130天,年均降水量569 mm,降水主要在夏季 [12,13]。松花江干流由西向東貫穿哈爾濱市中部,水源充足,土壤類型以黑土為主,地勢不高,為農(nóng)業(yè)生產(chǎn)提供優(yōu)良的條件。因此耕地和居民地成了哈爾濱主要土地利用/土地覆蓋類型,哈爾濱土地利用/土地覆蓋類型還有水田和河流以及少量的裸地、草地和林地等。
本研究選取哈爾濱市中心城區(qū)作為研究區(qū),包括南崗區(qū),道里區(qū),道外區(qū),香坊區(qū),平房區(qū),松北區(qū)和呼蘭區(qū),如圖1所示。
1.2 數(shù)據(jù)源及預(yù)處理
本研究以Landsat-8遙感影像為數(shù)據(jù)源,軌道號為118/28。為了不影響提取土地利用信息時(shí)的精確度,在選擇影像時(shí)避免云霧,研究區(qū)范圍內(nèi)云量為零;影像數(shù)據(jù)質(zhì)量良好。原始影像在遙感軟件ENVI5.1下經(jīng)過波段合成,在此基礎(chǔ)上行進(jìn)行幾何糾正、輻射定標(biāo)和裁剪等預(yù)處理獲得覆蓋研究區(qū)的OLI影像數(shù)據(jù)。
2 研究方法
2.1 決策樹分類方法
決策樹分類方法是目前比較常用的提取各種地類信息的分類方法之一,也是提取土地類型信息的常見的一種方法。決策樹是一種分層處理的結(jié)構(gòu),它的基本思想是以一些判斷條件來對原始數(shù)據(jù)逐步細(xì)化的過程[14]。決策樹有一個(gè)根節(jié)點(diǎn),還有一些中間節(jié)點(diǎn)和葉子節(jié)點(diǎn)構(gòu)成的樹狀數(shù)據(jù)。決策樹的每一個(gè)節(jié)點(diǎn)只有一個(gè)父節(jié)點(diǎn)和兩個(gè)或多個(gè)后代節(jié)點(diǎn)。決策樹每個(gè)分支點(diǎn)是一個(gè)決策判斷條件,每個(gè)分支點(diǎn)下兩個(gè)葉子節(jié)點(diǎn),代表著不滿意和滿意的條件。該方法不需要任何先驗(yàn)統(tǒng)計(jì)假設(shè)。因此很多遙感影像提取所需要的信息當(dāng)中決策樹分類法被廣泛的使用。決策樹分類方法跟傳統(tǒng)的最大似然法方法比起來,準(zhǔn)確度更高,計(jì)算量也不大,在學(xué)習(xí)過程中容易被使用者了解等優(yōu)點(diǎn)。
2.2 光譜指數(shù)
指數(shù)模型是根據(jù)多光譜影像中各類地物對不同波段的不同反映,在波段間突出地物信息的算法。它能很好地解釋各類土地覆蓋類型的特點(diǎn),計(jì)算容易實(shí)現(xiàn),方便實(shí)用。以下為本研究共選擇的20個(gè)光譜指數(shù),分別是水體類指數(shù):歸一化水體指數(shù)(Normalized Difference Water Index,NDWI)和改進(jìn)的歸一化水體指數(shù)(MNDWI);植被類指數(shù):歸一化植被指數(shù)(NDVI)、土壤調(diào)整植被指數(shù)(Soil-Adjusted Vegetation Index,SAVI)、修改土壤調(diào)整植被指數(shù)(Modified Soil Adjustment Vegetation Index,MSAVI)、增強(qiáng)植被指數(shù)(Enhanced Vegetation Index,EVI)、差值植被指數(shù)(Difference Vegetation Index,DVI)、比值植被指數(shù)(Ratio Vegetation Index,RVI)和綠度植被指數(shù)(GVI);建筑類指數(shù):歸一化建筑指數(shù)(Normalized Difference Barren Index,NDBI)、改進(jìn)歸一化裸露指數(shù)(Modified Normalized Difference Barren Index,MNDBI)、歸一化三波段指數(shù)(Normalized Difference Three Bands Index NDTBI)、比值居民地指數(shù)(Ratio Resident-area Index,RRI)、比值不透水面指數(shù)(Ratio Impervious Surface Index,RISI)和生物物理組成指數(shù)(Biophysical Composition Index,BCI);土壤類指數(shù):裸土指數(shù)(Bare Soil Index,BSI)、增強(qiáng)型裸土指數(shù)(Enhanced Bare Soil Index,EBSI)、歸一化差值裸土與建筑用地指數(shù)(Normalized Difference Bareness and Built - Up Index,NDBBI)、歸一化土壤指數(shù)(Normalized Difference Soil Index NDSI)和比值歸一化土壤指數(shù)(Ratio Normalized Difference Soil Index RNDSI)。
2.3 訓(xùn)練樣本與驗(yàn)證樣本的選取
為了減少人為因素對分類結(jié)果的影響。本研究在研究區(qū)中選了500個(gè)隨機(jī)點(diǎn)隨著隨機(jī)點(diǎn)使用ENVI的ROI采樣工具選擇訓(xùn)練樣本。將70%的樣本作為訓(xùn)練樣本,30%作為驗(yàn)證樣本。
3 結(jié)果分析
3.1 精度評價(jià)
精度評價(jià)是對分類結(jié)果準(zhǔn)確性的評估。本研究利用混淆矩陣以分類總體精度、Kappa系數(shù)和用戶精度為指標(biāo)進(jìn)行精度評價(jià)。當(dāng)?shù)匚锕庾V分別與各類水體指數(shù)、植被指數(shù)、建筑指數(shù)和土壤指數(shù)結(jié)合做變量的決策樹分類的結(jié)果:不同遙感指數(shù)對決策樹分類精度的影響不同,不是每個(gè)遙感指數(shù)都能夠提高分類精度。如表1所示。
3.2 指數(shù)的選取
根據(jù)決策樹能融合不同來源和特征的數(shù)據(jù),指數(shù)能突出各類土地覆蓋類型的優(yōu)點(diǎn),使用基于遙感指數(shù)的決策樹分類方法提取研究區(qū)土地類型信息。本研究依據(jù)不同指數(shù)對決策樹分類精度影響的不同,組成以下五組多變量決策樹數(shù)據(jù),提取哈爾濱市土地類型信息:
第一組:選擇各類指數(shù)中總精度最高的指數(shù),分別是水體指數(shù)中的NDWI和MNDWI的精度一樣高、植被指數(shù)中的DVI、建筑指數(shù)中的BCI和土壤指數(shù)中的EBSI與地物光譜結(jié)合進(jìn)行決策樹分類。由于水體指數(shù)中的兩個(gè)遙感指數(shù)精度一樣高。這一組做了三組變量。
第二組:各類指數(shù)中選出耕地用戶精度最高的作為一組,水體指數(shù)中的NDWI、植被指數(shù)中的RVI、建筑指數(shù)中的NDBI和土壤指數(shù)中的EBSI與地物光譜結(jié)合進(jìn)行決策樹分類。
第三組:各類指數(shù)當(dāng)中選出居民地精度最高的作為一組,水體指數(shù)中的MNDWI、植被指數(shù)中的MSAVI、建筑指數(shù)中的RISI和土壤指數(shù)中的EBSI與地物光譜結(jié)合進(jìn)行決策樹分類。
第四組:選擇各類指數(shù)中最常用的指數(shù),水體指數(shù)中的MNDWI、植被指數(shù)中的NDVI、土壤指數(shù)中的NDSI和建筑指數(shù)中的NDBI與地物光譜結(jié)合進(jìn)行決策樹分類。
第五組:文中提到的20個(gè)指數(shù)同時(shí)與地物光譜結(jié)合進(jìn)行決策樹分類。
在基于多變量的決策樹分類中不同指數(shù)的組合對分類精度的影響不同(如表2所示)?;谥笖?shù)的決策樹與于單純地物光譜的決策樹分類結(jié)果和最大似然法的分類結(jié)果對比(如圖2所示)。
4 結(jié)束語
本研究以哈爾濱市Landsat-8影像為研究對象,計(jì)算出研究區(qū)水體指數(shù),植被指數(shù),建筑指數(shù),土壤指數(shù)四類指數(shù)共20個(gè)指數(shù),并與地物光譜結(jié)合進(jìn)行決策樹分類。對比分析各類指數(shù)對決策樹分類中的影響,組成五組特征變量。五組數(shù)據(jù)中分類準(zhǔn)確度最高的一組是基于MNDWI、MSAVI、RISI和EBSI 的決策樹分類結(jié)果:總精度為85.68%,Kappa系數(shù)為0.80。與傳統(tǒng)最大似然分類方法總精度76.13%和Kappa指數(shù)0.65相比,總精度提高了9.55%,Kappa系數(shù)提高了0.15;與基于單純地物光譜決策樹分類的總精度83.09%和Kappa系數(shù)0.72相比,總精度提高了 2.59%,Kappa系數(shù)提高了0.08。
遙感土地類型信息提取中,基于指數(shù)的決策樹分類方法與普通決策樹和最大似然法相比分類精度都有所提高,并且不同的組合分類結(jié)果不同。在此方法中,不是光譜指數(shù)越多越好,也不是常用光譜指數(shù)組合的分類準(zhǔn)確度最高,而是要選擇指數(shù)最為關(guān)鍵。該方法結(jié)合指數(shù)模型和決策樹,并保留了兩種方法的優(yōu)點(diǎn),分類速度快、魯棒性強(qiáng),而且提高了分類準(zhǔn)確度。
但本研究沒有考慮到DEM數(shù)據(jù)、地表溫度數(shù)據(jù),忽略了地表高程,這些因子對分類精度都有一定的影響;只選取了較小研究范圍,在今后研究中可以嘗試將此方法用到更大研究區(qū)域范圍的土地利用信息提取。
參考文獻(xiàn)
[1]齊紅超,祁元,徐瑱.基于C5.0決策樹算法的西北干旱區(qū)土地覆蓋分類研究—以甘肅省武威市為例[J].遙感技術(shù)與應(yīng)用,2009,24(5):648-653.
[2]李爽,丁圣元,許叔明.遙感影像分類方法比較研究[J].河南大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,32(2):70-73.
[3]杜鳳蘭,慶久,夏學(xué)齊.遙感圖像分類方法評析與展望[J].遙感技術(shù)與應(yīng)用,2004,9(6):521-525.
[4]POWELL S L,COHEN W B,YANG Z,et al. Quantification of impervious surface in the Snohomish Water Resources Inventory Area of Western Washington from 1972-2006[J].Remote Sensing of Environment,2008,112(4):1895-1 908.
[5]LU D,WENG Q.Spectral mixture analysis of the urban landscape in Indianapolis with Landsat ETM+imagery[J].Photogrammetric Engineering and Remote Sensing,2004,70(9):1 053-1 062
[6]李爽,張二勛.基于決策樹的遙感影像分類方法研究[J].地域研究與開發(fā),2003,22(1):17-21.
[7]MCCAULEY S,G OETZ SJ.Mapping residential density patterns using multi-temporal Landsat data and a decision-tree classifier[J].International Journal of Remote Sensing,2004,25(6):1077-1094.
[8]Muchoney D,Borak J,Chi,H,et al.Application of the MODIS global supervised classification model to vegetation and land cover mapping of Central America[J].International Journal of Remote Sensing,2000,21(6):1115-1138.
[9]趙萍,馮學(xué)智,林廣發(fā).SPOT衛(wèi)星影像居民地信息自動(dòng)提取的決策樹方法研究[J].遙感學(xué)報(bào),2003,7(4):309-315.
[10]裴歡,房世峰.基于地物光譜特征和空間特征的干旱區(qū)綠洲土地分類[J].地理科學(xué),2013,33(11):1395-1399.
[11]何祺勝,塔西甫拉提·特依拜,丁建麗.基于決策樹方法的干旱區(qū)鹽漬地信息提取—以渭干河-庫車河三角洲綠洲為例[J].資源科學(xué),2006,28(6):134-140.
[12]宋戈,高楠.基于DEA方法的城市土地利用經(jīng)濟(jì)效益分析—以哈爾濱市為例[J].地理科學(xué),2008,28(2):185-188.
[13]黃輝玲,吳次芳.基于可拓學(xué)的生態(tài)市建設(shè)評價(jià)—以哈爾濱市為例[J].地理科學(xué),2009,29(5):651-657.
[14]潘琛等.決策樹分類法及其在遙感圖像處理中的應(yīng)用[J].測繪科學(xué),2008,33(1):208-211.