萬杰 楊勇 韓春峰 王訓宇
摘 要:該文章以云南省昆明市西山區(qū)為研究區(qū)域,利用WordView-2的4波段影像數(shù)據(jù)源,通過學習掌握ENVI軟件中的決策樹分類工具,以及利用不同地類的波譜信息的特征差異,分析了影像的各個地類的光譜特征,從中提取了4波段影像的NDVI(歸一化植被指數(shù)),以此確定了不同地類之間的波段均值閾,根據(jù)不同地類在不同波段以及NDVI上的變化建立對應的決策樹模型,最終得到其分類結果。本文最后采用已有的樣本感興趣區(qū)數(shù)據(jù)對其決策樹分類結果進行了精度評價,并且評價分析了其結果精度在遙感數(shù)據(jù)中的作用。
關鍵詞:決策樹 ENVI提取信息 WV-2
中圖分類號:S127 文獻標識碼:A 文章編號:1674-098X(2015)03(c)-0047-04
遙感影像信息提取是影像分析的一項重要內容。信息提取的方法由傳統(tǒng)的人工解譯,監(jiān)督分類,非監(jiān)督分類到后期的基于專家知識的決策樹分類。研究區(qū)域的不同,選擇研究方法也有所改變,尤其對于西南區(qū)域的丘陵地帶或多山地區(qū)采用傳統(tǒng)的方法不能很好的提取地類信息,因此,僅靠傳統(tǒng)的光譜特性提取地物,就容易造成地類提取的錯分或者漏分,分類結果不能滿足,后期的應用達不到精度需求[1]。為了實現(xiàn)自動、高效的影像分類方法,決策樹分類算法成為信息提取的關鍵技術之一,決策樹分類方法具有以下的優(yōu)點:(1)速度快:計算量相對較小,且容易轉化成分類規(guī)則;(2)準確性高:挖掘出的分類規(guī)則準確性高,便于理解;(3)方法操作簡單,準確度高,已在遙感圖像特征提取和圖像分類中得到廣泛應用[6-7]。
1 研究區(qū)概況與研究資料
1.1 研究區(qū)概況
西山區(qū)位于昆明市區(qū)西部,地處東經102°21′~102°45′,北緯24°41′~25°26′。東西寬36.8千米,南北長72千米,形如靈芝狀??偯娣e1058平方千米[2] ,其中山區(qū)、半山區(qū)面積占92%,壩區(qū)面積占8%。
西山區(qū)地處滇池盆地西北邊沿,地勢西北高,東南低,西北、北部地形起伏較大,靠昆明主城區(qū)部分為壩區(qū),其余為山區(qū)、半山區(qū)。最高海拔2622米(風擺山),最低海拔1731米[3] 。部分西山區(qū)地理位置如圖1所示。
1.2 數(shù)據(jù)源獲取
本研究采用的數(shù)據(jù)為云南省昆明市西山區(qū)的數(shù)據(jù),根據(jù)不同中心波長波段的組合方案,本研究采用WV-2數(shù)據(jù)的4,3,2波段分別賦予紅、綠、藍,獲取近似自然的假彩色合成圖像(如圖2),方便后面的目視解譯以及結果查看。
2 決策樹分類研究
ENVIDecision Tree分類方法是一個多級分類器,它的基礎是一系列的二叉決策樹。每一個決策樹依據(jù)一個表達式將圖像中的像元分為兩類,每一個新生成的類別又可以根據(jù)其他的表達式繼續(xù)向下分為兩類??梢愿鶕?jù)需求定義決策樹的節(jié)點,節(jié)點的個數(shù)是不受限制的。用戶可以使用來自不同來源或文件的數(shù)據(jù)共同生成一個決策樹分類器,也可以交互式編輯和“剪除”決策樹,保存后的決策樹可以用于其他數(shù)據(jù)。
ENVI的決策樹分類器有如下特征[4]:
決策樹的建立采用圖形拖放工具。
在單個決策樹中可以使用具有不同投影和不同像元尺寸的文件,使用過程中將動態(tài)對他們進行重新投影和重采樣。
可以動態(tài)計算特定的變量值(如NDVI、Aspect等),而不需要單獨準備,并將他們應用在表達式中。
基于知識的決策樹分類是基于遙感影像數(shù)據(jù)及其他空間數(shù)據(jù),通過專家經驗總結、簡單的數(shù)學統(tǒng)計和歸納方法等,獲得分類規(guī)則并進行遙感分類。分類規(guī)則易于理解,分類過程也符合人的認知過程,最大的特點是利用多源數(shù)據(jù)。
專家知識決策樹分類的步驟大體上可分為四步:知識(規(guī)則)定義、規(guī)則輸入、決策樹運行和分類后處理。難點是規(guī)則的獲取,可以來自經驗總結,如坡度小于20度是緩坡等;也可以通過統(tǒng)計的方法從樣本中獲取規(guī)則,如C4.5算法、CART算法、S-PLUS算法等。
2.1 分類預處理
根據(jù)人工目視解譯的標準規(guī)范《中華人民共和國土地利用現(xiàn)狀分類國家標準》,根據(jù)實驗區(qū)的特點將其土地覆蓋信息分為:植被,人工建筑棚,建筑用地,水體,未利用地。
由于每一種地物之間都可能存在有同物異譜,同譜異物的特性,在進行地類樣本選擇以前,需要通過測定各個地類的光譜值進行各個地類的最值,均值和方差值統(tǒng)計,綜合運用閾值的方法,將不同的地物提取出來。
2.2 規(guī)則建立
2.2.1植被提取以及人工建筑棚提取
由于植被在近紅外波段的反射率最強,在紅光波段的吸收率最強,這兩個波段不僅是植物光譜、光合作用中的最重要的波段,而且它們對同一生物物理現(xiàn)象的光譜響應截然相反,形成的明顯反差,這種反差隨著植被覆蓋度的變化而變化,因此,可對它們用比值,差分等多種組合來增強現(xiàn)實植被或者揭示隱含的植被信息[5]。
提取的植被信息與人工建筑棚之間存在一定的聯(lián)系,通過一定的NDVI閾值設定可以看到,提取的植被信息中有被錯分的地物,主要是人造工棚以及屋頂顏色鮮艷的建筑物,通過ENVI下的統(tǒng)計分析可以看出,在藍色波段可以發(fā)現(xiàn)綠地區(qū)域的最大值與非綠地對應的最小值基本接近,可以通過設置此閾值區(qū)分植被與人間建筑棚。
2.2.2 未利用地以及建筑用地提取
未利用地域建筑用地有很大的相似性,但又有很大的區(qū)別,可以通過二者地物在綠波段以及NDVI的差值變化來進行區(qū)分。具體的區(qū)分閾值通過ENVI下的樣本選擇統(tǒng)計分析進行劃定。
2.2.3 水體信息提取
水體信息在近紅外波段以后出現(xiàn)強吸收階段,反射率幾乎為零,可以根據(jù)此特定從NDVI值的閾值設定來區(qū)分水體與非水體信息。
2.3 決策樹生成
2.3.1 決策樹生成
生成的決策樹見圖4所示。
2.3.2 ENVI下執(zhí)行決策樹規(guī)則
第一步:規(guī)則獲取
根據(jù)上述三步對于不同地類的需求,ENVI下構建的決策樹規(guī)則描述如下:
Class1(植被):NDVI>0.3,
Class2(人工建筑棚):0.3Class3(未利用地):0.03