高雷亭,阮仁宗,顏梅春,歲秀珍,傅巧妮
(1. 河海大學(xué) 地球科學(xué)與工程學(xué)院,江蘇 南京 210098)
湖泊濕地作為濕地的一個(gè)重要類別,對(duì)全球變化、國民經(jīng)濟(jì)建設(shè)及可持續(xù)發(fā)展有極其重要的作用[1]。近幾年,國內(nèi)外學(xué)者在濕地分類方面做了很多工作。王紅娟等利用兩個(gè)季節(jié)的洞庭湖ETM數(shù)據(jù),并輔以物候特征和地面GIS信息,通過專家分類知識(shí)庫建立決策樹分類方法,分析洞庭湖濕地的影像分類[2];那曉東以三江平原為例,利用TM數(shù)據(jù)探討中國典型淡水沼澤濕地信息的提取方法[3]。李慧以閩江河口濕地為例,基于決策樹方法設(shè)計(jì)了兩期影像的決策樹分類模型,實(shí)現(xiàn)濕地信息的快速自動(dòng)提取[4]。Wright綜合Landsat TM紋理特征和輔助環(huán)境特征,采用決策樹方法提取美國黃石國家公園濕地的空間分布[5]。雖然光譜特征是濕地識(shí)別與分類的重要依據(jù),然而單純利用光譜分類,往往存在“同物異譜”和“異物同譜”問題,分類精度不夠理想。除光譜特征外,遙感圖像擁有的紋理特征給圖像分類提供了一個(gè)新的依據(jù)。本文結(jié)合光譜信息、紋理特征變量和纓帽變換的前3個(gè)指數(shù),構(gòu)建了一個(gè)知識(shí)規(guī)則模型,并將其用于洪澤湖濕地的地物分類提取,顯著提高了分類精度。
洪澤湖是我國五大淡水湖之一,在北緯33°6'~33°40'、東經(jīng) 118°10'~118°52'之間。洪澤湖及其周邊有湖泊、養(yǎng)殖場、河流、沼澤、林地、灘涂等多種濕地生態(tài)系統(tǒng),生物多樣性非常豐富,僅灘地上生長的水生植物就有30余種,主要分布在湖區(qū)的西部,蘆葦比較集中地分布在淮河入湖尾閭的洲灘上。天然的濕地植被為多種珍禽鳥類(如大鴇、東方白鸛、小天鵝、丹頂鶴等)提供了棲息、繁殖、捕食和越冬的理想場所,也為魚類提供了良好的生長和繁殖場所,具有很大的經(jīng)濟(jì)和生態(tài)研究價(jià)值[6]。研究區(qū)主要濕地類型的分類體系如表1所示。
表1 研究區(qū)濕地類型分類體系
本文選用2006-09-09的Landsat5 TM影像。首先利用洪澤湖地形圖對(duì)影像進(jìn)行幾何精校正,使均方誤差控制在0.5像元以內(nèi)。然后,裁剪出東經(jīng)118°12'21"~118°29'40",北緯 33°8'41"~33°24'52"的洪澤湖濕地自然保護(hù)區(qū)為研究區(qū)。
光譜響應(yīng)特征是遙感影像地物識(shí)別最直接的解譯元素。通過對(duì)圖像光譜特征曲線的分析,可以對(duì)不同波段進(jìn)行運(yùn)算和組合,從而得到分類中十分重要的參數(shù)[7]。圖1是對(duì)研究區(qū)采樣統(tǒng)計(jì)得到的各類地物光譜曲線,可以看出挺水植物在近紅外(TM4)波段的光譜亮度值明顯高于其他地物,很容易區(qū)分出來。在TM5波段,沉水植物、浮水植物、敞水區(qū)與其他地物的像元亮度值差異也較大,可以依據(jù)這兩個(gè)波段提取出浮水植物。在TM3波段,敞水區(qū)的像元亮度值接近50,而沉水植物、浮水植物和挺水植物均低于30,光譜特征差異也較大。
然而在TM1、TM2、TM3波段,挺水植物、浮水植物、沉水植物和養(yǎng)殖場的光譜特征非常相似,僅憑光譜信息進(jìn)行分類很容易出現(xiàn)“同物異譜”或“異物同譜”的現(xiàn)象;敞水區(qū)、養(yǎng)殖場和沉水植物在TM4、TM5、TM7波段光譜特征也很相似,無法用光譜將它們分開。這時(shí),需要利用遙感影像的另一個(gè)重要特征——紋理特征。
圖1 研究區(qū)主要地物光譜曲線
紋理不僅反映了影像的灰度信息,而且反映了地物本身的結(jié)構(gòu)特征和空間排列關(guān)系。綜合運(yùn)用光譜信息和紋理信息,可以提高影像分析的精確性[8,9]?;叶裙采仃囀且环N常用的紋理分析方法,能較好地反映紋理灰度級(jí)的相關(guān)性規(guī)律[10]。通過對(duì)比不同波長、方向、窗口的灰度共生矩陣紋理特征,發(fā)現(xiàn)3×3窗口、步長d=1、方向45°的灰度共生矩陣紋理特征對(duì)研究區(qū)地物具有較高的區(qū)分能力。由此,計(jì)算了均值、標(biāo)準(zhǔn)差、熵、角二階矩陣和相關(guān)性5個(gè)紋理測(cè)度[11,12]。
從研究區(qū)地物的紋理特征圖可以看出(圖2),相關(guān)性特征對(duì)地物的區(qū)分性較高,可以將挺水植物、養(yǎng)殖場和浮水植物從整個(gè)地物中提取出來,可以以此作為區(qū)分地物的特征值。
圖2 研究區(qū)各地物在紋理波段上的特征曲線
將亮度、綠度、濕度作為測(cè)試變量。分別將遙感影像的波段光譜數(shù)據(jù)轉(zhuǎn)換為三維數(shù)據(jù),即亮度軸、綠度軸和濕度軸。由于不同類型的光譜響應(yīng)特征不同[13],各類地物特征分布空間在亮度-綠度平面內(nèi)顯示一定的可分性,如圖3所示。
圖3 不同地物的濕度、綠度、亮度變化圖像
本研究采用以下6個(gè)測(cè)試變量:Landsat TM影像2個(gè)波段灰度值(TM4、TM5),2個(gè)紋理特征值(MEAN、COR),2個(gè)KT變量(濕度、綠度),目標(biāo)變量為挺水植物、浮水植物、沉水植物、敞水區(qū)、養(yǎng)殖場和其他6大類。
圖4 研究區(qū)決策樹模型
CART(classification and regression tree)是Breiman于1984年提出的決策樹構(gòu)建算法,其基本原理是通過由測(cè)試變量和目標(biāo)變量構(gòu)成的訓(xùn)練數(shù)據(jù)集的循環(huán)分析而形成二叉樹形式的決策樹結(jié)構(gòu)。CART是分類數(shù)據(jù)挖掘算法[14],從眾多的預(yù)測(cè)屬性(模型的輸入屬性)中選擇一個(gè)或多個(gè)屬性的組合,作為樹節(jié)點(diǎn)的分裂變量,把測(cè)試變量分到各個(gè)分枝中,重復(fù)該過程建立一棵充分大的分類樹,然后用交叉驗(yàn)證法進(jìn)行修剪,最終形成一棵兼顧復(fù)雜度和錯(cuò)誤率的最優(yōu)二叉樹[15-17]。
CART決策樹算法對(duì)融合后影像的光譜特征值、紋理特征變量以及KT變換的前2個(gè)分量合并的波段組合數(shù)據(jù)進(jìn)行計(jì)算,生成的決策樹(圖4)閾值為達(dá)到?jīng)Q策樹最佳預(yù)測(cè)性能時(shí)的閾值。可以看出,紋理均值及相關(guān)變量可以將養(yǎng)殖場從浮水植物和沉水植物中區(qū)分出來,再用濕度變量區(qū)分沉水植物和浮水植物。TM5波段及綠度變量可以將敞水區(qū)從其他地物中分離出來,而挺水植物則可由TM4波段提取。
結(jié)合分類規(guī)則和圖4,觀察生成的CART決策樹可以發(fā)現(xiàn),其中N0(結(jié)點(diǎn)序號(hào)從0開始,按照每一棵子樹從左往右依次編號(hào))就是樹的根結(jié)點(diǎn),N1和N2是根結(jié)點(diǎn)的第一個(gè)分支。在每個(gè)結(jié)點(diǎn)中,注明每一類別所包含的樣本單元數(shù)及非純度量(imp)。樹越往下,結(jié)點(diǎn)中的樣本單元越“純”。從圖4可以看出,用來分隔第一個(gè)結(jié)點(diǎn)的波段是紋理均值,共有625個(gè)像元樣本點(diǎn)。其中灰度值≤18.5的244個(gè)樣本單元被分入左結(jié)點(diǎn),而灰度值>18.5的381個(gè)樣本單元被分入右結(jié)點(diǎn)。分完后,其非純度量(Gini索引)改變?yōu)?.112,即“純度”提高了0.112。也就是說,在所有參與分類的波段,所有潛在的分割點(diǎn)中,紋理均值為18.5的分割點(diǎn)能使分完后兩部分的“純度”增值最大,這也從另一個(gè)方面說明了參與分類的波段的重要性大小。在一棵樹中,如果某波段參與分割結(jié)點(diǎn)的次數(shù)越多,則說明該波段對(duì)分類的貢獻(xiàn)越大。有多少個(gè)葉結(jié)點(diǎn),就有多少條地物類型的判別準(zhǔn)則。在本研究中,針對(duì)研究區(qū)生成的決策樹共有8個(gè)葉子結(jié)點(diǎn),對(duì)應(yīng)8條判別準(zhǔn)則,其中沉水植物和挺水植物各有兩條判別準(zhǔn)則,最后的分類結(jié)果如圖5所示。
表2 最大似然分類精度評(píng)價(jià)表
表3 CART分類精度評(píng)價(jià)表
圖5 2006年洪澤湖研究區(qū)分類圖
為了直觀地查看CART決策樹分類法對(duì)提高分類精度的效果,本文將CART決策樹分類后的精度結(jié)果與僅使用光譜特征分類的結(jié)果進(jìn)行比較。首先利用最大似然算法對(duì)研究區(qū)的光譜影像進(jìn)行非監(jiān)督分類,分類精度評(píng)價(jià)結(jié)果如表2所示,CART決策樹分類精度評(píng)價(jià)結(jié)果如表3所示。
精度評(píng)價(jià)表中的用戶精度對(duì)應(yīng)的是錯(cuò)分誤差,生產(chǎn)者精度對(duì)應(yīng)的是漏分誤差,它們從不同側(cè)面描述了分類精度。從表2可知,僅使用傳統(tǒng)分類算法,沉水植物的用戶精度只有39.82%,這主要是因?yàn)槌了参锖宛B(yǎng)殖場的光譜特征很相似,而且在該研究區(qū)中,養(yǎng)殖場中分布著很多沉水植物,導(dǎo)致養(yǎng)殖場與沉水植物混淆。敞水區(qū)的非監(jiān)督分類結(jié)果也比較低,生產(chǎn)者精度為59.81%。而運(yùn)用CART算法進(jìn)行分類后,其精度有了很大提高,沉水植物的用戶精度提高到85.71%,浮水植物提高到92.39%,敞水區(qū)的分類精度也提高到96.36%。然而,由于參與驗(yàn)證的點(diǎn)數(shù)有限,有些類別如養(yǎng)殖場驗(yàn)證點(diǎn)數(shù)較少,精度較低,導(dǎo)致總體精度偏低。
基于CART的決策樹分類結(jié)果優(yōu)于最大似然法分類。利用灰度共生矩陣提取出圖像的紋理信息(均值和相關(guān)性)以及KT變換的綠度指數(shù)等被用于決策規(guī)則的生成,對(duì)比由分類成果圖結(jié)合原始影像目視解譯結(jié)果,制定的分類規(guī)則具有一定的可行性。由于受資料、人為因素及其他因素影響,分類結(jié)果中存在一定的誤差。對(duì)于特征波段的選擇、計(jì)算方法以及檢驗(yàn)都有待于進(jìn)一步完善,需通過優(yōu)化分類算法來提高分類精度。
[1]譚衢霖.鄱陽湖濕地生態(tài)環(huán)境遙感變化監(jiān)測(cè)研究[D].北京:中國科學(xué)院遙感應(yīng)用研究所,2002
[2]王紅娟,姜加虎,黃群.基于知識(shí)的洞庭湖濕地遙感分類方法[J].長江流域資源與環(huán)境,2008,17(3):370-373
[3]那曉東,張樹清.基于決策樹方法的淡水沼澤濕地信息提取——以三江平原東北部為例[J].遙感技術(shù)與應(yīng)用,2008(8):365-372
[4]李慧,余明.基于決策樹模型的濕地信息挖掘與結(jié)果分析[J].地球信息科學(xué),2007,9(2):60-72
[5]Wright C, Gallant A. Improved Wetland Remote Sensing in Yellowstone National Park Using Classification Trees to Combine TM Imagery and Ancillary Environmental Data[J].Remote Sensing of Environment, 2007,107:582-605
[6]王洪道,竇鴻身,汪憲臣,等.中國的湖泊[M].北京:商務(wù)印書館,1996
[7]何厚軍,王文,劉學(xué)工.基于決策樹模型的海岸帶分類方法研究[J].地理與地理信息科學(xué),2008,24(5):25-28
[8]譚瑩.翁源縣基于紋理信息及CART決策樹技術(shù)的遙感影像分類研究[D].南京:南京林業(yè)大學(xué),2008
[9]馮建輝,楊玉靜.基于灰度共生矩陣提取紋理特征圖像的研究[J].北京測(cè)繪,2007(3):19-22
[10]Haralick R M. Statistical and Structural Approaches to Texture[J].Proc IEEE,1979, 67(5): 786-804
[11]Treitz P,Howarth P. Integrating Spectral, Spatial, and Terrain Variables for Forest Ecosystem Classification[J]. photogrammetric Engineering & Remote Sensing,2000,66(3):305-317
[12]Franklin S E, Pebble D R. Spectral Texture for Improved Class Discrimination in Complex Terain [J]. International Journal of Remote Sensing, 1989,54:1 727-1 737
[13]夏雙,阮仁宗,顏梅春,等. 洪澤湖濕地類型變化分析[J].南京林業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2012,36(1):38-42
[14]Mclver D K, Fried1 M A.Using Prior Probabilities in Decision-tree Classification of Remotely Sensed Data[J].Remote Sensing of Environment,2002,81:253-261
[15]Breiman L,Friedman J H,Olshen R A ,et al. Classification and Regression Tree[M]. Monterey, California: Wadsworth International Group,1984
[16]Yohanne S Y,Hoddinot T J. Classification and Regression Tree:An Introduction[M]. Washington D C: Internation Food Policy Research Institute,1999
[17]李俊杰,何隆華,戴錦芳,等.基于遙感影像紋理信息的湖泊圍網(wǎng)養(yǎng)殖區(qū)提取[J].湖泊科學(xué),2006,18(4):337-342