黃曉君,頡耀文,衛(wèi)嬌嬌,付 苗,呂利利,張玲玲
(1.蘭州大學(xué) 資源環(huán)境學(xué)院,甘肅 蘭州 730000;2.內(nèi)蒙古師范大學(xué) 地理科學(xué)學(xué)院,內(nèi)蒙古 呼和浩特 010022)
基于變化檢測(cè)-CART決策樹(shù)模式自動(dòng)識(shí)別沙漠化信息
黃曉君1,2,頡耀文1,衛(wèi)嬌嬌1,付 苗2,呂利利1,張玲玲1
(1.蘭州大學(xué) 資源環(huán)境學(xué)院,甘肅 蘭州 730000;2.內(nèi)蒙古師范大學(xué) 地理科學(xué)學(xué)院,內(nèi)蒙古 呼和浩特 010022)
目前沙漠化遙感監(jiān)測(cè)存在目視解譯的局限性、數(shù)據(jù)源的約束性、遙感信息利用率低等問(wèn)題?;诖?,以民勤盆地為試驗(yàn)區(qū),首先采用圖像差值、最大值合成及二維最大類(lèi)間方差等方法,檢測(cè)1994年、2014年兩期Landsat圖像的變化像元,然后利用分類(lèi)與回歸樹(shù)(CART)算法構(gòu)建決策樹(shù),自動(dòng)提取了2014年沙地信息,最后將變化檢測(cè)結(jié)果與沙地信息進(jìn)行空間疊置分析,并實(shí)現(xiàn)了沙漠化信息自動(dòng)識(shí)別模式。研究表明,變化檢測(cè)-CART決策樹(shù)模式精度為89.43%~93.00%,在95%置信水平上其置信區(qū)間介于85.90%~98.00%,顯然其精度具有較高可信度;該模式不僅能夠充分利用豐富遙感信息而且可排除多余信息的干擾。可見(jiàn),變化檢測(cè)-CART決策樹(shù)模式是識(shí)別沙漠化信息的有效方法之一,將對(duì)沙漠化防治工程具有重要應(yīng)用價(jià)值。
沙漠化;分類(lèi)與回歸樹(shù)(CART);決策樹(shù);變化檢測(cè);自動(dòng)識(shí)別
土地沙漠化是指在干旱、半干旱和部分半濕潤(rùn)地區(qū),由于自然因素或人文因素或兩者的共同作用,使原非沙漠地區(qū)出現(xiàn)以風(fēng)沙活動(dòng)為主要標(biāo)志的類(lèi)似沙漠景觀的土地退化過(guò)程。它是當(dāng)今世界最為嚴(yán)重的環(huán)境-社會(huì)-經(jīng)濟(jì)問(wèn)題之一,及時(shí)準(zhǔn)確監(jiān)測(cè)沙漠化信息是治沙止漠的基礎(chǔ),研究意義重大。
遙感具有獲取信息快、監(jiān)測(cè)范圍大、提供信息豐富等特點(diǎn),1970年代以來(lái)在土地沙漠化中得到廣泛應(yīng)用。國(guó)外最早在1975年Lampery利用航空像片對(duì)撒哈拉沙漠南緣的移動(dòng)進(jìn)行了研究[1],而國(guó)內(nèi)1984年中國(guó)科學(xué)院沙漠研究所利用航空相片及衛(wèi)星像片研究沙漠化[2]。目前,常見(jiàn)的土地沙漠化遙感監(jiān)測(cè)方法主要有目視解譯[3-5]、遙感專(zhuān)題指數(shù)[6-8]、沙漠化監(jiān)測(cè)指數(shù)[9-10]、人工神經(jīng)網(wǎng)絡(luò)[11-12]、光譜混合分析[13-14]、決策樹(shù)分類(lèi)[15-16]、基于面向?qū)ο骩17-18]等。由于沙漠化過(guò)程的動(dòng)態(tài)性與成因的復(fù)雜性,快速準(zhǔn)確監(jiān)測(cè)沙漠化信息有一定挑戰(zhàn)性。目視解譯提取沙漠化雖精度較高,但工作量大、效率低、主觀性強(qiáng),很難及時(shí)掌握沙漠化狀況。遙感專(zhuān)題指數(shù)、沙漠化監(jiān)測(cè)指數(shù)、人工神經(jīng)網(wǎng)絡(luò)等方法對(duì)遙感信息的利用率較低,其豐富的信息未能充分發(fā)揮應(yīng)有的作用。光譜混合分析與基于面向?qū)ο蟮谋O(jiān)測(cè)雖精度較高,但對(duì)數(shù)據(jù)源要求很高,如光譜混合像元分析較適于高光譜遙感數(shù)據(jù),基于面向?qū)ο筮m于高空間分辨率遙感數(shù)據(jù),從而它們利用的遙感數(shù)據(jù)不僅價(jià)格昂貴而且無(wú)法滿(mǎn)足大面積多時(shí)相的需求。目前雖沙漠化遙感監(jiān)測(cè)方法較多,但普適性較差,遙感信息的利用率低,尚未建立普遍接受的自動(dòng)提取沙漠化信息的方法框架。
分類(lèi)與回歸樹(shù)(CART)算法不僅對(duì)遙感數(shù)據(jù)源要求不高,而且能夠充分利用其豐富的遙感信息。目前美國(guó)NASA陸地衛(wèi)星Landsat可供免費(fèi)的1980年代以來(lái)大面積、多時(shí)相、中高空間分辨率多光譜遙感數(shù)據(jù),它必然是沙漠化遙感監(jiān)測(cè)的主要數(shù)據(jù)源?;诖耍狙芯恳悦袂谂璧貫樵囼?yàn)區(qū),利用Landsat衛(wèi)星遙感數(shù)據(jù),嘗試變化檢測(cè)-CART決策樹(shù)模式是構(gòu)建計(jì)算機(jī)自動(dòng)識(shí)別沙漠化信息的有效方法。
本文試驗(yàn)區(qū)是甘肅民勤盆地,地處我國(guó)西北內(nèi)陸干旱區(qū),在河西走廊東北部石羊河下游,地理位置介于38°25′~39°17′N(xiāo),102°45′~104°15′E。盆地底部海拔在1 300~1 400 m之間,大部平坦開(kāi)闊,地勢(shì)由西南向東北緩傾。盆地東西北三面被騰格里和巴丹吉林兩大沙漠包圍,大陸性沙漠氣候特征明顯,干旱少雨、晝夜溫差大、光照充足。在盆地石羊河兩岸分布所謂民勤綠洲。多年來(lái),由于人類(lèi)活動(dòng)的加劇和氣候變化的影響,綠洲與沙漠交錯(cuò)帶出現(xiàn)了土地沙漠化現(xiàn)象,因此該地區(qū)可作為本研究試驗(yàn)區(qū)。
本文主要使用的數(shù)據(jù)有1994年與2014年7月份Landsat TM/OLI影像數(shù)據(jù)(云量小于2%,行列號(hào)為131033,空間分辨率為30 m),還有美國(guó)NASA SRTM1 DEM數(shù)據(jù)(空間分辨率為30 m),另外包括2014年7月與10月兩次野外調(diào)查數(shù)據(jù)。利用ENVI軟件對(duì)影像數(shù)據(jù)進(jìn)行大氣輻射校正和裁剪處理,對(duì)DEM數(shù)據(jù)進(jìn)行幾何校正、投影轉(zhuǎn)換及裁剪處理。影像、DEM數(shù)據(jù)的坐標(biāo)與投影系統(tǒng)應(yīng)統(tǒng)一,即坐標(biāo)系統(tǒng)為WGS1984,投影為通用墨卡托UTM,帶號(hào)為48 N。
圖1 總體技術(shù)路線圖
基于變化檢測(cè)-CART決策樹(shù)模式自動(dòng)識(shí)別沙漠化信息的總體思路如圖1所示,首先自動(dòng)檢測(cè)由1994年至2014年的土地變化像元,它是圖像差值結(jié)合最大值合成法及二維最大類(lèi)間方差法來(lái)完成;其次自動(dòng)提取2014年沙地信息,它是在獲取若干沙地信息識(shí)別指標(biāo)的基礎(chǔ)上,利用CART算法構(gòu)建決策樹(shù)來(lái)完成;最后自動(dòng)識(shí)別沙漠化信息,它是通過(guò)變化檢測(cè)結(jié)果與沙地信息的空間疊置分析來(lái)實(shí)現(xiàn)。
2.1 變化檢測(cè)
2.1.1 圖像差值
為分析1994年、2014年TM/OLI圖像藍(lán)、綠、紅、近紅外及短波紅外1、2波段對(duì)典型地類(lèi),如沙地、綠地(如草地、耕地、林地)、水域(如河渠、湖泊、水庫(kù))及其他土地(如居民地、工礦、道路、鹽堿地、裸地、戈壁)等的光譜反射曲線特征,采樣了以上地類(lèi)的反射率,并繪制了光譜反射曲線(圖2)。結(jié)果表明,沙地的反射率在紅、短波紅外1、2波段上突出,與周?chē)木G地、水域及其他土地的光譜反射曲線有明顯差異,因?yàn)榧t色波段對(duì)葉綠素有較強(qiáng)的吸收,而對(duì)沙地的反射較高,且它是可見(jiàn)光中信息量較豐富的波段;短波紅外1、2波段對(duì)水體有較強(qiáng)的吸收,而對(duì)沙地的反射高,且在所有波段中短波紅外1的信息量最豐富。因此,從兩期圖像中分別選擇了近紅外、短波紅外1、2等3個(gè)波段,進(jìn)行了相應(yīng)的差值處理。
圖2 典型地類(lèi)光譜反射曲線
2.1.2 變化像元信息提取
圖像差值為分離變化與未變化像元信息奠定了基礎(chǔ),因?yàn)椴钪岛笙裨^對(duì)值呈兩極分化態(tài)勢(shì),這是變化像元信息提取的切入點(diǎn)。本研究顧及壓縮數(shù)據(jù)和不遺漏變化信息,利用最大值合成法,將3個(gè)差值圖像進(jìn)行合成處理。另外,為減少多余信息對(duì)變化像元中沙漠化信息的干擾,從合成圖像中剔除小于等于0的像元,因?yàn)閳D像差值使沙漠化像元值基本控制在大于0范圍。在此基礎(chǔ)上,采用二維最大類(lèi)間方差法,提取合成圖像中的變化像元信息。二維最大類(lèi)間方差法是在二維灰度直方圖的基礎(chǔ)上,具有統(tǒng)計(jì)意義上的最佳分割閾值,其將圖像的二維灰度直方圖分割成兩類(lèi),使兩類(lèi)間離散度矩陣的跡取最大值,即分離性最大,如式(1)所示。
(1)
表1 沙漠化信息識(shí)別指標(biāo)的計(jì)算
式中:trρ為類(lèi)間離散度矩陣ρ的跡,L為圖像灰度級(jí),(α,β)為任意閾值,(α′,β′)為最佳閾值。
本文根據(jù)以上數(shù)學(xué)定義,實(shí)現(xiàn)了變化像元與未變化像元的有效分離,其結(jié)果顯示合成圖像像元值大于0.076為變化像元,反之則未為變化像元。
2.2 CART決策樹(shù)沙地信息提取
2.2.1 沙地信息識(shí)別指標(biāo)選取
目前尚沒(méi)有能夠直接準(zhǔn)確提取沙地信息指數(shù)的方法,一般運(yùn)用分類(lèi)方法提取。本研究首先把地表分為沙地、綠地(如草地、耕地、林地)、水域(如河渠、湖泊、水庫(kù))及其他土地(如居民地、工礦、道路、鹽堿地、裸地、戈壁)等4類(lèi),然后利用CART決策樹(shù)對(duì)地表進(jìn)行分類(lèi),并實(shí)現(xiàn)沙地信息提取。
筆者參考文獻(xiàn)[7、9、15]等,選擇修改型土壤調(diào)整植被指數(shù)(MSAVI)、歸一化植被指數(shù)(NDVI)、歸一化差異水體指數(shù)(NDWI)、歸一化裸露指數(shù)(NDBI)、鹽分指數(shù)(SI)、表土粒度指數(shù)(GSI)、地表反照率(Albedo)、K-T變換的分量(如亮度Brightness、綠度Greenness)、紋理特征及DEM等作為沙地信息識(shí)別指標(biāo)。上述指標(biāo)在分類(lèi)中發(fā)揮應(yīng)有的作用,如:MSAVI、NDVI、Greenness能夠表征地面綠地信息,其中NDVI由于對(duì)低密度植被覆蓋地區(qū)受土壤背景影響較大,且高密度植被覆蓋地區(qū)易飽和,故適合中密度植被覆蓋地區(qū)綠地信息識(shí)別,而MSAVI受土壤背景影響較小,適于低密度植被覆蓋地區(qū)的綠地信息識(shí)別,Greenness與綠色植物的數(shù)量具有密切關(guān)系,能夠彌補(bǔ)NDVI在高密度植被覆蓋地區(qū)快速飽和的缺陷;NDWI可以最大程度抑制植被信息,而能夠突出水體信息;Albedo能夠反映地表對(duì)太陽(yáng)輻射反射特性,隨地表植被覆蓋度、土壤水分及地表粗糙度的變化,Albedo具有明顯的響應(yīng),則沙地、綠地、水域等不同地表特征的反射率呈明顯差異;Brightness能夠反映土壤反射率變化的信息,受土壤水分的影響,其值對(duì)不同水分地表具有明顯差異,則分離沙地與其他土地起到應(yīng)有的作用;NDBI對(duì)裸露地表較敏感,則識(shí)別裸地、道路等信息較好;SI能夠反映鹽堿地信息;GSI對(duì)表土粒度信息較敏感,則能夠較好識(shí)別戈壁、居民地等信息;紋理特征能夠反映地表粗糙度信息,沙地紋理與其他地表具有明顯的差異,則識(shí)別沙地信息起到應(yīng)有的作用;DEM能夠反映地貌形態(tài)特征,沙地與戈壁在海拔上具有一定空間差異性,則其能夠增強(qiáng)沙地與戈壁的分離性。以上指標(biāo)的獲取如表1所示。
2.2.2 訓(xùn)練樣本的選取
本文將地表分為4種土地類(lèi)型,即沙地、綠地(如草地、耕地、林地)、水域(如河渠、湖泊、水庫(kù))及其他土地(如居民地、工礦、道路、鹽堿地、裸地、戈壁),并采用目視解譯與野外考察等手段,在2014年圖像上選取訓(xùn)練樣本(350個(gè)圖斑,共28 138個(gè)像元)。目視解譯是在解譯者具備圖像解譯專(zhuān)業(yè)知識(shí)、區(qū)域背景知識(shí)及遙感系統(tǒng)知識(shí)的基礎(chǔ)上,根據(jù)圖像基本解譯要素和解譯標(biāo)志來(lái)識(shí)別目標(biāo)地物。訓(xùn)練樣本的選取是構(gòu)建決策樹(shù)的關(guān)鍵部分,它的好壞直接影響后期分類(lèi)精度。因此,在選取訓(xùn)練樣本時(shí),考慮了其代表性、典型性及完備性,也就是說(shuō)訓(xùn)練樣本代表了整個(gè)區(qū)域內(nèi)各地類(lèi)光譜特征差異。
2.2.3 CART決策樹(shù)的構(gòu)建及分類(lèi)
本文利用CART算法建立了決策樹(shù),即稱(chēng)為CART決策樹(shù)。CART決策樹(shù)是由輸入變量和輸出變量構(gòu)成的訓(xùn)練樣本數(shù)據(jù)集的循環(huán)分析的二叉樹(shù)結(jié)構(gòu),其中輸入變量是由基于訓(xùn)練樣本像元的各沙地信息識(shí)別指標(biāo)產(chǎn)生;輸出變量是由基于訓(xùn)練樣本像元的4種土地類(lèi)型產(chǎn)生。CART算法包括決策樹(shù)生長(zhǎng)和決策樹(shù)修剪兩部分內(nèi)容。在決策樹(shù)生長(zhǎng)時(shí),利用雜度削減量從眾多輸入變量中選擇當(dāng)前最佳分組變量,然后采用基尼系數(shù)確定分組變量分割閾值,其數(shù)學(xué)定義如式(2)、式(3)所示。
(2)
式中:G(t)為基尼系數(shù),t為節(jié)點(diǎn),k為輸出變量類(lèi)別個(gè)數(shù),P(j|t)是節(jié)點(diǎn)中輸出變量取第j類(lèi)的歸一化概率,Nj,t是節(jié)點(diǎn)t包含第j類(lèi)的樣本量,Nj是全樣本量。分組變量分割閾值過(guò)程是首先將每個(gè)輸入變量數(shù)值按升序排序,再?gòu)男〉酱笠来我韵噜彅?shù)值的中間值作為分割點(diǎn),將樣本分成兩組,并計(jì)算兩組樣本輸出變量值的異質(zhì)性。當(dāng)使兩組輸出變量值的異質(zhì)性總和最小、純度最大時(shí),分組變量達(dá)到最佳分割點(diǎn)。輸出變量值的異質(zhì)性是用基尼系數(shù)來(lái)測(cè)度,當(dāng)節(jié)點(diǎn)中輸出變量均取同一類(lèi)別時(shí),輸出變量取值的異質(zhì)性最小,即基尼系數(shù)為0,而當(dāng)各類(lèi)別取值概率相等時(shí),輸出變量取值的異質(zhì)性最大,即基尼系數(shù)為1-1/k。
(3)
式中:ΔG(t)為雜度削減量,G(t)和N分別為分組前輸出變量的基尼系數(shù)和樣本量,G(tr)、Nr和G(tl)、Nl分別為分組后右子樹(shù)的基尼系數(shù)和樣本量以及左子樹(shù)的基尼系數(shù)和樣本量。在節(jié)點(diǎn)處首先對(duì)所有輸入變量將計(jì)算其雜度削減量,再對(duì)雜度削減量進(jìn)行比較,選擇最大對(duì)應(yīng)的輸入變量將成為當(dāng)前節(jié)點(diǎn)分組變量。
在CART決策樹(shù)構(gòu)建中,決策樹(shù)的修剪處理很重要。它在保證決策樹(shù)有一定預(yù)測(cè)精度的前提下,還能削減決策樹(shù)的復(fù)雜程度,最終獲得一顆理想的樹(shù)。修剪由預(yù)修剪和后修剪兩部分構(gòu)成,其中預(yù)修剪是在建立決策樹(shù)時(shí),事先制定一些控制參數(shù)來(lái)修剪決策樹(shù),如決策樹(shù)最大深度、樹(shù)中父節(jié)點(diǎn)和子節(jié)點(diǎn)的最少樣本量或比例、樹(shù)節(jié)點(diǎn)中輸出變量的最小雜度削減量等;后修剪是在決策樹(shù)預(yù)修剪后充分生長(zhǎng)的基礎(chǔ)上,根據(jù)一定的規(guī)則,修剪樹(shù)中那些不具有一般代表性的葉節(jié)點(diǎn)或子樹(shù),這是一個(gè)邊修剪邊預(yù)測(cè)當(dāng)前決策子樹(shù)精度的過(guò)程。它是采用最小代價(jià)復(fù)雜性修剪法來(lái)完成。此方法
不僅顧及了決策樹(shù)的預(yù)測(cè)精度,而且考慮了決策樹(shù)的復(fù)雜程度。本文通過(guò)上述修剪處理,得到理想的決策樹(shù),再利用該決策樹(shù)自動(dòng)提取了2014年沙地信息。
2.3 沙漠化信息識(shí)別
通過(guò)1994年、2014年兩期Landsat衛(wèi)星圖像變化檢測(cè)與2014年CART決策樹(shù)分類(lèi)結(jié)果的空間疊置分析,自動(dòng)識(shí)別了2014年沙漠化信息。若變化像元與分類(lèi)圖像的沙地像元相重合,當(dāng)前像元為沙漠化像元,反之則未沙漠化像元。利用ENVI軟件波段計(jì)算功能進(jìn)行空間疊置分析,實(shí)現(xiàn)了沙漠化信息的自動(dòng)識(shí)別(如圖3所示,2014年民勤盆地沙漠化信息識(shí)別的局部放大圖)。
圖3 沙漠化信息識(shí)別的局部放大圖
3.1 變化檢測(cè)的有效性分析
3.1.1 沙漠化土地與未變化土地像元的有效分離
為分析變化檢測(cè)對(duì)沙漠化與未變化土地像元能夠分離的有效性,選取1 300未變化土地樣本像元(覆蓋了沙地、綠地、水域、其他土地)、2 520沙漠化土地樣本像元(綠地沙漠化、水域沙漠化及其他土地沙漠化像元各840個(gè)),然后分別對(duì)兩期紅、短波紅外1、2波段進(jìn)行差值,再進(jìn)行最大值合成處理,獲得其最大值,如圖4所示。圖4a和4b分別為未變化土地和沙漠化土地的3波段求差的最大值散點(diǎn)圖,其表明:未變化土地像元值集中于0附近,其值基本都小于分割閾值(0.076),而沙漠化土地像元值基本都大于分割閾值,從而在變化檢測(cè)中最大值合成法和二維最大類(lèi)間方差法的應(yīng)用不僅克服變化信息丟失而且有效分離沙漠化與未變化像元。另外,試驗(yàn)顯示有時(shí)其他土地沙漠化像元值小于閾值的現(xiàn)象,這對(duì)變化檢測(cè)帶來(lái)一定的誤差,但這只是很小部分,可忽略不計(jì)。
圖4 沙漠化與未變化土地像元的有效分離
3.1.2 變化檢測(cè)的精度分析
為變化檢測(cè)結(jié)果的精度分析,在2014年圖像上隨機(jī)選取了3 154個(gè)樣本點(diǎn),再利用目視解譯與野外判別方法確定其土地類(lèi)型,即沙地、綠地、水域及其他土地,并作為2014年真實(shí)樣本點(diǎn)。在此基礎(chǔ)上,同樣的方法產(chǎn)生1994年相應(yīng)真實(shí)樣本點(diǎn)。對(duì)兩期真實(shí)樣本點(diǎn)進(jìn)行比較得知,沙漠化與未變化樣本點(diǎn)分別為1 849和1 305,然后采用變化檢測(cè)方法對(duì)兩期真實(shí)樣本點(diǎn)間進(jìn)行檢測(cè),結(jié)果顯示:沙漠化與未變化樣本點(diǎn)分別為1 613和1 286。顯然沙漠化和未變化像元的檢測(cè)精度分別為87.24% 和98.54%,總體精度為91.92%(圖5)。
3.2 CART決策樹(shù)沙地信息提取精度分析
圖5 變化檢測(cè)精度驗(yàn)證
3.2.1 CART決策樹(shù)模型風(fēng)險(xiǎn)評(píng)價(jià)
CART決策樹(shù)沙地信息提取精度分析之前,應(yīng)評(píng)價(jià)CART決策樹(shù)模型的精度,即模型風(fēng)險(xiǎn)評(píng)價(jià)。它是利用風(fēng)險(xiǎn)估計(jì)(錯(cuò)判率)來(lái)衡量。在CART決策樹(shù)的構(gòu)建中使用的總樣本為28 138個(gè)像元。其中訓(xùn)練樣本和測(cè)試樣本分別占總樣本的80%、20%。一般用測(cè)試樣本來(lái)測(cè)試模型精度。其測(cè)試結(jié)果顯示,決策樹(shù)對(duì)測(cè)試樣本的風(fēng)險(xiǎn)估計(jì)為0.031,即錯(cuò)判率為3.1%,與訓(xùn)練樣本的風(fēng)險(xiǎn)估計(jì)值相等(表2)。說(shuō)明該模型穩(wěn)定,精度較高。
3.2.2 CART決策樹(shù)沙地信息提取精度評(píng)定
為評(píng)定CART決策樹(shù)沙地信息提取精度,其分類(lèi)結(jié)果與傳統(tǒng)的最大似然法與現(xiàn)代的人工神經(jīng)網(wǎng)絡(luò)方法分類(lèi)結(jié)果分別進(jìn)行了精度比較,三者分類(lèi)結(jié)果如圖6所示。筆者利用混淆矩陣計(jì)算Kappa系數(shù)和總體精度來(lái)評(píng)定其分類(lèi)精度。首先在2014年圖像上隨機(jī)選取了260個(gè)驗(yàn)證圖斑;其次采用手持GPS導(dǎo)航找到驗(yàn)證圖斑的實(shí)地位置,并確認(rèn)該圖斑土地類(lèi)型;最后把確認(rèn)的260個(gè)驗(yàn)證圖斑作為真實(shí)感興趣區(qū),與相應(yīng)的CART決策樹(shù)、最大似然法、人工神經(jīng)網(wǎng)絡(luò)分類(lèi)結(jié)果分別相比較,并獲得真實(shí)與預(yù)測(cè)的混淆矩陣,同時(shí)求出Kappa系數(shù)和總體精度。結(jié)果顯示,CART決策樹(shù)的分類(lèi)總體精度和Kappa系數(shù)最高,分別為87.34%和0.827 2,人工神經(jīng)網(wǎng)絡(luò)次之,分別為85.71%和0.806 0,最大似然法最低,分別為82.27%和0.758 8。分類(lèi)總體精度是分類(lèi)器正確分類(lèi)的像元總數(shù)與總像元數(shù)之比,若總體精度越大,分類(lèi)器分類(lèi)精度越高;Kappa系數(shù)是綜合了生產(chǎn)精度和用戶(hù)精度的指標(biāo),若Kappa系數(shù)越大,分類(lèi)結(jié)果與真實(shí)參考之間差異越小,則分類(lèi)器分類(lèi)精度越高。顯然CART決策樹(shù)提取沙地信息優(yōu)于最大似然法和人工神經(jīng)網(wǎng)絡(luò)。
3.3 沙漠化信息識(shí)別的精度驗(yàn)證
為沙漠化信息自動(dòng)識(shí)別精度的驗(yàn)證,從變化檢測(cè)-CART決策樹(shù)模式的自動(dòng)識(shí)別結(jié)果中隨機(jī)選取了1 486個(gè)驗(yàn)證點(diǎn)(圖7d),采用野外調(diào)查和室內(nèi)目視解譯方法,再結(jié)合地理國(guó)情普查數(shù)據(jù)和高空間分辨影像圖,判別當(dāng)前驗(yàn)證點(diǎn)是否沙漠化,如圖7a、圖b、圖c顯示了變化檢測(cè)-CART決策樹(shù)模式準(zhǔn)確識(shí)別沙漠化的狀況。精度驗(yàn)證得知,變化檢測(cè)-CART決策樹(shù)精度為89.43%(正確識(shí)別驗(yàn)證點(diǎn)數(shù)占總驗(yàn)證點(diǎn)數(shù)的百分比)。為進(jìn)一步評(píng)定沙漠化信息識(shí)別精度的可信程度,在計(jì)算識(shí)別精度的基礎(chǔ)上,利用總體比例的區(qū)間估計(jì)方法,在95%置信水平上估計(jì)了當(dāng)前精度的置信區(qū)間(圖8),結(jié)果表明:隨驗(yàn)證點(diǎn)由100增加到1 486期間,該模式沙漠化信息識(shí)別精度為89.43%~93.00%,其置信區(qū)間介于85.90%~98.00%;當(dāng)驗(yàn)證點(diǎn)數(shù)增加到600之后,精度變化變?yōu)榉€(wěn)定,基本在89.51%上下微小浮動(dòng)。綜上可見(jiàn),變化檢測(cè)-CART決策樹(shù)模式自動(dòng)識(shí)別沙漠化信息精度具有較高的可靠性。
表2 模型風(fēng)險(xiǎn)的評(píng)價(jià)結(jié)果
圖6 分類(lèi)結(jié)果
圖7 沙漠化驗(yàn)證
圖8 沙漠化信息識(shí)別精度及其置信區(qū)間
本文以民勤盆地為試驗(yàn)區(qū),提出了變化檢測(cè)-CART決策樹(shù)模式自動(dòng)識(shí)別沙漠化信息的方法。它由變化檢測(cè)與CART決策分類(lèi)樹(shù)兩部分組成,其中變化檢測(cè)的主要作用是自動(dòng)檢測(cè)包含沙漠化信息的變化像元,其精度分析顯示:沙漠化和未變化像元的檢測(cè)精度分別為87.24% 和98.54%,總體精度為91.92%,可見(jiàn)變化檢測(cè)能夠有效分離沙漠化與未變化像元。CART決策樹(shù)分類(lèi)目的是從2014年圖像中自動(dòng)提取沙地信息,其精度分析表明:模型精度為96.90%,分類(lèi)總體精度為87.34%,Kappa系數(shù)為0.827 2,與最大似然法、人工神經(jīng)網(wǎng)絡(luò)等方法比較得知,CART決策樹(shù)分類(lèi)精度優(yōu)于它們,顯然CART決策樹(shù)能夠有效提取沙地信息。在變化檢測(cè)與CART決策樹(shù)分類(lèi)的基礎(chǔ)上,利用ENVI波段計(jì)算功能對(duì)變化檢測(cè)與CART決策樹(shù)分類(lèi)結(jié)果進(jìn)行空間疊置分析,并自動(dòng)識(shí)別了沙漠化信息,其精度驗(yàn)證顯示:變化檢測(cè)與CART決策樹(shù)模式精度為 89.43%~93.00%,其置信區(qū)間介于85.90%~98.00%。顯而易見(jiàn),變化檢測(cè)-CART決策樹(shù)模式是識(shí)別沙漠化信息的有效方法之一。
變化檢測(cè)-CART決策樹(shù)模式不僅在精度上具有較高的可信度,而且其他方面亦有突出的優(yōu)勢(shì),如:①與光譜混合分析、基于面向?qū)ο蠓椒ū容^,適用性相對(duì)較高,它對(duì)數(shù)據(jù)源要求不高,免費(fèi)Landsat衛(wèi)星多光譜遙感數(shù)據(jù)即可,適合大面積沙漠化監(jiān)測(cè),但光譜混合分析和基于面向?qū)ο蠓椒▽?duì)遙感數(shù)據(jù)的光譜分辨率或空間分辨率具有較高的要求,則大面積沙漠化監(jiān)測(cè)必然費(fèi)用昂貴;②使豐富遙感信息充分發(fā)揮了應(yīng)有的作用,而支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、遙感專(zhuān)題指數(shù)、沙漠化監(jiān)測(cè)指數(shù)等方法對(duì)遙感信息的利用率相對(duì)較低;③實(shí)現(xiàn)了計(jì)算機(jī)自動(dòng)識(shí)別沙漠化信息,排除了多余信息的干擾,避免了由于解譯人員的主觀性或經(jīng)驗(yàn)的不同而引起的差異和錯(cuò)誤,提高了工作效率,可及時(shí)掌握沙漠化狀況??梢?jiàn),變化檢測(cè)-CART決策樹(shù)模式將對(duì)沙漠化防治工程具有重要應(yīng)用價(jià)值。
[1] Lamprety H F.Report on the desert encroachment reconnaissance in northen Sudan[R].Khartoum,Sudan National Council for Research, Ministry of Agriculture,1975.
[2] 朱震達(dá).中國(guó)沙漠化研究的進(jìn)展[J].中國(guó)沙漠,1989,9(1):1-13.
[3] Reiche M,Funk R,Zhang Z D,et al.Application of satellite remote sensing for mapping wind erosion risk and dust emission-deposition in Inner Mongolia grassland,China[J].Grassland Science,2012,58(1):8-19.
[4] 王濤,宋翔,顏長(zhǎng)珍,等.近35年來(lái)中國(guó)北方土地沙漠化趨勢(shì)的遙感分析[J].中國(guó)沙漠,2011,31(6):1351-1356.
[5] 胡夢(mèng)珺,田麗慧,張登山,等.遙感與GIS支持下近30年來(lái)青海湖環(huán)湖區(qū)土地沙漠化動(dòng)態(tài)變化研究[J].中國(guó)沙漠,2012,32(4):901-909.
[6] Nasem Badreldin·Rudi Goossens.A satellite-based disturbance index algorithm for monitoring mitigation strategies effects on desertification change in an arid environment[J].Mitig Adapt Strateg Glob Change,2015,20:263-276.
[7] 孫建國(guó),姜燁,顏長(zhǎng)珍,等.利用專(zhuān)題指數(shù)改善沙漠化土地遙感分類(lèi)精度[J].遙感技術(shù)與應(yīng)用,2013,28(4):655-658.
[8] Symeonakis E,Drake N.Monitoring desertification and land degradation over sub-saharan africa[J].International Journal of Remote Sensing,2004,25(3):573-592.
[9] 李寶林,周成虎.東北平原西部沙地沙質(zhì)荒漠化的遙感監(jiān)測(cè)研究[J].遙感學(xué)報(bào),2002,6(2):117-122.
[10]曾永年,向南平,馮兆東,等.Albedo-NDVI特征空間及沙漠化遙感監(jiān)測(cè)指數(shù)研究[J].地理科學(xué),2006,26(1):75-77.
[11] 喬平林,張繼賢,林宗堅(jiān).基于神經(jīng)網(wǎng)絡(luò)的土地荒漠化信息提取方法研究[J].測(cè)繪學(xué)報(bào),2004,33(1):58-62.
[12] 買(mǎi)買(mǎi)提·沙吾提,塔西甫拉提·特依拜,丁建麗,等.BP神經(jīng)網(wǎng)絡(luò)的沙漠化土地信息提取研究[J].干旱區(qū)研究,2008,25(5):647-652.
[13] Dawellbait M,Morari F.Monitoring desertification in a savannah region in sudan using Landsat images and spectral mixture analysis[J].Journal of Arid Environments,2012,80:45-55.
[14] 李曉松,吳波,范文義,等.基于光譜混合分析的荒漠化信息提取——以毛烏素沙地為例[J].林業(yè)科學(xué)研究,2006,19(2):192-198.
[15] 賈樹(shù)海,韓志根,呂默楠,等.基于決策樹(shù)的遼寧省北部沙漠化信息提取研究[J].生態(tài)環(huán)境學(xué)報(bào),2011,20(1):13-18.
[16] 段英杰,何政偉,王永前,等.基于遙感數(shù)據(jù)的西藏自治區(qū)土地沙漠化監(jiān)測(cè)分析研究[J].干旱區(qū)資源與環(huán)境,2014,28(1):55-61.
[17] 王志波,高志海,王琫瑜,等.基于面向?qū)ο蠓椒ǖ纳郴恋剡b感信息提取技術(shù)研究[J].遙感技術(shù)與應(yīng)用,2012,27(5):770-777.
[18] 馮益明,鄭冬梅,智長(zhǎng)貴,等.面向?qū)ο蟮纳郴恋匦畔⑻崛J].林業(yè)科學(xué),2013,49(1):126-133.
[19] Qi J,Chehbouni A,Huete R,et al.A modified soil adjusted vegetation index[J].Remote Sensing of Environment.1994,48(2):119-126.
[20] Tucker C J,Justice C O,Prince S D.Monitoring the grasslands of the sahel 1984-1985[J].International Journal of Remote Sensing,1986,7(11):1571-1581.
[21] Mcfeeters S K.The use of normalized difference water index(NDWI)in the delineation of open water features[J].International Journal of Remote Sensing,1996,17(7):1425-1432.
[22] 吳宏安,蔣建軍,周杰,等.西安城市擴(kuò)張及其驅(qū)動(dòng)力分析[J].地理學(xué)報(bào), 2005,60(1):143-150.
[23] Khan N M,Rastoskuev V V.Assessment of hydrosaline land degradation by using a simple approach of remote sensing indicators[J].Agricultural Water Management,2005,77(3):96-109.
[24] Xiao J,Shen Y,Tateishi R,et al.Development of topsoil grain size index for monitoring desertification in arid land using remote sensing[J].International Journal of Remote Sensing,2006,27(12):2411-2422.
[25] Liang Shunlin.Narrowband to broadband conversion of land sueface albedo I algorithms[J].Remote Sensing of Environment,2001,76(2):213-238.
Automatic Recognition of Desertification Information Based on the Pattern of Change Detection-CART Decision Tree
HUANG Xiaojun1, 2, XIE Yaowen1, WEI Jiaojiao1, FU Miao2, LYU Lili1and ZHANG Lingling1
(1.CollegeofEarthandEnvironmentalSciences,LanzhouUniversity,Lanzhou730000,China; 2.CollegeofGeographicalScience,InnerMongoliaNormalUniversity,Huhhot010022,China)
Thedesertificationofremotesensingmonitoringhassomeproblems,suchasvisualinterpretationlimitation,constraintofdatasourceandlowutilizationrateofremotesensinginformation.Basedonthis,takingMinqinbasinasthetestarea,firstly,thispaperdetectsthechangepixeloftwoLandsatimagesin1994and2014,byemployingthemethodsofimagedifference,maximumvaluesynthesisandtwo-dimensionalmaximumbetween-classvariance.Secondly,thedecisiontreeisconstructedbytheclassificationandregressiontree(CART)algorithmthenautomaticallyextractsthesandylandinformationof2014.Finally,spatialoverlayanalyzetheresultsofchangedetectionwithsandylandinformation,andrealizethepatternofautomaticrecognitionondesertificationinformation.Theresearchshowsthattheaccuracyofchangedetection-CARTdecisiontreepatternis89.43%to93%,andtheconfidenceintervalisbetween85.90%and98%at95%confidencelevel,clearlythatthereliabilityofitsaccuracyisrelativelyhigh.Thispatternnotonlycanmakefulluseoftheabundantremotesensinginformationbutalsocanexcludetheinterferenceofredundantinformation.Obviously,thechangedetection-CARTdecisiontreepatternisoneoftheeffectivemethodstoidentifythedesertificationinformation,anditwillhaveimportantapplicationvaluetothedesertificationcontrolproject.
desertification;classificationandregressiontree;regressiontree;changedetection;automaticrecognition
10.3969/j.issn.1000-811X.2017.01.008.]
2016-05-17
2016-07-04
國(guó)家自然科學(xué)基金項(xiàng)目(41471163);蘭州大學(xué)中央高?;究蒲袠I(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金(lzujbky-2016-242)
黃曉君(1984-),男,蒙古族,內(nèi)蒙古興安盟人,講師,主要從事自然災(zāi)害遙感監(jiān)測(cè)與預(yù)警研究. E-mail:hxj3s@qq.com
X43;F301
A
1000-811X(2017)01-0036-07
10.3969/j.issn.1000-811X.2017.01.008
黃曉君,頡耀文,衛(wèi)嬌嬌,等. 基于變化檢測(cè)-CART決策樹(shù)模式自動(dòng)識(shí)別沙漠化信息[J]. 災(zāi)害學(xué),2017,32(1):36-42. [HUANG Xiaojun,XIE Yaowen,WEI Jiaojiao,et al. Automatic recognition of desertification information based on the pattern of change detection-CART decision tree [J]. Journal of Catastrophology,2017,32(1):36-42.