張亞新,吳志勇,何 海
(河海大學(xué)水文水資源學(xué)院,南京 210098)
土地利用、土地覆蓋是城市發(fā)展規(guī)劃及資源開發(fā)利用的關(guān)鍵信息,同時(shí)也是區(qū)域土地覆被變化研究的重要基礎(chǔ)[1,2]。隨著計(jì)算機(jī)和地理信息技術(shù)的發(fā)展,土地利用空間分布數(shù)據(jù)在農(nóng)業(yè)監(jiān)測、環(huán)境資源保護(hù)和水文過程模擬等方面也發(fā)揮著重要作用[3,4]。近年來,受城鎮(zhèn)化進(jìn)程的影響,人類活動導(dǎo)致的城鎮(zhèn)地區(qū)土地利用變化加劇,因此,準(zhǔn)確、及時(shí)、有效地獲取到土地利用信息對于城鎮(zhèn)地區(qū)農(nóng)業(yè)發(fā)展、環(huán)境保護(hù)、水資源利用等具有重要意義[5-7]。
傳統(tǒng)的調(diào)查統(tǒng)計(jì)法提取土地利用信息耗時(shí)耗力、時(shí)效性差、成本高,遙感分類方法由于數(shù)據(jù)獲取成本低、時(shí)效性好而成為獲取土地利用信息的重要途徑[8]。常見的遙感分類方法有監(jiān)督分類法和決策樹法,其中監(jiān)督分類法又包括最大似然、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等3 種分類器。遙感分類方法是影響土地利用分類精度的關(guān)鍵因素[9,10],國內(nèi)外許多學(xué)者對不同分類方法的效果進(jìn)行比較研究。成淑艷等[11]比較研究了幾種常見的監(jiān)督分類方法在青海湖沙柳河流域土地覆被提取時(shí)的效果;徐曉桃等[12]以甘肅省為試驗(yàn)區(qū)對比研究了最大似然法、神經(jīng)網(wǎng)絡(luò)法和決策樹法3 種土地覆被分類方法的分類精度;周麗紅等[13]比較了監(jiān)督分類中幾種常見的分類器和決策樹方法在南昌市土地覆被分類時(shí)的精度。但大多數(shù)研究中對不同提取方法的比較僅基于混淆矩陣從總體分類精度和Kappa 系數(shù)進(jìn)行分析,缺少空間分布上的比較。
蘇南丘陵地區(qū)沖谷平原綿延,地勢高低懸殊,地貌錯綜復(fù)雜,區(qū)域內(nèi)土地利用分布較為分散且破碎[6],在利用遙感分類方法進(jìn)行土地利用分類時(shí)有一定的難度,加之不同分類方法在進(jìn)行土地利用信息提取時(shí)也各有利弊,不同地區(qū)的最優(yōu)分類方法由于當(dāng)?shù)氐匦蔚膹?fù)雜程度和區(qū)域內(nèi)地物的分布特征差異也不盡相同[14,15],因此,針對幾種常見的土地利用遙感分類方法在蘇南丘陵地區(qū)開展適用性研究很有必要。鑒于此,以蘇南丘陵地區(qū)的句容河流域?yàn)檠芯繀^(qū),選取多時(shí)相的Landsat 8 影像,分別利用監(jiān)督分類法中的最大似然、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)3 種分類器和基于時(shí)間序列特征指數(shù)的決策樹分類方法,得到4 種方法下研究區(qū)域的土地利用分類結(jié)果,從總體分類精度和地物空間分布對不同分類結(jié)果進(jìn)行比較分析,以評價(jià)不同土地利用遙感分類方法在蘇南丘陵區(qū)的適用性。
句容河流域(圖1)位于南京市和鎮(zhèn)江市邊界,流域總面積1 567 km2,平均海拔179 m。句容河流域內(nèi)包含平原、丘陵、山地等多種地形,土地利用類型主要有林地、耕地、水體、建筑用地、裸地,分布情況較為復(fù)雜,在蘇南丘陵區(qū)小流域中較為典型,據(jù)調(diào)查研究區(qū)域內(nèi)地物分布分散且破碎。因此本研究選取句容河流域能體現(xiàn)不同分類方法下土地利用結(jié)果的差異,便于對不同分類方法進(jìn)行比較。
圖1 研究區(qū)域地理位置
研究中使用的遙感數(shù)據(jù)為Landsat 8 OLI 數(shù)據(jù)(http://www.gscloud.cn),選取研究流域2015 年內(nèi)云量覆蓋較少的Landsat 8 圖像共4 景,成像時(shí)間分別為3 月10 日、4 月11 日、6 月14 日和9 月2 日。為得到研究區(qū)真實(shí)的地表反射率圖像,對Landsat 8 數(shù)據(jù)進(jìn)行預(yù)處理,主要包括輻射定標(biāo)、大氣校正、遙感影像裁剪。研究中用到的地物樣本數(shù)據(jù)基于2014—2017 年的Google Earth 歷史影像采集,包括水體、林地、耕地、建筑用地和裸地5 種類型。為保證樣本準(zhǔn)確性,結(jié)合Landsat 8 數(shù)據(jù)通過目視解譯對樣本做進(jìn)一步修正。
監(jiān)督分類法本質(zhì)是用已經(jīng)確定類別的像元去識別遙感圖像中其他未知像元的過程[16]。樣本中不同地物類型組合的可分離性均較好是進(jìn)行監(jiān)督分類的前提。基于樣本,分別計(jì)算6 月14 日和9 月2 日兩個時(shí)相不同地物類型組合之間的Jeffries-Matusita距離[17](表1),結(jié)果顯示單一時(shí)相的Landsat 數(shù)據(jù)下部分地物類型組合之間的Jeffries-Matusita 距離小于1.8,無法滿足監(jiān)督分類的要求。
因此,對9 月2 日的影像進(jìn)行主成分分析(Prin?ciple Component Analysis,PCA),將提取到的前兩個主成分(PC1、PC2)與6 月14 日影像進(jìn)行波段合成,該方法在保留圖像主要波段信息的同時(shí)能有效減少數(shù)據(jù)量。分離度計(jì)算結(jié)果顯示,波段合并后各類地物組合之間的分離度均大于1.8。最后基于不同時(shí)相Landsat 波段合并后的圖像,利用監(jiān)督分類法中的最大似然、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)3 種分類器分別得到句容河流域土地利用結(jié)果。
在使用決策樹法獲取土地利用信息時(shí),選擇合適的特征指數(shù)能大大提高分類效率。研究區(qū)內(nèi)不同土地覆被的光譜特征曲線見圖2,蘇南丘陵區(qū)內(nèi)城鎮(zhèn)數(shù)量較多,其中分布著零星的水體和綠化用地,因此選取歸一化植被指數(shù)NDVI[18]、歸一化建筑指數(shù)NDBI[19]和改進(jìn)的歸一化水體指數(shù)MNDWI[20]提取復(fù)雜背景下的植被、建筑物和水體。建筑用地和裸地的光譜特征較為相似,僅基于NDBI 不能很好地區(qū)分。從圖2 各類地物的光譜特征曲線可以看出,建筑用地和裸地紅光波段(b4)和藍(lán)光波段(b2)的差值有明顯差異,參照歸一化指數(shù)的構(gòu)建方法提出新型簡化裸地指數(shù)NSBI(New simplified bareland index)區(qū)分建筑用地和裸地,見式(1)。
圖2 研究區(qū)域不同時(shí)期主要土地覆蓋的光譜特征曲線
式中,RED、BLUE 分別為紅光波段和藍(lán)光波段的反射率。
不同地物在同一時(shí)間可能表現(xiàn)出相似的光譜特征,如耕地和林地,通過構(gòu)建時(shí)間序列的特征指數(shù)變化曲線可以解決該問題。城鎮(zhèn)建筑用地中分布的綠化植被給城鎮(zhèn)地區(qū)建筑用地和林地的區(qū)分帶來了困難,將NDBI 和NDVI 做差值可以強(qiáng)化建筑物在植被背景下的信息?;谝陨戏治龇謩e做出不同類型地物在3 月10 日、4 月11 日、6 月14 日和9 月2 日4 個時(shí)相的NDVI、MNDWI、NDBI-NDVI 和NSBI 時(shí)間序列變化曲線(圖3)。在不同特征指數(shù)的時(shí)間序列曲線中,相應(yīng)地物的特征信息顯著增強(qiáng):在NDVI 時(shí)間序列曲線中,林地在6 月14 日的NDVI 最高且在6 月—9 月NDVI 變化較小,明顯區(qū)別于其他地物;在MND?WI 時(shí)間序列曲線中,水體在4 個時(shí)期的MNDWI 均遠(yuǎn)高于其他地物;在NDBI-NDVI 時(shí)間序列曲線中,建筑用地和裸地與其余3 種地物的區(qū)別較為顯著,可將建筑用地和裸地提取出來;在NSBI 時(shí)間序列曲線中,裸地在各個時(shí)期的NSBI 都高于建筑用地,可將兩者區(qū)分。最后,通過對研究區(qū)各類地物幾種特征指數(shù)時(shí)間序列曲線的分析建立相應(yīng)的決策樹模型(圖4)對研究區(qū)土地利用信息進(jìn)行提取。
基于采集到的地物樣本數(shù)據(jù),利用混淆矩陣對不同分類方法的精度進(jìn)行評價(jià)。評價(jià)中用到的指標(biāo)有總體分類精度(Overall Accuracy)、制圖精度(Pro?ducer’s Accuracy)、用戶精度(User’s Accuracy)和Kappa 系數(shù),其中總體分類精度為樣本中被正確分類的像元數(shù)(即樣本的地物類型與分類結(jié)果中地物類型一致)占樣本總像元數(shù)的比例,Kappa 系數(shù)用于衡量分類結(jié)果和樣本的一致性,取值區(qū)間為(-1,1),Kappa 系數(shù)越大說明分類結(jié)果和樣本的一致性越好,當(dāng)Kappa 系數(shù)大于0.75 時(shí)可認(rèn)為分類結(jié)果較理想。
圖3 研究區(qū)域各類地物的特征指數(shù)時(shí)間序列曲線
圖4 基于時(shí)間序列特征指數(shù)的決策樹模型
基于4 種分類方法得到的研究區(qū)土地利用結(jié)果見圖5,利用混淆矩陣分別計(jì)算不同提取方法得到的分類結(jié)果的總體精度、Kappa 系數(shù)和每種地物的制圖精度和用戶精度見表2。精度計(jì)算結(jié)果表明,采用4 種地物分類方法的總體精度都在94%以上,其中總體分類精度監(jiān)督分類法>基于時(shí)間序列特征指數(shù)的決策樹法(以下簡稱“決策樹法”)。監(jiān)督分類方法中,總體分類精度支持向量機(jī)法>神經(jīng)網(wǎng)絡(luò)法>最大似然法。決策樹方法基于對部分樣本像元的分析確定分類閾值只能提取出純凈度相對較高的地物像元,可能會導(dǎo)致分類精度偏低,但監(jiān)督分類方法中基于機(jī)器學(xué)習(xí)的提取方法也可能會帶來過擬合效應(yīng)導(dǎo)致提取精度偏高。為研究不同土地利用分類方法在蘇南丘陵區(qū)的分類效果,還應(yīng)從地物空間分布上對分類結(jié)果進(jìn)一步比較分析。
圖5 不同提取方法的土地利用分類結(jié)果
表2 不同提取方法分類精度
為比較不同提取方法得到的土地利用結(jié)果在空間分布上的差異,選取研究流域中一典型區(qū)域進(jìn)行分析。將提取結(jié)果與同期高分辨率谷歌地圖影像(圖6a)進(jìn)行疊加分析,總體來看,不同方法得到的地物分布與谷歌影像顯示結(jié)果基本一致,具有明顯特征的地物都能被識別出來,但對于那些細(xì)小破碎的地物,不同方法的結(jié)果有細(xì)微的差異。從局部分類結(jié)果可以看出,在空間上分布較為破碎的地物(如裸地、建筑用地),神經(jīng)網(wǎng)絡(luò)法(圖6c)和支持向量機(jī)法(圖6d)提取結(jié)果相比于其他兩種方法較差,因?yàn)闄C(jī)器學(xué)習(xí)對樣本很敏感,但在地物分布較為分散和破碎的小流域,很難采集到較多的純地物樣本,相應(yīng)地會影響機(jī)器學(xué)習(xí)法的效果;而最大似然法(圖6b)利用基礎(chǔ)的統(tǒng)計(jì)方法,以地物樣本的均值、分布概率等統(tǒng)計(jì)量作為提取依據(jù),在一定程度上能降低樣本不純凈的影響;決策樹法(圖6e)通過構(gòu)建特征指數(shù)將不同地物差異放大,有利于決策規(guī)則的制定,且提取的結(jié)果在空間上更合理。總體而言,從地物空間分布上來看,決策樹法得到的土地利用結(jié)果更合理,與實(shí)際的地物分布也更接近。
為進(jìn)一步比較不同方法下各類地物的提取差異,分別對4 種土地利用分類結(jié)果中各類地物的面積進(jìn)行統(tǒng)計(jì)(表3)。結(jié)果表明,研究區(qū)內(nèi)耕地面積最大,其次是林地和建筑用地,水體和裸地面積最小,這與研究區(qū)域的實(shí)際情況基本符合。雖然不同分類方法的總體精度都在90%左右,但同種地物在不同分類方法下的面積仍存在差異。分析不同提取方法下土地利用結(jié)果差異的原因,主要是提取原理不同。神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)法都基于機(jī)器學(xué)習(xí),在地物分布較為破碎的區(qū)域,樣本中的噪聲會影響機(jī)器學(xué)習(xí)效果,產(chǎn)生過擬合現(xiàn)象。最大似然法和決策樹法提取結(jié)果中各類地物的面積較接近,因?yàn)檫@2 種方法都是基于統(tǒng)計(jì)分析的原理,能在一定程度上減弱樣本中噪聲帶來的誤差,提取結(jié)果在分布上也更合理。
圖6 各種分類方法局部分類結(jié)果比較
表3 不同提取方法各類地物面積統(tǒng)計(jì) (單位:km2)
蘇南丘陵區(qū)內(nèi)地物分布呈現(xiàn)破碎化,支持向量機(jī)法和神經(jīng)網(wǎng)絡(luò)法對于分布較為分散的建筑用地和裸地提取效果不佳,從圖6c 部分道路、右上角部分的裸地提取效果可以反映出來,而最大似然法和決策樹法分類的結(jié)果反而更貼近真實(shí)情況。因此最大似然和決策樹法在蘇南丘陵區(qū)土地利用分類時(shí)適用性最好。
以江蘇句容河流域?yàn)槔謩e從總體分類精度和空間分布上比較研究了不同遙感分類方法在獲取蘇南丘陵區(qū)土地利用信息時(shí)的差異。結(jié)果表明,監(jiān)督分類法和決策樹法在蘇南丘陵區(qū)的土地利用分類中效果均可行,但支持向量機(jī)法在進(jìn)行土地利用分類時(shí)的分類精度最高,總體分類精度和Kappa 系數(shù)分別為96.4%和0.948,從地物空間分布上看,決策樹法得到的分類結(jié)果與地物的實(shí)際分布情況更接近。總體來說,在進(jìn)行蘇南丘陵區(qū)土地利用分類時(shí),決策樹法和最大似然法適用性最好。
雖然以上分類方法在蘇南丘陵區(qū)的土地利用分類中都能取得較好的效果,但研究區(qū)內(nèi)的云覆蓋問題和混合像元問題仍有待解決。構(gòu)建特征指數(shù)能夠減弱云的影響,但不能從根本上解決云覆蓋問題,尤其是蘇南丘陵地區(qū)的遙感影像中常年存在云覆蓋現(xiàn)象,因此如何處理云覆蓋影像是土地利用分類的難題。此外蘇南丘陵地區(qū)地物的破碎化和分散化分布導(dǎo)致遙感影像中存在較多混合像元,混合像元問題的解決能進(jìn)一步提高分類的精度。