李雨秦,左小清,李洪忠
(1. 昆明理工大學(xué) 國(guó)土資源工程學(xué)院;2. 中國(guó)科學(xué)院 深圳先進(jìn)技術(shù)研究院)
紅樹(shù)林以有效地防浪護(hù)堤,凈化海水,預(yù)防赤潮發(fā)生,其具有結(jié)構(gòu)的復(fù)雜性,物種的多樣性,生產(chǎn)力的高效性,具有獨(dú)特的生態(tài)功能和重大的社會(huì)經(jīng)濟(jì)價(jià)值。而紅樹(shù)林可持續(xù)保護(hù)需要更好地監(jiān)測(cè)紅樹(shù)林的演替、分布等動(dòng)態(tài)信息和結(jié)構(gòu),因此需要迅速和精準(zhǔn)的繪圖,遙感技術(shù)的發(fā)展為滿足這一需求提供了可能。
Verheyden等[1]在對(duì)斯里蘭卡紅樹(shù)林地區(qū)航空攝影照片的目視解譯中,識(shí)別出單個(gè)樹(shù)木的圖像屬性以及物種組合,研究了航空攝影在高分辨率紅樹(shù)林植被動(dòng)態(tài)監(jiān)測(cè)中的適用性,結(jié)果表明航空照片適用于繪制以屬為基礎(chǔ)的植被地圖。Wang Le[2]等對(duì)比使用IKONOS和QuickBird影像,采用最大似然法對(duì)巴拿馬的加勒比海岸的三種紅樹(shù)林樹(shù)種進(jìn)行了分類,結(jié)果顯示二者在紅樹(shù)林物種分類領(lǐng)域均獲得了較為期待的結(jié)果,并且分類精度均達(dá)到了制圖要求。唐煥麗等[3]基于 WorldView-2影像數(shù)據(jù),對(duì)比了基于支持向量機(jī)的單一尺度和多尺度的面向?qū)ο蠓诸惙椒?,結(jié)果表明與單一尺度分類方法相比,多尺度分類方法的分類精度更高。
樹(shù)木種間分類對(duì)于遙感數(shù)據(jù)分辨率要求較高,因此具有更高的空間分辨率和光譜分辨率的影像數(shù)據(jù)可以提供更為精細(xì)的紅樹(shù)林樹(shù)種種間分類結(jié)果[4-6]。本文以 WorldView-2多光譜遙感影像數(shù)據(jù)為數(shù)據(jù)源,結(jié)合野外實(shí)地采樣樣點(diǎn),對(duì)比分析了人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隨機(jī)森林三種常用的分類方法的適用性,為后續(xù)高分辨率遙感影像的紅樹(shù)林中間分類提供參考。
深圳灣是香港和深圳市之間的一個(gè)海灣,準(zhǔn)確位置介乎中國(guó)香港新界西北部和中國(guó)廣東省深圳市南山區(qū)的東部對(duì)開(kāi)海域,位于元朗平原以西、蛇口以東。本研究區(qū)為深圳灣紅樹(shù)林自然保護(hù)區(qū),位于深圳灣北東岸深圳河口的紅樹(shù)林鳥(niǎo)類自然保護(hù)區(qū)之中,包括福田自然保護(hù)區(qū)和米埔自然保護(hù)區(qū)(具體位置如圖1所示)。
本文所用數(shù)據(jù)為分辨率為2 m的WorldView-2多光譜遙感影像數(shù)據(jù)(詳細(xì)波段參數(shù)見(jiàn)下表)以及野外實(shí)地采樣的樣點(diǎn)數(shù)據(jù)。樣點(diǎn)數(shù)據(jù)的由野外實(shí)地采樣獲取,采樣時(shí)間為2016年下半年,樣地的地理位置由使用手持GPS獲得的樣地中心經(jīng)緯度確定。
圖1 研究區(qū)位置示意圖(左圖取自谷歌地球)Fig.1 Schematic diagram of the location of the study area (the left picture is taken from Google earth)
表1 WorldView-2數(shù)據(jù)參數(shù)Tab.1 Brief introduction about satellite data of WorldView-2 imagery
遙感數(shù)據(jù)的預(yù)處理主要包括輻射定標(biāo)、大氣校正、幾何校正、正射校正等過(guò)程。輻射定標(biāo)將遙感影像的數(shù)字量化值(DN)轉(zhuǎn)化為大氣表觀輻射亮度值等物理量。大氣校正消除大氣影響造成的輻射誤差,反演地物真實(shí)的地表反射率,將表觀輻射亮度數(shù)據(jù)轉(zhuǎn)換為地表反射率數(shù)據(jù)。正射校正是幾何校正的最高級(jí)別,一般所說(shuō)的幾何校正是消除因大氣傳輸、傳感器本身、地球曲率等因素造成的幾何畸變,主要糾正或者賦予影像平面坐標(biāo)。正射校正除了進(jìn)行常規(guī)的幾何校正的功能外,還要根據(jù) DEM 來(lái)糾正影像因地形起伏而產(chǎn)生的畸變,會(huì)給圖像加上高程信息。本文所使用的 WorldView-2遙感影像數(shù)據(jù)主要進(jìn)行了輻射校正、幾何校正等預(yù)處理工作,均利用ENVI5.3中預(yù)處理工具進(jìn)行。
本研究選用了人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隨機(jī)森林三種分類方法對(duì) WorldView-2遙感影像數(shù)據(jù)進(jìn)行分類處理(均使用ENVI5.3軟件進(jìn)行處理)。
人工神經(jīng)網(wǎng)絡(luò),簡(jiǎn)稱為神經(jīng)網(wǎng)絡(luò)(NNs),它模仿人腦的神經(jīng)網(wǎng)絡(luò),進(jìn)行分布式并行信息處理。這種網(wǎng)絡(luò)靠著系統(tǒng)的復(fù)雜程度,通過(guò)多層的神經(jīng)網(wǎng)絡(luò),無(wú)限逼近真實(shí)的對(duì)應(yīng)函數(shù),進(jìn)而處理信息、模擬數(shù)據(jù)之間的真實(shí)關(guān)系。滕駿華等[7]通過(guò)人工神經(jīng)網(wǎng)絡(luò)分類方法將紅樹(shù)林群落信息分類并繪成專題圖。梁益同等[8]應(yīng)用神經(jīng)網(wǎng)絡(luò)對(duì)NOAA衛(wèi)星圖像進(jìn)行分類的基本原理和方法,并進(jìn)行了實(shí)例分析,結(jié)果證明了該方法的有效性。李四海等[9]為了探討中巴資源衛(wèi)星數(shù)據(jù)在紅樹(shù)林資源調(diào)查中的應(yīng)用能力,采用神經(jīng)網(wǎng)絡(luò)分類法進(jìn)行分類處理,并獲得精度較高的分類結(jié)果。劉凱等[10]將TM圖像與SAR圖像相融合,應(yīng)用神經(jīng)網(wǎng)絡(luò)分類法進(jìn)行分類,并取得較好結(jié)果。王祥等[11]用神經(jīng)網(wǎng)絡(luò)法對(duì)廣西山口紅樹(shù)林保護(hù)區(qū)的Landsat TM衛(wèi)星圖像進(jìn)行分類,并最終獲取紅樹(shù)林生態(tài)系統(tǒng)的景觀格局指標(biāo)。
支持向量機(jī),簡(jiǎn)稱SVM,由早期工作來(lái)自前蘇聯(lián)學(xué)者Vladimir N. Vapnik和Alexander Y. Lerner在1963年發(fā)表的研究[12]。支持向量機(jī)是以監(jiān)督學(xué)習(xí)的方式進(jìn)行二元分類的廣義線性分類器,是對(duì)線性分類器的改進(jìn),目的是找出最大邊距超平面。其主要思想是通過(guò)升維,將線性不可分的情況轉(zhuǎn)變?yōu)榫€性可分,進(jìn)而基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化在特征空間中構(gòu)造超平面。因此,對(duì)于高維模式識(shí)別、樣本數(shù)據(jù)線性不可分等情況,支持向量機(jī)相對(duì)于問(wèn)題的復(fù)雜度,需要的樣本較少且結(jié)果較優(yōu)[13]。本實(shí)驗(yàn)核函數(shù)選用徑向基函數(shù),是支持向量機(jī)最常用的一種核函數(shù)。周磊等[14]基于1990-2016年6個(gè)時(shí)期Landsat TM/OLI中等分辨率衛(wèi)星遙感影像數(shù)據(jù),采用支持向量機(jī)方法的孟加拉國(guó)海岸帶紅樹(shù)林遙感監(jiān)測(cè),最終給出了 6個(gè)時(shí)期改區(qū)域紅樹(shù)林空間分布狀況,分析了紅樹(shù)林30年間的演變趨勢(shì)。
隨機(jī)森林,簡(jiǎn)稱RF,一種將多顆決策樹(shù)集成的算法。它由Leo Breiman和Adele Cutler于1995年提出[15]。隨機(jī)森林以決策樹(shù)為基本單位,通過(guò)決策樹(shù)的投票來(lái)決定最后的分類結(jié)果。它重視各個(gè)特征在分類問(wèn)題上的重要性,可以有效減少?zèng)Q策樹(shù)過(guò)擬合的不足,提升泛化能力,能夠有效地運(yùn)用在大數(shù)據(jù)集上。不需要對(duì)高維特征的輸入樣本進(jìn)行降維,對(duì)部分特征缺失不敏感,且具有極好的準(zhǔn)確率。本研究使用了 ENVI拓展隨機(jī)森林工具(源碼來(lái)源于ENMAP-BOX v2.1.1并對(duì)其進(jìn)行封裝,方便其在ENVI下使用)[16],選用基尼系數(shù)作為節(jié)點(diǎn)特征選取的判定標(biāo)準(zhǔn),通過(guò)計(jì)算平方根確定每個(gè)節(jié)點(diǎn)備選特征的數(shù)量,設(shè)置100棵樹(shù)進(jìn)行投票,確定最終結(jié)果。Romie Jhonnerie等[17]曾基于Landsat 5 TM和ALOS PALSAR圖像,采用隨機(jī)森林分類法對(duì)紅樹(shù)林植被進(jìn)行分類,結(jié)果顯示,隨機(jī)森林分類器總體精度及Kappa系數(shù)分別為81.1%和0.76,優(yōu)于最大似然分類器分類結(jié)果的精度。
下圖為WorldView-2遙感影像數(shù)據(jù)分別使用三種分類方法的分類結(jié)果對(duì)比。對(duì)群落分布結(jié)果進(jìn)行目視解譯,可以發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)與隨機(jī)森林分類法的群落分布狀況基本相同。秋茄和桐花樹(shù)分布最為廣泛,幾乎遍布整個(gè)研究區(qū);海桑集中分布于研究區(qū)西北角以及沿海區(qū)域;老鼠簕與白骨壤分布較為隨機(jī),并且十分分散。就無(wú)瓣海桑而言,神經(jīng)網(wǎng)絡(luò)分類法(圖 2(a))與隨機(jī)森林分類法(圖 2(b))的結(jié)果較為一致:集中分布于中部;而與隨機(jī)森林分類法(圖2(c))呈現(xiàn)的結(jié)果則顯示研究區(qū)內(nèi)存在更多的無(wú)瓣海桑與海桑的混生群落,幾乎無(wú)無(wú)瓣海桑的單一群落。
圖2 三種分類方法的分類結(jié)果Fig.2 Classification results of the three classification methods
結(jié)果顯示(表2),隨機(jī)森林分類法的分類結(jié)果中,總體精度為73.6842%,高出神經(jīng)網(wǎng)絡(luò)分類法5.26個(gè)百分點(diǎn),高出支持向量機(jī)分類法6.3個(gè)百分點(diǎn);Kappa系數(shù)為0.6780,高出神經(jīng)網(wǎng)絡(luò)分類法0.064,高出支持向量機(jī)分類法0.083。說(shuō)明在基于WorldView-2多光譜遙感影像數(shù)據(jù)的紅樹(shù)林樹(shù)種分類實(shí)驗(yàn)中,隨機(jī)森林分類法較神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)分類法能夠有效地提高分類精度。
表2 三種分類方法的混淆矩陣Tab.2 Confusion matrix of the three classification methods
從上表可以看出,使用神經(jīng)網(wǎng)絡(luò)分類法時(shí)(表2(a)),桐花樹(shù)的生產(chǎn)者精度最佳,老鼠簕的用戶精度最佳,但是存在較多的老鼠簕被誤分為桐花樹(shù)。使用支持向量機(jī)分類法時(shí)(表2(b)),桐花樹(shù)的生產(chǎn)者精度最佳,白骨壤和無(wú)瓣海桑的用戶精度最佳。使用隨機(jī)森林分類法時(shí)(表2(c)),桐花樹(shù)的生產(chǎn)者精度最佳,秋茄的用戶精度最佳。而三種方法中白骨壤的用戶精度和生產(chǎn)者精度均為最低。由于研究區(qū)內(nèi)存在大量?jī)煞N以及兩種以上紅樹(shù)林樹(shù)種的混生群落,生長(zhǎng)邊界不清晰,極大地增大了識(shí)別的難度,而由于采樣條件的限制,不同樹(shù)種的樣本數(shù)量有較大差別,這些因素在一定程度上都會(huì)對(duì)分類結(jié)果造成影響。
本研究以深圳灣的深圳福田自然保護(hù)區(qū)和香港米埔自然保護(hù)區(qū)為研究區(qū)域,以該地區(qū)的紅樹(shù)林為研究對(duì)象,通過(guò)梳理國(guó)內(nèi)外關(guān)于樹(shù)種分類相關(guān)研究?jī)?nèi)容,借助ENVI5.3、ArcGIS10.2軟件,分別分析了三種分類方法紅樹(shù)林種間分類中的適用性。結(jié)果顯示:神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)與隨機(jī)森林分類法的群落分布狀況基本相同,但隨機(jī)森林分類法的總體精度和Kappa系數(shù)明顯高于神經(jīng)網(wǎng)絡(luò)分類法和支持向量機(jī)分類法,即在基于 WorldView-2多光譜遙感影像數(shù)據(jù)的紅樹(shù)林樹(shù)種分類實(shí)驗(yàn)中,隨機(jī)森林分類法較神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)分類法能夠有效地提高分類精度。
本研究還存在一些不足,需要后續(xù)進(jìn)一步完善:本文選取的分類方法對(duì)于混生群落的分類精度偏低,對(duì)過(guò)于分散的零星樹(shù)種識(shí)別度較差。樣本數(shù)量不均衡可能會(huì)給分類結(jié)果帶來(lái)偏差,后續(xù)有條件可新增實(shí)地采樣樣點(diǎn)以進(jìn)一步完善實(shí)驗(yàn)內(nèi)容。