孫玉鑫 梁慶炎 陳勇明
(1. 廣東省國土資源測繪院, 廣東 廣州 510670;2. 自然資源部 華南熱帶亞熱帶自然資源監(jiān)測重點(diǎn)實(shí)驗(yàn)室, 廣東 廣州 510670)
紅樹林是生長在熱帶和亞熱帶地區(qū),陸地和海洋交界的海岸潮間帶灘涂上生長的由木本植物組成的喬木和灌木林群落[1]。紅樹林作為一種獨(dú)特的實(shí)地植被類型,為鳥類、魚類以及海洋生物提供了豐富的食物和良好的棲息環(huán)境,在抵御海洋自然災(zāi)害,維護(hù)海灣、河口生態(tài)環(huán)境,保護(hù)沿海實(shí)地多樣性方面具有不可替代的重要作用[2]。
傳統(tǒng)的實(shí)地調(diào)查方法獲取紅樹林物種信息費(fèi)時(shí)費(fèi)力,且調(diào)查工作往往難以深入根系繁茂的紅樹林內(nèi)部[3]。相比而言,遙感技術(shù)更加經(jīng)濟(jì)高效,能夠?qū)崿F(xiàn)多時(shí)相且空間連續(xù)監(jiān)測植被物種的構(gòu)成[4]。目前,已有大量研究利用遙感技術(shù)對紅樹林物種進(jìn)行識別或分類,中等空間分辨率的多光譜遙感衛(wèi)星影像,如美國陸地衛(wèi)星(Landsat)系列衛(wèi)星、地球觀測衛(wèi)星系統(tǒng)(systeme probatoire d’observation de la terre,SPOT)和哨兵2號(Sentinel-2)常用于識別地區(qū)、國家或全球尺度的紅樹林空間分布,QuickBird、IKONOS、WorldView和Pléiades-1等高空間分辨率多光譜遙感影像,憑借其豐富的空間幾何信息,逐漸用于紅樹林物種的分類研究[5]。
與光譜信息較少的多光譜衛(wèi)星影像相比,高光譜遙感數(shù)據(jù)通常對樹種識別或分類更有效,因?yàn)樗鼈儼松习偕踔辽锨€(gè)連續(xù)波段,具有與植物功能性狀(例如色素含量、比葉面積和氮含量等)相關(guān)的光譜細(xì)節(jié)信息[6]。高光譜數(shù)據(jù)已廣泛用于紅樹林及其他森林物種(例如溫帶森林、亞熱帶森林、熱帶雨林和城市樹木的分類[7-8]。無人機(jī)獲取的高光譜數(shù)據(jù)分辨率往往會更高,包含大量的光譜、紋理與結(jié)構(gòu)特征信息[9]。如何處理高光譜圖像,識別混合像元中紅樹林的信息,避免錯(cuò)分漏分是其中的重點(diǎn)難點(diǎn)[10]。為了解決混合像元的問題,需要將混合像元進(jìn)行亞像元級別的分解[11]。本文基于支持向量機(jī)分類方法,引入像元解混技術(shù)進(jìn)行紅樹林分類研究。
用無人機(jī)搭載納米高光譜成像儀獲取的南沙濕地公園高空間分辨率、高光譜分辨率影像,用作濕地公園局部區(qū)域的紅樹林亞種分類的源數(shù)據(jù)。
在南沙濕地公園內(nèi),開展實(shí)地調(diào)查,詳細(xì)記錄紅樹林基本分布情況,作為紅樹林分類結(jié)果的對照。使用手持地物光譜儀獲取的南沙濕地公園實(shí)地采樣點(diǎn)位數(shù)據(jù)和光譜數(shù)據(jù)作為采樣點(diǎn)光譜數(shù)據(jù)庫。根據(jù)實(shí)際調(diào)查情況,選擇一處紅樹林物種相對較多,環(huán)境影響較為復(fù)雜的典型區(qū)域,對該區(qū)域開展基于無人機(jī)高光譜影像的紅樹林樹種分類工作。
影像數(shù)據(jù)由大疆公司矩陣(Matrice)600專業(yè)型無人機(jī)搭載美國海德沃公司Nano-Hyperspec微型高光譜成像儀獲得,航高200 m,地面分辨率0.1 m,光譜分辨率2.23 nm,覆蓋光譜范圍400~1000 nm,包含有269個(gè)波段。實(shí)驗(yàn)中使用的數(shù)據(jù)格式為像素按行存儲(band interleaved by line,BIL)。截取其大小為2000×2000像素的影像作為試驗(yàn)區(qū)(圖1)。南沙濕地公園共二期工程,選取一期進(jìn)行航飛,面積大約2 km2。影像主體部分位于一期中心,地物種類主要是蘆葦、木欖、秋茄、水黃皮、鐵冬青和水面。
圖1 開展紅樹林樹種分類的試驗(yàn)區(qū)域
在實(shí)地調(diào)查中,在光照充足的情況下,采用手持光譜儀采集樹種的光譜曲線信息,考慮到其他植物、水體、土壤等周圍環(huán)境對光譜曲線的影響,同時(shí)采集周圍環(huán)境的光譜信息,為端元光譜提供參考。
根據(jù)實(shí)地調(diào)查數(shù)據(jù)對該區(qū)域每一個(gè)樹種采集樣本,并將采集到的樹種樣本對應(yīng)到無人機(jī)影像中的對應(yīng)區(qū)域,作為各樹種的參考樣本,并以參考樣本的光譜作為參考在全幅影像上均勻地選取一定數(shù)量的端元,得到各樹種的候選端元集合,如圖2所示。
圖2 端元制作示意圖
由于水域不是本文關(guān)注重點(diǎn),采用掩膜法手工去除塊圖中的水域部分。
由于無人機(jī)拍攝時(shí)環(huán)境條件存在差異、拍攝時(shí)機(jī)身的擺動造成不同條帶光譜存在差異、條帶拼接時(shí)存在偏移等問題,對高光譜影像進(jìn)行預(yù)處理,包括亮度轉(zhuǎn)換,反射率校正,幾何校正,再使用遙感圖像處理系統(tǒng)的專業(yè)鑲嵌(MosaicPro)模塊對校正結(jié)果進(jìn)行拼接,根據(jù)先驗(yàn)知識和影像各波段質(zhì)量情況,去除部分波段后得到試驗(yàn)區(qū)的完整塊圖。塊圖包含的波段信息如表1所示。
表1 試驗(yàn)區(qū)影像波段信息
本實(shí)驗(yàn)用到了以下技術(shù)方法:
(1)支持向量機(jī)(support vector machine,SVM)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)算法。它通過解算最優(yōu)化問題,在高維特征空間中尋找最優(yōu)分類超平面,從而解決復(fù)雜數(shù)據(jù)的分類及回歸問題[12]。支持向量機(jī)屬于一般化線性分類器,這種分類器的特點(diǎn)是他們能夠同時(shí)最小化經(jīng)驗(yàn)誤差與最大化幾何邊緣區(qū),因此支持向量機(jī)也被稱為最大邊緣區(qū)分類器。
(2)光譜解混。受高光譜成像儀空間分辨率限制,以及紅樹林區(qū)域樹種混雜原因,一個(gè)像元內(nèi)往往包含多個(gè)樹種,高光譜遙感圖像存在大量混合像元,對高光譜圖像的混合像元分解得到端元及豐度的過程,一般稱為像元的光譜解混。其中,端元代表圖像中存在的純物質(zhì),豐度代表某個(gè)像素中的每個(gè)端元所點(diǎn)的百分比[13]。
(3)多端元線性混合光譜分解?;旌舷裨歉吖庾V圖像目標(biāo)分類準(zhǔn)確率降低的主要原因之一,因此不能直接進(jìn)行基于像元的監(jiān)督分類[14]。本文使用多端元線性混合光譜分解的方法,即光譜解混時(shí)對塊圖的每個(gè)像素進(jìn)行像素級分類,從而得到反映每個(gè)像素內(nèi)具有的樹種及其對應(yīng)的比例的豐度圖。該豐度圖得到了單個(gè)像素內(nèi)所具有的樹種及其對應(yīng)的比例,在亞像元級別反映各樹種的分布,更符合真實(shí)的樹種分布。在此基礎(chǔ)上,考慮每個(gè)像素的最大豐度樹種和相鄰像素的情況,處理形成最終合理的分類結(jié)果。
(4)混淆矩陣算法?;煜仃囁惴ㄊ乾F(xiàn)在國際上比較通用的遙感影像分類精度評價(jià)方法,在圖像精度評價(jià)中,通過將每個(gè)實(shí)測像元的類別與分類成果圖像中的同一位置的像元類別相比較計(jì)算得到[15]。分類情況一般分為4種,如表2所示。
表2 混淆矩陣分類信息表
PT、NF、PF、NF表示:
PT為真的正樣本(true positives,TP)=【正樣本】被正確分為【正樣本】
NT為真的負(fù)樣本(true negatives,TN)=【負(fù)樣本】被正確分為【負(fù)樣本】
PF為假的正樣本(false positives,FP)=【負(fù)樣本】被錯(cuò)誤分為【正樣本】
NF為假的負(fù)樣本(false negatives,FN)=【正樣本】被錯(cuò)誤分為【負(fù)樣本】
總體分類準(zhǔn)確率(Accuracy)計(jì)算公式見式(1)。
基于以上技術(shù)方法和建立的端元光譜庫,本文對試驗(yàn)區(qū)紅樹林樹種開展分類工作。
對于支持向量機(jī)分類部分,本文將端元光譜庫的樣本直接采用為監(jiān)督分類的樣本,具體包括蘆葦、木欖、秋茄、水黃皮、鐵冬青。再根據(jù)傳統(tǒng)的支持向量機(jī)分類模型對預(yù)處理后的塊圖執(zhí)行監(jiān)督分類,使用傳統(tǒng)的分類方法直接對每個(gè)像元賦予了樹種類別,得到支持向量機(jī)分類結(jié)果。分類結(jié)果如圖3所示。
圖3 支持向量機(jī)分類結(jié)果示意圖
由于傳統(tǒng)的分類方法直接對每個(gè)像元賦予特定的類別,但在紅樹林區(qū)域是不合理的。在前面的數(shù)據(jù)基礎(chǔ)上,通過多端元線性混合光譜分解得到各樹種類別的豐度圖,再進(jìn)一步處理形成分類結(jié)果,如圖4所示。
圖4 解混分類結(jié)果示意圖
在進(jìn)行精度評價(jià)前,本文根據(jù)實(shí)地調(diào)查情況,制作了樹種總體分布概況示意圖(圖5),作為分類結(jié)果的對照。由于試驗(yàn)區(qū)紅樹林空間分布復(fù)雜,局部區(qū)域不存在只有單一植被的情況,且混雜程度不一,分布圖僅描繪了不同區(qū)域的優(yōu)勢樹種,不排除存在其他植被的可能性。因此,不能直接使用分布圖進(jìn)行精度評定。
圖5 樹種總體分布概況示意圖
考慮到分布圖的局限性,實(shí)驗(yàn)在充分參考樹種分布概況的前提下,根據(jù)紋理、色彩、大小、陰影等特征、直接在影像上采集樣本,作為像元類別實(shí)測數(shù)據(jù),再分別統(tǒng)計(jì)支持向量機(jī)分類結(jié)果和解混分類結(jié)果,形成混淆矩陣,如表3、表4所示。
表3 支持向量機(jī)結(jié)果混淆矩陣
表4 解混結(jié)果混淆矩陣
根據(jù)支持向量機(jī)分類結(jié)果和解混分類結(jié)果的混淆矩陣,計(jì)算兩種分類方法的總體分類精度,結(jié)果如表5所示。
表5 總體精度評價(jià) 單位:%
將分類結(jié)果與實(shí)地調(diào)查數(shù)據(jù)對比,除去個(gè)別區(qū)域植被繁雜、周圍環(huán)境干擾使產(chǎn)生的混合像元難以解混,以及“同物異譜”或“同譜異物”的現(xiàn)象存在,造成部分樹種分類與實(shí)際有出入之外,兩種分類結(jié)果總體上與實(shí)地調(diào)查中紅樹林樹種分布的情況基本一致。其中,支持向量機(jī)分類總體精度達(dá)到80.88%,光譜解混后分類精度進(jìn)一步達(dá)到83.93%??梢钥吹?在基于無人機(jī)高光譜影像的樹種識別中,解混和支持向量機(jī)方法都能較好地識別出紅樹林的樹種,總體精度都達(dá)到了80%以上。相比于支持向量機(jī)分類方法,在近水形成的紅樹林混交區(qū)域,解混方法在紅樹林混交區(qū)域總體上表現(xiàn)更好,能夠在一定程度上提高紅樹林的分類精度。
在本實(shí)驗(yàn)中,存在不少未能識別成功的區(qū)域,經(jīng)分析影像質(zhì)量發(fā)現(xiàn),這些區(qū)域除了少數(shù)是其他植被之外,大部分為陰影、水體附近等影像特征信息較少的區(qū)域。光譜解混方法明顯提升了木欖、蘆葦、鐵冬青的分類精度,但在水黃皮、秋茄分類中不占優(yōu)勢,究其原因:①秋茄和水黃皮之間的波形及反射率值十分相近,在分類時(shí)容易錯(cuò)分;②秋茄本身植株矮小,光譜特征受其他植株影響較大,干擾光譜解混的豐度計(jì)算,影響最終分類。
本次實(shí)驗(yàn)進(jìn)行了大量的紅樹林高光譜數(shù)據(jù)獲取和處理工作,積累了一些寶貴的經(jīng)驗(yàn)。
(1)紅樹林生長區(qū)域樹種空間混雜,混合像元眾多,為保證分類準(zhǔn)確性,樹種的光譜信息宜優(yōu)先實(shí)地采樣獲取。
(2)對紅樹林樹種分類時(shí)不能直接根據(jù)像元?jiǎng)澐謽浞N,必須對像元進(jìn)行光譜解混,才能得到更接近于真實(shí)的分類結(jié)果。
(3)高質(zhì)量的影像數(shù)據(jù)是實(shí)現(xiàn)準(zhǔn)確分類不可忽視的重要前提條件。
(4)高光譜影像具有超高的光譜分辨率,能夠反映出不同樹種間的光譜差異,為不同樹種分類提供可能,但仍有部分樹種間的光譜差異十分細(xì)微,它們的波形及反射率值都很相近,像元解混存在困難,容易造成錯(cuò)分,需要進(jìn)一步研究更有效的分類方法。
總的來說,像元解混是一項(xiàng)行之有效的技術(shù)方法,能夠明顯提高目標(biāo)分類精度,基于高光譜影像進(jìn)行樹種監(jiān)督分類的技術(shù)手段較為成熟,有著非常廣闊的應(yīng)用前景[16]。