李曉雅,田昕,段濤,曹曉明,楊凱捷,盧琦,王鋒
1.中國(guó)林業(yè)科學(xué)研究院荒漠化研究所,北京 100091;2.中國(guó)林業(yè)科學(xué)研究院資源信息研究所,北京 100091;3.中國(guó)科學(xué)院微電子研究所,北京 100029
溫帶疏林草原是中國(guó)半干旱區(qū)的重要生態(tài)系統(tǒng),是在中國(guó)北方森林、草原生態(tài)系統(tǒng)過(guò)渡區(qū)域發(fā)育于沙地的地帶性頂級(jí)群落(于順利,2011;史宇飛 等,2011)。榆樹疏林曾廣泛分布于松遼平原和內(nèi)蒙古高原,由于生境的喪失,目前主要分布于內(nèi)蒙古高原的渾善達(dá)克沙地、科爾沁沙地、呼倫貝爾沙地和毛烏素沙地等地,其中以渾善達(dá)克沙地和科爾沁沙地分布面積最廣,疏林草原景觀最為典型(于順利和陳宏偉,2007)。準(zhǔn)確掌握疏林草原的分布及動(dòng)態(tài),不僅有利于加深對(duì)中國(guó)溫帶疏林草原生態(tài)系統(tǒng)的理解,進(jìn)一步也可為溫帶疏林草原的恢復(fù)和重建提供科學(xué)依據(jù)。
植被覆蓋度是定量化表征地表植物群落的重要指標(biāo),同時(shí)反映著區(qū)域生態(tài)環(huán)境的變化(DeFries等,2007;Yang 等,2012)。定量獲取疏林草原植被覆蓋度、準(zhǔn)確反演植被動(dòng)態(tài)變化規(guī)律,是實(shí)現(xiàn)疏林草原動(dòng)態(tài)監(jiān)測(cè)與評(píng)估的前提。獲取植被覆蓋度的方法主要包括地面測(cè)量和遙感解譯兩種途徑。野外觀測(cè)獲得的植被覆蓋度信息是實(shí)現(xiàn)覆蓋度遙感反演的基礎(chǔ),為覆蓋度遙感反演提供訓(xùn)練數(shù)據(jù)及驗(yàn)證信息。目前使用遙感手段進(jìn)行覆蓋度反演的方主要包括植被指數(shù)、經(jīng)驗(yàn)?zāi)P?、混合像元分解模型和機(jī)器學(xué)習(xí)方法,植被指數(shù)法通過(guò)建立植被指數(shù)與覆蓋度之間的關(guān)系反演植被覆蓋度(Harris等,2014;Wang 等,2020);經(jīng)驗(yàn)?zāi)P图唇⒉ǘ涡畔⑴c覆蓋度之間的經(jīng)驗(yàn)?zāi)P凸浪阒脖桓采w度(岳健 等,2020),經(jīng)驗(yàn)?zāi)P蛯?duì)數(shù)據(jù)集的正態(tài)分布特性和波段信息的獨(dú)立性要求較高,僅適用于特定的區(qū)域及特定值被,使其在大尺度植被覆蓋度估算中具有一定的局限性(賈坤 等,2013);混合像元分解方法同樣被廣泛應(yīng)用于半干旱地區(qū)植被覆蓋度的估測(cè)中(Cui 等,2019),該方法利用像元分解模型分解像元中各端元的亮度信息貢獻(xiàn),獲得端元植被豐度以估算值被覆蓋度(Adams 等,1986)。混合像元分解方法前期對(duì)光譜端元的選取嚴(yán)重影響到像元分解的精度,植被覆蓋度估測(cè)能力不穩(wěn)定(李曉松 等,2010),且疏林草原具有較復(fù)雜的地表覆蓋情況,端元組合較為復(fù)雜。
機(jī)器學(xué)習(xí)方法是通過(guò)構(gòu)建樣本數(shù)據(jù)集,結(jié)合地形、氣候、植被指數(shù)、光譜信息等預(yù)測(cè)變量,運(yùn)用數(shù)據(jù)挖掘方法找出隱含在預(yù)測(cè)變量和分類樣本之間的相關(guān)關(guān)系,并自動(dòng)建立估算模型,屬于遙感影像解譯中全監(jiān)督學(xué)習(xí)類方法(周培誠(chéng) 等,2021)。由于機(jī)器方法更適合處理復(fù)雜海量的數(shù)據(jù)集(Brandt等,2016)并具有較高的計(jì)算效率與估算精度,在干旱半干旱區(qū)植被覆蓋類型圖的繪制以及植被覆蓋度反演等方面得到了廣泛的應(yīng)用(Zhang等,2019;陳黔 等,2019;Hunter等,2020)。
疏林草原具有喬木、灌木和草本植被混合生長(zhǎng)的特點(diǎn),在植物斑塊化分布、高異質(zhì)性景觀的疏林草原區(qū)域,利用中低分辨率衛(wèi)星遙感影像識(shí)別疏林草原,精度難以保證(Latifovic 和Olthof,2004)。近年來(lái),覆蓋全球的高分辨率衛(wèi)星不斷涌現(xiàn),出現(xiàn)了覆蓋全球范圍的中高分辨率衛(wèi)星如哨兵(Sentinel)和國(guó)產(chǎn)高分(GF),為區(qū)域尺度的疏林草原植被覆蓋度估算提供了有利條件。
無(wú)人機(jī)飛行時(shí)間、靈活、可搭載多種類型傳感器,具有獲取植被結(jié)構(gòu)特征、識(shí)別矮小植株的高空間分辨率優(yōu)勢(shì)(Kattenborn 等,2019),被廣泛應(yīng)用到植被遙感分類和監(jiān)測(cè)中(韓東 等,2018;Wang等,2019;張順 等,2019;蔡棟 等,2019)。無(wú)人機(jī)近地遙感觀測(cè)技術(shù)的逐漸成熟,也帶動(dòng)了遙感信息由過(guò)去地面監(jiān)測(cè)與衛(wèi)星遙感的“二維數(shù)據(jù)”到星—空—地“三維數(shù)據(jù)”的轉(zhuǎn)變,成為地面觀測(cè)與衛(wèi)星遙感之間重要的紐帶,為生態(tài)遙感的進(jìn)一步發(fā)展提供了新的機(jī)遇(蔡宗磊 等,2019;郭慶華 等,2020;廖小罕 等,2019)。不過(guò)由于受到無(wú)人機(jī)續(xù)航時(shí)間的限制,通過(guò)無(wú)人機(jī)實(shí)現(xiàn)區(qū)域尺度的植被監(jiān)測(cè)還面臨較大的挑戰(zhàn)。
在利用不同空間尺度遙感數(shù)據(jù)時(shí),較大的空間尺度可以反應(yīng)區(qū)域上的規(guī)律,較精細(xì)的空間尺度可以揭示復(fù)雜的地表特征(萬(wàn)昌君 等,2019)。最近出現(xiàn)的這些新數(shù)據(jù)源為我們帶來(lái)了啟示,是否可同時(shí)利用近地遙感和高分辨率衛(wèi)星遙感兩種高空間分辨率數(shù)據(jù)源,基于機(jī)器學(xué)習(xí)算法融合兩種數(shù)據(jù)源在植被遙感監(jiān)測(cè)中各自的優(yōu)勢(shì),實(shí)現(xiàn)區(qū)域尺度溫帶疏林草原不同類型植物的高效精準(zhǔn)識(shí)別和動(dòng)態(tài)監(jiān)測(cè)?
因此,本研究探索了如何利用高分辨率衛(wèi)星(GF-6 和Sentinel-2)結(jié)合近地遙感獲取的超高分辨率影像,基于機(jī)器學(xué)習(xí)算法估算疏林草原上木本植物和草本植被的覆蓋度。具體目標(biāo)為:(1)基于無(wú)人機(jī)正射影像,利用分類和回歸樹算法對(duì)疏林草原木本植物和草本植物進(jìn)行自動(dòng)精準(zhǔn)分類;(2)利用隨機(jī)森林算法,實(shí)現(xiàn)從無(wú)人機(jī)正射影像到高分衛(wèi)星影像的疏林草原木本植物和草本植被覆蓋度的估算;(3)比較GF-6 和Sentinel-2 兩種高分辨率衛(wèi)星影像對(duì)疏林草原木本植物和草本植被覆蓋度估算的差異。
研究區(qū)位于中國(guó)內(nèi)蒙古自治區(qū)錫林郭勒盟正藍(lán)旗渾善達(dá)克沙地榆樹疏林草原長(zhǎng)期定位觀測(cè)大樣地,地理位置為42°57′34″N—42°58′15″N,115°57′E—115°58′E,平均海拔高度約為1300 m,面積為1 km×1 km(圖1)。該區(qū)域?qū)儆诟珊怠敫珊荡箨懶詺夂?,年平均氣?.1 ℃,降水集中于7—9 月,年平均降水量為313 mm。疏林草原生態(tài)系統(tǒng)由喬木層、灌木層和草本層3 層垂直結(jié)構(gòu)組成(于順利 等,2007)。將研究區(qū)內(nèi)的唯一喬木種榆樹(Ulmus pumila)和伴生灌木如耬斗葉繡線菊(Spiraea aquilegifolia)、小紅柳(Salix microstachyavar.bordensis)、黃柳(Salix gordejevii)、柴樺(Betula fruticosa)等14種灌木種定義為木本植物。草本層則主要由多年生草本褐沙蒿(Artemisia intramongolica)和一年生草本叉分蓼(Polygonum divaricatum),羊草(Aneurolepidum chinense)等近190 種草本植物構(gòu)成(韓東 等,2018)。
圖1 中國(guó)內(nèi)蒙古自治區(qū)渾善達(dá)克沙地榆樹疏林草原長(zhǎng)期定位監(jiān)測(cè)大樣地Fig.1 Long-term monitoring plot in Elm(Ulmus pumila)sparse forest grassland ecosystem in the Otindag sandy land(ESFOGE-Plot)Inner Mongolia,China
2.2.1 無(wú)人機(jī)影像數(shù)據(jù)
為了建立精準(zhǔn)的疏林草原植被覆蓋度訓(xùn)練數(shù)據(jù)集,選用配置1 cm 精度導(dǎo)航定位和具有2000 萬(wàn)像素CMOS傳感器的小型多旋翼高精度航測(cè)無(wú)人機(jī)(精靈4 RTK,大疆,中國(guó)深圳),采集榆樹疏林草原長(zhǎng)期定位觀測(cè)大樣地的無(wú)人機(jī)正射影像。本研究根據(jù)研究區(qū)的邊界設(shè)計(jì)無(wú)人機(jī)飛行方案進(jìn)行航空影像采集,影像拍攝時(shí)間為2020 年7 月20 日,拍攝時(shí)長(zhǎng)為2 h,共采集到1334 張?jiān)己脚挠跋?,無(wú)人機(jī)飛行參數(shù)設(shè)置見(jiàn)表1。利用實(shí)景三維建模軟件Agisoft Metashape(V1.6.5,Agisoft,俄羅斯)對(duì)原始航拍影像進(jìn)行校正和拼接處理,最終獲取樣地的數(shù)字正射影像圖DOM(空間分辨率為2.41 cm/pixel,圖2(a))。
表1 榆樹疏林草原長(zhǎng)期定位觀測(cè)大樣地?zé)o人機(jī)航拍飛行參數(shù)Table 1 Flight parameters of Unmanned Aerial Vehicle(UAV)aerial photogrammetry in the long-term monitoring plot in Elm Sparse Forest Grassland
圖2 榆樹疏林草原長(zhǎng)期定位觀測(cè)大樣地?zé)o人機(jī)正射影像和高分衛(wèi)星影像(框圖部分為分類精度驗(yàn)證區(qū)域)Fig.2 High resolution UAV and satellite images of long-term monitoring plot in Elm sparse forest grassland ecosystem(The area covered by a black box is the sample for validating the classification accuracy)
2.2.2 衛(wèi)星影像數(shù)據(jù)
選用GF-6 和Sentinel-2 作為衛(wèi)星影像數(shù)據(jù)??紤]衛(wèi)星過(guò)境時(shí)間及云量,分別選取2020 年7 月22 日GF-6 影像和2020 年7 月1 日Sentinel-2 影像。GF-6影像預(yù)處理過(guò)程包括輻射定標(biāo)、大氣校正等。GF-6 衛(wèi)星輻射定標(biāo)采用中國(guó)資源衛(wèi)星應(yīng)用中心的系數(shù),并采用光譜超立方體的快速視線大氣分析(FLAASH)方法進(jìn)行大氣校正。由歐洲航天局網(wǎng)站(https://scihub.copernicus.eu/[2021-01-08])下載的Sentinel-2 數(shù)據(jù)是經(jīng)過(guò)輻射校正后的反射率產(chǎn)品,利用ESA 官方發(fā)布的大氣校正模型Sen2cor(V2.8,ESA)進(jìn)行大氣校正。由于Sentinel-2 影像可見(jiàn)光波段與紅邊波段和紅外波段具有不同的空間分辨率,對(duì)10 m 分辨率的可見(jiàn)光波段進(jìn)行重采樣,重采樣后的Sentinel-2影像空間分辨率為20 m。分別將無(wú)人機(jī)近地面遙感平臺(tái)獲取的數(shù)字正射影像重采樣到16 m 和20 m,以重采樣后的無(wú)人機(jī)正射影像為基準(zhǔn),基于一階多項(xiàng)式分別對(duì)GF-6 影像和Sentinel-2 影像進(jìn)行精確的幾何配準(zhǔn),校正過(guò)后的誤差不超過(guò)一個(gè)像元,保證了后期處理中對(duì)無(wú)人機(jī)正射影像和衛(wèi)星影像疊加分析的準(zhǔn)確性;最后,利用研究區(qū)邊界分別對(duì)影像進(jìn)行裁剪,獲得兩景預(yù)處理后的研究區(qū)影像(圖2(b),2(c))。輻射校正、大氣校正與圖像裁剪等預(yù)處理在ENVI(V5.3)中完成。
本研究發(fā)展了一套基于高分辨率衛(wèi)星影像和機(jī)器學(xué)習(xí)算法估算疏林草原木本植物和草本植物的新方法。首先,(1)基于高分辨率的無(wú)人機(jī)正射影像,利用分類與回歸樹算法識(shí)別木本植物和草本植物,分別計(jì)算對(duì)應(yīng)GF-6 和Sentinel-2 衛(wèi)星像元尺度的木本植物和草本植被覆蓋度,作為疏林草原木本植物和草本植物覆蓋度估算模型的訓(xùn)練樣本;(2)提取衛(wèi)星影像的波段信息、植被指數(shù)以及紋理特征等參數(shù),作為疏林草原木本植物和草本植物覆蓋度估算模型的特征因子;(3)利用(1)和(2)的訓(xùn)練樣本數(shù)據(jù)集,基于隨機(jī)森林算法,針對(duì)不同衛(wèi)星數(shù)據(jù)源訓(xùn)練模型建立木本植物和草本植物覆蓋度估算模型;(4)利用已構(gòu)建的疏林草原木本植物和草本植物覆蓋度估算模型,基于高分辨率衛(wèi)星影像計(jì)算疏林草原木本植物和草本植物覆蓋度(圖3)。
圖3 榆樹疏林草原木本植物和草本植物覆蓋度估算方法流程圖Fig.3 Flowchart of woody and herbaceous Fractional Vegetation Cover(FVC)estimation in Elm sparse forest grassland
3.1.1 分類訓(xùn)練樣本的獲取
(1)基于無(wú)人機(jī)影像估算木本和草本植物覆蓋度。機(jī)器學(xué)習(xí)是一種通過(guò)數(shù)據(jù)挖掘方法找出隱含在預(yù)測(cè)變量和分類樣本間的相關(guān)關(guān)系,并自動(dòng)建立預(yù)測(cè)模型的方法。分類與回歸樹(CART)算法是由Breiman 等(1984)提出的一種非參數(shù)的有效監(jiān)督學(xué)習(xí)方法,即從一系列有特征和標(biāo)簽的數(shù)據(jù)中總結(jié)出決策規(guī)則,并用樹狀圖結(jié)構(gòu)來(lái)呈現(xiàn)這些規(guī)則以解決分類和回歸問(wèn)題的算法,能夠有效利用空間輔助信息,深度挖掘特征信息。利用分類與回歸樹算法對(duì)無(wú)人機(jī)正射影像進(jìn)行地物分類,基于色彩空間拓展函數(shù),將正射影像各像元的RGB 信息進(jìn)行擴(kuò)展,將色彩空間拓展到包含RGB(紅,綠,藍(lán))、HSV(色調(diào),飽和度,明度)、Lab(亮度,坐標(biāo)軸從紅色到綠色,坐標(biāo)軸從藍(lán)色到紅色)和XYZ(CIE1931標(biāo)準(zhǔn)色度系統(tǒng))(Reinhard等,2001)共12 種特征作為CART 分類算法的特征因子(Wang等,2019)。
利用無(wú)人機(jī)正射影像RGB 信息建立色彩空間拓展函數(shù)作為分類與回歸樹模型的特征因子;基于地面調(diào)查數(shù)據(jù)和目視解譯方法,使用圖像編輯軟件(如ImageJ,Photoshop 等)分別選取2020 年正射影像中的木本、草本和裸地,建立研究區(qū)地表類型的樣本訓(xùn)練集作為決策樹分類模型的分類樣本,生成決策樹分類模型。將地物類型劃分為木本植物,草本植物和沙地3 類,得到樣地木本、草本植物與裸沙地的地表類型圖。通過(guò)計(jì)算不同地物類型的像素?cái)?shù)占植被分類圖中總像素?cái)?shù)比例,獲取木本植物和草本植物的植被覆蓋度。
基于研究區(qū)無(wú)人機(jī)影像的地表類型分布圖(圖4(b)),利用GF-6衛(wèi)星影像和Sentinel-2 衛(wèi)星影像分別對(duì)木本植物和草本植物進(jìn)行掩膜,統(tǒng)計(jì)落在衛(wèi)星像元窗口內(nèi)的木本植物和草本植物像元總數(shù),并計(jì)算其占衛(wèi)星窗口像元總數(shù)的百分比(以下簡(jiǎn)稱覆蓋度分類樣本),得到衛(wèi)星像元尺度的木本和草本植物覆蓋度作為疏林草原覆蓋度模型的分類樣本數(shù)據(jù)。每組GF-6影像為3903個(gè)樣本數(shù)據(jù),Sentinel-2影像為2497個(gè)樣本數(shù)據(jù)。
圖4 基于無(wú)人機(jī)正射影像的衛(wèi)星像元尺度木本和草本植物覆蓋度計(jì)算方法Fig.4 Methods of woody and herbaceous FVC at pixel-scale of satellite images calculated from DOM obtained by UAV
(2)分類結(jié)果驗(yàn)證。為驗(yàn)證分類與回歸樹模型對(duì)無(wú)人機(jī)正射影像的分類精度,在無(wú)人機(jī)正射影像中隨機(jī)選取4000 個(gè)像素點(diǎn),將目視判別結(jié)果與模型分類結(jié)果進(jìn)行對(duì)比,基于像素點(diǎn)建立混淆矩陣,并計(jì)算Kappa系數(shù)和總體誤差作為指標(biāo)評(píng)價(jià)決策樹分類精度。
3.1.2 模型特征因子的選取
植被指數(shù)對(duì)植被的生物物理特征較為敏感。對(duì)于地表空間復(fù)雜的影像,提取影像的紋理特征可以獲取各種有用的信息,提高分類精度(劉龍飛等,2003)。本實(shí)驗(yàn)選擇的特征包括3 類,分別是波段反射率、植被指數(shù)以及紋理特征(Haralick,1979)。首先,選擇衛(wèi)星像元波段反射率作為模型特征因子(表2);植被指數(shù)包括歸一化植被指數(shù)NDVI(Normalized Difference Vegetation Index),差值植被指數(shù)DVI(Difference Vegetation Index),歸一化綠度植被指數(shù)GNDVI(Green Normalized Difference Vegetation Index),綠波比指數(shù)GRI(Green Ratio Vegetation Index),紅邊指數(shù)(MTCI)和增強(qiáng)型植被指數(shù)EVI(Enhanced Vegetation Index);采用基于統(tǒng)計(jì)分析的灰度共生矩陣GLCM(Gray-Level-Co-occurrence Matrix)實(shí)現(xiàn)GF-6 和Sentinel-2衛(wèi)星各波段紋理特征的計(jì)算。植被指數(shù)和紋理特征的提取在ENVI(V5.3)中完成。GF-6衛(wèi)星模型特征因子選取8 個(gè)波段反射率、6 個(gè)植被指數(shù)和48個(gè)紋理特征,共計(jì)62個(gè)特征因子,Sentinel-2衛(wèi)星選取10 個(gè)波段反射率、6 個(gè)植被指數(shù)和60 個(gè)紋理特征,共計(jì)76個(gè)特征因子。
表2 榆樹疏林草原木本和草本植物覆蓋度估算模型特征因子與描述Table 2 Features and description of woody and herbaceous FVC estimation model in Elm sparse forest grassland
3.1.3 疏林草原木本和草本植物覆蓋度估算模型建立
將影像波段反射率、6 種紋理特征和6 種植被指數(shù)作為特征因子,利用隨機(jī)森林算法建立疏林草原木本植物和草本植物覆蓋度估算模型。隨機(jī)森林是一個(gè)以分類與回歸樹算法為基礎(chǔ),將決策樹作為弱模型的袋裝法集成算法,即通過(guò)構(gòu)建多個(gè)相互獨(dú)立的訓(xùn)練樣本子集訓(xùn)練弱模型,然后對(duì)各預(yù)測(cè)結(jié)果取平均值作為最終預(yù)測(cè)結(jié)果。隨機(jī)森林在利用袋裝法對(duì)獨(dú)立樣本子集進(jìn)行模型訓(xùn)練時(shí),對(duì)每個(gè)特征因子出現(xiàn)的次數(shù)、深度以及模型的準(zhǔn)確率進(jìn)行統(tǒng)計(jì),并賦予每個(gè)特征一定的權(quán)重值,該權(quán)重值即為各特征因子的重要性(Breiman,2001)。
與復(fù)雜模型相比,優(yōu)先選擇特征因子較少且預(yù)測(cè)結(jié)果相對(duì)準(zhǔn)確的模型(James 等,2013)。由于并非全部特征變量都與覆蓋度相關(guān),利用所有特征因子建立隨機(jī)森林模型后,對(duì)特征因子進(jìn)行優(yōu)選,以提高隨機(jī)森林的預(yù)測(cè)精度并簡(jiǎn)化節(jié)點(diǎn)。特征因子優(yōu)選首先根據(jù)重要性得分對(duì)各特征因子進(jìn)行排序,然后按照重要性排名依次疊加特征因子并訓(xùn)練模型,利用10 倍交叉檢驗(yàn)(Crossvalidation)(Breiman,2001)分別計(jì)算一定特征因子數(shù)量下隨機(jī)森林模型的相關(guān)系數(shù)范圍,并進(jìn)行隨機(jī)森林穩(wěn)健性估計(jì),當(dāng)相關(guān)系數(shù)趨于穩(wěn)定后,排除對(duì)模型貢獻(xiàn)較小的變量,建立最優(yōu)性能下的隨機(jī)森林模型。
確定模型最佳特征因子后,通過(guò)10 倍交叉檢驗(yàn)查看模型預(yù)測(cè)精度的變化趨勢(shì),調(diào)整隨機(jī)森林模型中樹的數(shù)量和樹的深度等參數(shù)以獲取模型參數(shù)的最優(yōu)值,進(jìn)一步優(yōu)化模型、提高模型預(yù)測(cè)精度。應(yīng)用建立的模型對(duì)研究區(qū)木本植物和草本植物的覆蓋度進(jìn)行估算。以上圖像處理、模型訓(xùn)練、模型構(gòu)建和圖像分類均利用Python(V3.7)語(yǔ)言完成。
為防止由空間自相關(guān)引起的空間過(guò)度擬合,建模之前在研究區(qū)內(nèi)隨機(jī)且均勻選取25%的獨(dú)立樣本數(shù)據(jù)作為精度驗(yàn)證數(shù)據(jù),以評(píng)估模型對(duì)覆蓋度的估算精度。基于GF-6影像的數(shù)據(jù)集包含978組獨(dú)立驗(yàn)證數(shù)據(jù),基于Sentinel-2 影像的數(shù)據(jù)集包含626組獨(dú)立驗(yàn)證數(shù)據(jù)。比較無(wú)人機(jī)正射影像分類得到的覆蓋度與模型估算得到的覆蓋度值以評(píng)估模型精度,選擇的精度驗(yàn)證指標(biāo)包括模型樣本的決定系數(shù)R2(式(1))、均方根誤差RMSE(式(2))和估算精度EA(式(3))。
式中,yi為基于正射影像分類得到的覆蓋度,為模型估算的第i個(gè)覆蓋度,N為樣本數(shù)。
4.1.1 無(wú)人機(jī)正射影像分類
通過(guò)比較研究區(qū)內(nèi)部樣方的正射影像和分類圖,以目視判別方法評(píng)估分類的準(zhǔn)確性。由圖5可見(jiàn),木本植物、草本植物和裸沙地分類效果良好,草地和裸沙地中稀疏分布的灌木均被完整的提取,木本植物與草本植物邊界清晰,木本植物內(nèi)部完整,準(zhǔn)確排除樹冠間隙和樹冠陰影。目視判別與機(jī)器分類之間的誤差主要是由于草本植物與裸沙地的混合像元分類產(chǎn)生。表3為基于驗(yàn)證像素點(diǎn)建立的木本植物,草本植物和裸沙地的分類結(jié)果混淆矩陣,決策樹分類總體精度為0.89,Kappa 系數(shù)為0.83,分類精度較高。生產(chǎn)者精度和用戶精度的準(zhǔn)確性充分證明了基于分類與回歸樹算法的影像分類能夠準(zhǔn)確劃分無(wú)人機(jī)正射影像像元類型。
表3 榆樹疏林草原長(zhǎng)期定位觀測(cè)大樣地?zé)o人機(jī)正射影像像元分類精度評(píng)價(jià)Table 3 Accuracy evaluation in pixel-based classification of DOM in long-term monitoring plot in Elm sparse forest
4.1.2 模型特征因子選擇
不同特征因子數(shù)量下的隨機(jī)森林模型性能驗(yàn)證結(jié)果如圖所示(圖6)?;贕F-6影像的木本植物覆蓋度估算模型在特征因子數(shù)量為14 時(shí),模型趨于穩(wěn)健且預(yù)測(cè)精度較高,可作為平衡預(yù)測(cè)精度和簡(jiǎn)化模型的最優(yōu)特征因子個(gè)數(shù),建立最優(yōu)性能的覆蓋度估算模型?;贕F-6 影像的草本植物覆蓋度模型最優(yōu)特征因子數(shù)量為17?;赟entinel-2影像的木本和草本植物覆蓋度模型最優(yōu)特征因子數(shù)量分別為11和17。
圖6 不同特征因子數(shù)量下的隨機(jī)森林模型性能驗(yàn)證結(jié)果Fig.6 Random forest model performance verification results under different number of feature factors
表4 和表5 分別統(tǒng)計(jì)了基于GF-6 和Sentinel-2影像的疏林草原木本植物和草本植物覆蓋度估算模型重要性排名前5 的特征因子?;贕F-6 影像的疏林草原木本植物包含DVI、EVI、NDVI、MTCI和GRVI,均為植被指數(shù)(表4);基于Sentinel-2影像的疏林草原木本植物覆蓋度估算模型特征因子包括了NDVI、GNDVI、GRVI這3個(gè)植被指數(shù)、以及紅波段和植被紅邊1 波段?;贕F-6 的草本植物覆蓋度估算模型特征因子包含黃色波段、紅邊2波段、植被指數(shù)MTCI、紅邊2 波段紋理信息的均值和紅邊2波段紋理信息的方差;基于Sentinel-2的估算模型特征因子包含綠色波段、植被紅邊1、2波段和短波紅外1波段,紋理信息為短波紅外的均值。
表4 基于GF-6影像的榆樹疏林草原木本和草本植物覆蓋度估算模型特征因子Table 4 Top five preferred features ranking of woody and herbaceous FVC estimation model in Elm sparse forest grassland based on GF-6 image
表5 基于Sentinel-2影像的榆樹疏林草原木本和草本植物覆蓋度估算模型特征因子Table 5 Top five preferred features ranking of woody and herbaceous FVC estimation model in Elm sparse forest grassland based on Sentinel-2 image
DVI 是基于GF-6 影像的木本植物覆蓋度估算模型中最重要的特征因子,而NDVI則是Sentinel-2影像的木本植物覆蓋度估算模型中最重要的特征因子。對(duì)兩個(gè)模型特征因子綜合分析可知,植被指數(shù)均對(duì)木本植物覆蓋度的估算起重要作用,基于Sentinel-2 影像的草本植物估算模型最佳預(yù)測(cè)因子為中心波長(zhǎng)在705 nm 的植被紅邊1 波段,重要性達(dá)到0.60(表5),這與基于GF-6 的草本植物覆蓋度模型相似,除黃色波段外,模型特征因子的光譜特征和紋理特征同樣集中在紅邊波段(表4)。由此可知,GF-6 影像和Sentinel-2 影像在730—750 nm 處的反射率能有效反映草本植物植被覆蓋度。說(shuō)明紅邊波段反射率對(duì)草本植物覆蓋度變化較為敏感。
4.1.3 模型精度驗(yàn)證
將無(wú)人機(jī)影像分類得到的木本、草本植物覆蓋度樣本值與模型估算值進(jìn)行對(duì)比(圖7)?;贕F-6 影像和Sentinel-2 影像估算的木本植物覆蓋度R2均為0.72,均方根誤差為6.76%和6.53%,估算精度分別為46.31%和54.30%?;贕F-6 影像比基于Sentinel-2 影像的木本植物覆蓋度估算值均方根誤差相比高0.23%,估算精低7.99%?;贕F-6影像和Sentinel-2影像估算的草本植物覆蓋度R2分別為0.66 和0.81,均方根誤差分別為10.69%和8.20%,估算精度分別為77.88%和83.17%?;贕F-6 影像比基于Sentinel-2 影像估算的草本植物覆蓋度R2低0.15,均方根誤差高2.49%,估算精度低5.29%。
圖7 基于衛(wèi)星影像與基于無(wú)人機(jī)正射影像估算的榆樹疏林草原長(zhǎng)期定位觀測(cè)大樣地木本和草本植物覆蓋度結(jié)果比較Fig.7 Comparison of woody and herbaceous FVC in Elm sparse forest grassland estimated by satellite images and DOM of UAV
兩種衛(wèi)星影像對(duì)疏林草原木本植物覆蓋度估算精度總體差別較小,對(duì)草本植物覆蓋度估算精度Sentinel-2 影像略高于GF-6 影像。不論基于哪種衛(wèi)星影像,木本植物在0—20%區(qū)間的覆蓋度估算精度較高,而在20%—100%區(qū)間估算精度較低,原因可能由于木本植物覆蓋度在20%—100%區(qū)間的訓(xùn)練樣本數(shù)量較少。
分別基于GF-6 影像和Sentinel-2 影像對(duì)研究區(qū)木本、草本植物覆蓋度進(jìn)行制圖,并與基于無(wú)人機(jī)正射影像得到的木本、草本植物覆蓋度圖對(duì)比,如圖8所示??傮w來(lái)看,基于高分辨率衛(wèi)星影像獲取的木本、草本植物覆蓋度,與基于無(wú)人機(jī)正射影像獲取的木本、草本植物覆蓋度空間分布一致。基于GF-6 衛(wèi)星像元尺度對(duì)正射影像分類結(jié)果進(jìn)行統(tǒng)計(jì),約3/4 的木本植物像元落在0—20%覆蓋度內(nèi)、草本植物像元落在20%—80%覆蓋度范圍內(nèi);基于Sentinel-2 衛(wèi)星像元尺度對(duì)正射影像分類結(jié)果進(jìn)行統(tǒng)計(jì),約4/5 的木本植物像元落在0—20%覆蓋度內(nèi)、草本植物像元落在20%—80%覆蓋度范圍內(nèi)?;贕F-6 影像估算得到的覆蓋度3/4 的木本植物集中在0—20%,草本植物在25%—75%;基于Sentinel-2影像得到的覆蓋度4/5的木本植物集中在0—20%,草本植物在25%—75%。
圖8 基于高分衛(wèi)星影像和無(wú)人機(jī)正射影像的榆樹疏林草原長(zhǎng)期定位觀測(cè)大樣地木本和草本植物覆蓋度空間分布圖Fig.8 Maps of woody and herbaceous FVC in Elm sparse forest grassland from satellite image(GF-6 and Sentinel-2)and classified DOM
研究區(qū)木本植物覆蓋度在50%以上僅占研究區(qū)總像元數(shù)的2%—4%,且集中在研究區(qū)西部地勢(shì)較低的區(qū)域。研究區(qū)草本植物覆蓋度分布較為均衡,覆蓋度高于70%的區(qū)域集中分布在研究區(qū)的東部,覆蓋度低于30%的區(qū)域集中分布在地勢(shì)較高的沙丘區(qū)域。
本研究探索了一種利用近地遙感和衛(wèi)星遙感影像,基于機(jī)器學(xué)習(xí)算法,估算疏林草原木本植物和草本植物覆蓋度的新方法。研究不僅實(shí)現(xiàn)了基于無(wú)人機(jī)正射影像不同地物類別的精準(zhǔn)分類,獲取了清晰的不同植被類型生活型信息。同時(shí)利用重采樣升尺度的方法分別提取衛(wèi)星影像混合像元內(nèi)的疏林草原木本、草本植物覆蓋度,構(gòu)建了疏林草原木本、草本植物覆蓋度估算模型,實(shí)現(xiàn)了從無(wú)人機(jī)到衛(wèi)星的疏林草原木本植物和草本植被的覆蓋度精準(zhǔn)估算。研究結(jié)果表明:(1)利用無(wú)人機(jī)遙感監(jiān)測(cè)平臺(tái)能夠?qū)崿F(xiàn)疏林草原景觀尺度的精準(zhǔn)植被分類與覆蓋度計(jì)算;(2)構(gòu)建了基于GF-6 衛(wèi)星影像和Sentinel-2 衛(wèi)星影像的木本和草本植物覆蓋度估算模型,實(shí)現(xiàn)了基于高分辨率衛(wèi)星影像的疏林草原木本和草本植物覆蓋度估算;(3)基于Sentinel-2 衛(wèi)星影像的疏林草原木本和草本植物覆蓋度估算精度稍高于GF-6 衛(wèi)星,基于兩個(gè)衛(wèi)星影像的草本植物覆蓋度的估算精度都要顯著高于木本植物。
近年來(lái),覆蓋全球的高分辨率衛(wèi)星不斷涌現(xiàn),通過(guò)融合不同分辨率的多源衛(wèi)星遙感數(shù)據(jù),基于定量遙感尺度轉(zhuǎn)換模型,監(jiān)測(cè)熱帶地區(qū)稀樹草原上木本植被狀況和動(dòng)態(tài)是稀樹草原研究的熱點(diǎn)(Brandt等,2016;Tian等,2017)。González-Roglich和Swenson(2016)利用中巴地球衛(wèi)星(CBERS)影像與陸地衛(wèi)星(Landsat)影像,基于隨機(jī)森林算法估計(jì)阿根廷中部稀樹草原樹木覆蓋度。Herrmann等(2013)在西非塞內(nèi)加爾使用軌道觀測(cè)衛(wèi)星(Orbview)高分辨率影像與中分辨率成像光譜儀(MODIS)的NDVI數(shù)據(jù),基于決策樹算法建立模型并反演木本覆蓋度。Higginbottom 等(2018)融合Landsat 影像與日本對(duì)地觀測(cè)衛(wèi)星(ALOS)高分辨率合成孔徑雷達(dá)數(shù)據(jù),基于隨機(jī)森林算法繪制出南非林波波省疏林草原地區(qū)木本植物覆蓋度圖。以上研究均應(yīng)用機(jī)器學(xué)習(xí)方法結(jié)合多分辨率遙感影像實(shí)現(xiàn)了熱帶稀樹草原木本植物覆蓋度估算。中國(guó)溫帶疏林草原景觀與熱帶稀樹草原特征相似,在連續(xù)的草本層里鑲嵌有不連續(xù)的喬木和灌木植物,是中國(guó)半干旱區(qū)重要的生態(tài)系統(tǒng),也是世界上唯一分布于溫帶的疏林草原生態(tài)系統(tǒng)(于順利 等,2007)。本研究探索了將無(wú)人機(jī)近地遙感數(shù)據(jù)與高分辨率衛(wèi)星遙感數(shù)據(jù)相結(jié)合的新方法,以分布于中國(guó)內(nèi)蒙古高原上的溫帶疏林草原為對(duì)象,實(shí)現(xiàn)了疏林草原上木本植物和草本植物的同步監(jiān)測(cè)。新方法為實(shí)現(xiàn)區(qū)域尺度溫帶疏林草原不同生活型植物的高效精準(zhǔn)監(jiān)測(cè)提供了方法基礎(chǔ)。
本研究結(jié)果與同樣利用隨機(jī)森林方法,結(jié)合航空遙感數(shù)據(jù)與衛(wèi)星數(shù)據(jù),估算熱帶稀樹草原木本植物覆蓋度的驗(yàn)證結(jié)果相比(Ludwig等,2019),具有更高的決定系數(shù)和更低的均方根誤差。Ludwig估測(cè)得到的木本植物覆蓋度估算模型決定系數(shù)R2為0.44,均方根誤差為11.6%;基于GF-6 影像和Sentinel-2 影像估算的木本植物覆蓋度估算模型決定系數(shù)R2均為0.72,均方根誤差為6.76%和6.53%。此外,基于隨機(jī)森林建立的植被覆蓋度模型預(yù)測(cè)值均高估了較低的植被覆蓋度值,而低估了高植被覆蓋度值,與隨機(jī)森林算法在預(yù)測(cè)結(jié)果時(shí),對(duì)每棵回歸樹得到的預(yù)測(cè)變量求平均值作為預(yù)測(cè)結(jié)果的屬性相關(guān)(Prasad 等,2006)。隨機(jī)森林該屬性導(dǎo)致在覆蓋度預(yù)測(cè)中對(duì)于較低和較高的木本植物和草本植被覆蓋度估算誤差較大。
Higginbottom 等(2018)融合了Landsat衛(wèi)星數(shù)據(jù)和PALSAR 合成孔徑雷達(dá)數(shù)據(jù),并通過(guò)組合旱季、雨季多季節(jié)指標(biāo)訓(xùn)練模型。得到的木本植物覆蓋度驗(yàn)證結(jié)果中,決定系數(shù)最高達(dá)0.77。該結(jié)論對(duì)模型的改進(jìn)具有一定的啟發(fā)性,可以結(jié)合輔助數(shù)據(jù)并加入生長(zhǎng)季的不同時(shí)期影像作為預(yù)測(cè)指標(biāo),進(jìn)一步提高疏林草原木本植物和草本植物覆蓋度估算精度。
基于機(jī)器學(xué)習(xí)算法,融合無(wú)人機(jī)正射影像和高分辨率衛(wèi)星影像等多源數(shù)據(jù),充分發(fā)揮了近地遙感高空間分辨率和衛(wèi)星遙感區(qū)域大尺度覆蓋的特點(diǎn)。無(wú)人機(jī)正射影像為疏林草原木本、草本植被覆蓋度估算模型提供了高質(zhì)量的訓(xùn)練數(shù)據(jù),衛(wèi)星影像為探測(cè)區(qū)域尺度植被狀況提供了基礎(chǔ)數(shù)據(jù)源,機(jī)器學(xué)習(xí)的方法為兩種類型數(shù)據(jù)的融合搭建了橋梁。利用這一方法,未來(lái)可以實(shí)現(xiàn)中國(guó)溫帶疏林草原分布范圍的精確制圖,進(jìn)一步利用多時(shí)相的衛(wèi)星遙感數(shù)據(jù)也可監(jiān)測(cè)疏林草原上木本植物和草本植物的長(zhǎng)期變化特征。