郭文婷, 張曉麗
(1.北京林業(yè)大學(xué) 省部共建森林培育與保護(hù)教育部重點(diǎn)實(shí)驗(yàn)室,北京100083;2.北京林業(yè)大學(xué) 精準(zhǔn)林業(yè)北京市重點(diǎn)實(shí)驗(yàn)室,北京100083)
森林資源調(diào)查可以統(tǒng)計(jì)不同林地的生物學(xué)特性、生態(tài)特征和經(jīng)營(yíng)價(jià)值,為森林的合理經(jīng)營(yíng)規(guī)劃提供有效的數(shù)據(jù)支持[1-2]。由于中國(guó)各地區(qū)之間自然條件差異較大,森林類(lèi)型多種多樣,林分結(jié)構(gòu)較為復(fù)雜,森林資源調(diào)查工作難度很大[3]。植被分類(lèi)是研究森林資源狀況和動(dòng)態(tài)變化規(guī)律的基礎(chǔ),利用遙感手段可以更加快速、準(zhǔn)確地識(shí)別植被類(lèi)型[4]。因此傳統(tǒng)的依靠人力的地面調(diào)查已經(jīng)逐漸轉(zhuǎn)變?yōu)榛谶b感手段的植被識(shí)別和植被分類(lèi)[5-6]。以往許多研究學(xué)者基于植被的光譜特征進(jìn)行了植被分類(lèi)[7-8]。由于許多地物光譜特征相似度高及環(huán)境因素的影響,許多地物難以分離。針對(duì)這一問(wèn)題,有學(xué)者采用神經(jīng)網(wǎng)絡(luò)[9-10]、支持向量機(jī)[11-12]、隨機(jī)森林[13-14]、決策樹(shù)等[15-17]分類(lèi)方法對(duì)植被進(jìn)行分類(lèi)并取得較好的分類(lèi)結(jié)果。但是植被分布雜亂無(wú)序,且存在 “同物異譜”和 “同譜異物”的現(xiàn)象[18],只利用光譜特征進(jìn)行分類(lèi)很難取得高精度的分類(lèi)結(jié)果。有的學(xué)者采用結(jié)合紋理特征進(jìn)行分類(lèi)的方法并得到了更高的分類(lèi)精度,證明了紋理特征有助于提高分類(lèi)精度[19]。近年來(lái),為了進(jìn)一步提高植被的分類(lèi)精度,有學(xué)者對(duì)植被的物候信息進(jìn)行研究,發(fā)現(xiàn)有些植被的物候特征差異很大,利用多時(shí)相的遙感數(shù)據(jù)可以提高物候差異明顯的植被區(qū)分能力[20]。不同植被的物候特征、紋理特征、光譜特征各不相同,因此其歸一化植被指數(shù)(normalized difference vegetation index,NDVI)時(shí)間序列、紋理和光譜響應(yīng)存在一定的差異。利用單一特征進(jìn)行植被分類(lèi),精度往往較低。由于過(guò)去遙感數(shù)據(jù)源的限制,數(shù)據(jù)很難同時(shí)滿(mǎn)足高時(shí)間分辨率、高空間分辨率和豐富的光譜信息這3個(gè)特點(diǎn),例如MODIS數(shù)據(jù)具有較高的時(shí)間分辨率和豐富的光譜信息,但空間分辨率較低,只適合大尺度范圍的植被分類(lèi)[21];Landsat系列數(shù)據(jù)的空間分辨率也較低,且其光譜信息中缺少植被十分敏感的紅邊波段[22];而Sentinel-2數(shù)據(jù)則具有較高的時(shí)間分辨率、空間分辨率和豐富的光譜信息[23-24],尤其是其多個(gè)紅邊波段對(duì)植被區(qū)分具有很大幫助。由于不同植被的物候期存在一定的差異,因此其N(xiāo)DVI時(shí)間序列變化特征也存在一定差異,利用多期遙感影像構(gòu)建NDVI時(shí)間序列有助于將物候期差異明顯的植被區(qū)分。本研究基于多時(shí)相的Sentinel-2遙感影像,首先選取植被生長(zhǎng)旺盛時(shí)期的影像,計(jì)算NDVI并設(shè)定合適的閾值將研究區(qū)內(nèi)的植被提取出來(lái),剩余部分歸為非植被。然后選取NDVI時(shí)間序列、最佳時(shí)相的Sentinel-2數(shù)據(jù)中10個(gè)波段的光譜反射率特征和主成分分析前3個(gè)分量的紋理特征作為分類(lèi)特征,將研究區(qū)內(nèi)的植被類(lèi)型分為耕地、草地、常綠針葉林、落葉針葉林和落葉闊葉林五大類(lèi)。
旺業(yè)甸實(shí)驗(yàn)林場(chǎng)(圖1)位于內(nèi)蒙古赤峰市喀喇沁旗西南部,地屬燕山山脈北麓,屬茅荊壩次生林區(qū)的一部分,為淺山丘陵地貌,地勢(shì)西南高東北低,一般坡度為10°~30°,平均海拔為1300 m,最高峰是翠云峰, 海拔為 1890.9 m。41°21′~41°39′N(xiāo), 118°09′~118°30′E,東西長(zhǎng) 41 km,南北寬 20 km。林場(chǎng)總面積為253.07 km2,有林地面積為219.6 km2,林木總蓄積量為157萬(wàn)m3,森林覆被率為93.24%。在有林地面積中:天然次生林為115.33 km2,人工林為104.27 km2。其中人工落葉松Larix gmelinii面積為 45.33 km2, 油松Pinustabuliformis為 56.47 km2, 樟子松Pinus sylvestrisvar.mongholica為 2.15 km2,云杉Picea asperata為0.33 km2。旺業(yè)甸林區(qū)的生物資源復(fù)雜多樣,具有很強(qiáng)的代表性、典型性、特有性及脆弱性,在全國(guó)的多樣性保護(hù)中占有重要地位。林場(chǎng)有林地有落葉松,云杉,樟子松,紅松Pinuskoraiensis,油松,黑樺Betula dahurica,白樺Betula platyphylla,山楊Populus davidiana,核桃楸Juglansmandshurica等12個(gè)優(yōu)勢(shì)樹(shù)種。
使用的Sentinel-2數(shù)據(jù)是從歐洲航天局(European Space Agency,ESA)的數(shù)據(jù)共享網(wǎng)站(https://scihub.copernicus.eu/dhus/#/home)免費(fèi)下載。Sentinel-2A是歐洲航天局(ESA)于2015年6月23日發(fā)射的環(huán)境監(jiān)測(cè)衛(wèi)星,重訪(fǎng)周期為10 d,其雙星Sentinel-2B于2016年發(fā)射后,將重訪(fǎng)周期縮短到5 d。Sentinel-2A數(shù)據(jù)的具體波段信息見(jiàn)表1。由于植被自身的物候特征,植被的光譜反射率在時(shí)間序列上有一定的變化規(guī)律,因此,在2017年內(nèi)具有可用影像的月份均選取一景云量較少、質(zhì)量較高的Sentinel-2影像,共9景,成像時(shí)間分別 為 2017-01-15, 2017-02-14, 2017-04-15, 2017-05-25, 2017-06-14,2017-09-22, 2017-10-27, 2017-11-21,2017-12-31。 利用 ESA提供的SNAP軟件對(duì)數(shù)據(jù)進(jìn)行輻射定標(biāo)、大氣校正、幾何校正和圖像裁剪。將像元較大的波段重采樣為10 m×10 m的像元,從而使各個(gè)波段的像元大小一致。
圖1 研究區(qū)位置示意圖Figure 1 Location of the study area
表1 Sentinel-2波段信息表Table 1 Band information of Sentinel-2
本研究中的外業(yè)數(shù)據(jù)來(lái)源于2017年9月研究區(qū)的實(shí)地調(diào)查,共選取300個(gè)適合本次研究的樣點(diǎn)數(shù)據(jù)。實(shí)地調(diào)查遵循樣本具有代表性、樣本均勻分布的原則,在研究區(qū)內(nèi)選取具有代表性的植被類(lèi)型進(jìn)行采樣,且保證采集的樣本點(diǎn)均勻分布在整個(gè)研究區(qū)內(nèi)。樣本點(diǎn)的數(shù)據(jù)屬性包括樹(shù)種類(lèi)別和用手持GPS定位的經(jīng)緯度坐標(biāo)。由于采集得到的每個(gè)類(lèi)別樣本點(diǎn)數(shù)量不同,因此分別選取每個(gè)類(lèi)別的訓(xùn)練樣本,使其能夠均勻分布于研究區(qū)內(nèi)。共選取訓(xùn)練樣本數(shù)據(jù)122個(gè),其中非植被為18個(gè),耕地20個(gè),常綠針葉林22個(gè),落葉闊葉林24個(gè),落葉針葉林22個(gè),草地16個(gè)。剩余178個(gè)樣點(diǎn)數(shù)據(jù)作為驗(yàn)證樣本,其中非植被為19個(gè),耕地13個(gè),常綠針葉林46個(gè),落葉闊葉林41個(gè),落葉針葉林43個(gè),草地16個(gè)。
采用以下3種方法對(duì)研究區(qū)進(jìn)行植被分類(lèi):①最大似然法,以外業(yè)采集數(shù)據(jù)作為樣本,基于Sentinel-2數(shù)據(jù)的 10個(gè)波段(B02, B03, B04, B05, B06, B07, B08, B08a, B11, B12)進(jìn)行分類(lèi), 且各個(gè)類(lèi)別的樣本數(shù)據(jù)光譜特征均服從正態(tài)分布。②根據(jù)不同地物的歸一化植被指數(shù)(NDVI)時(shí)序變化特征和光譜特征(NDVI時(shí)序+光譜特征),選取最佳分類(lèi)閾值,建立基于決策樹(shù)的分層分類(lèi)模型,將研究區(qū)分為非植被、耕地、草地、常綠針葉林、落葉針葉林、落葉闊葉林。③NDVI時(shí)序特征+光譜特征+紋理特征(Sentinel-2時(shí)序多特征),采用支持向量機(jī)分類(lèi)器,經(jīng)過(guò)多次實(shí)驗(yàn)核函數(shù)選取高斯函數(shù),核函數(shù)系數(shù)γ為0.2,懲罰因子C為7,對(duì)在植被生長(zhǎng)旺盛期,利用NDVI閾值提取出的植被進(jìn)行植被類(lèi)型分類(lèi),將其分為耕地、草地、常綠針葉林、落葉針葉林、落葉闊葉林。
NDVI對(duì)植被反應(yīng)敏感,能夠反映出植被與其他地物在可見(jiàn)光、近紅外波段的明顯差異。因此,首先選取植被生長(zhǎng)茂盛時(shí)期的影像,計(jì)算其N(xiāo)DVI,設(shè)置合適的閾值將植被提取出來(lái)。NDVI計(jì)算公式如下: INDV=(B08-B04)/(B08+B04)。 其中: INDV為歸一化植被指數(shù), B08為近紅外波段的反射率,B04為紅光波段的反射率。
不同時(shí)間的NDVI能夠反映植被的物候信息,且兩者有一定的規(guī)律性,是區(qū)分植被類(lèi)型的重要特征。例如,常綠針葉林常年保持綠色,NDVI在1 a中的變化較?。晦r(nóng)作物在6-9月為生長(zhǎng)期,此時(shí)耕地的NDVI也呈增長(zhǎng)趨勢(shì),到9月NDVI達(dá)到最大值;落葉類(lèi)植被一般在5月開(kāi)始長(zhǎng)葉10月開(kāi)始落葉,NDVI也隨之在5月開(kāi)始上升10月開(kāi)始下降。因此,分別計(jì)算9個(gè)時(shí)相影像的NDVI,構(gòu)建6種地物的NDVI時(shí)序曲線(xiàn),描述6種地物的動(dòng)態(tài)變化過(guò)程。
根據(jù)地物的物候特征可知:在5-9月均為5種地物的最佳時(shí)相,因此選取這段時(shí)間內(nèi)質(zhì)量最好的2017-06-14影像繪制光譜反射率曲線(xiàn)進(jìn)行單波段光譜分析。對(duì)于NDVI時(shí)間序列曲線(xiàn)相似、難以區(qū)分的地物,利用不同地物的光譜反射率差異可以增加這種相似地物的區(qū)分度,但是仍可能存在混分現(xiàn)象。例如落葉針葉林和草地,兩者的NDVI時(shí)序變化規(guī)律相似,光譜反射率的變化規(guī)律也相似。因此,對(duì)紋理特征進(jìn)行分析后,在最終分類(lèi)時(shí)應(yīng)用紋理特征以提高分類(lèi)精度。
紋理特征是一種全局特征,它描述了物體表面的特性。與基于像素點(diǎn)的顏色特征不同,紋理特征需要在包含多個(gè)像素點(diǎn)的像素區(qū)域中進(jìn)行統(tǒng)計(jì)計(jì)算。而且紋理特征常具有旋轉(zhuǎn)不變性,對(duì)于噪聲也具有較強(qiáng)的抵抗能力。本研究共選取了Sentinel-2數(shù)據(jù)中的10個(gè)波段進(jìn)行分類(lèi)研究,若提取每個(gè)波段的紋理特征并參與最終分類(lèi),將會(huì)產(chǎn)生大量數(shù)據(jù),計(jì)算量太大。因此,在提取紋理特征前首先對(duì)數(shù)據(jù)進(jìn)行主成分分析處理,然后選取前3個(gè)主成分分量用來(lái)進(jìn)行后續(xù)的特征提取。1973年HARALICK提出的灰度共生矩陣是遙感圖像中常采用的紋理特征提取方法[25-26]。灰度共生矩陣是通過(guò)研究圖像上像元灰度的空間相關(guān)特性來(lái)描述紋理。通過(guò)研究分析選取5×5大小的移動(dòng)窗口,利用灰度共生矩陣分別計(jì)算前3個(gè)分量的8種紋理特征,即均值、方差、同質(zhì)性、對(duì)比度、差異性、熵值、二階矩、相關(guān)性。
綜上所述,共選取 43個(gè)特征用于分類(lèi),包括9個(gè)時(shí)相(2017-01-15,2017-02-14,2017-04-15,2017-05-25,2017-06-14,2017-09-22, 2017-10-27, 2017-11-21, 2017-12-31)的 NDVI特征,10 個(gè)波段(B02,B03,B04,B05,B06,B07,B08,B08a,B11,B12)的光譜反射率特征和24個(gè)紋理特征。
由圖2分析可得:①常綠針葉林在1 a中都是綠色植被,NDVI變化相對(duì)較小。在1,2,3,11,12月其他植物多處于非生長(zhǎng)期,常綠針葉林的NDVI明顯高于其他地物,容易被區(qū)分;②研究區(qū)內(nèi)的耕地在5-9月屬于生長(zhǎng)期,NDVI處于上升趨勢(shì),但同一時(shí)期的其他植物也處于生長(zhǎng)旺盛期,5種地物的NDVI均較高,相比之下耕地的NDVI值反而是最低的,容易被區(qū)分;③落葉闊葉林在5-9月屬于1 a中生長(zhǎng)最旺盛的時(shí)期,其N(xiāo)DVI值達(dá)0.80以上,高于同一時(shí)期的其他地物,可以進(jìn)行區(qū)分。
通過(guò)分析圖3發(fā)現(xiàn):①耕地在B11波段的反射率上升相比于其他地物的反射率下降具有顯著差異,利用B11波段很容易將耕地與其他地物區(qū)分出來(lái);②草地在B06,B07,B08,B08a波段的反射率與其他地物均存在差異,可以利用這幾個(gè)波段將草地與其他地物區(qū)分;③落葉針葉林在B05波段的反射率低于落葉闊葉林,而在B06波段的反射率卻高于落葉闊葉林,可以利用這一特征將兩者進(jìn)行區(qū)分。
通過(guò)分析典型地物的NDVI時(shí)間序列曲線(xiàn)與典型地物的光譜反射率曲線(xiàn),得出結(jié)合NDVI時(shí)序與光譜特征分類(lèi)方法的最佳分類(lèi)閾值。在2017-09-22的影像中,INDV<0.37為非植被;在2017-12-31的影像中,INDV>0.39為常綠針葉林;在2017-06-14的影像中,B11波段的反射率B11>25%為耕地(圖3);在2017-06-14的影像中,B08波段的反射率B08>21%為草地;在2017-05-25的影像中,INDV>0.8為落葉闊葉林;在2017-05-25影像中,0.7<INDV<0.8為落葉針葉林。
圖2 典型地物的NDVI時(shí)間序列曲線(xiàn)Figure 2 NDVI temporal profiles of typical land cover types
圖3 典型地物的光譜反射率Figure 3 Spectral reflectance curve of typical land cover types
通過(guò)分析比較3種方法的分類(lèi)結(jié)果(圖4和表2)發(fā)現(xiàn):①最大似然法。非植被與耕地在分類(lèi)結(jié)果中的面積明顯偏少,存在大量的漏分;草地在分類(lèi)結(jié)果圖中沒(méi)有明顯的表現(xiàn)出來(lái),也存在嚴(yán)重的漏分;常綠針葉林、落葉針葉林和落葉闊葉林在分類(lèi)結(jié)果完全是分散分布且交錯(cuò)分布的,這與實(shí)地調(diào)查情況不符,存在明顯的混分。②NDVI時(shí)序+光譜特征方法。非植被分類(lèi)情況與基于多特征的分類(lèi)結(jié)果一致,且明顯可以看出包含了一些道路,與實(shí)際調(diào)查情況相符;耕地和草地的分類(lèi)結(jié)果與其他2種方法相比面積較多,尤其是草地的面積過(guò)多,與常綠針葉林、落葉針葉林和落葉闊葉林產(chǎn)生混分。③NDVI時(shí)序+光譜特征+紋理特征方法。非植被與耕地的面積和分布情況均符合實(shí)際情況;常綠針葉林主要分布在耕地周邊,集中在研究區(qū)的中部;落葉闊葉林主要分布在研究區(qū)的西部和西南位置,少數(shù)分散分布于整個(gè)研究區(qū),與落葉針葉林交錯(cuò)分布;草地在研究?jī)?nèi)呈現(xiàn)為一些散碎的斑塊,且面積相對(duì)較小。整體的分類(lèi)結(jié)果與實(shí)地調(diào)查情況有較高的一致性。
圖4 3種方法的分類(lèi)結(jié)果示意圖Figure 4 Classification results of three methods
利用實(shí)地調(diào)查采集的178個(gè)樣點(diǎn)數(shù)據(jù)作為驗(yàn)證樣本,其中非植被19個(gè),耕地13個(gè),常綠針葉林46個(gè),落葉闊葉林41個(gè),落葉針葉林43個(gè),草地16個(gè)。對(duì)比3種方法的分類(lèi)結(jié)果與實(shí)地調(diào)查結(jié)果,并計(jì)算出每種方法的類(lèi)別分類(lèi)精度及總體分類(lèi)精度。由表3可見(jiàn):基于NDVI時(shí)序+光譜特征+紋理特征的多特征分類(lèi)總體精度達(dá)87.64%,分別比最大似然法和NDVI時(shí)序+光譜特征的分類(lèi)總體精度提高了15.73%和14.61%。而且基于NDVI時(shí)序+光譜特征+紋理特征的多特征分類(lèi)中單個(gè)類(lèi)別的分類(lèi)精度也均較高,其中常綠針葉林的分類(lèi)精度最高達(dá)到了95.65%,這是由于利用了NDVI時(shí)序特征,可以通過(guò)分析不同植物在1 a中的NDVI變化趨勢(shì),選擇出最佳的分類(lèi)時(shí)相將常綠針葉林與其他地物區(qū)分。耕地的分類(lèi)精度也比較高,其N(xiāo)DVI在1 a中的變化具有一定的規(guī)律性,且耕地在B11波段的反射率與其他地物有明顯差異,利用這些特征可與其他地物很好地區(qū)分。NDVI時(shí)序+光譜特征的分類(lèi)精度與NDVI時(shí)序+光譜特征+紋理特征的分類(lèi)精度相比,非植被這一類(lèi)別的分類(lèi)精度相同,但其他類(lèi)別的分類(lèi)精度則較低。這是由于NDVI時(shí)序變化和光譜特征代表的僅僅是一個(gè)平均值,并不能完全代表地物的特征變化,因此,根據(jù)平均值來(lái)選取閾值分層分類(lèi)的精度較低。
表2 3種分類(lèi)方法的地類(lèi)面積Table 2 Land area of three methods
表3 3種分類(lèi)方法的精度評(píng)價(jià)Table 3 Accuracy evaluation of three methods
本研究基于多時(shí)相的Sentinel-2遙感影像,選取NDVI時(shí)間序列、最佳時(shí)相的Sentinel-2數(shù)據(jù)中10個(gè)波段的光譜反射率特征和主成分分析前3個(gè)分量的紋理特征作為分類(lèi)特征,利用支持向量機(jī)分類(lèi)器,將研究區(qū)內(nèi)的植被類(lèi)型分為耕地、草地、常綠針葉林、落葉針葉林和落葉闊葉林。得出結(jié)論如下:①基于多特征的分類(lèi)總體精度達(dá)87.64%,Kappa系數(shù)為0.85,分別比最大似然法的分類(lèi)結(jié)果提高了15.73%和0.20。因此,結(jié)合多種特征的分類(lèi)方法有助于提高分類(lèi)精度。②通過(guò)構(gòu)建NDVI時(shí)間序列,分析地物的NDVI變化趨勢(shì),選擇常綠針葉林提取的最佳時(shí)相進(jìn)行提取,可以大大提高常綠針葉林的分類(lèi)精度。NDVI的時(shí)序特征對(duì)于植被的區(qū)分具有很大幫助。③耕地在Sentinel-2影像的B11波段上的反射率與其他地物有顯著差異,而且耕地在NDVI時(shí)間序列上也與其他地物有明顯差異,利用這些特征極大提高了耕地的分類(lèi)精度。④采用分層分類(lèi)的思想,首先將研究區(qū)內(nèi)的植被提取出來(lái),然后再對(duì)植被進(jìn)行類(lèi)型識(shí)別,可以排除非植被因素的干擾,有效提高植被類(lèi)型的分類(lèi)精度。
分類(lèi)結(jié)果中常綠針葉林與耕地均得到了很高的分類(lèi)精度,這是由于本研究考慮了植被的物候信息,構(gòu)建了不同植被的NDVI時(shí)間序列變化曲線(xiàn),并充分利用植被的物候特征進(jìn)行分類(lèi)。分類(lèi)結(jié)果中也顯示草地的分類(lèi)精度是所有類(lèi)別中精度最低的。一方面原因是,在研究區(qū)內(nèi)草地分布比較分散而且比較破碎,在實(shí)地調(diào)查中采集的草地樣本點(diǎn)相比其他類(lèi)別樣本數(shù)量較少,分類(lèi)時(shí)訓(xùn)練樣本的數(shù)量相比其他類(lèi)別也比較少,從而導(dǎo)致了分類(lèi)精度較低。另一方面,草地的NDVI時(shí)間序列變化規(guī)律與落葉針葉林、落葉闊葉林相似,其光譜反射率的變化規(guī)律與落葉針葉林也相似,從而導(dǎo)致草地極易與落葉針葉林、落葉闊葉林混分,使其分類(lèi)精度較低。本研究只選取了NDVI時(shí)序特征、光譜特征和紋理特征3種特征作為分類(lèi)特征,而地形特征中也包含了豐富的信息,可以充分利用地形特征進(jìn)行深入研究。