李煜 李崇貴 劉思涵 馬婷 吳夢(mèng)月
(西安科技大學(xué),西安,710054)
森林樹種識(shí)別及其分布情況制圖對(duì)于森林管理、森林?jǐn)_動(dòng)監(jiān)測(cè)、環(huán)境和生物多樣性評(píng)估以及碳儲(chǔ)量和蓄積量估算至關(guān)重要[1]。遙感數(shù)據(jù)(如光學(xué)遙感數(shù)據(jù)、主動(dòng)式雷達(dá)遙感數(shù)據(jù)等)均可實(shí)時(shí)獲取大量關(guān)于森林物種組成的信息,并且與傳統(tǒng)的實(shí)地監(jiān)測(cè)相比,所需的時(shí)間更少,并且可以實(shí)現(xiàn)大面積制圖以及覆蓋到人類難以進(jìn)入的森林區(qū)域。多光譜圖像一直是森林物種組成制圖中最常用的數(shù)據(jù)(特別是來自Landsat 8的圖像)[2-4],然而,由于混合像素的出現(xiàn),中等空間分辨率遙感數(shù)據(jù)的使用面臨挑戰(zhàn)[5]。一般情況下,中低空間分辨率數(shù)據(jù)雖然可以繪制森林類型覆蓋圖,但是分類結(jié)果沒有詳細(xì)分析樹種組成,不能被森林管理者使用。高光譜影像數(shù)據(jù)和激光雷達(dá)數(shù)據(jù)的出現(xiàn)使得森林樹種精細(xì)分類制圖成為可能[6-7]。首先高光譜傳感器可以對(duì)每個(gè)空間像元經(jīng)過色散,形成幾十個(gè)乃至幾百個(gè)窄波段以進(jìn)行連續(xù)的光譜覆蓋,從而更加細(xì)致的捕獲到植被的生化變化過程,因此在許多研究中高光譜數(shù)據(jù)的結(jié)果都優(yōu)于多光譜影像。然而高光譜遙感圖像各波段間存在著高相關(guān)性和高冗余度,在處理上有一定的困難,高光譜影像也需要更高的計(jì)算能力[8]。此外,陸地激光雷達(dá)雖然也能用于樹種分類,提供關(guān)于森林結(jié)構(gòu)的詳細(xì)的信息,但是由于激光雷達(dá)和高光譜數(shù)據(jù)的操作使用限制以及高額的使用成本,這些數(shù)據(jù)的適用性在大區(qū)域研究或全球范圍內(nèi)仍然是有限的,所以在大區(qū)域植被和森林覆蓋研究中,哨兵2A(具有相對(duì)密集、可自由獲取的多光譜影像)是更為優(yōu)勢(shì)的數(shù)據(jù)來源。李哲等[9]利用高分二號(hào)影像構(gòu)建了多種單時(shí)相及多時(shí)相影像組合,利用支持向量機(jī)(SVM)和隨機(jī)森林(RF)兩種分類器,分別實(shí)現(xiàn)了不同時(shí)相及特征維度的面向?qū)ο蟮?個(gè)樹種的分類,總體精度為63.5%~83.5%、卡帕(Kappa)系數(shù)為0.57~0.81。蔡林菲等[10]基于高分二號(hào)影像結(jié)合多種遙感及GIS特征因子,比較支持向量機(jī)、隨機(jī)森林和極端梯度提升(XGBoost)等3種分類算法,對(duì)龍泉市的闊葉樹、馬尾松、杉木和毛竹等4種主要優(yōu)勢(shì)樹種進(jìn)行分類,采用極端梯度提升分類模型的分類總精度為83.88% ,卡帕系數(shù)為0.78,比支持向量機(jī)和隨機(jī)森林分類方法有明顯提高。林志瑋等[11]以福建安溪縣為例,采用無人機(jī)獲取不同高度的航拍影像,采用卷積神經(jīng)網(wǎng)絡(luò)(DenseNet)建立樹種識(shí)別模型,表明不同航拍高度的樹種識(shí)別模型,其分類精度均達(dá) 80% 以上,最高精度為87.54%。Laurel et al.[12]使用激光雷達(dá)數(shù)據(jù),對(duì)美國加州國家保護(hù)區(qū)及周邊峽谷森林樹種進(jìn)行分類,研究使用支持向量機(jī)和隨機(jī)森林分類器,結(jié)果表明所有的分類結(jié)果的整體準(zhǔn)確率在90%以上,當(dāng)使用額外的訓(xùn)練樣本時(shí),支持向量機(jī)的表現(xiàn)優(yōu)于隨機(jī)森林,增加訓(xùn)練樣本也可以提高支持向量機(jī)分類器的個(gè)體性能。Nicola et al.[13]研究了哨兵2A在地中海進(jìn)行森林類型制圖的能力,結(jié)果表明夏季獲取的單個(gè)哨兵2A圖像無法區(qū)分森林類型,需要在不同物候期收集的多時(shí)相圖像,最佳時(shí)相組合影像的準(zhǔn)確度大于83%。物候變化可以提高樹種間光譜的可分性,物候周期引起的反射率變化有助于森林樹種的準(zhǔn)確分類。在利用多光譜影像進(jìn)行森林樹種分類,關(guān)鍵問題是多時(shí)相數(shù)據(jù)的選擇和組合方法[14]。本研究應(yīng)用夏季、秋季和冬季的哨兵-2A時(shí)間序列影像對(duì)樹種進(jìn)行分類,探討哨兵-2A最佳影像組合、影像采集日期和哨兵-2A各波段對(duì)樹種分類精度提高的貢獻(xiàn)大小。
大孤家林場(chǎng)位于清原縣東北部,東經(jīng)124°45′58″~125°8″,北緯42°25′1″~42°15′55″。地勢(shì)呈東高西低,地貌為低山丘陵,海拔200~600 m。氣候?qū)儆跍貛Т箨懶詺夂?,年平均氣? ℃,年降水量500~800 mm,降水量主要集中在7、8月份。大孤家林場(chǎng)是國家級(jí)的林木良種繁育基地,林場(chǎng)面積230 hm2,樹種以日本落葉松(Larixkaempferi(Lamb.) Carr)為主體,兼有紅松(PinuskoraiensisSieb. et Zucc.)、白樺(BetulaplatyphyllaSuk.)、水曲柳(FraxinusmandshuricaRupr.)等。土壤為棕色森林土。
哨兵-2A衛(wèi)星攜帶多光譜成像儀(MSI),高度為786 km,可覆蓋13個(gè)光譜波段,幅寬達(dá)290 km,地面分辨率分別為10、20和60 m,衛(wèi)星的重訪周期為10 d,兩顆互補(bǔ),重訪周期為5 d,從可見光和近紅外到短波紅外,具有不同的空間分辨率,在光學(xué)數(shù)據(jù)中,哨兵2A數(shù)據(jù)在紅邊范圍內(nèi)含有3個(gè)波段的數(shù)據(jù),這對(duì)監(jiān)測(cè)植被健康信息非常有效[15]。
哨兵-2A遙感數(shù)據(jù)來源于哥白尼開放存取中心(https://scihub.copernicus.eu/)提供的2018年覆蓋研究區(qū)的6景不同季節(jié)的無云影像(見圖1),其他輔助數(shù)據(jù)包括森林二類調(diào)查數(shù)據(jù)以及研究區(qū)行政區(qū)劃數(shù)據(jù)。研究中選擇了哨兵-2A影像10 m和20 m空間分辨率的波段(見表1)。
圖1 以森林為例的哨兵2A影像
表1 本研究使用的哨兵-2A光譜波段信息
樹種分類的樣地?cái)?shù)據(jù)是通過研究區(qū)二類調(diào)查數(shù)據(jù),結(jié)合谷歌地球上的多時(shí)相影像人工采集得到。即將二類調(diào)查數(shù)據(jù)加載到谷歌地球?qū)I(yè)版中,結(jié)合谷歌地球的歷史影像數(shù)據(jù)庫提供的時(shí)間序列遙感影像,通過目視解譯選擇各類型樹種樣地,解譯生成樣本數(shù)據(jù)。依據(jù)二類調(diào)查數(shù)據(jù)資料優(yōu)勢(shì)樹種屬性在研究區(qū)域內(nèi)共采集了包含落葉松、紅松、闊葉林、其他常綠針葉、非林地(耕地、建筑、水體)等主要特征地物樣本。通過地理信息系統(tǒng)檢查空間拓?fù)潢P(guān)系,刪除了覆蓋混合像元的樣地,以確保樣地完全落在單一林種區(qū)域,減少因?yàn)橄裨庾V混合造成的分類精度誤差。研究中所有樣地均設(shè)置為0.08 hm2矩形樣地。各類樹種訓(xùn)練樣本統(tǒng)計(jì)數(shù)據(jù)見表2。
表2 訓(xùn)練樣本信息
樹種分類方法選擇隨機(jī)森林分類器進(jìn)行,隨機(jī)森林是通過集成學(xué)習(xí)的思想將多棵樹集成的一種算法,基本單元是決策樹,其本質(zhì)屬于機(jī)器學(xué)習(xí)的一大分支——集成學(xué)習(xí)方法。集成分類器假設(shè)是當(dāng)使用一組弱學(xué)習(xí)器時(shí),與僅使用它們中的單個(gè)分類器相比,可以獲得更好的性能。隨機(jī)森林與其他非參數(shù)分類器相比,具有計(jì)算速度更快,成本更低的優(yōu)勢(shì)。此外,隨機(jī)森林可以抵抗過擬合問題的發(fā)生,并且可以管理許多輸入變量而無需刪除變量,這些優(yōu)勢(shì)決定了隨機(jī)森林適合時(shí)間序列遙感影像分類。實(shí)驗(yàn)在Enmap-Box軟件的監(jiān)督分類函數(shù)中應(yīng)用了隨機(jī)森林算法,將生成的樣本數(shù)據(jù)用作分類的輸入數(shù)據(jù),并且按照7∶3的比例將其隨機(jī)分成訓(xùn)練樣本和驗(yàn)證樣本,然后進(jìn)行模型訓(xùn)練,生成隨機(jī)森林模型變量的重要性報(bào)告。通過對(duì)不同單時(shí)相影像和根據(jù)隨機(jī)森林變量重要性報(bào)告進(jìn)行的不同多時(shí)相影像組合進(jìn)行多次分類實(shí)驗(yàn),將具有較高總體分類精度(OA)和Kappa系數(shù)的影像或影像組合認(rèn)為是最佳分類效果。
隨機(jī)森林可以對(duì)特征變量重要性進(jìn)行排序,隨機(jī)森林模型在得到特征變量的重要性得分后,可以根據(jù)特征變量重要性評(píng)級(jí)得分,按照從大到小的順序降序排列,完成變量選擇過程[16]。并且可以在特征變量選擇開始之前設(shè)定特征變量子集大小,根據(jù)子集的大小選取變量[17-18]。對(duì)于每顆樹,按照基尼系數(shù)和信息熵給變量特征排序,然后對(duì)整個(gè)森林取平均值[19]。隨機(jī)森林模型在分類中通常應(yīng)用基尼系數(shù)或信息熵進(jìn)行特征變量重要性評(píng)級(jí)。實(shí)驗(yàn)計(jì)算了60個(gè)波段信息的重要性統(tǒng)計(jì)信息,這里僅選取20個(gè)最重要的特征變量,即20個(gè)分別具有最高基尼系數(shù)和信息熵值的變量(見圖2)。
由圖2可知,基尼系數(shù)和信息熵統(tǒng)計(jì)數(shù)據(jù)都顯示10月18日和11月10日的短波紅外2波段和紅邊2波段在隨機(jī)森林分類器中對(duì)樹種分類的重要性最高。總體上,對(duì)分類貢獻(xiàn)度高的影像大多是秋冬季節(jié),波段分布以紅邊范圍內(nèi)波段為主,這也符合哨兵2A數(shù)據(jù)在紅邊范圍設(shè)計(jì)3個(gè)波段用以監(jiān)測(cè)植被健康信息的目的。其次貢獻(xiàn)度較高波段為兩個(gè)短波紅外波段以及紅光波段,均是對(duì)植被比較敏感的監(jiān)測(cè)波段。
圖2 對(duì)樹種分類最重要的20個(gè)變量的基尼系數(shù)和信息熵
結(jié)合兩種重要性評(píng)價(jià)方法所得重要性排序圖以及單時(shí)相影像,共設(shè)計(jì)分類組別9組,分別對(duì)6景不同時(shí)相遙感影像、兩組按照重要性所得20個(gè)波段進(jìn)行組合的多時(shí)相遙感影像以及由6景影像全部波段組合形成的遙感影像應(yīng)用隨機(jī)森林分類器的監(jiān)督分類。
由表3可知,在應(yīng)用單時(shí)相哨兵2A影像進(jìn)行監(jiān)督分類實(shí)驗(yàn)時(shí),8月2日的影像取得了最高精度,總體精度為82.17%,其次是5月24日以及10月18日的影像,總體精度分別為82.14%和82.09%。在多時(shí)相組合圖像的分類結(jié)果中,總體精度大幅提高。組合了所有影像波段的影像分類效果最好,總體精度高達(dá)87.45%。按照基尼系數(shù)所得統(tǒng)計(jì)信息的影像組合分類總體精度為86.65%,信息熵的影像組合總體精度為84.97%,相較于季相信息豐富的單時(shí)相影像沒有很大提升。
表3 單時(shí)相影像及影像組合的分類總體精度和Kappa系數(shù)
應(yīng)用精度評(píng)估數(shù)據(jù),最終選擇使用所有波段影像獲得大孤家林場(chǎng)樹種分類專題圖(見圖3)。
圖3 大孤家林場(chǎng)樹種分類專題圖
以大孤家林場(chǎng)為例,使用2018年獲取的6景哨兵2A無云影像,影像獲取的時(shí)間序列包含了大部分樹種關(guān)鍵生長(zhǎng)期,因此可以全面獲得有關(guān)樹種光譜值隨時(shí)間變化的趨勢(shì)。本研究驗(yàn)證了使用多時(shí)相遙感影像可以提高樹種分類的精度的結(jié)論。使用多時(shí)相影像組合的分類精度明顯優(yōu)于單時(shí)相影像分類精度,不同季節(jié)、不同樹種生長(zhǎng)期的影像組合能夠大幅度提高樹種識(shí)別率。通過使用多時(shí)相影像,一些樹種的特定差異會(huì)表現(xiàn)的更加明顯,比如落葉松與其他常綠針葉的差異。而對(duì)于季相差異不是很大的樹種,增加不同生長(zhǎng)期的波段組合并不能改善分類精度,因?yàn)樗鼈兊墓庾V之間具有高度相關(guān)性,無法體現(xiàn)出差異。從隨機(jī)森林模型的變量重要性報(bào)告中可知,對(duì)總體精度提升貢獻(xiàn)最高的影像波段都來自于10月18日(秋季)和11月10日(冬季)的影像,從這兩景影像中也可直觀看到地物顏色發(fā)生了明顯改變。物候差異一直都是影響光學(xué)遙感影像進(jìn)行不同植被覆蓋分類的重要因素,闊葉林最重要的物候變化來自于10月份的影像,針葉林在生長(zhǎng)初期的影像更能進(jìn)行分辨。
研究發(fā)現(xiàn)哨兵2A影像的多個(gè)波段都提供了大量有關(guān)植被特性的有價(jià)值的信息,基尼系數(shù)和信息熵的統(tǒng)計(jì)數(shù)據(jù)都表明,并非所有光譜波段都能對(duì)樹種分類精度提高做出同等貢獻(xiàn)。研究中最重要的波段信息都來自于哨兵2A影像的3個(gè)紅邊波段、2個(gè)短波紅外波段以及近紅外波段(窄)、可見光紅色和綠色。有類似研究結(jié)論也證實(shí)了哨兵2A影像短波紅外和紅邊波段的對(duì)樹種分類重要性[20],這與本研究中選擇的對(duì)樹種分類精度改善提供高貢獻(xiàn)度的波段吻合。
基于光學(xué)遙感影像的森林樹種分類存在的重要問題是森林覆蓋區(qū)域復(fù)雜的環(huán)境條件以及生物多樣性。一方面,森林覆蓋區(qū)域的影像受云層覆蓋、大氣和地形等因素影響,很難獲得各樹種關(guān)鍵物候期的高質(zhì)量和無云影像,但哨兵2A衛(wèi)星具有較短的重訪周期克服了該問題。另一方面,林分因子的異質(zhì)性和破碎化導(dǎo)致不占優(yōu)勢(shì)的樹種難以收集足夠的樣本來進(jìn)行細(xì)化,常見的優(yōu)勢(shì)樹種分類精度更高,而小類別樹種更容易錯(cuò)分,這是森林樹種的光譜相似性以及樣本量不足以形成均質(zhì)林分導(dǎo)致。后續(xù)研究中可以增加小類別樹種樣地?cái)?shù)量以期降低該類別樹種錯(cuò)分誤差。因此,利用哨兵2A多時(shí)相遙感影像以及隨機(jī)森林方法在森林樹種分類應(yīng)用方面具有較高的精度,可應(yīng)用多時(shí)相遙感影像對(duì)林分樹種制圖與監(jiān)測(cè)。