王俊杰, 張思媛, 滕鵬程
(1.黑龍江科技大學(xué) 礦業(yè)工程學(xué)院, 哈爾濱 150022; 2.兗州中材建設(shè)有限公司, 江西 撫州 344706)
精確識別森林樹種對生態(tài)環(huán)境和樹木的可持續(xù)發(fā)展具有重要意義,有助于研究森林中生態(tài)系統(tǒng)的多樣性,合理有計劃地規(guī)劃、監(jiān)測和保護森林資源,實現(xiàn)森林資源的可持續(xù)發(fā)展。無人機多光譜影像空間分辨率高且較傳統(tǒng)調(diào)查方法效率更高,因此為中小尺度上的精細樹種識別提供了新的方法。楊爍[1]基于Landsat影像并結(jié)合DEM數(shù)據(jù)對大興安嶺地區(qū)進行了遙感影像分類研究,分類總體精度為75.46%。Pro?ek等[2]以位于捷克的一個森林為研究區(qū),基于無人機多光譜和紋理信息進行了樹種精細分類,分類精度達到88.2%。隨著激光雷達掃描技術(shù)的發(fā)展,其在林業(yè)中的應(yīng)用也越來越廣泛[3]。Puttonen等[4]利用機載雷達點云數(shù)據(jù)和高光譜數(shù)據(jù)結(jié)合,對樹種進行分類,結(jié)果顯示結(jié)合了點云數(shù)據(jù)的精度提高為95.8%,證明了在樹種分類中結(jié)合多源遙感數(shù)據(jù)能夠提高識別精度。Clark等[5]通過對熱帶雨林的樹種識別研究,得出基于單木冠幅的樹種識別精度比基于像素尺度的樹種識別精度要高。隨著激光雷達技術(shù)的發(fā)展,將點云數(shù)據(jù)運用到單木分割也成了研究熱點。Drǎgut等[6]結(jié)合光譜特征和形狀特征通過多尺度分割算法實現(xiàn)了單木分割。Zhen等[7]提出了區(qū)域生長算法,通過樹木之間的高度差分析競爭區(qū)域?qū)崿F(xiàn)單木分割。手持激光掃描儀發(fā)射的激光束可透過林間隙抵達樹干、樹冠和地面,快速完整獲取森林的樹干等垂直結(jié)構(gòu)信息,但其在樹種識別領(lǐng)域運用較少。
因此,結(jié)合多源遙感數(shù)據(jù)進行樹種識別研究是目前的研究熱點,但大部分研究數(shù)據(jù)源采用較為單一,故筆者將HMLS數(shù)據(jù)和無人機多光譜數(shù)據(jù)結(jié)合,利用隨機森林模型進行樹種識別,探索不同數(shù)據(jù)組合方式對樹種識別精度的影響,以期為后續(xù)樹種識別領(lǐng)域提供一定參考意義。
文中研究區(qū)域選擇了位于哈爾濱市阿城區(qū)的料甸林場,料甸林場位于哈爾濱市阿城區(qū)東北區(qū)域(東經(jīng)127°3′39″~127°13′39″,北緯45°34′22″~45°42′4″[8])。林場地處張廣才嶺北段,整個地勢南高北低,地勢起伏較緩。主要喬木樹種有紅松、水曲柳、椴樹、柞樹、榆樹、色樹、白樺、楊樹等,灌木和藤本植物有白丁香、五味子等,草本植物有苔草、地榆、鈴蘭等。研究區(qū)地理位置示意,如圖1所示。
圖1 研究區(qū)地理位置示意
2.1.1 野外實測數(shù)據(jù)
野外實測數(shù)據(jù)獲取于2022年10月15日,選取了落葉松、樺樹、榆樹、楊樹和柞樹為研究對象。在研究區(qū)中主要選取了三塊便于測量的樣地,在樣地中隨機選取單木利用RTK測量單木的位置信息,并記錄單木的樹種信息,共記錄落葉松32株,樺樹10株,榆樹7株,楊樹26株,柞樹21株。
2.1.2 無人機數(shù)據(jù)
無人機多光譜數(shù)據(jù)搭載飛行平臺為固定翼無人機,利用MS600 V2通用型多光譜相機獲取多光譜數(shù)據(jù),坐標(biāo)系為CGCS2000坐標(biāo)系。采集時間于2022年10月15日的中午,飛行區(qū)域要包括整個研究區(qū)。具體無人機參數(shù)設(shè)置為飛行高度300 m,飛行速度18 m/s,航向重疊率80%,旁向重疊率70%,相片分辨率1 280×960,地面分辨率0.2 m,圖像類型16-bit TIFF。
2.1.3 手持激光掃描儀數(shù)據(jù)
手持激光雷達數(shù)據(jù)獲取于2020年10月15日,對研究區(qū)內(nèi)包含實測樣本單木的三塊樣地進行掃描,該數(shù)據(jù)獲取基于LiGrip手持旋轉(zhuǎn)激光掃描儀,手持移動激光掃描儀數(shù)據(jù)參數(shù)為:LIDAR精度±3 cm,測量范圍100m,掃描視場角為280°×360°,相對精度≤3 cm,掃描頻率300 000 pts/s。
雷達點云數(shù)據(jù)預(yù)處理的流程包括:點云去噪;基于CSF濾波算法對數(shù)據(jù)進行地面點分類;基于IDW插值法生成DEM、DSM,并對兩者作差生成研究區(qū)CHM(冠層高度模型)和點云歸一化。
單木分割算法可以將點云數(shù)據(jù)分割成多個部分,每個部分可以看作一棵單木。采用基于分水嶺分割(Watershed)算法、點云距離閾值分割(PCS)算法和基于層堆疊算法(Layer stacking)的單木分割方法對研究區(qū)點云數(shù)據(jù)進行單木分割。分水嶺分割基于分辨率為0.3 m的CHM(冠層高度模型),經(jīng)過嘗試選取Sigma(高斯平滑因子)為0.5來進行研究區(qū)的單木分割;PCS分割時嘗試不同的距離閾值進行分割,最終選擇距離閾值為2 m對本研究區(qū)進行單木分割;層堆疊種子點的單木分割流程為:(1)首先對點云數(shù)據(jù)進行歸一化操作,以消除地勢地形對單木分割的影響;(2)將點云數(shù)據(jù)進行水平分層,文中設(shè)置從1 m開始每隔1 m進行一次分層直至最高點;(3)基于K-Means聚類算法對每一層點云進行聚類操作,去除一些矮小的植被;(4)在每一個聚類生成多邊形緩沖區(qū),將每層多邊形重疊,多個多邊形重疊說明此處有單木存在,識別局部最大值將其作為種子點;(5)對種子點基于PCS算法進行單木分割。
將分割結(jié)果與實地調(diào)查數(shù)據(jù)進行匹配,單木分割的整體精度驗證,文中采用F來進行評價[9],F-Score由計算精度P(Precision)和召回率R(Recall)兩個因素計算而來,P代表單木檢測的準(zhǔn)確率,包括正確分割、欠分割和過分割[10]。分割精度的計算公式為
(1)
(2)
(3)
式中:TP——正確分割;
FN——欠分割;
FP——過分割。
通過對比結(jié)果精度,選取精度最高的分割算法參與樹種識別。
3.2.1 特征提取與特征篩選
結(jié)合國內(nèi)外研究,對多光譜波段之間進行不同的線性組合計算了11個光譜特征:大氣阻抗植被指數(shù)(ARVI)、亮度(BI)、差值植被指數(shù)(DVI)、增強型植被指數(shù)(EVI)、綠光歸一化植被指數(shù)(GNDVI)、紅外百分比植被指數(shù)(IPVI)、修正型簡單比值植被指數(shù)(MSR)、歸一化植被指數(shù)(NDVI)、歸一化綠光(NORMG)、最優(yōu)土壤調(diào)節(jié)指數(shù)(OSAVI)、紅綠比值植被指數(shù)(RGRI);基于灰度共生矩陣提取了8個紋理特征:角二階矩、相關(guān)性、對比度、相異性、熵、均勻度、均值、方差;基于HMLS數(shù)據(jù),提取了高度變量:點云累計高度百分位數(shù)、冠層起伏率、點云高度最大值、點云高度平均值、大于10%、30%、50%、70%、90%高度的點云密度和點云高度變異系數(shù);強度變量:點云強度平均值、點云強度百分位數(shù)、點云強度最大值、點云強度變異系數(shù)、點云強度的峰度值來參與樹種識別。
為了避免特征冗余,隨機森林在進行模型運算時會對數(shù)據(jù)的屬性進行重要性的排序,本文利用這一功能,基于OOBPredictorImportance包對參與分類的特征進行重要性排序,從中不斷優(yōu)選,選取排名靠前的變量參與樹種分類。
3.2.2 識別方法
隨機森林(Random Forest,RF)算法是一種機器學(xué)習(xí)算法,隨機森林分類就是利用多個樣本進行訓(xùn)練之后獲得預(yù)測分類結(jié)果的分類過程。將實測樣本數(shù)據(jù)以7∶3的比例分為訓(xùn)練集和驗證集,通過兩種不同數(shù)據(jù)組合形式(多光譜數(shù)據(jù)、多光譜數(shù)據(jù)結(jié)合手持點云數(shù)據(jù))對研究區(qū)內(nèi)樹種進行分類研究,并對比其識別精度。
分類結(jié)果精度的評定通過混淆矩陣來實現(xiàn),混淆矩陣又叫誤差矩陣,通過對比實測點和分類點來計算精度,其衡量指標(biāo)通過Kappa系數(shù)K、分類的總體精度ηOA、觀測一致率Pe來評價。具體計算公式為
(4)
(5)
(6)
式中:Xii——第i類樹被正確分類的數(shù)量;
N——分類樣本樹木總數(shù);
Xi——第i類驗證樣本的數(shù)量;
Xi′——被分為i的樣本數(shù)量。
基于三種單木分割算法對手持移動激光雷達數(shù)據(jù)(HMLS)實現(xiàn)了單木分割,并結(jié)合實測樣本點數(shù)據(jù)進行單木匹配,計算不同分割算法的單木分割精度,表1為基于Watershed、PCS和Layer stacking分割算法的單木分割結(jié)果精度對比情況。
表1 基于不同分割算法的單木分割精度
從表1可以發(fā)現(xiàn),基于Layer stacking層堆疊生成種子點的單木分割R值為0.763,P值為0.972,F值為0.855;該算法單木分割精度最高,96棵樣本樹中有70棵分割正確,24棵欠分割,2棵過分割,故選取Layer stacking算法分割結(jié)果進行樹種識別研究。
4.2.1 特征篩選結(jié)果
經(jīng)OOBPredictorImportance包對特征進行篩選并排序后,對于不同數(shù)據(jù)組合優(yōu)選出各自重要性排名前20的特征。圖2為特征優(yōu)選情況和重要性排序,其中,圖2a為光譜特征與紋理特征參與隨機森林樹種分類的特征重要性排序情況,圖2b為在圖2a的基礎(chǔ)上加入手持激光點云數(shù)據(jù)的隨機森林分類模型特征重要性排序情況。
圖2 特征重要性排序
從圖2a中可以看出,NORMG重要程度最高,紋理指數(shù)和原始波段排名靠后,說明紋理特征在天然林樹種識別中的影響較小。而觀察圖2b,發(fā)現(xiàn)排名靠前的特征除了NORMG以外,都為點云特征,這也證明了基于激光雷達數(shù)據(jù)提取的樹木結(jié)構(gòu)特征特別是點云高度特征在樹種識別中的應(yīng)用潛力。
4.2.2 識別結(jié)果
基于光譜特征和紋理特征的樹種識別結(jié)果見表2,結(jié)合光譜特征、紋理特征和手持點云結(jié)構(gòu)特征的樹種識別結(jié)果見表3。僅使用無人機多光譜數(shù)據(jù)的樹種識別總體精度為70.83%,Kappa系數(shù)為0.69;結(jié)合無人機多光譜數(shù)據(jù)和手持移動激光雷達數(shù)據(jù)的樹種識別總體精度為81.25%,Kappa系數(shù)為0.80,樺樹識別精度有所提高,總體來看分類表現(xiàn)良好。
表2 光譜特征的樹種識別
表3 光譜+手持點云數(shù)據(jù)的樹種識別
與僅使用無人機多光譜影像的分類模型相比,可以發(fā)現(xiàn)加入樹木結(jié)構(gòu)特征能很好地提高樹種識別精度。在五類樹種中,樺樹分類精度最低,其他樹種也都有一定程度的錯分,落葉松識別精度最高,考慮原因可能是落葉松為針葉樹種,而其他為闊葉樹,落葉松作為唯一的針葉林,故落葉松有更好的區(qū)分性,說明在對森林類型的分類上點云數(shù)據(jù)也有很好的表現(xiàn)。
以哈爾濱市阿城區(qū)料甸林場為研究區(qū),結(jié)合多光譜數(shù)據(jù)和手持激光雷達數(shù)據(jù)實現(xiàn)了研究區(qū)的單木樹種識別。具體研究結(jié)果如下。
(1)在對點云數(shù)據(jù)進行預(yù)處理、歸一化等操作后,對比了分水嶺分割、PCS分割和層堆疊種子點的單木分割結(jié)果精度,結(jié)果表明基于層堆疊生成種子點的單木分割算法精度最高,F值為0.843。
(2)在特征重要性排序中,點云高度變量比光譜特征、紋理特征和強度變量重要性更高,說明其在樹種識別中有很大的應(yīng)用前景。
(3)基于不同的數(shù)據(jù)組合方式的樹種識別,加入雷達數(shù)據(jù)后的樹種識別精度較僅使用多光譜數(shù)據(jù)的樹種識別精度提高了10.42%,而基于不同森林類型之間的區(qū)分比樹種分類效果更好。