王浩偉, 王照利, 楊佳樂(lè), 段夢(mèng)琦
(1.中煤航測(cè)遙感集團(tuán)有限公司,西安 710199; 2.國(guó)家林業(yè)和草原局西北調(diào)查規(guī)劃設(shè)計(jì)院,西安 710048)
傳統(tǒng)森林資源調(diào)查多利用卷尺、測(cè)高器等工具進(jìn)行人工測(cè)量,受各種條件的限制,勞動(dòng)強(qiáng)度大,費(fèi)時(shí)費(fèi)工,而激光雷達(dá)技術(shù)的出現(xiàn)為林業(yè)資源調(diào)查提供了新的思路與方法[1]。激光雷達(dá)具有與被動(dòng)光學(xué)遙感不同的成像機(jī)理,對(duì)植被空間結(jié)構(gòu)和地形具有較強(qiáng)的探測(cè)能力,特別是在森林高度探測(cè)方面具有其他遙感技術(shù)無(wú)法比擬的優(yōu)勢(shì)[2]。通過(guò)激光雷達(dá)獲取林區(qū)三維空間點(diǎn)信息,并在此基礎(chǔ)上分離植被特征,進(jìn)而實(shí)現(xiàn)森林資源的估測(cè)。
通過(guò)點(diǎn)云數(shù)據(jù)獲取的特征變量,由于其描述的森林信息不同,對(duì)不同林分因子的相關(guān)性也各不相同。多數(shù)學(xué)者在利用激光雷達(dá)點(diǎn)云數(shù)據(jù)進(jìn)行林木因子估測(cè)時(shí),往往將提取到的所有特征變量作為輸入?yún)?shù)送入相關(guān)回歸算法中直接進(jìn)行計(jì)算,由于沒(méi)有對(duì)繁多的特征變量進(jìn)行篩選,存在如下問(wèn)題:
1)提取的特征變量與林分因子之間相關(guān)性較差,使用該特征進(jìn)行林木因子估測(cè)不具有可靠性。
2)提取的特征變量之間存在較強(qiáng)的線性相關(guān)性,模型訓(xùn)練時(shí)使用冗余的特征相當(dāng)于加入了大量的噪聲數(shù)據(jù),使得模型訓(xùn)練過(guò)程易產(chǎn)生震蕩,導(dǎo)致穩(wěn)定性較低。
3)特征過(guò)多容易造成存儲(chǔ)空間和處理時(shí)間的浪費(fèi),模型收斂速度降低,甚至?xí)?duì)決策的制定造成誤導(dǎo)。
本文針對(duì)天然林實(shí)驗(yàn)區(qū),研究并分析了不同特征值對(duì)不同林分因子模型反演的影響,通過(guò)實(shí)驗(yàn)計(jì)算出特征變量對(duì)模型的貢獻(xiàn)值,根據(jù)貢獻(xiàn)權(quán)重的不同,對(duì)特征變量進(jìn)行篩選,保留核心特征子集,并對(duì)其進(jìn)行回歸分析,從而生成合適的模型。通過(guò)對(duì)特征變量的權(quán)重分析與重要性評(píng)估,實(shí)現(xiàn)了特征集合的降維處理,既能夠保持特征集合不失真,又能夠消除特征集合中冗余的特征屬性。
蘇迪等以點(diǎn)云和正射影像為研究對(duì)象,利用冠層高度模型提取高程,并通過(guò)一元線性回歸分析估測(cè)平均樹(shù)高和平均胸徑模型[3];吳思敏等以廣西高峰林場(chǎng)為研究對(duì)象,借助機(jī)載激光雷達(dá)點(diǎn)云,構(gòu)建不同分辨率的冠層高度模型,結(jié)合地面實(shí)測(cè)數(shù)據(jù),提出一種結(jié)合自適應(yīng)閾值與峰值探測(cè)提取林分平均高的方法[4];許子乾等從集成高分辨率無(wú)人機(jī)影像和LiDAR兩組點(diǎn)云數(shù)據(jù)中提取特征變量并進(jìn)行亞熱帶森林林分特征反演[5]。李旺等利用機(jī)載激光雷達(dá)點(diǎn)云數(shù)據(jù),結(jié)合實(shí)測(cè)單木結(jié)構(gòu)信息,分別從樣地和單木尺度估算森林地上生物量[6]。上述學(xué)者對(duì)獲取到的特征信息均未進(jìn)行權(quán)重比較,不能排除噪聲數(shù)據(jù)的干擾。
研究區(qū)位于陜西省安康市嵐皋縣國(guó)營(yíng)林場(chǎng),屬北亞熱帶大陸性季風(fēng)氣候,林場(chǎng)位于巴山北坡,平均海拔1 400m,屬天然次生林,適應(yīng)各種林木的生長(zhǎng),森林資源豐富,植被較好。此次用于實(shí)驗(yàn)的林場(chǎng)位于嵐皋縣南部,面積約300km2,活立木蓄積量約為461.49萬(wàn)立方米,林區(qū)樹(shù)種主要包括樺、櫟、華山松、云杉等。
傳統(tǒng)林分因子反演使用激光雷達(dá)點(diǎn)云數(shù)據(jù)提取冠層高度模型,并以此為基礎(chǔ)提取相關(guān)的特征變量,結(jié)合樣地實(shí)測(cè)數(shù)據(jù)進(jìn)而完成模型訓(xùn)練。本文在該技術(shù)的基礎(chǔ)上新增特征權(quán)重分析模塊,通過(guò)對(duì)特征變量權(quán)重的比較分析篩選出最優(yōu)核心特征變量子集,從而實(shí)現(xiàn)模型精度的提高(圖1)。
a.傳統(tǒng)林分因子反演流程 b.本文改進(jìn)的林分因子反演流程
2021年3—4月在嵐皋縣國(guó)營(yíng)林場(chǎng)內(nèi),布設(shè)方形樣地115塊,樣地面積為667m2,均為硬闊林。每塊樣地中心點(diǎn)使用實(shí)時(shí)動(dòng)態(tài)差分技術(shù)(Real-Time kinematic,RTK)進(jìn)行精密定位,精度控制在2~3cm內(nèi)[7]。對(duì)樣地進(jìn)行每木檢尺,記錄其樹(shù)高、胸徑、材積等,記錄樣地的蓄積、株數(shù)及郁閉度等森林參數(shù)[8](表1)。
表1 部分樣地外業(yè)調(diào)查情況
2021年5月,使用機(jī)載激光掃描儀,搭載Phase OneIXA 180數(shù)碼相機(jī),在研究區(qū)同步獲取50km2范圍內(nèi)激光雷達(dá)點(diǎn)云數(shù)據(jù)及航空正射影像數(shù)據(jù)。飛行速度為250km/h,激光發(fā)射頻率為400kHz,掃描速率為106lps,點(diǎn)間距優(yōu)于70cm,點(diǎn)云數(shù)據(jù)均勻分布于作業(yè)區(qū)。
(1)濾波與分類
濾波是基于去噪后的點(diǎn)云數(shù)據(jù)進(jìn)行分離地面點(diǎn)和非地面點(diǎn)的操作[9]。經(jīng)過(guò)近幾十年國(guó)內(nèi)外學(xué)者的研究,已經(jīng)形成了眾多研究成果,如主動(dòng)輪廓線法、分級(jí)穩(wěn)健內(nèi)插法、數(shù)學(xué)形態(tài)學(xué)濾波法、移動(dòng)窗口濾波法等[10]。本文使用漸進(jìn)加密三角網(wǎng)算法對(duì)研究區(qū)點(diǎn)云數(shù)據(jù)進(jìn)行地物點(diǎn)與地面點(diǎn)的分類。首先在粗放的尺度尋找地面點(diǎn),并根據(jù)這些地面點(diǎn)建立粗尺度的TIN網(wǎng)絡(luò)表面;隨后逐一判斷其余的三維點(diǎn)與所構(gòu)三角網(wǎng)的垂直距離與位置關(guān)系,當(dāng)距離小于閾值,就將該點(diǎn)納入并重構(gòu)新的TIN表面,否則將該點(diǎn)刪除。如此往復(fù),逐步納入新的地面點(diǎn),直至所有點(diǎn)判斷完成。對(duì)于非地面點(diǎn)云再根據(jù)高程閾值實(shí)現(xiàn)植被點(diǎn)云的分類。分類前后對(duì)比情況如圖2所示。
a.點(diǎn)云分類前 b.點(diǎn)云分類后
(2)植被點(diǎn)云歸一化
歸一化的植被點(diǎn)云是描述森林垂直結(jié)構(gòu)參數(shù)的重要指標(biāo),對(duì)于森林參數(shù)反演估測(cè)有著重要作用。通常使用地物點(diǎn)云與地面點(diǎn)云生成數(shù)字高程模型(Digital Elevation Model,DEM),與數(shù)字表面模型(Digital Surface Model,DSM)相減得到,將植被點(diǎn)云歸一化至同一水平線上,從而去除地形起伏對(duì)樹(shù)木高度及生長(zhǎng)形態(tài)的影響[11]。本文在生成歸一化的植被點(diǎn)云時(shí),直接計(jì)算分類后的植被點(diǎn)云數(shù)據(jù)相對(duì)于地表的垂直高度,從而減少因點(diǎn)云柵格化引起的精度丟失。另外,在計(jì)算時(shí)忽略高程值為0的點(diǎn),可減少空白點(diǎn)對(duì)后續(xù)操作的影響[12]。樣地歸一化植被點(diǎn)云按高程渲染結(jié)果如圖3所示。
a.樣地點(diǎn)云 b.樣地歸一化植被點(diǎn)云
歸一化后的植被點(diǎn)云數(shù)據(jù)仍包含有植被類別的所有空間信息,對(duì)其空間結(jié)構(gòu)位置的分析能夠分離出描述植被信息的特征參數(shù)[13]。針對(duì)歸一化的植被點(diǎn)云數(shù)據(jù),提取能夠表征林木特點(diǎn)的特征變量,主要包括高度特征、密度特征、其他特征。其中,高度特征描述林區(qū)植被垂直結(jié)構(gòu)特性[14],本文將植被點(diǎn)云的高程值按升序排序,并記為Hveg,提取的高度特征變量及其描述如表2所示。
表2 高度特征變量
密度特征描述植被點(diǎn)在林區(qū)全部點(diǎn)云數(shù)據(jù)中所占的比重,為準(zhǔn)確區(qū)分不同高度點(diǎn)云在總體數(shù)據(jù)中的密度情況,針對(duì)不同高度的植被點(diǎn)分別計(jì)算其密度特征,并按升序排序,記為Dveg,具體描述如表3所示。
表3 密度特征變量
除高度特征及密度特征外,根據(jù)研究區(qū)中點(diǎn)云數(shù)據(jù)不同類別點(diǎn)的個(gè)數(shù)可以描述植被的其他特征變量,具體描述如表4所示。
表4 其他特征變量
(1)
式中:K為有K個(gè)類別;pmk為節(jié)點(diǎn)m中類別k所占的比例。特征Xj在節(jié)點(diǎn)m的重要性,即節(jié)點(diǎn)m分值前后的Gini指數(shù)變化量為
(2)
式中:GIl和GIr分別表示分支后兩個(gè)新節(jié)點(diǎn)的Gini指數(shù)。如果特征Xj在決策樹(shù)i中出現(xiàn)的節(jié)點(diǎn)為集合M,那么Xj在第i顆樹(shù)的重要性為
(3)
假設(shè)隨機(jī)森林中共有n顆樹(shù),那么
(4)
最后將所有求得的重要性評(píng)分做歸一化處理即可得到每個(gè)特征變量的特征權(quán)重,最大值為1,該值越大越重要,即與因變量密切相關(guān),對(duì)因變量的變化影響較大,對(duì)決策的指定起決定性作用。在進(jìn)行反演時(shí),將提取的特征提供給隨機(jī)森林模型,并通過(guò)特征權(quán)重分析比較各特征變量對(duì)林分因子反演的貢獻(xiàn)程度,根據(jù)其貢獻(xiàn)值排序,從而對(duì)特征變量集合進(jìn)行篩選,去掉冗余特征變量,保留核心特征子集,目標(biāo)預(yù)測(cè)更為準(zhǔn)確。具體步驟如下:
1)將提取到的高度特征Dheight、密度特征Ddensity及其他特征Dother,組合為特征變量Dall,并使用線性函數(shù)轉(zhuǎn)換法,將所有特征變量取值范圍映射到[0,1]區(qū)間內(nèi),得到Dnormalize。
2)將歸一化后的全部特征變量送入隨機(jī)森林回歸器中進(jìn)行模型訓(xùn)練,以Dnormalize為自變量,待預(yù)測(cè)的林分因子為因變量,多次實(shí)驗(yàn)選取最優(yōu)參數(shù)結(jié)果,以該模型精度作為基準(zhǔn)分?jǐn)?shù)Scorebase,并記錄該模型中各特征變量的貢獻(xiàn)。
3)反復(fù)實(shí)驗(yàn),在保證Scorebase不降低的前提下,分別刪除權(quán)重低的特征變量,并用減少后的特征子集重新訓(xùn)練模型,記錄分?jǐn)?shù)。
4)最終保留分?jǐn)?shù)最高的模型所對(duì)應(yīng)的特征變量組合Dbest,以此作為該因變量的最優(yōu)特征變量子集。
由于一些特征屬性對(duì)于決策的制定所做出的貢獻(xiàn)度低,因此將其去除后并不影響對(duì)信息的理解與表達(dá)。通過(guò)權(quán)重分析篩選后的特征變量去除干擾特征對(duì)模型精度的影響,降低無(wú)效特征變量對(duì)訓(xùn)練過(guò)程的干擾,在一定程度上提高模型精度。
針對(duì)研究區(qū)內(nèi)布設(shè)的115塊樣地開(kāi)展實(shí)驗(yàn),使用隨機(jī)森林算法分別對(duì)蓄積量、林分平均高、株數(shù)這三個(gè)森林因子進(jìn)行回歸預(yù)測(cè),并在保證模型精度不降低的前提下不斷縮減特征變量個(gè)數(shù),找到對(duì)模型貢獻(xiàn)最大的特征子集,記錄每個(gè)特征變量的權(quán)重值,為各個(gè)林分因子找到本研究區(qū)下的最優(yōu)特征子集(圖4至圖6)。
本文使用的精度驗(yàn)證指標(biāo)為擬合優(yōu)度R2,該值越大則因變量與自變量之間的相關(guān)性越強(qiáng),其定義如公式(5)所示:
(5)
圖4中a,b展示了在進(jìn)行特征權(quán)重分析前蓄積量的反演情況,c展示了蓄積量因子在使用特征子集時(shí)的反演情況,擬合精度為0.915,相比之前有所提升,d展示了在當(dāng)前擬合精度下使用的特征變量及其權(quán)重,上四分位數(shù)高程、最大高程、郁閉度、上四分位密度、最小密度、最大密度所占權(quán)重分別為0.576、0.23、0.161、0.016、0.013、0.004。
圖4 蓄積量因子擬合結(jié)果及特征權(quán)重分析Figure 4 Accumulation factor fitting results and feature weight analysis
圖5中a,b展示了在進(jìn)行特征權(quán)重分析前林分平均高的反演情況,c展示了林分平均高因子在使用特征子集時(shí)的反演情況,擬合精度為0.923,相比之前有所提升,d展示了在當(dāng)前擬合精度下使用的特征變量及其權(quán)重,上四分位數(shù)高程、平均高程、高程中位數(shù)、最大高程、冠層起伏率、上四分位數(shù)密度、高程方差、最小密度、高程四分位間距所占權(quán)重分別為0.36、0.229、0.167、0.075、0.052、0.048、0.037、0.026、0.006。
圖5 林分平均高擬合結(jié)果及特征權(quán)重分析Figure 5 Analysis of stand average high fitting results and feature weights
在進(jìn)行株數(shù)的反演時(shí),將蓄積量作為其中的一個(gè)特征變量進(jìn)行權(quán)重分析,圖6中a,b展示了在進(jìn)行特征權(quán)重分析前株數(shù)的反演情況,c展示了株數(shù)因子在使用特征子集時(shí)的反演情況,擬合精度為0.902,相比之前有所提升,d展示了在當(dāng)前擬合精度下使用的特征變量及其權(quán)重,蓄積量、高程方差、最大高程、間隙率、葉面積指數(shù)、上四分位數(shù)高程所占權(quán)重分別為0.403、0.333、0.195、0.044、0.013、0.012。
圖6 株數(shù)因子擬合結(jié)果及特征權(quán)重分析Figure 6 Plant number factor fitting results and feature weight analysis
為驗(yàn)證本方法的穩(wěn)定性,對(duì)不同點(diǎn)云密度下的LiDAR數(shù)據(jù)開(kāi)展實(shí)驗(yàn)分析。對(duì)實(shí)驗(yàn)區(qū)點(diǎn)云數(shù)據(jù)進(jìn)行均勻抽稀,并保證稀釋后的結(jié)果能覆蓋到所有類型的點(diǎn)云。分別以2、3、4倍的間距對(duì)點(diǎn)云進(jìn)行均勻抽稀處理,得到不同密度的點(diǎn)云數(shù)據(jù),并根據(jù)不同密度的點(diǎn)云數(shù)據(jù)分別進(jìn)行試驗(yàn),獲取不同密度下相關(guān)林分因子的模型精度及相對(duì)均方根誤差,實(shí)驗(yàn)結(jié)果如表5所示。
除擬合精度外,本文還使用相對(duì)均方根誤差RRMSE對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)價(jià),RRMSE為實(shí)測(cè)值與預(yù)測(cè)值偏差的平方和樣地?cái)?shù)量比值的平方根再與實(shí)測(cè)值的算術(shù)平均數(shù)之比,該值越小,則模型預(yù)測(cè)的效果越好,其定義如公式(6)所示。
(6)
由表5可知,在不同的點(diǎn)云密度下,對(duì)于蓄積量、林分平均高及株數(shù)三個(gè)林分因子,通過(guò)分析特征權(quán)重后保留的特征子集在森林因子回歸計(jì)算時(shí)均取得較好的精度結(jié)果。另外,由于評(píng)估了不同特征的重要性程度,使用篩選后的特征子集與原始特征相比在模型構(gòu)建方面仍保持較高的精度,并且對(duì)不同的點(diǎn)云密度均具有較好的適應(yīng)性。
表5 不同點(diǎn)云密度下的各林分因子擬合精度
機(jī)載激光雷達(dá)點(diǎn)云穿透性及抗干擾力強(qiáng),應(yīng)用于森林資源調(diào)查能夠去除地形影響,有效提高調(diào)查精度。本文以陜西省安康市嵐皋縣國(guó)營(yíng)林場(chǎng)為研究對(duì)象,借助機(jī)載激光雷達(dá)點(diǎn)云,對(duì)天然次生林進(jìn)行植被點(diǎn)云歸一化,并提取實(shí)驗(yàn)區(qū)森林特征參數(shù)變量,提出一種在特征變量權(quán)重分析基礎(chǔ)上進(jìn)行林分因子反演的技術(shù)流程,結(jié)合大量實(shí)驗(yàn)結(jié)果進(jìn)行特征權(quán)重評(píng)估,保留權(quán)重高的核心特征變量,并通過(guò)實(shí)驗(yàn)驗(yàn)證該技術(shù)的有效性及穩(wěn)定性。實(shí)驗(yàn)結(jié)果表明:
1)保留的特征變量子集與林分因子之間的相關(guān)性較強(qiáng),能夠全面清楚地描述林木特征,具有較高的擬合精度。
2)在不同點(diǎn)云密度下,基于高權(quán)重特征變量訓(xùn)練的回歸模型均具有良好的魯棒性。在保證抽稀后點(diǎn)云均勻分布的前提下,擬合精度及相對(duì)均方誤差受每平方米點(diǎn)個(gè)數(shù)的影響較小。
本研究使用到的特征變量主要包括高度特征及密度特征,對(duì)林區(qū)特征描述存在一定的局限性,后續(xù)研究可以利用點(diǎn)云多次回波的特性,提取回波次數(shù)及強(qiáng)度等特征變量進(jìn)行實(shí)驗(yàn)研究。