鄧 焯,李 斌,范光鵬,趙天忠,于永輝
(1. 北京林業(yè)大學(xué) 信息學(xué)院,北京 100083;2. 北京林業(yè)大學(xué) 國(guó)家林業(yè)草原林業(yè)智能信息處理工程技術(shù)研究中心,北京 100083;3. 北京林業(yè)大學(xué) 林業(yè)信息化研究所,北京 100083;4. 廣西壯族自治區(qū)國(guó)有高峰林場(chǎng),廣西 南寧 530001)
森林是陸地生態(tài)系統(tǒng)的主體,在全球碳循環(huán)中起著十分重要的作用。森林蓄積量作為衡量森林?jǐn)?shù)量的重要的指標(biāo)之一,能夠直觀反映森林資源數(shù)量和質(zhì)量,獲取森林蓄積量是推算森林生物量和碳儲(chǔ)量的必要環(huán)節(jié)[1?3]?!丁笆奈濉绷謽I(yè)草原保護(hù)發(fā)展規(guī)劃綱要》明確指出:將增加中國(guó)森林蓄積量作為主要目標(biāo)之一,并將森林蓄積量與森林覆蓋率作為兩大約束性指標(biāo)。因此,實(shí)現(xiàn)森林資源動(dòng)態(tài)檢測(cè)、準(zhǔn)確獲取森林蓄積量等參數(shù)信息,已成為當(dāng)前森林資源調(diào)查的迫切需求。激光雷達(dá)(light detection and ranging,LiDAR)作為一種新興的主動(dòng)式遙感技術(shù),能夠從不同空間尺度對(duì)生態(tài)系統(tǒng)進(jìn)行高效精準(zhǔn)的監(jiān)測(cè)[4]。機(jī)載LiDAR發(fā)射的激光脈沖能穿透森林冠層并獲取樹(shù)冠上部枝葉的空間信息,通過(guò)林分內(nèi)的空隙,測(cè)量冠層結(jié)構(gòu)信息和林下地形信息[5]。而傳統(tǒng)方法通過(guò)樣木、樣地等抽樣調(diào)查進(jìn)行林分森林參數(shù)的推算,調(diào)查周期長(zhǎng)、成本高且調(diào)查范圍有限[6?7]。激光雷達(dá)在獲取森林空間結(jié)構(gòu)因子和地形因子等信息方面具有精度高、范圍廣等優(yōu)勢(shì)。
近年來(lái),基于機(jī)載激光雷達(dá)的林分蓄積量反演已有許多研究成果,集中在構(gòu)建參數(shù)方法和非參數(shù)方法的蓄積量反演模型。PAWE等[8]基于機(jī)載LiDAR數(shù)據(jù)對(duì)波蘭東南部林區(qū)建立多元線性回歸蓄積量反演模型,其中均方根誤差(root mean square error, RMSE)為15.2%;CHIRICI等[9]以Landsat 5TM、衛(wèi)星LiDAR數(shù)據(jù)等預(yù)測(cè)變量聯(lián)合氣溫、降水和地形等輔助變量進(jìn)行意大利中部地區(qū)蓄積量的大尺度反演,其中隨機(jī)森林回歸模型最優(yōu),決定系數(shù)(R2)為0.69、RMSE為37.2%;陳松等[10]基于Sentinel-2與機(jī)載LiDAR數(shù)據(jù)采用不同回歸方法對(duì)廣西高峰林場(chǎng)界牌、東升分場(chǎng)進(jìn)行蓄積量反演,構(gòu)建MLR-Logistic聯(lián)立模型精度優(yōu)于隨機(jī)森林等機(jī)器學(xué)習(xí)方法,R2為0.60、相對(duì)均方根誤差(relative root mean-squared error,RRMSE)為29.29%;曾偉生等[11]基于機(jī)載LiDAR數(shù)據(jù),采用線性和非線性參數(shù)回歸方法對(duì)東北林區(qū)進(jìn)行蓄積量反演,其中非線性回歸模型R2為0.71 ~0.82,略優(yōu)于線性回歸。已有多位研究者基于機(jī)載LiDAR數(shù)據(jù)進(jìn)行林分蓄積量反演模型研究,但對(duì)于建模方法中參數(shù)回歸和非參數(shù)回歸模型的比較國(guó)內(nèi)研究較少。本研究以廣西國(guó)有高峰林場(chǎng)桉Eucalyptus樹(shù)人工林為研究對(duì)象,基于機(jī)載激光雷達(dá)數(shù)據(jù)及地面調(diào)查數(shù)據(jù),采用逐步回歸、偏最小二乘回歸等參數(shù)回歸和隨機(jī)森林、支持向量回歸等非參數(shù)回歸進(jìn)行蓄積量反演模型研建,并通過(guò)模型評(píng)價(jià)指標(biāo)對(duì)以上4種方法進(jìn)行模型評(píng)估,進(jìn)而選擇出擬合優(yōu)度、泛化能力最優(yōu)模型。
研究區(qū)位于廣西壯族自治區(qū)南寧市興寧區(qū)的國(guó)有高峰林場(chǎng),22°51′ ~23°02′N,108°06′ ~108°31′E,該區(qū)地處亞熱帶地區(qū),年平均氣溫約21 ℃,年平均降水量為1 200 ~1 500 mm,相對(duì)濕度為79%,屬丘陵地貌,海拔為100 ~460 m,坡度為6° ~35°,具有較厚的赤紅壤,適宜亞熱帶和熱帶樹(shù)種生長(zhǎng),森林覆蓋率達(dá)87%,主要樹(shù)種為杉木Cunninghamia lanceolata、巨尾桉Eucalyptus grandis×E. urophylla、馬尾松Pinus massoniana等。
調(diào)查時(shí)間為2018年1—2月,研究區(qū)內(nèi)共設(shè)置71塊桉樹(shù)樣地(圖1),其中激光雷達(dá)覆蓋范圍內(nèi)共57塊樣地。樣地大小為20 m×20 m、25 m×25 m和25 m×50 m。采用實(shí)時(shí)動(dòng)態(tài)差分技術(shù)(real-time Kinematic,RTK)進(jìn)行樣地定位,記錄樣地中心點(diǎn)及樣地角點(diǎn)。采用每木檢尺的方法,使用胸徑尺、激光測(cè)高儀和皮尺逐一測(cè)量樣地內(nèi)樹(shù)木的胸徑、樹(shù)高等數(shù)據(jù)。統(tǒng)計(jì)樣地調(diào)查數(shù)據(jù)得到樣地算數(shù)平均樹(shù)高、算數(shù)平均胸徑、樣地面積(表1)。通過(guò)廣西地區(qū)桉樹(shù)二元材積表對(duì)單木材積量進(jìn)行計(jì)算[12],進(jìn)而計(jì)算得到樣地尺度的公頃蓄積量值 (V樣地):V樣地=V公頃S樣地/10 000。其中:V公頃為通過(guò)二元材積公式計(jì)算得的每公頃蓄積量,S樣地為桉樹(shù)樣地面積。
圖1 研究區(qū)樣地分布示意圖Figure 1 Location of the sample plots distribution
于2018年1月采集機(jī)載LiDAR數(shù)據(jù),使用有人機(jī)并搭載LMS-Q680i激光雷達(dá)掃描儀,實(shí)際飛行高度為1 000 m,最大掃描角度為 30°,波長(zhǎng)為1 550 nm,激光脈沖長(zhǎng)度為3 ns,采樣間隔為1 ns,最大掃描頻率為400 KHz,垂直分辨率為0.15 m,點(diǎn)云密度為 10 pt·m?2。
使用LiDAR 360軟件對(duì)機(jī)載激光雷達(dá)點(diǎn)云進(jìn)行點(diǎn)云拼接、去噪、地面點(diǎn)分類、基于地面點(diǎn)歸一化等預(yù)處理,結(jié)果如圖2所示。根據(jù)樣地角點(diǎn)以中心點(diǎn)坐標(biāo)對(duì)點(diǎn)云進(jìn)行裁剪,提取出基于樣地尺度特征變量共48個(gè),包括37個(gè)點(diǎn)云高度參數(shù)、10個(gè)密度參數(shù)、郁閉度等點(diǎn)云特征變量,具體參數(shù)見(jiàn)表2。
圖2 樣地點(diǎn)云預(yù)處理結(jié)果示例Figure 2 Example of point cloud preprocessing results of sample plots
表2 提取點(diǎn)云特征變量Table 2 Extracting point cloud feature variables
使用MATLAB激光雷達(dá)覆蓋范圍內(nèi)57個(gè)樣本進(jìn)行隨機(jī)抽樣,按照3∶1的比例選取42個(gè)作為訓(xùn)練樣本,15個(gè)作為驗(yàn)證樣本。以樣地實(shí)測(cè)公頃蓄積量為因變量,篩選后點(diǎn)云特征為自變量,采用逐步回歸、偏最小二乘回歸、隨機(jī)森林回歸、支持向量回歸模型進(jìn)行擬合 。
2.1.1 基于逐步篩選法優(yōu)選變量 對(duì)于逐步回歸,采用逐步篩選法對(duì)所有特征變量進(jìn)行變量篩選;再對(duì)篩選出特征變量進(jìn)行多重共線性檢驗(yàn),計(jì)算各變量間容忍度或特征變量間方差膨脹因子(FVI) 2個(gè)統(tǒng)計(jì)量[13],對(duì)于容忍度≤0.2或FVI≥5的變量進(jìn)行進(jìn)一步討論,確定最優(yōu)特征變量子集。FVI=1/(1?R2)。其中:R為特征變量間相關(guān)系數(shù)。
2.1.2 基于隨機(jī)森林優(yōu)選變量 對(duì)于偏最小二乘回歸、支持向量機(jī)回歸、隨機(jī)森林回歸等方法,使用隨機(jī)森林中重要性排序?qū)μ卣髯兞窟M(jìn)行優(yōu)選。其主要原理為隨機(jī)森林算法在構(gòu)建各決策樹(shù)時(shí),對(duì)某一特征變量進(jìn)行取舍,若此時(shí)均方誤差(mean square error, MSE)有較大變化,則該特征變量重要性高,最終得到所有特征變量重要性排序。
2.2.1 逐步回歸逐步回歸 (stepwise regression,SR)可用于篩選并剔除引起多重共線性的變量,逐步回歸建立模型一般形式為:Y=β0+β1X1+β2X2+···+βiXi+ε。逐步篩選法結(jié)合了向前選擇變量法和向后選擇變量法的優(yōu)點(diǎn),對(duì)i個(gè)自變量X分別與因變量Y建立一元回歸模型,計(jì)算各變量所對(duì)應(yīng)F值,其中,β0為常數(shù),βi為回歸系數(shù),ε為誤差項(xiàng)。在建立逐步回歸模型時(shí),選擇當(dāng)前未加入模型的預(yù)測(cè)變量中F的最大值所對(duì)應(yīng)的Xi加入模型,再對(duì)已選入預(yù)測(cè)變量逐個(gè)進(jìn)行t檢驗(yàn),若存在已選入預(yù)測(cè)變量不再顯著,則將其剔除。重復(fù)以上步驟,直到既沒(méi)有顯著的解釋變量選入回歸方程,也沒(méi)有不顯著的解釋變量從回歸方程中剔除為止,將保留下來(lái)的最優(yōu)子集作為建立模型的特征變量,并將候選變量對(duì)應(yīng)系數(shù)保留。
2.2.2 偏最小二乘回歸 偏最小二乘回歸(partial least squares regression, PLSR)結(jié)合了主成分分析、典型相關(guān)分析的優(yōu)點(diǎn),實(shí)現(xiàn)了數(shù)據(jù)降維、信息綜合[14]。首先對(duì)訓(xùn)練樣本進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,調(diào)用plsregress函數(shù)提取主成分與自變量和因變量組合。分別計(jì)算自變量和因變量提取出成分的貢獻(xiàn)率進(jìn)而計(jì)算得到累計(jì)貢獻(xiàn)率,當(dāng)度量因子Q2h≥0.097 5停止主成分的提取[15]。統(tǒng)計(jì)主成分對(duì)個(gè)數(shù)并建立各自變量與因變量的線性表達(dá)式,最后根據(jù)所建立的各主成分對(duì)模型,整理得到PLSR模型。
2.2.3 支持向量機(jī)回歸 支持向量機(jī)算法(support vector machine, SVM)利用內(nèi)積核函數(shù)代替高維空間的非線性映射, 不涉及大數(shù)定律和概率測(cè)度等有關(guān)問(wèn)題, 且SVM的決策函數(shù)僅有少數(shù)支持向量決定,該算法在解決小樣本多維度回歸和分類問(wèn)題時(shí)泛化能力強(qiáng),具備較好的“魯棒性”。VAPNIK[16]在SVM分類的基礎(chǔ)上引入了不敏感損失函數(shù),得到了支持向量機(jī)回歸算法(support vector regression, SVR)。
使用Libsvm工具箱實(shí)現(xiàn)SVR算法,采用網(wǎng)格搜索法(grid search)對(duì)常用的4種核函數(shù)進(jìn)行參數(shù)尋優(yōu)[17],即線性、多項(xiàng)式、RBF (徑向基核函數(shù))、sigmoid (多層感知機(jī)核函數(shù))。同時(shí)進(jìn)行十折交叉驗(yàn)證,保證回歸模型中懲罰系數(shù)(C)與gamma值(g)達(dá)到最優(yōu)。
2.2.4 隨機(jī)森林回歸 隨機(jī)森林回歸(RFR)算法采用自助采樣法(bootstrap sampling),在以決策樹(shù)構(gòu)建Bagging集成的基礎(chǔ)上,對(duì)樣本和特征變量進(jìn)行隨機(jī)選擇[18]。調(diào)用TreeBagger函數(shù)進(jìn)行RFR算法建模,通過(guò)對(duì)決策樹(shù)數(shù)量(ntree)和最小葉子點(diǎn)數(shù)進(jìn)行參數(shù)尋優(yōu),直到袋外(out-of-bag,OOB)誤差的MSE達(dá)到最小,保證模型預(yù)測(cè)性能達(dá)到最優(yōu),將尋優(yōu)結(jié)果作為RFR模型的建模參數(shù),用于模型構(gòu)建。
本研究使用決定系數(shù)(R2)、均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)對(duì)林分蓄積量估測(cè)模型進(jìn)行定量的精度驗(yàn)證和評(píng)價(jià)。其計(jì)算公式為:
3.1.1 逐步篩選法 在采用逐步篩選法進(jìn)行偏F檢驗(yàn)時(shí),取偏F檢驗(yàn)拒絕域的臨界值為F進(jìn)>F出,F(xiàn)進(jìn)為選入變量時(shí)的臨界值、F出為刪除變量時(shí)的臨界值。本研究設(shè)定F進(jìn)為0.10,F(xiàn)出為0.11,篩選特征變量結(jié)果為D9、HP95、Hmax、Hkurtosis。
對(duì)篩選出的變量進(jìn)行雙變量相關(guān)性分析,根據(jù)相關(guān)系數(shù)(R)計(jì)算各變量間方差膨脹因子(FVI)。計(jì)算結(jié)果如表3,Hmax與HP95之間FVI為 250.25,F(xiàn)VI大于5,認(rèn)為兩者之間存在共線性。因此分別以D9、Hmax、Hkurtosis和D9、HP95、Hkurtos為建模因子。
表3 各特征變量間的方差膨脹因子Table 3 FVI calculation of each variable
3.1.2 基于隨機(jī)森林篩選變量 對(duì)所有的48個(gè)特征變量進(jìn)行重要性排序,調(diào)用隨機(jī)森林中OOBPermuted VarDeltaError參數(shù),得到所有特征變量的重要性。選擇重要性大于0.2的變量作為建模因子,篩選結(jié)果如圖3,包括8個(gè)高度變量、2個(gè)密度變量,其中Hcurt重要性最高,達(dá)0.52;D6重要性相對(duì)最低,為0.22。
圖3 點(diǎn)云特征變量重要性排序Figure 3 Importance ranking of point cloud characteristic variables
3.2.1 逐步回歸法 根據(jù)特征變量?jī)?yōu)選結(jié)果,分別建立以D9、Hmax、Hkurtosis和D9、HP95、Hkurtos為建模因子的多元線性模型:
使用SPSS 26對(duì)Y1、Y2模型進(jìn)行初步評(píng)估,計(jì)算2種模型的相關(guān)系數(shù)(R)、R2以及標(biāo)準(zhǔn)估算誤差(SE),結(jié)果如表4。結(jié)果表明Y2中R2、SE均優(yōu)于Y1,因此選定Y2作為逐步回歸模型。
表4 逐步回歸模型初步評(píng)估Table 4 Preliminary evaluation of stepwise regression model
3.2.2 偏最小二乘回歸 利用PLSR提取的主成分F1、F2與因變量Y關(guān)系分別為F1=5.840Y+b和F2=0.271Y+b,b為常數(shù),得到最小二乘回歸模型為:
3.2.3 支持向量機(jī)回歸 調(diào)用meshgrid函數(shù)對(duì)C、gamma進(jìn)行參數(shù)尋優(yōu)并采用十折交叉驗(yàn)證,調(diào)用svmtrain函數(shù),分別構(gòu)建4種不同核函數(shù)的SVR模型并進(jìn)行模型訓(xùn)練,訓(xùn)練結(jié)果如表5。得到擬合結(jié)果最優(yōu)模型為RBF-SVR,其C為8,gamma為0.125。RBF-SVR 模型R2為 0.85,RMSE 為 29.24 m3·hm?2,MAE為94.98 m3·hm?2,選定該模型作為本研究的SVR模型。
表5 SVR不同核函數(shù)擬合結(jié)果Table 5 Fitting results of different kernel functions of SVR
3.2.4 隨機(jī)森林回歸 本研究采用窮舉法對(duì)決策樹(shù)數(shù)量和最小葉子點(diǎn)數(shù)進(jìn)行參數(shù)尋優(yōu)。分別設(shè)置決策樹(shù)數(shù)量和最小葉子點(diǎn)數(shù)最小值為50和2,每次遞增10和1,對(duì)尋優(yōu)過(guò)程循環(huán),通過(guò)觀察OOB誤差的MSE變化,直到尋找到本模型最優(yōu)參數(shù),尋優(yōu)結(jié)果如圖4。最終確定決策樹(shù)數(shù)量為90,葉子節(jié)點(diǎn)數(shù)量為2,將尋優(yōu)結(jié)果作為建模參數(shù),輸入訓(xùn)練樣本,完成RFR模型構(gòu)建。
圖4 隨機(jī)森林參數(shù)尋優(yōu)結(jié)果Figure 4 Evaluation of growing stock volume inversion model
3.2.5 模型評(píng)價(jià) 使用驗(yàn)證樣本對(duì)各模型的預(yù)測(cè)性能進(jìn)行評(píng)估,結(jié)果如表6、圖5??梢钥闯霾煌幕貧w模型均表現(xiàn)出較好的擬合結(jié)果,其中擬合結(jié)果最優(yōu)模型為RFR模型,模型評(píng)價(jià)結(jié)果R2為0.95,RMSE 為 12.64 m3·hm?2,MAE 為 8.00 m3·hm?2,RBF-SVR 模型其次,R2為 0.94,RMSE 為 13.09 m3·hm?2,MAE為 11.65 m3·hm?2。將驗(yàn)證樣本帶入模型,檢驗(yàn)?zāi)P偷念A(yù)測(cè)能力,結(jié)果顯示各模型預(yù)測(cè)能力與模型的擬合效果一致。通過(guò)傳統(tǒng)方法的劃分訓(xùn)練樣本與驗(yàn)證樣本,存在一定的偶然性與不確定性,為了進(jìn)一步確保各模型的穩(wěn)定性與泛化能力,采用留一法交叉驗(yàn)證(leave-one-out cross validation,LOOCV)對(duì)本研究中各模型進(jìn)行再次評(píng)估[19],如圖6所示:RBF-SVR模型表現(xiàn)最優(yōu),R2為0.88,RMSE為21.35 m3·hm?2,MAE 為 16.62 m3·hm?2,與其他模型相比,R2高出 0.03 ~0.07,RMSE 減少 2.58 ~5.17 m3·hm?2,MAE 減少 0.79 ~3.32 m3·hm?2。
表6 蓄積量反演模型評(píng)估Table 6 Evaluation of growing stock volume inversion model
圖5 各模型訓(xùn)練結(jié)果與驗(yàn)證結(jié)果散點(diǎn)圖Figure 5 Scatter diagram of training results and verification results of each model
圖6 各模型十折交叉驗(yàn)證結(jié)果Figure 6 Ten-fold cross validation results of each model
本研究采用SR、PLSR等參數(shù)回歸方法與RFR、SVR等非參數(shù)回歸方法進(jìn)行廣西高峰林場(chǎng)桉樹(shù)人工林的蓄積量反演模型研建,通過(guò)對(duì)點(diǎn)云特征變量篩選、建模因子優(yōu)選、參數(shù)尋優(yōu)等方法保證各模型達(dá)到最優(yōu)性能,在此基礎(chǔ)上采用留一法對(duì)各模型進(jìn)行交叉驗(yàn)證,保證了模型的穩(wěn)定性與泛化能力,并將該結(jié)果作為本研究各模型性能評(píng)估的最終結(jié)果。研究結(jié)果如下:①核函數(shù)為RBF的SVR在4種模型中預(yù)測(cè)精度最高 (ΔR2為 0.03 ~0.07、ΔRMSE 為 2.58 ~5.17 m3·hm?2、ΔMAE 為 0.79 ~3.32 m3·hm?2),采用 SVR 模型在解決林業(yè)激光雷達(dá)領(lǐng)域的回歸預(yù)測(cè)問(wèn)題已有廣泛應(yīng)用,肖越[20]結(jié)合Landsat 8、高分2號(hào)(GF-2)共2種光學(xué)遙感數(shù)據(jù)與極化SAR數(shù)據(jù)進(jìn)行旺業(yè)甸林場(chǎng)尺度的蓄積量反演,采用SVR模型擬合精度最高(R2為0.48,RMSE 為 57.27 m3·hm?2),與 MLR、RFR 等方法相比,ΔR2為 0.10 ~0.11、ΔRMSE 為 5.30 ~6.00 m3·hm?2。趙勛等[21]基于機(jī)載激光雷達(dá)進(jìn)行廣西高峰林場(chǎng)林分平均樹(shù)高估測(cè)中,通過(guò)隨機(jī)森林特征變量篩選,采用SVR相比較RFR方法,R2增加0.01、RMSE減少0.06 m。以上研究結(jié)果與本研究一致,進(jìn)一步表明解決基于LiDAR點(diǎn)云特征變量的林分蓄積量反演問(wèn)題時(shí),結(jié)合隨機(jī)森林篩選特征變量與支持向量機(jī)回歸可作為有效建模方法。
②本研究采用2種方法對(duì)特征變量進(jìn)行篩選,逐步回歸法保證入選的特征變量顯著且各變量之間不存在共線關(guān)系,隨機(jī)森林則通過(guò)計(jì)算各特征變量對(duì)建模時(shí)的貢獻(xiàn)度排序進(jìn)而篩選變量。肖越[20]利用逐步回歸法從遙感特征變量中篩選出建模因子用于蓄積量回歸模型構(gòu)建;周蓉等[22]在基于Landsat 8 遙感影像反演地上生物量的研究中,采用隨機(jī)森林重要性排序方法從遙感因子中篩選出特征變量用于構(gòu)建模型。這2種方法均廣泛應(yīng)用于構(gòu)建模型前的變量篩選,合理地選擇模型篩選方法,更有利于回歸模型構(gòu)建。
③本研究旨在選取最優(yōu)桉樹(shù)蓄積量反演模型,參數(shù)方法SR中逐步篩選法已對(duì)變量進(jìn)行篩選,故SR模型不再采用隨機(jī)森林進(jìn)行特征變量篩選。在本研究模型評(píng)估中,SR模型評(píng)估結(jié)果均優(yōu)于PLSR模型,袁鈺娜等[23]對(duì)東北林區(qū)4種不同針葉林蓄積量反演所建立的回歸模型中,PLSR模型的擬合結(jié)果和預(yù)測(cè)精度均優(yōu)于SR (ΔR2為0.05 ~0.15,ΔRMSE為2.6% ~4.2%),與本研究結(jié)果不一致,但由于2種回歸方法并未使用同一變量篩選方法,因此,不能直接認(rèn)為在解決預(yù)測(cè)回歸問(wèn)題時(shí)前者更加可靠,對(duì)于以上2種回歸方法的模型性能與預(yù)測(cè)能力需進(jìn)一步討論。
④本研究在林場(chǎng)尺度通過(guò)較少樣本進(jìn)行桉樹(shù)林分蓄積量反演,非參數(shù)方法總體預(yù)測(cè)精度較高且RBF-SVR模型略優(yōu)于RFR模型。SVR核心思想為將低維空間中的向量用非線性函數(shù)映射到一個(gè)高維特征空間,進(jìn)而尋求線性回歸超平面并解決低維空間中的非線性問(wèn)題[24],支持向量機(jī)回歸解決多維度小樣本回歸預(yù)測(cè)問(wèn)題相較隨機(jī)森林回歸更有優(yōu)勢(shì)。在反演尺度較大且訓(xùn)練樣本較多的林分蓄積量反演問(wèn)題時(shí),采用支持向量機(jī)回歸方法訓(xùn)練效率將明顯下降,此時(shí)選擇隨機(jī)森林回歸將更適用。
⑤本研究采用逐步篩選法篩選出的4個(gè)特征變量中,點(diǎn)云密度變量被選擇1次;在采用隨機(jī)森林篩選的10個(gè)變量中,點(diǎn)云密度變量被選擇2次,且密度變量D9在重要性排序中位于第3位。點(diǎn)云密度變量作為本研究中重要解釋變量之一,該類型變量能夠描述林分中樹(shù)木的水平結(jié)構(gòu)信息,與樹(shù)高(垂直結(jié)構(gòu)變量)等參數(shù)結(jié)合可解釋林分空間結(jié)構(gòu)信息。孫忠秋等[25]加入林分郁閉度作為水平結(jié)構(gòu)的解釋變量,與僅用點(diǎn)云高度參數(shù)相比較,RMSE下降0.27 m3·hm?2、MAE下降0.08 m3·hm?2,該變量對(duì)模型預(yù)測(cè)性能有一定提升。本研究將郁閉度作為候選變量,但在逐步篩選法中又將其剔除,因?yàn)樵诨陔S機(jī)森林法的重要性排序中,林分郁閉度參數(shù)在48個(gè)候選變量中排名第44位。由此可見(jiàn),在林業(yè)激光雷達(dá)應(yīng)用中,將林分密度用于衡量林分水平結(jié)構(gòu)信息更加可靠。
本研究通過(guò)2種參數(shù)回歸方法(逐步回歸、偏最小二乘回歸)與2種非參數(shù)方法(隨機(jī)森林回歸、支持向量機(jī)回歸)對(duì)林分蓄積量進(jìn)行估測(cè)。在采用傳統(tǒng)方法劃分訓(xùn)練樣本與驗(yàn)證樣本的結(jié)果中,非參數(shù)方法模型精度均優(yōu)于參數(shù)回歸方法;采用留一法對(duì)各模型預(yù)測(cè)精度進(jìn)行交叉驗(yàn)證時(shí),表現(xiàn)最優(yōu)模型RBFSVR屬于非參數(shù)回歸方法,表明解決林業(yè)激光雷達(dá)領(lǐng)域中的回歸預(yù)測(cè)問(wèn)題時(shí),非參數(shù)方法相較參數(shù)方法更有優(yōu)勢(shì)。本研究中蓄積量反演模型已在廣西高峰林場(chǎng)內(nèi)取得較好模型精度,但對(duì)于大尺度反演森林蓄積量的適用性有待進(jìn)一步論證。