李世榮 李臨兵
(廣東省嶺南綜合勘察設(shè)計院,廣東 廣州 510663)
直徑分布是指林分內(nèi)各種大小直徑林木按徑階的分配狀態(tài),是最重要、最基本的林分結(jié)構(gòu)[1]。林分直徑分布是研究林分樹高、斷面積和材積等結(jié)構(gòu)的基礎(chǔ),也是造林設(shè)計、確定林分發(fā)展階段、建立林分生長和收獲模型的重要前提工作[2]。目前,直徑分布的研究對象主要以同齡林為主[3-4],而天然林受林分自身的樹種組成與特性、演替階段、更新過程等因素的影響而變得復(fù)雜多樣。
林分直徑分布規(guī)律的研究主要從概率分布函數(shù)和理論模型入手。相關(guān)研究經(jīng)歷了靜態(tài)到動態(tài)的過程,靜態(tài)模擬方法是指以正態(tài)分布、負指數(shù)分布、SB 分布、 β 分布、Gamma 分布、Weibull分布等概率密度分布函數(shù)模擬林分分布規(guī)律[5-6]。林分直徑分布規(guī)律的動態(tài)預(yù)測主要是指以參數(shù)預(yù)測、參數(shù)恢復(fù)和百分位等方法估計模型參數(shù)[7],用以預(yù)測林分直徑分布的動態(tài)變化規(guī)律。目前常用的方法是參數(shù)預(yù)測法[8],即通過分布模型的參數(shù)與林分變量(平均胸徑、平均樹高、斷面積等)直接構(gòu)建函數(shù)關(guān)系,用以預(yù)測新林分的模型參數(shù),進而描述新林分的直徑分布規(guī)律。參數(shù)預(yù)測法通過林分變量來預(yù)測林分直徑分布結(jié)構(gòu),能最大限度的減少林業(yè)中的測量成本,但是也存在預(yù)測精度較低的問題。啞變量模型已被廣泛的應(yīng)用于回歸分析和建模研究,并被證實能有效提高模型的預(yù)測精度[9]。然而,直徑分布模型的參數(shù)預(yù)測中還沒有發(fā)現(xiàn)應(yīng)用啞變量技術(shù)的相關(guān)研究,通過在參數(shù)預(yù)測方程中加入林分相關(guān)的啞變量或許能提高參數(shù)的預(yù)測精度,因為模型參數(shù)與林分變量是緊密相關(guān)的。
櫟類的自然分布范圍遍及亞熱帶、熱帶和溫帶地區(qū),是闊葉林的主要建群種之一。在中國,櫟類是天然林的主要組成樹種之一,據(jù)第八次全國森林資源清查結(jié)果統(tǒng)計[10],中國櫟類總面積達到1 672 萬hm2,其面積和蓄積分別占全國喬木林的10.15%和12.94%。由于遭受過較嚴(yán)重的破壞,中國的櫟類主要是萌生的次生林,普遍存在林分過密、干形彎曲和樹冠發(fā)育不完整等質(zhì)量低下問題[11]。因此,本研究以湖南櫟類次生林為研究對象,探討利用啞變量模型構(gòu)建櫟類直徑分布預(yù)測模型,提高直徑分布預(yù)測精度,為櫟類的林分結(jié)構(gòu)經(jīng)營管理提供參考。
湖南省位于中國中南部長江中游地區(qū),地理坐標(biāo)為108o47′~114o15′ E, 24o38′~30o08′ N。海拔分布范圍為24~2 122 m,地形地貌復(fù)雜,包括有丘陵、平原、山地等。水熱充足,年平均溫度在15~18℃之間,年平均降水量1 200~1 700 mm,土壤類型主要以紅壤和黃壤為主。湖南是亞熱帶櫟類天然次生林的主要分布區(qū)之一,櫟類總面積占全省闊葉林面積的13%。湖南櫟類林分中的針葉樹主要包括馬尾松Pinus massoniana、杉木Cunninghamia lanceolata,闊葉樹包括樟Cinnamomum camphora、楓香Liquidambar formosana、鵝耳櫪Carpinus turczaninowii等。
數(shù)據(jù)來源于湖南省森林資源連續(xù)清查數(shù)據(jù)庫,從中篩選出櫟類株數(shù)占比超過30%且總株數(shù)超過750 株/hm2的固定樣地共188 塊,樹木總數(shù)為22 323 株。樣地主要分布于懷化、岳陽、郴州、吉首、永州、常德市等地。固定樣地的面積大小為25.8 m×25.8 m,調(diào)查時間為2014 年。樣地的林地調(diào)查因子包括海拔、坡度、坡向和坡位等,林分調(diào)查因子包括樹種、每木胸徑、相對位置等。經(jīng)調(diào)查,櫟類樣地內(nèi)的主要樹種包括有杉木、馬尾松、楓香、木荷Schima superba以及其它闊葉樹種。將櫟類林分劃分為3 種林分類型,其中櫟類樹種占比超過70%的劃分為櫟類純林類型S1(34 塊),針葉樹種占比超過35%的劃分為櫟類針葉混交林S2(124 塊),闊葉樹種占比超過35%的劃分為櫟類闊葉混交林S3(30 塊)。本研究中,櫟類總樣本被隨機劃分為兩個部分:70%(133 塊)樣地用于建模,30%(55 塊)樣地用于檢驗,樣地的基本概況見表1。
選取目前應(yīng)用較普遍的6 個直徑分布函數(shù)(正態(tài)分布、對數(shù)正態(tài)分布、Weibull 分布、Gamma 分布、Beta 分布和Logistic 分布函數(shù))來擬合櫟類次生林的直徑分布規(guī)律,并利用ForStat軟件計算各函數(shù)的參數(shù)估計值。函數(shù)的具體表達式見表2。
其中,Logistic 分布函數(shù)的參數(shù)估計使用百分位法,其余函數(shù)的參數(shù)估計采用矩估計法。采用Kolmoglov-Smirnov 檢驗法對樣本總體的分布類型進行檢驗[12]。
參數(shù)預(yù)測模型是通過構(gòu)建林分變量與分布函數(shù)各個參數(shù)的函數(shù)關(guān)系,用以預(yù)測其它林分的分布函數(shù)參數(shù)值的模型。目前常用的分布函數(shù)參數(shù)預(yù)測方法是構(gòu)建林分變量與參數(shù)的逐步回歸方程。2.3.1 逐步回歸參數(shù)模型 選取林分平均直徑D、直徑平方D2、總斷面積BA 和每公頃株數(shù)N共4個林分變量作為多元逐步回歸參數(shù)預(yù)測模型的自變量,分布函數(shù)的參數(shù)值為因變量,構(gòu)建如下關(guān)系式:
表1 櫟類樣地的基本情況Tab.1 Basic situation of the oak secondary forest plots
式中,iy為分布函數(shù)的參數(shù),i= 1,2…n;1φ~4φ為模型系數(shù);0φ為截距。
多元逐步回歸的具體步驟[13]:首先建立因變量與自變量的總回歸方程,然后對回歸方程及每一個自變量進行假設(shè)檢驗,當(dāng)某自變量對因變量的影響不顯著時,則剔除該變量,重新建立回歸方程,循環(huán)計算,即可篩選出對因變量有顯著影響的因子。其中,為了避免出現(xiàn)自變量之間存在嚴(yán)重的共線性問題,設(shè)置只有方差膨脹因子小于10 且具有顯著影響的變量才進入模型。
2.3.2 啞變量參數(shù)模型 樹木的生長在不同的林分類型之間往往表現(xiàn)出一定的差異,因此本文考慮將櫟類純林S1、櫟類—針葉混交林S2、櫟類—闊葉混交林S3 作為啞變量加入逐步回歸參數(shù)模型中,以進一步提高參數(shù)的預(yù)測精度。
表2 直徑分布函數(shù)的表達式Tab.2 Expression of the diameter distribution function
啞變量,又稱二元型變量,常用來處理定性因子或分類變量,一般取值為0 或1。在多元回歸模型(1)式中引入林分類型啞變量,其模型表達式為:
2.4.1 模型的評價 模型評價指標(biāo)主要包括決定系數(shù)R2、殘差平方和SSE 和相對均方根誤差RRMSE 共3 個,其中R2越大,說明模型的擬合程度越好,SSE 和RRMSE 越小,說明模型的預(yù)測誤差越小,精度越高。3 個指標(biāo)的表達式如下:
式中,n為樣本數(shù);yi為斷面積測量值;y?為斷面積預(yù)估值;為斷面積測量值的平均值;k為參數(shù)數(shù)量。
2.4.2 模型的檢驗 根據(jù)建模數(shù)據(jù)可模擬得到預(yù)測櫟類林分直徑分布的參數(shù)模型,利用參數(shù)模型計算55 個檢驗樣本的分布函數(shù)參數(shù)并預(yù)測各徑階的直徑分布狀況,對比分析預(yù)估值與觀測值的相關(guān)關(guān)系和殘差分布,以檢驗本研究構(gòu)建的櫟類次生林直徑分布預(yù)測模型是否準(zhǔn)確。
運用6 種分布密度函數(shù)分別擬合133 個樣地的直徑分布結(jié)果,并用KS 檢驗法對擬合結(jié)果進行判斷,結(jié)果見表3。正態(tài)分布和Logistic 分布的樣地接受率僅為30.1%和25.6%,說明兩者不適合櫟類次生林的直徑分布擬合;對數(shù)正態(tài)分布、Weibull 分布、Gamma 分布和Beta 分布的樣地接受率均超過70%,說明這4 個函數(shù)在擬合櫟類次生林的直徑分布時具有一定的適用性;Weibull分布函數(shù)的樣地接受率最高,達到91.7%,說明Weibull 分布函數(shù)在擬合櫟類次生林的直徑分布時效果更佳。
對Weibull 分布函數(shù)3 個參數(shù)的分布特征進行分析(表4),最小值參數(shù)a 的變化范圍在[4.677,6.080],尺度參數(shù)b 的變化范圍在[1.439,19.133],形狀參數(shù)c 的變化范圍在[0.642, 2.016];形狀參數(shù)c <1 的樣地數(shù)占總樣地的21.8%,1 ≤c <3.6的樣地占總樣地的78.2%,c >3.6 的樣地數(shù)為0,說明湖南省櫟類次生林的直徑分布以具有正偏的山狀曲線為主,反“J ”型分布曲線次之。
表3 分布函數(shù)擬合結(jié)果Tab.3 Fitting results of the distribution function
表4 Weibull 分布函數(shù)的參數(shù)統(tǒng)計特征Tab.4 Parameter statistical characteristics of Weibull distribution function
表5 Weibull 參數(shù)預(yù)估模型Tab.5 Prediction model of Weibull parameter
表6 啞變量模型的擬合結(jié)果Tab.6 Fitting results of dummy variable model
3.2.1 逐步回歸參數(shù)模型 為進一步預(yù)測和分析湖南地區(qū)櫟類次生林的林分直徑分布規(guī)律,利用通過檢驗的122 塊樣地的Weibull 分布函數(shù)參數(shù)值(a、b、c)分別與林分變量(平均直徑D、直徑平方D2、總斷面積BA、每公頃株數(shù)N)的主要指標(biāo)建立多元逐步回歸模型,得到Weibull 參數(shù)的逐步回歸預(yù)估模型。
由表5 可知,入選參數(shù)a 預(yù)估模型M1 的自變量為總斷面積BA,入選參數(shù)b 預(yù)估模型M2 的自變量為平均直徑D,入選參數(shù)c 預(yù)估模型M3 的自變量為直徑平方D2和每公頃株數(shù)N;入選自變量在統(tǒng)計學(xué)上都具有顯著意義,且方差膨脹因子均小于10,不存在共線性問題;參數(shù)a、b 預(yù)估模型M1、M3 的決定系數(shù)R2為0.134、0.258,擬合精度較低,但整體模型具有顯著意義。
3.2.2 啞變量參數(shù)模型 將林分類型啞變量以線性形式引入各參數(shù)的多元回歸預(yù)估模型中,構(gòu)建各參數(shù)的啞變量模型。由表6 可知,相對于參數(shù)b 預(yù)估模型M1,參數(shù)b 的啞變量預(yù)估模型M5 的決定系數(shù)R2提高了0.104,RRMSE 降低了0.83 個百分點;相對于參數(shù)c 預(yù)估模型M3,參數(shù)c 的啞變量預(yù)估模型M6 的決定系數(shù)R2提高了0.134,RRMSE 降低了3.18 個百分點;參數(shù)a 模型引入啞變量后,模型精度無變化。
對逐步回歸參數(shù)模型和啞變量參數(shù)模型在預(yù)測林分徑階頻率的效果進行比較。對兩類模型的決定系數(shù)R2、SSE 和RRMSE 進行比較,并對模型的平均絕對殘差進行差異顯著性檢驗,結(jié)果見表7。與逐步回歸參數(shù)模型相比,啞變量參數(shù)模型的決定系數(shù)提高了0.085,RRMSE 降低了6.43 個百分點;逐步回歸參數(shù)模型與啞變量參數(shù)模型的平均絕對殘差存在顯著差異(P=0.025 <0.05),說明啞變量參數(shù)模型的直徑分布預(yù)測效果顯著優(yōu)于逐步回歸模型。
表7 模型預(yù)測效果比較Tab.7 Comparison of model prediction effect
進一步利用驗證數(shù)據(jù)對2 個模型的預(yù)測效果進行檢驗,繪制2 個模型的預(yù)估值與觀測值的相關(guān)關(guān)系圖以及殘差分布圖(圖1)。2 個模型的徑階頻率預(yù)估值與觀測值的相關(guān)系數(shù)均在0.913 以上,預(yù)估精度高;殘差分布比較均勻,不存在明顯異方差,啞變量模型的預(yù)測殘差分布范圍更窄。
圖1 預(yù)估值與觀測值的相關(guān)關(guān)系及殘差分布Fig.1 Correlation and residual distribution between estimated and observed values
4.1 Weibull 函數(shù)在櫟類的直徑分布應(yīng)用中具有較好的適用性。Carretero 和Alvarez[14]的研究認(rèn)為,Weibull 函數(shù)是預(yù)測和管理櫟類森林的一個非常有用的工具。本研究中,Weibull 分布函數(shù)在模擬櫟類次生林的直徑分布規(guī)律時一樣表現(xiàn)出了很好的適用性。在6 個直徑分布函數(shù)中,Weibull 分布函數(shù)的接受率最高,達到91.7%;Gamma 分布函數(shù)和對數(shù)正態(tài)分布函數(shù)次之,分別為86.5%和82.0%;Logisitic 分布函數(shù)和正態(tài)分布函數(shù)最低。Rafa?[15]的研究表明,Weibull 分布和Gamma 分布適用于冷杉Abies fabri白樺Betula platyphylla混交林多層林分的直徑分布模擬,周永奇等[16]在擬合6 年生杉木的直徑分布時,發(fā)現(xiàn)對數(shù)正態(tài)分布的效果最好。結(jié)合本研究的結(jié)果,我們可以認(rèn)為Weibull、Gamma 和對數(shù)正態(tài)分布函數(shù)在擬合樹木的直徑分布規(guī)律時具有較高的靈活性,最適用的分布函數(shù)可能因樹種或林分結(jié)構(gòu)的差異而不同。
4.2 在模擬具有定性變量的數(shù)據(jù)時,啞變量模型能表現(xiàn)出較好的擬合效果。申家朋等[17]運用啞變量模型擬合落葉松的生物量模型時,得出了啞變量模型比一般異速方程具有更好性能的結(jié)論。由于沒有在分布函數(shù)的參數(shù)中引入啞變量的相關(guān)研究,本研究嘗試在參數(shù)a、b、c 的回歸模型中加入林分類型啞變量,期望能提高分布函數(shù)的預(yù)測精度。研究發(fā)現(xiàn)啞變量的引入確實能顯著提高參數(shù)b、c 模型的擬合精度,說明林分類型對Weibull分布函數(shù)的b,c 參數(shù)具有顯著影響。同時,相比于逐步回歸參數(shù)模型,啞變量變量的引入也能顯著提高直徑分布預(yù)測效果,說明櫟類次生林的直徑分布確實受到林分類型的影響。
4.3 由于櫟類次生林的林分結(jié)構(gòu)與地貌結(jié)構(gòu)復(fù)雜多樣,本研究未能對樣地的林分年齡、林層結(jié)構(gòu)以及立地指數(shù)等因子進行詳細的調(diào)查,這也導(dǎo)致構(gòu)建直徑分布模型時的可選擇變量較少。后續(xù)研究中可以選擇林分年齡、立地指數(shù)或林層結(jié)構(gòu)等因子為自變量或啞變量,以進一步降低模型的預(yù)測誤差。