李鵬
(遼寧省林業(yè)調(diào)查規(guī)劃院,遼寧 沈陽 110122)
?
遼東地區(qū)長白落葉松廣義線性生長模型研究
李鵬
(遼寧省林業(yè)調(diào)查規(guī)劃院,遼寧 沈陽 110122)
長白落葉松是遼寧省主要造林樹種之一,其總體質(zhì)量關(guān)系到遼寧省的生態(tài)環(huán)境建設(shè)。文章根據(jù)遼寧省森林資源連續(xù)清查數(shù)據(jù)主要調(diào)查因子,基于103塊調(diào)查樣地建立林分生長模型,分析林分生長規(guī)律。關(guān)于模擬林分生長模型,經(jīng)典的線性模型往往未能解釋數(shù)據(jù)的離散部分;然而,一些離散變量真正影響林分生長。文中將林分生長特性和林木材積的關(guān)系作為一個(gè)案例研究,通過分析屬性,提出了用廣義線性模型分析林分生長數(shù)據(jù)。
廣義線性模型;離散變量;林分生長
林分生長模型是指用一個(gè)或一組數(shù)學(xué)方程式來描述所計(jì)測的樹木因子、林分狀態(tài)和立地條件等變量與林分現(xiàn)實(shí)生長率之間的關(guān)系。一個(gè)好的林分生長模型可以預(yù)估在各種特定立地條件下林分的發(fā)展動(dòng)態(tài)。因此,林分生長模型在森林經(jīng)營與管理、森林經(jīng)營優(yōu)化決策、森林資源檔案建立和數(shù)據(jù)更新等方面具有重要的意義。本研究以遼寧省落葉松林為例,基于遼寧省森林資源一類調(diào)查103塊小班調(diào)查樣地,通過廣義線性模型建立了林分因子與林分平均蓄積的相關(guān)關(guān)系,提供對(duì)林分生長良好的預(yù)測需要依賴于變量及其持續(xù)的變化的影響。
研究地區(qū)位于遼寧省東部三市,即撫順市、本溪市、丹東市。地理坐標(biāo)123°22′—125°46′ E,39°45′—42°28′ N,本區(qū)是長白山脈的西南延伸部分,林區(qū)地貌屬低山區(qū),東高西低,平均海拔350 m,最高1 347 m,最低62 m,坡度一般在15°~25°,30°以上較少。本區(qū)屬季風(fēng)氣候,全年平均氣溫4~7 ℃,積溫值2 498.4~2 877.3 ℃,1月氣溫最低,平均在-10~-15 ℃,7月溫度最高,平均在22~23.5 ℃,年降水量750~1 150 mm,且多集中在6—8月;早霜從9月下旬開始,晚霜延至5月上旬,生長期為5—10月。本區(qū)屬棕壤區(qū),主要成土巖石為花崗巖、花崗片麻巖等;主要成土母質(zhì)有殘積、坡積、殘坡積、黃土狀母質(zhì)等。
2.1數(shù)據(jù)來源
本研究所用的數(shù)據(jù)均來自于遼寧省森林資源一類調(diào)查的103塊樣地。
2.2研究方法
2.2.1廣義線性模型廣義線性模型最早是由Nelder和Wedderburn(1972)提出的,該方法已被應(yīng)用于森林的特征建模,有較好的發(fā)展前景。維爾弗里德等(2003)用廣義線性模型、廣義相加模型和分類樹分析的統(tǒng)計(jì)方法預(yù)測在不同尺度上植物物種的空間分布。
Dobson(2001)指出,一般情況下,廣義線性模型的線性回歸方法的延伸,允許的時(shí)間和空間變化合并以及納入量化。和經(jīng)典的多元回歸相比,廣義線性模型提供了一個(gè)限制較少的形式。它們提供的除了正常和非恒定方差函數(shù)還有因變量的誤差分布。有一個(gè)廣義線性模型典型的假設(shè)是,所有的結(jié)果都是從同一個(gè)分布族,例如,正常的,泊松分布,或伽馬繪制。一個(gè)廣義線性模型分布族中的一個(gè)多元回歸模型;不同的分布回歸的方法個(gè)體分布隨時(shí)間地點(diǎn)和外部因素變化不同。使用以可能性為基礎(chǔ)的方法,這可以判斷可能的因素是否對(duì)研究現(xiàn)象產(chǎn)生真正的影響。
(1)隨機(jī)成分:作為一個(gè)例子,在指數(shù)分布中,定義Y是響應(yīng)獨(dú)立變量,不只是正常的組件。其中E(Y)=μ和恒定方差σ2;
(2)該系統(tǒng)的組成部分:X可能是離散變量或連續(xù)變量。由此產(chǎn)生的模型可以用來預(yù)測在任何表象的反應(yīng)變量;
Y=b0+b1X1+b2X2+...+bkXk
在這個(gè)公式中,b0是攔截回歸系數(shù),b1值是從數(shù)據(jù)計(jì)算的回歸系數(shù)。
(3)隨機(jī)變量和系統(tǒng)組件之間的關(guān)系:線性(多元回歸)模型可能不足以描述一個(gè)特定的關(guān)系,其對(duì)因變量所預(yù)測的影響在本質(zhì)上可能不是線性的。文中使用關(guān)系函數(shù)克服這個(gè)問題。在本文中,響應(yīng)變量被模擬為作為一個(gè)有對(duì)數(shù)關(guān)系函數(shù)的泊松隨機(jī)分布。
g(μi)=log(μi)
然而,人們可以假定響應(yīng)變量二項(xiàng)式或多項(xiàng)式,但結(jié)果與假定響應(yīng)變量服從泊松分布得到的結(jié)果不會(huì)有所不同。
2.2.2Akaike信息準(zhǔn)則要選擇最簡約的模型,Akaike信息準(zhǔn)則(AIC)是用作自動(dòng)逐步模型的選擇。由于Akaike信息準(zhǔn)則價(jià)值較低,一般來說,模型的預(yù)測值更接近觀測值(Chambers,1997)。該模型可以選擇用最小的Akaike信息準(zhǔn)則。
其中,n是樣本大小,是估計(jì)誤差項(xiàng)的標(biāo)準(zhǔn)偏差,和tr(S)表示帽子矩陣
2.2.3Spearman的秩相關(guān)Spearman秩相關(guān)規(guī)定分配一個(gè)兩個(gè)變量之間的獨(dú)立的自由檢測。但是,它對(duì)類型的相關(guān)性不敏感。Spearman秩相關(guān),給出了一個(gè)更好地衡量相關(guān)性的方法,也是一個(gè)更好的兩面獨(dú)立測試。 Spearman秩相關(guān)系數(shù)的計(jì)算公式為:
其中,R(x)和R(y)是一對(duì)變量(x和y)每個(gè)含n個(gè)觀測的秩。
2.2.4似然比檢驗(yàn)在統(tǒng)計(jì)中,似然比檢驗(yàn)是用來比較兩個(gè)模型的擬合,統(tǒng)計(jì)測試(空模型),其他(替代模型)是一個(gè)特殊情況。檢驗(yàn)是基于似然比,它表示數(shù)據(jù)在一個(gè)模型下數(shù)據(jù)的擬合比另一個(gè)模型擬合多的次數(shù)。這種可能的比例或?qū)?shù),可用于計(jì)算ρ值,或化為一個(gè)決定是否拒絕空模型的替代模型一個(gè)臨界值。
2.2.5Wald檢驗(yàn)Wald檢驗(yàn)是檢驗(yàn)在一個(gè)統(tǒng)計(jì)模型里特別的解釋變量的重要性。在泊松回歸里,我們有一個(gè)二進(jìn)制的結(jié)果變量以及更多的解釋變量。模型中每一個(gè)的解釋變量有一個(gè)相關(guān)參數(shù)。Polit(1996)和Agresti(1990)有描述,Wald檢驗(yàn)可以測試與一組解釋變量相關(guān)的參數(shù)是否都為零。如果一個(gè)特定的解釋變量,或一組解釋變量,經(jīng)Wald檢驗(yàn)是顯著的,然后與這些變量相關(guān)的參數(shù)不為零,那么這樣的變量應(yīng)該包含在模型中。如果經(jīng)Wald檢驗(yàn)不顯著,則可以省略這些解釋變量模型。
采用SPSS統(tǒng)計(jì),進(jìn)行廣義線性模型分析。文中生長模型以林分平均蓄積為自變量,計(jì)算了三種不同的變量組合:第一種自變量組合是坡位、平均胸徑和平均年齡;第二種自變量組合是坡位和平均年齡;第三種自變量組合是坡位和平均胸徑。對(duì)以上三種自變量組合進(jìn)行模擬,得到的模型分別為模型1、模型2、模型3。
3.1自變量為坡位、平均胸徑和平均年齡的林分蓄積模型的建立
采用SPSS統(tǒng)計(jì),應(yīng)用廣義線性模型,得到模型一系數(shù)、標(biāo)準(zhǔn)誤和沃爾德95%置信區(qū)間。通過每個(gè)模型擬合優(yōu)度比較的方法進(jìn)行測試,將3種自變量組合應(yīng)用到模型中,第一種自變量組合方案的廣義線性回歸模型的擬合優(yōu)度如表1。
表1 模型一的擬合記錄
由表1可看出,模型自變量坡位取不同的值時(shí),系數(shù)的取值顯著性均小于0.1,具有明顯的差異性。
表2 模型一的擬合優(yōu)度
注:自變量:坡位,平均年齡,平均胸徑;因變量:平均蓄積
離差反映了估計(jì)量與真實(shí)值之間的差距,或者說可能出現(xiàn)結(jié)果與平均預(yù)期的偏離程度,代表風(fēng)險(xiǎn)程度的大小。赤池信息量準(zhǔn)則(Akaike information criterion、簡稱AIC)是衡量統(tǒng)計(jì)模型擬合優(yōu)良性的一種標(biāo)準(zhǔn),該準(zhǔn)則建立在熵的概念基礎(chǔ)上,可以用來權(quán)衡所估計(jì)模型的復(fù)雜度和此模型擬合數(shù)據(jù)的優(yōu)良性。模型一的擬合優(yōu)度見表2。
3.2自變量為坡位、平均胸徑的林分蓄積模型的建立
將坡位、平均胸徑作為模型的自變量來建立模型,文中前面已經(jīng)提及,建立的模型成為模型二,模型二系數(shù)、標(biāo)準(zhǔn)誤和沃爾德95%置信區(qū)間如表3,第二種自變量組合的廣義線性模型的回歸模型的擬合優(yōu)度見表4。
表3 模型二的擬合記錄
由表3可知,當(dāng)自變量坡位值取2或者3時(shí),回歸系數(shù)顯著性都小于0.1,因此回歸系數(shù)具有顯著性;而當(dāng)坡位值取4時(shí),回歸系數(shù)等于0.828,遠(yuǎn)大于0.1,因此該回歸系數(shù)不具有顯著性。
表4 模型二的擬合優(yōu)度
注:自變量:坡位,平均胸徑;因變量:平均蓄積
Akaike信息標(biāo)準(zhǔn)越低,越接近模型的現(xiàn)實(shí)。模型二的離差小于模型一的離差,自由度比模型一的自由度大1。對(duì)數(shù)似然值前者大于后者,相反的,Akaike信息準(zhǔn)則 (AIC)前者大于后者,因此模型一更接近現(xiàn)實(shí),即模型一擬合優(yōu)度優(yōu)于模型二。
3.3自變量為坡位、平均年齡的林分蓄積模型的建立
模型三是將坡位、平均年齡作為模型的自變量來建立的。表5記錄了模型三系數(shù)、標(biāo)準(zhǔn)誤和沃爾德95%置信區(qū)間,廣義線性模型的回歸模型三的擬合優(yōu)度如表6。
表5 模型三的擬合記錄
由表5可知,模型三的常數(shù)項(xiàng)以及平均年齡項(xiàng)的系數(shù)的顯著性均小于0.1,因此系數(shù)具有顯著性。當(dāng)自變量坡位值取不同的值時(shí),回歸系數(shù)顯著性都小于0.1,因此回歸系數(shù)具有顯著性,因此該模型可以較好地模擬出坡位、平均年齡與林分平均蓄積的關(guān)系。
表6 模型三的擬合優(yōu)度
注:自變量:坡位,平均年齡;因變量:平均蓄積
模型三的離差大于模型一的離差,自由度比模型一的自由度大1。對(duì)數(shù)似然值大于模型一的對(duì)數(shù)似然值,Akaike信息準(zhǔn)則 (AIC)前者大于后者,因此模型三同模型一相比,模型一更接近現(xiàn)實(shí)。
由此我們可得出結(jié)論,由于模型一的Akaike信息準(zhǔn)則 (AIC)最小,其Akaike信息標(biāo)準(zhǔn)=2 817.013,而且其對(duì)數(shù)似然是最大的,對(duì)數(shù)似然值=-1 403.506,因此以坡位、平均胸徑和平均年齡為自變量的模型一是這些模型之間最佳的。
3.4最優(yōu)自變量組合廣義線性模型Wald檢驗(yàn)
從表7中看出,經(jīng)Wald檢驗(yàn)顯著,與坡位、胸徑以及平均年齡相關(guān)的這些參數(shù)都不為零,那么自變量應(yīng)該包括在模型中。
表7 最優(yōu)模型的Wald檢驗(yàn)
3.5最優(yōu)自變量組合廣義線性模型的表達(dá)
從表7可以看出,模型中的所有系數(shù)的顯著性(顯著水平<0.1)。最終模型結(jié)果如下:
V=2.803+0.292*P+0.12*D+0.002*A(P=2)
V=2.803+0.23*P+0.12*D+0.002*A
(P=3)
V=2.803+0.128*P+0.12*D+0.002*A(P=4)
其中,V指林分的平均蓄積,P指林分立地的坡位,D指林分的平均胸徑。A指林分的平均年齡。
由于調(diào)查數(shù)據(jù)中坡位為6的小班只有一個(gè),因此無法對(duì)坡位為6的林分的因子和林分蓄積的相關(guān)關(guān)系進(jìn)行模擬。
4.1以遼寧省長白落葉松林為例,基于103塊調(diào)查樣地,通過廣義線性模型建立了林分因子與林分平均蓄積的相關(guān)關(guān)系,通過每個(gè)模型擬合優(yōu)度比較的方法進(jìn)行測試,最終獲得模擬效果最好的模型,該模型以坡位、平均胸徑為自變量,最終得出了當(dāng)坡位分別為上坡、中坡、下坡的林分平均蓄積線性回歸方程?;貧w方程如下:
V=2.803+0.292*P+0.12*D+0.002*A(P=2);
V=2.803+0.23*P+0.12*D+0.002*A
(P=3);
V=2.803+0.128*P+0.12*D+0.002*A(P=4);
其中,V指林分的平均蓄積,P指林分立地的坡位,D指林分的平均胸徑,A指林分的平均年齡。
該模型可預(yù)測林分的生長動(dòng)態(tài)變化,從而為森林經(jīng)營者提供合理林分動(dòng)態(tài)信息。
4.2本文中重要的一個(gè)自變量為坡位,坡位為離散因子,在進(jìn)行林分調(diào)查時(shí),是較為容易獲得的數(shù)據(jù),將坡位作為自變量引入到林分蓄積量估計(jì)模型當(dāng)中來,應(yīng)用廣義線性模型能較好將此類離散變量作為自變量進(jìn)行估計(jì),這大大減少了野外調(diào)查的難度和工作量。
[1] Nelder J A,Wedderburn R W.Generalized linear models[J],Roy.Statist.Soc. Ser.A,135,1972:370-384
[2] Dobson A,An Introduction to Generalized Linear Models[M],(2nd ed).CRC Press,Boca Raton,Fla.2001:145-147
[3] Thuiller W,Araújo MB,Sandra L.Generalized models versus classification tree analysis: Predicting spatial distributions of plant species at different scales[J].Veg.Sci. 2003,14:669-680
[4] Chambers J M,Hastie T J. Statistical models in S [M],London,UK: Chapman&Hall,1997:23-25
[5] Polit D.Data Analysis and Statistics for Nursing Research[J],Stamford,CT:Appleton&Lange,1996:45-46
[6] Agresti A. Categorical Data Analysis. John Wiley and Sons[M].2nd ed.New York: The Wiley Series in Probability and Statistics,1990:24-26
[7] 楊志雄,袁岱菁.非線性混合效應(yīng)模型和廣義線性模型擬合隨機(jī)效應(yīng)logistic回歸的應(yīng)用比較[J].中國衛(wèi)生統(tǒng)計(jì),2011,28(3):321-323
[8] 馮靜海.廣義線性模型逆回歸統(tǒng)計(jì)研究[J].大連理工大學(xué)學(xué)報(bào),2011,51(3):464-468
[9] 陳卓恒.負(fù)二項(xiàng)分布的廣義線性模型及其應(yīng)用[J].華僑大學(xué)學(xué)報(bào):自然科學(xué)版,2011,32(2):226-230
Generalized Linear Models ofLarixolgensisin Eastern Region of Liaoning Province
Li Peng
(Forest Inventory ard Planning Institute,Liaoning Province,Shenyang 110122,China)
Larixolgensisis one of the main tree species in Liaoning Province,and its overall quality relates to the ecological environment of Liaoning Province.Growth model of stand was established based on 103 survey plots on the basis of the main description factor database of continuous forest inventory in Liaoning Province.The law of stand growth was analyzed.As for simulating stand growth Model,the classical linear models often failed to explain the discrete component of data.However,some discrete variables really influence the stand growth.The relationship between stand growth characters and volume of stands was discussed as a case study.Data of stand growth by using generalized linear models was proposed through analyzing attribute.
generalized Linear Models;discrete variables;stand growth
1005-5215(2016)09-0038-04
2016-06-30
遼寧省農(nóng)業(yè)攻關(guān)及成果產(chǎn)業(yè)化項(xiàng)目(2014207011)
李鵬(1985-),男,碩士,工程師,主要從事林業(yè)調(diào)查規(guī)劃工作.
S791.22
A
10.13601/j.issn.1005-5215.2016.09.011