殷祚云,曾令海,何波祥,連輝明,張謙,蔡燕靈,陳一群,藍(lán)燕群
廣東省林業(yè)科學(xué)研究院,廣東 廣州 510520
紅錐Castanopsis hystrix A. DC.是南亞熱帶地區(qū)珍貴、優(yōu)良的鄉(xiāng)土材用和景觀樹種,屬殼斗科錐屬常綠闊葉喬木,生長于海拔30~1300 m緩坡和山地常綠闊葉林中,分布于華南、華中、華東和西南地區(qū),越南、老撾、柬埔寨、緬甸、印度等國家也有分布;廣州市僅見于從化、花都兩個(gè)郊區(qū)市的山地林中[1-2]。由于城市區(qū)域天然林所剩無幾,野生紅錐已不多見,但人們開始重視包括紅錐在內(nèi)的鄉(xiāng)土闊葉樹種在城市景觀林建設(shè)、熱帶亞熱帶次生林經(jīng)營中的應(yīng)用[3-4]。
已見許多關(guān)于樹種胸高直徑(胸徑)分布的研究[5-11],但大多局限于韋伯分布(又稱威布爾分布)、正態(tài)分布等少數(shù)幾種統(tǒng)計(jì)分布,而對于冠幅、基徑(即地徑)、樹高等多個(gè)個(gè)體大?。˙ody size)指標(biāo)及其綜合指標(biāo),同時(shí)運(yùn)用多種統(tǒng)計(jì)分布模型來擬合的研究,鮮有報(bào)導(dǎo)。最近,在生態(tài)和進(jìn)化研究的一些領(lǐng)域,研究人員開始采用被稱為“模型選擇”途徑,而非傳統(tǒng)的零假設(shè)檢驗(yàn)途徑[12]。殷祚云將這種模型選擇途徑運(yùn)用于植物群落中物種多度分布(Species abundance distribution, SAD)的研究中,提出了一個(gè)“序列模型集合”以同時(shí)模擬觀察數(shù)據(jù),從而找到了最佳模型或普適模型——對數(shù)柯西分布,并藉此闡明了不同群落不同演替階段物種多度分布的格局與動態(tài)[13-17]。
本研究通過精心設(shè)計(jì)和詳細(xì)調(diào)查,測得幼齡期紅錐的多個(gè)個(gè)體大小指標(biāo)(或生長指標(biāo)、生長量指標(biāo))的大樣本數(shù)據(jù),用以探討這些指標(biāo)的觀察分布與多種理論分布之間的相互關(guān)聯(lián),旨在尋找適合這些指標(biāo)各自的最佳模型及符合所有指標(biāo)的普適模型,從而闡明其統(tǒng)計(jì)分布規(guī)律,亦為相關(guān)研究提供參考。
廣州市地處廣東省中部的南亞熱帶季風(fēng)海洋性氣候區(qū),夏熱冬暖,雨量充沛,雨熱同季,地帶性植被為季風(fēng)常綠闊葉林。設(shè)在廣東省龍眼洞林場筲箕窩的試驗(yàn)地(北緯23°13′48″ ~ 23°13′56″、東經(jīng)113°23′52″ ~ 113°24′04″)位于廣州市東北郊,屬丘陵地區(qū),土壤為山地赤紅壤,原為馬占相思采伐跡地。2010年5月林場采用20~30 cm高、一年生的紅錐容器苗進(jìn)行再造林,株行距為2.5 m×3 m。2012年5月,在整個(gè)試驗(yàn)區(qū)內(nèi)有代表性地設(shè)置了24個(gè)10 m×10 m固定樣方,所處海拔101~181 m(平均136.3 m),坡度25°~37°(平均31.5°),坡向從西北、東北、西南、南面、東南到東面;逐株調(diào)查每個(gè)樣方內(nèi)的存活個(gè)體,所登記個(gè)體大小指標(biāo)包括樹高、冠幅、胸徑和基徑(即地徑)。
選擇12個(gè)具有不同函數(shù)形式的主要連續(xù)型分布[14,18-21](SPSS Inc., 2004),這些理論分布多少有些貌似紅錐個(gè)體大小指標(biāo)的觀察分布。其中,瑞利、指數(shù)分布為單參數(shù)分布,另外10個(gè)均為雙參數(shù)分布。
1.2.1 正態(tài)分布(常態(tài)分布, Normal distribution) 概率密度函數(shù)(或稱分布密度、密度函數(shù),Probability density function, PDF):
累積分布函數(shù)(或稱分布函數(shù),Cumulative distribution function, CDF):
其中,均值μ為位置參數(shù)(location parameter),標(biāo)準(zhǔn)差σ為尺度參數(shù)(又稱比例參數(shù),scale parameter)。
1.2.2 瑞利分布(Rayleigh distribution)
概率密度函數(shù):
累積分布函數(shù):
F(x;λ)=1?e?(x/λ)2。
其中,λ是尺度參數(shù)。
瑞利分布是下述韋伯分布的特例:Rayleigh(x; λ)=Weibull(x; λ, 2)。
1.2.3 指數(shù)分布(也叫負(fù)指數(shù)分布,Exponential distribution)
概率密度函數(shù):
累積分布函數(shù):
F(x;λ)=1?e?λx。
其中,λ為尺度參數(shù)。
指數(shù)分布既屬于韋伯分布族,也屬于伽瑪分布族,有:
Exp(x; λ)=Weibull(x; 1/λ, 1)=Γ(x; 1, λ)。
1.2.4 伽瑪分布(亦作伽馬分布,Gamma distribution)
概率密度函數(shù):
累積分布函數(shù):
其中,k是形狀參數(shù)(Shape parameter),λ是尺度參數(shù)。
伽瑪分布適用于各種形式的分布,具有理論意義,其中Γ(1, λ)為指數(shù)分布,Γ(n/2,1/2)為自由度為n的卡方分布。
1.2.5 對數(shù)正態(tài)分布(Lognormal distribution)
概率密度函數(shù):
累積分布函數(shù):
其中,μ為位置參數(shù),σ為尺度參數(shù)。
1.2.6 韋伯分布(威布爾分布,Weibull distribution) 概率密度函數(shù):
累積分布函數(shù):
F(x;λ,k)=1?e?(x/λ)k。
其中,λ是尺度參數(shù),k是形狀參數(shù)。韋伯分布的累積分布函數(shù)是擴(kuò)展的指數(shù)分布累積分布函數(shù),且它與很多分布都有關(guān)系:當(dāng)k=1,是指數(shù)分布;k=2時(shí),是瑞利分布[18-19]。
1.2.7 柯西分布(哥西分布,Cauchy distribution)
概率密度函數(shù):
累積分布函數(shù):
其中,θ為位置參數(shù),λ為尺度參數(shù)。
1.2.8 邏輯斯諦分布(邏輯斯蒂、若吉斯蒂克分布,Logistic distribution)
概率密度函數(shù):
累積分布函數(shù):
其中,μ是均值、位置參數(shù),λ是尺度參數(shù)。
1.2.9 極值分布(Extreme value distribution)
概率密度函數(shù):
累積分布函數(shù):
其中,θ為位置參數(shù),λ為尺度參數(shù)。
1.2.10 拉普拉斯分布(Laplace distribution)
也叫雙指數(shù)分布;對應(yīng)于正態(tài)分布為第二型拉普拉斯分布,又稱第一型拉普拉斯分布。
概率密度函數(shù):
累積分布函數(shù):
其中,μ是均值、位置參數(shù),λ是尺度參數(shù)。
1.2.11 反高斯分布(或逆高斯分布,Inverse Gaussian distribution)
概率密度函數(shù):
累積分布函數(shù):
其中,μ是均值、位置參數(shù),λ是尺度參數(shù)(SPSS Inc., 2004)。
1.2.12 對數(shù)柯西分布(LogCauchy distribution)
概率密度函數(shù):
累積分布函數(shù):
其中,θ為位置參數(shù),λ為尺度參數(shù)。
分布參數(shù)估計(jì)采用最大或然法[14,16,18],也可得到或然函數(shù)值,用于計(jì)算模型對數(shù)據(jù)的擬合優(yōu)度(或稱適合度,Goodness of fit)標(biāo)準(zhǔn):
AIC = ?lnL + K;
CAIC = ?2lnL + K(lnS + 1)。
式中,AIC=Akaike信息標(biāo)準(zhǔn)(Akaike information criterion);CAIC=一致性Akaike信息標(biāo)準(zhǔn)(Consistent AIC);lnL=或然函數(shù)值的對數(shù);K=估計(jì)參數(shù)的個(gè)數(shù);S=樣本大小,即觀測值個(gè)數(shù)。AIC和CAIC越小,模型越好[22-25]。
同時(shí),還采用各分布的累積分布函數(shù)對各指標(biāo)的累積頻數(shù)數(shù)據(jù)進(jìn)行基于最小二乘法的非線性回歸分析,求得決定系數(shù)R2,用于模型評優(yōu);R2值越大,模型越好[16,21,26-27]。
此外,還要進(jìn)行分布模型是否符合觀察分布的統(tǒng)計(jì)顯著性檢驗(yàn),由于紅錐個(gè)體大小指標(biāo)均為連續(xù)性數(shù)據(jù),宜運(yùn)用柯爾莫哥洛夫-斯米爾諾夫檢驗(yàn)(Kolmogorov–Smirnov test, KS test)。KS檢驗(yàn)統(tǒng)計(jì)量定義為:當(dāng)隨機(jī)變量取一系列值(通常呈等差數(shù)列)時(shí),所得累積觀察分布和累積期望分布之差的絕對值中最大的一個(gè)[19,28-29]。根據(jù)樣本大小與組數(shù)的關(guān)系,確定組數(shù);再根據(jù)極差決定組距,最后對各個(gè)指標(biāo)數(shù)據(jù)進(jìn)行歸組[30],以用于KS檢驗(yàn)。設(shè)3個(gè)置信水平即α=0.01、0.05和0.20,分別表示較符合、符合和極符合;KS統(tǒng)計(jì)量大于α=0.01水平臨界值時(shí)為不符合[28]。
數(shù)據(jù)處理與分析采用幾種常用軟件完成[31-34],包括:SPSS 13.0 (SPSS Inc., 2004)、Microsoft Office Excel 2007 (Microsoft Corporation, 2006)、Microcal Origin 5.0 (Microcal Software, Inc., 1997)、OriginPro 7.5 (OriginLab Corporation, 2003)及Mathematica 4 (Wolfram Research, Inc., 1999)。
在廣東省龍眼洞林場筲箕窩試驗(yàn)地的24個(gè)固定樣方內(nèi)總共記錄了145株紅錐,其中127株可測胸徑;為比較包括胸徑在內(nèi)的全部指標(biāo)及其衍生指標(biāo)的統(tǒng)計(jì)分布,本研究以這127株紅錐為研究對象(表1)。關(guān)于峰度和偏度,4個(gè)一維(次)指標(biāo)即冠幅、胸徑、基徑和樹高以及2個(gè)二維指標(biāo)冠層面積、基部面積很近似于0,可認(rèn)為它們的總體分布為正態(tài)分布;胸高面積、體積明顯大于0,顯然是偏離正態(tài)的;三維指標(biāo)中,冠層體積、基部體積比胸高體積更趨近于0,故也較為接近正態(tài)。這與后面的統(tǒng)計(jì)檢驗(yàn)結(jié)果(表2—11)是一致的。
表1 廣州市二年生紅錐10種個(gè)體大小指標(biāo)觀測值的描述性統(tǒng)計(jì) Table 1 Descriptive statistics of 10 observed body size indicators of 2-year Castanopsis hystrix in Guangzhou, South China
從10個(gè)指標(biāo)來看,AIC和CAIC的變化趨勢幾乎是一樣的(表2—11),且由于這2個(gè)擬合優(yōu)度標(biāo)準(zhǔn)與KS統(tǒng)計(jì)量一樣,都是越小越好[22,24],而決定系數(shù)R2則是越大越好[16,26],因而本文提出一個(gè)新的綜合統(tǒng)計(jì)量CAIC×KS/R2,用以綜合判定不同分布模型對各生長指標(biāo)觀察分布的擬合優(yōu)度。
對于冠幅的頻數(shù)分布(表2),以越小越好的綜合統(tǒng)計(jì)量CAIC×KS/R2為標(biāo)準(zhǔn),分布適合度大小次序?yàn)椋嘿が?對數(shù)正態(tài)>反高斯>正態(tài)>極值>邏輯斯諦>韋伯>拉普拉斯>對數(shù)柯西>柯西>瑞利>指數(shù),前3名的綜合擬合優(yōu)度差異不大,分別是1.79、1.84、1.93;后3名差異很大。KS檢驗(yàn)表明,僅瑞利分布、指數(shù)分布不符合觀察,柯西分布在0.05置信水平顯著符合,其他分布均在0.20水平極顯著符合。
表2 十二種統(tǒng)計(jì)分布模型對廣州市二年生紅錐冠幅頻數(shù)分布的 擬合優(yōu)度比較 Table 2 Comparisons of the goodness-of-fits of 12 statistical distribution models to the frequency distribution of canopy diameter (CD) of 2-year Castanopsis hystrix in Guangzhou, South China
表3 十二種統(tǒng)計(jì)分布模型對廣州市二年生紅錐胸徑頻數(shù)分布的 擬合優(yōu)度比較 Table 3 Comparisons of the goodness-of-fits of 12 statistical distribution models to the frequency distribution of diameter at breast height (BD) of 2-year Castanopsis hystrix in Guangzhou, South China
KS檢驗(yàn)表明,反高斯分布和指數(shù)分布不適合胸徑數(shù)據(jù),對數(shù)柯西分布和對數(shù)正態(tài)分布在0.05置信水平符合,其余6個(gè)指標(biāo)都是極為符合(表3)。以綜合統(tǒng)計(jì)量為標(biāo)準(zhǔn)進(jìn)行比較,適合胸徑頻數(shù)分布的程度,從大到小依次是:邏輯斯諦>韋伯>極值>正態(tài)>瑞利>柯西>拉普拉斯>伽瑪>對數(shù)正態(tài)>對數(shù)柯西>反高斯>指數(shù)。前3位差別不大,其后的正態(tài)、瑞利、柯西、拉普拉斯和伽瑪分布差不多,再后的對數(shù)正態(tài)和對數(shù)柯西分布也很接近。
瑞利分布和指數(shù)分布不適合描述基徑的觀察分布,其他指標(biāo)則都極顯著符合(表4)。各分布模型對基徑觀察分布的擬合優(yōu)度排序?yàn)椋簩?shù)柯西>伽瑪>邏輯斯諦>正態(tài)>韋伯>極值>對數(shù)正態(tài)>反高斯>拉普拉斯>柯西>瑞利>指數(shù)。位于第1位的對數(shù)柯西分布大大優(yōu)于其后的3個(gè)分布,再后的韋伯、極值、對數(shù)正態(tài)、反高斯分布較為接近,拉普拉斯與柯西分布相差不大,而最后2個(gè)分布的綜合統(tǒng)計(jì)量特別的高,因而不適合基徑數(shù)據(jù)。
表4 十二種統(tǒng)計(jì)分布模型對廣州市二年生紅錐基徑頻數(shù)分布的 擬合優(yōu)度比較 Table 4 Comparisons of the goodness-of-fits of 12 statistical distribution models to the frequency distribution of ground diameter (GD) of 2-year Castanopsis hystrix in Guangzhou, South China
根據(jù)KS檢驗(yàn),樹高分布與冠幅、基徑分布一樣,顯然也不適合由指數(shù)和瑞利分布來描述,但極顯著地服從其他8種分布模型(表5)。12個(gè)理論分布對樹高數(shù)據(jù)的擬合優(yōu)度排名如下:對數(shù)柯西>伽瑪>拉普拉斯>邏輯斯諦>對數(shù)正態(tài)>反高斯>正態(tài)>極值>韋伯>柯西>指數(shù)>瑞利。樹高與基徑一樣,最為適合的也是柯西分布,但與緊隨其后的伽瑪、拉普拉斯、邏輯斯諦分布,在綜合統(tǒng)計(jì)量上的差異不是很大;從對數(shù)正態(tài)到柯西分布的6個(gè)分布較為接近;而位居最后的指數(shù)、瑞利分布,其綜合統(tǒng)計(jì)量比其他分布的大1~2個(gè)數(shù)量級。
對于冠層面積,僅指數(shù)分布不符合其觀察分布,正態(tài)和柯西分布在0.05置信水平符合,其他分布都是極符合(表6)。擬合優(yōu)度順序?yàn)椋悍锤咚?對數(shù)正態(tài)>極值>伽瑪>邏輯斯諦>瑞利>韋伯>對數(shù)柯西>拉普拉斯>正態(tài)>柯西>指數(shù)。仍就綜合統(tǒng)計(jì)量而言,最適合的反高斯分布與緊接著的對數(shù)正態(tài)、極值分布相近,而后的伽瑪、邏輯斯諦、瑞利和韋伯分布差不多,對數(shù)柯西、拉普拉斯、正態(tài)和柯西分布較接近,排最后的指數(shù)分布則奇高。
表5 十二種統(tǒng)計(jì)分布模型對廣州市二年生紅錐樹高頻數(shù)分布的 擬合優(yōu)度比較 Table 5 Comparisons of the goodness-of-fits of 12 statistical distribution models to the frequency distribution of tree height (HT) of 2-year Castanopsis hystrix in Guangzhou, South China
表6 十二種統(tǒng)計(jì)分布模型對廣州市二年生紅錐冠層面積頻數(shù)分布的 擬合優(yōu)度比較 Table 6 Comparisons of the goodness-of-fits of 12 statistical distribution models to the frequency distribution of canopy area (CA) of 2-year Castanopsis hystrix in Guangzhou, South China
令人驚奇的是,單參數(shù)的指數(shù)分布竟然成為模擬胸高面積頻數(shù)分布的最佳模型,排在其后的韋伯和伽瑪分布,其綜合統(tǒng)計(jì)量與指數(shù)分布的相差較??;再后的極值、邏輯斯諦、拉普拉斯分布相距不大;對數(shù)正態(tài)、柯西和對數(shù)柯西分布較為接近(表7)。擬合優(yōu)度順序?yàn)椋褐笖?shù)>韋伯>伽瑪>極值>邏輯斯諦>拉普拉斯>對數(shù)正態(tài)>柯西>對數(shù)柯西>正態(tài)>反高斯>瑞利。由KS檢驗(yàn)可知,正態(tài)、反高斯、瑞利分布不適合模擬實(shí)測數(shù)據(jù),對數(shù)正態(tài)分布在0.01水平較適合,柯西和對數(shù)柯西分布在0.05水平適合,其他均在0.20水平極適合。
對基部面積的擬合優(yōu)度次序?yàn)椋嘿が?極值>對數(shù)柯西>邏輯斯諦>韋伯>對數(shù)正態(tài)>瑞利>反高斯>拉普拉斯>正態(tài)>柯西>指數(shù)(表8)。排在第二位的極值分布綜合統(tǒng)計(jì)量與最佳模型伽瑪分布的很相近,排在第三的對數(shù)柯西分布則稍大些,而后的邏輯斯諦、韋伯、對數(shù)正態(tài)和瑞利較接近,再后的反高斯、拉普拉斯和正態(tài)分布相仿,柯西分布的綜合統(tǒng)計(jì)量則很大,指數(shù)分布最大,高出其他分布1個(gè)數(shù)量級。KS檢驗(yàn)也表明,擬合優(yōu)度排末尾的指數(shù)分布不符合基部面積的觀察分布;柯西分布在0.05置信水平符合;其他分布均在0.20水平極顯著地適合觀察。
表7 十二種統(tǒng)計(jì)分布模型對廣州市二年生紅錐胸高面積頻數(shù)分布的 擬合優(yōu)度比較 Table 7 Comparisons of the goodness-of-fits of 12 statistical distribution models to the frequency distribution of area at breast height (BA) of 2-year Castanopsis hystrix in Guangzhou, South China
表8 十二種統(tǒng)計(jì)分布模型對廣州市二年生紅錐基部面積頻數(shù)分布的 擬合優(yōu)度比較 Table 8 Comparisons of the goodness-of-fits of 12 statistical distribution models to the frequency distribution of ground area (GA) of 2-year Castanopsis hystrix in Guangzhou, South China
據(jù)KS檢驗(yàn)可得,冠層體積分布除了不服從指數(shù)分布、較顯著地服從瑞利和正態(tài)分布之外,均極顯著地服從其他9種統(tǒng)計(jì)分布,擬合優(yōu)度排位為:對數(shù)正態(tài)>反高斯>伽瑪>極值>對數(shù)柯西>韋伯>拉普拉斯>邏輯斯諦>柯西>瑞利>正態(tài)>指數(shù)(表9)。其最佳模型對數(shù)正態(tài)分布的綜合統(tǒng)計(jì)量明顯低于位居第二的反高斯分布;伽瑪與極值較接近;對數(shù)柯西、韋伯、拉普拉斯和邏輯斯諦相近;瑞利與正態(tài)差不多;指數(shù)分布則明顯最大。
表9 十二種統(tǒng)計(jì)分布模型對廣州市二年生紅錐冠層體積頻數(shù)分布的 擬合優(yōu)度比較 Table 9 Comparisons of the goodness-of-fits of 12 statistical distribution models to the frequency distribution of canopy volume (CV) of 2-year Castanopsis hystrix in Guangzhou, South China
表10 十二種統(tǒng)計(jì)分布模型對廣州市二年生紅錐胸高體積頻數(shù)分布的擬合優(yōu)度比較 Table 10 Comparisons of the goodness-of-fits of 12 statistical distribution models to the frequency distribution of volume at breast height (BV) of 2-year Castanopsis hystrix in Guangzhou, South China
對于胸高體積分布的擬合優(yōu)度,韋伯>伽瑪>指數(shù)>對數(shù)正態(tài)>對數(shù)柯西>拉普拉斯>邏輯斯諦>極值>柯西>正態(tài)>反高斯>瑞利(表10)。綜合統(tǒng)計(jì)量韋伯比伽瑪稍低,比排第三位的指數(shù)分布低2倍以上;但與胸高面積類似,指數(shù)分布能如此適合胸高體積數(shù)據(jù),較為少見;對數(shù)正態(tài)、對數(shù)柯西和拉普拉斯差不多;邏輯斯諦、極值和柯西較相近;從正態(tài)、反高斯到瑞利分布,綜合統(tǒng)計(jì)量都很大,且越來越明顯增大。KS檢驗(yàn)也表明后面3個(gè)分布不適合觀察分布;而對數(shù)柯西、極值和柯西分布在0.05水平上符合觀察;其余分布都在0.20水平極符合。
至于基部體積,擬合優(yōu)度排序?yàn)椋簩?shù)柯西>伽瑪>對數(shù)正態(tài)>韋伯>反高斯>極值>邏輯斯諦>拉普拉斯>正態(tài)>柯西>瑞利>指數(shù)(表11)。前3名的綜合統(tǒng)計(jì)量較接近;緊接著的4個(gè)分布也相近;再后的邏輯斯諦、拉普拉斯、正態(tài)、柯西分布,綜合統(tǒng)計(jì)量達(dá)到3位數(shù);最末一位指數(shù)分布的綜合統(tǒng)計(jì)量明顯高于倒數(shù)第二位的瑞利分布。從KS檢驗(yàn)可知,基部體積僅不服從指數(shù)分布,服從其他分布——在0.01水平較顯著服從瑞利分布,在0.05水平顯著服從正態(tài)、柯西和拉普拉斯分布,而在0.20水平極顯著服從另外7個(gè)分布。
表11 十二種統(tǒng)計(jì)分布模型對廣州市二年生紅錐基部體積頻數(shù)分布的擬合優(yōu)度比較 Table 11 Comparisons of the goodness-of-fits of 12 statistical distribution models to the frequency distribution of ground volume (GV) of 2-year Castanopsis hystrix in Guangzhou, South China
綜合上述結(jié)果顯示(表2—11),一般說來,同樣的分布模型即正態(tài)分布或柯西分布,對數(shù)尺度比之線性尺度,更適合觀察分布。以綜合統(tǒng)計(jì)量CAIC×KS/R2為評判標(biāo)準(zhǔn),這兩種類型的分布對10個(gè)指標(biāo)的擬合優(yōu)度順序列舉如下:
冠幅:對數(shù)正態(tài)>正態(tài),對數(shù)柯西>柯西;
胸徑:正態(tài)>對數(shù)正態(tài),柯西>對數(shù)柯西;
基徑:正態(tài)>對數(shù)正態(tài),對數(shù)柯西>柯西;
樹高:對數(shù)正態(tài)>正態(tài),對數(shù)柯西>柯西;
冠層面積:對數(shù)正態(tài)>正態(tài),對數(shù)柯西>柯西;
胸高面積:對數(shù)正態(tài)>正態(tài),柯西>對數(shù)柯西;
基部面積:對數(shù)正態(tài)>正態(tài),對數(shù)柯西>柯西;
冠層體積:對數(shù)正態(tài)>正態(tài),對數(shù)柯西>柯西;
胸高體積:對數(shù)正態(tài)>正態(tài),對數(shù)柯西>柯西;
基部體積:對數(shù)正態(tài)>正態(tài),對數(shù)柯西>柯西。也就是說,在10個(gè)指標(biāo)20種情形中僅有胸徑、基徑和胸高面積3個(gè)指標(biāo)4種情形是例外,其他16種情形都是對數(shù)尺度比線性尺度為優(yōu)。這顯然不是偶然的。
前面的分析還表明,伽瑪、韋伯、邏輯斯諦3個(gè)分布均在0.20置信水平極顯著地適合描述紅錐的全部10個(gè)個(gè)體大小指標(biāo),成為表現(xiàn)最好的3個(gè)普適模型;極值和拉普拉斯分布各僅一個(gè)指標(biāo)在0.05水平符合,其他在0.20水平符合,表現(xiàn)也不錯;對數(shù)柯西、對數(shù)正態(tài)分布及柯西分布也可以;而常用的正態(tài)分布有胸高面積和胸高體積2個(gè)指標(biāo)不適合,瑞利、指數(shù)和反高斯分布分別有5個(gè)、8個(gè)和3個(gè)指標(biāo)不符合。
現(xiàn)在比較伽瑪、韋伯、邏輯斯諦3個(gè)普適分布(表2—11)。對綜合統(tǒng)計(jì)量CAIC×KS/R2進(jìn)行排名后可知,在全部10個(gè)指標(biāo)中,從排名領(lǐng)先的指標(biāo)比例來看,伽瑪分布與韋伯分布為7:3,伽瑪與邏輯斯諦是9:1,可見伽瑪分布優(yōu)于韋伯分布、明顯優(yōu)于邏輯斯諦分布;而已有研究中常用的韋伯分布與不常用的邏輯斯諦分布領(lǐng)先指標(biāo)比例為4:6,韋伯分布還不如邏輯斯諦分布。綜上所述,伽瑪分布是最佳的普適模型,因而可用來比較所有個(gè)體大小指標(biāo)內(nèi)在的統(tǒng)計(jì)分布格局差異(圖1)。
適合模擬全部10個(gè)指標(biāo)統(tǒng)計(jì)分布的伽瑪分布曲線清楚地顯示出同一維度不同指標(biāo)、同類指標(biāo)不同維度之間偏態(tài)和峰態(tài)的差異(圖1)。4個(gè)一維(次)指標(biāo)分布曲線,除胸徑略微左偏(正偏)外,幾乎都呈左右對稱的鐘形曲線,這與表1的描述統(tǒng)計(jì)(其中胸徑的偏度最大)是一致的。只有胸高面積、體積的分布曲線變成凹形(或稱倒J形、雙曲線形),其他指標(biāo)都呈單峰形,這是與胸高面積、體積頻數(shù)分布的偏度遠(yuǎn)大于0、且在10個(gè)指標(biāo)中最大有關(guān)(表1),也就是它們嚴(yán)重違背正態(tài)分布的原因(表7、10)。2個(gè)二維指標(biāo)冠層面積和基部面積的分布曲線接近鐘形,另一個(gè)二維指標(biāo)胸高面積呈凹形,這也與前面描述統(tǒng)計(jì)的結(jié)果一致(表1);3個(gè)三維(次)指標(biāo)即冠層、胸高、基部體積,也表現(xiàn)類似格局。
各指標(biāo)伽瑪分布曲線的變化規(guī)律與分布參數(shù)的變化趨勢是一致的。從長度(直徑和高度)、面積到體積,即個(gè)體大小指標(biāo)從一、二到三維(次),曲線高度越來越矮,越來越左偏,以至變?yōu)榘夹危ㄐ馗呙娣e、體積),而且越來越凹——胸高體積比胸高面積更向左凹陷。這與所擬合伽瑪分布參數(shù)的變化規(guī)律相對應(yīng):從直徑、面積到體積,無論冠層、胸高還是基部,形狀參數(shù)k、尺度參數(shù)λ兩個(gè)參數(shù)都是遞減的(表12)。
圖1 擬合廣州市二年生紅錐10種個(gè)體大小指標(biāo)觀察分布的 伽瑪分布曲線比較 Fig.1 Comparisons of the gamma distribution curves fitting to the observed distributions of 10 body size indicators of 2-year Castanopsis hystrix in Guangzhou, South China
表12 模擬廣州市二年生紅錐10種個(gè)體大小指標(biāo)觀察分布的伽瑪分布之參數(shù)最大或然估計(jì) Table 12 Maximum likelihood estimation of the gamma distribution parameters modeling the observed distributions of 10 body size indicators of 2-year Castanopsis hystrix in Guangzhou, South China
幼齡期紅錐的全部個(gè)體大小指標(biāo)都有各自最適合的分布模型(且大多不適合常用分布),同時(shí)也存在共同遵從的分布模型,這是個(gè)性與共性的完美結(jié)合。冠幅、胸徑、基徑、樹高、冠層面積、胸高面積、基部面積、冠層體積、胸高體積和基部體積等10個(gè)指標(biāo)的最佳模型分別是伽瑪、邏輯斯諦、對數(shù)柯西、對數(shù)柯西、反高斯、指數(shù)、伽瑪、對數(shù)正態(tài)、韋伯和對數(shù)柯西分布,其中對數(shù)柯西分布占了3個(gè)指標(biāo),伽瑪分布2個(gè),其余均為1個(gè)??梢钥闯?,與最佳的普適模型伽瑪分布相比,對數(shù)柯西分布表現(xiàn)也較好——在KS檢驗(yàn)中僅胸徑、胸高面積、胸高體積3個(gè)指標(biāo)為顯著適合,其他7個(gè)指標(biāo)均為極顯著適合,這類似于生物群落中物種多度分布(SAD):分別在3個(gè)模型組成的集合和7個(gè)模型組成的集合中,都是對數(shù)柯西分布表現(xiàn)最佳[14,16-17]。值得注意的是,全部10個(gè)指標(biāo)所服從的最佳統(tǒng)計(jì)分布模型都不是通常所假設(shè)的正態(tài)分布,并且只有胸高體積一個(gè)指標(biāo)的觀察分布服從常用的韋伯分布。
不同維度指標(biāo)的統(tǒng)計(jì)分布具有不同的表現(xiàn)。10個(gè)指標(biāo)擬合伽瑪分布曲線顯示,同一維度不同指標(biāo)、同類指標(biāo)不同維度之間的偏態(tài)和峰態(tài)存在明顯差異。個(gè)體大小指標(biāo)從長度(直徑和高度)、面積到體積,即從一、二到三維(次),曲線高度越來越矮,越來越趨于正偏(即曲線高峰向左偏離均值)[35],以至變?yōu)榘夹?,而且越來越向左凹陷。另一方面,分布模型適合度與指標(biāo)尺度有關(guān)??偟恼f來,對數(shù)尺度的柯西分布、正態(tài)分布(即對數(shù)柯西分布、對數(shù)正態(tài)分布)分別比線性尺度的相同分布擬合優(yōu)度更大。因此,在進(jìn)行基于正態(tài)分布假設(shè)的各種統(tǒng)計(jì)檢驗(yàn)、推斷時(shí)應(yīng)格外謹(jǐn)慎。在某些情形下,先對觀察數(shù)據(jù)——特別是較高維度的數(shù)據(jù)——進(jìn)行對數(shù)等非線性尺度的轉(zhuǎn)換,再進(jìn)行統(tǒng)計(jì)分析,將會得到更有說服力的結(jié)論。在當(dāng)今生態(tài)學(xué)較為熱門的碳匯研究中,生物量或固碳量與三維指標(biāo),如木材蓄積量或本文提及的冠層、胸高和基部體積,通常呈線性正相關(guān),因而在進(jìn)行統(tǒng)計(jì)分析時(shí),應(yīng)考慮其中可能存在的非正態(tài)性或非對稱性。此外,本研究中的面積指標(biāo)與葉面積指數(shù)、地被物蓋度和郁閉度同屬二維指標(biāo),也應(yīng)呈線性正相關(guān),因此,這里所揭示的二維面積指標(biāo)統(tǒng)計(jì)分布規(guī)律亦可為后面這些常用指標(biāo)的調(diào)查研究提供借鑒。
本研究結(jié)果可為林木遺傳育種、栽培和種群生態(tài)學(xué)等領(lǐng)域研究提供參考。僅僅考察某一樹種不同種源、家系、無性系或單株之間某個(gè)個(gè)體大小指標(biāo)平均值的差異顯著性,是不全面的,未能充分揭示實(shí)測數(shù)據(jù)中所蘊(yùn)含的大量統(tǒng)計(jì)信息,而應(yīng)從多方位、多角度考察其間可能存在的差異,即:就各個(gè)指標(biāo),弄清它們之間其他樣本統(tǒng)計(jì)量(如偏態(tài)、峰態(tài)和變異系數(shù))及該指標(biāo)所屬總體分布的參數(shù)大小、曲線形狀等方面的異同所在。值得一提的是,對特定物種的天然或人工種群的長期跟蹤(尤其是定期定位)研究,有利于揭示其內(nèi)在的統(tǒng)計(jì)分布動態(tài)規(guī)律,因而將具有更加重大的理論和實(shí)踐意義。
提出一個(gè)綜合評價(jià)擬合優(yōu)度的統(tǒng)計(jì)量CAIC×KS/R2。這個(gè)統(tǒng)計(jì)量綜合考慮了3個(gè)不同角度、多個(gè)不同方面:CAIC——考慮了最大或然函數(shù)值、參數(shù)個(gè)數(shù)和樣本大小等3個(gè)方面[24-25],CAIC越小越好;KS統(tǒng)計(jì)量——對應(yīng)于隨機(jī)變量的完全取值序列(通常是等差數(shù)列),累積觀察分布與累積期望分布差異絕對值中的最大值[19,28-29],也是越小越好;R2——采用最小二乘法進(jìn)行非線性回歸時(shí)所得最小殘差(或剩余)平方和的補(bǔ),考慮了隨機(jī)變量全序列取值時(shí)累積觀察分布與累積期望分布差異的平方和,殘差越小,R2越大,模型越好[14,26]。單一標(biāo)準(zhǔn)評判模型優(yōu)劣,容易得出片面乃至不實(shí)之結(jié)論。
紅錐是南亞熱帶地區(qū)重要的材用和景觀樹種,也是廣東省珍貴的鄉(xiāng)土常綠闊葉樹種。現(xiàn)有研究很少報(bào)導(dǎo)運(yùn)用多個(gè)統(tǒng)計(jì)分布模型,同時(shí)對某一樹種多個(gè)個(gè)體大小指標(biāo)的頻數(shù)分布進(jìn)行擬合和比較。本研究精心設(shè)計(jì)了廣州城市景觀林固定樣地,仔細(xì)調(diào)查了其中二年生紅錐的冠幅、胸徑、基徑和樹高4個(gè)指標(biāo)。選用12個(gè)具有不同函數(shù)形式的主要連續(xù)型分布,組成一個(gè)相對完整的模型集合,運(yùn)用最大或然法和最小二乘法,同時(shí)模擬上述4個(gè)長度指標(biāo)及其衍生的3個(gè)面積指標(biāo)和3個(gè)體積指標(biāo)。研究表明:
(1)10個(gè)指標(biāo)都有各自最適合的分布模型,也共同遵從幾個(gè)分布模型,其中以伽瑪分布最佳,其次是邏輯斯諦分布和韋伯分布;
(2)分布曲線形狀因指標(biāo)的維度而異,從一維直徑和高度、二維面積到三維體積,曲線變得越來越低矮、趨于正偏,甚至從單峰形變成凹形;
(3)期望概率分布對觀察頻數(shù)分布的擬合優(yōu)度與指標(biāo)的尺度有關(guān),通常是對數(shù)尺度優(yōu)于線性尺度,例如:對數(shù)柯西分布比柯西分布更適合模擬10個(gè)指標(biāo)中除胸徑和胸高面積之外的8個(gè)指標(biāo);
(4)一個(gè)整合一致性Akaike信息標(biāo)準(zhǔn)CAIC、Kolmogorov-Smirnov檢驗(yàn)統(tǒng)計(jì)量KS和回歸決定系數(shù)R2的統(tǒng)計(jì)量CAIC×KS/R2,可作為擬合優(yōu)度的綜合評價(jià)標(biāo)準(zhǔn)。
本研究可望為林木栽培育種和種群生態(tài)學(xué)等領(lǐng)域的研究提供借鑒。應(yīng)從多方位、多角度地對某一樹種不同種群各生長指標(biāo)的頻數(shù)分布進(jìn)行比較,即針對每個(gè)指標(biāo),闡明這些種群之間除均值外的其他樣本統(tǒng)計(jì)量(包括偏態(tài)、峰態(tài)和變異系數(shù))及其所屬總體分布的參數(shù)大小、曲線形狀等方面的異同。而對特定物種的天然或人工種群的長期跟蹤研究,有利于揭示其內(nèi)在的統(tǒng)計(jì)分布動態(tài)規(guī)律,更是一個(gè)值得進(jìn)一步研究的有趣課題。
致謝:本研究在野外調(diào)查和資料收集中得到了廣東省林業(yè)科學(xué)研究院蔡漢興、謝振鳳、汪鵬和蔡靜如,廣東省龍眼洞林場朱細(xì)儉、李宇雪的大力支持,謹(jǐn)此表示衷心感謝!
[1] 葉華谷, 彭少麟. 廣東植物多樣性編目[M]. 廣州: 廣東世界圖書出版公司, 2006.
[2] 邢福武, 曾慶文, 謝左章. 廣州野生植物[M]. 貴州: 百通集團(tuán)貴州科技出版社, 2007.
[3] 曾令海, 殷祚云. 熱帶次生林經(jīng)營[M]. 廣州: 廣東省出版集團(tuán)廣東科技出版社, 2013.
[4] 朱細(xì)儉, 黃少鋒, 張志鴻. 紅錐混交林生長情況調(diào)查分析[J]. 廣東林業(yè)科技, 2003(4): 46-48.
[5] 董文宇, 邢志遠(yuǎn), 惠淑榮, 等. 利用Weibull分布描述日本落葉松的直徑結(jié)構(gòu)[J]. 沈陽農(nóng)業(yè)大學(xué)學(xué)報(bào), 2006(2): 225-228.
[6] 黃家榮, 孟憲宇, 關(guān)毓秀. 馬尾松人工林直徑分布神經(jīng)網(wǎng)絡(luò)模型研究[J]. 北京林業(yè)大學(xué)學(xué)報(bào), 2006(1): 28-31.
[7] 惠淑榮, 呂永震. Weibull分布函數(shù)在林分直徑結(jié)構(gòu)預(yù)測模型中的應(yīng)用研究[J]. 北華大學(xué)學(xué)報(bào):自然科學(xué)版, 2003(2): 101-104.
[8] 孟京輝, 陸元昌, 劉剛, 等 海南島熱帶天然林直徑分布模型研究[J]. 華中農(nóng)業(yè)大學(xué)學(xué)報(bào), 2010(2): 227-230.
[9] 寧小斌, 李永亮, 劉曉農(nóng). 基于Weibull分布的林分結(jié)構(gòu)可視化模擬技術(shù)研究[J]. 中南林業(yè)調(diào)查規(guī)劃, 2012,02:13-17.
[10] 王秀云, 黃建松, 程光明, 等. 用Weibull分布擬合刺槐林分直徑結(jié)構(gòu)的研究[J]. 林業(yè)勘察設(shè)計(jì), 2004(2):1-3.
[11] 閆東鋒, 侯金芳, 張忠義, 等. 寶天曼自然保護(hù)區(qū)天然次生林林分直徑分布規(guī)律研究[J]. 河南科學(xué), 2006(3):364-367.
[12] JOHNSON J B, OMLAND K S. Model selection in ecology and evolution[J]. Trends Ecological Evolution, 2004, 19 (2), 101-108.
[13] YIN Z Y, GUO Q, REN H, et al. Seasonal changes in spatial patterns of two annual plants in the Chihuahuan Desert, USA[J]. Plant Ecology, 2005, 178(2): 189-199.
[14] YIN Z Y, PENG S L, REN H, et al. LogCauchy, log-sech and lognormal distributions of species abundances in forest communities[J]. Ecological Modelling, 2005, 184(2/4): 329-340.
[15] YIN Z Y, REN H, ZHANG Q M,et al. Species abundance in a forest community in South China: a case of Poisson lognormal distribution[J]. Journal of Integrative Plant Biology, 2005, 47(7): 801-810.
[16] 殷祚云. Modeling on Species Abundance and Distribution Patterns in Plant Communities[D]. 北京:,中國科學(xué)院研究生院, 廣州: 華南植物園, 2005.
[17] 殷祚云, 任海, 彭少麟, 等. 華南退化草坡自然恢復(fù)中物種多度分布的動態(tài)與模擬[J]. 生態(tài)環(huán)境學(xué)報(bào), 2009, 18(1): 222-228.
[18] 數(shù)學(xué)手冊編寫組. 數(shù)學(xué)手冊[M]. 北京: 人民教育出版社,1979.
[19] 方開泰, 許建倫. 統(tǒng)計(jì)分布[M]. 北京: 科學(xué)出版社, 1987.
[20] 殷祚云, 廖文波. 南亞熱帶森林群落種-多度的對數(shù)正態(tài)分布模型研究[J]. 廣西植物, 1999, 19(3): 221-224.
[21] 殷祚云. Logistic曲線擬合方法研究[J]. 數(shù)理統(tǒng)計(jì)與管理, 2002, 21(1): 41-46.
[22] AKAIKE H. Information theory and an extension of maximum likelihood principle [C] // PETROV B N, CSAKI F. Proceedings of the Second International Symposium of Information Theory. Budapest: Akademiai Kiado, 1973, pp 267-281.
[23] WANG W, FAMOYE F. Modeling household fertility decisions with generalized Poisson regression [J]. Journal of Population Economics, 1997, 10:273-283.
[24] GURMU S,TRIVEDI P K. Excess zeros in count models for recreation trips [J]. Journal of Business and Economic Statistics, 1996, 14: 469-477.
[25] MELKERSSON M,ROOTH D O. Modeling female fertility using inflated count data models [J]. Journal of Population Economics, 2000, 13:189-203.
[26] QUINN G P, KEOUGH M J. Experimental Design and Data Analysis for Biologists [J]. Cambridge:Cambridge University Press, 2002.
[27] 殷祚云, 任海, 曾令海, 等. 三參數(shù)增長模型擬合: 以季風(fēng)常綠闊葉林中兩個(gè)優(yōu)勢喬木種群為例[J]. 生物數(shù)學(xué)學(xué)報(bào), 2006, 21(3): 428-434.
[28] GLOVER T J, MITCHELL K J. An Introduction to Biostatistics [M]. New York: McGraw-Hill, 2001.
[29] DETSIS V, DIAMANTOPOULOS J, KOSMAS C. Collembolan as-semblages in Lesvos Greece:effects of differences in vegetation and precipitation [J]. Acta Oecologica, 2000, 21(2):149-159.
[30] 馬育華. 田間試驗(yàn)和統(tǒng)計(jì)方法[M]. 北京: 農(nóng)業(yè)出版社, 1979.
[31] 宇傳華, 顏杰. Excel與數(shù)據(jù)分析[M]. 北京: 電子工業(yè)出版社, 2002.
[32] 郝紅偉, 施光凱. Origin 6.0實(shí)例教程[M]. 北京: 中國電力出版社, 2000.
[33] 盧紋岱, 朱一力, 沙捷, 等. SPSS for Windows從入門到精通[M]. 北京: 電子工業(yè)出版社, 1997.
[34] 楊鈺, 何旭洪, 趙昊彤. Mathematica應(yīng)用指南[M]. 北京: 人民郵電出版社, 1999.
[35] 杜榮騫. 生物統(tǒng)計(jì)學(xué)[M]. 北京: 高等教育出版社, 1985.