摘 要:以蘋果幼木為例,描述其樹干周長隨時(shí)間變化的Logistic 模型,并運(yùn)用傳統(tǒng)的非線性最小二乘法進(jìn)行參數(shù)估計(jì),在此基礎(chǔ)上,構(gòu)建非線性混合效應(yīng)模型,并利用R軟件進(jìn)行分析及參數(shù)估計(jì)。然后,對兩種擬合效果進(jìn)行對比,結(jié)果表明,運(yùn)用非線性混合效應(yīng)模型得到的參數(shù)值精度要高,最終的預(yù)測值和實(shí)測值也具有良好的一致性,說明非線性混合效應(yīng)模型可以更加有效的處理生長數(shù)據(jù),其建模思想及程序?qū)τ啄旧L規(guī)律的研究具有一定指導(dǎo)意義。
關(guān)鍵詞:蘋果幼木 Logistic 模型 非線性最小二乘法 非線性混合效應(yīng)模型
中圖分類號:S661 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-3973(2013)010-114-02
蘋果樹是目前栽培最廣的果樹之一,在中國也有2000多年的歷史。而其果實(shí)營養(yǎng)豐富,色、香、味俱全,在抗氧化、抗衰老、抗癌、防治心血管疾病方面也有很好的保健作用,深受廣大人民喜愛。蘋果幼木的生長數(shù)據(jù)為分類測量數(shù)據(jù),為了研究蘋果幼木的生長規(guī)律,本文利用其樹干周長的生長數(shù)據(jù),構(gòu)造了Logistic 模型,并運(yùn)用非線性最小二乘法求解,在此基礎(chǔ)上,建立了非線性混合效應(yīng)模型,利用R統(tǒng)計(jì)軟件中的nlme 程序包進(jìn)行求解,其建模思想及程序?qū)τ谟啄镜纳L數(shù)據(jù)研究開拓了新思路。
1 非線性混合效應(yīng)模型
1.1 模型基本結(jié)構(gòu)
。
2 實(shí)例分析
為了研究蘋果幼木的生長規(guī)律,隨機(jī)選取了6棵蘋果幼木,分別在6個(gè)時(shí)間點(diǎn)測量了其樹干周長,得到數(shù)據(jù)如表1。
我們分別運(yùn)用非線性回歸模型和非線性混合效應(yīng)模型來分析其生長規(guī)律。
首先,對于同一棵樹,在不同時(shí)間點(diǎn)通過測量得到的樹干周長,我們用直線連接,得到如圖1圖像,容易看到幼木的整體生長趨勢是一致的,但是不同的幼木之間卻存在著較大差異。
其中:為樹干的漸進(jìn)周長,為達(dá)到樹干的漸進(jìn)周長一半時(shí)所需時(shí)間,為生長幅度,其中:和是非線性的, ij相互獨(dú)立且均服從正態(tài)分布 ij~N(0, 2)。
在R統(tǒng)計(jì)軟件中,可以通過加載nlme程序包,運(yùn)用非線性nls方程來求解參數(shù)。由于需要設(shè)定初始值,在圖1中可以看出,樹干的平均漸進(jìn)周長是180,達(dá)到樹干的漸進(jìn)周長一半時(shí)所需平均時(shí)間為700,而從圖形中看出,大概要1150天幼木才達(dá)到漸進(jìn)周長的,故的初始值為450,將數(shù)據(jù)代入,從中可以得到各個(gè)參數(shù)的值=192.44,=759.18,=377.19,三個(gè)參數(shù)的標(biāo)準(zhǔn)差分別是17.65,106.16,74.62。不難發(fā)現(xiàn),參數(shù)的估計(jì)值和我們最初設(shè)定的初始值是非常接近的,但是標(biāo)準(zhǔn)差偏大。從圖2可以看出,殘差的變化區(qū)間很大,位于-30到40之間,且殘差受不同樹的影響非常大。
一個(gè)比較簡單的方法可以解釋樹的效應(yīng),即對每棵樹進(jìn)行nls函數(shù)擬合,產(chǎn)生不同的參數(shù),也就是 nlslist 模型。這種方法將會導(dǎo)致參數(shù)的過量化,而使用非線性混合效應(yīng)模型將在簡單的nls模型和過量參數(shù)的nlslist 模型之間達(dá)到一個(gè)平衡,它包含了適當(dāng)?shù)膮?shù),同時(shí)運(yùn)用隨機(jī)效應(yīng)來解釋不同樹生長的差異。
2.2 運(yùn)用非線性混合效應(yīng)模型求解參數(shù)
其中:,和和模型(3)的含義相同, 為固定效應(yīng),bi為隨機(jī)效應(yīng), ij相互獨(dú)立且均服從正態(tài)分布 ij~N(0, 2)。在這里,每個(gè)參數(shù),和都看做是具有隨機(jī)效應(yīng)的。
R中的nlme程序包中自帶有求解函數(shù),將數(shù)據(jù)代入,運(yùn)用nlme函數(shù)即可得到各個(gè)參數(shù)的值=190.75,=749.75,=368.85,和運(yùn)用最小二乘法算法得到的結(jié)果稍有一點(diǎn)差異。各個(gè)參數(shù)的標(biāo)準(zhǔn)差分別是14.32,25.40,28.14。
誤差標(biāo)準(zhǔn)差和殘差值則大大降低,說明運(yùn)用非線性混合效應(yīng)模型可以大大的降低誤差。是隨機(jī)效應(yīng),可以解釋不同樹生長水平的差異。
與圖2相比,運(yùn)用非線性混合效應(yīng)模型得到的殘差大大降低,基本上位于-5到5之間,圖3顯示出殘差大致分布在0附近,且非常穩(wěn)定。顯然,組內(nèi)誤差是存在的。
圖4顯示了實(shí)際測量值和運(yùn)用nlme模型得到的預(yù)測值,可以看到,兩者的差異很小,具有較強(qiáng)的一致性,說明建立的非線性混合效應(yīng)模型能夠很好的處理幼木生長數(shù)據(jù),反應(yīng)個(gè)體間差異。
3 結(jié)論
本文運(yùn)用蘋果幼木的生長數(shù)據(jù),結(jié)合其生長規(guī)律,建立了Logistic模型,再分別使用非線性最小二乘法和非線性混合效應(yīng)模型來估計(jì)其中參數(shù)。結(jié)果表明,考慮個(gè)體效應(yīng)的非線性混合效應(yīng)模型,既能夠確定幼木生長的平均水平,也可以反應(yīng)生長水平受不同幼木影響,最后得到的參數(shù)值要精確,誤差也大大降低。同時(shí),考慮到樣本量偏少,難以充分的分析固定效應(yīng)和隨機(jī)效應(yīng)對群體參數(shù)的影響,這也是本文的不足之處。
R是免費(fèi)統(tǒng)計(jì)軟件,運(yùn)用其進(jìn)行生長數(shù)據(jù)的處理,求解非線性混合效應(yīng)模型中的參數(shù),可以得到很好的結(jié)果。本研究為分類測量數(shù)據(jù),包括果樹生長數(shù)據(jù)的分析提供了廣闊的應(yīng)用前景。
參考文獻(xiàn):
[1] 劉鐵錚,付雅麗,秦立者,等.紅富士蘋果果實(shí)中VC含量的研究[J].煙臺果樹,2005(4):6-7.
[2] 王皎,李赫宇,劉岱琳,等.蘋果的營養(yǎng)成分及保健功效研究進(jìn)展[J].食品研究與開發(fā),2011,32(1):164-168.
[3] J.C.Pinheiro,Douglas.M.Bates.Mixed-Effects Models in Sand S-PLUS[M].Springer,New York,2000:511-528.
[4] 沈曦.重復(fù)測量數(shù)據(jù)非線性混合效應(yīng)模型的統(tǒng)計(jì)診斷[D].東南大學(xué),1999.
[5] 趙晉芳,羅天娥,劉桂芬.分類重復(fù)測量數(shù)據(jù)的非線性混合效應(yīng)模型[J].現(xiàn)代預(yù)防醫(yī)學(xué),2007(20):3866-3868.