程毛林
(蘇州科技大學(xué) 數(shù)理學(xué)院,江蘇 蘇州 215009)
基于偏最小二乘法的組合S型增長(zhǎng)曲線預(yù)測(cè)模型與應(yīng)用
程毛林
(蘇州科技大學(xué) 數(shù)理學(xué)院,江蘇 蘇州 215009)
在許多時(shí)間序列預(yù)測(cè)中,常用S型曲線描述增長(zhǎng)過(guò)程。由于S型曲線形式多樣,結(jié)構(gòu)不同,對(duì)同樣觀測(cè)值預(yù)測(cè),結(jié)果略有差別。為了增加預(yù)測(cè)精度,提高預(yù)測(cè)的可靠性,考慮不同增長(zhǎng)曲線預(yù)測(cè)結(jié)果存在多重共線性,該文利用偏最小二乘法,建立組合S型增長(zhǎng)曲線,實(shí)例表明組合S型增長(zhǎng)曲線預(yù)測(cè)結(jié)果精度高。
增長(zhǎng)曲線;非線性最小二乘估計(jì);偏最小二乘法;預(yù)測(cè)精度;組合
在時(shí)間序列里,有些變量的增長(zhǎng)量最初比較小,隨時(shí)間的增加逐漸增長(zhǎng)而達(dá)到一個(gè)快速增長(zhǎng)時(shí)期,爾后增長(zhǎng)速度趨緩,最終達(dá)到穩(wěn)定的總增長(zhǎng)量,這一過(guò)程若用曲線來(lái)表示,則是一種拉長(zhǎng)的S型曲線。這種S型曲線因變量增長(zhǎng)特性的不同而呈現(xiàn)出多樣性變化。常用Richards、General Logistic、Von Bertalanffy、Morgan-Mercer-Flodin等生長(zhǎng)模型來(lái)描述這種增長(zhǎng)過(guò)程[1-7]。隨著計(jì)算機(jī)仿真技術(shù)的應(yīng)用,對(duì)增長(zhǎng)模型的研究更加深入。對(duì)同樣的數(shù)據(jù),建立S型增長(zhǎng)曲線的預(yù)測(cè)結(jié)果會(huì)略有差異,為了減小這種差異,筆者基于偏最小二乘法[8-12],給出組合S型增長(zhǎng)曲線預(yù)測(cè)模型。
1.1 General Logistic模型
General Logistic模型形式為
或
式中,xt為t時(shí)刻某變量的觀測(cè)值;s、α、λ、γ為待估參數(shù)。s為飽和水平,α為增長(zhǎng)速度因子,λ為形狀因子,γ為積分常數(shù),ε為隨機(jī)誤差。當(dāng)λ=1,λ=-1,λ→0時(shí),可得到邏輯曲線、修正指數(shù)曲線、龔伯茲曲線。
與General Logistic模型結(jié)構(gòu)相同的是Richards模型(可相互推導(dǎo))。這一模型形式為
或
式中,參數(shù)α為飽和水平、β為初始值參數(shù)、r為增長(zhǎng)速率參數(shù)、δ為曲線形狀參數(shù),ε為隨機(jī)誤差。當(dāng)δ=-1時(shí)為Mitscherlich模型,當(dāng)δ→+∞時(shí)為Gompertz模型,當(dāng)δ=1時(shí)為L(zhǎng)ogistic模型。因此,Richards模型對(duì)S型增長(zhǎng)時(shí)間序列有很強(qiáng)的適應(yīng)性。
1.2 Von Bertalanffy模型
Von Bertalanffy模型具體形式為
或
式中,α、θ、k、m為待估參數(shù)。ε為隨機(jī)誤差,α為飽和水平,k為增長(zhǎng)速度因子,m為形狀因子,θ為積分常數(shù)。
當(dāng)m=0時(shí)為修正指數(shù)曲線,m=2時(shí)為邏輯曲線,m→1時(shí)趨向于龔伯茲曲線。
1.3 Morgan-Mercer-Flodin模型
Morgan-Mercer-Flodin模型形式為
或
上式,待估參數(shù)為η=(β,r,α,δ)。顯然,當(dāng)δ<0,t→+∞時(shí),y→β;當(dāng)δ>0,t→+∞時(shí),y→α。
1.4 三角函數(shù)增長(zhǎng)曲線模型
主要有正弦函數(shù)增長(zhǎng)曲線模型和余弦函數(shù)增長(zhǎng)曲線模型。正弦函數(shù)增長(zhǎng)曲線模型形式為
其中,L、α、β、γ為待估參數(shù)。L為飽和水平,α為增長(zhǎng)速度因子,β為形狀因子,γ為積分常數(shù)。顯然t→+∞時(shí),y→L。
余弦函數(shù)增長(zhǎng)曲線模型形式為
其中,L、α、β、γ為待估參數(shù)。L為飽和水平,α為積分常數(shù),β為增長(zhǎng)速度因子,γ為形狀因子。顯然t→+∞時(shí),y→L。
1.5 Weibull模型
Weibull模型形式為
上式,待估參數(shù)為η=(L,α,β,γ)。L為飽和水平,α為增長(zhǎng)速度因子,β為形狀因子,γ為積分常數(shù)。顯然t→+∞時(shí),y→L。
2.1 S型增長(zhǎng)曲線模型的參數(shù)估計(jì)
對(duì)線性模型的參數(shù)估計(jì)可直接使用最小二乘法,不需要確定參數(shù)初始值。但上面的5個(gè)S型增長(zhǎng)曲線是本質(zhì)上的非線性曲線。每個(gè)模型都含有4個(gè)參數(shù),參數(shù)估計(jì)比較復(fù)雜,記某個(gè)S型增長(zhǎng)曲線為
其中,f是自變量t以及個(gè)參數(shù)β1、β2、β3、β4的非線性函數(shù)。估計(jì)參數(shù)β1、β2、β3、β4的標(biāo)準(zhǔn)與線性回歸一樣,即誤差平方和最小化。如果具有x以及t的N個(gè)觀測(cè),就讓
有最小值,即為非線性最小二乘估計(jì)[13-15]。一般利用軟件,如MATLB軟件求解。初始值的確定可用選點(diǎn)法,對(duì)含4個(gè)參數(shù)的非線性曲線,設(shè)選取的4個(gè)點(diǎn)為,代入得到一個(gè)非線性方程組
利用MATLB軟件可以求出初始值β1、β2、β3、β4[16]。
2.2 組合S型增長(zhǎng)曲線模型
假設(shè)文中選擇5個(gè)S型增長(zhǎng)曲線,分別為X1、X2、X3、X4、X5。顯然X1、X2、X3、X4、X5之間存在嚴(yán)重的多重共線性,筆者利用偏最小二乘回歸建立組合增長(zhǎng)曲線模型。將X1、X2、X3、X4、X5視為5個(gè)自變量,因變量為Y,進(jìn)行偏最小二乘回歸。該文這里給出一個(gè)簡(jiǎn)潔的計(jì)算方法:
設(shè)自變量X=(X1,X2,…,X5)和因變量Y標(biāo)準(zhǔn)化處理后的數(shù)據(jù)為E0、F0。
(1)求矩陣E0TF0F0TE0最大特征根所對(duì)應(yīng)的特征向量w1,求得成分得分向量,和殘差矩陣,其中
(2)求矩陣E1TF0F0TE1最大特征根所對(duì)應(yīng)的特征向量w2,求得成分得分向量,和殘差矩陣,其中
把tk=wk1*X1*+…+wk5*X5*(k=1,2,…,r)代入Y*=t1β1+…+trβr,即得偏最小二乘回歸方程為
用原始變量表示的組合增長(zhǎng)曲線模型為
根據(jù)中國(guó)互聯(lián)網(wǎng)信息中心提供的中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告,收集了自2008年6月至2015年每半年一次的網(wǎng)民人數(shù)數(shù)據(jù)(x),見(jiàn)表 1。分析可知數(shù)據(jù)呈S型增長(zhǎng)。
表1 中國(guó)網(wǎng)民人數(shù)及相關(guān)結(jié)果
先分別建立5個(gè)增長(zhǎng)曲線模型:
正弦函數(shù)增長(zhǎng)曲線模型為
將X1、X2、X3、X4、X5視為5個(gè)自變量,因變量為Y,作偏最小二乘回歸,得預(yù)測(cè)模型
從檢驗(yàn)量可以看出模型擬合精度很高。圖1給出了擬合圖,圖中星號(hào)為實(shí)際觀測(cè)點(diǎn),實(shí)線為擬合曲線。
圖1 模型擬合圖
[1]LIN Zhaogang,LI Fengri.The generalized Chapman-Richards function and applications to tree and stand growth[J].Journal of Forestry Research,2003,14(1):19-26.
[2]PAN Jianxin,F(xiàn)ANG Kaitai.Growth Curve Model and Statistical Diagnostics[M].New York:Springer-Verlag,2002.
[3]程毛林.Richards模型參數(shù)估計(jì)及其模型應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2010,40(12):139-143.
[4]程毛林.二個(gè)四參數(shù)增長(zhǎng)曲線模型參數(shù)初始值的確定方法與模型應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2009,39(9):109-114.
[5]程毛林.邏輯思諦曲線的幾個(gè)推廣模型與應(yīng)用[J].運(yùn)籌與管理,2003,12(3):85-88.
[6]劉舒燕,艾書超.基于增長(zhǎng)曲線模型的高速公路發(fā)展研究[J].武漢理工大學(xué)學(xué)報(bào)(交通科學(xué)與工程版),2004,28(3):365-368.
[7]劉磊.邏輯增長(zhǎng)曲線模型的一種參數(shù)估計(jì)方法[J].湖北工業(yè)大學(xué)學(xué)報(bào),2008,23(1):83-85.
[8]馬麗,呂成文,唐炎.基于偏最小二乘法的土壤有機(jī)碳高光譜預(yù)測(cè)研究[J].安徽師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,39(2):164-167.
[9]盧鵬,何杰,彭叢笑.基于偏最小二乘法的PM2.5相關(guān)因素分析研究[J].四川理工學(xué)院學(xué)報(bào)(自然科學(xué)版),2015,28(1):71-75.
[10]司守奎,孫璽清.數(shù)學(xué)建模算法與應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2012.
[11]陳章華,陳磊,紀(jì)洪廣.基于偏最小二乘法的地應(yīng)力場(chǎng)擬合[J].北京科技大學(xué)學(xué)報(bào),2013,35(1):1-7.
[12]鄭鳴,段梅,陳福生.我國(guó)金融發(fā)展與外資企業(yè)自主創(chuàng)新——基于偏最小二乘法的實(shí)證研究[J].軟科學(xué),2012,26(8):1-5.
[13]李??跹┓?基于符號(hào)運(yùn)算和信賴域方法的非線性最小二乘法[J].計(jì)算機(jī)應(yīng)用,2004,24(7):22-24.
[14]陳忠,黃惠.求解非線性最小二乘問(wèn)題的迭代法[J].武漢大學(xué)學(xué)報(bào)(理學(xué)版),2003,49(1):14-16.
[15]XIAO Ailing.Some algorithms of nonlinear least squares[J].Mathematical Theory and Applications,2004,24(2):86-90.
[16]薛西峰,邢志棟,孟紅云.求解非線性方程組的信賴域方法[J].西北大學(xué)學(xué)報(bào)(自然科學(xué)版),2001,31(4):289-291.
Prediction model and application of combined S-type growth curves based on partial least squares
CHENG Maolin
(School of Mathematics and Physics,SUST,Suzhou 215009,China)
In many time series prediction,researchers commonly use S-type curves to describe the growth process.Because of the diversity of S-type curves and the differences in their structures,the results are slightly different out of the same observation.In order to improve the prediction accuracy and reliability,the author,taking into consideration the prediction results of different growth curves with multicollinearity,established the combined S-type growth curves with partial least squares.The illustrations show that the prediction accuracy of the combined S-type growth curves is high.
growth curve;nonlinear least squares estimation;partial least squares;prediction accuracy;combination
責(zé)任編輯:謝金春
O212MR(2010)Subject Classification:62J02
A
:2096-3289(2017)02-0008-04
2016-11-06
國(guó)家自然科學(xué)基金資助項(xiàng)目(11401418)
程毛林(1965-),男,安徽安慶人,副教授,碩士生導(dǎo)師,研究方向:應(yīng)用統(tǒng)計(jì)。