孫文凱,胡曉華,蔣文江
(海南師范大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,海南 ???571158)
多個(gè)關(guān)聯(lián)確定性時(shí)間序列微分方程建模方法研究
孫文凱,胡曉華*,蔣文江
(海南師范大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,海南 ???571158)
從純數(shù)學(xué)的角度,對(duì)多個(gè)關(guān)聯(lián)確定性時(shí)間序列分別進(jìn)行多次累加產(chǎn)生新序列,研究序列之間的關(guān)系,建立多元線性(或非線性)回歸方程.給定顯著性水平α,對(duì)每個(gè)回歸方程進(jìn)行顯著性檢驗(yàn).在置信度1-α下建立微分方程組模型,從而揭示這些時(shí)間序列之間的關(guān)系,實(shí)現(xiàn)對(duì)原序列的預(yù)測(cè)和控制.最后用1995-2014年海南省GDP和接待旅游人數(shù)建立微分方程組模型并進(jìn)行預(yù)測(cè).
多個(gè)時(shí)間序列;累加;微分方程;預(yù)測(cè)
對(duì)于彼此間互相影響的多個(gè)時(shí)間序列,如何揭示它們間的動(dòng)態(tài)關(guān)系是要研究的主要內(nèi)容.設(shè)X1(t),X2(t),…,Xk(t)(t=0,1,2,…,T)為k個(gè)非隨機(jī)的原始時(shí)間序列.如果給定的是單位時(shí)間數(shù)據(jù)如日(月、年)產(chǎn)量等,則可把它進(jìn)行多次累加,產(chǎn)生多個(gè)新序列;如果給定的是累積單位時(shí)間數(shù)據(jù),如到某日(月、年)的累積產(chǎn)量等,則可把它進(jìn)行多次累減,產(chǎn)生多個(gè)新序列.無(wú)論哪種情況,都可從純數(shù)學(xué)的角度對(duì)每個(gè)原始時(shí)間序列Xi(t)進(jìn)行一次、兩次甚至多次累加(減),直至最后一次累加(減)產(chǎn)生的新序列出現(xiàn)明顯的趨勢(shì)為止.實(shí)際應(yīng)用中一般二、三次累加(減)即可.
接下來(lái)尋找Xi(t)與其他序列和多次累加(減)后產(chǎn)生的新序列之間的關(guān)系.對(duì)每個(gè)Xi(t)建立單個(gè)多元線性(非線性)回歸模型,給定顯著性水平α,在置信度1-α下對(duì)單個(gè)方程進(jìn)行顯著性檢驗(yàn),若檢驗(yàn)通過(guò)則利用微分、差分關(guān)系建立相應(yīng)的單個(gè)微分方程.最后把單個(gè)微分方程合成微分方程組.該微分方程組可以是非線性的(當(dāng)然也可以是線性的),可以是高階的(也包括一階),并能刻畫k個(gè)原始時(shí)間序列X1(t),X2(t),…,Xk(t)彼此間互相影響的動(dòng)態(tài)關(guān)系.這樣就部分彌補(bǔ)了灰色預(yù)測(cè)法[1]不能建立非線性模型的不足.每個(gè)微分方程可決系數(shù)R2的大小能刻畫單個(gè)微分方程擬合程度的合理性.其中最小的R2能刻畫微分方程組擬合程度的好壞.許多著名的微分方程模型,如電子工程中的Van der pol方程[2],生物種群中的Volterra模型[3],氣象方面的Lorenz模型[4]等均可納入這種建模思想的框架下,成為這種建模方法的特例.
處處可導(dǎo)是光滑連續(xù)函數(shù)的特性,而離散時(shí)間序列是由離散的單點(diǎn)構(gòu)成,通常意義下無(wú)導(dǎo)數(shù)可言,因此原則上不能用導(dǎo)數(shù)研究這類時(shí)間序列的性質(zhì).但是可以把離散時(shí)間序列視為連續(xù)情況下的離散化,這樣就能從純數(shù)學(xué)的角度出發(fā),以微積分和差分為基礎(chǔ)研究離散時(shí)間序列,并建立相應(yīng)的微分方程組模型[5].
設(shè)x(t),0≤t<∞是一個(gè)連續(xù)函數(shù),定義
特別的,取Δt=1,(假設(shè)x(t)在Δt=1的范圍內(nèi)函數(shù)值變化不是很大),則有
在這里將研究范圍拓展到多個(gè)時(shí)間序列,這就要用到多元時(shí)間序列分析[6].考慮一個(gè)非隨機(jī)的k元時(shí)間序列
其中εkt是隨機(jī)誤差項(xiàng).在尋找關(guān)系式時(shí),可以考慮建立多元線性或非線性回歸,或其他時(shí)間序列模型.
接下來(lái)把X(0)(t),X(1)(t)看作連續(xù)函數(shù)的離散化,其所在的連續(xù)函數(shù)不妨仍記為X(0)(t),X(1)(t),則
這種情況要求單位時(shí)間(Δt=1)上所研究的時(shí)間序列的數(shù)值變化不是很大,也就是說(shuō)數(shù)據(jù)變化不能隨機(jī).給定一個(gè)顯著性水平α(一般取α=0.05或α=0.01),對(duì)關(guān)系式①,②,…,?進(jìn)行顯著性檢驗(yàn),一般包括方程(即上訴關(guān)系式)的顯著性檢驗(yàn)(F檢驗(yàn))和回歸系數(shù)的顯著性檢驗(yàn)(T檢驗(yàn)).另外,回歸系數(shù)的求解采用最小二乘法.若關(guān)系式①,②,…,?能通過(guò)顯著性檢驗(yàn),忽略εit,(i=1,2,…,k)則在置信度1-α下便可建立相應(yīng)的一階k元微分方程組模型
只要找到X(0)(t),X(1)(t),…,X(n)(t)的關(guān)系式
在一定置信水平上忽略εt便可建立一個(gè)k元n階微分方程組模型
從中解出X(n)(t),進(jìn)而求出X(0)(t)在應(yīng)用中一般二、三次累加就可以得到理想結(jié)果.
通常情況下,一個(gè)時(shí)間序列Xt既有確定性趨勢(shì)也有隨機(jī)性趨勢(shì).可以表示為Xt=μ+εt,模型(1)和(2)刻畫了時(shí)間序列的確定性部分,稱為主題模型.對(duì)于隨機(jī)誤差εt,要求E(εt)=0,即εt是白噪聲序列.若否,說(shuō)明εt還有可提取的信息,可再對(duì)εt進(jìn)行建模最終使其為白噪聲.這類模型稱為輔助模型.由主題模型和輔助模型便可以對(duì)原始序列進(jìn)行很好的預(yù)測(cè).
前面說(shuō)過(guò)許多著名的微分方程組模型都是這種建模方法的特例,并且灰色系統(tǒng)理論中的模型幾乎都可以用上面的方法去構(gòu)造,為了與實(shí)際問(wèn)題相符,這里假設(shè)時(shí)間序列
非負(fù).假設(shè)找到的方程①的具體形式如下
其中ai,bi(i=1,2,…,k-1)為待估參數(shù).在顯著性檢驗(yàn)通過(guò)的情況下便可建立相應(yīng)的k元一階微分方程模型
該模型即是灰色預(yù)測(cè)法中灰色Verhulst模型[7]的白化方程(影子方程).
為了更容易尋找F的具體形式,構(gòu)造一個(gè)新序列I(t)=(i1(t),i2(t),…,ik(t)),分別研究I(t)與X(i)(t)之間的關(guān)系,構(gòu)造得到宗旨是盡量使I(t)與X(i)(t)為線性關(guān)系.
首先考慮一個(gè)一維的情況.構(gòu)造I(t)=(X(2)(t))2·X(1)(t),若關(guān)系式的具體形式如下
若在一定顯著性水平下檢驗(yàn)通過(guò),則可建立如下模型
這其實(shí)是Van der pol方程,在電子工程中有十分重要的應(yīng)用.
接下來(lái)考慮一個(gè)二維的情況.令
且與x(i)(t)關(guān)系如下
若在一定顯著性水平下檢驗(yàn)通過(guò),則可建立相應(yīng)的微分方程組模型
這便是生物種群中Lotka-Voltera種間競(jìng)爭(zhēng)模型,是Logistic阻滯增長(zhǎng)模型[8]的延伸.N1,N2代表兩物種的種群數(shù)量;K1,K2為兩物種的最大環(huán)境容納量;a0,b0為兩物種的增長(zhǎng)率;α代表物種2對(duì)物種1的競(jìng)爭(zhēng)系數(shù);β代表物種1對(duì)物種2的競(jìng)爭(zhēng)系數(shù).
這種建模方法的優(yōu)勢(shì)在于避免了對(duì)最大環(huán)境容納量K1,K2的假設(shè),可以根據(jù)回歸出的參數(shù)a0,a1,b0,b1巧妙得出其估計(jì)值.當(dāng)然該模型還可用于集群企業(yè)競(jìng)爭(zhēng),或其他的市場(chǎng)競(jìng)爭(zhēng).
又如構(gòu)造新序列
且在一定顯著性水平下檢驗(yàn)通過(guò),則可建立如下模型
當(dāng)a2=1,a1<0,b2=1,c2=c3=-1,c1<0時(shí),模型(6)便是Lorenz方程組.Lorenz方程組是描述混沌現(xiàn)象的第一例有名的方程,常用于氣象、通信、電路等方面.
表1是1995-2014年海南省的GDP和接待過(guò)夜旅游人數(shù)的數(shù)據(jù)表(數(shù)據(jù)來(lái)源于《海南統(tǒng)計(jì)年鑒》[9]).(單位:GDP;億元;旅游人數(shù):萬(wàn)人).
表1 GDP和接待旅游人數(shù)Tab.1 GDP and the number of tourist reception
為了輸入方便,在Eviews軟件[10]中用x1,x2,y1,y2分別來(lái)代表,該表示方法以后也通用,到時(shí)不再逐一說(shuō)明.由圖1,2可知,都有隨時(shí)間增長(zhǎng)的趨勢(shì),而一次累加之后的增長(zhǎng)的趨勢(shì)更加明顯了.
接下來(lái)就要找這些序列之間的關(guān)系,用軟件經(jīng)過(guò)多次比較分析,找出了與之間的關(guān)系
圖1 累加之前時(shí)序圖Fig.1 Sequence chart before accumulation
圖2 累加之后時(shí)序圖Fig.2 Sequence chart after accumulation
方程(7)和(8)在α=0.05的顯著性水平下檢驗(yàn)通過(guò),可決系數(shù)R2均為0.99,但DW統(tǒng)計(jì)量分別為0.9889和0.9083,可見(jiàn)方程殘差存在自相關(guān)性,在主體模型之外還應(yīng)建立一個(gè)輔助模型(在以后的篇幅中討論).
現(xiàn)在聯(lián)立方程(7)和(8)并將系數(shù)帶入,可得微分方程組如下
由前文討論結(jié)果,可以用微分近似代替差分,即有
將(10)式帶入方程組(9)得
表2 方程組(10)的數(shù)值解Tab.2 Numerical solution of equations(10)
具體預(yù)測(cè)值可由表2逐一計(jì)算出,不再贅述.特別的,
這便求出了2013,2014年GDP和接待旅游人數(shù)的預(yù)測(cè)值.
前面說(shuō)過(guò)還要對(duì)方程(7)(8)建立殘差輔助模型,設(shè)其殘差序列分別為r1(t),r2(t).經(jīng)過(guò)對(duì)自相關(guān)系數(shù),偏自相關(guān)系數(shù),Q統(tǒng)計(jì)量等的分析得以下結(jié)論.
圖3 GDP序列及預(yù)測(cè)序列圖Fig.3 GDP sequence and the forecast sequence
圖4 旅游人數(shù)序列及序列預(yù)測(cè)圖Fig.4 Tourists sequence and the forecast sequence
殘差序列r1(t)的自相關(guān)系數(shù)始終在零周圍波動(dòng),判定該序列為平穩(wěn)時(shí)間序列;對(duì)于Q統(tǒng)計(jì)量的p值,該統(tǒng)計(jì)量的原假設(shè)為r1(t)滯后1期,2期,,…,k期的自相關(guān)系數(shù)均等于0,備擇假設(shè)為自相關(guān)系數(shù)中至少有一個(gè)不等于0,經(jīng)分析知p值都大于0.5%的顯著性水平,所以接受原假設(shè),即序列自相關(guān)系數(shù)接近于零,序列是純隨機(jī)序列,即白噪聲序列.所以不再對(duì)r1(t)建立模型.
殘差序列r2(t)的自相關(guān)系數(shù)可看做明顯落入隨機(jī)區(qū)間,自相關(guān)系數(shù)表現(xiàn)為截尾性;而偏自相關(guān)系數(shù)分析中發(fā)現(xiàn),滯后一期的偏自相關(guān)系數(shù)明顯不為零,而k>1以后的值都在置信區(qū)間內(nèi),可以認(rèn)為序列的偏自相關(guān)系數(shù)具有截尾性.因此,對(duì)序列r2(t)可建立ARMA(1,1)模型.模型的具體回歸過(guò)程見(jiàn)圖5.
經(jīng)分析,可以建立模型如下
其中et是一個(gè)白噪聲,r2(t-1)表示rt的滯后一期,此時(shí),新殘差εt的DW統(tǒng)計(jì)量為1.963973,接近2表示其不存在自相關(guān)性,即εt是一個(gè)白噪聲.擬合與殘差圖見(jiàn)圖6.
通過(guò)MATLAB求得數(shù)值解,特別的,
圖5 ARMA模型回歸圖Fig.5 Regression process of ARMA model
圖6 模型擬合與殘差圖Fig.6 Fitting and residual figure of model
故2013,2014年接待旅游人數(shù)預(yù)測(cè)的最終數(shù)據(jù)分別為3679.91+2.954433=3682.86和4026.57+12.7499= 4039.32.同時(shí)真實(shí)值為3672.51和4046.18(單位:萬(wàn)人),在接待旅游人數(shù)的預(yù)測(cè)方面,2013,2014年的預(yù)測(cè)值的相對(duì)誤差分別為10.35和-20.86;絕對(duì)誤差分別為0.28%和0.51%.
在GDP的預(yù)測(cè)方面,2013,2014年的預(yù)測(cè)值分別為3329.22和3668.86,同時(shí)真實(shí)值為3146.46和3500.72(單位:億元),其相對(duì)誤差分別為182.76和168.14;絕對(duì)誤差分別為2.97%和4.8%.
如此就完成了對(duì)GDP和旅游人數(shù)這兩個(gè)時(shí)間序列的建模和預(yù)測(cè),同時(shí)發(fā)現(xiàn)對(duì)于確定趨勢(shì)的時(shí)間序列而言,輔助模型對(duì)預(yù)測(cè)值的影響不大,且主體模型短期預(yù)測(cè)精度較高.
本文從灰色系統(tǒng)理論累加、累減的基本思想出發(fā),從純數(shù)學(xué)的角度,利用微分、差分等工具進(jìn)一步研究了具有確定趨勢(shì)的多維時(shí)間序列的建模方法,并用假設(shè)檢驗(yàn)的方法說(shuō)明所建微分方程組模型的合理程度,用可決系數(shù)R2刻畫擬合程度.這種建模方法適用于數(shù)據(jù)較少,樣本較小的情況下使用,其短期預(yù)測(cè)精度較高.這種新手段為我們提供了想象空間,拓寬了建模思路.
[1]劉思峰,黨耀國(guó).灰色系統(tǒng)理論及其應(yīng)用[M].5版.北京:科學(xué)出版社,2004.
[2]王樹(shù)禾.微分方程模型與混沌[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,1999.
[3]歐伯群,秦發(fā)金.具擴(kuò)散的捕食與被捕食Lotka-Volterra模型研究[J].西北師范大學(xué)學(xué)報(bào),2001,37(2):28-33.
[4]王光義,鄭艷,劉敬彪.一個(gè)超混沌Lorenz吸引子及其電路實(shí)現(xiàn)[J].物理學(xué)報(bào),2007,56(6):3113-3120.
[5]胡曉華,吉承儒,虞敏.灰色預(yù)測(cè)法的進(jìn)一步推廣及應(yīng)用[J].大學(xué)數(shù)學(xué),2013,29(1):117-121.
[6]Jonathan D Cryer.Time Series Analysis with Applications in R[M].BeiJing:China Machine Press,2011.
[7]崔立志,劉思峰,李致平.灰色離散Verhulst模型[J].系統(tǒng)工程與電子技術(shù),2011,33(3):590-593.
[8]胡寶安,陳博文,夏愛(ài)生,等.Logistic增長(zhǎng)時(shí)滯SIS模型分析[J].工程數(shù)學(xué)學(xué)報(bào),2007,24(2):373-376.
[9]海南統(tǒng)計(jì)局.海南統(tǒng)計(jì)年鑒(2000-2014)[EB/OL].[2015-01-20].http://www.tongjinianjian.com/62736.html.,2014-9-30/2015-01-20
[10]易丹輝.數(shù)據(jù)分析與Eviews應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,2008.
[11]劉則毅.科學(xué)計(jì)算技術(shù)與Matlab[M].北京:科學(xué)出版社, 2001.
責(zé)任編輯:畢和平
The Research of Differential Equations Modeling Methods of Correlative Deterministic Multivariate Time Series
SUN Wenkai,HU Xiaohua*,JIANG Wenjiang
(Faculty of Mathematics and Statistics,Hainan Normal University,Haikou571158,China)
From the perspective of pure mathematics,Deterministic multivariate time series were multiply accumulated to produce some new sequences,studying relationship among them and establishing the multiple linear or nonlinear regression model.If a significance level α was given,the significance test for every regression equation was carried out.At confidence level 1-α,the differential equations models were established to reveal the relationship among all the time series,and fore?cast or control them.Finally,using the data for the value of GDP and the number of tourist reception in Hainan province from 1995 to 2014,differential equations model is established to forecast.
multidimensional time series;accumulate;differential equation;forecast
O 29
:A
:1674-4942(2015)01-0009-06
2014-12-10
國(guó)家自然科學(xué)基金資助項(xiàng)目(11361022)
*通訊作者