董莉娜++李倩
【摘要】通過對我國1949年至2012年共49年的人口數(shù)據(jù)進行實證分析,分別運用確定性因素分解法和ARIMA模型兩種不同的時間序列分析方法,對我國人口的變化規(guī)律進行了擬合研究。
【關(guān)鍵詞】時間序列分析 確定性因素分解法建模 ARIMA模型
人口過多一直是我國最重要的問題之一,合理的人口規(guī)模是經(jīng)濟、社會、資源和環(huán)境協(xié)調(diào)發(fā)展的有力保證,因此了解我國人口規(guī)模發(fā)展的現(xiàn)狀和預測未來人口規(guī)模發(fā)展的趨勢,具有重要的理論和現(xiàn)實意義。早在十八世紀末,英國人馬爾薩斯在研究了百余年的人口統(tǒng)計數(shù)據(jù)資料后,利用微分方程建立了Logistic人口模型;國內(nèi)眾多學者也對人口預測方面的數(shù)學模型進行許多研究。本文通過對我國1949年至2012年共49年的人口數(shù)據(jù)進行實證分析,分別運用確定性因素分解法和ARIMA模型兩個不同的時間序列分析方法,對我國人口的變化規(guī)律進行了擬合研究。
時間序列是指同一現(xiàn)象的觀測值按不同時間排列的數(shù)字序列。在早期的時間序列分析中,通常是通過歷史數(shù)據(jù)的比較和圖形的觀察來揭示現(xiàn)象隨時間變化的規(guī)律,即所謂的描述性時序分析。傳統(tǒng)時間序列分析在實踐中的應用主要是確定性時間序列分析方法,包括指數(shù)平滑法、移動平均法、時間序列分解法等等。但在現(xiàn)實生活中,許多不確定性因素的影響越來越嚴重,已經(jīng)引起人們的重視。博克斯和詹金斯(1970)提出了一種基于隨機理論的時間序列分析方法,使時間序列分析理論達到了一個新的高度,大大提高了預測的精確度。對于平穩(wěn)時間序列來說,基本模型有:自回歸(AR)模型、移動平均(MA)模型以及自回歸移動平均(ARMA)模型等。對非平穩(wěn)時間序列,基本模型為:求和自回歸移動平均模型以及殘差自回歸模型等。近年來,隨著計算機技術(shù)和信號處理技術(shù)的迅速發(fā)展,時間序列分析的理論和方法越來越完善。
運用確定性因素分解法建立模型時,克萊默分解定理認為任何時間序列都可以分解為兩部分:一部分是由多項式?jīng)Q定的確定趨勢的一部分,另一部分是平穩(wěn)零均值誤差。由于1949年到1970年間的總?cè)丝跀?shù)據(jù)有部分缺失,所以只選擇1970年到2012年的人口數(shù)據(jù)進行分析。處理過程中以1970年為時間起點,即t=1。通過觀察發(fā)現(xiàn),總?cè)丝谛蛄袌D有明顯的線性趨勢,嘗試擬合一元線性直線。
建立ARIMA模型時,先將時間序列從Excel表中讀入R中,做總?cè)丝诘内厔輬D,觀察趨勢及平穩(wěn)性。時序圖清晰地顯示每年總?cè)丝诔尸F(xiàn)出明顯的逐年遞增的趨勢,顯然該序列一定不是平穩(wěn)序列。同時單位根檢驗的結(jié)果顯示,統(tǒng)計量的P值大于0.05,拒絕平穩(wěn)這一原假設(shè),所以可以認為我國總?cè)丝谛蛄酗@著非平穩(wěn)。顯然,這個序列的DF檢驗結(jié)果與根據(jù)時序圖得到的直觀判斷完全一致。先對總?cè)丝谛蛄羞M行一階差分,觀察發(fā)現(xiàn)一階差分序列仍然是不平穩(wěn)序列,再對總?cè)丝谛蛄羞M行二階差分,時序圖和單位根檢驗結(jié)果表明二階差分序列是平穩(wěn)序列。建立二階差分序列的ARMA模型.。ACF為四步截尾的,PACF收斂的速度能達到要求,嘗試擬合MA(4)模型。先對回歸系數(shù)進行估計和顯著性檢驗,根據(jù)輸出結(jié)果計算T統(tǒng)計量值(由參數(shù)除以標準差而得),MA(1)參數(shù)的T統(tǒng)計量值:-0.4502/0.1396=-3.22492837,MA(2)參數(shù)的T統(tǒng)計量值:-0.2038/0.1571=-1.29726289,MA(3)參數(shù)的T值:0.0946/0.1470 =0.64353741,MA(4)參數(shù)的T值0.4406/0.1460=-3.01780822,顯然MA(1)和MA(4)參數(shù)均在5%的顯著水平下拒絕零假設(shè)。根據(jù)檢驗結(jié)果去掉不顯著的變量,建立疏系數(shù)模型,MA(1)和MA(4)參數(shù)均在5%的顯著水平下拒絕零假設(shè)。為了檢驗模型是否用于結(jié)果的預測,對模型進行進一步的適應性檢驗。檢驗結(jié)果表明:LB統(tǒng)計量的P—值多數(shù)大于0.05(或其ACF均落在區(qū)間內(nèi)),說明殘差序列無自相關(guān),模型為適應的。利用觀察值數(shù)據(jù)和前面得到的擬合數(shù)據(jù),進行預測。
模型一中,擬合模型Xt=85342.930+1273.835t+εt
模型二中,綜合前面的差分運算,實際上是對原序列擬合疏系數(shù)模型ARIMA(0,2,(1,4))。
參考文獻
[1]王燕.應用時間序列分析[M].中國人民大學出版社,2005
[2][英]C.查特菲爾德著,駱振華譯.時間序列分析引論(第二版).廈門:廈門大學出版社,1987
[3][美]Jonathan D.Cryer,Kung-Sik Chan著,潘紅宇等譯.時間序列分析及應用(原書第二版).機械工業(yè)出版社,2011.1
作者簡介:董莉娜(1993-),女,山西運城人;李倩(1993-),女,山西長治人,山西財經(jīng)大學應用統(tǒng)計專業(yè)碩士研究生,研究方向:市場調(diào)查與分析。