凌 云
(成都文理學(xué)院 四川·成都 610401)
時間序列分析是統(tǒng)計學(xué)專業(yè)學(xué)生必修課程之一,在諸多領(lǐng)域都有著廣泛的應(yīng)用。自回歸模型是時間序列分析的經(jīng)典模型之一,強調(diào)其在實際中的應(yīng)用,并將應(yīng)用案例引入到日常教學(xué)中,將比較枯燥的數(shù)學(xué)模型與實踐緊密結(jié)合,不但能加強學(xué)生對自回歸模型的理解,豐富教學(xué)內(nèi)容,擴大課堂信息量,而且能激發(fā)學(xué)生探索與學(xué)習(xí)的興趣,提升學(xué)生的專業(yè)能力。本文通過自回歸模型在人口預(yù)測中的應(yīng)用,對案例教學(xué)在時間序列分析中的應(yīng)用進行了粗略的探討。
構(gòu)建AR(p)模型的步驟:
步驟1:對序列作平穩(wěn)性檢驗,若經(jīng)檢驗判定為非平穩(wěn),用平穩(wěn)化方法將序列作平穩(wěn)化處理;
步驟2:對平穩(wěn)的序列作白噪聲檢驗,若經(jīng)檢驗判定序列為白噪聲,建模結(jié)束;否則,轉(zhuǎn)步驟3;
步驟3:對模型進行識別,估計其參數(shù),轉(zhuǎn)步驟4;
步驟4:檢驗?zāi)P偷膶嵱眯?,若估計的參?shù)通過檢驗,殘差為白噪聲,則得到擬合模型并可以對序列作預(yù)測;否則轉(zhuǎn)步驟3。
在步驟1中,判斷一個時間序列是否平穩(wěn)的最簡單也是最直觀的方法就是時序圖法。將一個時間序列按時間順序繪成連線圖,若其始終在一個常數(shù)值上下隨機波動,波動強度隨時間變化不大,沒有明顯的趨勢性和周期性,則認為該序列是平穩(wěn)的。若序列不平穩(wěn),常用的平穩(wěn)化方法有差分、趨勢擬合、移動平均和指數(shù)平滑。
在步驟3中,通過自相關(guān)系數(shù)、偏自相關(guān)系數(shù)的截尾性與拖尾性作為模型識別的依據(jù)。若自相關(guān)系數(shù)拖尾,偏自相關(guān)系數(shù)p階截尾,則可建立AR(p)模型。需要注意的是,如果識別出的不只一個模型,則需要根據(jù)AIC等準(zhǔn)則來進行比較并選出最合適的模型。
在步驟4中,殘差為白噪聲是判斷模型有效性的標(biāo)準(zhǔn)之一。時間序列分析的目的之一就是要將序列中的相關(guān)信息充分提取出來,一旦被充分提取,那么剩余的殘差序列就應(yīng)該是白噪聲序列。
筆者在進行自回歸模型的教學(xué)中發(fā)現(xiàn),僅從理論的角度進行講解,并不能引起學(xué)生的興趣,同時使得學(xué)生難以用于實際問題中,不利于培養(yǎng)學(xué)生的專業(yè)能力。針對這個問題,結(jié)合自回歸模型的廣泛應(yīng)用案例,在理論概念講解之后,將其運用于實際問題——人口預(yù)測中,引導(dǎo)學(xué)生探索問題—收集數(shù)據(jù)—建立模型—預(yù)測,同時通過Eviews軟件上機操作,加深學(xué)生對這部分知識的理解,培養(yǎng)學(xué)生的專業(yè)技能,提高教學(xué)效果。
人口問題依然是目前世界普遍關(guān)心的重大問題之一。中國總?cè)丝跀?shù)是指中國在某一時間點上的人口總數(shù),人口眾多、人均資源少依然是我國的基本國情,人口與經(jīng)濟、社會、資源和環(huán)境等各方面的不夠協(xié)調(diào)仍是我國目前發(fā)展面臨的重要問題之一。因而,利用數(shù)據(jù)探究我國人口總數(shù)的變化趨勢、預(yù)測人口總量的變化,對與民生政策、經(jīng)濟政策、人與自然的和諧發(fā)展具有重要意義。本文根據(jù)上述理論,對1952-2018年中國總?cè)丝跀?shù)序列進行分析。
對給定的時間序列,在建模時,序列應(yīng)滿足平穩(wěn)性,故對1952-2018年中國總?cè)丝跀?shù)序列作時序圖進行觀察,以此獲得序列值的趨勢和走向以及不同時刻序列值之間的相關(guān)關(guān)系。其時序圖如下圖1:
圖1:1952-2018年中國總?cè)丝跀?shù)時序圖
由時序圖可以得出,1952-2018年中國總?cè)丝跀?shù)序列是非平穩(wěn)的。于是,我們需要對該序列作平穩(wěn)化處理。
1952-2018年中國總?cè)丝跀?shù)序列有明顯的線性增長趨勢。因此可以考慮對該序列作一階差分:
圖2:1952-2018年中國總?cè)丝跀?shù)一階差分后的序列時序圖
由時序圖,該序列沒有明顯的趨勢與周期,可以認為該序列是平穩(wěn)的。
對給定的時間序列,在建模時,序列除了滿足平穩(wěn)性,還需要滿足非白噪聲。故對中國總?cè)丝跀?shù)一階差分后的序列作純隨機性檢驗,見圖3。
圖3:一階差分后的序列的純隨機性檢驗結(jié)果
由圖3可知,在任意滯后階數(shù)下,該序列的Q統(tǒng)計量檢驗的伴隨概率均顯著為0,因此拒絕其是純隨機序列的假設(shè),可以認為該序列不是隨機序列,滿足序列是非白噪聲的要求??梢詫υ撔蛄薪r間序列模型。
通過觀察圖3中的自相關(guān)系數(shù)、偏自相關(guān)系數(shù),可以得出該序列的自相關(guān)系數(shù)拖尾,偏自相關(guān)系數(shù)1階截尾,因此可以建立AR(1)模型。
圖 4:AR(1)擬合相關(guān)參數(shù)圖
構(gòu)建的模型結(jié)果如下:
結(jié)果顯示,AR(1)的p值小于0.05,通過了顯著性檢驗。
通過殘差序列進一步對模型的有效性作檢驗:
圖5:AR(1)擬合殘差的純隨機性檢驗結(jié)果
由圖5可得,殘差序列全部在二倍標(biāo)準(zhǔn)差的范圍中,顯示出良好的擬合效果。最后建立AR(1)模型如下:
根據(jù)(3.1)與(3.2)建立我國1952-2018年總?cè)丝跀?shù)的組合模型:
該組合模型的擬合效果是比較好的,見圖6。
圖6:組合模型的真實值x與擬合值DF的擬合效果
根據(jù)(3.3)式對2019年我國人口總數(shù)進行預(yù)測,預(yù)測值為140961.986萬人。2019年我國人口總數(shù)的真實值為139772萬人,真實值與預(yù)測值的相對誤差為0.85%。該模型的預(yù)測效果是比較好的。
自回歸模型是時間序列分析的重要教學(xué)內(nèi)容之一,其概念、性質(zhì)和建模流程相對比較枯燥,教師僅從理論部分進行講解,學(xué)生會難以與實際問題相聯(lián)系。引入人口預(yù)測案例,通過Eviews軟件上機實踐,用完整的實際問題建模,能夠幫助學(xué)生理解自回歸模型的概念、應(yīng)用及軟件實現(xiàn),更好的達到學(xué)以致用的目的。當(dāng)然,自回歸模型在實際中的的應(yīng)用非常廣泛,可引用的教學(xué)案例較多。例如,旅游人數(shù)預(yù)測問題、國內(nèi)生產(chǎn)總值預(yù)測問題、氣溫預(yù)測問題等等。教師在教學(xué)過程中,可以選擇更貼近學(xué)生學(xué)習(xí)基礎(chǔ),更能引起學(xué)生的興趣的案例。同時,教師在將自回歸模型用于人口預(yù)測中,可引導(dǎo)學(xué)生自主建模,完成探索問題—收集數(shù)據(jù)—建立模型—預(yù)測以及利用Eviews軟件實現(xiàn)建模的過程,培養(yǎng)學(xué)生的專業(yè)能力。