王依婷 韋江英
摘要:利用ARMA模型對上證50的全收益股票收盤價(20170103-20180508)的數(shù)據(jù)進(jìn)行分析,并預(yù)測未來5天(20180509-20180515)的上證50全收益指數(shù)收盤價數(shù)據(jù),與實際數(shù)據(jù)相對照,模型預(yù)測誤差較小,說明ARIMA模型比較適合金融市場上的時間序列的研究和預(yù)測,為決策者和投資者提供決策指導(dǎo)。
關(guān)鍵詞:時間序列;ARIMA模型;股價預(yù)測;上證50
一、數(shù)據(jù)選取與方法選擇
(一)數(shù)據(jù)選取
金融時間序列是屬于時間序列數(shù)據(jù)的一種,首先,序列中的數(shù)據(jù)的取值依賴于時間的變化,具有單調(diào)性,其次,每一時刻上的數(shù)據(jù)取值具有一定的隨機(jī)性。不可能完全準(zhǔn)確地用歷史值預(yù)測,再次,前后時刻的數(shù)值具有一定的相關(guān)性,這種相關(guān)性就是系統(tǒng)的動態(tài)規(guī)律性,最后,從整體上看,金融時間序列往往呈現(xiàn)出某種趨勢性或出現(xiàn)周期性變化的現(xiàn)象。以上特征都表明金融時間序列是比較典型的時間序列,所以可以通過金融計量學(xué)的知識根據(jù)現(xiàn)有數(shù)據(jù)對未來數(shù)據(jù)進(jìn)行預(yù)測。
上證50全收益指數(shù)是上證50指數(shù)的衍生指數(shù),與上證50指數(shù)的區(qū)別在于指數(shù)的計算中將樣本股分紅計入指數(shù)收益,供投資者從不同角度考量指數(shù)走勢。筆者在上海證券交易所中可以找到了中國上證50全收益指數(shù)收盤價從從2017年1月3日到2018年5月8日的322個數(shù)據(jù)作為研究樣本。
(二)方法選擇
1.ARIMA模型介紹
ARIMA是由統(tǒng)計學(xué)家Box和Jenkins提出的,能夠準(zhǔn)確預(yù)測非平穩(wěn)時間序列的方法,在計量經(jīng)濟(jì)學(xué)中得到廣泛應(yīng)。ARIMA模型的基本原理:把時間序列視為隨機(jī)過程,用一個數(shù)學(xué)模型來描述或模擬;一旦該模型可確定,就可用該時間序列的過去值和現(xiàn)值來預(yù)測未來值。該模型考察了時間序列的動態(tài)、持續(xù)特征,揭示了時間序列過去與現(xiàn)在、將來與現(xiàn)在的相互關(guān)系。若序列{x}能通過d次差分后變成平穩(wěn)序列{y},于是可以直接建立適用于平穩(wěn)序列的ARMA模型。
經(jīng)過d階差分后的ARIMA(p,d,q)為本文采用的模型。其中P為AR的階數(shù),9為MA的階數(shù),d為差分階次,為一個白噪聲序列。ARIMA模型建模需要經(jīng)過5個步驟,即序列純隨機(jī)性檢驗,序列平穩(wěn)性檢驗,模型的識別與定階,模型參數(shù)估計和殘差的純隨機(jī)性檢驗。
2.純隨機(jī)性檢驗(如圖1)
P值<顯著性水平a,拒絕原假設(shè),說明該序列存在相關(guān)性,可以用來做實驗分析。
3.平穩(wěn)性檢驗
首先,從時序圖分析,明顯可以看出,該序列不平穩(wěn);初步判斷,認(rèn)為該序列具有一定的隨機(jī)趨勢,再做單位跟檢驗:(如圖2)
選擇顯著性水平為5%,ADF值>該顯著性水平下的臨界值,則序列存在單位根,即序列表現(xiàn)為非平穩(wěn)。
4.選擇ARIMA模型進(jìn)行數(shù)據(jù)擬合
對于存在趨勢性的非平穩(wěn)序列,可以選擇ARIMA模型和組合模型兩種方法來進(jìn)行分析,考慮到該序列的隨機(jī)趨勢特征比較明顯,可以通過原始序列做差分來進(jìn)行平穩(wěn)化處理,所以相對來說,ARIMA模型是更簡單的選擇。
二、模型的建立與預(yù)測
(一)模型的建立
1.平穩(wěn)化處理
經(jīng)過多次嘗試發(fā)現(xiàn),對序列做二階差分能得到比較平穩(wěn)的序列,二階差分后的時序圖顯示出差分后序列在均值附近比較穩(wěn)定地波動。為了進(jìn)一步確定平穩(wěn)性,對差分后序列做單位根檢驗,如表3:
ADF值<該顯著性水平5%下的臨界值,則序列不存在單位根,即序列表現(xiàn)為平穩(wěn)。其次,還發(fā)現(xiàn)該序列的截距項與趨勢項都不顯著,說明該序列不存在截距項和趨勢項。
2.模型的識別與定階
通過觀察差分后序列的自相關(guān)圖和偏自相關(guān)圖可以發(fā)現(xiàn),兩個圖都為拖尾,所以應(yīng)該擬合ARMA模型,如圖4所示:
3.ARMA模型的擬合
為了最后能更好地預(yù)測原序列,采取了直接使用函數(shù)形式的參數(shù)估計方法,通過多次嘗試,發(fā)現(xiàn)擬合如圖5所示的模型是比較好的:
首先,t檢驗都通過;其次,單位根的絕對值都小于1;而且,擬合優(yōu)度正常。(如圖6)
最后,再做殘差的純隨機(jī)性檢驗:
檢驗通過,殘差為白噪聲序列,說明信息提取比較充分,模型擬合得較好。
估計的方程如下:
Xt=0.19xt-1-0.17xt-4-0.13xt-5+0.99at-1+at
(二)模型預(yù)測
預(yù)測0509、0510、0511、0514、0515五期的值(雙休日跳過),預(yù)測圖表明,預(yù)測效果比較好。(如圖7)
預(yù)測值與上海證券交易所的真實值比較情況如下表所示,預(yù)測誤差的百分比絕對值保持在3%以下,也可以看出,預(yù)測效果較好:(如圖8)
三、結(jié)論
本文利用時間序列分析中的ARIMA模型,對上證50全收益指數(shù)收盤價這一時間序列進(jìn)行模型的建立和實證分析,了解金融市場中股票價格指數(shù)的基本特征。通過建模發(fā)現(xiàn)ARIMA模型較好地解決了非平穩(wěn)時間序列的建模問題,借助Eviews軟件可以方便地將ARIMA模型應(yīng)用于金融等時間序列的研究和預(yù)測,為決策者和投資者提供決策指導(dǎo)。