沈小欣 趙亞玲 朱海江
(浙江師范大學(xué) 數(shù)理信息學(xué)院,浙江 金華321004)
集成模型ARIMAX-GARCH及其在股票預(yù)測(cè)中的應(yīng)用
沈小欣 趙亞玲 朱海江
(浙江師范大學(xué) 數(shù)理信息學(xué)院,浙江 金華321004)
在分析ARIMAX模型與GARCH模型的預(yù)測(cè)特性和優(yōu)劣的基礎(chǔ)上,建立了基于兩者集成的ARIMAX-GARCH模型,其基本思想是充分發(fā)揮兩種模型在回歸與序列波動(dòng)性因素提取方面的優(yōu)勢(shì).對(duì)從5大行業(yè)中隨機(jī)抽取的10只只股票的實(shí)證分析表明,該集成模型在股票預(yù)測(cè)中的準(zhǔn)確率與穩(wěn)定性顯著優(yōu)于兩個(gè)單一模型.
時(shí)間序列;ARIMAX模型;GARCH模型;ARIMAX-GARCH模型;股票預(yù)測(cè)
近幾十年來(lái),很多學(xué)者開(kāi)始利用時(shí)間序列模型研究數(shù)據(jù)的變化規(guī)律.1976年George E.P.Box和Gwilym M.Jenkins在研究CO2的輸出濃度時(shí)開(kāi)始運(yùn)用多元時(shí)間序列分析方法[1],這就是早期的ARIMAX模型.1987年Engle和Granger又提出協(xié)整的概念[2],進(jìn)一步完善了ARIMAX模型.ARIMAX模型并沒(méi)有廣泛運(yùn)用于金融時(shí)間序列,其原因是很多金融時(shí)間序列的殘差序列具有異方差性,而ARIMAX模型并不能很好地刻畫金融時(shí)間序列的波動(dòng)性.1982年Engle提出了條件異方差模型[3],Bollerslevb于1986對(duì)文獻(xiàn)[3]的模型作了修正[4],提出廣義自回歸條件異方差模型,即GARCH模型.我國(guó)學(xué)者唐齊鳴與陳健利用ARCH模型對(duì)中國(guó)股市的波動(dòng)性進(jìn)行了檢驗(yàn),發(fā)現(xiàn)其具有較明顯的ARCH效應(yīng)[5].
股票預(yù)測(cè)一直是經(jīng)濟(jì)統(tǒng)計(jì)的一個(gè)熱點(diǎn).常用的股票預(yù)測(cè)模型中均使用股票收盤價(jià)這一單一變量,然而華爾街有句名言,“價(jià)走量先行”,說(shuō)明股票價(jià)格與成交量之間有一種必然的聯(lián)系,故比較好的股票預(yù)測(cè)模型應(yīng)該包含收盤價(jià)和成交量這兩個(gè)指標(biāo),因而是一個(gè)多元時(shí)間序列模型,且其具有金融時(shí)間序列的異方差性,故前面介紹的幾種模型都不能很好地適用于股票預(yù)測(cè).通過(guò)分析,本文將建立由ARIMAX模型和GARCH模型集成的ARIMAX-GARCH模型,該集成模型的主要思想是加入交易率序列為輸入變量序列,建立多元時(shí)間序列模型(ARIMAX)來(lái)擬合回歸部分,再利用GARCH模型提取殘差序列中的異方差因素,最后利用集成模型進(jìn)行股票預(yù)測(cè).
集成模型的具體表達(dá)式如下:
我們隨機(jī)抽取中國(guó)5大行業(yè)中的10只股票作為研究對(duì)象,由于歷史數(shù)據(jù)獲取有限,故10只股票的截取時(shí)間并不能達(dá)成一致.其中洋河股份截取時(shí)間自2010-07-13至2013-11-07,湯臣倍健截取時(shí)間自2011-05-25至2013-11-07,其余8只股票數(shù)據(jù)的截取時(shí)間均為自2006-02-06至2013-12-06,數(shù)據(jù)來(lái)源于雅虎財(cái)經(jīng)網(wǎng)站.
本文以洋河股份(002304)為例,首先詳細(xì)介紹了采用3種模型建模的過(guò)程及Eviews[6]實(shí)現(xiàn);其次分別預(yù)測(cè)現(xiàn)有樣本數(shù)據(jù)中最后7天的收盤價(jià);最后采用均方根誤差和平均絕對(duì)百分比誤差這兩個(gè)指標(biāo)對(duì)3種模型的預(yù)測(cè)結(jié)果進(jìn)行比較.其余9只股票的具體建模過(guò)程省略,10只股票的預(yù)測(cè)結(jié)果將在后文呈現(xiàn).
2.1數(shù)據(jù)整理
為方便論述,記上述時(shí)期日收盤價(jià)序列為C,日交易量序列為V,時(shí)間序列中的時(shí)間點(diǎn)編號(hào)為1到797.首先來(lái)看洋河股份(002304)收盤價(jià)和交易量的時(shí)序圖,見(jiàn)圖1.
很明顯,收盤價(jià)C和日交易量V都為不平穩(wěn)的時(shí)間序列,我們定義序列C的收益率為:
RCi+1=100(lnCi+1-lnCi),
相應(yīng)地,定義交易率為
RVi+1=100(lnVi+1-lnVi).
2.2平穩(wěn)性檢驗(yàn)
對(duì)序列RC和序列RV做單位根檢驗(yàn)(ADF檢驗(yàn)),結(jié)果表明在3種顯著性水平下都拒絕原假設(shè),故可認(rèn)為序列RC和序列RV都平穩(wěn).
2.3 3種模型參數(shù)估計(jì)以及預(yù)測(cè)效果比較
2.3.1 ARIMAX模型
由交易率與收益率的相關(guān)性圖及響應(yīng)序列(收益率序列)的自相關(guān)性與偏相關(guān)性圖可初步選出4個(gè)較優(yōu)化的模型,為了進(jìn)一步選出最優(yōu)模型,借助Eviews軟件,對(duì)這4個(gè)模型進(jìn)行分析,見(jiàn)表1.
表1 4個(gè)模型的R2和定階值(AIC)的比較
根據(jù)最小信息準(zhǔn)則(AIC),最終確定的模型為ARIMAX((5,6,7),0,(7)).
2.3.2 GARCH模型
在給GARCH模型定階時(shí),可供選擇的有如下兩個(gè)模型:
為了選出最優(yōu)模型,根據(jù)最小信息準(zhǔn)則(AIC),對(duì)這兩個(gè)模型進(jìn)行分析,計(jì)算它們的定階值(AIC).計(jì)算結(jié)果如下:模型一的定階值為4.467 908,模型二的定階值為4.468 258.因此最終確定模型一為最優(yōu)模型.
2.3.3 ARIMAX-GARCH模型
ARIMAX-GARCH集成模型參數(shù)擬合后如下式:
對(duì)此時(shí)的殘差做ARCH-LM檢驗(yàn)[6],結(jié)果顯示殘差不再具有ARCH效應(yīng).
2.3.4 3種模型預(yù)測(cè)效果的比較
為了更加全面地描述3個(gè)模型對(duì)股票的預(yù)測(cè)效果,本文采用均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)兩個(gè)指標(biāo)來(lái)衡量模型預(yù)測(cè)效果的好壞(第一個(gè)指標(biāo)是絕對(duì)指標(biāo),第二個(gè)指標(biāo)是相對(duì)指標(biāo))[7].兩個(gè)指標(biāo)分別定義為:
表2 各模型預(yù)測(cè)效果比較
如表2所示,以上10只股票中有6只顯示ARIMAX-GARCH模型的預(yù)測(cè)誤差明顯小于其它兩個(gè)模型,而表明其他兩個(gè)模型預(yù)測(cè)效果較優(yōu)的分別有兩只股票.仔細(xì)觀察發(fā)現(xiàn),在ARIMAX模型預(yù)測(cè)效果最好的兩只股票中,GARCH模型的預(yù)測(cè)效果最差,且差距很大,而在GARCH模型預(yù)測(cè)效果最好的兩只股票中,ARIMAX模型的預(yù)測(cè)效果最差,這充分說(shuō)明兩個(gè)單一模型的預(yù)測(cè)效果不穩(wěn)定.以上實(shí)證分析表明ARIMAX-GARCH模型在股票預(yù)測(cè)中比兩個(gè)單一模型更穩(wěn)定,且效果更佳.
股票作為金融市場(chǎng)最主要的金融產(chǎn)品,其價(jià)格能否被預(yù)測(cè),以及用何種方法進(jìn)行預(yù)測(cè),一直以來(lái)都是金融領(lǐng)域研究的焦點(diǎn)問(wèn)題.ARIMAX模型與GARCH模型是預(yù)測(cè)模型中的典型代表,兩者在預(yù)測(cè)上均具有自己獨(dú)特的優(yōu)勢(shì).分析ARIMAX模型與GARCH模型的特性可知,兩者具有極強(qiáng)的互補(bǔ)性,于是我們想到構(gòu)造ARIMAX模型與GARCH模型的集成模型(ARIMAX-GARCH)來(lái)取長(zhǎng)補(bǔ)短.在實(shí)證分析中,我們對(duì)10只股票收盤價(jià)在3個(gè)模型中預(yù)測(cè)效果的比較表明,ARIMAX-GARCH模型在股票預(yù)測(cè)中比兩個(gè)單一模型更穩(wěn)定,且效果更佳.
我們知道很多因素都會(huì)影響股票的收盤價(jià),故輸入變量序列中除交易量外還可以有很多其他變量,如何篩選變量,多變量間如何確定相互關(guān)系都有待于進(jìn)一步研究.
[1]George EP Box,Gwilym M Jenkins.Time Series Analysis:Forecasting and Control[M].California:Holden-Day,1976.
[2]Robert F Engle,CWJ Granger.Co-Integration and Error Correction:Representation,Estimation and Testing[J].Econometrica,1987,55(2):251-276.
[3]Robert F Engle,Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation[J].Econometrica,1982,50(4):987-1007.
[4]Tim Bollerslev.Generalized Autoregressive Conditional Heteroskedasticity[J].Journal of Econometrics,1986,31(3):307-327.
[5]唐齊鳴,陳健.中國(guó)股市的ARCH效應(yīng)分析[J].世界經(jīng)濟(jì),2001(3):29-36.
[6]高鐵梅.計(jì)量經(jīng)濟(jì)分析方法與建模——Eviews應(yīng)用及實(shí)例[M].北京:清華大學(xué)出版社,2006.
[7]熊志斌.基于ARIMAX與神經(jīng)網(wǎng)絡(luò)集成的GDP時(shí)間序列預(yù)測(cè)研究[J].數(shù)理統(tǒng)計(jì)與管理,2011,30(02):306-314.
Integrated Model ARIMAX GARCH and Its Applications in Stock Forecast
Shen Xiaoxin Zhao Yaling Zhu Haijiang
(Department of Statistics, Zhejiang Normal University, Jinhua, Zhejiang 321004)
Based on the analysis of the performance of multiple stationary time series of ARIMAX and GARCH models, this paper sets up a new model which integrates ARIMAX with GARCH. The new model has the advantage of regression in ARIMAX and the superiority of extracting volatility in GARCH. The result of empirical analysis about ten shares from five industries which are grabbed at random shows that the proposed model has better accuracy and stability in stock forecast than every single model.
time series; ARIMAX; GARCH; ARIMAX-GARCH; stock forecast
2014-08-22
沈小欣(1989-),女,江蘇泰州人.研究方向:數(shù)理統(tǒng)計(jì).
F224.9;O213.9
A
1008-293X(2014)09-0060-04
(責(zé)任編輯鄧穎)
紹興文理學(xué)院學(xué)報(bào)(自然科學(xué)版)2014年3期