黃詩敏
(福建師范大學(xué)經(jīng)濟(jì)學(xué)院,福州 350117)
20世紀(jì)90年代以來,金融全球化進(jìn)程不斷推進(jìn),上交所和深交所先后成立,我國股票市場迅速發(fā)展,如今中國股市經(jīng)歷數(shù)十年的穩(wěn)健發(fā)展,越來越多的投資者進(jìn)入股市進(jìn)行股票投資交易行為,期望獲取收益,這極大地促進(jìn)了中國股票市場的繁榮,然而在這種行為背后,越來越多學(xué)者意識到股價(jià)預(yù)測的重要性并對此方向展開研究,因此股價(jià)的分析與預(yù)測一直是金融領(lǐng)域的研究熱點(diǎn)。
在金融時(shí)間序列分析中,股票價(jià)格時(shí)間序列通常為非平穩(wěn)時(shí)間序列,ARIMA 模型可通過差分處理非平穩(wěn)時(shí)間序列,擬合平穩(wěn)序列,對其指標(biāo)進(jìn)行短期預(yù)測且準(zhǔn)確性較高,因此選用ARIMA 模型對股票價(jià)格時(shí)間序列進(jìn)行分析,在金融和股票領(lǐng)域具有重要的理論意義。
對于統(tǒng)計(jì)分析工具的選用,目前較多學(xué)者利用Eviews 軟件建立ARIMA 模型并對股價(jià)預(yù)測展開分析,而隨著R 語言軟件的不斷完善發(fā)展,R 語言軟件以其快捷便利的優(yōu)勢被更多地運(yùn)用于數(shù)據(jù)分析問題中,因此本文將選用R 語言軟件完成模型的建立及分析,這擴(kuò)展了目前對于該問題研究的工具運(yùn)用的多樣性。
本文選取招商銀行(600036)股票在2021年1月4日至2022年6月30日的每個(gè)交易日的日收盤價(jià)數(shù)據(jù),共計(jì)360組數(shù)據(jù),利用R 語言軟件進(jìn)行平穩(wěn)化處理和平穩(wěn)性檢驗(yàn),完成模型識別與定階,選擇合適的ARIMA 模型并進(jìn)行相關(guān)檢驗(yàn),最終對未來交易日股票進(jìn)行預(yù)測分析,對于股票價(jià)格未來走勢作出預(yù)判,可為投資者提供合理投資方向,在股市中獲取收益提供一定的參考意義。
時(shí)間序列分析方法是依據(jù)歷史數(shù)據(jù)建立合理的時(shí)間序列模型,用于預(yù)測未來發(fā)展趨勢變化的一種方法。對于金融時(shí)間序列問題的分析,常用的基本模型有ARMA 模型和ARIMA 模型。
2.1.1 ARMA 模型
ARMA 模型稱為自回歸移動(dòng)平均模型(Autoregressive moving average model,簡稱:ARMA),該模型是自回歸模型AR 模型和移動(dòng)平均模型MA 模型的有機(jī)組合。
AR 模型是依據(jù)研究對象過往的觀察值與現(xiàn)在的干擾值通過線性組合而成,從而進(jìn)行預(yù)測分析的模型。AR(p)模型形式表達(dá)為:
yt=Φ1yt-1+Φ2yt-2+…+Φpyt-p+εt
式中,yt為平穩(wěn)時(shí)間序列,εt為誤差,Φi(i=1,2,…,p)表示AR 模型的待定系數(shù),p 表示AR 模型的階數(shù)。
MA 模型是依據(jù)研究對象過往的干擾值與現(xiàn)在的干擾值通過線性組合而成,從而進(jìn)行預(yù)測分析的模型。MA(q)模型形式表達(dá)為:
yt=εt-θ1εt-1-θ2εt-2-…-θqεt-q
式中,yt為平穩(wěn)時(shí)間序列,εt為誤差,θj(i=1,2,…,q)表示MA 模型的待定系數(shù),q 表示MA 模型的階數(shù)。
ARMA 模型是根據(jù)AR 模型和MA 模型組合而成的模型,主要用于描述平穩(wěn)隨機(jī)過程。ARMA(p,q)模型形式表達(dá)為:
yt=Φ1yt-1+Φ2yt-2+…+Φpyt-p+εt-θ1εt-1-θ2εt-2-…-θqεt-q
2.1.2 ARIMA 模型
ARIMA 模型稱為差分自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average Model, 簡 稱ARIMA),是由博克思(Box)和詹金斯(Jenkins)于20世紀(jì)70年代初提出的一種時(shí)間序列預(yù)測方法,因此又稱為Box-Jenkins 模型。
ARIMA 模型是在ARMA 模型的基礎(chǔ)之上應(yīng)運(yùn)而生,兩個(gè)模型均包括AR 模型和MA 模型,二者的區(qū)別在于:ARMA模型僅可用于分析平穩(wěn)時(shí)間序列,ARIMA 模型可用于分析非平穩(wěn)序列,對序列進(jìn)行差分處理使序列平穩(wěn)后建立模型。在實(shí)際運(yùn)用中,由于時(shí)間序列多為非平穩(wěn)序列,ARIMA 模型的應(yīng)用更為廣泛。
在ARIMA(p,d,q)模型中,AR 表示自回歸,p 為自回歸的階數(shù);MA 表示移動(dòng)平均,q 為移動(dòng)平均項(xiàng)數(shù),而d 為時(shí)間序列進(jìn)行平穩(wěn)化處理時(shí)的差分次數(shù)(階數(shù)),ARIMA(p,d,q)模型形式可以表達(dá)為:
Δdyt=Φ1yt-1+Φ2yt-2+…+Φpyt-p+εt-θ1εt-1-θ2εt-2-…-θqεt-q
式中,Δdyt表示不平穩(wěn)序列yt經(jīng)過d 次差分轉(zhuǎn)換形成的平穩(wěn)序列,εt為誤差,Φi(i=1,2,…,p)和θj(j=1,2,…,q)為模型的待定系數(shù),p 和q 為模型的階數(shù)。
ARIMA 模型的建模可以分為以下4 個(gè)步驟:
第一,對時(shí)間序列數(shù)據(jù)預(yù)處理,進(jìn)行差分運(yùn)算或者其他變化,完成平穩(wěn)化處理,并通過單位根(ADF)檢驗(yàn)對序列進(jìn)行平穩(wěn)性檢驗(yàn)。
第二,對模型識別并確定模型階數(shù),可通過繪制自相關(guān)圖和偏自相關(guān)圖觀察階數(shù),也可運(yùn)用R 語言的auto.arima()代碼得出最優(yōu)模型,最終確定ARIMA 模型p 值和q 值。
第三,對模型進(jìn)行診斷檢驗(yàn),通過繪制正態(tài)QQ 圖判斷殘差項(xiàng)是否符合正態(tài)分布,通過進(jìn)行白噪聲檢驗(yàn)確定殘差序列是否為白噪聲。
第四,根據(jù)模型對數(shù)據(jù)進(jìn)行預(yù)測并分析。
在進(jìn)行股票預(yù)測時(shí)能夠表示股票價(jià)值的常用變量包括:
①開盤價(jià):每個(gè)交易日開盤時(shí)的股票價(jià)格。
②收盤價(jià):每個(gè)交易日收盤時(shí)的股票價(jià)格。
③最高價(jià):每個(gè)交易日中的最高股票價(jià)格。
④最低價(jià):每個(gè)交易日中的最低股票價(jià)格。
由于每一時(shí)點(diǎn)的股票價(jià)格都是變化的,但是最高價(jià)和最低價(jià)只能代表某一時(shí)點(diǎn)的供求關(guān)系情況,相較于其余兩個(gè)變量而言,最高價(jià)和最低價(jià)對于股票價(jià)格的總體預(yù)測幫助不大。因此本文選取收盤價(jià)作為研究對象,由于收盤價(jià)代表一天交易結(jié)束的價(jià)格,同時(shí)市場上的股票投資者觀測了一天價(jià)格動(dòng)向,一般會選擇在最后進(jìn)行交易。
在股票的選取上,由于招商銀行較早在A 股上市,具有一定的代表性,因此選用該股對股價(jià)分析具有可行性。
因此本文選取招商銀行(600036)股票在2021年1月4日至2022年6月30日的每個(gè)交易日的日收盤價(jià)視作觀測值進(jìn)行分析,數(shù)據(jù)來自網(wǎng)易財(cái)經(jīng)數(shù)據(jù)平臺,共計(jì)360 組數(shù)據(jù)。
由于股市波動(dòng)較大,股票時(shí)間序列通常是不平穩(wěn)的,需要對原始數(shù)據(jù)進(jìn)行平穩(wěn)化處理才能使序列變?yōu)槠椒€(wěn)序列,并通過平穩(wěn)性檢驗(yàn)方可進(jìn)行下一步模型構(gòu)建。
時(shí)間序列的平穩(wěn)性檢驗(yàn)主要有兩種檢驗(yàn)方法:第一種方法是圖形分析法,通過圖形判斷序列的平穩(wěn)性,可以根據(jù)時(shí)序圖和自相關(guān)圖等圖形的特征作出判斷,該方法操作簡單,肉眼即可判斷,應(yīng)用較為廣泛,缺點(diǎn)是具有較強(qiáng)的主觀性;第二種方法是假設(shè)檢驗(yàn)法,通過構(gòu)造檢驗(yàn)統(tǒng)計(jì)量進(jìn)行判斷,目前最常用的方法是單位根檢驗(yàn),該方法相較于圖形分析法更為科學(xué)準(zhǔn)確。
首先,依據(jù)股票的時(shí)序圖和描述性統(tǒng)計(jì)特征觀測時(shí)間序列樣本。由圖1 所示,招商銀行的股票收盤價(jià)隨著時(shí)間的變化而發(fā)生大幅度的波動(dòng)變化,可知初始序列為不平穩(wěn)序列,需要進(jìn)行相關(guān)處理使序列平穩(wěn)。因此對原始數(shù)據(jù)進(jìn)行一階差分處理后再繪制其時(shí)序圖,結(jié)果如圖2 所示,進(jìn)行一階差分后的時(shí)間序列呈現(xiàn)出圍繞數(shù)值0 上下小幅度波動(dòng)的狀態(tài),因此可以初步判斷該時(shí)間序列為平穩(wěn)序列。
圖1 招商銀行股票收盤價(jià)時(shí)序圖
圖2 一階差分后的時(shí)序圖
通過單位根檢驗(yàn)對一階差分后的序列進(jìn)行平穩(wěn)性檢驗(yàn)。Augmented Dickey-Fuller Test(ADF)是DF 檢驗(yàn)的拓展形式,可以對存在高階滯后的序列進(jìn)行單位根檢驗(yàn),原假設(shè)為序列存在單位根,即序列不平穩(wěn)。
在R 語言中安裝并加載tseries 程序包,運(yùn)用adf.test()代碼進(jìn)行單位根檢驗(yàn),檢驗(yàn)結(jié)果顯示Dickey-Fuller 統(tǒng)計(jì)量為-6.657 2,p 值為0.01,拒絕原假設(shè),表明序列為平穩(wěn)序列,因此差分處理后的序列通過平穩(wěn)性檢驗(yàn)。
根據(jù)上述分析,本文的原始時(shí)間序列數(shù)據(jù)經(jīng)過一階差分后得到平穩(wěn)序列,因此識別選用ARIMA(p,d,q)模型。
序列平穩(wěn)后,需要進(jìn)行模型定階,確定p、d、q 的數(shù)值。由于在平穩(wěn)化處理中,對原始序列進(jìn)行一階差分即獲得平穩(wěn)序列,可以首先確定d=1。
通??筛鶕?jù)繪制自相關(guān)(ACF)圖和偏自相關(guān)(PACF)圖確定ARIMA(p,d,q)中合適的p 值和q 值,因此使用R 語言相關(guān)命令繪制自相關(guān)圖與偏自相關(guān)圖,結(jié)果如圖3 和圖4 所示。但由于利用圖形判斷往往根據(jù)人為主觀選擇數(shù)值,可能存在偏頗,R 語言中提供自動(dòng)識別ARIMA 模型階數(shù)的程序包,可更為科學(xué)客觀地得出模型階數(shù)。
圖3 ACF 圖
圖4 PACF 圖
因此在R 語言中首先安裝并加載forecast 程序包,運(yùn)用auto.arima()代碼對序列自動(dòng)識別模型階數(shù),該方法依據(jù)BIC準(zhǔn)則,對模型的識別更為科學(xué)準(zhǔn)確。根據(jù)auto.arima 函數(shù)識別出來的最優(yōu)模型為ARIMA(2,1,1)模型(見圖5),即p=2、d=1、q=1,本文基于此建立方程。
圖5 模型識別結(jié)果
在確定模型后,需要對模型進(jìn)行相關(guān)檢驗(yàn)以保證模型的適用性。
首先,在建立模型之初假設(shè)殘差服從正態(tài)分布,因此通過繪制QQ 圖驗(yàn)證殘差項(xiàng)是否符合正態(tài)分布,根據(jù)圖6 所示,圖中大部分的散點(diǎn)分布趨近標(biāo)準(zhǔn)線,判斷殘差項(xiàng)基本符合正態(tài)分布的特征。
圖6 正態(tài)QQ 圖
其次,在建立模型之初假設(shè)殘差之間不相關(guān),因此通過Ljung-Box 檢驗(yàn)判斷殘差之間是否相關(guān),原假設(shè)為殘差之間不相關(guān),運(yùn)用Box.test 代碼進(jìn)行檢驗(yàn),結(jié)果顯示p 值為0.966 9,大于0.05,即接受原假設(shè),認(rèn)為殘差之間不相關(guān),說明殘差項(xiàng)屬于白噪聲序列,殘差項(xiàng)中的有效信息已被完整提取,模型基本完善。
根據(jù)上述檢驗(yàn)結(jié)果,可知ARIMA 模型擬合效果較為理想,因此可運(yùn)用已建立的ARIMA(2,1,1)模型對股票價(jià)格進(jìn)行預(yù)測,運(yùn)用R 語言中的forcast () 代碼完成此步驟。由于該ARIMA 模型適合用于短期預(yù)測,在短期預(yù)測方面精確度較高,因此選擇對未來5 個(gè)交易日股票價(jià)格進(jìn)行預(yù)測,預(yù)測結(jié)果如表1 所示。
表1 未來5 個(gè)交易日股票價(jià)格預(yù)測表
根據(jù)表1 與圖7 所示,股票預(yù)測值與實(shí)際收盤價(jià)較為接近,不超出80%和95%的置信區(qū)間,誤差均不超過6%,說明模型預(yù)測精度較高,同時(shí)驗(yàn)證本文構(gòu)建的ARIMA(2,1,1)模型是較為準(zhǔn)確的,可以較好地反映出招商銀行股票收盤價(jià)序列的變化規(guī)律,反映出股票價(jià)格的未來走勢。
圖7 股票預(yù)測結(jié)果
本文運(yùn)用R 語言軟件對招商銀行(600036)股票價(jià)格進(jìn)行時(shí)間序列的實(shí)證分析,首先對時(shí)間序列進(jìn)行平穩(wěn)性檢驗(yàn),然后利用R 語言中的auto.arima()代碼自動(dòng)識別模型階數(shù),構(gòu)建合適的ARIMA(2,1,1)模型,并對其模型進(jìn)行相關(guān)檢驗(yàn),最后利用R 語言中的forcast()代碼對未來交易日的股票價(jià)格進(jìn)行預(yù)測及分析。根據(jù)模型的預(yù)測結(jié)果顯示可知,ARIMA 模型對股票價(jià)格序列的短期變化規(guī)律有較好的預(yù)測作用,在短期預(yù)測中具有一定的準(zhǔn)確性。
綜上所述,ARIMA 模型可較好地適用于股票價(jià)格序列分析,對于股價(jià)的短期預(yù)測效果較好,能夠?yàn)橥顿Y者提供合理的投資方向,在股市中獲取收益提供一定的參考意義。