李 銀,伍曉晴
(韶關(guān)學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,廣東 韶關(guān) 512005)
隨著人們的收入水平提高,越來越多的人將剩余資金用來投資某些金融產(chǎn)品,比如股票、基金等. 在金融市場背景下,有投資就避免不了風(fēng)險(xiǎn),股票收盤價(jià)會(huì)受到各種各樣因素的影響,比如,國家的政策、國家的經(jīng)濟(jì)情況以及股市的規(guī)章制度等. 股票的波動(dòng)對于廣大股票持有者來說非常重要,研究股票的走勢非常重要,這會(huì)使投資者做出不同的舉措來研究與預(yù)測[1-2]. 在實(shí)現(xiàn)建軍100年奮斗目標(biāo)的背景下,我國需要強(qiáng)大的現(xiàn)代化國防力量,軍工投入會(huì)不斷增加. 與此同時(shí),一些國企有關(guān)改革政策的設(shè)立和實(shí)施,推動(dòng)了我國軍工板塊股票熱度不斷提升. 因此未來幾年內(nèi),軍工板塊將會(huì)迎來高速、持續(xù)、穩(wěn)定的發(fā)展機(jī)遇,研究軍工板塊股票的波動(dòng)性具有重要的研究意義.
岳朝龍對上海股市收益率進(jìn)行分析,發(fā)現(xiàn)上海股票收益率不僅具有條件異方差,而且具有杠桿效應(yīng),因此適合建立GARCH(廣義自回歸條件異方差)類模型[3]. 蕭楠研究發(fā)現(xiàn)上海銅期貨市場的收益率服從ARMA-GARCH(自回歸滑動(dòng)平均-廣義自回歸條件)模型,進(jìn)一步建立TARCH(門限自回歸條件異方差)模型和EGARCH(指數(shù)條件異方差)模型對收益率的杠桿效應(yīng)進(jìn)行檢驗(yàn),發(fā)現(xiàn)其并不存在顯著的杠桿效應(yīng)[4]. 張東旭研究上證綜合指數(shù)收盤價(jià)格在不同分布下的ARMA-GARCH 族模型,找到了參數(shù)最優(yōu)、擬合效果最好的模型[5]. 丁文絹對上證A 股50 建立ARIMA 模型和LSTM 模型進(jìn)行對比,發(fā)現(xiàn)通過使用多種深度學(xué)習(xí)的方法對時(shí)間序列同樣具有較好的預(yù)測精度[6]. 時(shí)間序列不僅可以應(yīng)用于對股票的預(yù)測,還可以應(yīng)用于對其他一些時(shí)間序列的變化,例如蘭華等比較ARMA 模型和馬爾可夫鏈模型兩個(gè)模型對光伏電站出力進(jìn)行預(yù)測,進(jìn)行分析,最后得出時(shí)間序列模型ARMA 模型對于預(yù)測光伏電站出力預(yù)測的精度比傳統(tǒng)的馬爾可夫鏈模型的要高[7]. 譚滿春等先利用時(shí)間序列模型預(yù)測交通流的線性部分,再利用人工神經(jīng)網(wǎng)絡(luò)預(yù)測交通流的非線性部分,兩種模型的結(jié)合有很好的預(yù)測效果[8].
投資者進(jìn)行投資時(shí)會(huì)根據(jù)目標(biāo)產(chǎn)品的投資金額進(jìn)行調(diào)整,以便以最低風(fēng)險(xiǎn)獲得最大收益,減少虧損.同時(shí),收益率的預(yù)測在單只股票以及資產(chǎn)投資組合中風(fēng)險(xiǎn)的計(jì)算起到重要的作用. 因此研究股票時(shí)間序列的走勢并挖掘其中的特征以及對股票收益率進(jìn)行預(yù)測是不可或缺的. 本文擬對我國股票中證軍工板塊指數(shù)的日收盤價(jià),通過分析主要統(tǒng)計(jì)特征,并通過多種檢驗(yàn),建立能預(yù)測該板塊收盤價(jià)波動(dòng)性的ARIMA 模型,以期對投資者進(jìn)行下一步?jīng)Q策提供幫助.
ARIMA(p,d,q)模型是一種自回歸整合移動(dòng)平均模型,是在20 世紀(jì)70年代被提出,也被稱作Box-Jenkins 模型,專門用于非平穩(wěn)時(shí)間序列分析和預(yù)測的方法[9-11].
參數(shù)d是差分階數(shù),表示將非平穩(wěn)的時(shí)間序列轉(zhuǎn)換為平穩(wěn)的時(shí)間序列時(shí)所作差分的次數(shù).
p階自回歸模型(AR 模型)中,要使用時(shí)間序列中以前的值,來預(yù)測當(dāng)前值,如當(dāng)p為3 時(shí),表示使用時(shí)間序列中過去3 個(gè)時(shí)段的值,來預(yù)測當(dāng)前值. 可以表示為,其中Yt表示第t時(shí)的觀測值,ε表示常數(shù),φi表示自回歸參數(shù),Yt-i表示Yt的滯后序列,εt表示隨機(jī)誤差項(xiàng).
q階滑動(dòng)平均模型(MA 模型)中,參數(shù)q表示移動(dòng)平均數(shù)的階數(shù),如當(dāng)q為3 時(shí),則在預(yù)測序列的當(dāng)前值時(shí),要考慮上3 個(gè)時(shí)段的平均值的偏差. 表示為,其中bi表示公式的相關(guān)系數(shù).
ARIMA 模型是由自回歸模型(AR)與滑動(dòng)平均模型(MA 模型)結(jié)合而成,可以表示為Yt=ε+,其中Yt表示第t時(shí)的觀測值,ε表示常數(shù),φi表示自回歸參數(shù),Yt-i表示Yt的滯后序列,bi表示公式的相關(guān)系數(shù),εt表示隨機(jī)誤差項(xiàng).
如表1 及圖1,模型中的3 個(gè)參數(shù)確定可以使用的方法有自相關(guān)(ACF)和偏自相關(guān)(PACF)函數(shù)定階法和赤池信息(AIC)準(zhǔn)則,先做出平穩(wěn)的時(shí)間序列的自相關(guān)圖和偏自相關(guān)圖,如果自相關(guān)圖表現(xiàn)出拖尾,且偏自相關(guān)圖表現(xiàn)出p階截尾,那么就選擇AR(p)模型;如果自相關(guān)圖表現(xiàn)出q階截尾,而偏自相關(guān)系數(shù)表現(xiàn)出拖尾,則選擇MA(q)模型;如果自相關(guān)圖和偏自相關(guān)系數(shù)均表現(xiàn)出拖尾,則選擇ARIMA(p,d,q)模型. 通常情況下,當(dāng)只用自相關(guān)圖和偏自相關(guān)圖難以確定階數(shù)時(shí),再結(jié)合AIC 準(zhǔn)則來確定模型的階數(shù). 選擇AIC(p,q)最小的時(shí)候,此時(shí)的p,q為最佳的模型階數(shù).
圖1 模型建立流程圖
表1 定階方法
由于股票中證軍工板塊指數(shù)可以代表軍工板塊的整體情況,利用Python 爬取中證軍工板塊指數(shù)(399967)2014年4月4日至2022年12月31日的日收盤價(jià)數(shù)據(jù)作為樣本數(shù)據(jù),一共為2 020 個(gè). 因?yàn)楣善钡臅r(shí)間序列的走勢波動(dòng)較大,對于大多數(shù)時(shí)間序列與經(jīng)濟(jì)與金融相關(guān)的數(shù)據(jù)都屬于非平穩(wěn)的,時(shí)間序列原始數(shù)據(jù)中可能會(huì)包含趨勢部分、循環(huán)或周期部分以及季節(jié)變動(dòng)部分,需要將不平穩(wěn)序列變?yōu)槠椒€(wěn)序列. 利用R 語言畫出中證軍工板塊收盤價(jià)的時(shí)間序列圖,如圖2. 可以看出中證軍工板塊指數(shù)的時(shí)序圖具有明顯的走勢,則可以初步判斷中證軍工板塊指數(shù)是非平穩(wěn)序列.
圖2 中證軍工板塊指數(shù)的時(shí)序圖
利用R 語言繪制出中證軍工板塊指數(shù)的自相關(guān)圖和偏自相關(guān)圖,如圖3、圖4 所示.
圖3 中證軍工板塊指數(shù)的ACF 圖
圖4 中證軍工板塊指數(shù)的PACF 圖
因?yàn)橹凶C軍工板塊指數(shù)的自相關(guān)函數(shù)是慢慢遞減,而平穩(wěn)序列的自相關(guān)系數(shù)的特點(diǎn)是迅速趨于0,所以該指數(shù)具有非平穩(wěn)性,不能直接建立ARIMA 模型,要先對中證軍工板塊指數(shù)序列做處理,變?yōu)槠椒€(wěn)的序列,這樣才可以用ARIMA(p,d,q)去描述.
因?yàn)楣善笔毡P價(jià)偏大,為了消除原始時(shí)間序列的非平穩(wěn)性,需要對此取對數(shù),取對數(shù)能減少共線性和異方差性出現(xiàn)的概率,然后再做1 階差分處理,處理后的時(shí)序圖如圖5,可以看出作1 階對數(shù)差分后的中證軍工板塊指數(shù)的收益序列在-0.10 和0.10之間,以0 為基準(zhǔn)線上下隨機(jī)波動(dòng),無特別明顯的走勢和對數(shù)差分序列自相關(guān)圖中是迅速變?yōu)? 的,可初步判斷該序列為平穩(wěn)序列.
圖5 1 階對數(shù)差分后的中證軍工板塊指數(shù)時(shí)序圖
根據(jù)以上分析,中證軍工板塊收盤價(jià)的原始時(shí)間序列數(shù)據(jù)經(jīng)過1 階差分處理后得到平穩(wěn)的時(shí)間序列,因此識(shí)別選用ARIMA(p,d,q)模型. 因此可以確立模型中的參數(shù)d為1 . 接下來需要確立模型中另外2 個(gè)參數(shù). 作出AR(p)、MA(q)對數(shù)差分的時(shí)間序列的自相關(guān)圖與偏自相關(guān)圖,見圖6 及圖7,經(jīng)觀察可初步估計(jì)p、q的值. 可知,ACF 圖在Lag=2 時(shí)開始逐步趨近于0,而PACF 圖是截尾的,因此模型AR 的階數(shù)p可以判定為1,2,3,模型MA 的q則為0.
圖6 中證軍工板塊指數(shù)1 階對數(shù)差分ACF 圖
圖7 中證軍工板塊指數(shù)1 階對數(shù)差分PACF 圖
從理論上對中證軍工板塊指數(shù)和1 階對數(shù)差分序列進(jìn)行ADF(單位根檢驗(yàn))的平穩(wěn)性檢驗(yàn),單位根檢驗(yàn)是檢驗(yàn)序列是否平穩(wěn)的主要方法. 本文利用軟件EViews 8.0 對序列進(jìn)行平穩(wěn)性檢驗(yàn),檢驗(yàn)結(jié)果如表2.
表2 ADF 檢驗(yàn)結(jié)果
如表2 所示,在1%的顯著性水平下,原序列P值為0.059 6>0.05,為非平穩(wěn)序列. 進(jìn)一步檢驗(yàn)中證軍工板塊指數(shù)對數(shù)差分后的序列是否通過平穩(wěn)性檢驗(yàn),對數(shù)差分后的序列P值<0.05,日對數(shù)收益率序列通過了檢驗(yàn),對原假設(shè)表示拒絕,即對數(shù)差分后的序列已經(jīng)是平穩(wěn)序列,至此,完成了原始數(shù)據(jù)的平穩(wěn)性處理. 因此可以確定序列是1 階單整序列,則ARIMA(p,d,q)模型中d=1.
利用EViews 分別建立3 個(gè)模型AR(3)、AR(2)和AR(1),同時(shí)比較3 個(gè)模型的赤池信息,如表3 所示. 由表3 可知,AR(2)模型的AIC 值是-4.826 700,是最小的,因此建立ARIMA(2,1,0)模型對應(yīng)的表達(dá)式為:lnat=1.078 206×lnat-1-0.083 336×lnat-2+9.262 814.
表3 3 個(gè)模型的信息
對建立的模型進(jìn)行擬合優(yōu)度和顯著性檢驗(yàn),發(fā)現(xiàn)模型的預(yù)測收益率與實(shí)際的收益率幾乎重合,ARIMA(2,1,0)的判定系數(shù)R2為0.992 254,擬合優(yōu)度很好.
還需要對1 階滯后進(jìn)行殘差序列相關(guān)性檢驗(yàn),由于1 階對應(yīng)的LM 檢驗(yàn)統(tǒng)計(jì)量Obs*R-squared 的P值為0.910 2,表示在5%的顯著性水平下,接受原假設(shè),說明建立的ARIMA(2,1,0)的殘差無自相關(guān)性,即沒有遺落變量,所以滯后階數(shù)選取是合理的.
模型的參數(shù)已經(jīng)估計(jì)后,對已經(jīng)建立的ARIMA(2,1,0)模型的隨機(jī)殘差序列進(jìn)行白噪聲檢驗(yàn). 結(jié)果表明P值都大于0.05,表明全部的Q值小于檢驗(yàn)水平為0.05 的卡方臨界值,拒絕原假設(shè),隨機(jī)誤差項(xiàng)是一個(gè)白噪聲序列,異方差效應(yīng)不顯著,也就是說建立的模型的殘差序列中幾乎沒有包含有用信息,則不需要繼續(xù)對殘差建立GARCH 模型,該模型的建立是合理的.
由于建立的時(shí)間序列模型擬合精度很高,則本文利用上述已經(jīng)建立的ARIMA(2,1,0)模型對股票序列對未來3 天中證軍工板塊指數(shù)收盤價(jià)進(jìn)行預(yù)測,在R 中調(diào)用forecast 函數(shù),預(yù)測2023年1月3日至2023年1月5日3 天的收盤價(jià). 預(yù)測的結(jié)果如表4,結(jié)果表明,建立的ARIMA(2,1,0)模型較為準(zhǔn)確,對該只股票日收盤價(jià)的預(yù)測有很好的現(xiàn)實(shí)意義. 代碼如下:
表4 預(yù)測的收盤價(jià)以及相對誤差
筆者對我國股票中證軍工板塊指數(shù)的日收盤價(jià)格中所獲取的數(shù)據(jù)進(jìn)行處理,依次經(jīng)過平穩(wěn)性檢驗(yàn)、參數(shù)確定、模型建立、異方差檢驗(yàn),再利用ARIMA 模型對中證軍工板塊指數(shù)的日收盤價(jià)建立模型,并預(yù)測未來3 天的收盤價(jià),對金融市場中的股票的基本特征有了更進(jìn)一步的了解. 研究發(fā)現(xiàn),時(shí)間序列模型能很好地解決了一些非平穩(wěn)股票時(shí)間序列的模型建立的問題,且模型非常簡單,容易操作,所涉及的只有內(nèi)生變量股票的收盤價(jià),結(jié)合Eviews 和R 語言可以將時(shí)間序列模型應(yīng)用到其他金融時(shí)間序列,尤其在金融和股票領(lǐng)域有重要的理論意義,預(yù)測值的準(zhǔn)確性對投資者和決策者起著非常重要的作用.
但是由于股票的時(shí)間序列價(jià)格變動(dòng)較大,因此該類模型適合短期預(yù)測,對于長期預(yù)測的結(jié)果會(huì)與真實(shí)值有較大的誤差[9-11]. 因此還有待進(jìn)一步的研究.