謝海寧,尚 園
(武漢紡織大學(xué),武漢430200)
1984年,我國第一支股票公開發(fā)行預(yù)示著我國金融市場迎來了改革開放,進入21世紀以后,股票投資已經(jīng)成為國民理財不可缺少的一部分。對于投資者來說,能夠預(yù)測股票未來發(fā)展趨勢對于其投資理財規(guī)劃具有非常深刻的意義。伴隨著股票市場的繁榮,股民們不斷尋求各種辦法判斷選擇最優(yōu)的投資組合,追求最大化自身收益。近年來,國內(nèi)外都由此興起了數(shù)家圍繞著股票價格進行預(yù)測的社交平臺,網(wǎng)友們自由發(fā)表自己預(yù)測股票價格走勢的經(jīng)驗,學(xué)者們也在積極研究更加精準有效的股票價格預(yù)測算法。本文將主要對ARMA模型進行介紹,以中信銀行歷史數(shù)據(jù)建模,建立股票價格預(yù)測模型預(yù)測其未來一個月中信銀行(股票代碼:601988)的股票價格走勢。然后對ARMA模型預(yù)測效果進行評析,通過分析結(jié)果為投資者提供一些合理的投資建議。
自回歸滑動平均模型(簡稱:ARMA模型)是一種隨機時間序列分析模型,由博克斯(Box)和詹金斯(Jenkins)于20世紀70年代創(chuàng)立。它的基本思想是:某些時間序列是依賴于時間的一族隨機變量,構(gòu)成該時序的單個序列值雖然具有不確定性,但是整個序列的變化卻有一定的規(guī)律性,可以通過相應(yīng)的數(shù)學(xué)模型進行近似描述。[1]在ARMA模型中,對一組指標序列進行預(yù)測時,主要利用過去值、當期值以及滯后隨機擾動項的加權(quán)建模,從而解釋并且預(yù)測時間序列的變化發(fā)展規(guī)律。[2]建立ARMA模型進行時間序列預(yù)測分析時,該時間序列必須是平穩(wěn)的。
假設(shè)yt是一個平穩(wěn)的時間序列,對yt時間序列進行分類討論:
當yt是它的前期值和隨機項的線性函數(shù)時,就被稱為p階自回歸模型,記AR(p)。表達式為:
其中,βi(i=1,2,3,...,p)是待估系數(shù),εt為白噪聲。
當yt是當期值和前期值的誤差和隨機項的線性函數(shù)時,就被稱為q階移動平均模型,記MA(q)。表達式為:
其中,α1(i=1,2,3,...,p)是待估系數(shù)。
當yt是當期值和前期值的誤差與隨機項,以及前期值的線性函數(shù),就被稱為自回歸移動平均序列,記作ARMA(p,q)。表達式為:
其中,β1(i=1,2,3,...,p)和α1(i=1,2,3,...,p)都是待估系數(shù),{εi}是為白噪聲序列,通俗點來說,ARMA(p,q)就是一個“混合”模型,將AR模型和MA模型結(jié)合在一起,使得所使用的參數(shù)個數(shù)最少。
首先,ARMA模型建立的前提條件是目標時間序列必須滿足平穩(wěn)性和白噪聲的要求。這里采用ADF檢驗研究序列的平穩(wěn)性,觀察殘差序列的自相關(guān)圖判斷是否是白噪聲。其次,針對模型的選擇和定階問題,這里通過自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì),以及AIC準則和SC準則來確定。
1.ADF檢驗
ADF檢驗又稱為單位根檢驗,如果被檢測的序列中存在單位根,則該序列非平穩(wěn)。表達式為:
原假設(shè):序列至少存在一個單位根;備擇假設(shè):沒有一個單位根。
若p>=α,則不能拒絕原假設(shè),即存在單位根,序列非平穩(wěn);反之拒絕原假設(shè),即不存在單位根,序列平穩(wěn)。
2.白噪聲檢驗
白噪聲就是均值為零、方差為常數(shù)的穩(wěn)定隨機序列,計量模型中的隨機誤差項必須是白噪聲,模型才有經(jīng)濟意義。表達式為:
H1:至少存在某個ρk≠0
原假設(shè):自相關(guān)函數(shù)均為零,滯后m階序列值相互獨立;備擇假設(shè):至少存在一個自相關(guān)函數(shù)不為零,滯后m期的序列之間存在相關(guān)性。
當p>=α時,則不能拒絕原假設(shè),序列為白噪聲;反之拒絕原假設(shè),序列為非白噪聲。
3.根據(jù)自相關(guān)函數(shù)和偏自相關(guān)函數(shù)性質(zhì)的方法
AR(p)的自相關(guān)函數(shù)是拖尾的,即會按指數(shù)衰減,或者正弦振蕩衰減,偏自相關(guān)函數(shù)是截尾的,截尾處為自回歸階數(shù);MA(q)模型的自相關(guān)函數(shù)是截尾的,截尾處對應(yīng)移動平均階數(shù)q,偏自相關(guān)函數(shù)則是拖尾的;ARMA(p,q)模型的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)都是拖尾的,自相關(guān)函數(shù)是q-p步拖尾,偏自相關(guān)函數(shù)是p-q步拖尾。[3]
4.AIC信息準則(Akaike information criterion)和SC準則(Schwarz Criterion)
AIC和SC的指標都是負數(shù),一般值越小表示模型越精簡(絕對值越大越好)。通過逐期增加模型的滯后變量建立模型,比較每個模型中AIC和SC統(tǒng)計量,取最小的統(tǒng)計量對應(yīng)的滯后期數(shù)作為模型的階數(shù)。
博克斯(Box)和詹金斯(Jenkins)針對ARMA模型的選擇時提倡應(yīng)該遵循節(jié)儉性(parsimony)原則,并提出建模過程的系統(tǒng)方法論,稱為Box-Jenkins方法論。該方法包括四個階段:第一,通過ADF檢驗判斷觀測序列是否是平穩(wěn)序列,若不是,可通過差分變換將觀測序列轉(zhuǎn)化為平穩(wěn)序列;第二,根據(jù)自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì)以及AIC準則和SC準則判斷出合適的ARMA模型(確定階數(shù))用于分析;第三,利用最小二乘法估計模型的未知參數(shù);第四,檢驗構(gòu)建的ARMA模型是否滿足模型的假設(shè)前提,其殘差序列是否是白噪聲,若不是或者存在一定的偏差,模型則需要修正;第五,使用得到的模型進行預(yù)測。
本文數(shù)據(jù)來源于同花順財經(jīng)網(wǎng),選取中信銀行2018年1月1日至2019年12月31日的股票日開盤價數(shù)據(jù),共計487個樣本數(shù)據(jù)。接下來基于ARMA模型的理論下,利用EViews 8對中信銀行的未來股票價格走勢進行分析預(yù)測。
1.檢驗原始數(shù)據(jù)序列是否為平穩(wěn)序列
根據(jù)ARMA模型建模的前提要求,對原始樣本數(shù)據(jù)進行平穩(wěn)性檢驗,將中信銀行487組樣本數(shù)據(jù)導(dǎo)入EViews 8軟件中,并且畫出其時間序列圖,觀察圖形走勢,可以初步判斷該時間序列是非平穩(wěn)的,進一步對原始數(shù)據(jù)選擇含有截距項和趨勢項的ADF檢驗,其t值為-1.444275,p值為0.8468接近于1,t值的絕對值小于1%的顯著性水平下的臨界值,所以不拒絕原假設(shè),該時間序列為非平穩(wěn)序列。再次對該時間序列進行含有截距項、不含有截距項和趨勢項兩種情況的ADF檢驗,發(fā)現(xiàn)結(jié)果均不拒絕原假設(shè),該時間序列是非平穩(wěn)序列。
對該時間序列進行平穩(wěn)化處理,對原始數(shù)據(jù)進行一階差分,一階差分后的時間序列圖以及ADF檢驗,t值為-21.68150,其絕對值大于1%的顯著性水平下的臨界值,p值為0,所以拒絕原假設(shè),一階差分后的序列為平穩(wěn)序列。接下來以一階差分后的序列進行建模分析。
2.確定最優(yōu)的ARMA模型
觀察原始數(shù)據(jù)的自相關(guān)圖和偏自相關(guān)圖,可見原始數(shù)據(jù)的相關(guān)圖衰減很慢,因此原始數(shù)據(jù)序列是非平穩(wěn)序列,畫出一階差分后的DY序列的自相關(guān)圖和偏自相關(guān)圖,發(fā)現(xiàn)DY序列的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)迅速趨于0,圍繞著0上下波動,并且均存在明顯的拖尾,依據(jù)模型識別的基本原則,將建立ARMA模型。
通過圖6可知模型中的p、q值可選取1或者2,因此我們選取ARMA(1,1)、ARMA(1,2)、ARMA(2,1)、ARMA(2,2)四種模型進行比較,根據(jù)AIC準則和SC準則選取最優(yōu)模型,結(jié)果顯示ARMA(2,2)模型的AIC和SC統(tǒng)計量最小,該模型最優(yōu)。
表1 AIC/SC/HQ統(tǒng)計量結(jié)果匯總表
3.建立ARMA(2,2)模型和參數(shù)估計
觀察ARMA(2,2)模型的估計結(jié)果,可以看出參數(shù)估計值中AR(1)、AR(2)、MA(1)、MA(1)的系數(shù)具有統(tǒng)計意義,而常數(shù)項的p值為0.31,并不顯著,故剔除。剔除之后,重新對模型ARMA(2,2)進行估計和檢驗,結(jié)果表明:模型的系數(shù)依然顯著,但是AIC和SC統(tǒng)計量增大,故為了擬合效果更好選擇保留常數(shù)項。因此,模型表達式可以寫成:
其中,εt為殘差序列。
4.對模型進行檢驗
一是白噪聲檢驗。接下來對參數(shù)估計后的殘差序列進行白噪聲檢驗,若殘差序列為非白噪聲序列,則建立的AEMA模型仍然需要改進。畫出殘差序列的自相關(guān)圖和偏自相關(guān)圖,可知該殘差序列的p值都大于0.05,這表明所有的Q值都小于0.05的顯著性水平下的卡方分布臨界值,且自相關(guān)與偏自相關(guān)圖顯著趨于0,即殘差序列不存在自相關(guān),該序列是白噪聲序列。綜上所述,ARMA(2,2)模型符合要求,可以運用ARMA(2,2)模型對中信銀行未來股價進行預(yù)測。二是模型的預(yù)測。利用AEMA(2,2)模型對中信銀行2019年12月31日后的22天的股票價格進行預(yù)測,動態(tài)預(yù)測幾乎成一條直線,故選擇采取靜態(tài)預(yù)測。將預(yù)測結(jié)果與實際的股票價格進行對比,擬合趨勢圖可以看出,其實預(yù)測結(jié)果還是較好的,尤其是前15日,后5日的預(yù)測值與實際值的誤差偏離比較大,因此,模型對短期內(nèi)的股票價格走勢預(yù)測能夠得到一個比較好的結(jié)果,但是就長期而言,影響股票價格波動的因素太多,比如宏觀政策調(diào)控(例如《中華人民共和國外商投資法》正式發(fā)布),重大突發(fā)性事件的發(fā)生(例如新冠肺炎)等,ARMA模型就無法對股票價格進行準確的預(yù)測了。
1.優(yōu)點
圖1預(yù)測結(jié)果與實際值對比圖
通過對中信銀行2018年1月1日至2019年12月31日共計487組開盤價數(shù)據(jù)預(yù)處理,利用一階差分后的序列構(gòu)建AEMA(2,2)模型,利用靜態(tài)預(yù)測方法預(yù)測未來22日的股票價格走勢,預(yù)測結(jié)果總體較好。股票市場瞬息萬變,其走勢一般是非平穩(wěn)的,通過ARMA模型預(yù)測短期內(nèi)的股票價格具有一定的實踐意義,投資者可以根據(jù)模型預(yù)測結(jié)果判斷某只股票短期內(nèi)的盈虧變化,有助于幫助投資者進行理性理財。
2.缺點
ARMA模型針對的是平穩(wěn)序列,在對數(shù)據(jù)的處理方面可能產(chǎn)生系統(tǒng)誤差,股票每日開盤價收集會存在一些缺失值,也會導(dǎo)致模型擬合時存在誤差;其次,現(xiàn)實中有諸多因素可能導(dǎo)致股票價格變化,而且AEMA模型針對短期預(yù)測具有較好的效果,不能對股票長期走勢進行預(yù)測。
本文對中信銀行(股票代碼:601988)2018年1月1日至2019年12月31日期間共計487組每日開盤價數(shù)據(jù)進行處理,以該組數(shù)據(jù)一階差分后的序列為建?;A(chǔ)構(gòu)建ARMA模型,對中信銀行未來22日的股票價格進行估計。結(jié)果顯示前15日預(yù)測值與實際值誤差偏離較小,后5日誤差偏離顯著較大。因此,得出結(jié)論,ARMA模型針對短期內(nèi)的股票價格進行預(yù)測,具有較大的參考價值,但是就長期而言,預(yù)測結(jié)果具有較大偏差。投資者在進行投資決策時,可以利用ARMA模型對短期內(nèi)的股票價格進行預(yù)測,制定短期投資計劃。就長期而言,更需要不斷探索更加準確的股票價格預(yù)測模型。