馬育欣,王純杰,秦喜文,董小剛
(長春工業(yè)大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,吉林 長春 130012)
由于股市的變化趨勢與多種因素緊密相連,比如上市公司的經(jīng)營狀況、匯率變動、經(jīng)濟政策等因素,使其變化規(guī)律十分繁復(fù),變化周期讓人無法捕捉。從股市表面上看,股票價格波動缺少一定的規(guī)律性,使得股票市場的變化趨勢難以預(yù)測。
美國國家宇航員Huang N E等[1]首次在1998年提出經(jīng)驗?zāi)B(tài)分解(EMD)的新型信號處理方法,并于次年對該方法進行了改進。這種方法的基本原理是將信號中不同特征尺度的序列逐個分離出來,分解出來的IMF序列體現(xiàn)了原信號的不同特征尺度,可以更準(zhǔn)確地反映原信號的內(nèi)在特征。2011年,劉海飛等[2]將EMD方法應(yīng)用于股價的短期預(yù)測中,證明EMD方法比使用小波分析方法預(yù)測效果更好。2012年,蔡赟姝等[3]采用EMD方法對上證綜合指數(shù)進行研究。2013年,宋國鋒等[4]運用EMD分解對含噪聲的數(shù)據(jù)進行噪聲剔除處理,得到信噪比品質(zhì)較好的數(shù)據(jù)形態(tài),對估計和預(yù)測高頻數(shù)據(jù)的走勢有一定的參考價值。2014年,白潔等[5]用EMD-GARCH方法將余額寶收益率原始數(shù)據(jù)分解重組,并對其進行了預(yù)測。
1982年,美國統(tǒng)計學(xué)家Engle R F[6]提出了自回歸條件異方差(ARCH)模型。直到1986年,Tim Bollerslev改變了ARCH模型的限制條件,提出了廣義自回歸條件異方差(GARCH)模型。2014年,陳雙等[7]利用GARCH族模型對國際油價的波動性進行分析。2015年,史美景等[8]建立了Spline-GARCH-EMD模型,檢驗長期股票市場風(fēng)險與宏觀經(jīng)濟變量的關(guān)系。2015年,桑秀麗等[9]建立了基于ARIMA-GARCH與拋物線的CPI組合預(yù)測模型的方法。
文中綜合EMD分解ARMA-GARCH模型,目的在于找到能夠更好地預(yù)測短期內(nèi)股票收盤價的模型,通過對股票收盤價數(shù)據(jù)的分析能夠更精準(zhǔn)預(yù)測短期內(nèi)股票收盤價的走勢,以獲得更多的利潤,更加有效地規(guī)避風(fēng)險。
EMD方法被普遍認(rèn)為是信號處理的一個重大進步,Huang N E等[1]提出的EMD引入了IMF,證明EMD方法的完備性和IMF的正交性。EMD內(nèi)的算法步驟如下:
1)對于給定的原始時間序列x(t),用三次樣條插值法得出的局部極大值和極小值來創(chuàng)建上包絡(luò)線和下包絡(luò)線。
2)計算上下包絡(luò)的平均值m1。
3)從x(t)中減去上下包絡(luò)的平均值m1,以獲得第一個IMF分量h(t)=x(t)-m1。
4)通過將h(t)視為新的x(t)重復(fù)步驟1)~3),直到滿足以下停止標(biāo)準(zhǔn)之一:
(i)m1接近零;
(ii)h(t)的過零和極值的數(shù)量最多相差一;
(iii)達到預(yù)定義的最大迭代。
5)將h(t)視為IMF,并計算殘差r(t)=x(t)-h(t)。
6)使用殘差r(t)作為新的x(t)來找到下一個IMF。重復(fù)步驟1)~5),直到獲得所有IMF。
最后,原始時間序列x(t)被分解為
式中:n----取決于原始時間序列x(t);
ci----第i個IMF分量;
rn----趨勢項。
GARCH模型適用于隨機誤差存在異方差性時,自回歸表示預(yù)測值與歷史數(shù)據(jù)存在相關(guān)關(guān)系。GARCH模型由兩個方程組成:一個是條件均值模型;另一個是條件方差方程,可分別寫為以下兩式:
yt=λyt-1+εt,εt∈N(0,σt),
(1)
(2)
p≥0,q>0,
式中:λ----均值方程的系數(shù)項;
ω----截距項;
首先用EMD方法將序列分解為若干個不同頻率的IMF和殘差序列。對于這些IMF序列和殘差序列分別采用不同參數(shù)的ARMA-GARCH模型進行擬合和預(yù)測,將各組預(yù)測值相加后得到最終預(yù)測值。具體流程如圖1所示。
選取貴州茅臺(600519)從2017年3月15日至2019年3月27日共497個股票收盤價作為研究數(shù)據(jù),時間間隔為1日,預(yù)測2019年3月28日至2019年4月3日的股票收盤價。在預(yù)測研究中使用了Matlab、Eviews,以及R軟件3.5.3版對數(shù)據(jù)進行研究分析,EMD分解通過Matlab軟件的EMD工具包實現(xiàn),ARIMA-GARCH模型建立和數(shù)據(jù)預(yù)測通過Eviews實現(xiàn),各種檢驗以及時序圖是通過R軟件完成的。
原始序列股票收盤價的時序圖如圖2所示。
圖1 EMD-GARCH模型建??蚣?/p>
圖2 原始序列股票收盤價的時序圖
從圖2中可以看出,該序列是非平穩(wěn)序列,所以對于原始序列先進行一階差分使其平穩(wěn),再對原始序列擬合ARIMA(1,1,1)-GARCH(1,1)模型。
對原始序列進行EMD分解,得到6個IMF序列和1個殘差序列,部分IMF序列及趨勢項序列如圖3所示。
圖3 部分IMF序列及趨勢項序列
它們分別表示原始股票收盤價在同一時間段內(nèi)的不同頻率和振幅,最后一個序列為趨勢項。從殘差序列的時序圖可以看出,該股票的收盤價格是不斷增大的。
對分解得到的7個序列分別擬合ARMA-GARCH模型,結(jié)果見表1。
對分解后的序列和殘差序列所建模型預(yù)測2019年3月28日至2019年4月3日的股票收盤價格,將得到的預(yù)測數(shù)據(jù)相加,計算得出最終的預(yù)測序列,再將其與原始數(shù)據(jù)所建模型得到的預(yù)測序列比較,并進行誤差分析。
預(yù)測結(jié)果比較見表2。
從表2可以看出,與使用未分解序列建模擬合ARIMA-GARCH模型的預(yù)測結(jié)果相比,明顯是基于EMD-GARCH 模型的預(yù)測結(jié)果的相對誤差更小,基于EMD分解股票收盤價預(yù)測模型所得到的結(jié)果精度更高。
表1 IMF序列擬合模型
表2 預(yù)測結(jié)果比較
通過對原始序列進行EMD分解,得到6個IMF序列和1個殘差序列后,對各個IMF序列和殘差序列擬合ARMA-GARCH模型,往后預(yù)測5 d股票收盤價,然后再將這7個序列的預(yù)測數(shù)據(jù)相加得到最終預(yù)測數(shù)據(jù)。并將它與原始序列建模擬合得到的預(yù)測結(jié)果進行比較,結(jié)果表明,EMD-GARCH模型的預(yù)測效果更優(yōu)??梢钥吹?該方法能準(zhǔn)確地預(yù)測短期內(nèi)股票收盤價的走勢,相對誤差較小,其預(yù)測結(jié)果在誤差允許的范圍內(nèi)具有很大的參考價值,有助于股票投資者做出正確的投資選擇,從而規(guī)避風(fēng)險獲取利益。