董 鑫,王 沁,何 婷,栗浩南
(西南交通大學(xué) 數(shù)學(xué)學(xué)院, 成都 611756)
波動率作為金融市場風(fēng)險的重要指標,能夠在一定程度上量化金融資產(chǎn)價格在一定范圍內(nèi)走勢的不確定性,是對金融市場資產(chǎn)價格的變化速度的體現(xiàn)。因此深入研究導(dǎo)致股票波動的內(nèi)在因素,對金融資產(chǎn)收益的波動進行有效預(yù)測,既為金融資產(chǎn)定價、合理配置資產(chǎn)提供理論和方法上的幫助,也對金融風(fēng)險的管理和防范起到至關(guān)重要的作用,促進中國股票市場繁榮穩(wěn)定發(fā)展。
近年來,隨著信息技術(shù)的不斷完善,日內(nèi)高頻數(shù)據(jù)的獲取日漸容易,基于高頻數(shù)據(jù)對金融市場的波動進行研究已被金融學(xué)術(shù)界所認可。2009年,Coris[1]基于高頻數(shù)據(jù)的已實現(xiàn)波動率(realized volatility,RV)提出了HAR-RV(heterogeneous autoregressive model of the realized volatility)模型,該模型通過簡單的形式模擬出股市波動率序列長記憶性和厚尾分布等特征,相對于GARCH和SV模型等傳統(tǒng)的波動率度量方法可以更加精確地刻畫金融市場波動率[2-4]。隨著研究的深入,HAR模型得到了大量的擴展。Anderson等[5]建立了HAR-RV-J和HAR-RV-CJ模型,證實了跳躍能夠?qū)Σ▌勇暑A(yù)測產(chǎn)生影響。Coris等[6]基于修正的門限多次冪變差構(gòu)建了CTZ統(tǒng)計量并建立了HAR-RV-TCJ模型。Coris等[7]在HAR-RV-J模型的基礎(chǔ)上考慮杠桿效應(yīng),構(gòu)建了LHAR-RV-J模型,證實了杠桿效應(yīng)引入能夠提高模型的波動率預(yù)測能力。Bollerslev等[8]在考慮跳躍和杠桿效應(yīng)的基礎(chǔ)上,同時考慮了市場波動的異方差性,構(gòu)建了HAR-GARCH-BV模型。國內(nèi)學(xué)者文鳳華等[9]考慮到市場杠桿效應(yīng)和交易量長記憶性對波動預(yù)測的影響,建立了LHAR-RV-V模型。陳浪南等[10]綜合考慮到長記憶性、跳躍和杠桿效應(yīng)構(gòu)建了HAR-CJ-D-FIGARCH。馬鋒等[11]基于跳躍和符號正負向變差構(gòu)建了4種含不同跳躍的HAR族模型,研究發(fā)現(xiàn)基于符號正負向跳躍變差的HAR-RV-TCJ模型的預(yù)測效果在眾多模型中表現(xiàn)最好。龔旭等[12]建立了LHAR-CJ-SB模型,研究表明杠桿效應(yīng)和結(jié)構(gòu)突變因素能有效提高HAR族模型的預(yù)測精度。
然而,隨著多重分形理論(multi-fractal theory)的提出和發(fā)展,大多數(shù)學(xué)者認識到,與已實現(xiàn)波動相比,多重分形波動可以對金融市場的非線性、自相似性、厚尾性等特征進行分析, 有效解釋了市場突變、股市暴跌、波動集聚等現(xiàn)象,被認為是描述和解釋金融市場復(fù)雜波動的有力工具[13]。在多重分形波動測度和分析方面,Kantelhardt等[14]提出了多重分形消除趨勢波動分析(multi-fractal detrended fluctuation analysis,MF-DFA)法,用于描述非平滑時間序列在不同標度上的多重分形統(tǒng)計特征。韓晨宇等[15]利用消除趨勢的方法分析了滬深股市的主要指數(shù)的多重分形特征,證實了股票市場存在明顯的多重分形性。由于MF-DFA的一些步驟依賴于經(jīng)驗,同時要求大量的數(shù)據(jù),Sarkar等[16]提出了基于盒計數(shù)(box-counting)來測度多重分形維數(shù),該方法使得多重分形的計算以及準確度得到了較大的提升。魏宇等[17]利用盒計數(shù)的方法,建立了基于多重分形譜的風(fēng)險測度指標,并利用多重分形譜提出了多重分形波動測度MFV。唐勇等[18]以改進的多分形波動率為中心,證實了考慮跳躍、杠桿效應(yīng)及多重分形等特征的HAR模型的預(yù)測效果優(yōu)于傳統(tǒng)的EGARCH-J模型和NGARCH-J模型。 苑瑩等[19]將跳躍、杠桿效應(yīng)和多重分形特征同時考慮到HAR模型中,構(gòu)造出多種HAR類模型,證實了預(yù)測效果最優(yōu)的模型均是基于多分形波動率構(gòu)建的HAR類模型。
在多重分形波動建模方面,Calvet等[20]首先提出將馬爾可夫轉(zhuǎn)換(Markov-switching)引入多重分形過程,并提出了一種新的多重分形迭代模型:馬爾可夫轉(zhuǎn)換多重分形模型(Markov-switching multi-fractal model,MSM),該模型使用馬爾可夫鏈結(jié)構(gòu)保證模型的平穩(wěn)性,能夠很好地刻畫金融資產(chǎn)的多重分形等特性,因此成為多重分形波動模型的典型代表并得到廣泛應(yīng)用。Calvet等[21]將MSM模型和GARCH、MSGARCH模型比較,認為MSM模型能更好地刻畫金融時間序列特征;Chuang等[22]在標普500指數(shù)波動率預(yù)測比較研究中發(fā)現(xiàn),MSM模型比隱含波動率、歷史波動率和標準GARCH模型具有更強的波動率預(yù)測能力;Ben等[23]在全球道瓊斯伊斯蘭市場世界指數(shù)波動率擬合實證研究中發(fā)現(xiàn),MSM模型比FIGARCH和FITVGARCH模型具有更好的擬合數(shù)據(jù)能力;唐振鵬等[24]在對上證綜指的預(yù)測研究中發(fā)現(xiàn),相較于GARCH和FIGARCH模型,MSM-GED是更適合中國股市,預(yù)測能力更強的波動模型。
梳理現(xiàn)有成果可以發(fā)現(xiàn),基于異質(zhì)性市場假說的HAR族模型得到廣泛的研究,同時基于多重分形理論作為復(fù)雜性研究的前沿課題開創(chuàng)了金融市場研究的新局面。鑒于此,考慮金融市場波動的異方差性、長記憶性以及多重分形的特點,對HAR模型進行拓展和改進,具體來說:①將MSM模型與HAR模型有機結(jié)合,構(gòu)造了含二狀態(tài)馬爾可夫轉(zhuǎn)換多重分形波動(binomial Markov-switching multi-fractal volatility,BSMFV)的HAR-BSMFV模型和含三狀態(tài)馬爾可夫轉(zhuǎn)換多重分形波動(trinomial Markov-switching multi-fractal volatility,TSMFV)的HAR-TSMFV模型;②將GARCH模型與HAR模型有機結(jié)合,構(gòu)造含異方差波動(heteroscedasticity volatility,HV)的HAR-HV模型;③將FIGARCH模型與HAR模型有機結(jié)合,構(gòu)造含單分形波動(fractal volatility,F(xiàn)V)的HAR-FV模型;④通過樣本內(nèi)擬合,6種預(yù)測誤差指標以及MCS檢驗,評價并比較HAR-BSMFV、HAR-TSMFV、HAR-HV以及HAR-FV這4種模型的擬合優(yōu)度、穩(wěn)健性及預(yù)測精度。
MSM模型是由Calvet等[20]提出的多重分形模型,該模型使用馬爾可夫鏈結(jié)構(gòu)保證模型的平穩(wěn)性,能夠很好地刻畫金融資產(chǎn)的多重分形等特性。MSM模型的基本結(jié)構(gòu)為:
(1)
(2)
MSM模型波動乘子的取值在一定程度上反映了模型刻畫的多重分形性的強弱。波動乘子取值的最大絕對差越大,模型所能刻畫異常值越多,序列的多重分形性越明顯[26]。由于MSM模型能夠?qū)κ袌龅亩嘀胤中尾▌舆M行測度,而且波動乘子以一階馬爾可夫過程發(fā)生轉(zhuǎn)換,所以稱MSM模型擬合得到的波動為馬爾可夫轉(zhuǎn)換多重分形波動(Markov-switching multi-fractal volatility,SMFV)。
為使用MSM模型對多重分形波動進行測度,首先需要對模型進行參數(shù)估計,一般利用極大似然法對參數(shù)進行估計,并通過對數(shù)似然函數(shù)值對模型進行擬合優(yōu)度檢驗。在正態(tài)分布的假定下,其對數(shù)似然函數(shù)為:
lnL(r1,…,rT;θ)=
(3)
在獲得參數(shù)估計值之后,可得到波動的擬合值,即SMFV,其定義為:
(4)
(5)
(6)
1998年,Andersen等[28]基于日內(nèi)高頻數(shù)據(jù)提出的已實現(xiàn)波動率的測度方法,以刻畫日內(nèi)高頻數(shù)據(jù)的潛在波動性。已實現(xiàn)波動率RVt通過資產(chǎn)日內(nèi)收益率的平方和計算。假設(shè)rt,i為第t個交易日采樣點i和i+1之間資產(chǎn)的對數(shù)收益,即:
rt,i=lnPt,i+1-lnPt,i
式中:t=1,2,…,T;i=1,2,…,L-1,L為單日時間序列采樣點的個數(shù)。對交易日t,已實現(xiàn)波動率RVt定義為:
Corsi[1]基于RV提出了HAR模型,其模型基本結(jié)構(gòu)為:
RVt=ω+α×RVt-1+εt
(7)
式中:εt為隨機擾動項。鑒于MSM模型能夠描述多重分形、異質(zhì)性及跳躍現(xiàn)象,同時考慮到低頻及高頻數(shù)據(jù)的共同使用可以提高模型的預(yù)測能力[29-30],在HAR模型的基礎(chǔ)上,分別將BMSM模型和TMSM模型測度的日間低頻數(shù)據(jù)的多重分形波動,引入HAR模型中,構(gòu)造HAR-BSMFV模型和HAR-TSMFV模型,其模型結(jié)構(gòu)分別為:
RVt=ω+α×RVt-1+β×BSMFVt-1+εt
(8)
RVt=ω+α×RVt-1+β×TSMFVt-1+εt
(9)
式中:ω、α和β為待估參數(shù)。HAR-BSMFV模型和HAR-TSMFV模型可以通過最小二乘法以獲得使殘差平方和達到最小的參數(shù)估計量,即:
金融時間序列通常會出現(xiàn)異方差的現(xiàn)象,因此使用Bollerslev[31]提出的GARCH模型對收益率序列的波動進行擬合,以刻畫收益率的異方差性。常見的GARCH(1,1)模型的結(jié)構(gòu)為:
式中:σt表示t時刻收益率rt的波動率,εt=σtet,et服從標準正態(tài)分布。GARCH模型的估計方法一般采用極大似然法[31]。使用GARCH(1,1)模型對收益率波動進行測度,稱該波動為HV,具體定義為:
(10)
傳統(tǒng)的GARCH模型無法對長記憶性進行刻畫,Baillie等[32]為了刻畫序列存在的長記憶性,即單分形性,對傳統(tǒng)GARCH模型進行改進,構(gòu)造了可以刻畫波動序列長記憶性的FIGARCH模型,常用的FIGARCH(1,d,1)模型的基本結(jié)構(gòu)為:
式中:L為滯后算子,F(xiàn)IGARCH模型的估計一般采用擬極大似然法[32],使用FIGARCH(1,d,1)模型對收益率波動進行測度,稱該波動為FV,具體定義為:
(11)
基于Chuang等[22]提出的HAR族模型,分別將HV和FV引入HAR模型中,得到HAR-HV模型與HAR-FV模型,其模型結(jié)構(gòu)分別為:
RVt=ω+α×RVt-1+β×HVt-1+εt
(12)
RVt=ω+α×RVt-1+β×FVt-1+εt
(13)
式中:ω、α和β為待估參數(shù)。采用最小二乘法對HAR-HV模型和HAR-FV模型的參數(shù)進行估計,即:
為了定量評估預(yù)測精度,遵循Hansen等[33]的建議,采用6種廣泛使用的損失函數(shù)作為評判模型預(yù)測精度的標準,這6種指標分別為:
與此同時,由于僅使用損失函數(shù)無法判斷模型的預(yù)測性能在統(tǒng)計學(xué)意義上是否有顯著差異,還采用Hansen等[34]提出的模型信度設(shè)定(model confidence set,MCS)檢驗方法來比較模型預(yù)測精度。若模型的MCS檢驗p值大于臨界值α,并且MCS檢驗的p值越接近1,表明該模型的預(yù)測性能越好。
以2014年1月2日至2021年3月31日上證綜指為研究樣本(共1 765個交易日)。Bollerslev等[35]證實了使用5 min的采樣間隔可以在盡可能充分利用日內(nèi)信息的同時,避免市場微觀結(jié)構(gòu)帶來的嚴重白噪聲,因此采用5 min的采樣間隔來收集高頻數(shù)據(jù),并以此來捕捉日內(nèi)效應(yīng),同時選用同采樣區(qū)間上證綜指的日對數(shù)收益率來刻畫日間效應(yīng)。將樣本區(qū)間的前80%劃分為樣本內(nèi)擬合數(shù)據(jù),余下的20%作為保留樣本用于預(yù)測性能檢驗。樣本數(shù)據(jù)來源于Wind資訊金融數(shù)據(jù)庫。
使用上證綜指的日對數(shù)收益率序列建立模型以對日間波動進行測度。日對數(shù)收益率的描述性統(tǒng)計及其相關(guān)檢驗數(shù)值如表1所示。從表1中可以發(fā)現(xiàn),上證綜指的日收益率序列不服從正態(tài)分布,存在明顯的尖峰厚尾特征;由ADF檢驗可知序列平穩(wěn);由ARCH檢驗可知序列存在ARCH效應(yīng),可以利用GARCH類模型進行波動率建模。
表1 上證綜指日對數(shù)收益率的描述性統(tǒng)計
表2 MSM類模型對數(shù)似然函數(shù)值
表3 MSM類模型的參數(shù)估計結(jié)果
從表3中的參數(shù)估計結(jié)果中可以發(fā)現(xiàn),BMSM模型波動乘子的高狀態(tài)值即m0為1.543 9,低狀態(tài)即m1為0.456 1,最大絕對差為1.087 8;TMSM模型波動乘子的高狀態(tài)值即m0為1.700 7,低狀態(tài)即m1為0.525 2,最大絕對值差為1.175 5。因此相較于BMSM模型,TMSM模型所能描繪的異常值更多,多重分形性更加明顯。BMSM(6)模型和TMSM(7)模型的轉(zhuǎn)移概率值如表4所示。
表4 MSM類模型的轉(zhuǎn)移概率值
從表4的轉(zhuǎn)移概率可以發(fā)現(xiàn),相較于BMSM模型,在k相同的情況下,TMSM模型的波動乘子發(fā)生轉(zhuǎn)移的概率更小,因此能夠更有效地刻畫長記憶性及市場異質(zhì)性;與此同時, 由于BMSM模型和TMSM模型的每個波動乘子以不同的轉(zhuǎn)移概率發(fā)生轉(zhuǎn)移,通過模型的乘積結(jié)構(gòu),以此來解釋波動的跳躍現(xiàn)象。
分別使用BMSM(6)模型和TMSM(7)模型對市場的多重分形波動進行測度,圖1和圖2是BSMFVt及TSMFVt2種多重分形波動曲線,其中的線框表示框中的波動處于低波動狀態(tài)。從圖1和圖2中可以看出BSMFV和TSMFV不僅可以通過高低波動狀態(tài)不斷轉(zhuǎn)換刻畫市場的跳躍現(xiàn)象,而且可以在一定程度上刻畫出市場波動的異方差性;與此同時,相較于BSMFV,TSMFV以更高維數(shù)的狀態(tài)空間,能夠更好地解釋市場中存在的劇烈波動。
圖1 BSMFV曲線
圖2 TSMFV曲線
同時使用GARCH(p,q)模型及FIGARCH(p,d,q)模型來測度市場的日間波動率??紤]到這2種模型存在對系數(shù)的限制,并且過多滯后項會增加參數(shù)估計的誤差。因此使用GARCH(1,1)模型及FIGARCH(1,d,1)模型,2種模型的參數(shù)估計結(jié)果如表5所示。
表5 GARCH類模型的參數(shù)估計結(jié)果
通過GARCH(1,1)模型及FIGARCH(1,d,1)模型擬合得到波動序列。圖3和圖4分別為HVt和FVt曲線。
圖3 HV曲線
圖4 FV曲線
HVt、FVt、BSMFVt及TSMFVt這4種波動序列的描述性統(tǒng)計結(jié)果如表6所示。從表6的結(jié)果可以發(fā)現(xiàn):4種波動均表現(xiàn)出明顯的“有偏”和“尖峰”性質(zhì),且其Jarque-Bera統(tǒng)計量表明原序列都不符合正態(tài)分布;ADF單位根檢驗表明所有的序列都是平穩(wěn)的;由ARCH檢驗可知4種序列均表現(xiàn)出明顯的異方差性,并且對比檢驗統(tǒng)計量值的大小可知TSMFVt的異方差性最明顯;通過對比多重分形譜極差Δα的大小可以發(fā)現(xiàn),HVt序列的多重分形性最小,TSMFVt序列的多重分形性最強。
表6 4種波動序列的描述性統(tǒng)計
使用HAR、HAR-HV、HAR-FV、HAR-BSMFV及HAR-TSMFV這5種模型對上證綜指進行樣本內(nèi)擬合,并通過擬合結(jié)果對這5種模型的樣本內(nèi)解釋能力進行評判。鑒于波動的對數(shù)序列的分布形態(tài)更加貼近正態(tài)分布,均采用對數(shù)序列進行計量建模。這些模型的樣本內(nèi)擬合結(jié)果如表7所示。從表7中可以看出:
表7 HAR族模型的參數(shù)估計結(jié)果
1) 各模型中前一日的日內(nèi)效應(yīng)和日間效應(yīng)對未來波動率都具有顯著的正向影響,說明市場存在很強的持續(xù)性。具體來說,基于已實現(xiàn)波動率的各模型,除常數(shù)項外其余參數(shù)估計值全部大于0,且在1%的顯著性水平下顯著。
2) 相較于傳統(tǒng)的HAR模型,提出的4種模型的擬合效果大幅提高,其中HAR-TSMFV模型的擬合效果最好,這說明相比其他模型,使用TMSM模型對市場日間波動特征具有更強的解釋能力。具體來說,一方面從R2的視角來看,在原模型分別加入4種日間波動后,模型的R2顯著提高,并且HAR-TSMFV模型的提高效果最大;另一方面,從參數(shù)估計的角度來看,HAR-TSMFV中日間波動的系數(shù)的t統(tǒng)計量值明顯大于其他模型,也就是說,使用TMSM擬合得到的日間收益波動對后一日的波動有更大的正向影響。造成以上現(xiàn)象的原因是,和GARCH以及FIGARCH模型相比,MSM模型多考慮了金融市場具有多重分形性以及跳躍現(xiàn)象的事實,和BMSM相比,TMSM的每個波動乘子有3種狀態(tài),其更高維數(shù)的狀態(tài)空間能夠更好地擬合股票市場的從平緩到劇烈的各種波動。
為了判別HAR、HAR-HV、HAR-FV、HAR-BSMFV和HAR-TSMFV這5種模型誰能更好地預(yù)測中國股市的波動,采用“滑動窗口”的樣本外預(yù)測方法,與此同時使用MSE、MAE、HMSE、HMAE、QLIKE及R2LOG這6種指標以及MCS檢驗對模型的樣本外預(yù)測性能進行對比分析。6種預(yù)測誤差指標值及MCS檢驗的結(jié)果在表8中展示。
表8 不同模型預(yù)測誤差指標值及MCS檢驗結(jié)果
從表8的實證結(jié)果可以發(fā)現(xiàn):
1) 將傳統(tǒng)的HAR模型與提出的4種模型作對比,從預(yù)測誤差指標值的角度來看,除了HAR-FV模型的MSE大于HAR模型,其余的預(yù)測誤差相比HAR模型均有不同程度的降低;從MCS檢驗角度來看,在MAE、HMAE、HMSE、QLIKE及R2LOG5種指標下,僅有傳統(tǒng)的HAR模型沒有通過MCS檢驗,而在MSE指標下,所有模型均通過了MCS檢驗。這表明相較于傳統(tǒng)的HAR模型,同時考慮日內(nèi)效應(yīng)和日間效應(yīng)的HAR族模型的預(yù)測能力更為優(yōu)秀。
2) 對比HAR-HV、HAR-FV、HAR-BSMFV和HAR-TSMFV這4種模型,可以看出HAR-BSMFV模型和HAR-TSMFV模型的6種預(yù)測誤差指標值均小于其他2種模型,這表明在模型中考慮市場的多重分形性及跳躍現(xiàn)象能夠提高模型的預(yù)測能力;與此同時,從MCS檢驗的角度來看,6種預(yù)測指標下的MCS檢驗中,HAR-TSMFV模型的p值均為1,甚至在HMAE、HMSE及QLIKE3種指標下,僅有該模型通過了MCS檢驗,這表明綜合考慮到日間波動的多重分形性、異方差性及跳躍現(xiàn)象,使用更高維數(shù)狀態(tài)空間捕捉市場波動不同狀態(tài)的HAR-TSMFV模型是預(yù)測能力最好的模型。
考慮到日間波動的多重分形性、時變性以及異方差性,分別使用GARCH模型、FIGARCH模型、BMSM模型和TMSM模型對股票市場的日間波動測度,得到HV、FV、BSMFV及TSMFV這4種波動,并將這4種波動引入傳統(tǒng)HAR模型中,構(gòu)建了HAR-HV、HAR-FV、HAR-BSMFV和HAR-TSMFV 4種模型。以上證綜指的日數(shù)據(jù)與5 min高頻數(shù)據(jù)為樣本數(shù)據(jù)的實證研究表明:
1) MSM模型不僅能夠較好地刻畫金融收益序列波動的多重分形性,還能夠在一定程度上刻畫波動異方差性,與此同時MSM類模型的每個波動乘子以不同的轉(zhuǎn)移概率發(fā)生轉(zhuǎn)移,通過模型的乘積結(jié)構(gòu)解釋波動的跳躍現(xiàn)象。
2) 相較于傳統(tǒng)的HAR模型,考慮到股票市場的日間效應(yīng),同時使用高頻數(shù)據(jù)與低頻數(shù)據(jù)的HAR族模型在擬合和預(yù)測方面具有更好的表現(xiàn)。
3) 相較于僅考慮到日間波動異方差性及單分形性的HAR-HV模型和HAR-FV模型,HAR-BSMFV模型和HAR-TSMFV模型的擬合效果和預(yù)測精度更好,表明在波動率建模時考慮股市波動多重分形性有助于提高預(yù)測效果。
4) 相較于HAR-BSMFV模型,HAR-TSMFV模型具有更優(yōu)秀的擬合和預(yù)測效果,這表明考慮到股票收益波動的高、低以及平穩(wěn)3種狀態(tài)是合理的。實證分析表明,HAR-TSMFV模型是一種更適用于中國股市,預(yù)測能力更強的波動模型,在資產(chǎn)定價、風(fēng)險管理領(lǐng)域有廣闊的應(yīng)用前景。