朱萬銳++唐大為
[摘要]當今許多金融問題,例如VaR計算、期權(quán)定價等,都需要首先對收益率的分布特征有比較準確的描述。之前的研究發(fā)現(xiàn)衡量波動性的高頻指標——已實現(xiàn)波動(realized volatility,RV)——可以幫助我們更好地預(yù)測收益率分布。文章探究這個結(jié)論是否適用于中國市場。
[關(guān)鍵詞]高頻指標;市場;收益分布;預(yù)測能力
[DOI]1013939/jcnkizgsc201718063
1引言
我們將異質(zhì)自回歸(HAR)模型(Corsi,2009; Andersen et al,2007)與基準模型EGARCH進行比較,比較的方法是“預(yù)測似然度”。預(yù)測似然度是根據(jù)已實現(xiàn)收益率預(yù)測得出的概率密度,是一種衡量數(shù)據(jù)與模型吻合程度的指標。模型的預(yù)測能力越好,它的預(yù)測似然度就會越大。平均預(yù)測似然度的期限結(jié)構(gòu)能夠顯示RV在長短不同的預(yù)測步數(shù)中有多大的作用。
2數(shù)據(jù)
本文選取2008年1月1日至2015年12月31日期間上證綜指5分鐘交易數(shù)據(jù)作為研究對象。中國股市的開盤時間為9∶30-11∶30和13∶00-15∶00,所以每個交易日會有48個5分鐘交易數(shù)據(jù)。對于每個5分鐘交易數(shù)據(jù),我們計算一個5分鐘連續(xù)復(fù)利對數(shù)收益率,并乘以100進行標準化,記為rt,i(i=1,…,I),其中 I 為第t天里5分鐘收益率的個數(shù)。在中國,I通常等于48,但由于會存在一些交易日提前閉市,所以1945個交易日中一共產(chǎn)生了93360個5分鐘收益率。其中,2008—2012年的數(shù)據(jù)用于模型估計,2013—2015年的數(shù)據(jù)用于預(yù)測,故樣本內(nèi)包含1218個交易日,樣本外包含727個。
3RV定義
RV定義為一段時間內(nèi)收益率的平方和,在股價連續(xù)且沒有測量錯誤時,是波動性的一種無偏估計量(Merton,1980)。未經(jīng)調(diào)整的日RV估計量如下計算:
RVt,u=r2t,i(1)
隨著日內(nèi)收益率頻率的上升,RV會存在偏誤問題——即市場微觀噪音(Fang,1996; Andreou and Ghysels,2002; Oomen,2002; Bai、Russell and Tiao,2004)。為了消除有偏性和不一致性,我們采用Hansen and Lunde(2006)所建議的Bartle 權(quán)重對RV進行調(diào)整,經(jīng)調(diào)整的RV如下計算:
RVt,ACq=r2t,i+2qj=1[(1-jq+1)It-ji=1(rt,irt,i+j)],其中,q=1,2,3(2)
為了跟波動性指標相匹配,日收益率應(yīng)該使用每天收盤價和開盤價之間的對數(shù)差,同樣乘以100來標準化。我們將日收益率的方差設(shè)為基準,不同RV的均值與其均值做比較,選擇最接近的RV用于HAR-RV模型。經(jīng)過統(tǒng)計性分析,日收益率的方差為2761572;當q=0,1,2,3時,RV的均值分別為2151439、2114523、20197238、2162044。可以看出,未經(jīng)調(diào)整的RV確實存在很大的偏誤。當q=2時,RV2的均值與日收益率的方差最接近,所以,HAR-RV模型采用RV2。
HAR-RV模型的估計結(jié)果
ln(RVt)=ω+1ln(RVt-1)+2ln(RVt-5,5)+3ln(RVt-22,22)+Vt
Coefficients
ω123
-006955028251028352037673
4基準模型
我們在GARCH族中考慮了三種模型:GARCH、EGARCH和TGARCH。經(jīng)回歸EGARCH模型的最大似然度最大,因此選擇EGARCH(1,1)作為基準模型。
5HAR-RV模型
Corsi(2009)提出了一個新模型——已實現(xiàn)波動的異質(zhì)自回歸模型(HAR-RV)。在這個模型中我們可以加入日內(nèi)數(shù)據(jù),模型設(shè)定如下:
rt=σtεt,εt~NID0,1
ln(RVt)=ω+1ln(RVt-1)+2ln(RVt-5,5)+3ln(RVt-22,22)+υt(3)
51收益率過程
在標準HAR-RV模型中,高頻收益率過程只由日波動率[AKσ~](d)t決定。模型假設(shè)[AKσ~](d)t=σ(d)t,其中σ(d)t是日波動率。收益率過程如下所示:
rt=σ(d)tεt,εt~NID0,1(4)
52RVt 等式
HAR-RV的波動性主要來自三方面:進行日或更高頻交易的短期交易者,每周進行倉位調(diào)整的中期投資者和投資周期高達一至數(shù)月的長期投資者。所以,RV定義如下:
ln(RVt)=ω+1ln(RVt-1)+2ln(RVt-5,5)+3ln(RVt-22,22)+υt(5)
其中RVt-1、RVt-5、RVt-22分別為衡量短期(日)、中期(周)和長期(月)的波動,其計算如下:
ln(RVt-h,h)≡1hh-1i=0n(RVt-h+i)ln(RVt-1,1)≡ln(RVt-1)(6)
53σt 和 RVt之間的關(guān)系
文獻中有兩種方法將RV與收益率方差聯(lián)系起來:一是假設(shè)日收益率的有條件方差等于日RV的有條件期望;二是假設(shè)收益率方差和RV等同。Forsberg和Bollerslev(2002)、Bollerslev et al(2009)和John et al(2011)在相似的研究中使用了第二種方法,所以在本文我們也使用第二種假設(shè)。
54HAR-RV模型估計
基于以上假設(shè),對HAR-RV模型進行回歸,我們得到估計模型如下:
ln(RVt)=-006955+0282521ln(RVt-1)+028352ln(RVt-5,5)+037673ln(RVt-22,22)
上述模型將用于接下來的預(yù)測似然度計算。
6分布預(yù)測
61平均預(yù)測似然度
John和Thomas(2011)認為在評價預(yù)測能力時多步預(yù)測更好,本文與John和Thomas(2011)的目的相同,所以仿照其多步預(yù)測的方法來評價兩個模型預(yù)測能力。對于樣本外觀測值t=τ+kmax,…,T-k,其平均預(yù)測似然度計算如下:
Dk=1T-τ-kmax+1T-kt=τ+kmax-klnfk(rt+k[JB)|]Φt,θ),k≥1(7)
其中fk(rt+k[JB)|]Φt,θ)是向前k期預(yù)測的概率分布,T是總樣本中觀測到的交易日個數(shù),k是向前預(yù)測的時間跨度,樣本外數(shù)據(jù)從τ到T。在我們的樣本中,T=1945,τ=1219,kmax=60。Dk越大,模型預(yù)測的準確性越好。
62向前k期預(yù)測的概率分布
我們使用以下公式計算向前k期預(yù)測的概率分布,
fk(rt+k[JB)|]Φt,θ)=∫f(rt+k[JB)|]μ,σ2t+k)p(σ2t+k[JB)|]Φt)dσ2t+k
≈1NNi=1f(rt+k[JB)|]μ,σ2(i)t+k)σ2(i)t+k~p(σ2t+k[JB)|]Φt)(8)
其中 f(rt+k[JB)|]μ,σ2(i)t+k)是基于t+k期的真實收益率,服從均值為μ,方差為σt+k2的正態(tài)分布。
63計算
首先,對于每一個模擬n次1步至60步向前預(yù)測,得到相應(yīng)的標準差。對于每一個預(yù)測跨度,只保留[1279-k,1945-k]這部分,以保證所有預(yù)測都落入到這段區(qū)間。由于對每一個起點的每一個k步預(yù)測都有n次模擬,所以將t∈[1279-k,1945-k]中全部的f(rt+k[JB)|]μ,σ2(i)t+k)求取平均值,作為fk(rt+k[JB)|]Φt,θ),進而再計算fk(rt+k[JB)|]Φt,θ)的平均值,其中t∈[1279-k,1945-k]。最后,根據(jù)式(8),可以計算出Dk。
7結(jié)論
圖1圖2為R語言模擬計算出來的Dk值,橫軸表示預(yù)測步數(shù),縱軸表示每一步所對應(yīng)的平均預(yù)測似然度,分別顯示了模擬100次和1000次時,HAR-RV模型與EGARCH模型的預(yù)測能力對比。我們有以下發(fā)現(xiàn)。
模擬100次時,HAR模型的似然度在步數(shù)不大于30的情況下會比EGARCH大。當模擬1000次時,相同的情況發(fā)生在預(yù)測步數(shù)不大于37時:
(1)對于短期預(yù)測,HAR模型能大幅提高預(yù)測效果,然而在預(yù)測中國的長期市場時并不有效。我們認為,導(dǎo)致這種現(xiàn)象的原因在于中國市場受到很多非市場因素的影響,且這些因素會隨時間變化。HAR模型更多地依賴于歷史數(shù)據(jù),非市場因素的變化會導(dǎo)致歷史數(shù)據(jù)“失效”。
(2)隨著模擬次數(shù)的增加,HAR的似然度降到EGARCH以下所需的步數(shù)會越來越大,所以我們推斷,如果能夠模擬無數(shù)次,HAR的預(yù)測能力會比本文所展現(xiàn)得更優(yōu)秀。
(3)圖1和圖2均顯示出HAR的平均預(yù)測似然度的期限結(jié)構(gòu)呈現(xiàn)負斜率。
圖1模擬100次圖2模擬1000次
參考文獻:
[1]John,MM,Thomas,HMDo High-frequency Measures of Volatility Improve Forecasts of Return Distributions[J].Journal of Econometrics,2011(160):69-76
[2]Amisano,G,Giacomini,RComparing Density Forecasts via Weighted Likelihood Ratio Tests[J]Journal of Business and Economic Statistics,2007,25(2):177-190
[3]Bollerslev,T,Kretschmer,U,Pigorsch,C,Tauchen,GA Discrete-time Model for Daily S&P500 Returns and Realized Variations:Jumps and Leverage EffectsJournal of Econometrics,2009,150(2):151-166