朱萬(wàn)銳++唐大為
[摘要]當(dāng)今許多金融問(wèn)題,例如VaR計(jì)算、期權(quán)定價(jià)等,都需要首先對(duì)收益率的分布特征有比較準(zhǔn)確的描述。之前的研究發(fā)現(xiàn)衡量波動(dòng)性的高頻指標(biāo)——已實(shí)現(xiàn)波動(dòng)(realized volatility,RV)——可以幫助我們更好地預(yù)測(cè)收益率分布。文章探究這個(gè)結(jié)論是否適用于中國(guó)市場(chǎng)。
[關(guān)鍵詞]高頻指標(biāo);市場(chǎng);收益分布;預(yù)測(cè)能力
[DOI]1013939/jcnkizgsc201718063
1引言
我們將異質(zhì)自回歸(HAR)模型(Corsi,2009; Andersen et al,2007)與基準(zhǔn)模型EGARCH進(jìn)行比較,比較的方法是“預(yù)測(cè)似然度”。預(yù)測(cè)似然度是根據(jù)已實(shí)現(xiàn)收益率預(yù)測(cè)得出的概率密度,是一種衡量數(shù)據(jù)與模型吻合程度的指標(biāo)。模型的預(yù)測(cè)能力越好,它的預(yù)測(cè)似然度就會(huì)越大。平均預(yù)測(cè)似然度的期限結(jié)構(gòu)能夠顯示RV在長(zhǎng)短不同的預(yù)測(cè)步數(shù)中有多大的作用。
2數(shù)據(jù)
本文選取2008年1月1日至2015年12月31日期間上證綜指5分鐘交易數(shù)據(jù)作為研究對(duì)象。中國(guó)股市的開(kāi)盤(pán)時(shí)間為9∶30-11∶30和13∶00-15∶00,所以每個(gè)交易日會(huì)有48個(gè)5分鐘交易數(shù)據(jù)。對(duì)于每個(gè)5分鐘交易數(shù)據(jù),我們計(jì)算一個(gè)5分鐘連續(xù)復(fù)利對(duì)數(shù)收益率,并乘以100進(jìn)行標(biāo)準(zhǔn)化,記為rt,i(i=1,…,I),其中 I 為第t天里5分鐘收益率的個(gè)數(shù)。在中國(guó),I通常等于48,但由于會(huì)存在一些交易日提前閉市,所以1945個(gè)交易日中一共產(chǎn)生了93360個(gè)5分鐘收益率。其中,2008—2012年的數(shù)據(jù)用于模型估計(jì),2013—2015年的數(shù)據(jù)用于預(yù)測(cè),故樣本內(nèi)包含1218個(gè)交易日,樣本外包含727個(gè)。
3RV定義
RV定義為一段時(shí)間內(nèi)收益率的平方和,在股價(jià)連續(xù)且沒(méi)有測(cè)量錯(cuò)誤時(shí),是波動(dòng)性的一種無(wú)偏估計(jì)量(Merton,1980)。未經(jīng)調(diào)整的日RV估計(jì)量如下計(jì)算:
RVt,u=r2t,i(1)
隨著日內(nèi)收益率頻率的上升,RV會(huì)存在偏誤問(wèn)題——即市場(chǎng)微觀(guān)噪音(Fang,1996; Andreou and Ghysels,2002; Oomen,2002; Bai、Russell and Tiao,2004)。為了消除有偏性和不一致性,我們采用Hansen and Lunde(2006)所建議的Bartle 權(quán)重對(duì)RV進(jìn)行調(diào)整,經(jīng)調(diào)整的RV如下計(jì)算:
RVt,ACq=r2t,i+2qj=1[(1-jq+1)It-ji=1(rt,irt,i+j)],其中,q=1,2,3(2)
為了跟波動(dòng)性指標(biāo)相匹配,日收益率應(yīng)該使用每天收盤(pán)價(jià)和開(kāi)盤(pán)價(jià)之間的對(duì)數(shù)差,同樣乘以100來(lái)標(biāo)準(zhǔn)化。我們將日收益率的方差設(shè)為基準(zhǔn),不同RV的均值與其均值做比較,選擇最接近的RV用于HAR-RV模型。經(jīng)過(guò)統(tǒng)計(jì)性分析,日收益率的方差為2761572;當(dāng)q=0,1,2,3時(shí),RV的均值分別為2151439、2114523、20197238、2162044??梢钥闯觯唇?jīng)調(diào)整的RV確實(shí)存在很大的偏誤。當(dāng)q=2時(shí),RV2的均值與日收益率的方差最接近,所以,HAR-RV模型采用RV2。
HAR-RV模型的估計(jì)結(jié)果
ln(RVt)=ω+1ln(RVt-1)+2ln(RVt-5,5)+3ln(RVt-22,22)+Vt
Coefficients
ω123
-006955028251028352037673
4基準(zhǔn)模型
我們?cè)贕ARCH族中考慮了三種模型:GARCH、EGARCH和TGARCH。經(jīng)回歸EGARCH模型的最大似然度最大,因此選擇EGARCH(1,1)作為基準(zhǔn)模型。
5HAR-RV模型
Corsi(2009)提出了一個(gè)新模型——已實(shí)現(xiàn)波動(dòng)的異質(zhì)自回歸模型(HAR-RV)。在這個(gè)模型中我們可以加入日內(nèi)數(shù)據(jù),模型設(shè)定如下:
rt=σtεt,εt~NID0,1
ln(RVt)=ω+1ln(RVt-1)+2ln(RVt-5,5)+3ln(RVt-22,22)+υt(3)
51收益率過(guò)程
在標(biāo)準(zhǔn)HAR-RV模型中,高頻收益率過(guò)程只由日波動(dòng)率[AKσ~](d)t決定。模型假設(shè)[AKσ~](d)t=σ(d)t,其中σ(d)t是日波動(dòng)率。收益率過(guò)程如下所示:
rt=σ(d)tεt,εt~NID0,1(4)
52RVt 等式
HAR-RV的波動(dòng)性主要來(lái)自三方面:進(jìn)行日或更高頻交易的短期交易者,每周進(jìn)行倉(cāng)位調(diào)整的中期投資者和投資周期高達(dá)一至數(shù)月的長(zhǎng)期投資者。所以,RV定義如下:
ln(RVt)=ω+1ln(RVt-1)+2ln(RVt-5,5)+3ln(RVt-22,22)+υt(5)
其中RVt-1、RVt-5、RVt-22分別為衡量短期(日)、中期(周)和長(zhǎng)期(月)的波動(dòng),其計(jì)算如下:
ln(RVt-h,h)≡1hh-1i=0n(RVt-h+i)ln(RVt-1,1)≡ln(RVt-1)(6)
53σt 和 RVt之間的關(guān)系
文獻(xiàn)中有兩種方法將RV與收益率方差聯(lián)系起來(lái):一是假設(shè)日收益率的有條件方差等于日RV的有條件期望;二是假設(shè)收益率方差和RV等同。Forsberg和Bollerslev(2002)、Bollerslev et al(2009)和John et al(2011)在相似的研究中使用了第二種方法,所以在本文我們也使用第二種假設(shè)。
54HAR-RV模型估計(jì)
基于以上假設(shè),對(duì)HAR-RV模型進(jìn)行回歸,我們得到估計(jì)模型如下:
ln(RVt)=-006955+0282521ln(RVt-1)+028352ln(RVt-5,5)+037673ln(RVt-22,22)
上述模型將用于接下來(lái)的預(yù)測(cè)似然度計(jì)算。
6分布預(yù)測(cè)
61平均預(yù)測(cè)似然度
John和Thomas(2011)認(rèn)為在評(píng)價(jià)預(yù)測(cè)能力時(shí)多步預(yù)測(cè)更好,本文與John和Thomas(2011)的目的相同,所以仿照其多步預(yù)測(cè)的方法來(lái)評(píng)價(jià)兩個(gè)模型預(yù)測(cè)能力。對(duì)于樣本外觀(guān)測(cè)值t=τ+kmax,…,T-k,其平均預(yù)測(cè)似然度計(jì)算如下:
Dk=1T-τ-kmax+1T-kt=τ+kmax-klnfk(rt+k[JB)|]Φt,θ),k≥1(7)
其中fk(rt+k[JB)|]Φt,θ)是向前k期預(yù)測(cè)的概率分布,T是總樣本中觀(guān)測(cè)到的交易日個(gè)數(shù),k是向前預(yù)測(cè)的時(shí)間跨度,樣本外數(shù)據(jù)從τ到T。在我們的樣本中,T=1945,τ=1219,kmax=60。Dk越大,模型預(yù)測(cè)的準(zhǔn)確性越好。
62向前k期預(yù)測(cè)的概率分布
我們使用以下公式計(jì)算向前k期預(yù)測(cè)的概率分布,
fk(rt+k[JB)|]Φt,θ)=∫f(rt+k[JB)|]μ,σ2t+k)p(σ2t+k[JB)|]Φt)dσ2t+k
≈1NNi=1f(rt+k[JB)|]μ,σ2(i)t+k)σ2(i)t+k~p(σ2t+k[JB)|]Φt)(8)
其中 f(rt+k[JB)|]μ,σ2(i)t+k)是基于t+k期的真實(shí)收益率,服從均值為μ,方差為σt+k2的正態(tài)分布。
63計(jì)算
首先,對(duì)于每一個(gè)模擬n次1步至60步向前預(yù)測(cè),得到相應(yīng)的標(biāo)準(zhǔn)差。對(duì)于每一個(gè)預(yù)測(cè)跨度,只保留[1279-k,1945-k]這部分,以保證所有預(yù)測(cè)都落入到這段區(qū)間。由于對(duì)每一個(gè)起點(diǎn)的每一個(gè)k步預(yù)測(cè)都有n次模擬,所以將t∈[1279-k,1945-k]中全部的f(rt+k[JB)|]μ,σ2(i)t+k)求取平均值,作為fk(rt+k[JB)|]Φt,θ),進(jìn)而再計(jì)算fk(rt+k[JB)|]Φt,θ)的平均值,其中t∈[1279-k,1945-k]。最后,根據(jù)式(8),可以計(jì)算出Dk。
7結(jié)論
圖1圖2為R語(yǔ)言模擬計(jì)算出來(lái)的Dk值,橫軸表示預(yù)測(cè)步數(shù),縱軸表示每一步所對(duì)應(yīng)的平均預(yù)測(cè)似然度,分別顯示了模擬100次和1000次時(shí),HAR-RV模型與EGARCH模型的預(yù)測(cè)能力對(duì)比。我們有以下發(fā)現(xiàn)。
模擬100次時(shí),HAR模型的似然度在步數(shù)不大于30的情況下會(huì)比EGARCH大。當(dāng)模擬1000次時(shí),相同的情況發(fā)生在預(yù)測(cè)步數(shù)不大于37時(shí):
(1)對(duì)于短期預(yù)測(cè),HAR模型能大幅提高預(yù)測(cè)效果,然而在預(yù)測(cè)中國(guó)的長(zhǎng)期市場(chǎng)時(shí)并不有效。我們認(rèn)為,導(dǎo)致這種現(xiàn)象的原因在于中國(guó)市場(chǎng)受到很多非市場(chǎng)因素的影響,且這些因素會(huì)隨時(shí)間變化。HAR模型更多地依賴(lài)于歷史數(shù)據(jù),非市場(chǎng)因素的變化會(huì)導(dǎo)致歷史數(shù)據(jù)“失效”。
(2)隨著模擬次數(shù)的增加,HAR的似然度降到EGARCH以下所需的步數(shù)會(huì)越來(lái)越大,所以我們推斷,如果能夠模擬無(wú)數(shù)次,HAR的預(yù)測(cè)能力會(huì)比本文所展現(xiàn)得更優(yōu)秀。
(3)圖1和圖2均顯示出HAR的平均預(yù)測(cè)似然度的期限結(jié)構(gòu)呈現(xiàn)負(fù)斜率。
圖1模擬100次圖2模擬1000次
參考文獻(xiàn):
[1]John,MM,Thomas,HMDo High-frequency Measures of Volatility Improve Forecasts of Return Distributions[J].Journal of Econometrics,2011(160):69-76
[2]Amisano,G,Giacomini,RComparing Density Forecasts via Weighted Likelihood Ratio Tests[J]Journal of Business and Economic Statistics,2007,25(2):177-190
[3]Bollerslev,T,Kretschmer,U,Pigorsch,C,Tauchen,GA Discrete-time Model for Daily S&P500 Returns and Realized Variations:Jumps and Leverage EffectsJournal of Econometrics,2009,150(2):151-166