沈根祥,鄒欣悅
(1.上海財經(jīng)大學經(jīng)濟學院,上海 200433;2.上海財經(jīng)大學數(shù)理經(jīng)濟學教育部重點實驗室,上海 200433)
波動(volatility)在投資組合選擇、風險價值計算等投資決策和管理中具有重要的作用,波動的建模和預(yù)測一直是金融計量經(jīng)濟學研究的重點和熱點。金融理論和實踐中常采用資產(chǎn)價格的方差或者條件方差作為波動計量。自回歸條件異方差(ARCH)模型和隨機波動(SV)模型是最為常見的波動模型,用于日交易頻率或者更低交易頻率風險資產(chǎn)價格的建模和預(yù)測。隨著資產(chǎn)價格日內(nèi)高頻交易數(shù)據(jù)的獲取,已實現(xiàn)波動RV(realized volatility)作為日波動的無偏和一致估計得到廣泛應(yīng)用[1-2]。為利用日內(nèi)高頻數(shù)據(jù)信息提高波動預(yù)測的準確性,Hansen等[3]將RV引入GARCH模型提出已實現(xiàn)GARCH模型(Realized GARCH),Hansen和Huang Zhuo[4]將RV引入EGARCH模型得出已實現(xiàn)EGARCH模型,Shepherd和Sheppard[5]提出基于高頻數(shù)據(jù)的波動預(yù)測模型,簡稱HEAVY(High-frEquency-bAsed VolatilitY)模型。
波動模型設(shè)定包括收益模型(也稱為一階矩模型)設(shè)定和波動模型(也稱為二階矩模型)設(shè)定。盡管在二階矩模型中加入RV比傳統(tǒng)GARCH模型具有更好的波動預(yù)測效果,已實現(xiàn)GARCH模型(包括已實現(xiàn)EGARCH模型)和HEAVY模型存在兩個不足:一是將一階矩模型中收益分布設(shè)定為正態(tài)分布,將二階矩模型中已實現(xiàn)波動設(shè)定為對數(shù)正態(tài)分布,不能充分刻畫收益分布和已實現(xiàn)波動的厚尾性;二是在波動模型中引入RV的方式較為隨意(ad hoc),缺乏準則和理論基礎(chǔ)。Opschoor等[6]在研究多資產(chǎn)波動模型時,采用向量t分布作為收益的聯(lián)合分布,矩陣F分布作為已實現(xiàn)方差-協(xié)方差矩陣的聯(lián)合分布,充分捕獲資產(chǎn)收益和波動中的厚尾特征,以觀測驅(qū)動模型設(shè)定方法給出波動模型的具體形式,提出一種新HEAVY波動模型。
由于不可觀測性,作為波動代理變量的方差可以看作時變參數(shù)。Cox將時變參數(shù)模型的設(shè)定分為觀測驅(qū)動(observation-driven)和參數(shù)驅(qū)動(parameter-driven)。觀測驅(qū)動模型將t期的參數(shù)值表示為自回歸項和t-1期變量可測函數(shù)的和,參數(shù)驅(qū)動模型則用一階自回歸模型描述參數(shù)的動態(tài)變化。Creal等[7]在研究觀測驅(qū)動模型設(shè)定時,提出采用觀測變量密度函數(shù)關(guān)于時變參數(shù)得分函數(shù)形成的鞅差序列構(gòu)造時變參數(shù)模型,稱為廣義自回歸得分(Generalized Autoregressive Score)模型,簡稱GAS模型,也稱為得分驅(qū)動(score-driven)模型。Blasques等[8]以Kullback-Leibler距離(簡稱K-L距離)為準則,從信息理論的角度證明,觀測驅(qū)動模型中只有GAS模型得出的條件密度函數(shù)才能減少和實際條件密度函數(shù)之間的K-L距離,即使模型設(shè)定錯誤的情況下仍然如此。Koopman等[9]對文獻中常用的兩類時變參數(shù)模型的預(yù)測效果進行比較,發(fā)現(xiàn)GAS模型與參數(shù)驅(qū)動模型的均方誤差僅相差不到1%,而由于包含隱變量需要采用數(shù)值積分計算似然函數(shù),參數(shù)驅(qū)動模型估計中的計算困難和計算量遠遠大于觀測驅(qū)動模型。
本文對已實現(xiàn)GARCH模型和HEAVY模型進行改進,提出廣義自回歸得分HEAVY波動模型,簡記為GAS-HEAVY模型。收益和已實現(xiàn)波動分布的設(shè)定借鑒Opschoor等[6],用波動對收益進行尺度調(diào)整得出調(diào)整t分布(rescaled t-distribution)作為資產(chǎn)收益分布,更為靈活地捕獲收益分布厚尾性和波動時變性,用波動對RV進行尺度調(diào)整得出調(diào)整F分布作為已實現(xiàn)波動的分布。F分布具有兩個自由度,與單自由度分布(如χ2分布)相比,對RV分布的厚尾性和非對稱性刻畫更為充分,同時F分布的支撐(support)是(0,),滿足RV只取正值的限制條件。波動模型的設(shè)定采用GAS模型。在給出平穩(wěn)性條件以及非負性條件后,本文分析了GAS-HEAVY波動模型的性質(zhì),并與已實現(xiàn)波動GARCH模型、HEAVY模型和t-GARCH模型進行比較以說明其優(yōu)越性。蒙特卡羅模擬試驗表明,無論數(shù)據(jù)生成過程是非隨機時變波動模型還是隨機波動模型,GAS-HEAVY模型的得分驅(qū)動設(shè)定使其對波動變化的反映更為靈敏,對樣本數(shù)據(jù)的擬合效果顯著優(yōu)于其它模型。
近幾年來,國內(nèi)對采用高頻數(shù)據(jù)建立波動預(yù)測模型進行了大量研究。楊科和陳浪南[10]構(gòu)建自適應(yīng)非對稱HAR-D-FIGARCH模型對上證綜指已實現(xiàn)波動進行預(yù)測,取得了很好的效果。楊科等[11]將跳躍因素引入模型,構(gòu)造AHAR-RV-CJ波動預(yù)測模型,研究結(jié)果表明跳躍對模型預(yù)測效果有顯著影響。翟慧等[12]以滬深300指數(shù)高頻數(shù)據(jù)為樣本,比較了HAR模型和GARCH模型的波動預(yù)測能力,認為對數(shù)形式的HAR-RV-CJ模型對短期、中期、長期波動率的樣本外預(yù)測都具有最高的精度。吳恒煜等[13]在HAR-RV模型中引入跳躍和結(jié)構(gòu)轉(zhuǎn)換,認為短期內(nèi)連續(xù)波動和跳躍波動對未來波動影響具有顯著差異,負向跳躍波動對未來波動的影響更大。吳鑫育等[14]研究了門限已實現(xiàn)隨機波動模型,認為加入門限的已實現(xiàn)隨機波動模型具有更好的擬合效果。
本文研究的創(chuàng)新之處體現(xiàn)在波動模型的設(shè)定上,以具有兩個自由度的F分布作為已實現(xiàn)波動的分布,對RV分布特征的捕捉更具靈活性,以得分驅(qū)動方法設(shè)定波動模型更新項的具體形式,使其對真實波動的擬合更為有效。選取上海證券交易所證綜合指數(shù)(上證綜指)、深證證券交易所成分指數(shù)(深證成指)和滬深300指數(shù)日收益數(shù)據(jù)和日內(nèi)1分鐘收益高頻數(shù)據(jù)的實證研究表明,以Hansen的模型預(yù)測能力SPA(Superior Predictive Ability)指標為評價標準[15],GAS-HEAVY模型在不同損失函數(shù)下的預(yù)測能力均明顯優(yōu)于其它模型。本文研究結(jié)果為風險資產(chǎn)波動的擬合和預(yù)測提供了更為有效的新模型。
(1)
設(shè)d0>2以保證εt存在方差。據(jù)此得出給定σt下rt的條件密度為
(2)
(3)
據(jù)此得出RVt的密度函數(shù)為
(4)
觀測驅(qū)動模型中鞅差序列st的設(shè)定十分關(guān)鍵。Creal等[7]將st取作t處觀測變量似然函數(shù)關(guān)于時變參數(shù)的得分函數(shù),得出廣義自回歸得分模型(GAS:Generalized Autoregressive Score):
得分函數(shù)為
經(jīng)計算得出
(5)
St=Sr,t+SRV,t
SRV,t=
(6)
收益模型(1)、已實現(xiàn)波動模型(3)和波動模型(6)構(gòu)成波動模型
(7)
本文稱之為基于高頻數(shù)據(jù)的得分驅(qū)動厚尾分布模型,簡記為GAS-HEAVY波動模型。
由此得出vart-1[St]<,再由var(St)=E(vart-1(St))得出St方差有限。將St表達式代入合并同類項可以看出,當且0<φ2<φ1時
3.2.1 與t-GARCH模型的比較
GARCH模型中收益rt的分布取作t分布時得到的模型就是t-GARCH模型。由于更能有效捕獲分布厚尾性,t-GARCH模型被廣泛采用。t-GARCH模型中的波動方程仍然采用標準的GARCH形式,即
(8)
為了比較,不考慮GAS-HEAVY模型中的RVt提供的信息。(7)中St只有收益更新項Sr,t,對應(yīng)的波動方程為
(9)
3.2.2 與HEAVY模型的比較
Shephard和Sheppard[5]將已實現(xiàn)波動引入日收益波動模型,提出基于高頻數(shù)據(jù)波動(HEAVY)模型,具體形式為
RVt=(γ/λ)μtξt,ξt~Γ(γ,λ),γ>0
μt+1=ω0+ω1RVt+ω2μt,ω0,ω1,ω2>0,ω1+ω2∈[0,1)
3.2.3 與已實現(xiàn)GARCH模型的比較
Hansen等[3]將已實現(xiàn)波動引入GARCH模型,提出已實現(xiàn)GARCH模型(Realized GARCH),具體形式為
rt=exp(ht/2)εt,εt~N(0,1)
ht=φ0+φ1ht-1+φ2logRVt-1
通過模擬實驗對GAS-HEAVY模型參數(shù)極大似然估計性質(zhì)和模型的波動預(yù)測能力進行分析評價。
模擬的第一部分以GAS-HEAVY模型為數(shù)據(jù)生成過程(DGP:data generating process)生成模擬樣本,對模型參數(shù)進行極大似然估計,分析模型參數(shù)估計效果。給定模型參數(shù)值通過(7)式產(chǎn)生模擬樣本,然后采用模擬樣本對模型參數(shù)進行極大似然估計。根據(jù)文獻和實證研究的有關(guān)結(jié)果,選取三組參數(shù)值進行模擬,第一組參數(shù)取值為φ1=0.9、φ2=0.8、d0=7、d1=7、d2=5,第二組參數(shù)取值為φ1=0.8、φ2=0.6、d0=6、d1=5、d2=6,第三組參數(shù)取值為φ1=0.96、φ2=0.8、d0=12、d1=50、d2=15。模擬的樣本量T=1000,按日交易數(shù)據(jù)計算大體相等于4年的長度。
表1中的數(shù)據(jù)表明,極大似然方法可以較為精確地估計出GAS-HEAVY模型的參數(shù)值,波動模型參數(shù)φ1、φ2和分布自由度參數(shù)d0、d1和d2的估計值都十分接近實際值,且具有很高的顯著性。
表1 采用模擬樣本的極大似然估計
表2給出了四種不同模型對DGP過程擬合的RMSE及其標準誤。
表2 波動模型對模擬樣本擬合的均方誤差
從表2看出,GAS-HEAVY模型數(shù)據(jù)擬合的RMSE均值和標準誤都遠遠小于其它模型,擬合效果和穩(wěn)定性具有明顯優(yōu)勢。沒有采用RV數(shù)據(jù)的tGARCH模型擬合效果最差,表明RV對波動模型估計具有信息含量。
圖1 模擬數(shù)據(jù)和不同模型擬合數(shù)據(jù)時序圖
圖1給出模擬數(shù)據(jù)和四種模型擬合數(shù)據(jù)的時序圖。tGARCH與其它模型不具可比性,不再畫出。圖1表明,已實現(xiàn)GARCH模型和HEAVY模型不能捕捉收益數(shù)據(jù)的動態(tài)變化,原因之一是兩類模型中波動模型設(shè)定的隨意性,對DGP的動態(tài)近似效果差。另外一個原因是兩類模型中rt和RVt都設(shè)定為正態(tài)分布或者對數(shù)正態(tài)分布,不能很好擬合服從t分布和F分布的DGP數(shù)據(jù)。GAS-NlogN模型中的波動模型采用了GAS模型,對DGP具有較好的動態(tài)擬合效果,但由于收益和RV都沒有采用厚尾分布,不能很好捕捉數(shù)據(jù)的厚尾特性,導(dǎo)致其與實際數(shù)據(jù)具有較大偏差。GAS-HEAVY模型對收益數(shù)據(jù)動態(tài)變化具有較強的捕捉能力,其波動模式與DGP最為接近,收益的t分布和RV的F分布設(shè)定充分反映了數(shù)據(jù)厚尾特征,得分驅(qū)動得出的波動模型對DGP模型逼近效果好,同時三個自由度參數(shù)也提高了波動模型的靈活性和數(shù)據(jù)擬合能力。
為驗證GAS-HEAVY模型對實際數(shù)據(jù)的擬合和預(yù)測能力,采用上證綜指(000001),深證成指(399001),滬深300(000300)2013年1月至2017年4月共1037個交易日的1分鐘高頻交易數(shù)據(jù)和日收盤數(shù)據(jù)進行實證分析,樣本區(qū)間包含2015年的股市巨幅波動。采用Barndorff-Nielsen等[18]提出的Realized Kernel方法計算已實現(xiàn)波動率,以消除和減輕市場微觀結(jié)構(gòu)噪音和價格跳躍的影響。計算結(jié)果表明,樣本區(qū)間內(nèi)三大指數(shù)的RV峰度都遠大于3,體現(xiàn)出明顯的尖峰厚尾分布特征。選擇χ2分布和F分布作為候選分布對RV進行Kolmogorov-Smirnov(K-S)分布檢驗。原假設(shè)為χ2分布的假設(shè)下,三大指數(shù)已實現(xiàn)波動K-S檢驗的p值均為0.00,顯著拒絕原假設(shè),原假設(shè)為F分布的假設(shè)下,三大指數(shù)已實現(xiàn)波動K-S檢驗的p值均為0.06、0.92和0.44,都不能拒絕原假設(shè),表明在RV分布的選擇上,F(xiàn)分布比χ2分布更符合實際情況。實證檢驗結(jié)果支持GAS-HEAVY模型對RV分布的設(shè)定。
采用三大指數(shù)時間序列數(shù)據(jù)對GAS-HEAVY、HEAVY、R-GARCH和GAS-NlogN(簡記為M1、M2、M3和M4)模型實施極大似然估計,并對其擬合和預(yù)測效果進行評價。tGARCH模型不作為比較的候選模型。GAS-NlogN(M4)模型采用正態(tài)分布和對數(shù)正態(tài)分布,不再有自由度參數(shù)。表3給出模型參數(shù)估計值及其標準誤(小括號內(nèi))。
表3 模型參數(shù)估計值及其標準誤
注:M4中對應(yīng)d1的值是RV對數(shù)正態(tài)分布的方差參數(shù)估計值。
從波動模型系數(shù)看,GAS-HEAVY模型和HEAVY模型的自回歸系數(shù)(φ1)高于已實現(xiàn)GARCH模型,三個指數(shù)模型的估計結(jié)果均體現(xiàn)出這一特征,其原因在于前兩個模型對收益和波動都采用了厚尾分布,不時出現(xiàn)的異常觀測值被看作來自分布尾部而不是波動水平發(fā)生了變化,厚尾分布對波動分布尾部性的控制,凸顯了波動的持續(xù)性。GAS-HEAVY模型的自回歸系數(shù)高于NlogN模型,進一步說明厚尾分布的重要性。另一個特征是GAS-HEAVY波動中的更新項系數(shù)(φ2)也顯著大于HEAVY模型,體現(xiàn)出采用得分驅(qū)動設(shè)定的波動更新項對收益數(shù)據(jù)和已實現(xiàn)波動率觀測值的利用更加有效,包含了更多影響未來波動的信息。GAS-NlogN模型的更新系數(shù)也大于HEAVY模型,進一步說明得分驅(qū)動設(shè)定波動模型更新項的優(yōu)勢。從三個指數(shù)模型的差別看,最為明顯的是滬深300指數(shù)(000300)GAS-HEAVY波動模型更新項系數(shù)(φ2=0.220)明顯小于上證綜指(0.994)和深證成指(0.996),表明大盤樣本股形成的滬深300指數(shù)波動更新小于上證綜指和深證成指,波動變化更為平穩(wěn)。
預(yù)測能力是評價波動模型的常用標準。發(fā)現(xiàn)Kupiec的VaR回測檢驗(backtesting)方法的諸多缺陷后,Hansen[15]提出評價波動模型預(yù)測效果的SPA(Superior Predictive Ability)統(tǒng)計量,被廣泛采用[12,16]。設(shè)模型M0為基準模型,M1…MK為其他K個模型,各個模型樣本外預(yù)測值計算的損失函數(shù)值為Lt,k,t=0,1…,T,定義dt,k≡Lt,0-Lt,k,t=1…T為基準模型與其他模型損失函數(shù)之差。dt,k為負表明基準模型預(yù)測能力更強。SPA檢驗統(tǒng)計量定義為:
表4 SPA檢驗結(jié)果
從檢驗結(jié)果看,無論采用哪種損失函數(shù),以GAS-HEAVY為基準模型HEAVY、R-GARCH和GAS-NlogN為對比模型的SPA檢驗的p值都遠遠大于5%,尤其是針對滬綜指的檢驗,p值更是高達0.95以上,充分表明GAS-HEAVY模型的波動預(yù)測能力強于其它兩個模型。以HEAVY模型為基準模型,GAS-HEAVY、R-GARCH和GAS-NlogN為對比模型的檢驗p值都接近0,拒絕原假設(shè),表明HEAVY模型的預(yù)測能力并不比GAS-HEAVY或者R-GARCH模型更強。以R-GARCH模型、GAS-NlogN為基準模型的檢驗結(jié)果與HEAVY為基準模型的檢驗具有完全相同的結(jié)論。SPA檢驗表明,GAS-HEAVY模型比HEAVY模型、R-GARCH模型和GAS-NlogN模型具有更強的波動預(yù)測能力。
本文提出一種綜合利用日數(shù)據(jù)和日內(nèi)高頻數(shù)據(jù)預(yù)測風險資產(chǎn)價格波動的模型,分別采用t分布和F分布作為日收益和已實現(xiàn)波動的分布,以期更為充分和靈活地捕捉分布厚尾性;波動模型設(shè)定采用觀測驅(qū)動方法中的得分驅(qū)動方法,有效提高了模型對數(shù)據(jù)生成過程的逼近效率。蒙特卡洛模擬實驗顯示,本文提出的GAS-HEAVY即使在模型誤設(shè)的情況下,對數(shù)據(jù)的擬合效果明顯好于同類模型。基于滬綜指、深成指和滬深300指數(shù)2013.1至2017.4數(shù)據(jù)的實證分析表明,在兩種不同損失函數(shù)的SPA檢驗下GAS-HEAVY模型的波動預(yù)測能力顯著強于其它同類模型。實證分析中模型參數(shù)估計結(jié)果表明,以大盤股為樣本的滬深300指數(shù)波動穩(wěn)定性和持續(xù)性比滬綜指和深成指更強,GAS-HEAVY模型設(shè)定的合理性,使其對指數(shù)波動動態(tài)變化的描述和刻畫更接近實際。本文提出的波動模型,以其更好的樣本內(nèi)擬合能力和更強的樣本外預(yù)測能力,為有關(guān)理論研究和市場應(yīng)用提供了新的工具。