程凌筠,宋澤芳,b*,張興發(fā),b,李莉麗
(廣州大學(xué) a.經(jīng)濟(jì)與統(tǒng)計(jì)學(xué)院; b.嶺南統(tǒng)計(jì)科學(xué)研究院,廣東 廣州 510006)
作為資產(chǎn)收益變異程度的一種定量測(cè)度,波動(dòng)率在金融時(shí)間序列的不同領(lǐng)域中都扮演著相當(dāng)重要的角色,如衍生產(chǎn)品定價(jià)、對(duì)沖投資決策或風(fēng)險(xiǎn)價(jià)值(VaR)評(píng)估等,都與波動(dòng)率密切相關(guān)。Engle[1]和Bollerslev[2]提出的自回歸條件異方差模型,即 (G)ARCH模型,是目前最成熟、最常用的波動(dòng)率建模模型之一。它已被廣泛用于刻畫和預(yù)測(cè)股票價(jià)格、商品期貨、通貨膨脹率和外匯等金融產(chǎn)品的波動(dòng)率。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,采集、存儲(chǔ)數(shù)據(jù)的成本不斷降低,日內(nèi)高頻金融數(shù)據(jù)的獲取也越來(lái)越方便。如何使用這類數(shù)據(jù)推進(jìn)金融市場(chǎng)波動(dòng)率的研究成為備受關(guān)注的焦點(diǎn)。其中一個(gè)方向是對(duì)日內(nèi)波動(dòng)率的刻畫,常見的是基于日內(nèi)高頻交易數(shù)據(jù)所估計(jì)的日內(nèi)真實(shí)波動(dòng)率,通常稱為已實(shí)現(xiàn)波動(dòng)率。學(xué)者們運(yùn)用不同的非線性度量方法提出了許多已實(shí)現(xiàn)波動(dòng)率指標(biāo),如已實(shí)現(xiàn)方差、已實(shí)現(xiàn)雙冪次變差和已實(shí)現(xiàn)極差等[3-5]。另一個(gè)方向是利用日內(nèi)高頻數(shù)據(jù)來(lái)改進(jìn)日頻波動(dòng)率模型的估計(jì)精度。Visser[6]將日內(nèi)高頻信息引入到GARCH模型中,提出尺度模型和波動(dòng)率代表模型,改進(jìn)了GARCH模型參數(shù)估計(jì)的漸近方差,提高了估計(jì)的準(zhǔn)確性。越來(lái)越多的研究也表明,由于高頻數(shù)據(jù)蘊(yùn)含了更豐富的資產(chǎn)價(jià)格變動(dòng)信息,將高頻信息引入低頻波動(dòng)率模型可以有效地提高模型參數(shù)的估計(jì)精度[7-13]。
在進(jìn)行高頻數(shù)據(jù)分析處理時(shí),首要面對(duì)的是數(shù)據(jù)抽樣問題,不同的頻率會(huì)對(duì)估計(jì)的準(zhǔn)確性造成不同的影響,即抽樣頻率過高容易有太多噪音,抽樣頻率過低又沒有充分利用信息,因而關(guān)于抽樣頻率的擇優(yōu)選取就顯得尤為重要。徐正國(guó)等[14]定義了微觀結(jié)構(gòu)誤差(MSE)作為最優(yōu)抽樣頻率的選擇準(zhǔn)則,其實(shí)證研究表明已實(shí)現(xiàn)波動(dòng)率估計(jì)在10 min間隔的抽樣頻率下MSE達(dá)到最小。郭名媛等[15]則考慮MSE和測(cè)量誤差之和為擇優(yōu)標(biāo)準(zhǔn),以總誤差最小的60 min為最優(yōu)抽樣間隔來(lái)計(jì)算賦權(quán)已實(shí)現(xiàn)波動(dòng)率。唐勇等[16]分別依據(jù)已實(shí)現(xiàn)波動(dòng)和已實(shí)現(xiàn)極差波動(dòng)與積分波動(dòng)之間誤差項(xiàng)的漸近分布,給出了最優(yōu)抽樣頻率的選擇方法。李勝歌等[17]基于已實(shí)現(xiàn)雙冪次變差和賦權(quán)已實(shí)現(xiàn)波動(dòng),給出了最優(yōu)抽樣頻率選擇方法。閔素芹等[18]比較了3種已實(shí)現(xiàn)波動(dòng)率的最優(yōu)抽樣頻率選擇方法。楊建輝等[19]研究了不同抽樣間隔下創(chuàng)業(yè)板指數(shù)已實(shí)現(xiàn)波動(dòng)的分布特征及其最優(yōu)采樣間隔。
已有的這些研究中,學(xué)者們討論高頻數(shù)據(jù)的最優(yōu)采樣間隔大多是針對(duì)日內(nèi)波動(dòng)率刻畫進(jìn)行考慮,鮮有考慮日頻波動(dòng)率模型。本文進(jìn)一步研究高頻數(shù)據(jù)應(yīng)用到日頻波動(dòng)率模型(GARCH)時(shí)的數(shù)據(jù)抽樣問題。與傳統(tǒng)的研究不同,本文的最優(yōu)頻率抽樣問題可以比較方便地通過選擇最優(yōu)波動(dòng)率代表來(lái)進(jìn)行刻畫。波動(dòng)率代表是運(yùn)用高頻數(shù)據(jù)估計(jì)日頻GARCH類模型時(shí)構(gòu)造的一個(gè)重要統(tǒng)計(jì)量,它是由日內(nèi)高頻數(shù)據(jù)信息通過加工構(gòu)造出的一個(gè)函數(shù),不同的波動(dòng)率代表對(duì)參數(shù)估計(jì)效果有直接影響。本文結(jié)合GARCH模型的3種估計(jì)方法,即基于對(duì)數(shù)正態(tài)分布的擬極大似然估計(jì)(log-Gaussian QMLE)、基于正態(tài)分布的擬極大似然估計(jì)(Gaussian QMLE)和基于拉普拉斯分布的擬極大指數(shù)似然估計(jì)(QMELE),討論不同估計(jì)方法下最優(yōu)波動(dòng)率代表的選擇問題及其在高頻數(shù)據(jù)抽樣頻率的選擇問題。
在日頻數(shù)據(jù)下,使用GARCH(1,1) 模型對(duì)波動(dòng)率進(jìn)行建模,其形式為
yt=σtεt,
(1)
(2)
其中,yt為資產(chǎn)第t天的收益率;εt是服從均值為0,方差為1分布的一組獨(dú)立同分布隨機(jī)誤差項(xiàng),分布未知;對(duì)于?t≥s,εt與ys相互獨(dú)立;參數(shù)ω>0,α≥0,β≥0保證條件方差的非負(fù)性。
假設(shè)每天可觀測(cè)到的金融資產(chǎn)價(jià)格過程為Pt(u),t=1,…,T,將日內(nèi)的交易時(shí)間設(shè)為[0,1]區(qū)間,0≤u≤1。當(dāng)u=1時(shí),Pt(1)恰為第t天收盤價(jià)。定義第t天u時(shí)刻的高頻對(duì)數(shù)收益率為
Yt(u)=100×[logPt(u)-logPt-1(1)],
即日內(nèi)的收益過程。在模型(1)~模型(2)的基礎(chǔ)上,Visser[6]考慮利用日內(nèi)收益過程對(duì)日頻GARCH模型進(jìn)行擴(kuò)展,得到如下尺度模型:
Yt(u)=σtZt(u),u∈[0,1],
(3)
(4)
其中,Zt(·)為標(biāo)準(zhǔn)過程,與σt相互獨(dú)立;?t≠s,Zt(·)與Zs(·)獨(dú)立同分布;σt稱為尺度參數(shù)。當(dāng)u=1時(shí),Yt(1)=yt,Zt(1)=εt,模型(3)~模型(4)即退化為日頻GARCH模型。
H(ρYt(u))=ρH(Yt(u))>0,?ρ>0,
(第3.2節(jié)有舉例詳細(xì)介紹H函數(shù))對(duì)每個(gè)交易日,根據(jù)正齊次性,由式(3)可得
Ht=H(Yt(u))=H(σtZt(u))=σtH(Zt(u)),
記zH,t=H(Zt(u))>0,由于Zt(u)是獨(dú)立同分布的標(biāo)準(zhǔn)過程,因此,zH,t是獨(dú)立同分布的隨機(jī)變量序列。于是,波動(dòng)率代表模型可表達(dá)為
Ht=σtzH,t,
(5)
(6)
上述模型中,所有變量都是同樣的頻率,日內(nèi)高頻數(shù)據(jù)信息體現(xiàn)在波動(dòng)率代表量Ht上。當(dāng)波動(dòng)率代表量Ht=H(Yt(u))=H(Yt(1))=|Yt(1)|=|yt|時(shí),可以看出模型(5)~模型(6)和模型(1)~模型(2)是等價(jià)的。一般情形下,模型(5)~模型(6)引入了高頻數(shù)據(jù)信息,同時(shí)又和模型(1)~模型(2)具有相同的模型參數(shù)。因此,基于波動(dòng)率代表模型(5)~模型(6)估計(jì)的參數(shù),用到了更多的信息,有望得到更為精確的估計(jì)。
對(duì)于波動(dòng)率代表模型,現(xiàn)有的研究主要采用3種估計(jì)方法對(duì)模型中的未知參數(shù)進(jìn)行估計(jì),分別為對(duì)數(shù)正態(tài)分布擬極大似然估計(jì)、正態(tài)分布擬極大似然估計(jì)和擬極大指數(shù)似然估計(jì),下面依次介紹3種方法對(duì)模型估計(jì)的過程,及估計(jì)量的漸近結(jié)果。
Visser[6]給出了基于對(duì)數(shù)正態(tài)分布的擬極大似然估計(jì)(log-Gaussian QMLE)及其估計(jì)量的漸近正態(tài)結(jié)果,該方法是將擬極大似然估計(jì)(Gaussian QMLE)應(yīng)用于對(duì)數(shù)波動(dòng)率代表log(Ht)。
(7)
定義
于是有
(8)
(9)
其中,
這里,G(θ)是關(guān)于θ和H,t的矩陣,與無(wú)關(guān),具體證明見文獻(xiàn)[6]。
GARCH模型的常用估計(jì)方法是基于正態(tài)分布的擬極大似然估計(jì)(Gaussian QMLE)。為使用QMLE來(lái)估計(jì)θ=(ω,α,β)′,需要對(duì)殘差項(xiàng)zH,t進(jìn)行標(biāo)準(zhǔn)化,并對(duì)模型(5)~模型(6)稍作調(diào)整。
(10)
(11)
依據(jù)模型(10)~模型(11),θ*的QMLE定義為
(12)
其中,
(13)
(14)
在實(shí)際數(shù)據(jù)分析中,模型殘差的分布是未知的,為了弱化矩條件,殘差項(xiàng)常被假定為服從標(biāo)準(zhǔn)雙指數(shù)分布(Laplace分布),因而基于該分布的擬極大指數(shù)似然估計(jì)(QMELE)也是常用的估計(jì)方法。
(15)
(16)
依據(jù)模型(15)~模型(16),θ*=(ω*,α*,β*)′的QMELE定義為
根據(jù)QMELE的漸近理論(Andersen等[21]),容易得到*的漸近分布為
其中,
從第2節(jié)可知,參數(shù)估計(jì)是通過極小化關(guān)于波動(dòng)率代表的似然函數(shù)得到的,所以使用不同的波動(dòng)率代表得到估計(jì)量的有效性是不同的,同時(shí)基于不同的估計(jì)方法,又會(huì)存在差異。因而選擇合適的波動(dòng)率代表是獲取準(zhǔn)確估計(jì)的重要前提。
λ=Var(log(Ht)|Fn-1),
(17)
如果λ越小,參數(shù)估計(jì)的漸近方差就越小,即對(duì)應(yīng)的波動(dòng)率代表越好。因而,對(duì)于log-Gaussian QMLE,尋找最優(yōu)的波動(dòng)率代表即為尋找最小的λ值。
(2)對(duì)于正態(tài)分布擬極大似然估計(jì),Visser[6]并未給出適用于其估計(jì)量的波動(dòng)率代表選擇方法。為此,在估計(jì)量漸近分布的基礎(chǔ)上進(jìn)行分析,以給出針對(duì)QMLE的波動(dòng)率代表選擇標(biāo)準(zhǔn)。
相應(yīng)地,將上述兩式進(jìn)行相除,即得
定義
(18)
(3)對(duì)于擬極大指數(shù)似然估計(jì),從漸近分布的角度出發(fā)同樣可以得到選擇最優(yōu)波動(dòng)率代表的標(biāo)準(zhǔn)。
于是,依據(jù)同樣的推導(dǎo)思想,可以推得QMELE下波動(dòng)率代表的選擇標(biāo)準(zhǔn)為
(19)
從高頻對(duì)數(shù)收益率的表達(dá)式可以看出,計(jì)算波動(dòng)率代表需要通過離散性抽樣數(shù)據(jù)來(lái)得到,也就是需要固定一個(gè)時(shí)間間隔來(lái)采集日內(nèi)的高頻數(shù)據(jù)。令k表示日內(nèi)時(shí)間間隔(單位:min),m表示在抽樣頻率k下一天內(nèi)總的收益?zhèn)€數(shù),Yt(uik) 表示第i次抽樣的收益率,i=1,…,m。本文考慮以下4種波動(dòng)率代表,作為模型中主要的選擇比較:
①已實(shí)現(xiàn)波動(dòng)率(RV):
②日內(nèi)收益絕對(duì)值之和(RAV):
③已實(shí)現(xiàn)極差波動(dòng)率(RVHL):
k(i-1)<Δi ④日內(nèi)極差之和(RAVHL): minΔi(Yt(u))},k(i-1)<Δi 其中,Yt(u0)的值用Yt(0)=0 代替;maxΔi(Yt(u))和minΔi(Yt(u))分別為第i個(gè)時(shí)間段Δi中的收益率最大值和最小值。 以上RV、RAV、RVHL和RAVHL都是波動(dòng)率代表Ht的具體例子,容易看出Ht的具體值會(huì)依賴于離散化的數(shù)據(jù)量個(gè)數(shù),而將一天內(nèi)的交易時(shí)間等分為多少段最合適即為最優(yōu)抽樣頻率的問題。對(duì)于同一波動(dòng)率代表,最優(yōu)頻率對(duì)應(yīng)的Ht才是最優(yōu)的。因而第3.1節(jié)給出的波動(dòng)率代表選擇標(biāo)準(zhǔn)可以提供一個(gè)選取最優(yōu)抽樣頻率的方法,即波動(dòng)率代表選擇標(biāo)準(zhǔn)達(dá)到最小的時(shí)間頻率為該波動(dòng)率代表的最佳頻率。 圖1 波動(dòng)率代表與抽樣頻率的關(guān)系圖 表1 不同波動(dòng)率代表在不同估計(jì)方法下的最優(yōu)抽樣頻率 由表1和圖1可看出,在不同波動(dòng)率代表、不同頻率、不同估計(jì)方法下,得到的估計(jì)量有效性均明顯不同。通過比較分析發(fā)現(xiàn): (1)在同一頻率3種估計(jì)方法準(zhǔn)則下,比較RV、RAV、RVHL和RAVHL后發(fā)現(xiàn),RV的有效性最差,RAVHL和RVHL是較優(yōu)的波動(dòng)率代表函數(shù)。可以看到,在頻率較高時(shí)(2~8 min)RAV和RVHL是最優(yōu)的波動(dòng)率代表函數(shù),在頻率較低時(shí)(10 min以上)RVHL的有效性表現(xiàn)更優(yōu)。從指標(biāo)的總體性看,兩者相差不大,因此,RVHL和RAV都可作為最優(yōu)的波動(dòng)率函數(shù)。 (2)對(duì)同一波動(dòng)率代表分別比較不同頻率的表現(xiàn)可以發(fā)現(xiàn),RV在不同頻率下的有效性波動(dòng)(數(shù)值大小變動(dòng))最大,隨著抽樣頻率的增加,每種方法對(duì)應(yīng)的數(shù)值大多是先遞減后遞增;相比之下,RVHL和RAVHL在不同頻率下的有效性表現(xiàn)較為穩(wěn)定,數(shù)值變動(dòng)較小。 (3)比較最優(yōu)抽樣頻率下的不同波動(dòng)率代表發(fā)現(xiàn),采用log-Gaussian QMLE時(shí)的最優(yōu)波動(dòng)率代表為10 min的RVHL(λ值最小),采用Gaussian QMLE時(shí),則是2 min的RVHL最優(yōu)(MHqmle值最小),而采用QMELE時(shí)是8 min的RVHL最優(yōu)(MHqmele值最小),意味著在最優(yōu)抽樣頻率下,無(wú)論使用什么估計(jì)方法,最優(yōu)的波動(dòng)率代表為RAV。 (4)每個(gè)波動(dòng)率代表在相應(yīng)頻率上達(dá)到了最低點(diǎn)。不同波動(dòng)率代表的曲線趨勢(shì)存在顯著差異。其中,RV的3條曲線均呈“低谷”狀態(tài);而RAV的3條曲線整體上均呈現(xiàn)遞增趨勢(shì);RVHL和RAVHL隨時(shí)間頻率的變化趨勢(shì)相同,或呈曲折遞增,或大致地遞減后再遞增。 基于表1的結(jié)果,選擇以2 min為間隔的RVHL進(jìn)一步使用高斯QMLE估計(jì)出GARCH(1,1)模型的參數(shù)。該波動(dòng)率代表具有最小的MHqmle值,那么根據(jù)式(12)和式(14)得到的估計(jì)量是最有效的QMLE,擬合滬深300指數(shù)收益率的GARCH(1,1)模型為 yt=σtεt, (20) (21) 于是,基于模型(20)~模型(21)可以獲得更為準(zhǔn)確的波動(dòng)率估計(jì)。另外,若選用QMELE方法或?qū)?shù)正態(tài)分布QMLE方法,則分別需要以8 min和10 min的頻率來(lái)構(gòu)造RVHL,這樣得到的QMELE和log-Gaussian QMLE的估計(jì)有效性是其中最好的,便于更準(zhǔn)確地建立模型和估計(jì)波動(dòng)率。 為了檢驗(yàn)結(jié)果的穩(wěn)健性,本文再將全樣本分成了兩個(gè)子樣本(2017年9月1日-2018年6月30日和2018年7月1日-2019年7月12日),進(jìn)行同樣的波動(dòng)率代表和頻率選擇分析。匯總結(jié)果見表2。 表2 子樣本在最優(yōu)波動(dòng)率代表下的最優(yōu)抽樣頻率 由表2可以發(fā)現(xiàn): (1)同頻率兩個(gè)子樣本下,RV波動(dòng)率代表函數(shù)的有效性是最差的,RVHL和RAVHL仍然是兩個(gè)差別不大的最優(yōu)波動(dòng)率代表函數(shù)。 (2)針對(duì)兩個(gè)不同的樣本,基于最優(yōu)準(zhǔn)則下選擇的最優(yōu)波動(dòng)率代表會(huì)有所不同,同時(shí)在不同估計(jì)方法下選擇的最優(yōu)頻率也會(huì)有所差異,表2中列出了兩個(gè)子樣本選擇的最優(yōu)波動(dòng)率函數(shù),以及不同估計(jì)方法下,基于最優(yōu)波動(dòng)率函數(shù)選擇的最優(yōu)頻率。在2017年9月至2018年6月的第一個(gè)子樣本中,選擇的是RAVHL為最優(yōu)波動(dòng)率函數(shù),3個(gè)估計(jì)方法下所對(duì)應(yīng)的最優(yōu)頻率分別為8 min、30 min和10 min;在2018年7月至2019年7月的第二個(gè)子樣本中,選擇的是RVHL為最優(yōu)波動(dòng)率函數(shù),3個(gè)估計(jì)方法下所對(duì)應(yīng)的最優(yōu)頻率分別為3 min、2 min和2 min。 總的來(lái)說(shuō),本文可以得到一個(gè)穩(wěn)健的結(jié)論是在全樣本和子樣本下,RVHL和RAVHL都可考慮選擇為最優(yōu)波動(dòng)率函數(shù),且不同頻率下它們的表現(xiàn)模式也很相似。在選擇最優(yōu)頻率時(shí),除了考慮選擇最優(yōu)波動(dòng)率函數(shù),還要考慮不同的估計(jì)方法,同時(shí)也會(huì)依賴不同樣本下的情況,但就整體而言,最優(yōu)頻率在2 min、8 min和10 min中選擇,也啟示了研究者和實(shí)踐應(yīng)用學(xué)者們?cè)趯?shí)際中對(duì)抽樣頻率進(jìn)行謹(jǐn)慎選擇。 通過波動(dòng)率代表,可以將日內(nèi)高頻數(shù)據(jù)應(yīng)用于改進(jìn)GARCH模型的參數(shù)估計(jì),不同的波動(dòng)率代表提高估計(jì)精度的效果不同。本文介紹了波動(dòng)率代表模型的3種估計(jì)方法,針對(duì)不同的估計(jì)方法給出了波動(dòng)率代表的選擇標(biāo)準(zhǔn),并將這些準(zhǔn)則進(jìn)一步應(yīng)用于解決高頻數(shù)據(jù)抽樣頻率的選擇問題。最后,采用滬深300指數(shù)的高頻數(shù)據(jù)做實(shí)證研究,通過比較研究發(fā)現(xiàn),不同波動(dòng)率代表、不同抽樣頻率都會(huì)對(duì)GARCH參數(shù)估計(jì)量的有效性造成明顯差異,而且在不同估計(jì)方法下的表現(xiàn)也不同。已實(shí)現(xiàn)極差波動(dòng)率(RVHL)和日內(nèi)極差波動(dòng)率(RAVHL)是有效性表現(xiàn)較優(yōu)的波動(dòng)率代表,但它們都會(huì)依賴于抽樣頻率,其最優(yōu)頻率也會(huì)依賴具體的估計(jì)方法,但主要是在2~8 min中選擇,具體的選擇也需考慮更多的因素,未來(lái)可以考慮一個(gè)自適應(yīng)樣本的方法對(duì)最優(yōu)頻率進(jìn)行選擇。4 實(shí) 證
5 結(jié) 論