何永濤,王 飛
(南開大學(xué)a.?dāng)?shù)量經(jīng)濟(jì)研究所;b.經(jīng)濟(jì)學(xué)院,天津300071)
在金融領(lǐng)域中,金融時間序列大多表現(xiàn)出方差的“波動集群”特征和分布的“高峰厚尾”特征。為了刻畫金融時間序列的這種特征,需要著重考察其方差過程的建模,這成為異方差時間序列模型發(fā)展的根本動因。目前,對于條件方差過程建模策略的研究主要有兩類。一類是將條件方差作為因變量、將當(dāng)前和過去數(shù)據(jù)平方值作為自變量的建模方法。這類方法起始于Engle提出的ARCH模型,隨后由Bollerslev、Taylor、Nelson和 Cao、Tsai和 Chan、Andersen等擴(kuò)展為一類廣為熟知的GARCH模型族。另一類方法設(shè)定方差過程服從某一潛在隨機(jī)過程,最早由Taylor提出,被稱之為隨機(jī)波動模型(stochastic volatility model,SV),主要應(yīng)用于分析金融領(lǐng)域中期權(quán)定價問題[1]174-194。例如,Hull和White將隨機(jī)波動模型應(yīng)用于Black-Scholes期權(quán)定價公式,隨后,Jacquier等、Harvey等以及Shepherd等系統(tǒng)地闡述了SV模型的建模策略與應(yīng)用步驟,并由金融數(shù)學(xué)領(lǐng)域引入到計量經(jīng)濟(jì)學(xué)領(lǐng)域,標(biāo)志著SV模型已經(jīng)日臻成熟。SV模型的標(biāo)準(zhǔn)形式是:
上式中,yt為t時刻所持有資產(chǎn)的收益率,ht為t時刻收益率的對數(shù)波動水平。隨機(jī)干擾項εt和ηt滿足獨立同分布條件E(εtεt+l)=0和E(ηtηt+l)=0,l≠0,且它們之間互不相關(guān),即同時滿足E(εtηt+k)=0,k≠0。參數(shù)|φ|被假定為|φ|<1,以保證ht的平穩(wěn)性??紤]到參數(shù)的過度識別問題,SV模型的基本形式中設(shè)定參數(shù)β=1或者μ=0。由于ht真實數(shù)據(jù)生成過程是平穩(wěn)隨機(jī)過程,因此收益率yt是時變的且以某種方式進(jìn)行聚集,從而有效地刻畫了yt序列的“波動集群”特征。
與ARCH類模型相比,SV模型在金融數(shù)據(jù)及宏觀經(jīng)濟(jì)序列建模應(yīng)用中具有三個獨有的優(yōu)勢:第一,由于yt服從混合分布,SV模型能夠反映出金融序列中的“高峰厚尾”特征;第二,放松隨機(jī)干擾項εt和ηt互不相關(guān)假定,SV模型能夠更直接地刻畫金融序列中的“非對稱性”特征;第三,同等擬合效果下,SV模型所需估計的參數(shù)更少?;谝陨蟽?yōu)勢,SV模型在金融領(lǐng)域建模中的應(yīng)用日趨廣泛。
在SV模型的建模過程中,模型的參數(shù)估計是最為關(guān)鍵的一環(huán)。考慮到SV模型的似然函數(shù)是無解析解的多重積分形式,傳統(tǒng)的極大似然估計方法不能直接使用,SV模型的參數(shù)估計通常采用廣義矩估計方法、偽極大似然估計方法和貝葉斯估計方法。廣義矩估計方法最早由Melino和Turnbull提出,并由Jacquier等、Anderson和Srensen等引入SV模型進(jìn)行發(fā)展完善[2]。其優(yōu)點在于不需要正態(tài)分布假設(shè)且允許誤差項存在異方差和序列相關(guān),但該方法的有限樣本性質(zhì)較差,對于波動持續(xù)性參數(shù)φ接近于1的參數(shù)值,其收斂于無條件矩的速度相當(dāng)緩慢,大體上是一種相當(dāng)無效的方法。偽極大似然估計方法由Harvey等提出[3]。該方法假定εt服從正態(tài)分布,通過將標(biāo)準(zhǔn)SV模型變換成狀態(tài)空間形式,并利用Kalman濾波構(gòu)造預(yù)測誤差項的似然函數(shù),然后使用數(shù)值優(yōu)化方法(EM算法、Newton-Raphson算法等)進(jìn)行迭代。其優(yōu)點在于它提供了波動性序列ht的預(yù)測值、濾波值和平滑值,方便擴(kuò)展到更一般的模型,但是估計量不具有有效性,對于方差系數(shù)τ較小時,其有效性迅速惡化。
近年來,多數(shù)研究者采用貝葉斯估計方法來完成SV模型的估計。在貝葉斯估計方法框架下,SV模型的參數(shù)和潛在波動過程都被當(dāng)作隨機(jī)變量處理,通過計算參數(shù)的邊緣后驗分布來完成貝葉斯推斷,但在大多數(shù)情況下參數(shù)和變量的聯(lián)合分布是非常復(fù)雜的高維分布,因此不能直接從這個分布中抽取樣本。馬爾科夫鏈蒙特卡羅(Markov chain-Monte Carlo,MCMC)技術(shù)為我們提供了有效的解決辦法。MCMC技術(shù)可以間接地從參數(shù)的聯(lián)合分布中生成隨機(jī)樣本,而不必直接設(shè)定分布的具體形式,只要樣本容量足夠多,就可以得到收斂到真實值的樣本統(tǒng)計量。目前,MCMC技術(shù)被認(rèn)為是處理這種困難問題的最有力、最有用途的工具。
對于建模過程中SV模型的貝葉斯估計效率問題,尚未發(fā)現(xiàn)有文獻(xiàn)做過深入研究。在實際建模應(yīng)用中,研究者通常采用不同MCMC抽樣方案來確定SV模型的估計值,但其適用性如何,是否對不同樣本量和抽樣次數(shù)具有穩(wěn)健性等問題,已有文獻(xiàn)均未做過相關(guān)研究。本文將選取四個具有代表性的MCMC抽樣方案,從算法耗時、抽樣效率和估計精度三個方面對此進(jìn)行研究。
由于Taylor提出的SV模型假定過于苛刻,為了滿足實際的需要,眾多研究者對其進(jìn)行了擴(kuò)展,擴(kuò)展形式主要有厚尾SV模型、非線性SV模型、長記憶SV模型、非對稱SV模型、多元SV模型和多因子SV模型等。盡管SV模型存在眾多擴(kuò)展形式,但是通過將MCMC算法進(jìn)行擴(kuò)展可以很容易地處理其參數(shù)的估計問題。
為了建立SV模型的MCMC抽樣方案,需要重新考察SV模型中的待估計參數(shù)。由式(1)和式(2)可知,如果給定不可觀測波動性序列ht初始值h0以及未知參數(shù)τ2和θ=(μ,φ)′的先驗分布,那么未知參數(shù)(θ,τ2)的條件后驗分布可由如下貝葉斯法則求?。?/p>
其中,h和y 分別代表列向量(h1,h2,…,hn)′和(y1,y2,…,yn)′,p(h0)、p(θ)和p(τ2)是已給定的未知參數(shù)h0、θ和τ2的先驗分布。注意到,利用式(3)僅能得到未知參數(shù)θ和τ2的條件后驗分布,然而由于SV模型中波動性序列ht也是不可觀測的,因此需要進(jìn)一步對ht的條件后驗分布進(jìn)行考察。同樣,ht條件后驗分布和聯(lián)合后驗分布可由貝葉斯法則求?。?/p>
上式中,h-t表 示 拋 除t 期 后ht的 列 向 量 (h0:(t-1),h(t+1):n)′。理論上,結(jié)合式(3)和式(4)即可得到SV模型中所有未知參數(shù)的事后估計值,但實際上由于上述后驗分布為復(fù)雜的高維分布,無法直接求取解析解,通常使用MCMC技術(shù)來解決此類問題。MCMC方法首先建立一個馬爾科夫鏈,使得上述后驗分布為其平穩(wěn)分布,然后運行此馬氏鏈充分長時間直至收斂到平穩(wěn)分布。建立此類馬氏鏈的方法包括 Metropolis算法,Metropolis-Hastings(MH)算法和Gibbs算法。
隨機(jī)游走M(jìn)etropolis抽樣方法最早由Jacquier等引入到SV模型的貝葉斯估計中,該方法由“回歸參數(shù)”和“波動狀態(tài)變量”兩個抽樣模塊構(gòu)成[4]?!盎貧w參數(shù)”抽樣模塊用于完成上述式(3)中未知參數(shù)θ和τ2的條件后驗分布p(θ,τ2|h,y)的抽樣;“波動狀態(tài)變量”抽樣模塊用于完成上述式(4)中波動性序列ht的條件后驗分布的抽樣。
在實現(xiàn)“回歸參數(shù)”抽樣模塊時,Jacquier等為未知回歸參數(shù)θ和τ2設(shè)定正態(tài)—逆伽馬類型的先驗分布。由于正態(tài)—逆伽馬先驗分布與后驗分布構(gòu)成共軛分布,因此參數(shù)θ和τ2的條件后驗分布同樣是正態(tài)—逆伽馬類型的分布。具體來說,假定先驗分布的具體形式為,則其條件后驗分布為。其中條件后驗分布的參數(shù)和與先驗分布的超參數(shù)和之間存在如下關(guān)系:
狀態(tài)變量h抽樣問題由“波動狀態(tài)變量”抽樣模塊來完成。具體來說,設(shè)定ht初始值h0的先驗分布為正態(tài)分布,則其條件后驗分布為。其中參數(shù) mt和C2t與先驗分布的超參數(shù)m0和C0之間存在如下關(guān)系:
利用上述結(jié)果可以實現(xiàn)ht的條件后驗分布的抽樣,結(jié)合式(4)的結(jié)論,可以構(gòu)建出ht的條件后驗分布的表達(dá)式:
上式中,給定合適的調(diào)整方差v2h,則波動狀態(tài)變量ht的條件后驗分布可由隨機(jī)游走M(jìn)etropolis抽樣方法實現(xiàn)。具體步驟如下:
重復(fù)上述過程,直至馬氏鏈?zhǔn)諗康狡椒€(wěn)分布。需要說明的是,隨機(jī)游走M(jìn)etropolis抽樣方法下得到的馬氏鏈,其收斂性對v2h選擇比較敏感。如果v2h取值過大,多數(shù)的候選點將被拒絕,此時算法的效率很低。相反,如果v2h取值過小,則候選點幾乎都被接受,此時所得的馬氏鏈幾乎是純隨機(jī)游走過程,這同樣也是一種低效率。Robert等建議v2h的取值應(yīng)使得接受率α∈ [0.5,0.85],這樣才可以保證得到的鏈有較好的性質(zhì)。
獨立Metropolis-Hastings抽樣方法是 MH算法的特殊情形,最早由Kim等引入到SV模型的分析之中[5]。獨立 Metropolis-Hastings抽樣方法與隨機(jī)游走M(jìn)etropolis抽樣方法實現(xiàn)方法大致相同,主要的區(qū)別是在“波動狀態(tài)變量”抽樣模塊中使用獨立MH抽樣代替隨機(jī)游走M(jìn)etropolis抽樣。具體來說,Kim等研究發(fā)現(xiàn)式(9)中p(yt|ht)的對數(shù)形式具有如下性質(zhì):
上式中,const表示某一常數(shù),利用泰勒公式將冪指數(shù)項exp(-h(huán)t)在mt附近進(jìn)行一階展開,則:
從而可以得到ht分布函數(shù)的一個近似形式
3)計算ht*被接受的概率:
獨立 Metropolis-Hastings抽樣方法的優(yōu)點是容易實施,而且在提議分布和目標(biāo)分布很接近時也趨于表現(xiàn)良好,但是當(dāng)提議分布和目標(biāo)分布差別較大時,其表現(xiàn)就較差。
上述兩種方法中,波動狀態(tài)變量ht都是由逐期抽樣而獲得,因而被稱之為“逐分量”抽樣?!爸鸱至俊背闃釉诓▌有蛄衕t之間的相關(guān)程度較低的情形下表現(xiàn)良好,但是如果波動序列ht之間高度相關(guān),將會產(chǎn)生抽樣之間的高相關(guān)性,從而導(dǎo)致所建立的馬氏鏈?zhǔn)諗坑谄椒€(wěn)分布的速度十分緩慢。為此,一些學(xué)者致力于研究對波動狀態(tài)變量ht的“成塊”抽樣,將要討論的方案Ⅲ和方案Ⅳ即是這類方法的典型代表。
在進(jìn)行“成塊”抽樣之前,需將SV模型寫成狀態(tài)空間的表達(dá)形式,為此,首先對前文式(1)兩邊進(jìn)行平方并取對數(shù):
其中y*t=logy2t,ξt=logε2t。式(2)和式(13)構(gòu)成了SV模型的狀態(tài)空間形式。值得注意的是,上式中擾動項ξt不再服從正態(tài)分布,Abramowitz和Stegun研究發(fā)現(xiàn)[6]925-961,此時擾動項ξt的期望為E(ξt)=-1.27、方差為var(ξt)=π2/2。由于只有在狀態(tài)空間模型擾動項服從正態(tài)分布時,才能使用Kalman濾波進(jìn)行波動狀態(tài)變量的更新,為此,Ruiz建議將擾動項ξt進(jìn)行正態(tài)近似處理:ξt~N(β,σ2),β=-1.27、σ2=π2/2。設(shè)定zt=y(tǒng)*t-β,則上式(13)變換為:
其中υt~N(0,1),式(2)和式(14)構(gòu)成了SV模型的正態(tài)狀態(tài)空間形式,采用FFBS(Forward Filtering Backward Sample)從p(h|θ,τ2,σ2,z)中即可完成狀態(tài)變量ht的“成塊”更新。需要強(qiáng)調(diào)的是,采用正態(tài)分布對擾動項ξt的分布進(jìn)行近似并不是一個理想的方案,它會在分布的尾部引入一個較大的偏差。
為了解決方案Ⅲ中由擾動項ξt正態(tài)近似引起的偏差問題,Kim等構(gòu)造了由7個正態(tài)分布加權(quán)而成的混合分布,并證明采用混合分布對隨機(jī)干擾項ξt的分布進(jìn)行近似要比單純的正態(tài)近似效果更好。構(gòu)造混合分布的7個正態(tài)分布加權(quán)表達(dá)式為:
其中,μj、σ2j是第j個正態(tài)分布的均值和方差,qj是選擇第j個正態(tài)分布概率,f(ξt)是正態(tài)分布的混合分布①① Kim等給定的7個正態(tài)分布的參數(shù)(qj,μj,σ2j 分別為:(0.0073,-10.12999,5.79596)、(0.10556,-3.97281,2.61369)、(0.00002, - 8.56686,5.1795)、 (0.04395,2.77786,0.16735)、 (0.34001,0.61942,0.64009)、 (0.24566,1.79518,0.34023)、(0.25750,-1.08819,1.26261)。。與正態(tài)分布近似相比,有限混合正態(tài)近似擬合效果更好。進(jìn)一步,通過引入指示變量Ω{I1,I2,…,In}使得f(ξt|It)滿足f(ξt|It)~N(μj,σ2j),p(It=j(luò))=qj。這種表示的優(yōu)勢在于可以直接從離散分布p(It=j(luò))中抽取It,進(jìn)而基于式(13)可以直接采用FFBS抽樣方法對波動狀態(tài)變量h進(jìn)行“成塊”抽樣。
需要說明的是,抽樣方案Ⅳ與抽樣方案Ⅲ的抽樣過程是一致的,主要的變化是在抽樣方案Ⅳ中,使用有限混合分布替代正態(tài)分布來近似擾動項ξt的分布。正如上文所述,有限混合分布對擾動項ξt分布的近似效果與正態(tài)分布相比具有較大改善,但同時也注意到,由于有限混合分布每次需要從7個正態(tài)分布中抽取樣本,因此將在一定程度上增加運算的負(fù)擔(dān),從而影響抽樣的速度。
上述四種抽樣方案分別建立了四種不同的MCMC抽樣方案來完成SV模型的貝葉斯估計,不同抽樣方案所建立的馬氏鏈也不同。實質(zhì)上,MCMC抽樣方案優(yōu)劣關(guān)鍵在于建立的馬氏鏈的性質(zhì)。依據(jù)遍歷均值定理,一個好的鏈應(yīng)該具有快速混合性質(zhì),即從任意位置出發(fā)都能很快收斂到平穩(wěn)分布?;诖?,我們從算法耗時、抽樣效率和估計精度三個方面建立對四種抽樣方案的評價準(zhǔn)則。
算法耗時用于衡量算法的時間復(fù)雜度。隨著計算機(jī)的普及和性能的提高,MCMC抽樣方案對抽樣速度的要求已經(jīng)得到很大改善,但是在分析大數(shù)據(jù)時,運算速度仍是衡量抽樣方案優(yōu)劣的一個重要指標(biāo)。考慮到不同配置的計算機(jī)在數(shù)據(jù)處理速度上存在較大差別,為了保證比較的公平性,我們在同一硬件平臺上完成對四種方案進(jìn)行分析。具體的運行平臺配置為Intel Core 2T5870 2.00GHZ,2GRAM。
抽樣效率用于衡量馬氏鏈的收斂速度。影響抽取樣本無效率的一個重要因素是馬氏鏈?zhǔn)諗啃?,通常檢查馬氏鏈?zhǔn)諗颗c否的最直接方法是軌跡圖和自相關(guān)圖。軌跡圖適用于自相關(guān)水平較弱時馬氏鏈的收斂性檢查,如果自相關(guān)水平很高,軌跡圖診斷馬氏鏈?zhǔn)諗啃缘男Ч捅容^差。與軌跡圖相比,自相關(guān)圖的適用性更廣一些,這主要是因為自相關(guān)函數(shù)隨著步長的增大而減小較快。考慮到現(xiàn)實模型中大多參數(shù)存在自相關(guān)而使得抽樣走遍整個目標(biāo)分布的速度比較慢,因而自相關(guān)圖更適合檢查馬氏鏈的收斂性。但是,如果在目標(biāo)分布的一個局部支撐上產(chǎn)生的值的方差非常小,將導(dǎo)致單獨一個馬氏鏈看起來已經(jīng)收斂而實際上在整個支撐上并未達(dá)到收斂,此時自相關(guān)圖也同樣失效。為此,構(gòu)造如下無效率因子:
其中ρk為滯后k期的自相關(guān)函數(shù)。通過計算無效率因子,我們基于從不同初始值出發(fā),然后檢查幾個平行的初始值非常分散的馬氏鏈,發(fā)現(xiàn)收斂很慢的效率就會高得多。
估計精度用于衡量估計結(jié)果的有效性,使用MC誤差統(tǒng)計量來進(jìn)行衡量。MC誤差監(jiān)視了由隨機(jī)模擬而帶來的波動性,精度高的估計量,其MC誤差必須很小且精度隨著樣本容量遞增。Gelman和Rubin提出使用多層鏈?zhǔn)降鷣碛嬎鉓C誤差,具體來講,假設(shè)由k個馬氏鏈,每個鏈有m個樣本,在目標(biāo)分布下其期望為φ和方差為δ2。使用fij表示第i個鏈的j個樣本的MC值,那么在混合樣本中,φ的一個無偏估計為,而鏈間的方差B/m和鏈內(nèi)的方差W 分別為:
從而可以使用B和W 的加權(quán)進(jìn)行估計δ2:
已有文獻(xiàn)研究表明,如果φ接近于1且τ2較小,那么波動ht存在高度相關(guān)性,此時,如果所建立的馬氏鏈不合理,就會產(chǎn)生抽樣之間的高度相關(guān)性,將導(dǎo)致抽樣算法的無效率,最適合用于算法優(yōu)劣的評價。因此,我們設(shè)定生成模擬數(shù)據(jù)的真實參數(shù)值分別為h0= 0.0,μ =- 0.00645,φ = 0.99,τ2= (0.0225,0.45)。依據(jù)式(2),則ht(t=1,2,…,n)由生成,其中ζ從正態(tài)分布N(0,0.15)中隨機(jī)生成。利用ht并結(jié)合式(1),從而yt可從正態(tài)分布中生成。考慮到樣本容量可能帶來的影響,分別使用n=100和n=500兩種情形進(jìn)行研究。
在運行MCMC估計方法之前,還需考慮先驗分布的設(shè)定。首先設(shè)定參數(shù)(θ,τ2)的共軛先驗分布為正態(tài)—逆伽馬分布:
所有的運算結(jié)果都通過R(Version3.0.2)軟件來完成。首先,采用上述設(shè)定生成模擬數(shù)據(jù),然后分別使用第二節(jié)中的四種抽樣方案來完成對未知參數(shù)的貝葉斯推斷。為了評價各抽樣方案的優(yōu)劣,我們在抽樣過程中分別計算出抽樣算法的算法耗時、無效率因子和MC誤差三個評價指標(biāo)。
由表1中各抽樣算法的運算耗時可知,方案Ⅳ所需算法耗時最長,方案Ⅰ次之,方案Ⅱ和Ⅲ差別較小且相對較短。這說明,在對波動變量進(jìn)行抽樣時,“逐分量”抽樣算法與“成塊”抽樣算法在算法耗時方面幾乎無異;各方案之間算法耗時的差異大部分源于對隨機(jī)干擾項ξt近似方法處理方式的不同。
表1 算法耗時表(單位:秒)
在分析算法的收斂性問題時,我們參照Reis的做法,重點考察波動序列ht的第100期的樣本收斂性質(zhì)[7]。圖1給出了不同(τ2,n)組合下四種抽樣方案的樣本自相關(guān)函數(shù)。由圖1可知,當(dāng)(τ2,n)的取值為(0.0225,100)時,四種抽樣方案下波動變量h100自相關(guān)函數(shù)衰減均非常緩慢,但是隨著τ2和n取值變大,方案Ⅲ和Ⅳ以極快的速度衰減至0附近,并且保持在較低的相關(guān)性水平狀態(tài),方案Ⅱ次之,方案Ⅰ衰減速度最慢。這主要是因為數(shù)據(jù)生成過程中φ的取值接近于1,導(dǎo)致波動變量之間相關(guān)性較高,結(jié)果“逐分量”抽樣算法就會產(chǎn)生抽樣之間的高相關(guān)性,從而使得h100自相關(guān)函數(shù)衰減緩慢,而“成塊”抽樣算法將所有波動變量作為一個整體進(jìn)行抽樣,因此能夠使得樣本自相關(guān)函數(shù)具有較快的衰減速度。
圖1 狀態(tài)變量h100的樣本自相關(guān)圖
考慮到可能會出現(xiàn)的局部收斂而整體未收斂情況,我們?yōu)殡S機(jī)數(shù)發(fā)生器設(shè)定不同種子,再次對四種抽樣方案重復(fù)進(jìn)行50次模擬,每次模擬2 000次并計算四種情形下的各參數(shù)的無效率因子。由表2中各參數(shù)無效率因子的計算結(jié)果可知,總體上,隨著τ2和n取值變大,四種抽樣方案的無效率因子取值均變小,說明抽樣效率在逐步提高,而且在四種情形下,方案Ⅰ中各參數(shù)的無效率因子值均遠(yuǎn)大于其它三種方案,這驗證了方案Ⅰ在四種方案中自相關(guān)函數(shù)衰減最慢的事實。
表2 各參數(shù)無效率因子的中位數(shù)、5%分位數(shù)和95%分位數(shù)表
為了評價各抽樣方案下估計量的估計精度問題,根據(jù)所得到的抽樣樣本,我們首先繪制出各參數(shù)后驗核密度分布圖,以便直觀掌握各個參數(shù)的后驗分布情況。圖2給出了四種抽樣方案下各參數(shù)在不同情形時的后驗核密度分布圖。
由圖2可知,在四種情形下,方案Ⅱ和方案Ⅳ下各參數(shù)的后驗分布都較為近似,方案Ⅰ和方案Ⅲ則與前兩者差異較大,方案Ⅰ的差異主要表現(xiàn)在各參數(shù)的后驗分布有時會呈現(xiàn)明顯的雙峰特征,而方案Ⅲ的差異則主要表現(xiàn)在各參數(shù)后驗分布的偏度和峰度方面。例如,當(dāng)(τ2,n)的取值為(0.0225,500)和(0.45,100)時,在抽樣方案Ⅲ下參數(shù)φ和τ2的后驗分布均出現(xiàn)偏度和峰度的偏差。同時,當(dāng)(τ2,n)的取值為(0.0225,100)時,在抽樣方案Ⅲ下參數(shù)φ的后驗分布表現(xiàn)出更明顯的雙峰特征。這種現(xiàn)象出現(xiàn)的主要原因是,方案Ⅰ下參數(shù)的自相關(guān)函數(shù)衰減較慢導(dǎo)致馬爾科夫鏈尚未收斂,而對于方案Ⅲ下各參數(shù)的后驗分布差異則是由于在抽樣過程中該方案使用了正態(tài)分布來近似隨機(jī)干擾項的分布,從而導(dǎo)致在抽樣過程中存在較大偏差。這兩種情況都會使得在進(jìn)行貝葉斯推斷時產(chǎn)生一定的偏差。
圖2 各參數(shù)后驗分布的核密度圖
進(jìn)一步,表3中給出了四種方案下SV模型中各參數(shù)的相關(guān)統(tǒng)計量,包括均值、絕對誤差和MC誤差與標(biāo)準(zhǔn)差的比值。我們預(yù)期方案Ⅱ和方案Ⅳ下各參數(shù)均值應(yīng)該較為近似,從結(jié)果來看,在n=100,500以及不同的τ2值下,方案Ⅱ和方案Ⅳ下各參數(shù)的均值確實較為接近,這與預(yù)期相符合。同時可以看出,在不同的情形下,方案Ⅲ與它們差異均較大。通過絕對誤差可以看出,在n=100,500情況下,隨著τ2取值變大,參數(shù)h100的絕對誤差也隨著變大。這說明波動系數(shù)增大會干擾模型的估計結(jié)果。另外,MC誤差與標(biāo)準(zhǔn)差的比值都遠(yuǎn)小于1,說明MC誤差要遠(yuǎn)小于樣本標(biāo)準(zhǔn)差,預(yù)示著參數(shù)的馬爾科夫鏈比較平穩(wěn)。
表3 參數(shù)的均值、絕對誤差和MC誤差與標(biāo)準(zhǔn)差比值表
最后,綜合以上模擬分析的結(jié)論,對四種抽樣方案的表現(xiàn)進(jìn)行排序。為了能更直接地評價不同情況下四種抽樣方案的優(yōu)劣,我們分別在每種情況下對它們排序,并統(tǒng)計它們在每個次序中出現(xiàn)的次數(shù),表4給出了次數(shù)的累計百分比。
表4中的結(jié)果顯示,單純從四種方案的抽樣效率方面而言,抽樣方案Ⅳ在次序1和2中占據(jù)絕對優(yōu)勢,累計百分比分別為62.5%和93.75%;抽樣方案Ⅲ次之,累計百分比分別為37.5%和75%;抽樣方案Ⅱ和抽樣方案Ⅰ在抽樣效率方面相對較差,其中抽樣方案Ⅱ在次序1和2中的累計占比分別為0%和31.25%,而抽樣方案Ⅰ則從未在次序1和2中出現(xiàn)。這表明,本文提到的四種抽樣方案中,“成塊”抽樣具有更高的抽樣效率,具體的抽樣效率由高至低分別為方案Ⅳ、方案Ⅲ、方案Ⅱ和方案Ⅰ。對于四種方案的估計精度而言,在次序1中四種抽樣方案的占比基本保持穩(wěn)定,而在次序2中則發(fā)生較大的變化,其中抽樣方案Ⅳ的累計占比增加幅度最大,為68.5%;其次是抽樣方案Ⅱ,在次序2中其累計占比增加至62.5%;相對而言,抽樣方案Ⅰ和Ⅲ的增加幅度較小。如果以次序1和2中的累計占比來衡量抽樣方案的估計精度,那么四種方案中方案Ⅳ最優(yōu),其次為方案Ⅱ、方案Ⅰ和方案Ⅲ。
表4 次數(shù)的累計百分比表
本文系統(tǒng)地總結(jié)了隨機(jī)波動模型的建模進(jìn)展,對近年來隨機(jī)波動模型的幾種主要估計方法進(jìn)行了評述,并分析了它們各自的優(yōu)勢和不足。重點討論了貝葉斯估計方法下隨機(jī)波動模型的MCMC抽樣算法,通過模擬分析得出以下幾個結(jié)論:
第一,在算法耗時方面,有限混合分布近似和FFBS抽樣方法算法耗時最長,獨立 Metropolis-Hastings抽樣方法次之,其它兩種方法較短且差別較小。
第二,通過觀測各參數(shù)的樣本自相關(guān)圖,可知兩種“逐分量”MCMC抽樣方法中各參數(shù)的自相關(guān)圖衰減緩慢,而兩種“成塊”MCMC抽樣方法中各參數(shù)的樣本自相關(guān)圖以極快的速度衰減至0附近,并且保持較低的相關(guān)性水平。
第三,通過對比四種方案中各參數(shù)的估計值與真實值之間的絕對誤差,結(jié)果表明基于有限混合分布近似的“成塊”抽樣算法在估計精度方面均優(yōu)于其它三種方法。
需要說明的是,在實際應(yīng)用中,究竟采用何種抽樣方法來完成隨機(jī)波動模型的貝葉斯估計,取決于研究者的研究目的,本文只是提供一個可供選擇的依據(jù)。
[1] Taylor J.Modeling Financial Time Series[M].New York:Wiley,1986.
[2] Anderson G,Srensen E.GMM Estimation of a Stochastic Volatility Model:a Monte Carlo Study[J].Journal of Business and Economic Statistics,1997(14).
[3] Harvey A,Ruiz E,Shephard N.Multivariate Stochastic Variance Model[J].Review of Economic Studies,1994(61).
[4] Jacquier E,Polson N,Rossi E.Bayesian Analysis of Stochastic Volatility Models[J].Journal of Business and Economic Statistics,1994(12).
[5] Kim S,Shephard N,Chib S.Stochastic Volatility:Likelihood Inference and Comparison with ARCH Models[J].Review of Economic Studies,1998(65).
[6] Abramowitz M,Stegun N C.Handbook of Mathematical Functions[M].New York:Dover Publications Inc,1970.
[7] Reis A,Salazar E,Gamerman D.Comparison of Sampling Schemes for Dynamic Linear Models[J].International Statistical Review,2006(74).