傅可昂, 吳夢(mèng)雪, 黃 煒, 王江峰
(1. 浙大城市學(xué)院 計(jì)算機(jī)與計(jì)算科學(xué)學(xué)院, 浙江杭州310015;2. 浙江工商大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院, 浙江杭州310018;3. 浙江大學(xué) 數(shù)學(xué)科學(xué)學(xué)院, 浙江杭州310027)
隨著計(jì)算機(jī)技術(shù)的進(jìn)步和發(fā)展, 數(shù)據(jù)存儲(chǔ)和記錄的成本越來(lái)越低, 人們可以獲得金融市場(chǎng)上每筆交易的實(shí)時(shí)數(shù)據(jù), 即獲得采樣頻率越來(lái)越高的數(shù)據(jù), 這些數(shù)據(jù)往往被稱為高頻數(shù)據(jù). 通過(guò)對(duì)高頻數(shù)據(jù)的分析, 人們能正確地揭示金融市場(chǎng)的微觀結(jié)構(gòu), 這就使得對(duì)高頻數(shù)據(jù)的研究成為當(dāng)前的一個(gè)研究熱點(diǎn). 由于金融市場(chǎng)中每筆交易的交易時(shí)間都是隨機(jī)的, 而高頻數(shù)據(jù)記錄的正是實(shí)時(shí)交易產(chǎn)生的數(shù)據(jù), 因此高頻數(shù)據(jù)的一個(gè)顯著特點(diǎn)就是交易之間的時(shí)間間隔(又稱持續(xù)期)不規(guī)則. 這些不規(guī)則的時(shí)間間隔包含了許多市場(chǎng)微觀信息(比如交易的聚集或分散), 必須出現(xiàn)在描述數(shù)據(jù)的模型中, 而采用傳統(tǒng)的等間距計(jì)量模型對(duì)其建模則會(huì)丟失很多信息. 有鑒于此,Engle和Russel[1]提出了描述交易時(shí)間間隔的自回歸條件持續(xù)期(ACD)模型, 從而開(kāi)啟了ACD模型及其應(yīng)用的研究.
在連續(xù)的交易過(guò)程中, 記Tt為第t次交易發(fā)生的時(shí)間,xt=Tt ?Tt?1表示第t ?1次和第t次交易之間的時(shí)間間隔(持續(xù)期). ACD模型的主要思想是在自回歸條件異方差模型的基礎(chǔ)上, 采用一個(gè)標(biāo)記的點(diǎn)過(guò)程來(lái)刻畫(huà)交易時(shí)間到達(dá)的隨機(jī)性. 標(biāo)準(zhǔn)的ACD(p,q)模型可表示為
其中εt為獨(dú)立同分布的非負(fù)誤差項(xiàng)且滿足Eεt= 1,?t= E(xt|Ft?1)為持續(xù)期xt的條件期望,Ft?1=σ(xt?1,··· ,x1)是前t ?1次交易的信息集,p,q為模型的滯后階數(shù). 令θ:=(ω,α1,··· ,αp,β1,··· ,βq)T為模型參數(shù). 由于持續(xù)期xt恒為正, 故?t也應(yīng)該恒為正, 因此本文記參數(shù)空間Θ為Rp+q+10 中的緊集, 其中R0= (0,∞), θ0為參數(shù)θ的真實(shí)值. 眾所周知, 高頻數(shù)據(jù)還存在著明顯的日內(nèi)效應(yīng), 即在日內(nèi)表現(xiàn)出周期性的規(guī)律, 因此結(jié)合Engle和Russel[1]的建議,本文的xt為去除日內(nèi)效應(yīng)后的持續(xù)期.
Engle和Russel[1]采用形如(1)和(2)式的模型, 在誤差項(xiàng)服從指數(shù)分布和Weibull分布的條件下(此時(shí)的模型分別記為EACD和WACD模型), 較好地捕捉到了交易間隔的變化規(guī)律. 之后又有許多學(xué)者對(duì)ACD模型進(jìn)行了多方面的推廣, 有的提出了諸如誤差項(xiàng)服從Gamma分布, Burr分布,Birnbaum-Saunders分布和Fr′echet分布的GACD,BACD,BS-ACD和FACD模型(見(jiàn)[2-5]),有的則在模型形式上進(jìn)行了推廣, 如Bauwens等[6]提出了Log-ACD模型, Zhang等[7]提出了門(mén)限ACD模型, 戴麗娜[8-9]采用非參數(shù)可加ACD模型和半?yún)?shù)ACD模型進(jìn)行統(tǒng)計(jì)建模, Saart等[10]則對(duì)半?yún)?shù)ACD模型進(jìn)行了理論分析探索.
在對(duì)目前運(yùn)用較為廣泛的參數(shù)ACD模型進(jìn)行參數(shù)估計(jì)時(shí), 應(yīng)用最多的是擬極大似然估計(jì)(QMLE)方法. 眾所周知, QMLE只有在假設(shè)模型誤差方差有限的條件下, 才具有相合性和漸近正態(tài)性, 并且在估計(jì)過(guò)程中往往需要事先假設(shè)誤差服從某種特定的分布. Lu和Ke[11]提出了廣義最小二乘估計(jì)(GLSE), 并說(shuō)明該估計(jì)比常用的QMLE較優(yōu), 但是它卻要求數(shù)據(jù)的四階矩有限.金融高頻數(shù)據(jù)一般都呈現(xiàn)明顯的“尖峰重尾”性, 其方差甚至可能無(wú)窮. 因此, 在ACD模型中要求誤差方差有限顯得不夠合理, 并且一旦事先假定的誤差分布與實(shí)際不符, 將會(huì)得出錯(cuò)誤的結(jié)論.劉偉[12]對(duì)ACD模型采用了最小一乘(LAD)估計(jì), 其主要優(yōu)點(diǎn)是不用事先假定誤差分布, 且不要求誤差方差有限. 但是LAD估計(jì)也存在著一定的缺陷, 即面對(duì)具有極端值的數(shù)據(jù)時(shí), LAD估計(jì)給所有數(shù)值以相同的權(quán)重, 這顯然是不合理的.
為了彌補(bǔ)已有估計(jì)的不足, 本文擬對(duì)ACD模型采用自加權(quán)最小一乘(SLAD)估計(jì)(即根據(jù)數(shù)值自身特點(diǎn)給予不同的權(quán)重以降低極端值的影響), 并研究該估計(jì)的極限性質(zhì)及其應(yīng)用. 本文剩余部分結(jié)構(gòu)如下:§2介紹一些基本概念后給出本文的主要結(jié)論(強(qiáng)相合性和漸近正態(tài)性),§3和§4分別給出了SLAD估計(jì)的數(shù)值模擬和實(shí)證分析結(jié)果,§5給出結(jié)論的證明過(guò)程.
由(2)式可知?t與θ有關(guān), 故記?t為?t(θ). 對(duì)(1)式兩端同時(shí)取對(duì)數(shù), 可得
令yt=lnxt ?c0,ηt=lnεt ?c0, 其中c0=median(lnεt), 則有
因此, 參數(shù)的SLAD估計(jì)為
其中v=max(p,q),wt=wt(xt?1,xt?2,···)>0為一有界可測(cè)函數(shù).
本節(jié)將對(duì)參數(shù)的SLAD估計(jì)進(jìn)行有限樣本的模擬研究, 主要比較SLAD估計(jì)與QMLE和LAD估計(jì)在誤差含有一定極端值時(shí)的表現(xiàn)以及SLAD估計(jì)的正態(tài)性表現(xiàn). 考慮ACD(1,1)模型, 其中θ的真實(shí)值取(0.1,0.2,0.7), 誤差項(xiàng)εt分別服從Exp(1), Lognormal(-0.5,1), Weibull(2,1.128),Pareto(2,1), Burr(3,0.5), Fr′echet(2,0.56)這六種期望為1的分布. 金融市場(chǎng)容易受新消息的影響,這種影響將直接導(dǎo)致持續(xù)期中存在較多的離群點(diǎn)(極端值), 這些離群點(diǎn)將直接影響估計(jì)效果.為了更好地體現(xiàn)金融數(shù)據(jù)的特點(diǎn), 從產(chǎn)生的隨機(jī)數(shù)中隨機(jī)抽取5%的數(shù)據(jù), 將這些數(shù)據(jù)加上分布的3倍樣本標(biāo)準(zhǔn)差作為離群點(diǎn). 在SLAD估計(jì)中, 選取
其中at=|xt?1|I(|xt?1|≥c),c為序列xt的95%分位數(shù)點(diǎn).
產(chǎn)生樣本容量為500的觀察數(shù)據(jù), 將重復(fù)運(yùn)行2000次后的三種估計(jì)的平均偏差(Bias)和均方誤差(MSE)進(jìn)行比較, 具體結(jié)果如下表所示.
表1 不同分布下的估計(jì)結(jié)果比較
從表1可以看出, 不管是重尾還是輕尾誤差分布, SLAD估計(jì)結(jié)果可以說(shuō)整體上均好于LAD和QMLE. 這說(shuō)明SLAD估計(jì)的結(jié)果更為穩(wěn)健, 更適合具有重尾性和極端值的金融數(shù)據(jù)建模(對(duì)ACD(1,2), ACD(2,1), ACD(2,2)等高階模型, 也可得到類(lèi)似的模擬結(jié)果說(shuō)明SLAD估計(jì)的結(jié)果較為穩(wěn)健, 本節(jié)限于篇幅而未放高階模型的數(shù)值模擬結(jié)果).
在誤差分布服從Fr′echet(2,0.56)的條件下, 對(duì)按SLAD方法所得到的三個(gè)參數(shù)(ω,α1,β1)的估計(jì)值進(jìn)行正態(tài)性檢驗(yàn), 所得QQ圖如圖1所示. 由圖可知, SLAD方法所得估計(jì)符合§2中的漸近正態(tài)性結(jié)論.
圖1 ω(左), α1(中)和β1(右)的SLAD估計(jì)的QQ圖
選取青島海爾(600690)和寶信軟件(600845)兩只股票2017年6月19日至2017年6月23日的數(shù)據(jù)作為實(shí)證分析的樣本. 價(jià)格持續(xù)期是指價(jià)格的變化超過(guò)一個(gè)給定的閾值所需的時(shí)間, 其中價(jià)格的變化指的是變化的絕對(duì)值. 在本節(jié)中, 將閾值設(shè)為0.01元, 即價(jià)格的絕對(duì)值每變化0.01元所需的時(shí)間即為一個(gè)價(jià)格持續(xù)期. 價(jià)格持續(xù)期可以用來(lái)衡量市場(chǎng)價(jià)格變化的速度和市場(chǎng)的流動(dòng)性,投資者也可以根據(jù)對(duì)價(jià)格持續(xù)期的預(yù)測(cè)來(lái)及時(shí)地調(diào)整投資策略. 價(jià)格持續(xù)期越小, 說(shuō)明市場(chǎng)波動(dòng)性越大, 反之則越小. 圖2和3分別給出了兩只股票的部分原始價(jià)格持續(xù)期(縱坐標(biāo)代表原始價(jià)格持續(xù)期值, 橫坐標(biāo)代表持續(xù)期序列值)散點(diǎn)圖. 從圖2和3這兩張?jiān)汲掷m(xù)期圖可以看出, 原始價(jià)格持續(xù)期存在著明顯的聚集效應(yīng)和日內(nèi)效應(yīng)(即在一天中持續(xù)期呈現(xiàn)出先增后減的趨勢(shì)). 由于日內(nèi)效應(yīng)會(huì)影響模型的結(jié)果, 故同Engle和Russel[1]一樣, 在建模前采用三次樣條插值法去除價(jià)格持續(xù)期的日內(nèi)效應(yīng). 樣條節(jié)點(diǎn)分別為每個(gè)交易日的10: 00, 10: 30, 11: 00, 13: 30, 14: 00, 14:30. 去除日內(nèi)效應(yīng)前后, 價(jià)格持續(xù)期的描述性統(tǒng)計(jì)分析結(jié)果見(jiàn)表2和3.
圖3 寶信軟件原始價(jià)格持續(xù)期
表2 原始價(jià)格持續(xù)期統(tǒng)計(jì)分析
表3 去除日內(nèi)效應(yīng)后價(jià)格持續(xù)期統(tǒng)計(jì)分析
對(duì)比表2和3可以發(fā)現(xiàn), 去除日內(nèi)效應(yīng)后兩只股票的價(jià)格持續(xù)期均值均接近于1且偏度和峰度都有所下降; 表中的偏度和峰度說(shuō)明即使去除了日內(nèi)效應(yīng), 兩只股票的價(jià)格持續(xù)期也都不符合正態(tài)分布; 從Ljung-Box Q 統(tǒng)計(jì)量來(lái)看, 調(diào)整前后持續(xù)期的Q統(tǒng)計(jì)量值遠(yuǎn)大于閾值, 這表明原始價(jià)格持續(xù)期和去除日內(nèi)效應(yīng)后的價(jià)格持續(xù)期均存在著很強(qiáng)的自相關(guān)性, 同時(shí)也說(shuō)明日內(nèi)效應(yīng)并不是導(dǎo)致價(jià)格持續(xù)期存在自相關(guān)性的唯一原因.
對(duì)去除日內(nèi)效應(yīng)后的價(jià)格持續(xù)期用QMLE建立WACD(1,1)模型(與GACD等模型相比,WACD模型估計(jì)結(jié)果相對(duì)較好), 同時(shí)應(yīng)用SLAD和LAD方法估計(jì)ACD(1,1)模型參數(shù). 具體結(jié)果如下表所示.
表4 三種估計(jì)結(jié)果對(duì)比表
從表4可以發(fā)現(xiàn), 兩只股票的α+β均小于1, 滿足模型平穩(wěn)性的要求, 且β的值遠(yuǎn)大于α, 說(shuō)明價(jià)格持續(xù)期的期望受上一期期望的影響要大于上一期價(jià)格持續(xù)期;α+β的值均大于0.85, 說(shuō)明其存在這較強(qiáng)的聚集效應(yīng). 從AIC等指標(biāo)來(lái)看, SLAD估計(jì)的結(jié)果不比LAD和QMLE的結(jié)果差. 對(duì)應(yīng)用SLAD方法建模估計(jì)后的殘差(xt)進(jìn)行自相關(guān)檢驗(yàn), 兩只股票滯后10階和20 階的Ljung-Box??tQ 統(tǒng)計(jì)量分別為11.889(0.293), 23.587(0.261)和14.201(0.164), 23.124(0.283), 均接受了原假設(shè),說(shuō)明殘差符合獨(dú)立同分布的條件, 模型擬合得比較充分.
對(duì)殘差序列采用Resnick[15]所介紹的Hill估計(jì)的方法估計(jì)尾部指數(shù), 圖4和5分別給出了青島海爾和寶信軟件價(jià)格持續(xù)期SLAD估計(jì)建模后殘差序列的尾指數(shù)估計(jì)圖. 從圖中無(wú)法說(shuō)明殘差序列具有有限方差, 這也就意味著SLAD估計(jì)的結(jié)果相較而言更為可信.
圖4 青島海爾尾指數(shù)估計(jì)圖
圖5 寶信軟件尾指數(shù)估計(jì)圖