葉五一,李瀟穎,繆柏其
(中國科學(xué)技術(shù)大學(xué)統(tǒng)計與金融系,安徽合肥 230026)
基于藤Copula方法的持續(xù)期自相依結(jié)構(gòu)估計及預(yù)測
葉五一,李瀟穎,繆柏其
(中國科學(xué)技術(shù)大學(xué)統(tǒng)計與金融系,安徽合肥 230026)
本文基于Copula方法對由高頻分筆數(shù)據(jù)得到的交易量持續(xù)期進行了研究。應(yīng)用多元藤Copula方法對連續(xù)幾個交易量持續(xù)期之間的自相依結(jié)構(gòu)進行估計,在此基礎(chǔ)上提出了一種新的條件密度函數(shù)估計方法,進而給出了交易量持續(xù)期的預(yù)測。對中國石化高頻分筆數(shù)據(jù)進行實證分析的結(jié)果表明,本文模型對持續(xù)期的預(yù)測能力要明顯優(yōu)于EACD模型,在密度函數(shù)預(yù)測檢驗方面,本文模型也有更好的表現(xiàn)。
Canonical藤Copula; 自相依結(jié)構(gòu); ACD模型; 高頻分筆數(shù)據(jù)
持續(xù)期(Duration)是指金融市場中相鄰兩個事件之間的時間間隔。交易量持續(xù)期、報價持續(xù)期和價格持續(xù)期反應(yīng)了市場最基本的交易信息和流動性特征,可以作為金融市場信息流動的重要指標(biāo),對持續(xù)期的研究能夠揭示和解釋金融市場的某些規(guī)律和現(xiàn)象[1]。隨著獲得(超)高頻交易數(shù)據(jù)能力的提高,也有許多針對(超)高頻交易數(shù)據(jù)的研究。然而分筆交易的時間間隔是隨機的,傳統(tǒng)的時間序列分析模型不適合描述持續(xù)期數(shù)據(jù),需要探索新的分析方法。
Engle和Russel[2]提出自回歸條件久期(Autoregressive Conditional Duration,ACD)模型可以用于描述這些點過程產(chǎn)生的數(shù)據(jù)。ACD的原始模型設(shè)定持續(xù)期服從線性自回歸過程,而殘差項分別服從標(biāo)準(zhǔn)指數(shù)(Exponent)分布或者標(biāo)準(zhǔn)化的韋布爾(Weibull)分布。為了更加準(zhǔn)確的描述持續(xù)期數(shù)據(jù),許多學(xué)者對ACD模型進行了擴展和改進,代表性的有一般伽瑪(Generalized Gamma)分布ACD模型[3]。將Burr分布引入到ACD模型中,克服了已有ACD模型的不足,可以描述非單調(diào)的危險率函數(shù)[4]。LOG-ACD模型克服了傳統(tǒng)ACD模型中條件期望方程的變量系數(shù)必須非負(fù)的限制,可以加入解釋變量來檢驗市場微觀結(jié)構(gòu)理論[5]。
然而這些模型都是在標(biāo)準(zhǔn)ACD的框架下提出的,本質(zhì)上描述的都是線性關(guān)系,除了可能導(dǎo)致過度參數(shù)化外,還受到嚴(yán)格自回歸過程的影響。本文提出一種基于Copula方法的半?yún)?shù)模型來描述持續(xù)期數(shù)據(jù),分析持續(xù)期之間的非線性相依結(jié)構(gòu)。實際上可以將相鄰的持續(xù)期數(shù)據(jù)看作是某一個多元分布的實現(xiàn),我們把這個多元分布分成兩部分來看,即變量的無條件邊際分布和變量間的相依結(jié)構(gòu)。Copula能很好地描述變量間的相依結(jié)構(gòu),利用Copula描述連續(xù)兩個持續(xù)期數(shù)據(jù)間的相依結(jié)構(gòu)(Temporal Dependence),通過并對德國XETRA系統(tǒng)的交易數(shù)據(jù)進行了實證分析,發(fā)現(xiàn)基于Copula方法的模型在預(yù)測方面表現(xiàn)要優(yōu)于ACD模型,但是沒有給出具體的持續(xù)期預(yù)測結(jié)果[6]。運用Copula可以對股票市場和外匯市場的相依結(jié)構(gòu)進行模擬,驗證了兩者收益率之間對稱尾部相依的顯著性[7]。本文將利用藤Copula對連續(xù)多個(大于2)持續(xù)期數(shù)據(jù)間自相依結(jié)構(gòu)進行建模,得到持續(xù)期xt在給定前n個相鄰持續(xù)期數(shù)據(jù)條件下的條件密度函數(shù)估計,并給出持續(xù)期預(yù)測效果和密度預(yù)測的檢驗。
相比較而言,二元Copula的(條件)分布函數(shù)和密度函數(shù)都比較容易得到明確的函數(shù)表達式。多元Copula的(條件)分布函數(shù)和密度函數(shù)表達式不方便表示,常見的包括多元student t Copula 和多元Gaussian Copula等,但這兩類Copula在描述尾部相依性時有一定的局限,其中Gaussian Copula不適合描述尾部具有相關(guān)性的數(shù)據(jù),Student t Copula則適合描述同時具有上尾相關(guān)和下尾相關(guān)的數(shù)據(jù)。本文引入藤Copula對多元Copula進行分解,以納入更多的二元copula對數(shù)據(jù)進行描述。藤Copula在簡單構(gòu)造模塊pair-Copula的基礎(chǔ)上,提出的一種構(gòu)造復(fù)雜多元相依結(jié)構(gòu)新方法,它將多元聯(lián)合密度函數(shù)分解成一系列pair-Copula模塊和邊緣密度函數(shù)的乘積,這就為二元Copula方法推廣到高維情況提供了理論基礎(chǔ)[8]。在藤Copula中應(yīng)用最廣泛的是C藤Copula和D藤Copula,其中C藤Copula適合描述有主導(dǎo)變量的數(shù)據(jù)集間的相依結(jié)構(gòu),D藤適合描述變量間地位相同的數(shù)據(jù)集。C藤Copula方法引入到金融領(lǐng)域中來,獲得了很好的應(yīng)用[9-12]。本文假定已經(jīng)實現(xiàn)的持續(xù)期對后續(xù)實現(xiàn)的持續(xù)期都有影響,每棵樹上都有一個主導(dǎo)的節(jié)點,因此我們利用C藤Copula估計多維自相依結(jié)構(gòu)。藤Copula的引入,使得本文提出的半?yún)?shù)模型對持續(xù)期相依結(jié)構(gòu)的描述更具靈活性和準(zhǔn)確性。本文中我們將對交易量持續(xù)期進行實證分析,結(jié)果表明,本文模型在持續(xù)期的預(yù)測和密度函數(shù)檢驗方面都明顯優(yōu)于ACD模型,原因在于前者能夠?qū)Χ嘣植歼M行刻畫,而后者只能描述持續(xù)期均值之間的線性關(guān)系。
2.1 標(biāo)準(zhǔn)ACD模型
標(biāo)準(zhǔn)ACD模型基于GARCH模型思想建立,用于描述連續(xù)金融事件之間時間間隔[2]。令ti表示第i個金融事件對應(yīng)的時間,以xi=ti-ti-1表示相鄰兩個金融事件之間的持續(xù)期。本文定義金融事件為完成指定的交易量(TradingVolume),xi為完成指定交易量所需要的時間,即交易量持續(xù)期(TradingVolumeDuration)。取ψi=E(xi|Fi-1)表示xi的條件期望,F(xiàn)i-1為第i-1個金融事件發(fā)生時可以得到的信息集合。標(biāo)準(zhǔn)ACD模型定義為:
xi=ψiεi
(1)
其中{εi}是獨立同分布的非負(fù)隨機變量序列,滿足E(εi)=1。一般假定εi服從標(biāo)準(zhǔn)指數(shù)分布或者標(biāo)準(zhǔn)化的韋布爾分布,并且假定期望持續(xù)期ψi滿足以下的線性形式[2]:
(2)
因為期望持續(xù)期為正,且為了保證持續(xù)期序列的平穩(wěn)性,必須對參數(shù)作以下的假定:
ω,αj,βk>0 ?j,k,
滿足以上條件的就是標(biāo)準(zhǔn)ACD(r,s)模型。簡單ACD模型和復(fù)雜的ACD模型在數(shù)據(jù)描述上有相近的表現(xiàn)[13],本文采用εi服從標(biāo)準(zhǔn)指數(shù)分布的ACD(1,1),即EACD(1,1)模型作為基準(zhǔn)比較模型。
2.2 Canonical 藤(Vines)Copula 方法介紹
假定n維隨機向量X=(X1,X2,…,Xn),其聯(lián)合分布函數(shù)為F(x1,x2,…,xn),由Sklar[14]定理,多元分布函數(shù)可以通過Copula和隨機變量的邊緣分布Fi(i=1,2,…,n)表示如下:
F(x1,x2,…,xn)=C(F1(x1),F2(x2),…,Fn(xn))
多元聯(lián)合密度函數(shù)則可以表示為:
f(x1,x2,…,xn)=c12…n(F1(x1),F2(x2),…,F(xiàn)n(xn))·f1(x1)·…·fn(xn)
(3)
其中,c12…n(·)表示n維Copula密度函數(shù),fi(xi)表示邊緣密度函數(shù)。邊緣密度函數(shù)相對來說容易估計,而多維變量間相依結(jié)構(gòu)的描述卻比較復(fù)雜??紤]到二元Copula選擇的多樣性,可以把n維Copula密度函數(shù)分解成一系列pairCopula密度函數(shù)的乘積,更方便地描述復(fù)雜的多元相依結(jié)構(gòu)。對于高維Copula密度函數(shù),pairCopula分解存在許多邏輯結(jié)構(gòu)。Bedford和Cooke[8]引入了藤(Vine)圖形來描述這種邏輯結(jié)構(gòu),Canonical藤是應(yīng)用最廣泛的邏輯結(jié)構(gòu)之一,適合描述存在引導(dǎo)其他變量的關(guān)鍵變量的數(shù)據(jù)集,其結(jié)構(gòu)圖如圖1所示。
圖1 Canonical 藤
根據(jù)Canonical藤的邏輯結(jié)構(gòu),我們便可以把n維Copula密度函數(shù)c(F1(x1),F2(x2),…,Fn(xn))分解成如下形式:
(4)
在上述表達式中,每個pairCopula密度函數(shù)包含一對條件分布函數(shù)F(x|υ),它可以通過下述公式得到:
(5)
其中υj代表向量υ中第j個元素,υ-j代表從向量υ中去除第j個元素υj。
2.3 基于Canonical藤Copula方法半?yún)?shù)持續(xù)期模型
本文基于藤copula描述n個連續(xù)持續(xù)期之間的自相依結(jié)構(gòu),并且預(yù)測持續(xù)期xt的條件密度函數(shù)f(xt|Ωt-1),其中Ωt-1={xt-1,xt-2……xt-n-1}為前n-1期已實現(xiàn)的持續(xù)期,進而在條件密度的基礎(chǔ)上估計xt的條件均值。由于已經(jīng)實現(xiàn)的持續(xù)期對后續(xù)實現(xiàn)的持續(xù)期都有影響,所以每棵樹上都有關(guān)鍵節(jié)點,因此我們將采用Canonical藤建立模型。
根據(jù)公式(3)和公式(4)可知:
(6)
由(6)式及Bayes定理,可得在前n-1個已實現(xiàn)的持續(xù)期的條件下,持續(xù)期xt的條件密度為:
f(xt|Ωt-1)=ct-1,t|Ωt-2(F(xt-1|Ωt-2),F(xt|Ωt-2))·ct-2,t|Ωt-3(F(xt-2|Ωt-3),F(xt|Ωt-3))·…·ct-n+1,t|Ωt-n(F(xt-n+1|Ωt-n),F(xt|Ωt-n))·ct-n,t(F(xt-n),F(xt))·f(xt)
我們得到持續(xù)期xt的條件密度函數(shù)f(xt|Ωt-1)后,便能通過(7)式求得xt的條件期望作為對xt的預(yù)測。
ψt1=∫xtf(xt|Ωt-1)dxt
(7)
其中ψt1即為基于本文模型得到的條件期望持續(xù)期的估計。
3.1 持續(xù)期數(shù)據(jù)預(yù)處理
目前獲得的高頻數(shù)據(jù)基本都是對大盤定時掃描的結(jié)果,因此單筆交易時間間隔大多是某個數(shù)的倍數(shù),比如3秒。這樣顯示單筆交易的時間ti和對應(yīng)交易量vi可能并不匹配,也就是說交易量中的一部分可能在ti之前就完成了,可是由于定時掃描的原因,無法反應(yīng)出精確匹配的時間ti和對應(yīng)交易量vi。本文在計算交易量持續(xù)期的時候?qū)⒏鶕?jù)交易量對單筆交易持續(xù)期進行線性拆分。
圖2 調(diào)整前后的Volume Duration(單位:秒)
3.2 模型估計
關(guān)于ACD模型的估計已經(jīng)有很多文獻給出,不再重述[15]。下面給出本文模型的估計方法,以n=3為例,估計交易量持續(xù)期xt的條件密度函數(shù)f(xt|xt-1,xt-2) ((6)式)。
3.2.1pair-Copula參數(shù)估計
在估計Copula參數(shù)前,需要得到持續(xù)期Xt-2,Xt-1,Xt的邊緣分布。根據(jù)給定的高頻交易數(shù)據(jù)得到N個交易量持續(xù)期的觀測值(x1,x2,……xN),根據(jù)N個觀測值構(gòu)造三個向量x1,x2,x3,其中x1=(x1,x2,……xN-2)′,x2=(x2,x3,……xN-1)′,x3=(x3,x4,……xN)′。上述三個向量都有N-2個觀測值,且x2,x1對應(yīng)位置的交易量持續(xù)期為x3對應(yīng)位置的交易量持續(xù)期的前兩個已實現(xiàn)持續(xù)期。由于本文模型主要是為了描述連續(xù)幾個交易量持續(xù)期之間的自相依結(jié)構(gòu),為了避免對邊緣分布的錯誤設(shè)定,采用經(jīng)驗分布估計x1,x2,x3的邊緣分布:
(8)
其中,I是示性函數(shù),當(dāng)xi,j≤r成立時取1,否則取0。
得到邊緣分布后,將其代入C藤Copula的對數(shù)似然函數(shù),便可以對參數(shù)進行極大似然估計。我們首先需要選擇用何種類型的pairCopula來描述收益率序列間的相依結(jié)構(gòu),常見的二元pairCopula有Gaussian,Studentt,Gumbel和ClaytonCopula。在實證分析中,有多種途徑來選擇使用何種Copula來描述特定的數(shù)據(jù)集,比如,可以觀察原始數(shù)據(jù)的散點圖,也可以用AIC、BIC準(zhǔn)則比較擬合結(jié)果,進而選擇合適的Copula函數(shù)類型。本文中將采用極大似然方法估計C藤中每個pairCopula的參數(shù),其對數(shù)似然函數(shù)如下:
(9)
其中n是多元Copula的維數(shù),T表示觀察值個數(shù),θ代表pairCopula的參數(shù)集合。以上的每一個pairCopula中至少有一個參數(shù)需要被估計,這取決于選擇的Copula函數(shù)類型,例如StudenttCopula有自由度和相關(guān)系數(shù)兩個參數(shù)需要估計,ArchimedeanCopula通常只有一個參數(shù)需要被估計。其中條件分布函數(shù)F(xj,t|x1,t…xj-1,t)和F(xj+i,t|x1,t…xj-1,t)可以通過(5)式給出的關(guān)系通過循環(huán)計算得出。最大化(9)式,便可以得到所有參數(shù)的估計值。在對pairCopula做極大似然估計時,初值的選取非常重要,可以參見文獻[9],這里不再詳述。本文模型中的對數(shù)似然函數(shù)為:
(10)
3.2.2 估計Xt的邊緣密度函數(shù)
本文采用非參數(shù)核密度估計方法對Xt的密度函數(shù)f(xt)進行估計:
(11)
其中,h為選擇的窗寬,K(u)為核函數(shù)。眾多理論研究證明,Epanechnikov核是最優(yōu)的核函數(shù),在實證研究中本文也采用該核函數(shù)。我們也對其他核函數(shù),例如高斯核做過分析,得到的結(jié)果幾乎沒有差別。Epanechnikov核函數(shù)表達式如下所示:
K(u)=0.75*(1-u2)I(|u|≤1)
3.2.3 預(yù)測條件密度函數(shù)和交易量持續(xù)期
估計出公式(6)中兩個Copula密度函數(shù)ct-2,t和ct-1,t|t的參數(shù)值,每列樣本持續(xù)期的經(jīng)驗分布函數(shù)值以及Xt的邊緣密度函數(shù)值以后,便可以根據(jù)(6)式對條件密度f(xt|xt-1,xt-2)進行計算,其中xt-1,xt-2為給定的已實現(xiàn)的前兩個持續(xù)期。xt在估計樣本的最大值和最小值之間按0.01秒為間隔取值,再根據(jù)(7)進行數(shù)值積分,便可以得到預(yù)測持續(xù)期ψt1。
3.3 密度預(yù)測檢驗
密度預(yù)測作為針對每個樣本點的概率密度分布的一種預(yù)測,在數(shù)量金融學(xué)等領(lǐng)域中的應(yīng)用比之常見的點預(yù)測和區(qū)間預(yù)測更能滿足實際需要[10]。
令p(xt|Ωt-1)為產(chǎn)生持續(xù)期xt的真實密度函數(shù)序列,可以通過判斷預(yù)測密度f和真實密度p是否相等來評估預(yù)測的優(yōu)劣[16]。由于p是不可觀測的,直接判斷f和p是否相等是困難的,可以基于以下命題解決[16]。
命題 1 假設(shè)p(xt|Ωt-1)是產(chǎn)生持續(xù)期xt的真實密度函數(shù)序列,f(xt|Ωt-1)是模型計算出的預(yù)測密度函數(shù)序列,Ωt-1持續(xù)期xt產(chǎn)生之前我們可以獲得的所有信息。如果:
p(xt|Ωt-1)=f(xt|Ωt-1)t=1,2……N
那么根據(jù)f(xt|Ωt-1)算出的累積分布函數(shù)序列:
獨立同分布與(0,1)上的均勻分布,即{zt}~iidU(0,1)。
可以基于直方圖和自相關(guān)函數(shù)圖來直觀判斷序列zt是否為獨立均勻分布[16]。除此之外,本文還應(yīng)用Kolmogorov-Smirnov檢驗(后文簡稱k-s檢驗)來評判序列zt是否為均勻分布。
表1 數(shù)據(jù)統(tǒng)計特征(持續(xù)期單位為秒)
4.1 數(shù)據(jù)預(yù)處理和數(shù)據(jù)描述
本文選用中國石化的分筆交易數(shù)據(jù)進行實證分析,數(shù)據(jù)從2011年8月8日到2011年9月1日。為了對模型進行參數(shù)估計和效果檢驗,將數(shù)據(jù)分為兩段,一段從8月8日到8月22日,作為樣本估計模型參數(shù)。另一段從8月23日到9月1日,用來檢驗?zāi)P偷念A(yù)測效果。考慮到集合競價和連續(xù)競價兩種機制的相互影響,剔除了集合競價數(shù)據(jù)。利用分筆交易數(shù)據(jù)中的單筆成交量和成交時間信息,通過對數(shù)據(jù)的線性拆分,得到完成給定交易量所需交易時間的數(shù)據(jù),即本文中要分析的交易量持續(xù)期序列。本文分別設(shè)定交易量指標(biāo)為5萬股、10股和20股進行分析。數(shù)據(jù)的統(tǒng)計特征如表1所示。
4.2 模型估計
在該部分,以交易量取10萬股為例進行實證分析的表述,5萬以及20萬股的實證過程完全一樣,三種交易量的實證結(jié)果將同時給出。持續(xù)期的EACD(1,1)的估計結(jié)果如表2所示。
表2 EACD(1,1)估計結(jié)果
圖3 EACD(1,1)擬合效果圖
圖i的自相關(guān)系數(shù)變化圖
表3 εi擬合效果統(tǒng)計
下面應(yīng)用本文提出的模型進行實證分析。以n=3為例,即在得到前兩個交易量持續(xù)期條件下,對下一交易量持續(xù)期進行分析和預(yù)測。由去除日內(nèi)效應(yīng)的交易量持續(xù)期數(shù)據(jù),可以得到三個持續(xù)期向量x1,x2,x3,然后基于公式(8)估計出每個序列中樣本值所對應(yīng)的經(jīng)驗分布函數(shù)值。同時考慮上尾和下尾相關(guān)性,在實證分析時應(yīng)用二元StudenttCopula來描述前后持續(xù)期之間的自相依結(jié)構(gòu)。對于StudenttCopula,需要估計的參數(shù)有自由度ν={ν12,ν13,ν23|1}和相關(guān)系數(shù)ρ={ρ12,ρ13,ρ23|1},其條件分布函數(shù)F(x2|x1),F(x3|x1)為:
F(xi|x1)=
(12)
表4 相關(guān)系數(shù)估計結(jié)果
在考慮初值問題后,將數(shù)據(jù)F1,F2,F3和公式(11)帶入公式(10),令對數(shù)似然函數(shù)L最大化,即可得出Student t-Copula參數(shù)的估計值。表5給出了參數(shù)的估計結(jié)果。
從表5我們可以看出,參數(shù)估計的T統(tǒng)計量都大于2,說明參數(shù)估計結(jié)果顯著,說明本文模型很好地描述相鄰持續(xù)期之間的自相依結(jié)構(gòu)關(guān)系。至此,我們完成了模型參數(shù)的估計。
4.3 模型預(yù)測效果比較
將參數(shù)帶入模型,結(jié)合對Xt的核密度估計,我們便可以通過向前滾動的方法,預(yù)測出下一交易量持續(xù)期服從的條件密度函數(shù),進而可以得到下一交易量持續(xù)期的預(yù)測。圖5展示了我們通過帶入去除日內(nèi)效應(yīng)的檢驗樣本數(shù)據(jù)得到預(yù)測效果圖。
從上圖可以清晰的看出,兩種模型都能對交易量持續(xù)期的聚集效應(yīng)做出很好的預(yù)測。但從標(biāo)出的紅圈中可以看出,相比于EACD(1,1)模型,本文模型能更好的預(yù)測下一交易量持續(xù)期,特別是在交易量持續(xù)期突然變大或變小時,本文模型在大多數(shù)情況下能做出更敏感的反應(yīng)。這表明,本文模型能更好的利用現(xiàn)有交易活躍度的信息做出準(zhǔn)確反應(yīng)。
同樣我們利用本文模型對交易量取5萬股和20萬股時產(chǎn)生的檢驗樣本持續(xù)期進行預(yù)測,并給出預(yù)測圖。同樣可以看出,本文提出的模型能更好地預(yù)測下一交易量持續(xù)期,特別是對較大或者較小的交易量持續(xù)期能夠作出更敏感的反應(yīng)。為了更明確地顯示本文所提模型在持續(xù)期突然變化時的優(yōu)勢,我們又對圖中所標(biāo)出的幾個關(guān)鍵地方給出了如下的定量結(jié)果(w=10萬股時):
表5 pair Copula (Student t) 的參數(shù)估計結(jié)果
表6 模型預(yù)測效果定量比較(突然變化時)
圖5 交易量持續(xù)期預(yù)測效果圖
由表6可以看出,對于突然變化的持續(xù)期,本文所提出的模型預(yù)測結(jié)果的相對誤差要遠遠小于EACD模型,說明本文模型在預(yù)測突變的持續(xù)期時具有一定的優(yōu)勢。
通過向前滾動得到每一個交易量持續(xù)期的條件密度函數(shù)序列后,便可以通過公式(7)得到檢驗樣本的累積分布函數(shù)值序列Zt。我們首先采用Diebold等提出的累積頻率直方圖來直觀的觀測Zt是否是均勻分布[16]。從圖6我們可以看出當(dāng)交易量取10萬股時,直觀上相比于EACD模型,本文模型產(chǎn)生的直方圖更接近于均勻分布。當(dāng)交易量為20萬股時,由于數(shù)據(jù)太少,本文模型的對應(yīng)的直方圖也表現(xiàn)出劇烈的抖動。當(dāng)交易量取5萬股時,明顯可以看出,本文模型產(chǎn)生的直方圖表現(xiàn)較好。
下面基于自相關(guān)系數(shù)(ACF)分析累積分布函數(shù)值序列的獨立性假設(shè)。圖7給出了自相關(guān)系數(shù)隨滯后階數(shù)(Lag)變化的變化圖。從圖7 中可以看出,本文模型和EACD模型產(chǎn)生的預(yù)測累積分布函數(shù)值序列均顯示出一定程度上的自相關(guān)型,拒絕了獨立性原假設(shè)。
表7中給出了對原假設(shè)累積分布函數(shù)值序列服從均勻分布的K-S檢驗結(jié)果,當(dāng)交易量取不同值時,檢驗結(jié)果均接受本文模型預(yù)測的累積分布函數(shù)序列服從均勻分布的原假設(shè)。
圖6 累積分布函數(shù)值序列直方圖
圖7 累積分布函數(shù)值序列自相關(guān)系數(shù)圖
V=10w(EACD)V=10wV=5wV=20wK?S統(tǒng)計量00962004120019500365p值43551e-008007730460605458是否接受1(否)0(是)0(是)0(是)
本文提出了一個用于描述持續(xù)期序列自相依結(jié)構(gòu)的基于藤Copula方法的半?yún)?shù)模型。為了檢測本文模型的效果,我們用EACD(1,1)模型作為基準(zhǔn)模型進行比較。ACD是參數(shù)化的且有嚴(yán)格自回歸結(jié)構(gòu)的持續(xù)期模型,這樣設(shè)定會限制對持續(xù)期過程的描述。在本文中我們將相鄰的n個持續(xù)期數(shù)據(jù)看作是某一個多元分布實現(xiàn),我們把這個多元分布分成兩部分來看,即變量的無條件邊際分布和變量間的相依結(jié)構(gòu)。眾所周知,Copula能夠很好的描述變量間的相依結(jié)構(gòu),這樣基于Copula函數(shù)就可以將變量間的相依結(jié)構(gòu)和變量的邊際分布分離開來。在本文中,我們采用藤Copula將多元Copula分解成一系列pairCopula的乘積,以引入更多的Copula來描述相依結(jié)構(gòu)。
在實證部分對中國石化的交易量持續(xù)期進行了分析,實證結(jié)果表明,EACD模型和本文模型都能很好的擬合并預(yù)測出持續(xù)期的聚集效應(yīng),但本文模型能更好的預(yù)測下一交易量持續(xù)期。尤其是在交易量持續(xù)期突然變大或變小時,本文模型在大多數(shù)情況下能做出更敏感的反應(yīng)。然后我們采用Diebold等提出的密度預(yù)測檢驗方法對兩種模型進行檢驗,檢驗結(jié)果接受了本文模型預(yù)測產(chǎn)生的累積分布函數(shù)序列服從均勻分布的原假設(shè),同時拒接了EACD模型產(chǎn)生的累積分布函數(shù)序列服從均勻分布的原假設(shè)。但是,本文模型和EACD模型預(yù)測產(chǎn)生的累積分布函數(shù)序列在獨立性上表現(xiàn)不好,表現(xiàn)出來一定的自相關(guān)性,這一點有待繼續(xù)改進。
[1]DiamondDW,VerrecchiaRE.Constraintsonshort-sellingandassetpriceadjustmentstoprivateinformation[J].JournalofFinancialEconomics, 1987, 82(2):33-53.
[2]EngleRF,RussellJR.Autoregressiveconditionalduration:Anewapproachforirregularlyspacedtransactiondata[J].Econometrics, 1998, 66(5):1127-1162.
[3]LundeA.Ageneralizedgammaautoregressiveconditionaldurationmodel[R].WorkingPaper,DepartmentofEconomics,UniversityofAarhus, 1998.
[4]GrammigJ,MaurerKO.Non-monotonichazardfunctionsandtheautoregressiveconditionaldurationmodel[J].TheEconometricsJournal, 2000, 3(1):16-38.
[5]BauwensL,GiotP.ThelogarithmicACDmodel:Anapplicationtothebid-askquoteprocessofthreeNYSEstocks[J].AnnalesdEconomieetdeStatistique, 2000, 60:117-149.
[6]SavuC,NgWL.TheSCoDModel:Analyzingdurationswithasemi-parametriccopulaapproach[J].InternationalReviewofFinance, 2005, 5(1-2): 55-74.
[7]NingC.Dependencestructurebetweentheequitymarketandtheforeignexchangemarket-Acopulaapproach[J].JournalofInternationalMoneyandFinance, 2010, 29(5):743-759.
[8]BedfordT,CookeRM.Probabilitydensitydecompositionforconditionallydependentrandomvariablesmodeledbyvine[J].AnnalsofMathematicsandArtificialIntelligence, 2001, 32(1):245-268.
[9]AasK,CzadoC,FrigessiA,etal.Pair-copulaconstructionsofmultipledependence[J].Insurance:MathematicsandEconomics, 2009,44(2),182-198.
[10]HeinenA,ValdesegoA.AsymmetricCAPMdependenceforlargedimension:Thecanonicalvineautoregressivecopulamodel[R].WorkingPaper,SSRN,2009.
[11]JoeH,LiHaijun.Taildependencefunctionsandvinecopulas[J].JournalofMultivariateAnalysis, 2010, 101(1):252-270.
[12]RighiMB,CerettaPS.AnalyzingthedependencestructureofvarioussectorsintheBrazilianmarket:Apaircopulaconstructionapproach[J].EconomicModelling, 2013, 35:199-206.
[13]BauwensL,GiotP,GrammigJ,etal.Acomparisonoffinancialdurationmodelsviadensityforecasts[J].InternationalJournalofForecasting, 2004, 20(4): 589-609.
[14]SkalrA.Fonctionsderepartitionanddimensionsetleursmarges[J].Publicationsdel′lnstitntStatistiquedel′UniversitedeParis, 1959,(8):229-231.
[15] 李廣川, 劉善存, 邱菀華. 交易量持續(xù)期的模型選擇:密度預(yù)測方法[J]. 中國管理科學(xué),2008,16(1):131-141.
[16]DieboldFX,GuntherTA,TayAS.Evaluatingdensityforecastswithapplicationstofinancialriskmanagement[J].InternationalEconomicReview, 1998, 39(4): 863-883.
[17] 葉五一,繆柏其,吳遵. 基于分位點自回歸模型的動態(tài)持續(xù)期風(fēng)險估計[J],數(shù)理統(tǒng)計與管理,2010,29(3): 500-517.
Auto-dependenceStructureEstimatingandForecastingofDurationBasedonVineCopula
YE Wu-Yi,LI Xiao-ying,MIAO Bai-Qi
(University of Science and Technology of China, Hefei 230026,China)
In this paper, the trading volume duration sequence derived from high-frequency tick-by-tick data is analyzed by Copula method. The auto-dependence structure of several consecutive trading volume durations is estimated by multivariate vine Copula, then, a new estimating method about conditional density function forecasting is also proposed. Moreover, a new forecasting method of the volume duration is put forward. Empirical results of Sinopec show that the predictive ability of our model is much better than that of EACD, which can also be demonstrated from the density forecasting test.
canonical vine copula;auto-dependence structure;ACD model;tick-by-tick data
2014-04-12;
2015-05-03
國家自然科學(xué)基金青年面上連續(xù)資助項目(71371007);國家自然科學(xué)基金面上資助項目(71172214);國家自然科學(xué)基金青年科學(xué)基金資助項目(71001095)
葉五一(1979-),男(漢族),山東安丘人,中國科技大學(xué)統(tǒng)計與金融系,副教授,金融工程博士,研究方向:風(fēng)險管理和金融工程.
1003-207(2015)11-0029-10
10.16381/j.cnki.issn1003-207x.2015.11.004
C931
A