蔡風(fēng)景,李 元
(1.溫州大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院,浙江 溫州 325035;2.廣州大學(xué)a.數(shù)學(xué)與交叉科學(xué)廣東省普通高校重點實驗室;b.經(jīng)濟與統(tǒng)計學(xué)院,廣東 廣州 510006)
基于DAG的Pair-Copula分解方法及其在股市相關(guān)性中的應(yīng)用
蔡風(fēng)景1,2a,李 元2b
(1.溫州大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院,浙江 溫州 325035;2.廣州大學(xué)a.數(shù)學(xué)與交叉科學(xué)廣東省普通高校重點實驗室;b.經(jīng)濟與統(tǒng)計學(xué)院,廣東 廣州 510006)
采用圖形建模工具中的有向非循環(huán)圖(DAG)方法對高維隨機變量進行Pair-Copula分解,并提出非正態(tài)的PC算法對DAG進行識別,最后應(yīng)用于國際股市分析主要股指的尾部相依結(jié)構(gòu)。數(shù)值模擬表明,若變量不服從橢圓分布,新的非正態(tài)PC算法要優(yōu)于傳統(tǒng)的PC算法。經(jīng)AR(1)-GARCH(1,1)模型過濾后的殘差DAG分析,股市信息流動具有明顯的區(qū)域效應(yīng),歐洲股市主要通過美國與美洲其它股指存在信息傳導(dǎo)。英國和香港是歐洲和亞洲股市信息聯(lián)系的紐帶,中國內(nèi)地只與香港存在直接的信息流動?;赟JC-Copula實證結(jié)果表明,歐洲德國和英國股市間的尾部相關(guān)性較強,亞洲股市間下尾相關(guān)系數(shù)要大于上尾,不同區(qū)域聯(lián)結(jié)股市間的上尾相關(guān)性強于下尾。
DAG;Copula函數(shù);SJC
1959年Sklar首先提出Copula理論,并指出隨機變量的聯(lián)合分布可分解為邊際分布和描述變量相關(guān)性的Copula函數(shù)。因此,若確定變量的邊緣分布和選定一個合適的Copula函數(shù)后,就可以方便地給出隨機向量的聯(lián)合分布[1]1-15。由于Copula函數(shù)在使用中對邊際分布的選擇沒有限制,因此可以運用Copula函數(shù)理論靈活構(gòu)造多元分布,這是傳統(tǒng)聯(lián)合分布無法比擬的優(yōu)勢。同時,Copula函數(shù)的參數(shù)估計可以分階段進行,解決了許多參數(shù)需同時估計的困難,大大降低了模型參數(shù)估計的復(fù)雜程度。
理論上Copula函數(shù)可簡單推廣到高維情形,但遺憾的是現(xiàn)有Copula函數(shù)絕大多數(shù)為二元Copula,大大限制了該方法在高維建模中的應(yīng)用。因此,對高維Copula函數(shù)的構(gòu)造研究也成了學(xué)術(shù)界關(guān)注的熱點問題。Bedford等提出使用Pair-Copula分解方法對高維Copula進行降維,該方法通過高維隨機變量密度函數(shù)的分解,將高維問題分解成若干個二元 Copula函數(shù)建模問題[2-3]。Kurowicka等采用了基于樹結(jié)構(gòu)的高維Copula分解方法[4-5]。國內(nèi)的杜子平等將高維Copula建模中藤的方法與動態(tài)Copula相結(jié)合,構(gòu)造了基于藤方法的高維動態(tài)Copula,且將該方法應(yīng)用于國際股票市場,研究其動態(tài)相關(guān)性[6]。張高勛等構(gòu)建基于藤的Pair-Copula方法應(yīng)用于國內(nèi)行業(yè)股指的VaR計算[7]。由于基于藤的Pair-Copula方法對相關(guān)結(jié)構(gòu)有較強的假定,因此推斷有一定的主觀性。近年來,有向非循環(huán)圖(Directed Acyclic Graph,DAG)被廣泛應(yīng)用于經(jīng)濟領(lǐng)域進行相關(guān)結(jié)構(gòu)的統(tǒng)計推斷,因此基于DAG的Copula方法也被提出應(yīng)用于高維分解,但遺憾的是在上述研究中DAG是經(jīng)驗給定[8-11]。本文提出非正態(tài)的PC算法對過濾后殘差的DAG進行統(tǒng)計推斷,這種基于數(shù)據(jù)的驅(qū)動方法要優(yōu)于主觀設(shè)定的經(jīng)驗方法,再利用基于DAG的Pair-Copula分解方法分析國際主要股指的尾部相依結(jié)構(gòu)。
邊際分布在[0,1]區(qū)間上均勻分布的Copula函數(shù)刻畫了聯(lián)合分布與邊緣分布之間的依賴結(jié)構(gòu)。
因此,多元密度函數(shù)可通過若干個條件密度函數(shù)的二元Copula函數(shù)的乘積進行構(gòu)建,實際上該分解過程為迭代運算。
對于有向非循環(huán)圖D= {V,E},V是點集,表示隨機變量的集合,E( V×V)為有向邊集合,兩點間至多有一條邊。令pa(v),de(v),nd(v)分別表示點v父結(jié)點、后代和非后代集,記為:
假定有向非循環(huán)圖D滿足因果Markov和忠實性假設(shè)兩個假設(shè),則任一分布P都可按照D中的父子結(jié)構(gòu)分解為[12]:
下面以五個變量為例,對基于DAG的Pair-Copula密度函數(shù)分解進行說明。
圖1 示例DAG
根據(jù)式(7),可將圖1中的聯(lián)合密度函數(shù)表示為:
目前,大部分學(xué)者主要通過PC算法對DAG進行識別,但傳統(tǒng)的PC算法要求序列為正態(tài)分布,而實際的金融時間序列往往并不服從正態(tài)分布,因此本文提出基于非正態(tài)分布的PC算法識別DAG,其思想是:若隨機向量不服從多元正態(tài)分布,先利用非參正態(tài)方法將其變化為正態(tài)分布再進行識別[12-13]。
由于金融時間序列數(shù)據(jù)通常表現(xiàn)出尖峰、厚尾和偏斜的特性,因此在邊際分布選擇上,除沿用經(jīng)典的GARCH類模型外,本文利用能同時體現(xiàn)數(shù)據(jù)的尖峰、厚尾和偏斜特性的偏斜-t分布來刻畫殘差序列的分布[14]。偏斜學(xué)生t分布的密度函數(shù)如下:
由于股票收益率數(shù)據(jù)一般會表現(xiàn)出波動聚集性,利用 AR(1)-GARCH(1,1)模型來描述股指收益率,誤差項通過偏斜t分布刻畫,參數(shù)采用極大似然方法進行估計。
為檢驗非正態(tài)PC算法的有效性,分別基于6維和9維隨機變量進行數(shù)值模擬。為保證模擬的穩(wěn)健性,隨機產(chǎn)生1 000個DAG,對每個DAG圖形均隨機產(chǎn)生1 000次正態(tài)分布、t分布、混合正態(tài)分布和Cauchy分布序列長度為1 000的樣本數(shù)據(jù),分別利用傳統(tǒng)的PC和非正態(tài)的PC算法進行識別。由表1模擬結(jié)果可知,模擬維數(shù)為6時,基于傳統(tǒng)PC算法的各種分布的平均正確識別率差異不大,但正態(tài)和t分布下平均錯誤識別率要明顯小于混合和Cauchy分布,同時導(dǎo)致基于前兩種分布的平均正確發(fā)現(xiàn)率要好于后兩種分布。利用新的非正態(tài)PC算法發(fā)現(xiàn)4個分布三種指標識別效果均較佳,算法對分布比較穩(wěn)健。在正態(tài)和t分布下,新算法和傳統(tǒng)的PC算法差異不大,但在混合正態(tài)分布和Cauchy分布下,新的非正態(tài)PC算法的平均錯誤識別率明顯要小于傳統(tǒng)的PC算法,從而說明新的算法識別效果更好,對分布更加穩(wěn)健。當模擬的維數(shù)增加到9維時,可以得到類似的結(jié)論。同時,當維數(shù)增加時,雖然平均正確識別率略有提高,但是平均錯誤識別率提高更快,總體識別效果下降。
表1 數(shù)值模擬結(jié)果(6維和9維)
由表2各股指收益率的統(tǒng)計指標可知,日收益率均值都在0附近。所有股指收益率的偏度均小于0,即股指收益率的分布左偏。各股指收益率的峰度均大于3,說明股指收益率具有尖峰厚尾性。Jarque-bera正態(tài)性檢驗表明上述股指收益率均顯著拒絕正態(tài)假設(shè)。Q6和Q26統(tǒng)計量表明,美國、加拿大、德國和臺灣股指收益率有一定的自相關(guān)性,股指收益率平方均存在顯著的自相關(guān),證實波動率聚集現(xiàn)象。
由上述基本統(tǒng)計性質(zhì)可知,上述股指收益率數(shù)據(jù)ARCH效應(yīng)顯著,分布呈明顯的尖峰厚尾和偏斜性,因而采用 AR(1)-GARCH(1,1)模型對數(shù)據(jù)的邊際分布進行建模,其中誤差項利用偏斜t分布來擬合。對建模后得到的標準殘差序列進行ARCH效應(yīng)檢驗,結(jié)果拒絕ARCH效應(yīng),表明標準殘差序列已無二階相關(guān)性,GARCH建模效果良好。
對經(jīng) AR(1)-GARCH(1,1)模型過濾后的標準殘差序列利用柯爾莫格洛夫和Shapiro-Wilk進行正態(tài)性檢驗(表3),發(fā)現(xiàn)大部分標準化后的殘差序列不服從正態(tài)分布,因此采用非正態(tài)的PC算法進行DAG(圖2)識別。
由圖2可知,歐洲德國和英國股市存在直接的聯(lián)結(jié),美洲和亞洲各國或地區(qū)股指內(nèi)部存在相互的信息流動,說明國際股市信息流動存在明顯的區(qū)域效應(yīng)。美國和歐洲股指的信息傳導(dǎo)需通過美國股市,這是因為美國股市在美洲乃至全球股市均起著舉足輕重的作用。歐洲和亞洲股指的信息流動需通過英國和香港股市作為中介,這主要是因為香港是新時代亞洲金融中心,在亞洲與世界股指信息流動中起著重要的聯(lián)結(jié)作用。中國內(nèi)地只存在與香港股市的有向邊連接且為有向邊的終點,說明香港對中國內(nèi)地股市有一定的信息傳導(dǎo),中國內(nèi)地股市雖然和全球股市聯(lián)動性逐步增強,但香港股市還是其聯(lián)動的重要紐帶。同時,再利用傳統(tǒng)的PC算法進行DAG識別,除個別有向邊指向不同之外,其余有向邊與圖2完全一致,這也說明非正態(tài)的PC算法比較穩(wěn)健。
表2 各股指收益率基本統(tǒng)計性質(zhì)
表3 殘差(標準化)的正態(tài)檢驗
圖2 國際主要股指收益率的DAG
根據(jù)圖2的DAG結(jié)果,基于SJC Copula方法進行高維Pair-Copula分解:
表4給出了式(13)中相應(yīng)Copula函數(shù)的尾部相關(guān)系數(shù)的估計結(jié)果。由尾部相關(guān)系數(shù)可知,國際主要股指收益率的尾部相關(guān)性系數(shù)較大,歐洲德國和英國股指之間的尾部相關(guān)性最強,最容易導(dǎo)致暴漲暴跌的情形發(fā)生。美洲美國和加拿大股市尾部相關(guān)性較強,美國和巴西股指尾部相關(guān)性較小,不超過0.1,加拿大和巴西的條件尾部相關(guān)系數(shù)接近于0,說明巴西和其它主要美洲股指同時暴漲暴跌的可能性較小。亞洲股指內(nèi)部中國內(nèi)地和香港、日本和臺灣的下尾相關(guān)系數(shù)均大于上尾,說明同時暴跌的可能性要大于暴漲。不同區(qū)域(洲與洲)國家或地區(qū)股市之間的上尾相關(guān)系數(shù)大于下尾(美國-德國;英國-香港),同時暴漲的可能性要大于暴跌。
表4 基于SJC copula高維Pair分解的尾部相關(guān)系數(shù)
本文基于DAG方法對高維Copula進行Pair-Copula分解。該分解方法允許雙變量Copula之間可靈活建模,自由選擇不同類型的Copula函數(shù)。相比較以前基于藤結(jié)構(gòu)的Copula方法,本文采用的方法在參數(shù)估計和模型構(gòu)造上更節(jié)約,效率更高。同時,本文采用非正態(tài)PC算法對DAG進行統(tǒng)計推斷,克服了以往只依賴主觀及經(jīng)驗設(shè)定、過分依賴正態(tài)假設(shè)的不足,應(yīng)用范圍更廣。將該方法應(yīng)用于國際主要股票市場分析主要股指收益率的相依結(jié)構(gòu),DAG識別結(jié)果表明,美洲、歐洲和亞洲內(nèi)部股指信息流動順暢,國際主要股指信息傳導(dǎo)具有明顯的區(qū)域效應(yīng)。中國和國際股市的信息傳遞還是需通過香港股市。基于SJC-Copula函數(shù)的Pair-Copula分解結(jié)果表明,國際主要股指的尾部相關(guān)性較強,尤其是歐洲德國和英國股市。亞洲股市間的下尾相關(guān)性要強于上尾,而不同區(qū)域國家股市間的尾部則恰好相反。由于圖模型理論在高維數(shù)據(jù)降維中具有獨特優(yōu)勢,因此可以預(yù)見圖模型在Copula理論的Pair分解中應(yīng)該大有可為,這也是本文未來要深入研究的問題。
[1] 韋艷華,張世英.Copula理論及其在金融分析上的應(yīng)用[M].北京:清華大學(xué)出版社,2008.
[2] Bedford T,Cooke R M.Probability Density Decomposition for Conditionally Dependent Random Variables Modeled by Vines[J].Annals of Mathematics and Artifcial Intelligence,2001,32(1).
[3] Bedford T,Cooke R M.Vines-A New Graphical Model for Dependent Random Variables[J].Annals of Statistics,2002,30(4).
[4] Kurowicka D,Cooke R M.Sampling Algorithms for Generating Joint Uniform Distributions Using the Vine -copula Method[J].Computational Statistics and Data Analysis,2007,51(6).
[5] Aas K,Czado C,F(xiàn)rigessi A,et al.Pair-Copula Constructions of Multiple Dependence[J].Insurance:Mathematics and Economics,2007,44(2).
[6] 杜子平,閆鵬,張勇.基于“藤”結(jié)構(gòu)的高維動態(tài)Copula的構(gòu)建[J].數(shù)學(xué)的實踐與認識,2009,30(10).
[7] 張高勛,田益祥,李秋敏.基于Pair-Copula模型的資產(chǎn)組合VaR比較研究[J].系統(tǒng)管理學(xué)報,2013,22(2).
[8] Yang J,Guo H,Wang Z J.International Transmission of Inflation among G-7Countries:A Data-determined VAR Analysis[J].Journal of Banking & Finance,2006,30(10).
[8] 楊子暉.財政政策與貨幣政策對私人投資的影響研究——基于有向無環(huán)圖的應(yīng)用分析[J].經(jīng)濟研究,2008(5).
[9] 蔡風(fēng)景,蔡周策,李元.基于DAG方法的經(jīng)濟變量因果關(guān)系研究[J].統(tǒng)計與信息論壇,2008,23(9).
[10]Czado C,Min A,Baumann T,et al.Pair-Copula Constructions for Modeling Exchange Rate Dependence[R/OL].[2013-11-20].http://wwwm4.ma.tum.de/Papers/Czado/cc-pubs.html.
[11]Bauer A,Czado C,Klein T.Pair-Copula Constructions for Non-Gaussian DAG Models[J].Can J.Statistics,2012,40(1).
[12]Spirtes P,Glymour C,Scheines R.Causation,Prediction and Search[C].Proceedings of Adaptive Computation and Machine Learning.Cambridge:MIT Press,2000.
[13]Liu H,Han F,Yuan M,et al.High Dimensional Semiparametric Gaussian Copula Graphical Models[J].Ann.Stat.2012,40(40).
[14]Hansen B E.Autoregressive Conditional Density Estimation[J].International Economic Review,1994,35(3).
[15]Patton A J.Modeling Asymmetric Exchange Rate Dependence[J].International Economic Review,2006,47(2).
Pair-copula Constructions with DAG and Application on the International Stock Markets
CAI Feng-jing1,2a,LI Yuan2b
(1.School of Mathematics &Information Science,Wenzhou University,Wenzhou 325035,China;a.Key Laboratory of Mathematics and Interdisciplinary Sciences of Guangdong Higher Education Institutes;b.School of Economics and Statistics,2.Guangzhou University,Guangzhou 510006,China)
The Pair-Copula constructions based on directed acyclic graph which is distinguished by Nonnormal PC algorithm is proposed and used in the dependence structure among the international stock markets.Simulation shows that the Nonnormal PC algorithm is superior to the traditional method.Empirical result shows that the regional segmentation of the major international financial markets is proved in this study,the connection between America and European stock markets by US;the connection between European and Asian stock markets by England and Hong Kong;Chinese stock market is only connected Hong Kong directly.The tail dependence between German and England stock markets is the strongest the lower tail dependence between Asian stock markets is stronger than the upper,while the upper tail dependence between different continents is stronger than the lower.
directed acyclic graph;Copula function;SJC
O212∶C812
A
1007-3116(2014)06-0048-06
2013-11-18
國家自然科學(xué)基金項目《一類半?yún)?shù)時間序列模型的統(tǒng)計推斷》(11271095);教育部人文社會科學(xué)基金項目《圖模型方法在金融計量中的應(yīng)用》(12YJCZH002);高等學(xué)校博士學(xué)科點專項科研基金《一類非平穩(wěn)變系數(shù)部分線性時間序列模型的研究》(20124410110002);國家統(tǒng)計科研計劃一般項目《基于圖模型方法的大數(shù)據(jù)處理技術(shù)及應(yīng)用研究》(2013LY136);數(shù)學(xué)與交叉科學(xué)廣東省普通高校重點實驗室開放課題資助項目《經(jīng)濟計量中高維數(shù)據(jù)的圖模型建模及應(yīng)用》(2012-02-03-01)
蔡風(fēng)景,男,浙江瑞安人,管理學(xué)博士,副教授,研究方向:數(shù)量經(jīng)濟和金融統(tǒng)計;
李 元,男,山東臨沂人,概率統(tǒng)計專業(yè)博士,教授,博士生導(dǎo)師,研究方向:金融統(tǒng)計和風(fēng)險管理。
(責(zé)任編輯:崔國平)