王乃瑩,梁馮珍
(天津大學(xué) 理學(xué)院,天津 300072)
基于半?yún)?shù)估計(jì)的W-CIC Copula函數(shù)選擇準(zhǔn)則
王乃瑩,梁馮珍
(天津大學(xué) 理學(xué)院,天津 300072)
基于全參數(shù)極大似然估計(jì)的AIC準(zhǔn)則是常用的模型選擇標(biāo)準(zhǔn).在實(shí)際應(yīng)用中,往往將其用于半?yún)?shù)偽極大似然估計(jì),其中存在模型選擇的偏差.CIC準(zhǔn)則適用于半?yún)?shù)偽極大似然估計(jì),但對(duì)于大部分在邊界處增長(zhǎng)過(guò)快的Copula密度函數(shù)該準(zhǔn)則失效.基于此,對(duì)原有的CIC準(zhǔn)則進(jìn)行改進(jìn)建立W-CIC準(zhǔn)則,即降低Copula密度函數(shù)在邊界處的權(quán)重,是CIC準(zhǔn)則的加權(quán)版本.W-CIC準(zhǔn)則打破了原準(zhǔn)則的局限性,適用于更多的Copula函數(shù)模型.
模型選擇;AIC;CIC;copulae;W-CIC;最大偽似然估計(jì)
Copula函數(shù)種類(lèi)繁多,不同Copula函數(shù)有不同的特征,可以描述不同的相關(guān)關(guān)系.在實(shí)際的統(tǒng)計(jì)研究中,對(duì)同一問(wèn)題選擇不同Copula模型進(jìn)行研究,可能會(huì)導(dǎo)致不同的分析結(jié)果.因此面臨的重要問(wèn)題就是:假設(shè)存在若干個(gè)備選Copula函數(shù)模型,如何從這幾個(gè)Copula函數(shù)方案中選取滿(mǎn)足要求的最佳Copula函數(shù).
針對(duì)這一問(wèn)題,近年來(lái)國(guó)外專(zhuān)門(mén)討論Copula函數(shù)的選擇的文獻(xiàn)很多,而且也取得了一些有意義的成果.Erik Kole[1]和Durrleman[2]等通過(guò)經(jīng)驗(yàn)Copula函數(shù)與已知Copula函數(shù)的最小K-S距離來(lái)確定最優(yōu)的Copula函數(shù).Huard等[3]利用Bayesian定理選擇最優(yōu)的Copula函數(shù),其優(yōu)點(diǎn)為Copula函數(shù)的選擇并不依賴(lài)于Copula函數(shù)參數(shù)的估計(jì).在國(guó)內(nèi),針對(duì)Copula函數(shù)選擇的研究不是很多,如任仙玲等[4]建立基于非參數(shù)核密度估計(jì)的Copula函數(shù)選擇原理.王沁等[5]建立基于截?cái)鄑au的Copula選擇原理等等.
以上文獻(xiàn)從不同角度考慮最優(yōu)Copula函數(shù),而在實(shí)際應(yīng)用中較常用的方法是基于最大似然估計(jì)的AIC(Akaike Information Criteria)準(zhǔn)則[6].使用AIC準(zhǔn)則的前提是邊緣分布已知,基于全參數(shù)的極大似然估計(jì).但在實(shí)際使用中,研究者[7]往往將其應(yīng)用于更一般的以似然為基礎(chǔ)的情況.例如,當(dāng)邊緣分布未知,我們使用經(jīng)驗(yàn)分布函數(shù)代替邊緣分布函數(shù),即用半?yún)?shù)偽似然估計(jì)(MPLE)來(lái)估計(jì)參數(shù)Copula模型時(shí),一般使用推廣的準(zhǔn)則(用計(jì)算的最大偽似然函數(shù)值直接代替AIC準(zhǔn)則中最大似然函數(shù)值).盡管該準(zhǔn)則被廣泛應(yīng)用,但偽似然并不是真正的似然,其正確性和準(zhǔn)確性還有待考證.
本文鑒于此,重新考慮CIC準(zhǔn)則的建立過(guò)程并對(duì)其進(jìn)行改進(jìn),添加權(quán)重函數(shù),建立了W-CIC準(zhǔn)則.W-CIC準(zhǔn)則打破了原準(zhǔn)則的局限性,適用于所有的Copula函數(shù)模型.
由于對(duì)大部分尾部相關(guān)性高的Copula函數(shù)CIC準(zhǔn)則的偏差修正項(xiàng)發(fā)散,這就使得CIC準(zhǔn)則具有很大的局限性.其中一個(gè)改進(jìn)方法就是添加權(quán)重函數(shù)w(u),來(lái)降低Copula密度函數(shù)在邊界處的權(quán)重,例如在邊界處定義權(quán)重函數(shù)w(u)=0或者w(u)≈0,其余處w(u)=1.這樣加權(quán)形式之后的W-CIC準(zhǔn)則一定得到一個(gè)有限的數(shù),適應(yīng)于更多的Copula函數(shù)模型.以下將重新考慮并改進(jìn)CIC準(zhǔn)則的建立過(guò)程,建立W-CIC準(zhǔn)則.
首先給出加權(quán)KL距離的定義.
KLw(c°(·),c(·,θ))=∫w(u)×{c°(u)logc°(u)c(u,θ)-[c°(u)-c(u,θ)]}du
其中H(θ)=∫w(u)logc(u,θ)c°(u)du-∫w(u)c(u,θ)du
與CIC準(zhǔn)則相同,W-CIC準(zhǔn)則也以漸近偽似然理論為基礎(chǔ).在研究Δw,n之前,我們需要簡(jiǎn)單介紹偽似然估計(jì)的漸近理論,以便作為推導(dǎo)出修正偏差項(xiàng)的理論工具.
引理1 在Tsukahara[11]中A1條件下,
∑=Γ+Ω.
(1)
其中
(2)
Ω=VarZ,Z=
(3)
這里η為分布為C°的隨機(jī)向量.
令I(lǐng)(u,θ)=?2logc(u,θ)?θ?θt,考慮二階導(dǎo)函數(shù)
H(2)(θ)∶=∫w(u)I(u,θ)c°(u)du-∫(w(u)c(u,θ)φ(u,θ)φt(u,θ)du-∫w(u)c(u,θ)I(u,θ)du
(4)
基于偽似然估計(jì)的漸近理論,我們可以推導(dǎo)出修正偏差項(xiàng)的具體形式.
定理1在Tsukahara[11]中A1~A5條件下
(5)
證明:
將Hn(θ^w)在θ^w=θ°w處進(jìn)行二階泰勒展開(kāi).
由于Jnpn→∞J,所以
(6)
ζ′(u,θ)=?w(u)logc(u,θ)?u
ζ″(u,θ)=?2w(u)logc(u,θ)?u?ut
(7)
因此,
由引理3和引理4的結(jié)論可以得到以下定理.
這里EZn=0并且
(8)
(9)
總結(jié)一下,我們得到了偏差修正項(xiàng)的精確形式.
(10)
AIC-like W-CIC 假設(shè)備選模型完全正確,在這種假設(shè)下準(zhǔn)則中的部分內(nèi)容將會(huì)得到一些簡(jiǎn)化.
2{∑ni=1w(Fn,⊥(Xi))logc(Fn,⊥(Xi)θ^w-n∫w(u)c(u,^w)du}-2(δ^δ^)
其中Γ^為Γ的廣義逆矩陣.Γ^=Varθ^w[w(η^)φ(η,θ^w-ξ(θ^w)]為Γ的經(jīng)驗(yàn)估計(jì)量.當(dāng)(Y1,Y2,…,Yd)~C(u,θ^w)時(shí),Ca,b(ua,ub,θ^w)為(Ya,Yb)的Copula函數(shù).
Ω^=Varθ^w{∫[0,1]d?[w(u)φ(u,θ^w)-ξ(θ^w)]?u(I{η≤u}⊥-u)dC(u,θ^w)}
在實(shí)際中Ω^可由蒙特卡羅模擬得到.
∑^=1n∑ni=1{w(η^(i),θ^w)-ξ(θ^w)+Z^i}{w(η^(i),θ^w)-ξ(θ^w)+Z^i}t
本文基于CIC準(zhǔn)則,重新考慮其建立過(guò)程并進(jìn)行改進(jìn),添加權(quán)重函數(shù),建立了W-CIC準(zhǔn)則.W-CIC準(zhǔn)則雖然形式復(fù)雜,但它的得出在于進(jìn)一步加深證實(shí)了偽似然估計(jì)并不適合估計(jì)尾部相關(guān)性高的Copula模型,尤其是對(duì)Copula的密度函數(shù)取對(duì)數(shù)運(yùn)算之后,使得在邊界處增長(zhǎng)速度更快.在CIC準(zhǔn)則建立過(guò)程中,偏差項(xiàng)Δm,n的部分內(nèi)容發(fā)散.所以添加權(quán)重函數(shù)來(lái)降低尾部權(quán)重顯得尤為需要.因此本文所得到W-CIC準(zhǔn)則是具有較強(qiáng)的理論意義.
[1] KOLE E, KOEDIOEDIJK K, VERBEEK M. Selecting Copulas for risk management [J]. Journal of Banking and Finance, 2007, 31(8): 2405-2423.
[2] DURRLEMAN V, NIKEGHBALI A, RONCALLI T. Which Copula is the right one? [R]. Paris: Groupe de Recherche Operationnelle, Credit Lyonnais, Working Paper, 2000.
[3] HUARD D, VIN G, FAVRE A C. Bayesian Copula selection [J]. Computational Statistics & Data Analysis, 2006, 51(2): 809-822.
[4] 任仙玲, 張世英. 基于非參數(shù)核密度估計(jì)的Copula 函數(shù)選擇原理[J]. 系統(tǒng)工程學(xué)報(bào), 2007, 20(5): 92-97.
[5] 王 沁, 王 璐, 何 平. 基于截?cái)鄑au的Copula 模型選擇及應(yīng)用[J]. 數(shù)理統(tǒng)計(jì)與管理, 2008, 27(1): 118-123.
[6] CLAESKENS G, HJORT N. Model Selection and Model Averaging [M]. Cambridge University Press, 2008.
[7] CHEN X, FAN Y. Pseudo-likelihood ratio tests for semiparametric multivariate Copula model selection [J]. Can. J. Stat. 2005, 33(3): 389-414.
[8] GR?NNEBERG S, HJORT N L. The Copula information criterion [J]. SFI2 and Department of Statistics, 2008, 41(2): 113-138.
[9] GR?NNEBERG S. The Copula information criterion and its implications for the maximum pseudo likelihood estimator. In Dependence Modeling: Handbook on Vine Copulae [R]. World Scientific, 2010. 131-163.
[10] GR?NNEBERG S, HJORT N L. The Copula information criteria [J]. Scandinavian Journal of Statistics, 2014, 41(2): 436-459.
[11] TSUKAHARA H. Semiparametric estimation in Copula models [J]. Scandinavian Journal of Statistics, 2005, 33(3): 357-375.
Study on weighted Copula information criterion based on semiparametric estimation
WANG Nai-ying, LIANG Feng-zhen
(School of Science, Tianjin University, Tianjin 300072, China)
Akaike information criterion (AIC) based on fully parametric maximum likelihood estimation is a commonly used Copula function selection criterion. In practical applications, many investigations use it as a model selection criterion for the MPLE. But it exists a deviation in model selection. Copula Information Criterion (CIC) was developed in the semiparametric setting. However, such a model-selection procedure cannot exist for copula models with densities that grow very fast near the edge of the unit cube. This problem affects most popular copula models. Weighted-CIC formula as a modification of CIC formula was proposed to down-weight the sensitivity of the pseudo-likelihood near the edge of the unit cube. It was the weighted version of CIC formula. W-CIC formula was applicable to more copula functions and breaks the limitation of CIC formula.
model selection; AIC; CIC; copulae; W-CIC; maximum pseudo-likelihood estimators
2015-10-19.
王乃瑩(1991-),女,碩士,研究方向:概率論與數(shù)理統(tǒng)計(jì).
F830
A
1672-0946(2017)01-0094-04