張明珠,岳曉鵬,田 萍
(許昌學(xué)院 數(shù)學(xué)科學(xué)學(xué)院,許昌 461000)
在概率中總是假定隨機變量之間是相互獨立的,但在很多實際問題中獨立很難滿足,隨機變量之間存在著千絲萬縷的聯(lián)系。因此對隨機變量的這種復(fù)雜關(guān)系,即相依性的研究一直以來是個熱點問題[1,2],對它出現(xiàn)了很多不同指標(biāo)的刻畫,Kendall’s τ[3]就是其中的一個,它刻畫出了二維隨機變量,對于二維以上的隨機變量卻沒有定義。因此本文擬建立三維隨機變量的和諧定義,即從和諧的角度衡量了三維隨機變量之間的相依關(guān)系。借助于連接函數(shù)copula得到其計算公式,并且進一步討論得到幾個等價的計算公式。最后討論三維隨機變量和諧度量指標(biāo)和二維邊緣和諧度量指標(biāo)的關(guān)系,得到它們之間關(guān)系的表達式。本文第一部分將介紹copula[3]函數(shù)和Kendall’s τ的定義及相關(guān)結(jié)論;第二部分將建立三維隨機變量的和諧定義,并借助copula函數(shù)得到其計算公式;第三部分將具體討論三維隨機變量的 Kendall’s τ與二維邊緣Kendall’s τ的關(guān)系。
布,則二維隨機變量的Kendall’s τ的定義為
τ=τX,Y=P((X1-X2)(Y1-Y2)>0)-P((X1-X2)(Y1-Y2)<0)
為了方便研究,這里把二維隨機變量的和諧度量指標(biāo)Kendall’s τ簡記為 τ(2)或 τ(2)X,Y。
引理1[3]條件同上,若二維隨機變量是連續(xù)型的,存在唯一的 Copula 有 H(x,y)=C(F(x),G(y)),則
通過τ的定義可以看出,它從一個側(cè)面反映了二維隨機變量X和Y的相依關(guān)系。就是用二維隨機變量(X,Y)是一致增或一致減與非一致增或非一致減的差值來表現(xiàn)的它們之間的相依性,是衡量復(fù)雜的相依關(guān)系的一個度量。其實它是一種序的關(guān)系。這里把隨機變量之間的一致增和一致減統(tǒng)稱為一致序,把隨機變量之間的一增一減統(tǒng)稱為不一致序。當(dāng)然也可通過τ(2)值反映出隨機變量取值的一種變化。因此成為衡量相依關(guān)系的一個重要指標(biāo)。
三維隨機變量的相依性將更加復(fù)雜,下面就從和諧的角度給出相依性的一種度量,因為這種定義和二維的幾何意義相同,所以也把它命名為和諧指標(biāo)。
Copula是連接聯(lián)合分布函數(shù)與其邊緣分布函數(shù)的函數(shù)(有的文獻把它稱為連接函數(shù)[2])。下面給出Copula的存在性定理。即Sklar定理[3]。
Sklar定理[3]令二維隨機變量(X,Y)的聯(lián)合分布函數(shù)為H,邊緣分布函數(shù)分別為F和G,那么存在一個Copula,有
H(x,y)=C(F(x),G(y)),?(x,y)∈R2
若F和G連續(xù),則C是存在唯一的。相反,如果C是Copula,并且F和G是分布函數(shù),則由上式確定的H是邊緣分布分別為F和G的聯(lián)合分布。
下面給出二維隨機變量的Kendall’s τ的定義[3]。
定義1[3]設(shè)二維隨機變量(X1,Y1)和(X2,Y2)服從同一分
定義2 設(shè)三維隨機變量(X1,Y1,Z1)和(X2,Y2,Z2)具有相同的聯(lián)合分布函數(shù)H(x,y,z),三維隨機變量和諧指標(biāo)的定義為
為了和二維和諧度量指標(biāo)Kendall’s τ區(qū)別,記三維和諧度量指標(biāo) Kendall’s τ為或 τ(3)X,Y,Z。
因為[P(X1-X2)(Y1-Y2)(Z1-Z2)>0+P(X1-X2)(Y1-Y2)(Z1-Z2)<0]=1,所以定義2可以簡化為
從定義2可以看出,三維和諧度量指標(biāo)Kendall’s τ是一致序減去不一致序,它與二維的定義的幾何意義是相同的。由于和諧度量指標(biāo)Kendall’s τ一般是衡量二維隨機變量之間序關(guān)系的度量,對三維隨機變量沒有具體的刻畫,而τ(3)也是從序的角度衡量隨機變量之間關(guān)系的度量,因此可以說三維和諧度量指標(biāo) Kendall’s τ是二維和諧度量指標(biāo)Kendall’s τ的一種推廣。
三維隨機變量的和諧指標(biāo)τ(3)同樣可以借助于Copula這個工具來表達。
定理1 設(shè)(X1,Y1,Z1)和(X2,Y2,Z2)是兩個同分布的三維連續(xù)型隨機變量,且聯(lián)合分布函數(shù)為H,邊際分布分別為F1(x),F(xiàn)2(x)和 F3(x)。 令 C 為三維隨機變量的聯(lián)合分布對應(yīng)的Copula,有 H(x,y,z)=C(F1(x),F(xiàn)2(x),F(xiàn)3(x)),則
證明:首先
類似的
所以
結(jié)論得證。
由定理1的結(jié)論知,三維Kendall’s τ也可以完全借助Copula表達。三維Kendall’s τ還有另外一種Copula表述形式,如下定理所示:
定理2 前提條件同定理2,則
對 P(X1<X2,Y1<Y2,Z1<Z2)的證明換一種角度
因為
又因為
因此
所以
結(jié)論得證。
通過定理1和2的證明可知,τ(3)的兩種Copula形式是等價的。定理2的結(jié)論更適合當(dāng)Copula C是對稱形式時的使用。當(dāng)然也可以根據(jù)不同的情況,采用不同的形式。通過上述兩個定理的證明,可以得到一個有趣的結(jié)論。
結(jié)論1 設(shè)(X,Y,Z)為任意的三維連續(xù)隨機變量,且聯(lián)合分布函數(shù)為 H,邊際分布分別為 F1(x),F(xiàn)2(x)和 F3(x)。 令 C為三維隨機變量的聯(lián)合分布函數(shù)對應(yīng)的Copula,即H(x,y,z)=C(F1(x),F(xiàn)2(x)和 F3(x))。 則
證明:只需利用定理1和2的結(jié)論即可得上式。
三維 Kendall’s τ和二維 Kendall’s τ具有一定的聯(lián)系,又有一定的差別。那么能否建立三維Kendall’s τ與其自身的二維邊緣Kendall’s τ的關(guān)系呢?下面來研究它們之間具有何種關(guān)系。
定理3 設(shè)(X,Y,Z)為三維連續(xù)的隨機變量,聯(lián)合分布函數(shù)為 H,一維邊緣分布函數(shù)分別 F1(x),F(xiàn)2(y)和 F3(x)。令分布函數(shù)對應(yīng)的 Copula 是 C,有 H(x,y,z)=C(F1(x),F(xiàn)2(y),F(xiàn)3(x))則
其中 τ(2)X,Y、τ(2)Y,Z、τ(2)X,Z分別表示隨機變量(X,Y,Z)的二維隨機變量(X,Y)、(Y,Z)、(X,Z)的二維邊緣 Kendall’s τ。
證明:由隨機變量(X,Y,Z)和(X,Y)的關(guān)系知,隨機變量(X,Y)的聯(lián)合分布函數(shù)為 H(x,y,+∞),則聯(lián)合分布函數(shù)對應(yīng)的 Copula 為 C(F1(x),F(xiàn)2(y),1)。 由二維 Kendall’s 的定義知,隨機變量(X,Y),(X,Z)和(Y,Z)的 Kendall’s τ分別為
τ(2)X,Y、τ(2)Y,Z、τ(2)X,Z分別是 二 元函數(shù)的 積 分表達式 ,因此若想建立 τ(3)和它們的關(guān)系,就必須想辦法使 τ(3)這個三重積分表達式變?yōu)槎胤e分表達式。記
Δai=C(u1,u2,ai)-C(u1,u2,ai-1) (i=1,2,…,n)
令 λ=max{Δa1,Δa2,…,Δan},則
同理
所以由定理2得
結(jié)論得證。
由定理 3可得到三維 Kendall’s τ與二維邊緣 Kendall’s τ的關(guān)系。從而說明,三維Kendall’s τ可以通過它的分量,即二維邊緣Kendall’s來表示,二者之間存在密切的關(guān)系。定理4還給出了求三維Kendall’s τ的另一種方法,即可以借助二維邊緣 Kendall’s τ來求 τ(3)。
例 1:設(shè)三維連續(xù)的隨機變量(X,Y,Z)對應(yīng)的 Copula[2]形式如下,求 τ(3)。
解:(方法 1)首先利用定理 2 求 τ(3)。
由Copula的對稱性知
(方法 2)由定理 3知,只需要求出二維邊緣 Kendall’s τ即可求得 τ3。
本文從和諧的關(guān)系出發(fā)度量和刻畫了三維隨機變量之間復(fù)雜的相依關(guān)系,對解決實際問題提供幫助。并且進一步探討三維隨機變量的和諧指標(biāo) Kendall’s τ與二維邊緣Kendall’s τ之間的關(guān)系,還建立了它們之間關(guān)系的恒等式。這在二維的和諧關(guān)系的研究基礎(chǔ)之上又前進了一步,具有較強的理論意義。在今后的研究中,將對它們之間關(guān)系作更深入的挖掘。
[1]張堯庭.我們應(yīng)該選用什么樣的相關(guān)性指標(biāo)[J].統(tǒng)計研究,2002,(9).
[2]Roger.B.Nelsen.Multidimensional Dependency Measures[J].Journal of Multivariate Analysis,2004,89.
[3]Roger.B.Nelsen.An Introduction to Copulas[M].New York:Springer-Verlag,Inc,1999.