[摘 要] 偏相關(guān)系數(shù)作為研究變量之間“純”相關(guān)關(guān)系的一種手段,在相關(guān)分析中占有非常重要的地位。本文以三變量為例分析了偏相關(guān)系數(shù)的計(jì)算過(guò)程,認(rèn)為在排除其余變量對(duì)進(jìn)行偏相關(guān)分析的兩個(gè)變量的影響時(shí),存在一個(gè)數(shù)學(xué)期望不為零的漂移量,這無(wú)疑使得變兩間的“純”相關(guān)關(guān)系受到影響。最后文章分析了漂移量的含義,并就偏相關(guān)系數(shù)計(jì)算的改進(jìn)提出了初步的設(shè)想。
[關(guān)鍵詞] 相關(guān)分析 偏相關(guān)系數(shù)
相關(guān)和回歸分析作為研究變量之間相關(guān)關(guān)系的兩種基本方法,在統(tǒng)計(jì)學(xué)中占有非常重要的地位,在進(jìn)行實(shí)證分析過(guò)程中二者之間存在互補(bǔ)關(guān)系。
一、偏相關(guān)系數(shù)基本計(jì)算方法分析
我們以三個(gè)變量(y,χ1,χ2)為例,來(lái)說(shuō)明偏相關(guān)系數(shù)計(jì)算的基本思想。假設(shè)變量y,χ1,χ2之間的數(shù)量依存關(guān)系為:
y=ω0+ω1χ1+ω2χ2+μ (1)
在求y與χ1的偏相關(guān)系數(shù)時(shí),必須清除χ2的影響,為此先求y、χ1對(duì)χ2的回歸:
y=αμ+χ2+ε1—— (2)
y= +χ2+ε2—— (3)
在傳統(tǒng)的偏相關(guān)系數(shù)計(jì)算方法中認(rèn)為(1)式和(2)式中的殘差部分ε1和ε2分別是變量y和χ1中未被χ2解釋的部分,即清除了χ2影響后y和χ1的值,這兩個(gè)殘差間的相關(guān)關(guān)系就表示了y和χ1之間的純相關(guān)關(guān)系。因此界定排除χ2影響后y和χ1之間的偏相關(guān)系數(shù):
(4)
其中就是ε1和ε2的簡(jiǎn)單相關(guān)系數(shù)。
由此可見(jiàn):偏相關(guān)系數(shù)計(jì)算思想的就是對(duì)進(jìn)行偏相關(guān)分析的兩個(gè)變量“排除其他變量的影響”,通過(guò)兩個(gè)變量中其他變量不能解釋的部分間的相關(guān)關(guān)系來(lái)分析兩變量間的“純”依存關(guān)系,因此偏相關(guān)分析的關(guān)鍵在于如何有效排除其他變量的影響。在傳統(tǒng)的偏相關(guān)系數(shù)計(jì)算中排除其它變量影響的工具就是(2)式和(3)式,就本例而言通過(guò)(2)(3)兩式提供的方法能否有效的清除χ2對(duì)y和χ1的影響呢?
二、對(duì)和的分析
(2)式的主要目的是尋找y中受χ1影響的部分,那么ε1是否準(zhǔn)確地度量了這一結(jié)果呢?在進(jìn)行偏相關(guān)分析時(shí),我們已知變量y,χ1,χ2之間存在數(shù)量依存關(guān)系y=ω0+ω1χ1+ω2χ2+μ,由此可知在沒(méi)有確定三變量之間的因果關(guān)系之前,它們之間表現(xiàn)為相互影響的相關(guān)關(guān)系。我們利用進(jìn)行(2)式和(3)式分析時(shí)的樣本,通過(guò)最小二乘法來(lái)估計(jì)(1)式,假設(shè)估計(jì)的結(jié)果為:
y=(5)
在進(jìn)行(5)式的估計(jì)過(guò)程中正規(guī)方程組的第二個(gè)方程為:
由于ε3利用現(xiàn)有樣本將χ1對(duì)χ2回歸而得到的殘差,因此χ2,且=0所以上式可以轉(zhuǎn)化為,因?yàn)橹皇铅?的線性組合,所以,亦即:,所以,進(jìn)而有所以:
(6)
其中ε3利用現(xiàn)有樣本將χ2對(duì)χ1回歸而得到的殘差,通過(guò)的表達(dá)式不難發(fā)現(xiàn),可以看作是χ2排除χ1影響之后剩余的部分與y進(jìn)行回歸分析而得到的回歸系數(shù),因此度量了在排除χ1影響之后χ2與y之間的關(guān)系。和(2)式相比β通常不等于,但在兩種比較明顯的情況下他們會(huì)相等,其一是:樣本中χ1對(duì)y的局部效應(yīng)為0,即ω1=0,其二是樣本中χ2和χ1不相關(guān)。而我們進(jìn)行yy1.2分析之前,通常不可能一開始就認(rèn)定χ1對(duì)y的局部效應(yīng)為0或χ2和χ1不相關(guān),如果χ1對(duì)y的局部效應(yīng)為0,那么我們就沒(méi)有必要來(lái)進(jìn)行yy1.2的分析;如果χ2和χ1不相關(guān),顯然沒(méi)有必要排除χ2對(duì)χ1的影響,也就沒(méi)有必要進(jìn)行(3)式的分析。
由于本例的主要目的是測(cè)量χ1對(duì)y的純效應(yīng),因此我們不可能一開始就判斷χ1是對(duì)y沒(méi)有重要影響的變量。通過(guò)(2)式和(5)的對(duì)比不難發(fā)現(xiàn):(2)式在測(cè)量χ2對(duì)y的影響時(shí),很可能遺漏重要變量χ1,進(jìn)而使β成為一個(gè)有偏估計(jì)量。
(7),由(1)式可知:,所以:
將此結(jié)果帶入(7)式可得:
由于其中
所以
所以,亦即。由此可見(jiàn),利用(2)式來(lái)測(cè)量χ2對(duì)y的影響是有偏移的。將(8)式帶入到(2)式中可得:
根據(jù)(1)式可知ω2χ2i部分就是χ2排除χ1影響后的部分對(duì)y的影響。因此根據(jù)(2)式所確定的χ1對(duì)y的影響ε1存在一個(gè)漂移,
而且此漂移量的數(shù)學(xué)期望不等于零。
同理利用(3)式來(lái)分析χ1中χ2不能解釋的部分時(shí),由于y與χ1的因果關(guān)系并沒(méi)有確定,因此無(wú)法直接排除y對(duì)χ1的影響,故此這一步一樣面臨著遺漏重要變量y的影響,其分析過(guò)程與上述過(guò)程一樣。假設(shè):χ1=κ0+κ1χ2+κ2y+ν,利用估算(2)式的樣本,估計(jì)(3)式時(shí)可知:
同樣利用(3)式測(cè)算χ1中χ2不能解釋的部分ε2存在一個(gè)數(shù)學(xué)期望不為零的漂移
三、對(duì)偏相關(guān)系數(shù)計(jì)算思想的分析
利用(2)式和(3)式測(cè)算排除χ2影響后y和χ1的值存在一個(gè)數(shù)學(xué)期望不為零的漂移量,其背后隱藏著一個(gè)關(guān)于χ2對(duì)y和χ1影響機(jī)制的設(shè)定問(wèn)題。由于我們進(jìn)行的是相關(guān)分析,在進(jìn)行定量測(cè)量時(shí)我們并沒(méi)有分析三者之間的因果關(guān)系,因此它們之間的影響是相互的,因此從回歸分析的角度來(lái)說(shuō)(2)式和(3)式存在遺漏重要變量的風(fēng)險(xiǎn)是毫無(wú)疑問(wèn)的。正是因?yàn)樗鼈冎g相互影響,那么我們?cè)跍y(cè)量χ2對(duì)y和χ1影響時(shí),是僅僅把χ2對(duì)y和χ1的直接影響界定為χ2對(duì)y和χ1的影響,還是把χ2對(duì)y和χ1的間接影響也包含在χ2對(duì)y和χ1的影響中,這種不同的界定最后得出的結(jié)果是不同的。以χ2對(duì)y的影響為例,χ2對(duì)y存在直接影響,即(5)式中的部分,同時(shí)χ2對(duì)y存在間接影響,即χ2通過(guò)直接影響χ1間接影響y,這部分第二部分分析的漂移量
中有一定的體現(xiàn)。
,由(3)式可知測(cè)量了
χ2對(duì)χ1的影響,再由(1)式可知ω1就測(cè)量了χ2通過(guò)直接影響χ1對(duì)y間接影響。因此(2)式中βχ2部分不僅包含有χ2對(duì)y的直接影響,同時(shí)也包含有χ2對(duì)y的間接影響。對(duì)于χ1通過(guò)直接影響χ2對(duì)y的間接影響,筆者認(rèn)為應(yīng)該包含在χ1對(duì)y的影響之中,在進(jìn)行偏相關(guān)分析時(shí)只用排除χ2對(duì)y和χ1的直接影響。怎樣通過(guò)排除χ2對(duì)y和χ1的直接影響后分析y和χ1之間的相關(guān)關(guān)系我們將另文進(jìn)行論述。
參考文獻(xiàn):
[1]伍德里奇著:《計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論-現(xiàn)代觀點(diǎn)》J.M.費(fèi)劍平 林相森譯:中國(guó)人民大學(xué)出版社2003年3月第一版
[2]于俊年:《計(jì)量經(jīng)濟(jì)學(xué)》,對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)出版社2005年6月
[3]梁之舜:《概率論與數(shù)理統(tǒng)計(jì)》,高等教育出版社2001年3月
“本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文”