李生彪
摘 要 本文對(duì)相關(guān)系數(shù)兩個(gè)性質(zhì)的三種證明方法進(jìn)行了討論,比較了其優(yōu)劣,并將相關(guān)系數(shù)性質(zhì)應(yīng)用于線性回歸分析之中。
關(guān)鍵詞 相關(guān)系數(shù) 證明 線性回歸分析
中圖分類(lèi)號(hào):O211 文獻(xiàn)標(biāo)識(shí)碼:ADOI:10.16400/j.cnki.kjdkx.2015.02.017
Discussion on the Correlation Coefficient Prove
LI Shengbiao
(Lanzhou University of Arts and Science, Lanzhou, Gansu 730000)
Abstract In this paper, three methods proved the correlation coefficient of the two natures are discussed and compared their advantages and disadvantages. And applied nature of the correlation coefficient of linear regression analysis.
Key words the correlation coefficient; prove; linear regression analysis
在大學(xué)的概率論與數(shù)理統(tǒng)計(jì)課程中,相關(guān)系數(shù)是學(xué)生必學(xué)的數(shù)字特征之一,它描述的是兩個(gè)隨機(jī)變量和之間的線性相關(guān)程度,在一元線性回歸分析中也有著重要的應(yīng)用。與數(shù)學(xué)期望和方差相比,學(xué)生學(xué)對(duì)相關(guān)系數(shù)理解起來(lái)也是相對(duì)比較困難,尤其是在講到相關(guān)系數(shù)的性質(zhì)證明時(shí),學(xué)生理解起來(lái)更是困難,而相關(guān)系數(shù)的性質(zhì)又恰好揭示了相關(guān)系數(shù)的本質(zhì)及其意義,是重要的一部分內(nèi)容。因此,本文就相關(guān)系數(shù)的三種證明方法進(jìn)行了討論和比較,指出了各自的優(yōu)劣,并將相關(guān)系數(shù)性質(zhì)應(yīng)用于線性回歸分析之中。
1 線性相關(guān)系數(shù)及其性質(zhì)
下文中用()表示隨機(jī)變量的方差,()表示兩個(gè)隨機(jī)變量和的協(xié)方差。
定義1.1 ?設(shè)()是一個(gè)二維隨機(jī)變量,且()>0,()>0,則稱為和的相關(guān)系數(shù)。
具有以下兩條性質(zhì):
性質(zhì)1.1:≤≤1。
性質(zhì)1.2:∣∣= 1的充要條件是存在常數(shù)和,使得{ = ?+ } = 1。
對(duì)相關(guān)系數(shù)作以下四點(diǎn)說(shuō)明:
(i)相關(guān)系數(shù)反映的是兩個(gè)隨機(jī)變量和之間的線性相關(guān)程度的強(qiáng)弱,因此,也被稱為線性相關(guān)系數(shù)。
(ii)若 = 0,則稱與不相關(guān)。不相關(guān)是指與之間不存在線性關(guān)系,但與之間可能存在著其他的函數(shù)關(guān)系,譬如指數(shù)關(guān)系、平方關(guān)系等。
(iii) 若 = ?,則稱與完全相關(guān)。若 = 1,則稱與完全正相關(guān);若 = ,則稱與完全負(fù)相關(guān)。
(iv) 若0<∣∣<1,則稱與有“一定程度”的線性相關(guān)。∣∣的值越接近于1,與線性相關(guān)程度越高;∣∣的值越接近于0,與線性相關(guān)程度越低。
2 相關(guān)系數(shù)性質(zhì)的證明
這里我們將主要討論相關(guān)系數(shù)性質(zhì)的三種證明方法。
2.1 證法一
先利用切比雪夫不等式證明引理1。
引理1 隨機(jī)變量的方差() = 0的充要條件是:{ = ()} = 1。
再運(yùn)用一元二次方程實(shí)數(shù)根的判別方法得到引理2。
引理2 (柯西-許瓦茲不等式)設(shè)()是一個(gè)二維隨機(jī)變量,()<,()<,則有
≤()·()。
性質(zhì)1.1的證明: 記,由引理2有:
即≤≤1。
性質(zhì)1.2的證明:由引理2可知:∣∣= 1的充要條件是存在常數(shù),使得,又因?yàn)?,所以∣∣= 1的充要條件是,由引理1可知, ∣∣= 1的充要條件是存在常數(shù)使得。我們記 = , = ()(),即有{ = ?+ } = 1。
2.2 證法二
性質(zhì)1.1的證明:記,構(gòu)造輔助函數(shù)。
由 = () + () = 0,得 = 。記 ?= ,
由于所以≥0,即≤≤1。
性質(zhì)1.2的證明:由上面的證明過(guò)程可知,∣∣= 1的充要條件是,考慮到,由證法一中的引理1即有∣∣= 1的充要條件是,其中 ?= ?= ,則有:
{ = ?+ ()()} = 1
我們記 = ,則 = ()() = ()(),性質(zhì)1.2得證。
在證明二中不僅證明了的存在性,并且給出了的具體表達(dá)式。由于 = ,且()>0,()>0,因此,當(dāng)∣∣= 1時(shí),≠0。故性質(zhì)1.2的更準(zhǔn)確地表述為:∣∣= 1的充要條件是存在常數(shù)和,且≠0使得{ = ?+ } = 1。
那么要問(wèn),在證法一中能不能也得到≠0呢?答案是肯定的。在證法一中已證明了∣∣= 1的充要條件是存在常數(shù),使得。此時(shí)若 = 0,則,即有() = 0,這與()>0矛盾,故 ≠ 0,而 = ,即≠0。
2.3 證法三
性質(zhì)1.1的證明:記易知,
() = () = 0, () = () = 1, ?= ?= ()
( ?) = () + () ?2()
= 1 + 1 ?2 = 2 (1 ?)
由于( ?)≥0,所以(1 ?)≥0,即≤≤1。
性質(zhì)1.2的證明: = ?= 1的充要條件是() = 0。由引理1知() = 0的充要條件是( = ) = 0。又因?yàn)?/p>
故 = 1的充要條件是{ = ?+ ()()} = 1,同理 = 1的充要條件是{ = ?+ ()+()} = 1,我們記 = ,則 = ()() = ()(),性質(zhì)1.2得證。
3 相關(guān)系數(shù)在線性回歸中的應(yīng)用
在上面三種證法中,證法二和證法三得到的結(jié)果更為深刻,給出了和的值:
= , ?= ()()。
這一結(jié)果在解釋一元線性回歸分析是有用的。設(shè)有()的觀察值( , ), = 1,2,…。則樣本相關(guān)系數(shù)是:
樣本相關(guān)系數(shù)可作為的估計(jì)。當(dāng)≈1時(shí),可近似認(rèn)為≈1。這時(shí)根據(jù)性質(zhì)1.2,自然可考慮線性回歸函數(shù) = ?+ ,其中 = , ?= ()()。由矩估計(jì)法,可建立(), (), (), ()的估計(jì)分別為:
由此得到和的估計(jì)值:
這與最小二乘估計(jì)法得到的結(jié)果是一致的。
參考文獻(xiàn)
[1] 盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)(第四版)[M].北京:高等教育出版社,2001.
[2] 魏宗舒,等.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,1983.
[3] 錢(qián)偉民,楊筱菡.關(guān)于相關(guān)系數(shù)性質(zhì)的三種證明方法[J].大學(xué)數(shù)學(xué),2009.25(1):176-178.
[4] 張世強(qiáng),呂杰能等.關(guān)于相關(guān)系數(shù)的探討[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2009.39(19):102-107.