• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      協(xié)方差、相關(guān)系數(shù)、 回歸系數(shù)的內(nèi)在關(guān)系探討

      2022-05-30 09:30:52曹昭
      中國(guó)集體經(jīng)濟(jì) 2022年25期
      關(guān)鍵詞:相關(guān)系數(shù)回歸系數(shù)協(xié)方差

      曹昭

      摘要:協(xié)方差、相關(guān)系數(shù)和回歸系數(shù)是衡量?jī)蓚€(gè)定距變量之間相關(guān)方向和程度的三個(gè)不同指標(biāo)。盡管這三個(gè)指標(biāo)有著不同的含義和計(jì)算方法,但是它們之間有著極為嚴(yán)密的邏輯關(guān)系。闡釋這種邏輯關(guān)系具有非常重要的理論和現(xiàn)實(shí)意義。

      關(guān)鍵詞:協(xié)方差;相關(guān)系數(shù);回歸系數(shù)

      變量之間的相關(guān)關(guān)系,特別是定距變量之間的相關(guān)關(guān)系是社會(huì)科學(xué)的重要研究?jī)?nèi)容之一。在社會(huì)學(xué)研究中,我們一般用三個(gè)數(shù)量指標(biāo)來(lái)衡量?jī)蓚€(gè)定距變量之間的相關(guān)程度。這三個(gè)指標(biāo)分別是:協(xié)方差、相關(guān)系數(shù)和回歸系數(shù)。雖然這三個(gè)指標(biāo)的計(jì)算方法和具體含義有著明顯的區(qū)別。但是,經(jīng)過(guò)仔細(xì)分析,會(huì)發(fā)現(xiàn)它們之間有著邏輯上的內(nèi)在統(tǒng)一性。對(duì)協(xié)方差、相關(guān)系數(shù)與回歸系數(shù)的計(jì)算方法、數(shù)學(xué)含義進(jìn)行分別闡釋的基礎(chǔ)上,揭示出三者之間的內(nèi)在邏輯關(guān)系,對(duì)大部分統(tǒng)計(jì)學(xué)的初學(xué)者而言,具有非常重要的理論和現(xiàn)實(shí)意義。在本文接下來(lái)的內(nèi)容中,將分別對(duì)協(xié)方差、相關(guān)系數(shù)、回歸系數(shù)的計(jì)算方法、數(shù)學(xué)含義做出說(shuō)明并進(jìn)一步揭示三者之間的內(nèi)在聯(lián)系。

      一、協(xié)方差的計(jì)算方法和數(shù)學(xué)含義

      在日常的工作和生活中,會(huì)經(jīng)常面對(duì)兩個(gè)定距變量是否相關(guān)的問(wèn)題:比如人的身高與體重、人的受教育年限和工資收入、某一商品的定價(jià)與銷售量之間是否存在一定的相關(guān)性呢?為了驗(yàn)證或判斷兩個(gè)定距變量之間的相關(guān)程度,常用的方法就是繪制“散點(diǎn)圖”。要想繪制兩個(gè)變量的散點(diǎn)圖,首先要做的工作就是收集和整理兩個(gè)變量不同觀測(cè)值的原始數(shù)據(jù)。比方說(shuō),要探索人的體重與身高兩個(gè)變量的相關(guān)程度,首先必須收集這兩個(gè)變量不同觀測(cè)值的原始數(shù)據(jù)。為了研究的方便,可以把人的體重作為因變量Y,把人的身高作為自變量X。假定已經(jīng)獲得了因變量Y(人的體重)和自變量X(人的身高)的n組觀測(cè)值,如表1所示。我們來(lái)具體討論散點(diǎn)圖的繪制和協(xié)方差的計(jì)算方法,然后說(shuō)明它們蘊(yùn)涵的數(shù)學(xué)思想。

      根據(jù)上面表格提供的數(shù)據(jù),可以把上面的每一對(duì)觀測(cè)值(xi,yi)作為不同的點(diǎn)在直角坐標(biāo)系中表示出來(lái)。當(dāng)然,這一直角坐標(biāo)系的縱軸表示體重,橫軸表示身高。這樣,就得到了能大致揭示人的身高和體重兩個(gè)變量之間相關(guān)程度的散點(diǎn)圖。令人遺憾的是,通過(guò)散點(diǎn)圖我們只能對(duì)兩個(gè)變量是否存在線性相關(guān)關(guān)系做出模糊的判斷。要想進(jìn)一步了解兩個(gè)變量的相關(guān)程度,還需要對(duì)搜集的數(shù)據(jù)進(jìn)行進(jìn)一步的處理和加工。一般說(shuō)來(lái),通過(guò)計(jì)算兩個(gè)定距變量的協(xié)方差,能夠使人對(duì)它們變化方向的一致與否做出較為明確的判斷。接下來(lái),我們就對(duì)協(xié)方差的計(jì)算方法及其數(shù)學(xué)含義進(jìn)行簡(jiǎn)單的分析和說(shuō)明。

      就上面的例子來(lái)說(shuō),我們可以在因變量Y(體重)和自變量X(身高)的散點(diǎn)圖上,通過(guò)點(diǎn)( , )分別作平行于縱軸和橫軸的兩條直線。(其中 =∑x /n,? =∑y /n)那么,這兩條支線就把原來(lái)的散點(diǎn)圖劃分為四個(gè)象限。

      此時(shí),如果原來(lái)散點(diǎn)圖中的點(diǎn)落在一、三象限部分的數(shù)量超過(guò)落在二、四象限部分的數(shù)量,就意味著自變量X和因變量Y具有正的線性相關(guān)關(guān)系。這表明,當(dāng)自變量X的取值高于其自身的平均值 時(shí),因變量Y的取值也大多數(shù)高于其自身的平均值 ,當(dāng)自變量X的取值低于其自身的平均值? 時(shí),因變量Y的取值也大多數(shù)低于其自身的平均值 。因此,兩個(gè)變量X、Y總的來(lái)說(shuō)具有大致一致的變化方向,即因變量Y隨著自變量X的增加而增加;反之,如果原來(lái)散點(diǎn)圖中的點(diǎn)落在二、四象限部分的數(shù)量超過(guò)落在一、三象限部分的數(shù)量,就意味著自變量X和因變量Y具有負(fù)的線性相關(guān)關(guān)系。這表明,當(dāng)自變量X的取值低于其自身的平均值? 時(shí),因變量Y的取值卻大多數(shù)高于其自身的平均值 ,當(dāng)自變量X的取值高于其自身的平均值? ?時(shí),因變量Y的取值卻大多數(shù)低于其自身的平均值 。因此,兩個(gè)變量X、Y總的來(lái)說(shuō)具有大致相反的變化方向,即因變量Y隨著自變量X的增加而減少。當(dāng)然,如果原來(lái)散點(diǎn)圖中的點(diǎn)均勻分布在四個(gè)象限內(nèi),則說(shuō)明自變量X和因變量Y沒(méi)有線性關(guān)系。

      以上的分析,只是從直觀上對(duì)兩個(gè)定距變量是否相關(guān)的判斷方法,為了對(duì)兩個(gè)定距變量的相關(guān)性進(jìn)行更充分的分析和說(shuō)明,人們提出了“協(xié)方差”這一概念指標(biāo)。協(xié)方差指標(biāo)所蘊(yùn)含的數(shù)學(xué)思想是:如果散點(diǎn)圖中的點(diǎn)分布在一、三象限內(nèi),那么(xi- )與(yi- )必然是同號(hào)的,要么同時(shí)為正,要么同時(shí)為負(fù),兩者的積(xi- )(yi- )一定是正數(shù);反之,如果散點(diǎn)圖中的點(diǎn)分布在二、四象限內(nèi),那么(xi- )與(yi- )必然是異號(hào)的,兩者的積(xi- )(yi- )一定是負(fù)數(shù)。因此,我們可以把n個(gè)(xi- )(yi- )的值加起來(lái)求平均數(shù),如果平均數(shù)大于零,說(shuō)明散點(diǎn)圖中的點(diǎn)大多數(shù)在一、三象限,此時(shí),兩個(gè)定距變量具有正的線性相關(guān)關(guān)系;如果平均數(shù)小于零,說(shuō)明散點(diǎn)圖中的點(diǎn)大多數(shù)在二、四象限,此時(shí),兩個(gè)定距變量具有負(fù)的線性相關(guān)關(guān)系。(xi- ),(yi- )以及(xi- )(yi- )的取值情況可以用表2表示。

      根據(jù)上面的說(shuō)明,協(xié)方差的計(jì)算公式可以表示為:

      Cov(Y,X)=∑(xi- )(yi- )/n,根據(jù)它的符號(hào)我們能夠大致判斷兩個(gè)定距變量的相關(guān)方向。但是,由于協(xié)方差的大小會(huì)隨著自變量與因變量取值單位的變化而變化,它不能精確反應(yīng)兩個(gè)定距變量的相關(guān)程度。就上面我們所舉事例來(lái)說(shuō),如果我們要計(jì)算體重和身高兩個(gè)變量的協(xié)方差,在體重以“千克”為單位、身高以“厘米”為單位的情況下與體重以“千克”為單位,身高以“毫米”為單位的情況相比較,協(xié)方差會(huì)擴(kuò)大近10倍。為了克服協(xié)方差這一指標(biāo),受變量取值單位影響的弊端,統(tǒng)計(jì)學(xué)上通常用“相關(guān)系數(shù)”這一指標(biāo)來(lái)衡量?jī)蓚€(gè)定距變量的相關(guān)程度。接下來(lái),我們就對(duì)相關(guān)系數(shù)的計(jì)算方法和數(shù)學(xué)思想進(jìn)行簡(jiǎn)單的分析、說(shuō)明。

      二、相關(guān)系數(shù)的計(jì)算方法和數(shù)學(xué)含義

      為了克服協(xié)方差受兩個(gè)變量取值單位影響的弊端,可以把數(shù)據(jù)(xi- )和(yi- )進(jìn)行“標(biāo)準(zhǔn)化”處理。具體的方法是把每一個(gè)(xi- )和(yi- )都分別除以其自身的標(biāo)準(zhǔn)差。這樣,兩個(gè)變量的每次變化都擺脫了取值單位的影響。因?yàn)闊o(wú)論兩個(gè)自變量的計(jì)量以何種單位為標(biāo)準(zhǔn),其自身的標(biāo)準(zhǔn)差也必然以同樣的單位為計(jì)量標(biāo)準(zhǔn)。為了說(shuō)明相關(guān)系數(shù)的計(jì)算方法,我們先把(xi- )與(yi- )的取值標(biāo)準(zhǔn)化,并把兩者以及它們的積,用表3列示出來(lái)。

      在表3中,我們可以把第二列的每一行看作是:以標(biāo)準(zhǔn)差為單位,自變量X每次變化的數(shù)量。在n取值較大的情況下,我們可以假定,總的說(shuō)來(lái),在n個(gè)觀測(cè)值的情況下,自變量X的變化總共為n個(gè)標(biāo)準(zhǔn)差(這就是第二列的最后一行為n的原因)。同理,上表第四列的每一行則可以看作,以標(biāo)準(zhǔn)差為單位,由于自變量X的每次變化,所帶來(lái)的因變量Y的變化量。在以各自標(biāo)準(zhǔn)差為單位的情況下,如果我們計(jì)算由于自變量X的變化,所帶來(lái)的因變量Y的變化的加權(quán)平均數(shù),所得到的結(jié)果就是相關(guān)系數(shù)。其表達(dá)式為:

      R=∑(xi- )(yi- )/nSxSy,相關(guān)系數(shù)R的數(shù)學(xué)含義為:平均來(lái)說(shuō),自變量X每變化其自身的一個(gè)標(biāo)準(zhǔn)差,所導(dǎo)致因變量Y變化其自身標(biāo)準(zhǔn)差的數(shù)量。就上面我們所舉的例子來(lái)說(shuō),如果我們根據(jù)收集的觀測(cè)數(shù)據(jù)計(jì)算出體重和身高兩個(gè)定距變量的相關(guān)系數(shù)R為0.75,就表示,平均來(lái)講,如果人的身高每增加或減少其自身的1個(gè)標(biāo)準(zhǔn)差,那么人的體重就相應(yīng)變化其自身的0.75個(gè)標(biāo)準(zhǔn)差。

      與協(xié)方差相比,相關(guān)系數(shù)這一指標(biāo)有效克服了兩個(gè)定距變量的取值單位對(duì)相關(guān)關(guān)系計(jì)算的影響,能夠有效衡量?jī)蓚€(gè)定距變量之間的相關(guān)方向和相關(guān)程度,是統(tǒng)計(jì)學(xué)中較為常用而有效的指標(biāo)之一。需要注意的是,相關(guān)系數(shù)的取值范圍必然在-1和1之間。當(dāng)相關(guān)系數(shù)為零時(shí),并不表示兩個(gè)變量不相關(guān),而只是說(shuō)明這兩個(gè)變量之間沒(méi)有線性相關(guān)性。

      通過(guò)計(jì)算相關(guān)系數(shù),能夠?qū)蓚€(gè)定距變量的相關(guān)程度進(jìn)行一般把握。但是,在實(shí)際的社會(huì)調(diào)查研究就中,我們對(duì)兩個(gè)定距變量關(guān)系的探討往往是在特定的取值單位下進(jìn)行的,需要明確,某一變量一定單位的變化,所可能導(dǎo)致的另一個(gè)變量的具體變化情況。具體來(lái)說(shuō),如果要探索體重和身高的相關(guān)關(guān)系,我們往往想知道的是,平均來(lái)講,人的身高每增加或減少1厘米,體重的變化相應(yīng)是多少千克。在這種情況下,需要計(jì)算的是回歸系數(shù),而不是相關(guān)系數(shù)。在接下來(lái)的內(nèi)容中,我們進(jìn)一步對(duì)回歸系數(shù)的計(jì)算方法和數(shù)學(xué)含義進(jìn)行說(shuō)明。

      三、回歸系數(shù)的計(jì)算方法和數(shù)學(xué)含義

      由上文對(duì)相關(guān)系數(shù)的分析得知,如果兩個(gè)定距變量的相關(guān)系數(shù)為R,就意味著平均起來(lái),每當(dāng)自變量變化其自身的1個(gè)標(biāo)準(zhǔn)差,因變量就相應(yīng)變化其自身的R個(gè)標(biāo)準(zhǔn)差。也就是說(shuō),如果以各自的標(biāo)準(zhǔn)差為單位,因變量與自變量變化量的比值為R/1。假如現(xiàn)在我們面臨的問(wèn)題是,在自變量與因變量都有特定取值單位的條件下,自變量每發(fā)生1個(gè)取值單位的變化,因變量發(fā)生的變化是多少。此時(shí),我們只要對(duì)相關(guān)系數(shù)進(jìn)行適當(dāng)?shù)霓D(zhuǎn)換,就可得出答案。

      因?yàn)?,在以各自的?biāo)準(zhǔn)差為單位的情況下,因變量與自變量變化量的比值為R/1,那么在自變量和因變量都有特定取值單位的條件下,因變量與自變量變化值的比例可以寫為:RSy/SX,這一比值的大小就是回歸系數(shù)B,把相關(guān)系數(shù)R=∑(xi- )(yi- )/nSxSy代入,可得回歸系數(shù)的表達(dá)式為:

      B=∑(xi- )(yi- )/nS

      =∑(xi- )(yi- )/∑(xi- )2

      =∑xiyi- n? /∑x? - n 2

      回歸系數(shù)B的數(shù)學(xué)含義為:平均而言,自變量X每變化1個(gè)取值單位,因變量Y相應(yīng)變化的取值單位的數(shù)量。以本文開始的事例來(lái)說(shuō),如果根據(jù)收集到的體重和身高的觀測(cè)數(shù)據(jù)(假設(shè)身高的單位是厘米,體重的單位是千克)計(jì)算出的回歸系數(shù)為2,就表明,平均來(lái)講,如果人的身高每增加1厘米,體重就會(huì)相應(yīng)增加2千克。當(dāng)然,對(duì)于兩個(gè)定距變量的其回歸系數(shù)B,也可以用最小二乘法求出其表達(dá)式。在這里,我們之所以根據(jù)相關(guān)系數(shù)R求得其表達(dá)式,目的是為了更好地揭示相關(guān)系數(shù)與回歸系數(shù)的內(nèi)在聯(lián)系及其各自的數(shù)學(xué)與統(tǒng)計(jì)學(xué)蘊(yùn)涵。

      通過(guò)本文的分析,可以看出:協(xié)方差、相關(guān)系數(shù)與回歸系數(shù)三者之間有著極為嚴(yán)密的內(nèi)在邏輯關(guān)系。相關(guān)系數(shù)可以看作是標(biāo)準(zhǔn)化了的協(xié)方差。通過(guò)“標(biāo)準(zhǔn)化”,相關(guān)系數(shù)克服了協(xié)方差受兩個(gè)變量取值單位影響的弊端。相關(guān)系數(shù)表示的是,在以各自標(biāo)準(zhǔn)差為單位的條件下,兩個(gè)定距變量平均變化量的比值;而回歸系數(shù)則表示在兩個(gè)定距變量都有特定取值單位的條件下,平均而言,自變量每變化1個(gè)取值單位,因變量的相應(yīng)變化量。而且,兩者是可以相互推出的。

      參考文獻(xiàn):

      [1]布萊洛克.社會(huì)統(tǒng)計(jì)學(xué)[M].沈崇麟,等,譯.重慶:重慶大學(xué)出版社,2010.

      [2]查特吉,哈迪,普賴斯.例解回歸分析[M].鄭明,等,譯.北京:中國(guó)統(tǒng)計(jì)出版社,2004.

      [3]S.韋斯伯格.應(yīng)用線性回歸[M].王靜龍,等,譯.北京:中國(guó)統(tǒng)計(jì)出版社,1998.

      [4]翁定軍.社會(huì)定量研究的數(shù)據(jù)處理——原理與方法[M].上海:上海大學(xué)出版社,2004.

      [5]賈俊平,等.統(tǒng)計(jì)學(xué)[M].北京:中國(guó)人民大學(xué)出版社,2012.

      [6]盧淑華.社會(huì)統(tǒng)計(jì)學(xué)[M].北京:北京大學(xué)出版社,2009.

      [7]李沛良.社會(huì)研究的統(tǒng)計(jì)應(yīng)用[M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2001.

      [8]袁衛(wèi),等.統(tǒng)計(jì)學(xué)[M].北京:高等教育出版社,2009.

      *本文系商丘師范學(xué)院科研啟動(dòng)經(jīng)費(fèi)資助項(xiàng)目(編號(hào):7001/700146)暨河南省高校哲學(xué)社會(huì)科學(xué)創(chuàng)新團(tuán)隊(duì)項(xiàng)目(編號(hào):2020-CXTD-11)的研究成果。

      (作者單位:商丘師范學(xué)院)

      猜你喜歡
      相關(guān)系數(shù)回歸系數(shù)協(xié)方差
      多元線性回歸的估值漂移及其判定方法
      電導(dǎo)法協(xié)同Logistic方程進(jìn)行6種蘋果砧木抗寒性的比較
      多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時(shí)Bayes估計(jì)及優(yōu)良性
      人口老齡化對(duì)我國(guó)消費(fèi)結(jié)構(gòu)影響研究
      南京市能見(jiàn)度變化趨勢(shì)及其影響因素
      不確定系統(tǒng)改進(jìn)的魯棒協(xié)方差交叉融合穩(wěn)態(tài)Kalman預(yù)報(bào)器
      一種基于廣義協(xié)方差矩陣的欠定盲辨識(shí)方法
      秦皇島海域夜光藻種群密度與環(huán)境因子的關(guān)系
      電子鼻傳感器陣列優(yōu)化對(duì)豬肉新鮮度法的檢測(cè)
      肉類研究(2015年5期)2015-08-08 12:48:29
      縱向數(shù)據(jù)分析中使用滑動(dòng)平均Cholesky分解對(duì)回歸均值和協(xié)方差矩陣進(jìn)行同時(shí)半?yún)?shù)建模
      泗洪县| 治多县| 烟台市| 长子县| 太康县| 吉首市| 临城县| 姚安县| 孝义市| 迭部县| 克拉玛依市| 宜黄县| 马尔康县| 彩票| 灌南县| 万安县| 台山市| 屯留县| 简阳市| 襄城县| 克什克腾旗| 安徽省| 清徐县| 古交市| 永顺县| 临颍县| 东兴市| 清新县| 资源县| 浏阳市| 鹤山市| 延边| 砚山县| 鄱阳县| 灌阳县| 叶城县| 顺昌县| 平安县| 东阳市| 即墨市| 蓝山县|