王芳
摘 要:本文運用R軟件對重慶市各區(qū)(自治縣、市)國民經(jīng)濟主要指標進行分析,最后根據(jù)分析結(jié)果,將這這些地區(qū)分為了四類。
關(guān)鍵詞:判別分析;國民經(jīng)濟主要指標
聚類分析和判別分析都是根據(jù)對象之間的距離遠近對對象進行歸類,但二者之間的不同點在于,在聚類分析中,一般事先不知道應(yīng)該將數(shù)據(jù)分為幾類,完全根據(jù)數(shù)據(jù)來確定;而在判別分析中,至少有一個已經(jīng)明確知道的類別的“訓(xùn)練樣本”,利用這個數(shù)據(jù),來建立基本的判別準則,并通過預(yù)測變量來為未知類別的觀測樣本進行判別分類。
1 判別分析
采用重慶市各區(qū)國民經(jīng)濟主要指標作為原始數(shù)據(jù),并利用快速聚類后各區(qū)分類結(jié)果進行判別分析,得到判別函數(shù),具體結(jié)果如下:
上表是分類統(tǒng)計量的表格,包括各個類別以及總和的未加權(quán)和加權(quán)的有效值。
2 結(jié)論
在使用SPSS時設(shè)置各組的先驗概率均相等,由于分為了4個組,因此先驗概率為0.25。另外還給出了參與分析的未加權(quán)的和加權(quán)的個案數(shù)。
上表給出的分類函數(shù)系數(shù)是貝葉斯得分系數(shù),使用的是貝葉斯原理而不是fisher原理。在SPSS中,也是使用這個系數(shù)來計算得分的,如果想利用fisher判別方法就要用表中的系數(shù)來計算得分。將自變量的值與上表中系數(shù)相乘,哪類得出的值大就屬于哪一類。例如,將重慶市江北區(qū)作為待判數(shù)據(jù),將江北區(qū)的人均GDP,工業(yè)GOV,消費TRS,IBFR,YEDBFI分別和上表中對應(yīng)項相乘,在于對于的常量相加,就可以得出一類的得分,將四類的得分都計算出來,比較大小,得出第四類得分最高,因此江北區(qū)屬于第四類經(jīng)濟區(qū)。
[參考文獻]
[1](美)約翰遜(Johnson,R.A.).實用多元統(tǒng)計分析.清華大學(xué)出版社,2008.
[2]薛毅.統(tǒng)計建模與R軟件.清華大學(xué)出版社.