[摘要] 本文根據(jù)系統(tǒng)聚類分析的最小離差平方和法,利用SPSS軟件,通過(guò)浙江省11個(gè)地市的國(guó)民經(jīng)濟(jì)主要指標(biāo),對(duì)處在不同經(jīng)濟(jì)發(fā)展水平的各個(gè)地市進(jìn)行聚類分析,從而將浙江省劃分為三個(gè)經(jīng)濟(jì)發(fā)展水平不同的經(jīng)濟(jì)區(qū)域,結(jié)果供有關(guān)決策部門參考。
[關(guān)鍵詞] 最小離差平方和法 主要經(jīng)濟(jì)指標(biāo) 聚類分析
聚類分析又稱群分析,是多元統(tǒng)計(jì)分析中研究樣本或指標(biāo)的一種主要的分類方法,起源于考古分類學(xué)。隨著經(jīng)濟(jì)和社會(huì)的發(fā)展,結(jié)合了更為強(qiáng)大的數(shù)學(xué)工具的聚類分析方法已經(jīng)越來(lái)越多應(yīng)用到經(jīng)濟(jì)分析和社會(huì)工作分析中。在經(jīng)濟(jì)領(lǐng)域中,主要是根據(jù)影響國(guó)家、地區(qū)乃至單個(gè)企業(yè)的經(jīng)濟(jì)效益、發(fā)展水平的各項(xiàng)指標(biāo)進(jìn)行聚類分析,然后根據(jù)分析結(jié)果進(jìn)行綜合評(píng)價(jià),以便得出科學(xué)的結(jié)論。聚類分析的方法主要有兩種,一種是“快速聚類分析方法”(K-Means Cluster Analysis),另一種是“系統(tǒng)聚類分析方法”(Hierarchical Cluster Analysis)。本文將根據(jù)2004年浙江省各市國(guó)民經(jīng)濟(jì)主要指標(biāo),利用系統(tǒng)聚類的Ward’s Method,對(duì)浙江省11個(gè)市進(jìn)行分類。
一、聚類方法簡(jiǎn)介
系統(tǒng)聚類法(hierarchical clustering method)是使用最多的一種聚類方法。它的基本思想是:
1.將全部n個(gè)樣品各看成一類,即得到n類;
2.確定樣品與樣品和類與類之間的距離;
3.計(jì)算各類之間的距離,并將距離最近的兩類合并為一類,形成一個(gè)新的類;
4.重復(fù)步驟3。這樣從有n類開始,每次合并一類,經(jīng)過(guò)n-1次合并后,所有的樣品成為一類;
5.將上述合并的全部聚類過(guò)程用一個(gè)直觀圖形畫出來(lái),即畫出聚類圖;
6.決定類的個(gè)數(shù),并由上述步驟得到相應(yīng)的聚類分析的結(jié)果。
以下我們用Gij表示第i個(gè)樣品與第j個(gè)樣品的距離,G1,G2,…表示類,GKL表示GK與GL的距離。本節(jié)介紹的系數(shù)聚類法中,類與類之間的距離與樣品之間的距離相同,即DKL=dkl。
二、 數(shù)據(jù)處理
(來(lái)源:2005浙江統(tǒng)計(jì)年鑒,見參考文獻(xiàn)[13])。
:國(guó)內(nèi)生產(chǎn)總值 GDP(億元);:社會(huì)固定資產(chǎn)投資(億元);
:全社會(huì)消費(fèi)品零售總額(億元);:城鎮(zhèn)居民人均可支配收入(元);
:農(nóng)村居民人均純收入(元)。
1.原始數(shù)據(jù)標(biāo)準(zhǔn)化
標(biāo)準(zhǔn)化后的數(shù)據(jù)
2.SPSS軟件處理結(jié)果
我們采用系統(tǒng)聚類分析法的Ward’s Method對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行處理,下面對(duì)軟件輸出結(jié)果進(jìn)行詳細(xì)介紹。
使用SPSS的Classify→Hierarchical Cluster程序進(jìn)行聚類分析。其中Method子對(duì)話框里,方法選擇最小方差法(Ward’s Method),間距測(cè)度變量選擇Squared Euclidean distance(歐氏距離的平方),然后得出如下結(jié)果:
(1)系統(tǒng)聚類分析的概要結(jié)果,
從表3中可以看出,11個(gè)樣本都進(jìn)入了聚類分析。
本表格的第一行表示,第4個(gè)樣本和第6個(gè)樣本最先進(jìn)行了聚類,樣本間的距離為0.195,這個(gè)聚類的結(jié)果將在后面的第五步聚類中用到;第二行表示聚類的第二步中第8個(gè)樣本和第11個(gè)樣本進(jìn)行了聚類,樣本間的距離為0.653,這個(gè)聚類的結(jié)果將在后面的第八步聚類中用到。其他行的含義和上面的類似??梢?,經(jīng)過(guò)了10步聚類,11個(gè)樣本聚成了一個(gè)大類。
該表格是樣本系統(tǒng)聚類分析聚成3個(gè)類時(shí),樣本的類歸屬情況表。從該表格可以看出,杭州市,寧波市2個(gè)市聚為一類;溫州市,嘉興市,紹興市,臺(tái)州市4個(gè)市聚為一類;湖州市,金華市,舟山市, 衢州市,麗水市5個(gè)市聚為一類。
(4)聚類圖
這個(gè)圖是系統(tǒng)聚類分析的譜系圖(Dendrogram)。從圖中可以看出,各個(gè)類之間的距離在25的坐標(biāo)內(nèi)。借此可以直觀地顯示整個(gè)聚類的過(guò)程。
3.通過(guò)以上的分類表和龍骨圖(譜系圖)可以清楚的看到,離差法聚類分析結(jié)果
(1)較發(fā)達(dá)城市:杭州市,寧波市;
(2)中等發(fā)達(dá)城市:溫州市,嘉興市,臺(tái)州市,紹興市;
(3)發(fā)展中城市:金華市,湖州市,舟山市,衢州市,麗水市。
三、 結(jié)果分析
通過(guò)上面的聚類分析,根據(jù)2004年浙江省各市國(guó)民經(jīng)濟(jì)的主要指標(biāo),我們將目前浙江省各市縣的經(jīng)濟(jì)發(fā)展水平劃分為3個(gè)經(jīng)濟(jì)區(qū)域:
1.較發(fā)達(dá)城市:杭州市,寧波市
2.中等發(fā)達(dá)城市:溫州市,嘉興市,臺(tái)州市,紹興市,金華市,湖州市,舟山市
3.發(fā)展中城市:衢州市,麗水市
從聚類結(jié)果我們可以發(fā)現(xiàn),發(fā)達(dá)城市杭州市和寧波市,由于城市發(fā)展歷史悠久,基礎(chǔ)建設(shè)比較完善,產(chǎn)業(yè)機(jī)構(gòu)比較合理,城市規(guī)模較大,城市經(jīng)濟(jì)發(fā)展快,所以把它們歸類為經(jīng)濟(jì)發(fā)達(dá)的城市。而中等發(fā)達(dá)城市,湖州市、嘉興市和舟山市由于靠近上海,與上海的社會(huì)經(jīng)濟(jì)關(guān)系比較密切,依托上海,大力發(fā)展外貿(mào)經(jīng)濟(jì)。其他4個(gè)城市一般為沿海城市,對(duì)外貿(mào)易便利,而且這里有浙東兩條黃金旅游線(杭州—紹興—寧波—舟山;杭州—紹興—臺(tái)州),旅游業(yè)也很發(fā)達(dá),因此經(jīng)濟(jì)達(dá)到中等發(fā)達(dá)水平,而金華市跟多個(gè)市比鄰,所以跟其他市的經(jīng)濟(jì)貿(mào)易也比較頻繁,經(jīng)濟(jì)方面相對(duì)來(lái)說(shuō)也是比較發(fā)達(dá)的。而衢州市,麗水市由于位于地理位置原因,基礎(chǔ)建設(shè)相對(duì)滯后,產(chǎn)業(yè)結(jié)構(gòu)不夠合理,財(cái)政收入少,所以經(jīng)濟(jì)會(huì)相對(duì)比較落后。
當(dāng)然,以上分析結(jié)果僅是根據(jù)一年的經(jīng)濟(jì)主要指標(biāo)得出的結(jié)論,如果要想進(jìn)行更準(zhǔn)確合理的分析,還需要進(jìn)一步結(jié)合其它的數(shù)據(jù)進(jìn)行分析。
參考文獻(xiàn):
[1]張堯庭方開泰:多元統(tǒng)計(jì)分析引論[M].北京:科學(xué)出版社,1982
[2]王學(xué)仁王松桂:實(shí)用多元統(tǒng)計(jì)分析[M].上海:上海科學(xué)技術(shù)出版社,1990
[3]錢俊龍:概率論與應(yīng)用統(tǒng)計(jì)[M].北京:中國(guó)統(tǒng)計(jì)出版社,1992
[4]何曉群:現(xiàn)代統(tǒng)計(jì)分析方法與應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,1998
[5]于秀林任雪松:多元統(tǒng)計(jì)分析[M].北京:中國(guó)統(tǒng)計(jì)出版社,1999
[6]李雙杰顧六寶:用聚類分析法評(píng)估區(qū)域經(jīng)濟(jì)[J].中國(guó)農(nóng)村觀察,2001
[7]蘇金明:統(tǒng)計(jì)軟件SPSS系列應(yīng)用實(shí)戰(zhàn)篇[M].北京:電子工業(yè)出版社,2002
[8]郝黎仁:SPSS實(shí)用統(tǒng)計(jì)分析[M].北京:中國(guó)水利水電出版社,2002
[9]吳明隆:SPSS統(tǒng)計(jì)應(yīng)用實(shí)務(wù)[M].科學(xué)出版社,2003
[10]盧紋岱:SPSS for Windows統(tǒng)計(jì)分析[M].北京:電子工業(yè)出版社,2004
[11]何曉群:多元統(tǒng)計(jì)分析[M].北京:中國(guó)人民大學(xué)出版社,2004
[12]王學(xué)明:應(yīng)用多元分析[M].上海: 上海財(cái)經(jīng)大學(xué)出版社,2004
[13]浙江省統(tǒng)計(jì)局,2005浙江統(tǒng)計(jì)年鑒.中國(guó)統(tǒng)計(jì)出版社,2005