張淑麗
對我國各地區(qū)的基本經(jīng)濟(jì)狀況進(jìn)行聚類分析可以采用的方法有多種,但最常用的有兩種,即系統(tǒng)聚類和K均值聚類,因此本報(bào)告將分這兩種方法對數(shù)據(jù)進(jìn)行聚類分析。然后從中找出聚類最合適的結(jié)果進(jìn)行分析。
一、系統(tǒng)聚類分析法對我國各地區(qū)的經(jīng)濟(jì)水平的分析
一般地,常用的系統(tǒng)聚類方法有最短距離法、最長距離法、中間距離法、中心法、類平均法、可變類平均法、可變法和離差平方和等八種方法。本文采用最短距離法進(jìn)行系統(tǒng)聚類分析。本文選取人均GDP、人均工業(yè)總產(chǎn)值、客運(yùn)量、貨運(yùn)量、地方政策預(yù)算內(nèi)收入、固定資產(chǎn)投資總額、在崗職工占總?cè)丝诘谋壤?、在崗職工人均工資額、城鄉(xiāng)居民年底儲蓄余額作變量,對31個省、市、直轄市的基本經(jīng)濟(jì)狀況做聚類分析。在SPSS軟件分析得出的結(jié)果:若將樣品分為兩類,則廣東為一類,其余的為一類;若將樣品分為三類,則廣東為一類,山東和江蘇為一類,其余的為一類;以此類推。本文將樣品分為四類,第一類為廣東;第二類包括山東、江蘇;第三類包括上海、北京;其余地區(qū)包含在第四類。
二、K均值聚類分析法對我國各地區(qū)的經(jīng)濟(jì)水平的分析
在SPSS軟件中以人均GDP、人均工業(yè)總產(chǎn)值、客運(yùn)量、貨運(yùn)量、地方政策預(yù)算內(nèi)收入、固定資產(chǎn)投資總額、在崗職工占總?cè)丝诘谋壤?、在崗職工人均工資額、城鄉(xiāng)居民年底儲蓄余額為對象,對全國各地區(qū)基本經(jīng)濟(jì)狀況進(jìn)行K均值聚類分析。得到初始類中心表,該表給出了K均值迭代的初始類中心坐標(biāo),這些坐標(biāo)是由SPSS自動給定的,反應(yīng)了各個指標(biāo)在每一類中的平均水平,給出了K均值的迭代過程,表中的每一行代表每次迭代導(dǎo)致類中心的變化量。從表中可以看出,迭代共進(jìn)行了3次,每次迭代導(dǎo)致類中心的變換量逐漸減少,直到第4次為0,達(dá)到收斂。然后根據(jù)迭代結(jié)果得到分類變量的方差分析表,該表可用于檢驗(yàn)各個分析變量的均值在不同類中是否存在顯著性差異,同樣可以用于對分類效果是否顯著的檢驗(yàn)。該檢驗(yàn)的原假設(shè)是分析變量在不同類中不存在顯著性差異,備擇假設(shè)是分析變量在不同類中存在顯著性差異。通過分析可知:在崗職工平均工資這個變量的p值大于0.05,所以在的顯著性水平下接受原假設(shè),即認(rèn)為分析變量在不同類中不存在顯著性差異,也就是說這個變量的分類效果不顯著。其余變量的p值都小于0.05,這說明這些變量對于分類具有顯著作用。最終的聚類中心的結(jié)果反映了各個指標(biāo)經(jīng)過聚類后的平均水平,與初始類中心不同的是,該中心坐標(biāo)不是由SPSS自動給定的,而是系統(tǒng)經(jīng)過計(jì)算得到的。
分析結(jié)果表明:31個地區(qū)被分成4類。第一類包括1個地區(qū),為山東;第二類包括21個地區(qū),包括北京、天津、山西、內(nèi)蒙古、吉林、黑龍江、上海、福建、江西、湖北、廣西、海南、重慶、貴州、云南、西藏、山西、甘肅、青海、寧夏、新疆;第三類包括1個地區(qū),為廣東;第四類包括8個地區(qū),有河北、遼寧、江蘇、浙江、安徽、河南、湖南、四川。
三、結(jié)論
通過對以上兩種聚類方法進(jìn)行比較分析后發(fā)現(xiàn):系統(tǒng)聚類的效果明顯優(yōu)于K均值聚類,前者的分組情況更符合實(shí)際情況。所以本文采用系統(tǒng)聚類方法對我國各省市地區(qū)的基本經(jīng)濟(jì)狀況進(jìn)行分析,得到以下結(jié)論:
第一類為廣東,地處東南沿海,與東南亞地區(qū)的經(jīng)濟(jì)往來緊密,而且在改革開放以后,廣東省的各地區(qū)成為對外開放的首試對象,從此廣東省的經(jīng)濟(jì)有了較快較好的發(fā)展。在2010年廣東舉辦了亞運(yùn)會,成為了萬眾矚目的焦點(diǎn),加大了廣東省的貨運(yùn)量、客運(yùn)量等。這使得廣東省的基本經(jīng)濟(jì)狀況更為較高水平。
第二類為山東和江蘇,這兩個地區(qū)位于沿海地區(qū),成為近年來經(jīng)濟(jì)發(fā)展勢頭較為強(qiáng)勁的地區(qū),主要以輕工業(yè)為主要經(jīng)濟(jì)發(fā)展路徑。
第三類為北京和上海,北京作為中國的首都、政治中心,經(jīng)濟(jì)發(fā)展?fàn)顩r自然較為突出,而上海中國的金融中心,經(jīng)濟(jì)發(fā)展勢頭仍是不容小覷的。
第四類包括其余的地區(qū),其中有東三省和華北和華南的部分省市自治區(qū)、西北和西南地區(qū)的全部省市自治區(qū)。這些地區(qū)大部分都以重工業(yè)為基礎(chǔ)產(chǎn)業(yè),經(jīng)濟(jì)發(fā)展較為落后,經(jīng)濟(jì)技術(shù)的與時俱進(jìn)性差。