摘 要:基于主成分分析和聚類分析的方法,對(duì)黑龍江省的13個(gè)城市和相應(yīng)的19項(xiàng)指標(biāo)進(jìn)行綜合競(jìng)爭(zhēng)力的分析。研究結(jié)果表明,運(yùn)用兩種不同的統(tǒng)計(jì)方法進(jìn)行評(píng)價(jià),得出一致的評(píng)價(jià)結(jié)果。因此,說(shuō)明文章所采用的方法具有科學(xué)性和可行性。
關(guān)鍵詞:主成分分析 綜合競(jìng)爭(zhēng)力 K均值聚類 特征向量
中圖分類號(hào):F222 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-4914(2013)07-040-02
在多元統(tǒng)計(jì)的理論中,主成分分析的方法和聚類分析的方法是兩種重要的統(tǒng)計(jì)方法。其中,主成分分析是將多個(gè)指標(biāo)化為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)方法。它的主要特點(diǎn)是排除了原有指標(biāo)之間相關(guān)性的干擾,方法客觀;聚類分析是本著“物以類聚”的原理得出的,是將研究個(gè)體或指標(biāo)進(jìn)行分類的一種統(tǒng)計(jì)方法。目前,K均值聚類是較為流行的聚類分析方法。本文研究了2011年黑龍江省主要城市競(jìng)爭(zhēng)力發(fā)展的現(xiàn)狀,運(yùn)用上述兩種不同的統(tǒng)計(jì)方法進(jìn)行評(píng)價(jià),得到一致的評(píng)價(jià)結(jié)果。結(jié)果表明我們采用的方法是有效的。
一、統(tǒng)計(jì)方法及模型
(一)主成分分析
1.選擇初始凝聚點(diǎn)和初始分類。
2.計(jì)算初始K個(gè)類的重心,然后對(duì)所有樣品逐一計(jì)算它到初始K類的距離,若某樣品到它原來(lái)所在類的距離最近,則它仍在原類,否則將它移動(dòng)到和它距離最近的那一類,并重新計(jì)算失去該樣品的那個(gè)類重心以及接收該樣品的那個(gè)類的重心,即再重新計(jì)算每一類的重心作為該類的凝聚點(diǎn)。
3.重新計(jì)算步驟(2)直到所有樣品都不能移動(dòng)為止,或者說(shuō)如果某一步所有的新凝聚點(diǎn)與前一次老凝聚點(diǎn)重合,則計(jì)算過(guò)程終止。
二、主成分分析
利用主成分分析對(duì)黑龍江省13個(gè)城市綜合競(jìng)爭(zhēng)力進(jìn)行分析,并選取了19個(gè)指標(biāo)作為反映黑龍江省13個(gè)城市綜合競(jìng)爭(zhēng)力的因素,分別是:農(nóng)、林、牧、漁業(yè)x1;采礦業(yè)(x2);制造業(yè)(x3);電力、燃?xì)饧八纳a(chǎn)供應(yīng)業(yè)(x4);建筑業(yè)(x5);交通運(yùn)輸倉(cāng)儲(chǔ)及郵政業(yè)(x6);信息傳播、計(jì)算機(jī)服務(wù)和軟件業(yè)(x7);批發(fā)和零售業(yè)(x8);住宿和餐飲業(yè)(x9);金融業(yè)(x10);房地產(chǎn)業(yè)(x11);租賃和商務(wù)服務(wù)業(yè)(x12);科學(xué)研究技術(shù)服務(wù)和地質(zhì)勘察業(yè)(x13);水利、環(huán)境和公共設(shè)施管理業(yè)(x14);居民服務(wù)和其他服務(wù)業(yè)(x15);教育(x16);衛(wèi)生、社會(huì)保障和社會(huì)福利業(yè)(x17);文化、體育和娛樂(lè)業(yè)(x18);公共管理和社會(huì)組織(x19)。數(shù)據(jù)來(lái)源:《黑龍江統(tǒng)計(jì)年鑒2012》(見(jiàn)表1)。
1.對(duì)原始數(shù)據(jù)進(jìn)行初始化。
2.建立變量的相關(guān)系數(shù)矩陣R。
3.求的特征值和特征向量。
4.給出主成分,前2個(gè)特征值的累積貢獻(xiàn)率已經(jīng)達(dá)到96.228%,根據(jù)前2個(gè)特征值,得到的前二個(gè)主成分為(如表2和表3所示):
我們發(fā)現(xiàn):在第一主成分中各項(xiàng)指標(biāo)的系數(shù)都較大,因此,第一主成分反映的原始指標(biāo)信息比較多,定義為綜合成分。在第二主成分中,只有第二項(xiàng)的系數(shù)比較大,其它項(xiàng)的系數(shù)都較小,因此,定義為采礦業(yè)成分。
5.根據(jù)各地區(qū)的主成分得分計(jì)算相應(yīng)的綜合得分,綜合得分的計(jì)算公式為:
由表3可知,各個(gè)主成分的排名不盡相同,第一主成分排名靠前的是哈爾濱、齊齊哈爾、大慶、牡丹江,說(shuō)明它們?cè)?9項(xiàng)指標(biāo)中均具有較高的綜合水平。第二主成分排名靠前的雞西、七臺(tái)河、哈爾濱、雙鴨山、鶴崗,說(shuō)明它們?cè)诓傻V業(yè)方面具有較好的基礎(chǔ)。
綜合得分大于零,表示綜合競(jìng)爭(zhēng)力水平在平均值之上,即哈爾濱、大慶、齊齊哈爾、牡丹江、佳木斯;綜合得分小于零,表示綜合競(jìng)爭(zhēng)力水平在平均值之下,即綏化、雞西、雙鴨山、黑河、七臺(tái)河、伊春、大興安嶺、鶴崗。
從綜合得分來(lái)看,綜合競(jìng)爭(zhēng)力處于第一的是哈爾濱。這與該地區(qū)是黑龍江省的省會(huì),且是黑龍江省經(jīng)濟(jì)、政治和文化的中心是相吻合的。其次,大慶、齊齊哈爾、牡丹江、佳木斯和綏化處于綜合競(jìng)爭(zhēng)力的第二位。最后,處于第三類的是雞西、雙鴨山、七臺(tái)河、黑河、伊春、大興安嶺和鶴崗。利用主成分分析的方法得出的此結(jié)論與目前的各城市的綜合水平基本上保持是一致的。
三、聚類分析
采用K均值聚類法,得到以下結(jié)果:
該結(jié)果顯示,主成分的分類結(jié)果是正確的,合理的。
四、結(jié)論
本文采用主成分分析方法和聚類分析法,對(duì)黑龍江省的13個(gè)地區(qū)的19項(xiàng)指標(biāo)進(jìn)行了綜合競(jìng)爭(zhēng)力的分析。結(jié)果表明,兩種方法得出的結(jié)論基本一致,這說(shuō)明我們選用方法的正確性。因此,政府部門應(yīng)該根據(jù)城市競(jìng)爭(zhēng)力的水平評(píng)價(jià)結(jié)果,制定科學(xué)的規(guī)劃。從而,在大力發(fā)展各個(gè)城市的資源優(yōu)勢(shì)的同時(shí),使資金、技術(shù)向一般城市傾斜,使較弱城市的競(jìng)爭(zhēng)力有著不同程度的進(jìn)步,進(jìn)而促進(jìn)省內(nèi)各城市的協(xié)調(diào)發(fā)展。
[基金項(xiàng)目:黑龍江省教育廳科研項(xiàng)目(12521471)]
參考文獻(xiàn):
1.任雪松,于秀林.多元統(tǒng)計(jì)分析[M].北京:中國(guó)統(tǒng)計(jì)出版社,2003
2.羅應(yīng)婷,楊鈺娟.SPSS統(tǒng)計(jì)分析-從基礎(chǔ)到實(shí)踐[M].北京:電子工業(yè)出版社,2007
3.陳萍.黑龍江省中心城市競(jìng)爭(zhēng)力分析[J].哈爾濱師范大學(xué)自然科學(xué)學(xué)報(bào),,2006(5)
4.黑龍江省社會(huì)科學(xué)院課題組.提升哈爾濱城市競(jìng)爭(zhēng)力的研究報(bào)告[J].學(xué)習(xí)與探索,2006(3)
5.蔡若男,馬丹.黑龍江省各城市綜合競(jìng)爭(zhēng)力統(tǒng)計(jì)分析[J].齊齊哈爾大學(xué)學(xué)報(bào)(自然科學(xué)版),2013(2)
(作者單位:黑龍江科技大學(xué)理學(xué)院 黑龍江哈爾濱 150027)
(責(zé)編:賈偉)