陳智波 尹紅
摘? 要: 為了研究陜西省各地區(qū)城市的建設(shè)與發(fā)展?fàn)顩r,本文以陜西省的11個(gè)主要城市為研究對(duì)象,選取2015年度各個(gè)地區(qū)城市的年底城市總?cè)丝跀?shù)、地方財(cái)政收入、城市用水普及率、城市燃?xì)馄占奥省⒆≌娣e等15個(gè)因素作為評(píng)價(jià)指標(biāo),從陜西省統(tǒng)計(jì)年鑒中提取出各個(gè)城市的相關(guān)數(shù)據(jù)。采用聚類分析法(系統(tǒng)聚類分析、k-均值聚類分析)和主成分分析法兩種多元統(tǒng)計(jì)學(xué)方法,運(yùn)用spss軟件進(jìn)行分析,最后對(duì)陜西省主要地區(qū)的城市建設(shè)和發(fā)展?fàn)顩r進(jìn)行綜合評(píng)價(jià)。
關(guān)鍵詞: 城市發(fā)展;SPSS統(tǒng)計(jì)軟件;聚類分析;主成分分析
【Abstract】: In order to study the construction and development of regional cities in Shaanxi Province, this paper takes 11 major cities in Shaanxi Province as the research object. Fifteen factors such as total urban population, local financial revenue, urban water use penetration rate, urban gas penetration rate and residential area at the end of 2015 are selected as evaluation indexes, and each city is extracted from the statistical yearbook of Shaanxi Province. Relevant data. Cluster analysis (system cluster analysis, K-means cluster analysis) and principal component analysis are used to analyze the situation of urban construction and development in Shaanxi Province. Finally, the comprehensive evaluation of urban construction and development in the main areas of Shaanxi Province is carried out.
【Key words】: Urban development; SPSS statistical software; Cluster analysis; Principal component analysis
0? 引言
城市建設(shè)是城市管理的重要組成部分。城市建設(shè)以規(guī)劃為依據(jù),通過(guò)建設(shè)工程對(duì)城市人居環(huán)境進(jìn)行改造,對(duì)城市系統(tǒng)內(nèi)各物質(zhì)設(shè)施進(jìn)行建設(shè),城市建設(shè)的內(nèi)容包括城市系統(tǒng)內(nèi)各個(gè)物質(zhì)設(shè)施的實(shí)物形態(tài),是為管理城市創(chuàng)造良好條件的基礎(chǔ)性、階段性工作,是過(guò)程性和周期性比較明顯的一種特殊經(jīng)濟(jì)工作[1]。對(duì)于省內(nèi)的各個(gè)城市來(lái)說(shuō),如何掌握它們
現(xiàn)階段的發(fā)展情況,并對(duì)之后發(fā)展做出規(guī)劃,服務(wù)城市經(jīng)濟(jì)社會(huì)發(fā)展,真正為市民創(chuàng)造良好的人居環(huán)境是非常重要的。本文運(yùn)用聚類分析和主成分分析法,借助spss軟件進(jìn)行數(shù)據(jù)分析[2],根據(jù)結(jié)果對(duì)陜西省各地區(qū)城市建設(shè)與發(fā)展?fàn)顩r做出分析與評(píng)價(jià)。
1? 聚類分析
聚類分析是建立一種分析方法,將一批樣本和變量,按照他們?cè)谛再|(zhì)上的親疏、相似程度進(jìn)行分類的一種多元統(tǒng)計(jì)分析方法。聚類分析的內(nèi)容十分豐富,按其聚類的方法可以分為:系統(tǒng)聚類法、動(dòng)態(tài)聚類法、最優(yōu)化聚類法、模糊聚類法、圖論聚類法和聚類預(yù)報(bào)法[3]。
另外,按照分類對(duì)象不同可以分為R型聚類和 Q型聚類,R型是對(duì)變量進(jìn)行聚類,Q型是對(duì)樣本進(jìn)行聚類。
4? 數(shù)據(jù)分析
4.1? 聚類分析
利用SPSS軟件首先對(duì)數(shù)據(jù)進(jìn)行系統(tǒng)聚類分析,分析過(guò)程及結(jié)果如下[9]。
通過(guò)表2個(gè)案處理摘要表,我們可以看出,在整個(gè)聚類過(guò)程中,所選取的11個(gè)城市均參與了聚類分析過(guò)程,沒(méi)有遺失或未參與的樣本。這充分說(shuō)明此次聚類分析已經(jīng)對(duì)11個(gè)樣本的各項(xiàng)指標(biāo)進(jìn)行了相似聚類,因而可以進(jìn)行下一步分析。
通過(guò)表3樣本聚類表,我們可以看出當(dāng)11個(gè)樣本分別分成2個(gè)聚類和3個(gè)聚類時(shí)的樣本聚類情況。
結(jié)合表3樣本歸類表和圖1聚類樹(shù)形圖,當(dāng)將樣本聚為3類時(shí),我們可以得出表4的聚類結(jié)果。
接下來(lái)我們?cè)偈褂肒-均值聚類方法對(duì)樣本進(jìn)行分析:
a. 由于聚類中心中不存在變動(dòng)或者僅有小幅變動(dòng),因此實(shí)現(xiàn)了收斂。任何中心的最大絕對(duì)坐標(biāo)變動(dòng)為0.000。當(dāng)前迭代為2。初始中心之間的最小距離為6775.821。
根據(jù)K-均值聚類最終得到的表6聚類成員表我們可以看出11個(gè)樣本被聚為3類第一類為西安,第二類為榆林、渭南、咸陽(yáng)、漢中、延安、寶雞、安康,第三類為銅川、商洛、楊凌,由此可見(jiàn)兩種聚類方法得到的結(jié)果是一致的。
4.2? 主成分分析
由于選取的各個(gè)指標(biāo)的單位不相同,因此在進(jìn)行主成分分析前需要將所有的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的數(shù)據(jù)如表7所示。
由表8總方差解釋表可知特征根λ1=9.667,特征根λ2=2.367,前兩個(gè)主成分的累積方差貢獻(xiàn)率達(dá)到了80.229%,即涵蓋了大部分信息,這表明前兩個(gè)主成分能夠代表最初的15個(gè)指標(biāo)來(lái)分析陜西省各地區(qū)的城市發(fā)展與建設(shè)情況,故提取兩個(gè)主成分即可[10],分別記為z1,z2。
在運(yùn)用主成分分析方法對(duì)陜西省各地區(qū)的城市建設(shè)與發(fā)展時(shí),我們最后選取了兩個(gè)主成分因子即2個(gè)主要指標(biāo)代表了15個(gè)指標(biāo)進(jìn)行分析,表11綜合得分與排名表給出了各城市的綜合得分與排名,其中綜合得分為正值的,說(shuō)明城市建設(shè)與發(fā)展高于平均水平,反之,綜合得分為負(fù)值的,說(shuō)明其城市建設(shè)與發(fā)展低于平均水平。排名一列我們可以看出11個(gè)城市在綜合兩個(gè)主成分因子下的排名,由大到小一次為:西安、咸陽(yáng)、榆林、渭南、寶雞、漢中、安康、延安、商洛、銅川、楊凌。
5? 結(jié)論
在進(jìn)行對(duì)陜西省各地區(qū)的城市建設(shè)與發(fā)展?fàn)顩r進(jìn)行分析時(shí)我們采用了聚類分析和主成分分析的方法,綜合聚類分析和主成分分析的結(jié)果,我們可以得到下表12綜合得分與聚類狀況表。
從表中我們可以看出在陜西省的城市中,西安市作為陜西省的省會(huì)城市,無(wú)論在哪個(gè)方面都處于龍頭地位,其城市建設(shè)與發(fā)展遠(yuǎn)遠(yuǎn)高于同地區(qū)的其他城市,不僅在綜合得分上處于第一位,同時(shí)與其他城市相比自為一類。
咸陽(yáng)市居于第二位,近幾年來(lái)陜西省政府在咸陽(yáng)市成立西咸新區(qū),加大對(duì)咸陽(yáng)市的建設(shè)和發(fā)展投入,使得咸陽(yáng)市成為西安國(guó)際化大都市的核心組成部分,成為西部高端化和先進(jìn)的制造業(yè)基地,其余6個(gè)城市與咸陽(yáng)建設(shè)發(fā)展?fàn)顩r較為接近。
商洛、銅川、楊凌同為一類,這說(shuō)明其城市建設(shè)與發(fā)展?fàn)顩r與上面的八個(gè)城市相比還是很有差距的,這就要求政府在以后的發(fā)展中加大對(duì)基礎(chǔ)城市建設(shè)的投資,努力提高各方面的水平。
參考文獻(xiàn)
[1]寧越敏, 唐禮智. 城市競(jìng)爭(zhēng)力的概念和指標(biāo)體系[J]. 現(xiàn)代城市研究, 2001, 10(3).
[2]趙楠, 王昕, 李英娜, 等. 利用 spss 軟件分析校園霸凌事件的發(fā)生規(guī)律以及預(yù)防[J]. 軟件, 2018, 39(1): 159-164.
[3]陳磊磊.不同距離測(cè)度的K-Means 文本聚類研究[J]. 軟件, 2015, 36(1): 56-61.
[4]田明光, 翟旭, 江穎潔, 等. 基于K均值聚類及高斯過(guò)程回歸集成的鉛酸電池荷電狀態(tài)預(yù)測(cè)[J]. 軟件, 2018, 39(1): 132-137.
[5]何曉群. 多元統(tǒng)計(jì)分析[M]. 北京: 中國(guó)人民大學(xué)出版社, 2015.
[6]張文宇, 王秀秀, 任露, 等. 改進(jìn)的主成分聚類分析法在教育信息化中的應(yīng)用[J]. 軟件, 2015, 36(7): 10-16.
[7]高惠璇編著, 《應(yīng)用多元統(tǒng)計(jì)分析》北京大學(xué)出版社, 2005. 1.
[8]陜西省統(tǒng)計(jì)局. 陜西省統(tǒng)計(jì)年鑒[Z]. 北京: 中國(guó)統(tǒng)計(jì)出版社.
[9]吳榮強(qiáng), 李晉宏. 基于聚類分析的鋁電解槽陽(yáng)極壓降的分類[J]. 軟件, 2018, 39(3): 166-169.
[10]唐功爽. 基于spss的主成分分析于因子分析的辨析[J]. 統(tǒng)計(jì)教育, 2007(2).
[11]張士杰. 基于主成分分析的阜陽(yáng)市城市競(jìng)爭(zhēng)力評(píng)價(jià)[J]. 安徽廣播電視大學(xué)學(xué)報(bào), 2011, (4).