吳成鑫
(黃山學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,安徽 黃山245041)
改革開放以來,我國經(jīng)濟(jì)得到迅速發(fā)展,人民的生活水平不斷提高,但與此同時各地居民收入分配差距也在擴(kuò)大。為了研究目前各地區(qū)的城鎮(zhèn)居民收入差異,本文采用多元統(tǒng)計分析中的聚類分析和主成分分析方法[1],選取《中國統(tǒng)計年鑒-2018》中適當(dāng)?shù)闹笜?biāo)變量,利用SPSS軟件構(gòu)建出統(tǒng)計模型,得出相應(yīng)的研究結(jié)果,進(jìn)而提出合理的意見和建議。
系統(tǒng)聚類[2]是按照一定的層次將樣本進(jìn)行分類。先將距離得比較近的樣品分為另一類,然后將距離比較遠(yuǎn)的樣品聚成另一類,一直重復(fù)這個過程進(jìn)行下去,直到所有的樣本都聚到合適的類中為止,然后結(jié)束過程。
主成分分析[3]采用降維的思想,將多的指標(biāo)轉(zhuǎn)換成少的且彼此之間沒有關(guān)系的綜合性指標(biāo)。首先構(gòu)造適合原始變量的少數(shù)線性組合,產(chǎn)生互不相關(guān)的新變量,然后提取其中幾個包含原始變量絕大多數(shù)信息的變量去解釋原始變量,提取的新變量即為主成分。
本文選取《中國統(tǒng)計年鑒-2018》中與我國31個省市城鎮(zhèn)居民人均收入相關(guān)的5個指標(biāo)變量,分別為人均可支配收入、工資性收入、經(jīng)營凈收入、財產(chǎn)凈收入、轉(zhuǎn)移凈收入,記為X1、X2、X3、X4、X5。
利用SPSS軟件,對上述5個指標(biāo)變量進(jìn)行系統(tǒng)聚類,可得出結(jié)果如表1。
表1 群集成員
表1中第二列和第三列是群集成員分類情況,在第二列中,全部樣本分為3類,在第三列中,全部樣本分成2類,其中相同數(shù)字的表示分在同一類。
可以看出,當(dāng)聚成3類時:北京,上海為第一類;天津,內(nèi)蒙古,江蘇,浙江,福建,山東,廣東為第二類;遼寧,山西,黑龍江,吉林,江西,安徽,貴州,河南,甘肅,陜西,寧夏,青海,湖北,山東,廣西,湖南,重慶,海南,云南,四川,新疆,西藏為第三類。當(dāng)聚成2類時:北京,上海為第一類;其它均為第二類。
運用SPSS軟件畫出冰掛圖,如圖1所示。
圖1 冰掛圖
從圖1可以直觀地看出,2017年中國城鎮(zhèn)居民收入的分類情況,群集數(shù)由上至下依次遞增,以圖上端最少群集數(shù)為例,北京和上海連在一起,因此它倆聚成一類,其他城市則聚成另一類,此時群集數(shù)為2。
運用SPSS軟件畫出樹狀圖,如圖2所示。
圖2 樹狀圖
圖2 反映了31個省市區(qū)的分類情況,展示了分類狀態(tài)和各類之間的距離。以寧夏,新疆和海南為例,它們距離最近且相似性較高,將它們合并成一類,按照此步驟進(jìn)行下去,最后所有的省市個體聚成一類,此時類間距離已經(jīng)很大,聚類過程完成。
綜合以上結(jié)果可知,我國的東部和沿海地區(qū)的城鎮(zhèn)居民收入水平比東北和西北地區(qū)要高,尤其是北京和上海兩個城市,各項收入均處于較高水平,屬于我國經(jīng)濟(jì)發(fā)展的繁榮地帶,其次是東南沿海地區(qū),它們能夠較好地吸收外來資源,因此發(fā)展水平也較好,而中西部等地區(qū)由于地理、政策等各種因素的影響,導(dǎo)致其人均收入相比其他地區(qū)仍處于較低水平。
利用SPSS軟件,對上述5個指標(biāo)變量進(jìn)行主成分分析,可直接輸出結(jié)果,如表2-表5。
表2 相關(guān)矩陣
表5 成份矩陣
表2為變量X1,X2,X3,X4,X5的樣本相關(guān)系數(shù)矩陣,其中大部分變量的相關(guān)系數(shù)都比較高,一些相關(guān)系數(shù)都達(dá)到了1,因此選取的樣本特性較好,各變量之間存在相關(guān)線性關(guān)系,可以進(jìn)行主成分分析。
表3中KMO為0.278,巴特利特(Bartlett)的球度檢驗統(tǒng)計量的觀測值為589.360,如果顯著性水平取α=0.05,則其明顯大于概率p值,應(yīng)拒絕零假設(shè),因此可以認(rèn)為相關(guān)系數(shù)矩陣與單位陣之間有顯著性的差異,進(jìn)一步驗證上述數(shù)據(jù)進(jìn)行主成分分析是可行的。
表3 KMO和Bartlett的檢驗
表4說明了前兩個主成分的累計貢獻(xiàn)率已經(jīng)達(dá)到89.094%,所以提取前兩個主成份進(jìn)行分析。
表4 解釋的總方差
運用SPSS軟件畫出碎石圖,如圖3所示。
圖3 碎石圖
圖3 給出了不同成分?jǐn)?shù)下的特征值,其中5個變量在第1個成分?jǐn)?shù)上的載荷都很高,意味著它們與第1個主成分的相關(guān)程度高,到第2成分?jǐn)?shù)時已趨向平緩狀態(tài),往后第3、4主成分更加平穩(wěn),進(jìn)一步驗證提取兩個主成分是合理的。
綜上分析可知,本次主成分分析應(yīng)提取兩個主成分,接下來利用所得數(shù)據(jù)計算得分計算式。
根據(jù)表4及表5可以計算出兩個主成分的特征向量,可得第一主成份:
F1=0.535X1+0.507X2-0.083X3+0.523X4
+0.42X5
第二主成分:
F2=0.179X1+0.151X2+0.916X3+0.069X4
-0.316X5
可以看出,在第一個主成分里,載荷系數(shù)比較高的有第一、二、四、五指標(biāo),所以可以把第一主成分看作反映了城鎮(zhèn)居民人均收入中除去經(jīng)營凈收入的其他收入的綜合性指標(biāo)。在第二個主成分里,載荷系數(shù)較高的只有經(jīng)營凈收入,因此第二主成分可以看作經(jīng)營性因子。
結(jié)合表4中第一、第二主成分各自的貢獻(xiàn)度,可得出下面得分計算式:
W=0.67271F1+0.21823F2
將31組數(shù)據(jù)代入上面的得分計算式,可得出31個省市的收入排名情況,如表6所示。
表6 各省市收入排名
由表6可以看出,我國各地區(qū)的城鎮(zhèn)居民人均收入仍然存在差距,其中北京、上海排名高居前列,東南沿海的省市普遍比中西部省市的收入高,此外,中西部地區(qū)城市的收入得分差距較小。
綜合聚類分析和主成分分析的結(jié)果,可以得出以下結(jié)論以及相關(guān)建議。
首先,北京及東南沿海地區(qū)城鎮(zhèn)居民收入仍然比中西部地區(qū)的收入高很多,這和它們的地理位置、歷史因素、政治因素等都有關(guān)。東南沿海交通便利,自然資源豐富,歷史上就有一定經(jīng)濟(jì)基礎(chǔ),在國家改革開放政策的影響下,抓住了發(fā)展機(jī)遇,經(jīng)濟(jì)有了長足有效的發(fā)展,在短時間內(nèi),中西部地區(qū)難以趕上東南沿海地區(qū)的經(jīng)濟(jì)發(fā)展水平。其次,中西部地區(qū)的城鎮(zhèn)居民收入差距較小和國家扶持政策息息相關(guān),在國家政策的影響下,中西部地區(qū)的經(jīng)濟(jì)水平也有了明顯的提高,特別是在國家扶貧政策的有力推動下,一些地區(qū)特別貧窮和落后的情況正在逐步消失。
為縮小我國不同區(qū)域居民收入差距,政府應(yīng)加快落后地區(qū)的產(chǎn)業(yè)轉(zhuǎn)移,引導(dǎo)其經(jīng)濟(jì)合理健康的發(fā)展;實施積極的就業(yè)創(chuàng)業(yè)政策,鼓勵特色產(chǎn)業(yè)和新興產(chǎn)業(yè)的發(fā)展,支持自主創(chuàng)業(yè),吸引人才和資金進(jìn)入中西部地區(qū),提高這些地區(qū)經(jīng)濟(jì)活力;加快基礎(chǔ)設(shè)施建設(shè),完善城市交通網(wǎng)絡(luò),為經(jīng)濟(jì)發(fā)展打好硬件基礎(chǔ);完善社會保障體系,提高落后地區(qū)的民生投入,增加居民轉(zhuǎn)移性收入,改善居民生活水平。