吳 珣,楊 婕,張 紅
(西南交通大學 地球科學與環(huán)境工程學院,四川 成都 611756)
人口分布是指人口數(shù)量規(guī)模的地域分布,它是人口地理學研究的關(guān)鍵,與人口數(shù)量、空間分布和一定區(qū)域內(nèi)人口密度緊密相關(guān)[1]。研究人口分布狀況、揭示人口分布與空間位置的關(guān)系,對于增進人地關(guān)系的理解,實現(xiàn)人口、資源、環(huán)境可持續(xù)發(fā)展有著十分重要的作用[2-4]。
中國人口眾多,地域遼闊、自然環(huán)境多樣,人口分布面臨的主要問題有:大城市病、高密度連綿城市群的環(huán)境污染、大片鄉(xiāng)村缺少就近特大城市輻射帶動的發(fā)展難題、生態(tài)氣候等自然條件惡劣地區(qū)人口的生存困境、以及高密度大流量的人口遷移等[5-6]。自1935年胡煥庸提出了“璦琿-騰沖”線至今[7],“胡煥庸線”一直是體現(xiàn)中國人口空間分布地域差異的一條最基本的分界線。當今中國人口正處于轉(zhuǎn)折點上[4],李克強總理在國家博物館參觀人居科學研究展時,向社會和科學界提出“胡煥庸線怎么破”的命題,為中國人口分布研究帶來新的機遇與挑戰(zhàn)[8]。
由于人口分布受自然與社會雙重影響,對人口的研究涉及社會學、經(jīng)濟學、地理學、人口學、環(huán)境科學等多個學科,研究角度諸如聚落、人口流動與遷移、居民點分布、人口與產(chǎn)業(yè)格局、區(qū)域發(fā)展關(guān)聯(lián)分析等[5,9-10]。由于空間相互聯(lián)系和相互作用是揭示事物與現(xiàn)象空間分布特征和動態(tài)變化規(guī)律的基礎(chǔ)[11],空間自相關(guān)性也成為研究人口分布格局及變動的最為有效的工具之一[12]。當前人口自相關(guān)研究多集中于人口自相關(guān)模式、人口自相關(guān)與社會經(jīng)濟關(guān)聯(lián)分析等[13-14],對于人口自相關(guān)分析中空間權(quán)重矩陣建立的方法及其比較的研究較少。此外,作為快速交通流線的主要形式,高速鐵路建設(shè)可提高可達性,有效拓展區(qū)域人口流動空間,并引導人口和產(chǎn)業(yè)的集聚趨勢[15]。有必要根據(jù)高鐵可達性重新定義空間權(quán)重矩陣,揭示高鐵影響下的人口空間自相關(guān)特征。
綜上,本文基于距離閾值和鄰接關(guān)系定義多種空間權(quán)重矩陣,建立高鐵兩小時經(jīng)濟圈空間權(quán)重矩陣,使用Moran's I指數(shù),刻畫中國人口分布的空間自相關(guān)特征,并比較不同空間權(quán)重矩陣下的中國人口空間分布自相關(guān)特征的一致性與差異性。
空間自相關(guān)是地統(tǒng)計的基礎(chǔ)。1973年,Cliff和Ord出版了《空間自相關(guān)》一書,為度量地理空間單元間的相互聯(lián)系提供有效的統(tǒng)計分析手段[16]。隨后,Tobler指出了空間自相關(guān)的普遍性并提出了地理學第一定律,即地表所有事物和現(xiàn)象在空間上都是關(guān)聯(lián)的,且距離較近的事物比距離較遠的事物聯(lián)系更緊密[17]。當前空間自相關(guān)分析已成為刻畫空間關(guān)聯(lián)模式、研究空間分異和空間格局的有效方法。相較洛倫斯曲線、基尼系數(shù)等傳統(tǒng)度量指標而言,運用空間自相關(guān)分析可以較好地表達人口分布的集聚現(xiàn)象,揭示人口格局的空間結(jié)構(gòu)和空間相互作用。
目前,刻畫空間自相關(guān)指數(shù)的統(tǒng)計量主要有Moran's I和Geary's C指數(shù)。由于Moran's I是最早提出的、簡單且最常用的統(tǒng)計量,并且研究發(fā)現(xiàn)在判斷一個區(qū)域是否存在空間聚集,尤其是估計聚集區(qū)域位于區(qū)域的邊緣時,Moran's I指數(shù)比Geary's C統(tǒng)計的結(jié)果更為可靠[18],故本文選取Moran's I指數(shù)作為分析指標。
空間自相關(guān)分為全局空間自相關(guān)和局部空間自相關(guān)。其中,全局空間自相關(guān)主要用于描述某區(qū)域內(nèi)某種現(xiàn)象的整體空間分布情況,以判斷該現(xiàn)象在空間上是否存在聚集性[12]。全局空間自相關(guān)指數(shù)Moran's I 的計算公式為:
式中,xi和xj為位置i和位置j的特定屬性,x-為其相應的均值,wij為空間權(quán)重矩陣,代表i和j的空間關(guān)系。空間權(quán)重矩陣可以量化數(shù)據(jù)集要素中存在的空間和時態(tài)關(guān)系。雖然空間權(quán)重矩陣文件可能具有多種不同的物理格式,但從概念上講,可以將空間權(quán)重矩陣看作一個表格,數(shù)據(jù)集中的每個要素都對應著表格中的一行和一列。任意給定行/列組合的像元值即為權(quán)重,從而量化這些行要素和列要素之間的空間關(guān)系,通常通過距離或鄰接關(guān)系來定義權(quán)重,下一節(jié)將詳細介紹各類權(quán)重設(shè)置方法。其中S定義為:
Moran's I 的取值范圍為[-1,1]。當Moran's I指數(shù)值接近0,指示隨機趨勢或不相關(guān);當Moran's I為正時,指示聚集趨勢,即距離鄰近的事物性質(zhì)越相似。當Moran's I為負時,指標離散趨勢,即距離鄰近的事物間的差異越大。計算出Moran's I后,一般要對其進行顯著性Z檢驗,計算公式為:
式中,E(I)和Var(I)分別表示Moran's I指數(shù)的期望和方差。
局部空間自相關(guān)分析側(cè)重于研究局部范圍內(nèi)空間對象屬性值在的空間相關(guān)性,局部Moran's I指數(shù)的計算公式如下:
其中Zi=(xi-x-)/S,S與公式(1)中一致;Zi,Zj分別為空間單元i與j某個屬性的標準值,反映屬性值與均值的偏差程度。I值的具體含義與全局空間自相關(guān)指標類似。
全局空間自相關(guān)和局部空間自相關(guān)從整體和局部探測空間對象的分布情況,關(guān)鍵在于空間關(guān)系的定義,都需要考慮空間權(quán)重矩陣。不同的空間權(quán)重對應著不同的空間關(guān)系,從而給空間對象的全局和局部空間自相關(guān)分析帶來差異。本文將人口分布作為研究對象,運用全局和局部自相關(guān)分析方法,同時皆考慮不同的空間權(quán)重矩陣,從全局和局部揭示不同鄰近關(guān)系下人口空間分布格局和空間相互作用。
如前所述,與傳統(tǒng)統(tǒng)計學相比,全局與局部Moran's I指數(shù)均考慮了空間權(quán)重。空間權(quán)重矩陣是空間相鄰關(guān)系的主要表達方式,刻畫了空間對象間的相互鄰接關(guān)系。當前有多種空間權(quán)重定義方式,如基于距離的權(quán)重矩陣、Queen權(quán)重矩陣、Rook權(quán)重矩陣、K最近點權(quán)重矩陣、Delaunay權(quán)重矩陣等。下面介紹幾種常見權(quán)重矩陣與本文給出的權(quán)重矩陣定義:
1)基于固定距離的空間權(quán)重矩陣
在空間數(shù)據(jù)中,距離是空間對象的直線距離或球面距離。在小的地區(qū)(小尺度的研究),可以忽略地球的曲率,距離的計算可以采用歐氏距離或曼哈頓距離。在較大的區(qū)域(大尺度研究),距離的計算要考慮地球的曲率。FIXED_DISTANCE(以下簡稱FD):首先需要建立一個距離閥值d,比較空間目標兩點之間的距離dij與閾值d的關(guān)系,小于閾值取1,其他取0。此方法中,距離代表著空間關(guān)聯(lián)性,有效刻畫人口空間意義上的關(guān)聯(lián)性,不過閾值距離選擇與實際的應用相關(guān)。權(quán)重矩陣的定義如下:
2)基于K-最近鄰權(quán)重
K_NEAREST_NEIGHBORS(以下簡稱KNN):此方法的計算需預先設(shè)定K值,并分別計算空間目標的兩兩之間的距離dij在觀測點周圍隨機選擇與其最近的k個點,認為是相鄰的,權(quán)重為1,其余為0。此方法中,空間對象相鄰關(guān)系的構(gòu)建隨機性較強,缺乏客觀性。權(quán)重矩陣的定義如下:
3)基于鄰接關(guān)系權(quán)重矩陣
根據(jù)直接相鄰關(guān)系,將空間目標的位置鄰接關(guān)系定義為下列兩種情形中的任何一種:ROOK CONTIGUITY(以下簡稱RC)、QUEEN CONTIGUITY(以下簡稱QC)。對于Queen權(quán)重矩陣,只要兩個空間對象之間有公共的邊或同一點,就認為兩者是相鄰的,權(quán)值為1,否則權(quán)值為0。對于Rook權(quán)重矩陣,只要兩個對象之間有公共邊,就認為兩者相鄰,權(quán)值為1,否則為0。在鄰接關(guān)系中,還存在高階和低階效應。就省域為例,一個省的二階鄰近,代表與該省域鄰近省域的鄰近省域也與該省相鄰。此方法中,注重區(qū)域間邊界關(guān)系,受客觀邊界影響較強。一階鄰近Rook權(quán)重矩陣的定義如下:
4)基于通行時間權(quán)重矩陣
我國高速鐵路網(wǎng)的不斷完善,不僅可以促進經(jīng)濟的流通,對人口的分布也會有一定的影響。根據(jù)通行時間(高鐵兩小經(jīng)濟圈),給出省與省之間通行時間的權(quán)重矩陣(以下簡稱HSR2)。在一定條件內(nèi)(兩小時內(nèi))高鐵可以到達的權(quán)值為1,否則為0。本文方法,通過高鐵可達性重新定義空間權(quán)重矩陣,揭示高鐵影響下的人口空間自相關(guān)特征。權(quán)重矩陣的定義如下:
不同空間權(quán)重矩陣關(guān)注空間單元的不同方面,如Queen權(quán)重矩陣側(cè)重于空間單元間的直接相連性,而閾值權(quán)重矩陣則關(guān)心空間單元間距離的阻隔作用。本文構(gòu)建了兩種閾值權(quán)重矩陣,一種為幾何距離閾值(FD),其值設(shè)為500 km,其依據(jù)2015年3月實施高鐵新建設(shè)計開行速度250 km/h,2小時大致能行駛的距離約500 km[19];另一種為根據(jù)通行時間(高鐵兩小時經(jīng)濟圈,HSR2)定義的閾值權(quán)重矩陣,利用兩種閾值權(quán)重矩陣從空間和時間兩個維度進行人口分布空間自相關(guān)對比分析。此外,還考慮了Rook、Queen兩種不同鄰接關(guān)系定義,階數(shù)分別為一階(RC1,QC1)和二階(RC2,QC2),既充分考慮省域間邊界鄰接關(guān)系,同時探測高階鄰接帶來的影響;K最近鄰點權(quán)重矩陣考慮了三鄰域(KNN3)和六鄰域(KNN6),雖然存在一定的隨機性,但不失為空間鄰近關(guān)系的一個補充,三個或六個鄰域也與實際情況較為接近。
本文以省及直轄市作為基本分析單元,人口數(shù)據(jù)由《中國人口年鑒(2010年)》得到。
以省及直轄市作為基本分析單元,得到圖1所示的中國省級人口密度空間分布圖??臻g分布上,人口密度高等級省份主要分布于中國東部沿海,中部平原,人口數(shù)量巨大,并且沿海各行政區(qū)域面積較小,經(jīng)濟條件較好,人口密度相對較大。低等級人口密度省份主要分布于西北和西南地區(qū),以盆地、高原和丘陵地帶為主,經(jīng)濟欠發(fā)達,地廣人稀,人口密度普遍不高。整體呈現(xiàn)東部高于西部的空間特征。中國人口密度分布的東南和西北分異突變線,與“胡煥庸線”大致吻合。
圖1 中國省級人口密度分布圖Fig. 1 Distribution density map of provincial population in China
使用Geoda軟件進行全局空間自相關(guān)性分析,得到中國省級人口密度分布全局Moran'I值(見表1),為了便于分析比較,圖1為相應的Moran'I和統(tǒng)計量Z數(shù)值分布散點圖。
表1 不同鄰近關(guān)系下全局Moran's I值及其檢驗統(tǒng)計量Z值(α=0.05)Tab.1 Global Moran's I and Z score in different proximity relations
圖2 不同鄰近關(guān)系下全局Moran's I值及其檢驗統(tǒng)計量Z值(α=0.05)Fig. 2 Global Moran's I and Z score in different proximity relations
結(jié)合表1和圖2,①從Moran's I值大小來看,四類不同的空間鄰近位置關(guān)系所得到的全局Moran's I指數(shù)值均大于0,2010中國省域人口密度分布正的空間自相關(guān)性保持一致;②不同空間鄰近關(guān)系,在保持空間正相關(guān)的空間模式下,其顯著性水平有高有低。檢驗統(tǒng)計量Z值在5%的顯著水平下,RC、QC方法Z值均大于1.96,顯著性水平較強,KNN方法Z值接近1.96,顯著性水平次之,F(xiàn)D和HSR2方法顯著性水平最弱;③對于RC、QC方法,隨著階數(shù)O增加,Moran's I值下降很快,KNN方法隨著鄰接數(shù)增加,也表現(xiàn)相似的現(xiàn)象。揭示高階效應存在于人口密度的空間自相關(guān)分析中,也即是省域之間一階鄰近對人口密度空間自相關(guān)分析影響較大,各個省份人口密度和鄰近省份人口密度關(guān)系緊密相關(guān)。
全局空間自相關(guān)指數(shù)概括了在一個總的空間模式中空間依賴的程度,揭示了全局綜合特征,但是還不能表明各個省域與周邊鄰近省域之間的局部空間關(guān)系,因此以下利用局部自相關(guān)的分析方法來揭示我國各個省份人口密度的空間依賴關(guān)系。
圖3展示了八種空間權(quán)重矩陣下人口密度分布局部Moran's I指標圖。圖例中,白色代表沒有顯著性,也即是沒有空間關(guān)聯(lián)關(guān)系;正相關(guān)有兩種類型,紅色代表人口密度高于均值省份被人口密度高于均值的省份所包圍(HH),綠色代表人口密度低于均值的省份被人口密度低于均值的省份所包圍(LL);而負相關(guān)也有兩種類型:人口密度高于均值的空間單元被人口密度低于均值的鄰域所包圍(“高—低”關(guān)聯(lián)或HL,用粉色表示),或者相反(“低—高”關(guān)聯(lián)或LH,用紫色表示);灰色代表其他。
結(jié)合圖3與表2,F(xiàn)D和HSR2方法得到的局部空間自相關(guān)結(jié)果表明:局部空間自相關(guān)類型中,無鄰域省份和非顯著性省份占主要,F(xiàn)D方法含有4個HH型和一個LH型,HSR2只含有2個HH型,所占比例都較小;空間分布上,以小型“組團”形式出現(xiàn),聚集性較弱,HH型主要分布在江浙一帶,安徽為LH型;實際中,江浙沿海一帶,人口密度較大,空間距離與發(fā)達的高鐵系統(tǒng)對其人口密度制約度較低,影響較小。
圖3 2010年中國各省域人口密度局部空間關(guān)聯(lián)模式圖Fig. 3 Local spatial association of provincial population density in China
表2 不同權(quán)重矩陣對局部空間自相關(guān)的影響Tab.2 Effects of spatial weight matrices on local Moran's I
對于QC方法和QR方法,絕大部分省份的空間自相關(guān)性并不明顯,且階數(shù)一致時,局部自相關(guān)類型保持一致。當階數(shù)O為1時,含有1個HH型,7個LL型??臻g分布上,LL型主要集中在胡煥庸線的西北地區(qū),HH型為江蘇;當階數(shù)O為2時,HH型有3個,LL型有13個,LH型有2個,高階效應帶來的影響在其產(chǎn)生作用??臻g分布上,內(nèi)蒙古不再是LL型,其次LL型中增加了黑龍江和吉林兩省,并且HH型主要集中在江浙滬一帶,LH型也出現(xiàn)在安徽江西這樣人口密度不大的省份。實際中,HH型依然出現(xiàn)在江浙一帶,其人口密度大,經(jīng)濟較為發(fā)達,LL型中增加西南地區(qū),云貴川地區(qū)人口密度相對較小,經(jīng)濟相對落后,人口密度呈現(xiàn)出LL型的抱團模式。
至于KNN方法,非顯著性省份占主要部分,三鄰域和六鄰域自相關(guān)結(jié)果也有一定差異。三鄰域KNN方法,含有1個HH型,4個LL型,所占比例較小??臻g分布上,LL型主要集中在西北地區(qū),HH型為江蘇;六鄰域KNN方法,含有3個HH型,3個LL型,1個LH型,空間分布上,LL型依然集中在西北地區(qū),HH型集中在江浙滬地區(qū)。
由此分析可知,不同的空間權(quán)重矩陣下,在局部自相關(guān)性上表現(xiàn)為一定的差異,但總體上各個省域人口密度對鄰近省域人口密度影響一般都較為顯著。中國西部各個省份和西南一些省份保持著LL型的關(guān)聯(lián)模式,HH型的關(guān)聯(lián)模式一般都集中在東部和中部;基于距離的空間權(quán)重矩陣與基于鄰接關(guān)系的空間權(quán)重矩陣表現(xiàn)出的空間關(guān)聯(lián)模式,其差異性較大,LL型的關(guān)聯(lián)模式并不是很多。
由于受地形和氣候環(huán)境的影響,加上東部沿海地區(qū)改革開放的程度較高,客觀上造成東西部的經(jīng)濟發(fā)展不平衡,使得西部發(fā)展較慢,人口密度一直偏低,東部人口密度較高。在“胡煥庸線”西北地區(qū),人口密度保持著LL型的空間關(guān)聯(lián)模式占主導,RC方法和QC方法探測的結(jié)果較為明顯,一致表現(xiàn)為西部地區(qū)人口密度小的省份,其周邊省份人口密度也較小。八種空間權(quán)重矩陣并沒有檢測出HL型的空間關(guān)聯(lián)模式,說明人口密度大的省份,其周邊人口密度并不會很小,不過幾乎每種空間權(quán)重矩陣都檢測出了江蘇省HH型的空間關(guān)聯(lián)模式。
圖4 不同權(quán)重矩陣對局部空間自相關(guān)的影響Fig. 4 Effects of spatial weight matrices on local Moran's I
中國多樣化的自然環(huán)境造就人口分布區(qū)域間差異,人口分布的研究對實現(xiàn)人口、環(huán)境、資源可持續(xù)管理具有深刻意義。相對于洛倫斯曲線、基尼系數(shù)等傳統(tǒng)度量指標,運用空間自相關(guān)分析可以較好地表達人口分布的集聚現(xiàn)象,揭示人口格局的空間結(jié)構(gòu)和空間相互作用。然而當前測度人口空間自相關(guān)特征多采用單一鄰近關(guān)系構(gòu)造空間權(quán)重矩陣,忽視了不同空間鄰近關(guān)系對自相關(guān)特征分析結(jié)果的影響。
為了彌補當前人口相關(guān)性分析采用的空間權(quán)重矩陣過于單一的不足,本文對比分析不同空間權(quán)重矩陣下,中國人口空間自相關(guān)分布特征,研究結(jié)果表明:①在不同空間鄰近關(guān)系下,中國省域人口密度分布在全局自相關(guān)上均呈現(xiàn)空間正自相關(guān),但其顯著性水平有高有低;②局部自相關(guān)分析結(jié)果在空間分布上,以小型“組團”形式出現(xiàn),因中國特定的地形和悠久的歷史文化,使得Moran's I指數(shù)表現(xiàn)出較大的差異性和偶然性。③自定義的空間權(quán)重矩陣結(jié)果驗證了其他結(jié)構(gòu)的高—高相關(guān)。
本文采用的空間結(jié)構(gòu)并不一定包含了所有的空間結(jié)構(gòu),同時所采用的數(shù)據(jù)是2010年中國各省份人口,是靜態(tài)的,而對于多時間段的人口密度的分布和交通的飛速發(fā)展以及快速城鎮(zhèn)化帶來的人口劇烈流動對“胡煥庸”線的穩(wěn)定性有待進一步研究。