沈思連,王春偉,崔建嶺
(1.河南科技大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,河南 洛陽 471003;2.63892部隊(duì),河南 洛陽 471003)
近年來,人口作為一種基本信息已成為目前研究的熱點(diǎn)問題之一。人口的分布狀況在一定意義上反映了一個(gè)國(guó)家或地區(qū)自然條件的差異和經(jīng)濟(jì)發(fā)展水平的高低,研究人口分布對(duì)于揭示其地域特點(diǎn)具有重要意義。我國(guó)是世界人口大國(guó),而山東省又是人口大省。要想準(zhǔn)確把握山東省人口與經(jīng)濟(jì)可持續(xù)發(fā)展的關(guān)系,制定合理的人口政策,就有必要對(duì)全省人口的空間分布進(jìn)行深入分析和廣泛研究。本文以山東省統(tǒng)計(jì)年鑒數(shù)據(jù)為基礎(chǔ),研究了該省人口數(shù)量的空間變化模式,并對(duì)該分布模式下的影響因素進(jìn)行了研究。首先利用Surfer軟件的可視化技術(shù)研究山東省人口數(shù)量的空間分布特征。其次基于近年來發(fā)展起來的局部線性地理加權(quán)回歸(Local Linear Geographically Weighted Regression,簡(jiǎn)記為L(zhǎng)LGWR)技術(shù)對(duì)該省人口分布的影響因素進(jìn)行定量分析,并利用F-檢驗(yàn)考查各因素在全省范圍內(nèi)的空間非平穩(wěn)性。
根據(jù)網(wǎng)上公布的第六次全國(guó)人口普查數(shù)據(jù)顯示,山東省全省常住人口為9579.31萬人,位居全國(guó)第二,僅次于廣東省。同第五次人口普查2000年11月1日0時(shí)的9079.31人相比,該省十年間共增加了500萬人,增長(zhǎng)率為5.50%,平均每年的增長(zhǎng)率約為0.54%。這一結(jié)果說明十年來雖然人口總量仍呈現(xiàn)上升的趨勢(shì),但增長(zhǎng)速度已得到控制,相對(duì)較慢,這可能是由于近些年來經(jīng)濟(jì)社會(huì)的發(fā)展,人民生活水平的提高以及人們觀念的轉(zhuǎn)變所致。
一方面,人口的空間分布及其主要的影響因素通常具有空間非平穩(wěn)性。另一方面,隨著時(shí)間的推移,該空間非平穩(wěn)性也會(huì)發(fā)生變化。因此,有必要對(duì)人口分布的空間差異進(jìn)行研究,揭示其空間變化規(guī)律,從而為制定合理的人口政策和實(shí)現(xiàn)人口的有序流動(dòng)提供主要依據(jù)。
為揭示山東省人口數(shù)量的空間分布規(guī)律,我們選取該省132個(gè)市縣區(qū)(其空間分布如圖1),并利用Googleearth軟件搜集了相應(yīng)地區(qū)的經(jīng)緯度數(shù)據(jù)(單位:度)。另一方面,為了與該省第五次人口普查(即2000年11月1日0時(shí))中的人口空間分布作比較,我們選取2000年11月1日0時(shí)和2010年11月1日0時(shí)的132個(gè)市縣區(qū)的人口數(shù)量數(shù)據(jù)(單位:萬人)。
從圖1可以看出,所選的空間站點(diǎn)幾乎均勻地分布在全省范圍內(nèi),這也是對(duì)數(shù)據(jù)進(jìn)行有效分析和合理解釋的必要前提。另一方面,也可看到所有站點(diǎn)(用圓點(diǎn)表示)均在山東省的邊界線以內(nèi),這在一定意義下說明由Googleearth得到的各市縣區(qū)的經(jīng)緯度數(shù)據(jù)具有較高的精度。
圖1 山東省132個(gè)市縣區(qū)的空間分布圖
為了更直觀地展示山東省132個(gè)市縣區(qū)2000年和2010年的人口空間分布特征,并揭示十年來人口數(shù)量的空間變化規(guī)律,我們利用Surfer軟件將搜集的人口數(shù)量數(shù)據(jù)進(jìn)行可視化(經(jīng)緯度數(shù)據(jù)的單位均為度,人口數(shù)量數(shù)據(jù)的單位均為萬人),相關(guān)結(jié)果如圖2所示。
從圖2可以看出,山東省的人口分布明顯不均衡,主要表現(xiàn)為以下幾個(gè)特征:①全省各地市之間人口總量差距顯著,呈現(xiàn)多個(gè)同心環(huán),且人口自西南向東北遞減,人口主要集中在交通干線和城市地區(qū)。②十年來人口相對(duì)稀少的地區(qū)逐漸縮小,例如,人口總量在20~70萬之間的地區(qū)明顯縮小,這些地區(qū)主要集中在北部邊界及東北部地區(qū)。③人口相對(duì)稠密地區(qū)的人口總量值顯著增加,比如,菏澤-濟(jì)寧-臨沂-日照-青島-煙臺(tái)一帶,十年間人口總量由90~140萬人增加到100~170萬人左右。④2000年和2010年的人口分布呈現(xiàn)類似的空間分布模式,即全省范圍呈現(xiàn)多個(gè)同心環(huán),人口大多集中在經(jīng)濟(jì)發(fā)達(dá)、交通便利的市區(qū)。
圖2 山東省各市縣區(qū)2000年和2010年的人口數(shù)量的空間分布(左為2000年,右為2010年)
人口分布通常受自然因素和人文因素的影響,自然因素包括地形、地勢(shì)、地貌和氣候等,人文因素包括了社會(huì)歷史條件、經(jīng)濟(jì)水平等。本節(jié)以山東省統(tǒng)計(jì)年鑒數(shù)據(jù)為基礎(chǔ),搜集取得影響人口分布的可能因素指標(biāo):就業(yè)率、單位面積的糧食產(chǎn)量(噸/千公頃)、人均糧食產(chǎn)量(噸/萬人)、人均GDP(萬元)、單位面積的GDP(萬元/平方米)、農(nóng)民的人均純收入(元)。由于以上衡量指標(biāo)數(shù)據(jù)的單位不同,不便于直接進(jìn)行數(shù)據(jù)分析。本文首先對(duì)以上數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,基于標(biāo)準(zhǔn)化后的數(shù)據(jù)建立合適的空間變系數(shù)回歸模型,利用近年來發(fā)展起來的局部線性GWR方法擬合該模型。
空間變系數(shù)模型是探索與分析空間數(shù)據(jù)回歸關(guān)系空間非平穩(wěn)性的重要工具之一,尤其是近年來發(fā)展起來的LLGWR擬合方法(見文獻(xiàn)[4])更是以其概念上的簡(jiǎn)單性和操作上的易實(shí)現(xiàn)性以及在許多領(lǐng)域中的實(shí)用性受到人們的普遍重視。由于該估計(jì)方法是我們后面進(jìn)行數(shù)據(jù)分析的基礎(chǔ),故首先簡(jiǎn)單介紹一下該方法。
空間變系數(shù)模型中系數(shù)函數(shù)的估計(jì)是人們探索和分析回歸關(guān)系空間非平穩(wěn)性的主要依據(jù)。假定模型(1)中所有的系數(shù)函數(shù)關(guān)于地理位置坐標(biāo)u和v均具有連續(xù)的一階偏導(dǎo)數(shù)。對(duì)于研究區(qū)域內(nèi)任意給定的目標(biāo)位置,令doi為目標(biāo)位置與第i個(gè)觀測(cè)位置之間的歐氏距離,則根據(jù)二元函數(shù)的Taylor展開式,在的某鄰域內(nèi)可近似為
為便于表示,引入矩陣符號(hào)。令
其中Ip和0p×2p分別表示 p階單位陣和 p×2p階零矩陣。
類似于其他的局部光滑技術(shù),在利用LLGWR方法擬合模型(1)的過程中,需要預(yù)先確定核函數(shù)K(·)和光滑參數(shù)h。通常情況下,核函數(shù)K(t)取為Gauss函數(shù)
窗寬參數(shù)h可由某種數(shù)據(jù)驅(qū)動(dòng)方法來確定。
由于本節(jié)的主要目的是為了揭示山東省人口總量與其可能影響因素之間的空間回歸關(guān)系,故我們基于第二節(jié)中該省132個(gè)市縣區(qū)(其空間分布見圖1)的人口相關(guān)數(shù)據(jù)進(jìn)行分析,其中包括各市縣區(qū)的經(jīng)緯度坐標(biāo)(單位:度)、就業(yè)率、單位面積的糧食產(chǎn)量(噸/千公頃)、人均糧食產(chǎn)量(噸/萬人)、人均GDP(萬元)、單位面積的GDP(萬元/平方米)、農(nóng)民的人均純收入(元)。
由于在后面的估計(jì)和檢驗(yàn)過程中,各市縣區(qū)的地理位置坐標(biāo)均為某平面直角坐標(biāo)系下的平面坐標(biāo),為此在我國(guó)西安1980坐標(biāo)系統(tǒng)下,利用高斯-呂克格投影方法(見文獻(xiàn)[6])將各觀測(cè)站點(diǎn)的經(jīng)緯度坐標(biāo)轉(zhuǎn)化為直角坐,其中以零度緯線(赤道)作為橫坐標(biāo)軸,以該省淄博市沂源縣所在的經(jīng)線作為縱坐標(biāo)軸。
這里需要指出的是,在進(jìn)行坐標(biāo)變換的過程中,中央經(jīng)線的選取比較復(fù)雜,一般是根據(jù)分帶(三度帶或六度帶)決定的,每個(gè)帶有自己的中央經(jīng)線。在此選取該省淄博市沂源縣所在地的經(jīng)線(即為中央經(jīng)線,因其大致處于山東省的中央,可保證全省面積處于變形最小狀態(tài)。
另外,為了減小不同量綱對(duì)分析結(jié)果的影響,我們將原始數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化,將人口數(shù)量作為因變量,記為Y,就業(yè)率、單位面積的糧食產(chǎn)量、人均糧食產(chǎn)量、人均GDP、單位面積的GDP、農(nóng)民的人均純收入作為自變量,分別依次記為市縣區(qū)的地理位置坐標(biāo)記為
利用LLGWR方法對(duì)模型(5)進(jìn)行擬合,選取高斯核函數(shù)(如(4)式所示)和交叉確認(rèn)方法(見文獻(xiàn)[5,6])求得系數(shù)函數(shù)在各個(gè)空間位置處的估計(jì)值。基于各系數(shù)函數(shù)的估計(jì)值檢驗(yàn)其在所研究的空間區(qū)域內(nèi)變化的顯著性,即等價(jià)于檢驗(yàn)
基于觀測(cè)數(shù)據(jù)
首先利用局部線性地理加權(quán)回歸方法對(duì)模型(7)進(jìn)行擬合。在式(4)中的Gauss核函數(shù)下,利用交叉確認(rèn)方法選擇窗寬參數(shù)h=76km,相應(yīng)系數(shù)顯著性檢驗(yàn)的檢驗(yàn)p-值分別為0.0435977,0.0494687和0.0457165。
對(duì)于給定的顯著性水平α=0.1,由于三個(gè) p-值均相對(duì)較小,因此可斷言模型中的三個(gè)系數(shù)函數(shù)在所研究區(qū)域內(nèi)均存在明顯的空間非平穩(wěn)性,即顯著變化。此外,系數(shù)函數(shù)和在各空間位置處的估計(jì)值用等值線的形式展示在圖4和圖5中。
圖4 模型(7)中系數(shù) 估計(jì)值的等值線圖(左為 ,右為
圖5 模型(7)中系數(shù)估計(jì)值的等值線圖(左為,右為
從圖4(左側(cè)圖)中可以看出,系數(shù) β1(u,v)(即截距項(xiàng))的估計(jì)值在北部和東北部地區(qū)相對(duì)較小,西南部及東部地區(qū)相對(duì)較大,這也反映了山東省人口分布的基本特點(diǎn)。由圖4(右側(cè)圖)中可知,人均糧食產(chǎn)量對(duì)人口數(shù)量的影響強(qiáng)度自西南向東北方向依次有所增加。
圖5(左側(cè)圖)說明人均GDP對(duì)人口數(shù)量的影響強(qiáng)度,呈現(xiàn)出幾個(gè)明顯的空間格局。具體來說,系數(shù)β3(u,v)的估計(jì)值在西部地區(qū)沿著西南向東北方向,東部邊界地區(qū)沿東南向東北方向均依次有所增加。此外,北部地區(qū),影響強(qiáng)度自南向北逐漸變大;南部地區(qū),影響強(qiáng)度自北向南逐漸變大。
圖5(右側(cè)圖)展示了系數(shù)函數(shù) β4(u,v)的估計(jì)值。從圖中可以看出,該值在全省范圍內(nèi)存在空間差異性。具體來說,全省除了菏澤地區(qū)及聊城-濟(jì)寧-棗莊的西部邊界地區(qū)外,該估計(jì)值自西南向東北方向依次有所增加。在聊城-濟(jì)寧-棗莊的西部邊界地區(qū),農(nóng)民的純收入對(duì)人口數(shù)量的影響相對(duì)較弱,往菏澤方向則有所增強(qiáng)。
本文考查了山東省人口總量的空間分布規(guī)律,并對(duì)影響人口分布的主要因素進(jìn)行了定量分析。具體來說,首先利用描述性統(tǒng)計(jì)分析方法與軟件的可視化技術(shù)揭示了人口數(shù)量的空間分布特征。其次,利用空間統(tǒng)計(jì)學(xué)中近年來發(fā)展起來的局部線性GWR模型探索與分析影響人口分布的主要因素,并考查其空間非平穩(wěn)性問題。分析結(jié)果表明人均糧食產(chǎn)量、人均GDP和農(nóng)民的人均純收入是影響該省人口分布的主要因素,這三個(gè)因素在全省范圍內(nèi)均呈現(xiàn)出顯著的空間非一致性。
[1]馮守平.中國(guó)人口增長(zhǎng)預(yù)測(cè)模型[J].安徽科技學(xué)院學(xué)報(bào),2008,(6).
[2]陳文權(quán),趙茲,李得勝.Leslie修正模型在人口預(yù)測(cè)中的應(yīng)用[J].世界科技研究與發(fā)展,2008,(2).
[3]薛臻.我國(guó)人口增長(zhǎng)預(yù)測(cè)數(shù)學(xué)模型[J].河南科技學(xué)院學(xué)報(bào)(自然科學(xué)版),2008,(1).
[4]張靜,王興華.利用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)人口數(shù)量[J].襄樊學(xué)院學(xué)報(bào),2001,(5).
[5]Hart J D.Nonparametric Smoothing and Lack-of-Fit Tests[M].New York:Springer,1997.
[6]沈永年,孔慶瑜.1980西安坐標(biāo)系快速高斯投影計(jì)算公式[J].冶金測(cè)繪,1994,(3).
[7]Lee Y,Mei C L,Zhang W.X.Statistical Tests for Spatial Non-Stationarity Based on The Geographically Weighted Regression Model[J].Environment and Planning A,2000,(32).