于婷婷
(遼寧師范大學(xué)地理科學(xué)學(xué)院,遼寧 大連116000)
人口數(shù)據(jù)空間化可以獲取不同空間尺度上的人口空間分布信息,是實(shí)現(xiàn)人口與社會(huì)經(jīng)濟(jì)、資源、環(huán)境耦合的重要途徑之一,對(duì)國(guó)家制定宏觀決策,提高綜合管理能力具有重要意義[1]。
人口空間化的方法和技術(shù)研究一直是研究熱點(diǎn),主要方法有空間插值法、多源數(shù)據(jù)融合法和影響因子分析法等[2]。大量研究表明夜間燈光數(shù)據(jù)與人口分布之間存在顯著關(guān)系,現(xiàn)有夜間燈光數(shù)據(jù)有DMSP/OLS、NPP/VIIRS 和珞珈一號(hào)[3],鄒雅婧[4]等基于NPP/VIIRS 和珞珈一號(hào)兩種夜間燈光數(shù)據(jù)與人口數(shù)據(jù)進(jìn)行SLM建模,結(jié)果證明珞珈一號(hào)數(shù)據(jù)在人口空間化研究中具有更高的精度;李欣欣[5]等使用土地利用和夜間燈光數(shù)據(jù)分別建立人口空間化模型。大量學(xué)者運(yùn)用夜間燈光數(shù)據(jù)模擬人口空間化,但方法不盡相同。王釗[6]等采用SLM模型進(jìn)行人口空間化建模,王珂靖[7]等采用GWR 模型結(jié)合土地利用數(shù)據(jù)進(jìn)行人口空間化建模,結(jié)果表明人口空間化精度與建模方法和格網(wǎng)尺度大小密切相關(guān)。目前基于珞珈一號(hào)的人口空間化模擬較少,且尚無(wú)空間滯后模型和地理加權(quán)回歸模型應(yīng)用于人口空間化方面的比較研究。
本文選取大連市甘井子區(qū)為研究區(qū)域,基于珞珈一號(hào)夜間燈光數(shù)據(jù)、土地利用數(shù)據(jù)數(shù)據(jù)以及人口數(shù)據(jù),建立研究區(qū)200m×200m 格網(wǎng),采用SLM和GWR 模型分別進(jìn)行人口空間化建模,并對(duì)其結(jié)果進(jìn)行精度評(píng)價(jià)和分析,為大連是甘井子區(qū)人口與區(qū)域政策等相關(guān)研究提供參考,為人口空間化相關(guān)研究提供參考。
甘井子區(qū),隸屬于遼寧省大連市,位于大連市西部和西北部,東、南臨黃海,北瀕渤海,與金州區(qū)、沙河口區(qū)和旅順口區(qū)毗鄰,總面積502km2。2018 年,甘井子區(qū)下轄16 個(gè)街道,戶(hù)籍人口79.8338 萬(wàn)人。甘井子區(qū)屬大連市市內(nèi)四區(qū)之一,位于城鄉(xiāng)結(jié)合處,是大連市城市的擴(kuò)展的重要區(qū)域,特殊的地理位置使得大連市甘井子區(qū)擁有良好的發(fā)展要素。
2018 年土地利用數(shù)據(jù)來(lái)自中科院地理科學(xué)與資源研究所的資源環(huán)境科學(xué)與數(shù)據(jù)中心。人口數(shù)據(jù)來(lái)采用2018 年LandScan 全球人口動(dòng)態(tài)統(tǒng)計(jì)分析數(shù)據(jù)庫(kù)。夜間燈光數(shù)據(jù)采用2019 年珞珈一號(hào)星夜間燈光數(shù)據(jù),來(lái)源于高分辨率對(duì)地觀測(cè)系統(tǒng)湖北數(shù)據(jù)與應(yīng)用中心,空間分辨率130 m,但其在傳輸過(guò)程中會(huì)存在數(shù)據(jù)輻射失真現(xiàn)象,因此需要進(jìn)行輻射校正,輻射校正后DN 值范圍為[0,82.9728]。
建立研究區(qū)域200m×200m 格網(wǎng),將輻射校正后的DN 值和人口密度數(shù)據(jù)重采樣到200m×200m 格網(wǎng)內(nèi),并統(tǒng)計(jì)每個(gè)格網(wǎng)內(nèi)各類(lèi)土地利用類(lèi)型面積, 以上數(shù)據(jù)均投影為WGS84-UTM-51N 坐標(biāo)系。
空間滯后回歸(Spatial Lag Model,SLM)可以考慮人口數(shù)據(jù)的空間相關(guān)性,模型的一般形式如下:
其中,POPi為因變量,指第i 個(gè)格網(wǎng)的人口數(shù)量;W 為空間權(quán)重矩陣;DNi為因變量,指第i 個(gè)格網(wǎng)的DN 值;ρ 為空間滯后變量WPOPi的回歸系數(shù),以此確定人口分布的空間效應(yīng);β 為因變量的系數(shù);ε 為白噪聲。
地理加權(quán)回歸(Geographic Weighted Regression,GWR)將地理位置加入到數(shù)據(jù)的回歸參數(shù)之中。模型結(jié)構(gòu)如下:
其中,(ui,vi)為第i 個(gè)格網(wǎng)的地理中心坐標(biāo);β0(ui,vi)是第i 個(gè)自變量回歸的常數(shù)項(xiàng);βj(ui,vi)為第i 個(gè)自變量的第j 個(gè)回歸參數(shù);xij為第i 個(gè)因變量空間上的第j 個(gè)變量;j 為因變量參與回歸的輔助數(shù)據(jù)個(gè)數(shù);εi為誤差項(xiàng)。
通過(guò)計(jì)算得到甘井子區(qū)人口數(shù)據(jù)的Moran's 指數(shù)為0.96,為空間正相關(guān)。運(yùn)用SPSS 軟件分析得到人口數(shù)據(jù)與DN 值和土地利用中的居民用地面積成顯著相關(guān)(p>0.01)。
運(yùn)用公式(1)、(2),以人口數(shù)據(jù)作為因變量,輻射正后DN 值和居民用地面積作為自變量,進(jìn)行SLM和GWR 建模得到模型擬合度R2分別為達(dá)0.95 和0.67,模型和各自變量系數(shù)的統(tǒng)計(jì)檢驗(yàn)都達(dá)到了顯著水平,結(jié)果如表1、圖1、2 所示。
表1 空間滯后回歸系數(shù)表
圖1 基于空間滯后回歸模型的人口空間化
圖2 基于地理加權(quán)回歸模型的人口空間化
將兩種模型對(duì)比來(lái)說(shuō),SLM以空間自相關(guān)為前提,但實(shí)際上是一種全局空間回歸模型,模型中各格網(wǎng)系數(shù)仍相同,不能突出人口異質(zhì)性。GWR 是典型的局部模型,回歸系數(shù)隨著變量的空間位置的變化而變化,因此GWR 模型可以更好的考慮居民用地對(duì)人口空間分布的影響,與實(shí)際更相符。對(duì)人口空間化的數(shù)據(jù)進(jìn)行整理并根據(jù)公式(3)計(jì)算得到,基于SLM和GWR 模型構(gòu)建的模型絕對(duì)誤差為9.2%和12.5%,兩種模型的精度都較高。
人口空間化結(jié)果中,南關(guān)嶺街道、中華路街道、泡崖街道、興華街道、椒金山街道、甘井子街道、周水子街道和機(jī)場(chǎng)前街道人口密度較大,位于城市中心區(qū)域及中心邊緣區(qū)域,交通便利城市發(fā)展較好,因此居民點(diǎn)較多人口密度較大;泉水街道、大連灣街道西部、革鎮(zhèn)堡街道南部、辛寨子街道東部,紅旗街道東部以及凌水街道東部及北部人口數(shù)量相對(duì)居中,該區(qū)域主要為城鄉(xiāng)結(jié)合處,其中凌水街道為國(guó)家級(jí)高新技術(shù)產(chǎn)業(yè)開(kāi)發(fā)區(qū),吸引大量人才和投資創(chuàng)業(yè)者,發(fā)展較迅速;其他地方多為生態(tài)保護(hù)區(qū)和農(nóng)村,因此人口數(shù)量較少。
人口空間分布受自然、社會(huì)經(jīng)濟(jì)等因素的影響,大部分學(xué)者都在大尺度下進(jìn)行人口空間化建模,本文選用200m×200m 格網(wǎng)的小尺度人口空間化建模,且運(yùn)用兩種建模方式比較小尺度下兩種建模方式的精度并分析其原因。另外,夜間燈光輻射率和人口數(shù)據(jù)關(guān)系往往只是在局部范圍內(nèi)呈線性相關(guān),人口空間分布還受多種因素影響,因而在探究人口空間化的方法和技術(shù)中還需要進(jìn)一步優(yōu)化。