——以京津冀地區(qū)為例"/>
金耀,李士成,倪永,楊楠
(1.中國地質(zhì)環(huán)境監(jiān)測院,北京 100081;2.中國地質(zhì)大學(武漢)公共管理學院,武漢 430074;3.中國環(huán)境監(jiān)測總站 國家環(huán)境保護環(huán)境監(jiān)測質(zhì)量控制重點實驗室,北京 100012)
人口空間分布形態(tài)可以刻畫人類活動的強度和范圍,是研究人地關(guān)系的重要指標,其廣泛應(yīng)用于區(qū)域規(guī)劃、資源配置、政府決策、災(zāi)害評估及生態(tài)保護等各個領(lǐng)域。掌握和研究人口信息數(shù)據(jù)可以為區(qū)域協(xié)同發(fā)展研究、總體規(guī)劃等工作提供科學支撐。傳統(tǒng)的人口數(shù)據(jù)主要來源于人口普查和年度人口統(tǒng)計年鑒數(shù)據(jù),通常以行政單元逐級匯總而來,存在分辨率低、更新周期長、空間粒度粗的問題。此外,在進行空間分析或與其他數(shù)據(jù)融合時,存在行政單元和自然單元邊界不一致、受行政界線變遷影響等問題[1-3]。人口數(shù)據(jù)格網(wǎng)化,是按照數(shù)學模型將基于行政區(qū)的人口數(shù)據(jù)分配到格網(wǎng)中,實現(xiàn)統(tǒng)計單元由行政單元向格網(wǎng)的轉(zhuǎn)換[4],能直觀、多尺度地表達人口的真實分布,是對統(tǒng)計數(shù)據(jù)的細化和補充,已經(jīng)成為人口空間分布研究信息獲取的主要手段之一。
人口格網(wǎng)化的研究歷史較早,可以追溯到1936年Wright[5]使用地形圖估算各類型居民點人口密度,將分區(qū)密度制圖理念引入人口空間分布研究中,這成為后期人口數(shù)據(jù)格網(wǎng)化的主要理論依據(jù)。此后,國外學者利用遙感數(shù)據(jù)、土地分類數(shù)據(jù)建立人口分布模型來研究人口格網(wǎng)化[6-11]。目前,國際上一些科研機構(gòu)已發(fā)布了全球人口空間化柵格數(shù)據(jù),如英國南安普頓大學發(fā)布的WorldPop世界人口密度數(shù)據(jù)以及哥倫比亞大學發(fā)布的GPW(gridded population of the world)人口數(shù)據(jù)。
國內(nèi)也有很多人口格網(wǎng)化方面的研究。早期的學者應(yīng)用面積權(quán)重模型進行人口數(shù)據(jù)格網(wǎng)化,如呂安民等[12]提出的面積內(nèi)插法和范一大等[13]提出的面積權(quán)重法,該類方法未考慮影響人口空間分布的環(huán)境因素。后來有些學者通過建立環(huán)境因子模型研究人口數(shù)據(jù)格網(wǎng)化,如文獻[14-15]基于地表覆蓋、河流及道路等環(huán)境因子進行人口格網(wǎng)化,該方法模型影響因子較多,不易確定各因子的權(quán)重系數(shù)。夜間燈光數(shù)據(jù)可以指示區(qū)域社會經(jīng)濟發(fā)展及人類活動,文獻[16-17]采用夜間燈光進行人口模擬,該方法雖參數(shù)少,但是在人口高密度的城市地區(qū)及人口低密度的鄉(xiāng)村地區(qū)誤差較大。因此,文獻[18-19]把地表覆蓋類型和DMSP/OLS夜間燈光數(shù)據(jù)結(jié)合進行人口格網(wǎng)化研究。隨著新一代夜間燈光數(shù)據(jù)NPP/VIIRS的應(yīng)用,很多學者開始采用NPP/VIIRS數(shù)據(jù)進行人口格網(wǎng)化研究[20-23],并取得了較好的模擬效果。胡云鋒等[24]對比了DMSP/OLS和NPP/VIIRS夜間燈光數(shù)據(jù)進行人口模擬,認為NPP/VIIRS夜間燈光數(shù)據(jù)更適用于人口數(shù)據(jù)空間化研究。
地形是影響人口分布的重要自然環(huán)境因素,當前基于地表覆蓋數(shù)據(jù)和夜間燈光的人口空間化研究,僅考慮了地表覆蓋和夜間燈光數(shù)據(jù)與人口數(shù)量的關(guān)系,而忽略了地形因素,這不利于研究范圍較大且地形復(fù)雜區(qū)域的人口空間化研究。基于夜間燈光和地表覆蓋的人口空間化模擬誤差容易出現(xiàn)在人口密度極低或極高區(qū)域,在人口密度差異較大的區(qū)域,影響人口分布的主導因子也存各異,使用統(tǒng)一的模型參數(shù)較難適配所有的地區(qū)。此外,在以往研究中,高分辨率的地表覆蓋數(shù)據(jù)會被重采樣為與低空間分辨率夜間燈光數(shù)據(jù)相同的空間分辨率,這會犧牲原始地表覆蓋數(shù)據(jù)的精度,因此,本文中嘗試在模擬過程中采用較高空間分辨率的輸入數(shù)據(jù)。鑒于此,本研究以地形復(fù)雜且人口空間分布異質(zhì)性較高的京津冀地區(qū)為例,引入地形和人口密度因子進行分區(qū)建模的思路,采用2017年度NPP/VIIRS夜間燈光數(shù)據(jù)及高分辨率的土地覆蓋數(shù)據(jù),與區(qū)縣級常住人口統(tǒng)計數(shù)據(jù)回歸建模,得到高精度的人口空間化數(shù)據(jù)。本文旨在完善在地形復(fù)雜且人口空間分布異質(zhì)性較高地區(qū)的人口空間化的方法,建立京津冀地區(qū)2017年度的精細化格網(wǎng)人口數(shù)據(jù)。
京津冀位于中國華北,包括北京、天津兩個直轄市和河北省全境,界于36°05′N~42°40′N,113°27′E~119°50′E之間,面積21.8×104km2。區(qū)域東臨渤海,西為太行山,北為燕山,地勢西北高、東南低,由西北向東南傾斜(圖1),兼有高原、山地、丘陵、平原、草原和海濱地貌類型,豐富的地貌類型使得該地區(qū)具有代表性。研究其人口空間化,可為其他地形復(fù)雜地區(qū)的人口空間化研究提供參考。
注:該圖基于自然資源部標準地圖服務(wù)下載的審圖號為GS(2019)3266號的標準地圖制作,底圖無修改。
此外,京津冀地區(qū)是華北地區(qū)重要的人口聚集地和區(qū)域中心,2018年該地區(qū)常住人口達11 270.1萬人,占全國總?cè)丝诘?.08%[25],區(qū)域平均人口密度達523人/km2。但是該區(qū)域人口分布不均衡,既有人口密集的國際化大都市,也有人口稀疏的海濱曬鹽場,這給人口格網(wǎng)化增加了難度。此外,人口分布的巨大差異對跨區(qū)域人口管理、資源協(xié)同配置及城市群產(chǎn)業(yè)布局提出了挑戰(zhàn),研究精細化的人口空間分布特征可為京津冀協(xié)同發(fā)展戰(zhàn)略決策提供基礎(chǔ)數(shù)據(jù)和技術(shù)支持。吳健生等[26]基于DMSP/OLS夜間燈光、土地覆蓋和其他因子數(shù)據(jù)建模模擬京津冀地區(qū)2010年人口數(shù)據(jù),模型涉及的參數(shù)因子較多,且確定各因子權(quán)重所采用的層次分析法與專家打分法比較復(fù)雜。王曉潔等[27]采用2000年DMSP/OLS夜間燈光結(jié)合2019年的手機定位趨勢來模擬京津冀地區(qū)2000年人口數(shù)據(jù),方法較新穎,但數(shù)據(jù)的時間一致性還有待商榷。此外,這兩項研究模擬的人口數(shù)據(jù)的年度較早,難以滿足當前人口精細化管理對數(shù)據(jù)的高時效性。因此,本文采用新一代NPP/VIIRS夜間燈光和土地覆蓋數(shù)據(jù),引入地形和人口密度因子分區(qū),利用逐步回歸模型來模擬京津冀地區(qū)2017年高精度人口格網(wǎng)數(shù)據(jù)。
1)NPP/VIIRS夜間燈光數(shù)據(jù)。NPP/VIIRS是新一代夜間燈光數(shù)據(jù),較DMSP/OLS夜間燈光數(shù)據(jù)具有更高的灰度級和空間分辨率。受到雜散光污染,數(shù)據(jù)在夏季像元值缺失嚴重,因此,本文采用了陳慕琳等[28]使用三次Hermite插值法校正的京津冀地區(qū)2017年NPP/VIIRS年平均夜間燈光數(shù)據(jù)。
2)地表覆蓋數(shù)據(jù)(land cover,LC)。本文使用的LC數(shù)據(jù)來自于清華大學發(fā)布的10 m分辨率全球地表覆蓋圖(FROM-GLC10)[29],時間為2017年,該數(shù)據(jù)集將地表覆蓋/覆被分為耕地、林地、草地、水域、不透水面等十個類別。
3)人口統(tǒng)計數(shù)據(jù)。本文使用的區(qū)縣和鄉(xiāng)鎮(zhèn)人口數(shù)據(jù)是常住人口統(tǒng)計數(shù)據(jù),區(qū)縣人口統(tǒng)計數(shù)據(jù)來自京津冀各統(tǒng)計局公布的統(tǒng)計年鑒數(shù)據(jù),鄉(xiāng)鎮(zhèn)人口數(shù)據(jù)來自《中國縣域統(tǒng)計年鑒(鄉(xiāng)鎮(zhèn)卷)-2018》[30]。
4)行政區(qū)邊界數(shù)據(jù)。本文所使用的行政邊界包括區(qū)縣和鄉(xiāng)鎮(zhèn)行政邊界,數(shù)據(jù)來源于國家地球系統(tǒng)科學數(shù)據(jù)中心[31-32](http://geodata.cn)。
5)地形數(shù)據(jù)。本文使用的地形數(shù)據(jù)是SRTM3(shuttle radar topography mission),空間分辨率為90 m,數(shù)據(jù)來源于中國科學院計算機網(wǎng)絡(luò)信息中心地理空間數(shù)據(jù)云平臺(http://www.gscloud.cn)。
6)WorldPop人口數(shù)據(jù)。本文使用的WorldPop人口數(shù)據(jù)是由英國南安普頓大學地理數(shù)據(jù)研究所發(fā)布的,時間為2017年,空間分辨率為3″(約100 m)和30″(約1 km)[33-34],數(shù)據(jù)來源于WorldPop網(wǎng)站(https://wopr.worldpop.org)。
本文采用的所有空間數(shù)據(jù)都轉(zhuǎn)化為Albers-equal-area投影,中央經(jīng)線為105°E,標準緯線為25°N和47°N。采用雙線性插值法將15″空間分辨率的NPP/VIIRS夜間燈光數(shù)據(jù)重采樣為10 m和100 m空間分辨率。采用眾數(shù)法將10 m空間分辨率的地表覆蓋數(shù)據(jù)重采樣為100 m。使用SRTM3地形數(shù)據(jù)生成地形起伏度(relief degree of land surface,RDLS),計算每個區(qū)縣的平均地形起伏度和平均海拔(height)。
區(qū)縣和鄉(xiāng)鎮(zhèn)行政邊界數(shù)據(jù)分別為2015年和2012年,通過對比參考民政部網(wǎng)站公布的行政區(qū)劃變更信息,把行政邊界數(shù)據(jù)調(diào)整更新到2017年。將人口統(tǒng)計信息與行政邊界數(shù)據(jù)關(guān)聯(lián),為每個行政區(qū)域賦值常住人口,并計算每個區(qū)縣的人口密度。
表1 數(shù)據(jù)來源及屬性
首先,分析研究區(qū)域縣級常住人口數(shù)量與各類地表覆蓋像元數(shù)、地表覆蓋夜間燈光指數(shù)總量及地形因子之間的相關(guān)性,為后期參數(shù)選擇及模型構(gòu)建提供依據(jù)。然后,利用地形因子和人口密度,對研究區(qū)進行分區(qū),再采用多源逐步回歸分析,建立各個分區(qū)區(qū)縣人口數(shù)量與地表覆蓋像元數(shù)量及夜間燈光指數(shù)總量的回歸模型。利用回歸模型估算格網(wǎng)人口數(shù)量,基于區(qū)縣人口統(tǒng)計數(shù)據(jù)對模擬結(jié)果進行校正。最后,對人口空間化模擬結(jié)果進行精度分析。詳細的人口空間化技術(shù)路線如圖2所示。
圖2 人口空間化技術(shù)路線
1)數(shù)據(jù)融合。土地覆蓋可定性地指示人口的空間分布范圍,如土地覆蓋中的不透水面主要為人造地表,是人類活動的主要場所,湖泊和河流等水域基本無人居住。夜間燈光數(shù)據(jù)是較綜合的指標,涵蓋了居民點、交通、社會經(jīng)濟等信息,燈光的強度可以指示人口數(shù)量的情況?;谕恋馗采w和夜間燈光數(shù)據(jù)進行建模,模型參數(shù)相對較少,易于構(gòu)建。但是在高人口密度地區(qū)燈光強度趨于飽和,且由于夜間燈光數(shù)據(jù)空間分辨率較大,無法識別出人口數(shù)量的差異。此外,土地覆蓋數(shù)據(jù)在分類的過程中會存在一定誤差,一些零散的人口聚集點可能無法識別。
因此,把高分辨率的土地覆蓋與夜間燈光數(shù)據(jù)進行融合,生成地表覆蓋夜間燈光指數(shù),不僅可以識別散落在耕地、林地及草地上的人口集聚點,還可以細化燈光強度飽和區(qū)的人口空間分布情況。土地覆蓋數(shù)據(jù)中的不透水面(impervious surface)與人口分布關(guān)系比較密切,耕地(cropland)、林地(forest)和草地(grassland)上會存在零散的人口分布點。因此,從土地覆蓋中提取這四類土地類型,并將NPP/VIIRS夜間燈光數(shù)據(jù)與其進行融合,生成耕地夜間燈光指數(shù)、林地夜間燈光指數(shù)、草地夜間燈光指數(shù)及不透水面夜間燈光指數(shù)四個數(shù)據(jù)。其表達如式(1)所示。
(1)
式中:M為參與構(gòu)建模型的土地類型個數(shù),這里取值為4;LLCj為第j種地表覆蓋類型上的夜光燈指數(shù);LCjk為第k個格網(wǎng)第j種地表覆蓋類型;Lightjk為第k個格網(wǎng)第j種地表覆蓋類型上的夜光燈指數(shù)。
2)基于地形和人口密度分區(qū)。在地形地貌復(fù)雜地區(qū),地形是人口分布不可忽略的影響因子,研究表明人口分布密度與海拔呈負相關(guān)[35],且人口分布向地形起伏度低的地區(qū)集中[36]。因此在構(gòu)建模型前,通過海拔和地形起伏度兩個地形因子把研究區(qū)劃分成了山地和平原區(qū),可以兼顧地形因子對人口的影響。此外,基于夜間燈光和地表覆蓋的人口空間化模擬誤差容易出現(xiàn)在人口密度極低或極高區(qū)域,因此,按照人口密度把研究區(qū)再分區(qū),可以確保分區(qū)構(gòu)建的模型在不同人口密度區(qū)內(nèi)達到最佳的擬合效果。
以區(qū)縣級常住人口數(shù)作為因變量,以區(qū)縣各地表覆蓋類型像元數(shù)(面積)和各地表覆蓋夜間燈光指數(shù)總量為自變量,建立逐步回歸分析模型,求解模擬參數(shù)。為了保證模型估算的人口數(shù)量為非負,在進行回歸分析時,剔除系數(shù)為負的變量,然后將剩余變量再次引入模型進行回歸,最終得到的模型所有自變量的回歸系數(shù)全為正。模型表達如式(2)所示。
(2)
式中:Pi為第i個縣級統(tǒng)計人口;M為參與構(gòu)建模型的土地類型個數(shù),這里取值為4;LCij、LLCij分別為第i個區(qū)縣第j種地表覆蓋類型上的像元總個數(shù)和夜間燈光指數(shù)總量;aj、bj為回歸系數(shù)。利用上述結(jié)果得到格網(wǎng)尺度人口,計算如式(3)所示。
(3)
式中:Pi k為第i個區(qū)縣內(nèi)第k個格網(wǎng)的模擬人口數(shù);LCijk、LLCijk分別為第i個區(qū)縣第k個格網(wǎng)第j種地表覆蓋類型上的像元數(shù)和夜光燈指數(shù)總量。
通過式(3)初步模擬各個格網(wǎng)的人口數(shù)量,采用區(qū)縣常住人口統(tǒng)計數(shù)據(jù)對初始模擬人口進行校正,確??h域尺度上匯總的模擬的人口數(shù)量與實際統(tǒng)計的人口數(shù)量保持一致。校正如式(4)所示。
(4)
式中:P′i k為第i個縣內(nèi)第k個格網(wǎng)上的最終模擬人口數(shù);Pi m為第i個縣內(nèi)第m個格網(wǎng)上的初始模擬人口數(shù);N為第i個區(qū)縣的格網(wǎng)個數(shù)。
對模擬的人口空間化結(jié)果采用鄉(xiāng)鎮(zhèn)級人口統(tǒng)計數(shù)據(jù)進行檢驗。本文選擇相關(guān)系數(shù)(R)、均方根誤差(root mean square error,RMSE)及平均相對誤差(mean relative error,MRE)三個指標來衡量模擬結(jié)果的精度。
通過相關(guān)性分析發(fā)現(xiàn)(表2),京津冀地區(qū)縣級常住人口數(shù)量與四類地表覆蓋類型的夜間燈光指數(shù)總量及不透水面像元數(shù)量五個因子顯著正相關(guān),與地形起伏度和海拔因子負相關(guān)。
表2 各區(qū)縣人口統(tǒng)計值與各要素之間的相關(guān)系數(shù)
地表覆蓋中的不透水面主要為人造地表,是人類活動的主要場所,與人口數(shù)量的相關(guān)性大于0.58,通過與夜間燈光數(shù)據(jù)融合,其相關(guān)性提升到了0.81以上。而地表覆蓋中的耕地、林地及草地的像元數(shù)與人口相關(guān)性較低,通過與夜間燈光指數(shù)融合,這三種地表覆蓋類型與人口數(shù)量的相關(guān)性大幅提升。
把平均海拔大于1 km或平均地形起伏度大于50 m的區(qū)縣劃分為山地區(qū),其他區(qū)縣劃為平原區(qū),再以平原區(qū)166個區(qū)縣人口密度的平均值833人/km2為閾值,把平原地區(qū)劃分為高和低密度人口區(qū)。通過地形和人口密度分區(qū),京津冀地區(qū)200個區(qū)縣劃分成了3個區(qū),其中34個區(qū)縣屬于山地區(qū)(人口密度差距不大,未按人口密度再分區(qū)),111個區(qū)縣屬于平原低密度人口區(qū),55個區(qū)縣屬于平原高密度人口區(qū)。分區(qū)結(jié)果如圖3所示。
注:該圖基于自然資源部標準地圖服務(wù)下載的審圖號為GS(2019)3266號的標準地圖制作,底圖無修改。
在進行人口格網(wǎng)化的過程中,為了探索分區(qū)建模及輸入數(shù)據(jù)的空間分辨率對人口模擬精度的影響。本文中采用了分區(qū)/不分區(qū)及輸入數(shù)據(jù)為10 m/100 m空間分辨率兩個因素,形成四組模擬方案進行人口格網(wǎng)化模擬對比。最終得到回歸方程參數(shù)如表3所示。
表3 模型回歸系數(shù)表
1)精度驗證及誤差分析。隨機選取京津冀地區(qū)140個鄉(xiāng)鎮(zhèn)街道作為驗證數(shù)據(jù),計算鄉(xiāng)鎮(zhèn)街道2017年常住人口統(tǒng)計數(shù)據(jù)與格網(wǎng)化人口數(shù)據(jù)的誤差。表4是各組方案模擬結(jié)果的對比。由表4可以看出,在其他因子不變情況下,分區(qū)模擬的效果要好于不分區(qū)模擬;入?yún)?shù)據(jù)空間分辨率100 m要優(yōu)于10 m。因此,最優(yōu)的模擬方案為在模擬時地表覆蓋數(shù)據(jù)和夜間燈光數(shù)據(jù)采樣為100 m分辨率進行分區(qū)模擬,模擬的人口數(shù)與鄉(xiāng)鎮(zhèn)人口統(tǒng)計數(shù)的相關(guān)系數(shù)達到了0.88,平均相對誤差為32.71%。通過與已有的同類研究進行對比發(fā)現(xiàn),文獻[24]基于NPP/VIIRS夜間燈光與LC數(shù)據(jù)的川渝地區(qū)人口空間化模擬結(jié)果的平均相對誤差為44.62%。這表明在模擬時,參考地形和人口密度因子分區(qū)可以提升基于LC和夜間燈光數(shù)據(jù)的人口空間化的模擬精度。
表4 各模擬方案人口空間化誤差統(tǒng)計表
對分區(qū)模擬的相對誤差做進一步的分級統(tǒng)計(圖4),可以看出人口空間化準確(MRE≤15%)的鄉(xiāng)鎮(zhèn)個數(shù)為42,占總鄉(xiāng)鎮(zhèn)數(shù)的30.00%;人口空間化較準確(15%
圖4 相對誤差分級統(tǒng)計表
2)與WorldPop數(shù)據(jù)對比。
(1)定量誤差。以200個區(qū)縣和140個鄉(xiāng)鎮(zhèn)的統(tǒng)計人口數(shù)據(jù)為檢驗標準,把模擬的最優(yōu)人口數(shù)據(jù)結(jié)果JJJPop(500 m空間分辨率)與WorldPop(1 km及100 m空間分辨率)進行比較,結(jié)果如表4所示。通過分析發(fā)現(xiàn):在整個區(qū)域和區(qū)縣層面,JJJPop精度遠優(yōu)于WorldPop;在鄉(xiāng)鎮(zhèn)層面,除了WorldPop(100 m)的MRE稍小于JJJPop之外,JJJPop其他精度都優(yōu)于WorldPop。這是由于本研究是基于區(qū)縣級別的人口統(tǒng)計數(shù)據(jù)進行的模擬,且在模擬過程中采用了區(qū)縣級人口校正,確保了模擬的人口結(jié)果在整個區(qū)域和區(qū)縣層面與統(tǒng)計人口基本一致,但在鄉(xiāng)鎮(zhèn)級別的人口模擬精度會衰減,而WorldPop(100 m)由于有較高的空間分辨率,在鄉(xiāng)鎮(zhèn)層面的人口統(tǒng)計稍有優(yōu)勢。
(2)區(qū)域?qū)Ρ?。選擇承德市及邯鄲市的JJJPop和WorldPop進行區(qū)域?qū)Ρ?圖5)。WorldPop數(shù)據(jù)在邯鄲市中心人口偏少,在承德市的雙灤區(qū)和鷹手營子礦區(qū)的人口分布偏少,這與實際情況不符,此外,WorldPop(100 m)在局部的人口空間化跳躍性較大。因此,JJJPop在承德市和邯鄲市的人口空間分布模擬更為合理。
圖5 JJJPop與WorldPop模擬對比
表5 兩種人口分布數(shù)據(jù)對比特征
圖6(a)是最終模擬的京津冀地區(qū)500 m格網(wǎng)人口數(shù)據(jù)。通過分析發(fā)現(xiàn),京津冀地區(qū)人口分布大體上呈現(xiàn)西北山地區(qū)域人口密度低,東南平原人口密度高。將模擬的格網(wǎng)人口數(shù)據(jù)與京津冀分區(qū)圖疊加分析發(fā)現(xiàn):區(qū)域10.25%的人口位于占區(qū)域總面積45.69%的山地區(qū),人口主要分布于山間地勢平坦的谷地。區(qū)域43.59%的人口位于占區(qū)域總面積44.13%的平原低密度人口區(qū),區(qū)域46.17%的人口聚集在占區(qū)域總面積10.18%的平原高密度人口區(qū)。平原區(qū)人口主要位于經(jīng)濟發(fā)達的區(qū)域中心城市及縣城駐地附近,高密度人口區(qū)主要位于地級市市轄區(qū)及交通干道附近。通過分析圖6(b)也可以得到京津冀人口分布的大體趨勢,但其詳細程度遠低于空間化的人口數(shù)據(jù),無法體現(xiàn)區(qū)縣內(nèi)部精細的人口分布特征。
注:該圖基于自然資源部標準地圖服務(wù)下載的審圖號為GS(2019)3266號的標準地圖制作,底圖無修改。
本研究針對區(qū)域地貌復(fù)雜且人口空間分布異質(zhì)性較高的京津冀地區(qū),融合地表覆蓋和NPP/VIIRS夜間燈光數(shù)據(jù),引入地形和人口密度因子分區(qū)建模來模擬人口格網(wǎng)化數(shù)據(jù),該方法提高了地形復(fù)雜且人口空間分布異質(zhì)性較高地區(qū)人口空間化的精度,獲得了京津冀地區(qū)2017年高精度的500 m格網(wǎng)人口數(shù)據(jù)。有以下結(jié)論。
1)分區(qū)模擬可以提升模擬結(jié)果的精度。在建立人口空間化回歸方程時,為了確保模擬人口不出現(xiàn)負值,方程的各項回歸系數(shù)都應(yīng)該為正數(shù)。地形因子與人口數(shù)量呈負相關(guān),在以往的人口格網(wǎng)化研究中,為了回歸方程系數(shù)的非負性,地形因子常被忽略?;诘匦我蜃影蜒芯繀^(qū)分為山地和平原區(qū),可兼顧地形因素對人口分布的影響。此外,按照人口密度分區(qū)建模,可以有效區(qū)分不同人口密度區(qū)的模型特征,實現(xiàn)區(qū)域最優(yōu)模擬,從而提高人口模擬精度。
2)NPP/VIIRS夜間燈光與地表覆蓋數(shù)據(jù)進行融合,可以有效提升地表覆蓋數(shù)據(jù)與人口分布之間的相關(guān)性。地表覆蓋分類數(shù)據(jù)在分類的過程中會存在一定誤差,一些零星的地表覆蓋類別可能無法識別。地表覆蓋分類數(shù)據(jù)與NPP/VIIRS夜間燈光數(shù)據(jù)融合后,可以識別出耕地、林地及草地上的人口集聚點,提升地表覆蓋數(shù)據(jù)與人口分布之間的相關(guān)性。
3)建模時將夜間燈光數(shù)據(jù)的空間分辨率重采樣為與地表覆蓋數(shù)據(jù)分辨率一樣的100 m,可以獲得較好的模擬效果。原始的10 m地表覆蓋數(shù)據(jù)雖然空間分辨率高,但由于原始地表覆蓋數(shù)據(jù)在生成過程中也存在一定誤差,與夜間燈光數(shù)據(jù)融合后會將這種誤差放大,從而影響最終的模擬精度。
4)本研究中模擬得到的京津冀500 m格網(wǎng)人口數(shù)據(jù),精度優(yōu)于WorldPop人口數(shù)據(jù),其相對于基于區(qū)縣統(tǒng)計人口密度數(shù)據(jù),可以展現(xiàn)更詳細的人口分布特征。京津冀地區(qū)人口分布大體上呈現(xiàn)西北山地區(qū)域人口密度低,東南平原人口密度高的特點。46.17%的人口聚集在占區(qū)域面積10.18%的地區(qū),主要位于地級市市轄區(qū)及交通干道附近。