劉治成 肖東升
摘要:針對已有的人口空間化研究多采用靜態(tài)數(shù)據(jù)、時空分辨率較低、在應急救援等方面實用性不高的問題,提出了一種使用高時空分辨率數(shù)據(jù),結合城市圈層結構理論和主成分分析法的建筑物尺度人口估算方法。以成都市為例,利用騰訊位置大數(shù)據(jù),通過計算不同城市圈層的定位率,得到了成都市不同時段1 km×1 km的人口分布數(shù)據(jù)。在此基礎上,以基于建筑物中心點的泰森多邊形為人口分配基本單元,結合宜出行熱力數(shù)據(jù)和POI數(shù)據(jù),分別計算其對人口分布的貢獻值并賦予計算權值,得到了成都市青羊區(qū)建筑物尺度人口分布數(shù)據(jù)。街道尺度統(tǒng)計數(shù)據(jù)回歸分析的決定系數(shù)R2為0.926 4,總體精度較高,模擬人口分布符合實際情況。
關鍵詞:應急救援;主成分分析;人口分布;POI;建筑物
中圖分類號:P315.94?? 文獻標識碼:A?? 文章編號:1000-0666(2021)02-0251-11
0 引言
人口是自然災害最重要的承災體,人口分布數(shù)據(jù)是應急救援的關鍵支撐數(shù)據(jù)(郭建興等,2018)。人口分布與城市的經(jīng)濟發(fā)展、基礎設施建設以及生態(tài)環(huán)境保護等都有著緊密聯(lián)系(李國平,陳秀欣,2009)。目前,我國人口統(tǒng)計是以行政區(qū)劃逐級統(tǒng)計和匯總的,最低統(tǒng)計到鄉(xiāng)鎮(zhèn)街道一級,10年更新一次,不能滿足災害應急救援等方面的應用要求。探究城市內部更小尺度的人口空間分布是人口空間化研究的重點之一(李澤宇,董春,2019;賈召亮等,2020)。
隨著移動終端及GPS技術的高速發(fā)展,移動終端的位置服務進入了研究者的視野。例如王賢文等(2017)利用騰訊位置服務相關數(shù)據(jù)研究了京津冀地區(qū)在短期內的人口流動;潘碧麟等(2019)通過微博簽到數(shù)據(jù)研究了成渝之間的城際人口流動規(guī)律;吳中元等(2019)利用騰訊位置大數(shù)據(jù)對南京市江寧區(qū)秣陵街道進行了小區(qū)級別的人口數(shù)據(jù)預測;Sakaki等(2010)通過提取日本社交軟件用戶在分享信息的同時攜帶的位置信息,研究了地震對Twitter用戶時空行為造成的影響。
在災害應急救援中,災后第一時間的人口空間分布數(shù)據(jù)可幫助應急救援部門快速部署救援力量,為受災人員的救援贏得寶貴的時間(郭建興等,2018)。騰訊位置大數(shù)據(jù)可以實時記錄使用騰訊位置服務用戶的位置信息,空間分辨率為1 km,目前騰訊位置服務的使用量已突破日均500億人次,所以該數(shù)據(jù)在研究人口空間分布方面具有一定的代表性。該數(shù)據(jù)獲取簡單,可快速獲取災區(qū)震前1 km空間分辨率的使用騰訊位置大數(shù)據(jù)服務的人口空間分布,為救援力量的初步部署提供輔助數(shù)據(jù)。要更精確地鎖定可能受災人群的具體位置,縮小救援人員的搜救范圍,提高搜救效率,則需要分辨率更高的人口空間分布數(shù)據(jù)。宜出行熱力數(shù)據(jù)是騰訊地圖通過模擬計算出的人口密度等級,表達人口密度的相對大小,具有實時更新、實時獲取的特性,且該數(shù)據(jù)空間分辨率達到了27 m,可為更小尺度的人口空間化研究提供一定的參考。所以本文采用微信宜出行熱力數(shù)據(jù),結合POI興趣點數(shù)據(jù)對小范圍內建筑物尺度的人口空間化進行研究。
1 研究方法
1.1 基本原理
1.1.1 主成分分析
主成分分析(Principal Components Analysis,PCA)是通過將原始、復雜、多維的變量進行線性組合,構造互不相關的綜合變量,來降低變量維度的一種數(shù)據(jù)降維處理方法。數(shù)據(jù)經(jīng)主成分分析后可在降低數(shù)據(jù)維度的同時保持原始數(shù)據(jù)的大部分特征,減少數(shù)據(jù)的冗余程度,更利于進行后續(xù)處理(賈俊平,2008)。
設某數(shù)據(jù)集X存在n個樣本,每個樣本有m個變量,則該數(shù)據(jù)集的矩陣如下:
Xm×n=
x11x12…x1n
x21x22…x21
xm1xm2…xmn(1)
由于在實際問題中,矩陣的維度過大可能會導致后續(xù)處理復雜,耗時過久,通常需要對數(shù)據(jù)進行主成分分析以降低數(shù)據(jù)維度,其具體步驟為:為了消除由于數(shù)據(jù)量綱不同引起的誤差,對原始矩陣進行標準化處理,得到矩陣X*m×n;計算矩陣X*m×n的協(xié)方差矩陣;將X*m×n的協(xié)方差矩陣計算化為相關系數(shù)矩陣,公式為:
ρij=cov(xi,xj)σii σjj(2)
計算出特征值λ1,λ2,…,λm,λi≥0,i=1,2,…,m),并從小到大排列,得到相對應的正交單位化特征向量θ1,θ2,…,θm;計算得到各個主成分的貢獻率,公式為:
Pi=λi∑mi=1λi (i=1,2,…,m)(3)
則其累計貢獻率為:
Pi(sum)=∑mi=1Pi (i=1,2,…,m)(4)
主成分提取原則通常按累計貢獻率達到約80%以上,或主成分特征值大于1提取主成分。得到提取的主成分后,計算每個主成分的得分,公式為:
ωri=θ1X*r1+θ2X*r2,…,+θmX*rm(r=1,2,…,n)(5)
式中:i為主成分提取個數(shù)。
1.1.2 泰森多邊形
泰森多邊形最初是由荷蘭氣象學家Thiessen提出的用離散氣象站點數(shù)據(jù)計算平均降雨量的一種插值分析方法,由其基點周圍的鄰點的垂直平分線組成,具有多邊形內任意一點距多邊形控制點的距離小于到其他多邊形控制點距離的特點(閆慶武等,2011a)。
1.2 技術路線
本文首先通過騰訊位置大數(shù)據(jù)結合城市圈層結構理論得到了成都市全域1 km人口空間分布數(shù)據(jù),再結合宜出行熱力數(shù)據(jù)和建筑物分布數(shù)據(jù)將人口分配至建筑物中,最終得到了青羊區(qū)建筑物尺度人口分布數(shù)據(jù),具體技術路線如圖1所示。
2 研究區(qū)概況與數(shù)據(jù)
2.1 研究區(qū)概況
成都市位于四川盆地西部、青藏高原東緣,東北與德陽市相接、東南與資陽市相鄰、南與眉山市相連、西南與雅安市接壤、西北與阿壩藏族羌族自治州鄰接,地理位置處于(30°05′~31°26′N,102°54′~104°53′E)。成都市包括錦江區(qū)、青羊區(qū)、成華區(qū)、武侯區(qū)、金牛區(qū)、雙流區(qū)、龍泉驛區(qū)、新都區(qū)、郫都區(qū)、溫江區(qū)、青白江區(qū)11個市轄區(qū)和都江堰市、彭州市、崇州市、邛崍市、簡陽市5個縣級市以及新津縣、金堂縣、大邑縣、蒲江縣4個縣。
據(jù)成都市發(fā)布的2018年統(tǒng)計年鑒數(shù)據(jù),截至2018年年底成都市常住人口數(shù)為1 633萬,其中城鎮(zhèn)常住人口數(shù)1 194萬,常住人口城鎮(zhèn)化率達到了73.12%;截至2018年年底成都市戶籍人口數(shù)為1 478.1萬,其中城鎮(zhèn)戶籍人口數(shù)為901.6萬,戶籍人口城鎮(zhèn)化率達到了61%,在西部地區(qū)城市中達到了相當高的水平(成都市統(tǒng)計局,2019)。
成都市毗鄰龍門山地震帶,地震等自然災害多發(fā),2008年汶川地震造成成都市死亡4 156人,受傷17 802人。成都市作為西部地區(qū)人口最多的市級行政單位,對掌握高時空分辨率人口空間分布情況有現(xiàn)實需求,所以本文將成都市作為研究區(qū)。
2.2 數(shù)據(jù)來源及預處理
為了數(shù)據(jù)的統(tǒng)一,本文所獲取的具有位置信息的坐標系數(shù)據(jù)均采用WGS 1984坐標系,數(shù)據(jù)單位均為國際單位制標準單位。本文數(shù)據(jù)來源如下:
(1)2018年成都市人口統(tǒng)計數(shù)據(jù)來源于成都市及各個區(qū)(縣)的2018年統(tǒng)計年鑒。2018年成都市行政區(qū)劃圖來源于GADM網(wǎng)站https://gadm.org/index.html.。
(2)2019年3月11—15日騰訊位置大數(shù)據(jù)及宜出行熱力數(shù)據(jù)來自騰訊位置大數(shù)據(jù)官網(wǎng)https://heat.qq.com/.及微信宜出行官網(wǎng)http://c.easygo.qq.com.,騰訊位置大數(shù)據(jù)包括經(jīng)度、緯度、定位人數(shù)及定位時間;宜出行數(shù)據(jù)包括經(jīng)度、緯度、熱力值和采集時間,采集數(shù)據(jù)格式為Excel表格。將表格數(shù)據(jù)加載到ArcGIS 10.2中轉換得到矢量點數(shù)據(jù)。3月11—15日均為工作日,在研究成都市人口分布的普遍規(guī)律時較具代表性。
(3)成都市建筑物數(shù)據(jù)和POI數(shù)據(jù)在百度地圖開放平臺http://lbsyun.baidu.com/.申請開發(fā)秘鑰獲取,數(shù)據(jù)格式為Excel表格,在ArcGIS 10.2中轉換為矢量點數(shù)據(jù)并進行數(shù)據(jù)清洗,篩選出需要的數(shù)據(jù)。
(4)成都市遙感影像來自于Google地圖,數(shù)據(jù)為2018—2019年的衛(wèi)星影像拼接圖,分辨率為2 m。
3 大范圍人口數(shù)據(jù)空間化
人口數(shù)據(jù)空間化的基本思路是將人口統(tǒng)計數(shù)據(jù)與其他一些影響人口分布的數(shù)據(jù),如土地利用類型、建筑物空間分布等結合起來,建立多元回歸等模型,將人口統(tǒng)計數(shù)據(jù)分配在行政區(qū)劃、格網(wǎng)或其他尺度上(黃益修,2016)。目前已建立的人口空間化模型主要有核密度估計模型(閆慶武等,2011b;梁亞婷,2015)和多因素融合模型(裴惠娟等,2016;曹偉超等,2012)等。
3.1 研究方法
本文選取騰訊位置大數(shù)據(jù)作為變量,假設在1小時內,在該區(qū)域使用騰訊位置大數(shù)據(jù)服務的人不重復且分布較為均勻,則可通過某一區(qū)域的定位數(shù)量推算出該區(qū)域的定位率,通過定位率可以算出各計算單元的人數(shù),得到成都市的人口分布。
由于城市人口密度隨距城市中心的距離呈衰減趨勢(Clark,1951),按照城市圈層結構理論和各行政區(qū)人口、經(jīng)濟等原因,可將成都市分成3個圈層(陳藝,2019),第一圈為金牛區(qū)、成華區(qū)、錦江區(qū)、武侯區(qū)和青羊區(qū);第二圈為雙流區(qū)、龍泉驛區(qū)、青白江區(qū)、新都區(qū)、郫都區(qū)以及溫江區(qū);第三圈為簡陽市、金堂縣、彭州市、都江堰市、崇州市、大邑縣、邛崍市、浦江縣和新津縣。
考慮到后期驗證需使用人口統(tǒng)計數(shù)據(jù),所以選取每晚21—24時進行計算,因為在成都市春季的該時間段,人們大都處在居所(肖東升等,2016),人口分布情況與常住人口統(tǒng)計數(shù)據(jù)較為吻合,另外3個季節(jié)人員流動情況與春季類似,則分圈層計算每個圈層定位率的公式為:
lp(i)=tiRPi(6)
式中:lp為定位率;i為圈層數(shù);t為平均每小時定位次數(shù);RP為常住人口數(shù)。由各圈層的定位率計算各圈層中1 km分辨率格網(wǎng)中的人數(shù),計算公式為:
SPj=tjlp(i)=tjRPiTj(7)
式中:SPj為格網(wǎng)j中的模擬人數(shù);tj為格網(wǎng)j定位次數(shù)。
3.2 實驗過程及結果分析
2019年3月11—15日成都市騰訊位置大數(shù)據(jù)平均每小時定位量時序如圖2所示。從圖中可以看出,在0—5時定位量呈下降趨勢,大部分人都陸續(xù)進入睡眠狀態(tài),但依舊有100萬左右的定位次數(shù),原因可能為在夜晚手機未關機,軟件自動請求定位服務以及尚有一部分人沒有進入睡眠時間;5—13時定位量呈增加趨勢,人們陸續(xù)起床,準備或進入上班、上學狀態(tài),定位量在13時達到峰值,原因可能為午飯后手機使用量增多;13—15時定位量急劇下降,多數(shù)人進入到午休或準備上班;15—17時定位量基本處于平穩(wěn),多數(shù)人回到上班或上學狀態(tài);18時定位量增加,多數(shù)人在歸家途中,手機的使用率增加。19—22時定位量平穩(wěn),多數(shù)人在家中;22—24時定位量呈減少趨勢,
人們逐漸進入睡眠狀態(tài)。由上可知,定位量的變化基本和當?shù)鼐用竦纳钜?guī)律相符。
利用式(6)對上述定位量式進行計算,可得到各圈層定位率:第一圈層的定位率為22%,第二圈層定位率為21%,第三圈層定位率為8%。說明在經(jīng)濟越發(fā)達、人口越密集的地區(qū),騰訊位置大數(shù)據(jù)服務的使用率也越高,定位率也越高,符合實際情況。再通過式(2)計算出每個格網(wǎng)的人口值,結果如圖3所示。
從圖3可以看出成都市人口分布總體較為集中,其中人口密度最大的區(qū)域為成都市幾個中心城區(qū),從中心城區(qū)向外,人口密度呈逐漸下降的趨勢,在各個行政區(qū)的中心城區(qū)人口呈明顯的聚集現(xiàn)象,在非城區(qū)地帶,也存在一些人口密度稍大的區(qū)域,對比成都市衛(wèi)星影像來看,主要為鄉(xiāng)鎮(zhèn)的人口聚居區(qū)域,符合實際情況。
根據(jù)實驗結果統(tǒng)計成都市各個區(qū)(縣)柵格人口總值與常住人口數(shù),見表1。從表中可以得出在區(qū)(縣)級人口數(shù)據(jù)驗證下,本文的人口分布計算結果與實際結果的平均絕對誤差為90 392人,平均相對誤差為12.69%,準確度較高??傮w來說,計算結果中人口密度較大的區(qū)(縣)誤差小于人口密度較小的區(qū)(縣),其中絕對誤差最大的為郫都區(qū),因為該區(qū)中包含很多工廠,本文計算郫都區(qū)人口時包含了工廠的工人,而工人的平均年齡較低,智能手機使用率高,導致人口估算值偏高。人口估算值與各區(qū)(縣)常住人口統(tǒng)計數(shù)據(jù)回歸分析如圖4所示。
由圖4可看出,通過計算不同圈層的定位率得出的各區(qū)(縣)人口數(shù)與常住人口數(shù)偏差較小,其中線性回歸擬合直線的斜率為0.998 3,R2為0.919 9,說明該模型的計算結果總體精度較高。
據(jù)上述原理可得各時間段成都市人口分布情況,如圖5所示。
4 小范圍建筑物尺度人口空間化
在災害發(fā)生后,1 km空間分辨率的人口數(shù)據(jù)可幫助救援力量快速到達待救援區(qū)域,但是在進行更細致搜救時,則需要參考更高空間分辨率的人口分布數(shù)據(jù)。發(fā)生在城市的災害中,建筑物的結構損壞、倒塌,是造成人員傷亡的主要因素(李媛媛等,2015),所以建筑物尺度的人口空間分布對應急救援具有一定的現(xiàn)實意義。在已有的研究中(胡楊等,2020;董春等,2019;趙真等,2019),建筑物尺度的人口分布多是基于建筑物功能分類,將人口分配至居住建筑上。但是在實際情況中,建筑物功能往往不是單一的,人口并非只分布在居住建筑,所以在進行人口分配時,首先要判斷建筑物內是否有人口分布。
青羊區(qū)位于成都市中心地帶,面積67.78 km2,常住人口約85萬,是成都人口密度最大的區(qū)(縣)之一,城鎮(zhèn)化程度高,轄區(qū)內建筑類型豐富(成都市統(tǒng)計局,2019),非常適合進行建筑物尺度的人口空間化實驗。
4.1 研究方法
熱力數(shù)據(jù)表示周圍人口密度的相對大小,假設人口只分布在存在熱力值的范圍,則可以用熱力值區(qū)分建筑物是否需分配人口。由于建筑物損壞會影響該建筑物周圍人的安全,所以將建筑物內的人口和其周圍的人口均分配至該建筑物。本文采用以建筑物中心點為基準點建立泰森多邊形,使用泰森多邊形內的人口計入多邊形內的建筑的方法將人口全部歸算至建筑物中。由于在實際計算中可能會出現(xiàn)少數(shù)泰森多邊形內并沒有包含熱力數(shù)據(jù)點的情況,會造成少數(shù)存在人口的建筑沒有被分配到人口的問題。為了減少這類問題的影響,本文引入POI(Point of Interest)數(shù)據(jù)進行改善,相關研究表明,POI興趣點數(shù)據(jù)與人口分布數(shù)據(jù)存在顯著的相關性(邱歌,2019)。由于POI數(shù)據(jù)種類較多,為了減少變量之間的互相影響,需對POI數(shù)據(jù)進行主成分分析,降低數(shù)據(jù)維度。根據(jù)主成分的貢獻率可得到綜合主成分得分,即POI貢獻值:
SPOIj=P1∑ni=1λiPCA1+P2∑ni=1λiPCA2+…+Pn∑ni=1λiPCAn(8)
式(3)可簡化為:
SPOIj=∑ni=1(pi×PCAij)∑ni=1pi(9)
式中:SPOIj為第j個泰森多邊形的POI貢獻值;pi為第i個主成分的貢獻率;PCAij為第j個泰森多邊形的第i個主成分的計算值;n為提取的主成分個數(shù)。
通過對計算出的興趣點貢獻值與熱力值進行聯(lián)合計算,則可根據(jù)POI密度進行分區(qū),計算出每個泰森多邊形內的人口:
POPl=(a×SPOIl/SPOIk+b×TVl/TVk)×SPl(10)
式中:a、b為兩計算因子的權值,滿足a+b=1;POP為泰森多邊形內計算人口值;TV為宜出行熱力值;SP為前文基于騰訊位置大數(shù)據(jù)模擬的人口數(shù)據(jù);l為泰森多邊形序號;k為POI密度分區(qū)編號。由于POI多分布于街道兩側,為了減少POI對街道兩側人口過高估計,故在確定a、b取值時,令a
4.2 實驗過程
以宜出行數(shù)據(jù)點為中心建立30 m緩沖區(qū),取與宜出行緩沖區(qū)面有交集的建筑物作為研究時段有人員分布的建筑物,研究區(qū)局部建筑物分類如圖6所示。
因為在進行人口統(tǒng)計時多是對居住建筑進行統(tǒng)計,所以為了實驗的準確性,避免部分建筑物如公廁、崗亭、變壓器室等干擾實驗結果,通過將建筑物數(shù)據(jù)與衛(wèi)星影像疊加分析,發(fā)現(xiàn)城市中少數(shù)小于100 m2的建筑多為公廁、崗亭、變壓器室等非居住建筑及數(shù)據(jù)源采集誤差,所以將研究區(qū)內有人建筑物的面積閾值設置為100 m2,則按有人建筑物中心建立的泰森多邊形,如圖7所示。
如圖7所示,本文將基于有人建筑物中心點建立的泰森多邊形作為人口分配基礎單元,統(tǒng)計多邊形內的宜出行熱力值和POI總數(shù),作為人口分配的依據(jù)。根據(jù)百度地圖對POI數(shù)據(jù)的分類,在百度地圖開放平臺獲取了2019年成都市青羊區(qū)的11類與人類活動相關的興趣點數(shù)據(jù),對街道尺度上各類興趣點與人口進行相關性分析,結果見表2。
表2中酒店和金融與人口的相關性較低,故將其排除。為了減少變量之間的相關影響以及自變量個數(shù),對9類POI數(shù)據(jù)進行主成分分析,降低數(shù)據(jù)維度。首先對數(shù)據(jù)進行檢驗,結果見表3。表中KMO(Kaise-Meyer-Olkin,檢驗統(tǒng)計量)數(shù)值為0.648,Bartlett檢驗對應P值小于0.001,數(shù)據(jù)適合進行主成分分析,各變量的方差解釋率見表4。
按照特征根大于1的原則提取得到兩個主成分,其中主成分1的方差解釋率為70.57%,主成分2的方差解釋率為13.14%,累計方差解釋率達到84.09%,保留了大部分變量信息。提取的兩個主成分得分矩陣見表5。
從表5中可以得到各主成分的得分表達式,主成分1=0.136×運動健身+0.135×醫(yī)療+0.145×休閑娛樂+0.156×生活服務+0.141×美食-0.017×旅游景點+0.153×培訓機構+0.132×交通設施+0.123×房地產(chǎn);主成分2=-0.236×運動健身+0.022×醫(yī)療-0.069×休閑娛樂-0.032×生活服務-0.143×美食+0.740×旅游景點+0.095×培訓機構+0.305×交通設施+0.179×房地產(chǎn)。結合公式(9)可得到每個泰森多邊形的興趣點貢獻值為:
SPOIj=0.843×PCA1+0.157×PCA2(11)
在進行POI密度分區(qū)時,計算出文家街道、黃田壩街道、蘇坡街道、金沙街道、東坡街道、草堂街道、光華街道為低密度區(qū),平均POI密度為549個/km2;汪家拐街道、府南街道、新華西路街道、西御河街道、草市街街道、少城街道、太升路街道為高密度區(qū),平均POI密度為1 460個/km2。經(jīng)實驗,式(10)中的權值,當a=0.25,b=0.75時,結果較好,則每個泰森多邊形內的人口計算公式為:
Pl=(0.25×SPOIl/SPOIk+0.75×TVl/Tk)×SPl(12)
4.3 實驗結果及分析
按式(12)計算得到每個泰森多邊形的人口數(shù),并將其分配至對應的建筑物中,其結果(局部)如圖8所示。
圖8所示區(qū)域截自府南街道和光華街道,可以看到在21—24時,人口主要分布在居住建筑內,但是也有少部分人口分布在非居住建筑內,右下角區(qū)域人口稀少,該區(qū)域為金林半島小區(qū)以及杜甫草堂景區(qū)。金林半島小區(qū)為多為別墅和3層左右的小洋房,人口密度較低,實驗結果符合實際情況。
由于本文將所有種類的建筑參與人口分配,且將建筑物周圍的人口都歸算至建筑物內,單獨驗證某建筑物內的人口數(shù)與實驗所得人口數(shù)較為困難,且不準確,所以筆者在街道尺度上對實驗結果進行驗證,青羊區(qū)街道模擬人口數(shù)與常住人口統(tǒng)計數(shù)見表6。
從表6可以看出實驗模擬人口數(shù)與常住人口統(tǒng)計數(shù)基本一致,平均絕對誤差為0.845 3萬人,平均相對誤差為15.53%,實驗結果準確度較高。其中絕對誤差最大的街道為文家街道,實驗模擬人數(shù)較人口統(tǒng)計數(shù)少1.617 2萬人,絕對誤差最小的街道為蘇坡街道,誤差僅為0.043 9萬人。雖然實驗結果總體令人滿意,但是部分街道出現(xiàn)了較大誤差,分析原因可能為:
(1)本文計算的為21—24時的建筑物內人口平均分布情況,與驗證的常住人口統(tǒng)計數(shù)據(jù)可能會產(chǎn)生一定的差異。
(2)不同的街道,建筑物的類型各有差異,如部分街道主要為居住建筑,因為本文的研究時間段大部分人都已回到家中,所以該街道的人口誤差就相對較小;部分街道分布著大量商業(yè)建筑或工廠等,在夜晚商業(yè)建筑和工廠等對人口存在一定的吸引力,導致相應街道的誤差相對較大。
通過統(tǒng)計實驗得到的各街道建筑物人口數(shù)之和與各街道常住人口統(tǒng)計數(shù)進行線性回歸分析如圖9所示。從圖中可以看出,模擬結果與人口統(tǒng)計數(shù)的回歸線斜率為1.024 9,R2為0.926 4,實驗結果總體可靠性較高,能準確反映大部分建筑物在研究時段真實的人口分布情況。
5 結論
本文利用多日的騰訊位置大數(shù)據(jù),參考城市圈層結構理論,計算出成都市各區(qū)(縣)手機的定位率,通過定位率得到了不同時段成都市1 km空間分辨率的人口分布數(shù)據(jù),經(jīng)過精度驗證,其決定系數(shù)R2為0.919 9,總體精度較高?;谝训玫降? km空間分辨率成都市人口分布數(shù)據(jù),利用宜出行熱力數(shù)據(jù)和POI數(shù)據(jù)與人口的相關性,分別計算其對人口的貢獻率,實現(xiàn)了青羊區(qū)建筑物尺度的人口空間化,并得到了青羊區(qū)21—24時的建筑物尺度的人口空間分布數(shù)據(jù),在街道尺度的人口統(tǒng)計數(shù)據(jù)驗證下,其決定系數(shù)R2為0.926 4,總體結果可信度高。基于本文研究,得出以下結論:
(1)本文研究數(shù)據(jù)獲取簡單,時效性高,1 km空間分辨率下的人口分布估算方法簡單準確,可提高地震應急救援的效率。
(2)使用泰森多邊形作為人口分布的基本單元,可更準確地將建筑物周邊的人口分配至建筑物內。
(3)通過熱力數(shù)據(jù)范圍而非建筑物類型區(qū)分建筑物是否分配人口,可得到更符合研究時段實際人口分布情況。
雖然本文提出的人口空間化模型有較好的效果,但是也存在以下不足:
(1)在進行大范圍人口分布估算時,僅從定位數(shù)量因素考慮了定位率的問題,人口老齡化率、青少年率及城鎮(zhèn)化率等可能影響定位率的因素暫未加入計算。
(2)在建筑物尺度沒有到達實時人口分布的情況下的計算。
今后的研究中我們會參考更多影響因素進行分析,以達到高時空分辨率的建筑物尺度人口分布計算,為應急救援、城市建設等做出貢獻。
參考文獻:
曹偉超,陶和平,譚理,等.2012.基于多源空間數(shù)據(jù)的山區(qū)人口分布模擬[J].國土資源遙感,24(2):61-67.
陳藝.2009.成都城市經(jīng)濟圈的區(qū)域特征及其帶動效應[J].城市發(fā)展研究,16(5):13-17.
成都市統(tǒng)計局.2019.成都年鑒(2019)[M].成都:成都年鑒社.
董春,尹詩畫,張玉.2019.多智能體的城市精細尺度人口估算模型[J].測繪科學,44(8):113-119.
郭建興,姬建中,和朝霞,等.2018.面向地震應急的山區(qū)人口百米格網(wǎng)分布——以麟游縣為例[J].地震地磁觀測與研究,39(6):150-157.
胡楊,張小詠,肖迪.2020.基于手機大數(shù)據(jù)的城市建筑物人口時空估算[J].系統(tǒng)仿真學報,32(10):1814-1883.
黃益修.2016.基于夜間燈光遙感影像和社會感知數(shù)據(jù)的人口空間化研究[D].上海:華東師范大學.
賈俊平.2008.統(tǒng)計學(第三版)[M].北京:中國人民大學出版社.
賈召亮,鄭川,李袁欣,等.2020.面向地震應急的人口空間化方法研究——以云南省大理白族自治州為例[J].地震研究,43(4):751-758.
李國平,陳秀欣.2009.京津冀都市圈人口增長特征及其解釋[J].地理研究,28(1):191-202.
李媛媛,陳建國,張小樂,等.2015.基于建筑結構破壞的地震傷亡評估方法及應用[J].清華大學學報(自然科學版),55(7):803-807,814.
李澤宇,董春.2019.引入興趣點的地理加權人口空間分布模型研究——以天津市為例[J].遙感信息,34(2):113-117.
梁亞婷.2015.基于遙感和GIS的城市人口時空分布研究:以上海市靜安區(qū)為例[D].上海:上海師范大學.
潘碧麟,王江浩,葛詠,等.2019.基于微博簽到數(shù)據(jù)的成渝城市群空間結構及其城際人口流動研究[J].地球信息科學學報,21(1):68-76.
裴惠娟,周中紅,孫艷萍,等.2016.甘肅省人口空間分布特征分析[J].西北師范大學學報(自然科學版),52(5):95-100.
邱歌.2019.基于隨機森林模型的高精度人口數(shù)據(jù)空間化——以鄭州市區(qū)為例[D].內蒙古:內蒙古師范大學.
王賢文,王虹茵,李清純.2017.基于地理位置大數(shù)據(jù)的京津冀城市群短期人口流動研究[J].大連理工大學學報(社會科學版),38(2):105-113.
吳中元,許捍衛(wèi),胡鐘敏.2019.基于騰訊位置大數(shù)據(jù)的精細尺度人口空間化:以南京市江寧區(qū)秣陵街道為例[J].地理與地理信息科學,35(6):61-65.
肖東升,常鳴,蘇勇,等.2016.基于時空菱形的人員在室率評估方法[J].世界地震工程,32(1):43-49.
閆慶武,卞正富,王紅.2011a.利用泰森多邊形和格網(wǎng)平滑的人口密度空間化研究——以徐州市為例[J].武漢大學學報(信息科學版),36(8):987-990,1010-1011.
閆慶武,卞正富,張萍,等.2011b.基于居民點密度的人口密度空間化[J].地理與地理信息科學,27(5):95-98.
趙真,郭紅梅,張瑩,等.2019.基于天地圖高精度建筑物的四川寶興縣人口估算[J].地震研究,42(2):204-209.
Clark C.1951.Urban population densities[J].Journal of Royal Statistical Society,114(4):490-496.
Sakaki T,Okazaki M,Matsuo Y.2010.Earthquake shakes twitter users:real-time event detection by social sensors[C]//Proceedings of the 19th International Conference on World Wide Web.New York;ACM:851-860.
Research on Population Distribution with High Spatial Resolution Basedon Multi-source Information
LIU Zhicheng1,XIAO Dongsheng1,2
(1.School of Civil Engineering and Surveying and Mapping,Southwest Petroleum University,Chengdu 610500,Sichuan,China)
(2.Disaster Prevention and Emergency Research Center for Surveying,Mapping and Remote Sensing,Southwest Petroleum University,Chengdu 610500,Sichuan,China)
Abstract
The current spatialized data of population are normally static and of low resolution in time and space,and not so practical for emergency and rescue.To solve this problem,according to the theory of urban circle structure and principal component analysis,we proposed a method of estimating population on building-scale using high resolution data in time and space.Taking Chengdu City as an example,we calculated the location rate of different urban circles using the Tencent Location Big Data,and obtained the population distribution in the grid of 1 km×1 km of Chengdu in different periods of a day.Further,we used the Tyson Polygon based on the center of the building as the basic unit of population distribution,and calculated and weighted the contribution of the data from Tencent Easygo and the POI data from Baidu Map to the population distribution.In this way we obtained the distribution of population on building-scale in Qingyang District of Chengdu.R2,the coefficient of determination for the regression analysis of the street-scale statistics,is 0.926 4.Our results are more accurate and conform to the actual distribution of population in this area.
Keywords:emergency and rescue;principal component analysis;population distribution;POI;buildings
收稿日期:2020-11-03.
基金項目:國家自然基金(51774250)、四川省軟科學研究計劃項目(2019JDR0112)、工程結構安全評估與防災技術四川省青年科技創(chuàng)新研究團隊(2019JDTD0017)和西南石油大學測繪遙感地信青年科技創(chuàng)新團隊(2019CXTD07)聯(lián)合資助.
第一作者簡介:劉治成(1996-),碩士研究生,主要研究方向為地理信息工程.E-mail:2371944224@qq.com.
通訊作者簡介:肖東升(1974-),教授,主要研究方向為測繪科學與技術,城市防災減災應急和油氣遙感.E-mail:xiaodsxds@163.com.