許玲麗,顏梅春
(河海大學(xué)地球科學(xué)與工程學(xué)院,江蘇 南京 211100)
人口一直是城市發(fā)展的重要因素,精準(zhǔn)把握人口分布可為生態(tài)環(huán)境建設(shè)、社會(huì)經(jīng)濟(jì)政策制定和城市規(guī)劃提供重要參考[1]。目前傳統(tǒng)調(diào)查人口數(shù)據(jù)的方法效率低、周期長(zhǎng),調(diào)查結(jié)果時(shí)效性和空間性差[2]。隨著科技的發(fā)展,利用大數(shù)據(jù)和遙感技術(shù)探尋城市人口分布逐漸成為熱點(diǎn),分別考慮城市燈光亮度、土地利用類型、交通發(fā)達(dá)程度、城市建筑類型和布局等,或嘗試集成多因素建立相關(guān)模型來(lái)構(gòu)建人口估算模型[3-6]。在利用多源數(shù)據(jù)進(jìn)行精細(xì)尺度的人口模擬,信息的綜合利用及適應(yīng)的尺度和方法等方面都有諸多問(wèn)題亟待解決[2,7]。
夜間燈光數(shù)據(jù)能夠反映夜晚燈光強(qiáng)度、范圍、分布形狀,已經(jīng)廣泛應(yīng)用在城市建成區(qū)提取[8]、城市GDP模擬[9]、人口預(yù)估、經(jīng)濟(jì)發(fā)展[10]、城市景觀格局分析[11]等方面。如文獻(xiàn)[12]基于Landsat 8數(shù)據(jù)和夜間燈光數(shù)據(jù)DMSP/OLS,提取鬼城指數(shù)來(lái)構(gòu)建不同指數(shù)級(jí)別人口空間模型;文獻(xiàn)[5,13]利用土地分類數(shù)據(jù)和夜間燈光數(shù)據(jù)DMSP/OLS對(duì)人口空間化模型進(jìn)行優(yōu)化;文獻(xiàn)[14]在1996年率先提出對(duì)DMSP的夜間燈光數(shù)據(jù)與人口、GDP和耗電數(shù)據(jù)的空間關(guān)系進(jìn)行分析研究,得出燈光數(shù)據(jù)與人類活動(dòng)有著很強(qiáng)的相關(guān)性。與DMSP/OLS夜間燈光數(shù)據(jù)相比,新一代NPP/VIIRS燈光數(shù)據(jù)具有更高的時(shí)空分辨率,在城市人口、經(jīng)濟(jì)、社會(huì)生活中起著很大的作用[15-16]。但該數(shù)據(jù)獲取的時(shí)間偏晚,不能完全反映區(qū)域人口活動(dòng)狀況。因此,利用夜間燈光數(shù)據(jù)結(jié)合其他信息可以更客觀準(zhǔn)確地進(jìn)行城市人口估算模擬。
國(guó)內(nèi)外有許多基于夜間燈光遙感影像研究人口密度或人口分布的,多數(shù)是基于土地利用分類數(shù)據(jù)進(jìn)行估算;也有將夜間燈光數(shù)據(jù)與其他因素的因子結(jié)合分析的,但基本上都是基于區(qū)縣級(jí)以上尺度的研究,對(duì)于其內(nèi)部各區(qū)域的差異考慮較少。不同區(qū)域其開(kāi)發(fā)程度不同導(dǎo)致經(jīng)濟(jì)發(fā)展情況不同,人口分布狀況也不同,因此估算的模型也不同。如今是大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)媒體數(shù)據(jù)極其豐富,商貿(mào)、服務(wù)行業(yè)的數(shù)量和分布更是人口分布的側(cè)影,對(duì)人口估算有很重要的影響?;谝陨显?,本文研究擬從城市的3個(gè)尺度,即市級(jí)、市郊級(jí)和城市化度的層面,以南京市街道級(jí)行政區(qū)的人口密度和人口總量為基本單元對(duì)象,探討新一代NPP/VIIRS夜間燈光數(shù)據(jù)、IBI指數(shù)和POI數(shù)據(jù)在人口估算中的作用,以及其影響程度和模型,以拓展城市人口估算的廣度和深度。
南京市地處長(zhǎng)江三角洲地區(qū),是我國(guó)東部沿海經(jīng)濟(jì)帶與長(zhǎng)江經(jīng)濟(jì)帶戰(zhàn)略交匯的重要節(jié)點(diǎn)城市,轄玄武、秦淮、建鄴、鼓樓、雨花臺(tái)、棲霞、江寧、浦口、六合、溧水、高淳11個(gè)區(qū),共有83個(gè)街道、17個(gè)鎮(zhèn),全市行政區(qū)域面積6 587.02 km2,2016年末全市常住人口總量827萬(wàn)人,人口分布具有典型性。
數(shù)據(jù)包括:國(guó)家基礎(chǔ)地理信息中心的南京市行政邊界圖;南京市2010年人口普查數(shù)據(jù)(以街道為單元);2017年大眾點(diǎn)評(píng)網(wǎng)南京市共37 726個(gè)餐飲商家POI數(shù)據(jù)。
采用來(lái)自地理數(shù)據(jù)空間云的Landsat 8數(shù)據(jù)(2017.10),對(duì)Landsat 8影像進(jìn)行數(shù)據(jù)預(yù)處理(如大氣校正、輻射校正和GS(gram-schmidt pan sharpening)方法波段融合),得到15 m分辨率的多光譜數(shù)據(jù)作最大似然法分類(5類)以備輔助參考。利用NOAA官網(wǎng)的2017年NPP/VIIRS數(shù)據(jù)進(jìn)行噪聲濾除剔除異常值[17]。南京市的POI、土地利用和夜間燈光分布基本情況如圖1所示。
首先提取建筑用地IBI指數(shù),用IBI指數(shù)設(shè)置閾值劃分市郊,然后根據(jù)人口密度進(jìn)行城市化度分級(jí),最后利用不同數(shù)據(jù)源及組合分別進(jìn)行市級(jí)、市郊級(jí)和城市化度級(jí)3個(gè)層面尺度的多種關(guān)系模擬。具體過(guò)程如下。
城市的土地利用程度,尤其是城市建成區(qū)的建筑用地占比反映了人口聚集程度[5,13,18]。IBI指數(shù)是近些年廣泛使用的,用于提取城市建筑用地范圍[19-20]的建筑用地指數(shù),其計(jì)算方法參見(jiàn)文獻(xiàn)[20]。通過(guò)Landsat 8的OLI數(shù)據(jù)計(jì)算IBI指數(shù),水體值的范圍為0~0.5,植被為0.5~0.6,建成區(qū)為0.6~1。將提取的IBI指數(shù)柵格圖分別與南京市遙感影像圖、土地利用分類圖疊加,契合度好,表明IBI指數(shù)提取的城市建筑區(qū)精度較高,適用性強(qiáng),但無(wú)法區(qū)別建筑用地是城市還是鄉(xiāng)村[20],因此需要進(jìn)行后續(xù)處理。
區(qū)域開(kāi)發(fā)和發(fā)展通常是集中連片的,在IBI建筑用地圖像中,連片大面積區(qū)域?yàn)殚_(kāi)發(fā)程度高的城市市區(qū)范圍,碎小區(qū)域或呈點(diǎn)狀分布的區(qū)域?yàn)殚_(kāi)發(fā)、發(fā)展水平低的農(nóng)區(qū)或郊區(qū)范圍[20]。進(jìn)行市郊分級(jí),使用小面元過(guò)濾的方法:首先,將建筑用地IBI二值化;其次,運(yùn)用八鄰域算法進(jìn)行鄰域聚類,去除區(qū)域圖層中的碎小面積的斑點(diǎn)、斑塊,得到若干平滑獨(dú)立的小面元,即連通斑塊的像元數(shù);最后,采用ENVI中的過(guò)濾工具(Sieve Classes),設(shè)置過(guò)濾閾值范圍。南京市發(fā)展水平較高,開(kāi)發(fā)區(qū)域分布范圍廣,過(guò)濾面元的閾值設(shè)置較大才能得到較明顯的城市分級(jí),7001為建成區(qū)閾值,1001為郊區(qū)閾值。
由于市內(nèi)夜間燈光輻射值方差大,因此有必要對(duì)建成區(qū)進(jìn)行城市化度分級(jí)分析。人口密度是城市化程度的主要體現(xiàn),本文按照人口密度進(jìn)行城市化程度分級(jí)。結(jié)合文獻(xiàn)[21—22],對(duì)南京市100個(gè)鄉(xiāng)鎮(zhèn)、街道按照人口密度將其分為3個(gè)等級(jí),0~2000人/km2為第三等級(jí)低度城市化區(qū)、2000~10 000人/km2為第二等級(jí)中度城市化區(qū)、10 000 人/km2及以上為第一等級(jí)高度城市化區(qū)。低度城市化區(qū)主要分布于南京市周邊地區(qū),有大范圍的農(nóng)田,開(kāi)發(fā)較晚或未開(kāi)發(fā)。中度城市化區(qū)集中于居民區(qū),人口密度和燈光強(qiáng)度中等,不會(huì)有燈光值突增或極值的情況。高度城市化區(qū)在建成區(qū)核心范圍內(nèi),建筑組團(tuán)復(fù)雜,商業(yè)活動(dòng)點(diǎn)集中且遍布于居民區(qū),人口密度和燈光強(qiáng)度最大且燈光有疊加。
結(jié)合POI數(shù)據(jù)、IBI指數(shù)和NPP/VIIRS數(shù)據(jù)3個(gè)指標(biāo),與人口數(shù)據(jù)進(jìn)行單因素及多因素的線性、冪、指數(shù)和對(duì)數(shù)函數(shù)模擬,探求不同因素與人口總量和人口密度間的相關(guān)性,同種因素與人口總量和人口密度間不同函數(shù)關(guān)系的確定性系數(shù),構(gòu)建人口模擬模型POPi={IBIi,Ni,Pi},其中,i為街道,POP為人口總量,IBI為建筑指數(shù),N為燈光總值,P為餐飲商家數(shù)據(jù)。
統(tǒng)計(jì)不同因素的總值與人口總量、均值與人口密度關(guān)系,得到不同函數(shù)回歸模型確定性系數(shù)最佳的結(jié)果,見(jiàn)表1。
表1基于南京市數(shù)據(jù)的回歸分析統(tǒng)計(jì)(t表示總量,a表示密度或均值)
因素關(guān)系模型R2Pty=89.476x+473870.65POPIBIty=1.1115x+659100.06Nty=9.5153x+582150.21Pay=691.1x0.69350.87POPaIBIay=155.57e9.7158x0.81Nay=413.38e0.1032x0.77
由表1可見(jiàn),采用平均值進(jìn)行回歸分析得到的確定性系數(shù)R2普遍大于采用人口總數(shù)進(jìn)行回歸得到的R2,說(shuō)明各自變量的平均值或“密度”與人口密度的相關(guān)性更強(qiáng),因?yàn)槊芏雀荏w現(xiàn)資源分配和利用狀況,總量具有模糊性;從單因素來(lái)看,餐廳和商家數(shù)量最能體現(xiàn)人口數(shù)量和人口密度,因?yàn)槊褚允碁樘臁?duì)于變量是平均值(如餐廳商家分布密度)的,線性關(guān)系都不是最合適的,人口密度和POI指數(shù)是冪函數(shù),R2為0.87,與IBI指數(shù)和NPP/VIIRS均值是指數(shù)函數(shù),R2分別為0.81和0.77,因?yàn)樯鐣?huì)經(jīng)濟(jì)活動(dòng)具有競(jìng)爭(zhēng)、盲目、隨機(jī)性和不確定性。
結(jié)合IBI指數(shù)通過(guò)ENVI中的小面元過(guò)濾的方法,得到市區(qū)街道共80個(gè),郊區(qū)街道共20個(gè)。分別統(tǒng)計(jì)市區(qū)、郊區(qū)人口與燈光數(shù)據(jù),并計(jì)算不同區(qū)域夜間燈光數(shù)據(jù)的標(biāo)準(zhǔn)差,輔助分析不同區(qū)域內(nèi)的燈光值的差異,得到人口密度與燈光平均值的函數(shù)關(guān)系,如圖2所示。市區(qū)的指數(shù)函數(shù)模型最優(yōu),R2為0.7,郊區(qū)線性函數(shù)最優(yōu),R2為0.86。
由圖2可見(jiàn),建成區(qū)(市區(qū))在人口密度較小的區(qū)域分布緊湊,隨著人口密度增大,數(shù)據(jù)點(diǎn)開(kāi)始分散。郊區(qū)街道燈光標(biāo)準(zhǔn)差在1以下,該域內(nèi)燈光強(qiáng)度分布較均勻,除江心洲和長(zhǎng)蘆2個(gè)街道外,數(shù)據(jù)分布于回歸線兩側(cè),燈光亮度小且分布緊湊,線性回歸相關(guān)性系數(shù)高達(dá)0.86。郊區(qū)的人口密度(線性回歸)效果優(yōu)于建成區(qū)的人口密度(指數(shù)函數(shù)),主要由于建成區(qū)高樓林立,燈光疊加飽和,夜燈數(shù)據(jù)無(wú)法傳遞實(shí)際的燈光數(shù)量造成的。
分別對(duì)研究區(qū)內(nèi)各級(jí)城市化度的街道數(shù)據(jù)進(jìn)行模擬建模,選擇最優(yōu)的結(jié)果,見(jiàn)表2。
表2 基于人口密度分級(jí)數(shù)據(jù)的分析統(tǒng)計(jì)(t和a的含義同表1,數(shù)字表示等級(jí))
由表2可知,第一等級(jí)即高度城市化區(qū)域,各模型的確定性系數(shù)均在0.3左右,與人口數(shù)據(jù)的模擬效果都很差,原因是由燈光飽和、人口的高度集中和商業(yè)集聚效應(yīng)導(dǎo)致;第二等級(jí)即中度城市化區(qū)域內(nèi),基于總數(shù)據(jù)量的模擬效果更加顯著,各種模型的R2均在0.8以上,相關(guān)性非常強(qiáng),原因是城市居住區(qū)的人口和設(shè)施基本配套且均勻分布;第三等級(jí)即低度城市化區(qū)域內(nèi),基于總數(shù)據(jù)量的模擬效果都比較差,相較而言,基于平均值數(shù)據(jù)的回歸效果較好,相關(guān)性基本在0.5~0.65之間,因?yàn)槿丝诤彤a(chǎn)業(yè)都稀疏更容易造成空間上的不對(duì)等。其中,POI的密度對(duì)人口密度的響應(yīng)程度較高,相關(guān)性更強(qiáng),原因同前。
不同因素與人口的模型效果都有影響,故綜合建立三者與人口數(shù)量的多元關(guān)系模型,只有二級(jí)的人口密度綜合模型沒(méi)有通過(guò)0.001顯著性檢驗(yàn)。由表1、表2可知,二三級(jí)總數(shù)據(jù)、三級(jí)平均數(shù)據(jù)的多元線性回歸效果都在可接受范圍內(nèi),人口總數(shù)據(jù)在高度城市化街道的最佳對(duì)數(shù)模型的R2為0.49,中度的線性R2為0.91,低度的線性R2為0.78。說(shuō)明中度城市化的區(qū)域只利用單因素也可以較好地估算人口,多因素更好,高度城市化區(qū)域的人口模擬最復(fù)雜,仍然面臨困難。
城市中心人口密集,商業(yè)活動(dòng)頻繁,人口流動(dòng)量大,受影響因素較多,本文只分析夜燈數(shù)據(jù)、餐飲店鋪數(shù)據(jù)、建筑用地指數(shù)的相關(guān)性,未考慮其他主觀和不確定因素。人口統(tǒng)計(jì)數(shù)據(jù)是2010年的,與2017年的多源數(shù)據(jù)存在時(shí)間上的出入,但是城市、居住區(qū)變化很小,因此對(duì)市區(qū)、高度和中度城市化區(qū)域的結(jié)果和結(jié)論基本不受影響。
本文以遙感IBI指數(shù)、NPP/VIIRS數(shù)據(jù)和POI數(shù)據(jù)作為人口響應(yīng)變量,對(duì)南京市作一元線性、指數(shù)、對(duì)數(shù)、冪函數(shù)4個(gè)模型模擬,根據(jù)街道城市化分級(jí)、城市和郊區(qū)分層分析。結(jié)論如下:
(1) 市級(jí)。單因素回歸分析模型中,3個(gè)變量基于平均值的冪函數(shù)模型最佳,且POI>IBI>NPP/VIIRS。因此,適于建立餐廳商家分布密度數(shù)據(jù)冪函數(shù)一元回歸方程估算南京市人口密度。
(2) 城市化程度。中度城市化區(qū)域人口模擬效果最好,不同函數(shù)模型效果相近,且IBI指數(shù)最佳;城市化程度低的區(qū)域適合基于平均值數(shù)據(jù)的建模;城市化程度高的區(qū)域不適合作此分析。
(3) 綜合考慮多元線性回歸分析中的擬合優(yōu)度值、方差分析和顯著性,可以得到城市化程度高區(qū)域適合采用多元對(duì)數(shù)函數(shù)回歸模型估算人口密度;城市化程度中等區(qū)域適合采用模型的可選范圍較廣,不同函數(shù)的回歸模型都較適合,線性模型最佳;城市化程度較低的區(qū)域適合采用多元線性回歸模型。