張文佳 李春江 羅雪瑤 柴彥威 ZHANG Wenjia,LI Chunjiang,LUO Xueyao,CHAI Yanwei
近年來,隨著新型城鎮(zhèn)化的推進(jìn)以及城市規(guī)劃和城市發(fā)展觀念的轉(zhuǎn)變,“以人為本”、重視居民需求和生活質(zhì)量的社區(qū)生活圈規(guī)劃得到學(xué)術(shù)界和規(guī)劃界的關(guān)注。社區(qū)生活圈規(guī)劃研究以居民在社區(qū)及附近的日常生活供需匹配作為研究對象,是時空行為研究在社區(qū)規(guī)劃領(lǐng)域的創(chuàng)新性應(yīng)用。然而,目前關(guān)于社區(qū)生活圈的研究仍然是傳統(tǒng)居住區(qū)公共服務(wù)設(shè)施配置研究的延續(xù),對于社區(qū)生活圈內(nèi)的居民需求和居民時空行為關(guān)注不足??偟膩碚f,社區(qū)生活圈規(guī)劃研究在概念界定、范圍劃定、職能歸屬、規(guī)劃方法和實施模式等方面仍處于討論和探索階段,亟需大量研究關(guān)注[1]。
在社區(qū)生活圈規(guī)劃研究所面臨的諸多問題中,傳統(tǒng)的數(shù)據(jù)分析方法無法適應(yīng)時空行為日益復(fù)雜、行為軌跡數(shù)據(jù)日益豐富的需要,有必要引入新方法來挖掘行為需求,理解時空行為模式,并指導(dǎo)規(guī)劃編制。其中,機器學(xué)習(xí)算法結(jié)合了統(tǒng)計學(xué)和計算機科學(xué)的優(yōu)勢,其監(jiān)督學(xué)習(xí)(supervised learning)與無監(jiān)督學(xué)習(xí)(unsupervised learning)算法已被廣泛應(yīng)用于時空大數(shù)據(jù)特征挖掘分析,如分類、聚類、異常值分析、模式識別、因果推斷、決策預(yù)測等。因此,以機器學(xué)習(xí)算法為基礎(chǔ)的分析框架可以更為精準(zhǔn)、高效地挖掘社區(qū)生活圈中居民的時空行為模式,實現(xiàn)不同社區(qū)行為模式的遷移,為社區(qū)生活圈規(guī)劃提供指導(dǎo)。
本文將系統(tǒng)梳理現(xiàn)有機器學(xué)習(xí)在時空行為預(yù)測、模式挖掘和行為與環(huán)境非線性關(guān)系等方面研究的前沿進(jìn)展,以及社區(qū)生活圈規(guī)劃研究面臨的難點與挑戰(zhàn);然后,結(jié)合社區(qū)生活圈規(guī)劃研究的難點與機器學(xué)習(xí)技術(shù)的最新進(jìn)展,提出機器學(xué)習(xí)方法在城市社區(qū)生活圈規(guī)劃研究中的應(yīng)用框架;最后,以“基于時空行為需求預(yù)測的社區(qū)生活圈劃分方法”和“基于非線性閾值效應(yīng)的社區(qū)生活圈設(shè)施配置規(guī)劃”兩個研究案例,對機器學(xué)習(xí)方法在社區(qū)生活圈物質(zhì)空間規(guī)劃研究中的應(yīng)用進(jìn)行闡釋。
既有研究在社區(qū)生活圈概念和內(nèi)涵界定、范圍劃分方法與設(shè)施評價和優(yōu)化等方面取得了一定的成果,但是在社區(qū)生活圈規(guī)劃研究的理論、技術(shù)方法和實證上仍面臨諸多挑戰(zhàn)。
現(xiàn)有研究對于社區(qū)生活圈概念的認(rèn)識基本一致,可以概括為居民在社區(qū)周邊日常生活所涉及的空間范圍以及滿足其日常生活需求的時空資源的集合[2]。社區(qū)生活圈的內(nèi)涵逐漸從單一的物質(zhì)空間走向物質(zhì)空間與行為空間、社會空間的融合[3];社區(qū)生活圈規(guī)劃不僅包括公共服務(wù)設(shè)施配置的優(yōu)化,還包括社會空間和社會治理的提升[4]。在新型冠狀病毒肺炎(以下簡稱“新冠肺炎”)疫情背景下,最新研究也將防災(zāi)減災(zāi)、健康、安全等要素融入社區(qū)生活圈,以提升社區(qū)生活圈規(guī)劃韌性和應(yīng)對突發(fā)公共安全事件的應(yīng)急能力[5],[6]106。不過,已有研究以理論探討為主,尤其在將社會空間、安全空間融入社區(qū)生活圈方面仍然缺乏具體的實證研究支撐。
社區(qū)生活圈空間范圍的劃分方法也是近期研究的重點和規(guī)劃的技術(shù)難點與前置條件。大多數(shù)研究和規(guī)劃將社區(qū)生活圈的空間范圍等同于居民步行的可達(dá)范圍,并綜合考慮人口規(guī)模、用地面積和行政管理邊界等要素劃分社區(qū)生活圈邊界[7],[8]1703,[9];也有學(xué)者通過識別設(shè)施完備性和計算設(shè)施密度進(jìn)行劃分[10-11]。然而這類基于空間和設(shè)施的方法未能將居民日常生活考慮在內(nèi),背離了社區(qū)生活圈概念。近期,部分研究基于個體行為調(diào)查數(shù)據(jù)或手機信令大數(shù)據(jù),通過識別生活空間、分析居民行為需求來劃分生活圈[12],[13]3,[14]。此類方法能較好地滿足社區(qū)生活圈“因地制宜”、響應(yīng)居民需求的基本要求,但也存在數(shù)據(jù)獲取成本高的問題。
最后,公共服務(wù)設(shè)施是社區(qū)生活圈的核心與基本出發(fā)點,已有研究在指標(biāo)優(yōu)化、可達(dá)性分析、規(guī)劃布局、特殊人群等方面積累了較多成果。相關(guān)研究主題包括新版《城市居住區(qū)規(guī)劃設(shè)計標(biāo)準(zhǔn)》設(shè)施配置指標(biāo)評價和優(yōu)化[15]33,社區(qū)生活圈體系與設(shè)施配置要求[16],生活圈設(shè)施供給與居民差異化需求之間的匹配關(guān)系分析、評價與規(guī)劃應(yīng)對策略[8]1708,[17-19],不同人群對各類設(shè)施的步行可達(dá)性計算和評價[20-21],以及基于老年人群步行能力和特殊需求分析的社區(qū)生活圈設(shè)施布局與配置建議[22-23]等??傮w上,社區(qū)生活圈公共服務(wù)設(shè)施評價和優(yōu)化的相關(guān)研究較多,但對設(shè)施和居民之間復(fù)雜的非線性關(guān)系認(rèn)識不足,同時在設(shè)施調(diào)整建議方面缺乏對“量”的考慮,而更多是“少”和“多”的基本判斷。
綜上所述,雖然目前關(guān)于社區(qū)生活圈的研究取得了一定的成果,但已有研究在概念內(nèi)涵、劃分方法和公共服務(wù)設(shè)施評價與優(yōu)化上仍然存在不足,在理論、方法和實證上仍然面臨挑戰(zhàn)[24]。首先,近期研究開始意識到社區(qū)生活圈不僅包含物質(zhì)空間層面,還包括社區(qū)交往生活圈和社區(qū)安全生活圈,但仍然缺乏與之相關(guān)的理論框架,以及與之相關(guān)的實證研究。其次,關(guān)于社區(qū)生活圈劃分方法,以及與之相關(guān)的時空行為調(diào)查、分析和預(yù)測技術(shù)還需進(jìn)一步探索。最后,在公共服務(wù)設(shè)施評價和優(yōu)化方面,已有研究對設(shè)施和居民之間的非線性關(guān)系關(guān)注不足,難以提供設(shè)施量的優(yōu)化建議。
精細(xì)化、動態(tài)化的社區(qū)生活圈規(guī)劃研究依賴于基于居民個體時空行為數(shù)據(jù)的采集、分析、模擬、評估和預(yù)測。隨著個體行為數(shù)據(jù)收集的時空間粒度越來越精細(xì),獲得海量個體數(shù)據(jù)的成本越來越低(如手機信令、浮動車GPS數(shù)據(jù)等),傳統(tǒng)的針對個體時空行為的計量分析方法面臨的挑戰(zhàn)越來越大,難以適應(yīng)精細(xì)化生活圈規(guī)劃研究的分析使用。因此,生活圈時空行為需求的精細(xì)化研究需要能夠高效快速地分析時空行為大數(shù)據(jù)的機器學(xué)習(xí)方法。而當(dāng)前機器學(xué)習(xí)算法輔助下的時空行為研究已經(jīng)在個體出行行為的決策預(yù)測、個體與群體行為模式挖掘以及個體行為與建成環(huán)境關(guān)系分析等方面取得一定進(jìn)展。
1.2.1 個體出行行為的決策預(yù)測
機器學(xué)習(xí)算法已被應(yīng)用于個體出行行為的決策規(guī)律與預(yù)測研究上[25]。其中,一類研究集中在個體時空行為需求的預(yù)測分析上。這類研究可以歸納為分類決策問題,例如個體在不同時空間環(huán)境下是否會使用某類設(shè)施、選擇何種交通方式出行。傳統(tǒng)分析多構(gòu)建離散選擇模型(Discrete Choice Model,DCM)展開研究[26]。而近年的研究開始使用神經(jīng)網(wǎng)絡(luò)算法(Neural Network Algorithm,NNA)[27-28]、基于決策樹的集成學(xué)習(xí)算法(Ensemble Learning Algorithm,ELA)[29-30]、支持向量機(Support Vector Machine,SVM)[31]等機器學(xué)習(xí)方法。研究發(fā)現(xiàn),機器學(xué)習(xí)方法打破了以往經(jīng)典回歸的線性假設(shè),預(yù)測精度有很大提升,同時可以快速高效地處理大數(shù)據(jù)[32-34]。此外,也有研究對個體出行目的地進(jìn)行識別和預(yù)測,例如使用貝葉斯分類器(Bayes Classifier)、隱馬爾科夫模型(Hidden Markov Model,HMM)、基于自助法(Bootstrapped Decision Tree,BDT)和剪枝法(Decision Tree with Pruning,DTP)的決策樹進(jìn)階算法等,對不同出行方式的出行目的地選擇或下一個目的地進(jìn)行預(yù)測[35-39]。
1.2.2 個體與群體行為的模式挖掘
機器學(xué)習(xí)算法還被廣泛應(yīng)用于時空行為軌跡的模式挖掘分析。時空行為模式包括個體長時序行為的規(guī)律性與周期性挖掘[40]、慣常行為分析[41]、突變點挖掘等[42],以及群體行為模式識別、聚類與異常行為分析等[43]。盡管目前的行為模式挖掘算法仍存在對多維數(shù)據(jù)的處理能力不足、對長時間序列結(jié)果動態(tài)性的探測不足、對多類型時空行為數(shù)據(jù)處理的精度參差不齊等問題,但已有方法為深入理解個體時空行為模式、不同人群的日?;顒映鲂心J郊捌渑c社區(qū)和城市空間的互動關(guān)系提供了分析基礎(chǔ)。
1.2.3 個體行為與建成環(huán)境的互動關(guān)系
少數(shù)研究開始利用機器學(xué)習(xí)算法,探討建成環(huán)境與個體行為之間的非線性聯(lián)系,并通過分析閾值效應(yīng)對社區(qū)生活圈的設(shè)施配置和土地利用提供規(guī)劃建議。這區(qū)別于傳統(tǒng)分析基于線性、獨立同分布樣本的統(tǒng)計模型假設(shè),可以深入挖掘變量間可能存在的多種非線性關(guān)系。已有研究采用梯度提升決策樹等機器學(xué)習(xí)方法,驗證了社區(qū)建成環(huán)境與小汽車出行距離[44]114、到公交站點的步行距離[45]、電動車出行距離[46]等存在非線性關(guān)系和閾值效應(yīng)。這些研究一方面可以探討社區(qū)生活圈規(guī)劃過程中應(yīng)該優(yōu)先考慮哪些建成環(huán)境的調(diào)整,另一方面提供配置社區(qū)設(shè)施與土地利用指標(biāo)的數(shù)量建議。這些往往是定性分析或傳統(tǒng)計量統(tǒng)計方法無法直接回答的問題[47]。
結(jié)合社區(qū)生活圈規(guī)劃研究面臨的挑戰(zhàn)與機器學(xué)習(xí)方法在時空行為研究中應(yīng)用的前沿進(jìn)展,本文提出機器學(xué)習(xí)方法在社區(qū)生活圈規(guī)劃研究的應(yīng)用框架。社區(qū)生活圈的概念內(nèi)涵與時空行為緊密相關(guān),因此,運用機器學(xué)習(xí)方法首先應(yīng)該指向?qū)ι鐓^(qū)生活圈居民的時空行為分析,包括個體行為模式挖掘、群體行為模式聚類、行為與空間非線性關(guān)系分析和行為預(yù)測等,進(jìn)而運用在社區(qū)生活圈規(guī)劃的不同議題上,具體可以從社區(qū)生活圈的物質(zhì)空間、社區(qū)交往生活圈和社區(qū)安全生活圈3個維度,分別對其中不同的研究議題展開分析(見圖1)。
圖1 機器學(xué)習(xí)方法在社區(qū)生活圈規(guī)劃研究中的應(yīng)用框架Fig.1 The framework of the application of machine learning techniques in community life circle planning research
物質(zhì)空間是社區(qū)生活圈在現(xiàn)實世界的基礎(chǔ)和載體,對社區(qū)生活圈物質(zhì)空間的規(guī)劃是實現(xiàn)可持續(xù)人居環(huán)境建設(shè)、提高居民生活質(zhì)量的重要環(huán)節(jié)。其中,社區(qū)生活圈空間范圍的劃分和公共服務(wù)設(shè)施配置的優(yōu)化是機器學(xué)習(xí)應(yīng)用于社區(qū)生活圈物質(zhì)空間維度的兩個重要應(yīng)用方向。機器學(xué)習(xí)方法為從時空整合角度進(jìn)行個體需求分析及引導(dǎo)社區(qū)生活圈物質(zhì)空間規(guī)劃提供了基礎(chǔ)。
在空間范圍劃分方面,可以利用較長時間維度的居民出行活動數(shù)據(jù),進(jìn)行居民時空行為模式挖掘和預(yù)測,從而獲得居民慣常行為特征,并探測其與社區(qū)生活圈的互動關(guān)系,由此從需求視角出發(fā)劃定不同層級社區(qū)生活圈的空間范圍。
公共設(shè)施配置優(yōu)化方面,可以利用非線性建模方法,分析居民出行行為與土地利用的多元非線性關(guān)系與閾值效應(yīng),從而獲得更為精細(xì)化的土地利用空間配置策略。此外,通過對居民長時間維度行為模式和生活方式的觀測,探測社區(qū)生活圈內(nèi)設(shè)施的時空資源與居民時空需求之間的動態(tài)匹配關(guān)系,從而在時間維度上優(yōu)化設(shè)施資源利用方案,實現(xiàn)時空行為規(guī)劃與管理的創(chuàng)新。
居民的社會交往和互動及其形成的社會網(wǎng)絡(luò),共同組成了社區(qū)生活圈的社會空間。社會空間是打造和諧宜居社區(qū)生活圈、提升居民幸福感的重要非空間因素。其中,促進(jìn)社會交往和融合能夠增強社區(qū)歸屬感和凝聚力,有助于維持社區(qū)的服務(wù)水平和再生產(chǎn)能力,是營造社會空間的重要維度。已有研究多從靜態(tài)角度,利用居住分異等指標(biāo)探索不同人群的融合程度,但缺乏對居民活動過程中交往和融合的時空動態(tài)探討,且研究結(jié)果難以與社區(qū)社會空間營造相結(jié)合[48]。因此,相關(guān)研究可以利用模式挖掘和社群探測等技術(shù)手段,分析不同群體的時空間行為特征和活動模式特征,從行為交互角度進(jìn)行社會排斥、活動空間交互、社會包容等方面的研究,探索多主體聯(lián)合和行為決策機制,并結(jié)合其與社區(qū)組織和社區(qū)空間的互動關(guān)系,提出促進(jìn)社區(qū)生活圈中各類人群融合和交往的政策建議。
社區(qū)生活圈作為城市空間最基本的組織細(xì)胞,同時也是應(yīng)對重大突發(fā)公共事件的“防災(zāi)減災(zāi)基本單元”,應(yīng)當(dāng)具有突發(fā)事件應(yīng)急響應(yīng)、過程中社區(qū)資源調(diào)配和事后秩序迅速恢復(fù)的能力。2020年突如其來的新冠肺炎疫情更是印證了提升社區(qū)層面的突發(fā)公共衛(wèi)生應(yīng)急事件處置能力的必要性。已有研究指出,社區(qū)生活圈的規(guī)劃建設(shè)應(yīng)考慮韌性和健康等理念[6]105。社區(qū)韌性強調(diào)社區(qū)在城市生態(tài)和社會環(huán)境快速變動過程中適應(yīng)不確定性風(fēng)險的能力,應(yīng)當(dāng)結(jié)合豐富的時空行為模式挖掘和預(yù)測技術(shù),探索基于居民日常活動出行的韌性評估,如針對個體或多主體的動態(tài)環(huán)境風(fēng)險源暴露分析和基于“突發(fā)事件前、中、后”的居民時空行為模式穩(wěn)定性的設(shè)施配置分析,實現(xiàn)精準(zhǔn)防控和土地利用規(guī)劃調(diào)整[49]。
此外,為構(gòu)建可持續(xù)、健康的社區(qū)生活圈,可在探索居民時空行為模式的基礎(chǔ)上,分析個體的出行結(jié)構(gòu)特征及其影響因素,從而提出能促進(jìn)居民體力活動的健康生活圈設(shè)施規(guī)劃建議。
社區(qū)生活圈空間范圍的劃分是社區(qū)生活圈規(guī)劃研究的技術(shù)難點和前置條件[13]1?;诰用裥袨樾枨筮M(jìn)行空間劃分是社區(qū)生活圈規(guī)劃的基本要求,但行為數(shù)據(jù)獲取成本較高,導(dǎo)致相關(guān)方法難以推廣。機器學(xué)習(xí)方法可以在一定程度上解決上述問題:通過學(xué)習(xí)有行為數(shù)據(jù)社區(qū)生活圈的劃分結(jié)果與社區(qū)空間信息和人口結(jié)構(gòu)特征的關(guān)系,進(jìn)而對其他社區(qū)居民行為需求進(jìn)行預(yù)測,并基于預(yù)測結(jié)果劃分生活圈(見圖2)。
圖2 基于時空行為需求預(yù)測的社區(qū)生活圈劃分方法框架Fig.2 The framework of the community life circle delineation method based on the estimation of spatiotemperal behavior demand
具體來說,首先,為了簡化討論,以用地地塊為分析基本單元,居民時空行為需求表征為對社區(qū)周邊15 min步行可達(dá)范圍內(nèi)所有地塊的需求水平,具體可以使用活動日志調(diào)查中居民前往不同設(shè)施所在地塊的時長、GPS調(diào)查中居民在該地塊上停留的GPS點數(shù)量,也可以采用高精度的熱力圖數(shù)據(jù)或手機信令數(shù)據(jù)進(jìn)行估算。進(jìn)一步以中位數(shù)為界將地塊劃分為“高需求”和“低需求”地塊。此外,考慮到居民對不同用地類型的需求模式不同,可以根據(jù)用地分類標(biāo)準(zhǔn)區(qū)分為公共服務(wù)設(shè)施、商業(yè)服務(wù)設(shè)施、綠地公園、居住和其他5類用地類型,分別構(gòu)建預(yù)測模型。其中,公共服務(wù)、商業(yè)服務(wù)和綠地公園作為社區(qū)生活圈中重要的服務(wù)要素,也是供需匹配分析的重點。
其次,獲取成本相對較低的地理環(huán)境數(shù)據(jù)和社區(qū)人口結(jié)構(gòu)數(shù)據(jù)作為輸入的自變量。比如地塊距社區(qū)中心的距離、面積、商業(yè)設(shè)施數(shù)量、公共服務(wù)設(shè)施數(shù)量,以及社區(qū)年齡、教育和戶口構(gòu)成情況等。具體可以根據(jù)實際工作需要進(jìn)行增減。
再次,考慮到地塊被分為“高需求”和“低需求”兩類,機器學(xué)習(xí)中常用的分類算法,比如神經(jīng)網(wǎng)絡(luò)算法、基于決策樹的集成學(xué)習(xí)算法和支持向量機等,可以被作為構(gòu)建時空行為需求預(yù)測模型的基本算法。在實際工作中,可以通過對比不同算法的預(yù)測誤差,選擇誤差最小即預(yù)測正確率最高的模型作為不同用地類型的最終預(yù)測模型。
最后,在構(gòu)建需求預(yù)測模型后,輸入無行為調(diào)查數(shù)據(jù)的社區(qū)人口和地理環(huán)境信息,便可以獲得該社區(qū)居民對其步行可達(dá)范圍內(nèi)所有地塊的需求水平,進(jìn)而劃分出包含行為信息的社區(qū)生活圈范圍。Li等[50]基于上述思路,以北京市清河街道15個社區(qū)為例構(gòu)建了基于行為需求預(yù)測的社區(qū)生活圈劃分方法,結(jié)果顯示該方法具有較高的預(yù)測精度,同時劃分方法還為下一步設(shè)施規(guī)劃和選址提供參考。
合理評價社區(qū)設(shè)施與土地利用配置,并對相關(guān)規(guī)劃指標(biāo)提供數(shù)量建議是實現(xiàn)社區(qū)生活圈規(guī)劃精細(xì)化的重要環(huán)節(jié)[15]34。以居民出行行為特征為依托進(jìn)行設(shè)施配置評估符合社區(qū)生活圈規(guī)劃“以人為本”的需求導(dǎo)向,然而現(xiàn)有大多數(shù)定量研究采用傳統(tǒng)統(tǒng)計學(xué)方法研究居民時空行為和社區(qū)建成環(huán)境的互動關(guān)系,難以提供精細(xì)、準(zhǔn)確的土地利用和設(shè)施配置有效范圍。機器學(xué)習(xí)中的非線性模型放寬了嚴(yán)格的因變量與自變量間的線性關(guān)系假設(shè),使得兩者之間的關(guān)系不局限于固定的斜率系數(shù),而是呈現(xiàn)為不斷變化的非線性形態(tài),從而更細(xì)致地刻畫自變量對因變量的影響,為研究個體時空行為和社區(qū)建成環(huán)境之間的非線性關(guān)系和閾值效應(yīng)提供基礎(chǔ),從而得到設(shè)施配置、土地利用面積比例等指標(biāo)的合理范圍(見圖3)。
圖3 基于非線性機器學(xué)習(xí)模型的社區(qū)生活圈設(shè)施配置優(yōu)化研究框架Fig.3 The framework of the land use optimization in community life circle based on nonlinear machine learning model
具體而言,首先,確立并計算社區(qū)生活圈內(nèi)的建成環(huán)境指標(biāo)。在傳統(tǒng)建成環(huán)境與出行行為相關(guān)研究的基礎(chǔ)上[51],選取有效的社區(qū)生活圈建成環(huán)境指標(biāo),主要包括人口密度、街區(qū)設(shè)計、社區(qū)尺度可達(dá)性、土地利用混合度、區(qū)域可達(dá)性、公共交通可達(dá)性等維度。其中,社區(qū)尺度可達(dá)性變量多用設(shè)施密度代替,而設(shè)施類型的選取應(yīng)與現(xiàn)有規(guī)劃文本相對應(yīng),從而使結(jié)果更好地指導(dǎo)規(guī)劃實踐。依據(jù)現(xiàn)有規(guī)劃文本,5 min、10 min、15 min社區(qū)生活圈分別對應(yīng)300 m、500 m和1 000 m的步行范圍。因此,根據(jù)收集的人口和地理環(huán)境數(shù)據(jù),以社區(qū)或個體為中心建立緩沖區(qū),計算不同尺度社區(qū)生活圈內(nèi)的建成環(huán)境指標(biāo),以表征不同尺度的社區(qū)生活圈內(nèi)設(shè)施和土地利用現(xiàn)狀。
其次,在收集居民行為數(shù)據(jù)的基礎(chǔ)上,確立并計算社區(qū)生活圈設(shè)施評估的行為目標(biāo)導(dǎo)向。以人為本的社區(qū)生活圈強調(diào)便捷、綠色的可持續(xù)行為,將居民出行行為簡化為機動車出行距離、步行或騎行比例等指標(biāo),從而探索能夠引導(dǎo)更高可持續(xù)行為比例的社區(qū)生活圈建成環(huán)境。
再次,使用機器學(xué)習(xí)非線性模型擬合社區(qū)生活圈建成環(huán)境(自變量)對居民行為指標(biāo)(因變量)的影響。常用的非線性機器學(xué)習(xí)模型包括決策樹、隨機森林、梯度提升決策樹、支持向量機等。本文以梯度提升決策樹模型為例,說明算法構(gòu)建過程:該算法基于決策樹模型改進(jìn),即每輪迭代構(gòu)建一棵決策樹,同時采用負(fù)梯度下降的方式找到損失函數(shù)最小時的一系列參數(shù),最終得到由若干決策樹加合而成的總模型。具體來說,通過控制決策樹的棵數(shù)、學(xué)習(xí)深度、學(xué)習(xí)速率等參數(shù),估計目標(biāo)函數(shù),即M棵決策樹的加權(quán)總和以使損失函數(shù)最小。其中,M是決策樹的棵樹,αm是第m棵決策樹b(x;θ m)的權(quán)重,θm為第m棵樹的一系列參數(shù)。
非線性機器學(xué)習(xí)模型提供了變量重要性的排序,即各個自變量對于減少每輪迭代中損失函數(shù)貢獻(xiàn)的匯總。這一排序能夠顯示哪些自變量對于解釋因變量是更重要的。此外,相應(yīng)算法提供了因變量隨著自變量變化的邊際變化曲線,如圖4展示了美國奧斯陸15 min社區(qū)生活圈內(nèi)的人口密度對每周機動車出行距離的非線性影響,當(dāng)人口密度達(dá)到3 000人/km2時,對降低機動車的出行距離有明顯影響,也即提供了合理的人口密度設(shè)置范圍。
圖4 人口密度與機動車出行距離的非線性關(guān)系Fig.4 The nonlinear relationship between vehicle travel distance and population density
最后,從非線性機器學(xué)習(xí)模型中得到社區(qū)生活圈建成環(huán)境各指標(biāo)的合理范圍,并與現(xiàn)有規(guī)劃文本相比較,從而評估現(xiàn)有規(guī)劃文本指標(biāo)的合理性并提供優(yōu)化策略。
伴隨著城市發(fā)展的人本轉(zhuǎn)型與對社區(qū)規(guī)劃和社區(qū)治理的重視,社區(qū)生活圈規(guī)劃愈發(fā)成為學(xué)術(shù)研究與規(guī)劃實踐的前沿和熱點,也是我國國土空間規(guī)劃體系創(chuàng)新的重要組成部分。目前社區(qū)生活圈規(guī)劃研究以公共服務(wù)設(shè)施配置優(yōu)化為主,規(guī)劃實踐仍然延續(xù)居住區(qū)規(guī)劃的傳統(tǒng)思路,對于社區(qū)生活圈內(nèi)的居民需求和居民時空行為關(guān)注不足。本文通過梳理社區(qū)生活圈規(guī)劃研究和規(guī)劃的不足以及機器學(xué)習(xí)方法在時空行為應(yīng)用的前沿,提出機器學(xué)習(xí)方法在社區(qū)生活圈的應(yīng)用框架,并以社區(qū)生活圈劃分和設(shè)施配置優(yōu)化為例對機器學(xué)習(xí)在社區(qū)生活圈物質(zhì)空間方面的創(chuàng)新應(yīng)用進(jìn)行闡釋,以期為更精細(xì)、更適應(yīng)居民差異化需求的社區(qū)生活圈規(guī)劃提供借鑒。