劉柯良,陳 堅,祝 燁,彭 濤,邱智宣
(1.重慶交通大學 交通運輸學院,重慶 400074;2.重慶市市政設計研究院,重慶 400014)
隨著城市居民小汽車保有量的增速遠超道路基礎設施的建設,交通擁堵已成為大城市工作日早晚高峰的常態(tài)[1].交通擁堵是土地利用、道路基礎設施等空間要素與個體出行行為復雜耦合的結果.在推進社區(qū)生活圈改造的背景下,從城市規(guī)劃源頭改善道路交通擁堵狀況,解析社區(qū)建成環(huán)境與小汽車使用行為之間的關聯(lián)關系尤為迫切.
社區(qū)生活圈是國土空間規(guī)劃體系創(chuàng)新的重要組成部分[2].通過社區(qū)建成環(huán)境來塑造居民空間行為成為新型城鎮(zhèn)化階段的重要任務.建成環(huán)境作為城市物理空間的重要組成部分,是研究特定空間下出行行為的重要抓手[3-4].國內外眾多學者對建成環(huán)境與小汽車使用行為的關系展開了研究,Ma 等[5]研究發(fā)現(xiàn)居住地周圍高密度、高混合的建成環(huán)境能夠削減居民的出行距離,降低出行者對私人小汽車的依賴;Handy 等[6]同樣認為更緊湊的社區(qū)建成環(huán)境能有效減少機動車出行;尹超英等[7]研究發(fā)現(xiàn)交通小區(qū)建成環(huán)境對通勤出行方式選擇有顯著影響.然而,隨著相關領域的實證研究增多,部分學者意識到建成環(huán)境與出行行為的線性關系假設具有較大缺陷,嘗試利用機器學習中回歸樹的算法探索其中非線性效應,從而指導更精細化的空間設計,Tao 等[8]基于梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)模型分析了建成環(huán)境與步行距離的非線性關系,并與線性模型進行對比說明了GBDT 模型對數(shù)據(jù)具有更好的擬合度;Zhang 等[9]基于GBDT 模型探究建成環(huán)境對家庭小汽車擁有量的非線性影響;陳堅等[10]以建成環(huán)境對出行行為的影響為切入點,構建了刻畫建成環(huán)境與城市停車需求非線性關系的GBDT 模型.
已有研究分析表明,建成環(huán)境對小汽車使用行為具有顯著影響,但其中非線性效應的具體表現(xiàn)形式在不同的研究中呈現(xiàn)出一定的差異性,仍有待進一步挖掘.由于傳統(tǒng)出行行為研究需要通過問卷調查獲取個體社會經(jīng)濟與出行特征等信息,而問卷調查全過程中存在被調查者配合度差異、調查人員工作態(tài)度差異等諸多因素影響,調查數(shù)據(jù)可信度仍存疑,通過分析居住小區(qū)配建停車場泊位使用行為以審視小汽車擁有者在小區(qū)層面的出行行為,能夠從新的視角客觀探究小汽車使用行為.另一方面,現(xiàn)有建成環(huán)境與出行行為的非線性關系研究以我國城市作為地理背景的實證較少,由于社會、經(jīng)濟與文化的差異,建成環(huán)境與出行行為的關系在不同國家地區(qū)有所不同[11-13],亟待為該領域貢獻中國城市的實證分析,以促進該領域形成較為可靠的理論基底,并指導面向低碳綠色的社區(qū)生活圈規(guī)劃.本文以重慶市為例,通過居住小區(qū)配建停車場泊位利用率(簡稱泊位利用率)來反映泊位使用行為,進而刻畫居民的小汽車使用行為.基于機器學習方法探究社區(qū)建成環(huán)境對泊位利用率的非線性效應,深入挖掘社區(qū)建成環(huán)境與小汽車使用行為的關系,以期為面向低碳綠色的社區(qū)生活圈空間設計與改造提出科學參考,優(yōu)化城市空間資源的配置.
社區(qū)建成環(huán)境的表征指標選取一方面參考相關研究,考慮影響出行需求產(chǎn)生與出行方式選擇的建成環(huán)境要素,另一方面結合研究需求,進行探索性潛在建成環(huán)境影響因素挖掘.根據(jù)已有研究成果[14-15],建成環(huán)境常用5D 要素來進行刻畫.其中密度(Density)可通過人口密度來進行表征;多樣性(Diversity)可通過土地利用混合度進行表征;設計(Design)可通過路網(wǎng)密度與交叉口密度進行表征;公交臨近度(Distance to Transit)可通過公交站點密度、軌道站點密度進行表征;重慶屬于多中心組團式城市格局,目的地可達性(Destination Accessibility)可通過距離商圈的距離進行表征.由于小汽車擁有者的社會經(jīng)濟特征會影響出行行為,因此將房價作為控制變量納入模型.
為分析社區(qū)生活圈建成環(huán)境,需要選擇合適的社區(qū)生活圈的測度范圍,參考建成環(huán)境與出行行為研究中的空間單元劃分方面的研究成果[16-17],并結合文獻[18]中對社區(qū)生活圈內涵及設施服務半徑的界定,本文最終選取小區(qū)500 m 緩沖區(qū)作為社區(qū)建成環(huán)境的基本分析單元.
基于文獻[19]中的停車普查指標,將泊位利用率界定為停車場的泊位在一天中被占用時間的比例,直接反映小汽車擁有者的泊位使用行為,間接反映小汽車使用行為,影響路徑見圖1.
圖1 建成環(huán)境對泊位利用率的影響路徑Fig.1 Effect path of built environment on the parking space utilization rate
為掌握重慶市主城區(qū)停車設施動靜態(tài)特征及停車行為,2019 年通過分層抽樣方法確定了主城區(qū)128 個停車場為調查樣本展開調查.其中停車場靜態(tài)特性與動態(tài)特性是本研究的關鍵指標,包括停車場車位數(shù)、停車場車輛進出時間等,用于計算停車設施一天的泊位利用率.其中部分停車場的動態(tài)特征通過停車場電子卡口數(shù)據(jù)獲取,而對于沒有電子卡口數(shù)據(jù)的停車場,通過24 h 的連續(xù)人工調查獲得動態(tài)特性.本文從調查的128 個停車場樣本中選取了近10 年新建小區(qū)的配建停車場,車位出售率均在95%以上且無對外共享車位情況,確保泊位利用率能夠準確反映小汽車使用行為,最后共計68 個樣本,覆蓋重慶市8 個行政區(qū),樣本空間分布見圖2.
圖2 樣本空間分布Fig.2 Spatial distribution of samples
停車場位置數(shù)據(jù)基于停車設施地址,通過逆地理編碼工具獲取其經(jīng)緯度坐標;人口密度數(shù)據(jù)通過世界人口數(shù)據(jù)網(wǎng)址獲取開源人口密度柵格數(shù)據(jù)[20];興趣點(Point of Interst,POI)數(shù)據(jù)通過python 程序接入高德API 爬取,并利用QGIS 軟件的坐標轉換插件將高德的GCJ-02 坐標系轉化為WGS-84 坐標系;道路網(wǎng)絡數(shù)據(jù)通過開源地圖網(wǎng)站(OpenStreet-Map,OSM)截取研究范圍內的路網(wǎng),并將雙線道路網(wǎng)絡轉化為單線網(wǎng)絡;小區(qū)房價數(shù)據(jù)基于小區(qū)位置地址通過python 程序從二手房網(wǎng)站爬取.
利用Arcgis 的緩沖區(qū)工具生成以居住區(qū)為核心的社區(qū)生活圈,用空間連接工具計算社區(qū)生活圈內POI 數(shù)量與路網(wǎng)長度;土地利用混合度基于社區(qū)生活圈內POI 類型豐富度進行表征,在文獻[18]中對社區(qū)服務要素配置建議的基礎上,選取了政府、銀行、醫(yī)院、學校、體育館、商場、酒店、廣場、公園9 類POI,土地利用混合度由土地利用熵指數(shù)來定量反映[21],其計算公式為
式中:Li代表第i個緩沖區(qū)內土地利用熵指數(shù);Pij代表第i個緩沖區(qū)內第j種POI 數(shù)量占總數(shù)的比例;Ni代表第i個緩沖區(qū)內包含POI 的類型數(shù)量.
土地利用混合度的數(shù)值在0 到1 之間,0 表示土地利用類型為均質,1 表示各類土地利用類型均存在;距離商圈的距離求解通過Arcgis 構建道路網(wǎng)絡數(shù)據(jù)集,利用網(wǎng)絡分析工具箱進行OD 成本矩陣求解,基于起終點間沿路網(wǎng)的空間距離作為計算成本,其中起點為各個停車場,終點為重慶市5 大商圈,選取其中的距離最小值作為指標測度結果.建成環(huán)境指標具體描述見表1.
表1 解釋變量匯總Tab.1 Indicators of built environment
表2列出了指標的統(tǒng)計性分析,從K-S 檢驗可以看出,各變量的顯著性均大于0.05,說明樣本數(shù)據(jù)呈正態(tài)分布,樣本質量較好.通過SPSS 對解釋變量進行多重共線性檢驗,結果顯示變量的方差膨脹系數(shù)值(Variance Inflation Factor,VIF)都小于10,說明不存在強共線性的變量,因此將所有解釋變量納入模型.
表2 變量描述性統(tǒng)計結果Tab.2 Descriptive statistics of explanatory variables
梯度提升迭代決策樹(GBDT)模型是一種基于樹的集成方法[22],該方法通過最小化損失函數(shù)來逼近真實值,計算式為
式中:L為損失函數(shù);F為待擬合的回歸函數(shù);x為建成環(huán)境變量;y為泊位利用率.
GBDT 模型可以處理不同類型的自變量,不易受樣本中的異常值與缺失值的影響,且對數(shù)據(jù)量的要求不高,此外,它可以擬合復雜的非線性方程并提供自變量關于因變量的重要度貢獻,上述優(yōu)勢是本文選擇此方法的重要因素.然而,GBDT 模型無法檢驗自變量對因變量的影響是否具有顯著性,因此對結果解釋時需保持一定的警惕.
梯度提升是將許多弱(或簡單)模型聚合為一個強(或復雜)模型.GBDT 模型主要目標是將多棵樹線性地、順序地組合起來,使預測具有最佳性能.GBDT 模型中的回歸樹都是CART 回歸樹,與隨機森林構建多棵并列的樹不同,GBDT 模型構建的每一棵樹都在前一棵樹的基礎上進行構建,其目標是擬合前一棵樹的殘差,直到達到迭代次數(shù)或到達預先設置的樹的數(shù)量,最后模型的結果即每棵樹的結果加權求和.即
式 中:γj為 第j棵 樹 的 權 重;cj為 第j棵 樹 的 參 數(shù);h(x,cj)為子樹j的估計結果;J為決策樹的數(shù)量.
通過梯度上升的方法來估計各棵樹的權重與待估計參數(shù).
步驟2:GBDT 模型將m-1 次迭代的損失函數(shù)的負梯度方向作為第m次迭代的殘差,即rim=作為第m棵樹擬合的目標,即
步 驟3:估 計 乘 子γm的 值,即接著,在m-1 次迭代的基礎上更新模型,得到Fm(x)=Fm-1(x)+γmhm(x),同時,為防止過擬合,引入學習率λ,即Fm(x)=Fm-1(x)+λγmhm(x).
步驟4:若達到迭代次數(shù)的上限或精度要求,則輸出模型結果,反之,則繼續(xù)迭代.
GBDT 模型中的變量重要度指某特征所帶來的信息增益總量,通過計算所有加法樹的均值來反映.
GBDT 模型通過繪制部分依賴圖來刻畫自變量與因變量之間的非線性關系,部分依賴關系的數(shù)學定義式為
式中:xS為所關注的建成環(huán)境變量;xC為其他建成環(huán)境變量;FxS(xS)為所關注的建成環(huán)境變量對近似函數(shù)的部分依賴關系.
通過式(6)估計變量間的非線性關系.
利用R 編程語言中的“gbm”包實現(xiàn)GBDT 模型求解.通過五折交叉驗證法確定模型參數(shù),即將數(shù)據(jù)集隨機分為5 個樣本量相同子集,選擇其中的4 份作為訓練集,剩余的1 份作為測試集,并通過設置0.001 的學習率來防止過擬合[23].本文設置了5 000 棵初始樹,并通過分析樹的深度從0 到20 所對應的損失函數(shù)變化,發(fā)現(xiàn)樹的深度為6、樹的數(shù)量為2 000時的學習效果最好.
為了說明非線性模型的優(yōu)勢,將線性的OLS 模型與非線性的GBDT 模型進行對比,結果見表3.GBDT 模型與OLS 模型的調整后R2值分別為0.53與0.31,由此可知,GBDT 模型的擬合優(yōu)度較OLS模型提高了71%,說明考慮非線性效應GBDT 對數(shù)據(jù)具有更強的解釋效應.
表3 模型結果Tab.3 Model results
從變量的相對重要度排序來看,對泊位利用率影響最大的因素是房價,其貢獻度為20.90%,說明小汽車擁有者的個體經(jīng)濟水平對小汽車使用行為影響最大,其次是距離商圈的距離(14.30%)、人口密度(14.20%)、土地利用混合度(12.60%),它們比公交臨近度(11.67%)與軌道臨近度(10.03%)對泊位利用率有更大的影響,說明從增加土地利用混合度、商住混合開發(fā)、控制人口密度等方式對小汽車使用行為有更大的影響,而交叉口密度(9.80%)、路網(wǎng)密度(6.50%)等道路網(wǎng)絡因素的影響相對較小.
獨立效應分析通過部分相關圖來展示每個建成環(huán)境變量與泊位利用率的關系,同時考慮其他變量影響的平均效應,部分相關圖如圖3 所示.
建成環(huán)境與泊位利用率之間均存在非線性關系與閾值效應.從整體趨勢來看,人口密度與泊位利用率呈現(xiàn)倒V 型關系;距離商圈的距離與泊位利用率呈現(xiàn)負相關,其他社區(qū)建成環(huán)境指標與泊位利用率呈現(xiàn)正相關.
從社區(qū)人口密度來看,泊位利用率隨人口密度值在0~1.6 之間逐漸增加,在1.6 之后開始逐漸下降(見圖3(a)).這可能是由于人口密度過低往往代表著社區(qū)基礎設施資源匱乏,從而促使長距離出行,導致小汽車使用.而人口密度過高則會出現(xiàn)人均街道空間變小、公共交通擁擠度增高、社區(qū)環(huán)境不良等問題,從而抑制步行、公交等綠色出行方式,促使小汽車使用,因此社區(qū)空間規(guī)劃師需注意對人口密度的控制.
從社區(qū)土地利用多樣性來看,土地利用混合度熵值在0.55~0.72 之間對泊位利用率產(chǎn)生正向影響(見圖3(b)),隨著土地利用混合度的增加,多樣的出行需求更容易在小尺度空間得到滿足,從而降低小汽車使用,然而較少的功能混合對降低泊位利用率的作用不太顯著,這表明社區(qū)居民活動空間的多樣性,規(guī)劃者在社區(qū)公共設施布局時需注意對多樣化需求的滿足.
從社區(qū)道路網(wǎng)絡設計角度來看,路網(wǎng)密度數(shù)值超過6 之后對泊位利用率的提高效果開始明顯(見圖3(c)),交叉口密度數(shù)值當超過10 時才對泊位利用率產(chǎn)生作用(見圖3(d)).因為一方面密路網(wǎng)多交叉口的布局有利于降低小汽車機動性,另一方面,更高的路網(wǎng)密度與交叉口密度意味著更多的連通街道,從而提供更便利的步行基礎條件.這也印證了當下社區(qū)空間塑造采用“小尺度、密路網(wǎng)”的人性化街道空間布局形式的有效性.
從社區(qū)公共交通臨近度來看,整體趨勢上,公共交通鄰近度與軌道交通臨近度高,可提高泊位利用率,這是由于這兩項指標數(shù)值越大,反映了社區(qū)公共交通供給水平越高,出行者便越可能放棄小汽車出行,從而提高了泊位利用率.其中公交臨近度數(shù)值需要達到3、軌道臨近度數(shù)值需要達到1 才能提供高泊位利用率(見圖3(e)與圖3(f)),前者說明了常規(guī)公交注重“規(guī)模問題”,強調公交站點的密度是否足夠大,這提示了社區(qū)常規(guī)公交的規(guī)劃要注重提高服務密度,社區(qū)尺度下的公交站點應達到3 個以上才能抑制小汽車使用;而軌道交通更注重“有無問題”,強調社區(qū)是否被軌道交通站點所服務,這可能是由于軌道線網(wǎng)的連通性更強.
圖3 建成環(huán)境指標與泊位利用率的關系Fig.3 Relationship between built environment and parking space utilization rate
從社區(qū)距離商業(yè)中心的距離來看,距離商圈的距離在0~2 km 內對泊位利用率影響不大,在2~6 km 的區(qū)間隨著距離增加泊位利用率開始下降,超過6 km 后泊位利用變化趨平(見圖3(g)).越接近于商圈,往往居住地周邊公交與步行可達性較好、道路擁堵問題也會更嚴重,因此小汽車的使用會減少,泊位利用率會提高.該結論反映了綜合性商圈對社區(qū)的服務半徑為2 km,影響半徑為6 km,這為大型商圈的空間布局提供了參考.
1)GBDT 模型克服了傳統(tǒng)統(tǒng)計模型線性假設的缺陷,通過分析建成環(huán)境對停車泊位的使用行為,表明建成環(huán)境對小汽車使用行為具有非線性效應,且不同建成環(huán)境因子的相對貢獻度不同,已有研究也證明了類似觀點[8-10].
2)除小區(qū)房價(23.5%)外,距離商圈的距離(14.30%)、人口密度(14.20%)、土地利用混合度(12.60%)是影響小汽車使用行為的最重要建成環(huán)境因素,這一方面反映了社會經(jīng)濟屬性對小汽車使用行為的影響比建成環(huán)境因素更大,而已有研究中對于社會經(jīng)濟屬性與建成環(huán)境因素哪一個對小汽車使用行為影響更大仍未有統(tǒng)一結論[24];另一方面反映了社區(qū)的土地規(guī)劃與人口控制在影響小汽車使用行為的重要性,文獻[25]在研究建成環(huán)境對小汽車行駛里程的影響中得到了類似的結論.此外,本文為低碳社區(qū)生活圈規(guī)劃提供了定量改善依據(jù).
3)建成環(huán)境因子與泊位利用率的關系均存在非線性關系.其中包括了規(guī)模效應與閾值效應,這提醒規(guī)劃管理者在通過城市規(guī)劃來抑制小汽車使用時需要關注:對規(guī)模效應的把握,即只有達到一定數(shù)量或程度的建成環(huán)境因子才能顯著改善出行行為;對閾值的警惕,不要一味地加強建成環(huán)境改造,應準確把握背后的作用機制,從而避免資源的浪費.
本文以重慶作為地理背景進行實證研究,上述結論為相關規(guī)劃管理部門提供了參考.由于文化地理背景的差異,不同城市應該開展基于自己城市觀測數(shù)據(jù)的研究,通過停車數(shù)據(jù)來更真實地反映小汽車使用行為,以彌補傳統(tǒng)調查數(shù)據(jù)的缺陷.未來研究中,一方面需要進行多尺度建成環(huán)境的分析,這樣可能會使得結論更具有可靠性;另一方面,隨著圖像識別技術的成熟,未來建成環(huán)境的測度應更多考慮影響出行行為的微觀街景特征,由于這些變量在空間設計中的可調節(jié)性更強,這對改善出行環(huán)境、抑制小汽車使用提供了更可行的空間優(yōu)化方向.