黃合來, 許鵬鵬, 翟曉琪
(中南大學 交通運輸工程學院,湖南 長沙 410075)
?
不同區(qū)劃方案對宏觀交通事故建模的影響
黃合來, 許鵬鵬, 翟曉琪
(中南大學 交通運輸工程學院,湖南 長沙 410075)
摘要:依托美國佛羅里達州Hillsborough縣歷史數(shù)據(jù),分別提取人口普查單元組、交通分析小區(qū)、人口普查區(qū)、郵政投遞區(qū)等4種區(qū)劃方案的事故數(shù)據(jù)、路網(wǎng)交通特征數(shù)據(jù)和經(jīng)濟-社會-人口數(shù)據(jù);基于貝葉斯方法構(gòu)建負二項條件自回歸模型,從模型擬合度、模型估計參數(shù)、小區(qū)事故黑面識別等3個方面定量評價不同區(qū)劃方案對宏觀交通安全分析結(jié)果的影響.研究表明:宏觀交通安全分析結(jié)果會隨著空間單元劃分方式不同而產(chǎn)生顯著差異;小區(qū)數(shù)目越少,事故預測越為準確;對比人口普查單元組、人口普查區(qū)和郵政投遞區(qū),基于交通分析小區(qū)的模型擬合度最低;變量中等家庭收入對分區(qū)規(guī)模最不敏感,其參數(shù)估計結(jié)果具有穩(wěn)健性和可靠性.
關(guān)鍵詞:宏觀交通安全分析; 區(qū)劃方案; 貝葉斯估計; 條件自回歸模型
交通安全規(guī)劃已成為當前國際道路交通業(yè)界和學術(shù)界最為前沿的研究方向之一[1],其要求將交通安全考慮到交通規(guī)劃的各個層面,強調(diào)從宏觀到微觀對安全水平的預測和規(guī)劃.交通規(guī)劃層面的影響因素與交通安全水平的關(guān)聯(lián)方法,即宏觀事故預測模型,已成為該領(lǐng)域核心技術(shù)之一.
國外已經(jīng)開展大量定量研究來分析不同規(guī)劃層面的影響因素與交通安全水平的關(guān)系.其空間分析單元包括州[2]、縣[3-4]、行政區(qū)劃[5]、交通分析小區(qū)(traffic analysis zones, TAZs)[6-8]、人口普查區(qū)(census tracts, CTs)[9]、郵政投遞區(qū)(zone improvement plan codes, ZIP)[10]等.已有研究主要從道路網(wǎng)絡(luò)特征(公路里程、路網(wǎng)密度、交叉口密度)[3-6],交通流特征(限速、平均行駛速度、交通流量)[3-6,9],天氣特征(降雨量、降雪量、年降雨天數(shù))[3],土地利用特征[7],以及社會-經(jīng)濟-人口特征(人口、年齡、性別、就業(yè)、收入等)[3,4,9-10]等若干方面進行分析.方法層面,常用的負二項模型和泊松-對數(shù)正態(tài)模型假定事故的分布在空間上相互獨立,而現(xiàn)實中事故數(shù)據(jù)具有空間聚集特征.為克服上述缺陷,通過引入條件自回歸(conditional autoregressive, CAR)殘差項以反映相鄰小區(qū)間可能存在的空間關(guān)聯(lián),貝葉斯條件自回歸模型被廣泛應用于宏觀交通安全分析中[3,4,8,10-11].
由于宏觀事故建模依賴于事故數(shù)據(jù)和規(guī)劃層面數(shù)據(jù)以小區(qū)的方式聚合呈現(xiàn),其結(jié)果可能會隨著空間單元劃分方式不同而變化[11].現(xiàn)階段,尚沒有文獻深入探討不同區(qū)劃方案對宏觀交通安全分析結(jié)果的影響.
本文依托美國佛羅里達州Hillsborough縣歷史數(shù)據(jù),分別提取人口普查單元組、交通分析小區(qū)、人口普查區(qū)、郵政投遞區(qū)層面的事故數(shù)據(jù)、路網(wǎng)交通特征數(shù)據(jù)和經(jīng)濟-社會-人口數(shù)據(jù);基于貝葉斯方法構(gòu)建負二項條件自回歸模型;從模型擬合度、模型估計參數(shù)、小區(qū)事故黑面識別等3個方面定量評價不同區(qū)劃方案下同一事故預測模型結(jié)果的差異性.
1數(shù)據(jù)準備
1.1區(qū)劃方案介紹
獲取4種區(qū)劃方案,人口普查單元組、人口普查區(qū)、交通分析小區(qū)和郵政投遞區(qū).交通分析小區(qū)來源于中佛羅里達區(qū)域規(guī)劃模型,其余3種區(qū)劃方案來源于美國人口普查局拓撲地理信息編碼系統(tǒng).
人口普查單元(census blocks)是美國最小的地理區(qū)劃單元,每個單元人口一般控制在85人次左右.Hillsborough縣共包含17 388個人口普查單元,其面積的中位數(shù)為0.02 km2.因此,較難在人口普查單元上提取有用的人口統(tǒng)計信息.
人口普查單元組(block groups, BGs)由人口普查單元聚合而來,是人口普查數(shù)據(jù)發(fā)布的最小區(qū)劃單元.一個人口普查單元組一般包含600~3 000人.
人口普查單元組聚合得到人口普查區(qū).每個人口普查區(qū)的人口保持在1 200~8 000人次,小區(qū)內(nèi)人口特征、經(jīng)濟收入、生活水平等具有同質(zhì)性.
交通分析小區(qū)是研究交通生成與分布的基本空間單元,其劃分通?;谌丝谄詹閱卧?,以河流、橋梁、山川、鐵路等屏障作為邊界線,并保證小區(qū)內(nèi)土地利用屬性的同質(zhì)性[12].
郵政投遞區(qū)是美國郵政服務(wù)采用的一種區(qū)劃方案.ZIP是地區(qū)改進計劃(zone improvement plan)的簡稱,其喻示郵件可以更有效、更快捷地送至目的地.
Hillsborough縣共包含795個人口普查單元組、738個交通分析小區(qū)、249個人口普查區(qū)和52個郵政投遞區(qū),小區(qū)面積的中位數(shù)分別為0.99、1.24、4.19和27.39 km2.
1.2數(shù)據(jù)收集
道路交通數(shù)據(jù)來源于佛羅里達州運輸部道路調(diào)查報告和Hillsborough縣GIS(geographical information system)地圖.基于GIS平臺對數(shù)據(jù)進行集聚處理,獲得小區(qū)層面的路網(wǎng)交通特征數(shù)據(jù)如下:
(1) 路段總長度:每個小區(qū)內(nèi)道路中心線總里程數(shù);
(2) 按限速值分類的路段長度:限速值為40 km·h-1的路段長度;限速值為56 km·h-1的路段長度;限速值為72 km·h-1的路段長度;限速值為89 km·h-1的路段長度;以及限速值為105 km·h-1的路段長度;
(3) 交叉口數(shù)目:每個小區(qū)內(nèi)交叉口的數(shù)目;
(4) 車輛行駛里程(vehicle mile traveled, VMT):小區(qū)內(nèi)每條路段的年平均日交通量與其長度的乘積.
經(jīng)濟-社會-人口數(shù)據(jù)來源于美國人口普查局2000年人口普查數(shù)據(jù).基于AcrMap空間關(guān)聯(lián)工具對數(shù)據(jù)進行映射處理,獲得各區(qū)劃方案的變量如下:
(1) 小區(qū)面積:每個小區(qū)的陸地面積(去除河流和湖泊的占地面積);
(2) 常住人口數(shù):基于2006年總?cè)丝趯Ω鱾€小區(qū)的人口進行比例擴算;
(3) 人口性別分布:每個小區(qū)男性/女性人口數(shù);
(4) 人口年齡分布:每個小區(qū)年齡為15歲及以下的人口數(shù),年齡處于16~64歲的人口數(shù),年齡為65歲及以上的人口數(shù);
(5) 中等家庭收入:小區(qū)內(nèi)所有家庭收入的中位數(shù).
1.3數(shù)據(jù)處理
選取事故總數(shù)作為模型的響應變量.對于模型的解釋變量,車輛行駛里程是交通事故發(fā)生的直接機會變量,將其首先加入模型.交叉口是交通事故多發(fā)點.在控制路段長度的前提下,采用交叉口密度(交叉口數(shù)目與道路總長度的比值)來反映交通狀況的復雜程度.不同限速策略可能會對交通安全產(chǎn)生顯著影響.在控制路段長度的前提下,采用不同限速路段長度占小區(qū)道路總長度的比例來考量限速策略與交通安全的關(guān)系.由于限速89和105 km·h-1的路段所占比例較低,為避免變量冗余,將兩者合并.采用人口密度(人口數(shù)目與小區(qū)面積比值)以反映小區(qū)人口密集程度.采用女性人口比例和不同年齡段人口比例來表征小區(qū)人口年齡性別特征.對于小區(qū)經(jīng)濟發(fā)展水平,采用中等家庭收入作為指標變量.變量的描述性統(tǒng)計結(jié)果見表1.
表1 變量描述性統(tǒng)計表
2模型建立
2.1負二項條件自回歸模型
Yi~Negbin(λi,γ)
(1)
式中:λi為事故的期望值;γ為離散系數(shù);VMT,i為第i個小區(qū)的車輛行駛里程;Xik表示第i個小區(qū)第k個解釋變量;β0、β1和βk為待估系數(shù).φi為滿足條件自回歸的先驗分布[8]:
其中:τc為精度參數(shù);wij為空間鄰接矩陣W的元素.若第i個小區(qū)與第j個小區(qū)相鄰,則wij=1,否則為0.
在貝葉斯估計中,為模型參數(shù)設(shè)定無信息先驗分布如下:
βk~N(0,1 000)
1/γ~Gamma(0.01,0.01)
τc~Gamma(0.01,0.01)
使用WinBUGS軟件[13]對上述模型進行標定.
采用安全可提高空間指標[14]對事故黑面進行判別:
Pi=λi-
(2)
Pi值越大,小區(qū)i安全改善的潛能越大.
2.2模型評價標準
采用偏差信息準則(deviance information criterion,DIC,以DIC表示)、R2、均方預測標準誤差(normalized mean squared prediction error, NMSPE, 以NMSPE表示)對待選模型進行科學評價.
類似赤池信息準則,DIC綜合考慮模型擬合度和復雜度,其計算方法如下[15]:
(3)
采用R2對模型整體擬合度進行評價:
(4)
為避免樣本數(shù)目差異,采用NMSPE評價模型預測精度,表示如下:
(5)
NMSPE值越小,模型的預測能力越強.
3結(jié)果分析
3.1模型擬合度評價
依據(jù)模型擬合度和簡約度對解釋變量進行篩選,并避免高度相關(guān)的變量加入同一模型.剔除在所有區(qū)劃方案中均不顯著的變量,模型估計結(jié)果見表2所示.結(jié)果表明:(1)隨著小區(qū)數(shù)目增多,DIC值顯著增大.其原因可能為隨著樣本數(shù)增多,模型復雜度逐漸增大.因此,僅從DIC值無法客觀判別不同區(qū)劃方案下同一模型的優(yōu)劣.(2)對于人口普查區(qū)和郵政投遞區(qū),模型擬合度最優(yōu),而交通分析小區(qū)層面的模型擬合度最低,R2值僅為0.68.(3)隨著小區(qū)數(shù)目逐漸減少,NMSPE值逐漸降低.這說明本研究所采取的宏觀區(qū)域指標在小區(qū)數(shù)目較小的情況下對事故的預測更為準確.
3.2模型參數(shù)估計結(jié)果
由表2可得出以下結(jié)論:(1)對于人口普查單元組、交通分析小區(qū)和郵政投遞區(qū),顯著的解釋變量數(shù)均為5個,而人口普查區(qū)中顯著的解釋變量有4個;(2)隨著小區(qū)數(shù)目逐漸減少,變量影響系數(shù)的標準差逐漸增大;(3)空間自相關(guān)效應在4種區(qū)劃方案中均顯著,說明有必要考慮小區(qū)間的空間相關(guān)性.
表2 模型估計結(jié)果
注:加下劃線的數(shù)值表明95%統(tǒng)計顯著.
車輛行駛里程與事故顯著正相關(guān).這說明隨著車輛行駛里程增加,居民出行活動增加,事故頻次顯著增長.此外,該變量的影響系數(shù)最大,說明車輛行駛里程是預測小區(qū)交通安全水平的主要指標.另一方面,不同區(qū)劃方案間該變量的估計參數(shù)差異較大.例如,對于人口普查區(qū),其影響系數(shù)僅為0.43,而在郵政投遞區(qū)中增至0.98.
交叉口是交通事故多發(fā)點.除了郵政投遞區(qū),交叉口密度在其余三種區(qū)劃方案中均與事故頻次顯著正相關(guān).給定路段長度和車輛行駛里程,交叉口數(shù)目越多,事故發(fā)生的頻次越高.
路段限速的設(shè)定要綜合考慮區(qū)域特征、道路設(shè)計標準、交通運行狀況等因素.此外,路段限速值并不能夠客觀地反映交通流特征,因此其與交通安全的關(guān)系錯綜復雜[8].本研究中,對于人口普查單元組、人口普查區(qū)和郵政投遞區(qū),增加限速40 km·h-1路段,小區(qū)的安全水平將顯著提高;對于變量限速72 km·h-1路段比例,其在交通分析小區(qū)中與事故顯著正相關(guān),而在其余區(qū)劃方案中均不顯著;變量限速89~105 km·h-1路段比例僅在郵政投遞區(qū)中顯著.
以往研究表明,人口密集程度越高的小區(qū),事故頻次越高[4].對于交通分析小區(qū)和郵政投遞區(qū),人口密度均與事故顯著正相關(guān),而其在人口普查單元組中與事故顯著負相關(guān).該結(jié)果有違常識.變量相關(guān)性檢驗表明:人口密度與事故頻次95%顯著負相關(guān),皮爾遜相關(guān)系數(shù)為-0.17.
對于4種區(qū)劃方案,中等家庭收入均與事故顯著負相關(guān),說明小區(qū)經(jīng)濟發(fā)展水平越高,事故頻次越低,交通狀況越為安全.其原因可能為這類小區(qū)的道路級配較高,道路安全設(shè)施配置相對齊全;另一方面,富有小區(qū)居民的安全意識可能較高,其購買和擁有高安全性能汽車的可能性較高.
為定量評價表2模型參數(shù)估計結(jié)果差異是否統(tǒng)計顯著,對模型參數(shù)進行均值偏差標準檢驗(standard difference in means test).圖1箱體圖代表模型變量影響系數(shù)的均值±1.5倍標準差.假定S為標準差,當滿足條件:
(6)
如圖1,變量中等家庭收入對小區(qū)區(qū)劃方式最不敏感,其參數(shù)估計結(jié)果具有穩(wěn)健性和可靠性.其余變量均存在差異95%置信區(qū)間上統(tǒng)計顯著的情況.
a 車輛行駛里程
b 交叉口密度
c 限速40 km·h-1路段比例
d 限速72 km·h-1路段比例
e 限速89~109 km·h-1路段比例
f 人口密度
g 中等家庭收入
3.3事故黑面識別
采用安全可提高空間指標,假定排名前20%的小區(qū)為事故多發(fā)區(qū),結(jié)果如圖2所示.可以看出,事故黑面會隨著空間單元劃分方式不同而變化.對于郵政投遞區(qū),事故黑面主要位于中部偏西南地區(qū),而在其余三種區(qū)劃方案中,事故黑面多集中于中部偏西地區(qū).
4結(jié)語
基于實踐數(shù)據(jù),本文首次證實宏觀交通安全分析結(jié)果會隨著空間單元劃分方式不同而產(chǎn)生顯著差異.研究表明:(1)小區(qū)數(shù)目越少,事故預測越為準確;(2)對比人口普查單元組、人口普查區(qū)和郵政投遞區(qū),基于交通分析小區(qū)的模型擬合度最低;(3)變量中等家庭收入對分區(qū)規(guī)模最不敏感,其參數(shù)估計結(jié)果具有穩(wěn)健性和可靠性;(4)實際中分區(qū)要保持適度規(guī)模.當小區(qū)數(shù)目較多時,一方面造成數(shù)據(jù)冗余并增加數(shù)據(jù)收集工作量,另一方面,處于小區(qū)邊界上的事故將明顯增多,可能導致邊界效應;如若小區(qū)數(shù)目較少,將導致有效信息缺失,此外,以往研究表明[10],小區(qū)數(shù)目越少,變量影響系數(shù)的標準差越大,顯著變量的數(shù)目越少.
現(xiàn)階段,宏觀交通安全研究多采用交通分析小區(qū)作為基本空間分析單元.考慮交通分析小區(qū)的劃分鮮有考慮安全相關(guān)因素,黃合來等[1]提出“交通安全分析小區(qū)”的概念,一方面,交通安全分析小區(qū)的劃分應盡可能滿足交通分析小區(qū)劃分的基本原則;另一方面,小區(qū)聚合應遵循安全同質(zhì)性原則.
交通安全分析小區(qū)的提出更大程度上是強調(diào)“將交通安全融入交通規(guī)劃”這一理念.考慮交通規(guī)劃實踐,建議仍采用“交通分析小區(qū)”稱謂,但在其區(qū)劃過程中如何將交通規(guī)劃層面的因素和交通安全相關(guān)因素有機融合,是一個值得探討的科學問題.
a 人口普查單元組
b 交通分析小區(qū)
c 人口普查區(qū)
d 郵政投遞區(qū)
參考文獻:
[1]黃合來, 許鵬鵬, 馬明, 等. 道路交通安全規(guī)劃理論研究前沿[J]. 中國公路學報, 2014, 27(9): 90.
HUANG Helai, XU Pengpeng, MA Ming,etal. Cutting edge research on transportation safety planning: a technical review[J]. China Journal of Highway & Transport, 2014, 27(9): 90.
[2]Washington S, Metarko J, Fomunung I,etal. An inter-regional comparison: fatal crashes in the southeastern and non-southeastern United States: preliminary findings[J]. Accident Analysis & Prevention, 1999, 31(1-2): 135.
[3]Aguero-valverde J, Jovanis P P. Spatial analysis of fatal and injury crashes in Pennsylvania[J]. Accident Analysis & Prevention, 2006, 38(4): 618.
[4]Huang H L, Abdel-Aty M, Darwiche A L. County-Level crash risk analysis in Florida: Bayesian spatial modeling[J]. Transportation Research Board: Journal of the Transportation Research Board, 2010, 2148: 27.
[5]Haynes R, Jones A, Kennedy V,etal. District variations in road curvature in England and Wales and their association with road-traffic crashes[J]. Environment & Planning A, 2007, 39(5): 1222.
[6]Abdel-Aty M, Siddiqui C, Huang H L. Integrating trip and roadway characteristics in managing safety at traffic analysis zones[J]. Transportation Research Record: Journal of the Transportation Research Board, 2011, 2213: 20.
[7]Pulugurha S S, Duddu V R, Kotagirl Y. Traffic analysis zone level crash estimation models based on land use characteristics[J]. Accident Analysis & Prevention, 2013, 50: 678.
[8]Xu P P, Huang H L. Modeling crash spatial heterogeneity: random parameter versus geographically weighting[J]. Accident Analysis & Prevention, 2015, 75: 16.
[9]MacNab Y C. Bayesian spatial and ecological models for small-area accident and injury analysis[J]. Accident Analysis & Prevention, 2004, 36(6): 1019.
[10]Lee J, Abdel-Aty M, Choi K. Analysis of residence characteristics of at-fault drivers in traffic crashes[J]. Safety Science, 2014, 68: 6.
[11]Xu P P, Huang H L, Dong N,etal. Sensitivity analysis in the context of regional safety modeling: identifying and assessing the modifiable areal unit problem[J]. Accident Analysis & Prevention, 2014, 70: 110.
[12]Abdel-Aty M, Lee J, Siddiqui C,etal. Geographical unit based analysis in the context of transportation safety planning[J]. Transportation Research Part A: Policy and Practice, 2013, 49: 62.
[13]Spiegelhalter D J, Thomas A, Best N G,etal. WinBUGS version 1.4.1 User Manual[Z]. Cambridge: Medical Research Council Biostatistics Unit, 2003.
[14]王雪松, 李佳, 謝琨. 基于安全可提高空間的事故多發(fā)信控交叉口判別[J]. 同濟大學學報: 自然科學版, 2015, 43(3): 410.
WANG Xuesong, LI Jia, XIE Kun. Signalized intersection hotspot identification based on potential for safety improvement[J]. Journal of Tongji University: Natural Science, 2015, 43(3): 410.
[15]Spiegelhalter D, Best N, Carlin B P,etal. Bayesian measures of model complexity and fit[J]. Journal of Royal Statistical Society B: Statistical Methodology, 2002, 64(4): 583.
Influence of Zonal Configurations on Macro-level Traffic Safety Modeling
HUANG Helai, XU Pengpeng, ZHAI Xiaoqi
(School of Traffic and Transportation Engineering, Central South University, Changsha 410075, China)
Abstract:Based on the historic data from Hillsborough County, Florida, U.S., the zone-level factors including crashes counts, road network, traffic pattern, and various social economic factors were explicitly collected for four different zoning schemes, i.e. block groups, traffic analysis zones, census tracts, and zone improvement plan codes. Then, a Bayesian negative binomial model with conditional autoregressive prior was developed for each spatial units, respectively. The impacts of zonal variations on macro-level safety modeling were investigated mainly from three aspects, i.e. model performance, model parameter estimates, as well as crash hotspots identification. Results revealed that statistical results based on different aggregation configurations could be significantly different. Zoning schemes with less number of zones tend to have higher crash prediction precision. Compared with block groups, census tracts, and zone improvement plan codes, traffic analysis zones level model preforms worst in terms of model goodness of fit. The variable of median household income shows consistently significant effects on crash frequency and is robust to variation in data aggregation.
Key words:macro-level safety analysis; zoning schemes; Bayesian inference; conditional autoregressive model
文獻標志碼:A
中圖分類號:U491.31
通訊作者:許鵬鵬(1990—),男,工學碩士,主要研究方向為交通安全,空間數(shù)據(jù)分析.E-mail: pengpengxu@yeah.net
基金項目:國家自然科學基金項目(71371192);霍英東教育基金會高等院校青年教師基金應用研究課題(142005);湖南省杰出青年基金項目(2015JJ1017).
收稿日期:2015-04-23
第一作者: 黃合來(1979—),男,工學博士,教授,博士生導師,主要研究方向為交通安全,交通規(guī)劃和智能交通.
E-mail: huanghelai@csu.edu.cn