楊 素, 何 輝, 陳 鵬, 方 星
(1.中國人民公安大學(xué)信息網(wǎng)絡(luò)安全學(xué)院, 北京 102600; 2.烏魯木齊市公安局, 烏魯木齊 830022;3.東莞市公安局, 東莞 523000)
近年來,我國機(jī)動車保有量和機(jī)動車駕駛?cè)藬?shù)不斷上升,交通行駛環(huán)境日益復(fù)雜,交通事故頻發(fā),交通狀況態(tài)勢不容樂觀. 已有研究表明,交通事故具有一定的時(shí)間模式和空間模式,其在空間和時(shí)間上的分布具有不均勻性[1-3]. 對交通事故進(jìn)行時(shí)空分析,識別事故熱點(diǎn)并挖掘事故時(shí)空分布特征,可為交通安全管理提供科學(xué)依據(jù),從而有針對性地制定交通安全策略和措施.
學(xué)者們對交通事故的早期研究主要是將數(shù)理統(tǒng)計(jì)方法運(yùn)用于分析事故時(shí)空分布特征[4-8]、鑒別及檢驗(yàn)事故熱點(diǎn)[9-14]等. 隨著對交通事故空間模式探索的深入,空間統(tǒng)計(jì)方法被運(yùn)用于交通事故時(shí)空分析工作,具體可分為空間聚類[15-20]、核密度估計(jì)[21-23]等方面. 張光南等[15]基于廣州市交通事故空間熱力圖提取9個(gè)事故熱點(diǎn)區(qū)域,通過系統(tǒng)聚類法分析事故影響因素,歸納出商業(yè)地區(qū)、市中心等3類事故高發(fā)區(qū). 柳林等[11]通過核密度估計(jì)法定性分析惠州市2010年交通事故的時(shí)空變化,發(fā)現(xiàn)城市空間結(jié)構(gòu)會對事故發(fā)生產(chǎn)生影響.
已有研究或是在整個(gè)研究地區(qū)內(nèi)探索事故熱點(diǎn)區(qū)域,或是基于行政區(qū)劃這一空間視角,對交通事故在不同行政區(qū)劃內(nèi)的分布情況進(jìn)行簡單可視化[24],對事故時(shí)空分析的空間尺度較為單一. 由于交通事故依賴于道路交通系統(tǒng),其空間現(xiàn)象受道路網(wǎng)絡(luò)的約束[25],部分學(xué)者嘗試從道路網(wǎng)絡(luò)的視角對交通事故展開時(shí)空分析研究,Colak等[21]引入網(wǎng)絡(luò)空間權(quán)重,采用核密度估計(jì)法識別土耳其里澤省45 km主干道上的交通事故熱點(diǎn);朱芳琪等[17]結(jié)合GIS與改進(jìn)的時(shí)空密度聚類方法,對2016—2018年湖南省高速公路交通事故進(jìn)行時(shí)空可視化統(tǒng)計(jì)分析并識別事故多發(fā)路段.
此外,當(dāng)前交通事故時(shí)空分析大多基于交通事故數(shù)展開. 事實(shí)上,不同類型交通事故(如死亡事故、傷人事故、財(cái)產(chǎn)損失事故等)對道路交通系統(tǒng)的影響程度以及對人們生命健康、財(cái)產(chǎn)安全的危害程度不同,在交通事故時(shí)空分析工作中事故嚴(yán)重程度同樣值得關(guān)注. 本文在已有研究基礎(chǔ)上,以東莞市2019-01-01—2020-12-31交通事故為研究對象,采用洛倫茲曲線及基尼系數(shù)、自然間斷分級法,同時(shí)引入事故嚴(yán)重程度指數(shù),試圖從道路網(wǎng)絡(luò)這一空間尺度揭示東莞市交通事故時(shí)空熱點(diǎn)分布特征,為交通事故預(yù)防提供參考.
本文的研究區(qū)域?yàn)閺V東省東莞市,該市為珠江三角洲中心城市之一、粵港澳大灣區(qū)城市之一,是廣東省重要的交通樞紐. 東莞市不設(shè)區(qū),下轄28個(gè)鎮(zhèn)、4個(gè)街道、2個(gè)管委會、1個(gè)生態(tài)園. 該市總面積2 542.67 km2,常住人口數(shù)為1 043.7萬人,汽車保有量超300萬[26]. 從常住人口數(shù)量來看,東莞屬特大城市,但其總面積小,使得該市人口密度大,同時(shí)汽車保有量大,交通事故頻發(fā),以東莞市為研究區(qū)域開展交通事故具有典型意義.
圖1 東莞市行政區(qū)劃
本文所用數(shù)據(jù)包括脫敏后的交通事故數(shù)據(jù)和道路網(wǎng)絡(luò)數(shù)據(jù). 交通事故數(shù)據(jù)為2019-01-01—2020-12-31東莞市交通事故記錄,共11 502條,每條記錄包含15個(gè)屬性,可分為事故基本屬性、環(huán)境屬性、事故評價(jià)屬性3大類. 事故基本屬性包含事故編號、事故地點(diǎn)、發(fā)生時(shí)間、傷亡人數(shù)等,環(huán)境屬性為行政區(qū)劃、道路養(yǎng)護(hù)單位等,事故評價(jià)屬性則為事故類型、事故標(biāo)簽等. 道路網(wǎng)絡(luò)數(shù)據(jù)來自O(shè)pen Street Map(OSM)開源地圖下載平臺[27],經(jīng)行政邊界裁剪后得到矢量路網(wǎng)數(shù)據(jù),共19 306條路段.
根據(jù)研究區(qū)域范圍進(jìn)行交通事故數(shù)據(jù)篩選,刪除空間位置明顯偏離的事故數(shù)據(jù)67條,補(bǔ)全包含空值的事故數(shù)據(jù)20條,剩余事故數(shù)據(jù)為 11 435條. 通過對道路網(wǎng)絡(luò)進(jìn)行路網(wǎng)簡化、拓?fù)錂z查等處理,共獲取12 830條路段. 為了防止將偏離路段過遠(yuǎn)的事故點(diǎn)匹配至路段上,通過將事故點(diǎn)投影至最近路段,得到每一事故點(diǎn)至最近路段的距離,統(tǒng)計(jì)該距離的累計(jì)頻率分布,假定距離小于d的事故點(diǎn)占所有數(shù)據(jù)點(diǎn)的80%,則設(shè)置d為緩沖區(qū)寬度,將對應(yīng)的投影點(diǎn)作為新的交通事故數(shù)據(jù)點(diǎn),刪除其余不位于緩沖區(qū)內(nèi)的交通事故數(shù)據(jù)點(diǎn). 通過統(tǒng)計(jì),確定緩沖區(qū)寬度為176 m,共獲得9 148條交通事故點(diǎn)的路段匹配結(jié)果.
本文首先對東莞市交通事故數(shù)據(jù)及道路網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行預(yù)處理,將交通事故點(diǎn)匹配至相應(yīng)路段;其次,選取洛倫茲曲線及基尼系數(shù)定性、定量分析事故聚集特征,在自然間斷點(diǎn)分級法的基礎(chǔ)上引入事故嚴(yán)重程度指數(shù)Si,將一周分為工作日、休息日,1 d分為00:00—06:00、06:00—12:00、12:00—18:00、18:00—24:00 4個(gè)時(shí)段,對比分析加權(quán)Si前后,不同時(shí)段下道路網(wǎng)絡(luò)的事故時(shí)空分布特性. 具體研究框架如圖2所示.
圖2 研究框架
作為研究國民收入在國民之間的分配不均等問題的坐標(biāo)圖形和分析指標(biāo),洛倫茨曲線與基尼系數(shù)已被廣泛應(yīng)用于經(jīng)濟(jì)社會發(fā)展的各個(gè)領(lǐng)域[28]. 本文采用洛倫茲曲線與基尼系數(shù)分析事故在道路網(wǎng)絡(luò)中的聚集特征,事故洛倫茨曲線是根據(jù)事故累積百分比和道路網(wǎng)絡(luò)累積百分比繪制的曲線,定性刻畫了事故分布的不均勻程度. 由洛倫茲曲線可計(jì)算得出基尼系數(shù),基尼系數(shù)的取值位于0~1之間,且越接近1時(shí)事故聚集程度越高[29],見式(1):
(1)
式中,Mi為第i個(gè)道路網(wǎng)絡(luò)的事故累積百分比;Ni為對應(yīng)道路網(wǎng)絡(luò)的累積百分比.
自然間斷點(diǎn)分級法基于數(shù)據(jù)中固有的自然分組,對相似值進(jìn)行最恰當(dāng)?shù)姆旨?并使各個(gè)類之間的差異最大化[30],已被廣泛應(yīng)用于空間數(shù)據(jù)分類[31-33].本文采用自然間斷點(diǎn)分級法劃分道路網(wǎng)絡(luò)中的事故熱點(diǎn)分布等級,同時(shí)引入事故嚴(yán)重程度指數(shù),分析事故時(shí)空分布特征.為區(qū)分事故嚴(yán)重程度,參考我國道路交通事故等級的相關(guān)標(biāo)準(zhǔn),根據(jù)傷亡人數(shù)和經(jīng)濟(jì)損失計(jì)算事故嚴(yán)重程度指數(shù),由于東莞市交通事故數(shù)據(jù)中包含每次事故的死亡人數(shù)、受傷人數(shù),缺乏經(jīng)濟(jì)損失數(shù)據(jù),見式(2):
Si=A1W+A2Q+A3Z
(2)
式中,Si為第i起事故的事故嚴(yán)重程度指數(shù);W為死亡人數(shù);Q為受傷人數(shù);A1、A2為死亡人數(shù)、受傷人數(shù)的權(quán)重系數(shù),設(shè)置為0.5、0.1;A3為經(jīng)濟(jì)損失的權(quán)重系數(shù),設(shè)置為0.05;Z為是否為財(cái)產(chǎn)損失事故,若為財(cái)產(chǎn)損失事故,則取1,若為死亡事故或傷人事故,取0.
根據(jù)交通事故點(diǎn)的道路網(wǎng)絡(luò)匹配結(jié)果,統(tǒng)計(jì)每一路段包含的交通事故數(shù),以每10起事故為統(tǒng)計(jì)區(qū)間將其分成13類,得到道路網(wǎng)絡(luò)上的事故分布情況,如圖3所示. 可以看出,0~10起區(qū)間內(nèi)的路段一共有1 876條,占路段總數(shù)的87.91%,而交通事故數(shù)大于40起區(qū)間內(nèi)分布的路段均為個(gè)位數(shù),呈斷崖式減少.
圖3 道路網(wǎng)絡(luò)事故分布
根據(jù)道路網(wǎng)絡(luò)事故數(shù)量繪制洛倫茨曲線,得到結(jié)果如圖4所示. 同時(shí),計(jì)算得到基尼系數(shù)為0.89,說明道路網(wǎng)絡(luò)中不同路段上的交通事故數(shù)差距較大,絕大部分交通事故僅聚集在極少路段中,交通事故在道路網(wǎng)絡(luò)中的聚集程度很高.
圖4 道路網(wǎng)絡(luò)事故洛倫茲曲線
針對道路網(wǎng)絡(luò),將1 d分為00:00—06:00、06:00—12:00、12:00—18:00、18:00—24:00 4個(gè)時(shí)段,分別繪制交通事故數(shù)和對其加權(quán)Si后的時(shí)空熱點(diǎn)分布圖,通過分級設(shè)色可視化自然間斷點(diǎn)分級法劃分后的事故熱點(diǎn)等級,如圖5~8所示. 可以看到,在工作日中,由于夜晚睡眠和白天工作,00:00—06:00、12:00—18:00的事故量較小、熱點(diǎn)路段較少;受早高峰影響06:00—12:00事故熱點(diǎn)路段有所增加;18:00—24:00,多個(gè)等級為高的交通事故熱點(diǎn)分布于東莞市各地. 在道路網(wǎng)絡(luò)中部分路段出現(xiàn)了熱點(diǎn)聚集,如虎門港高速及其周邊的西坊路、濱海大道、京港澳高速等. 而加權(quán)Si后,道路網(wǎng)絡(luò)中的事故熱點(diǎn)路段明顯減少,說明工作日雖易發(fā)生交通事故,但大多數(shù)事故的嚴(yán)重程度較低.
圖5 工作日道路網(wǎng)絡(luò)事故熱點(diǎn)分布
圖6 加權(quán)Si后的工作日道路網(wǎng)絡(luò)事故熱點(diǎn)分布
圖7 休息日道路網(wǎng)絡(luò)事故熱點(diǎn)分布
圖8 加權(quán)Si后的休息日道路網(wǎng)絡(luò)事故熱點(diǎn)分布
在休息日中,等級為高的事故熱點(diǎn)路段整體較少并稀疏分布于不同時(shí)段,其中包含位于東莞市人民政府附近的體育路以及位于珠三角環(huán)線高速旁的長恩路,以及虎門鎮(zhèn)內(nèi)的懷林路、上南路等. 與工作日不同的是,休息日加權(quán)Si后道路網(wǎng)絡(luò)中熱點(diǎn)路段開始增多,主要體現(xiàn)在0~6時(shí),其中新星路發(fā)生過1起事故嚴(yán)重程度指數(shù)為2的特大交通事故、塘龍中路發(fā)生過1起事故嚴(yán)重程度指數(shù)為1.5的特大交通事故.
從定性的角度觀察洛倫茲曲線發(fā)現(xiàn),交通事故在道路網(wǎng)絡(luò)上的分布均呈現(xiàn)出聚集性,而從定量的角度計(jì)算基尼系數(shù),得到道路網(wǎng)絡(luò)基尼系數(shù)為0.89,屬于“差距懸殊”[29],說明道路網(wǎng)絡(luò)中事故聚集現(xiàn)象明顯,可將交通事故預(yù)防的視角聚焦于這一空間尺度,通過熱點(diǎn)分析明確道路網(wǎng)絡(luò)中的事故高發(fā)路段,以此為基礎(chǔ),后續(xù)可著重調(diào)查這部分路段的事故原因并采取相應(yīng)措施,如:對熱點(diǎn)路段進(jìn)行監(jiān)測,排除可能引發(fā)交通事故的道路因素(如道路線性設(shè)計(jì)、路面破損、標(biāo)志標(biāo)線不清晰等)及環(huán)境因素(如照明不佳、存在視線遮擋物等),并設(shè)立警示牌提醒駕駛員小心駕駛. 若某條路段常因超速引發(fā)交通事故,則可通過調(diào)整路段限速、增設(shè)測速儀等措施避免事故發(fā)生,從而有針對性的達(dá)到較好事故預(yù)防效果.
加權(quán)Si前后事故熱點(diǎn)則分布在不同路段上,呈現(xiàn)出明顯差異,加權(quán)Si前后,事故熱點(diǎn)分布存在差異,具體表現(xiàn)為工作日事故熱點(diǎn)路段數(shù)明顯減少,事故熱點(diǎn)等級較高的路段數(shù)也有所降低;休息日事故熱點(diǎn)路段增多且部分路段熱點(diǎn)等級升高.
工作日中,加權(quán)Si前,位于虎門鎮(zhèn)的虎門港高速、濱海大道、西坊路;位于厚街鎮(zhèn)的康樂南路;位于清溪鎮(zhèn)的清溪廣場路等路段在多個(gè)不同時(shí)段呈現(xiàn)事故熱點(diǎn). 加權(quán)Si后,以上路段的熱點(diǎn)等級降低,說明該部分路段雖時(shí)有事故發(fā)生,但事故總體嚴(yán)重程度不高. 可加大監(jiān)督執(zhí)法力度,增設(shè)交通攝像頭、測速儀等,進(jìn)一步規(guī)范駕駛員駕駛行為,同時(shí)可通過完善隔離設(shè)施,優(yōu)化行駛環(huán)境.
休息日中,出現(xiàn)新星路、塘龍中路等事故數(shù)少但嚴(yán)重程度高的路段,同時(shí)有部分路段的事故熱點(diǎn)等級升高,說明少數(shù)路段交通事故數(shù)量不多但事故較為嚴(yán)重,加權(quán)Si后該部分路段呈現(xiàn)事故熱點(diǎn),可重點(diǎn)查明事故原因,關(guān)注易引發(fā)嚴(yán)重交通事故潛在因素,對路段采取針對性事故防范措施,降低重復(fù)發(fā)生嚴(yán)重事故的可能性.
針對東莞市2019-01-01—2020-12-31交通事故,本文通過洛倫茲曲線與基尼系數(shù)定性、定量地分析事故聚集特征,引入事故嚴(yán)重程度指數(shù)Si,利用自然間斷點(diǎn)分級法,分析道路網(wǎng)絡(luò)中的事故時(shí)空熱點(diǎn)分布情況,主要結(jié)果如下:
1)交通事故在道路網(wǎng)絡(luò)中呈現(xiàn)出明顯聚集性,大部分交通事故聚集在少數(shù)路段中,工作日中主要包含虎門港高速、濱海大道、西坊路、沿江高速等事故熱點(diǎn)路段,休息日中主要包含長安隧道、濱江東路等事故熱點(diǎn)路段,總體而言,休息日的熱點(diǎn)路段數(shù)量少于工作日.
2)加權(quán)Si會對道路網(wǎng)絡(luò)上的事故熱點(diǎn)分布結(jié)果產(chǎn)生一定影響,加權(quán)Si后,工作日事故熱點(diǎn)路段明顯減少,虎門港高速、濱海大道等路段事故熱點(diǎn)等級降低,休息日事故熱點(diǎn)路段增多,出現(xiàn)了新星路、塘龍中路等事故數(shù)少但事故嚴(yán)重程度高的路段.
此外,通過觀察熱點(diǎn)路段的道路類型及周邊環(huán)境發(fā)現(xiàn):事故熱點(diǎn)路段中,各鎮(zhèn)街一般城市道路數(shù)量最多,其中部分事故地點(diǎn)位于道路交叉口附近;其后依次為國省道、城市快速路、高速公路. 同時(shí),熱點(diǎn)路段周邊主要分布有景區(qū)、公園、產(chǎn)業(yè)園、工業(yè)園、公司、工廠、學(xué)校、住宅區(qū)、商業(yè)城等. 將道路類型及周邊環(huán)境等因素作為特征輸入,通過對比學(xué)習(xí)模型識別事故熱點(diǎn)相似路段,可為交通事故預(yù)防提供參考.
本文仍存在一定不足. 首先,本文采用自然間斷點(diǎn)分級法在道路網(wǎng)絡(luò)上得到分散的熱點(diǎn)路段,事實(shí)上,一條路段上的交通狀況(如交通擁堵)會沿著道路網(wǎng)絡(luò)傳播至相鄰路段,后續(xù)可探索采用其他時(shí)空分析方法,在道路網(wǎng)絡(luò)上獲取連續(xù)的熱點(diǎn)分布變化.