馮戰(zhàn)雨, 張健,3, 姜涵
(1.東南大學江蘇省城市智能交通重點實驗室, 江蘇 南京 211189; 2.東南大學交通學院, 江蘇 南京 211189;3.西藏大學工學院, 西藏 拉薩 850000)
近年來,隨著共享經(jīng)濟的快速發(fā)展以及中國“雙碳”政策的施行,作為一類特殊交通群體的電動自行車因其突出的經(jīng)濟性和便利性已日趨大眾化[1]。但在其給交通參與者帶來出行便利的同時,也增加了與機動車發(fā)生交通沖突乃至事故的概率,對道路交通安全造成了嚴重威脅。據(jù)中國統(tǒng)計年鑒公布的數(shù)據(jù)顯示,中國2020年的電動自行車完成產(chǎn)量2966.1萬輛,同比增長29.7%。發(fā)生涉及電動車的造成人員傷亡的交通事故19.88萬起,致1.99萬人死亡[2]。在這些非機動車事故中,由騎行分心行為直接或間接導致的事故占了相當一部分比重。以杭州市為例,在近3年來杭州轄區(qū)的電動自行車交通事故中近40%和騎行分心行為有關[3]。騎行分心行為,即騎行人員在騎行過程因為各種原因而產(chǎn)生的分心操作進而影響騎行的行為[4]。如在騎行過程中使用手機,不僅會阻礙騎行者對動態(tài)道路環(huán)境的信息收集,還會造成騎行者的反應能力及操控穩(wěn)定性的下降,進而造成事故風險的增加[5]。騎行分心行為在現(xiàn)階段道路交通系統(tǒng)中已經(jīng)較為普遍,但總結現(xiàn)階段國內(nèi)外研究,針對騎行分心行為這一對象的研究仍然較少[6]。因此在當前背景下,亟需關注電動自行車騎行者在分心騎行狀態(tài)下的安全現(xiàn)狀與風險成因。
現(xiàn)有圍繞電動自行車分心事故的研究主要包括電動自行車事故特性與分心行為分析兩方面。在電動自行車事故特性方面,許霖歡等[7]以杭州市電動自行車事故數(shù)據(jù)為基礎,從交通事故時間、空間等方面進行了統(tǒng)計分析,得到了影響電動自行車交通事故的主要因素,并提出了針對性對策建議;于昊等[8]總結了近年來全國城市道路中不同類型電動自行車的交通事故特征的區(qū)別;馬景峰等[9]基于既有事故數(shù)據(jù),選取時空、環(huán)境、車型等潛在影響因素,采用多項Logistic模型、有序Logistic模型、廣義有序Logistic模型,量化分析了各因素對事故嚴重性影響的顯著性與差異性;李英帥等[10]基于某市的電動自行車交通事故歷史數(shù)據(jù),通過描述性統(tǒng)計分析,利用隨機森林模型對電動自行車騎行者受傷嚴重程度進行預測,得到了各潛在因素對電動自行車事故嚴重性的影響程度。在分心行為分析方面,Stelling-Konczak等[11]指出在電動自行車騎行過程中聽音樂或打電話,均會影響電動自行車騎行人對周圍環(huán)境的感知能力。Zheng等[12]通過對電動自行車騎行者進行問卷調(diào)查,分析了在騎行過程中使用手機對騎行人控制水平的影響;張存保等[13]針對信號交叉口處行人使用手機對其安全產(chǎn)生不利影響的問題,以實測數(shù)據(jù)為基礎,對行人使用與不使用手機情況下的過街行為與安全性差異進行統(tǒng)計分析;Ren等[14]用易受傷害的道路使用者(行人、自行車手和摩托車手)作為研究對象,采用案例交叉研究設計,通過對在道路參與者進行抽樣調(diào)查,發(fā)現(xiàn)在走路或在騎行過程中,分心行為會增加道路傷害的風險。
總結以往學者的研究,從事故數(shù)據(jù)獲取的角度來看,由于中國交通事故具體信息難以獲取,現(xiàn)階段針對電動自行車分心事故的研究大多基于問卷調(diào)查或歷史事故信息所得的原始數(shù)據(jù),獲得的數(shù)據(jù)雖可以較宏觀地反映出騎行過程中的風險概率及交通特性,但難以囊括原始事故過程的豐富信息,尤其是事故所涉及到的分心行為、風險行為及其他潛在因素。從事故數(shù)據(jù)的分析方法來看,Logistic回歸及其衍生模型仍為現(xiàn)階段針對電動自行車事故風險致因分析的主流方法,但模型本身對事故數(shù)據(jù)以及變量自身的特性要求較苛刻,在電動自行車事故數(shù)據(jù)分析過程中較難完全契合。
針對上述研究中存在的不足,本文提出基于視頻數(shù)據(jù)的電動自行車分心事故風險行為研究。通過搜集現(xiàn)階段網(wǎng)絡平臺公布的電動自行車視頻數(shù)據(jù),并全面提取事故特征信息形成原始數(shù)據(jù)集,建立隨機森林模型、邏輯回歸模型、決策樹模型和支持向量機模型進行擬合度對比分析。以最佳模型量化分析各類事故潛在因素對事故嚴重程度影響的顯著性,并依據(jù)數(shù)據(jù)分析結果對道路交通系統(tǒng)中的不同群體提出相應建議。
本文涉及到的事故數(shù)據(jù)來源于各城市交管部門在網(wǎng)絡上發(fā)布的近五年的電動自行車事故視頻。通過在微博、bilibili等網(wǎng)絡平臺,輸入“電動自行車分心”、“騎行分心”“非機動車分心事故”等類似關鍵詞,對交管部門發(fā)布的事故主體為電動自行車的事故報道視頻進行下載,相關事故視頻截圖如圖1所示。每起事故均為相互獨立事件,通過數(shù)據(jù)編碼形成事故數(shù)據(jù)集。
圖1 事故視頻截圖Fig.1 Screenshot of the accident video
對上階段搜集到事故視頻進行數(shù)據(jù)的預處理,遍歷所收集的事故視頻進行篩選,考慮到可能存在事故視頻的重復問題,去除相同的事故視頻,并刪除發(fā)生在2017年前的事故視頻,最終得到2017~2022年的電動自行車事故案例共計468例。
《道路交通管理信息采集規(guī)范》[15]將交通事故嚴重程度分為4個層次:死亡事故、重傷事故、輕傷事故和財產(chǎn)損失事故。依據(jù)此標準對事故信息進行提取可得到財產(chǎn)損失、輕傷、重傷、死亡事故數(shù)分別為57,169,148和94起,其占比分別為12.1%,36.1%,31.6%和20.2%。考慮到現(xiàn)階段國內(nèi)外對事故傷害程度較多采用2分類方法[16-17],即將事故結果歸類為“未發(fā)生”與“發(fā)生”。本文對事故嚴重程度等級進行重新劃分,將財產(chǎn)損失事故與輕傷事故歸為輕微事故;重傷和死亡事故歸為嚴重事故。
電動自行車分心事故信息具有多維度復雜性,本文從時間、空間、事故雙方、事故形態(tài)等共6個方面選取了12個因素進行分析,各因素描述性計數(shù)統(tǒng)計結果如表1所示。
表1 事故因素描述性統(tǒng)計結果Tab.1 Descriptive statistical results of accident factors
為了準確分析出從各類事故潛在因素對電動自行車事故嚴重度的影響機理,需構建合理事故因素模型對所提取數(shù)據(jù)進行分析。選取事故發(fā)生時間、事故空間位置、分心行為、風險行為、事故雙方、事故形態(tài)、保護設備為自變量,以事故嚴重程度作為因變量,建立事故分析模型。選取隨機森林模型、Lo-gistic回歸模型、決策樹模型和支持向量機模型進行事故因素分析。模型訓練目標為事故等級,對于模型訓練與測試,選取75%的數(shù)據(jù)進行訓練,25%數(shù)據(jù)進行測試,尋找模型的最優(yōu)參數(shù)。使用正確預測的概率Precision作為衡量分析準確度的評價指標:
式中TP(True Positive)指正確預測到的正例的數(shù)量,F(xiàn)P(False Positive)指把負例預測成正例的數(shù)量。
隨機森林[18]是一個包含多棵決策樹的分類模型,不需要測算就能夠處理二分特征、分類特征、數(shù)值特征的數(shù)據(jù),并且提供一個很好的特征重要度的選擇指標。隨機森林分類模型的主要參數(shù)包括內(nèi)部節(jié)點再劃分所需最小樣本數(shù)min_samples_split,最大深度max_depth和樹的個數(shù)n_estimators。
Logistic回歸模型是一種廣義線性回歸模型,該模型假設因變量服從伯努利分布,在線性回歸基礎上利用Sigmoid映射函數(shù)來實現(xiàn)。其主要用于分類。它在線性回歸的基礎上加入了Sigmoid函數(shù),將線性回歸的結果輸入至Sigmoid函數(shù)中,通過Sigmoid函數(shù)引入了非線性因素,可以適用于分類問題。Logistic回歸模型的重要參數(shù)主要包括penalty和C,分別代表正則化強度的方式和系數(shù)。
決策樹模型是一種常見的分類預測模型,該模型的核心思想是基于樹結構對數(shù)據(jù)進行劃分,它包含一個根節(jié)點、若干個內(nèi)部節(jié)點和葉子節(jié)點。其中根節(jié)點包含全部的樣本。每個內(nèi)部節(jié)點代表了一個屬性測試,每個子節(jié)點對應于一個決策結果,模型的重要參數(shù)主要包括內(nèi)部節(jié)點再劃分所需最小樣本數(shù)min_samples_split,最大深度max_depth和特征選取方法criterion。
支持向量機(Support Vector Machine)[19]是一種二類分類模型,它的基本模型是定義在特征空間上的間隔最大的線性分類器,該模型的重要參數(shù)主要包括懲罰系數(shù)C,核函數(shù) kernel和核函數(shù)參數(shù)。
在Python3.7環(huán)境下訓練模型所得到的最優(yōu)參數(shù)調(diào)整結果如表2所示。
表2 模型最優(yōu)參數(shù)調(diào)整結果Tab.2 Model optimal parameter adjustment results
四種模型的ROC曲線依據(jù)在測試集中的分析精準度結果分別如圖2和表3所示。隨機森林、Lo-gistic回歸、決策樹和支持向量機模型的AUC指標均保持在80%以上,表明上述模型均能保持良好的分析效果。其中隨機森林模型的AUC值為0.937,明顯高于另外三類模型,并且在模型分析精準度上,隨機森林模型的準確率為88.0%,同樣高于另外三類模型。故本文最終選定隨機森林模型對事故數(shù)據(jù)進行分析。
表3 模型預測正確率結果Tab.3 Model prediction accuracy results
圖2 ROC曲線對比圖Fig.2 Comparison of ROC curves
考慮到初步提取的事故數(shù)據(jù)集包含的特征維度較多,有必要在諸多因素中選擇對事故結果影響較大的特征,以便分析對事故進行進一步的分析。基尼系數(shù)作為隨機森林的核心指標之一,可以計算出特征重要程度。將變量按照模型輸出重要性排名進行降序排序,如圖3所示,選取預測重要度占比超過5%的變量進行分析。
圖3 各變量預測重要程度Fig.3 Predicted importance of each variable
由隨機森林輸出模型的各變量預測重要程度圖可以看出:分心行為對于事故等級的影響程度占比為18.4%,顯著高于其他預測變量。逆向行駛、闖紅燈、并排騎行、占用機動車道四類風險行為對事故等級的影響程度占比分別為12.7%,11.3%,7.8%和7.5%,均超過了5%。事故涉及雙方、事故形態(tài)、事故位置三類變量對于事故等級的影響程度占比分別為10.4%,8.0%和6.1%,同樣超過5%。
考慮到各個因素之間可能存在關聯(lián)關系,并且結合原始數(shù)據(jù)類型均為分類型變量,因此考慮分析事故的二維頻率關系,進而得出變量之間關聯(lián)程度的強弱。事故頻率次數(shù)的二維熱力圖如圖4所示,由圖4可以看出:
圖4 事故頻率次數(shù)熱力圖Fig.4 Thermal diagram of accident frequency
當電動自行車使用者在騎行過程中出現(xiàn)占用機動車道、未戴頭盔、手機分心、闖紅燈或逆向行駛等危險駕駛行為時,單項因素造成事故程度嚴重的概率往往會相對較高。
當電動自行車使用者在騎行過程中使用手機,出現(xiàn)占用機動車道、未戴頭盔、手機分心、闖紅燈或逆向行駛這些危險駕駛行為時,造成事故嚴重的概率會相對較高。
當電動自行車使用者在騎行過程中出現(xiàn)其他分心行為時,與手機分心行為相似,當涉及到闖紅燈、占用機動車道、為佩戴頭盔等風險行為時,事故程度嚴重的概率也會相對偏高。
在電動自行車與小型機動車之間造成嚴重交通事故中,事故形態(tài)往往以側(cè)面相撞較多,并且往往伴隨著電動自行車使用者闖紅燈或占用機動車道行駛行為。
綜上所述,對于電動自行車群體來說,首先需要對其開展對應的安全教育培訓,規(guī)范安全意識,減少在騎行過程出現(xiàn)的各種騎行分心現(xiàn)象。同時強調(diào)在騎行過程中應觀察自身周邊環(huán)境尤其道路中車輛運行狀態(tài),在此基礎上減少在騎行過程中突然變道或不規(guī)律行駛,與大中型車輛并肩騎行的現(xiàn)象,并在騎行過程中要正確佩戴安全頭盔。
對機動車駕駛員群體來說,需要強化對經(jīng)驗尚淺的機動車駕駛員的安全意識教育,強調(diào)在交叉口周邊或未規(guī)劃機動車道路段時對周邊環(huán)境的觀察,提前減速,避免事故的發(fā)生。尤其是大型車輛駕駛員,由于大型車輛在轉(zhuǎn)向時會存在視覺盲區(qū),往往造成事故嚴重程度更高。要避免與電動自行車交通群體的并肩、并排行駛的現(xiàn)象,以免造成同向刮擦類型的事故。
對于行政執(zhí)法人員來說,需要加大道路執(zhí)法力度,對電動自行車騎行者不佩戴頭盔、載人騎行等風險情況進行嚴格執(zhí)法;在道路交通流量較大的區(qū)域增添護欄及標志標線,并逐步推動構建非機動車道路網(wǎng),實現(xiàn)機非隔離,改善電動自行車騎行者的交通環(huán)境。
本文基于2017~2022年的468起電動自行車分心事故視頻,從事故的時間特性、空間特性、交通參與者特性、分心行為、風險行為及事故嚴重程度六個方面對所收集視頻進行了事故信息的提取。采用隨機森林模型、Logistic回歸模型、決策樹模型和支持向量機模型進行擬合度對比分析,模型擬合度結果表明使用隨機森林模型量化分析各類潛在事故因素最佳。使用隨機森林模型對各因素進行排序,并基于排序結果分析了變量間的潛在關聯(lián)關系。結果表明,電動自行車分心事故中,影響騎行人受傷害程度最主要的5類因素分別為:分心行為、逆向行駛、闖紅燈、事故雙方、事故形態(tài),存在明顯關聯(lián)關系的變量主要為手機分心行為、逆向行駛、占用機動車道及闖紅燈等。并依據(jù)該分析結果對道路交通系統(tǒng)中的不同群體提出了相應建議。
未來在針對涉及電動自行車分心事故中,可以擴充研究數(shù)據(jù)規(guī)模,并且將更多與事故嚴重程度存在潛在聯(lián)系的事故因素如天氣狀況、行駛速度等納入研究范疇中,以探討其對電動自行車交通事故的傷害程度。