劉強(qiáng),嚴(yán)修,謝謙,3,解孝民
(1.中山大學(xué),智能工程學(xué)院,廣東 深圳 518107;2.中山大學(xué)-廣汽研究院智慧交通與人工智能聯(lián)合實(shí)驗(yàn)室,廣州 510006;3.廣東省海洋工程施工與水上應(yīng)急救援工程技術(shù)中心,廣州 510006;4.廣東瑪西爾電動(dòng)科技有限公司,廣東 肇慶 523268)
作為交通系統(tǒng)的重要組成部分,城市公交的安全性備受關(guān)注。道路公交系統(tǒng)是由人、車、路、環(huán)境等多個(gè)因素組成的復(fù)雜系統(tǒng),其安全性與多方面因素相關(guān)。因此,探究公交安全事故的影響因素對保障公交安全具有重要意義[1]。
國內(nèi)外學(xué)者針對公交安全事故影響因素展開了相關(guān)研究[2]。Celik等[3]將公交事故嚴(yán)重程度分為有死亡、受重傷、受輕傷和僅財(cái)產(chǎn)損失這4類,采用有序Logit模型分析環(huán)境特征和道路特征等因素對加納公交事故嚴(yán)重程度的影響發(fā)現(xiàn),夜間、交叉口等因素增加了更嚴(yán)重事故發(fā)生的概率。Reuben等[4]將公交事故嚴(yán)重程度分為有死亡、受重傷、受輕傷和僅財(cái)產(chǎn)損失這4類,采用隨機(jī)參數(shù)模型分析駕駛員特征、環(huán)境特征和道路特征等因素對發(fā)展中國家公交事故嚴(yán)重程度的影響發(fā)現(xiàn),夜晚和酒駕易導(dǎo)致更嚴(yán)重的事故。顧宏艷等[5]將公交事故嚴(yán)重程度分為致命事故、嚴(yán)重事故和輕傷事故這3 類,采用有序Logit 模型分析駕駛員特征、環(huán)境特征和車輛特征等因素對英國公交事故嚴(yán)重程度的影響發(fā)現(xiàn),事故嚴(yán)重程度與是否工作日和白天等因素顯著相關(guān)。林慶豐等[6]將公交事故分為有人員死亡和無人員死亡,采用二元logistic模型分析駕駛員特征、環(huán)境特征和事故特征等因素對廣東省公交事故嚴(yán)重程度的影響發(fā)現(xiàn),是否高峰期和路口路段類型對車輛事故嚴(yán)重程度具有顯著影響。
綜上所述,國內(nèi)外學(xué)者在分析公交事故嚴(yán)重程度的影響因素中取得了豐富成果,發(fā)現(xiàn)駕駛員特征、環(huán)境特征、道路車輛特征和事故特征等因素對公交事故嚴(yán)重程度具有一定影響。另外,合理的事故嚴(yán)重程度分類是探索其影響因素的重要基礎(chǔ),然而這些研究往往直接根據(jù)是否死亡或受傷對事故嚴(yán)重程度進(jìn)行定性分類,通常分為2類(有死亡和無死亡)[6]、3 類(有死亡、僅受傷和無傷亡)[2]或4 類(有死亡、受重傷、受輕傷和無傷亡)[4,7]。這種定性分類方法未考慮死亡受傷的人數(shù)和財(cái)產(chǎn)損失數(shù)目,顯然存在一定局限性。在定性分類基礎(chǔ)上尋求更合理、精確的事故嚴(yán)重程度量化和分類方法值得探索。
針對此問題,本文以佛山市2021 年全年的公交事故數(shù)據(jù)為例,嘗試采用事故綜合強(qiáng)度評價(jià)法量化公交事故嚴(yán)重程度,并運(yùn)用K-means對事故嚴(yán)重程度進(jìn)行聚類,以將其進(jìn)行有序分類。運(yùn)用有序Logit 回歸算法對公交事故嚴(yán)重程度進(jìn)行建模分析,探究公交事故嚴(yán)重程度的顯著影響因素。
基于佛山市某公交企業(yè)提供的2021 年全年記錄的事故數(shù)據(jù),將預(yù)處理后的156起事故數(shù)據(jù)作為本文樣本數(shù)據(jù)。每條事故數(shù)據(jù)包括公交車駕駛員信息、車輛特征、道路環(huán)境特征、事故特征、人員傷亡情況和財(cái)產(chǎn)損失情況等信息。
道路公交系統(tǒng)是由人、車、路和環(huán)境等多個(gè)因素組成的復(fù)雜系統(tǒng),許多方面的因素都可能導(dǎo)致交通事故的發(fā)生[8]。根據(jù)相關(guān)文獻(xiàn)研究,結(jié)合公交運(yùn)行特點(diǎn)[9-10],選取環(huán)境特征、駕駛員特征、道路車輛特征和事故特征這4 個(gè)方面共17 個(gè)因素作為自變量。為便于后續(xù)Logit 建模,對各變量的不同分類進(jìn)行賦值,如表1所示。
表1 自變量的定義和賦值Table 1 Definitions of variables
合理的公交事故嚴(yán)重程度分類是探索其影響因素的重要基礎(chǔ)。傳統(tǒng)四分類方法直接定性地將事故嚴(yán)重程度分為有死亡、有重傷、有輕傷和僅財(cái)產(chǎn)損失,存在一定局限性。鑒于此,本文采用交通工程學(xué)領(lǐng)域中事故綜合強(qiáng)度法定量計(jì)算公交事故嚴(yán)重程度,事故綜合強(qiáng)度法公式[11]為
式中:V為事故綜合強(qiáng)度指標(biāo);M為當(dāng)量死亡人數(shù)(人);R為人口數(shù)(人);C為當(dāng)量小汽車數(shù)(輛);L為不同道路條件下的修正系數(shù);nd為死亡人數(shù)(人);ns為重傷人數(shù)(人);nm為輕傷人數(shù)(人);e為直接經(jīng)濟(jì)損失(萬元)。
由于樣本數(shù)據(jù)涉及的事故均發(fā)生在佛山市境內(nèi),故人口數(shù)保持一致,可不予計(jì)算;道路修正系數(shù)難以準(zhǔn)確標(biāo)定且差距較小,未予以計(jì)算,后續(xù)應(yīng)進(jìn)行改善。部分公交事故的基本情況和事故綜合強(qiáng)度計(jì)算結(jié)果如表2所示。
表2 部分公交事故情況及事故綜合強(qiáng)度Table 2 Information of some bus accidents and comprehensive intensity of accidents
基于事故綜合強(qiáng)度,運(yùn)用K-means聚類對事故嚴(yán)重程度進(jìn)行分類。K-means 聚類算法因其簡便高效的特點(diǎn)在聚類領(lǐng)域得到廣泛應(yīng)用。常見的K-means聚類效果評價(jià)指標(biāo)為平均輪廓系數(shù),其計(jì)算公式[12]為
式中:a(w) 為樣本w與同類別中其他樣本的平均距離;b(w)為樣本w與它距離最近的不同類別中所有樣本的平均距離。
K值(分類簇的數(shù)量)是K-means聚類算法的關(guān)鍵參數(shù),其對K-means 的聚類效果有顯著影響[12]。為探究合適的K值,分別取K值為3、4、5對事故綜合強(qiáng)度進(jìn)行分類,并計(jì)算對應(yīng)平均輪廓系數(shù),結(jié)果如表3所示。3種K值下平均輪廓系數(shù)均接近1,表明采用K-means聚類對樣本數(shù)據(jù)分類效果較好;同時(shí)K取值為4 和5 時(shí),平均輪廓系數(shù)較大且接近。因此,為便于計(jì)算,取K值為4。
表3 不同K 值下的STable 3 Value of S under different values of K
K值為4 時(shí)的分類結(jié)果如圖1 所示。由圖1 可知,4 類公交事故綜合強(qiáng)度的均值、中值和25%~75%范圍均具有顯著差異且逐漸增大,表明達(dá)到了分類目的。
圖1 事故嚴(yán)重程度分類Fig.1 Classification of accident severity
事故綜合強(qiáng)度+K-means分類結(jié)果與傳統(tǒng)四分類法結(jié)果的對比情況如圖2 所示。由圖2 可知,事故嚴(yán)重程度為極嚴(yán)重和嚴(yán)重的事故數(shù)量差距較小,而事故嚴(yán)重程度為一般嚴(yán)重和不太嚴(yán)重的事故數(shù)量差距較大。一方面,人員受輕傷可能不比造成大量財(cái)產(chǎn)損失的事故更嚴(yán)重,因此傳統(tǒng)方法對一般嚴(yán)重和不太嚴(yán)重的事故分類結(jié)果存在較大偏差;另一方面,事故綜合強(qiáng)度+K-means分類結(jié)果中,嚴(yán)重程度越高的事故數(shù)量越少,符合事物的普遍規(guī)律。因此,事故綜合強(qiáng)度+K-means 分類結(jié)果與實(shí)際情況更相符。
圖2 兩種方法分類結(jié)果對比Fig.2 Comparison of classification results by two methods
選取合適的Logit回歸模型是有效分析公交事故嚴(yán)重程度影響因素的關(guān)鍵[13]。區(qū)別于其他Logit模型,有序Logit 模型考慮了因變量的序次特征。在2.2節(jié)中,公交車事故嚴(yán)重程度被分為4類,即分類后的公交車事故嚴(yán)重程度具備明顯的序次特征。因此,有序Logit 模型適合用來建立公交車事故嚴(yán)重程度模型,分析不同因素對公交車事故嚴(yán)重程度影響情況。有序Logit模型為
式中:xi為第i個(gè)影響因素;y為公交事故嚴(yán)重程度;pj為y取值小于等于j的概率;αj為y取值為j的回歸常數(shù)項(xiàng);βi為xi的回歸系數(shù);β為βi構(gòu)成的向量;x為xi構(gòu)成的向量;n為影響因素的個(gè)數(shù)。
由于選取的影響因素較多,為排除因素之間存在強(qiáng)相關(guān)性而對模型準(zhǔn)確性造成影響,需對選定的影響因素進(jìn)行共線性檢驗(yàn)[14]。方差膨脹因子VIF是衡量自變量X引起多重共線性程度的常用指標(biāo)。采用SPSS26 對選取的17 個(gè)自變量進(jìn)行多重共線性檢驗(yàn),結(jié)果如表4所示。
表4 多重共線性檢驗(yàn)Table 4 Multicollinearity test
研究表明,當(dāng)VIF 大于等于10 時(shí),認(rèn)為變量之間存在明顯的多重共線性[14]。從表4 結(jié)果可以看出,17 個(gè)自變量的VIF 均明顯小于10,即它們之間不存在多重共線性,均可用作模型的自變量。
分別將事故綜合強(qiáng)度+K-means分類法和傳統(tǒng)四分類法結(jié)果作為因變量進(jìn)行有序Logit 回歸建模,采用SPSS26 對模型求解,并進(jìn)行平行線檢驗(yàn)。檢驗(yàn)得到兩模型的顯著性水平均大于0.05,即符合平行線檢驗(yàn),因此兩模型都是有效的。同時(shí),計(jì)算得到兩模型的擬合優(yōu)度,結(jié)果如表5所示。根據(jù)表5可知,兩個(gè)模型的兩種擬合優(yōu)度檢驗(yàn)指標(biāo)的顯著性水平均為1>0.05,故兩個(gè)回歸模型擬合效果較優(yōu)。而基于事故綜合強(qiáng)度+K-means的有序回歸模型的Person顯著性水平遠(yuǎn)大于傳統(tǒng)四分類法,說明前者具有更高的擬合優(yōu)度。
表5 模型擬合優(yōu)度Table 5 Model goodness-of-fit
3.4.1 模型參數(shù)估計(jì)
兩個(gè)模型下每個(gè)自變量的回歸參數(shù)結(jié)果如表6所示。表6中,顯著性水平P值小于0.05時(shí),表示該自變量對公交車事故嚴(yán)重程度具有顯著影響;β值為正表明該自變量能增大因變量的值,β值為負(fù)表明該自變量能減小因變量的值。
表6 有序Logit回歸模型結(jié)果Table 6 Results of ordered Logit regression model
將事故綜合強(qiáng)度+K-means分類法的結(jié)果作為因變量的有序Logit回歸結(jié)果顯示,是否高峰期、是否白天、天氣、是否換道、是否超速、是否加速度過大和是否進(jìn)出站等因素是影響公交事故嚴(yán)重程度的顯著因素。而將傳統(tǒng)四分類法結(jié)果作為因變量的有序Logit回歸結(jié)果顯示,只有高峰、區(qū)域和是否超速對公交事故嚴(yán)重程度具有顯著影響,其余因素均無顯著影響。
根據(jù)相關(guān)研究結(jié)果[1-10],天氣、超速和換道行為等因素確實(shí)會(huì)對事故嚴(yán)重性造成顯著影響。按照傳統(tǒng)四分類方法的回歸結(jié)果明顯不符這一結(jié)論,而采用事故綜合強(qiáng)度+K-means 分類方法的回歸結(jié)果與之相符。因此,進(jìn)一步驗(yàn)證了事故綜合強(qiáng)度+K-means 分類方法的合理性,并且進(jìn)一步表明基于事故綜合強(qiáng)度+K-means 分類法的有序Logit模型具有更好的擬合優(yōu)度。
3.4.2 模型計(jì)算結(jié)果驗(yàn)證
為進(jìn)一步驗(yàn)證有序Logit模型的有效性并直觀分析各顯著影響因素的特點(diǎn),統(tǒng)計(jì)包含各顯著影響因素的事故中嚴(yán)重程度為1、2和3、4事故數(shù)量的占比,結(jié)果如圖3所示。由圖3可知,包含高峰、換道、超速、注意力分散和進(jìn)出站等因素的事故中,嚴(yán)重程度為3、4的事故數(shù)量占比遠(yuǎn)高于50%,表明這些因素確實(shí)容易造成嚴(yán)重程度更高的事故。相反,包含白天和晴天因素的事故中,嚴(yán)重程度為3、4的事故數(shù)量低于50%,表明晴天和白天會(huì)減少嚴(yán)重程度更高的事故發(fā)生。因此,統(tǒng)計(jì)分析的結(jié)果與有序Logit 回歸模型結(jié)果相一致,進(jìn)一步驗(yàn)證了采用事故綜合強(qiáng)度+K-means法分類結(jié)果作為因變量建立有序Logit模型的有效性。
圖3 各顯著影響因素中兩種嚴(yán)重程度事故占比Fig.3 Proportion of accidents of two severities among significant influencing factors
基于3.4 節(jié)分析得到的顯著影響因素結(jié)果,采用STATA16 進(jìn)一步計(jì)算各顯著因素對事故嚴(yán)重程度影響的平均邊際系數(shù)以分析各顯著因素對公交事故嚴(yán)重程度的影響程度[15],具體結(jié)果如表7所示。
表7 各顯著影響因素的邊際效應(yīng)Table 7 Marginal effects of each significant influencing factor
高峰會(huì)增大嚴(yán)重程度為3和4的公交車事故的發(fā)生概率,增大的概率分別為9.16%和11.57%;高峰期發(fā)生的事故中嚴(yán)重程度為3和4的事故占比高達(dá)70%。高峰期間,車及行人的流量和密度均顯著增加,常發(fā)生交通擁堵現(xiàn)象,容易發(fā)生更嚴(yán)重的事故。因此,交通管理部門應(yīng)注意高峰時(shí)期的安全管理。
白天會(huì)減小嚴(yán)重程度為3和4的公交車事故的發(fā)生概率,減小的概率分別為17.65%和22.31%;白天發(fā)生的事故中嚴(yán)重程度為3和4的事故占比只有44%。這是因?yàn)榘滋旃饩€充足,駕駛員警惕性高,不易發(fā)生嚴(yán)重事故。相反地,夜晚光線不足,駕駛員警惕性不高,同時(shí)伴有精神狀態(tài)欠佳等情況,導(dǎo)致夜晚容易發(fā)生更嚴(yán)重的事故。因此,公交車駕駛員夜晚行車時(shí)應(yīng)提高警惕。同時(shí),應(yīng)加強(qiáng)路燈的建設(shè)工作。
晴天會(huì)減小嚴(yán)重程度為3和4的公交車事故的發(fā)生概率,減小的概率分別為9.77%和12.34%;晴天發(fā)生的事故中嚴(yán)重程度為3和4的事故占比只有40%。晴天路面狀況良好,不易發(fā)生更嚴(yán)重的事故。相反,雨天路面狀況較為惡劣,導(dǎo)致夜晚更容易發(fā)生嚴(yán)重程度更高的事故。因此,公交車駕駛員雨天行車時(shí)應(yīng)提高警惕。
換道會(huì)增大嚴(yán)重程度為3和4的公交車事故的發(fā)生概率,增大的概率分別為22.99%和29.06%;換道發(fā)生的事故中嚴(yán)重程度為3和4的事故占比高達(dá)85%。若公交車有換道行為,會(huì)導(dǎo)致被超車車輛反應(yīng)時(shí)間不足,造成嚴(yán)重的事故發(fā)生。因此,公交車駕駛員應(yīng)謹(jǐn)慎選擇是否換道,并在換道前仔細(xì)觀察周圍路況。
超速會(huì)增大嚴(yán)重程度為3和4的公交車事故的發(fā)生概率,增大的概率分別為18.97%和23.98%;超速發(fā)生的事故中嚴(yán)重程度為3和4的事故占比高達(dá)63%。公交車速度越大,因安全距離不足越易導(dǎo)致事故的發(fā)生;同時(shí),速度越快,發(fā)生碰撞時(shí)公交車包括乘客吸收的能量越大。因此,公交車車速應(yīng)控制在合理范圍內(nèi),同時(shí)應(yīng)注意和前車保持足夠的安全距離。
加速度過大會(huì)增大嚴(yán)重程度為3和4的公交車事故的發(fā)生概率,增大的概率分別為13.55%和17.13%;加速度過大發(fā)生的事故中嚴(yán)重程度為3和4 的事故占比高達(dá)63%。公交車加速度越大,車內(nèi)乘客越容易受到慣性的作用,故容易出現(xiàn)摔倒的情況,發(fā)生事故;同時(shí),加速度過大也容易與其他車輛避讓不及而發(fā)生嚴(yán)重事故。因此,公交車應(yīng)控制加速度在合理范圍內(nèi),注意車內(nèi)乘客的乘坐安全。
注意力分散會(huì)增大嚴(yán)重程度為3和4的公交車事故的發(fā)生概率,增大的概率分別為24.50%和30.97%;注意力分散發(fā)生的事故中嚴(yán)重程度為3和4 的事故占比高達(dá)81%。駕駛員注意力分散,會(huì)導(dǎo)致對路況的感知能力以及遇到緊急狀況時(shí)的反應(yīng)能力降低,容易發(fā)生嚴(yán)重程度更高的事故。因此,公交企業(yè)應(yīng)加強(qiáng)教育駕駛員在駕駛過程中保持高度集中,同時(shí)應(yīng)注意公交班次安排和司機(jī)調(diào)度的合理性。
進(jìn)出站會(huì)增大嚴(yán)重程度為3和4的公交車事故的發(fā)生概率,增大的概率分別為9.71%和12.27%;同時(shí),進(jìn)出站發(fā)生的事故中嚴(yán)重程度為3 和4 的事故占比高達(dá)67%。進(jìn)出站時(shí),公交車會(huì)進(jìn)行制動(dòng)和加速行為,部分乘客在車廂內(nèi)行走,故更容易發(fā)生嚴(yán)重程度更高的事故。因此,駕駛員進(jìn)出站時(shí)應(yīng)注意,制動(dòng)踏板開度和加速踏板開度不宜過大,也應(yīng)注意車內(nèi)乘客的安全狀態(tài)。
本文提出基于事故綜合強(qiáng)度+K-means分類法的公交事故嚴(yán)重程度影響因素分析模型。獲得的主要結(jié)論如下:
(1) 基于事故綜合強(qiáng)度+K-means 的公交事故嚴(yán)重程度分類法結(jié)果與實(shí)際情況更相符;
(2) 基于事故綜合強(qiáng)度+K-means 分類法的有序Logit模型具有更好的擬合優(yōu)度;
(3)高峰期、換道、超速、加速度過大、注意力分散和進(jìn)出站會(huì)增大發(fā)生極嚴(yán)重公交車事故的概率,增大的概率分別為11.57%、29.06%、23.98%、17.13%、30.97%和12.27%;
(4)白天和晴天會(huì)減小發(fā)生極嚴(yán)重公交車事故的概率,減少的概率分別為22.31%和12.34%。