鄒曉芳, 張俊杰, 楊培東
(1.招商新智科技有限公司, 北京 100070; 2.東南大學(xué)交通學(xué)院, 南京 211189)
隨著我國經(jīng)濟(jì)的快速發(fā)展和機(jī)動車數(shù)量的不斷增加,道路交通事故頻發(fā),道路交通安全也面臨極大挑戰(zhàn). 世界衛(wèi)生組織2018年關(guān)于交通安全的統(tǒng)計(jì)報(bào)告結(jié)果顯示,中國因道路交通事故導(dǎo)致的死亡人數(shù)居世界第2,由此可見,我國的道路交通安全現(xiàn)狀非常嚴(yán)峻[1]. 截至2019年,我國高速公里通車?yán)锍踢_(dá)14.96萬km,位居世界第1[2]. 高速公路因其行車速度快、通行能力高等特點(diǎn),更易發(fā)生嚴(yán)重交通事故,有研究表明其里程死亡率、事故死亡率分別是普通公路的4.51倍、2.21倍[3]. 橋梁作為高速公路瓶頸路段,通常也是事故多發(fā)路段,對該路段交通事故進(jìn)行研究,對于改善高速公路行車安全具有十分重要的意義.
交通事故是1種具有隨機(jī)性、突發(fā)性的事件,其發(fā)生是1個(gè)極其復(fù)雜的過程,是包括駕駛員、車輛、道路及自然環(huán)境等多方面因素綜合影響的結(jié)果,國內(nèi)外學(xué)者對交通事故特征及影響因素進(jìn)行了大量研究. 馮雷等[4]選取4條交通氣象條件較好的霧天事故多發(fā)高速公路路段為研究對象,對霧天條件下交通事故特征進(jìn)行研究,并將交通事故與能見度進(jìn)行定量分析. 陸化普等[5]基于GIS技術(shù)對深圳市道路交通事故空間分布特征進(jìn)行研究,發(fā)現(xiàn)交通事故發(fā)生頻率及嚴(yán)重度在城區(qū)與郊區(qū)分布存在差異. 王潔等[6]對河北省高速公路夏冬季事故時(shí)變特征進(jìn)行研究,并基于二元Logistic回歸建立交通事故氣象預(yù)警模型. Hou等[7]借助詳細(xì)的交通事故、交通特征和高速公路幾何數(shù)據(jù),對影響安全的因素進(jìn)行研究,結(jié)果表明事故數(shù)隨著平曲線半徑的減小而增大. Tarko[8]研究了公路幾何結(jié)構(gòu)對高速公路路段交通事故發(fā)生的安全影響,結(jié)果表明坡度是交通事故的影響因素,坡度越陡,交通事故發(fā)生的概率越高. Duckwon等[9]對美國加州I-880N高速公路45英里路段的交通事故和實(shí)時(shí)交通流數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)實(shí)時(shí)交通流是影響交通事故的主要因素. Cafiso等[10]通過廣義線性模型研究道路幾何線形、交通流與交通事故之間的關(guān)系,結(jié)果表明:平均車速與交通事故之間呈正相關(guān)性.
為研究道路交通事故特征,分析交通事故的成因,統(tǒng)計(jì)回歸模型被廣泛應(yīng)用于交通事故預(yù)測研究中. Li等[11]基于低等級道路交通事故數(shù)據(jù)采用泊松回歸進(jìn)行擬合,結(jié)果證明了泊松回歸在交通事故頻數(shù)建模中的適用性. Ramesh等[12]對比了廣義負(fù)二項(xiàng)回歸模型與負(fù)二項(xiàng)模型在數(shù)據(jù)擬合方面能力,結(jié)果表明廣義負(fù)二項(xiàng)回歸模型擬合效果更好. 段萌萌等[13]以高橋隧比高速公路為研究對象,采用多元非線性回歸分析法建立事故預(yù)測模型,結(jié)果表明該模型精度較高,可作為高橋隧比高速公路事故建模的參考. 為了解釋數(shù)據(jù)中零值出現(xiàn)頻次較多的問題,部分學(xué)者建立零膨脹回歸模型(ZINB)來降低零值對估計(jì)結(jié)果的影響. Qin等[14]采用零膨脹泊松回歸模型分析了雙車道公路不同類型事故數(shù)與車道寬度、交通量等因素的關(guān)系,研究表明該模型可較好反映交通事故數(shù)與年平均日交通量、路段長度之間的關(guān)系. Arief Rizaldi等[15]利用零膨脹負(fù)二項(xiàng)回歸模型對印度尼西亞事故數(shù)據(jù)進(jìn)行研究,結(jié)果表明事故數(shù)與單位長度中央分隔帶開孔數(shù)、對行人和道路預(yù)留區(qū)的干擾程度呈正相關(guān). Daniel等[16]基于城市主干道貨車事故數(shù)據(jù)建立零膨脹泊松和零膨脹負(fù)二項(xiàng)模型,結(jié)果表明路段長度和信號設(shè)置對貨車事故頻數(shù)有較為顯著的影響. Ayati等[17]基于城市道路交通事故數(shù)據(jù),分別建立了泊松、負(fù)二項(xiàng)、零膨脹泊松、零膨脹負(fù)二項(xiàng)模型,結(jié)果表明,平均速度、交通流量、橫斷面車道數(shù)和出入口數(shù)量對事故數(shù)有顯著影響,同時(shí)發(fā)現(xiàn)在四類模型中零膨脹負(fù)二項(xiàng)模型的預(yù)測精度最高.
綜上,目前國內(nèi)外學(xué)者對交通事故致因及事故預(yù)測模型進(jìn)行了大量研究,但針對高速公路大橋路段的事故特征及預(yù)測模型研究較少. 因此,本文以G50高速公路K785+834—K800+984斷面為研究對象,在數(shù)據(jù)描述分析的基礎(chǔ)上,對高速公路大橋路段事故特征進(jìn)行分析,并構(gòu)建零膨脹負(fù)二項(xiàng)回歸模型對交通事故數(shù)據(jù)進(jìn)行擬合,并借助R軟件對模型進(jìn)行求解. 研究結(jié)果擬為提高相似道路條件下的交通安全水平,提升交通管理能力提供理論支撐和參考.
鄂東長江公路大橋位于湖北省長江黃石水道中下游,跨越繁忙的長江主航道,是G45、G50高速在湖北東部的共用過江通道,其基本走勢如圖1所示.
圖1 鄂東長江公路大橋基本走勢(滬渝向)
鄂東長江公路大橋全段共有4座立交,線路全長15.2 km,橋梁總長6.23 km. 大橋南北引橋全長5.886 km,其中跨江橋面段0.96 km. 南北引橋間為雙向六車道,其余主路雙向四車道. 全程客車限速(60~100) km/h,貨車限速(60~90) km/h.
以湖北省高速公路聯(lián)網(wǎng)中心反饋的路段流量數(shù)據(jù)及從轄區(qū)交警處獲取的路段事故數(shù)據(jù)為研究對象,在對數(shù)據(jù)預(yù)處理的基礎(chǔ)上對鄂東長江公路大橋路段事故特征進(jìn)行分析,具體路段數(shù)據(jù)描述如表 1所示.
表1 鄂東長江公路大橋路段數(shù)據(jù)描述
以2016—2019年事故數(shù)據(jù)為研究對象,從事故類型、事故原因及事故車型3個(gè)角度分析鄂東長江公路大橋路段事故特性,各角度中位列前3的因素如表2所示.
表2 鄂東長江公路大橋路段事故概況
1.3.1 鄂東長江公路大橋路段事故特征分析
以2016—2019年鄂東長江公路大橋路段事故數(shù)據(jù)為研究對象,研究發(fā)現(xiàn)該路段在相鄰年內(nèi)逐月及逐小時(shí)事故數(shù)量分布大體一致. 不失一般性,本節(jié)選取2017、2018年事故數(shù)據(jù)對鄂東長江公路大橋路段事故時(shí)間分布特性進(jìn)行分析.
繪制如圖2所示的2017—2018年鄂東長江公路大橋段逐月事故變化趨勢圖. 由圖2可知,事故在逐月分布上呈現(xiàn)“單月激增,整體均衡”狀態(tài). 大橋轄區(qū)2月份事故最多,其次為1月份、10月份,其余月份流量較為均衡. 2017、2018年春節(jié)分別為 1月27日、2月15日,因此1、2月份事故高發(fā)與春節(jié)期間出行增多有密切關(guān)系. 10月事故數(shù)較臨近月份有所增加,這與國慶黃金周出行增多有關(guān).
圖2 2017—2018年鄂東長江公路大橋段逐月事故變化
進(jìn)一步分析大橋段事故在1 d內(nèi)24 h的時(shí)段分布,繪制如圖3所示的變化趨勢圖. 由圖3可知,大橋路段1 d內(nèi)事故呈現(xiàn)“M”型分布特征,事故主要集中在上午09:00—11:00,下午14:00—16:00,以及18:00—20:00時(shí)段,其余時(shí)段事故較少. 白天 2個(gè)時(shí)段事故較集中主要由長時(shí)間的駕駛疲勞以及注意力不集中導(dǎo)致,晚間18:00—20:00事故多發(fā)則因?yàn)橐股蹬R,視線較差,駕駛員不易辨識前后車距離等導(dǎo)致.
圖3 2017—2018年鄂東長江公路大橋段事故24 h時(shí)段分布
1.3.2 鄂東長江公路大橋路段事故空間分布特征
分別繪制滬渝向及渝滬向事故空間分布柱狀圖,將事故空間分布柱狀圖與大橋段實(shí)際道路線形結(jié)合,形成如圖4所示的事故空間分布圖.
圖4 鄂東長江公路大橋事故空間分布
由圖4可知,滬渝向事故在一定范圍內(nèi)較為集中,主要為散花收費(fèi)站附近、北引橋起點(diǎn)附近、花湖互通附近,其余區(qū)間內(nèi)事故較少;渝滬向事故分布沒有明顯的集中趨勢,在大橋段范圍各區(qū)域較為平均. 對于橋面段而言,滬渝向與渝滬向兩者事故數(shù)量均未較其他斷面有所增加,渝滬向橋面段事故稍多于滬渝向.
目前常用的路段單元劃分方法包括定長法及同質(zhì)法2種[18-19]. 定長法即按照固定長度對研究路段進(jìn)行劃分,同質(zhì)法則以道路屬性的變化為劃分依據(jù),常選取的指標(biāo)包括交通量、限速和其他道路條件. 考慮路段實(shí)際及數(shù)據(jù)支撐情況,結(jié)合該路段平面及街景地圖,本文采用同質(zhì)法與出入口分段結(jié)合的思想,在互通樁號點(diǎn)處、車道改變處、曲直分段點(diǎn)處,同時(shí)考慮出入口情況,將轄區(qū)G50路段雙向共分為 18個(gè)段面. 其中最短斷面508 m,最長斷面3 223 m,平均路段長度1 614 m,具體路段單元劃分結(jié)果如圖5所示.
為對該路段內(nèi)事故數(shù)進(jìn)行預(yù)測,以轄區(qū)2018年全年(除10月)217起事故為基礎(chǔ),收集了包括交通事故、道路幾何設(shè)計(jì)及交通流3個(gè)方面的數(shù)據(jù). 其中,事故數(shù)據(jù)包括事故發(fā)生時(shí)間、事故車型及經(jīng)濟(jì)損失等,道路線形數(shù)據(jù)包括平面線形、車道數(shù)、路段長度及出入口類型,交通流量數(shù)據(jù)包括車流量及其行駛方向.
在對數(shù)據(jù)分析的基礎(chǔ)上,結(jié)合路段單元劃分結(jié)果,本文以交通流量和道路線形2類指標(biāo)為自變量建立事故預(yù)測模型,具體備選自變量指標(biāo)如表3所示.
表3 備選自變量
將收集的交通事故、道路線形及交通流量數(shù)據(jù)一一對應(yīng)到劃分的18個(gè)路段研究單元上,生成198條數(shù)據(jù)記錄,即本文建模樣本. 為對該路段事故數(shù)進(jìn)行預(yù)測,將事故頻數(shù)作為因變量,其余變量作為自變量,自變量中月均流量、貨車比、路段長度為連續(xù)變量,由于月均流量數(shù)值較大,故將其取對數(shù)處理. 車道數(shù)、線形、出入口形式為分類變量,其中車道數(shù)、線形(直線、曲線)為二分類變量,出入口形式為四分類變量,將其做啞變量處理,變量描述性統(tǒng)計(jì)如表4所示.
在198條事故數(shù)記錄中,110條記錄值為0,因變量事故頻數(shù)中0值較多,傳統(tǒng)的負(fù)二項(xiàng)回歸模型并不適用,因此考慮使用零膨脹負(fù)二項(xiàng)回歸模型.
零膨脹負(fù)二項(xiàng)回歸建模,將交通事故的發(fā)生看作2個(gè)過程:第1個(gè)過程對應(yīng)零事件的發(fā)生,即未發(fā)生事故,此過程中個(gè)體取值只能為零,稱為零過程,這解釋了數(shù)據(jù)中為何存在過多零值;第2個(gè)對應(yīng)事故的發(fā)生過程,此過程中個(gè)體的取值為正,該過程稱為計(jì)數(shù)過程.
零膨脹負(fù)二項(xiàng)回歸模型是將原數(shù)據(jù)集看做1個(gè)全為零的數(shù)據(jù)集與1個(gè)滿足負(fù)二項(xiàng)分布的數(shù)據(jù)集的集合,適用于零值較多、過度離散的數(shù)據(jù)[20-21].其概率分布P(Yi)可表達(dá)為:
(1)
式中,Pi為一定時(shí)間段內(nèi)第i個(gè)路段未發(fā)生交通事故的概率;yi為第i個(gè)路段事故數(shù)觀測值;λi為第i個(gè)路段事故的期望值;K為離散系數(shù);Г為伽馬函數(shù).
零膨脹負(fù)二項(xiàng)回歸模型的均值E(Yi)及方差Var(Yi)分別為:
E(Yi)=(1-Pi)λi
(2)
(3)
當(dāng)Pi=0時(shí),變量Yi服從均值為λi,方差為λi(1+λi/K)的負(fù)二項(xiàng)分布.通常情況下可采用二元Logit模型預(yù)測零膨脹負(fù)二項(xiàng)回歸模型中事故發(fā)生的概率,因此零膨脹負(fù)二項(xiàng)回歸模型可表達(dá)為:
(4)
(5)
本文以月均流量、貨車比、路段長度、車道數(shù)、線形及出入口形式為自變量,月事故頻數(shù)為因變量,構(gòu)建零膨脹負(fù)二項(xiàng)回歸模型.
構(gòu)建模型時(shí),自變量之間的強(qiáng)相關(guān)性可能導(dǎo)致變量間存在多重共線問題,進(jìn)而影響模型中其余變量的顯著性,因此在建模型前應(yīng)檢驗(yàn)自變量間的相關(guān)性,以便更加精確地構(gòu)建模型. 本文借助R軟件,利用Pearson相關(guān)系數(shù)衡量月均流量、貨車比、路段長度3個(gè)連續(xù)變量間的相關(guān)性,利用Spearman等級相關(guān)系數(shù)衡量車道數(shù)、線形及出入口形式3個(gè)分類變量之間及其與連續(xù)變量之間的相關(guān)關(guān)系. 自變量共線性檢驗(yàn)結(jié)果矩陣如表5所示.
表5 自變量共線性檢驗(yàn)結(jié)果矩陣
由表5可知,流量與貨車比、路段長度、車道數(shù)及出入口形式間存在較大相關(guān)性,貨車比與車道數(shù)及線形之間也有較大相關(guān)性. 將全部自變量代入模型,輸出結(jié)果表明流量、斷面長度、曲線與直線3個(gè)自變量顯著.
將顯著變量再次迭代至模型,但由于流量、路段長度和路段線形存在相關(guān)性,如同時(shí)存在將對模型結(jié)果產(chǎn)生影響. 因此最終得到2個(gè)模型,即模型1和模型2,其自變量分別為流量和路段長度,流量和路段線形. 具體模型輸出結(jié)果如表6、7所示.
表6 模型1輸出結(jié)果
由表6及表7可知,流量、路段長度、曲線vs直線對高速公路大橋路段事故影響顯著. 流量對路段交通運(yùn)行有著重要影響,不同流量下的駕駛員駕駛行為也存在差異. 高速公路大橋路段事故數(shù)量隨著流量的增加而增加,因此流量是影響事故發(fā)生的因素之一,這與以往的研究結(jié)論[22-24]一致. 路段長度也與高速公路大橋路段事故數(shù)有關(guān),大橋路段越長,事故數(shù)越多. 道路線形對駕駛員的負(fù)面影響是造成交通事故的主要原因之一(如彎道處視距不足等),這一結(jié)論與Ayati等[25]的結(jié)論一致.
表7 模型2輸出結(jié)果
1)本文對高速公路大橋路段事故特征及預(yù)測模型進(jìn)行研究. 在對數(shù)據(jù)描述分析的基礎(chǔ)上,從時(shí)空角度對路段事故特征進(jìn)行分析. 利用同質(zhì)法與出入口分段結(jié)合的思想對路段單元進(jìn)行劃分,根據(jù)收集的事故數(shù)據(jù)統(tǒng)計(jì)特征,選擇構(gòu)建零膨脹負(fù)二項(xiàng)回歸模型對交通事故數(shù)據(jù)進(jìn)行擬合,借助R軟件對模型進(jìn)行求解.
2)研究結(jié)果表明,高速公路大橋路段事故在逐月分布上呈現(xiàn)“單月激增,整體均衡”的狀態(tài),在1 d內(nèi)24 h的時(shí)段分布中呈現(xiàn)“M”型分布特征. 從空間角度,滬渝向事故在一定范圍內(nèi)較為集中,渝滬向事故較為分散. 影響高速公路大橋路段事故發(fā)生的主要因素為流量、路段長度及線形. 流量對路段交通的運(yùn)行有重要影響,不同流量下駕駛員駕駛行為存在差異. 路段長度也與高速公路大橋路段事故數(shù)有關(guān),大橋路段越長,事故數(shù)越多. 道路線形對駕駛員有重要影響,如駕駛員可能在曲線處因視距不足而引發(fā)交通事故.
3)交通事故的發(fā)生是1個(gè)及其復(fù)雜的過程,是眾多因素作用的結(jié)果,由于數(shù)據(jù)限制,本文構(gòu)建的零膨脹負(fù)二項(xiàng)回歸模型未考慮交通事故嚴(yán)重度等因素,這可能增大模型誤差且降低其遷移能力,后續(xù)可進(jìn)一步完善數(shù)據(jù)資源,使零膨脹負(fù)二項(xiàng)回歸模型可用于其他相似道路條件下的交通事故預(yù)測.