馬德明,梁宏斌
基于時空混合殘差網(wǎng)絡的事故黑點預測研究
馬德明,梁宏斌
(西南交通大學,交通運輸與物流學院,成都 611756)
深度學習在圖像識別、自然語言處理方面的研究進展突飛猛進,也逐漸開始應用于交通領域,目前主要應用于交通流和交通需求預測,但對事故的研究較少。本文將事故數(shù)據(jù)作為一種時空數(shù)據(jù),在時間和空間維度分析其與其他深度學習所研究數(shù)據(jù)的差異,利用深度學習相關技術分別從時間和空間維度建模,提取相應的特征與屬性,并將這些模型組件組裝與融合,搭建了時空混合殘差網(wǎng)絡,用于事故黑點預測。在對真實數(shù)據(jù)進行預處理后載入模型進行實驗,訓練效果良好,損失最后降到0.862 4,隨機選取序列的預測事故圖平均誤差為-5.45%,與其他模型相比損失最小,結果表明本網(wǎng)絡具有較好的事故黑點預測能力。
交通事故;事故預測;深度學習;事故黑點
當前隨著交通的不斷發(fā)展,事故也間接地有所增加,事故受到道路交通發(fā)展的影響。事故黑點是交通安全研究的重要方向,在高效整治交通事故方面可起到關鍵作用。
當前研究事故黑點的方法多為線性回歸方法或多元統(tǒng)計分析方法,Lord等[1]研究表明采用廣義估計方程比普通數(shù)學模型能更好地分析交通事故的時間相關性;MA與Gill[2,3]建立了多變量泊松-對數(shù)正態(tài)回歸模型來進行事故數(shù)的預測與事故黑點的探測;考慮位于同一交通通道的交叉口之間的空間相關性,WANG等[4]采用廣義估計方程分析Central Florida地區(qū)的交叉口安全影響因素;Huang與Fawcett等[5,6]應用貝葉斯進行事故黑點識別;Murat[7]考慮事故類型和事故產(chǎn)生的影響因素,采用香農(nóng)熵方法確定黑點的安全水平;孟祥海[8]研究了滑動窗窗體長度及滑動步長對事故多發(fā)路段鑒別影響;Bham[9]基于主成分分析方法提出一種綜合分級度量來識別高速路上的事故黑點;Wang[10]建立一元負二項條件自回歸模型和二元負二項空間條件自回歸模型來分析單車事故和多車事故的影響因素以及這些因素在事故黑點中的一致性情況;Harirforoush[11]提出網(wǎng)絡核密度估計的空間分布與臨界事故率網(wǎng)絡篩選綜合方法來探測事故黑點;Ulak[12]比較了常用的基于網(wǎng)絡的熱點檢測方法,深入了解所選熱點檢測方法在使用不同空間權重時的異同;Zahran[13]對比了基于風險水平的空間交通事故分析方法與道路審計方法的差異,并確定了所研究道路的危險水平;石小林等[14]運用二元Logit模型對事故嚴重程度進行了分析。
現(xiàn)階段深度學習在圖像識別、自然語言處理等方面取得了重大的突破,而在交通領域的應用還不太廣泛,主要應用于交通流的研究。Shi[15]對時空序列預測問題的機器學習方法進行了系統(tǒng)的回顧;Li[16]將交通流建模為有向圖上的擴散過程,并引入擴散卷積遞歸神經(jīng)網(wǎng)絡,建立了將交通流的空間與時間相關性結合的深度學習框架;Zhao[17]將圖卷積網(wǎng)絡和門控遞歸單元相結合,提出了時態(tài)圖卷積網(wǎng)絡模型進行城市交通量的預測;Zhang[18]基于深度學習的方法提出ST-ResNet模型,用來集中預測一個城市每個區(qū)域的人群流入和流出情況。
本文在分析事故數(shù)據(jù)時空特性的基礎上,將深度學習技術應用于事故黑點預測研究中,建立了時空混合殘差網(wǎng)絡來預測事故黑點,并以真實數(shù)據(jù)進行實驗,驗證了模型的有效性。
卷積神經(jīng)網(wǎng)絡是一種前饋神經(jīng)網(wǎng)絡,是處理位置相關信息的有效深度學習結構,通過卷積神經(jīng)網(wǎng)絡,可以提取出事故數(shù)據(jù)空間維度的特征。
對于某些問題,我們關注的重點在于部分較為重要的輸出節(jié)點與輸入節(jié)點之間的關系,這部分重要的節(jié)點以圖像的形式表現(xiàn)出來就稱為感知域。此時層與層之間并非全連接,而是僅連接到感知域。此外,使用權值共享的思想,可將參數(shù)量再進一步的減少。例如使用權值矩陣:
與感知域的輸出相乘累加,作為相應位置的下一層輸入;同時滑動感知域窗口,對于其他的感知域也采用該權值矩陣與感知域的輸出相乘累加,作為對應位置的下一層輸入。這種共享權值的“局部連接”網(wǎng)絡其實就是卷積神經(jīng)網(wǎng)絡。每個輸出節(jié)點用權值相乘累加的方式提取對應感知域的特征信息,其實就是離散卷積運算:
網(wǎng)絡模型層數(shù)的增加是一把雙刃劍,雖然可以提高網(wǎng)絡泛化能力,但另一方面網(wǎng)絡的層數(shù)越多就越難訓練,這主要是由于梯度彌散和梯度爆炸現(xiàn)象造成的。為了解決深層神經(jīng)網(wǎng)絡這兩個問題,深度殘差網(wǎng)絡通過在卷積層的輸入和輸出之間添加跳過連接或殘差連接建立回退機制,如圖1所示。
圖1 ResNet結構
經(jīng)過添加這樣一個跳過連接后,即使出現(xiàn)梯度彌散或者梯度爆炸問題,也可以通過此跳過連接的回退機制,將梯度以線性的方式回退到之前的輸出中進行梯度更新,完成殘差學習。即最差的效果也不會低于上一輸出層的效果,大大提高了模型的訓練效率與表達能力。
事故數(shù)據(jù),本質上是一種時空數(shù)據(jù)。在時間維度上記錄事故發(fā)生的時間,在空間維度上標記事故發(fā)生的位置。時空數(shù)據(jù)相對于文本數(shù)據(jù)、圖像數(shù)據(jù)、視頻數(shù)據(jù)等一系列在深度學習研究中常見的數(shù)據(jù),具有以下特點:
(1)時間維度的周期性和趨勢性。事故數(shù)據(jù)在一定程度上具有周期性,這本質上跟隨交通流量的變化而表現(xiàn)出來。同時事故的重復性變化不是嚴格的發(fā)生,而是具有趨勢性的上揚和下降,例如隨著冬天的到來氣溫逐漸降低,事故的發(fā)生相對于天暖的時候有所增加,這不是嚴格的周期性,而是趨勢性的上揚問題。
(2)空間維度的距離性和層次性。根據(jù)地理學第一定律可知,距離越遠,其相似度越低,這是空間相關性的基礎。空間粒度的劃分可以有不同的大小,以反映不同層次的信息。大粒度可以反映整體的網(wǎng)絡結構信息,小粒度可以反映局部的細節(jié)信息,空間層次性劃分的意義在于:有的事故的相似度,或稱為相關性,可能在較小的一層很低甚至不存在,但是往上歸納一層即可找到;而有的事故的相似度在較大的一層比較高,但是在較小的一層中能分析出它們之間的差異。距離和層次是空間數(shù)據(jù)的特有屬性。
在交通事故預測問題中,發(fā)生在不同地點的交通事故存在相似之處,這其中的空間相似性主要包括道路線形(橫縱曲線)、周邊環(huán)境特征、道路限速等空間特征的相似性,這些空間特征會不同程度的影響事故的發(fā)生,在不同的地點隱性表達。
相鄰區(qū)域的地理和環(huán)境特性具有一定的相似性,卷積神經(jīng)網(wǎng)絡可以通過卷積操作,利用過濾器,即前文所述的感知域來捕獲這種相似性。如圖2所示,淺層的網(wǎng)絡層負責捕獲附近地點和距離較近地點的空間相似性,并將這種特性編譯到輸出中,深層的網(wǎng)絡層基于之前的輸出,捕獲距離較遠地點甚至是全城范圍內的空間相似性。經(jīng)過以上的處理,整個城市的空間相似性就已經(jīng)被提取出來,并儲存在最后的網(wǎng)絡圖中。
圖2 多層卷積
這樣的處理,具有以下三點優(yōu)勢:
(1)保證時間維度仍然具有一定的連續(xù)性,可以提取出序列信息;
(2)刻畫時間維度的特性;
(3)減少總序列的長度,從而間接減少單個卷積層所需要處理的圖像數(shù)量,提高學習效率。
為了解決深層網(wǎng)絡訓練效果差的問題,本文在模型中使用殘差學習。對于每一個卷積神經(jīng)網(wǎng)絡,堆棧了個殘差單元,如圖4所示。
圖4 殘差單元
殘差單元的處理過程可表示如下:
前文分別對空間和時間維度建模后,構建了相關的組件,為了組建完整的神經(jīng)網(wǎng)絡,將上述組件按一定的規(guī)則或連接方式進行組裝,最終的網(wǎng)絡結構如圖5所示。
圖5 時空混合殘差網(wǎng)絡
不同的地點所發(fā)生的事故在一定程度上表現(xiàn)出周期性和趨勢性,但是各自地點所體現(xiàn)出的周期性屬性和趨勢性屬性的強度卻不完全相同,為了能夠準確地在不同地點反映出這兩種特性,本文使用了基于參數(shù)矩陣的融合方法:
最后,預測值與真實值之間的損失(loss)用均方差來計算:
本文的模型實現(xiàn)代碼結果如圖6所示。
圖6 模型的代碼架構
各模塊所實現(xiàn)的具體功能如表1所示。
表1 模塊與功能
本文使用的數(shù)據(jù)是美國弗吉尼亞州的事故數(shù)據(jù),該數(shù)據(jù)集包含了弗吉尼亞州從2010年1月1日至2017年3月18日所發(fā)生的事故,從總共79萬條數(shù)據(jù)中篩選18萬條北弗吉尼亞地區(qū)數(shù)據(jù)用于實驗,數(shù)據(jù)坐標范圍如表2所示,分別為東南角和西北角的坐標數(shù)據(jù)。
表2 數(shù)據(jù)范圍頂點坐標
為滿足多層卷積神經(jīng)網(wǎng)絡輸入格式的要求,需將所在區(qū)域劃分為×的空間網(wǎng)格,作為后續(xù)事故數(shù)據(jù)映射的框架。在實際研究中,網(wǎng)格劃分標準的確定需要權衡數(shù)據(jù)覆蓋率、計算復雜度和預測難度三者之間的關系。本文在綜合考量上述三者關系的基礎上經(jīng)過多次實驗,最后選擇表3所示的網(wǎng)格劃分方式。
表3 網(wǎng)格劃分概況
這樣的網(wǎng)格劃分方式既避免了數(shù)據(jù)稀疏問題的出現(xiàn),同時降低了計算復雜度與預測難度,提高了網(wǎng)絡的訓練效率與預測精度。
圖7 事故映射圖示例
本文分別對16×16和32×32的網(wǎng)格規(guī)模模型進行了實驗,發(fā)現(xiàn)16×16的網(wǎng)絡規(guī)模更加適合本數(shù)據(jù)集,故以下的分析均基于16×16網(wǎng)格規(guī)模的實驗結果。
圖8為模型的訓練損失變化圖。淺色折線為實際損失變化曲線,但是不便于分析,故進行了平滑處理,得到平滑后的訓練損失變化曲線。為了有更好的展示效果,未將損失的高位部分展示出來,模型損失值的最高點位于8.234,隨后迅速下降,約于150步附近達到0.885 8處,隨后在波動中整體呈現(xiàn)出損失下降的趨勢,說明模型在不斷地被訓練與優(yōu)化,且符合深度神經(jīng)網(wǎng)絡模型訓練的普遍情況,約于2790步處達到模型的最優(yōu)點,損失值為0.658。
圖8 訓練損失
圖9為模型的測試損失變化圖。淺色折線為實際損失變化曲線,但是不便于分析,故進行了平滑處理,得到平滑后的測試損失變化曲線??捎^察到,經(jīng)過訓練后的模型,剛開始損失值就較低,起始為0.960 1,后有所上升,屬于隨機情況,最高值為10步附近的1.019,隨后也迅速下降,約于130步附近達到0.922 3,隨后在波動中呈現(xiàn)下降趨勢,在328步附近達到最低值0.862 4。
圖9 測試損失
測試損失略高于訓練損失屬于正常情況,因為測試損失不僅包括了模型的泛化能力,還包括了訓練集上的損失。根據(jù)訓練損失和測試損失,可說明該時空混合殘差網(wǎng)絡具有預測事故黑點的能力。
從真實事故數(shù)據(jù)中隨機選取4個時間序列的事故映射圖,并同時選取對應序列的預測事故圖,用于實驗結果的絕對誤差分析。實驗結果的具體絕對誤差如表4所示,其中絕對誤差的定義為(預測值-真實值)/真實值。
表4 絕對誤差
由表4可知,事故黑點預測效果整體非常好,其中效果最好的地區(qū)誤差甚至降到了1%附近?,F(xiàn)無法做到準確的定位、預測每一起交通事故,更多的是盡可能準確地去預測在何時、何地會出現(xiàn)大量的交通事故,即事故黑點,故總體而言,預測準確度均在較高水平。對于本次選取的4個隨機序列,平均絕對誤差為-5.45%,除去效果最差的序列a,其余3個序列的平均誤差僅為-2.89%,已經(jīng)達到非常高的準確度。
除了進行本文所提出的時空混合殘差網(wǎng)絡實驗,為了對比模型的效果,還應用了自回歸模型(AR),有時序選擇的長短時記憶網(wǎng)絡(S-LSTM),卷積長短時記憶網(wǎng)絡(ConvLSTM)進行對比實驗。實驗的損失計算仍用均方差,其結果如表5所示。
表5 實驗效果對比
由上表可知,本文的時空混合殘差網(wǎng)絡優(yōu)于其他幾個模型,驗證了本模型的有效性。
使用深度學習方法時對數(shù)據(jù)有不同的要求,故本文首先分析了事故數(shù)據(jù)相對于文本數(shù)據(jù)、圖像數(shù)據(jù),在時間和空間維度所呈現(xiàn)出的特性,在此基礎上對時間和空間維度分別建模捕捉其時空特征,并將上述建模得到的組件進行組裝與融合,構建時空混合殘差網(wǎng)絡。在對真實數(shù)據(jù)集進行預處理后,輸入模型進行實驗,訓練效果較優(yōu),隨機選取的序列事故映射圖的平均誤差在-5.45%,同時和其他模型相比損失最低,表明該模型具有較好的事故黑點預測能力。但本文的研究中未能將事故產(chǎn)生的經(jīng)濟損失,人員傷亡等屬性囊括在內,后續(xù)的研究可將事故嚴重程度和其他影響因素作為輸入對象,以提高預測的準確度。
[1] LORD D, PERSAUD B N. Accident prediction models with and without trend: application of the generalized estimating equations procedure [J]. Transportation Research Record, 2000, 17 (1): 102-108.
[2] MA J, KOCKELMAN K M, DAMIEN P. A multivariate Poisson-lognormal regression model for prediction of crash counts by severity, using Bayesian methods [J]. Accident Analysis & Prevention, 2008, 40 (3): 964-975.
[3] GILL G S, CHENG W, ZHOU J, et al. Comparative analysis of cost-weighted site ranking using alternate distance-based neighboring structures for spatial crash frequency modeling [J]. Journal of Transportation Safety & Security, 2019, 11 (1): 79-101.
[4] WANG X, ABDEL-ATY M. Crash estimation at signalized intersections along Corridors: analyzing Spatial Effect and Identifying Significant Factors [J]. Transportation Research Record, 2006, 1953 (1): 98-111.
[5] HUANG H, CHIN H C, HAQUE M M. Empirical Evaluation of Alternative Approaches in Identifying Crash Hot Spots: Naive Ranking, Empirical Bayes, Full Bayes Methods [J]. Transportation Research Record, 2009, 2103 (1): 32-41.
[6] FAWCETT L, THORPE N, MATTHEWS J, et al. A novel Bayesian hierarchical model for road safety hotspot prediction [J]. Accident Analysis & Prevention, 2017, 99 (1): 262-271.
[7] MURAT Y S. An entropy (shannon) based traffic safety level determination approach for black spots [J]. Procedia-social and Behavioral Sciences, 2011, 20: 786-795.
[8] 孟祥海, 張道玉, 吳佩潔. 滑動窗窗體長度及滑動步長對事故多發(fā)路段鑒別影響 [J]. 交通運輸系統(tǒng)工程與信息, 2018, 18 (4): 148-155.
[9] BHAM G H, MANEPALLI U R, SAMARANAYKE V. A composite rank measure based on principal component analysis for hotspot identification on highways [J]. Journal of Transportation Safety & Security, 2019, 11 (3): 225-242.
[10] WANG X, FENG M. Freeway single and multi-vehicle crash safety analysis: influencing factors and hotspots [J]. Accident Analysis & Prevention, 2019, 132 (1): 52-68.
[11] HARIRFOROUSH H, BELLALITE L. A new integrated GIS-based analysis to detect hotspots: a case study of the city of Sherbrooke [J]. Accident Analysis & Prevention, 2019, 130 (1): 62-74.
[12] ULAK M B, OZGUVEN E E, VANLI O A, et al. Exploring alternative spatial weights to detect crash hotspots [J]. Computers, Environment and Urban Systems, 2019, 78 (1): 13-98.
[13] ZAHRAN E-S M M, TAN S J, TAN E H A, et al. Spatial analysis of road traffic accident hotspots: evaluation and validation of recent approaches using road safety audit [J]. Journal of Transportation Safety & Security, 2019, 2 (1): 1-30.
[14] 石小林, 李涵, 黃子富. 基于二元Logit模型的直角事故受傷嚴重程度分析[J]. 交通運輸工程與信息學報, 2020, 18 (1): 106-110.
[15] SHI X, YEUNG D-Y. Machine learning for spatiotemporal sequence forecasting: A survey [J]. ArXiv Preprint ArXiv: 2018, 1808 (1): 65-68.
[16] LI Y, YU R, SHAHABI C, et al. Diffusion convolutional recurrent neural network: Data-driven traffic forecasting [J]. ArXiv Preprint ArXiv: 2017, 1707 (1): 19-26.
[17] ZHAO L, SONG Y, ZHANG C, et al. T-gcn: a temporal graph convolutional network for traffic prediction [J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 9 (1): 3848-3858.
[18] ZHANG J, ZHENG Y, Qi D. Deep spatio-temporal residual networks for citywide crowd flows prediction[J]. ArXiv Preprint ArXiv: 2016, 1610 (1): 81-100.
Accident Black Spot Prediction Based on Spatio-Temporal Heterogeneous Residual Network
MA De-ming,LIANG Hong-bin
(School of Transportation and Logistics, Southwest Jiaotong University, Chengdu 611756, China)
Deep learning has progressed rapidly in theresearch areas of image recognitionand natural language processing. Additionally, its application in the field of transportation isincreasinggradually. Currently, it is mainly utilized in the prediction of the traffic flow and demand. However, the research on accidents is yet insufficient. In this study, we analyzed the difference between accident data as a type of spatio-temporal data and compared it with otherspatio-temporal data studied through deep learning. Building a spatio-temporal heterogeneous residual network for accident hotspot prediction requires spatial and temporal dimension modeling, extraction of corresponding features and attributes, and assembly and fusion of these model components. The real data were pre-processed and loaded into the model, which was then experimented on. The training effect was satisfactory, and the loss had decreased from 8.234 to 0.862 4. The average error of the predicted accident map of a randomly selected sequence was -5.45%, and the loss in this case was minimal when compared with other models. The results indicate that the proposed network exhibited a superiorcapability of predicting accident hotspots.
traffic accident; accident prediction; deep learning; accident hotspot
1672-4747(2020)04-0068-08
U491.31
A
10.3969/j.issn.1672-4747.2020.04.009
2020-03-15
馬德明(1995—),男,云南楚雄人,主要研究方向為交通安全、事故黑點,E-mail: chdrailmdm@163.com
梁宏斌(1972—),男,四川成都人,副教授,博士,研究方向為移動云計算、信息安全等,E-mail: 14273385@qq.com
馬德明,梁宏斌. 基于時空混合殘差網(wǎng)絡的事故黑點預測研究[J]. 交通運輸工程與信息學報,2020, 18(4): 68-75
(責任編輯:劉娉婷)