季 芳,熊 堅(jiān),楊文臣,郭鳳香
(1.昆明理工大學(xué) 交通工程學(xué)院,云南 昆明 650500;2.云南省交通規(guī)劃設(shè)計(jì)研究院,云南 昆明 650500)
隨著我國(guó)山區(qū)高速公路里程的不斷增長(zhǎng),山區(qū)高速公路的交通安全狀況引起人們的重視。大量研究表明,人是致使高速公路交通事故發(fā)生的主要因素。但不可否認(rèn)的是,仍存在由道路線形條件復(fù)雜、天氣狀況惡劣等其他因素直接或間接導(dǎo)致的大量交通事故。因此,研究山區(qū)高速公路的交通事故預(yù)測(cè)模型具有重大的實(shí)用價(jià)值[1-4]。鑒于此,本文期望可以從現(xiàn)有的大量山區(qū)高路公路的交通事故記錄中,通過(guò)對(duì)非人為因素的分析,來(lái)預(yù)測(cè)山區(qū)高速公路的交通事故。從而更好地識(shí)別山區(qū)高速公路上的高危路段,給予駕駛?cè)烁娴鸟{駛提醒,提高山區(qū)高速公路的安全性。
傳統(tǒng)的一些預(yù)測(cè)模型,包括概率預(yù)測(cè)法、貝葉斯預(yù)測(cè)模型等。在山區(qū)高速公路這一復(fù)雜的系統(tǒng)中,其在研究多個(gè)因素對(duì)交通事故的影響方面均存在不足,無(wú)法做出有效的預(yù)測(cè)[5-7]。此外,山區(qū)高速公路的事故發(fā)生存在較大的隨機(jī)性,各影響因素與事故間不存在嚴(yán)格的線性關(guān)系。因此,需要選擇一些用于非線性關(guān)系研究模型來(lái)做預(yù)測(cè)。本文采用基于粒子群優(yōu)化的BP網(wǎng)絡(luò)建立了山區(qū)高速公路的事故嚴(yán)重等級(jí)的預(yù)測(cè)模型,并基于昆石高速公路的事故數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證。
粒子群中的粒子所在的位置在不斷地更新,是根據(jù)下列公式進(jìn)行位置移動(dòng)的
(1)
(2)
式中,i=1,2,…,m;d=1,2,…,D;w是一個(gè)非負(fù)數(shù),是粒子群的慣性因子;加速常數(shù)c1和c2均為非負(fù)常數(shù),一般取值為2;r1和r2是[0,1]范圍內(nèi)隨機(jī)變換的一個(gè)隨機(jī)數(shù)值;α為粒子群的約束因子,調(diào)控粒子速度的權(quán)重[10]。
BP算法自身存在以下不足:(1)BP算法的收斂速度偏慢,尤其當(dāng)訓(xùn)練樣本的數(shù)量極為龐大時(shí);(2)存在局部最優(yōu)問(wèn)題,導(dǎo)致整體學(xué)習(xí)和訓(xùn)練結(jié)果不佳。因此,用粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法,彌補(bǔ)BP網(wǎng)絡(luò)的不足,并提高BP網(wǎng)絡(luò)的收斂速度及網(wǎng)絡(luò)的學(xué)習(xí)能力。
基于粒子群優(yōu)化的BP神經(jīng)網(wǎng)絡(luò),如圖1所示。
圖1 基于粒子群優(yōu)化的BP網(wǎng)絡(luò)結(jié)構(gòu)圖
(1)輸入層變量。輸入層變量主要包括一些對(duì)交通事故嚴(yán)重程度有著緊密聯(lián)系的影響因素,當(dāng)然不是所有的影響因素均能夠作為輸入層的變量,變量的選取也需要結(jié)合實(shí)際的數(shù)據(jù)情況[11]。綜合實(shí)際事故記錄情況,確定以下5個(gè)變量為BP網(wǎng)絡(luò)模型的輸入層變量:1)時(shí)間:據(jù)夜間事故死亡率的分析顯示:高速公路夜間的交通事故率比白天大1~1.5倍;2)天氣:根據(jù)云南的氣候情況和所記錄的事故數(shù)據(jù)分析,本文的天氣情況主要包括:晴、陰、雨、霧4類;3)車(chē)輛類型:發(fā)生事故時(shí)車(chē)輛的數(shù)目是隨機(jī)的,車(chē)輛類型也難以做出一個(gè)統(tǒng)一的判定,本文在處理該問(wèn)題時(shí),采用了肇事車(chē)輛的車(chē)型來(lái)量化這一影響因素;4)道路平曲線半徑:道路平曲線半徑設(shè)計(jì)不當(dāng)是發(fā)生交通事故的主要原因之一,本文將道路平曲線半徑分為4個(gè)等級(jí);5)道路縱坡坡度:縱坡坡度過(guò)大時(shí),需要保持車(chē)輛的合理速度,維持連貫的駕駛狀態(tài)將對(duì)行車(chē)安全造成較大的影響。相關(guān)研究表明,在長(zhǎng)下坡極易發(fā)生交通事故。
(2)輸出層變量。為了分析輸入因素對(duì)事故的影響,將事故嚴(yán)重等級(jí)作為輸出變量?;诶ナ咚俟返氖鹿视涗浨闆r,選擇事故的傷亡人員數(shù)作為事故嚴(yán)重等級(jí)的衡量標(biāo)準(zhǔn)。根據(jù)相關(guān)事故等級(jí)的劃分標(biāo)準(zhǔn),本文將事故嚴(yán)重等級(jí)量化為0,1,2,3這4個(gè)等級(jí):1)輕微事故:輕傷1~2人,財(cái)產(chǎn)損失機(jī)動(dòng)車(chē)事故不足1 000元;2)一般事故:重傷1~2人,或輕傷3人以上,財(cái)產(chǎn)損失不足3萬(wàn)元;3)重大事故:死亡1~2人,或者重傷3人以上10人以下,財(cái)產(chǎn)損失3萬(wàn)元以上不足6萬(wàn)元;4)特大事故:死亡3人以上,或者重傷11人以上,同時(shí)重傷8人以上或者死亡2人,同時(shí)重傷5人以上,財(cái)產(chǎn)損失6萬(wàn)元以上。
在考慮事故嚴(yán)重等級(jí)時(shí),為了讓輸出的結(jié)果能夠有一個(gè)統(tǒng)一的量化標(biāo)準(zhǔn)。在本文的研究中,事故的嚴(yán)重程度還是以人員傷亡情況作為主要衡量標(biāo)準(zhǔn)的。因財(cái)產(chǎn)損失存在一定的估計(jì),采用傷亡人員數(shù)作為衡量標(biāo)準(zhǔn)同時(shí)也體現(xiàn)了安全為第一的原則。
事故數(shù)據(jù)的記錄,大多為文字記錄,難以直接應(yīng)用于事故預(yù)測(cè)模型。根據(jù)本文所采用的BP網(wǎng)絡(luò)模型的需要,對(duì)這些數(shù)據(jù)進(jìn)行了量化處理[12]。在數(shù)據(jù)整理篩選完畢后,基于所選的312個(gè)抽樣數(shù)據(jù)來(lái)建立模型?;诖?,對(duì)數(shù)據(jù)的量化處理是本文事故數(shù)據(jù)處理的主要工作。具體的變量量化情況,如表1所示。
表1 變量的量化
鑒于MATLAB神經(jīng)網(wǎng)絡(luò)工具箱的方便實(shí)用,本文采用它來(lái)實(shí)現(xiàn)該網(wǎng)絡(luò)。將神經(jīng)網(wǎng)絡(luò)的均方誤差作為粒子群算法的適應(yīng)度,適應(yīng)度的計(jì)算通過(guò)調(diào)用子函數(shù)來(lái)實(shí)現(xiàn)[13-16]具體神經(jīng)網(wǎng)絡(luò)模型的實(shí)現(xiàn)過(guò)程,如圖2所示??梢?jiàn)網(wǎng)絡(luò)的模型建立,是通過(guò)5個(gè)輸入層的輸入變量,經(jīng)過(guò)隱含層,來(lái)實(shí)現(xiàn)輸出層的1個(gè)變量的輸出。
圖2 神經(jīng)網(wǎng)絡(luò)模型的實(shí)現(xiàn)過(guò)程
完成編程后,對(duì)數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練以及測(cè)試。本文以昆石高速公路K0~K78路段,2008年~2012年之間的312條事故數(shù)據(jù)為樣本數(shù)據(jù)。并隨機(jī)抽取樣本數(shù)據(jù)中的260條作為模型的訓(xùn)練數(shù)據(jù),將剩下的52條作為測(cè)試數(shù)據(jù)進(jìn)行模型驗(yàn)證。通過(guò)不斷迭代,使數(shù)據(jù)訓(xùn)練的效果達(dá)到較佳水平。最終網(wǎng)絡(luò)的訓(xùn)練結(jié)果,如圖3所示。
圖3 均方誤差(MSE)變化趨勢(shì)圖
由圖可見(jiàn),PSO-BP的網(wǎng)絡(luò)收斂速度比BP的收斂速度快,且PSO-BP最后達(dá)到的網(wǎng)絡(luò)均方誤差值也相較BP更小,這也體現(xiàn)了粒子群算法的優(yōu)化效果?;旧系恋?代以后,PSO-BP網(wǎng)絡(luò)的誤差已趨于收斂,而不加優(yōu)化的BP網(wǎng)絡(luò)還未呈現(xiàn)出明顯的收斂趨勢(shì)。同時(shí),還可以看出在多次迭代之后,PSO-BP的網(wǎng)絡(luò)誤差值明顯低于BP網(wǎng)絡(luò)的誤差值。
經(jīng)過(guò)網(wǎng)絡(luò)的迭代訓(xùn)練,最終的網(wǎng)絡(luò)訓(xùn)練集和測(cè)試集誤差如表2所示。
表2 整體網(wǎng)絡(luò)誤差對(duì)比表
從表2可得出結(jié)論:(1)PSO-BP模型的總體誤差比BP模型?。?2)兩個(gè)模型的訓(xùn)練集誤差均比測(cè)試集誤差小。這是因訓(xùn)練集的誤差是模型經(jīng)過(guò)多次迭代而來(lái)的,而測(cè)試集的誤差是將測(cè)試集的數(shù)據(jù)直接放入模型進(jìn)行的驗(yàn)證,不存在迭代,是一次驗(yàn)證而出的結(jié)果。
將樣本中所取的52條測(cè)試數(shù)據(jù)放入模型進(jìn)行驗(yàn)證,該52條測(cè)試數(shù)據(jù)所驗(yàn)證的模型的預(yù)測(cè)準(zhǔn)確率為89.6%。這一驗(yàn)證結(jié)果說(shuō)明,所建立的預(yù)測(cè)模型可用作事故嚴(yán)重等級(jí)的預(yù)測(cè)分析。
所建立的模型在上一節(jié)通過(guò)驗(yàn)證且準(zhǔn)確率較佳,故在預(yù)測(cè)模型的基礎(chǔ)上,進(jìn)行仿真模擬分析,研究單個(gè)影響因素與事故嚴(yán)重程度間的關(guān)系,以期得到一定的事故發(fā)生規(guī)律。
在所有的仿真結(jié)果分析中,均給出統(tǒng)一的情境設(shè)定,5個(gè)輸入層變量定為:凌晨;晴天;重型貨車(chē);半徑為600~2 000 m;坡度取值區(qū)間為[-5,-3);所設(shè)定的情境輸入層數(shù)據(jù)量化后為:(0,0,4,0,1)。
(1)時(shí)間-事故的預(yù)測(cè)分析。在時(shí)間-事故的輸入輸出關(guān)系研究中,設(shè)定的情境輸入層數(shù)據(jù)量化為:(*,0,4,0,1),通過(guò)模型的仿真模擬,得出事故嚴(yán)重等級(jí)預(yù)測(cè)值,據(jù)此進(jìn)行時(shí)間-事故間的關(guān)系分析。程序運(yùn)行后,模型的預(yù)測(cè)結(jié)果如圖4所示。
圖4 時(shí)間與傷亡人數(shù)的量化關(guān)系圖
圖4中,橫坐標(biāo)為量化的時(shí)間,為0~3,表征凌晨、上午、下午、晚上這4個(gè)時(shí)間段;縱坐標(biāo)為量化的傷亡人員數(shù),表征事故的嚴(yán)重等級(jí)。發(fā)現(xiàn)在時(shí)間段0,即凌晨0:00~8:00;其次在時(shí)間段3,也就是晚上的18:00~0:00,事故的嚴(yán)重等級(jí)預(yù)測(cè)值較高,模型預(yù)測(cè)在這兩個(gè)時(shí)間段更易發(fā)生嚴(yán)重的交通事故。這一現(xiàn)象的可能原因是在深夜與凌晨這兩個(gè)時(shí)間段,駕駛?cè)烁壮霈F(xiàn)疲勞駕駛以及貨車(chē)存在的超載現(xiàn)象,導(dǎo)致較為嚴(yán)重的事故發(fā)生。
(2)天氣-事故的預(yù)測(cè)分析。在天氣-事故的輸入輸出關(guān)系研究中,設(shè)定的情境輸入層數(shù)據(jù)量化為:(0,*,4,0,1)。通過(guò)模型的仿真模擬,得出事故嚴(yán)重等級(jí)預(yù)測(cè)值,據(jù)此進(jìn)行天氣-事故間的關(guān)系分析。程序運(yùn)行后,模型的預(yù)測(cè)結(jié)果如圖5所示。
圖5 天氣與傷亡人數(shù)的量化關(guān)系圖
圖5中,橫坐標(biāo)為量化的天氣,賦值為0~3,表征晴、陰、雨、霧這4種天氣狀況;縱坐標(biāo)為量化的傷亡人員數(shù),表征事故的嚴(yán)重等級(jí)??梢钥闯觯谔鞖馇闆r為2和3時(shí),也就是雨天與霧天的天氣狀況下,事故的嚴(yán)重等級(jí)預(yù)測(cè)值較高,模型預(yù)測(cè)在雨天及霧天更易發(fā)生嚴(yán)重的交通事故。這一現(xiàn)象可能的原因是因?yàn)樵诟咚俟飞系能?chē)輛行駛車(chē)速較高,雨天狀況下路表摩擦降低,更易發(fā)生事故;霧天狀況下,駕駛?cè)说囊曈X(jué)觀察能力受限,極易導(dǎo)致多車(chē)追尾事故,致使重大事故的發(fā)生。
(3)半徑-事故的預(yù)測(cè)分析。在半徑-事故的輸入輸出關(guān)系研究中,設(shè)定的情境輸入層數(shù)據(jù)量化為:(0,0,4,0,*)。通過(guò)模型的仿真模擬,得出事故嚴(yán)重等級(jí)預(yù)測(cè)值,據(jù)此進(jìn)行半徑-事故間的關(guān)系分析。程序運(yùn)行后,模型預(yù)測(cè)結(jié)果如圖6所示。
圖6 半徑與傷亡人數(shù)的量化關(guān)系圖
圖6中,橫坐標(biāo)為量化的半徑,賦值為0~3,表征4種半徑的取值范圍;縱坐標(biāo)為量化的傷亡人員數(shù),表征事故的嚴(yán)重等級(jí)??梢?jiàn),在半徑編號(hào)為0和1時(shí),即在半徑取值范圍為0~600 m和600~1 500 m時(shí),事故的嚴(yán)重等級(jí)預(yù)測(cè)值均較高,模型預(yù)測(cè)在這兩個(gè)半徑取值范圍內(nèi)的地點(diǎn)更易發(fā)生嚴(yán)重的交通事故。這一現(xiàn)象可能的原因是在小半徑處,尤其是曲線半徑驟然變小時(shí),若保持原有的行車(chē)速度,易發(fā)生側(cè)翻事故,導(dǎo)致嚴(yán)重事故的發(fā)生。
(4)車(chē)輛類型-事故的預(yù)測(cè)分析。在車(chē)輛類型-事故的輸入輸出關(guān)系研究中,設(shè)定的情境輸入層數(shù)據(jù)量化為:(0,0,*,0,1)。通過(guò)模型的仿真模擬,得出事故嚴(yán)重等級(jí)預(yù)測(cè)值,進(jìn)行車(chē)輛-事故的關(guān)系分析。程序運(yùn)行后,模型預(yù)測(cè)結(jié)果如圖7所示。
圖7 車(chē)輛類型與傷亡人數(shù)的量化關(guān)系圖
圖7中,橫坐標(biāo)為量化的車(chē)輛類型,賦值為0~6,表征7種類型的肇事車(chē)輛;縱坐標(biāo)為量化的傷亡人員數(shù),表征事故的嚴(yán)重等級(jí)??梢钥闯?,在車(chē)輛類型編號(hào)為3和5時(shí),即在車(chē)輛為重型貨車(chē)和汽車(chē)列車(chē)的情況下,事故的嚴(yán)重等級(jí)預(yù)測(cè)值較高,模型預(yù)測(cè)這兩類車(chē)型更易發(fā)生嚴(yán)重的事故。這一現(xiàn)象可能的原因是在山區(qū)高速公路上,重型貨車(chē)和汽車(chē)列車(chē)的裝載大且車(chē)速較快。尤其與客車(chē)發(fā)生碰撞時(shí),極易造成人員傷亡,致使嚴(yán)重事故的發(fā)生。
本文采用基于粒子群優(yōu)化的BP網(wǎng)絡(luò)建立了山區(qū)高速公路的事故嚴(yán)重等級(jí)的預(yù)測(cè)模型,并基于昆石高速公路的事故數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證。經(jīng)驗(yàn)證,模型的預(yù)測(cè)效果較佳。預(yù)測(cè)準(zhǔn)確率為89.6%后,通過(guò)設(shè)定情境,用模型進(jìn)行仿真分析,得出了一些事故發(fā)生規(guī)律。仿真結(jié)果表明:在凌晨時(shí)段、雨霧天、以及在小半徑處,駕駛重型貨車(chē)等情況下,更易發(fā)生嚴(yán)重的事故,這就需要駕駛?cè)嗽谶@些情況下更加注重行車(chē)安全。