袁振洲,郭曼澤,彭泳鑫,楊洋*
(北京交通大學(xué),a.綜合交通運(yùn)輸大數(shù)據(jù)應(yīng)用技術(shù)交通運(yùn)輸行業(yè)重點(diǎn)實(shí)驗(yàn)室;b.交通運(yùn)輸學(xué)院,北京100044)
隨著世界人口的不斷增長(zhǎng),人口老齡化問(wèn)題日趨嚴(yán)重[1],老年人出行安全問(wèn)題也逐漸得到重視。近年來(lái),學(xué)者們對(duì)老年行人交通事故研究?jī)?nèi)容分析主要涉及造成事故因素、安全意識(shí)調(diào)查研究、危險(xiǎn)認(rèn)知能力研究、事故空間環(huán)境探究等方面。DAS等[2]研究老年行人碰撞影響因素之間的關(guān)聯(lián),發(fā)現(xiàn)一些可能導(dǎo)致老年行人事故高發(fā)的關(guān)聯(lián)結(jié)果,包括女性行人(79 歲以上)與駕駛員倒車(chē)碰撞,65~69 歲男性行人在夜間更容易發(fā)生事故,以及黑夜光照條件較差也會(huì)使老年行人出行更加危險(xiǎn)。DOMMES等[3]研究表明,老年被試者過(guò)街速度較慢,具有較低的安全閾值,更易導(dǎo)致碰撞事故的產(chǎn)生。老年參與者主要考慮近車(chē)道上的時(shí)間間隔而忽略遠(yuǎn)車(chē)道上的時(shí)間間隔,此外,研究還發(fā)現(xiàn)老年行人危險(xiǎn)判斷能力、注意力相比年輕人存在普遍降低的情況。還有一些研究發(fā)現(xiàn)了與年齡相關(guān)的身體機(jī)能變化和健康等問(wèn)題,例如,老年癡呆、肌肉萎縮等會(huì)間接促成老年行人事故中的死亡[4-5]。KIM[6]考慮城市環(huán)境因素是否和老年行人安全相關(guān),結(jié)果顯示,T 型交叉口的設(shè)置,路邊行道樹(shù)的種植,以及公園等休閑用地設(shè)施的存在等環(huán)境因素提高了老年行人的安全性。公交站數(shù)量的增加會(huì)使老年行人事故風(fēng)險(xiǎn)增加;斑馬線的使用會(huì)降低青年行人的事故率,反而增加老年人出行危險(xiǎn)性。研究問(wèn)題層面,研究者們對(duì)于老年行人這一特定年齡段群體的交通事故關(guān)注度欠缺。多數(shù)事故因素分析強(qiáng)調(diào)因果關(guān)系,忽略事故特征之間相關(guān)關(guān)聯(lián)關(guān)系。而部分研究由于實(shí)際事故數(shù)據(jù)的空缺使老年行人碰撞研究大部分停留在實(shí)驗(yàn)室仿真模擬階段,缺少對(duì)實(shí)際事故的具體研究分析。
研究方法主要涉及:利用邏輯回歸、貝葉斯網(wǎng)絡(luò)等方法展開(kāi)的已發(fā)生事故的原因分析;利用模擬實(shí)驗(yàn)的形式采集的事故發(fā)生時(shí)行人行為、駕駛員行為特征分析;利用大數(shù)據(jù)環(huán)境下的機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘方法分析事故風(fēng)險(xiǎn)識(shí)別以及事故特征。
傳統(tǒng)建模方法難以同時(shí)兼顧模型準(zhǔn)確度與靈活性(可移植性),或在前者基礎(chǔ)上同時(shí)兼顧數(shù)據(jù)缺失值的處理。LI 等[7]在2016年提出一種稀疏數(shù)據(jù)感知算法和近似樹(shù)學(xué)習(xí)加權(quán)分位數(shù)圖算法,在梯度提升算法的基礎(chǔ)上進(jìn)一步優(yōu)化,由于其良好的計(jì)算功能,克服了許多傳統(tǒng)建模方法中和傳統(tǒng)機(jī)器學(xué)習(xí)方法上的缺點(diǎn)。SHI等[8]研究設(shè)計(jì)一種駕駛行為特征提取和選擇的算法,評(píng)估車(chē)輛駕駛水平和預(yù)測(cè)風(fēng)險(xiǎn)水平。該算法集成了基于學(xué)習(xí)的特征選擇、無(wú)監(jiān)督風(fēng)險(xiǎn)評(píng)級(jí)和不平衡數(shù)據(jù)重采樣的方法,利用XGBoost 算法建立行為特征與相應(yīng)風(fēng)險(xiǎn)水平之間的關(guān)聯(lián),通過(guò)特征重要性排序和遞歸消除識(shí)別關(guān)鍵特征,結(jié)果顯示XGBoost針對(duì)關(guān)鍵特征識(shí)別的準(zhǔn)確度較高,更加有效地實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè)風(fēng)險(xiǎn)水平。關(guān)聯(lián)規(guī)則分析也是針對(duì)該問(wèn)題常用的數(shù)據(jù)挖掘研究方法,其中Apriori 關(guān)聯(lián)規(guī)則挖掘算法是關(guān)聯(lián)規(guī)則分析的主要方法之一。
但XGBoost 和Apriori 兩種數(shù)據(jù)挖掘方法在應(yīng)用過(guò)程中也存在一些不足。XGBoost 算法在老年行人交通事故上的應(yīng)用少有體現(xiàn),同時(shí),該方法同其他樹(shù)模型的使用局限性一樣,無(wú)法實(shí)現(xiàn)對(duì)事故多屬性間的關(guān)聯(lián)考慮,也無(wú)法對(duì)事故原因進(jìn)行有效的定量化呈現(xiàn)和剖析;Apriori算法能夠?qū)崿F(xiàn)事物多屬性之間的關(guān)聯(lián)考慮,但傳統(tǒng)Apriori 算法由于在交通事故致因分析和風(fēng)險(xiǎn)識(shí)別的關(guān)聯(lián)規(guī)則挖掘工作中,對(duì)各風(fēng)險(xiǎn)因素進(jìn)行等權(quán)重處理,會(huì)出現(xiàn)因果顛倒的無(wú)效甚至錯(cuò)誤的無(wú)序關(guān)聯(lián)規(guī)則[9]。
面對(duì)老年行人交通事故的嚴(yán)峻形勢(shì),為準(zhǔn)確提取老年行人交通事故的內(nèi)在機(jī)理,有效提高老年行人的交通安全水平,有必要對(duì)老年行人交通事故進(jìn)行風(fēng)險(xiǎn)識(shí)別和嚴(yán)重程度預(yù)測(cè)研究。為準(zhǔn)確識(shí)別老年行人交通事故嚴(yán)重程度的影響因素,并準(zhǔn)確預(yù)測(cè)導(dǎo)致老年行人交通事故嚴(yán)重性成因之間的關(guān)聯(lián)關(guān)系,本文提出一種結(jié)合機(jī)器學(xué)習(xí)算法加權(quán)改進(jìn)的關(guān)聯(lián)規(guī)則算法XGB-Apriori,以期對(duì)老年行人事故實(shí)現(xiàn)精準(zhǔn)識(shí)別,精準(zhǔn)預(yù)判。
本文數(shù)據(jù)來(lái)源于美國(guó)科羅拉多州64 個(gè)郡2006—2016年的行人交通事故,事故數(shù)共11856條。SIRAM 等[10]研究表明,年齡大于等于65 歲被定義為老年人,在交通事故分析領(lǐng)域被廣泛應(yīng)用。本文使用65 歲作為老年行人的年齡分界,根據(jù)行人年齡的初步篩選,得到老年行人交通事故數(shù)據(jù)共856條??屏_拉多州老年行人交通事故在不同市內(nèi)的密度分布情況如圖1所示。
圖1 老年行人交通事故密度分布Fig.1 Number of older pedestrian traffic crashes density distribution map
道路交通安全基于人、車(chē)、路、環(huán)境的相互作用,而交通事故的產(chǎn)生則是人、車(chē)、路、環(huán)境之間的相互耦合作用導(dǎo)致的結(jié)果,因此,本文按照人、車(chē)、路、環(huán)境將數(shù)據(jù)字段劃分為4 個(gè)維度。其中,人作為交通事故的第一因素,大約94%~96%的車(chē)輛撞擊事故是由于人的錯(cuò)誤造成的[11],不同司機(jī)和行人的狀態(tài)和行為對(duì)行人交通事故有著顯著不同的影響,例如,司機(jī)和行人的性別、年齡、以及事故雙方當(dāng)時(shí)的行為狀態(tài)。本文將現(xiàn)有事故分類(lèi)數(shù)據(jù)字段分布逐一列出,如表1所示。
表1 樣本主要特征信息Table 1 Information table of main characteristics of sample
人的因素主要涉及駕駛員以及老年行人的身體因素,其中,老年行人男性的致死事故(FAT)數(shù)是女性的3.14 倍,受傷事故(INJ)是女性的2.13 倍,財(cái)產(chǎn)損失事故(PDO)是女性的2.30倍。致死事故中駕駛員的性別比例男性是女性的1.69 倍。當(dāng)事故發(fā)生時(shí),有57%的事故,老年行人和車(chē)輛的碰撞角度為垂直90°,說(shuō)明絕大多數(shù)的老年行人交通事故發(fā)生在雙方都處于對(duì)方視野弱側(cè)的情況下,具有一定的意外性。車(chē)輛的不同維度參數(shù),例如,車(chē)輛高度、體積、重量等對(duì)事故發(fā)生時(shí)司機(jī)的視野情況、司機(jī)的感知反應(yīng),特別是針對(duì)老年行人事故的嚴(yán)重程度有著不同于其他類(lèi)型交通事故的影響。車(chē)輛因素方面,造成事故的非小汽車(chē)類(lèi)型的車(chē)輛(SUV、卡車(chē)、公交車(chē)、校車(chē)),參與的事故數(shù)占總體車(chē)輛的比例為40%。道路因素中,不同的道路線形以及事故位置對(duì)于司機(jī)的駕駛行為以及視野、行人過(guò)馬路的安全性都有一定的影響。發(fā)生在路段上的老年行人致死事故是交叉口致死事故的7.28倍,說(shuō)明擁有斑馬線的交叉口在實(shí)際交通情況下確實(shí)能夠幫助減少行人交通事故。因此,由多種類(lèi)型的因素可見(jiàn),事故發(fā)生各特征值對(duì)應(yīng)的事故數(shù)之間呈現(xiàn)一定的比率關(guān)系,說(shuō)明事故風(fēng)險(xiǎn)和一些因素有著較強(qiáng)關(guān)聯(lián),某些特征可能具有較高的事故傾向性。因此,本文利用建模詳細(xì)分析事故特征之間的關(guān)系,并識(shí)別事故風(fēng)險(xiǎn)。
Apriori 算法可以從海量數(shù)據(jù)中挖掘出數(shù)據(jù)之間有意義的關(guān)聯(lián)規(guī)則及他們之間的相關(guān)聯(lián)系,但在計(jì)算過(guò)程中存在缺點(diǎn):當(dāng)事務(wù)數(shù)據(jù)庫(kù)很大時(shí),候選頻繁項(xiàng)集數(shù)量巨大,在驗(yàn)證候選頻繁項(xiàng)集時(shí),需要掃描整個(gè)數(shù)據(jù)庫(kù),非常耗時(shí);無(wú)定向關(guān)聯(lián)規(guī)則計(jì)算會(huì)導(dǎo)致結(jié)果分析結(jié)構(gòu)邏輯錯(cuò)誤;由于老年行人交通事故數(shù)據(jù)特性較為復(fù)雜,維度較多,直接進(jìn)行關(guān)聯(lián)規(guī)則挖掘會(huì)導(dǎo)致算法效率降低且會(huì)出現(xiàn)大量無(wú)用以及無(wú)關(guān)聯(lián)的結(jié)果。為盡可能消除并修正算法不足,在傳統(tǒng)Apriori算法上考慮如下層面的改進(jìn):
(1)通過(guò)機(jī)器學(xué)習(xí)XGBoost模型提取變量特征值與權(quán)重優(yōu)化。
(2)對(duì)算法進(jìn)行有序定向約束設(shè)置,令算法適用于交通事故致因分析,以期在處理老年行人交通事故分析時(shí),避免輸出結(jié)果中先導(dǎo)項(xiàng)和后繼項(xiàng)錯(cuò)位顛倒的情況發(fā)生。
通過(guò)對(duì)表1中各種因素的特征變量(年齡、行駛速度、時(shí)間等特征變量為連續(xù)變量,其他為分類(lèi)變量)利用XGBoost梯度提升算法開(kāi)展機(jī)器學(xué)習(xí)得到的客觀權(quán)重值進(jìn)行集成優(yōu)化,實(shí)現(xiàn)機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘算法的有效集成。機(jī)器學(xué)習(xí)方法的利用能夠?qū)⑻卣骶S度進(jìn)行合理降維,幫助關(guān)聯(lián)規(guī)則算法更加準(zhǔn)確地識(shí)別關(guān)聯(lián)因素之間的強(qiáng)關(guān)聯(lián)關(guān)系,提高計(jì)算效率與準(zhǔn)確度。
2.1.1 特征選擇路線
為從大量老年行人事故的特征中選擇顯著特征,本文利用scikit-learn庫(kù)中提供的特征選擇法以及接口選擇特征變量,將特征選擇本身作為組成部分嵌入到學(xué)習(xí)算法里,即將SFM 方法與機(jī)器學(xué)習(xí)器XGBoost訓(xùn)練過(guò)程融合,在學(xué)習(xí)的過(guò)程中同時(shí)進(jìn)行特征選擇。根據(jù)計(jì)算出的特征重要性刪除無(wú)關(guān)緊要的特征。基于學(xué)習(xí)模型的特征排序,采取預(yù)先訓(xùn)練模型的方法,在整個(gè)數(shù)據(jù)集上生成不同的特征子集進(jìn)行訓(xùn)練。進(jìn)而,通過(guò)閾值決定選擇特征變量數(shù),得到重要性高的特征以及其重要性。最后,將整個(gè)算法封裝在SFM 轉(zhuǎn)化器中,完成整個(gè)數(shù)據(jù)集中特征方案的評(píng)估和選擇。scikit-learn決策算法如圖2所示。
圖2 Scikit-learn決策算法Fig.2 Scikit-learn decision algorithm
2.1.2 特征選擇器-XGBoost
XGBoost 是由k個(gè)基礎(chǔ)樹(shù)模型組成的加法運(yùn)算式。在對(duì)老年行人致死事故的特征值重要度選擇建模中,對(duì)每一個(gè)事故中特征值預(yù)測(cè)時(shí)均構(gòu)成組合,最終構(gòu)成k個(gè)基礎(chǔ)樹(shù)模型的組合。通過(guò)驗(yàn)證模型準(zhǔn)確度以及選擇最終得到的計(jì)算相對(duì)值,選擇高得分項(xiàng)的特征值。
模型的預(yù)測(cè)精度由模型的偏差和方差共同決定,XGBoost目標(biāo)函數(shù)由模型的損失函數(shù)L與抑制模型復(fù)雜度的正則項(xiàng)Ω組成,即
式中:Ij為葉子節(jié)點(diǎn)j的實(shí)例集。
為高效挖掘模型潛力,以便后期在特征和模型融合上,能夠更加精準(zhǔn),在編程階段對(duì)該步驟進(jìn)行必要的參數(shù)調(diào)整。
2.1.3 特征評(píng)價(jià)指標(biāo)計(jì)算
由于F-score 能夠衡量特征在模型中提升決策樹(shù)構(gòu)建的價(jià)值,因此,學(xué)習(xí)模型將輸出特征的相對(duì)重要程度值F-score,作為本文的一種特征選擇指標(biāo),其表達(dá)式為
式中:v為特征值;h為樹(shù)模型集合H的某一個(gè)樹(shù)模型;q為葉子非端點(diǎn)節(jié)點(diǎn)集合Q的某個(gè)節(jié)點(diǎn);hq為結(jié)構(gòu)樹(shù)h的非端點(diǎn)節(jié)點(diǎn)的特征集合,最終得分表示在所有數(shù)枝上的任何節(jié)點(diǎn)上出現(xiàn)次數(shù)的總和。其中,第1 次加和是對(duì)行人事故特征值v在結(jié)構(gòu)樹(shù)h的Q個(gè)非端點(diǎn)節(jié)點(diǎn)q中被用于分裂節(jié)點(diǎn)q的次數(shù)的和;第2次加和是針對(duì)XGBoost模型參數(shù)中設(shè)定的所有結(jié)構(gòu)樹(shù)集合H進(jìn)行遍歷加和,得到特征值v的特征得分。
在相對(duì)重要度選擇基礎(chǔ)上,特征v的全局重要度權(quán)重通過(guò)該特征的特征重要值與選定閾值條件下所有特征的特征重要值之和的比值來(lái)表示,作為特征重要度權(quán)重結(jié)果,即
式中:V為通過(guò)閾值選擇的重要特征值。
2.2.1 關(guān)聯(lián)挖掘原理
關(guān)聯(lián)規(guī)則挖掘采用逐層搜索的迭代方法,基本思想是利用遍歷的方法計(jì)算頻率,進(jìn)而再進(jìn)行層層查找,在生成的候選項(xiàng)集中尋找頻繁項(xiàng)集[12]。
1 條完整的關(guān)聯(lián)規(guī)則可以表示為“A= >B”的蘊(yùn)含形式,A是先導(dǎo)項(xiàng),又稱(chēng)為致因?qū)?,B是后繼項(xiàng),又稱(chēng)為結(jié)果層。關(guān)聯(lián)規(guī)則“A= >B”為研究中可視且成立的基本條件,符合預(yù)設(shè)支持度、置信度和提升度的要求,支持度(Support)、置信度(Confidence)、提升度(Lift)是表征關(guān)聯(lián)規(guī)則的3 個(gè)重要參數(shù)。舉例說(shuō)明,項(xiàng)目集A對(duì)項(xiàng)目集B的關(guān)聯(lián)挖掘表征參數(shù)分別記為:ESup(A=>B)反映了A和B中所含的事務(wù)的項(xiàng)在事務(wù)集中同時(shí)出現(xiàn)的頻率,EConf(A=>B)反映了包含X的事務(wù)中出現(xiàn)Y的條件概率,ELift(A=>B)反映了A的出現(xiàn)對(duì)B出現(xiàn)概率提升的程度。
參數(shù)設(shè)定:在建模過(guò)程中,指定最小支持度(min_support)和最小置信度(min_confidence),前者描述關(guān)聯(lián)規(guī)則需滿(mǎn)足的最低重要程度,后者規(guī)定關(guān)聯(lián)規(guī)則必須滿(mǎn)足的最低可靠性,且min_support ∈(0,1],min_confidence ∈(0,1]。
強(qiáng)關(guān)聯(lián)規(guī)則:數(shù)據(jù)集D在項(xiàng)目集上滿(mǎn)足最小支持度閾值和最小信任度閾值,同時(shí)提升度ELift>1的關(guān)聯(lián)規(guī)則就稱(chēng)為有價(jià)值的強(qiáng)關(guān)聯(lián)規(guī)則。
2.2.2 XGB-Apriori算法構(gòu)建
在遍歷后選擇出的重要特征值,并得到重要字段變量指標(biāo)權(quán)重。Apriori算法通過(guò)尋找頻繁項(xiàng)集,逐層迭代搜索:通過(guò)掃描數(shù)據(jù)庫(kù),累計(jì)每個(gè)項(xiàng)的計(jì)數(shù),得到候選集C1,根據(jù)最小支持度篩選出頻繁1項(xiàng)集的集合,記為L(zhǎng)1;然后,使用L1結(jié)合產(chǎn)生2項(xiàng)集的集合C2,按最小支持度篩選出L2,按照該方式不斷迭代下去,直到最后得到p項(xiàng)集的集合Cp,并篩選出Lp,得到頻繁項(xiàng)集,p為數(shù)據(jù)庫(kù)中項(xiàng)的最大數(shù)。
根據(jù)已經(jīng)找到的頻繁項(xiàng)集,利用非空子集構(gòu)造規(guī)則,找出滿(mǎn)足條件的表達(dá)式,即強(qiáng)關(guān)聯(lián)規(guī)則,最終得到擁有強(qiáng)關(guān)聯(lián)的項(xiàng)目集。通過(guò)梯度提升XGBoost 算法優(yōu)化的Apriori 算法模型示意如圖3所示,其中,表示篩選集合中某一被篩選集合L1所對(duì)應(yīng)的后繼項(xiàng)集合,R1則表示后繼項(xiàng)絕對(duì)值,表示針對(duì)先導(dǎo)向篩選集合的后繼項(xiàng)相對(duì)值。
圖3 XGB-Apriori模型算法框架Fig.3 Construction diagram of XGB-Apriori model algorithm
圖4 XGB-Apriori的算法設(shè)計(jì)流程Fig.4 Algorithm design flowchart of XGB-Apriori
基于XGB-Apriori算法的行人交通事故風(fēng)險(xiǎn)識(shí)別流程如下:
Step 1 樣本結(jié)構(gòu)化設(shè)計(jì)。按照事故屬性變量的維度與層次劃分,確定待分析的屬性變量,提取相關(guān)屬性變量數(shù)據(jù)集。
Step 2 極限梯度提升XGBoost 優(yōu)化特征權(quán)重。利用scikit-learn 機(jī)器學(xué)習(xí)庫(kù)中XGBoost 算法與SFM 類(lèi)功能融合實(shí)現(xiàn)特征選擇,并計(jì)算樣本數(shù)據(jù)集中各字段變量的權(quán)值。
Step 3 設(shè)置關(guān)聯(lián)規(guī)則挖掘中的定向約束。根據(jù)具體挖掘中考慮的維度與指向,設(shè)置各字段變量在先導(dǎo)項(xiàng)和后繼項(xiàng)的約束集合。
Step 4 參數(shù)設(shè)置。根據(jù)不同關(guān)聯(lián)分析背景要求以及數(shù)據(jù)形式,確定最小支持度(min-sup)、最小置信度(min-conf),以及提升度(Lift)的閾值。
Step 5 XGB-Apriori關(guān)聯(lián)規(guī)則挖掘。依照XGB-Apriori 算法流程,先求出滿(mǎn)足最小支持度閾值的頻繁項(xiàng)集,再根據(jù)最小置信度閾值和提升度閾值約束條件,求得并輸出符合要求的關(guān)聯(lián)規(guī)則。
Step 6 基于Step 3中的特征值指標(biāo)權(quán)重優(yōu)化結(jié)果,求得各規(guī)則的相對(duì)支持度(ER-Sup)、相對(duì)置信度(ER-Conf),以及相對(duì)提升度(ER-Lift)值,重新排序并篩選出有價(jià)值的強(qiáng)關(guān)聯(lián)規(guī)則。
Step 7 關(guān)聯(lián)規(guī)則解讀以及取得的相關(guān)成果在行人交通安全管理中的應(yīng)用。
856 條老年行人交通事故數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)清洗,去掉其中的0值數(shù)據(jù)以及無(wú)效數(shù)據(jù),針對(duì)該數(shù)據(jù)做XGBoost的機(jī)器學(xué)習(xí)建模,隨機(jī)選取其中80%的數(shù)據(jù)建立模型,20%的數(shù)據(jù)做模型驗(yàn)證。XGBoost 的機(jī)器學(xué)習(xí)方法會(huì)遍歷整個(gè)數(shù)據(jù)集,找到合適的分隔點(diǎn)進(jìn)行數(shù)的分割,利用SFM 算法計(jì)算各項(xiàng)特征值重要度,通過(guò)不斷地迭代,最終得到訓(xùn)練后的結(jié)果。
引入基線準(zhǔn)確度(Baseline Accuracy)作為驗(yàn)證模型準(zhǔn)確度合理性的指標(biāo)之一,在做分類(lèi)預(yù)測(cè)的模型中,基線準(zhǔn)確度將數(shù)據(jù)量中高頻出現(xiàn)類(lèi)別的預(yù)測(cè)準(zhǔn)確度作為該模型的準(zhǔn)確度值,模型預(yù)測(cè)的最終準(zhǔn)確度如果低于基線準(zhǔn)確度,說(shuō)明需要提高建模的數(shù)據(jù)量或利用功能更強(qiáng)的機(jī)器學(xué)習(xí)算法重新構(gòu)建模型。本文關(guān)于老年行人交通事故嚴(yán)重程度分類(lèi)的模型評(píng)價(jià),對(duì)模型預(yù)測(cè)精確率和召回率做綜合評(píng)估,最終的預(yù)測(cè)準(zhǔn)確度F1 值為78.31%?;€準(zhǔn)確度為69.94%,說(shuō)明模型構(gòu)建的合理性。
模型選定重要度的特征值個(gè)數(shù)通過(guò)設(shè)定閾值實(shí)現(xiàn),SFM算法提取閾值選定結(jié)果如表2所示。
表2 SFM算法提取閾值選定結(jié)果Table 2 Extraction of threshold selection results by SFM algorithm
由表2可知,SFM算法提取閾值選定的特征值個(gè)數(shù)為21 時(shí),得到的模型預(yù)測(cè)準(zhǔn)確度相比小于或是大于21個(gè)數(shù)時(shí)的基線準(zhǔn)確度最高,因此,選擇前21位特征值進(jìn)行進(jìn)一步的分析。
模型中針對(duì)嚴(yán)重程度的分析,分為:0,INJURY 1,F(xiàn)ATAL 2,PDO 這4 類(lèi),參數(shù)調(diào)整后的最終參數(shù)與值如表3所示。
表3 Xgboost算法模型調(diào)參結(jié)果Table 3 Xgboost algorithm model tuning results
人、車(chē)、路、環(huán)境4個(gè)維度的數(shù)據(jù)特征值與老年行人交通事故嚴(yán)重程度等級(jí)之間的聯(lián)系通過(guò)XGBoost構(gòu)建。XGBoost 建模過(guò)程中,配置超參數(shù)以構(gòu)建適當(dāng)?shù)哪P瓦M(jìn)行特征排序。經(jīng)過(guò)模型訓(xùn)練,生成各特征的分割權(quán)值和平均增益,并對(duì)其進(jìn)行歸一化,分別計(jì)算基于權(quán)重和基于增益的相對(duì)重要度得分。分?jǐn)?shù)衡量的是在XGBoost 中構(gòu)建的樹(shù)的功能有效性。特征值分?jǐn)?shù)越高表明相對(duì)重要性越大,為快速的特征過(guò)濾定義了一個(gè)評(píng)分閾值范圍。在每次迭代中,保留重要性分?jǐn)?shù)大于閾值的特征,通過(guò)10倍分層交叉驗(yàn)證估計(jì)學(xué)習(xí)性能。采用基于權(quán)重和基于增益的重要度排序的特征濾波算法,根據(jù)模型閾值基線準(zhǔn)確度截取重要度較高的前21個(gè)數(shù)據(jù)特征值進(jìn)行結(jié)果分析。結(jié)果表明,司機(jī)年齡、老年人年齡、司機(jī)駕駛速度以及發(fā)生事故的時(shí)間等特征值均對(duì)老年行人交通事故的嚴(yán)重程度帶來(lái)重要影響。
依照樣本結(jié)構(gòu)設(shè)計(jì)和處理流程處理后,提取科羅拉多州老年行人交通事故數(shù)據(jù)857條,特征值21個(gè)。首先,進(jìn)行各維度數(shù)據(jù)的輸入,設(shè)置初始閾值,考慮初始樣本數(shù)量以及老年行人事故特征,按照參數(shù)特性調(diào)整閾值,經(jīng)過(guò)不斷人工調(diào)試,設(shè)置最小相對(duì)支持度閾值min-sup 為0.01,最小相對(duì)置信度閾值min-conf為0.1;進(jìn)而,分別應(yīng)用原始Apriori關(guān)聯(lián)規(guī)則挖掘算法和考慮定向約束改進(jìn)的XGBApriori 關(guān)聯(lián)規(guī)則挖掘算法對(duì)輸入的數(shù)據(jù)集進(jìn)行關(guān)聯(lián)規(guī)則挖掘,獲得相關(guān)的規(guī)則[13]。挖掘結(jié)果匯總?cè)鐖D5所示,未加載定向約束的原始Apriori 算法輸出結(jié)果加載定向約束的改進(jìn)算法XGB-Apriori輸出結(jié)果
圖5 傳統(tǒng)Apriori算法與改進(jìn)XGB-Apriori算法挖掘結(jié)果精度提升對(duì)比Fig.5 Comparison of improvement of mining accuracy
通過(guò)以上計(jì)算結(jié)果可以識(shí)別:未加載定向約束的原始Apriori 關(guān)聯(lián)規(guī)則挖掘算法共挖掘到5966159 條關(guān)聯(lián)規(guī)則,應(yīng)用本文提出的改進(jìn)XGBApriori 模型,在相同的參數(shù)閾值設(shè)置條件下,挖掘結(jié)果只輸出符合條件的300009條關(guān)聯(lián)規(guī)則。換言之,如果未對(duì)算法進(jìn)行優(yōu)化和改進(jìn),在該樣本計(jì)算條件下,將至少產(chǎn)生5666150 條無(wú)效的關(guān)聯(lián)規(guī)則,即改進(jìn)的XGB-Apriori 模型比傳統(tǒng)Apriori 模型在進(jìn)行行人交通事故耦合機(jī)理挖掘時(shí),計(jì)算精確度提高了91%。由此可見(jiàn),對(duì)此類(lèi)問(wèn)題采用傳統(tǒng)的Apriori算法,將對(duì)結(jié)果造成極大混淆,因此,本文對(duì)Apriori算法進(jìn)行的優(yōu)化改進(jìn)十分必要。
對(duì)挖掘結(jié)果進(jìn)行可視化渲染處理,如圖6所示,橫坐標(biāo)表征相對(duì)支持度(R-Sup),縱坐標(biāo)表征相對(duì)置信度( R-Conf ),顏色深淺為相對(duì)提升度(R-Lift)大小。
圖6 基于參數(shù)標(biāo)定的閾值修正挖掘結(jié)果分布情況Fig.6 Distribution of mining results of threshold correction based on parameter calibration
由圖6關(guān)聯(lián)規(guī)則散點(diǎn)圖可以發(fā)現(xiàn):一部分關(guān)聯(lián)規(guī)則的相對(duì)支持度介于0.05~0.13 之間,另一部分介于0.05~0.79 之間,說(shuō)明在所有符合閾值條件規(guī)則中高頻規(guī)則和低頻規(guī)則并存;從相對(duì)置信度指標(biāo)來(lái)看,大部分關(guān)聯(lián)規(guī)則的相對(duì)置信度在0.5~0.95之間,另有少數(shù)規(guī)則的相對(duì)置信度大于0.05~0.25,但介于0.5~0.75 相對(duì)置信度的區(qū)域,其顏色較淺,意味著這部分關(guān)聯(lián)規(guī)則的提升度可能不足,有可能是項(xiàng)集間關(guān)聯(lián)程度不夠,甚至是無(wú)效的關(guān)聯(lián)規(guī)則,說(shuō)明本次建模的初始相對(duì)置信度閾值設(shè)置較小,上調(diào)為0.7更有利于有效規(guī)則的篩選;同時(shí),對(duì)于相對(duì)提升度指標(biāo),通過(guò)觀察散點(diǎn)圖中的顏色,大約有1/2關(guān)聯(lián)規(guī)則的相對(duì)提升度小于1,說(shuō)明有很大部分規(guī)則未能滿(mǎn)足提升度大于1的約束條件,即為無(wú)效的關(guān)聯(lián)規(guī)則。因此,需重新調(diào)整模型參數(shù)進(jìn)一步分析篩選有效關(guān)聯(lián)規(guī)則。因此,最小相對(duì)支持度保持原有量級(jí),調(diào)整為0.1,最小相對(duì)置信度閾值設(shè)為0.75,得到符合約束條件(相對(duì)支持度sup 大于0.1,相對(duì)置信度conf 大于0.75)的關(guān)聯(lián)規(guī)則共11734 條。進(jìn)一步提取計(jì)算得到頻繁項(xiàng)集中高相對(duì)支持度和高相對(duì)置信度的關(guān)聯(lián)規(guī)則,排序并分別提取相對(duì)支持度和相對(duì)置信度前三的關(guān)聯(lián)規(guī)則。
高相對(duì)支持度的關(guān)聯(lián)規(guī)則,表征此類(lèi)頻繁項(xiàng)集發(fā)生的頻率較高,在考慮老年行人風(fēng)險(xiǎn)防控時(shí),應(yīng)盡可能減少或阻止先導(dǎo)項(xiàng)發(fā)生;高相對(duì)置信度的關(guān)聯(lián)規(guī)則,表征此類(lèi)頻繁項(xiàng)集發(fā)生的條件概率比較高,在考慮老年行人風(fēng)險(xiǎn)防控時(shí),一旦其先導(dǎo)項(xiàng)條件發(fā)生,就應(yīng)格外注意防止后繼項(xiàng)的事故發(fā)生。相對(duì)支持度排序輸出有價(jià)值規(guī)則如表4所示。
表4 相對(duì)支持度排序輸出有價(jià)值關(guān)聯(lián)規(guī)則Table 4 Relative support sorting outputs valuable association rules
表4中,第1條關(guān)聯(lián)規(guī)則,由本文提出的相對(duì)支持度、相對(duì)置信度與相對(duì)提升度的概念表征針對(duì)整個(gè)事務(wù)集的相對(duì)值,相對(duì)支持度(R-Sup)為0.789 表示先導(dǎo)項(xiàng)中駕駛員年齡、駕駛員是否使用安全帶等因素和后繼項(xiàng)老年行人受傷事故并列發(fā)生的事故數(shù)占所有事故集合比例較高,因此,在風(fēng)險(xiǎn)防控時(shí),應(yīng)盡可能避免或減少先導(dǎo)項(xiàng)的發(fā)生。相對(duì)置信度(R-Conf)為0.762 表示駕駛員年齡、安全帶使用、駕駛員性別等屬性符合第1條關(guān)聯(lián)規(guī)則時(shí),在與事故相關(guān)的所有關(guān)聯(lián)規(guī)則中,老年行人受傷的可能性相對(duì)較大,因此,該事故項(xiàng)級(jí)一旦其先導(dǎo)項(xiàng)發(fā)生,應(yīng)該更加警惕行人受傷事件的發(fā)生。相對(duì)提升度(RLift)為1.002表示上述相對(duì)支持度與相對(duì)置信度之間的關(guān)聯(lián)性是強(qiáng)相關(guān)的。相對(duì)置信度排序輸出有價(jià)值關(guān)聯(lián)規(guī)則如表5所示。
表5 相對(duì)置信度排序輸出有價(jià)值關(guān)聯(lián)規(guī)則Table 5 Relative confidence sort outputs valuable association rules
為更形象地體現(xiàn)輸出結(jié)果的關(guān)聯(lián)形式和各關(guān)聯(lián)規(guī)則的參數(shù)水平,對(duì)關(guān)聯(lián)規(guī)則挖掘結(jié)果進(jìn)行更清晰的直觀分析,對(duì)以上改進(jìn)XGB-Apriori 算法的挖掘結(jié)果,通過(guò)R語(yǔ)言中的關(guān)聯(lián)規(guī)則可視化分析工具包arulesViz 中的“plot-grouped”函數(shù)繪制關(guān)聯(lián)矩陣圖如圖7所示。圖中,橫軸為規(guī)則先導(dǎo)項(xiàng)集(LHS),縱軸為規(guī)則后繼項(xiàng)集(RHS),圓圈節(jié)點(diǎn)代表一條有效關(guān)聯(lián)規(guī)則,圓圈節(jié)點(diǎn)大小代表關(guān)聯(lián)規(guī)則的相對(duì)支持度(R-Sup),越大說(shuō)明相對(duì)支持度越大,圓圈節(jié)點(diǎn)顏色表示關(guān)聯(lián)規(guī)則相對(duì)置信度(R-Conf),顏色越深說(shuō)明相對(duì)置信度越高。虛線框分別圈出高相對(duì)支持度、高相對(duì)置信度或相對(duì)支持度相對(duì)置信度雙高所對(duì)應(yīng)的一條關(guān)聯(lián)規(guī)則。
針對(duì)老年行人的交通事故后果與嚴(yán)重程度層面,通過(guò)圖7 可知:老年行人交通事故中產(chǎn)生的事故后果多為造成人員受傷(INJURY),即造成人員受傷的事故頻率較高(高相對(duì)支持度);發(fā)生老年人員死亡后果(FAT)和僅財(cái)產(chǎn)損失的后果(PDO)雖然整體發(fā)生的頻率相對(duì)較低,但在特定的致因維度層面指標(biāo)耦合條件下,存在較高的概率發(fā)生此類(lèi)事故(相對(duì)高置信度),體現(xiàn)具體事故耦合機(jī)理的關(guān)聯(lián)規(guī)則需要進(jìn)一步提取并分析其內(nèi)在規(guī)律。
圖7 閾值修正后挖掘結(jié)果矩陣可視化效果圖Fig.7 Visual renderings of mining result matrix after threshold correction
提升度作為篩選判斷參數(shù),在算法設(shè)計(jì)校準(zhǔn)參數(shù)時(shí)已將min-lift閾值設(shè)置為1,即輸出的結(jié)果中并不存在提升度小于1的關(guān)聯(lián)規(guī)則,只需關(guān)注相對(duì)支持度和相對(duì)置信度即可。挖掘結(jié)果中的高相對(duì)置信度和高相對(duì)支持度的關(guān)聯(lián)規(guī)則值得重點(diǎn)關(guān)注,需要進(jìn)行雙向控制,提取高相對(duì)支持度和高相對(duì)置信度并存的關(guān)聯(lián)規(guī)則作為有價(jià)值的強(qiáng)關(guān)聯(lián)規(guī)則,用以分析老年行人交通事故發(fā)生的耦合機(jī)理,識(shí)別老年行人交通事故風(fēng)險(xiǎn)因子,得到針對(duì)老年行人的交通事故致因。
在進(jìn)行有價(jià)值強(qiáng)關(guān)聯(lián)規(guī)則提取時(shí),先對(duì)關(guān)聯(lián)規(guī)則分布進(jìn)行參數(shù)切分(圖6(b)),獲取符合參數(shù)條件的關(guān)聯(lián)規(guī)則,再通過(guò)關(guān)聯(lián)規(guī)則聚合后的可視化渲染參數(shù)效果圖(圖7)進(jìn)行約束篩選,進(jìn)一步提取有價(jià)值的強(qiáng)關(guān)聯(lián)規(guī)則,圖7中的虛線框內(nèi)區(qū)域即為需要關(guān)注的高相對(duì)支持度和高相對(duì)置信度的有價(jià)值關(guān)聯(lián)規(guī)則,通過(guò)針對(duì)兩組篩選結(jié)果的交叉匹配,得到最終老年行人交通事故分析中的有價(jià)值強(qiáng)關(guān)聯(lián)規(guī)則,如表6所示。
表6 有價(jià)值強(qiáng)關(guān)聯(lián)輸出結(jié)果Table 6 Valuable and strong correlation output results
根據(jù)表4相對(duì)支持度排序結(jié)果,高支持度表征事故發(fā)生頻次較高。由先導(dǎo)項(xiàng)中有關(guān)人、車(chē)、路、環(huán)境以及時(shí)間這4 個(gè)維度上的要素對(duì)老年行人交通事故的統(tǒng)計(jì)分析和影響分析得出:
(1)駕駛員與行人方面,駕駛員年齡處于34~43歲年齡段(Driver age 為34~43)發(fā)生事故頻次較高,事故發(fā)生時(shí)駕駛員情況多為良好,無(wú)異常情況。老年人處于64~83歲年齡段(Older age為64~83),發(fā)生受傷的事故頻次較多。老年致死的行人事故中,駕駛員為男性(Driver sex 為M),且駕駛速度在(0,17)km·h-1(Driver speed 為(0,17)km·h-1)的情況居多。女性駕駛員(Driver sex為F)在相對(duì)較高的駕駛速度下(Driver speed 為[33,49)km·h-1)發(fā)生的老年行人事故中,多以受傷事故為主。
(2)車(chē)的方面,發(fā)生事故車(chē)輛類(lèi)型以小客車(chē)(Vehicle type 為PASS CAR/VAN)和城市越野車(chē)(Vehicle type 為SUV)為主。其中,城市越野車(chē)(Vehicle type為SUV)擁有更大的體積和重量,發(fā)生致死事故的頻次更多。老年行人受傷事故中,車(chē)輛與行人碰撞角度的狀態(tài)多為垂直(Direction 為90 degree angle),該情況涉及駕駛員轉(zhuǎn)彎或是處于視野盲區(qū),對(duì)于行人的注意力有所降低。
(3)高相對(duì)支持度挖掘結(jié)果發(fā)現(xiàn),午、晚高峰是需要交通管理部門(mén)重點(diǎn)注意的時(shí)段,老年行人在該時(shí)段發(fā)生的事故嚴(yán)重程度多為受傷或死亡事故。SUV 車(chē)輛相對(duì)于更輕、更小的轎車(chē)而言,發(fā)生的老年行人死亡事故頻次更大。
(4)出行時(shí)間方面,午高峰、晚高峰時(shí)段(time hours 為11:00-15:00,time hours 為16:00-20:00 )出現(xiàn)了較多的老年人受傷和死亡事故。
表4中針對(duì)相對(duì)支持度排序結(jié)果的后繼項(xiàng),未發(fā)現(xiàn)僅造成老年行人財(cái)產(chǎn)損失的事故,即“PDO”的字段,說(shuō)明,財(cái)產(chǎn)損失事故在老年行人交通事故范圍的發(fā)生頻次較低,且一旦發(fā)生了事故,其結(jié)果主要以行人受傷甚至死亡結(jié)果為主。
同理,根據(jù)表5 相對(duì)置信度,即表征條件概率較高排序的結(jié)果得到不同類(lèi)型因素對(duì)老年行人交通事故的不同影響:
(1)在按照相對(duì)置信度(R-Conf)由高到低排序輸出的關(guān)聯(lián)規(guī)則結(jié)果中,人的因素占較大比例,當(dāng)男性(Driver sex 為M)駕駛員年齡相對(duì)較大(Driver age 為64~73 歲),行駛速度處于[49,65)km·h-1,老年人年齡處于64~73歲之間,大概率會(huì)造成死亡事故的發(fā)生。相對(duì)較為年輕的駕駛員(Driver age 為24~33 歲),在行駛相對(duì)較慢的情況下(Driver speed為(0,17)km·h-1),能夠降低行人傷亡的概率。駕駛員的自身情況較差,酒駕或?qū)β窙r的不熟悉(Driver condition 為 ALCOHOL/DRUGS,Driver factor 為DRIVER UNFAMILIAR W/AREA)也會(huì)誘發(fā)行人受傷事故的發(fā)生。老年行人身體狀況的變化,例如,飲酒出行(Older situation=ALCOHOL)同樣會(huì)促成事故的發(fā)生。
(2)車(chē)輛類(lèi)型的變化誘發(fā)事故發(fā)生,相對(duì)較大和較重的車(chē)輛(Vehicle type 為SUV)以較快速度(Driver speed為[49,65)km·h-1)行駛過(guò)程中,即使行人速度極低(Older speed為2.8 km·h-1),也會(huì)大概率造成行人死亡事故的發(fā)生。當(dāng)車(chē)輛與行人的碰撞形態(tài)處于同向(Direction 為Same direction)或是對(duì)向(Opposite direction)的情況,易造成程度較為嚴(yán)重的受傷或死亡事故。
(3)道路方面,匝道成為值得關(guān)注的危險(xiǎn)地段(road_desc 為RAMP)。路面線性為曲線有坡度(contour 為CURVE ON-GRADE)的情況下,結(jié)合其他特定因素,也會(huì)大概率造成行人死亡事故的發(fā)生。
(4)處于晚高峰出行時(shí)段(time hours 為16:00-20:00)同時(shí)光線條件(lighting 為DAWN OR DUSK)較差的情況下,極易導(dǎo)致事故的發(fā)生。黃昏時(shí)分是駕駛車(chē)輛最費(fèi)神的時(shí)刻,黃昏時(shí)光線暗淡,由于車(chē)燈的光線與環(huán)境的光亮度相似,駕駛員對(duì)周?chē)?chē)輛和行人的動(dòng)態(tài)反應(yīng)極不敏感,因此,對(duì)于此時(shí)段的交通情況應(yīng)格外注意。
根據(jù)表6 有價(jià)值的強(qiáng)關(guān)聯(lián)規(guī)則的結(jié)果表征該類(lèi)結(jié)果既顯示高頻事故發(fā)生同時(shí)發(fā)生條件概率也高的關(guān)聯(lián)規(guī)則:
(1)老年行人受傷事故中,事故發(fā)生地處于道路路段(road_desc為NON-INTERSECTION)與交叉口(road_desc為AT INTERSECTION)的情況較為普遍,行駛路況條件良好且速度處于0~33 km·h-1的速度區(qū)間、行人與車(chē)輛的碰撞角度同向(Direction 為Same direction)與垂直(Direction 為90 degree angle)情況并存,都與老年行人受傷表現(xiàn)出強(qiáng)關(guān)聯(lián)關(guān)系。早高峰、晚高峰時(shí)段(time hours 為6:00-10:00)(time hours 為16:00-20:00)發(fā)生受傷事故頻次較高,且駕駛員年齡段以54~63 歲為主(Driver age 為54~63歲)。在包含人的身體狀況欠佳的關(guān)聯(lián)規(guī)則中,以行人酒后出行(Older situation為ALCOHOL)或駕駛員身體抱恙(Driver factor為ILLNESS)情況居多。
(2)在老年行人死亡交通事故中,以天氣情況為雨天(weather 為RAIN),路面濕滑的情況為主(condition 為WET),燈光條件以黑夜有燈(lighting為DARK-LIGHTED)的情況居多。說(shuō)明,在夜間的燈光條件下,需要更加注意行駛以及出行安全,極端天氣條件下更需要提前預(yù)防。在先導(dǎo)項(xiàng)車(chē)輛類(lèi)型中,車(chē)載人數(shù)越多,車(chē)重越大,更偏向于老年人死亡的事故發(fā)生。其中,卡車(chē)或是施工車(chē)(Vehicle type 為PICKUP TRUCK/UTILITY VAN)在路段行駛的危險(xiǎn)性較大,后繼項(xiàng)中行人死亡事故形態(tài)居多。
一般的行人事故多數(shù)分析造成事故結(jié)果的因素,計(jì)算探究造成事故的影響因素,偏向于探究造成事故因果關(guān)系。本文更強(qiáng)調(diào)分析影響事故發(fā)生變量之間的相關(guān)關(guān)系,強(qiáng)調(diào)各影響因素相互之間耦合機(jī)理,并能通過(guò)算法得出關(guān)聯(lián)條件之間的關(guān)聯(lián)關(guān)系,而不僅僅是定性的結(jié)論。一般行人事故分析得到的結(jié)果與本文高支持度、高置信度得到的結(jié)論存在共性,其中,城市越野車(chē)(Vehicle type 為SUV)擁有更大的體積和重量,發(fā)生致死事故的頻次更多,夜間易造成事故等結(jié)論[2]。較為全面的影響因素之間的相關(guān)關(guān)系在本文中亦得以體現(xiàn),例如,本文關(guān)聯(lián)度結(jié)論中涉及到:事故碰撞角度、坡度、道路路面條件、駕駛員以及行人自身的身體狀況,以及是否酒后出行或是酒后駕駛等因素,這些因素分析在已有研究較少得出。
本研究更關(guān)心在風(fēng)險(xiǎn)防控時(shí),一旦其先導(dǎo)項(xiàng)條件發(fā)生的情況,應(yīng)格外注意防止后繼項(xiàng)的事故發(fā)生的結(jié)論。
本文利用XGB-Apriori算法提取老年行人交通事故的內(nèi)在機(jī)理,對(duì)老年行人交通事故進(jìn)行風(fēng)險(xiǎn)識(shí)別和嚴(yán)重程度預(yù)測(cè)研究,重點(diǎn)分析影響事故發(fā)生變量之間的相關(guān)關(guān)系,強(qiáng)調(diào)各影響因素相互之間耦合機(jī)理,并能通過(guò)算法得出關(guān)聯(lián)條件之間的關(guān)聯(lián)關(guān)系,而不僅僅是定性的結(jié)論。
本文提出XGB-Apriori算法在針對(duì)老年行人道路事故風(fēng)險(xiǎn)關(guān)聯(lián)規(guī)則挖掘問(wèn)題建模中,精度提升了91%。主要結(jié)論為:
(1)行人在午、晚高峰時(shí)段發(fā)生的事故嚴(yán)重程度多為受傷或死亡事故,SUV車(chē)輛與行人垂直碰撞的情況居多,且死亡事故頻次較大。
(2)無(wú)論是針對(duì)行人還是駕駛員,人的身體狀況較差,例如,行人飲酒或是駕駛員生病等情況,易誘發(fā)事故。傍晚黃昏時(shí)刻,光線對(duì)駕駛員的視線影響較大,可能導(dǎo)致老年行人受傷概率較大,需要駕駛員注意力高度集中。
(3)老年人在較差天氣、夜間出行時(shí)更易發(fā)生交通事故,且遇到的車(chē)輛體積越大,載重越大的情況下,老年行人事故致死情況越多。而在老年受傷事故中,道路因素涉及面較為寬泛,主路段以及道路交叉口都有事故的發(fā)生。