李澤文,張萌萌,李虹燕
(山東交通學(xué)院 交通與物流工程學(xué)院,山東 濟(jì)南 250357)
近年來(lái),我國(guó)道路事故多發(fā),據(jù)中國(guó)統(tǒng)計(jì)年鑒[1]顯示,2019年全國(guó)交通事故發(fā)生數(shù)量為247 646起,比2018年增長(zhǎng)了2 709起,同比增長(zhǎng)1.11%,造成 67 759人死亡、275 125受傷,道路交通安全問(wèn)題迫在眉睫。交通事故形態(tài)可清晰地描述交通事故參與者之間是以什么樣的狀態(tài)導(dǎo)致事故的發(fā)生,故研究其致因?qū)τ陬A(yù)防交通事故從而降低事故率具有重要作用。
近年來(lái),許多學(xué)者開展了對(duì)交通事故形態(tài)及其致因方面的研究。高建剛等[2]通過(guò)收集交通事故統(tǒng)計(jì)數(shù)據(jù)對(duì)道路交通事故形態(tài)歸納分析,總結(jié)了道路交通事故形態(tài)的特點(diǎn)和規(guī)律,為我國(guó)的道路交通安全研究奠定了基礎(chǔ),該方法得出了照明是影響事故形態(tài)的主要因素,此后也被Raynham等[3]采用確定晝夜分界點(diǎn)的方法驗(yàn)證;因?yàn)橹苯佑^察法需要大量的時(shí)間和精力,所以不適用于大樣本研究,會(huì)影響到結(jié)果的代表性,為了更好描述交通事故形態(tài)的影響因素,鄧瑤望等[4]、王義婷等[5]、陸歡等[6]通過(guò)建立二元Logit模型探究事故形態(tài)與各因素之間的相關(guān)關(guān)系,這種方法可以很好地分析分類變量之間的因果聯(lián)系,但需逐一對(duì)各種交通事故形態(tài)致因進(jìn)行分析,步驟繁瑣;在二元Logit模型基礎(chǔ)上,陶剛等[7]使用粗糙集理論的簡(jiǎn)約算法求解各因素相對(duì)于事故形態(tài)的重要度,對(duì)各因素對(duì)事故形態(tài)的影響程度做出判斷,但是只針對(duì)了簡(jiǎn)單的算例進(jìn)行實(shí)驗(yàn),有待檢驗(yàn);而后,隨著數(shù)據(jù)量日漸充實(shí),統(tǒng)計(jì)技術(shù)手段日新月異[8],王長(zhǎng)君等[9]以泊松模型和負(fù)二項(xiàng)模型為工具,王羽塵等[10]采用零膨脹泊松和零膨脹負(fù)二項(xiàng)模型,Mohammad[11]應(yīng)用結(jié)構(gòu)方程模型等,對(duì)大量的數(shù)據(jù)進(jìn)行擬合,分析不同因素對(duì)道路交通事故形態(tài)的影響程度,取得了很好的效果,應(yīng)用廣泛。但上述研究方法多為直接建立模型,并未對(duì)影響因素之間的共線性進(jìn)行診斷,容易影響模型的精確度。
本文基于最優(yōu)尺度分析方法判斷各因素之間是否存在共線性的問(wèn)題以及是否具有統(tǒng)計(jì)學(xué)意義,將具有統(tǒng)計(jì)學(xué)意義的影響因素與事故形態(tài)納入無(wú)序多分類Logit模型,詳細(xì)分析各因素指標(biāo)對(duì)事故形態(tài)的貢獻(xiàn)水平,確定不同事故形態(tài)的影響因素,以期為交通安全部門提供建議,實(shí)現(xiàn)對(duì)交通事故的主動(dòng)預(yù)防和預(yù)測(cè)。
交通事故涉及到人、車、路、環(huán)境4大因素系統(tǒng),各系統(tǒng)又分為不同的子系統(tǒng)和影響因素。基于前人研究成果,并綜合考慮交通安全部門的管理和實(shí)施方案,本文從道路交通設(shè)施和交通環(huán)境2個(gè)方面入手,擬選取以下因素作為事故模型自變量,如圖1所示。
圖1 影響因素系統(tǒng)框架Fig.1 System framework of influencing factors
本文抽取某市2017年1月到2019年12月的1 077起交通事故作為基本建模數(shù)據(jù),以交通事故形態(tài)作為研究對(duì)象,選取追尾碰撞、正面碰撞、側(cè)面碰撞以及刮擦碰撞等4類事故形態(tài)作為因變量(記為Yr,r=1,2,3,4)進(jìn)行分析。
針對(duì)交通事故形態(tài)變量無(wú)序、多元的屬性,采用無(wú)序多分類Logit模型對(duì)事故形態(tài)影響因素進(jìn)行分析,且模型在計(jì)算過(guò)程中會(huì)設(shè)置虛擬變量,便于檢驗(yàn)分類變量(自變量)對(duì)因變量的作用,不僅提高模型的精度,也可避免自行設(shè)置變量的復(fù)雜性。
最優(yōu)尺度分析法最早由荷蘭Leiden大學(xué)DTSS課題組研制[12]。最優(yōu)尺度分析模型的數(shù)學(xué)表達(dá)如式(1):
(1)
式中:Yr是因變量,表示事故形態(tài)種類,r=1,2,3,4,分別代表追尾碰撞、正面碰撞、側(cè)面碰撞以及刮擦碰撞;Xi是自變量,表示交通事故形態(tài)的影響因素,i=1,2,…,8,分別代表在道路橫斷面位置、中央隔離設(shè)施、路側(cè)設(shè)施防護(hù)類型、道路線型、天氣、能見度、照明、路面狀態(tài);ε為隨機(jī)誤差,在建模的時(shí)候引入,用來(lái)解釋由于數(shù)據(jù)本身具有測(cè)量誤差而導(dǎo)致的由模型確定性因素得到的最終結(jié)果與實(shí)際有所偏差的原因;β0~β8為回歸系數(shù),其絕對(duì)值越大表明自變量對(duì)因變量的影響越大。
最優(yōu)尺度分析擅長(zhǎng)將分類變量不同取值量化處理,從而對(duì)變量之間做共線性診斷及顯著性分析,簡(jiǎn)化分類問(wèn)題。
運(yùn)用spss軟件對(duì)數(shù)據(jù)進(jìn)行最優(yōu)尺度分析,結(jié)果見表1~2。
表1 模型分析結(jié)果Table 1 Analysis results of model
表1中模型的多元相關(guān)系數(shù)R為0.802,判定系數(shù)R2為0.643,表示模型中的自變量可以有效地解釋因變量,且在模型的方差分析中P<0.05,說(shuō)明模型具有統(tǒng)計(jì)學(xué)意義。
表2給出了各自變量的回歸系數(shù)、顯著性值以及容忍度,其中回歸系數(shù)表示自變量對(duì)因變量影響大小的參數(shù),回歸系數(shù)越大表明影響越大,不同因素對(duì)事故形態(tài)的影響程度排序?yàn)椋?/p>
表2 回歸分析Table 2 Regression analysis
X3>X1>X2>X6>X5>X4>X7>X8
自變量的顯著性可以判斷其是否具有統(tǒng)計(jì)學(xué)意義,當(dāng)顯著性值小于0.05時(shí),則認(rèn)為在95%的顯著性水平下顯著,具有統(tǒng)計(jì)學(xué)意義,反之則沒有,路面狀態(tài)的顯著性值為0.096,不具有統(tǒng)計(jì)學(xué)意義,因此,選擇剔除。容忍度反映了自變量的共線性情況,數(shù)值越大越好,轉(zhuǎn)換后容忍度均大于0.5,表示各自變量之間不存在多重共線性問(wèn)題。
上述變量在進(jìn)入模型之后被量化評(píng)分,以此來(lái)表示各個(gè)類別之間的差距,量化評(píng)分近似,則表示影響程度相近,反之影響程度差異大,如能見度量化評(píng)分對(duì)應(yīng)如圖2所示,可見X61>50 m、50 m≤X62<100 m被給予了相同的量化評(píng)分,100 m≤X63<200 m量化評(píng)分稍有不同,與X64≥200 m評(píng)分差距非常大。
圖2 能見度量化評(píng)分Fig.2 Quantitative scoring of visibility
綜上,在道路橫斷面位置、中央隔離設(shè)施、路側(cè)設(shè)施防護(hù)類型等8個(gè)變量之間不存在共線性問(wèn)題,但路面狀態(tài)這一變量未通過(guò)顯著性檢驗(yàn),選擇剔除,把剩余變量的標(biāo)準(zhǔn)化數(shù)據(jù)(即量化評(píng)分)代入回歸方程,最終可得到發(fā)生某種事故形態(tài)的偏向情況,方程如式(2):
(2)
Logit模型主要研究的是因變量與自變量的依存關(guān)系,其要求因變量取值為分類變量(二分類或多分類),自變量可為連續(xù)變量、等級(jí)變量、分類變量。在實(shí)際問(wèn)題中,有很多變量并非為連續(xù)性變量、等級(jí)變量,如事故形態(tài)種類為無(wú)序性分類變量,故選用無(wú)序多分類Logit回歸模型。該模型首先定義因變量的某1個(gè)水平為參照水平(SPSS默認(rèn)取值水平大的為參照水平),本文以刮擦碰撞(Y4)的事故形態(tài)為對(duì)照組,分析追尾碰撞(Y1)、正面碰撞(Y2)、側(cè)面碰撞(Y4)3類事故形態(tài)的相對(duì)發(fā)生概率,構(gòu)建3個(gè)廣義Logit模型,如式(3)~(5):
(3)
(4)
(5)
式中:Pr表示第r種事故形態(tài)的發(fā)生概率,其中r=1,2,3,4;α1~α3為回歸截距,為了避免模型誤設(shè);βij為模型的回歸系數(shù),其代表了自變量對(duì)新變量的影響程度,絕對(duì)值越大,表示影響程度越大,反之則越??;Xij為第i種自變量的第j種指標(biāo)取值,其中i∈[1,7],j∈[1,9]且均為正整數(shù)。
如圖1所示。以第4個(gè)因變量為參照水平,如果需要比較正面碰撞和側(cè)面碰撞(2和3),則直接將式(4)和式(5)相減即可得到相應(yīng)函數(shù)[13-14]。無(wú)序多分類Logit模型中參數(shù)標(biāo)定方法可以采用極大似然法估計(jì)參數(shù)[15]。給定樣本的數(shù)據(jù)量越大,通過(guò)這種方法估計(jì)參數(shù)的誤差越小,其估計(jì)結(jié)果方差也越小?;静襟E為:
(6)
利用擬合優(yōu)度檢驗(yàn)和似然比檢驗(yàn),對(duì)Logit模型的擬合效果進(jìn)行評(píng)價(jià)。擬合優(yōu)度檢驗(yàn)法主要是為驗(yàn)證模型的正確率和有效性,其基本思路是依據(jù)總體分布狀況,計(jì)算分類變量中各類別的期望頻數(shù),與分布的觀測(cè)頻數(shù)進(jìn)行對(duì)比,判斷期望頻數(shù)與觀察頻數(shù)是否有顯著差異,從而達(dá)到對(duì)分類變量分析的目的。似然比檢驗(yàn)用來(lái)評(píng)估模型是否具有統(tǒng)計(jì)學(xué)意義,對(duì)僅包含常數(shù)項(xiàng)(截距)模型和包含路側(cè)設(shè)施防護(hù)類型、中央隔離設(shè)施等7個(gè)自變量的模型擬合效果進(jìn)行評(píng)估。
根據(jù)模型擬合度檢驗(yàn)原理及方法,得出具體擬合度檢驗(yàn)值見表3。皮爾遜卡方sig.值為1.000>0.050,說(shuō)明模型對(duì)原始數(shù)據(jù)的擬合良好,模型有效。似然比檢驗(yàn)中sig.值小于0.001,說(shuō)明至少有1個(gè)自變量的偏回歸系數(shù)不為0,即包含7個(gè)自變量的模型的擬合優(yōu)度好于僅截距的無(wú)效模型。
表3 擬合檢驗(yàn)結(jié)果Table 3 Fitting test results
3.3.1 追尾碰撞致因分析
追尾碰撞事故形態(tài)致因分析模型見表4,表中β為回歸系數(shù),Exp(β)作為效應(yīng)指標(biāo)分析自變量的各個(gè)分類對(duì)因變量影響程度的大小,當(dāng)β>0,Exp(β)>1說(shuō)明了變量為危險(xiǎn)因素;當(dāng)β<0,Exp(β)<1說(shuō)明了變量為保護(hù)性因素;當(dāng)β=0,即Exp(β)=1說(shuō)明該因素與因變量無(wú)關(guān)[16]。P值用來(lái)判定假設(shè)檢驗(yàn)結(jié)果,當(dāng)P大于一般規(guī)定的臨界值0.05,在統(tǒng)計(jì)學(xué)上沒有意義,模型在運(yùn)算迭代過(guò)程中,直接將它們剔除;當(dāng)P<0.05時(shí),在統(tǒng)計(jì)學(xué)上有意義。
表4 追尾碰撞事故模型參數(shù)匯總Table 4 Summary on model parameters of rear end collision accident
由表4可得追尾碰撞事故擬合模型如式(7):
(7)
式中:Xij取值為0或1,i∈[1,7],j∈[1,9]且均為正整數(shù)。
分析表明,路側(cè)設(shè)置綠化帶回歸系數(shù)小于0,對(duì)追尾碰撞事故有負(fù)向影響,為事故發(fā)生的保護(hù)性因素,相對(duì)于路側(cè)無(wú)防護(hù)時(shí)發(fā)生追尾碰撞事故概率的0.171倍;而路側(cè)設(shè)置金屬護(hù)欄時(shí)回歸系數(shù)大于0,是事故發(fā)生的危險(xiǎn)因子,增大了車輛發(fā)生追尾碰撞的概率。同樣在道路橫斷面位置為非機(jī)動(dòng)車道回歸系數(shù)大于0,是機(jī)動(dòng)車道發(fā)生事故概率的11.378倍。夜間行車時(shí),無(wú)照明是事故發(fā)生的危險(xiǎn)因子,車輛發(fā)生追尾碰撞事故概率是有照明的52.288倍。
3.3.2 正面碰撞致因分析
正面碰撞事故形態(tài)致因分析模型見表5,模型構(gòu)建方法同3.3.1節(jié)。
由表5可得正面碰撞事故擬合模型如式(8):
表5 正面碰撞事故模型參數(shù)匯總Table 5 Summary on model parameters of frontal collision accident
(8)
分析表明,路側(cè)設(shè)置行道樹時(shí)回歸系數(shù)大于0,是事故發(fā)生的危險(xiǎn)因子,增大了車輛發(fā)生正面碰撞的可能性,發(fā)生事故概率是路側(cè)無(wú)防護(hù)時(shí)的29.330倍;路側(cè)設(shè)置綠化帶回歸系數(shù)小于0,對(duì)正面碰撞事故有負(fù)向影響,為事故發(fā)生的保護(hù)性因素,相對(duì)于路側(cè)無(wú)防護(hù)時(shí)發(fā)生追尾碰撞事故概率的0.152倍。
模型中能見度為50 m≤X62<100 m和100 m≤X63<200 m的回歸系數(shù)均小于0,是正面碰撞事故的保護(hù)性因素,是能見度X64≥200 m時(shí)發(fā)生事故的0.184倍和0.178倍。
3.3.3 側(cè)面碰撞致因分析
側(cè)面碰撞事故形態(tài)致因分析模型見表6,模型構(gòu)建方法同3.3.1節(jié)。
表6 側(cè)面碰撞事故模型參數(shù)匯總Table 6 Summary on model parameters of side collision accident
由表6可得側(cè)面碰撞事故擬合模型如式(9):
(9)
分析表明,在機(jī)非混合道同樣容易發(fā)生側(cè)面碰撞,且是機(jī)動(dòng)車道的4.374倍。中央隔離設(shè)置綠化帶小于0,是事故發(fā)生的保護(hù)性因素,以隔離墩為參照,影響程度是設(shè)置隔離墩設(shè)施的0.054倍。且具有路側(cè)設(shè)施綠化帶的道路發(fā)生側(cè)面碰撞事故概率是不具有此類型設(shè)施的0.162倍。
模型表明側(cè)面碰撞也與能見度有顯著的相關(guān)關(guān)系,相對(duì)于能見度X64≥200 m,在能見度為50 m≤X62<100 m和100 m≤X63<200 m范圍內(nèi)車輛發(fā)生側(cè)面碰撞事故的概率降低了約70%。
綜上,路側(cè)設(shè)置綠化帶是碰撞事故中的重要影響因子,事故率約是無(wú)防護(hù)的15%,另外中央隔離設(shè)施使用綠化帶也可有效降低側(cè)面碰撞事故率,故在道路環(huán)境允許的情況下可以盡量多設(shè)置綠化帶;路側(cè)行道樹設(shè)置不合理或未及時(shí)修剪,使車輛不能有效識(shí)別道路信息,是正面碰撞的重要影響因素,事故概率不具備此類設(shè)施的29.330倍,故應(yīng)對(duì)綠化設(shè)施位置進(jìn)行修正;夜間在沒有路燈的路段行車會(huì)增加危險(xiǎn)性,發(fā)生追尾碰撞事故的概率是有照明的52.288倍,因此,在道路上要合理的為夜間車輛和行人出行提供必要的照明設(shè)施;目前城市各道路寬度較窄,無(wú)法達(dá)到機(jī)非分開,該市車流量較大,故在機(jī)非混合道上行駛的車輛容易發(fā)生碰撞事故,且事故率是機(jī)動(dòng)車道的4.374倍,對(duì)于碰撞事故多發(fā)性道路若條件允許應(yīng)該盡量減少對(duì)機(jī)非混合道的設(shè)置;能見度為50 m≤X62<100 m和100 m≤X63<200 m時(shí)事故率較低,這也從側(cè)面反映了駕駛員在能見度降低時(shí)對(duì)車速的調(diào)控以及自我意識(shí)的提高。
3.3.4 模型驗(yàn)證
上述模型由某市的交通事故數(shù)據(jù)構(gòu)建而成,盡管通過(guò)了統(tǒng)計(jì)學(xué)相關(guān)檢驗(yàn),模型擬合度較好,但其是否能表征該市的事故特征機(jī)理,仍需對(duì)模型進(jìn)行驗(yàn)證。抽取該市2017年1月到2019年12月另外100起交通事故數(shù)據(jù)形成驗(yàn)證樣本集合,按照上述建模方法,將相關(guān)影響指標(biāo)代入式(7)~(9)。計(jì)算結(jié)果見表7。
表7 模型精度Table 7 Model accuracy
由表7可知,模型整體相對(duì)誤差僅為4.0%,各事故形態(tài)的相對(duì)誤差分別為11.1%,4.8%,1.5%,20.0%,平均相對(duì)誤差為9.4%,這說(shuō)明模型適用性較好。
1)基于最優(yōu)尺度分析方法判斷各因素之間是否存在共線性的問(wèn)題以及是否具有統(tǒng)計(jì)學(xué)意義,將具有統(tǒng)計(jì)學(xué)意義的影響因素與事故形態(tài)納入無(wú)序多分類Logit模型,有效識(shí)別影響事故形態(tài)的各項(xiàng)因素,并通過(guò)模型中回歸系數(shù)與優(yōu)勢(shì)比值得到各因素對(duì)事故形態(tài)貢獻(xiàn)水平,便于分析事故形態(tài)致因。該方法用于某特定道路或地區(qū)交通事故研究,有助于揭示道路建設(shè)的潛在危險(xiǎn)因子,同時(shí)由于數(shù)據(jù)是按照事故形態(tài)分組,模型結(jié)果可以輔助事故黑點(diǎn)篩查和預(yù)測(cè),并作為道路安全管理部門改善的參考,具有一定的現(xiàn)實(shí)意義。
2)模型表明,路側(cè)、中央隔離設(shè)施設(shè)置綠化帶,增加必要的照明設(shè)施,有望降低事故發(fā)生率,這一點(diǎn)對(duì)于城市道路改造具有實(shí)際意義;路側(cè)行道樹設(shè)置不合理或未及時(shí)修剪,使車輛不能有效識(shí)別道路信息,是正面碰撞的重要影響因素,故該市應(yīng)對(duì)綠化設(shè)施位置進(jìn)行修正;機(jī)非混合道是事故的危險(xiǎn)因子,增大了側(cè)面碰撞事故發(fā)生概率,道路條件允許的情況下可以盡量實(shí)行機(jī)非分行。
3)文中研究尚存在不足之處,首先,在交通事故形態(tài)對(duì)照組設(shè)置方面,本文僅以刮擦碰撞作為對(duì)照組進(jìn)行分析,后續(xù)可調(diào)整因變量的分類形式,獲得對(duì)比較為明顯的因變量分類作為對(duì)照組;其次,自變量對(duì)照組的選擇,雖然能得到一些有意義的結(jié)果,但應(yīng)該在后續(xù)研究中設(shè)置對(duì)比較為明顯的分類作為對(duì)照類;在自變量選擇方面,未來(lái)也會(huì)將交通量、事故車型等信息考慮在內(nèi)。
中國(guó)安全生產(chǎn)科學(xué)技術(shù)2022年1期