李俊輝, 湯左淦
(1.廣東交通職業(yè)技術(shù)學(xué)院 軌道交通學(xué)院, 廣東 廣州 510650; 2.深圳市城市交通規(guī)劃設(shè)計(jì)研究中心股份有限公司, 廣東 深圳 518057)
隨著國民經(jīng)濟(jì)的快速發(fā)展,人民生活水平逐漸提高,我國民用汽車保有量逐年上升,并以每年至少13%的速度增長,這給交通安全帶來了巨大的影響。據(jù)世界衛(wèi)生組織估計(jì),每年全球交通事故造成大約125萬人死亡,以及至少2000萬人受傷[1]。因此,分析影響交通事故嚴(yán)重程度的影響因素有助于降低交通事故傷害等級,保障人民的安全出行。
近年來,許多國內(nèi)外學(xué)者一直致力于交通安全領(lǐng)域研究,并引入了一系列離散統(tǒng)計(jì)模型用以研究事故傷害程度的影響因素。馮忠祥[2]等將事故分為死亡和非死亡事故,采用Logistic模型研究道路環(huán)境因素對繞城高速交通事故嚴(yán)重程度的影響。王磊[3]等以3條高速公路事故作為研究樣本,將交通事故分為死亡、受傷與僅財(cái)產(chǎn)損失3個(gè)等級,對比分析了基于有序Logit與多項(xiàng)式Logit模型建立的事故傷害預(yù)測模型,發(fā)現(xiàn)多項(xiàng)式Logit的預(yù)測精度比有序Logit模型高。趙躍峰[4]等分別采用有序Logit與部分偏比例優(yōu)勢模型建立公路隧道交通事故嚴(yán)重程度分析模型。江欣國[5]等將事故嚴(yán)重程度分為4個(gè)等級,采用廣義Logit模型研究各種危險(xiǎn)行為的交互作用對雙責(zé)事故受傷嚴(yán)重程度的影響作用。宗芳[6]等建立了交通事故受傷人數(shù)預(yù)測有序Probit模型,分析了受傷人數(shù)的影響因素,并計(jì)算了各影響因素的邊際貢獻(xiàn)。溫惠英[7]等考慮了事故個(gè)體的異質(zhì)性,構(gòu)建了基于混合Logit的翻車事故傷害分析模型。馬壯林[8]等采用累積Logit模型分析時(shí)空與環(huán)境因素對高速公路事故傷害程度的影響。Anarkooli[9]分別構(gòu)建了隨機(jī)效應(yīng)廣義有序Probit模型與混合Logit模型分析翻車事故傷害程度的影響因素。Cunto與Ferreira[10]以巴西2004年—2011年3232起摩托車事故建立混合有序Logit事故傷害模型,發(fā)現(xiàn)駕駛員年齡、使用頭盔、周末與白天與事故嚴(yán)重程度相關(guān)。
綜合以上分析,前人運(yùn)用了一系列離散選擇模型分析交通事故嚴(yán)重程度的因素,但是上述模型未考慮事故樣本中存在的零膨脹現(xiàn)象,即事故樣本中含有大量的零值(最低等級的事故傷害程度一般編碼為0,例如未受傷)。以英國發(fā)生的交通事故為例,英國將事故分為輕傷、重傷與死亡3個(gè)等級,其中輕傷事故比例達(dá)到87.2%。Harris and Zhao[11]指出若忽略這種零膨脹現(xiàn)象,將會(huì)導(dǎo)致有偏估計(jì),從而導(dǎo)致錯(cuò)誤的結(jié)論。因此,考慮到事故傷害等級的有序特性,本文將引入零膨脹有序Probit模型,用以分析交通事故傷害程度的影響因素,并對比零膨脹有序Probit模型與傳統(tǒng)有序Probit模型的估計(jì)結(jié)果。
擬采用零膨脹有序Probit(ZIOP)模型對事故傷害程度進(jìn)行建模,ZIOP模型的本質(zhì)是二元Probit(BP)與有序Probit(OP)的整合模型,故其包含BP過程與有序OP過程。根據(jù)Harris and Zhao的模型構(gòu)建過程[11],為定義ZIOP模型的BP過程,先定義一個(gè)事故受傷傾向性函數(shù)s*如下,
s*=XTβ+ε,
(1)
其中,X是自變量,β是自變量的估計(jì)參數(shù)集合,ε是誤差項(xiàng)并服從標(biāo)準(zhǔn)正態(tài)分布。通過事故受傷傾向性函數(shù)s*可以將事故樣本分成非嚴(yán)重受傷傾向事故(s=0)與嚴(yán)重受傷傾向事故(s=1)2類群體。當(dāng)s*≤0 時(shí),s=0;當(dāng)s*> 0時(shí),s=1。因此,一起事故為嚴(yán)重受傷傾向事故的概率可以表示為:
Pr(s=1|X)=Pr(s*>0)=φ(XΤβ),
(2)
(3)
其中,J是事故傷害程度的分類數(shù);μj是OP模型的閾值參數(shù)。效用函數(shù)y*的表達(dá)式為:
y*=ZΤα+δ,
(4)
(5)
BP過程與OP過程可以通過變量y聯(lián)結(jié)起來,
(6)
(7)
由式(6)可知,最低等級事故的概率確實(shí)“膨脹”了,其概率為BP過程中非嚴(yán)重受傷傾向事故的概率與OP過程中嚴(yán)重受傷傾向事故條件下受傷程度為最低等級的概率之和。ZIOP模型可用最大似然法求解,其對數(shù)似然函數(shù)為:
(8)
其中,N為樣本量;i表示為第i起事故;θ是待估參數(shù);hij是一個(gè)指示變量,其表達(dá)式為:
(9)
由于ZIOP模型的估計(jì)參數(shù)只能反映各因素對事故傷害水平的影響趨勢,而不能衡量因素對事故傷害水平的影響大小,故本文在估計(jì)模型參數(shù)后,還計(jì)算了各顯著變量的邊際效應(yīng)值。邊際效應(yīng)值是指當(dāng)保持其它變量取值不變時(shí),某個(gè)變量變化一個(gè)單位對某類事故傷害水平的概率變化。本文的自變量均為離散變量,離散變量的邊際效應(yīng)值計(jì)算公式如下:
(10)
根據(jù)英國的交通事故數(shù)據(jù)庫,提取2016年發(fā)生在交叉口的10258起單車碰撞事故數(shù)據(jù)作為建模樣本。以事故傷害程度為因變量,事故傷害程度分為輕傷、重傷與死亡3個(gè)等級,并分別編碼為0、1、2。經(jīng)過數(shù)據(jù)預(yù)處理以及根據(jù)前人的研究經(jīng)驗(yàn),選取24個(gè)潛在影響因素作為建模的候選自變量,所有自變量均已轉(zhuǎn)化為0~1離散變量,各變量的編碼及頻率分析見表1。在建模時(shí),除參照類別外,均可直接納入模型進(jìn)行擬合。由表1可知,輕傷事故在事故樣本中的百分比達(dá)到78.90%,表明事故樣本中含有大量的零值,因此,從數(shù)據(jù)結(jié)構(gòu)來看,采用ZIOP模型分析事故傷害程度是合理的。
表1 變量的描述性統(tǒng)計(jì)Table 1 Summary statistics of variables變量變量屬性編碼頻率/%未受傷078.90事故傷害程度輕傷119.48重傷21.63事故發(fā)生在周末是124.60否*075.40事故發(fā)生在高峰期是163.38否*036.62白天*169.45光線條件夜間有燈光226.86夜間無燈光33.68天氣情況晴朗多云*084.11不良天氣115.89事故發(fā)生地郊區(qū)017.98城區(qū)*182.02環(huán)形路16.74街道24.01路段類型單行道*38.97雙行道479.26高速路匯合點(diǎn)51.03[20,30]*184.09限速值(mph)[40,50]27.38[60,70]38.53環(huán)形112.48交叉口類型T/Y形260.89十字形*314.41其它412.22交叉口控制方式無信號控制*081.80信號控制118.20行人過街控制無*098.81有11.19行人過街設(shè)施無*065.13有134.87路面條件干燥*071.49潮濕128.51
續(xù)表1 變量的描述性統(tǒng)計(jì)變量變量屬性編碼頻率/%[0,5]*127.56車齡[6,10]233.21[11,15]331.76≥1547.47轎車*182.90車輛類型客車210.95貨車36.15掉頭122.49變道20.64車輛行駛意圖超車31.54直行*456.64其他518.69無*186.79側(cè)滑翻車情況側(cè)滑27.71翻車35.50車道發(fā)生碰撞否*090.29是197.71車輛沖出車道否*078.12是121.88無*179.66燈柱、信號柱27.08車道外碰撞物樹32.78防護(hù)欄42.46其他58.02車頭160.23車尾24.62車輛受損部位車身右側(cè)39.38車身左側(cè)415.91無*59.87[500,1 200)*110.31[1 200,1 600)238.26發(fā)動(dòng)機(jī)排量/cm3[1 600,2 000)326.96[2 000,3 000)411.05≥3 000513.40汽油*152.77燃料類型重油245.65其他31.58駕駛員性別女性*030.98男性169.02[15,34]*137.80駕駛員年齡[35,64]250.83≥65311.37注: “*”為參考類別。
以英國2016年發(fā)生在交叉口的10258起單車碰撞事故數(shù)據(jù)作為研究對象,分別采用OP模型與ZIOP模型構(gòu)建事故傷害程度估計(jì)模型,并對比這2種模型的差異。
首先將表1中的24個(gè)自變量納入OP模型,取顯著性水平0.1,運(yùn)用Stata15.0求解,然后剔除P值>0.1 的自變量,重新對模型的參數(shù)進(jìn)行估計(jì)。
通過計(jì)算發(fā)現(xiàn),事故發(fā)生在周末、事故發(fā)生在高峰期、路段類型、光線條件、車輛類型、車輛行駛意圖、側(cè)滑翻車情況、在車道內(nèi)是否發(fā)生碰撞、非車道碰撞物、車輛受損部位、駕駛員性別、發(fā)動(dòng)機(jī)排量、燃料類型以及車輛行駛年齡共14個(gè)自變量與事故傷害程度相關(guān),估計(jì)結(jié)果見表2。
表2 有序Probit模型的參數(shù)估計(jì)Table 2 Parameters estimation for ordered Probit model變量變量屬性系數(shù)標(biāo)準(zhǔn)差P值事故發(fā)生在周末是0.097 0.033 0.003 事故發(fā)生在高峰期是-0.057 0.030 0.054 環(huán)形路-0.297 0.074 0.000 路段類型街道-0.114 0.083 0.167 雙行道-0.177 0.049 0.000 高速匯合點(diǎn)-0.406 0.157 0.010 光線條件夜間有燈光0.160 0.032 0.000 夜間無燈光0.175 0.075 0.019 車輛類型客車-0.458 0.104 0.000 貨車0.138 0.064 0.032 調(diào)頭-0.159 0.035 0.000 車輛行駛意圖變道-0.125 0.180 0.489 超車-0.141 0.114 0.216 轉(zhuǎn)彎-0.275 0.046 0.000 側(cè)滑翻車情況側(cè)滑-0.135 0.061 0.026翻車0.010 0.067 0.885車道是否發(fā)生碰撞是-0.152 0.054 0.005燈柱、信號柱-0.362 0.066 0.000非車道碰撞物樹0.216 0.082 0.008防護(hù)欄-0.382 0.102 0.000其他-0.157 0.057 0.006車頭0.514 0.070 0.000車輛受損部位車尾0.472 0.098 0.000車身右側(cè)0.487 0.081 0.000車身左側(cè)0.375 0.074 0.000駕駛員性別男性0.106 0.032 0.001[1 200,1 600)0.012 0.049 0.804 發(fā)動(dòng)機(jī)排量/cm3[1 600,2 000)0.000 0.056 0.996 [2 000,3 000)0.026 0.066 0.697 ≥3 0000.403 0.096 0.000 燃料類型重油0.008 0.039 0.839其它-0.424 0.132 0.001[6,10]0.037 0.037 0.313 車輛行駛年齡[11,15]0.080 0.039 0.039>160.036 0.060 0.545截距截距11.129 0.099 0.935截距22.518 0.104 2.315
基于OP模型的估計(jì)結(jié)果,將OP模型中14個(gè)顯著自變量納入ZIOP模型中,同樣取顯著性水平0.1,為了對比OP模型與ZIOP模型的異同,故在最終估計(jì)結(jié)果中,未將ZIOP模型中的不顯著變量剔除。由表3的估計(jì)結(jié)果可知,在BP過程中,僅有5個(gè)變量與事故嚴(yán)重程度相關(guān),分別為車輛類型、非車道碰撞物、車輛受損部位、駕駛員性別以及車輛的發(fā)動(dòng)機(jī)排量。在OP過程中,僅側(cè)滑翻車情況、車輛受損部位以及車輛行駛年齡與事故傷害程度不顯著相關(guān)。
表3 ZIOP模型的參數(shù)估計(jì)Table 3 Parameters estimation for ZIOP model變量變量屬性BP過程OP過程系數(shù)標(biāo)準(zhǔn)差P值系數(shù)標(biāo)準(zhǔn)差P值事故發(fā)生在周末是-0.141 0.122 0.2480.128 0.039 0.001*事故發(fā)生在高峰期是0.028 0.114 0.807 -0.065 0.034 0.057*環(huán)形路-0.389 0.266 0.143 -0.244 0.092 0.008*路段類型街道-0.096 0.293 0.744 -0.118 0.098 0.228 雙行道-0.064 0.174 0.714 -0.179 0.057 0.002*高速匯合點(diǎn)-0.571 0.537 0.288-0.289 0.199 0.145 光線條件夜間有燈光-0.054 0.128 0.674 0.188 0.037 0.000*夜間無燈光0.236 0.274 0.390 0.145 0.092 0.115 車輛類型客車0.068 0.325 0.833 -0.366 0.219 0.095*貨車0.593 0.328 0.070*0.064 0.074 0.388 調(diào)頭-0.111 0.144 0.441 -0.157 0.040 0.000*車輛行駛意圖變道0.107 0.820 0.897 -0.127 0.199 0.525 超車-0.528 0.557 0.343 -0.084 0.142 0.554 轉(zhuǎn)彎0.080 0.152 0.601 -0.324 0.056 0.000*側(cè)滑翻車情況側(cè)滑-0.272 0.213 0.202-0.095 0.076 0.213 翻車0.024 0.223 0.916 -0.022 0.090 0.807 車道是否發(fā)生碰撞是-0.111 0.211 0.599-0.148 0.070 0.035*燈柱、信號柱0.444 0.605 0.463-0.425 0.076 0.000*非車道碰撞物樹0.335 0.728 0.646 0.207 0.092 0.025*防護(hù)欄-0.187 0.633 0.768 -0.388 0.125 0.002*其他-2.274 0.427 0.000*0.608 0.232 0.009*車頭1.206 0.181 0.000*0.041 0.118 0.731 車輛受損部位車尾0.418 0.371 0.260 0.132 0.137 0.335 車身右側(cè)1.048 0.284 0.000*0.031 0.124 0.802 車身左側(cè)1.104 0.219 0.000*-0.107 0.122 0.380 駕駛員性別男性0.333 0.151 0.027*0.069 0.039 0.075*[1 200,1 600)0.637 0.247 0.010*-0.080 0.068 0.239 發(fā)動(dòng)機(jī)排量/cm3[1 600,2 000)0.721 0.306 0.018*-0.089 0.076 0.243 [2 000,3 000)0.775 0.404 0.055*-0.063 0.085 0.460 ≥3 000-1.758 0.492 0.000*1.167 0.193 0.000*燃料類型重油0.037 0.200 0.854 -0.010 0.043 0.826 其它0.495 0.675 0.463 -0.494 0.144 0.001*[6,10]0.144 0.129 0.2630.007 0.043 0.869 車輛行駛年齡[11,15]0.165 0.145 0.256 0.053 0.045 0.241 >160.181 0.217 0.403 0.000 0.070 0.998 截距或常數(shù)項(xiàng)0.1220.4290.7760.5130.1650.1892.0230.1601.710
a.重要的參數(shù)估計(jì)結(jié)果分析。
在ZIOP模型中,有2個(gè)顯著參數(shù)在BP與BP過程中的符號相反,分別為“其它車道外碰撞物(溝渠等)”與“車輛的發(fā)動(dòng)機(jī)排量 ≥ 3000 cm3”?!捌渌嚨劳馀鲎参?溝渠等)”變量的參數(shù)符號在BP過程中,其符號為負(fù),表明車輛與溝渠等發(fā)生碰撞,發(fā)生嚴(yán)重受傷傾向事故的概率更低;而在OP過程中,其符號為正,表明當(dāng)事故為嚴(yán)重受傷傾向事故群體時(shí),車輛與溝渠等發(fā)生碰撞更容易發(fā)生嚴(yán)重性受傷事故。而OP模型的參數(shù)估計(jì)結(jié)果會(huì)得出車輛與溝渠等發(fā)生碰撞更不容易發(fā)生嚴(yán)重性受傷事故的結(jié)論。
此外,“車輛的發(fā)動(dòng)機(jī)排量 ≥ 3000 cm3”的變量符號在BP過程中為負(fù),而在OP過程中為正,表明當(dāng)車輛的發(fā)動(dòng)機(jī)排量大于3000 cm3時(shí),發(fā)生嚴(yán)重受傷傾向事故的概率更低;但是當(dāng)該事故為嚴(yán)重受傷傾向事故時(shí),發(fā)動(dòng)機(jī)排量大于3000 cm3的車輛發(fā)生嚴(yán)重性受傷事故的概率更大。在OP模型中,發(fā)動(dòng)機(jī)排量大于3000 cm3的車輛發(fā)生嚴(yán)重性受傷事故的概率更大。綜上可以發(fā)現(xiàn),ZIOP模型的解釋性比OP模型強(qiáng)。
b.OP與ZIOP模型中“輕傷”的邊際概率對比分析。
表4 OP與ZIOP模型中“輕傷”的邊際概率Table 4 Marginal probability for “slight injury” in OP and ZIOP models(%)變量變量屬性O(shè)PZIOPPr(y=0)Pr(r=0)Pr(r=1, y=0)Pr(y=0)事故發(fā)生在周末是-2.70*1.58*-4.18*-2.60*事故發(fā)生在高峰期是1.59*-0.311.821.51*環(huán)形路8.40*4.643.398.03*路段類型街道3.461.052.603.66雙行道5.23*0.704.37*5.07*高速匯合點(diǎn)10.99*7.182.629.81*光線條件夜間有燈光-4.58*0.61-5.19*-4.58*夜間無燈光-5.03*-2.50-2.31-4.81*車輛類型客車10.85*-0.768.477.71*貨車-4.17*-5.89*1.37-4.52*調(diào)頭4.46*1.263.21*4.47*車輛行駛意圖變道3.56-1.153.942.80超車3.996.75-2.114.64轉(zhuǎn)彎7.39*-0.868.36*7.50*側(cè)滑翻車情況側(cè)滑3.60*3.250.233.48*翻車-0.27-0.260.710.45車道是否發(fā)生碰撞是4.22*1.252.974.22*燈柱、信號柱8.98*-3.5612.38*8.82*非車道碰撞物樹-6.69*-2.78-4.42-7.20*防護(hù)欄9.39*1.897.609.50*其他4.25*51.17*-45.51*5.66*車頭-12.26*-20.01*12.20*-7.81*車輛受損部位車尾-11.03*-8.522.92-5.60*車身右側(cè)-11.47*-18.08*11.35*-6.74*車身左側(cè)-8.35*-18.79*15.24*-3.56*駕駛員性別男性-2.94*-3.75*0.53-3.23*[1 200,1 600)-0.33-7.84*7.82*-0.03發(fā)動(dòng)機(jī)排量/cm3[1 600,2 000)-0.01-8.558.560.01[2 000,3 000)-0.69-8.988.16-0.82≥3 000-12.35*49.33*-52.26*-2.93燃料類型重油-0.22-0.410.490.08其它9.86*-5.0014.06*9.06*[6,10]-1.01-1.670.85-0.82車輛行駛年齡[11,15]-2.22*-1.89-0.19-2.08*>16-1.00-2.071.27-0.80
c.擬合優(yōu)度對比分析。
根據(jù)表5中OP與ZIOP模型的擬合優(yōu)度指標(biāo)可知,ZIOP模型的AIC指標(biāo)小于OP模型的AIC指標(biāo),表明ZIOP模型的擬合優(yōu)度更高。此外,Vuong’s 檢驗(yàn)值為5.36,大于閾值1.96,也表明ZIOP模型的擬合優(yōu)度更高。
表5 OP與ZIOP模型的主要統(tǒng)計(jì)量Table 5 Main statistics for OP and ZIOP models統(tǒng)計(jì)量指標(biāo)OP模型ZIOP模型自由度3773L(θ)-5 675.324-5 615.159AIC指標(biāo)11 424.65011 376.320Vuongs 檢驗(yàn)值(ZIOP/OP)5.36
a.針對交通事故樣本中“零值”過多的現(xiàn)象,以事故傷害程度為因變量,構(gòu)建零膨脹有序Probit模型,模型估計(jì)結(jié)果顯示零膨脹有序Probit模型中的顯著變量與傳統(tǒng)有序Probit模型中的基本一致,但是零膨脹有序Probit模型的解釋性更強(qiáng)。
b.研究結(jié)果表明,當(dāng)事故樣本中含有大量的零值時(shí),采用傳統(tǒng)有序Probit模型研究事故傷害程度的影響因素會(huì)導(dǎo)致各影響因素對“零值”的邊際概率被高估。
c.擬合優(yōu)度對比結(jié)果顯示,零膨脹有序Probit模型對樣本事故數(shù)據(jù)的擬合效果比傳統(tǒng)有序Probit模型好。