劉海玥, 付川云,2, 夏亮
(1.西南交通大學(xué) 交通運輸與物流學(xué)院, 四川 成都 611756;2.西南交通大學(xué) 綜合交通運輸智能化國家地方聯(lián)合工程實驗室, 四川 成都 611756)
交通違法行為是導(dǎo)致交通事故的主要原因之一。相對于研究交通事故,研究交通違法行為更具有價值,因為其尚未造成后果,且可研究樣本較多?,F(xiàn)有研究表明,駕駛?cè)说纳鐣丝谔卣髋c自我報告的交通違法行為密切相關(guān),即具有某些社會人口特征的駕駛?cè)烁鼉A向于交通違法。
社會人口特征包括性別和年齡。Kontogiannis T.等認(rèn)為男性比女性更易發(fā)生交通違法行為,這和大部分研究結(jié)論一致。部分研究則提出了相反的觀點,如Susilo Y. O.等認(rèn)為女性摩托車騎車人交通違法行為多于男性騎車人。除性別外,年齡也影響駕駛?cè)私煌ㄟ`法行為。相關(guān)研究表明,年輕駕駛?cè)诉`反交通法規(guī)的次數(shù)比年長駕駛?cè)硕?,年輕男性駕駛?cè)耸亲罹呓煌ㄟ`法行為傾向的群體。受教育程度、駕齡等社會人口特征亦影響駕駛?cè)私煌ㄟ`法行為。Akaateba M. A.等認(rèn)為教育程度與超速有關(guān),受教育程度較高時,超速頻率下降;Tseng C. M.則認(rèn)為受過高等教育的駕駛?cè)烁鼉A向于超速。在駕齡方面,Zhang G. G.等認(rèn)為駕齡小于2年的駕駛?cè)烁壮?;Sagberg F.、Mohammed N. P.等認(rèn)為隨著駕駛經(jīng)驗的增加,違反交通規(guī)則的可能性會增加。已有文獻(xiàn)主要研究社會人口特征與交通違法行為之間的關(guān)系,但鮮有研究探索社會人口特征對多次交通違法行為(一年內(nèi)交通違法2次及以上)的影響。因此,該文通過線上及線下問卷調(diào)查,搜集駕駛?cè)松鐣丝谔卣骷捌渥罱荒陜?nèi)交通違法次數(shù)等信息,分析多次交通違法的影響因素,為遏制交通違法行為提供方向。
1.1.1 問卷設(shè)計
通過問卷調(diào)查搜集駕駛?cè)松鐣丝谔卣骷捌渥罱荒陜?nèi)交通違法次數(shù)等信息。為保證樣本數(shù)和研究質(zhì)量,同時開展線上和線下問卷調(diào)查,問卷內(nèi)容一致,涉及被調(diào)查駕駛?cè)松鐣丝谔卣?、日常駕駛車輛類型、最近一年內(nèi)交通違法次數(shù)共7類問題。根據(jù)現(xiàn)有研究成果,社會人口特征包括性別、年齡、駕齡、學(xué)歷和月收入。性別和年齡根據(jù)被調(diào)查者實際情況填寫;將駕齡劃分為1~2、3~5、6~10、11~15、16年及以上;學(xué)歷包括小學(xué)、初中、高中或職高、中專、本科或大專、碩士和博士;月收入包括3 000元以下、3 001~5 000、5 001~10 000、10 001~15 000及15 001元以上。另外,問卷還考慮駕駛?cè)巳粘q{駛車輛類型,包括出租車、小客車、中客車、大客車、公交車、校車、小貨車、中貨車、大貨車、拖掛車和特殊車輛。被調(diào)查駕駛?cè)俗罱荒陜?nèi)交通違法次數(shù)包括0、1、2~3、4~6、7~10、11次及以上(見表1)。
表1 調(diào)查問卷設(shè)計
1.1.2 線上及線下問卷調(diào)查
線上調(diào)查將問卷做成網(wǎng)頁,于2017年10月26日—11月30日通過網(wǎng)絡(luò)通訊平臺邀請全國各地駕駛?cè)颂顚懻{(diào)查問卷。線下問卷調(diào)查于2017年11月22、23、28日在成都市人流密集地開展。剔除異常數(shù)據(jù)、信息不完整的問卷后,共搜集到404份線上調(diào)查問卷和202份線下調(diào)查問卷。
對線上和線下問卷調(diào)查數(shù)據(jù)均未進(jìn)行信度和效度檢驗。這是因為問卷設(shè)計較簡單;調(diào)查對象流動性大而無法進(jìn)行重復(fù)調(diào)查;針對社會人口特征、日常駕駛車型和最近一年內(nèi)交通違法次數(shù)的調(diào)查不涉及被調(diào)查者主觀意識,準(zhǔn)確性高。
根據(jù)調(diào)查問卷內(nèi)容,從社會人口特征和車型因素兩方面確定自變量。借鑒文獻(xiàn)[16],將年齡劃分為≤24、25~33、34~44、45~59和≥60歲5個區(qū)間,并將≤24歲設(shè)置為基變量。其他因素分別以女性(性別)、1~2年(駕齡)、小學(xué)(學(xué)歷)、3 000元以下(月收入)、出租車(車型)作為基變量,剩余變量均設(shè)置為啞變量(見表2)。
為便于研究,根據(jù)被調(diào)查駕駛?cè)俗罱荒陜?nèi)交通違法次數(shù)確定其是否多次交通違法。將多次交通違法作為因變量,包括是(即多次交通違法)和否(即未多次交通違法)兩個值。
采用二元Logit模型分別對線上及線下問卷調(diào)查數(shù)據(jù)進(jìn)行分析。為確定多次交通違法行為研究的建議模型,同時采用二元Probit模型對問卷調(diào)查數(shù)據(jù)進(jìn)行分析。
二元因變量的廣義線性模型表達(dá)式為:
(1)
式中:y*為假設(shè)的不可觀察的因變量;β為系數(shù);x為自變量;ξ為隨機(jī)誤差,以零為均值系統(tǒng)地分布。
表2 自變量描述
假設(shè)y表示可觀察的一個二元因變量,即多次交通違法,y=1表示多次交通違法,y=0表示未多次交通違法,它與不可觀察因變量y*間的關(guān)系為:
(2)
于是,有:
(3)
式中:F為ξ的累積分布函數(shù)。
1.3.1 二元Logit 模型
假設(shè)ξ服從logistic(u=0,σ=1)分布,其累積分布函數(shù)為:
(4)
根據(jù)式(3)和式(4),得:
(5)
對式(5)變形,得到二元Logit模型的表達(dá)式:
(6)
從而得:
(7)
1.3.2 二元Probit 模型
假設(shè)ξ服從Normal(u=0,σ=1)分布,其累積分布函數(shù)為:
(8)
根據(jù)式(3)和式(8),得:
(9)
進(jìn)而得到二元Probit模型的表達(dá)式:
(10)
利用IBM SPSS Statistics 19分別對二元Logit模型和二元Probit模型的參數(shù)進(jìn)行估計。模型擬合效果的好壞通過Pearson卡方檢驗來判斷,Pearson卡方值的計算如下:
(11)
式中:k為單元格數(shù);Ai為i水平下的觀察頻數(shù);Ei為i水平下的期望頻數(shù),Ei=npi;n為總頻數(shù),n較大時,χ2統(tǒng)計量服從k-1個自由度的卡方分布;pi為i水平下的期望頻率。
若Pearson卡方檢驗的P>0.05,則表明期望頻數(shù)和觀察頻數(shù)相差較小,擬合良好;若P<0.05,則擬合較差。
2.1.1 基于線上問卷調(diào)查數(shù)據(jù)
對線上問卷調(diào)查數(shù)據(jù)進(jìn)行描述統(tǒng)計分析,結(jié)果見表3。被調(diào)查的404名駕駛?cè)酥?,男性?5.3%,女性占34.7%;多數(shù)駕駛?cè)四挲g為25~33歲,占37.1%,60歲以上僅占2%;被調(diào)查者整體學(xué)歷較高,其中本科/大專學(xué)歷占45%,碩士以上占40.1%;駕齡主要為1~2(37.4%)和3~5年(23.7%);月收入以3 001~5 000(24%)和5 001~10 000元(32.7%)為主;絕大多數(shù)被調(diào)查駕駛?cè)?94.3%)駕駛小客車;最近一年內(nèi)有、無多次交通違法行為的駕駛?cè)朔謩e占40.6%和59.4%。
表3 基于線上問卷調(diào)查數(shù)據(jù)的描述統(tǒng)計
續(xù)表3
2.1.2 基于線下問卷調(diào)查數(shù)據(jù)
對線下問卷調(diào)查數(shù)據(jù)進(jìn)行描述統(tǒng)計分析,結(jié)果見表4。被調(diào)查的202名駕駛?cè)酥?,男性?0.8%,女性占29.2%;多數(shù)駕駛?cè)四挲g為25~33歲(37.1%),60歲以上僅占1.5%;被調(diào)查者整體學(xué)歷較高,本科/大專學(xué)歷占54%;駕齡6年以下的占55%;月收入以3 001~5 000(37.2%)和5 001~10 000元(30.2%)為主;多數(shù)被調(diào)查駕駛?cè)?92.6%)駕駛小客車;最近一年內(nèi)有、無多次交通違法行為的駕駛?cè)朔謩e占46%和54%。
2.2.1 基于線上問卷調(diào)查數(shù)據(jù)
分別利用二元Logit模型和二元Probit模型對線上問卷調(diào)查數(shù)據(jù)進(jìn)行擬合,參數(shù)估計結(jié)果見表5。兩模型的參數(shù)估計結(jié)果表明:年齡、駕齡、學(xué)歷、車型對多次交通違法行為無顯著影響,僅性別和月收入對多次交通違法行為有顯著影響。其中男性駕駛?cè)吮扰择{駛?cè)烁装l(fā)生多次交通違法;相對于月收入低于3 000元的駕駛?cè)?,月收入處于其他水平的駕駛?cè)烁鼉A向于多次交通違法,即月收入越高的駕駛?cè)硕啻谓煌ㄟ`法的可能性越大。該結(jié)果與Alver Y.等的研究結(jié)論相同,后者認(rèn)為高收入者比低收入者更易發(fā)生超速行為。月收入處于10 001~15 000元的駕駛?cè)硕啻谓煌ㄟ`法的可能性最大。
表4 基于線下問卷調(diào)查數(shù)據(jù)的描述統(tǒng)計
表5 基于線上問卷調(diào)查數(shù)據(jù)的模型參數(shù)估計結(jié)果
對比二元Logit模型和二元Probit模型參數(shù)估計結(jié)果,前者是后者的1.62~1.66倍。二者的Pearson卡方檢驗結(jié)果見表6。二者的P值均大于0.05,均擬合較好;前者的Pearson卡方值遠(yuǎn)小于后者,二元Logit模型的擬合效果更好。
表6 基于線上問卷調(diào)查數(shù)據(jù)的模型Pearson卡方檢驗結(jié)果
2.2.2 基于線下問卷調(diào)查數(shù)據(jù)
分別利用二元Logit模型和二元Probit模型對線下問卷調(diào)查數(shù)據(jù)進(jìn)行擬合,參數(shù)估計結(jié)果見表7。二者的參數(shù)估計結(jié)果顯示:僅性別和月收入對駕駛?cè)硕啻谓煌ㄟ`法行為有顯著影響。值得注意的是,與基于線上問卷調(diào)查數(shù)據(jù)的結(jié)果有所不同,此處僅月收入為15 001元以上的駕駛?cè)吮仍率杖氲陀? 000 元的駕駛?cè)烁装l(fā)生多次交通違法行為。這可能是因為線下問卷調(diào)查樣本數(shù)偏少。
表7 基于線下問卷調(diào)查數(shù)據(jù)的模型參數(shù)估計結(jié)果
如表8所示,二元Logit模型和二元Probit模型的擬合效果均較好,前者更優(yōu),與基于線上問卷調(diào)查數(shù)據(jù)的分析結(jié)果一致。
表8 基于線下問卷調(diào)查數(shù)據(jù)的模型Pearson卡方檢驗結(jié)果
通過線上及線下問卷調(diào)查搜集駕駛?cè)松鐣丝谔卣?、駕駛車型及交通違法次數(shù)信息,應(yīng)用二元Logit和Probit模型分析多次交通違法行為的影響因素,得到以下結(jié)論:
(1) 男性駕駛?cè)吮扰择{駛?cè)烁装l(fā)生多次交通違法;月收入越高的駕駛?cè)税l(fā)生多次交通違法的可能性越大。
(2) 二元Logit模型比二元Probit模型更適用于模擬多次交通違法行為。