胡越寧, 趙 丹, 牛學軍
(中國人民公安大學交通管理學院,北京 100038)
自動駕駛汽車測試主要采用基于場景的測試方法,即通過預先設定的場景,要求被測車輛完成某項特定目標或任務而對其進行測試的方法。相比于里程測試,測試場景的篩選縮減了里程測試過程中大量的“無風險”里程,測試效率高且更有針對性[1]。因此,構(gòu)建自動駕駛汽車的城市道路平面交叉口測試場景十分重要。平面交叉口包括三枝路口和四枝路口,雖然三枝路口相較于四枝路口沖突點少,但事故發(fā)生量并不少[2],因此自動駕駛汽車在三枝路口的安全性能值得研究。
目前,不少學者關于交叉口危險場景的研究集中在四枝路口(主要為十字路口)[3-6]??紤]到四枝路口與三枝路口在運行規(guī)則、控制方式、設施設計上存在較大差異,一些研究也開始考慮三枝路口危險場景。Nitsche等[7]基于OTS數(shù)據(jù)庫中1 056起事故案例,采用K-Medoids聚類算法提取出13類三枝路口和6類四枝路口預碰撞場景。徐向陽等[8]基于NAIS數(shù)據(jù)庫中499起事故案例,采用層次聚類算法得到7類四枝路口和1類三枝路口場景。廖靜倩等[9]基于NAIS數(shù)據(jù)庫中277起事故案例,采用層次聚類算法得到4類三枝路口危險場景。
綜上,國內(nèi)外關于三枝路口事故場景的研究還比較少,且由于道路交通事故數(shù)據(jù)來源于傳統(tǒng)車輛,因此,大部分學者的研究主要面向輔助駕駛測試[3-6,8-9],測試輔助駕駛系統(tǒng)在面對傳統(tǒng)車輛駕駛?cè)说奈kU場景下是否可以緩解事故傷害甚至避免事故。也有學者的研究面向自動駕駛測試[7],但事故案例中往往包含大量人類駕駛?cè)说倪`法行為,這些違法行為在自動駕駛汽車運行過程中根本不會出現(xiàn)。因此,為了提高自動駕駛汽車三枝路口測試場景覆蓋率和測試效率,本文基于實際道路交通事故數(shù)據(jù),依據(jù)自動駕駛汽車特點篩選得到碰撞事故案例,提取典型場景要素,旨在得到面向自動駕駛汽車的三枝路口典型危險場景,從而為擴充我國自動駕駛汽車測試場景庫提供參考。
本文選擇國內(nèi)自動駕駛產(chǎn)業(yè)發(fā)展較為迅速的地區(qū)作為研究對象,選擇北京市和寧波市作為典型城市。北京市地處華北平原,常住人口2 189萬,機動車保有量685萬;寧波市地處東南沿海,常住人口954萬,機動車保有量300萬。兩市的道路交通事故數(shù)據(jù)完備,能夠代表兩類地區(qū)的交通環(huán)境和事故特征。收集兩市近3年的道路交通事故數(shù)據(jù),共計12 454起,包括70個描述交通事故信息的字段可作為場景要素。本文研究的路口類型選定為三枝路口,事故車輛類型選定為乘用車或商用車。考慮到路口事故的多樣性,車輛運動狀態(tài)僅考慮直行、左轉(zhuǎn)彎和右轉(zhuǎn)彎。此外,還需滿足以下3個篩選條件:
(1)剔除數(shù)據(jù)缺失或者不明的事故案例;
(2)剔除由于路段常見違法行為引發(fā)的事故案例(如切入、倒車、追尾等);
(3)剔除存在違反通行規(guī)定的違法行為的事故案例(如逆向行駛、不按規(guī)定車道行駛等)。
Aydin等[10]認為使用傳統(tǒng)道路交通事故數(shù)據(jù)時,通過剔除人為因素,可以生成更符合自動駕駛汽車的事故場景。本文認為相對于傳統(tǒng)車輛駕駛?cè)?自動駕駛汽車具備3個特點:①具備良好的駕駛技能;②不會喪失或部分喪失駕駛能力;③不會主動違反交通規(guī)則。表1列出各特點對應的傳統(tǒng)車輛駕駛?cè)诉`法行為。選定的事故為雙方事故,若其中一方無以上違法行為,且為乘用車或商用車,則被視為自動駕駛測試車輛,另一方歸為交通參與者。
表1 傳統(tǒng)車輛駕駛?cè)诉`法行為
按照上述條件,最終篩選得到378例碰撞事故案例。其中180例發(fā)生在公路,138例發(fā)生在城市道路,60例發(fā)生在其他道路。
篩選案例可以確保測試車輛駕駛?cè)耸抢硇缘?但是由于交通參與者存在各種各樣的違法行為,即便駕駛?cè)嘶蚨嗷蛏俚刈龀隽藨獙Υ胧?事故仍不可避免地發(fā)生了。因此有必要了解目前駕駛?cè)诵枰獞獙Φ奈kU情況,因為這些情況同樣可能發(fā)生在自動駕駛汽車上[7]。
聚類分析的核心思想是將個體或?qū)ο蠓诸?使得同一類的對象之間的相似性比與其他類對象的相似性更強。其目的在于使類內(nèi)對象的同質(zhì)化最大化和類與類間對象的異質(zhì)化最大化。層次聚類法(hierarchical clustering method)是聚類分析諸多方法中使用最多的,該算法可以有效避免靠經(jīng)驗或?qū)I(yè)知識對分類的影響,且可復用性較高[11]。
2.1.1 算法步驟
首先,將個樣本看成n類(一類包含一個樣本),然后將性質(zhì)最接近的兩類合并成一個新類,得到n-1類,再從中找出最接近的兩類加以合并,變成n-2類,如此下去,最后所有的樣本均在一類,將上述并類過程畫成一張圖(稱為聚類圖)便可決定分類數(shù),每類各有哪些樣本。
2.1.2 樣本距離
聚類分析中,常用距離來度量樣本之間的接近程度。本文采用歐式距離計算樣本之間的距離,第i個樣本和第j個樣本之間的距離為:
式中:p為樣本中含有的變量個數(shù);xik為第i個樣本中第j個變量的度量值。
2.1.3 類間距離
離差平方和法(Ward法)是先讓n個樣本各自成一類,然后每次縮小一類,每縮小一類,離差平方和就要增大,選擇使其增加最小的兩類合并,直到所有的樣本歸為一類為止。
類Gp中的樣本的離差平方和為:
式中:xi為類Gp中的第i個樣本,為類Gp的重心。
類Gp和Gq之間的距離平方為:
式中:Dp+q為類Gp與類Gq合并后的新類Gp+q的離差平方和;Dp為類Gp的離差平方和。
卡方檢驗(chi-square test)是應用較廣的一種假設檢驗方法,屬于非參數(shù)檢驗的一種,目的是通過樣本數(shù)據(jù)的分布來檢驗總體分布與期望分布是否一致??ǚ綑z驗的公式可表示為:
式中:fo表示實際頻數(shù),fe代表期望頻數(shù),n為卡方檢驗的自由度。
本文將利用聚類分析和卡方檢驗挖掘事故的特點,提取典型參數(shù)特征。
如前所述,描述每起交通事故信息的場景要素多達70個,因此在聚類分析前應對各場景要素進行篩選。篩選原則有3條:一是因測試車輛與交通參與者的類型、運動狀態(tài)和碰撞角度的組合可以還原碰撞事故場景,將其視為必須保留的場景要素;二是剔除無法對自動駕駛汽車的環(huán)境感知或控制執(zhí)行造成影響的場景要素;三是剔除差異性不明顯的場景要素。文獻[12]指出,數(shù)據(jù)中場景要素的某一特征占樣本總數(shù)的75%以上,差異性將不明顯,不能將所有初步選定的場景要素全部用于聚類分析,如圖1所示的路表、通行和天氣情況。
圖1 未選定場景要素的特征分布
綜上所述,共選取8個典型場景要素作為聚類參數(shù):照明條件、交通控制方式、道路物理隔離、測試車輛類型、交通參與者類型、測試車輛運動狀態(tài)、交通參與者運動狀態(tài)和碰撞角度。
3.2.1 聚類結(jié)果
對378例碰撞事故案例進行聚類分析,得到10類聚類結(jié)果。接著對聚類結(jié)果進行卡方檢驗,取置信度為90%,將計算的卡方值與卡方對照表對應的臨界值進行比較,若卡方值大于臨界值,則說明該參數(shù)具有典型參數(shù)特征,將依據(jù)各參數(shù)特征在每一類中所占比例和各參數(shù)特征在總體中所占比例,得到每一類的典型參數(shù)特征,表2將卡方值大于臨界值的數(shù)字加粗,將得到的典型參數(shù)特征用“*”標出。反之,則說明該參數(shù)的各個特征在該類中分布差異性不明顯,該參數(shù)沒有典型參數(shù)特征。
表2 三枝路口典型危險場景聚類結(jié)果
當卡方值大于臨界值時,以第1類聚類結(jié)果為例對典型參數(shù)特征的選取原則進行解釋:
(1)測試車輛類型的參數(shù)特征“商用車”包括30個樣本,故在第1類中所占比例為78.9%,大于“乘用車”的21.1%,在總體中所占比例為14.0%,大于“乘用車”的4.9%,故“商用車”的參數(shù)特征非常顯著,屬于第1類的典型參數(shù)特征;
(2)交通控制方式的參數(shù)特征,包括“信號控制”和“無信號控制”,雖然“無信號控制”在第1類中所占比例為47.4%,小于“信號控制”的52.8%,但是“無信號控制”在總體中所占比例為17.3%,大于“信號控制”的7.3%,故兩個參數(shù)特征共同作為第1類的典型參數(shù)特征。
當卡方值小于臨界值時,也就是某一類中某個參數(shù)的各個參數(shù)特征均不具有顯著的統(tǒng)計學特性,說明在提取典型危險場景時需要考慮所有的參數(shù)特征。另外,考慮到典型危險場景設計的合理性,當某參數(shù)特征在某一類中所占比例過小時,需要在選取參數(shù)特征時設定閾值[9],本文取10%,即選定為典型參數(shù)特征后,該參數(shù)特征在某一類中所占比例應大于10%,如第5類中照明條件中的參數(shù)特征“夜間無路燈照明”在總體中所占比例為11.1%,大于“白天”的8.9%和“夜間有路燈照明”的4.5%,故可以歸為典型參數(shù)特征,但是“夜間無路燈照明”在第5類中所占比例為6.5%,小于10%,故不選取為典型參數(shù)特征。
3.2.2 基于事故類型進一步提取典型參數(shù)特征
為了對未區(qū)分出來的典型參數(shù)特征做進一步的提取,使每一個參數(shù)只有唯一的典型參數(shù)特征(如第1類中的“交通控制方式”兩個參數(shù)特征共同作為第1類的典型參數(shù)特征),本文根據(jù)三枝路口碰撞事故案例中的場景要素“事故類型”對聚類分析得到的10類聚類結(jié)果作進一步的分析。事故類型分為財產(chǎn)損失事故、傷人事故、死亡事故,按照各種事故類型的占比乘以權(quán)重得到危險程度,權(quán)重分別取為0.6、0.3、0.1,最終選取危險程度最大的參數(shù)特征作為唯一的典型參數(shù)特征,危險程度的計算公式可以表示為:
式中:D表示危險程度,ω1、ω2、ω3分別表示財產(chǎn)損失事故、傷人事故、死亡事故的權(quán)重,A1、A2、A3分別表示為財產(chǎn)損失事故、傷人事故、死亡事故在總事故中的占比。
如確定第3類中的交通參與者類型,交通參與者類型中的參數(shù)特征“商用車”“摩托車”和“非機動車”在聚類分析時均被歸為典型參數(shù)特征,但通過事故類型分析可知“摩托車”的危險程度最高,故最終選定“摩托車”作為第3類的典型參數(shù)特征,如表3所示。
表3 交通參與者類型確定
經(jīng)過提取的典型參數(shù)特征,最終得到10類典型危險場景,如表4所示。
表4 三枝路口典型危險場景
10類三枝路口典型危險場景可描述為:第1類場景為白天,右轉(zhuǎn)的商用車與直行的非機動車發(fā)生同向側(cè)面碰撞,事故發(fā)生地點無信號控制,附近有中心隔離和機非隔離設施。第2類場景為白天,直行商用車與左轉(zhuǎn)非機動車發(fā)生同向側(cè)面碰撞,事故發(fā)生地點無信號控制,附近無隔離設施。第3類場景為白天,直行的商用車與左轉(zhuǎn)的摩托車發(fā)生直角側(cè)面碰撞,事故發(fā)生地點無信號控制,附近無隔離設施。第4類場景為白天,直行的商用車與左轉(zhuǎn)的非機動車發(fā)生直角側(cè)面碰撞,事故發(fā)生地點為信號控制,附近有中心隔離和機非隔離設施。第5類場景為白天,直行的乘用車與通過人行橫道的非機動車發(fā)生直角側(cè)面碰撞,事故發(fā)生地點無信號控制,附近有中心隔離設施。第6類場景為白天,左轉(zhuǎn)的商用車與直行的非機動車發(fā)生直角側(cè)面碰撞,事故發(fā)生地點為信號控制,附近有中心隔離和機非隔離設施。第7類場景為白天,直行的商用車與通過人行橫道的行人發(fā)生碰撞,事故發(fā)生地點無信號控制,附近有中心隔離和機非隔離設施。第8類場景為白天,直行的乘用車與左轉(zhuǎn)的摩托車發(fā)生直角側(cè)面碰撞,事故發(fā)生地點無信號控制,附近無隔離設施。第9類場景為白天,左轉(zhuǎn)的乘用車與直行的摩托車發(fā)生對向側(cè)面碰撞,事故發(fā)生地點無信號控制,附近無隔離設施。第10類場景為夜間,直行的乘用車與通過人行橫道的行人發(fā)生碰撞,事故發(fā)生地點無信號控制,附近有路燈、中心隔離和機非隔離設施。
上述10類三枝路口典型危險場景,可根據(jù)其涉及的要素特征進一步歸類:①從照明條件角度而言,第10類涉及夜間有路燈照明的場景;②從交通參與者角度而言,第1、2、4、5、6類為非機動車參與場景,其中第1、2、4、6類為商用車和非機動車工況,占樣本總數(shù)的31%,另外,第3、8、9類為摩托車參與場景,第7和10類為行人參與場景;③從運動狀態(tài)角度而言,第1類場景為直行與右轉(zhuǎn)彎沖突,第2、3、4、6、8、9類為直行與左轉(zhuǎn)彎沖突,占樣本總數(shù)的63%,第5、7、10類為非機動車、行人通過人行橫道時的場景。
本文篩選得到378例碰撞事故案例,根據(jù)案例中的場景要素分析確定聚類參數(shù),通過聚類分析、卡方檢驗和事故類型分析,提取典型參數(shù)特征,最終得到10類三枝路口典型危險場景。
(1)篩選得到的碰撞事故案例可以了解目前測試車輛駕駛?cè)诵枰獞獙Φ奈kU情況,這對于研究自動駕駛汽車需要面對的危險情況具有一定的參考價值。
(2)通過聚類分析和卡方檢驗提取典型參數(shù)特征,并基于事故類型進一步提取典型參數(shù)特征,得到10類符合中國交通實際的三枝路口典型危險場景,其各具有代表性和典型性。其中,商用車和非機動車工況場景,以及直行與左轉(zhuǎn)彎的沖突是需要重點關注的三枝路口典型危險場景。
本文只收集了兩個城市的道路交通事故數(shù)據(jù),并不能完全代表國內(nèi)實際,未來可以收集更多典型城市的事故數(shù)據(jù)。事故案例中沒有詳細的事故發(fā)生過程信息,無法了解雙方在發(fā)生碰撞前的具體運動狀態(tài)(如減速、轉(zhuǎn)向等),從而無法構(gòu)建較為完備的場景,未來將尋找內(nèi)容更豐富的深度事故數(shù)據(jù)開展研究。