呂能超 高謹謹 王維鋒 王玉剛
(1.武漢理工大學智能交通系統(tǒng)研究中心 武漢 430063;2.河海大學土木與交通學院 南京 210098)
駕駛?cè)孙L格存在差異,體現(xiàn)在駕駛操作的差異化。早在上世紀90年代,就有學者對駕駛風格開展了研究[1],并將駕駛風格定義為駕駛?cè)嗽隈{駛車輛過程中的駕駛行為習慣。駕駛風格與駕駛技能有所區(qū)別,駕駛技能是指駕駛?cè)藢囕v的控制能力和適應復雜交通狀況的能力,而駕駛風格涉及個人選擇駕駛的方式或多年來形成的駕駛習慣,體現(xiàn)在駕駛?cè)藢π旭偹俣鹊倪x擇、超車閾值、車頭時距,以及違反交通規(guī)則的傾向等[2]。駕駛風格對行車習慣有較大影響,因此在駕駛行為研究領域備受關注。
研究表明:不同風格駕駛?cè)说母囆袨槊黠@不同[3],為了便于研究駕駛風格及其行為特征,通常將駕駛?cè)说鸟{駛風格分為激進型、普通型和保守型3類[4-6],也有的學者將其分為冒進型、比較冒進型、比較謹慎型和謹慎型4類[7],甚至還有的學者將其劃分為5類[3]。目前,駕駛風格分類的研究一般可總結(jié)為主觀的問卷調(diào)查和基于客觀的駕駛數(shù)據(jù)分析建模等2類方法[8-9]。
主觀問卷調(diào)查分類方法一般通過問卷的形式,對反映駕駛?cè)酥饔^感受和心理預期等方面的評價指標進行統(tǒng)計和量化分析,從而實現(xiàn)對駕駛?cè)笋{駛風格的分類[10-11]。如Taubman-Ben-Ari等[12]設計的多維度駕駛風格量表法(multimensional driving style inventory,MDSI),從多維度問卷數(shù)據(jù)量化分析中評估駕駛風格,對駕駛風格的結(jié)構(gòu)進行界定并將其明確區(qū)分為4種風格;孫龍等[13]對MDSI中駕駛風格的影響因素進行了修訂,增加了駕駛風格量表的信度和效度的評價指標。基于主觀問卷的調(diào)查分類法方法簡單,無需信息采集設備,但該方法的分類結(jié)果只能反映駕駛?cè)藢ψ晕荫{駛行為的評估,分類結(jié)果往往帶有一定主觀偏差,不能完全體現(xiàn)駕駛?cè)藢嶋H駕駛行為特征[4];此外,該方法只能基于問卷進行事后分析,不能實時測量駕駛?cè)孙L格。
為了彌補問卷調(diào)查方法的不足,Li等[14]采用1種基于客觀數(shù)據(jù)的主觀分類方法,這種方法主要是利用駕駛?cè)俗匀获{駛的視頻數(shù)據(jù)對駕駛風格進行分類。相比于問卷調(diào)查分類方法,該方法分類結(jié)果更符合駕駛?cè)说膶嶋H駕駛行為特征。基于網(wǎng)聯(lián)行車數(shù)據(jù)構(gòu)建的駕駛風格分類模型能夠更為客觀、嚴謹?shù)卦u價駕駛?cè)说鸟{駛風格。該方法通常選擇能夠表征駕駛?cè)说鸟{駛行為參數(shù)作為分類指標,如超速時間比例[5]、速度[6]、加速度[15]、車頭時距、換道時距[16]、油門踏板開度[17]等,在分類方法方面,通過構(gòu)建分層聚類和K-means聚類[7,18-19]等無監(jiān)督機器學習方法、有監(jiān)督機器學習的支持向量機模型方法[20]等實現(xiàn)駕駛風格的分類;此外,Li[21]對典型的機動狀態(tài)之間的轉(zhuǎn)換模式進行分析,采用隨機森林算法對駕駛風格進行分類。結(jié)果表明:采用該方法可以顯著提升駕駛風格的分類識別精度,有望在將來信息化程度高的車載環(huán)境中得到應用。
目前基于客觀數(shù)據(jù)的駕駛風格分類方法,一般選用較多的參數(shù),而且建模過程比較復雜;而目前的網(wǎng)聯(lián)車輛僅能提供有限的感知參數(shù),上述方法不能在現(xiàn)有網(wǎng)聯(lián)數(shù)據(jù)采集條件下推廣應用。為了降低數(shù)據(jù)采集的復雜程度和建模難度,本研究提出了1種基于精簡客觀行車數(shù)據(jù)的駕駛風格分類方法。由于駕駛?cè)说囊恍┨卣髋c駕駛習慣相關,不同風格的駕駛?cè)嗽诓僮鬈囕v時,車輛的一些運行參數(shù)具有差異性,而車頭時距指標能夠直觀地反應出不同駕駛?cè)说鸟{駛習慣,即車頭時距能夠體現(xiàn)駕駛?cè)说募みM型程度[21];此外車頭時距數(shù)據(jù)易于獲取,通過常見的車載傳感器即可獲得。因此,本研究基于網(wǎng)聯(lián)行車數(shù)據(jù)提取車頭時距為研究指標,根據(jù)不同風格駕駛?cè)说母囂匦蕴崛∶糠N駕駛風格典型的駕駛模式,利用模糊數(shù)學的思想對典型模式進行賦值,并提出駕駛風格分類的閾值。本研究提出的駕駛風格快速分類的方法,使用易獲取、極精簡的數(shù)據(jù)達到駕駛風格分類目的;與以往研究相比,在數(shù)據(jù)集質(zhì)量要求、計算簡便性等方面存在優(yōu)勢、便于實施;同時,對于制定個性化輔助駕駛策略、提高預警有效性方面具有重要意義[22]。
駕駛模式是駕駛?cè)嗽谀骋粫r段內(nèi)的連續(xù)操作狀態(tài)的集合,反映了駕駛?cè)瞬僮鳡顟B(tài)變化的時變特征,不同風格的駕駛?cè)说鸟{駛模式特征異質(zhì)性顯著;因此,可以通過提取駕駛?cè)说牡湫婉{駛模式來識別其駕駛風格。由于駕駛行為具有典型的時序特性,前后時序的駕駛行為之間的關聯(lián)性和差異性具有重要的價值,因此采用時間窗分析駕駛?cè)诵袨樘匦?。根?jù)文獻[23],在駕駛過程中,一般時間窗為3 s的連續(xù)操作狀態(tài),就能很好地反應駕駛?cè)说男袨樘匦?,代表駕駛?cè)说鸟{駛習慣。太長的連續(xù)時間涉及的因素較復雜,因此,應在反映駕駛?cè)艘鈭D的基礎上盡可能選取較短的時間窗來分析其駕駛行為。研究在此基礎上,引入車頭時距(time headway,THW)指標,將連續(xù)時間窗的THW特征值表征為1個駕駛模式。為了更好地對駕駛風格進行識別,本研究分別選取3 s和5 s的時間窗對的THW特征值進行分析,通過對比發(fā)現(xiàn),以5 s為時間窗提取出的不同駕駛風格的典型駕駛模式具有相似性,不能很好的區(qū)分其駕駛風格,因此,確定選取3 s的THW特征值為1個駕駛模式。
文獻表明,將駕駛風格分為3種類型是最常用,也是最可用的分類方式[5-7]。本研究利用三分制量表法將44位駕駛?cè)说鸟{駛風格標定為激進型、普通型和保守型3種類型。根據(jù)標定結(jié)果,通過計算提取每種駕駛風格中累計頻率排名較高的前85%的駕駛模式作為該駕駛風格對應的典型模式;通過事先獲取的大量帶有風格標簽的駕駛行為片段,提取能夠代表駕駛風格的典型駕駛模型;利用模糊數(shù)學的方法,賦予不同駕駛風格的典型模式相應的分值。并基于自然駕駛采集的大量駕駛片段進行模型的建模和驗證。
在樣本數(shù)據(jù)選取時按照7∶3比例構(gòu)造訓練集和測試集,根據(jù)典型模式的分值對訓練集駕駛?cè)说鸟{駛風格進行量化,采用三分制量表法標定的駕駛風格結(jié)果,構(gòu)建駕駛風格量化分類閾值準則,并對測試集的駕駛?cè)说鸟{駛風格進行辨識。結(jié)合三分制量表法標定的結(jié)果評價所辨識的駕駛風格準確率。具體流程見圖1。
圖1 基于網(wǎng)聯(lián)數(shù)據(jù)的駕駛風格分類建模思路流程Fig.1 Procedure of driving style classification modeling based on connected data
為了開展本研究所提出的駕駛風格分類方法建模和驗證,要對每位參與實驗的駕駛?cè)诉M行評定和標記,以確定每位駕駛?cè)说膶嶋H駕駛風格。根據(jù)以往駕駛行為相關研究經(jīng)驗[5,14],主觀評價是穩(wěn)定而又可行的評價方法;雖然該方法不能用于實時評價,但是在建模所需的樣本標記階段,是非常適用的方法。因此,本研究采用多名專家主觀評價方法??紤]到駕駛風格分類方法的可行性和準確性,本研究選取三分制量表法對駕駛?cè)说鸟{駛風格進行標定。
三分制量表法是1種基于客觀駕駛數(shù)據(jù)的主觀分類方法。相比于其他主觀分類方法,該方法由3位專家分別對駕駛?cè)说鸟{駛風格進行分類,降低了評價的主觀性,是1種常用且有效的方法。這種方法是通過3位專家觀看駕駛?cè)嗽隈{駛過程中的駕駛行為表現(xiàn),即超車、換道、跟車等能夠反映駕駛?cè)笋{駛風格的駕駛行為等,對每位駕駛?cè)朔謩e進行評分(1分為保守型;2分為普通型;3分為激進型),即每位駕駛?cè)丝梢缘玫?個分值。每位駕駛?cè)说淖罱K得分取決于3位專家評分結(jié)果是否一致?;谌种浦饔^評價的駕駛風格辨識遵循如下處理準則:①如果3位專家評分結(jié)果一致,那么該分值對應的駕駛風格類型即為該駕駛?cè)说鸟{駛風格;②如果其中2位專家的評分結(jié)果相同,且與第3位專家的評分值相差小于或等于1,那么以相同評分的2位專家評分結(jié)果為準;③如果其中2位專家的評分結(jié)果相同,而評分值與第3位專家評分值相差大于1,則重新進行評分;若3位專家評分結(jié)果各不相同,也需要重新進行評分。
具體評分規(guī)則如下。
式中:S為駕駛?cè)孙L格得分值;EA為專家A評分值;EB為專家B評值;EC為專家C評分值。
三分制量表法提供了1種準確、穩(wěn)定的駕駛風格辨識方法,但其操作過程繁瑣,且需要大量的視頻數(shù)據(jù)資料支撐,不能實現(xiàn)駕駛風格的實時識別;然而,對于駕駛風格標注階段非常適用。本研究用此方法對駕駛?cè)俗匀获{駛實驗過程中的駕駛風格進行分類,并對行車片段進行標簽標注,為后續(xù)駕駛風格的閾值劃分和驗證提供依據(jù)。
駕駛?cè)嗽隈{駛過程中受交通流、周圍環(huán)境以及前方引導車的影響,從而采取不同的操作。車頭時距是駕駛行為的直觀體現(xiàn)。本研究定義連續(xù)3 s的車頭時距特征值為1個駕駛模式,提取不同駕駛風格中出現(xiàn)累計頻率較高的駕駛模式作為該駕駛風格的典型駕駛模式。提取方法及流程見圖2。
圖2 基于車頭時距的典型駕駛模式提取方法Fig.2 The method of typical driving patterns based on THW
1.3.1 車頭時距分級及編碼
對于時間序列數(shù)據(jù),為了方便計算,需要對所提取的特征進行合理的簡化,以降低復雜度和信息量。本文采用符號聚合近似(symbolic aggregate approximation,SAX)方法將數(shù)據(jù)轉(zhuǎn)化為簡化的代碼。SAX算法由Lin等[23]提出,它可以將輸入時間序列轉(zhuǎn)換成字符串,既能夠?qū)υ紨?shù)據(jù)進行簡化降維,也保留了原始時間序列的大體形狀。SAX包括2個步驟:①將原始數(shù)據(jù)轉(zhuǎn)化成分段聚合近似(piecewise aggregate approximation,PAA)表示形式,即將一定時間長度的車頭時距進行平均值計算,以均值代表該時間段內(nèi)的數(shù)據(jù);②根據(jù)聚類點的位置將聚類數(shù)據(jù)轉(zhuǎn)換成字符串。
分段聚合近似是將n維時間序列C=c1,c2,…,c n轉(zhuǎn)換為w維的向量C=c1,c2,…,c w的過程,其中,第i個按照式(2)計算。
將n維原始的時間序列向量降維到w維,將原始時間序列向量劃分為w個片段,是第i個片段的均值。其中,為壓縮率,必須保證為整數(shù)。
將PAA形式的車頭時距數(shù)據(jù)轉(zhuǎn)化成字符串時需要依據(jù)車頭時距的分級和編碼規(guī)則來完成;因此,需要設置車頭時距分級及編碼規(guī)則。根據(jù)所有駕駛?cè)说能囶^時距數(shù)據(jù)的分布情況,將其按從小到大的范圍劃分為不同的等級,并設置相應的編碼。根據(jù)前期Lyu等[24]研究中行車狀態(tài)下的車頭時距分布規(guī)律,本研究根據(jù)車頭時距分布情況將其劃分為8個等級,并依次將其代碼設置為1~8。具體劃分情況見表1。
表1 車頭時距等級劃分情況Tab.1 Classification of THWclass
轉(zhuǎn)化成PAA形式的時間序列根據(jù)車頭時距編碼設置規(guī)則,將PAA系數(shù)映射到相應的符號,即將降維之后的THW值映射到對應的等級中,從而將時間窗行車數(shù)據(jù)轉(zhuǎn)化為對應的編碼代碼。
本研究樣本數(shù)據(jù)車頭時距的采集頻率為10 Hz,數(shù)據(jù)量較大,需對原始數(shù)據(jù)進行欠采樣處理。因此,以1 s為時間長度進行符號聚合近似處理,即以1 s的車頭時距平均值來表示這1 s內(nèi)的車頭時距。以其中任意1名駕駛?cè)?0 s內(nèi)的車頭時距數(shù)據(jù)為例,分段聚合近似結(jié)果見圖3。圖中右側(cè)的數(shù)字表示各等級范圍,根據(jù)車頭時距所屬范圍確定其編碼。
圖3 車頭時距分級及編碼Fig.3 Grading and coding of THW
1.3.2 駕駛模式提取
本研究定義連續(xù)3 s的車頭時距對應等級的字符串為1個駕駛模式。由于駕駛過程是1個連續(xù)的過程,因此采用滑動時間窗法來檢測駕駛?cè)说鸟{駛模式。見圖3,每3 s產(chǎn)生1個駕駛模式,選擇3 s的滑動時間窗口來檢測駕駛?cè)说鸟{駛模式,如123,234,345,…,等。時間段分別產(chǎn)生1個駕駛模式。由于車頭時距被劃分為8個等級,每3 s為1個駕駛模式,因此共產(chǎn)生83=512種駕駛模式。見圖4,每個矩形框包圍的連續(xù)3個代碼為1個駕駛模式,從第13 s起駕駛模式依次為:643,433,333。
圖4 駕駛模式提取及編碼過程Fig.4 The process of car driving patterns extracting and coding
考慮到有效樣本篩選的原則,充分考慮駕駛?cè)吮旧硪鈭D的跟車數(shù)據(jù),剔除由于其他車輛的行為而產(chǎn)生的THW突變等情況;通過分析,認為以下情形中THW不代表駕駛?cè)吮旧淼母囈鈭D,將剔除以下數(shù)據(jù):①連續(xù)3 s內(nèi)的THW均大于6 s,即產(chǎn)生888這種駕駛模式時,此時車輛處于自由巡航狀態(tài);②連續(xù)2 s內(nèi)的THW發(fā)生突變,即產(chǎn)生881,811,882,822或產(chǎn)生188,118,288,228等這幾種駕駛模式時,前者可能是該車輛被其他車輛切入,后者可能是由于前車換道駛離。
1.3.3 駕駛風格典型模式選取
假設認為,不同駕駛風格有其典型的高頻駕駛模式,提取這些典型的高頻駕駛模式是關鍵。典型模式選取時,結(jié)合三分制量表法劃分的駕駛風格結(jié)果,將每種風格駕駛?cè)讼嗤a的駕駛模式自然聚集成一組;統(tǒng)計每種駕駛風格中不同類型的駕駛模式的發(fā)生頻率,提取每種駕駛風格典型高頻的駕駛模式。
此外,不同駕駛風格存在典型駕駛模式可能存在類似的現(xiàn)象,即同一種駕駛模式在不同駕駛風格中均出現(xiàn),這就使得同一種駕駛模式成為不同駕駛風格的典型模式,出現(xiàn)這一現(xiàn)象的原因可能是某些駕駛模式是所有駕駛?cè)似毡椴捎玫鸟{駛模式,不具有駕駛風格的區(qū)別性。為了解決這一問題,設置典型模式提取規(guī)則:①一般情況下,提取每種駕駛風格中出現(xiàn)頻率較高的前85%分位的駕駛模式為典型駕駛模式;②若不同駕駛風格中累計排名較高的前85%分位駕駛模式中出現(xiàn)相同的駕駛模式,則對比該模式在不同駕駛風格中的出現(xiàn)的累計頻率,認為該模式屬于累計頻率較高的駕駛風格的典型模式。
通過分析不同駕駛風格的駕駛模式,以提取其對應的典型駕駛模式,主要思路及步驟如下。
步驟1。根據(jù)三分制量表法的主觀評價分類結(jié)果,對駕駛?cè)孙L格進行分類,并將相同駕駛風格的行車片段構(gòu)成1個子數(shù)據(jù)集,提取其THW特征值。
水肥一體化技術是將灌溉與施肥融為一體的農(nóng)業(yè)新技術。在國家大力發(fā)展現(xiàn)代農(nóng)業(yè)的新形勢下,河北華雨農(nóng)業(yè)科技有限公司發(fā)揮自身在灌溉裝備和新型微生物肥料行業(yè)多年形成的獨特優(yōu)勢,在水肥一體化技術領域推出新成果,為優(yōu)質(zhì)高效綠色環(huán)保型現(xiàn)代農(nóng)業(yè)注入新的活力。
步驟2。采用滑動時間窗法檢測每類駕駛風格駕駛?cè)说鸟{駛模式,將每種駕駛風格產(chǎn)生的相同的代碼自動劃分為1組,即每種駕駛風格中包含的每種駕駛模式劃分為1組。
步驟3。統(tǒng)計每種駕駛風格中每種駕駛模式出現(xiàn)的累計頻率,并提取每種駕駛風格中出現(xiàn)累計頻率較高的前85%分位的駕駛模式作為典型駕駛模式。
為了區(qū)分不同駕駛風格,需將不同駕駛風格駕駛?cè)说母囂匦粤炕?,對不同駕駛風格中典型的駕駛模式進行賦值。實現(xiàn)分類的方法有多種,如聚類、模式識別、模糊隸屬度等方法。模糊數(shù)學是研究現(xiàn)實世界中許多界限不分明甚至是很模糊問題的數(shù)學工具,本研究采用模糊隸屬度思想研究不同駕駛風格的典型模式的分值設置。模糊隸屬度的首要問題就是確定隸屬度函數(shù),半梯形分布或梯形分布是比較常用的隸屬度函數(shù)。根據(jù)本研究典型模式頻率數(shù)據(jù)分布的特點,采用半梯形分布方法確定典型模式的隸屬函數(shù)。
由本研究中定義的典型模式可知,每種風格出現(xiàn)某種典型模式的頻率越高,說明這種典型模式越能夠體現(xiàn)該駕駛風格的駕駛模式;因此可知,典型駕駛模式的頻次對應的隸屬度函數(shù)屬于偏大型隸屬度函數(shù),函數(shù)形式見式(3)。
為了定量描述駕駛?cè)说鸟{駛行為,根據(jù)駕駛?cè)诵熊嚁?shù)據(jù)中出現(xiàn)典型對應的分值以及所占行車時間百分比對駕駛?cè)诉M行分值計算,分值具體定義為,駕駛?cè)诵熊嚻沃谐霈F(xiàn)各典型模式所占總駕駛時間的百分比與該典型模式對應分值乘積的累計值[25]。計算公式為
式中:S為駕駛?cè)笋{駛風格的得分值;Pi為駕駛?cè)诵熊嚁?shù)據(jù)中出現(xiàn)典型模式i的時間占總駕駛時間的百分比;Si為典型駕駛模式i對應的分值。
樣本量的選取是獲得足夠?qū)嶒灁?shù)據(jù)的關鍵,樣本量過小會降低結(jié)果的可信度,過大則會導致資源的浪費。本研究參考文獻[26]基于預期方差、目標置信度和誤差幅度計算所需樣本量。計算公式為
式中:N為樣本量;Z為標準正態(tài)分布統(tǒng)計量;σ為標準偏差;E為最大誤差。
通常,選擇10%的顯著性水平來反映未知參數(shù)的90%置信水平。當置信水平為90%時,Z=1.25;σ取值為0.25~0.5,E=10%。因此,計算所需最小樣本量取值范圍為10~39。因此,本研究共招募44名被試駕駛?cè)耍ㄅ?19;男性=25),被試年齡在22~55歲之間(mean=32.8,SD=8.2),駕駛?cè)笋{齡在2~18年之間(mean=6.9),平均駕駛里程為11萬km,范圍在400~4×105km之間,樣本的性別、年齡和駕駛經(jīng)驗的分布符合中國一般駕駛?cè)巳旱姆植记闆r。
本研究的建模數(shù)據(jù)來自自然駕駛網(wǎng)聯(lián)行車數(shù)據(jù),實驗基于自主開發(fā)的實車實驗平臺開展。如圖5所示,實驗平臺基于廣汽傳祺GA3集成,主要裝載了高級駕駛輔助系統(tǒng)Mobileye M630、前向激光雷達Ibeo LUX4、車載慣性導航系統(tǒng)OXTS RT2500、前視攝像頭等。其中Mobileye用于采集前方最多8個目標的位置信息以及本車相對車道線位置信息,Mobileye的預警功能在部分實驗過程中處于關閉狀態(tài);CAN總線用于采集駕駛?cè)瞬僮骱筒糠周囕v運動姿態(tài)信息,如油門踏板、制動踏板、轉(zhuǎn)向盤轉(zhuǎn)角和車速等;慣導系統(tǒng)用來采集車輛運動姿態(tài)和位置信息,如加速度、角速度和經(jīng)緯度;激光雷達隱藏安裝在車頭,用于采集前方目標相對于本車的位置和相對速度,作為冗余信息采集傳感器;前視攝像頭用來采集車輛行車視頻。除視頻外,所有數(shù)據(jù)均采用CAN總線設備采集,實現(xiàn)了時間的同步;最終通過采集軟件處理后,采用頻率為10 Hz。
圖5 實驗平臺Fig.5 Experimental platform
本次實驗給出駕駛員起點和終點,實驗路段包括4個部分,見圖6,路段1和路段3為城市快速路,路段2為高速公路,路段4為城市道路。整個實驗過程中駕駛?cè)藷o需佩戴任何實驗儀器,只需按照日常的習慣從起點駛向終點,在保證安全的前提下,發(fā)揮每位駕駛?cè)烁髯缘牟僮髁晳T和駕駛風格。
圖6 實驗路線Fig.6 Experimental routes
通過自然駕駛實車實驗獲取到88人次、每人次105 km的實車實驗數(shù)據(jù),共計約10 000 km。實驗過程中采集的數(shù)據(jù)包括駕駛員基本信息、速度(v,km/h)、縱向加速度(a x,m/s2)、車頭時距(THW,s)、碰撞時間(time-to-collision,TTC,s)和車頭間距(Distance Headway,dhw,m)等,獲取的所有數(shù)據(jù)類型見表2。
表2 自然駕駛平臺采集的原始數(shù)據(jù)Tab.2 Raw data from a natural flight platform
本研究僅使用Mobileye采集的THW及前視攝像頭采集的行車視頻數(shù)據(jù)來研究駕駛風格。由于傳感器檢測范圍限制或者前方?jīng)]有目標,Mobileye輸出的數(shù)據(jù)并不是直接輸出車頭時距指標,需要進行進一步處理,同時車載傳感器采集的原始數(shù)據(jù)不可避免的存在漏幀、不連續(xù)、跳變等缺陷,需對原始數(shù)據(jù)進行清洗與預處理以保證數(shù)據(jù)質(zhì)量。因此,本文使用三次樣條插值對丟失幀進行補充,并基于Savitzky-Golay濾波器過濾噪聲、修正跳變,最終獲得準確的車頭時距數(shù)據(jù)。
通過對行駛工況界定,提取有效行車片段。有效片段選取時充分考慮樣本中能夠代表本車駕駛?cè)艘鈭D的跟車數(shù)據(jù)。由于實驗路段中高速公路路段車流量較小,車輛基本處于自由巡航狀態(tài),無法提取到有效的車頭時距數(shù)據(jù);城市道路車流量較大,車輛經(jīng)常處于交通擁堵狀態(tài),車頭時距過小,難以有效區(qū)分不同風格駕駛員操作的差異性。因此,最終選取路段1和路段3總長度為47 km的城市快速路作為研究對象。將城市快速路的行車數(shù)據(jù)按照30 s為1個時間窗進行劃分,每個時間窗內(nèi)的行車數(shù)據(jù)作為一段有效行車片段,最終共獲取到約2 640段有效行車片段。其中,30名駕駛?cè)藬?shù)據(jù)用于建模(占總數(shù)據(jù)集68.2%),14名駕駛?cè)藬?shù)據(jù)用于驗證(占總數(shù)據(jù)集31.8%)。
1)三分制量表法劃分駕駛風格。選擇3位駕駛經(jīng)驗豐富且深入了解不同駕駛風格特征的駕駛?cè)俗鳛轳{駛風格主觀評價專家,3位專家通過觀看44位駕駛?cè)说男熊囈曨l數(shù)據(jù),根據(jù)被試駕駛?cè)嗽谛熊囘^程中的跟車、超車、換道等能體現(xiàn)駕駛風格的駕駛行為,并采用三分制量表法分別對44位駕駛?cè)艘来芜M行打分從而對其駕駛風格進行標定。在駕駛風格標定過程中,初次打分時,不同專家之間出現(xiàn)意見分歧,其中39位駕駛?cè)说娘L格標定結(jié)果一致,5位駕駛?cè)说鸟{駛風格不能確定;隨后,3位專家對這5位駕駛員重新進行標定;最終,將這5位駕駛員確定為3位屬于普通型,2位屬于保守型。三分制量表法的駕駛風格分類結(jié)果見表3。
表3 駕駛風格標定結(jié)果Tab.3 The result of driving style calibration
2)不同駕駛風格的模式賦值。根據(jù)不同駕駛風格駕駛?cè)说男袨樘匦苑謩e賦予不同駕駛風格的典型模式初始分值。分值可以設置為-1,0,1,也可以設置為其他值,主要用來區(qū)別不同類型風格。初始值設置見表4。
表4 典型駕駛模式初始分值Tab.4 Typical initial values of the following patterns
首先,基于自然駕駛建立行車數(shù)據(jù)集,對行車數(shù)據(jù)集進行有效性篩選及分段;然后,根據(jù)三分制量表法得到每位駕駛?cè)说鸟{駛風格,進而對每個行車片段進行駕駛風格標注;最后,提取3種駕駛風格的行車片段中的典型駕駛模式,并對其按照出現(xiàn)頻次百分比進行分值賦值?;诿糠N典型模式所占的時間百分比,利用式(4)計算每種典型模式的隸屬度及對應分值,提取的每種駕駛風格的典型模式見表5。
表5 部分典型的駕駛模式隸屬度及對應分值Tab.5 A part of the membership and the corresponding values of typical car following patterns
從上述提取的不同駕駛風格的典型模式可以看出:①激進型駕駛?cè)伺琶壳暗鸟{駛模式為222,433,332,443,322,可以看出激進型駕駛?cè)藘A向于與前車保持較小的車頭時距,且有將車頭時距由大到小調(diào)整的意愿;②普通型駕駛?cè)伺琶壳暗鸟{駛模式為333,444,544,554,654,其車頭時距保持在比較適中的位置;③保守型駕駛?cè)伺琶壳暗鸟{駛模式為666,777,555,665,556,可以看出保守型駕駛?cè)藘A向于與前車保持較大的車頭時距,且有將車頭時距由小到大調(diào)整的意愿;④激進型駕駛?cè)嗽隈{駛過程中緊緊跟隨前車,隨著前車速度的變化不斷調(diào)整運行狀態(tài);而保守型駕駛?cè)藙t為自己預留更加充裕的時間來應對前車速度的變化,這一結(jié)果符合不同駕駛風格駕駛?cè)说男睦硖匦浴?/p>
3)不同駕駛風格的閾值設定。駕駛風格閾值設置時,根據(jù)實驗得到的44組有效樣本,選擇約70%的樣本,即30名駕駛?cè)俗鳛轳{駛風格分類的建模數(shù)據(jù)集。隨機選取樣本時遵循分層抽樣的原則,按照比例隨機選擇激進型、普通型、保守型駕駛?cè)朔謩e為4,15,11名。利用式(4)計算得出訓練集駕駛?cè)说钠骄种?、分值標準差、分值極大值和分支極小值見表6。
表6 訓練集駕駛?cè)说梅智闆rTab.6 Training set the driver of the score
具體分值分布情況見圖7。由圖7中建模數(shù)據(jù)集駕駛?cè)说梅智闆r可知,普通型和保守型駕駛?cè)朔种涤薪徊嬷丿B部分。這種情況符合客觀規(guī)律,本身因個體差異會存在少數(shù)不同類型駕駛?cè)嗽u分分值重合情況;但是激進型和保守型駕駛?cè)酥g分值沒有重疊。設置閾值的目的是區(qū)分不同的駕駛風格,準確地說,就是找出2個臨界值作為不同駕駛風格的分界線,其中1條線盡可能將普通型與保守型分開,是與保守型、普通型的各個樣本分值距離之和最小的值,另1條線盡可能將激進型與普通型分開,即與激進型、普通型的各個樣本分值距離之和最小的值。通過計算得出與保守型和普通型各樣本分值距離之和最小的值為64.67,與普通型和激進型樣本分值距離之和的最小的值為181.20,如圖7中的虛線所示。因此,將各駕駛風格閾值是設置為:S<64.67為保守型,64.67≤S<181.20普通型,S≥181.20為激進型駕駛?cè)恕?/p>
圖7 訓練集駕駛?cè)朔种捣植记闆rFig.7 Drivers'scoring of training set
為了測試與驗證本研究所提出的基于精簡車頭時距特征駕駛風格分類方法的識別效果,本研究利用樣本集中其余14名駕駛?cè)说膶嶒灁?shù)據(jù)作為模型的測試集。利用上述同樣方法對測試集的駕駛?cè)藬?shù)據(jù)進行分析,計算出14名駕駛?cè)说姆种?,并根?jù)以上模型中設定的各駕駛風格閾值對測試集駕駛?cè)说鸟{駛風格進行識別。測試集駕駛?cè)说梅智闆r及識別結(jié)果見表7。
將識別結(jié)果與三分制量表法劃分的結(jié)果進行比較,驗證識別結(jié)果的準確率,見圖8中混淆矩陣。橫坐標為本研究所提方法的辨識結(jié)果,縱坐標三分制量表法的分類結(jié)果,即實際駕駛風格,橫縱坐標中的數(shù)字1,2,3分別表示保守型、普通型和激進型。由混淆矩陣可知,利用本研究提出的駕駛風格分類方法對14名駕駛?cè)诉M行識別,具體識別結(jié)果為:保守型、普通型、激進型駕駛?cè)巳藬?shù)分別為7,5,2名;與真實結(jié)果相比,本文所提方法誤將2名普通型駕駛?cè)俗R別成保守型駕駛?cè)?,總體來看,駕駛風格識別準確率為85.7%。其中,駕駛風格被識別錯誤的2名駕駛?cè)嗽趯<掖蚍謺r也出現(xiàn)了不同的意見,由表7可知,采用三分制量表法進行駕駛風格劃分時,2名專家認為是普通型,1名專家認為是保守型,最終標定為普通型,因此,這2名駕駛?cè)说鸟{駛風格不明顯,介于保守型與普通型之間。此外,模型訓練集與驗證樣本量較小,導致不同駕駛風格閾值設置時存在偏差,因此也會導致駕駛風格識別錯誤的情況。如果增加樣本數(shù)量有望進一步減小隨機誤差對識別精度的影響。
表7 測試集駕駛?cè)说梅智闆rTab.7 Drivers'scoring of test set
圖8 駕駛風格識別結(jié)果Fig.8 The result of driving style recognition.
本研究提出了1種基于車頭時距特性來辨識駕駛風格的方法,僅利用精簡的車頭時距指標,在車聯(lián)網(wǎng)環(huán)境下具有可實施性。采用三分制量表法辨識駕駛?cè)笋{駛風格,將駕駛?cè)说鸟{駛風格分為保守型、普通型和激進型3種,將駕駛?cè)说鸟{駛操作過程進行量化,采用模糊隸屬度方法構(gòu)建了駕駛?cè)笋{駛風格的分類閾值準則,得到不同駕駛風格的閾值,通過對測試集進行驗證,發(fā)現(xiàn)12名駕駛?cè)说鸟{駛風格被正確識別,2名駕駛?cè)说鸟{駛風格被錯誤識別,識別的準確率為85.7%。主要結(jié)論及貢獻如下。
1)激進型駕駛?cè)烁鼉A向于近距離跟車,且有將車頭時距向小調(diào)整的傾向;相反地,保守型駕駛?cè)烁鼉A向于遠距離跟車,且有將車頭時距向大調(diào)整的傾向。這一結(jié)論與之前研究中不同風格駕駛?cè)说鸟{駛習慣相符合[27]??梢?,本研究所提取的不同風格下典型駕駛模式能夠很好地反映不同風格駕駛?cè)说鸟{駛行為特征。
2)本研究創(chuàng)新性地提出了駕駛風格分類的閾值,并結(jié)合實例得出各駕駛風格閾值分別為:S<64.67為保守型,64.67≤S<181.20為普通型,S≥181.20為激進型駕駛?cè)恕?/p>
3)通過極精簡的單一指標-車頭時距來實現(xiàn)駕駛風格的識別。基于本研究提出的方法可以構(gòu)建一套實時、易用、有效的駕駛風格識別方法,將分類結(jié)果反饋給駕駛?cè)撕蛙囕d系統(tǒng),以實現(xiàn)個性化預警或個性化自動駕駛,使得輔助駕駛及自動駕駛更加符合個性化要求。
本研究在訓練集樣本選取時,采用分層抽樣的方法。由于總樣本量不大,分層抽樣時存在每層的抽樣比例不均衡、有偏差的現(xiàn)象;抽樣的結(jié)果可能會影響閾值設置結(jié)果,進而對駕駛風格的識別結(jié)果產(chǎn)生一定影響。如果樣本量夠大,能夠消除訓練集抽樣不均衡現(xiàn)象,使得不同駕駛風格的典型駕駛模式及閾值設置更具有科學性和可信性。