陸一賓,沈鈺博,王 伊,郭 倫
基于車輛行駛數(shù)據(jù)的駕駛風(fēng)格識(shí)別
陸一賓,沈鈺博,王 伊,郭 倫
(長(zhǎng)安大學(xué) 汽車學(xué)院,陜西 西安 710064)
車輛駕駛員駕駛風(fēng)格對(duì)于汽車的燃油經(jīng)濟(jì)性和行駛安全性有重要的影響。文章就基于車輛行駛數(shù)據(jù)在駕駛風(fēng)格識(shí)別方面的研究進(jìn)行綜述,首先介紹了駕駛員駕駛風(fēng)格識(shí)別的基本流程,接著論述不同學(xué)者在駕駛風(fēng)格識(shí)別方面使用的算法模型,包括支持向量機(jī)(SVM)算法、反向傳播(BP)神經(jīng)網(wǎng)絡(luò)算法、隨機(jī)森林模型算法,然后基于實(shí)際車輛行駛數(shù)據(jù),利用不同駕駛風(fēng)格識(shí)別模型對(duì)其進(jìn)行實(shí)現(xiàn)分析,最后對(duì)駕駛員駕駛風(fēng)格識(shí)別的研究工作進(jìn)行了展望。
駕駛風(fēng)格識(shí)別;行駛數(shù)據(jù);識(shí)別模型;實(shí)例分析
駕駛風(fēng)格是指駕駛員在車輛行駛過程中操縱車輛的駕駛行為習(xí)慣,其與車輛的燃油經(jīng)濟(jì)性、駕駛舒適性及行駛安全性密切相關(guān),例如駕駛風(fēng)格激進(jìn)的駕駛員在行駛的過程中更容易頻繁大幅度地加減速,這將帶來更高的燃油消耗和安全風(fēng)險(xiǎn)以及較差的乘坐體驗(yàn)。通過對(duì)駕駛員行車過程中駕駛行為特征和車輛行駛數(shù)據(jù)分析,可以動(dòng)態(tài)識(shí)別駕駛員所表現(xiàn)的駕駛風(fēng)格,對(duì)于改善車輛行駛的舒適性和安全性,實(shí)現(xiàn)駕駛員安全駕駛具有重要意義。
早期對(duì)于駕駛風(fēng)格的研究主要采用問卷調(diào)查的方法,其容易受到外界環(huán)境的影響,結(jié)果的準(zhǔn)確性和可靠性無法保證。隨著數(shù)據(jù)處理技術(shù)的發(fā)展,眾多學(xué)者基于采集的實(shí)車行駛數(shù)據(jù)或模擬器運(yùn)行數(shù)據(jù),通過對(duì)數(shù)據(jù)的分析來實(shí)現(xiàn)對(duì)駕駛風(fēng)格識(shí)別。本文重點(diǎn)對(duì)主要的駕駛風(fēng)格識(shí)別算法模型進(jìn)行概述,并基于實(shí)際的車輛行駛數(shù)據(jù),對(duì)上述算法模型進(jìn)行實(shí)現(xiàn)分析。
基于車輛行駛數(shù)據(jù)實(shí)現(xiàn)駕駛風(fēng)格識(shí)別的流程可以分為以下三部分,駕駛風(fēng)格識(shí)別流程如圖1所示。
圖1 駕駛風(fēng)格識(shí)別流程圖
1)構(gòu)造駕駛行為特征參數(shù):在行駛數(shù)據(jù)預(yù)處理基礎(chǔ)上構(gòu)造表征駕駛行為的特征參數(shù),是后續(xù)進(jìn)行駕駛風(fēng)格分類的基礎(chǔ);
2)駕駛風(fēng)格分類:對(duì)駕駛風(fēng)格識(shí)別前需要對(duì)駕駛風(fēng)格進(jìn)行聚類,為避免駕駛行為特征參數(shù)過多而影響駕駛風(fēng)格聚類的效果和速度,聚類前需要對(duì)其進(jìn)行降維處理;
3)駕駛風(fēng)格識(shí)別:在駕駛風(fēng)格聚類的基礎(chǔ)上建立不同的風(fēng)格識(shí)別模型,比較其識(shí)別的精度,最終選擇合適的風(fēng)格識(shí)別模型實(shí)現(xiàn)駕駛風(fēng)格的動(dòng)態(tài)識(shí)別。
駕駛風(fēng)格分類在駕駛風(fēng)格識(shí)別過程中較為關(guān)鍵,分類的結(jié)果直接影響對(duì)駕駛員行駛狀態(tài)的判別。許多學(xué)者對(duì)用于駕駛風(fēng)格分類的降維和聚類算法進(jìn)行了深入研究,王旭等[1]利用主成分分析法將選取的18個(gè)駕駛行為特征參數(shù)降維成6個(gè)主成分,并利用K-means++算法將駕駛風(fēng)格聚類成平靜型、一般型和激進(jìn)型三類;王科銀等[2]運(yùn)用因子分析法與K-means算法將駕駛風(fēng)格分為謹(jǐn)慎型、一般型和激進(jìn)型三類;李倫[3]通過t-SNE降維算法和高斯混合模型(Gaussian Mixture Model, GMM)算法對(duì)挑選的15個(gè)特征參數(shù)進(jìn)行處理,最終將駕駛風(fēng)格分為保守型、普通型和激進(jìn)型三類;LIU等[4]利用主成分分析法和模糊C均值聚類算法將駕駛風(fēng)格分為通用型、保守型和激進(jìn)型三類,其分類的成功率達(dá)92.16%。
在駕駛風(fēng)格的識(shí)別上,許多學(xué)者采用了不同的算法模型對(duì)其進(jìn)行識(shí)別。對(duì)于不同的車輛數(shù)據(jù)類型,不同算法的識(shí)別精度存在差異,因而選擇合適的識(shí)別算法模型對(duì)于實(shí)現(xiàn)車輛動(dòng)態(tài)安全節(jié)能駕駛提醒至關(guān)重要。常用的駕駛風(fēng)格識(shí)別算法模型主要有支持向量機(jī)(Support Vector Machine, SVM)算法、反向傳播(Back Propagation, BP)神經(jīng)網(wǎng)絡(luò)算法、隨機(jī)森林模型算法。
SVM算法是一種有監(jiān)督的機(jī)器學(xué)習(xí)算法。該算法泛化能力較強(qiáng),其可以將線性不可分的數(shù)據(jù)映射到高維空間使其線性可分,并在高維空間中構(gòu)造最佳超平面完成分類。因其在處理小樣本、非線性和高維空間的分類中表現(xiàn)較好的效果,常用于駕駛風(fēng)格的識(shí)別中。
郝景賢等[5]在對(duì)混合動(dòng)力汽車駕駛風(fēng)格分類的基礎(chǔ)上,利用支持向量機(jī)算法對(duì)駕駛風(fēng)格進(jìn)行識(shí)別,無論是加速還是減速下的駕駛風(fēng)格或是加減速下的駕駛風(fēng)格,該算法都能保證至少90%的準(zhǔn)確率。劉冠穎等[6]采用一對(duì)多支持向量機(jī)算法(OvR-SVM)對(duì)駕駛風(fēng)格進(jìn)行識(shí)別,通過不斷增加訓(xùn)練集樣本的數(shù)量,測(cè)試集的識(shí)別精度不斷升高,最終識(shí)別的準(zhǔn)確率高達(dá)99.96%。王科銀等[2]對(duì)聚類后的駕駛風(fēng)格分別采用支持向量機(jī)模型和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)模型進(jìn)行識(shí)別,無論是否對(duì)樣本進(jìn)行降維處理,支持向量機(jī)模型的識(shí)別精度始終高于ANN模型,且降維后SVM模型的識(shí)別精度為98.13%。
人工神經(jīng)網(wǎng)絡(luò)模型是一種常用的機(jī)器學(xué)習(xí)模型,由于其可以實(shí)現(xiàn)從輸入到輸出的高度非線性映射,常用于模式識(shí)別、系統(tǒng)辨識(shí)、信號(hào)處理等領(lǐng)域。而BP神經(jīng)網(wǎng)絡(luò)作為最常用的神經(jīng)網(wǎng)絡(luò)算法,因其具有良好的并行性、高度的非線性、良好的容錯(cuò)能力,其魯棒性較好不易受噪聲的影響,且分類準(zhǔn)確率較高,因而適合處理駕駛風(fēng)格識(shí)別問題。
張雅麗等[7]構(gòu)建了一個(gè)3層BP神經(jīng)網(wǎng)絡(luò)模型,通過比較不同神經(jīng)元節(jié)點(diǎn)個(gè)數(shù)、傳遞函數(shù)和訓(xùn)練函數(shù)類型以及網(wǎng)絡(luò)學(xué)習(xí)率對(duì)預(yù)測(cè)誤差的影響,選擇最優(yōu)的模型參數(shù)對(duì)公交車進(jìn)出站三種駕駛風(fēng)格進(jìn)行識(shí)別,整體的平均識(shí)別率為93.52%。吳麗寧[8]利用搭建的三層BP神經(jīng)網(wǎng)絡(luò)模型,將70%的樣本作為訓(xùn)練集,30%的樣本作為測(cè)試集,能夠較好的實(shí)現(xiàn)對(duì)卡車駕駛員駕駛風(fēng)格的識(shí)別。李立治等[9]借助神經(jīng)網(wǎng)絡(luò)模型對(duì)隨機(jī)挑選的5組駕駛風(fēng)格樣本進(jìn)行識(shí)別,結(jié)果顯示所有樣本均能被準(zhǔn)確識(shí)別。
隨機(jī)森林模型是基于多棵決策樹組合構(gòu)成的機(jī)器學(xué)習(xí)模型,其原理是通過每棵決策樹分類模型對(duì)訓(xùn)練樣本進(jìn)行投票,將票數(shù)最高的標(biāo)簽作為最終的分類結(jié)果。該模型適合處理高維度數(shù)據(jù),對(duì)于異常值具有較好的容忍度,且能輸出不同特征之間的重要性比值。
劉迪等[10]利用隨機(jī)森林模型分別對(duì)兩種不同工況下的駕駛風(fēng)格進(jìn)行交叉驗(yàn)證,辨識(shí)的準(zhǔn)確率達(dá)90.9%。趙韓等[11]驗(yàn)證了隨機(jī)森林模型在辨識(shí)不同車流密度條件下不同的駕駛風(fēng)格均具有較好的精確度,為后續(xù)進(jìn)一步優(yōu)化混合動(dòng)力汽車的能量管理策略奠定了基礎(chǔ)。朱冰等[12]基于基尼指數(shù)分析變量重要性的基礎(chǔ)上構(gòu)建了一種基于變量重要性的隨機(jī)森林模型,該模型不僅整體識(shí)別精度高達(dá)97.1%且相較原本的模型算法更加簡(jiǎn)單易行。
由于采集的公交車實(shí)際行駛數(shù)據(jù)包含的數(shù)據(jù)項(xiàng)較多,對(duì)其進(jìn)行篩選過濾得到與駕駛行為有關(guān)的數(shù)據(jù)集。在對(duì)篩選后的數(shù)據(jù)集進(jìn)行異常值去除、缺失值補(bǔ)充等預(yù)處理工作后,以各個(gè)公交車站點(diǎn)為依據(jù)劃分運(yùn)動(dòng)學(xué)片段,并計(jì)算各運(yùn)動(dòng)學(xué)片段的駕駛行為特征參數(shù)。
本次共劃分721個(gè)運(yùn)動(dòng)學(xué)片段,并挑選計(jì)算7個(gè)駕駛行為特征參數(shù),分別為速度均值、速度標(biāo)準(zhǔn)差、最大速度,加速度均值、加速度標(biāo)準(zhǔn)差、減速度均值、減速度標(biāo)準(zhǔn)差。速度標(biāo)準(zhǔn)差的計(jì)算公式如下,加速度標(biāo)準(zhǔn)差和減速度標(biāo)準(zhǔn)差的計(jì)算同理。
式中,為運(yùn)動(dòng)學(xué)片段中的樣本總數(shù)。加減速度標(biāo)準(zhǔn)差均可以反映駕駛員駕駛風(fēng)格的激烈程度,其數(shù)值越大表明駕駛員駕駛風(fēng)格越激進(jìn)。
利用主成分分析法對(duì)運(yùn)動(dòng)學(xué)片段的駕駛行為特征進(jìn)行降維處理,最終前2個(gè)主成分累計(jì)貢獻(xiàn)率為79.93%,且其特征值均大于1,可用其代表大部分特征參數(shù)的信息,各主成分貢獻(xiàn)率如圖2所示。對(duì)降維處理后的數(shù)據(jù)進(jìn)行K-means聚類,經(jīng)對(duì)比發(fā)現(xiàn)聚類成3類的效果最好,分別命名為保守型、一般型和激進(jìn)型,其中保守型片段個(gè)數(shù)為274個(gè)占比38%、一般型片段個(gè)數(shù)為156個(gè)占比21.64%,激進(jìn)型片段個(gè)數(shù)為291個(gè)占比40.36%。聚類結(jié)果如表1所示。
圖2 各主成分貢獻(xiàn)率
表1 聚類結(jié)果
類別片段個(gè)數(shù)占比/% 保守型27438 一般型15621.64 激進(jìn)型29140.36
在駕駛風(fēng)格分類的基礎(chǔ)上,分別建立SVM模型、BP神經(jīng)網(wǎng)絡(luò)模型、隨機(jī)森林模型。將80%的駕駛風(fēng)格樣本作為訓(xùn)練集,剩余20%的駕駛風(fēng)格樣本作為測(cè)試集,以均方根誤差、平均絕對(duì)誤差、運(yùn)行時(shí)間作為各模型的識(shí)別指標(biāo),各模型指標(biāo)對(duì)比如表2所示,不同模型訓(xùn)練集與測(cè)試集的識(shí)別效果如表3所示。
表2 識(shí)別指標(biāo)對(duì)比
模型均方根誤差平均絕對(duì)誤差運(yùn)行時(shí)間/s SVM0.238 20.042 52.900 BP神經(jīng)網(wǎng)絡(luò)0.206 30.028 43.621 隨機(jī)森林0.252 60.049 64.303
表3 識(shí)別準(zhǔn)確率對(duì)比
模型訓(xùn)練集/%測(cè)試集/% SVM96.2196.45 BP神經(jīng)網(wǎng)絡(luò)98.6097.87 隨機(jī)森林10095.76
從表2和表3可知,上述三種模型均能實(shí)現(xiàn)對(duì)駕駛風(fēng)格的識(shí)別,且識(shí)別精度均較高于95%。各模型測(cè)試集的識(shí)別誤差較小,識(shí)別速度較快,能夠快速實(shí)現(xiàn)對(duì)駕駛員駕駛風(fēng)格的識(shí)別。三種識(shí)別模型中基于BP神經(jīng)網(wǎng)絡(luò)的識(shí)別模型在測(cè)試集的識(shí)別精度、識(shí)別誤差上均優(yōu)于支持向量機(jī)模型和隨機(jī)森林模型,識(shí)別精度高達(dá)97.87%,且其訓(xùn)練集的識(shí)別效果和運(yùn)行時(shí)間均居于其他兩個(gè)模型之間,因而該方法較其余兩種模型相比更適于該公交車駕駛員駕駛風(fēng)格的識(shí)別。
本文從駕駛員駕駛風(fēng)格的識(shí)別流程、常用的識(shí)別算法模型、模型的實(shí)現(xiàn)分析三個(gè)方面介紹基于車輛行駛數(shù)據(jù)的駕駛風(fēng)格識(shí)別分析,為研究駕駛風(fēng)格的識(shí)別提供思路。
車輛行駛數(shù)據(jù)的獲取是進(jìn)行駕駛風(fēng)格研究的前提與基礎(chǔ),未來可結(jié)合問卷調(diào)查的方式收集數(shù)據(jù),同時(shí)考慮外界環(huán)境因素的影響,通過對(duì)更加全面數(shù)據(jù)信息的分析訓(xùn)練,可以實(shí)現(xiàn)各種交通場(chǎng)景下駕駛風(fēng)格的實(shí)時(shí)準(zhǔn)確預(yù)測(cè),實(shí)現(xiàn)駕駛員的安全節(jié)能駕駛。
[1] 王旭,馬菲,廖小棱,等.基于多分類監(jiān)督學(xué)習(xí)的駕駛 風(fēng)格特征指標(biāo)篩選[J].交通信息與安全,2022,40(1): 162-168.
[2] 王科銀,楊亞會(huì),王思山,等.駕駛風(fēng)格聚類與識(shí)別研究[J].湖北汽車工業(yè)學(xué)院學(xué)報(bào),2021,35(3):1-6,10.
[3] 李倫.基于純電動(dòng)汽車高頻運(yùn)行數(shù)據(jù)的駕駛行為研究[D].濟(jì)南:山東大學(xué),2021.
[4] LIU Y G,WANG J M,ZHAO P,et al.Research on Classification and Recognition of Driving Styles Based on Feature Engineering[J].IEEE Access,2019,7 (9):89245-89255.
[5] 郝景賢,余卓平,趙治國(guó),等.混合動(dòng)力汽車駕駛風(fēng)格識(shí)別的研究[J].汽車工程,2017,39(12):1444-1450.
[6] 劉冠穎,郭鳳香,申江衛(wèi),等.基于數(shù)據(jù)特征的駕駛風(fēng)格分類與識(shí)別方法研究[J].昆明理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,48(3):165-173.
[7] 張雅麗,付銳,袁偉,等.考慮能耗的進(jìn)出站駕駛風(fēng)格分類及識(shí)別模型[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2023,53 (7):2029-2042.
[8] 吳麗寧.基于駕駛風(fēng)格分類的卡車油耗預(yù)測(cè)[D].西安:長(zhǎng)安大學(xué),2020.
[9] 李立治,楊建軍,劉雙喜,等.國(guó)內(nèi)人群的駕駛風(fēng)格分類及識(shí)別方法研究[J].重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)), 2019,33(11):33-40.
[10] 劉迪,鄭建明,覃斌,等.基于自然駕駛場(chǎng)景大數(shù)據(jù)的駕駛風(fēng)格研究[J].汽車技術(shù),2022,564(9):36-42.
[11] 趙韓,劉浩,邱明明,等.考慮車流密度影響的駕駛風(fēng)格識(shí)別方法研究[J].汽車工程,2020,42(12):1718-1727.
[12] 朱冰,李偉男,汪震,等.基于隨機(jī)森林的駕駛?cè)笋{駛習(xí)性辨識(shí)策略[J].汽車工程,2019,41(2):213-218,224.
Driving Style Recognition Based on Vehicle Driving Data
LU Yibin, SHEN Yubo, WANG Yi, GUO Lun
( School of Automotive, Chang'an University, Xi'an 710064, China )
Driver's driving style is an important impact on fuel economy and driving safety. This paper summarizes the research on driving style recognition based on vehicle driving data. Firstly, it introduces the basic process of driver's driving style recognition, and then discusses the algorithm models used by different scholars in driving style recognition, including support vector machine (SVM) algorithm, back propagation (BP) neural network algorithm and random forest model algorithm. Then, based on the actual vehicle driving data, different driving style recognition models are used to realize the analysis, and finally the research work of driver driving style recognition is prospected.
Driving style recognition; Driving data; Recognition model; Case analysis
U471
A
1671-7988(2023)18-194-04
陸一賓(1999-),男,碩士研究生,研究方向?yàn)轳{駛行為與生態(tài)駕駛,E-mail:1922831854@qq.com。
10.16638/j.cnki.1671-7988.2023.018.038