劉海江,章曉棟
(同濟大學 機械與能源工程學院,上海 201804)
整車駕駛性是評價汽車縱向動力學性能最重要的屬性之一,反映了駕駛員在汽車縱向行駛過程中人車交互作用下的感覺[1]。其體現(xiàn)了汽車產品的市場定位與品牌基因,是影響消費者購買意愿,提升產品競爭力的關鍵。整車駕駛性具體表現(xiàn)為在車輛駕駛過程中出現(xiàn)的起步熄火、動力不足、加速響應緩慢等現(xiàn)象,這些現(xiàn)象均隱含在整車起步過程、加速過程、瞬時給油/斷油過程等駕駛工況中,由實時采集得到的汽車性能參數(shù)數(shù)據形態(tài)進行反映。因此,從客觀數(shù)據的角度出發(fā),通過定義整車各駕駛工況的特征參數(shù),從而實現(xiàn)工況的自動精確識別,是整個駕駛性評價過程中必不可少的工作,也是提高整車駕駛性開發(fā)效率的一大措施。
國外相關企業(yè)在針對整車駕駛性客觀指標體系的構建及評價方法方面已展開了一定的研究。CHANG等[2]建立了駕駛人員自身的振動感覺與車輛主觀評估之間的映射關系,使用神經網絡法構建了一套能量函數(shù)及校準方法來客觀地評估車輛駕駛性。HAYAT等[3]在研究各個子系統(tǒng)對于車輛駕駛性影響的基礎上,采用動態(tài)建模、分析及仿真技術,分析了車輛在多種駕駛工況下的動態(tài)表現(xiàn)。但對于作為評價指標來源的駕駛工況片段數(shù)據的分類識別,還缺乏一定的研究。國內對于整車駕駛性客觀評價的研究還處于起步階段,而且當前根據車載數(shù)據進行的識別研究多集中于根據車載數(shù)據識別駕駛行為及狀態(tài)的優(yōu)劣上[4-6]。劉軍等[7]根據從轉角數(shù)據中提取的角度標準差和靜止百分比,建立了駕駛員疲勞狀態(tài)判別模型。郭孜政等[8]采用單因子方差分析提取駕駛危險狀態(tài)辨識主因子,基于貝葉斯判別構建了駕駛行為危險狀態(tài)辨識模型。李振龍等[9]通過方差分析和均值分析選取方向盤轉角作為識別特征,并分別采用KNN和SVM構建了醉酒駕駛狀態(tài)識別模型。胡月等[10]提出了與縱向加速度、沖擊度等相關的駕駛性客觀評價指標,初步建立了瞬態(tài)工況的駕駛性客觀評價方法。
本研究通過多傳感器信息融合,對比了整車在不同駕駛工況下的數(shù)據表現(xiàn),結合汽車試驗理論與專家知識,定義并提取了與工況識別分類相關聯(lián)的特征參數(shù)。在此基礎上,采用C4.5決策樹及樸素貝葉斯法進行混合駕駛工況分類模型的搭建,并通過測試驗證,對比評價了所建立的分類識別模型的效果。
研究過程中,首先采用駕駛性道路試驗,而非模擬仿真的方式,由駕駛員在規(guī)范的跑道內執(zhí)行各工況下的駕駛動作。與此同時,采用集成了多傳感器(如從IMU獲取縱向加速度信號,從OBD接口獲取CAN總線數(shù)據)的數(shù)據采集設備對多源車載信號進行同步采集,并通過數(shù)據清洗,提取與整車駕駛性緊密相關的6類信號的數(shù)據,包括加速踏板開度、縱向加速度、車速、發(fā)動機轉速、擋位及制動信號。
由于對駕駛工況的識別及分類無法通過單一數(shù)據源的分析實現(xiàn),所以采用信息融合技術,通過多傳感器數(shù)據的組合,從不同維度進行綜合分析。信息融合按數(shù)據抽象的不同層次,可分為像素(數(shù)據)層、特征層及決策層的融合[11-12]。為保留結果的精確性,本研究采用數(shù)據層目標特性融合的方式,針對駕駛工況自動識別的目標,對經預處理的原始數(shù)據進行特征提取與特征集構建。
圖1 車載多傳感器數(shù)據層融合
特征提取的首要工作,是對整車駕駛性開發(fā)與試驗過程中所出現(xiàn)的各駕駛工況從數(shù)據表現(xiàn)層面進行清晰的定義。通過研究整車起步過程、加速過程、瞬時給油過程的操作規(guī)范,結合對經預處理后傳感器數(shù)據的分析,完成各工況下相關特征參數(shù)的提取。具體如下:
(1)整車駕駛性試驗中,起步過程操作定義為:松開制動踏板后2 s內,在蠕行或車速為0的狀態(tài)下在1 s內踩下加速踏板至某一目標油門開度。
如圖2所示,基于專家知識對該過程的數(shù)據形態(tài)進行分析,得到起步過程的數(shù)據特征:①存在加速踏板開度變化率較高的觸發(fā)點,在1 s內觸發(fā)上升至大于20%。②無換擋事件發(fā)生。③加速踏板觸發(fā)前2 s內存在制動信號。④加速踏板觸發(fā)前車速為0或處于蠕行車速。由此提煉,得到特征參數(shù)為:加速踏板變化率;油門觸發(fā)前車速;擋位變化;制動信號。
(2)整車駕駛性試驗中,加速過程操作定義為:固定擋位下,緩慢地(5~7 s)將油門開度從0均勻踩到目標值后結束,并且整車初始狀態(tài)為蠕行狀態(tài)。
如圖3所示,同理,得到穩(wěn)車速瞬間給油過程的數(shù)據特征:①在>2 s內加速踏板均勻上升至一目標值(>30%)。②無擋位變化。③加速踏板觸發(fā)前車速處于蠕行車速。由此提取特征參數(shù)為:加速踏板變化率;油門觸發(fā)前車速;擋位信號。
(3)穩(wěn)車速瞬間給油過程操作:將車速穩(wěn)定至目標車速(±1 km/h)3 s后,執(zhí)行瞬間的(<0.2 s)目標油門開度輸入。
圖2 整車起步工況預處理后數(shù)據
圖3 加速工況預處理后數(shù)據
如圖4所示,穩(wěn)車速瞬間給油過程的數(shù)據特征為:①存在加速踏板開度變化率極高的觸發(fā)點,在0.2 s內觸發(fā)上升至大于30%。②數(shù)據窗內無制動信號。③加速踏板觸發(fā)前3 s內車速處于穩(wěn)定的目標值。由此得到特征參數(shù)為:加速踏板變化率;油門觸發(fā)前車速;制動信號。
圖4 穩(wěn)車速瞬間給油工況預處理后數(shù)據
結合上述分析,將各工況下描述的特征參數(shù)進行提取與組合。通過定義統(tǒng)一的數(shù)據窗Ri=[油門觸發(fā)3 s前時刻,油門觸發(fā)5 s后時刻],可得組合后的特征屬性集為:
式中:xi1為加速踏板變化率;xi2為油門觸發(fā)前車速;xi3為擋位變化;xi4為制動信號。其中,xi1和xi2為連續(xù)型特征參數(shù),其它均為離散型特征參數(shù)。
將不同工況類別進行組合,得到輸出集為:
式中:yi1為起步;yi2為加速;yi3穩(wěn)速瞬間給油;yi4為其它。
將特征參數(shù)集與輸出集相結合,可得到樣本集合:
為簡化樣本集的表示,將集合中所含的自然語言進行歸一化處理:(1)“有”、“無”分別標記為“1”、“0”。(2)“起步”、“加速”、“穩(wěn)速瞬間給油”、“其它”分別標記為“1”、“2”、“3”、“4”。
根據上述建立的規(guī)則,基于某自主品牌車型大量駕駛性試驗數(shù)據建立樣本庫。從中提取部分樣本數(shù)據,經歸一化處理后見表1。
表1 樣本集示例
由于當前已建立的樣本數(shù)據庫仍屬于小規(guī)模數(shù)據集的范疇,為防止結果欠擬合,不采用神經網絡等常用于解決大數(shù)據量問題的分類/預測模型,而基于概率統(tǒng)計學理論,分別選用決策樹及貝葉斯法進行建模。
2.1.1 C4.5決策樹分類方法
C4.5算法屬于決策樹學習算法的一種,表示對象屬性和對象值之間的一種映射。其繼承了ID3算法的優(yōu)點,采用信息增益率來選擇特征屬性,克服了用信息增益選擇屬性時偏向選擇取值多的屬性的不足,且對于連續(xù)型的特征屬性,C4.5算法能夠完成對連續(xù)屬性的離散化處理。
2.1.2 基于C4.5算法的模型構建與測試驗證
(1)連續(xù)屬性離散化。C4.5決策樹算法采用二分法對連續(xù)屬性進行離散化處理[13]。對于本研究中的樣本數(shù)據集D,設連續(xù)屬性P(加速踏板變化率)在樣本集上出現(xiàn)的有序序列為{ p1, p2,..., pn},選擇在pi與pi+1間取候選劃分點ti = ( pi+ pi+1) /2( 1 < i< n ?1),可將樣本集劃分為2個子集。此時,通過改進后的信息增益公式計算每一候選劃分點:
可得到使信息增益最大化的最終劃分點(Ent(D)即為樣本集D的信息熵)。
(2)分類模型訓練與測試。將連續(xù)屬性離散化后所取得的最大信息增益值與其它離散屬性進行比較,選擇信息增益值最大的屬性作為C4.5決策樹的根結點進行劃分。依次類推,遞歸執(zhí)行節(jié)點劃分過程。
選取已有的84個訓練樣本及22個測試樣本構成樣本集,采用Python編寫決策樹學習算法對樣本集進行訓練與測試。訓練所得的C4.5決策樹模型如圖5所示。
圖5 混合駕駛工況C4.5決策樹分類模型
由圖5可知,決策樹深度為6,且“擋位變化”屬性的信息增益率最高。
對當前生成的決策樹進行保存,并輸入測試樣本對其進行驗證。采用混淆矩陣,對模型測試結果進行可視化,結果如圖6所示。
混淆矩陣中,列代表對具體工況的預測結果,行則代表的是每一樣本的真實類別。由圖6可知,測試集中存在5個起步工況,6個加速工況,8個穩(wěn)速瞬間給油工況及3個其它隨機工況。預測結果顯示,對于各工況的識別,分類準確率為(5+6+8+2)/(5+6+8+3)=95.5%,分類模型的準確率較高。只有一組真實類別為隨機工況的樣本被錯誤分類為起步工況。
圖6 分類混淆矩陣
2.2.1 樸素貝葉斯分類方法
貝葉斯概率及貝葉斯準則提供了一種利用已知值來估計未知概率的有效方法。其中,樸素貝葉斯方法基于對特征屬性獨立性的要求,在樣本數(shù)據較少的情況下仍然有效,且可以處理多類別問題。
2.2.2 模型構建與測試驗證
假設所提取的特征屬性集中各特征均相互獨立,則基于樸素貝葉斯方法,針對每個樣本 ,需要尋找使后驗概率P( yi|xi)最大的類別yi,即:
對于離散屬性,即“制動信號”、“擋位變化”,條件概率P( xi|c )計算式為:
式中:Dyi為樣本集中類別為yi的樣本集;Dyi,xi為在Dyi中屬性取值為xi的樣本集。
而對于連續(xù)屬性,即“油門變化率”,“油門觸發(fā)前車速”,采用概率密度函數(shù)對條件概率計算式進行變形:
式中:μyi,i,πσyi,i分別為輸出類別yi的樣本在特征參數(shù)xi上取值的均值與方差。
(2)分類模型訓練與測試。采用Python機器學習庫Scikit-learn輔助構建貝葉斯分類器,采用上一節(jié)中決策樹分類所使用的樣本集對貝葉斯分類器進行訓練。對于已構建完成的分類器,對22個測試樣本進行識別與分類,得到識別準確率情況見表2。
表2 樸素貝葉斯識別工況準確率
由表2可知,基于樸素貝葉斯構建的分類器在測試集上可達到19/22=86.4%的識別準確率,效果較好。
圖7 樸素貝葉斯駕駛工況分類器測試效果
為進一步對比兩者的識別效果,采用評估分類模型時常用的查準率及查全率[14-15]兩個指標進行分析,并最終計算模型的F1度量值[14-15]來進行綜合評估。查全率、查準率及F1測試值的公式如下所示:
表3 分類模型效果比較
針對兩模型在同一測試集上的分類效果,分別計算上述指標,結果見表3。
由表3可知,C4.5決策樹的識別準確率、查全率及F1值相較于樸素貝葉斯方法分別高出10.6%、10.2%及10.0%。因此,在對混合駕駛工況的識別與分類中,C4.5模型的識別性能要高于Naive Bayes,究其原因,是由于決策樹算法最適用于處理帶分界點的、由大量分類數(shù)據和數(shù)值數(shù)據共同組成的數(shù)據集[14]。而本研究中所提取的特征參數(shù)集,均符合上述特點,所以識別準確率極高。而在使用樸素貝葉斯方法進行分類的過程中,雖然做了條件獨立性假設,但由于各特征參數(shù)均為整車動力總成系統(tǒng)性能的反映,無法做到完全獨立,所以將對分類模型的識別效果產生一定影響。
在對不同汽車駕駛工況進行定義與描述的基礎上,將在時間序列數(shù)據中進行混合工況識別的問題抽象為分類判別問題。通過特征定義、數(shù)據融合、特征提取及特征組合,構建了用于分類模型訓練的樣本集?;谀匙灾髌放栖囆蛯嵻囋囼灅颖緮?shù)據,分別采用C4.5決策樹算法及概率統(tǒng)計學中的樸素貝葉斯方法構建了混合駕駛工況分類模型,并通過回代,對模型的識別準確率進行了測試。結果表明,基于C4.5決策樹及樸素貝葉斯構建的模型均可達到85%以上的識別準確率,且前者的識別準確率要優(yōu)于后者。然而,貝葉斯分類器支持增量式訓練,且接受大數(shù)據量訓練時具有較高的速度。隨著試驗數(shù)據的不斷獲取,樣本數(shù)量的不斷增加,在今后的應用過程中需綜合考慮。