秦 杭,何洪文,韓 陌
(北京理工大學(xué) 機(jī)械與車輛學(xué)院 電動車輛工程國家重點實驗室,北京 100081)
隨著能源形勢和環(huán)境問題的日益嚴(yán)峻,電動汽車逐步取代燃油車成為發(fā)展趨勢。與傳統(tǒng)發(fā)動機(jī)相比,電機(jī)具有成本低、噪音小、效率高等優(yōu)點,同時具有良好的轉(zhuǎn)矩輸出特性,十分適合車用。由于電動機(jī)具有較高的工作效率和很寬的轉(zhuǎn)速范圍,一些電動車輛上可以不使用多擋位的變速箱。然而,單一的傳動比對電機(jī)的輸出轉(zhuǎn)矩和轉(zhuǎn)速要求更高,不利于控制電機(jī)的成本和體積,也不利于提高電機(jī)效率。為了同時滿足加速、爬坡工況下的高轉(zhuǎn)矩需求和車輛的最高行駛速度需求,同時提高總體效率、降低成本,很多電動車輛,尤其是作業(yè)車等大型車輛仍然需要變速箱來調(diào)整傳動系統(tǒng)的傳動比。
換擋規(guī)律[1-2]是變速器研究的熱點之一。如何根據(jù)駕駛員意圖、道路環(huán)境和車輛行駛工況制定合理的換擋策略[3-5],解決特殊工況下頻繁換擋和換擋失敗的問題,對提高整車的動力性和經(jīng)濟(jì)性具有重要意義。
傳統(tǒng)的換擋規(guī)律一般基于規(guī)則,考慮車速、節(jié)氣門開度和加速度等多個參數(shù)[6-8]選擇合適的換擋點。基于規(guī)則的換擋規(guī)律能保證車輛在特定工況下獲得最優(yōu)的動力性和經(jīng)濟(jì)性,是目前廣泛使用的換擋規(guī)律。然而,這類基于規(guī)則的換擋規(guī)律在復(fù)雜駕駛條件下可能無法精確滿足駕駛員的駕駛意圖。另外,傳統(tǒng)的換擋規(guī)律只考慮當(dāng)前車輛信息和駕駛員指令,計算的是局部最優(yōu)解。這種方法可以獲得最優(yōu)的靜態(tài)換擋點,卻忽略了潛在車速變化的影響。本文中提出一種基于模型預(yù)測控制的智能換擋策略,將短時歷史工況作為輸入,訓(xùn)練循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)預(yù)測未來短時間內(nèi)的工況;然后,在模型預(yù)測控制框架內(nèi)利用動態(tài)規(guī)劃算法(DP)計算預(yù)測時間域內(nèi)的最優(yōu)擋位序列用于車輛控制;最后,基于Matlab/Simulink平臺建立車輛模型,并以中國重型車輛道路行駛工況(CWTVC)為例,驗證了該換擋策略的有效性。
研究對象為包括兩擋變速箱在內(nèi)的傳動系統(tǒng)。驅(qū)動力由驅(qū)動電機(jī)提供,動力經(jīng)過變速箱和主減速器傳遞到驅(qū)動輪上。整車主要參數(shù)如表1所示。
整車模型基于縱向車輛動力學(xué)模型[9]。車輛行駛阻力包括空氣阻力、滾動阻力、坡度阻力、加速阻力,如式(1)所示。
式中:Ttq為電機(jī)驅(qū)動力;i0為主減速比;ig為變速箱減速比;ηt為傳動系效率;r為車輪半徑;f為滾動阻力系數(shù);m為車輛質(zhì)量;α為道路坡度;ua為行駛車速;CD為空氣阻力系數(shù);A為迎風(fēng)面積;δ為汽車旋轉(zhuǎn)質(zhì)量換算系數(shù)。
模型預(yù)測換擋規(guī)律的整體算法流程如圖1所示。其核心部分主要有基于RNN的工況預(yù)測和基于DP的滾動優(yōu)化兩部分。
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[10]是一種處理序列數(shù)據(jù)的網(wǎng)絡(luò)結(jié)構(gòu)。它不僅考慮前一時刻的輸入,而且賦予網(wǎng)絡(luò)對之前內(nèi)容的一種“記憶”功能。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相比,循環(huán)神經(jīng)網(wǎng)絡(luò)增加了隱層之間的聯(lián)系,使得隱層特征不僅與當(dāng)前時刻有關(guān),也和之前的輸入有關(guān)。
循環(huán)神經(jīng)網(wǎng)絡(luò)可用來對未來工況預(yù)測。神經(jīng)網(wǎng)絡(luò)的輸入和輸出均為車速序列,且長度可能不同,因此解決這一問題需要Seq2Seq模型。
Seq2Seq的RNN網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。Seq2Seq是Encoder-Decoder結(jié)構(gòu)的網(wǎng)絡(luò),輸入和輸出都是序列。Encoder將一個可變長度的信號序列變?yōu)楣潭ㄩL度的向量,Decoder將這個固定長度的向量變成可變長度的目標(biāo)信號序列。RNN計算過程為:
圖2 RNN網(wǎng)絡(luò)結(jié)構(gòu)示意圖
使用過去10 s的車輛速度作為RNN的輸入,網(wǎng)絡(luò)輸出結(jié)果是未來5 s的速度。訓(xùn)練集由多種工況組成,測試集為中國重型車輛道路行駛工況(C-WTVC)。經(jīng)過分析和測試,最終選擇循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)元個數(shù)為20,激活函數(shù)為sigmoid函數(shù)。
為了對比模型的性能,需要建立一個深度神經(jīng)網(wǎng)絡(luò)(DNN)進(jìn)行對照。深度神經(jīng)網(wǎng)絡(luò)包含5層網(wǎng)絡(luò),每層包括20個神經(jīng)元,并同樣使用sigmoid函數(shù)作為激活函數(shù)。
RNN和DNN模型的結(jié)果如表2所示。分別計算了2種模型平均絕對誤差(MAE)和均方誤差(MSE),并比較了2種模型的訓(xùn)練時間。
表2 車速預(yù)測結(jié)果
仿真結(jié)果顯示:RNN模型的平均絕對誤差比DNN降低了10.98%,均方誤差降低了16.79%,說明循環(huán)神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果精度更高;時間消耗均在3 s左右,所需時間在同一個數(shù)量級,表明RNN模型能較好地預(yù)測車輛速度。
動態(tài)規(guī)劃[11-12]是一種全局優(yōu)化算法,可在有限范圍內(nèi)求得全局最優(yōu)解。在動態(tài)規(guī)劃前,首先需要確定系統(tǒng)的目標(biāo)函數(shù)、控制變量、狀態(tài)變量。目標(biāo)函數(shù)需要同時兼顧車輛的動力性、經(jīng)濟(jì)性和換擋頻率。由于動態(tài)規(guī)劃只選取求解域內(nèi)的可行解,所以當(dāng)車輛滿足工況動力性需求時,動態(tài)規(guī)劃求出的結(jié)果一定滿足動力性要求。因此在構(gòu)造目標(biāo)函數(shù)時只需考慮經(jīng)濟(jì)性和換擋頻率。取當(dāng)前車輛的SOC和擋位為狀態(tài)變量,換擋操作為控制變量,其取值范圍為[-1,0,1]。 -1表示降1擋,0表示維持當(dāng)前擋位,1表示升1擋。車輛單位步長的電耗可表示為:
式中:x1、x2分別為車輛當(dāng)前狀態(tài)下的SOC和擋位;uk為換擋操作;Δt為仿真步長;ΔSOC(x1,x2,uk)可由上一時刻的SOC和當(dāng)前車輛狀態(tài)計算得到,具體計算方法見式(4)。
式中:T為電機(jī)轉(zhuǎn)矩;ω為電機(jī)轉(zhuǎn)速;eff為傳動系統(tǒng)效率;Vbatt為動力電池電壓;Qbatt為電池最大容量。
為防止車輛為達(dá)到最優(yōu)經(jīng)濟(jì)性頻繁換擋,還需構(gòu)造換擋懲罰量函數(shù),給換擋操作一定的懲罰值,如式(5)所示。
式中λ為換擋懲罰因子。結(jié)合式(3)和式(5)得到代價函數(shù)為:
在動態(tài)規(guī)劃算法計算過程中,首先根據(jù)式(5)逆向計算得到各個時刻不同狀態(tài)離散點上的最優(yōu)控制解,再正向計算得到各個時刻相應(yīng)狀態(tài)點應(yīng)采取的最優(yōu)控制,進(jìn)而得到全局最優(yōu)控制解。
基于動態(tài)規(guī)劃算法的換擋控制策略在理論上能夠達(dá)到全局最優(yōu)的控制效果,但該算法需要在全局工況已知的條件下進(jìn)行,而在實際運行過程中無法獲取車輛的全局運行工況,因此無法實現(xiàn)實時控制。在模型預(yù)測控制框架下利用DP算法則可以解決實時性問題。
模型預(yù)測控制(MPC)[13-14]是一種先進(jìn)的控制理論,主要包括模型預(yù)測、滾動優(yōu)化和反饋校正3個步驟。
預(yù)測模型是指根據(jù)系統(tǒng)的歷史及當(dāng)前時刻的狀態(tài)信息、控制信息和外界環(huán)境信息對系統(tǒng)未來時刻的狀態(tài)進(jìn)行預(yù)測。與實際結(jié)果接近的預(yù)測可以幫助判斷狀態(tài)量的趨勢,從而根據(jù)代價函數(shù),通過滾動優(yōu)化過程獲得優(yōu)化后的控制量。
滾動優(yōu)化是指在獲得未來一段時域內(nèi)的狀態(tài)量預(yù)測值后,通過優(yōu)化算法求得該時域內(nèi)的最優(yōu)控制序列。由于對狀態(tài)量的預(yù)測存在誤差,且誤差會隨著時間的累計而增大,使長時間的控制序列無法達(dá)到實際最優(yōu),因此采用滾動優(yōu)化的方法,對每次預(yù)測優(yōu)化得到的最優(yōu)控制序列只采取第1個控制量,再根據(jù)下一次預(yù)測求取下一個控制量。
反饋校正指通過反饋信息檢測系統(tǒng)的實際狀態(tài),基于此狀態(tài)重新進(jìn)行工況預(yù)測進(jìn)行下一輪的模型預(yù)測控制。此步驟實現(xiàn)了模型預(yù)測控制的閉環(huán)控制,使得控制更加精確。
使用模型預(yù)測控制框架構(gòu)建換擋策略時,具體過程如下:
步驟1將車輛的歷史車速信息輸入所搭建的RNN預(yù)測模型,對未來短時域的車速進(jìn)行預(yù)測,獲得未來一段時間內(nèi)的車輛運行工況信息。
步驟2基于預(yù)測的工況信息,利用動態(tài)規(guī)劃的滾動優(yōu)化算法在預(yù)測時域內(nèi)進(jìn)行擋位尋優(yōu),得到最優(yōu)控制序列。
步驟3根據(jù)動態(tài)規(guī)劃滾動優(yōu)化算法尋得的優(yōu)化控制序列得到擋位、電機(jī)轉(zhuǎn)矩、電機(jī)轉(zhuǎn)速等部件的控制序列,只選取第1個控制量發(fā)送至電機(jī)、變速箱等控制器,整車響應(yīng)控制量改變運動狀態(tài)。
步驟4重復(fù)步驟1~3至完成整個行程。
仿真模型中,車速預(yù)測RNN模型是基于Tensorflow平臺搭建并訓(xùn)練的。對訓(xùn)練好的模型進(jìn)行參數(shù)提取并在Matlab中搭建相應(yīng)的預(yù)測模型進(jìn)行實際工況預(yù)測。在Matlab/Simulink中搭建車輛動力學(xué)模型,計算車輛的狀態(tài)。最后在Matlab中調(diào)用工況預(yù)測模型和車輛動力學(xué)模型,進(jìn)行動態(tài)規(guī)劃尋優(yōu),得到模型預(yù)測換擋策略。
采用C-WTVC工況對預(yù)測換擋策略的效果進(jìn)行檢驗。該工況行駛周期為1 800 s,最高車速約為87.8 km/h,具體工況如圖3所示。為使工況更加貼近實際情況,并考察預(yù)測換擋策略的實際效果,在工況前段分別加入坡度為3%的上坡和下坡,如表3所示。
圖3 C-WTVC工況
表3 道路坡度
圖4為RNN預(yù)測得到的車速結(jié)果。根據(jù)預(yù)測車速與實際車速的比較可以發(fā)現(xiàn),RNN可以較好地預(yù)測未來車速。當(dāng)車輛處于加速或減速階段時,預(yù)測效果最好;當(dāng)車速在一定范圍內(nèi)波動時也有一定預(yù)測效果;當(dāng)車速接近于0或很大時,預(yù)測效果較差,RNN預(yù)測車輛在靜止時會加速,高速時會減速。由于這兩種情況車輛不會采取換擋操作,所以對換擋優(yōu)化影響很小。綜上,RNN模型具有較好的效果,可用于模型預(yù)測換擋策略的車速預(yù)測部分。
圖4 RNN預(yù)測車速結(jié)果
車輛初始荷電狀態(tài)為0.85。作為對照,構(gòu)建基于規(guī)則的雙參數(shù)經(jīng)濟(jì)性換擋規(guī)律[15],如圖5所示。升擋線根據(jù)某車速和加速踏板開度下的整體傳動效率最高的擋位決定。為防止頻繁換擋,降擋線車速比升擋線車速低4~8 km/h,且升、降擋速度差隨踏板開度增加而增加。該換擋規(guī)律考慮車輛加速踏板開度和車速這2個參數(shù),簡單實用,具有良好的經(jīng)濟(jì)性,被廣泛應(yīng)用于車輛中。在CWTVC工況下,分別對DP、模型預(yù)測換擋規(guī)律和經(jīng)濟(jì)性規(guī)則換擋規(guī)律進(jìn)行仿真。
圖6顯示了雙參數(shù)經(jīng)濟(jì)性換擋規(guī)律和基于模型預(yù)測、動態(tài)規(guī)劃換擋策略的SOC曲線。3種換擋策略結(jié)果中,SOC下降趨勢一致,最終SOC接近。其中,雙參數(shù)經(jīng)濟(jì)性換擋規(guī)律的能耗最高,而動態(tài)規(guī)劃得到的換擋策略能耗最低。
圖5 雙參數(shù)經(jīng)濟(jì)性換擋規(guī)律
圖6 不同換擋策略SOC曲線
仿真結(jié)果見表4。模型預(yù)測換擋、雙參數(shù)經(jīng)濟(jì)性和動態(tài)規(guī)劃換擋策略的能耗分別為76.69、78.21和76.25。結(jié)果表明:與基于規(guī)則的換擋規(guī)律相比,MPC換擋策略在一個完整工況內(nèi)所需的能量減少了1.9%,即1.52 kW·h/100 km。DP是一種全局優(yōu)化算法,求得的是全局最優(yōu)解,因而能耗最少。對于經(jīng)濟(jì)性換擋規(guī)律而言,為避免不必要的頻繁換擋,必須由升擋線和降擋線兩條換擋線組成。在升擋線和降擋線之間有1個緩沖區(qū),因而升、降擋往往無法在真正的效率最高點,所以能耗比動態(tài)規(guī)劃得出的結(jié)果要高。MPC換擋策略不需要這樣的緩沖區(qū),經(jīng)濟(jì)性較規(guī)則換擋策略更好。
表4 不同換擋規(guī)律能量消耗結(jié)果
與此同時,模型預(yù)測換擋策略在整個行駛周期內(nèi)換擋23次,雙參數(shù)經(jīng)濟(jì)換擋規(guī)律的換擋頻率為32。傳統(tǒng)的換擋規(guī)律沒有考慮未來工況變化對當(dāng)前換擋決策的影響。當(dāng)車輛速度接近換擋點時,為達(dá)到當(dāng)前時刻的最優(yōu)經(jīng)濟(jì)性,雙參數(shù)換擋規(guī)律可能頻繁換擋,因而犧牲了舒適性。即使換擋線之間存在緩沖區(qū),當(dāng)車速在這一范圍內(nèi)頻繁波動時,依然有可能頻繁換擋。而MPC換擋策略考慮了未來車速的變化趨勢,能有效防止頻繁換擋,從而保證較好的經(jīng)濟(jì)性。值得注意的是,結(jié)果顯示MPC換擋策略的換擋頻率甚至小于DP得到的結(jié)果,這并沒有說明MPC的結(jié)果優(yōu)于DP。本文中換擋規(guī)律評價標(biāo)準(zhǔn)包含換擋頻率和能耗兩方面,雖然MPC的換擋頻率較DP更低,但其能耗更高。事實上,RNN預(yù)測的車速會與實際車速有一定偏差,導(dǎo)致MPC策略認(rèn)為某些時刻車輛應(yīng)該維持當(dāng)前擋位,而預(yù)先知道全局工況的DP則求解出最優(yōu)決策為換擋。
圖7、8分別是雙參數(shù)經(jīng)濟(jì)性換擋規(guī)律和MPC換擋策略在C_WTVC工況下的擋位和車速的結(jié)果??梢悦黠@看出,基于規(guī)則的換擋規(guī)律相比MPC換擋策略換擋更加頻繁。這是因為,一方面,當(dāng)車輛低速行駛時,如果RNN預(yù)測結(jié)果顯示車速在未來不會長時間高于換擋點,那么MPC換擋策略會讓車輛更不傾向于升擋;另一方面,如果RNN預(yù)測得到的未來車速將僅短暫時間低于換擋點,并且當(dāng)前擋位滿足車輛的動力需求,則車輛不會降擋。這樣,MPC換擋策略在保證經(jīng)濟(jì)效益的同時大大降低了復(fù)雜工況下的換擋頻率,從而減少了換擋機(jī)構(gòu)的磨損,降低了換擋過程的能耗,提高了整車的平順性。
圖7 雙參數(shù)經(jīng)濟(jì)換擋規(guī)律擋位與車速
圖8 MPC換擋策略擋位與車速
本文中建立了基于RNN的車速預(yù)測模型。與DNN 模型相比,MAE和MSE分別降低了10.98%和16.79%。在模型預(yù)測框架下,以RNN模型預(yù)測的短時工況為預(yù)測結(jié)果,在預(yù)測時域內(nèi)利用DP算法對擋位進(jìn)行優(yōu)化。仿真結(jié)果顯示,整車能耗較經(jīng)濟(jì)性換擋規(guī)律下降了1.9%,同時換擋頻率顯著下降。結(jié)果表明:該模型預(yù)測換擋策略可實時為電動車輛選擇最佳擋位,提高純電動汽車的經(jīng)濟(jì)性和乘坐舒適性。