譚穎琦, 許景懿, 熊光明, 李子睿, 陳慧巖
(1.北京理工大學(xué) 機(jī)械與車(chē)輛學(xué)院, 北京 100081; 2.北京工業(yè)職業(yè)技術(shù)學(xué)院 機(jī)械工程學(xué)院, 北京 100042)
現(xiàn)代傳感、電子控制、機(jī)器視覺(jué)和導(dǎo)航定位等先進(jìn)技術(shù)的飛速發(fā)展,推動(dòng)了地面無(wú)人機(jī)動(dòng)平臺(tái)的高速化進(jìn)程以及越野環(huán)境下行駛能力的迅速提升。履帶式無(wú)人車(chē)輛因其承載能力大、可靠性高、機(jī)動(dòng)性強(qiáng),是無(wú)人機(jī)動(dòng)平臺(tái)的重要分支[1]。面對(duì)世界新軍事變革和國(guó)內(nèi)軍事變革形勢(shì)需求,各種高電能武器迅速發(fā)展,履帶式混合動(dòng)力無(wú)人平臺(tái)因其優(yōu)良的特性[2],成為了地面無(wú)人機(jī)動(dòng)平臺(tái)的重要領(lǐng)域。履帶式混合動(dòng)力無(wú)人平臺(tái)可以在多種工作模式下適應(yīng)不同行駛工況的需求,獲得比傳統(tǒng)車(chē)輛更好的整車(chē)效率、燃油經(jīng)濟(jì)性和機(jī)動(dòng)性,對(duì)提升陸戰(zhàn)平臺(tái)整體性能、適應(yīng)未來(lái)作戰(zhàn)需求具有重要意義。
對(duì)于混合動(dòng)力無(wú)人平臺(tái)來(lái)說(shuō),能量管理技術(shù)是影響系統(tǒng)性能的關(guān)鍵因素。能量管理技術(shù)是根據(jù)混合動(dòng)力系統(tǒng)不同組件的狀態(tài)反饋和能量管理策略,實(shí)現(xiàn)不同動(dòng)力源之間的功率調(diào)控,滿(mǎn)足動(dòng)力性需求,將動(dòng)力電池的電池荷電狀態(tài)(SOC)維持在一定范圍,從而提高燃油經(jīng)濟(jì)性、降低燃油消耗并減少尾氣排放。由于履帶式無(wú)人車(chē)輛行駛路況復(fù)雜多變,所以對(duì)其能量管理策略的工況適應(yīng)性提出了更嚴(yán)苛的要求。因此,設(shè)計(jì)具有良好工況適應(yīng)性的能量管理策略是履帶式混合動(dòng)力無(wú)人平臺(tái)綜合性能的最關(guān)鍵任務(wù)。
隨著能量管理技術(shù)的迭代,根據(jù)實(shí)現(xiàn)方式的差異,混合動(dòng)力車(chē)輛能量管理策略主要分為基于規(guī)則的能量管理策略和基于優(yōu)化的能量管理策略[3-9]。其中,基于優(yōu)化的控制策略是近年來(lái)能量管理策略研究的主要方向,分全局最優(yōu)和實(shí)時(shí)優(yōu)化兩種策略。實(shí)時(shí)優(yōu)化控制策略不依賴(lài)于預(yù)先計(jì)算的控制策略,而是根據(jù)車(chē)輛信息在每個(gè)時(shí)間步長(zhǎng)內(nèi)執(zhí)行主要計(jì)算,以產(chǎn)生控制決策。近年來(lái)國(guó)內(nèi)外學(xué)者提出的實(shí)時(shí)優(yōu)化的能量管理策略,包括等效燃油最小[10-12]、機(jī)器學(xué)習(xí)[13-14]、模型預(yù)測(cè)控制(MPC)[5,7,15-17]等算法,能在線(xiàn)對(duì)能量管理決策進(jìn)行優(yōu)化計(jì)算。MPC是實(shí)時(shí)優(yōu)化的一種實(shí)現(xiàn)方法,通過(guò)不斷預(yù)測(cè)、求解、控制、更新形式實(shí)時(shí)優(yōu)化。
本文將以履帶式混合動(dòng)力無(wú)人平臺(tái)為研究對(duì)象,面向能量管理進(jìn)行混合動(dòng)力無(wú)人平臺(tái)建模,合理分配發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組及動(dòng)力電池組的輸出功率,在越野工況軌跡規(guī)劃設(shè)計(jì)上,提出基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)與長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)的預(yù)測(cè)模型,并設(shè)計(jì)MPC能量管理策略對(duì)混合動(dòng)力無(wú)人平臺(tái)進(jìn)行能量管理優(yōu)化。通過(guò)實(shí)車(chē)試驗(yàn),驗(yàn)證基于軌跡規(guī)劃的MPC策略的有效性,實(shí)現(xiàn)能量管理優(yōu)化目標(biāo),提高燃油經(jīng)濟(jì)性。本文研究?jī)?nèi)容結(jié)構(gòu)圖如圖1所示。
圖1 本文研究?jī)?nèi)容結(jié)構(gòu)圖
本文研究對(duì)象是履帶式混合動(dòng)力無(wú)人駕駛平臺(tái),如圖2所示。
圖2 履帶式混合動(dòng)力無(wú)人駕駛平臺(tái)
該履帶平臺(tái)是以我國(guó)63式履帶裝甲車(chē)為基礎(chǔ),保留履帶和側(cè)減速器,具有良好的動(dòng)力性能。文獻(xiàn)[18]對(duì)該履帶平臺(tái)進(jìn)行了無(wú)人化、電控化的改造,配備激光雷達(dá)、毫米波雷達(dá)、雙目攝像機(jī)、慣性導(dǎo)航單元、實(shí)時(shí)差分定位導(dǎo)航系統(tǒng)、CAN通訊網(wǎng)絡(luò)和工控機(jī)等器件組成,即具有完整的感知、規(guī)劃及運(yùn)動(dòng)控制系統(tǒng),能自主完成環(huán)境探測(cè)、避障、超車(chē)等無(wú)人駕駛車(chē)輛的能力。該車(chē)的基本結(jié)構(gòu)參數(shù)如表1所示。
表1 無(wú)人履帶平臺(tái)結(jié)構(gòu)相關(guān)參數(shù)
該平臺(tái)由原車(chē)的柴油機(jī)傳動(dòng)系統(tǒng)替換為串聯(lián)式混合動(dòng)力系統(tǒng)。圖3為該履帶式無(wú)人駕駛平臺(tái)的混合動(dòng)力系統(tǒng)結(jié)構(gòu)圖。
該平臺(tái)采用雙電機(jī)獨(dú)立驅(qū)動(dòng)方案,主要由發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組、動(dòng)力電池組、電力集成控制器、雙側(cè)驅(qū)動(dòng)電機(jī)、傳動(dòng)系統(tǒng)等組成。發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組與動(dòng)力電池組通過(guò)功率耦合與電力集成控制器為平臺(tái)各用電設(shè)備提供電能。發(fā)動(dòng)機(jī)不直接參與機(jī)械傳動(dòng),無(wú)機(jī)械能直接輸出到驅(qū)動(dòng)輪,僅帶動(dòng)發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組實(shí)現(xiàn)發(fā)電,從而提供穩(wěn)態(tài)功率,滿(mǎn)足平臺(tái)各部件功率需求,使動(dòng)力電池SOC維持在一定的范圍內(nèi),保持系統(tǒng)功率平衡。當(dāng)動(dòng)力電池SOC較低時(shí),發(fā)動(dòng)機(jī)為整車(chē)提供動(dòng)力并為動(dòng)力電池充電;當(dāng)動(dòng)力電池SOC較高時(shí),發(fā)動(dòng)機(jī)停止工作,由動(dòng)力電池提供整車(chē)需求功率。通過(guò)調(diào)控發(fā)動(dòng)機(jī)的工作狀態(tài)及工作點(diǎn)維持動(dòng)力電池電能平衡以提高燃油經(jīng)濟(jì)性。
對(duì)于本文研究的履帶式串聯(lián)混合動(dòng)力無(wú)人駕駛車(chē)輛,其混合動(dòng)力能量管理技術(shù)是決定混合動(dòng)力系統(tǒng)綜合性能的關(guān)鍵技術(shù)。能量管理策略的主要目標(biāo)是在滿(mǎn)足行駛動(dòng)力性的前提下,合理分配發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組或動(dòng)力電池組的輸出功率,從而提高燃油經(jīng)濟(jì)性、降低排放和提高電池壽命等性能指標(biāo)。
發(fā)動(dòng)機(jī)輸出軸與發(fā)電機(jī)輸入軸剛性連接,二者的轉(zhuǎn)速相等,考慮發(fā)動(dòng)機(jī)和發(fā)電機(jī)的轉(zhuǎn)動(dòng)慣量,發(fā)動(dòng)機(jī)和發(fā)電機(jī)的轉(zhuǎn)速、轉(zhuǎn)矩和輸出功率滿(mǎn)足:
(1)
式中:ne為發(fā)動(dòng)機(jī)轉(zhuǎn)速;ng為發(fā)電機(jī)輸入軸轉(zhuǎn)速;Te為發(fā)動(dòng)機(jī)轉(zhuǎn)矩;Tg為發(fā)電機(jī)輸入軸轉(zhuǎn)矩;Je和Jg分別為發(fā)動(dòng)機(jī)和發(fā)電機(jī)的轉(zhuǎn)動(dòng)慣量;Pg為發(fā)電機(jī)輸出到直流母線(xiàn)的電功率;ηg為發(fā)電機(jī)效率。
本文對(duì)履帶車(chē)輛動(dòng)力學(xué)進(jìn)行簡(jiǎn)化,忽略履帶的滑轉(zhuǎn)、滑移等運(yùn)動(dòng),根據(jù)車(chē)輛動(dòng)力學(xué)方程、滾動(dòng)阻力、空氣阻力、坡度阻力方程以及轉(zhuǎn)向阻力矩公式等可獲得串聯(lián)混合動(dòng)力車(chē)輛的需求功率為
(2)
發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組和動(dòng)力電池組共同提供能量,滿(mǎn)足整車(chē)功率需求,功率平衡方程為
Pg+Pb=Preq
(3)
式中:Pg為發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組輸出功率;Pb為動(dòng)力電池組的輸出功率。
以上介紹了履帶式混合動(dòng)力無(wú)人平臺(tái)的結(jié)構(gòu)和能量管理系統(tǒng)工作模式,并構(gòu)建了發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組模型、整車(chē)動(dòng)力學(xué)模型和功率平衡方程,為后續(xù)平臺(tái)的能量管理策略研究奠定了基礎(chǔ)。
本節(jié)通過(guò)分析混合動(dòng)力履帶車(chē)輛運(yùn)動(dòng)學(xué)模型,進(jìn)行局部軌跡規(guī)劃設(shè)計(jì),并基于軌跡規(guī)劃提出CNN-LSTM的預(yù)測(cè)方法,對(duì)工況進(jìn)行精準(zhǔn)預(yù)測(cè),采用MPC能量管理策略,在履帶式混合動(dòng)力無(wú)人車(chē)輛上實(shí)現(xiàn)能量管理優(yōu)化控制,其策略原理圖如圖4所示。
圖4 基于MPC能量管理策略
MPC是一種針對(duì)多變量難控問(wèn)題的先進(jìn)控制方法。MPC的基本思想是利用已有的模型、系統(tǒng)當(dāng)前的狀態(tài)和未來(lái)的控制量去預(yù)測(cè)系統(tǒng)未來(lái)的輸出,通過(guò)滾動(dòng)地求解帶約束優(yōu)化問(wèn)題來(lái)實(shí)現(xiàn)控制目的。
以某一時(shí)刻作為當(dāng)前時(shí)刻,預(yù)測(cè)系統(tǒng)在未來(lái)預(yù)測(cè)時(shí)域內(nèi)的系統(tǒng)動(dòng)態(tài)過(guò)程和狀態(tài)軌跡,計(jì)算控制時(shí)域內(nèi)使得系統(tǒng)優(yōu)化目標(biāo)取得最優(yōu)解的最優(yōu)控制序列,獲得預(yù)測(cè)控制軌跡,并將最優(yōu)控制序列的第1個(gè)控制量作用于系統(tǒng),并在下一個(gè)時(shí)刻,重復(fù)上述過(guò)程,如此滾動(dòng)完成帶約束的優(yōu)化問(wèn)題,實(shí)現(xiàn)對(duì)系統(tǒng)的持續(xù)控制[19]。MPC的優(yōu)化過(guò)程使得系統(tǒng)對(duì)于動(dòng)態(tài)特性的變化和不確定性的干擾具有較強(qiáng)的魯棒性。
基于MPC的能量管理策略包含三步:預(yù)測(cè)模型建立、實(shí)時(shí)滾動(dòng)優(yōu)化、反饋校正控制。本節(jié)將按這三個(gè)步驟設(shè)計(jì)MPC方法進(jìn)行混合動(dòng)力無(wú)人平臺(tái)能量管理實(shí)時(shí)優(yōu)化[20]。
建立預(yù)測(cè)模型是MPC方法的首要步驟,通過(guò)對(duì)未來(lái)信息的預(yù)測(cè),為實(shí)時(shí)滾動(dòng)優(yōu)化提供基礎(chǔ)。
本節(jié)將基于局部軌跡規(guī)劃提出CNN-LSTM工況預(yù)測(cè)方法實(shí)現(xiàn)對(duì)預(yù)測(cè)時(shí)域內(nèi)車(chē)速預(yù)測(cè),從而構(gòu)建能量管理最優(yōu)控制問(wèn)題。
2.1.1 局部軌跡規(guī)劃
本文采用3階螺旋線(xiàn)作為狀態(tài)采樣的曲線(xiàn)模型[21]獲得了一條運(yùn)動(dòng)可行的無(wú)碰撞路徑,并將控制輸入表示為3階螺旋線(xiàn),如(4)式所示:
k(s)=a+bs+cs2+ds3
(4)
式中:k(s)為曲線(xiàn)在一定長(zhǎng)度內(nèi)的曲率;a為起點(diǎn)曲率;b、c、d為擬合參數(shù)。
基于車(chē)輛運(yùn)動(dòng)學(xué)方程得到車(chē)輛弧長(zhǎng)運(yùn)動(dòng)學(xué)模型,如(5)式所示:
(5)
式中:x(s)、y(s)為某一長(zhǎng)度上路徑點(diǎn)的坐標(biāo);θ(s)為曲線(xiàn)的走向;x0、y0為起點(diǎn)的位置;s為弧長(zhǎng);θ0為起點(diǎn)的走向。
在以3階螺旋線(xiàn)為狀態(tài)空間采樣中,通過(guò)對(duì)(4)式和(5)式進(jìn)行積分求出最終路徑點(diǎn)坐標(biāo),再對(duì)路徑分割和選擇。
采用迭代式算法進(jìn)行速度規(guī)劃設(shè)計(jì)。通過(guò)對(duì)每個(gè)路徑點(diǎn)的速度施加橫向加速度約束、縱向加速度約束以及沖擊度約束,每個(gè)約束將以連續(xù)和有限差分形式表示,以生成速度剖面。通過(guò)迭代式算法修改速度剖面,在每次循環(huán)中考慮所有約束,調(diào)整當(dāng)前路點(diǎn)的速度以滿(mǎn)足約束值,直到速度剖面不改變,最終的速度剖面即為規(guī)劃速度序列。
2.1.2 CNN-LSTM預(yù)測(cè)方法
為了同時(shí)處理歷史速度序列和規(guī)劃速度序列,本文提出了基于CNN-LSTM的預(yù)測(cè)模型。
CNN是深度學(xué)習(xí)的代表算法之一,用于學(xué)習(xí)時(shí)間序列數(shù)據(jù)的局部趨勢(shì)特征。由于其局部連接和權(quán)值共享等特性,降低其處理多變量時(shí)間序列的網(wǎng)絡(luò)的復(fù)雜度,減少了訓(xùn)練參數(shù)的數(shù)量,在提高學(xué)習(xí)效率的同時(shí),也提高了魯棒性和容錯(cuò)能力。但是時(shí)間序列數(shù)據(jù)(如車(chē)輛速度)會(huì)表現(xiàn)出對(duì)過(guò)去數(shù)據(jù)的依賴(lài)。CNN的淺層學(xué)習(xí)模型由于沒(méi)有考慮對(duì)歷史數(shù)據(jù)的依賴(lài)性,在處理時(shí)間序列問(wèn)題時(shí)無(wú)法取得良好效果。
LSTM作為循環(huán)神經(jīng)網(wǎng)絡(luò)的一個(gè)變種,可以通過(guò)隱藏記憶狀態(tài)來(lái)體現(xiàn)這種依賴(lài)性,揭示時(shí)間序列的本質(zhì)。LSTM可用于從對(duì)應(yīng)的時(shí)間序列數(shù)據(jù)中獲取長(zhǎng)期相關(guān)特征。LSTM由4個(gè)神經(jīng)網(wǎng)絡(luò)層以一種特殊的連接方式構(gòu)成,通過(guò)4個(gè)相互作用的層可以有效解決梯度消失問(wèn)題,其結(jié)構(gòu)如圖5所示。
圖5 長(zhǎng)短期記憶網(wǎng)絡(luò)
如圖5所示,LSTM除了典型的循環(huán)神經(jīng)網(wǎng)絡(luò)中的tanh層以外,增加了3個(gè)門(mén)層:遺忘門(mén)、輸入門(mén)和輸出門(mén)。通過(guò)4個(gè)相互作用的層可以有效解決梯度消失問(wèn)題。典型的LSTM單元模塊計(jì)算過(guò)程如(6)式所示:
(6)
式中:WX、UX分別為隱藏狀態(tài)和輸入狀態(tài)的權(quán)重矩陣,bX為偏置,X=i,f,o,g,分別表示輸入門(mén)、遺忘門(mén)、輸出門(mén)和內(nèi)部隱藏狀態(tài);ht是新的隱藏狀態(tài)。
基于規(guī)劃速度與預(yù)測(cè)速度的CNN-LSTM的流程圖如圖6所示。首先將歷史速度序列與規(guī)劃速度序列合并,并作為CNN的輸入量,經(jīng)過(guò)CNN與LSTM的處理,輸出預(yù)測(cè)速度序列。
圖6 基于規(guī)劃速度與預(yù)測(cè)速度的CNN-LSTM預(yù)測(cè)模型
2.2.1 能量管理優(yōu)化設(shè)計(jì)
將預(yù)測(cè)的工況模型代入履帶式混合動(dòng)力無(wú)人車(chē)輛的控制模型(2)式和(3)式中,可以求解出預(yù)測(cè)時(shí)域內(nèi)無(wú)人駕駛車(chē)輛的功率需求,從而構(gòu)建出最優(yōu)控制問(wèn)題。能量管理優(yōu)化控制問(wèn)題是在滿(mǎn)足系統(tǒng)約束條件下,求解使得性能指標(biāo)最小的最優(yōu)控制量,是一個(gè)非線(xiàn)性時(shí)變最優(yōu)控制問(wèn)題。本文僅考慮混合動(dòng)力履帶車(chē)輛的燃油經(jīng)濟(jì)性,即獲得最小燃油消耗值。因此,本文的能量管理最優(yōu)控制問(wèn)題的性能指標(biāo)為
(7)
(8)
φf(shuō)uel為根據(jù)臺(tái)架試驗(yàn)數(shù)據(jù)確定的發(fā)動(dòng)機(jī)油耗特性圖查表函數(shù)。
維持動(dòng)力電池組平衡是能量管理目標(biāo)之一,即初始時(shí)刻的電池SOC與結(jié)束時(shí)刻的電池SOC應(yīng)相同。由于MPC的優(yōu)化問(wèn)題中的預(yù)測(cè)時(shí)域比全局優(yōu)化的預(yù)測(cè)時(shí)域短,且初始SOC也不等于目標(biāo)SOC,因此在MPC的優(yōu)化過(guò)程中不做電池SOC的硬約束。但為了達(dá)到維持電池SOC穩(wěn)定的目的,在性能函數(shù)中加入電池當(dāng)前SOC與目標(biāo)SOC的差值作為一個(gè)優(yōu)化目標(biāo),所以將(7)式性能函數(shù)改為
(9)
式中:ω1、ω2為權(quán)重因子;SOC(t)為當(dāng)前電池SOC;SOCtar為目標(biāo)電池SOC。
可將(9)式寫(xiě)成離散時(shí)間形式
(10)
動(dòng)力電池組的SOC作為系統(tǒng)的狀態(tài)變量,狀態(tài)方程為
(11)
式中:Voc為動(dòng)力電池組開(kāi)路電壓;Rb為電池內(nèi)阻;Pb為電池功率;Cb為電池的額定容量??蓪?11)式寫(xiě)成離散時(shí)間形式
(12)
在本文研究的串聯(lián)混合動(dòng)力系統(tǒng)中,發(fā)動(dòng)機(jī)輸出軸和發(fā)電機(jī)輸入軸直連,發(fā)動(dòng)機(jī)采用轉(zhuǎn)速控制方式,發(fā)電機(jī)采用轉(zhuǎn)矩控制方式,發(fā)動(dòng)機(jī)轉(zhuǎn)速和發(fā)電機(jī)轉(zhuǎn)矩需要符合發(fā)動(dòng)機(jī)和發(fā)電機(jī)的外特性,并且在相鄰兩個(gè)控制區(qū)間,發(fā)動(dòng)機(jī)轉(zhuǎn)速ne和發(fā)電機(jī)轉(zhuǎn)矩Tg的變化不能太快,否則無(wú)法完成工作點(diǎn)的轉(zhuǎn)移,發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組無(wú)法達(dá)到目標(biāo)輸出功率。因此需要滿(mǎn)足如下約束
(13)
式中:ne為發(fā)動(dòng)機(jī)轉(zhuǎn)速;ne,min、ne,max分別為發(fā)動(dòng)機(jī)的最小轉(zhuǎn)速和最大轉(zhuǎn)速;Δne為發(fā)動(dòng)機(jī)轉(zhuǎn)速變化率;Δne,min、Δne,max分別為發(fā)動(dòng)機(jī)轉(zhuǎn)速變化所允許的最小值和最大值;Tg為發(fā)電機(jī)轉(zhuǎn)矩;Tg,min、Tg,max分別為發(fā)電機(jī)的最小轉(zhuǎn)矩和最大轉(zhuǎn)矩;ΔTg為發(fā)電機(jī)轉(zhuǎn)矩變化率;ΔTg,min、ΔTg,max分別為發(fā)電機(jī)轉(zhuǎn)矩變化所允許的最小值和最大值。
本系統(tǒng)中動(dòng)力電池組的充放電能力有一定的限制,為了防止動(dòng)力電池過(guò)充和過(guò)放,需滿(mǎn)足如下約束
(14)
式中:SOCmin、SOCmax為動(dòng)力電池組SOC所允許的最小值和最大值;Pbmin、Pbmax為動(dòng)力電池組的最大充電功率和最大放電功率。
2.2.2 動(dòng)態(tài)規(guī)劃算法優(yōu)化設(shè)計(jì)
本節(jié)設(shè)計(jì)優(yōu)化的前向動(dòng)態(tài)規(guī)劃算法[22]求解能量管理最優(yōu)控制問(wèn)題。
求解履帶式混合動(dòng)力無(wú)人平臺(tái)能量管理最優(yōu)問(wèn)題的前提是全局工況已知,即每個(gè)時(shí)刻車(chē)輛的動(dòng)力學(xué)約束是已知的。由2.2.1節(jié)可知,能量管理最優(yōu)控制問(wèn)題為求解最小成本函數(shù),即獲得最小燃油消耗值。本文根據(jù)最小成本對(duì)應(yīng)儲(chǔ)存的轉(zhuǎn)移狀態(tài),設(shè)計(jì)優(yōu)化的前向動(dòng)態(tài)規(guī)劃算法逆向搜索最優(yōu)狀態(tài),從而獲得最優(yōu)狀態(tài)軌跡,即燃油消耗最小值各時(shí)刻的SOC值以及對(duì)應(yīng)的控制量序列。
根據(jù)能量管理最優(yōu)控制問(wèn)題,將動(dòng)力電池SOC作為系統(tǒng)的狀態(tài)變量x,對(duì)SOC狀態(tài)進(jìn)行離散化處理,將電池SOC范圍等分為p份,其上下限需滿(mǎn)足能量管理控制目標(biāo)的要求,本文為0.6~0.8,n為總離散階段數(shù),k為當(dāng)前階段,k=1,2,…,n-1。
對(duì)于采樣時(shí)刻k=1時(shí),第i個(gè)SOC狀態(tài)xi時(shí)的最小成本函數(shù)為
J1(xi)=L1(xi)
(15)
式中:J1(xi)為第1個(gè)采樣時(shí)刻xi狀態(tài)的最小成本函數(shù);L1(xi)為在第1個(gè)階段的系統(tǒng)約束下?tīng)顟B(tài)從初始狀態(tài)轉(zhuǎn)移到xi的瞬時(shí)成本函數(shù)。
以此類(lèi)推,可以得到所有階段的最小成本函數(shù),即對(duì)于采樣時(shí)刻k(1 Jk(xi)=minj[Jk-1(xj)+Lk(xi,xj)] (16) 式中:Jk(xj)為第k個(gè)采樣時(shí)刻xj狀態(tài)的最小成本函數(shù);Jk-1(xj)為第k-1個(gè)采樣時(shí)刻xj狀態(tài)的最小成本函數(shù);Lk(xi,xj)為在第k個(gè)階段的系統(tǒng)約束下?tīng)顟B(tài)從xj轉(zhuǎn)移到xi的瞬時(shí)成本函數(shù)。 對(duì)于本文研究的混合動(dòng)力能量管理最優(yōu)問(wèn)題,由(17)式可知,系統(tǒng)在采樣在采樣時(shí)刻k的瞬時(shí)成本函數(shù)為 (17) 該瞬時(shí)成本函數(shù)的計(jì)算取決于系統(tǒng)狀態(tài)變量電池SOC(j)和控制變量u(j),其中控制變量為發(fā)動(dòng)機(jī)轉(zhuǎn)速ne和發(fā)電機(jī)轉(zhuǎn)矩Tg。由發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組約束(13)式和動(dòng)力電池組約束(14)式可知,狀態(tài)變量SOC(j)和兩個(gè)控制變量u(j)都有上下限約束,本文選擇狀態(tài)變量電池SOC和發(fā)動(dòng)機(jī)轉(zhuǎn)速來(lái)確定系統(tǒng)的狀態(tài),然后將動(dòng)力電池SOC范圍和發(fā)動(dòng)機(jī)轉(zhuǎn)速范圍離散化,從而可以計(jì)算瞬時(shí)成本函數(shù)。但是,隨著離散化網(wǎng)格數(shù)的增加,計(jì)算量呈指數(shù)增長(zhǎng),計(jì)算時(shí)間過(guò)長(zhǎng)。為降低動(dòng)態(tài)規(guī)劃的算法的計(jì)算量,提高計(jì)算效率,本文根據(jù)履帶式混合動(dòng)力無(wú)人車(chē)輛的特性,通過(guò)減小電池SOC和發(fā)動(dòng)機(jī)轉(zhuǎn)速這兩個(gè)量的搜索范圍,提高算法的求解速度。 系統(tǒng)的狀態(tài)變量電池SOC是根據(jù)離散化后的所有離散點(diǎn)進(jìn)行計(jì)算,從動(dòng)力電池組約束(14)式可知,動(dòng)力電池SOC在每一個(gè)時(shí)刻的變化收到電池充放電功率的約束,無(wú)法過(guò)大變化。因此,通過(guò)減小動(dòng)力電池SOC的變化范圍,從而縮小每個(gè)時(shí)刻電池SOC的搜索域,即對(duì)于一個(gè)SOC值,只在紅色線(xiàn)處進(jìn)行搜索,而另外其他的SOC值不進(jìn)行計(jì)算,減小計(jì)算量。由于電池SOC終端沒(méi)有固定,所以最后一個(gè)狀態(tài)不再固定,而是與前面狀態(tài)相同,計(jì)算所有離散化的SOC值,從而獲得預(yù)測(cè)時(shí)域內(nèi)的最優(yōu)控制序列,實(shí)現(xiàn)預(yù)測(cè)時(shí)域內(nèi)的局部?jī)?yōu)化,如圖7所示。 圖7 基于動(dòng)態(tài)規(guī)劃的實(shí)時(shí)滾動(dòng)優(yōu)化 對(duì)于系統(tǒng)控制變量發(fā)動(dòng)機(jī)轉(zhuǎn)速,可根據(jù)發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組約束(13)式,將上一狀態(tài)對(duì)應(yīng)的最優(yōu)控制量作為基準(zhǔn),僅搜索附近區(qū)域,如(18)式所示,即可減小發(fā)動(dòng)機(jī)轉(zhuǎn)速的搜索范圍。 ne(k-1)+Δne,min≤ne(k)≤ne(k-1)+Δne,max (18) 以上考慮到電池充放電功率約束和發(fā)動(dòng)機(jī)轉(zhuǎn)速變化約束,通過(guò)縮小電池SOC和發(fā)動(dòng)機(jī)轉(zhuǎn)速的搜索范圍,減少動(dòng)態(tài)規(guī)劃算法的計(jì)算量,提高動(dòng)態(tài)規(guī)劃的計(jì)算效率,從而得到最優(yōu)軌跡,實(shí)現(xiàn)了前向動(dòng)態(tài)規(guī)劃算法的優(yōu)化。求解最小成本函數(shù)流程圖如圖8所示。 根據(jù)圖8,針對(duì)每一個(gè)SOC離散值,求得時(shí)刻k-1 到k的SOC變化值ΔSOC,如 圖8 求解最小成本函數(shù)流程圖 ΔSOC=SOCk-SOCk-1 (19) 由動(dòng)力電池模型可計(jì)算電池的充放電功率為 Pb=-VocCbΔSOC-(CbΔSOC)2Rb (20) 整車(chē)需求功率Preq可由(2)式計(jì)算求解。根據(jù)功率平衡,發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組的目標(biāo)輸出功率可Pg由(3)式計(jì)算求解。因?yàn)榘l(fā)動(dòng)機(jī)和發(fā)電機(jī)剛性連接,所以轉(zhuǎn)速相同,將發(fā)動(dòng)機(jī)轉(zhuǎn)速代入發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組模型(1)式,可求解發(fā)電機(jī)轉(zhuǎn)矩和發(fā)動(dòng)機(jī)轉(zhuǎn)矩,從而由發(fā)動(dòng)機(jī)油耗模型(8)式求解油耗。 根據(jù)約束(13)式,比較控制變量的可行解,從而得到最小瞬時(shí)成本函數(shù)。如果在計(jì)算過(guò)程中,無(wú)可行解,則說(shuō)明此時(shí)的電池SOC的值無(wú)法達(dá)到,即系統(tǒng)狀態(tài)不可獲得,則設(shè)定該過(guò)程的成本函數(shù)為最大值。 根據(jù)前向動(dòng)態(tài)規(guī)劃優(yōu)化算法,當(dāng)前總成本為上一時(shí)刻狀態(tài)對(duì)應(yīng)的總成本與轉(zhuǎn)移狀態(tài)最小成本的和的最小值,即為 (21) 按照(21)式一直計(jì)算到終止時(shí)刻,獲得系統(tǒng)整個(gè)過(guò)程的總成本函數(shù)、每個(gè)時(shí)刻的最優(yōu)狀態(tài)量和控制量。 采用優(yōu)化動(dòng)態(tài)規(guī)劃解決MPC中的最優(yōu)控制問(wèn)題是局部最優(yōu)控制,而不是全局最優(yōu)控制。由于存在預(yù)測(cè)誤差和外部干擾,求解出的最優(yōu)控制序列不能全部作用于系統(tǒng),只能將第一個(gè)最優(yōu)控制量作用于系統(tǒng),在下一個(gè)控制周期重新觀(guān)測(cè)系統(tǒng)狀態(tài),根據(jù)歷史速度序列和規(guī)劃速度序列重新預(yù)測(cè)速度,對(duì)上一時(shí)刻的預(yù)測(cè)值進(jìn)行修訂,然后重新求解新預(yù)測(cè)時(shí)域內(nèi)的最優(yōu)控制問(wèn)題,如此循環(huán)。 本試驗(yàn)采用履帶式混合動(dòng)力無(wú)人平臺(tái),即圖2所示平臺(tái),可設(shè)置純電動(dòng)模式和混合動(dòng)力模式。本試驗(yàn)是在某試驗(yàn)場(chǎng)越野環(huán)境中,以混動(dòng)模式為前提,比較兩種不同的能量管理策略方法,對(duì)基于軌跡規(guī)劃預(yù)測(cè)的MPC能量管理策略進(jìn)行驗(yàn)證。在無(wú)人駕駛模式和混合動(dòng)力模式下,考慮到動(dòng)力電池SOC維持在70%左右能發(fā)揮較好的充放電特性,因此將其電池SOC初始值設(shè)置為70%[2]。試驗(yàn)場(chǎng)環(huán)境如圖9所示。圖10為實(shí)車(chē)試驗(yàn)中的無(wú)人駕駛?cè)致窂健?/p> 圖9 實(shí)車(chē)試驗(yàn)環(huán)境 圖10 實(shí)車(chē)試驗(yàn)無(wú)人駕駛?cè)致窂?/p> 本試驗(yàn)首先根據(jù)2.1.1節(jié)介紹的軌跡規(guī)劃算法輸出規(guī)劃速度序列,如圖11所示。 圖11 規(guī)劃速度序列 該規(guī)劃速度序列與歷史速度序列合成為合并速度序列,作為后續(xù)基于軌跡規(guī)劃的工況預(yù)測(cè)方法的輸入量;其次將基于規(guī)劃速度序列的直接預(yù)測(cè)精度與采用CNN-LSTM工況預(yù)測(cè)精度進(jìn)行對(duì)比;最后通過(guò)對(duì)比基于多步神經(jīng)網(wǎng)絡(luò)的等效燃油消耗量,進(jìn)一步驗(yàn)證基于CNN-LSTM工況預(yù)測(cè)的能量管理策略的有效性。 本研究利用采集的大量的實(shí)車(chē)無(wú)人駕駛數(shù)據(jù)訓(xùn)練基于軌跡規(guī)劃的CNN-LSTM工況預(yù)測(cè)模型,以實(shí)際無(wú)人駕駛工況作為測(cè)試,驗(yàn)證模型效果。 圖12顯示了直接用規(guī)劃速度作為預(yù)測(cè)速度的預(yù)測(cè)效果與同時(shí)使用規(guī)劃速度和歷史速度并采用CNN-LSTM模型進(jìn)行工況預(yù)測(cè)的比較結(jié)果。表2給出了預(yù)測(cè)精度對(duì)比,預(yù)測(cè)精度用均方根誤差作為評(píng)價(jià)指標(biāo),其計(jì)算公式為 表2 兩種模型的預(yù)測(cè)精度對(duì)比 圖12 兩種預(yù)測(cè)模型對(duì)比圖 (22) 式中:e為均方根誤差;vpre和vreal分別為預(yù)測(cè)速度和實(shí)際速度。 由表2可知,通過(guò)對(duì)比不同工況預(yù)測(cè)方法,采用CNN-LSTM模型預(yù)測(cè)方法效果比基于規(guī)劃速度的直接預(yù)測(cè)模型的預(yù)測(cè)精度提高了3%,說(shuō)明使用CNN-LSTM模型可以提高工況預(yù)測(cè)效果。 為了驗(yàn)證本文研究的基于CNN-LSTM預(yù)測(cè)的MPC能量管理策略,本節(jié)將傳統(tǒng)的基于多步神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的策略與其進(jìn)行對(duì)比實(shí)驗(yàn)。圖13 顯示了兩種不同策略下動(dòng)力電池SOC變化的結(jié)果。 圖13 兩種能量管理策略的電池SOC結(jié)果對(duì)比圖 由圖13可知,兩種能量管理策略都能使電池SOC維持在目標(biāo)值附近。對(duì)于基于CNN-LSTM預(yù)測(cè)的能量管理策略SOC曲線(xiàn),在50~150 s期間,工況比較穩(wěn)定,履帶車(chē)輛需求功率比較平穩(wěn),電池SOC穩(wěn)定在目標(biāo)值處;在150~180 s期間,需求功率較大,動(dòng)力電池和發(fā)動(dòng)機(jī)共同提供電能,SOC下降至0.695左右;在180~210 s期間,需求功率較小,發(fā)動(dòng)機(jī)發(fā)電機(jī)組的輸出功率不僅用于驅(qū)動(dòng)車(chē)輛,還給動(dòng)力電池充電,使動(dòng)力電池SOC上升至初始值。此過(guò)程為該履帶車(chē)輛在混動(dòng)模式下的輸出結(jié)果,證明基于CNN-LSTM預(yù)測(cè)能量管理策略較基于多步神經(jīng)網(wǎng)絡(luò)的能量管理策略更有效地使動(dòng)力電池發(fā)揮削峰填谷的作用,能夠完成維持動(dòng)力電池SOC穩(wěn)定的目標(biāo),并且能夠適時(shí)調(diào)節(jié)電池的充放電功率,從而更有利于調(diào)節(jié)發(fā)動(dòng)機(jī)的工作點(diǎn)使之更多地工作在高效區(qū),提高燃油經(jīng)濟(jì)性,如圖14所示。 圖14 兩種能量管理策略的發(fā)動(dòng)機(jī)工作點(diǎn)對(duì)比圖 通過(guò)比較兩種能量管理策略下發(fā)動(dòng)機(jī)工作點(diǎn)的狀態(tài),如圖14展示可知,與基于多步神經(jīng)網(wǎng)絡(luò)策略相比,基于CNN-LSTM預(yù)測(cè)的MPC優(yōu)化策略使得發(fā)動(dòng)機(jī)能有更多的工作點(diǎn)落在高效區(qū)內(nèi),工作范圍得到更多改善,經(jīng)過(guò)SOC修正后,兩種能量管理策略的等效燃油消耗量對(duì)比情況如表3所示。 表3 兩種能量管理策略等效燃油消耗量對(duì)比 通過(guò)對(duì)比可知,基于CNN-LSTM預(yù)測(cè)的MPC的能量管理優(yōu)化策略比基于多步神經(jīng)網(wǎng)絡(luò)策略的等效燃油消耗量減少了3.9%,改善了燃油經(jīng)濟(jì)性,也體現(xiàn)了基于CNN-LSTM預(yù)測(cè)方法的預(yù)測(cè)精度高。 本文以履帶式混合動(dòng)力無(wú)人平臺(tái)為研究對(duì)象,面向能量管理對(duì)平臺(tái)進(jìn)行建模;對(duì)發(fā)動(dòng)機(jī)- 發(fā)電機(jī)組及動(dòng)力電池組的輸出功率進(jìn)行分配;基于局部軌跡規(guī)劃提出CNN-LSTM模型預(yù)測(cè)的方法;設(shè)計(jì)了MPC的優(yōu)化策略,實(shí)現(xiàn)了能量管理優(yōu)化目標(biāo)。 通過(guò)實(shí)車(chē)試驗(yàn),驗(yàn)證了基于CNN-LSTM預(yù)測(cè)模型的有效性;證明了基于CNN-LSTM預(yù)測(cè)的能量管理策略比基于多步神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的策略燃油經(jīng)濟(jì)性要好,減少了燃油消耗,提高了控制策略的優(yōu)化性、適應(yīng)性和魯棒性。2.3 反饋校正控制
3 實(shí)車(chē)驗(yàn)證與結(jié)果分析
3.1 基于CNN-LSTM工況預(yù)測(cè)的能量管理策略驗(yàn)證
3.2 能量管理策略對(duì)比驗(yàn)證
4 結(jié)論