胡銀全,劉和平,游青山
(1.重慶工程職業(yè)技術學院,重慶 402260;2.重慶大學,重慶 400044)
與傳統(tǒng)燃油汽車相比,混合動力汽車具有能源利用率高、環(huán)境污染小等優(yōu)勢,能夠有效緩解能源危機和環(huán)境污染問題[1]。混合動力汽車具有兩個以上動力源,不同的轉(zhuǎn)矩分配方法導致的能耗也差別較大,因此對混合動力汽車的能量管理策略進行實時優(yōu)化,對于節(jié)能減排具有重要意義[2]。
混合動力汽車的能量管理策略可以分為基于規(guī)則的化方法[3]、全局優(yōu)化方法[4]與實時優(yōu)化[5]方法。基于規(guī)則的能量分配方法包括基于確定規(guī)則和基于模糊規(guī)則兩大類,其中模糊規(guī)則可以根據(jù)行駛工況進行調(diào)整,因此燃油經(jīng)濟性一般好于確定規(guī)則;但是模糊邏輯依賴專家經(jīng)驗制定,其控制性能難以得到保證。文獻[6]使用粒子群算法優(yōu)化規(guī)則控制中的不確定閾值,比純?nèi)加推嚭臀磧?yōu)化控制規(guī)則都具有較好的燃油經(jīng)濟性。
基于全局優(yōu)化的能量管理方法需預知行駛工況,因此無法應用于實時控制,多作為其他控制策略的評價標準,全局優(yōu)化方法包括動態(tài)規(guī)劃法、極小值原理等。
文獻[7]將能量管理優(yōu)化與實時優(yōu)化分兩步進行,一是使用動態(tài)規(guī)劃得到最優(yōu)轉(zhuǎn)矩分配;二是使用神經(jīng)網(wǎng)絡擬合車輛狀態(tài)與最優(yōu)轉(zhuǎn)矩分配的關系,使轉(zhuǎn)矩分配結(jié)果具有實時控制能力。實時優(yōu)化方法以需求動力為輸入、以車輛狀態(tài)為約束,實時優(yōu)化下一時刻的控制量,是一種在線優(yōu)化方法,包括燃油消耗最小方法、模型預測控制方法等。文獻[8]以馬爾可夫模型預測車輛加速度,以燃油經(jīng)濟性為目標使用模型預測控制方法進行優(yōu)化,與恒值模型預測控制比提高了車輛的燃油經(jīng)濟性。實時優(yōu)化方法是一種在線優(yōu)化和控制方法,但是實時優(yōu)化方法由于沒有全局先驗知識,因此是一種非最優(yōu)控制方法。
這里針對混合動力汽車的燃油經(jīng)濟性控制問題,建立了混合動力汽車的實時控制仿真模型;使用極小值原理和等效燃油消耗最小策略設計車輛控制律,為了適應復雜多變的工況,提出了等效因子隨駕駛工況的自適應變化策略,實現(xiàn)了車輛在綜合駕駛工況下的燃油經(jīng)濟性控制。
這里研究的混合動力系統(tǒng)結(jié)構(gòu),如圖1所示。動力系統(tǒng)主要由發(fā)動機、離合器、ISG電機、CVT無級變速器等組成。
圖1 混合動力系統(tǒng)結(jié)構(gòu)Fig.1 Structure of Hybrid Power System
通過控制離合器的通斷,可以實現(xiàn)純電驅(qū)動、純發(fā)動機驅(qū)動、混合驅(qū)動、行車充電和制動能量回收等工作模式。
(1)純電驅(qū)動模式。在車輛起步或低速運轉(zhuǎn)階段,為了防止發(fā)動機工作在低效率區(qū)域,由ISG電機單獨驅(qū)動車輛,此時離合器為斷開狀態(tài)。
(2)純發(fā)動機驅(qū)動模式。當車速增加或者需求功率提高時,車輛進入純發(fā)動機驅(qū)動模式,電機不工作,此時離合器處于閉合狀態(tài)。
(3)混合驅(qū)動模式。當車輛車速較高或者需求轉(zhuǎn)矩較大,發(fā)動機在最佳工作點不足以驅(qū)動車輛,此時進入混合驅(qū)動模式,即發(fā)動機和電機同時工作,離合器處于閉合狀態(tài)。
(4)行車充電模式。當車輛的需求功率下降,且電池SOC未達到上限時,為了保證發(fā)動機工作在高效率區(qū)域,車輛進入行車充電模式,即發(fā)動機除了用于驅(qū)動車輛,剩余能量對電池進行充電。
(5)制動能量回收。當車輛進入制動狀態(tài)時,在安全的前提下,最大程度地回收制動能量,回收能量存儲于電池中。
車輛的制動模式包括再生制動、機械制動和混合制動三種,制動模式的確定規(guī)則為:(1)為了防止電池過充,當電池SOC>90%時,使用機械制動;(2)為了保證車輛安全,當制動強度>0.7時,使用機械制動;(3)當CVT輸入轉(zhuǎn)速<500rpm時不滿足充電要求,只能使用機械制動;(4)其余情況下優(yōu)先使用再生制動,當再生制動不滿足制動要求時使用混合制動。
以上規(guī)則流程,如圖2所示。圖中:Treq—車輛需求轉(zhuǎn)矩;n—CVT輸入轉(zhuǎn)速;z—制動強度。
圖2 制動規(guī)則Fig.2 Braking Rule
混合動力車輛的實時控制模型包括動力系統(tǒng)模型、車輛動力學模型、駕駛員模型,動力學模型又包括發(fā)動機模型、電機模型、電池模型和CVT模型等。
(1)發(fā)動機模型
發(fā)動機穩(wěn)態(tài)輸出轉(zhuǎn)矩與節(jié)氣門開度和發(fā)動機轉(zhuǎn)速有關,可通過查表獲得,記為:
式中:Te—發(fā)動機輸出穩(wěn)態(tài)轉(zhuǎn)矩;α—節(jié)氣門開度;neng—發(fā)動機轉(zhuǎn)速;f1()—查表函數(shù)。
由于發(fā)動機轉(zhuǎn)矩輸出存在遲滯問題,因此使用含有遲滯的一階慣性環(huán)節(jié)將穩(wěn)態(tài)轉(zhuǎn)矩轉(zhuǎn)化為動態(tài)轉(zhuǎn)矩,即:
式中:τ—遲滯時間;kτ—慣性系數(shù);s—拉氏因子;Teng—動態(tài)輸出轉(zhuǎn)矩。發(fā)動機的燃油消耗率模型可通過二維插值法獲得,即:
式中:be—發(fā)動機的燃油消耗率;f2()—二維插值函數(shù)。由此得到發(fā)動機燃油消耗量為:
式中:mf—發(fā)動機燃油消耗量;Peng—發(fā)動機輸出功率。
計算方法為:
(2)電機模型
電池放電帶動電機驅(qū)動車輛,電機的驅(qū)動功率為:
式中:Pbat—電機的驅(qū)動功率;Tmot—電機轉(zhuǎn)矩;n mot—電機轉(zhuǎn)速;
ηmot—電機充放電效率。
電池處于充電狀態(tài)時,電機的發(fā)電功率為:
電機工作效率ηmot由實驗建模得到,記為:
(3)電池模型
將電池等效為內(nèi)阻模型,即Rint模型。電池內(nèi)阻記為Rin,開路電壓記為Uoc,輸出電壓記為Ub,內(nèi)部電流記為Ib,則電池電流、充放電效率、SOC值分別為:
式中:Pb—電池功率,Pb>0表示放電,Pb<0表示充電;ηbat—電池的充放電效率;SOC(t)—t時刻電池SOC值;Qc—電池標稱電量。
(4)CVT模型
使用臺架實驗獲得CVT的輸入輸出傳動效率模型,并以此得到CVT輸出轉(zhuǎn)矩,為:
式中:ηcvt—CVT傳動效率;f4()—基于實驗數(shù)據(jù)的擬合函數(shù);Tin—
CVT輸入轉(zhuǎn)矩;icvt—CVT速比;Tout—CVT輸出轉(zhuǎn)矩。
(5)車輛動力學模型
使用牛頓第二定律構(gòu)造車輛的動力學方程,車輛行駛過程中所受阻力包括空氣阻力、摩擦阻力、爬坡阻力和加速慣性力,得到車輛的動力學模型為:
式中:Td1—動力系統(tǒng)施加在車輛上的轉(zhuǎn)矩;r—車輪半徑;CD—空氣阻力系數(shù);A—車輛的迎風面積;v—車速;m—車輛質(zhì)量;g—重力加速度;f—路面的滾動摩擦系數(shù);α—路面坡度;δ—旋轉(zhuǎn)質(zhì)量換算系數(shù)。
當Td1為驅(qū)動力矩時有:Td1=(Teng+Tmot)i0icvtηcvtηT;
當Td1為制動力矩時有:Td1=Tbra+Tmoti0icvtηcvtηT。
式中:i0—主減速器傳動比;ηT—傳動系統(tǒng)效率;
Tbra—機械制動力矩。
(6)駕駛員模型
這里使用PID控制構(gòu)造駕駛員模型,即:
式中:e(t)—車速誤差;vtar—目標車速;vact—實際車速;Td2—車速跟蹤轉(zhuǎn)矩需求;Kp、Ki、Kd—比例系數(shù)、積分系數(shù)和微分系數(shù)。
根據(jù)以上建模過程,得到混合動力車輛的實時控制仿真模型,如圖3所示。
圖3 車輛仿真模型Fig.3 Simulation Model of the Vehicle
本節(jié)使用龐特里亞金極小值原理和等效燃油消耗法求解車輛在不同工況下的最優(yōu)控制律。
混合動力汽車能量管理問題的目標是某個行駛周期內(nèi)燃油消耗量最小,即性能指標為:
式中:J—性能指標;t0—初始時刻;tf—終止時刻;m?f—燃油消耗率;u(t) ={icvt(t),SF(t)}T—控 制 量;icvt(t)—CVT 速 比;SF(t) =Tmot Treq—電機轉(zhuǎn)矩分配系數(shù);Treq—需求轉(zhuǎn)矩;x(t) =S(t)—系統(tǒng)狀態(tài)量。狀態(tài)方程為:
構(gòu)造哈密頓函數(shù)為:
式中:λ(t)—協(xié)態(tài)。
根據(jù)極小值原理[9],根據(jù)式(14)可以求得最優(yōu)控制u*(t)、最優(yōu)狀態(tài)量x*(t)和最優(yōu)協(xié)態(tài)λ*(t),即:
結(jié)合前文的混合動力系統(tǒng)實時控制模型,使用等效因子將車輛的電量消耗轉(zhuǎn)化為燃油消耗,得到等效燃油消耗策略的哈密頓函數(shù)為:
式中:s(t)—等效因子;Qlhq—燃油最低熱值;Qc—電池最大容量。
等效因子s(t)對燃油消耗策略影響較大,若s(t)過大則車輛傾向于用油,不利于燃油經(jīng)濟性;
若s(t)過大則車輛傾向于用電,利于燃油經(jīng)濟性,但是電池容易過充或過放而影響壽命。
另外,等效因子的設置還需要滿足邊界條件約束,在下文中將討論等效因子關于工況的自適應調(diào)整方法。
若只關注車輛的燃油經(jīng)濟性,會造成發(fā)動機頻繁的啟動關閉和CVT速比變化率較大。發(fā)動機頻繁的啟動關閉會減少發(fā)動機和離合器使用壽命;CVT速比變化率較大時,車輛傳動系統(tǒng)的動態(tài)性能下降,甚至使液壓系統(tǒng)無法響應。因此,為了防止發(fā)動機頻繁啟停和CVT速比變化率過大,將兩者作為優(yōu)化子目標引入到哈密頓函數(shù)中,為:
式中:α—發(fā)動機啟停次數(shù)權值;β—CVT速比變化率權值;C()—計數(shù)函數(shù);Ess—發(fā)動機狀態(tài)標志,當狀態(tài)由0變?yōu)?時計數(shù)函數(shù)C()加1;Δicvt—速比變化量;I—速比變化量閾值,取為2。按照式(14)完全一致的方法可求得式(16)的最佳控制量、最佳狀態(tài)量。
根據(jù)經(jīng)驗取β=0.1,在HWEFT、UNIF01、EPA75、MANHANTTAN等4種標準工況下對α進行仿真測試,分別測試α∈[0,1]不同取值對發(fā)動機啟停次數(shù)和CVT速比變化率的影響,電池SOC初值設置為0.7,時間步長為0.1s,測試結(jié)果,如圖4所示。
圖4 權值測試結(jié)果Fig.4 Weight Testing Result
百公里油耗隨權值α變化曲線,如圖4(a)所示。發(fā)動機啟停次數(shù)隨權值α變化曲線,圖中啟停次數(shù)減少率以α= 0 為基準,如圖4(b)所示。
分析圖4可知,混合動力車輛的百公里油耗隨著權值α的增大而提高,發(fā)動機啟停次數(shù)隨α的增大而減少。這是因為當α增大時,說明優(yōu)化目標更加關注啟停次數(shù),因此發(fā)動機啟停次數(shù)減少而燃油消耗有一定上升。綜合圖4(a)和圖4(b),α= 0.3時發(fā)動機啟停次數(shù)減少率幾乎不再下降,而燃油消耗增加率不足4%,因此最終取α= 0.3。
本節(jié)首先對行駛工況進行智能識別,而后依據(jù)行駛工況和電池SOC初值給出自適應等效因子。
為了有效識別車輛的行駛工況,選擇11個參數(shù)組成特征向量,分別為:平均車速vm、最大車速vmax、平均加速度am、最大加速度amax、最大減速度dmax、平均減速度dm、怠速時間占比ri、加速時間占比ra、減速時間占比rd、勻速時間占比rc、怠速次數(shù)fi。
每個標準工況的行駛總時間不同,若每個標準工況只提取一組特征參數(shù),則用于訓練和測試的樣本數(shù)量不足。為了解決以上問題,提出了行駛工況的重疊采樣法,具體方法為:將標準行駛工況每120s作為一組樣本,從0s開始采樣,每間隔30s采樣一次,按照這種采樣方法,樣本之間存在重疊,因此稱為重疊采樣法。重疊采樣法可以有效增加樣本數(shù)量,解決樣本數(shù)量不足的問題。
學習矢量量化神經(jīng)網(wǎng)絡兼具監(jiān)督學習和競爭學習的思想和優(yōu)勢,因此使用學習矢量量化網(wǎng)絡構(gòu)造行駛工況的智能識別方法。學習矢量量化網(wǎng)絡由輸入層、競爭層、輸出層等組成,如圖5所示。輸入層與競爭層間為全連接,競爭層與輸出層間為部分連接。圖中(x1,x2,…xn)為輸入向量,wij為輸入層神經(jīng)元i與輸出層 神 經(jīng) 元j間 的 權 值,(y1,y2,…ym) 為 競 爭 層 輸 出 向 量,(o1,o2,…ol)為類別標簽。
圖5 學習矢量量化網(wǎng)絡Fig.5 Learning Vector Quantization Network
學習矢量量化網(wǎng)絡[10]的學習規(guī)則包括LVQ1和LVQ2兩種,這里使用LVQ1學習規(guī)則,分為以下步驟實現(xiàn):
(1)初始化網(wǎng)絡結(jié)構(gòu)和權值參數(shù)wij,設定參數(shù)學習效率η、最大學習次數(shù)Tmax、誤差目標e;
(2)計算輸入向量與競爭層神經(jīng)元之間的距離,即:
按照距離最小的原則選擇競爭層中與輸入距離最小的神經(jīng)元,并得到其對應的輸出類別標簽Li;
(3)記輸入向量的實際類別標簽為Lx,若Li=Lx說明勝出神經(jīng)元類別與實際類別一致,此時權值訓練方法為:
若Li≠Lx說明勝出神經(jīng)元類別與實際類別不一致,此時權值訓練方法為:
式中:η—學習率。
(4)訓練結(jié)束。當達到最大訓練次數(shù)或者達到設定誤差時,訓練過程結(jié)束。
按照方法提取MANHANTTAN、UDDS、US06、WVUINTER 等4種標準工況下的特征參數(shù),4種標準工況分別記為工況1、工況2、工況3、工況4。工況1和工況2提取了21組特征參數(shù),工況3和工況4 分別提取了18 組特征參數(shù),共78 組數(shù)據(jù),隨機選取46組數(shù)據(jù)對學習矢量量化網(wǎng)絡進行訓練,剩余32組數(shù)據(jù)作為測試樣本。
根據(jù)輸入輸出參數(shù)數(shù)量,輸入神經(jīng)元設置為11,競爭層神經(jīng)元設置為20,輸出層神經(jīng)元設置為4,每個輸出神經(jīng)元對應一種識別結(jié)果。學習矢量量化網(wǎng)絡訓練的最大迭代次數(shù)設置為200,訓練誤差目標為0.05,學習效率設置為0.001,網(wǎng)絡的訓練過程,如圖6所示。
圖6 學習矢量量化網(wǎng)絡訓練過程Fig.6 Training Process of Learning Vector Quantization Network
從圖中可以看出,算法迭代至42次時達到設定的訓練目標,訓練過程結(jié)束,此時的均方誤差為0.04938。將32組測試樣本輸入到訓練完畢的網(wǎng)絡中,行駛工況的識別結(jié)果,如圖7所示。從圖7中可以看出,32組測試樣本的行駛工況全部能夠正確識別,沒有出現(xiàn)誤判情況,說明這里建立的學習矢量量化網(wǎng)絡能夠準確的識別行駛工況類別,可以為等效因子的自適應變化提供工況依據(jù)。
圖7 學習矢量量化網(wǎng)絡識別結(jié)果Fig.7 Recognition Result of Learning Vector Quantization Network
等效燃油消耗最小策略中等效因子的自適應方法是近期的研究熱點,最優(yōu)等效因子不僅與行駛工況有關,而且與電池初始SOC值相關。
當前研究中一般在設定的標準工況或者工況已知的行駛條件下研究最優(yōu)等效因子設定方法,不符合行駛工況本身復雜多變的特性。這里給出了工況自適應的等效燃油最小策略,等效因子的自適應方法為:
式中:s(t)—自適應等效因子;
s0(t)—通過打靶法離線訓練的等效因子初值;
fp(SOC)—針對SOC邊界約束的懲罰函數(shù)。
首先介紹基于打靶法的最優(yōu)等效因子離線訓練方法。前文中提到,等效因子的設置需滿足電池SOC的邊界約束,以UDDS、NYCC、NEDC等3種標準工況為例,在初始時刻SOC(t0)= 0.7時,終止時刻SOC與初始時刻SOC的差值ΔSOC=SOC(tf)-SOC(t0)隨等效因子的變化曲線,如圖8所示。
圖8 不同工況下等效因子對SOC變化量影響Fig.8 The Influence of Equivalent Factor on SOC Variation
從圖中可以看出,在等效因子增大的過程中,ΔSOC由負轉(zhuǎn)正,這是因為當?shù)刃б蜃觭(t)較大時傾向于用油,因此終止時刻SOC(tf)>SOC(t0),即ΔSOC>0;當?shù)刃б蜃觭(t)較小時傾向于用電,因此終止時刻SOC(tf)<SOC(t0),即ΔSOC<0。
在不同工況不同電池SOC初值下,只有一個等效因子s(t)可以使得ΔSOC= 0,使用打靶法進行離線訓練,獲得不同行駛工況不同SOC初值下的等效因子,步驟為:
(1)給定一個等效因子初值s0;
(2)在每個控制周期內(nèi)通過最小化哈密頓函數(shù)H(x(t),u(t),t)得到最優(yōu)控制量u*(t),更新車輛狀態(tài)進入下一控制周期;
(3)行駛工況結(jié)束時,判斷ΔSOC=SOC(tf)-SOC(t0)的符號,若ΔSOC>0 則s(t) =s(t- 1) - Δs;若ΔSOC<0 則s(t+ 1) =s(t) + Δs,其中s(0) =s0,Δs>0為打靶步長;
(4)判斷是否存在|SOC(tf)-SOC(t0) |<ε,ε為設定的閾值,若否則轉(zhuǎn)至(2);若是則打靶結(jié)束,輸出對應的最優(yōu)等效因子sopt=s(t)。
按照上述方法可以得到不同工況下、不同電池SOC初值情況下的等效因子初值s0(t)。
以NYCC 和MANHANTTAN 兩種標準工況為例,最優(yōu)等效因子s0(t)與電池SOC初值的對應關系,如圖9所示。
圖9 最優(yōu)等效因子s0(t)Fig.9 Optimal Equivalent Factor s0(t)
由于實際駕駛工況復雜多變,因此有必要在等效因子中加入基于SOC反饋的邊界約束懲罰函數(shù)fp(SOC),實現(xiàn)對電池SOC的閉環(huán)控制,將電池SOC限制在合理范圍內(nèi)。
為了方便表達,記x(t) =SOC(t),這里基于邊界約束構(gòu)造的懲罰函數(shù)為:
式中:Kp>0—懲罰函數(shù)斜率,a>0—二次函數(shù)系數(shù);[xlow.xhigh]—設定的SOC變化區(qū)間,Δx=Kp(4a),式(20)中二次項函數(shù)的設置是為了實現(xiàn)平滑過渡。分析式(20)可知,當電池SOC接近或超越上邊界時,fp(SOC)取負值因此等效因子s(t)減小,此時傾向于用電而使電池SOC減?。划旊姵豐OC接近或超越下邊界時,fp(SOC)取正值因此等效因子s(t)增大,此時傾向于用油而使電池SOC增大。
車輛主要參數(shù)、性能指標及主要動力系統(tǒng)參數(shù),如表1所示。
為了驗證工況自適應等效燃油消耗最小策略的控制效果,使用TestCycle綜合工況進行驗證,此綜合工況由FTP、HWFET、NYCC、US06等4種標準工況組成,時長為7000s,如圖10所示。
圖10 綜合工況Fig.10 Comprehensive Driving Condition
工況識別器對駕駛工況的識別結(jié)果,如圖11所示。從圖中可以看出學習矢量量化網(wǎng)絡對駕駛工況的識別準確度極高,在駕駛工況頻繁變化位置出現(xiàn)了誤判情況,這是因為由于工況頻繁變化,同一駕駛工況的維持時間較短,特征提取不足而出現(xiàn)了誤判現(xiàn)象。
圖11 駕駛工況識別結(jié)果Fig.11 Driving Condition Recognition Result
等效因子隨駕駛工況的自適應變化過程,如圖12所示,當電池SOC值保持在設定的范圍內(nèi)時,等效因子保持為常值,當SOC超越設定的變化范圍時,等效因子跟隨懲罰函數(shù)的變化而自適應變化。
圖12 自適應等效因子Fig.12 Adaptive Equivalent Factor
發(fā)動機工作點分布,如圖13所示。從圖中可以看出絕大多數(shù)發(fā)動機工作點均分布在最優(yōu)經(jīng)濟區(qū)域,說明這里提出的等效燃油消耗最小策略可以有效提高發(fā)動機效率、減少油耗。
圖13 發(fā)動機工作點分布Fig.13 Distribution of Engine Working Points
將這里提出的工況自適應等效燃油最小策略與文獻[6]提出的智能規(guī)則控制、文獻[11]提出的模型預測控制策略進行比較,均在圖10所示的綜合工況下進行仿真,三種控制策略的百公里油耗和等效油耗,如表2所示。
表2 車輛能量消耗Tab.2 Energy Cost of Vehicle
由表2可知,這里提出的自適應等效燃油消耗最小策略的百公里油耗和百公里等效油耗最少,百公里油耗為5.56L/100km,比智能規(guī)則控制減少了7.64%,比模型預測控制減少了4.96%。
自適應等效燃油消耗最小策略的百公里等效油耗為5.67L/00km,比智能規(guī)則控制減少了6.13%,比模型預測控制減少了5.18%。
這是因為這里提出的等效燃油消耗最小策略實現(xiàn)了等效因子隨駕駛工況和電池SOC初值自適應變化,從而實現(xiàn)了發(fā)動機高效率工作。
這里研究了混合動力汽車的燃油經(jīng)濟性控制問題,使用極小值原理和等效燃油消耗最小策略實現(xiàn)了車輛的燃油經(jīng)濟性控制,為了適應復雜多變的駕駛工況,提出了等效因子隨駕駛工況的自適應變化策略,經(jīng)驗證可以看出:
(1)基于學習矢量量化網(wǎng)絡的工況識別器具有較高的識別準確度;
(2)工況自適應等效燃油消耗最小策略可以有效減少車輛油耗,實現(xiàn)車輛的燃油經(jīng)濟性控制。