惠小亮 張朦朦 李鵬豪,2 張永林,2 曹 鈺,2
(1-重慶紅江機(jī)械有限責(zé)任公司 重慶 402160 2-船舶與海洋工程動(dòng)力系統(tǒng)國(guó)家工程實(shí)驗(yàn)室)
調(diào)速器能夠幫助柴油機(jī)根據(jù)外界負(fù)載量的變化自動(dòng)調(diào)節(jié)供油量,使得噴油泵所提供的油量與外界負(fù)載始終匹配,作為柴油機(jī)控制系統(tǒng)的核心部件,調(diào)速器性能的好壞對(duì)柴油機(jī)工作效率起到至關(guān)重要的作用[1-2]。目前,能源的短缺和新排放法的嚴(yán)控對(duì)柴油機(jī)的工作性能提出了更高的挑戰(zhàn),故如何設(shè)計(jì)出時(shí)效性更好,工作效率更高的調(diào)速器是現(xiàn)階段研究的熱點(diǎn)問(wèn)題[3]。近些年來(lái),國(guó)內(nèi)對(duì)柴油機(jī)調(diào)速問(wèn)題做出了大量的研究,并有大量文獻(xiàn)公開(kāi)發(fā)表,何毅等人以MMC2017 平臺(tái)為基礎(chǔ),進(jìn)行電子調(diào)速的設(shè)計(jì),并提出相應(yīng)的PID 控制算法[4];曹月真等人研究了船舶動(dòng)力系統(tǒng)電子調(diào)速器的構(gòu)成模式、工作狀態(tài)及設(shè)計(jì)參數(shù),進(jìn)而對(duì)船舶電子調(diào)速系統(tǒng)進(jìn)行仿真模型構(gòu)建,并對(duì)電子調(diào)速器的系統(tǒng)構(gòu)成進(jìn)行深入研究,對(duì)執(zhí)行系統(tǒng)和控制系統(tǒng)等進(jìn)行仿真設(shè)計(jì)[5];馮濤針對(duì)現(xiàn)有調(diào)速器反應(yīng)時(shí)間長(zhǎng)及不能靈活修正控制參數(shù)的缺點(diǎn),提出了一種以發(fā)電機(jī)電流為輸入量,并且改進(jìn)了傳統(tǒng)電子調(diào)速的閉環(huán)控制算法,提出了一種預(yù)知式電子調(diào)速策略[6]。
楊波等人利用AMESim 軟件進(jìn)行了柴油機(jī)調(diào)速仿真優(yōu)化研究,并且優(yōu)化前后控制閥和執(zhí)行機(jī)構(gòu)的響應(yīng)特性,優(yōu)化后的調(diào)速器控制閥以及執(zhí)行機(jī)構(gòu)能夠很好地滿足準(zhǔn)確性和快速性的要求[7]。從整體上看,針對(duì)柴油機(jī)電子調(diào)速器的自適應(yīng)預(yù)測(cè)方法研究尚少。
本文根據(jù)柴油機(jī)工作原理,建立了D6114 型柴油機(jī)平均模型,建立matlab/simulink 仿真模型,提出一種概率統(tǒng)計(jì)Bayes 公式和MAXQ 算法結(jié)合的自適應(yīng)行為預(yù)測(cè)算法,即B-MAXQ(Bayes-MAXQ)算法,通過(guò)在該算法中增加完成函數(shù)和即時(shí)評(píng)價(jià)函數(shù),使得電子調(diào)速器可根據(jù)當(dāng)前轉(zhuǎn)速和下一時(shí)刻的目標(biāo)轉(zhuǎn)速,進(jìn)行執(zhí)行器的PID 最優(yōu)參數(shù)預(yù)測(cè),使得PID 參數(shù)得到更快速的調(diào)整,從而使調(diào)速器更快、更準(zhǔn)確地達(dá)到目標(biāo)轉(zhuǎn)速。柴油機(jī)運(yùn)行過(guò)程是連續(xù)的,調(diào)速器調(diào)速過(guò)程也是連續(xù)的,那么可根據(jù)轉(zhuǎn)速和PID參數(shù)歷史變化過(guò)程為PID 參數(shù)預(yù)測(cè)提供經(jīng)驗(yàn)數(shù)據(jù),并且運(yùn)用統(tǒng)計(jì)學(xué)方法建立算法模型,從而預(yù)測(cè)未來(lái)調(diào)速器的調(diào)速行為。其目的是為使執(zhí)行器在特定的當(dāng)前轉(zhuǎn)速及目標(biāo)轉(zhuǎn)速下會(huì)采取特定的PID 參數(shù)組合,從而幫助調(diào)速器作出更好的行為選擇,并且采用此方法使調(diào)速器在工作過(guò)程中復(fù)用累積的學(xué)習(xí)經(jīng)驗(yàn)。
傳統(tǒng)的MDP 只能在離散狀態(tài)下進(jìn)行工作,然而柴油機(jī)工作過(guò)程是連續(xù)的,這導(dǎo)致MDP 無(wú)法在此過(guò)程使用,故將馬爾科夫決策過(guò)程MDP(Markov decision process) 擴(kuò)展為半馬爾可夫決策過(guò)程SMDP[8],SMDP 完善了MDP 的狀態(tài)-動(dòng)作映射機(jī)制,將時(shí)間段劃分為多個(gè)時(shí)間步進(jìn)行動(dòng)作執(zhí)行[9]。
將SMDP 用5 元組{S,A,P,R,I}來(lái)定義。將S 定義為調(diào)速器的當(dāng)前轉(zhuǎn)速,A 定義為執(zhí)行器PID 參數(shù)的集合;P ∶S*N*S*A→[0,1]是多步轉(zhuǎn)移概率函數(shù),P(s′,N|s,{a})代表執(zhí)行器采取PID 參數(shù)集合{a},調(diào)速器在N 個(gè)時(shí)刻內(nèi)可由當(dāng)前轉(zhuǎn)速s 轉(zhuǎn)移到目標(biāo)轉(zhuǎn)速s′的概率;R ∶S*A→R 是回報(bào)獎(jiǎng)賞函數(shù),r(s,a)是執(zhí)行器在調(diào)速器當(dāng)前轉(zhuǎn)速s 的情況下選擇PID 參數(shù)a后期望取得的總的回報(bào)值,它包含了分析MDP 獲得報(bào)酬的所有必要信息;I 是初始的狀態(tài)分布。SMDP通過(guò)PID 參數(shù)-調(diào)速器速度映射關(guān)系,累積獎(jiǎng)賞值,從而找到一個(gè)獎(jiǎng)賞值最大的最優(yōu)策略。
將SMDP 尋優(yōu)策略應(yīng)用到電子調(diào)速器自適應(yīng)調(diào)速領(lǐng)域,建立MSMDP(Multi-markov decision process)模型[10]。由于柴油機(jī)自適應(yīng)調(diào)速是一種復(fù)雜的非線性時(shí)變的動(dòng)力機(jī)械,常規(guī)的SMDP 模型很難在全工況下取得良好的控制效果,故將SMDP 在決策時(shí)間的概念上進(jìn)行擴(kuò)展。
將5 元組的SMDP 拓展為MSMDP 7 元組{An,S,A,P,R,I,T},由于PID 參數(shù)的選擇會(huì)影響齒條位置控制器,從而會(huì)影響柴油機(jī)的轉(zhuǎn)速,所以本文將所選的PID 參數(shù)集合看做MSMDP 集合中的行為動(dòng)作,每個(gè)元素定義如下:由于調(diào)速器的調(diào)速過(guò)程是連續(xù)的,故該過(guò)程可看做是由連續(xù)的n 組PID 參數(shù)共同調(diào)節(jié)的,對(duì)于運(yùn)行的總時(shí)間為m,那么對(duì)于任意的時(shí)間段j,j∈m,均能構(gòu)成一個(gè)最優(yōu)PID 有限集Aj;A表示工作過(guò)程中的聯(lián)合PID 參數(shù)集合,即可表示表示A 中的即時(shí)PID 參數(shù)集合。
其中S、P、R、I 與SMDP 中的定義一致。T 為終止?fàn)顟B(tài),它規(guī)定了決策時(shí)刻的選擇,由于最優(yōu)聯(lián)合PID 集合的獲取可能會(huì)存在時(shí)延誤差,故決策時(shí)間的選擇會(huì)影響到轉(zhuǎn)移概率P。那么對(duì)終止?fàn)顟B(tài)T,其規(guī)定為:聯(lián)合PID 集合A 中,若有即時(shí)PID 集合ai完成調(diào)速工作,則執(zhí)行器可重新選擇PID 集合,若未完成此刻PID 調(diào)速過(guò)程,則要等到動(dòng)作完成后才能重新選擇。
將MSMDP 應(yīng)用于調(diào)速總?cè)蝿?wù)M 中,M 可分解為子任務(wù)序列{M0,M1,…,Mn},以M0作為根任務(wù),每個(gè)子任務(wù)可用4 元組{Si,Ai,Ti,Ri}來(lái)定義:
1)Si為Mi的轉(zhuǎn)速集合。
2)Ai為子任務(wù)Mi的PID 參數(shù)集合。
3)Ti為Mi的終止?fàn)顟B(tài)的目標(biāo)轉(zhuǎn)速集,當(dāng)某組PID 執(zhí)行完后,轉(zhuǎn)速達(dá)到最終的目標(biāo)轉(zhuǎn)速集合Ti時(shí),Mi的求解過(guò)程結(jié)束。
4)Ri為完成子任務(wù)Mi的獎(jiǎng)賞值,R(s,N|s,a)為執(zhí)行某一組PID 參數(shù)集合后,當(dāng)前轉(zhuǎn)速s∈Si變遷到目標(biāo)轉(zhuǎn)速s′∈Ti的回報(bào)獎(jiǎng)賞值,其含義為當(dāng)上層子任務(wù)采取執(zhí)行器PID 參數(shù)集合a 時(shí),由當(dāng)前轉(zhuǎn)速s變成目標(biāo)轉(zhuǎn)速s′是否滿足上層子任務(wù)的要求。如果采取此PID 集合a 后無(wú)法達(dá)到上層子任務(wù)所期望的目標(biāo)轉(zhuǎn)速s′,則賦一個(gè)較大的負(fù)獎(jiǎng)賞值來(lái)阻止此PID集合a 的發(fā)生,反之則給出合適的正獎(jiǎng)賞值鼓勵(lì)此PID 集合a 的發(fā)生。
根據(jù)MAXQ 學(xué)習(xí)算法將總?cè)蝿?wù)M 進(jìn)行層次劃分,并且定義Vi(s,a)為Mi在當(dāng)前轉(zhuǎn)速s 以及目標(biāo)轉(zhuǎn)速s′執(zhí)行PID 參數(shù)集合a 得到的期望獎(jiǎng)賞,得到:
上述4 個(gè)公式為任意某分層策略的評(píng)價(jià)函數(shù)分解方程。a′代表為達(dá)到目標(biāo)轉(zhuǎn)速s′所運(yùn)行的PID 參數(shù)集合;設(shè)柴油機(jī)此時(shí)轉(zhuǎn)速為s,那么R(s′|s,a)表示在轉(zhuǎn)速s 下,執(zhí)行PID 參數(shù)集合a 到達(dá)目標(biāo)轉(zhuǎn)速s′所得到的即時(shí)獎(jiǎng)賞值。將整個(gè)任務(wù)M 自動(dòng)分解成單個(gè)子任務(wù){(diào)M0,M1,…,Mn},V(i,s)為評(píng)價(jià)函數(shù),它是由復(fù)合動(dòng)作子任務(wù)函數(shù)C(i,s,a)和基本原子動(dòng)作函數(shù)V(i,s,a)組成,將根節(jié)點(diǎn)的評(píng)價(jià)函數(shù)V(a0,s)遞歸分解為單個(gè)子任務(wù)的評(píng)價(jià)函數(shù)和完成函數(shù)C(j,s,a),j=1,2,3,…,n。
按照以上所述,利用MAXQ 分層算法中的策略π 在當(dāng)前轉(zhuǎn)速s 下進(jìn)行分層。設(shè)Ma0是根任務(wù),策略π選擇了子任務(wù)Ma1,Ma1選擇了Ma2,以此類(lèi)推進(jìn)行子任務(wù)選擇,直到子任務(wù)Man-1 的策略選擇了原子動(dòng)作an(最后時(shí)刻的PID 參數(shù)集合),則可將根節(jié)點(diǎn)的根任務(wù)值函數(shù)V(a0,s)分解為:
其中:{a0,a1,…,an}是由MAXQ 算法得到的一條自上而下的節(jié)點(diǎn)路徑,圖1 為V(a0,s)的計(jì)算方法[11]。
圖1 根節(jié)點(diǎn)值函數(shù)的計(jì)算方法
將B-MAXQ 工作原理應(yīng)用于電子調(diào)速器調(diào)速過(guò)程中,其步驟包括:
1)建立Mi的轉(zhuǎn)速-PID4 元組序列seq{},其內(nèi)容包括{子任務(wù),原子動(dòng)作,前置條件,后置條件},其中,Mi代表第i 個(gè)子任務(wù),i 為正整數(shù)。子任務(wù)指柴油機(jī)當(dāng)前轉(zhuǎn)速;原子動(dòng)作指執(zhí)行器PID 的參數(shù)組合,每個(gè)子任務(wù)都是由若干個(gè)原子動(dòng)作完成;前置條件為PID 執(zhí)行前一時(shí)刻柴油機(jī)需要滿足的速度;后置條件為當(dāng)前目標(biāo)轉(zhuǎn)速。
建立轉(zhuǎn)速-PID 預(yù)測(cè)表Ptable (Prediction table),當(dāng)Mi完成時(shí),那么將此時(shí)輸入完整的seq{}序列輸入到轉(zhuǎn)速-PID 預(yù)測(cè)表中,并將seq{}序列清空,使得下次執(zhí)行其他子任務(wù)時(shí)再使用。
2)B-MAXQ 概率預(yù)測(cè)的理論的構(gòu)建:在已知柴油機(jī)的當(dāng)前轉(zhuǎn)速及目標(biāo)轉(zhuǎn)速的條件下,采用概率統(tǒng)計(jì)方法和Bayes 公式來(lái)估計(jì)某一組特定的PID 集合執(zhí)行的概率,設(shè)表示在第j 時(shí)刻的電子調(diào)速器認(rèn)為在第i 時(shí)刻的s 轉(zhuǎn)速下可能采取某一組PID 參數(shù)集合ak的概率。若電調(diào)在s 轉(zhuǎn)速下探索不同PID 集合的次數(shù)為(Ni)s,以及電調(diào)在探索某一PID 參數(shù)集合ak的次數(shù)為,那么pj(s,i,ak)的計(jì)算公式為:
3)當(dāng)電子調(diào)速器發(fā)現(xiàn)柴油機(jī)處于s 轉(zhuǎn)速時(shí),根據(jù)當(dāng)前的目標(biāo)轉(zhuǎn)速預(yù)測(cè)應(yīng)采取何種PID 參數(shù)集合作為自己的最優(yōu)反應(yīng)策略,執(zhí)行器根據(jù)此時(shí)選取的PID參數(shù)集合進(jìn)行齒條位置的調(diào)節(jié),在進(jìn)行一系列連續(xù)動(dòng)作后,使柴油機(jī)處于目標(biāo)轉(zhuǎn)速s′,那么就可以根據(jù)當(dāng)前PID 參數(shù)集合aj和目標(biāo)轉(zhuǎn)速s′來(lái)預(yù)測(cè)出執(zhí)行器下一時(shí)刻的PID 參數(shù)組合。根據(jù)貝葉斯公式得出:
式中:p(ai|aj,s′)表示柴油機(jī)處于轉(zhuǎn)速s 并且此時(shí)執(zhí)行器的PID 參數(shù)集合為aj時(shí),預(yù)計(jì)執(zhí)行器下一時(shí)刻采取PID 參數(shù)集合ai的概率;p(s,|aj,ai)是執(zhí)行器采取聯(lián)合PID 集合ai、aj后到達(dá)目標(biāo)轉(zhuǎn)速s′的轉(zhuǎn)移概率,p(s′|ai)為執(zhí)行器采取PID 集合ai后柴油機(jī)到達(dá)目標(biāo)轉(zhuǎn)速s′的轉(zhuǎn)移概率。由此可將公式作為推廣:執(zhí)行器某時(shí)刻的PID 參數(shù)集合記為ak,其余PID 參數(shù)集合為ak′(不含ak),即得到推廣公式為:
以柴油機(jī)電子調(diào)速任務(wù)作為分層模型,每個(gè)子任務(wù)是由柴油機(jī)的目標(biāo)速度定義的,當(dāng)執(zhí)行器運(yùn)行某一組PID 參數(shù)時(shí),達(dá)到目標(biāo)轉(zhuǎn)速時(shí),則終止當(dāng)前子任務(wù)。如果獲取到每個(gè)子任務(wù)的PID 集合,則可視為獲取整個(gè)任務(wù)的調(diào)速策略。
當(dāng)每個(gè)Mi子節(jié)點(diǎn)學(xué)習(xí)完成后則獲取的是局部的PID 參數(shù),每個(gè)Mi均有終止?fàn)顟B(tài),若所到達(dá)的終止態(tài)不滿足上層任務(wù)的子目標(biāo)轉(zhuǎn)速,那么就視為此時(shí)獲取的PID 參數(shù)是不利于局部?jī)?yōu)化的,對(duì)這種策略應(yīng)該賦負(fù)獎(jiǎng)賞值加以抑制,因此在各個(gè)子任務(wù)中增加即時(shí)評(píng)價(jià)函數(shù)(s 為柴油機(jī)當(dāng)前轉(zhuǎn)速),然后在Vi節(jié)點(diǎn)中增加的完成函數(shù),由決定當(dāng)前的行為策略,而Mi節(jié)點(diǎn)向上層計(jì)算Vi時(shí)仍使用C。因此每個(gè)子任務(wù)的V 節(jié)點(diǎn)需要構(gòu)建Ci(s,a)(s,a)兩張函數(shù)表,而原子動(dòng)作i 只需要構(gòu)建V(i,s)(∑P(s′|s,i)R(s′|s,i),P(s′|s,i)表示在執(zhí)行子任務(wù)i 時(shí)柴油機(jī)的當(dāng)前轉(zhuǎn)速s,當(dāng)執(zhí)行完畢后達(dá)到柴油機(jī)目標(biāo)轉(zhuǎn)速s′的概率;R(s′|s,i)表示柴油機(jī)的當(dāng)前轉(zhuǎn)速為s,當(dāng)子任務(wù)執(zhí)行完畢后達(dá)到目標(biāo)轉(zhuǎn)速s′的獎(jiǎng)勵(lì)值),定義(為子任務(wù)的完成函數(shù),V 表示子任務(wù)的值函數(shù))為根據(jù)此刻完成函數(shù)和值函數(shù)V 確定柴油機(jī)達(dá)到目標(biāo)轉(zhuǎn)速s′采取的最佳PID 集合。
綜上所述,B-MAXQ 的原理如下:
1)在柴油機(jī)當(dāng)前轉(zhuǎn)速s 下執(zhí)行動(dòng)作i(由當(dāng)前的PID 參數(shù)集合直接映射的動(dòng)作),收到回報(bào)值為r(s,i),觀察新的目標(biāo)轉(zhuǎn)速s′。
2)更新原子動(dòng)作獎(jiǎng)勵(lì)
3)將當(dāng)前轉(zhuǎn)速s,完成協(xié)作任務(wù)Mi的所有執(zhí)行器PID 參數(shù)集合以及目標(biāo)轉(zhuǎn)速s′壓入序列seq 的開(kāi)頭。
1)若Mi為協(xié)作子任務(wù)時(shí),包括以下步驟:
a)利用模擬退火算法來(lái)選擇PID 參數(shù)集合aj,令ChildSeq=B-MAXQ(Mi,aj,s),當(dāng)Mi為協(xié)作子任務(wù),以(Mi,aj,s)為研究對(duì)象,并且將其輸入到BMAXQ 算法中進(jìn)行迭代求最優(yōu)策略,ChildSeq 為Seq的子序列,當(dāng)每個(gè)ChildSeq 均求解成功后,Seq 序列組合成功。其中ChildSeq 為子任務(wù)Mi所執(zhí)行的速度-PID 參數(shù)序列(包括當(dāng)前轉(zhuǎn)速,PID 參數(shù)序列,以及目標(biāo)轉(zhuǎn)速);
b)根據(jù)當(dāng)前轉(zhuǎn)速s 以及目標(biāo)轉(zhuǎn)速s′去選擇執(zhí)行器PID 參數(shù)序列,當(dāng)前轉(zhuǎn)速s,以及目標(biāo)轉(zhuǎn)速s′所對(duì)應(yīng)的執(zhí)行器PID 參數(shù)集合為:
c)最優(yōu)PID 參數(shù)集合a*計(jì)算如下:
d)令N=0,對(duì)于序列中每一個(gè)(s,a),都進(jìn)行 如下運(yùn)算:
e)將ChildSeq 添加到seq{}首位,并且當(dāng)前轉(zhuǎn)速s 用目標(biāo)轉(zhuǎn)速s′代替;
f)將seq 序列按層次順序添加到Ptable中。
2)獎(jiǎng)賞函數(shù)、學(xué)習(xí)率?t以及動(dòng)作策略的設(shè)置,其步驟包含如下:
a)如表1 為不同精度等級(jí)的調(diào)速性能指標(biāo)。學(xué)習(xí)行為的好壞可由獎(jiǎng)賞函數(shù)作為評(píng)判標(biāo)準(zhǔn)。按照GB/T3475-2008 規(guī)定[12],判斷電子調(diào)速器的性能可由穩(wěn)態(tài)轉(zhuǎn)速波動(dòng)率、瞬態(tài)調(diào)速率和轉(zhuǎn)速穩(wěn)定時(shí)間來(lái)平衡。
表1 不同精度等級(jí)的調(diào)速性能指標(biāo)
本文根據(jù)GB/T3475-2008 標(biāo)準(zhǔn),柴油機(jī)電子調(diào)速器在負(fù)荷突變時(shí)以及穩(wěn)態(tài)工作下的獎(jiǎng)賞函數(shù)設(shè)計(jì)如下:
b)理論上講,獎(jiǎng)賞值獲得的越高證明PID 選擇得越好,如果想獲得高獎(jiǎng)賞值,那么每個(gè)PID 都必須選擇最高的Q 值動(dòng)作,但是在學(xué)習(xí)的初期,選擇最高Q 值的PID 集合往往導(dǎo)致電子調(diào)速器總是采用相同的高Q 值動(dòng)作,不能探索其它PID 集合,故尋優(yōu)策略會(huì)陷入局部最優(yōu)當(dāng)中。為了使PID 參數(shù)集合的選取具有隨機(jī)性,并且能在試探過(guò)程中發(fā)現(xiàn)更好的PID參數(shù)集合,那么采用Boltzmann 探索策略,由以完成函數(shù)來(lái)定義其探索方式,在轉(zhuǎn)速s 下選擇PID 集合aj的概率定義為:
c)將學(xué)習(xí)率?t設(shè)置:
如圖2 所示為一種基于B-MAXQ 的電子調(diào)速方法流程框圖。
圖2 一種基于B-MAXQ 的電子調(diào)速方法流程框圖
為了驗(yàn)證本文提出的B-MAXQ 算法的有效性,根據(jù)柴油機(jī)工作原理,建立了D6114 型柴油機(jī)平均模型,如圖3 所示為柴油機(jī)總體模型,如圖4 所示為基于B-MAXQ 算法的柴油機(jī)調(diào)速系統(tǒng)模型,并在matlab/simulink 軟件上進(jìn)行仿真。
圖3 柴油機(jī)總體模型
圖4 基于B-MAXQ 算法的柴油機(jī)調(diào)速系統(tǒng)模型
D6114 柴油機(jī)是由6 個(gè)氣缸組成,結(jié)構(gòu)為直列四沖程,行程為135 mm,缸徑為114 mm,額定轉(zhuǎn)速為1 500 r/min,燃油泵為直列柱塞泵。
試驗(yàn)通過(guò)柴油機(jī)起動(dòng)及穩(wěn)態(tài)試驗(yàn)和加減載試驗(yàn),測(cè)試B-MAXQ 自適應(yīng)可預(yù)測(cè)調(diào)速算法的調(diào)速性能,并以GB/T3475-2008 作為評(píng)價(jià)標(biāo)準(zhǔn),其評(píng)價(jià)調(diào)速性能以對(duì)比轉(zhuǎn)速波動(dòng)率v,瞬態(tài)調(diào)速率δ,轉(zhuǎn)速恢復(fù)時(shí)間τ 為主,通過(guò)分析試驗(yàn)結(jié)果來(lái)驗(yàn)證B-MAXQ 算法性能。
采取B-MAXQ 算法進(jìn)行200 次柴油機(jī)起動(dòng)控制試驗(yàn),試驗(yàn)數(shù)據(jù)按照試驗(yàn)順序進(jìn)行每50 次為一組記錄,記錄的4 組試驗(yàn)數(shù)據(jù)進(jìn)行擬合圖像,即試驗(yàn)圖像如圖5 所示。
從試驗(yàn)結(jié)果圖像分析可知:利用B-MAXQ 算法可使柴油機(jī)順利起動(dòng),并且起動(dòng)后可直接、順利、準(zhǔn)確地進(jìn)入低轉(zhuǎn)速控制,過(guò)渡過(guò)程平穩(wěn)、快速,過(guò)渡時(shí)間小于2 s。隨著試驗(yàn)次數(shù)的增加,柴油機(jī)轉(zhuǎn)速波動(dòng)率、瞬態(tài)調(diào)速率以及轉(zhuǎn)速恢復(fù)時(shí)間均有不同程度的改善,即隨著試驗(yàn)次數(shù)的增加,柴油機(jī)在起動(dòng)過(guò)程中,柴油機(jī)轉(zhuǎn)速上升迅速,且在一定范圍內(nèi),超調(diào)量變小,轉(zhuǎn)速穩(wěn)定時(shí)間變短,轉(zhuǎn)速波動(dòng)變小。試驗(yàn)證明:使用B-MAXQ 自適應(yīng)行為預(yù)測(cè)PID 算法在柴油機(jī)起動(dòng)過(guò)程中,能夠通過(guò)自適應(yīng)學(xué)習(xí)自主改善柴油機(jī)的主要性能指標(biāo)。
圖5 第1~200 次起動(dòng)試驗(yàn)數(shù)據(jù)擬合圖像
試驗(yàn)中設(shè)定柴油機(jī)的目標(biāo)轉(zhuǎn)速為1 200 r/min,其中以對(duì)調(diào)速器的性能要求最高,最能表現(xiàn)調(diào)速器調(diào)速性能的突加100%負(fù)載和突卸100%負(fù)載為主要試驗(yàn)[13],試驗(yàn)進(jìn)行200 次,試驗(yàn)數(shù)據(jù)按照試驗(yàn)順序進(jìn)行每50 次為一組記錄,記錄的4 組試驗(yàn)數(shù)據(jù)進(jìn)行擬合圖像,即試驗(yàn)圖像如圖6 所示,根據(jù)圖像中轉(zhuǎn)速峰值以及穩(wěn)定時(shí)間的變化,具體試驗(yàn)數(shù)據(jù)見(jiàn)表2 和表3。
圖6 第1~200 次100%加減載試驗(yàn)數(shù)據(jù)擬合圖像
表2 100%突加負(fù)載試驗(yàn)數(shù)據(jù)分析
表3 100%突減負(fù)載試驗(yàn)數(shù)據(jù)分析
從試驗(yàn)結(jié)果分析可知:利用B-MAXQ 算法進(jìn)行柴油機(jī)的突加100%負(fù)載和突卸100%負(fù)載均可順利達(dá)到目標(biāo)轉(zhuǎn)速,且過(guò)渡過(guò)程平穩(wěn),穩(wěn)態(tài)時(shí)轉(zhuǎn)速波動(dòng)小于±70。分析表2、表3 數(shù)據(jù)可知,隨著試驗(yàn)次數(shù)的增加,柴油機(jī)轉(zhuǎn)速波動(dòng)率、瞬態(tài)調(diào)速率以及轉(zhuǎn)速恢復(fù)時(shí)間均有不同程度的改善,即隨著試驗(yàn)次數(shù)的增加,柴油機(jī)在100%加減負(fù)荷過(guò)程中,柴油機(jī)在一定范圍內(nèi),超調(diào)量變小,轉(zhuǎn)速穩(wěn)定時(shí)間變短,轉(zhuǎn)速波動(dòng)變小。試驗(yàn)證明:使用B-MAXQ 自適應(yīng)行為預(yù)測(cè)算法在柴油機(jī)100%加減負(fù)荷工作過(guò)程中,能夠通過(guò)自適應(yīng)學(xué)習(xí)自主改善柴油機(jī)的主要性能指標(biāo)。
試驗(yàn)結(jié)果表明,基于B-MAXQ 自適應(yīng)預(yù)測(cè)PID算法在柴油機(jī)調(diào)速系統(tǒng)中具有更小的超調(diào)率和更短地穩(wěn)定時(shí)間,具體結(jié)論如下:
1)利用概率統(tǒng)計(jì)Bayes 公式和MAXQ 算法結(jié)合所提出的B-MAXQ 自適應(yīng)預(yù)測(cè)PID 算法,可實(shí)現(xiàn)執(zhí)行器自主調(diào)節(jié)齒條位置,從而使柴油機(jī)更快更穩(wěn)定地達(dá)到目標(biāo)轉(zhuǎn)速。
2)B-MAXQ 算法中構(gòu)建轉(zhuǎn)速-PID 集合預(yù)測(cè)表以及增加即時(shí)評(píng)價(jià)函數(shù)以及相應(yīng)的完成函數(shù),使調(diào)速過(guò)程中學(xué)習(xí)經(jīng)驗(yàn)?zāi)軌虻玫綇?fù)用并且實(shí)現(xiàn)電子調(diào)速器自調(diào)整過(guò)程,從而達(dá)到預(yù)測(cè)執(zhí)行器PID 參數(shù)集合的目的。
3)通過(guò)進(jìn)行多次柴油機(jī)起動(dòng)試驗(yàn)以及100%加減負(fù)載試驗(yàn)證明,B-MAXQ 算法在控制柴油機(jī)工作過(guò)程中,不僅能夠滿足柴油機(jī)調(diào)速的各項(xiàng)指標(biāo),并且隨著試驗(yàn)次數(shù)的增多,還能在一定范圍內(nèi)自適應(yīng)優(yōu)化自身性能,具有廣泛的實(shí)際應(yīng)用價(jià)值。