潘恒斌 官維 潘明章 梁科 文濤 姜淑君
摘要: ?在嚴格的排放法規(guī)面前,柴油機后處理系統(tǒng)發(fā)揮了不可估量的作用,而獲取NO ?x 排放是后處理系統(tǒng)中SCR裝置得以正常工作的前提之一。建立一種使用獵人獵物優(yōu)化(HPO)算法優(yōu)化長短期記憶(LSTM)網(wǎng)絡的虛擬預測模型,實現(xiàn)對柴油機NO ?x 排放準確預測,以代替現(xiàn)有物理傳感器或作為并行裝置監(jiān)控其運行。試驗在柴油機測功機上進行,在高度瞬態(tài)的柴油機運行周期內,輸入了若干種便于獲取且與NO ?x 形成密切相關的參數(shù)至模型中,結果表明:該優(yōu)化后的網(wǎng)絡應用于測試集和全新的未知瞬態(tài)工況時,與未優(yōu)化網(wǎng)絡的預測結果相比,RMSE分別提高了29.1%和23.4%, R 2分別大于和接近0.95,預測結果與傳感器測量值呈現(xiàn)高度相同的變化趨勢,滿足了車載運用和準確性的需求,驗證了該方法的可行性。
關鍵詞: ?柴油機;氮氧化物;預測;獵人獵物優(yōu)化算法;長短期記憶網(wǎng)絡
DOI ?: ??10.3969/j.issn.1001-2222.2024.01.011
中圖分類號: ?TK421.5 ??文獻標志碼: ?B ??文章編號: ??1001-2222(2024)01-0067-09
自從19世紀末柴油機問世以來,其便以熱效率、經(jīng)濟性和可靠性等方面的優(yōu)勢廣泛應用于商用車領域和工業(yè)機械中。然而柴油機在排放方面的劣勢不容忽視,而排放法規(guī)日益嚴苛,2019年7月試點實施的國六排放標準更是對柴油機主要排放物NO ?x 和PM提出了新的要求。
NO ?x 虛擬預測是針對車輛實時排放控制要求而發(fā)展起來的一種新技術。傳統(tǒng)的物理傳感器受限于造價高昂和瞬態(tài)實時測量性能不佳等因素,在后處理系統(tǒng)中應用存在一些弊端;而NO ?x 虛擬技術通過構建模型,可以精準地輸出目標值與若干輸入量之間的關系,具有快速動態(tài)響應和離線預測能力。該模型可以是根據(jù)經(jīng)驗或模型標定擬合成的多項式函數(shù),亦可是無法獲取內部詳細演算規(guī)律的黑箱模型。這種技術逐漸引起人們的關注,因為它能夠彌補傳統(tǒng)物理傳感器的不足,提供實時且準確的NO ?x 排放預測值。
精準地預測柴油機主要排放物便可以獲取實時的燃燒動態(tài),進而對缸內燃燒進行閉環(huán)反饋控制。通過調節(jié)噴油器的相關參數(shù)改善燃燒狀態(tài)量,從而達到降低排放的目的。此外,在SCR系統(tǒng)中為了保證NO ?x 和氨之間處于理想的化學計量比,提高還原反應的效率,避免出現(xiàn)NO ?x 的不完全還原或氨的過量生成, 需要對下游的NO ?x 濃度進行精準測量,為尿素噴射量的確定提供依據(jù)。綜上所述, NO ?x 虛擬預測技術在后處理系統(tǒng)中的應用具有巨大潛力。
針對NO ?x 的排放預測,眾多學者進行了大量研究。在排放物產(chǎn)生機制的建模方面,Jung Dohoy等[1]將燃油噴霧進行分區(qū),用完整的發(fā)動機循環(huán)直接預測NO ?x 排放,結果顯示兩者變化基本一致,但由于分區(qū)較多,循環(huán)仿真耗時較多,故計算速度較慢。Andersson等[2]以Zeldovich機理為基礎,以噴油和進氣參數(shù)作為輸入還原缸內燃燒過程,但是由于模型過于理想化,僅在部分小負荷工況下預測結果較吻合,其余工況不理想。
在經(jīng)驗擬合建模方面,Lopez等[3]利用缸壓信號和進氣濃度基于經(jīng)驗公式進行NO ?x 排放建模,由于輸入?yún)?shù)量不足,表征的燃燒有效信息有限,穩(wěn)態(tài)工況下測量誤差就達10%,瞬態(tài)工況下則更大。Ebner等[4]基于缸壓開發(fā)NO ?x 虛擬傳感器,模型是一個二次多項式函數(shù),與某型號NO ?x 物理傳感器相比,它在一個循環(huán)內的響應時間更快,可預測的工況范圍更廣,但是其預測精度不佳,僅能反映出NO ?x 的變化趨勢。除多項式回歸模型外,利用神經(jīng)網(wǎng)絡預測污染物排放值的方法在過去二十年間得到了廣泛研究[5-8]。Atkinson等[9]提出基于循環(huán)神經(jīng)網(wǎng)絡(RNN)來估算柴油機和汽油機的瞬態(tài)NO ?x 排放,從結果直觀看出對柴油機的預測效果明顯優(yōu)于汽油機。通用汽車公司[10]提出一種基于前饋神經(jīng)網(wǎng)絡算法的NO ?x 排放預測方法,提取了與NO ?x 排放相關性較大的5個燃燒狀態(tài)參數(shù)作為輸入,以NO ?x 排放作為輸出來訓練網(wǎng)絡,并在模型中加入動態(tài)補償項以提高加速工況中NO ?x 排放精度,結果表明總體預測精度仍有待提升。Alcan等[11]采用基于Sigmoid的具有外源輸入的非線性自回歸(NARX)模型來預測穩(wěn)態(tài)和瞬態(tài)循環(huán)下給定輸入集的NO ?x 排放,生成不同參數(shù)值的模型來分析對參數(shù)變化的敏感性,并提出了一種易于解釋的映射的參數(shù)選擇方法來找到最佳建模參數(shù);但試驗結果表明,所獲得的大多數(shù)模型的穩(wěn)態(tài)和瞬態(tài)驗證精度僅高于80%和70%。Tang等[12]以油耗、負荷和柴油混合比為輸入?yún)?shù),建立了生物柴油發(fā)動機排放性能的雙隱層BP神經(jīng)網(wǎng)絡模型,得到了NO ?x 排放預測值和試驗值隨燃油消耗量的變化曲線,結果表明NO ?x 排放的預測結果在燃油消耗量低時與試驗結果吻合良好,相關系數(shù) R 很高,但是該預測值會隨著燃油消耗量的增加而逐漸偏離試驗值,僅能確保兩者趨勢一致。
在前饋神經(jīng)網(wǎng)絡中,參數(shù)傳遞具有單向性,最終輸出只依賴于當前輸入,該網(wǎng)絡處理的對象是具有一定因果關系的一組隨機變量之間的數(shù)值關系。而發(fā)動機輸入?yún)?shù)為時序數(shù)據(jù),長期處理此類數(shù)據(jù)往往具有局限性。在深度學習中,模型的選擇取決于數(shù)據(jù)類型與研究目的,以循環(huán)神經(jīng)網(wǎng)絡(RNN)為代表的模型常用于處理該類序列數(shù)據(jù)。RNN神經(jīng)元不僅可以接收其他神經(jīng)元的信息,還能從自身提取信息,這就形成了有環(huán)路的網(wǎng)絡結構,反饋值隨時間反向傳播,算法按照時間逆序將誤差往前傳遞作為 附加網(wǎng)絡進行輸入??紤]到RNN網(wǎng)絡處理長時間序列的局限性,本研究使 用RNN模型的改進LSTM模型,將其離線訓練完畢后對柴油機下游的NO ?x 排放進行實時的虛擬預測。此外,獵人獵物優(yōu)化算法是近兩年提出的智能優(yōu)化算法,具有優(yōu)化迭代迅速、收斂效果顯著的優(yōu)勢,該算法的使用旨在高效準確尋找全局最優(yōu)的LSTM超參數(shù)組合,避免單一模型陷入局部最優(yōu)解,最終達到提高預測精度的目的。
1 ??試驗
1.1 ?試驗平臺
試驗臺架由增壓水冷式高壓共軌柴油機、瞬態(tài)交流電力測功機、AVL735油耗儀、AVL PUMA臺架測試系統(tǒng)和AVL AMA氣體排放分析儀等組成。柴油機的基本參數(shù)如表1所示,試驗臺架示意見圖1。
1.2 ?工況選取及數(shù)據(jù)獲取
根據(jù)中國現(xiàn)行的污染物排放限值及測量的相關法規(guī)進行了世界統(tǒng)一瞬態(tài)試驗循環(huán)(WHTC)測試,全程1 800 s。為了防止數(shù)據(jù)量過少產(chǎn)生過擬合或數(shù)據(jù)量太大模型收斂時間長的情況,設定測試采樣頻率為0.1 s,可獲取約18 000個瞬態(tài)工況點的數(shù)據(jù)。此外為了驗證模型的泛化能力,以歐洲瞬態(tài)循 環(huán)(ETC)測試作為驗證工況,全程同樣1 800 s,采樣頻率仍為0.1 s,得到約18 000個瞬態(tài)工況點數(shù)據(jù)。
需要指出的是,柴油機SCR系統(tǒng)啟動溫度約為200 ℃,柴油機在冷起動狀態(tài)下尿素噴射裝置處于禁用狀態(tài),此時估算NO ?x 的排放值是無意義的。因此在進行循環(huán)測試之前,對柴油機在最高轉速點和 轉矩點進行了約5 min的充分預熱,緊接著操控臺架進入WHTC循環(huán)程序,與此同時開始記錄數(shù)據(jù)。
上述數(shù)據(jù)是通過標定套件(INCA-ETAS數(shù)據(jù)采集和MDA數(shù)據(jù)分析)來獲取的,結合現(xiàn)有的傳感器等設備采集了8個預選輸入變量:進氣流量、進氣總管下游氧含量、廢氣溫度、進氣溫度、增壓壓力、軌壓、轉速、當前循環(huán)噴油量,還采集了需預測的輸出量NO ?x 排放值。
2 ??LSTM ?模型建立
2.1 ?RNN ?循環(huán)神經(jīng)網(wǎng)絡
如前所述,前饋神經(jīng)網(wǎng)絡中由于信息的單向傳遞性,各輸入和輸出之間彼此相互獨立,其數(shù)值在時間線上并無關聯(lián),且數(shù)據(jù)的順序具有任意交換性。該特點使得模型加快了獲得各輸入與輸出間的非線性關系,但同時會犧牲模型擬合的準確性。特別是對于柴油機NO ?x 排放值這類典型的時間序列,它在某瞬態(tài)工況點是受過去連續(xù)時刻內多因素的共同作用,用前饋神經(jīng)網(wǎng)絡處理時無法直接利用過去的信息,因此需要采用以RNN為代表的神經(jīng)網(wǎng)絡模型處理時間序列預測的問題。RNN的結構中隱藏層之間有節(jié)點的連接,當前隱藏層內的神經(jīng)元由此刻的輸入以及前一個隱藏層的輸出組成,構成了閉環(huán)的模型,可存儲過去時刻的信息,使其具有短期記憶功能,這就確保了過去時刻與當前時刻的關聯(lián)性。
然而RNN模型存在以下的缺點:首先是某一時刻的輸出只與上一時刻有關,但實際上柴油機的燃燒是一種動態(tài)過程,其NO ?x 在某一時刻的排放是過去連續(xù)時刻多變量累積的結果;其次在訓練的過程中隨著輸入量的增多網(wǎng)絡結構會展開得更長,反向傳播算法無法避免產(chǎn)生梯度消失和梯度爆炸的問題[13]。RNN神經(jīng)網(wǎng)絡僅具備短期記憶功能,而按照柴油機的連續(xù)運行時間所構成的工況點是較長時間序列,因此引出了RNN模型的改進結構——LSTM模型。
2.2 ?LSTM ?長短期記憶網(wǎng)絡
LSTM模型是RNN模型的變體,但特殊的結構使其具備處理長期和短期時間序列的功能。它總體結構與RNN類似,只是隱藏層有所差別且更為復雜,它的隱藏層結構如圖2所示。
由圖2可知, LSTM隱藏層中創(chuàng)造性地提出了4個交互層,即包括3個Sigmoid和1個tanh的激活函數(shù),前者的功能是把從前的輸入值壓縮到0~1之間,“1”即為保留,“0”即為舍棄,這樣可達到選擇性通過信息的目的。而長時間的記憶功能的實現(xiàn)是歸功于處于上方從左貫通至右的“傳送帶”,這條線上只有簡單的線性交互層,確保了過去信息的流通并基本保持不變。
LSTM的隱藏層包括遺忘門、輸入門、輸出門和記憶細胞單元,它們各自的激活函數(shù)對過去的信息進行篩選后匯入至“傳送帶”繼續(xù)進行信息的傳遞。從左至右各單元及涉及的公式如下:
1) ?f t 是遺忘門,用于決定 t -1時刻的信息量 h t-1 有多少能流入到 t 時刻狀態(tài) C t ,公式為
f t=σ W f · ?h t-1,x t +b f ?。 ?(1)
式中: σ= 1 1+e-x ?; W ?f是權重矩陣,其維度由輸入和隱藏層的維度決定; b ?f是偏置項。
2) ?i t 是輸入門,用于決定 t 時刻的輸入量 x t 有多少能保留至 C t ,公式為
i t=σ W i · ?h t-1,x t +b i ?。 ?(2)
3) ???t 是候選記憶細胞單元,輸入量經(jīng)過tanh函數(shù)生成了一個候選值向量,公式為
t= tanh ?W C· h t-1,x t +b C ?。 ?(3)
4) ?C t 是記憶細胞單元, t 時刻的短時記憶 ??t 和歷史時刻的長記憶 C t-1 會被共同加入到這個狀態(tài)中,遺忘門的存在可以使長久前的記憶得以保留,輸入門的存在使得 t 時刻關鍵的信息被讀取,這就是LSTM隱藏層結構的關鍵所在,其公式為
C t=f t · C t-1+i t · ??t 。 ?(4)
5) ?o t 是輸出門,用于決定 t 時刻的記憶細胞單元 C t 的信息有多少能輸出到此刻的隱藏層輸出 h t ,其公式為
o t=σ W o · ?h t-1,x t +b o ?。 ?(5)
6) LSTM隱藏層最終輸出 h t ,公式為
h t=o t · ?tanh ?C t ?。 ?(6)
2.3 ?建立 LSTM ?模型
2.3.1 ?數(shù)據(jù)預處理與預選變量的選取
測量設備長時間使用會造成短暫異常或失靈,因而產(chǎn)生較大測量誤差,為了不讓這些異常值對模型預測結果造成影響,務必對其進行剔除。
在工程上使用3 σ 準則處置:設一組數(shù)據(jù)為 X 1, X 2,X 3,…X n ,平均值為 ??,與均值的差為 d i= X i- (i=1,2,…n) ,即有下式:
σ= ?∑ n i=1 d2 i n-1 ??。 ?(7)
若某數(shù)據(jù)與均值的差滿足 ?d i >3σ ,就認為此為粗大值,須予以剔除。
此外,各輸入?yún)?shù)間量級差別過大及量綱的差異性減緩了模型迭代處理的速度,故還需要對輸入量進行歸一化處理,使所有的值落在[0,1]區(qū)間。
X??i= X i-X ?min ?X ?max -X ?min ??。 ?(8)
式中: X??i 是歸一化后的值。在最后輸出預測值之前還需要返回原量綱的值,即反歸一化:
X i=X??i X ?max -X ?min ?+X ?min ?。 ?(9)
本次采集數(shù)據(jù)共選擇了8個對NO ?x 生成具有潛在影響的預選變量,但對于神經(jīng)網(wǎng)絡而言,輸入的參數(shù)種類過多會造成維度太大,影響處理速度,反之則會影響模型預測精度。為了平衡其中的利弊,實踐中一般選擇5個左右更具典型性的預選變量作為輸入。在統(tǒng)計學中,相關系數(shù)是衡量兩種變量間相關性程度的指標,其取值范圍是[-1,1],絕對值越大時相關性程度越高,常見的有Pearson系數(shù)和Spearson系數(shù)。Pearson系數(shù)對數(shù)據(jù)集本身要求較高,且強調的是兩個數(shù)據(jù)集間線性相關的程度,而此次分析中關注的是NO ?x 與其他預選變量間的單調關系,而非嚴格的線性關系,因此均采用Sperson系數(shù)進行分析,得到了如圖3所示的相關性熱圖。
以圖3中的關聯(lián)度排序作為依據(jù),選取增壓壓力、進氣流量、廢氣溫度、循環(huán)噴油量和軌壓作為輸入。盡管轉速的關聯(lián)度排名從理論上得出的結論是靠后的,但是該指標反映柴油機在任一時刻的運轉情況,是無法替代的重要參數(shù),因此也需將其作為輸入,至此共有6個預選變量被選取作為模型輸入?yún)?shù)。
2.3.2 ?訓練集與測試集的劃分
訓練集選取的原則是選擇的范圍盡可能涵蓋柴油機運行的典型工況,以復現(xiàn)出任何瞬態(tài),使網(wǎng)絡具有更佳的泛化能力。WHTC循環(huán)測試是聯(lián)合國歐洲經(jīng)委會GRPE小組制定的全球技術法規(guī)第4號定義的瞬態(tài)發(fā)動機測功表,涵蓋了全球統(tǒng)一的重型認證發(fā)動機尾氣排放程序,再現(xiàn)了歐盟、美國和日本等國家和地區(qū)具有代表性的駕駛工況。因此選用采集的WHTC循環(huán)的18 492個瞬態(tài)工況點對應的6個預選變量,將前150 s符合粗大誤差的異常工況點剔除后,剩余的工況點按照70%、30%劃分為訓練集和測試集(見圖4)。訓練方法采用自適應時刻估計(adam)學習算法。
2.3.3 ?基于網(wǎng)格搜索式的參數(shù)確定
在LSTM網(wǎng)絡中,參數(shù)可分為模型參數(shù)和超參數(shù)兩種:前者是在模型訓練時隨著梯度下降法自動更正的參數(shù),包括隱藏層各個門的權重矩陣及偏倚系數(shù)等;后者指的是訓練前就已經(jīng)被設置為某一固定值的參數(shù),包括LSTM層數(shù)、每層神經(jīng)元數(shù)量、最大迭代次數(shù)和初始學習率等。超參數(shù)是模型訓練過程的依據(jù),因此對其進行最優(yōu)化的選取,可顯著提高模型學習的效果,以獲得更佳的預測能力。
網(wǎng)格搜索法是確定超參數(shù)的手段之一,通常是每種超參數(shù)均在合理數(shù)值范圍內且按照一定間隔進行選取,并進行若干次訓練,從而盡可能遍歷多種超參數(shù)組合,本質上是一種窮舉法[14]。最后用評價指標評價,進而選擇最優(yōu)項。常用的評價指標有:均方根誤差RMSE、平均絕對誤差MAE、決定系數(shù) R 2,具體公式如式(10)~式(12)所示。
RMSE= ?1 ?n ∑ n i=1 ?y i-y ~ ?i 2 ?, ?(10)
MAE= 1 ?n ∑ n i=1 ?y i-y ~ ?i ?, ?(11)
R2=1- ∑ n i=1 ?y i-y ~ ?i 2 ∑ n i=1 ?y i-y i ?2 ?。 ?(12)
式中: y i 是實際值; ?y ~ ?i 是預測值; n 是工況點數(shù)目。
第一步確定LSTM層數(shù),當按經(jīng)驗指定其余超參數(shù)并保持其不變的情況下,從第1層開始進行訓練并在測試集上進行預測。重復若干次并記錄每次預測評價指標,取平均值后繼續(xù)逐一增加層數(shù),重復此步驟。一共進行了4層的訓練,得到的評價指標如表2所示。
由表中數(shù)據(jù)可知,當層數(shù)為2時RMSE和MAE值最低, R 2最接近1,且總耗時適中,因此LSTM層數(shù)設定為2。對于其余的超參數(shù),在合理數(shù)值范圍內進行多層網(wǎng)格搜索:每層神經(jīng)元數(shù)量從[20,50]按10的步長搜索;初始學習率從[0.002,0.005]按0.001的步長搜索;最大迭代次數(shù)從[150,300]按50的步長搜索。由此遍歷了64次搜索后,最終確定當每層神經(jīng)元數(shù)量均為40,初始學習率為0.004及最大迭代次數(shù)為250時評價指標最佳。整個網(wǎng)絡的建立過程如圖5所示。
按照上述方式選取的超參數(shù)組合訓練完畢后,模型應用在測試集的預測效果和殘差統(tǒng)計分布區(qū)間如圖6和圖7所示。由圖6和圖7可見,模型初步具備了預測總體趨勢的能力。僅66%的工況點落在[-50,50]的殘差區(qū)間,且在尖端點上誤差仍然較大,這也是仍有8%的工況點落在[-100,100]區(qū)間外的主要原因。若將訓練完畢的網(wǎng)絡模型用于全新工況的預測,結果將無法達到預期,這體現(xiàn)出網(wǎng)格搜索法的局限性。由于待選擇的超參數(shù)有4組,每組均有選取的范圍,且搜索步長有一定的間隔,所以極有可能無法捕捉到全局最優(yōu)組合,得到的只是局部最優(yōu)解。綜上,采用一種優(yōu)化算法——獵人獵物算法(HPO)優(yōu)化LSTM的超參數(shù),通過該算法搜尋目標范圍內最優(yōu)的超參數(shù)組合,使模型得到令人滿意的預測精度。
2.3.4 ?基于獵人獵物優(yōu)化算法的超參數(shù)確定
獵人獵物優(yōu)化算法(HPO)是Naruei[15]等在2021年提出的基于種群優(yōu)化算法,靈感來源于大自然一個群體中捕食者捕食獵物的行為。算法的實現(xiàn)步驟如下:
1) 將所有群體成員的初始位置隨機設為 ?x ?= x 1 ,x 2 ,…x n ??,同時各自的目標函數(shù)設置為 ?O ?= O 1,O 2,…O n ?;其中每個成員的位置 x i 與適應度 O i 由式(13)和式(14)確定:
x i= rand ?p,d ??ub-lb +lb , ?(13)
O i=f x → ??。 ?(14)
式中: p 是種群個數(shù); d 是需優(yōu)化的超參數(shù)個數(shù); ub 和 lb 分別是各超參數(shù)的上下界; f(x → ) 在該算法中是一個求解模型中訓練集RMSE的函數(shù),它是整個算法運行的依據(jù),顯然最終的目標是求解適應度函數(shù)的最小值,并在最大迭代次數(shù)后輸出。實踐中無法通過一次迭代獲取超參數(shù)的最優(yōu)組合,因此定義了由探索和開發(fā)兩個步驟組成的多次搜索機制:探索強調的是算法隨機搜索的行為,確保了算法不會陷入局部最優(yōu)解;開發(fā)是在探索到目標區(qū)域時停止對全局的隨機搜索,進一步對該區(qū)域深度挖掘。
2) 針對獵人的更新機制,該算法提出式(15):
x i,j t+1 =x i,j t +0.5[ 2CZP ?pos( j)-x i,j t ?+ 2 1-C Zμ (j)-x i,j t ?] 。 ?(15)
式中: x i,j(t+1) 和 x i,j(t) 分別是獵人下一次迭代位置和當前位置; P ?pos ?(j) 是獵物位置; μ (j) 是種群所有成員位置的平均值; Z 是由式(16)決定的適應性參數(shù)。
P=r 1 <C; IDX = P= =0 ?;
Z=r 2 IDX +r 3~ IDX ??。 ?(16)
式中: r 1 ?和 r 3 ?是[0,1]內的隨機向量; r ?2是[0,1]內的隨機數(shù); P 和IDX是滿足等式條件的索引值; C 是決定了探索或開發(fā)兩者占比的平衡參數(shù),由式(17)計算得到。
C=1-i ?0.98 I ?Max ??。 ?(17)
式中: i 是此時迭代次數(shù); I ?Max是最大迭代次數(shù)。從開始至迭代完全結束 C 的值將從1減少到0.02,這意味著算法由探索至開發(fā)的逐漸轉變。
3) 為了求出獵物的位置 P ?pos,先根據(jù)式(18)計算所有成員位置的平均值 μ ,
μ= ∑ n i=1 x i ?n ?; ?(18)
再根據(jù)式(19)計算獵物群體的 n 維歐氏距離,
D i = ∑ n j=1 ?x i,j-μ j 2 ?; ?(19)
最后根據(jù)上文提及的獵人捕食的思維,選擇距離群體最遠的個體作為目標獵物,因此有
P ?pos ?=x i 。 ?(20)
式中: i 是 D(i) ?max對應的指標。為了縮短算法收斂時間,根據(jù)實際狩獵場景提出了衰減機制:
k ?best=ceil ?C×p ?。 ?(21)
式中: p 是種群個數(shù); k ?best在開始時為 p ,結束時為1,為此改用式(22)得到獵物位置。
P ?pos ?=x j 。 ?(22)
式中: j 是 D(k ?best) max中括號內對應的指標。
4) 如前所述,目標獵物意識到被獵人鎖定后會盡力逃脫至安全位置,提出式(23)更新獵物位置。
x i,j t+1 =T ?pos( j)+CZ cos 2π r 4 × T ?pos( j)-x i,j t ??。 ?(23)
式中: x i,j(t+1) 和 x i,j(t) 分別是獵物下一次迭代位置和當前位置; ?T ?pos ?(j) 是安全位置; r ?4是[0,1]內的隨機數(shù)。
5) 至此,獵人和獵物的初始位置及更新機制已給出,最后一步是給出一個判斷依據(jù),使算法選擇走獵人或是獵物的路線。因此,引入一個取值在[0,1]內的隨機數(shù) r ?5和一個設值為0.1的選擇參數(shù) β 。當 r ?5< β 時,算法走獵人的路線,即由式(15)更新位置;反之算法走獵物路線,即由式(23)更新位置。
結合目前的數(shù)據(jù)規(guī)模,為避免程序運行時間過長,設定該算法的種群數(shù)量為20,最大迭代次數(shù)為40;對于待優(yōu)化的各超參數(shù)上下限,每層神經(jīng)元數(shù)量是[10,200],初始學習率是[0.001,0.200],最大迭代次數(shù)是[100,300]。優(yōu)化的流程如圖8所示。
當優(yōu)化程序運行完畢后,可以得到如圖9所示的進化曲線。圖9表明當?shù)M行至15次時適應度衰減至最低點并達到穩(wěn)定,此時對應的超參數(shù)如下:第一、二隱藏層神經(jīng)元數(shù)目為100和30,初始學習率是0.015,最大迭代次數(shù)是255。隨后將上述訓練完畢的網(wǎng)絡模型應用至測試集中,所得到的在測試集上的預測效果和殘差分布見圖10和圖11。
從測試集的預測結果直觀看出,當采用HPO優(yōu)化得出超參數(shù)組合,模型對數(shù)據(jù)的擬合效果有顯著提升,尖端點的預測效果得到明顯改善。從評價指標來看, R 2由原來的0.927 8提高到0.963 5,RMSE由原來的65.439 8優(yōu)化到46.347 9,優(yōu)化了29.12%,這表示模型對于輸入數(shù)據(jù)的理解和學習能力更強,可更好擬合真實情況。而從直方圖得知,落在[-50,50]殘差區(qū)間的工況點從66.2%提升至了85.5%,左右兩端的長尾現(xiàn)象有所緩和,離群值數(shù)量已然降低。結果表明:HPO算法的優(yōu)勢在于由各超參數(shù)的上下限決定的探索空間內,獵人或獵物可以在該范圍進行隨機性移動和選擇,并且衰減機制的存在保證了算法必定會收斂,每一次迭代的超參數(shù)組合會被保留,并從中選擇適應度最小的作為全局最優(yōu)解輸出。
3 ??結果對比與評估
為了進一步驗證模型的泛化能力,在測試集的基礎上引入另一種全新的工況,即ETC工況,以此測試如前所述的兩種訓練完畢的模型應對未知工況的預測精度。與此同時,建立一個相同網(wǎng)絡架構的BP模型與現(xiàn)有模型進行橫向對比,將其層數(shù)、每層隱藏層的神經(jīng)元數(shù)目、最大迭代次數(shù)和初始學習率等設置成與優(yōu)化后的LSTM模型一致;再建立一個NARX模型,將其輸入和輸出延遲步數(shù)設定為1,隱藏層結構也與優(yōu)化后的LSTM模型一致,兩者的訓練集均為圖4中WHTC工況選定的部分。4種模型的預測結果、殘差絕對值構成的散點圖以及評價指標如圖12和表3所示。
由預測圖和評價指標得知,BP模型和NARX模型在面對長時間序列問題時預測情況較不理想,大于400的殘差值占有相當?shù)谋壤_@是由于這兩種模型缺乏門控機制和記憶單元導致無法捕捉和存儲長期依賴關系,以及在反向傳播算法訓練時可能遇到了梯度消失或爆炸的問題,這些因素都將導致預測精度的降低。對于未知工況,LSTM網(wǎng)絡的泛化能力得到了有力證明,預測精度的下降在合理范圍內,尤其是優(yōu)化后的LSTM網(wǎng)絡其RMSE比未優(yōu)化的提高了23.4%, R 2接近于0.95,殘差的絕對值普遍在200以內且離群值的比例占比很低,預測值與傳感器實測值的軌跡相當近似。
4 ??結束語
柴油機NO ?x 排放是典型的連續(xù)型數(shù)值變量,因此提出了應用于時序預測的LSTM網(wǎng)絡模型。將各預選變量對NO ?x 產(chǎn)生及變化的相關程度排序,選取了廢氣溫度、增壓壓力、進氣流量、軌壓、循環(huán)噴油量和轉速作為輸入變量。采用了網(wǎng)格搜索法對LSTM網(wǎng)絡的各超參數(shù)進行選取,并對WHTC工況剔除異常值的工況點進行訓練和測試,初步驗證了模型的預測能力,結果表明在測試集上取得了較為一般的預測精度。
為了進一步提高模型的預測準確性,避免陷入局部最優(yōu)解,提出了HPO算法對LSTM超參數(shù)組合進行更為合理的選擇。將使用HPO優(yōu)化得到的組合模型再次應用于WHTC工況的測試集進行驗證,結果表明此次的模型預測精度取得了進一步的改善, R 2由原來的0.927 8提高到0.963 5,RMSE也優(yōu)化了29.1%。
最后引進ETC工況,將6個變量分別作為BP模型、NARX模型、網(wǎng)格搜索得到的LSTM模型和經(jīng)HPO優(yōu)化后的HPO-LSTM模型的輸入。經(jīng)對比得出BP模型和NARX模型預測效果有限,而HPO-LSTM模型在該工況下仍保持良好的預測精度,與未優(yōu)化的LSTM模型相比, R 2由原來的0.908 3提高到0.949 5,RMSE優(yōu)化了23.4%,具備預測未知瞬態(tài)工況下NO ?x 排放的能力。
參考文獻:
[1] ?Jung Dohoy,Assanis Dennis.Quasidimensional Modeling of Direct Injection Diesel Engine Nitric Oxide,Soot,and Unburned Hydrocarbon Emissions[J].ASME J. Eng. Gas Turbines and Power,2006,128(2):388-396.
[2] Ericson C,Westerberg B,Andersson M,et al.Modelling diesel engine combustion and NO ?x ?formation for model based control and simulation of engine and exhaust aftertreatment systems[C].SAE Paper 2006-01-0687.
[3] Arrègle Jean,López J,Guardiola Carlos,et al.Sensitivity Study of a NO ?x ?Estimation Model for On-Board Applications[C].SAE Paper 2008-01-0640.
[4] Winkler-Ebner B,Hirsch M,Del Re L,et al.Comparison of virtual and physical NO ?x -sensors for heavy duty diesel engine application[J].SAE International Journal of Engines,2010,3(1):1124-1139.
[5] 周斌,譚達明,魏道遠,等.基于神經(jīng)網(wǎng)絡的內燃機排放預測方法的研究[J].內燃機學報,2001,19(4):361-364.
[6] Perhinschi M G,Wayne W S,Clark N,et al.Neural Network Modeling of Emissions from Medium-Duty Vehicles Operating on Fisher-Tropsch Synthetic Fuel[C].SAE Paper 2007-01-1080.
[7] 胡杰,林峰,王天田,等.基于神經(jīng)網(wǎng)絡最小偏二乘法的柴油機NO ?x 排放預測模型[J].內燃機學報,2015,33 (6):510-515.
[8] 鄒浪,何超,李加強,等.基于機器學習的柴油機顆粒物濃度預測[J].車用發(fā)動機,2020(2):84-92.
[9] Atkinson C M,Long T W,Hanzevack E L.Virtual sensing: a neural network-based intelligent performance and emissions prediction system for on-board diagnostics and engine control[J].Progress in Technology,1998,73(301-314):2-4.
[10] ?Wang Y Y,He Y,Rajagopalan S.Design of Engine-Out Virtual NO ?x ?Sensor Using Neural Networks and Dynamic System Identification[J].SAE International Journal of Engines,2011,4(1):828-836.
[11] Alcan G,Unel M,Aran V,et al.Predicting NO ?x ?emissions in diesel engines via sigmoid NARX models using a new experiment design for combustion identification[J].Measurement,2019,137:71-81.
[12] Tang D,Xu Y C,Yao S D,et al.Prediction of emission performance in a diesel engine fuelled with bio-diesel based on double-hidden layer BP neural network[J].Applied Mechanics and Materials,2013,278:370-373.
[13] 梁宏濤,劉碩,杜軍威,等.深度學習應用于時序預測研究綜述[J/OL].計算機科學與探索:1-21.[2023-05-27].http://kns.cnki.net/kcms/detail/11.5602.TP.20230310.0857.002.html.
[14] 王鑫,吳際,劉超,等.基于LSTM循環(huán)神經(jīng)網(wǎng)絡的故障時間序列預測[J].北京航空航天大學學報,2018,44(4):772-784.
[15] Naruei I,Keynia F,Sabbagh Molahosseini A.Hunter-prey optimization: Algorithm and applications[J].Soft Computing,2022,26(3):1279-1314.
NO ?x ?Virtual Prediction Technology of Diesel Engine Based on HPO-LSTM
PAN Hengbin1,GUAN Wei1,PAN Mingzhang1,LIANG Ke1,WEN Tao1,JIANG Shujun2
(1.School of Mechanical Engineering,Guangxi University,Nanning 530004,China;2.Wuxi Institute of Technology,Wuxi 214121,China)
Abstract: ?In the face of strict emission regulations, the diesel engine post-treatment system plays an immeasurable role, and the acquisition of NO ?x ?emissions is one of the prerequisites for the normal operation of SCR device in the post-treatment system. A virtual prediction model that used hunter-prey optimization (HPO) algorithm to optimize long short term memory(LSTM) network was established to accurately predict NO ?x ?emissions of diesel engine in place of existing physical sensors or as a parallel device to monitor their operation. The test was carried out on a dynamometer of diesel engine. During the highly transient operation cycle of ?diesel engine, several parameters that were easy to obtain and closely related to NO ?x ?formation were input into the model. The results show that, compared with the prediction results of non-optimized network, RMSE increases by 29.1% and 23.4%, and ?R 2 is greater than and close to 0.95 respectively when the optimized network is applied to the test set or to a new unknown transient condition. The prediction results show a highly identical trend with the measured values of sensor, which meets the requirements of on-board application and accuracy and hence verifies the feasibility of this method.
Key ?words: ?diesel engine;NO ?x ;prediction;hunter-prey optimization algorithm;long short term memory network
[編輯: 潘麗麗]
收稿日期: ??2023-07-26; [HT6H]修回日期: ??2023-10-26
基金項目: ???國家自然科學基金面上項目(22172038);廣西重點研發(fā)計劃 (桂科AB21220059,桂科AB22080085)
作者簡介: ???潘恒斌(1999—),男,碩士,主要研究方向為柴油機排放控制;601570994@qq.com。
通訊作者: ???姜淑君(1980—),女,高級工程師,碩士,主要研究方向為內燃機燃燒排放;956671743@qq.com。