楊 蓉,楊 林,譚盛蘭,張 松,黃 偉,黃俊明
(1.廣西大學機械工程學院廣西制造系統(tǒng)與先進制造技術重點實驗室,南寧530004;2.廣西玉柴機器股份有限公司,玉林537005)
柴油機因熱效率高、燃油經濟性好、工作范圍廣等特點被廣泛地應用于交通、電力、農業(yè)等領域[1]。柴油車是排放NOx的主要移動源,截至2019年底,中國柴油車NOx排放總量占全國汽車NOx排放總量的88.9% 以上[2]。為了改善環(huán)境空氣質量,加快建設美麗中國的步伐,柴油車排放的NOx已經成為打贏藍天保衛(wèi)戰(zhàn)的重點攻克對象之一。以尿素為還原劑的選擇性催化還原(selective catalytic reduction,SCR)技術是降低柴油車NOx排放的主要途徑。通常情況下,SCR 對NOx的凈化效果受尿素噴射量的影響[3]。尿素噴射量過少,NOx的排放量仍可能超標;尿素噴射量過多,將導致氨氣排放增加,污染環(huán)境。為嚴格監(jiān)控柴油車的污染物排放,目前已有政策指出重型柴油車應開展全天候、全方位的排放監(jiān)控,利用機動車道路遙感監(jiān)測設備、排放檢驗機構聯網實現重型柴油車遠程排放監(jiān)控。
當前SCR 系統(tǒng)中尿素基本噴射量的控制主要通過查表法確定,即依據柴油機轉速與噴油量查找柴油機穩(wěn)態(tài)工況的NOx排放MAP 圖決定,所以SCR 系統(tǒng)對柴油機NOx排放的凈化程度很大程度依賴柴油機臺架標定試驗。柴油機臺架標定試驗是獲得柴油機穩(wěn)態(tài)NOx排放MAP 圖最直接的方法,該方法可靠且結果說服力強,但試驗成本高且標定時間長。隨著各種新技術在柴油機上應用,原本就是多輸入多輸出的柴油機系統(tǒng)變得更為復雜,致使排放標定難度成倍增加。其次,標定過程中工作人員操作是否得當也會影響標定結果。此外,對于使用年限較長的柴油機,由于其結構老化、噴油系統(tǒng)磨損等現象,導致同一工況下通過MAP 圖查表得到的柴油機NOx排放值可靠度降低。更重要的是,通過臺架試驗標定得到的是柴油機穩(wěn)態(tài)特性,不一定適用于瞬態(tài)特性。因此,目前相關研究人員為了降低發(fā)動機試驗成本及優(yōu)化SCR 系統(tǒng)尿素噴射量的控制,已開始利用柴油機NOx排放模型預測不同工況下的柴油機NOx排放[4-7]。
隨著機器學習的迅速發(fā)展,神經網絡模型目前已被廣泛應用于預測柴油機穩(wěn)態(tài)和瞬態(tài)的NOx排放[8-14]。區(qū)別于穩(wěn)態(tài)工況,柴油機瞬態(tài)運行過程中所經歷的各個工況點無法被視為互相獨立的工況點。相關研究[13-14]指出,柴油機瞬態(tài)過程中所經歷的工況點,能夠在連續(xù)時間內反映出柴油機性能參數變化的趨勢。針對這種趨勢,本文中將借鑒時間序列預測的思想,考慮柴油機過去運行狀態(tài)對當前NOx排放的影響,構建一種運用遺傳算法(genetic algorithm,GA)優(yōu)化后的長短期記憶(long short term memory,LSTM)神經網絡模型,并評估該模型對柴油機瞬態(tài)NOx排放的預測效果,為SCR 系統(tǒng)尿素噴射量的精確控制提供參考。
LSTM 神經網絡是一種部分反饋神經網絡,通過引入門控機制,避免了誤差反向傳播過程中出現梯度消失和爆炸的現象,能有效地對過去狀態(tài)進行判斷,加強了學習樣本的長時依賴關系[15]。LSTM神經網絡對時序數列具備良好的處理能力,被廣泛地應用于電力與流量負荷預測等領域。
圖1 所示為LSTM 神經網絡基本單元結構,其中Ct-1表示t-1 時刻單元的狀態(tài)矩陣,其元素的值在0 到1 之間,值越大表示上一刻被保留的信息越充足;St-1表示的t-1 時刻單元的輸出矩陣;Ct、St分別表示單元在t時刻的狀態(tài)與輸出矩陣。f 與tanh表示網絡層,其中f 層的激活函數為sigmoid 函數,tanh 層激活函數為tanh 函數。在LSTM 神經網絡中,遺忘門與輸出門是更新單元狀態(tài)信息的主要結構,其中遺忘門決定了Ct-1和St-1是否被保留在t時刻的Ct中,而輸入門則決定了當前輸入Xt有多少信息需要被保留在當前的Ct中。LSTM 基本單元結構如式(1)~式(6)所示。式中,ft、it分別為遺忘門中f 層、輸入門中f 層與輸入門中tanh 層在t時刻的輸出矩陣;Wfx為外部輸入Xt與遺忘門中f 層的連接權值矩陣;Wfs為上一刻輸出St-1與遺忘門中f 層的連接權值矩陣;bf為遺忘門中的偏置向量;Wix為Xt與輸入門中f 層的連接權值矩陣;Wis為St-1與輸入門中f 層的連接權值矩陣;bi為f 層的偏置向量;Wcx為Xt與輸入門中tanh 層的連接權值矩陣;Wcs為St-1與輸入門中tanh 層的連接權值矩陣;bc為tanh 層的偏置向量;⊙為Hadamard 乘積,表示兩個矩陣中對應位置元素相乘;Wox為Xt與輸出門中f 層的連接權值矩陣;Wos為St-1與輸入門中f 層的連接權值矩陣;bo為輸出門f 層的偏置向量;ot為f 層的輸出矩陣。
圖1 LSTM 神經網絡基本單元結構示意圖
LSTM 根據時間反向傳播(back propagation through time,BPTT)算法更新網絡參數[16]。即BPTT 算法中誤差是按照時間反向傳播的,在誤差反向傳播計算過程中St的誤差包含了t時刻及t時刻以后的誤差,故計算每一時刻的誤差時都需通過計算St與Ct+1實現。
試驗測試對象為一臺排量為7 L、帶增壓中冷的電控高壓共軌車用柴油機,其基本參數如表1 所示。測試設備主要包括發(fā)動機控制單元(engine control unit,ECU)標定套件(ETAS-INCA 6.0 軟件及接口等)、用于測試整機燃油消耗的AVL 735 油耗儀、測試轉速與轉矩的AVL PUMA 臺架測試系統(tǒng)、測試機油壓力與溫度的AVL ComsysLube 554 機油監(jiān)控系統(tǒng)、測試冷卻水溫度與壓力的AVL ComsysCool 553 冷卻水監(jiān)控系統(tǒng)及測量NOx排放的AVL AMA i60 常規(guī)氣體排放測試儀等。
表1 發(fā)動機基本參數
對該款柴油機進行歐洲瞬態(tài)循環(huán)(European transient cycle,ETC)測試,其轉速、轉矩和NOx排放如圖2 所示,其中測試時長為2 022 s。測試過程中,臺架測試系統(tǒng)根據發(fā)動機外特性曲線,在最高轉矩點(1 000 r/min、1 050 N·m)和最高轉速點(2 300 r/min、100% 負荷)分別對發(fā)動機進行預熱,總預熱時長為222 s,此后為1 800 s 的ETC測試。研究中每隔0.1 s 采集記錄1 個工況數據,共采集記錄了20 220 個瞬態(tài)工況點。
圖2 轉速、轉矩及NOx排放隨時間的變化趨勢
在瞬態(tài)過程中,轉速與轉矩不斷變化,進而使得進氣量、噴油量及噴油規(guī)律等隨之發(fā)生變化,從而對柴油機燃燒性能和排放產生影響。本文中預選擇了轉速、轉矩、進氣量、總噴油量、主噴提前角、預噴提前角、軌壓及主噴持續(xù)時間作為模型的輸入參數,部分數值如表2 所示。
表2 部分預選變量數值
為了從預選變量中選擇合適的參數作為模型的輸入,剔除與NOx生成相關性不顯著的參數,對上述參數分別進行了相關性分析。本文中對預選參數分別采用了Pearson 相關系數“R”分析和Spearman 相關系數“ρ”分析,其中Pearson 相關系數用于分析參數間的線性相關程度,Spearman 相關系數用于分析參數間的非線性相關程度。
表3 所示為各預選變量對NOx生成的相關性分析結果,其中相關系數的正值表示預選變量與NOx呈正相關,兩者變化趨勢相同;而相關系數的負值表示預選變量與NOx呈負相關,兩者變化趨勢相反。此外,相關系數絕對值越接近1,兩參數間的相關性越強;相關系數絕對值越接近于0,兩參數間的相關度越弱。表3 中相關性分析結果在0.01 級別時,變量間相關性不顯著。從表3 可知,轉速、主噴提前角和預噴提前角與NOx的Pearson 相關系數絕對值高于Spearman 相關系數絕對值;轉矩、進氣量、總噴油量、軌壓和主噴持續(xù)時間的Spearman 相關系數絕對值更高。從整體上看,除轉速和預噴提前角外,其余變量與NOx生成的相關性較強。
表3 相關性分析結果
雖然轉速與NOx的相關系數較低,但是轉速是反映柴油機當前運行狀態(tài)的主要參數,其對NOx生成的影響不可輕易忽略。此外由于現代柴油機多采用高壓共軌技術,可實現燃油分段噴射,而合適的預噴策略可以實現柴油機油耗、NOx與碳煙排放的綜合優(yōu)化[17],因此也無法忽視預噴提前角對NOx排放的影響。綜上所述,本文中將保留所有預選參數。
由于無法將每個瞬態(tài)工況點視為互相獨立的工況,因此需要考慮上述參數的歷史狀態(tài)對當前NOx排放的影響。此外排放測試設備探頭安裝在排氣總管上,受排氣運動的影響,無法將測試得到的NOx排放結果理想化地等同于對應時刻柴油機缸內燃燒循環(huán)產生的NOx排放濃度,在建立瞬態(tài)排放預測模型時需要綜合考慮各預選參數和NOx排放的歷史狀態(tài)對當前NOx排放量的影響。
圖3 為各預選參數和NOx排放的歷史狀態(tài)與當前NOx排放的相關系數的計算結果。其中轉速、主噴提前角、預噴提前角和NOx采用Pearson 相關系數進行分析計算,轉矩、進氣量、總噴油量、軌壓和主噴持續(xù)時間采用Spearman 相關系數計算。
圖3 歷史狀態(tài)相關性分析
對神經網絡而言,減少網絡輸入參數有利于降低網絡結構復雜度,進而加快網絡收斂速度,但是可能降低網絡的預測性能,因此必須在保證模型最終預測性能的前提下降低模型結構的復雜度。研究按照0.75∶0.15∶0.15 的比例將數據依次劃分為訓練集、驗證集和測試集,即訓練集為0 至第1 415.4 s 的ETC 循環(huán)測試數據,共14 154 個工況點,驗證集為第1 415.5 s至第1 718.7 s 的ETC 循環(huán)測試數據,共3 033 個工況點,測試集為第1 718.8 s 至第2 022.0 s 的ETC 循環(huán)測試數據,共3 033 個工況點。建立了3 種輸入參數不同的LSTM 神經網絡模型,用以判斷歷史狀態(tài)對當前NOx排放的影響。3 種LSTM 模型參數設置如表4所示。
表4 模型參數設置
輸入參數間的數量級差距明顯,為了合理平衡不同數量級的輸入參數對輸出參數的影響,采用min-max 標準化將輸入輸出參數映射在[-1,1]之間,標準化計算公式如式(7)所示。式中,i為參數個數;j為樣本個數;Xij為第i個參數、第j個樣本的原始數據;Ximax為第i個參數的最大原始數據;Ximin為第i個參數的最小原始數據;xij為第i個參數、第j個樣本的歸一化數據。
預測計算完成時,輸出參數還應按式(8)進行反歸一化處理。
式中,xj為輸出變量第j個預測結果;Xmax為原輸出變量中的最大值;Xmin為原輸出變量中的最小值;Xj為相應預測結果的反歸一化數據。
模型建立后,還需要對模型進行評價,本文中選用Pearson 相關系數R、決定系數R2、均方根誤差Rrmse及平均絕對誤差Mmae作為評價指標,用以評估具有不同輸入參數的LSTM 模型的預測效果。各評價指標數學表達式如式(9)~式(12)所示。
式中,yi為實際期望值為BP 神經網絡輸出值;n為樣本總量。
本文中對3 種LSTM 模型進行了多次測試,并對每次測試進行統(tǒng)計分析,計算其評價指標,以均值作為判斷模型預測性能的最終依據。表5 為不同模型輸入參數下LSTM 模型對驗證集的預測效果。從表5 可知,輸入參數中,考慮了預選參數與NOx排放的歷史狀態(tài)的LSTM(1)模型與LSTM(2)模型的測試效果優(yōu)于未考慮歷史狀態(tài)的LSTM(3)模型。與LSTM(2)模型相比,LSTM(1)模型的整體預測效果表現更佳。雖然從表5 可看出考慮轉速與預噴提前角的歷史狀態(tài)對當前NOx排放影響的LSTM(1)模型較LSTM(2)模型的Rrmse和Mmae的降低幅度并不明顯,分別為3.597% 和2.226%,但不考慮轉速與預噴提前角的歷史狀態(tài)會降低模型的預測精度,故對這2 個參數予以保留。
表5 3 種LSTM 模型測試效果對比
增加模型的輸入參數將增加模型的復雜度,使模型的計算時間延長。為了對比LSTM(1)模型和LSTM(2)模型的預測時間,研究復現了兩種模型對驗證集的預測過程,并分別進行了10 次測試。測試結果顯示,LSTM(1)模型總耗時為345.436 517 s,LSTM(2)模型的總耗時為343.191 599 s,前者的總耗時相比后者增加了0.65%。由此可見,雖然LSTM(1)模型的預測精度相比LSTM(2)模型有所增加,但同時也犧牲了系統(tǒng)響應時間。本研究的初衷是盡可能提高模型的預測精度,因此最終選擇了LSTM(1)模型。
結合圖3 與表5 的測試結果,本文中最終確定預測模型的輸入參數為t-1 時刻與t時刻的轉速、轉矩、進氣量、總噴油量、主噴提前角、預噴提前角、軌壓、主噴持續(xù)時間及t-1 時刻的NOx排放量。
通過測試分析具有不同隱含層層數的LSTM(1)模型的預測性能,可以確定預測模型的隱含層層數。其中每一層隱含層上的神經元數均設置為30,即每增加1 層隱含層,就增加30 個神經元。表6 所示為不同隱含層下LSTM(1)模型對驗證集的預測效果。從表6 可看出,具有兩層隱含層的LSTM(1)模型預測效果最佳,R和R2最高,分別為0.977 和0.954;Rrmse與Mmae最低,分別為177.360 和141.066。因此,確定預測模型的隱含層為2 層。后文中再提及LSTM(1)模型,均是指具有2 層隱含層的LSTM(1)模型。
表6 具有不同隱含層的LSTM(1)模型的預測效果
學習率與隱含層神經元數均會對模型的預測性能造成一定影響。其中學習率決定訓練過程中模型能否收斂至最小值及何時收斂;而隱含層神經元數則決定訓練過程中模型能否有效地從樣本中提取其潛在規(guī)律。此外,在目前主流的機器學習框架(如TensorFlow、Kears、Theano 及MATLAB 深度學習工具箱)中,通常采用小批量梯度下降算法訓練LSTM 神經網絡,即使用訓練集中的部分樣本(Batchsize)更新修正連接權值與偏置,保證網絡預測性能的同時減少訓練時長。由于上述參數的選取對LSTM 神經網絡的預測效果影響明顯,因此需要選取合適的參數,保證模型的預測性能。
學習率、隱含層神經元數及Batchsize 的選取范圍廣,依照經驗法等傳統(tǒng)調參方法難以對這些參數進行合理選取。遺傳算法[18]是一種基于種群的自適應全局搜索進化算法,通過借助概率實現在搜索范圍內搜索方向的自動調整,進而求解待優(yōu)化問題的最優(yōu)解。本文中采用遺傳算法對LSTM(1)模型的學習率、隱含層神經元數及Batchsize 進行組合選取,進而構建預測柴油機瞬態(tài)NOx排放的GA-LSTM 模型,即應用遺傳算法優(yōu)化后的LSTM 模型。遺傳算法優(yōu)化LSTM(1)模型流程如圖4 所示。
圖4 遺傳算法優(yōu)化LSTM(1)模型流程圖
首先,將待優(yōu)化參數(學習率、隱含層神經元數和Batchsize)作為遺傳算法的優(yōu)化對象,并根據其各自優(yōu)化范圍進行染色體初始化,建立染色體種群;將染色體重組賦值于LSTM(1)模型進行訓練,并將計算得到的驗證集預測值與實際值之間的均方誤差作為評價染色體適應度優(yōu)劣的指標;然后,對染色體進行遺傳操作,并將更新的染色體再賦值于LSTM(1)模型訓練,直至篩選出具有最佳適應度值的染色體;最后對篩選出的染色體進行解碼,以實現GA-LSTM 模型的訓練過程。GA-LSTM 模型參數設置如表7 所示。
表7 GA-LSTM 模型參數設置
圖5 展示了遺傳算法優(yōu)化學習率、隱含層神經元數和Batchsize 過程中迭代軌跡的變化趨勢。從圖5 可以看出,隨著迭代次數的增加,染色體適應度值呈現出逐級遞減的趨勢。在迭代35 次后趨于穩(wěn)定,其最優(yōu)均方誤差為0.063 67。通過遺傳算法優(yōu)化,得到LSTM(1)模型的最優(yōu)學習率、隱含層神經元數和Batchsize 組合為0.058、26 和360。
圖5 遺傳算法迭代軌跡
圖6 所示為LSTM(1)模型與GA-LSTM 模型對驗證集的測試效果。從圖6 可以看出,采用遺傳算法優(yōu)化后的LSTM(1)模型(后文將統(tǒng)一稱為“GA-LSTM 模型”)對驗證集的測試效果明顯優(yōu)于LSTM(1)模型。其中,GA-LSTM 模型預測的NOx排放曲線與NOx實際排放曲線的重合度較高,其R與R2分別為0.992 和0.983,較LSTM(1)模型分別提高了0.015 與0.029。此外,與LSTM(1)模型相比,GA-LSTM 模型預測值與實際值間的偏差相對較小,其Mmae與Rrmse分別為89.780 和119.345,較LSTM(1)模型分別降低了36.356% 與32.710%,由此也體現出遺傳算法組合優(yōu)化LSTM(1)模型參數的有效性。
圖6 LSTM(1)模型與GA-LSTM 模型的驗證預測結果
利用遺傳算法對LSTM(1)模型的學習率、隱含層神經元數與Batchsize 進行組合尋優(yōu)后,進一步確定了具有最佳參數的柴油機瞬態(tài)NOx排放預測模型,即GA-LSTM 模型。雖然通過圖6 已經可以看出不同模型的預測效果,但是模型的泛化性能還需要進一步評估。選擇ETC 循環(huán)測試工況中的測試集進一步對模型的泛化能力進行分析驗證。圖7 展示了經過訓練后GA-LSTM 模型對測試集的預測結果。
圖7 GA-LSTM 模型預測結果
由圖7(a)可知,基于GA-LSTM 模型的NOx排放預測曲線與實際NOx排放曲線基本重合,預測誤差整體較小。通過計算得出GA-LSTM 模型對測試集的NOx預測值與實際NOx排放值間的R與R2分別為0.993 與0.985,Rrmse和Mmae分別為75.645 和56.218。此外,殘差分布區(qū)間也可反映模型的預測效果。圖7(b)統(tǒng)計了GA-LSTM 模型預測值與實際值間的預測殘差分布情況,其中直方體的寬度代表預測殘差區(qū)間。從圖7(b)中可以看出,GA-LSTM模型對預測集的預測殘差主要集中在[-200,200]區(qū)間內,工況點數共有2 989 個,約占預測集樣本總數的98.5%。其中有278 個工況點落入[-200,-100)區(qū)間,有1 537 個工況點落入[-100,0)區(qū)間,有984 個工況點落入[0,100)區(qū)間,有190 個工況點落入[100,200]區(qū)間。有2 521 個工況點的預測殘差分布在[-100,100]區(qū)間內,約占預測集樣本總數的83.1%。此外從圖7(b)中也可看出,存在34 個工況點的預測殘差分布在[-200,200]區(qū)間外,僅占整個預測集樣本總數的1.1%。由此可知,建立的GALSTM 模型具有較好的泛化性,能夠較為準確地預測出未參與模型訓練的ETC 循環(huán)工況點的NOx排放數值。
(1)考慮歷史狀態(tài)對當前NOx排放的影響,可以使預測模型具有更好的預測效果,降低模型預測誤差。
(2)利用遺傳算法優(yōu)化LSTM 神經網絡參數的組合,可以有效避免依據經驗人為選取參數的不利影響,提高模型的預測性能。
(3)本文中提出的GA-LSTM 模型對柴油機瞬態(tài)NOx排放有較好的預測效果。