余 舒,楊志剛
(1. 寧波吉利汽車研究開發(fā)有限公司,浙江 寧波 315000; 2. 陜西汽車控股集團有限公司, 陜西 西安 710200)
隨著城市機動車保有量的不斷增加、城市交通擁堵問題的日益加劇, 機動車尾氣污染日益嚴重。對此,國家的排放法規(guī)日趨嚴格,國六排放標準即將全面實施。目前,滿足國六法規(guī)的重型車輛,其排放后處理技術,基本采用廢氣再循環(huán)(exhaust gas recirculation,EGR)結合氧化催化器(diesel oxidation catalyst,DOC)、顆粒捕集器(diesel particulate filter,DPF)、選擇性催化還原(selective catalytic reduction,SCR)一體化的后處理技術手段。同時,在排氣EGR后,安裝排氣節(jié)流閥和前NOx傳感器,DOC催化器前后分別安裝溫度傳感器,DPF前后安裝壓差傳感器,SCR催化器前后分別安裝溫度傳感器、Urea噴嘴以及后NOx傳感器,上述催化器、傳感器以及控制器等裝置設備通過耦合作用,形成一套整體的柴油車后處理系統,共同完成重型車輛尾氣凈化的功能[1-3]。
在復雜的后處理系統中,當Urea噴射不合理時,不僅會降低SCR系統性能,還會對環(huán)境造成二次污染,而SCR催化器的前、后NOx傳感器在其中發(fā)揮著監(jiān)測排放和反饋控制的作用。X.YUAN等[4]研究了SCR系統Urea噴射,采用開環(huán)控制策略,依據發(fā)動機轉速、扭矩和NOx原機排放脈譜圖,計算不同車輛工況下的Urea噴射量,并利用催化器溫度、排氣流量、前后NOx濃度等關鍵狀態(tài)參數進行噴射量修正,使SCR系統運行在最佳的性能區(qū)間,保證尾氣排放符合要求;X.SHI等[5]基于PID控制器,依據SCR系統下游的NOx濃度值、NH3泄露量和發(fā)動機的實時排氣流量,實現Urea溶液噴射量的精準控制;Y.YUJI等[6]和P.CHEN等[7]利用自適應控制算法,基于發(fā)動機工況、催化器溫度、廢氣流量確定基本噴射量,實現SCR系統噴射量隨環(huán)境變化和擾動的自適應控制。
筆者采用改進的機器學習算法:動態(tài)時間彎曲(dynamic time warping, DTW)-密度聚類算法(density-based spatial clustering of applications with noise, DBSCAN)、嵌入誤差反饋的卷積神經網絡(eCNN),結合重型車輛的15項參數和變量,構造重型車輛的原機NOx排放預測模型,應用于重型車輛的后處理SCR系統。通過嵌入預測模型的后處理控制器,作為替代系統入口處前NOx傳感器,為后處理系統的降本增效提供基礎支持。
重型車輛運行過程中,產生的變量參數多、樣本數量大,為構建合理的車輛排放預測模型,利用相關性分析從海量參數中篩選出與排放相關的變量;利用降維分析-主成分分析減少模型變量的維度,采用聚類分析處理相似數據,降低樣本數據量的大小。通過上述統計分析及機器學習算法,構造模型的訓練和測試數據集,以得到準確有效的車輛NOx排放預測模型,實現替代后處理系統入口處的前NOx傳感器,具體方案如圖1。
圖1 預測模型的替代方案Fig. 1 Alternative to predictive model
采集的原始樣本數據來源于200輛不同系列的重型商用車,時間跨度為3個月,數據規(guī)模約為2 000萬條。在采集的原始數據樣本中,不同傳感器或不同來源的變量數據間存在時間標簽錯位問題,需在數據集成時針對數據時間標簽進行對齊處理。
同時,采集的車輛參數需要通過轉換處理,衍生為與車輛或道路環(huán)境相關的變量參數,如:檔位傳動比和橋速比轉換為車輛實時檔位;GPS信號轉化為道路坡度信號;車輛迎風面積和整車質量等參數轉換為車輛比功率(vehicle specific power,VSP)等。通過參數轉化,將采集的車輛參數轉變?yōu)楦N合車輛特性的變量參數,部分參數轉換方法如圖2。
圖2 衍生參數計算邏輯Fig. 2 Calculation logic diagram of derivative parameter
通過采集和衍生,用于構造模型的數據樣本體量更加龐大,需要利用合理的數據預處理方法,縮減數據樣本量,構造模型的訓練和測試數據集。采用的數據預處理方法包括:變量相關性分析、降維(主成分)分析、聚類分析。
1.2.1 變量相關性分析
在車輛的可采集參數中,主要分為道路環(huán)境參數、發(fā)動機參數、車輛參數,這些參數主要包括:空氣溫度、空氣濕度、經緯度、海拔、道路坡度、道路類型、發(fā)動機轉速、發(fā)動機扭矩、發(fā)動機排氣流量、車輛速度、車輛加速度、車輛油耗、車輛檔位等。其中,一部分參數對車輛NOx排放的影響已在其他研究中得到原理性的驗證,如:發(fā)動機轉速、發(fā)動機扭矩、空氣溫度、空氣濕度、車輛油耗等[8];另一部分參數與車輛NOx排放的影響關系未知,需要應用合適的方法進行分析,以篩選出用于構建模型的特征參數。
若通過單因素變量的原則逐一分析車輛參數與NOx排放的影響關系,會面臨眾多變量難以有效控制的問題,且數據集龐大,難以快速簡潔篩選出數據集以得到影響關系。為此,利用皮爾遜(Pearson)和斯皮爾曼(Spearman)相關系數,分析各車輛參數對原機NOx排放的影響關系。當Pearson和Spearman系數的絕對值越接近1,則此變量對NOx排放相關關系越強;當系數取值在0.7以上,變量間的相關性較強;當相關系數數值越接近0,則表示此變量對NOx排放的影響微乎其微[9]。
依據Pearson和Spearman相關系數的計算公式,如式(1)、(2),計算車輛檔位、車輛加速度、道路類型、道路坡度、排氣流量、VSP[10]與車輛行駛過程中的NOx排放的相關性,據此評價各參數與NOx排放間的影響關系,相關系數的絕對值結果如圖3。
(1)
(2)
由圖3可知:在未知影響的車輛參數中,排氣流量與NOx的相關性系數均較小,表明其對重型車輛的NOx排放影響不明顯;車輛檔位、加速度、道路坡度和VSP的Pearson相關系數不大,但Spearman系數均處于0.7以上,說明上述參數與NOx排放存在強相關性;道路類型與NOx的Spearman相關系數大于0.6,表示道路類型與NOx排放存在一定相關性。
圖3 各車輛參數與NOx的相關系數Fig. 3 Correlation coefficient between various vehicle parametersand NOx
依據變量相關性分析,在繁雜的車輛參數中,篩選出NOx排放預測模型的有效輸入變量參數,包含:發(fā)動機轉速、發(fā)動機扭矩、車輛速度、車輛加速度、車輛油耗、道路坡度、道路類型、車輛檔位、車輛VSP,構成建模分析的訓練集和測試集。
1.2.2 主成分分析
在車輛采集參數中,與NOx排放存在相關性的參數較多,但相關參數間也存在較強的相關關系,參數間存在大量重復信息。如直接利用變量參數的數據集構造模型,會因為多重共線性問題降低模型預測精度。為解決變量多造成的復雜性和共線性的問題,需找到新的評價參數,代替數量較多的原有特征參數,用更少的新變量集來盡可能的反映原始變量信息,在簡化的基礎上更好的解釋問題。
主成分分析作為統計分析中數據化簡和信息濃縮的主要方法,可將多個變量中的同類信息集中、提純,減少變量個數的同時,更好的解釋和利用變量中的數據信息。此方法可從NOx排放相關的多個變量中,提取出能表征原始變量參數特點且互不相關的主分量,用于揭示NOx排放的實際影響因素。在實際應用中,通常只選取前幾個方差最大的主成分,雖然損失了部分信息,但提取的絕大部分變異信息已足夠分析問題,既減少了變量數目,又抓住了問題本質。
依據式(3)的主成分分析的數學模型,結合主成分分析的原理,得到式(4)、式(5):
(3)
(4)
(5)
式中:Fi為第i個主成分;Xi為原始數據的集合;Zi為第i個主成分;li為X對應的單位特征向量;S為X的樣本協方差矩陣;XT為原始數據矩陣的轉置。
原則上,如果有n個原始變量,就可以提取出n個主成分,但是如果將它們全部提取出來,就失去該方法簡化變量的實際意義。一般是按照累計貢獻率的大小取主成分因子,當提取的多個主成分因子的累計貢獻率達到90%,表明提取的因子已包含足夠多的原始數據信息,其他的變量對因變量的影響較小,可以忽略不計。
針對上述眾多參數變量的數據集進行主成分分析,得到的主成分因子1~9的累計方差貢獻率如表1。
表1 主成分的累計方差貢獻率Table 1 Cumulative variance contribution ratio of principalcomponents
按照主成分分析計算的累計貢獻率可知,因子1~4的累計方差貢獻已達到90%以上,表明因子1~4已包含原始9個變量參數的大部分信息,據此可推斷出,影響NOx排放的最佳主成分因子為因子1~4。
主成分因子1~4確定后,結合式(3),通過變量的樣本數據計算主成分得分矩陣,構造各車輛參數與主成分因子之間的數學表達式,模型表達式的部分結構如式:
(6)
依據主成分的數學模型,可以將9個存在相關關系的車輛參數轉換為4個互不相關的主成分因子,將其作為車輛NOx排放預測模型的直接輸入變量參數。
1.2.3 DTW密度聚類
車輛參數的數據基本以時間序列形式存在于數據庫中,且車輛行駛產生的時序數據中存在較多的相似性特征,如:車速相同、發(fā)動機工況相同、加速度相同、油耗相同、道路坡度相同等。針對數據特點,擬采用聚類算法對數據進行離散化預處理,消除時間參數對模型的影響,考慮到各序列段的數據長度不一致,引入動態(tài)時間彎曲距離(dynamic time warping,DTW)作為序列片段的相似性類別判斷依據,據此篩選出合理的訓練集,作為車輛NOx排放預測模型的輸入集合。
密度聚類(DBSCAN)是基于空間密度的聚類算法,使用“領域”概念來描述樣本分布的緊密程度,將有足夠密度的樣本區(qū)域劃分為相似的類別,此算法不需要人為預先確定聚類數量,能有效解決聚類數量不合理導致的誤差;DTW算法,用于計算評估不同長度樣本序列間的距離,能有效解決車輛參數中相似特征樣本的數據段長度不同的問題。
結合兩種算法優(yōu)點,使用DTW-DBSCAN算法,通過DBSCAN確定有效的聚類中心,通過DTW算法的距離作為相似類別劃分的依據,計算更佳的聚類結果以構造合理的模型訓練樣本。此聚類算法的邏輯流程如圖4。
圖4 DTW密度聚類算法的流程Fig. 4 The flow chart of DTW and DBSCAN algorithm
綜合上述數據預處理算法,經過主成分降維、DTW密度聚類等機器學習算法,將原始數據集樣本劃分為不同類別,最終形成變量維度低、數據樣本精煉的模型訓練數據集,用于后續(xù)預測模型訓練。
原始數據樣本經1.2節(jié)預處理后,形成多個不同類別的數據片段集合,各集合中的序列片段均視為輸入矩陣,利用卷積神經網絡(convolutional neural networks,CNN)的“黑箱”模擬出輸入與輸出之間映射模型。預處理后的數據樣本,80%作為模型的訓練集,利用訓練集構造模型,利用另外20%樣本數據,進行預測模型的測試驗證,比較模型預測值和實測值。依據NOx排放模型預測的精確程度,分析模型用于替代后處理系統NOx傳感器的可行性。
eCNN模型,即在卷積神經網絡中,引入具有一定獨立性的誤差反饋神經元,以此來計算輸出誤差,修正最終輸出,改進模型在NOx排放突變情況下的收斂速度和預測精度。eCNN模型的結構包含:輸入矩陣、卷積層、池化層、誤差反饋單元、輸出層共5個層次,如圖5。
圖5 eCNN算法結構Fig. 5 The structure of eCNN algorithm
輸入層將預處理后的主成分數據和信息轉化為矩陣,用于卷積層進行特征提??;卷積層和池化層通過卷積核、平均池化原則,提取出各車輛主成分參數的特征;誤差反饋單元利用相同類別中上一次輸出的誤差,來補償修正當前輸出結果,此層包含當前輸出神經元和誤差反饋神經元;輸出層利用調整后的線性單元,預測車輛在不同狀態(tài)的NOx排放濃度。
通過改進的誤差反饋神經網絡模型,結合數據預處理算法,構建車輛NOx排放預測模型,結構如圖6。
圖6 NOx排放模型計算邏輯Fig. 6 Calculation logic diagram of NOx prediction model
將利用改進的eCNN方法構建的預測模型,與1維卷積神經網絡(1-D CNN)、卷積神經網絡(CNN)方法構建的預測模型進行比較,分析多種模型在NOx預測方面的性能差異。利用預處理后多個類別中的數據樣本,比較不同模型之間預測值的平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、均方根誤差(RMSE),結果如圖7。
圖7 不同模型的預測誤差比較Fig. 7 Comparison of prediction errors of different models
由圖7可知:eCNN構建的車輛NOx排放模型,其預測精度在CNN的基礎上有一定改善,特別在預測時長增加后保持了更高的精度,相對于其他回歸模型而言,預測精度有明顯的優(yōu)勢。
筆者用于建模的樣本數據為前NOx傳感器的數據,且后NOx預測需考慮物理化學過程,模型復雜,暫不考慮應用于后NOx傳感器。
為評價NOx排放預測模型替代系統前NOx傳感器的可行性,針對預處理數據和eCNN模型構建排放預測模型,分析模型預測值與實際測量值的差異,通過不同的后處理SCR系統技術指標,分析排放預測模型的精確度和可行性。
基于不同的SCR系統控制策略:開環(huán)策略系統和閉環(huán)策略系統,選擇合適的預測評價指標。
1)開環(huán)策略系統:系統的控制策略是依據車輛發(fā)動機實時工況參數和脈譜圖來實現,NOx傳感器實現排放監(jiān)測的功能[11],不做誤差反饋來修正系統參數;此時,預測模型的評價指標可為NOx排放濃度誤差和NOx比排放值誤差。
2)閉環(huán)策略系統:系統的控制策略是由前、后NOx傳感器的實時測量值來實現[12],基于實時測量濃度值,進行系統控制策略(Urea噴射量)的反饋修正;此時,預測模型的評價指標可設定為NOx濃度誤差、Urea噴射量誤差和NOx比排放誤差。
2.2.1 開環(huán)策略系統指標分析
在實施開環(huán)控制策略的后處理SCR系統中,NOx傳感器僅監(jiān)測處理后NOx排放是否達標。為驗證模型預測精度,針對NOx濃度和衍生的NOx原機比排放2個數據,分析模型預測值與實際值的差異,計算模型的擬合優(yōu)度,評價模型精度與可行性。
依據預處理數據和eCNN模型構建的預測模型計算NOx濃度值,并與傳感器的實測濃度進行比較,差異如圖8。
圖8 模型預測濃度值與實測值差異Fig. 8 Difference between the predicted concentration value of themodel and the measured value
由圖8可知:NOx預測模型的濃度預測值基本接近傳感器的實際測量值,兩數值的最大絕對誤差小于50 ppm,相對誤差百分比保持在2%以內。分析模型的擬合情況,由式(7)計算RMSE為4.3,RMSE的數值較小表明模型的擬合效果較好,可用于重型車輛的原機NOx排放預測。
(7)
在開環(huán)系統中,為探究濃度值差異對后處理系統的影響,可依據NOx濃度衍生的NOx比排放值作為評價指標。NOx比排放值,是指發(fā)動機輸出單位功率下產生的污染物氣體質量,主要用于評價車輛行駛時的排放水平,計算如式(8)(歐洲穩(wěn)態(tài)循環(huán),ESC[13])。
(8)
式中:λNOx為NOx的比排放值;ρNO, i為第i個工況點的NOx濃度值;qi為第i個工況點的流量;Pi為第i個工況的功率。
依據NOx排放預測模型和NOx傳感器的測量值,利用公式計算車輛比排放值,傳感器測量的比排放為:9.49 g/kWh,預測模型輸出的比排放為:9.38 g/kWh,兩比排放值的絕對誤差為0.11 g/kWh,相對誤差為1.16%,這說明:在車輛NOx排放水平的評估上,排放預測模型與NOx傳感器測量的差異較小。
在實施開環(huán)控制策略的后處理系統中,排放預測模型可準確模擬前NOx傳感器的測量信號,實時計算SCR系統的轉化效率,結合后NOx傳感器測量數據,分析尾氣處理水平和催化器性能。
2.2.2 閉環(huán)策略系統指標分析
后處理SCR系統實施閉環(huán)控制策略,即傳感器的測量值進入控制器中參與后處理系統決策,此時用NOx排放預測模型代替?zhèn)鞲衅鳎瑒t需驗證模型輸出濃度值對后處理SCR系統決策的影響。因此,閉環(huán)系統的評價指標包含:濃度值誤差、Urea噴射量誤差、NOx比排放誤差。
采用閉環(huán)策略的SCR系統,預測模型的NOx濃度值與傳感器的測量值見圖9。
圖9 閉環(huán)SCR系統的預測值與實測值差異Fig. 9 Difference between predicted value and measured value ofclosed-loop SCR system
由于NOx濃度值會影響SCR系統的Urea噴射量和NOx比排放值。為驗證影響程度,基于閉環(huán)控制策略的SCR系統中,將NOx濃度值帶入SCR系統的仿真模型,計算在相同工況和不同NOx濃度值下的Urea噴射量,如圖10;結合SCR催化器的物理化學模型,篩選出對應WHSC(世界統一穩(wěn)態(tài)循環(huán))的工況點[14],計算SCR系統在催化前、后的NOx比排放值,如圖11。比較不同濃度下的評價指標的差異程度,分析NOx預測模型替代前NOx傳感器的可行性。并比較預測模型和傳感器輸出NOx濃度值的差異對Urea噴射量和比排放的影響。
圖10 Urea噴射量差異Fig. 10 Difference of Urea injection volume
圖11 NOx比排放的差異Fig. 11 Difference of NOx specific emission
由圖10可知:兩種方式的NOx濃度平均差異為2.46 ppm,最大誤差不超過50 ppm,相對誤差低于3%;與此同時,閉環(huán)系統的Urea噴射量是基于NOx濃度來決策的,依據仿真計算結果,Urea噴射量的差異也較小,平均誤差為25.96 mL/h,最大誤差保持在49 mL/h以內,平均相對誤差為2.08%。
由圖11可知:由于兩種方式的NOx濃度平均濃度、Urea噴射量均差異較小,導致系統的NOx比排放值誤差也較小,替代后前NOx比排放相差約0.06 g/kWh,相對誤差較小,為0.75%;利用模型代替前NOx傳感器,實現尾氣排放處理后,比排放增加0.015 g/kWh,此時的比排放值為0.30 g/kWh,車輛的尾氣排放符合法規(guī)要求。因此,利用預測模型代替前NOx傳感器對后處理系統的性能影響較小。
在應用閉環(huán)控制策略的后處理系統中,排放預測模型的預測精度較高,可替代后處理系統中的前NOx傳感器,輸出合理NOx排放值,可確保Urea噴射量的精確控制,能實現后處理系統清潔尾氣的功能,并滿足國家的排放法規(guī)要求。
利用改進的數據預處理算法和eCNN,基于200輛重型車輛營運3個月的實際行駛數據,構建重型車輛后處理系統的NOx排放預測模型。
通過不同類型系統的評價指標:NOx濃度值、Urea噴射量、NOx比排放值,分析NOx排放模型預測值與傳感器的差異。結果表明:NOx排放預測模型的預測濃度與傳感器實際測量濃度誤差低于3%,系統的尿素(Urea)噴射量的變化小于2.08%;NOx的比排放變化保持在0.75%以內;利用預測模型替代傳感器的后處理系統與利用傳感器的系統之間差別較小。
在應用開環(huán)、閉環(huán)控制策略的后處理系統中,嵌入NOx排放預測模型,可替代后處理系統的前NOx傳感器,保證SCR系統的性能仍滿足法規(guī)要求,此方式能精簡后處理系統,有效降低硬件成本。