蔣 欽,葉 濤,張 舒,楊瑞
(武漢理工大學(xué) 機(jī)電工程學(xué)院,武漢 430070)
自從我國(guó)完成新型干法水泥技術(shù)替代后,我國(guó)水泥產(chǎn)量持續(xù)居于世界首位,占據(jù)世界水泥產(chǎn)量的60%左右[1],水泥產(chǎn)量自2019 年持續(xù)走高[2]。
在全球“碳中和”的背景下,國(guó)內(nèi)外學(xué)者致力于提高水泥行業(yè)能源利用率的研究,主要包含燒成設(shè)備改造、原燃材料代替及水泥能耗預(yù)測(cè)研究。文獻(xiàn)[3]通過(guò)擴(kuò)大分解爐體積、優(yōu)化撒料裝置及改用第四代篦冷機(jī)等一系列技術(shù)措施對(duì)5000 t/d 水泥熟料生產(chǎn)線進(jìn)行了技術(shù)改造,改造后噸熟料煤耗降低5.56 kg;文獻(xiàn)[4]在水泥生料中分別外摻ZnO、TiO2、MnO2、CuO 及CaF2,在不同摻量及不同溫度下比較各外摻物對(duì)生料易燒性的影響,結(jié)果表明含鋅、含鈦及含氟廢渣對(duì)生料易燒性改善最佳。
現(xiàn)有研究一般是利用歷史生產(chǎn)數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)算法建立水泥能耗模型,最后分析各參數(shù)與煤耗的關(guān)系從而達(dá)到煤耗優(yōu)化的目的。文獻(xiàn)[5]將偏最小二乘投影應(yīng)用于潛在結(jié)構(gòu)回歸,表明降低窯爐燒結(jié)溫度,可以在降低能耗和CO2排放的同時(shí),保證水泥熟料的質(zhì)量水平;文獻(xiàn)[6]使用聚合神經(jīng)網(wǎng)絡(luò)來(lái)提高單個(gè)人工神經(jīng)網(wǎng)絡(luò)非線性模型的魯棒性,為Ewekoro 水泥廠確定最佳操作參數(shù),達(dá)到了61.5%能源效率的最佳條件。
鑒于此,本文提出了一種CatBoost 結(jié)合粒子群算法(particle swarm optimization,PSO)的方式,對(duì)四川省某水泥廠的生產(chǎn)工藝參數(shù)進(jìn)行預(yù)測(cè)與優(yōu)化,最終確定最低噸煤耗和其對(duì)應(yīng)的工藝參數(shù),此外分析了不同工藝參數(shù)對(duì)煤耗調(diào)優(yōu)的影響程度。
本文主要針對(duì)水泥燒成系統(tǒng)做煤耗優(yōu)化,四川省某水泥廠的新型干法水泥煅燒工藝采用目前廣泛使用的“五級(jí)旋風(fēng)窯外預(yù)分解”技術(shù),工藝流程主要包括預(yù)熱分解、熟料燒成及熟料冷卻[7]。
預(yù)熱器出口氣體溫度及氣體成分對(duì)于煤耗支出有一定的影響,比如預(yù)熱器出口廢氣溫度偏高,說(shuō)明廢熱高溫氣體沒(méi)有與生料充分地進(jìn)行熱交換;預(yù)熱器C1 出口廢氣中CO 含量偏高,說(shuō)明窯爐內(nèi)通風(fēng)狀態(tài)不佳,燃料燃燒不充分,影響熱耗;從C5 預(yù)熱器至C1 預(yù)熱器的溫度應(yīng)該是逐級(jí)遞增的關(guān)系,如果出現(xiàn)溫度倒掛現(xiàn)象,也會(huì)影響熱耗[8]。如果分解爐出口氣體溫度低于C5 預(yù)熱器出口氣體溫度,也是煤粉不完全燃燒的現(xiàn)象。調(diào)整篦冷機(jī)推速可以控制熟料層的厚度,從而保證熟料驟冷;冷卻風(fēng)機(jī)用風(fēng)量的調(diào)整,可以直接影響二三次風(fēng)溫,間接地影響煤耗。喂料量過(guò)少不利于產(chǎn)量提升,過(guò)多會(huì)導(dǎo)致窯爐內(nèi)部供氧量不足;三次風(fēng)溫反映熟料冷卻效果,同時(shí)向分解爐提供熱源及空氣。
因此結(jié)合水泥生產(chǎn)線實(shí)際情況及廠內(nèi)專(zhuān)業(yè)人員的建議,選取46 項(xiàng)工藝參數(shù)用于煤耗優(yōu)化研究。
對(duì)于異常工藝參數(shù)直接剔除,而對(duì)于數(shù)據(jù)樣本的缺失值,為更好地進(jìn)行后續(xù)的研究,就需要對(duì)其進(jìn)行補(bǔ)充,常見(jiàn)的缺失值處理方法有刪除缺失值、回歸預(yù)測(cè)缺失值和線性插補(bǔ)等[9]。本文采集的數(shù)據(jù)樣本較少,基于計(jì)算成本及模型擬合性考慮,本文使用線性插補(bǔ)及均值替換的方法對(duì)缺失值進(jìn)行填充。
在水泥燒成系統(tǒng)中采集的工藝參數(shù)之間具有不同的量綱及單位,并且某些參數(shù)范圍變化很大。如果直接使用這些數(shù)據(jù)樣本訓(xùn)練模型,會(huì)造成部分?jǐn)?shù)據(jù)的特征提取困難,因此需要對(duì)采集的樣本數(shù)據(jù)進(jìn)行歸一化,用于提升訓(xùn)練時(shí)模型的收斂速度[10]。
本文分析的是噸煤耗與選取的工藝參數(shù)之間的關(guān)系,結(jié)合采集的數(shù)據(jù)及單位,噸煤耗計(jì)算公式為
式中:噸煤耗的單位為kg/t。
在構(gòu)建噸煤耗回歸預(yù)測(cè)模型之前,需要對(duì)所有工藝參數(shù)進(jìn)行相關(guān)性分析。本文中需要剔除Pearson相關(guān)系數(shù)絕對(duì)值低于0.2 的工藝參數(shù),預(yù)熱器三次風(fēng)壓、窯尾O2含量、C1 出口O2含量等22 項(xiàng)工藝參數(shù)與噸煤耗的相關(guān)系數(shù)絕對(duì)值均小于0.2,故刪去這22 項(xiàng)工藝參數(shù)。
對(duì)于噸煤耗預(yù)測(cè)來(lái)說(shuō),如果某個(gè)工藝參數(shù)方差很低,該工藝參數(shù)在煤耗預(yù)測(cè)中作用很小,就需要進(jìn)行刪除。在模型訓(xùn)練過(guò)程中,某些特征會(huì)出現(xiàn)相關(guān)性過(guò)高的現(xiàn)象,稱(chēng)為共線性。如果同時(shí)使用就會(huì)導(dǎo)致分析結(jié)果不穩(wěn)定,故需要消除共線性,即剔除其中某個(gè)工藝參數(shù)。找出Perason 相關(guān)系數(shù)絕對(duì)值大于0.85 的所有工藝參數(shù),只保留方差值較大的一項(xiàng),剔除掉其它工藝參數(shù)。最終剔除ID 風(fēng)機(jī)轉(zhuǎn)速、ID 風(fēng)機(jī)功率、預(yù)熱器出口CO、窯尾煙囪粉塵含量、窯尾煙囪O2含量這5 項(xiàng)參數(shù),剩余19 項(xiàng)工藝參數(shù)用作噸煤耗預(yù)測(cè)模型的輸入。
梯度提升決策樹(shù)(gradient boosting decision tree,GBDT)算法融合Boosting 算法和決策樹(shù)算法,由文獻(xiàn)[11]提出。XGBoost、LightGBM、CatBoost 都是在GBDT 算法的基礎(chǔ)上進(jìn)行了改進(jìn)。
隨機(jī)森林回歸是一種集成算法,由多棵回歸樹(shù)組成,模型的最終預(yù)測(cè)結(jié)果取所有回歸樹(shù)的均值[12]。XGBoost 繼承了CART 的優(yōu)點(diǎn),使用GBDT 算法訓(xùn)練新的決策樹(shù)將其加入到模型中[13]。LightGBM 由微軟開(kāi)發(fā),是基于決策樹(shù)的梯度提升框架[14]。CatBoost是Yandex 開(kāi)源的GBDT 改進(jìn)算法,以梯度提升對(duì)稱(chēng)樹(shù)為基學(xué)習(xí)器[15]。此外,CatBoost 把梯度增強(qiáng)算法改為有序增強(qiáng)算法,避免了迭代過(guò)程中的梯度偏移,增強(qiáng)了泛化能力。使用隨機(jī)森林、XGBoost、LightGBM 和CatBoost 的回歸預(yù)測(cè)效果如圖1 所示。
圖1 四種回歸器預(yù)測(cè)效果Fig.1 Four types of regressors predict performance
結(jié)合上述不同算法下的噸煤耗模型預(yù)測(cè)結(jié)果,對(duì)比結(jié)果如表1 所示??梢钥闯鯩AE、RMSE 越小,R2決定系數(shù)越高??傮w來(lái)看,CatBoost 在MAE、RMSE、R2決定系數(shù)優(yōu)于其它3 種算法。
表1 四種算法在默認(rèn)參數(shù)下的性能對(duì)比Tab.1 Performance comparison of four algorithms under default parameters
樹(shù)結(jié)構(gòu)Parzen 評(píng)估器(tree-structured parzen estimator,TPE)是使用高斯混合模型的一種非常規(guī)貝葉斯優(yōu)化算法[16]。TPE 算法優(yōu)化流程如圖2 所示。
圖2 TPE 算法優(yōu)化流程Fig.2 TPE algorithm optimization flow chart
經(jīng)過(guò)TPE 優(yōu)化后,隨機(jī)森林算法、XGBoost 算法、LightGBM 算法、CatBoost 算法的性能對(duì)比如表2所示。CatBoost 在MAE、RMSE、R2方面接近于XGBoost,并且單次迭代時(shí)間更短,所以本文選用基于CatBoost 算法建立的噸煤耗預(yù)測(cè)模型。
CatBoost 模型輸入端共有19 項(xiàng)工藝參數(shù),這些工藝參數(shù)耦合性很強(qiáng),傳統(tǒng)的經(jīng)驗(yàn)法很難通過(guò)調(diào)整這19 項(xiàng)工藝參數(shù),達(dá)到噸煤耗全局最優(yōu)的目的。粒子群算法收斂速度快、求解精度高,特別適用于單目標(biāo)優(yōu)化問(wèn)題,因此本文使用粒子群算法用于研究煤耗優(yōu)化問(wèn)題。
多參數(shù)優(yōu)化是使用PSO 算法篩選出的19 項(xiàng)工藝參數(shù)進(jìn)行優(yōu)化求解,找到一組最佳的工藝參數(shù)組合使噸煤耗最低。基于PSO 的參數(shù)優(yōu)化流程如圖3所示。
基于PSO 的迭代曲線如圖4 所示。可以看出在前100 次迭代中,適應(yīng)值收斂極快;在第100 次迭代后,有陷入局部最優(yōu)的情況及跳出局部的情況,但是優(yōu)化程度并不明顯;在第325 次迭代后找到噸煤耗最低的工藝參數(shù)組合,此時(shí)噸煤耗為77.91 kg。優(yōu)化后的工藝參數(shù)取值組合如表3 所示。
表3 優(yōu)化后的19 項(xiàng)參數(shù)取值Tab.3 Optimized 19 parameter values
圖4 PSO 優(yōu)化曲線Fig.4 PSO optimization curve
煤耗優(yōu)化參數(shù)眾多,如果對(duì)所有參數(shù)同時(shí)現(xiàn)場(chǎng)調(diào)優(yōu),勢(shì)必是一大難點(diǎn)。但是,如圖5 所示,在圖5的幫助下,就可以知道每個(gè)參數(shù)在煤耗調(diào)優(yōu)中的比重,根據(jù)比重大小進(jìn)行現(xiàn)場(chǎng)參數(shù)調(diào)優(yōu)。比如分解爐用煤率、預(yù)熱器三次風(fēng)溫、C1 出口壓力及主傳窯轉(zhuǎn)速的優(yōu)化權(quán)值均在10%以上,可以先對(duì)這幾項(xiàng)參數(shù)調(diào)優(yōu),達(dá)到快速降低煤耗的目的。
圖5 各參數(shù)優(yōu)化權(quán)值占比Fig.5 Optimization weight ratio of each parameter
本文通過(guò)Pearson 相關(guān)系數(shù)和方差法篩選出水泥生產(chǎn)過(guò)程中對(duì)煤耗影響較大的特征參數(shù)。比較了隨機(jī)森林、XGBoost、LightGBM 和CatBoost 四種回歸器對(duì)噸煤耗的預(yù)測(cè)效果,通過(guò)TPE 優(yōu)化后4 個(gè)回歸器的R2分別為0.9646、0.9789、0.9718 和0.9779,考慮到迭代時(shí)間的影響,使用CatBoost 結(jié)合粒子群算法對(duì)煤耗進(jìn)行優(yōu)化,確定最低噸煤耗為77.91 kg 以及各工藝參數(shù)最優(yōu)值以及各參數(shù)對(duì)煤耗調(diào)優(yōu)的影響程度。