湯 健 喬俊飛 郭子豪
如何基于運(yùn)行優(yōu)化控制策略降低復(fù)雜工業(yè)過程的能源消耗和污染排放,是國內(nèi)外流程工業(yè)企業(yè)所面臨的急需解決難題[1?3].焚燒是進(jìn)行城市固廢(Municipal solid waste,MSW)處理的主要技術(shù)手段[4].對于發(fā)展中國家的MSW焚燒(MSW incineration,MSWI)企業(yè),最為緊迫的問題是如何降低焚燒造成的污染排放[5?6],其中急需在線監(jiān)視和優(yōu)化控制的是造成焚燒建廠“鄰避現(xiàn)象(Not in my backyard,NIMBY)”(指居民或單位因擔(dān)心垃圾場、核電廠、殯儀館類的建設(shè)項(xiàng)目對身體健康、環(huán)境質(zhì)量和資產(chǎn)價值等帶來負(fù)面影響而激發(fā)的嫌惡情結(jié),滋生“不要建在我家后院”的心理,并采取強(qiáng)烈、堅(jiān)決,甚至高度情緒化的集體反對和抗?fàn)幮袨?主要原因之一的劇毒物質(zhì)二噁英(Dioxin,DXN)的排放濃度[7?9].MSWI 企業(yè)當(dāng)前主要關(guān)注如何基于優(yōu)化的運(yùn)行參數(shù)實(shí)現(xiàn)DXN 排放的最小化[10].目前,除配套先進(jìn)的尾氣處理裝置外,普遍采用“3T1E”準(zhǔn)則間接控制DXN 排放[11],即:焚燒爐內(nèi)高于850 ℃的溫度(Temperature,T)、超過2 秒(Time,T)的煙氣停留時間、較大的湍流程度(Turbulence,T)和合適的過量空氣系數(shù)(Excess oxygen,E).當(dāng)前MSWI企業(yè)難以進(jìn)行以降低DXN排放為直接目標(biāo)的運(yùn)行優(yōu)化和反饋控制,其主要原因是:1) DXN 排放濃度的機(jī)理模型難以構(gòu)建[12];2) 以月或季為周期的離線直接檢測焚燒尾氣方式不能提供實(shí)時反饋的DXN排放濃度值[13].近年來的研究熱點(diǎn)是基于指示物/關(guān)聯(lián)物對DXN 排放進(jìn)行在線間接檢測[14?15],但這些方法固有的設(shè)備復(fù)雜、造價昂貴、檢測滯后等原因?qū)е缕潆y以用于MSWI 過程的運(yùn)行優(yōu)化和反饋控制[13].
數(shù)據(jù)驅(qū)動軟測量技術(shù)可用于需要離線化驗(yàn)的難以檢測參數(shù)(如本文中的二噁英)的在線估計(jì)[16?17].MSWI 過程包括固廢焚燒、蒸汽發(fā)電、煙氣處理及尾氣排放等多個階段,其所包含的數(shù)百維過程變量間具有較大的冗余性與互補(bǔ)性;顯然,這些不同階段與DXN 的產(chǎn)生、燃燒、吸收、再合成等過程相關(guān),有必要結(jié)合工藝過程劃分為不同階段子系統(tǒng)以便于能夠量化表征對DXN 排放濃度軟測量的貢獻(xiàn)度,同時能夠保留全部過程變量,進(jìn)而避免有用過程變量的缺失.因此,依據(jù)MSWI 過程的特點(diǎn),可將DXN排放濃度軟測量歸結(jié)為一類面向小樣本高維數(shù)據(jù)的建模問題.文獻(xiàn)[18]指出,模型輸入維數(shù)和低價值訓(xùn)練樣本的增加使得獲取完備訓(xùn)練樣本的難度增大.文獻(xiàn)[19]定義了維數(shù)約簡后的建模樣本與約簡特征之比,指出該值應(yīng)滿足構(gòu)建魯棒學(xué)習(xí)模型的需求.因此,針對MSWI 過程具有小樣本高維特性的DXN 排放建模數(shù)據(jù)進(jìn)行維數(shù)約簡是必要的.
目前較為常用的方法是基于機(jī)理或經(jīng)驗(yàn)通過特征選擇實(shí)現(xiàn)維數(shù)約簡.以依據(jù)經(jīng)驗(yàn)選擇的部分過程變量為輸入,文獻(xiàn)[20?21]通過采用多年前歐美研究機(jī)構(gòu)所收集的少量樣本,基于線性回歸、人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)等算法構(gòu)建DXN 排放濃度軟測量模型.近年來,我國臺灣地區(qū)針對實(shí)際焚燒過程,首先初選部分過程變量,再結(jié)合相關(guān)性分析和主元分析(Principal component analysis,PCA)進(jìn)行特征選擇,最后基于BP 神經(jīng)網(wǎng)絡(luò)(Back propagation neural network,BPNN)進(jìn)行DXN 排放濃度建模[22];但BPNN 具有易陷入局部最小、易過擬合和面向小樣本數(shù)據(jù)建模泛化性能差等缺點(diǎn).理論上,基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的支持向量機(jī)(Support vector machine,SVM)算法能夠有效建模小樣本數(shù)據(jù)[23?24],但其需求解二次規(guī)劃(Quadratic programming,QP)問題且超參數(shù)難以自適應(yīng)選擇.最小二乘?支持向量機(jī)(Least squares SVM,LS-SVM)通過求解線性等式克服QP 問題,其超參數(shù)可通過優(yōu)化算法得到[25?27],但耗時且只能得到次優(yōu)解[28].上述方法均以部分過程變量為輸入構(gòu)建傳統(tǒng)單模型,其泛化性有待于提高,并且難以表征MSWI 不同工藝階段對DXN 模型的貢獻(xiàn)率.此外,上述研究也缺少對LS-SVM 超參數(shù)的自適應(yīng)選擇機(jī)制.
針對工業(yè)過程機(jī)理復(fù)雜性難以有效地進(jìn)行特征選擇以及變量間具有的強(qiáng)共線性,能夠提取高維數(shù)據(jù)蘊(yùn)含變化的主元分析(PCA)是工業(yè)過程難以檢測參數(shù)軟測量中較為常用的潛在特征提取方法[29],但貢獻(xiàn)率低的主元建模會降低預(yù)測穩(wěn)定性[30].此外,基于上述非監(jiān)督方法所提取的蘊(yùn)含原始過程變量主要變化的潛在特征與難測參數(shù)間的相關(guān)性卻可能較弱.因此,有必要對貢獻(xiàn)率滿足要求的潛在變量進(jìn)行再次選擇.
此外,針對MSWI 過程的不同階段子系統(tǒng)和全流程系統(tǒng)所提取的潛在特征可視為表征不同局部和全局特性的多源信息.理論和經(jīng)驗(yàn)分析表明,面向多源信息采用選擇性集成(Selective ensemble,SEN)機(jī)制構(gòu)建的軟測量模型具有更佳的穩(wěn)定性和魯棒性[30].文獻(xiàn)[31]綜述了集成子模型多樣性的構(gòu)造策略,指出訓(xùn)練樣本重采樣包括劃分訓(xùn)練樣本(樣本空間)、劃分或變換特征變量(特征空間)等,基于特征空間的集成構(gòu)造策略在模型預(yù)測性能上較優(yōu).針對小樣本多源高維譜數(shù)據(jù),Tang 等[32]提出基于選擇性融合多源特征和多工況樣本的SEN 潛結(jié)構(gòu)映射模型.文獻(xiàn)[32?33]提出了基于隨機(jī)采樣樣本空間的SEN 神經(jīng)網(wǎng)絡(luò)模型和潛結(jié)構(gòu)映射模型.文獻(xiàn)[34]提出基于子空間的集成學(xué)習(xí)通用框架.文獻(xiàn)[35]提出了在特征子空間內(nèi)隨機(jī)采樣樣本空間的面向多尺度機(jī)械信號的雙層SEN 潛結(jié)構(gòu)映射模型.文獻(xiàn)[36]提出的SEN 神經(jīng)網(wǎng)絡(luò)模型分別構(gòu)建候選子模型和選擇集成子模型及計(jì)算其權(quán)重.但上述方法均未進(jìn)行模型參數(shù)自適應(yīng)機(jī)制的研究.采用與文獻(xiàn)[20]相同的建模數(shù)據(jù),文獻(xiàn)[37]提出了基于候選超參數(shù)的SEN 建模方法,但該方法難以描述當(dāng)前實(shí)際MSWI 過程的真實(shí)特性,并且難以有效表征DXN 生成、燃燒、吸附和排放過程的多階段特性.
綜上可知,依據(jù)MSWI 過程的多階段特性對不同階段子系統(tǒng)進(jìn)行非監(jiān)督潛在特征的提取與度量,構(gòu)建具有自適應(yīng)超參數(shù)選擇和SEN 機(jī)制的DXN排放濃度軟測量模型的研究還未見報(bào)道.因此,本文所提的基于潛在特征SEN 的DXN 排放濃度軟測量方法的創(chuàng)新點(diǎn)表現(xiàn)在:1)采用PCA 提取依工藝流程劃分階段子系統(tǒng)和MSWI 全流程系統(tǒng)的潛在特征,并依據(jù)預(yù)設(shè)的主元貢獻(xiàn)率閾值進(jìn)行多源潛在特征初選,保證預(yù)測穩(wěn)定性和避免特征選擇不當(dāng)造成的信息損失;2)采用互信息(Mutual information,MI)度量初選潛在特征并進(jìn)行選擇以保證再選潛在特征與DXN 間的相關(guān)性,自適應(yīng)確定多源潛在特征再選的上下限及閾值;3)采用具有超參數(shù)自適應(yīng)選擇機(jī)制的LS-SVM 算法和自適應(yīng)確定集成子模型尺寸、集成子模型及其加權(quán)系數(shù)的SEN 機(jī)制構(gòu)建DXN 排放濃度軟測量模型,確保具有互補(bǔ)特性的最佳子系統(tǒng)能夠選擇性融合.
MSWI 的主要設(shè)備包括焚燒爐、移動爐排、廢鍋和尾氣處理等設(shè)備,其中,焚燒爐將MSW 轉(zhuǎn)化為殘?jiān)⒒覊m、煙氣與熱量,位于焚燒爐底部的移動爐排促使MSW 有效和完全燃燒,廢鍋產(chǎn)生的蒸汽用于推動汽輪機(jī)產(chǎn)生電力,煙氣中的灰塵和污染物通過尾氣處理設(shè)備凈化后排入大氣.其過程如圖1 所示.
由圖1 可知,MSWI 過程包含DXN 生成、燃燒、吸附和排放等階段,G1、G2 和G3 等不同階段的煙氣中所包含的DXN 濃度具有差異性.通常,為保證焚燒爐內(nèi)的有害物質(zhì)能夠有效和完全分解,煙氣溫度應(yīng)該達(dá)到850 ℃ 并保持2 s 以上.用于MSW焚燒的一次風(fēng)從爐排底部噴入,并通過引入湍流和保證過量氧的供應(yīng)使得二次風(fēng)能夠輔助進(jìn)行煙氣的完全燃燒.在煙氣冷卻過程中,進(jìn)行焚燒礦渣和廢鍋底灰的處置和收集后排出煙氣(G1).活性炭和石灰被注入反應(yīng)器,用于移除酸性氣體和吸收DXN及一些重金屬,煙氣然后再進(jìn)入袋式過濾器.在反應(yīng)器和袋式過濾器內(nèi)產(chǎn)生的飛灰被注入混涅設(shè)備后排放煙氣(G2).引風(fēng)機(jī)將煙氣(G2)吸入到煙囪,產(chǎn)生排放至大氣中的煙氣(G3),其包含HCL、SO2、NOx和HF等多種能夠?qū)崟r在線檢測的污染物濃度,以及具有長周期、高成本等特點(diǎn)需離線才能化驗(yàn)的DXN 濃度.由上述描述可知,DXN 排放濃度與MSWI 過程不同階段的易檢測過程變量均具有相關(guān)性.由圖1可知,MSWI 過程按工藝流程至少可分為焚燒、鍋爐、煙氣處理、蒸汽發(fā)電、煙氣排放、公用工程輔助共6 個階段子系統(tǒng).對于DXN 排放濃度建模,本文將不同的階段子系統(tǒng)及全流程系統(tǒng)均視為多源信息.
圖1 基于DXN 視角的MSWI 過程描述Fig.1 MSWI process description based on DXN perspective
依據(jù)上述分析,本文提一種基于潛在特征SEN建模的DXN 排放濃度軟測量方法,包括廣義子系統(tǒng)劃分模塊、潛在特征提取與初選模塊、潛在特征度量與再選模塊、自適應(yīng)選擇性集成建模模塊,如圖2 所示.
圖2 基于潛在特征SEN 建模的DXN 排放濃度軟測量策略Fig.2 Soft sensing strategy of DXN emission concentration based on latent feature SEN modeling
上述模塊的功能是:1)廣義子系統(tǒng)劃分模塊.基于工藝流程或經(jīng)驗(yàn)知識將過程變量分組為蘊(yùn)含不同局部信息的階段子系統(tǒng),并將全流程系統(tǒng)作為包含全局信息的廣義子系統(tǒng).2)潛在特征提取與初選模塊.采用PCA 提取不同階段子系統(tǒng)和MSWI 全流程系統(tǒng)所包含過程變量的全部潛在特征,基于依據(jù)經(jīng)驗(yàn)設(shè)定的潛在特征貢獻(xiàn)率閾值獲得多源初選潛在特征,其目的是防止采用較小貢獻(xiàn)率的潛在特征建模造成預(yù)測性能的不穩(wěn)定.3)潛在特征度量與再選模塊.采用MI 度量初選潛在特征與DXN 排放濃度間的關(guān)系,并結(jié)合軟測量模型預(yù)測性能自適應(yīng)確定再選潛在特征,其目的是使得所選的多源潛在特征與DXN 間具有較好的映射關(guān)系.4)自適應(yīng)選擇性集成建模模塊.采用超參數(shù)自適應(yīng)選擇策略構(gòu)建基于不同廣義子系統(tǒng)再選潛在特征的最佳預(yù)測性能子模型,結(jié)合分支定界和預(yù)測誤差信息熵加權(quán)算法自適應(yīng)地選擇子模型和計(jì)算其加權(quán)系數(shù),其目的是選擇具有較好冗余與互補(bǔ)特性子模型進(jìn)行融合,以提高SEN 軟測量模型的預(yù)測性能.本文中采用的公式符號及其說明如表1 所示.
表1 本文中的公式符號及其說明匯總表Table 1 Summary of formula symbols and their explanations in this paper
本文中,模型輸入數(shù)據(jù)X ∈RN×M包括N個樣本(行)和M個變量(列),其源于MSWI 過程數(shù)量為 (I ?1) 的子系統(tǒng).為表征MSWI 全流程系統(tǒng)所蘊(yùn)含的全局信息,將其視為廣義上的第I個子系統(tǒng).
若將第i個子系統(tǒng)的建模數(shù)據(jù)表示為Xi ∈,即存在如下關(guān)系:其中,I表示子系統(tǒng)個數(shù),Mi表示第i個子系統(tǒng)包含的變量個數(shù).
相應(yīng)地,輸出數(shù)據(jù)y=包括N個樣本(行),其來源于離線化驗(yàn)的DXN 排放濃度檢測數(shù)據(jù).顯然,輸入/輸出數(shù)據(jù)在時間尺度上具有較大的差異性:過程變量以秒為單位在DCS 系統(tǒng)采集與存儲,DXN 排放濃度以月/季為周期離線化驗(yàn)獲得,故存在N?M.
以第i個子系統(tǒng)為例,首先采用PCA 提取輸入變量的潛在特征.將輸入數(shù)據(jù)Xi進(jìn)行零均值、1方差的標(biāo)準(zhǔn)化處理后,將其分解為
基于式(3),從數(shù)據(jù)Xi所提取的全部潛在特征可表示為
進(jìn)而,從數(shù)據(jù)Xi所提取的潛在特征可表示為
進(jìn)一步,全部潛在特征可表示為
將依據(jù)經(jīng)驗(yàn)選擇的閾值記為θContri(其默認(rèn)取值為1),采用如下規(guī)則對全部潛在特征進(jìn)行初次選擇,
進(jìn)而,將針對第系統(tǒng)的初選潛在特征表示為
進(jìn)一步,全部初選潛在特征ZFeSe1st可表示為
式中,函數(shù) max(·) 和 min(·) 分別表示取最大值和最小值,表示依據(jù)經(jīng)驗(yàn)確定的候選閾值數(shù)量(其默認(rèn)值為10).
將選定閾值記為θContri,其值在之間依據(jù)預(yù)測性能進(jìn)行自適應(yīng)選擇.采用如下規(guī)則對初選潛在特征進(jìn)行再選:
因此,全部再選潛在特征ZFeSe2nd可表示為
其中,wi表示權(quán)重系數(shù),bi表示偏置,是第n個樣本的預(yù)測誤差.
采用拉格朗日方法可得到
對上述公式進(jìn)行求解,
將所采用的核函數(shù)表示為
進(jìn)一步,將LS-SVM 問題轉(zhuǎn)換為求解以下線性系統(tǒng)(24) (見本頁下方).
通過求解式(24),得到βi和bi.
進(jìn)而,基于LS-SVM 構(gòu)建的子模型可表示為
上述排放濃度子模型的超參數(shù)自適應(yīng)選擇機(jī)制采用下述的兩步法實(shí)現(xiàn).
步驟 1.采用網(wǎng)格搜索策略以子模型的預(yù)測性能為目標(biāo)函數(shù),在候選超參數(shù)矩陣Mpara中自適應(yīng)選擇初始超參數(shù)對.其中,候選超參數(shù)矩陣Mpara如式(26)所示.
對全部子系統(tǒng)及MSWI 全流程系統(tǒng)執(zhí)行上述過程,所構(gòu)建的候選子模型預(yù)測輸出的集合可表示為
其中,fi(·) 表示第i個子模型.
結(jié)合基于分支定界的最優(yōu)化選擇算法和基于預(yù)測誤差的信息熵加權(quán)算法對上述候選子模型進(jìn)行自適應(yīng)的選擇和加權(quán).在給定候選子模型和加權(quán)算法后,集成子模型的選擇類似最優(yōu)組合特征選擇[30].面向數(shù)量有限的候選子模型,通常采用的策略為:多次耦合運(yùn)行優(yōu)化與加權(quán)算法構(gòu)建集成尺寸為2~ (I ?1)的多個SEN 模型,基于預(yù)測性能排序得到優(yōu)選的SEN 模型.假定本文最終軟測量模型的集成尺寸為Isel,其預(yù)測輸出值為
利用集成子模型的預(yù)測值和真值,基于預(yù)測誤差信息墑的加權(quán)算法得到,由下式得到:
本文數(shù)據(jù)源于北京某MSWI 焚燒廠的1# 爐,涵蓋了2012 年~ 2018 年DXN 排放濃度檢測樣本39 個,輸入變量的維數(shù)286 維(刪除部分?jǐn)?shù)據(jù)殘缺的變量).可見,輸入特征維數(shù)遠(yuǎn)遠(yuǎn)超過建模樣本數(shù)量,進(jìn)行維數(shù)約簡非常必要.本文將建模數(shù)據(jù)等分訓(xùn)練和測試兩部分
注 1.本文研究的目的包括對工業(yè)過程數(shù)據(jù)可用性驗(yàn)證和算法有效性驗(yàn)證2 個方面.
4.2.1 廣義子系統(tǒng)劃分、潛在特征提取與初選的結(jié)果
本文中,將依據(jù)工藝流程劃分的階段子系統(tǒng)焚燒、鍋爐、煙氣處理、蒸汽發(fā)電、煙氣排放和公用工程分別標(biāo)記為Incinerator、Boiler、Flue gas、Steam、Stack 和Common,并認(rèn)定包含差異化的局部信息的標(biāo)準(zhǔn)子系統(tǒng).為表示焚燒過程變量的整體變化特性,將包含全部變量的MSWI 全流程系統(tǒng)也作為表征全局信息的廣義子系統(tǒng).因此,廣義上講,本文共包含7 個子系統(tǒng).采用PCA 提取的前6 個潛在特征的累積貢獻(xiàn)率如圖3 所示.
圖3 表明:不同子系統(tǒng)前6 個PC 的累積貢獻(xiàn)率均達(dá)到了80.
圖3 不同功能子系統(tǒng)的前6 個PC 的累積貢獻(xiàn)率Fig.3 Cumulative contribution rate of the first six PCs of different functional subsystems
考慮到采用貢獻(xiàn)率較低的潛在變量建模會導(dǎo)致模型預(yù)測性能的不穩(wěn)定,本文將θContri取為1 進(jìn)行潛在特征的初選.初選潛在特征及其貢獻(xiàn)率如表2所示.
由表2 可知:1)不同階段子系統(tǒng)的初選潛在特征數(shù)量依次為13、6、9、8、6 和12,其中Incinerator(焚燒)子系統(tǒng)和Steam (蒸汽發(fā)電)子系統(tǒng)選擇的數(shù)量為最多的13 個和最少的5 個,為各自原始過程變量數(shù)量的1/6 和1/10,表明輸入變量間較強(qiáng)的共線性和階段子系統(tǒng)間的差異性;2) Stack (煙氣排放)子系統(tǒng)包含的過程變量和提取的潛在變量數(shù)量均為6 個,表明排放煙氣包含的HCL、SO2等組分之間具有差異性;3) MSWI 全流程系統(tǒng)所初選的潛在特征數(shù)量為15 個,高于其他階段子系統(tǒng),從其蘊(yùn)含全局信息的視角這也是合理的.
表2 初選潛在特征的數(shù)量及其貢獻(xiàn)率Table 2 Number of the primary selected latent feature and their contribution ratio
4.2.2 潛在特征度量與再選結(jié)果
此處采用MI 方法度量上述初選潛在特征與DXN 間的相關(guān)性,如圖4 所示.
圖4 表明:1)從全部子系統(tǒng)及全流程系統(tǒng)初選潛在特征的第1 個特征的MI 值可知,雖然其能夠表征原始過程變量中的最大部分變化,但其與DXN間的相關(guān)性卻是最小的,這表明進(jìn)行潛在特征的再選是必要的;2)第1 個潛在特征的MI 最小值(0.4429)源于MSWI 全流程系統(tǒng),最大值(0.7182) 源于Stack (煙氣排放)子系統(tǒng),且后者是前者的1.6 倍,表明按照工藝流程劃分為不同子系統(tǒng)進(jìn)行特征提取是非常合理的;3)除第1 個潛在特征外,其他潛在特征雖然在表征過程變量的貢獻(xiàn)率上是逐漸下降的,但在表征MI 值上卻未呈現(xiàn)出任何規(guī)律性,表明以與DXN 的相關(guān)性大小為準(zhǔn)則進(jìn)行潛在特征度量和再選擇是必要的.
圖4 全部子系統(tǒng)及MSWI 全流程系統(tǒng)的初選潛在特征與DXN 間的MI 值Fig.4 MI value between DXN and primary potential characteristics of all subsystems and MSWI whole process systems
初選潛在特征MI 值的極值統(tǒng)計(jì)如表3 所示.
表3 表明:潛在特征與DXN 相關(guān)性的強(qiáng)弱與其被提取的順序和貢獻(xiàn)率不相關(guān).如,針對Incinerator(焚燒)子系統(tǒng),其潛在特征的最大MI 值0.8559 來自于貢獻(xiàn)率僅為1.514.
結(jié)合第4.2 節(jié)所述算法和表3 度量結(jié)果,MI 閾值的上限和下限自適應(yīng)地確定為0.7882 和0.7182,將取為默認(rèn)值10,可知步長為0.006999.結(jié)合軟測量模型性能,最終確定閾值為0.7882.再選潛在特征的數(shù)量和MI 值的統(tǒng)計(jì)結(jié)果如表4 所示.
表3 全部子系統(tǒng)及MSWI 全流程系統(tǒng)初選潛在特征MI 值的極值統(tǒng)計(jì)表Table 3 Extremum statistical table of potential characteristic MI values for primary selection latent feature of all Subsystems and MSWI whole process system
由表4 可知,最終為全部子系統(tǒng)和全流程系統(tǒng)選擇的再選潛在特征數(shù)量分為5、2、1、3、2、6 和1,這表明與DXN 具有較高相關(guān)性的潛在變量的分布與數(shù)量是不同的,構(gòu)建不同的預(yù)測子模型更能體現(xiàn)其在建模貢獻(xiàn)率上的差異性和互補(bǔ)性.
表4 再選潛在特征數(shù)量和MI 值統(tǒng)計(jì)表Table 4 Statistical table of re-selected latent feature's number and MI value
4.2.3 自適應(yīng)選擇集成建模
本文中,將候選正則化參數(shù)與核參數(shù)的集合分別預(yù)先選擇為 {0.0001,0.001,0.01,0.1,1,10,100,1 000,2 000,4 000,6 000,8 000,10 000,20 000,40 000,60 000,80 000,160 000 和0.0001,0.001,0.01,0.1,1,10,100,1 000,1 600,3 200,6 400,12 800,25 600,51 200,102 400}.結(jié)合第3 節(jié)所確定的再選潛在特征為輸入,采用網(wǎng)格搜索方法進(jìn)行LS-SVM 超參數(shù)自適應(yīng)尋優(yōu)的第1 次和第2 次的曲線如圖5 所示.
圖5 子模型超參數(shù)自適應(yīng)尋優(yōu)的第1 次和第2 次的曲線Fig.5 Curves of the 1st and 2nd curves for adaptive hyperparametric optimization of submodels
基于上述結(jié)果,上述子模型自適應(yīng)選擇的超參數(shù)對分別為(109,109)、(10 000,25.75)、(5.950,0.0595)、(30.70,2.080)、(5.950,0.5950)、(1 520 800,22 816)和(1 362 400,158.5),對應(yīng)的測試均方根誤差(Root mean square error,RMSE) 分別為0.01676、0.02302、0.01348、0.01943、0.01475、0.02261 和0.02375.可見,采用MSWI 全流程系統(tǒng)的再選潛在特征構(gòu)建的子模型預(yù)測誤差最大(0.02375),其對應(yīng)的超參數(shù)對具有較大范圍(1 362 400,158.5),表明蘊(yùn)含全局信息的潛在特征的數(shù)據(jù)分布范圍較寬;相對而言,依據(jù)工藝流程劃分的焚燒、煙氣處理和煙氣排放子系統(tǒng)所對應(yīng)的子模型的預(yù)測誤差分別為0.01676、0.01348 和0.01475,其相應(yīng)的超級參數(shù)分別為(109,109),(5.950,0.0595) 和(5.950,0.5950);從機(jī)理上講,上述3 個子系統(tǒng)是與DXN 的生成與燃燒、吸收、排放等工藝密切先關(guān),該結(jié)果進(jìn)一步表明了本文所提方法的合理性;此外,具有最大潛在特征MI 值的公用工程子系統(tǒng)所構(gòu)建的子模型的預(yù)測誤差僅為0.02261,這也是與DXN機(jī)理和該子系統(tǒng)相關(guān)性很小的事實(shí)相符合.
針對基于上述各個子系統(tǒng)及全流程系統(tǒng)潛在特征的候選子模型,采用基于分支定界和預(yù)測誤差信息熵加權(quán)算法的耦合策略,可得到集成尺寸為26時的SEN 模型,其測試誤差相應(yīng)地分別為0.01345、0.01332、0.01401、0.01460 和0.01560.可見,在集成尺寸為2 和3 時,具有強(qiáng)于最佳候選子模型的預(yù)測性能.
最終構(gòu)建得到的DXN 軟測量模型的集成尺寸為3,其集成子模型所對應(yīng)的子系統(tǒng)為煙氣處理、煙氣排放和焚燒.由前文分析可知,此3 個子系統(tǒng)所對應(yīng)的工藝流程與DXN 的吸收、排放和生成與燃燒相關(guān).目前焚燒廠為降低DXN 排放濃度,除在煙氣處理階段均采用較為先進(jìn)的末端處理裝置外,對能夠吸附DXN 的活性炭供應(yīng)量往往為上限值;但需要提出的是,該方法只是改變了DXN 的存在方式,并未從根本上予以消除.因此,在未來工作中,非常有必要對煙氣處理裝置之前的DXN 含量進(jìn)行測量,為優(yōu)化控制DXN 的生成與燃燒以及吸附提供支撐.
由上述仿真結(jié)果可知,從國內(nèi)實(shí)際MSWI 過程獲取的DXN 檢測數(shù)據(jù)具有一定程度的可用性,本文所提算法也是有效的,但更具實(shí)用性的研究還需要結(jié)合更多定制化、高成本的實(shí)驗(yàn)才能深入進(jìn)行.
由前文可知,此處所提方法與文獻(xiàn)[22,24,37]相比的優(yōu)點(diǎn)在于:1) 采用全部MSWI 過程變量建模,之前方法是采用依據(jù)機(jī)理或經(jīng)驗(yàn)選擇的部分與DXN 相關(guān)的過程變量建模,丟棄的過程變量會造成信息損失;2) 依據(jù)工藝流程劃分為不同的階段子系統(tǒng),分別提取和選擇各自潛在特征構(gòu)建候選子模型,并將蘊(yùn)含全局信息的MSWI 全流程系統(tǒng)也作為一個廣義概念下的子系統(tǒng),最終構(gòu)建DXN 排放濃度SEN 軟測量模型,實(shí)現(xiàn)具有互補(bǔ)特性候選子模型的自適應(yīng)選擇性融合,而之前方法多為單模型,即使SEN 模型也未進(jìn)行多源信息的融合.
因此,為與已有方法進(jìn)行比較,基于本文所用的近幾年實(shí)際工業(yè)過程數(shù)據(jù),選擇與文獻(xiàn)[22,24,37]所采用的相同或類似的過程變量及方法進(jìn)行比較:1) 借鑒文獻(xiàn)[22],選擇“爐膛溫度、二次燃燒室出口溫度左、二次燃燒室出口溫度右、一級過熱器出口蒸汽溫度、二級過熱器出口蒸汽溫度、三級過熱器出口蒸汽溫度、活性炭儲倉給料量、FGD 出口煙氣溫度A、FGD 出口煙氣溫度B、以及煙氣中SO2、HCL和O2濃度”共12 個變量;2) 借鑒文獻(xiàn)[24],選擇“爐膛溫度、一級過熱器出口蒸汽溫度、二級過熱器出口蒸汽溫度、三級過熱器出口蒸汽溫度、煙道入口煙氣流量、以及煙氣中SO2、HCL、灰塵濃度”共8個變量;3) 借鑒文獻(xiàn)[37],選擇“爐膛溫度、鍋爐出口主蒸汽流量、煙道入口煙氣溫度、煙道入口煙氣流量、HCL濃度、PM 濃度”共6 個變量.此外,也與采用PLS 和AWF 進(jìn)行合并加權(quán)融合策略的集成建模(EN)建模方法進(jìn)行了比較.
不同建模方法的統(tǒng)計(jì)結(jié)果如表5 所示.由表5可知:
表5 不同建模方法統(tǒng)計(jì)結(jié)果Table 5 Statistical results of different modeling methods
1)從用于構(gòu)建軟測量模型的過程變量數(shù)量的視角:文獻(xiàn)[22,24,37]所采用輸入特征是從286 個變量中選擇的12、8 和6 個機(jī)理或經(jīng)驗(yàn)特征,采用經(jīng)驗(yàn)風(fēng)險(xiǎn)神經(jīng)網(wǎng)絡(luò)模型、結(jié)構(gòu)最小化風(fēng)險(xiǎn)SVM模型和基于多核參數(shù)SEN 模型構(gòu)建的DXN 模型在預(yù)測性能上均弱于以286 全部變量為輸入的3 類模型(PLS 模型、PCA-LSSVM 模型、基于PCA-MILSSVM 子模型的EN 模型),以及實(shí)際上以104 個過程變量為輸入的基于PCA-MI-LSSVM 子模型的SEN 模型,表明前3 種方法在丟棄大部分過程變量的過程中導(dǎo)致了有價值信息的損失,也說明了采用適當(dāng)數(shù)量的過程變量建模是必要的.
2)從采用建模方法的視角:文獻(xiàn)[22]的結(jié)果表明神經(jīng)網(wǎng)絡(luò)在面向小樣本數(shù)據(jù)建模時具有較大的隨機(jī)性,文獻(xiàn)[24]的結(jié)果表明SVM 適合構(gòu)建小樣本數(shù)據(jù)模型,通過集成多個核參數(shù)的SEN 策略[37]可進(jìn)一步提高預(yù)測性能;PLS 方法通過提取與286個輸入變量和輸出DXN 排放濃度均相關(guān)的潛在特征構(gòu)建線性回歸模型,也獲得了比上述3 種僅采用部分過程變量建模更好的性能;PCA-LS-SVM通過提取MSWI 全流程系統(tǒng)的潛在特征,構(gòu)建了預(yù)測誤差進(jìn)一步降低的軟測量模;基于PCA-MI-LSSVM 子模型的EN 和SEN 方法也進(jìn)一步提高建模精度,表明選擇性融合局部與全局信息的合理性.總體上,結(jié)構(gòu)風(fēng)險(xiǎn)最小化的建模算法性能較佳,SEN 建模策略更優(yōu).
3) 從集成子模型融合策略的視角:基于PLS的EN 建模方法具有僅次于本文所提方法的預(yù)測性能,表明PLS 能夠有效對7 個候選子模型進(jìn)行較為合適的融合.此處,PLS 融合相當(dāng)于構(gòu)建了候選子模型輸出與最終EN 輸出間的映射關(guān)系[38].考慮到僅構(gòu)建了線性融合模型,還需進(jìn)行深入研究.
4)從DXN 軟測量模型的集成子模型自適應(yīng)選擇與合并的視角:本文所提方法無需對全部過程變量進(jìn)行選擇,只是通過對依據(jù)工藝階段的劃分的包含局部信息的6 個階段子系統(tǒng)及包含全局信息的全流程系統(tǒng)的潛變量特征候選子模型的優(yōu)化選擇與加權(quán),構(gòu)建得到面向多源信息的選擇性融合模型,結(jié)果表明所選擇的集成子模型是基于與DXN 的生成、燃燒、吸附和排放機(jī)理相關(guān)的階段子系統(tǒng)構(gòu)建,進(jìn)一步驗(yàn)證了建模數(shù)據(jù)的可用性和算法的有效性.
綜上可知,本文所提方法具有最佳預(yù)測性能,能夠?qū)Ρ碚骶植啃畔⒑腿中畔⒌碾A段子系統(tǒng)和MSWI 全流程系統(tǒng)所蘊(yùn)含的潛在特征進(jìn)行有效的選擇性融合.同時,由于不同焚燒系統(tǒng)的差異性,在子系統(tǒng)劃分粒度與方式、全流程系統(tǒng)融合效果等方面,本文所提方法還需要在更多實(shí)際工業(yè)數(shù)據(jù)上進(jìn)行進(jìn)一步驗(yàn)證.
本文針對北京某焚燒企業(yè)的工業(yè)實(shí)際,依據(jù)工藝流程將MSWI 過程劃分為多個階段子系統(tǒng),針對劃分得到的表征局部信息的階段子系統(tǒng)和表征全局信息的全流程系統(tǒng),采用基于PCA 和先驗(yàn)知識的潛在特征提取和初選、基于MI 和先驗(yàn)知識的初選潛在特征度量和再選、面向再選潛在特征的自適應(yīng)SEN 建模機(jī)制共3 個階段的有效融合,提出了基于多源潛在特征SEN 建模的DXN 排放濃度軟測量方法,并基于實(shí)際運(yùn)行數(shù)據(jù)仿真驗(yàn)證了所提方法的有效性.本文在自適應(yīng)調(diào)整貢獻(xiàn)率閾值、MI 再選閾值、超參數(shù)和SEN 模型結(jié)構(gòu)等方面還有待于加強(qiáng).此外,如何結(jié)合數(shù)值仿真的模型與工藝流程進(jìn)行DXN 排放機(jī)理的分析也還有待于深入進(jìn)行.所提方法也需要在具有不同特性的焚燒系統(tǒng)上進(jìn)一步驗(yàn)證.