閆浩思,趙文杰
(華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院,河北 保定 071000)
我國(guó)煤炭資源豐富,煤炭燃燒產(chǎn)生有害氣體導(dǎo)致大氣污染問(wèn)題嚴(yán)峻,其中SO2污染最為嚴(yán)重[1]。為達(dá)到SO2排放標(biāo)準(zhǔn),燃煤電站引進(jìn)煙氣脫硫技術(shù),以石灰石-石膏濕法脫硫?yàn)橹鱗2]。然而,濕法脫硫系統(tǒng)運(yùn)行能耗大,增加了脫硫系統(tǒng)運(yùn)行成本,如何實(shí)現(xiàn)節(jié)能和減排的雙贏,是燃煤電站脫硫系統(tǒng)運(yùn)行優(yōu)化的重要工作之一。
建立脫硫出口SO2濃度預(yù)測(cè)模型是實(shí)現(xiàn)脫硫系統(tǒng)運(yùn)行優(yōu)化的基礎(chǔ)。目前,脫硫系統(tǒng)建模的方法主要分為兩種:一種是基于化學(xué)機(jī)理的建模方法,一種是基于運(yùn)行數(shù)據(jù)的建模方法?;诨瘜W(xué)機(jī)理建模通常根據(jù)脫硫吸收塔內(nèi)的化學(xué)反應(yīng)過(guò)程構(gòu)建相應(yīng)的微分方程,建立理論模型。祝杰等[3]依據(jù)濕法脫硫系統(tǒng)化學(xué)反應(yīng)機(jī)理,組建脫硫系統(tǒng)數(shù)學(xué)模型預(yù)測(cè)脫硫效率;馬雙忱等[4]根據(jù)脫硫塔內(nèi)化學(xué)反應(yīng)建立分布式脫硫塔模型,預(yù)判脫硫系統(tǒng)內(nèi)部參數(shù),為現(xiàn)場(chǎng)優(yōu)化提供技術(shù)支持。但由于脫硫系統(tǒng)的復(fù)雜性,機(jī)理建模需要對(duì)脫硫塔進(jìn)行模型簡(jiǎn)化,難以精確描述脫硫系統(tǒng)實(shí)際工況,在實(shí)際應(yīng)用中對(duì)脫硫系統(tǒng)出口濃度的預(yù)測(cè)也難以達(dá)到預(yù)期。
近年來(lái),隨著人工智能理論的發(fā)展,基于運(yùn)行數(shù)據(jù)的建模方法得到了普遍重視,利用機(jī)器學(xué)習(xí)等智能算法建立脫硫系統(tǒng)模型成為了研究熱點(diǎn)。洪文鵬等[5]建立了采用粒子群算法(PSO)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的脫硫效率預(yù)測(cè)模型;馬雙忱等[6]利用深度神經(jīng)網(wǎng)絡(luò)建立了可用于脫硫系統(tǒng)主要指標(biāo)預(yù)測(cè)的模型;李軍紅等[7]運(yùn)用廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)構(gòu)建脫硫效率模型,相比于傳統(tǒng)BP算法,預(yù)測(cè)精度更能夠達(dá)到實(shí)際工況運(yùn)行要求。
由于脫硫系統(tǒng)運(yùn)行工況復(fù)雜,影響因素眾多,變量之間存在耦合關(guān)系,且系統(tǒng)實(shí)際運(yùn)行數(shù)據(jù)中含有噪聲干擾?;谶\(yùn)行數(shù)據(jù)建模時(shí),輸入變量的選擇會(huì)影響模型預(yù)測(cè)精度,選擇變量過(guò)少不能反映脫硫系統(tǒng)的運(yùn)行特性,過(guò)多則會(huì)導(dǎo)致模型結(jié)構(gòu)復(fù)雜,引入無(wú)用噪聲信息,降低模型的泛化能力[8]。因此,合理地選擇輸入變量是建立脫硫出口SO2濃度預(yù)測(cè)模型重要的一個(gè)環(huán)節(jié)。上述研究中,模型輸入變量的選擇大多依賴運(yùn)行經(jīng)驗(yàn),不同類型的脫硫系統(tǒng)模型輸入變量需要根據(jù)經(jīng)驗(yàn)重新確定;同時(shí),核極限學(xué)習(xí)機(jī)作為一種改進(jìn)的前饋神經(jīng)網(wǎng)絡(luò)建模方法[9],在學(xué)習(xí)速率和泛化能力方面,相較于BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等人工智能方法具有一定優(yōu)勢(shì)。韓宏泉等[10]提出了基于核極限學(xué)習(xí)機(jī)的短期水量預(yù)測(cè)模型,通過(guò)城市需水量實(shí)際數(shù)據(jù)進(jìn)行性能測(cè)試,表明該模型對(duì)短期水量預(yù)測(cè)精度高;李軍等[11]將遺傳算法、模擬退火、微分演化3種優(yōu)化算法組合對(duì)核極限學(xué)習(xí)機(jī)的關(guān)鍵參數(shù)進(jìn)行尋優(yōu),建立了高效的風(fēng)電功率預(yù)測(cè)模型。
本文針對(duì)燃煤機(jī)組濕法脫硫系統(tǒng),提出了一種基于最大信息系數(shù)(maximal information coefficient,MIC)的變量選擇和海洋捕食(marine predators algorithm,MPA)優(yōu)化核極限學(xué)習(xí)機(jī)(kernel extreme learning machine,KELM)的脫硫出口SO2濃度預(yù)測(cè)模型。
以山西某電廠600 MW燃煤機(jī)組濕法脫硫系統(tǒng)為例,石灰石-石膏濕法脫硫系統(tǒng)的工藝流程圖如圖1所示。鍋爐煙氣經(jīng)由鍋爐主煙道引出后,采用引增合一的方式進(jìn)入脫硫吸收塔。脫硫塔內(nèi)石灰石漿液經(jīng)5臺(tái)漿液循環(huán)泵(A~E)分別進(jìn)入5層噴淋層,由噴嘴噴出產(chǎn)生漿液霧滴,霧滴與煙氣充分接觸,由上至下的在吸收塔內(nèi)以逆流的方式洗滌煙氣,進(jìn)行脫硫化學(xué)反應(yīng)。空氣通過(guò)氧化風(fēng)機(jī)進(jìn)入吸收塔進(jìn)行氧化反應(yīng),通過(guò)脫水系統(tǒng)生產(chǎn)石膏。與此同時(shí),與石灰石循環(huán)漿液接觸反應(yīng)后的凈煙氣通過(guò)除霧裝置分離液滴,最后經(jīng)由濕煙囪排入大氣離開脫硫系統(tǒng)[12]。
圖1 石灰石-石膏濕法脫硫系統(tǒng)工藝流程圖Fig.1 Process flow chart of limestone-gypsum wet desulfurization system
石灰石-石膏濕法脫硫反應(yīng)包含氣體、固體、液體3種不同物質(zhì)形態(tài)的反應(yīng)與轉(zhuǎn)化,出口SO2濃度影響因素復(fù)雜。在建立脫硫出口SO2濃度預(yù)測(cè)模型的過(guò)程中,多選變量會(huì)使得預(yù)測(cè)模型的運(yùn)行時(shí)間長(zhǎng)、泛化能力差;而漏選變量會(huì)導(dǎo)致模型無(wú)法對(duì)建模對(duì)象進(jìn)行確切描述[13]。因此,合理的模型輸入變量選擇,是模型實(shí)現(xiàn)高效預(yù)測(cè)的重要步驟。
根據(jù)脫硫系統(tǒng)的運(yùn)行機(jī)理,影響出口SO2濃度的影響因素眾多[14],包括吸收塔液位、吸收塔漿液密度、入口SO2濃度、入口煙氣溫度、機(jī)組負(fù)荷、氧化風(fēng)機(jī)電流、入口煙氣流量、入口煙氣氧量、pH值、5臺(tái)漿液循環(huán)泵流量、石灰石漿液供給量等15個(gè)影響因素。其中,漿液循環(huán)泵運(yùn)行臺(tái)數(shù)的不同組合,對(duì)脫硫效率有顯著影響。實(shí)際運(yùn)行中,漿液循環(huán)泵運(yùn)行臺(tái)數(shù)的組合模式多樣,為便于描述漿液循環(huán)泵組合對(duì)出口SO2濃度的影響特性,提出一種循環(huán)漿液綜合流量描述方法。結(jié)合電機(jī)學(xué)原理,異步電機(jī)電流、功率隨著電機(jī)負(fù)載變化而變化,電機(jī)不超載其轉(zhuǎn)速不變,轉(zhuǎn)速與磁極對(duì)數(shù)有關(guān),關(guān)系為:
n=60ν/p
(1)
式中:n為電機(jī)轉(zhuǎn)速;ν為電源頻率;p為磁極對(duì)數(shù)。
離心泵的電機(jī)轉(zhuǎn)速與漿液循環(huán)泵功率、揚(yáng)程、流量之間的關(guān)系有:
(2)
式中:Q為漿液循環(huán)泵流量;H為揚(yáng)程;P為漿液循環(huán)泵功率;n1、n2分別為異步電機(jī)轉(zhuǎn)速。漿液循環(huán)泵電流隨著揚(yáng)程增大而增大,在相同循環(huán)漿液流量下,啟動(dòng)揚(yáng)程大的循環(huán)泵使得煙氣與石灰石漿液的接觸時(shí)間長(zhǎng),脫硫效率高。
結(jié)合山西某電廠漿液循環(huán)泵的運(yùn)行參數(shù),即A、C、D、E泵流量為12 500 m3/h,B泵為12 000 m3/h;5臺(tái)泵揚(yáng)程分別為24,27,28.3,30.3,32.3 m。以中間漿液循環(huán)泵C泵流量為基準(zhǔn),考慮到揚(yáng)程對(duì)脫硫效率的影響,提出循環(huán)漿液綜合流量數(shù)學(xué)描述式:
Qz=(1-4.3k)QA+(1-1.3k)QB+
QC+(1+2k)QD+(1+2k)QE
(3)
式中:Qz為綜合漿液循環(huán)流量;QA、QB、QC、QD、QE分別為5臺(tái)漿液循環(huán)泵的額定流量;k>0為待定常數(shù),在建模時(shí)取值通過(guò)MPA尋優(yōu)算法得到。
最大信息系數(shù)是Reshef[15]等在2011年提出的一種新的衡量2個(gè)變量之間相關(guān)性強(qiáng)弱的算法,是互信息的改進(jìn)。互信息量為待選變量關(guān)于響應(yīng)變量的信息量,2變量之間是否為線性關(guān)系不受約束,基本公式為:
(4)
式中,f(X;Y)為聯(lián)合概率密度函數(shù)。
最大信息系數(shù)克服了互信息在計(jì)算連續(xù)變量的聯(lián)合概率密度函數(shù)困難的缺陷,最大程度地找到待選輸入變量X與輸出變量Y的相關(guān)性。MIC的計(jì)算公式為:
(5)
式中:B為構(gòu)建m×n網(wǎng)格數(shù)量的最大上限,是樣本規(guī)模n的相關(guān)函數(shù),B=n0.6。
由于MIC的普遍適用性和公平性,本文提出了一種基于MIC的特征選擇算法,即選用MIC算法衡量變量相關(guān)性,用相關(guān)性判斷作為特征選擇算法篩選的條件。特征選擇算法的評(píng)價(jià)函數(shù)為:
(6)
式中:I(Y;Xa)表示輸出變量Y與待選輸入變量Xa的相關(guān)程度;MIC(Y;Xa)表示輸出變量Y與待選輸入變量Xa的最大信息系數(shù);MIC(Xa,Xb)為待選擇輸入變量Xa與已選擇輸入變量Xb之間的最大信息系數(shù);N為已經(jīng)篩選出的變量樣本集。
相關(guān)性判別關(guān)系式為:
I(Y;Xa)<η*I(Y;Y)η∈[0,1]
(7)
minI(Xa;Y)/I(Y;Y)≤η≤maxI(Xa;Y)/I(Y;Y)
(8)
式中η為相關(guān)性的閾值。當(dāng)待選變量與響應(yīng)變量的相關(guān)程度小于η*I(Y;Y)時(shí),則表明待選輸入變量Xa與輸出變量Y不相關(guān)。
基于MIC算法的改進(jìn)變量選擇方法步驟為:
(1) 對(duì)樣本集和待選變量樣本集進(jìn)行初始化,計(jì)算輸出變量Y與待選輸入變量X的最大信息系數(shù);
(2) 求得當(dāng)MIC值最大時(shí)的待選輸入變量Xa,即為特征選擇后的輸入變量;
(3) 在待選樣本集中去除MIC值最大的待選變量Xa,用相關(guān)性判別關(guān)系式判別剩余待選輸入變量X與輸出變量Y的相關(guān)性是否滿足式(7),若滿足則表示剩余待選輸入變量與輸出變量不相關(guān),不滿足則返回步驟(2)進(jìn)一步篩選輸入變量。
定理1 令φsafe是系統(tǒng)的安全屬性,A是一個(gè)接受φsafe所有壞前綴集合的DFA,H是表示系統(tǒng)模型的HMM,監(jiān)控器M=A?H,o1,o2,…,ot,是系統(tǒng)運(yùn)行時(shí)的觀測(cè)序列.那么在t時(shí)刻系統(tǒng)安全性的概率:
(4) 當(dāng)剩余待選輸入變量均與輸出響應(yīng)變量Y不相關(guān)時(shí),輸出待選變量樣本集。
采用基于最大信息系數(shù)的變量選擇方法對(duì)影響脫硫出口SO2濃度的影響因素進(jìn)行篩選,其中循環(huán)漿液綜合流量待定系數(shù)k設(shè)置為0。綜合考慮模型精度和模型結(jié)構(gòu),選取相關(guān)性的閾值η為0.1,得到6個(gè)輸入變量為:吸收塔液位高度、吸收塔漿液密度、石膏漿液pH值、吸收塔入口SO2濃度、循環(huán)漿液綜合流量、機(jī)組負(fù)荷。篩選后的輸入變量及最大信息系數(shù)見表1。
表1 輸入變量與最大信息系數(shù)Tab.1 Input variable and maximum information coefficient
極限學(xué)習(xí)機(jī)算法(ELM)是基于前饋神經(jīng)網(wǎng)絡(luò)的新型單隱層算法,具有學(xué)習(xí)速度快、非線性擬合程度高的特點(diǎn),進(jìn)行一步計(jì)算得到輸出權(quán)值,近來(lái)被普遍應(yīng)用于預(yù)測(cè)模型中[16,17]。
假設(shè)N個(gè)出口SO2濃度的影響因素作為輸入訓(xùn)練集{xi,yi|xi∈Rs,i=1,…,n},其中xi是影響脫硫系統(tǒng)因素的第i個(gè)樣本的s維輸入向量xi=[xi1,…,xis],yi為i個(gè)樣本的出口SO2濃度。根據(jù)極限學(xué)習(xí)機(jī)的定義可知,脫硫出口SO2濃度的預(yù)測(cè)量為:
(9)
式中:k為隱含層神經(jīng)元的個(gè)數(shù);g(*)為顯式激勵(lì)函數(shù);wj為網(wǎng)絡(luò)輸入神經(jīng)元與隱含層第j個(gè)神經(jīng)元間的權(quán)向量;bj是隱含層第j個(gè)神經(jīng)元的偏置;βj為網(wǎng)絡(luò)隱含層第j個(gè)神經(jīng)元與輸出層神經(jīng)元間的權(quán)值向量。
當(dāng)ELM的輸出預(yù)測(cè)結(jié)果與實(shí)際輸出誤差最小時(shí),達(dá)到訓(xùn)練模型的學(xué)習(xí)目標(biāo),其對(duì)應(yīng)的矩陣表達(dá)式為:
Hβ=Y
(10)
式中:H是網(wǎng)絡(luò)隱含層的輸出矩陣;Y是出口SO2濃度期望輸出。依照最小二乘法對(duì)式(10)求解得到網(wǎng)絡(luò)輸出權(quán)值矩陣β,表達(dá)式為:
β=(HTH)-1HTY
(11)
ELM預(yù)測(cè)模型在訓(xùn)練過(guò)程中會(huì)出現(xiàn)波動(dòng)隨機(jī)且耗時(shí)過(guò)久的缺點(diǎn),引入核極限學(xué)習(xí)機(jī)算法改進(jìn)ELM,即利用核函數(shù)矩陣ΩELM內(nèi)積的形式確定隱含層映射,在計(jì)算過(guò)程中隱含層神經(jīng)元數(shù)量不需要人為指定。核極限學(xué)習(xí)機(jī)訓(xùn)練模型結(jié)構(gòu)如圖2。
圖2 核極限學(xué)習(xí)機(jī)訓(xùn)練模型Fig.2 KELM training model of
首先引入正則化系數(shù)C,控制β的取值范圍,即用來(lái)衡量結(jié)構(gòu)風(fēng)險(xiǎn)與經(jīng)驗(yàn)風(fēng)險(xiǎn)間的比例,提高模型泛化能力,則β表示為:
β=HT(HTH+I/C)-1Y
(12)
接著采用核函數(shù)矩陣ΩELM代替HHT,則有
(13)
最終網(wǎng)絡(luò)輸出預(yù)測(cè)結(jié)果為:
y=f(x)
=h(x)HHT(HTH+I/C)-1Y
=[K(x,x1),…,K(x,xN)](I/C+ΩELM)-1Y
(14)
式中K(xi,xj)為核函數(shù)。核函數(shù)的存在,將數(shù)據(jù)投向高維映射空間,有效提高了KELM預(yù)測(cè)模型的泛化能力和穩(wěn)定性,加快模型的學(xué)習(xí)速度,能夠在脫硫系統(tǒng)出口SO2濃度預(yù)測(cè)中具有更精準(zhǔn)的預(yù)測(cè)能力。
海洋捕食者算法(MPA)是一種新型仿生物智能優(yōu)化算法,模擬海洋中捕食者與獵物之間的生物行為,捕食者通過(guò)在Lévy游走和布朗運(yùn)動(dòng)2種方式中選擇切換,尋求捕獵最優(yōu)方式成為頂級(jí)捕食者[19]。MPA基本原理描述為:
(1) 初始化階段。MPA算法隨機(jī)對(duì)搜索空間中的獵物種群位置初始化,數(shù)學(xué)描述為:
X0=Xmin+rand(Xmax-Xmin)
(15)
式中:Xmax、Xmin分別為海洋生物種群搜索空間的上下界;rand(,)為[0,1]區(qū)間內(nèi)的隨機(jī)值。
(2) MPA優(yōu)化階段。迭代初期捕食者的速度低于獵物速度,捕食者選擇布朗運(yùn)動(dòng)方式,數(shù)學(xué)模型描述為:
(16)
式中:Bi為移動(dòng)步長(zhǎng);RB是布朗運(yùn)動(dòng)下滿足正態(tài)分布的隨機(jī)向量;Ei為精英矩陣;Pi獵物矩陣;P為常數(shù)取值0.5;R為在[0,1]區(qū)間內(nèi)的隨機(jī)向量;t與tmax為當(dāng)前以及最大的迭代次數(shù)。
優(yōu)化迭代中期,捕食者與獵物兩者速度相當(dāng)?shù)剡M(jìn)行運(yùn)動(dòng),海洋種群被分為相等2個(gè)部分,獵物基于Lévy游走的方式負(fù)責(zé)開發(fā),捕食者選取布朗運(yùn)動(dòng)的方式負(fù)責(zé)探尋。負(fù)責(zé)開發(fā)和探尋的種群行為的數(shù)學(xué)表達(dá)為:
(17)
(18)
(19)
式中:RL為L(zhǎng)évy游走下分布的隨機(jī)向量;BCF是用來(lái)限制捕食者運(yùn)動(dòng)步長(zhǎng)的一種自適應(yīng)參數(shù)。
優(yōu)化迭代后期,捕食者速度大于獵物。捕食者選擇Lévy游走為最佳策略負(fù)責(zé)開發(fā),優(yōu)化捕食過(guò)程。該過(guò)程數(shù)學(xué)描述為:
(20)
Pi=Ei+P×BCF?Bi
(21)
式中RL點(diǎn)乘精英矩陣模擬Lévy游走。
(3) 魚類聚集裝置(FADs)與渦流效應(yīng)影響捕食者種群運(yùn)動(dòng)。為防止MPA算法優(yōu)化過(guò)程中的早熟收斂,陷入局部最優(yōu)停滯,提出了算法尋優(yōu)調(diào)節(jié)機(jī)制,數(shù)學(xué)描述為:
(22)
式中:pf表示在迭代過(guò)程中受魚類聚集裝置所影響的概率,取值為0.2;U為[0,1]區(qū)間內(nèi)的隨機(jī)生成的二進(jìn)制向量;r為[0,1]區(qū)間內(nèi)的平均分布隨機(jī)數(shù)值;r1、r2為獵物矩陣的隨機(jī)指標(biāo)[20]。
核極限學(xué)習(xí)機(jī)KELM的核函數(shù)參數(shù)S、正則化系數(shù)C決定其學(xué)習(xí)能力和預(yù)測(cè)精度,循環(huán)漿液綜合流量參數(shù)k決定循環(huán)漿液綜合流量與脫硫出口SO2濃度相關(guān)性,采用海洋捕食算法對(duì)C、S以及循環(huán)漿液綜合流量參數(shù)k進(jìn)行尋優(yōu),提高脫硫出口SO2濃度預(yù)測(cè)模型效果。在確定模型的輸入變量后,建立基于MPA-KELM的脫硫出口SO2濃度預(yù)測(cè)模型,模型流程圖如圖3所示。
圖3 MPA-KELM預(yù)測(cè)模型流程圖Fig.3 Flow chart of MPA-KELM prediction model
依據(jù)圖3流程圖,建立MPA-KELM脫硫出口濃度預(yù)測(cè)模型的詳細(xì)步驟為:
步驟1 初始化,設(shè)置MPA的最大迭代次數(shù)tmax、最初迭代次數(shù)t、種群數(shù)量n、受FADs所影響的概率pf、常數(shù)P等進(jìn)行初始化設(shè)置,確定KELM預(yù)測(cè)模型核函數(shù)類型為RBF核;
步驟2 定義適應(yīng)度函數(shù),遍歷獵物種群矩陣P,計(jì)算每個(gè)元素的適應(yīng)度,得到最優(yōu)解后構(gòu)建精英矩陣E;
步驟3 根據(jù)FADs效應(yīng)和旋渦效應(yīng)更新獵物所處位置,獲取最佳捕食者位置,更新精英矩陣,并利用記憶功能存儲(chǔ)最優(yōu)位置;
步驟4 迭代到最大迭代次數(shù)后,終止迭代,將精英矩陣確定的參數(shù)最優(yōu)解代入網(wǎng)絡(luò)訓(xùn)練;
步驟5 將測(cè)試樣本輸入脫硫出口SO2濃度預(yù)測(cè)模型,得到預(yù)測(cè)結(jié)果并根據(jù)評(píng)價(jià)指標(biāo)評(píng)價(jià)模型。
為驗(yàn)證模型的有效性,選取山西某600 MW機(jī)組脫硫塔現(xiàn)場(chǎng)運(yùn)行的穩(wěn)定工況數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行清洗后,得到389組為預(yù)測(cè)模型訓(xùn)練數(shù)據(jù),189組為測(cè)試數(shù)據(jù)。對(duì)脫硫出口SO2濃度預(yù)測(cè)模型進(jìn)行性能評(píng)價(jià)時(shí),采用均方誤差(MSE)、平均絕對(duì)百分比誤差(MAPE)2個(gè)指標(biāo)來(lái)衡量預(yù)測(cè)精度:
(23)
(24)
5.2.1 MPA-KELM預(yù)測(cè)模型實(shí)驗(yàn)結(jié)果與分析
設(shè)定MPA算法n=30,tmax=50,當(dāng)前最大迭代次數(shù)t=0,受魚類聚集裝置所影響的概率pf=0.2、P=0.5。KELM參數(shù)[C,S]∈[2-2,220][21],循環(huán)漿液綜合流量參數(shù)k的取值范圍設(shè)置為[0,0.1]。圖4為變量選擇后脫硫系統(tǒng)出口SO2濃度預(yù)測(cè)模型訓(xùn)練樣本和測(cè)試樣本的預(yù)測(cè)值和實(shí)際值曲線。
圖4 MPA-KELM模型預(yù)測(cè)效果圖Fig.4 MPA-KELM model prediction effect diagram
由圖4可知,在訓(xùn)練樣本和測(cè)試樣本中,MPA-KELM的預(yù)測(cè)值與實(shí)際值基本重合,能夠緊密地跟蹤實(shí)際值的變化,具有較小的偏差。不管是對(duì)于訓(xùn)練集的擬合還是對(duì)測(cè)試集的預(yù)測(cè)均具有較高的準(zhǔn)確度,表明MPA-KELM的預(yù)測(cè)模型精度較高,其擁有較強(qiáng)的學(xué)習(xí)能力。
5.2.2 基于MIC的變量選擇對(duì)結(jié)果影響分析
在使用機(jī)理分析法對(duì)影響出口濃度的變量進(jìn)行篩選后,冗余變量以及相關(guān)性較弱變量的存在仍然使得預(yù)測(cè)模型的運(yùn)行時(shí)間長(zhǎng)、泛化能力差。針對(duì)這一問(wèn)題,采用基于MIC的變量選擇算法進(jìn)一步選擇模型輸入變量。為驗(yàn)證算法的適用性,將變量選擇前與變量選擇后的輸入變量分別采用MPA-KELM預(yù)測(cè)模型進(jìn)行預(yù)測(cè),其它參數(shù)設(shè)置等保持相同,評(píng)價(jià)指標(biāo)如表2所示。
由表2可知,變量選擇后的預(yù)測(cè)模型訓(xùn)練樣本的評(píng)價(jià)指標(biāo)變化不大,測(cè)試樣本的評(píng)價(jià)指標(biāo)有了明顯改善:MSE在訓(xùn)練集上增加了0.380 3 mg/m3,測(cè)試集上減少了1.219 7 mg/m3,MAPE在訓(xùn)練集上增加了1.741 3%,測(cè)試集上減少了2.397 5%。
表2 變量選擇前后的評(píng)價(jià)指標(biāo)Tab.2 Evaluation indexes before and after variable selection
由于脫硫系統(tǒng)實(shí)際運(yùn)行數(shù)據(jù)包含噪聲信號(hào),在變量選擇前對(duì)包含無(wú)用噪聲和冗余信息的變量進(jìn)行學(xué)習(xí),出現(xiàn)過(guò)擬合,導(dǎo)致了訓(xùn)練精度高,泛化能力差的現(xiàn)象;在變量選擇后剔除了冗余變量,減少了模型可調(diào)參數(shù),一定程度抑制噪聲的干擾,使得訓(xùn)練集的誤差稍有增大。表明在變量選擇前,預(yù)測(cè)模型的學(xué)習(xí)能力較強(qiáng),泛化能力較差?;贛IC變量選擇算法選擇了對(duì)脫硫系統(tǒng)出口SO2濃度相關(guān)性強(qiáng)且合理的輸入變量,精簡(jiǎn)了模型結(jié)構(gòu),使得模型預(yù)測(cè)精度得到提高。
5.2.3 模型對(duì)比分析
為進(jìn)一步探尋MPA-KELM模型的預(yù)測(cè)特點(diǎn),分別與核極限學(xué)習(xí)機(jī)(KELM)、麻雀搜索算法(sparrow search algorithm,SSA)優(yōu)化核極限學(xué)習(xí)機(jī)(SSA-KELM)2種脫硫出口濃度預(yù)測(cè)模型進(jìn)行對(duì)比。采用試錯(cuò)法在評(píng)價(jià)指標(biāo)最佳時(shí)獲取KELM模型參數(shù)取值。為避免實(shí)驗(yàn)的偶然性,采用相同的樣本集,將麻雀搜索算法與MPA算法的參數(shù)設(shè)置相同,即n=30,tmax=50。各預(yù)測(cè)模型對(duì)脫硫系統(tǒng)出口濃度數(shù)據(jù)的訓(xùn)練樣本和測(cè)試樣本的預(yù)測(cè)曲線見圖5,各預(yù)測(cè)模型測(cè)試誤差對(duì)比見圖6。
圖5 各預(yù)測(cè)模型預(yù)測(cè)效果對(duì)比圖Fig.5 Comparison of prediction effects of each prediction model
圖6 各預(yù)測(cè)模型測(cè)試誤差對(duì)比圖Fig.6 Error comparison diagram of each prediction model
由圖5、圖6可知,由脫硫出口SO2濃度的實(shí)際值與3種模型的預(yù)測(cè)結(jié)果分析,各預(yù)測(cè)模型的輸出均能較好地跟蹤實(shí)際的變化趨勢(shì),但各模型的預(yù)測(cè)準(zhǔn)確度存在不同。由預(yù)測(cè)模型的結(jié)果與實(shí)際脫硫出口SO2濃度值的擬合度分析,在訓(xùn)練集上,KELM、SSA-KELM、MPA-KELM這3種模型的擬合度基本相同;在測(cè)試集上,3種預(yù)測(cè)模型對(duì)脫硫出口濃度的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果存在一定偏差。由測(cè)試結(jié)果看:SSA-KELM的預(yù)測(cè)結(jié)果與實(shí)際值偏離程度最大,KELM的預(yù)測(cè)值基本貼合于實(shí)際值,吻合程度優(yōu)于SSA-KELM;而從訓(xùn)練樣本結(jié)果和測(cè)試樣本輸出的結(jié)果可知,MPA-KELM的預(yù)測(cè)數(shù)據(jù)為最佳擬合,且具有穩(wěn)定性,說(shuō)明MPA-KELM模型對(duì)脫硫出口濃度的預(yù)測(cè)精度高,性能優(yōu)越。表3為各模型預(yù)測(cè)評(píng)價(jià)指標(biāo)。
表3 各模型預(yù)測(cè)評(píng)價(jià)指標(biāo)Tab.3 Prediction and evaluation indexes of each model
由表3可知,相較于常規(guī)的KELM,MPA-KELIM的MPE在訓(xùn)練集上和測(cè)試集上分別減小0.738 2 mg/m3、1.543 3 mg/m3,MAPE分別減小了0.895 1%、1.763%。結(jié)合圖6預(yù)測(cè)模型測(cè)試誤差對(duì)比圖,表明MPA算法能夠?qū)τ贙ELM預(yù)測(cè)模型的關(guān)鍵參數(shù)進(jìn)行有效尋優(yōu),提高模型預(yù)測(cè)準(zhǔn)確度,對(duì)于提高脫硫出口預(yù)測(cè)模型的學(xué)習(xí)能力和泛化能力具有重要意義。
與SSA-KELM相比,MPA-KELIM的MPE和MAPE在訓(xùn)練集上分別增大了0.641 6 mg/m3、2.326 2%,而在測(cè)試集上MPE和MAPE分別減小了4.602 5 mg/m3、3.207 8%??芍猄SA算法使得模型的訓(xùn)練精度變高,但模型出現(xiàn)過(guò)擬合的問(wèn)題。上述結(jié)果表明MPA能夠克服算法尋優(yōu)過(guò)程中的早熟收斂現(xiàn)象,進(jìn)而擁有良好的尋優(yōu)特性。
綜上,在3個(gè)模型比較中,MPA-KELM模型預(yù)測(cè)的擬合度和穩(wěn)定性均優(yōu)于其他2個(gè)模型,證明采用MPA算法能夠進(jìn)行有效的尋優(yōu),提升脫硫出口濃度預(yù)測(cè)模型的準(zhǔn)確度。
本文提出了基于MIC變量選擇和海洋捕食優(yōu)化核極限學(xué)習(xí)機(jī)的脫硫系統(tǒng)出口SO2濃度預(yù)測(cè)模型,采用山西某600 MW電廠脫硫現(xiàn)場(chǎng)工況數(shù)據(jù)對(duì)預(yù)測(cè)模型進(jìn)行驗(yàn)證,得到以下結(jié)論:
(1) 利用基于MIC的變量選擇方法選擇合適的變量精準(zhǔn)描述建模對(duì)象,能夠有效去除冗余變量以及相關(guān)性較弱的變量,提高模型的泛化能力。
(2) 與KELM模型相比,MPA優(yōu)化KELM預(yù)測(cè)模型的關(guān)鍵參數(shù),避免了需要假設(shè)正則化系數(shù)與核參數(shù)并不斷試驗(yàn)的缺陷。
(3) 與麻雀搜索算法優(yōu)化的KELM預(yù)測(cè)模型相比,MPA-KELM預(yù)測(cè)模型矯正了SAA-KELM模型的過(guò)擬合問(wèn)題,提高預(yù)測(cè)模型的泛化能力。
(4) 采用基于MIC的變量選擇算法,以及MPA優(yōu)化KELM關(guān)鍵參數(shù)能夠有效提高KELM預(yù)測(cè)模型的適用性、穩(wěn)定性,得到高質(zhì)量的預(yù)測(cè)結(jié)果,為脫硫系統(tǒng)SO2的現(xiàn)場(chǎng)優(yōu)化控制提供技術(shù)支持。