金秀章,景 昊
(華北電力大學(xué) 控制與計算機(jī)工程學(xué)院,河北 保定 071003)
目前燃煤電廠的SO2排放量已經(jīng)超過了 SO2排放總量的一半,并且呈現(xiàn)逐年遞增的趨勢。我國先后頒布的《火電廠大氣污染物排放標(biāo)準(zhǔn)》和《煤電節(jié)能減排升級與改造行動計劃 (2014—2020 年)》等一系列政策法規(guī),明確指出火電廠的SO2排放濃度必須控制在 35 mg/m3以下[1]。石灰石-石膏濕法煙氣脫硫技術(shù)(WFGD)是目前最有效的燃煤機(jī)組SO2控 制 技 術(shù) 之 一[2]。WFGD 工 藝 中 漿 液 pH 值 是決定煙氣脫硫效率的關(guān)鍵參數(shù),因此pH 值的測量需要迅速、準(zhǔn)確。
在 WFGD 現(xiàn)場測量時由于環(huán)境惡劣,且 pH 值變化具有較大的慣性,導(dǎo)致測量時長較大,無法及時得到漿液 pH 值的準(zhǔn)確值,對于脫硫作業(yè)十分不利。因此需要對漿液 pH 值進(jìn)行預(yù)測。
pH 值測量作為非線性系統(tǒng)一直是研究熱點(diǎn)[3]。利用燃煤機(jī)組的運(yùn)行數(shù)據(jù),再結(jié)合機(jī)理分析,采用實(shí)驗(yàn)建模的方法可以辨識出精確合理的系統(tǒng)模型[4]。文獻(xiàn)[5]和文獻(xiàn)[6]把神經(jīng)網(wǎng)絡(luò)等自適應(yīng)模糊系統(tǒng)用于 pH 中和過程。BP 神經(jīng)網(wǎng)絡(luò)、RBF 神經(jīng)網(wǎng)絡(luò)、Elman 神經(jīng)網(wǎng)絡(luò)等方法是 pH 值建模的典型方法,但上述算法本身在時間序列的處理上并沒有突出的優(yōu)勢。
隨著技術(shù)的進(jìn)步,深度學(xué)習(xí)、遞歸神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等也在 pH 值建模得到應(yīng)用[7-10]。LSTM神經(jīng)網(wǎng)絡(luò),注重數(shù)據(jù)間的時間特性,在大遲延時間序列預(yù)測中具有突出優(yōu)勢[11]。LSTM 神經(jīng)網(wǎng)絡(luò)的特點(diǎn)在于發(fā)現(xiàn)當(dāng)前時刻數(shù)據(jù)與之前數(shù)據(jù)間的聯(lián)系,利用本身具有的記憶能力,將之前數(shù)據(jù)的狀態(tài)進(jìn)行保存[12],同時根據(jù)保存的信息影響后續(xù)的預(yù)測值及變化趨勢。
因此,本文提出一種基于LSTM 神經(jīng)網(wǎng)絡(luò)的pH值預(yù)測模型。以某 600 MW 機(jī)組為研究對象,使用機(jī)組實(shí)際運(yùn)行數(shù)據(jù),經(jīng)過機(jī)理和相關(guān)性分析,確定pH值模型的輔助變量,建立高精度的pH 值預(yù)測模型。
作為循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)中的一個特殊情況,LSTM 與前饋神經(jīng)網(wǎng)絡(luò)不同,屬于反饋神經(jīng)網(wǎng)絡(luò)的一種。RNN 中神經(jīng)元的輸出可以在下一個時刻作用于自身,且共享從樣本序列中不同位置學(xué)習(xí)到的特征,以此減少模型中的參數(shù)數(shù)量,這一點(diǎn)在數(shù)據(jù)規(guī)模龐大時具有重要意義。與傳統(tǒng)RNN 網(wǎng)絡(luò)的區(qū)別在于,LSTM 網(wǎng)絡(luò)結(jié)構(gòu)加入了控制門的機(jī)制,結(jié)構(gòu)包括記憶細(xì)胞、輸入門、輸出門、遺忘門四部分。LSTM 原理圖如圖1 所示。
圖1 中,三個框分別為不同時序下的細(xì)胞狀態(tài),δ表示激活函數(shù)為sig-moid 的前饋網(wǎng)絡(luò)層,tanh 表示激活函數(shù)為 tanh 的前饋網(wǎng)絡(luò)層。Xt表示 t 時刻的輸入,S(t)表示 t 時刻細(xì)胞的狀態(tài)值,前饋網(wǎng)絡(luò)層中的隱藏神經(jīng)元個數(shù)經(jīng)多次調(diào)試后,確定一個最佳值。
輸入門 it的值和在t 時刻輸入細(xì)胞的候選狀態(tài)值,計 算 如 下 :
其中,Wi為輸入門的權(quán)重矩陣,bi為輸入門的偏置項;Wc為細(xì)胞當(dāng)前狀態(tài)的權(quán)重矩陣;bc為細(xì)胞當(dāng)前狀態(tài)的偏置項。
其次,計算在 t 時刻遺忘門的激活值 ft,公式如下:
式中,Wf為遺忘門的權(quán)重矩陣,bf為遺忘門的偏置項。
由以上公式可計算出t 時刻的細(xì)胞狀態(tài)更新值 S(t),公式如下:
計算出細(xì)胞狀態(tài)更新值后,可計算輸出門的值ht,公式如下:
式中,Wo為輸出門的權(quán)重矩陣,bo為輸出門的偏置項。
通過以上計算,LSTM 可以有效利用輸入數(shù)據(jù)使LSTM 神經(jīng)網(wǎng)絡(luò)具有長時期記憶功能。
根據(jù) WFGD 的生產(chǎn)機(jī)理,pH 值的影響因素來源于兩個方面,分別是燃燒側(cè)產(chǎn)生的SO2總量和新鮮石灰石漿液的供應(yīng)量。如果SO2總量不變,新鮮石灰石漿液供應(yīng)量增加可以增大pH 值;如果新鮮石灰石漿液供應(yīng)量不變,SO2總量增大可以降低pH值。因此模型輔助變量應(yīng)選取與SO2總量和新鮮石灰石漿液變化有關(guān)的物理量。之后使用互信息計算漿液pH 值與生產(chǎn)中所涉及的物理量的相關(guān)性。選取與漿液pH 值相關(guān)性大的變量為輔助變量。因?yàn)闈{液 pH 值變化慣性大,所以當(dāng)前時刻漿液 pH 值受前時刻漿液pH 值的影響。最后確定總風(fēng)量、總煤量、凈煙氣 SO2濃度、原煙氣 SO2濃度、原煙氣流量、空預(yù)器入口煙氣氧量、空預(yù)器出口煙氣氧量、爐漿液密度、新鮮石灰石漿液流量、吸收塔液位、兩臺氧化風(fēng)機(jī)電流及5 s 前的漿液pH 值為輔助變量。
圖1 LSTM 結(jié)構(gòu)圖
本文所用數(shù)據(jù)源于某燃煤電廠的歷史數(shù)據(jù)。預(yù)處理包括剔除粗大值、數(shù)據(jù)中值濾波兩部分。
2.2.1 粗大值處理
數(shù)據(jù)規(guī)模足夠,且趨于正態(tài)分布,因此使用 3σ準(zhǔn)則對數(shù)據(jù)進(jìn)行粗大值處理。步驟如下:
(1)計算標(biāo)準(zhǔn)差 σ
式中,xn為數(shù)據(jù)值;n 為數(shù)據(jù)個數(shù);為數(shù)據(jù)平均值。
(2)比較數(shù)據(jù)是否滿足下式要求,如果不滿足則將數(shù)據(jù)剔除。
(3)重復(fù)步驟(2),直到數(shù)據(jù)全部滿足式(8)的要求。
2.2.2 數(shù)據(jù)濾波
對數(shù)據(jù)曲線中帶有“毛刺”的數(shù)據(jù)濾波,可以消除噪聲的影響,使數(shù)據(jù)變化更加平滑,更加接近真實(shí)數(shù)據(jù)。其中輔助變量總風(fēng)量的濾波圖如圖2 所示。
2.2.3 時序調(diào)整
pH 值變化是一個復(fù)雜的過程,存在多變量、多耦合及遲延的問題。因此采用互信息法求輔助變量與主導(dǎo)變量間的時間遲延,對變量進(jìn)行時序調(diào)整,進(jìn)一步提高模型預(yù)測精度。
模型以漿液 pH 值作為輸出,采用三層 LSTM 神經(jīng)網(wǎng)絡(luò)建立,每層21 個神經(jīng)元,優(yōu)化算法為 Adam,最大迭代次數(shù)為 280,初始學(xué)習(xí)率為 0.005,在 125輪訓(xùn)練后乘以 0.1 來降低學(xué)習(xí)率。選用 8 700 組預(yù)處理后的數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),其中6 700 組用于模型訓(xùn)練,2 000 組用于模型測試,數(shù)據(jù)采樣時間間隔為1 s。
基于 LSTM 神經(jīng)網(wǎng)絡(luò)的 pH 值預(yù)測模型 LSTM模型結(jié)構(gòu)如圖3 所示。
圖3 LSTM 模型結(jié)構(gòu)
圖2 數(shù)據(jù)濾波
為了便于驗(yàn)證模型的性能,使用LSTM 模型與BP 神經(jīng)網(wǎng)絡(luò)模型和 LSSVM 模型進(jìn)行對比。模型預(yù)測值與實(shí)際值如圖4 所示。LSTM 模型與 LSSVM 模型和BP 神經(jīng)網(wǎng)絡(luò)模型相比在預(yù)測趨勢、預(yù)測精度方面更加具有優(yōu)勢。LSSVM 模型測試結(jié)果顯示,在漿液 pH 值增大時,預(yù)測值下降;pH 值不變時,預(yù)測趨勢反復(fù)波動。BP 神經(jīng)網(wǎng)絡(luò)模型測試結(jié)果顯示,漿液 pH 值不變時,預(yù)測值反復(fù)波動;pH 值增大時,預(yù)測值沒有明顯的趨勢變化。同時LSSVM 模型和BP 神經(jīng)網(wǎng)絡(luò)模型的預(yù)測值一直在頻繁、劇烈波動,使預(yù)測精度更低。而LSTM 網(wǎng)絡(luò)模型測試結(jié)果顯示,漿液pH 值穩(wěn)定時,預(yù)測值也比較穩(wěn)定;在漿液 pH值急劇增加時,預(yù)測值也在急劇增加,預(yù)測值與實(shí)際值緊密跟隨,且增加后迅速保持穩(wěn)定。對比三個不同模型測試結(jié)果,LSTM 模型在預(yù)測精度、趨勢跟隨上均優(yōu)于LSSVM 模型和 BP 神經(jīng)網(wǎng)絡(luò)模型,驗(yàn)證了LSTM 模型在數(shù)據(jù)挖掘和時間序列處理上的優(yōu)勢。
模型的預(yù)測誤差如圖5 所示。LSSVM 模型、BP神經(jīng)網(wǎng)絡(luò)模型誤差較大,多次出現(xiàn)誤差比較嚴(yán)重的值,且誤差曲線一直存在頻繁、劇烈的波動,因此LSSVM 模型、BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測不理想。LSTM模型誤差最小,誤差穩(wěn)定在0 刻度左右,沒有出現(xiàn)較大誤差。因此 LSTM 模型測試結(jié)果最好。
為了進(jìn)一步分析模型的性能,采用平均絕對誤差(MAE)和均方根誤差(RMSE)兩個指標(biāo)對各個模型進(jìn)行分析,如式(9)、式(10)所示:
式中,ypi為預(yù)測值,yai為實(shí)際值。
如表1 所示,LSTM 模型與 BP 神經(jīng)網(wǎng)絡(luò)模型、LSSVM 模型相比測試結(jié)果最好。LSTM 模型與LSSVM 模型相比平均絕對誤差降低了0.014 0,均方根誤差降低0.016 6。本文建立的LSTM 神經(jīng)網(wǎng)絡(luò)模型與BP 神經(jīng)網(wǎng)絡(luò)模型、LSSVM 模型相比在趨勢、精度、平均絕對誤差及均方根誤差方面均有非常大的提升,驗(yàn)證了LSTM神經(jīng)網(wǎng)絡(luò)在時間序列處理上的優(yōu)越性,也驗(yàn)證了LSTM 模型在漿液pH 值預(yù)測的有效性及通用性。
表1 模型測試結(jié)果
圖4 模型預(yù)測值與實(shí)際值
圖5 模型預(yù)測誤差
針對燃煤電廠 WFGD 過程中石灰石漿液pH 值的變化受多個變量的影響,且變量之間具有相關(guān)性和現(xiàn)場數(shù)據(jù)具有時序特性,本文提出了一種基于長短期記憶網(wǎng)絡(luò)的 pH 值預(yù)測模型。首先,通過機(jī)理分析初步篩選輔助變量后進(jìn)一步使用互信息確定輔助變量;然后,建立LSTM 神經(jīng)網(wǎng)絡(luò)模型;最后,使用燃煤電廠數(shù)據(jù)對模型進(jìn)行測試。模型測試結(jié)果表明本文所提出的 LSTM 模型相對 BP 神經(jīng)網(wǎng)絡(luò)模型、LSSVM 模型預(yù)測精度高、泛化能力強(qiáng)。
需要說明的是,由于數(shù)據(jù)量有限,本研究只能歸納出高負(fù)荷狀態(tài)下的漿液pH 值預(yù)測模型。然而隨著燃煤電廠智能化水平的提高,電廠數(shù)據(jù)海量化和高維化已經(jīng)成為必然趨勢。合理使用這些數(shù)據(jù)可以進(jìn)一步建立全工況的漿液 pH 值預(yù)測模型,這也是后續(xù)的研究重點(diǎn)。本文結(jié)果對LSTM 算法在燃煤電廠的實(shí)際應(yīng)用具有一定借鑒意義。