王祖林,韓 碩,康俊杰,李云飛,藕泉江
(1.河北國(guó)華定州發(fā)電有限責(zé)任公司,定州073000;2.華北電力大學(xué) 控制與計(jì)算機(jī)學(xué)院,北京102206;3.北京達(dá)華潔能工程技術(shù)有限公司,北京100029)
我國(guó)主要的發(fā)電形式是燃煤發(fā)電,煤炭燃燒產(chǎn)生的主要污染物為氮氧化合物,因此控制污染物的排放對(duì)生態(tài)環(huán)境以及人民的健康尤為重要。NOx排放預(yù)測(cè)是鍋爐燃燒和選擇性催化還原(SCR)、煙氣脫硫(FGD)等排放控制設(shè)備運(yùn)行中的一項(xiàng)重要技術(shù),近年來(lái)一直受到研究者的關(guān)注[1-4]。由于SCR 脫硝系統(tǒng)入口NOx濃度測(cè)量具有一定的滯后特性,如果能夠提前準(zhǔn)確預(yù)測(cè)NOx排放的入口濃度,建立精確的預(yù)測(cè)模型,就能夠?yàn)閷?shí)現(xiàn)燃燒優(yōu)化與噴氨量的超前調(diào)節(jié)打下基礎(chǔ)[5],進(jìn)而保證NOx排放濃度始終保持在較低的水平,提高運(yùn)行系統(tǒng)的穩(wěn)定性。
目前,國(guó)內(nèi)外燃煤電站都采用選擇性催化還原脫硝技術(shù), 但由于SCR 系統(tǒng)具有很強(qiáng)的非線性,在負(fù)荷頻繁變動(dòng)時(shí),難以精確控制NOx的排放。機(jī)理建模由于過(guò)程復(fù)雜,模型精度較低。隨著人工智能大數(shù)據(jù)技術(shù)的發(fā)展,數(shù)據(jù)驅(qū)動(dòng)模型越來(lái)越受到工業(yè)界的關(guān)注[6-7]。模型的建立包括數(shù)據(jù)的處理、變量的選擇和學(xué)習(xí)網(wǎng)絡(luò)的建立,文獻(xiàn)[8]將可能性模糊C 均值聚類(lèi)算法應(yīng)用于電力負(fù)荷數(shù)據(jù)檢測(cè)與修正過(guò)程中,對(duì)數(shù)據(jù)中的異常數(shù)據(jù)進(jìn)行檢測(cè)和修正;文獻(xiàn)[9]結(jié)合SRCKF 和移動(dòng)窗口法提出了一種自適應(yīng)容積卡爾曼濾波方法,針對(duì)參數(shù)數(shù)據(jù)存在不同噪聲統(tǒng)計(jì)特性的特點(diǎn), 移動(dòng)窗口法實(shí)時(shí)估計(jì)噪聲的協(xié)方差陣,校正參數(shù)的濾波結(jié)果;文獻(xiàn)[10]采用遺傳算法對(duì)SCR 系統(tǒng)運(yùn)行數(shù)據(jù)進(jìn)行主元分析選出主要獨(dú)立變量,建立廣義回歸神經(jīng)網(wǎng)絡(luò),得到SCR 系統(tǒng)的GAGRNN 模型, 但是該模型沒(méi)有考慮歷史時(shí)序?qū)Ξ?dāng)前時(shí)刻的影響。
為此,本文首先利用滑動(dòng)平均法對(duì)原始數(shù)據(jù)進(jìn)行去噪,然后基于隨機(jī)森林算法分析變量間的相互關(guān)系,從37 個(gè)輸入變量中選出20 個(gè)相關(guān)度高的變量,去除冗余變量,最后利用深度學(xué)習(xí)Bi-LSTM 建立了某電廠660 MW 電站鍋爐燃燒系統(tǒng)SCR 入口動(dòng)態(tài)的NOx濃度預(yù)測(cè)模型。該模型充分利用歷史信息,并能夠?qū)崿F(xiàn)動(dòng)態(tài)建模,結(jié)果表明相較于傳統(tǒng)數(shù)據(jù)模型該模型擬合效果好、預(yù)測(cè)精度高,并與其他幾種模型進(jìn)行對(duì)比分析,驗(yàn)證了模型的有效性。
本文采用某660 MW 電廠的歷史數(shù)據(jù),為了提高預(yù)測(cè)模型的預(yù)測(cè)精度,需要對(duì)數(shù)據(jù)進(jìn)行降噪預(yù)處理。采用滑動(dòng)窗口平均法對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,滑動(dòng)平均相當(dāng)于低通濾波,在數(shù)據(jù)展開(kāi)圖中選定某一尺寸的窗口,將窗口內(nèi)的所有異常值做算術(shù)平均,將所求的平均值作為窗口中心點(diǎn)的異常值。按照點(diǎn)距或線距移動(dòng)窗口,重復(fù)此平均方法,直到對(duì)全部數(shù)據(jù)完成上述過(guò)程。
滑動(dòng)窗口平均方法是沿全長(zhǎng)度為N 的數(shù)據(jù),不斷地逐個(gè)滑動(dòng)地取m 個(gè)相鄰數(shù)據(jù)作加權(quán)平均來(lái)表示平滑數(shù)據(jù),其一般算式為
式中:m=p-q;Wi為權(quán)系數(shù),且其和為1。
處理結(jié)果如圖1~圖4 所示,列舉了發(fā)電機(jī)有功功率、預(yù)熱器煙道入口處后墻壓力、給煤機(jī)給煤量、鍋爐氧量這4 個(gè)主要因變量的原始數(shù)據(jù)以及處理后的數(shù)據(jù)。
圖1 發(fā)電機(jī)有功功率數(shù)據(jù)處理前后對(duì)比Fig.1 Comparison before and after processing of generator active power data
圖2 空預(yù)器入口壓力數(shù)據(jù)處理前后對(duì)比Fig.2 Comparison of air preheater inlet pressure data before and after processing
圖3 給煤機(jī)給煤量數(shù)據(jù)處理前后對(duì)比Fig.3 Comparison of coal feeder data before and after processing
圖4 鍋爐氧量數(shù)據(jù)處理前后對(duì)比Fig.4 Comparison of boiler oxygen data before and after processing
根據(jù)燃燒機(jī)理分析,SCR 入口NOx的生成主要受風(fēng)量、煤量及配風(fēng)方式等的影響。數(shù)據(jù)建模的輸出是SCR 反應(yīng)器A 進(jìn)口NOx濃度,與輸出的相關(guān)的自變量包括發(fā)電機(jī)有功功率、總煤量、各層二次風(fēng)門(mén)擋板開(kāi)度閥門(mén)指令、給煤機(jī)給煤量及磨煤機(jī)一次風(fēng)流量等37 個(gè)變量。
隨機(jī)森林在模型輸入變量選擇方面應(yīng)用廣泛,本文使用基尼指數(shù)衡量每個(gè)變量對(duì)目標(biāo)變量的貢獻(xiàn)大小,變量重要性評(píng)分用VIM 表示,基尼指數(shù)用GI 表示。假設(shè)有c 個(gè)特征b1,b2,b3,…,bc,則每個(gè)特征bn的基尼指數(shù),即第n 個(gè)特征在隨機(jī)森林所有決策樹(shù)中節(jié)點(diǎn)不純度的平均改變量表示為
式中:k 為類(lèi)別個(gè)數(shù);Pnk表示類(lèi)別k 在節(jié)點(diǎn)n 中所占的比例大小。
特征bn在節(jié)點(diǎn)c 分支前后的基尼指數(shù)變化量用下式表示:
式中:GIl和GIr分別為分枝后生成的兩個(gè)新節(jié)點(diǎn)的基尼指數(shù)。
假設(shè)特征bn在決策樹(shù)i 中出現(xiàn)的節(jié)點(diǎn)屬于集合M,則特征bn在第i 棵樹(shù)的重要程度表示為
如果隨機(jī)森林中共有L 棵樹(shù),則:
通過(guò)保持變量個(gè)數(shù)不變,改變生成樹(shù)數(shù)量的方法, 使用隨機(jī)森林算法對(duì)37 個(gè)相關(guān)變量進(jìn)行重要性評(píng)分,進(jìn)而選出合適的輸入變量。
LSTM 神經(jīng)網(wǎng)絡(luò)由Hochreiter 等提出,在RNN的基礎(chǔ)上考慮數(shù)據(jù)的時(shí)序特性, 其引入了門(mén)控單元,解決了網(wǎng)絡(luò)訓(xùn)練過(guò)程中梯度消亡的問(wèn)題。LSTM單元結(jié)構(gòu)如圖5 所示。
圖5 LSTM 結(jié)構(gòu)圖Fig.5 Architecture of LSTM
每個(gè)單元結(jié)構(gòu)中都包含有輸入門(mén)、 輸出門(mén)、遺忘門(mén),這三個(gè)結(jié)構(gòu)通過(guò)非線性活函數(shù)對(duì)輸入的信息選擇性通過(guò)或者遺忘,同時(shí)確定新輸入有多少通過(guò)或遺忘,這取決于信息的價(jià)值含量。這些確保了有效信息的傳遞。遺忘門(mén)控制前一時(shí)刻單元結(jié)構(gòu)狀態(tài)信息ct-1的保留程度, 輸入門(mén)決定了當(dāng)前時(shí)刻單元結(jié)構(gòu)的輸入ht-1有多少保留到當(dāng)前單元狀態(tài)c1,輸出門(mén)控制當(dāng)前單元狀態(tài)ct有多少輸出到單元結(jié)構(gòu)的當(dāng)前輸出ht。LSTM 單元結(jié)構(gòu)三個(gè)門(mén)的公式如下:
遺忘門(mén)對(duì)應(yīng)的函數(shù)式:
輸入門(mén)對(duì)應(yīng)的函數(shù)式:
輸出門(mén)對(duì)應(yīng)的函數(shù)式:
式中: ft、it、ot分別為遺忘門(mén)、輸入門(mén)、輸出門(mén)的輸出;w 和b 分別為權(quán)重矩陣和偏置項(xiàng)。
單元結(jié)構(gòu)的當(dāng)前狀態(tài)為
單元結(jié)構(gòu)的當(dāng)前輸出為
Bi-LSTM 網(wǎng)絡(luò)是由2 層LSTM 網(wǎng)絡(luò)通過(guò)反向連接構(gòu)成的,可以充分提取各個(gè)輸入數(shù)據(jù)序列間的關(guān)聯(lián)關(guān)系及序列自身的前向以及反向關(guān)聯(lián)關(guān)系,最終得到輸入時(shí)間序列與SCR 入口NOx濃度的映射關(guān)系,其結(jié)構(gòu)如圖6 所示。
圖6 Bi-LSTM 結(jié)構(gòu)圖Fig.6 Architecture of Bi-LSTM
構(gòu)建一個(gè)如圖7 所示的4 層神經(jīng)網(wǎng)絡(luò),包括輸入層、Bi-LSTM 層、全連接層、輸出層。將序列輸入圖層的大小指定為輸入數(shù)據(jù)的特征數(shù)量。將全連接層的大小指定為響應(yīng)數(shù)。指定Bi-LSTM 層有200 個(gè)隱含單元。將求解器設(shè)置為adam,并進(jìn)行300 輪訓(xùn)練。為了防止梯度爆炸,將梯度閾值設(shè)置為1。
圖7 Bi-LSTM 網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.7 Bi-LSTM network structure diagram
本文研究對(duì)象為某電廠超臨界660 MW 燃煤機(jī)組,鍋爐為超臨界參數(shù)變壓運(yùn)行的直流爐,四角切向燃燒方式、一次中間再熱、單爐膛平衡通風(fēng)、固態(tài)排渣、半露天布置、爐前低封、全鋼構(gòu)架,配用中速磨煤機(jī)正壓直吹式制粉系統(tǒng)。
為了使訓(xùn)練數(shù)據(jù)具有廣泛的表示性,為了體現(xiàn)深度神經(jīng)網(wǎng)路的優(yōu)勢(shì),從所研究電廠的分散控制系統(tǒng)(distributed control system,DCS)中采集了46800個(gè)大數(shù)據(jù)樣本,對(duì)基于Bi-LSTM 的NOx排放模型進(jìn)行了訓(xùn)練和測(cè)試。采樣間隔為15 s,采樣時(shí)間覆蓋了所研究鍋爐8 天的運(yùn)行歷史數(shù)據(jù)。為了保證訓(xùn)練集和測(cè)試集都包含不同的運(yùn)行工況,避免不同樣本分布對(duì)模型精度和通用性的影響。樣本數(shù)據(jù)分為兩部分,將前70%的數(shù)據(jù)設(shè)置為訓(xùn)練數(shù)據(jù)集,剩余30%設(shè)置為測(cè)試數(shù)據(jù)集。結(jié)合現(xiàn)場(chǎng)測(cè)點(diǎn)的具體情況,總共確定了37 個(gè)操作變量作為基于Bi-LSTM 的NOx排放模型的原始輸入變量。利用隨機(jī)森林算法得到這些變量的重要性柱狀圖,如圖8 所示。
將基于隨機(jī)森林的變量重要性評(píng)估的評(píng)分閾值設(shè)為2,分?jǐn)?shù)高于2 的變量可作為模型訓(xùn)練網(wǎng)絡(luò)的輸入變量。經(jīng)過(guò)分析,選擇其中20 個(gè)變量,如表1所示。
圖8 原始變量重要性柱狀圖Fig.8 Histogram of importance of original variables
表1 輸入變量及其變化范圍Tab.1 Input variables and their range of variation
基于Bi-LSTM 方法模型預(yù)測(cè)SCR 入口NOx濃度的框架結(jié)構(gòu)如圖9 所示。
圖9 基于Bi-LSTM 的NOx 排放預(yù)測(cè)框架圖Fig.9 Block diagram of NOx emission prediction based on Bi-LSTM
電站鍋爐煤粉燃燒過(guò)程中生成的NOx大多以燃料型和熱力型為主,并且NOx的生成不僅僅由當(dāng)前時(shí)刻的運(yùn)行輸入量單獨(dú)決定的,而是受之前一段時(shí)間內(nèi)運(yùn)行輸入量的累積影響。穩(wěn)態(tài)模型通常只考慮當(dāng)前時(shí)刻的系統(tǒng)輸入和輸出關(guān)系, 不能描述NOx生成的動(dòng)態(tài)特性。電站鍋爐負(fù)荷頻繁變動(dòng),長(zhǎng)期處于變工況運(yùn)行狀態(tài),穩(wěn)態(tài)模型的預(yù)測(cè)精度將大大下降。相比之下,動(dòng)態(tài)模型考慮了系統(tǒng)輸入和輸出的時(shí)間序列影響,對(duì)真實(shí)對(duì)象的動(dòng)態(tài)特性具有更好的解釋能力,更能反映系統(tǒng)的動(dòng)態(tài)變化特性。根據(jù)NOx機(jī)理和現(xiàn)場(chǎng)測(cè)量的遲滯情況,本文利用X(t)、X(t-1)、X(t-2)、X(t-3)等時(shí)序輸入建立SCR 脫硝系統(tǒng)入口NOx質(zhì)量濃度的動(dòng)態(tài)模型。為了驗(yàn)證數(shù)據(jù)動(dòng)態(tài)模型的準(zhǔn)確性,本文分別采用BPNN 建立NOx排放的動(dòng)態(tài)模型和核偏最小二乘(kernel partial least squares,KPLS)方法建立的靜態(tài)模型作為對(duì)比。圖10 為基于動(dòng)態(tài)的Bi-LSTM 的SCR 反應(yīng)器入口NOx質(zhì)量濃度的模型的訓(xùn)練結(jié)果及與其他模型的對(duì)比圖, 圖11為測(cè)試結(jié)果的對(duì)比圖。
圖10 Bi-LSTM、BPNN 及KPLS 的NOx 模型訓(xùn)練結(jié)果對(duì)比圖Fig.10 Comparison diagram of NOx model training results of BI-LSTM,BPNN and KPLS
圖11 Bi-LSTM、BPNN 及KPLS 的NOx 模型測(cè)試結(jié)果對(duì)比圖Fig.11 Comparison diagram of NOx model training results of BI-LSTM,BPNN and KPLS
由圖10、圖11 可知,基于Bi-LSTM 和BPNN 的動(dòng)態(tài)模型要比KPLS 建立的靜態(tài)模型預(yù)測(cè)的效果要好,深度神經(jīng)網(wǎng)絡(luò)要比淺層的神經(jīng)網(wǎng)絡(luò)建立的模型準(zhǔn)確性高。值得一提的是,當(dāng)樣本量不充足或者樣本覆蓋工況不完整時(shí), 會(huì)影響數(shù)據(jù)模型的準(zhǔn)確度。為了說(shuō)明本文所提方法的泛化能力,所選測(cè)試數(shù)據(jù)的范圍要大于訓(xùn)練數(shù)據(jù)的范圍。這時(shí)KPLS 靜態(tài)模型存在著嚴(yán)重的模型失效問(wèn)題,動(dòng)態(tài)的BPNN 模型表現(xiàn)的好于靜態(tài)KPLS,而動(dòng)態(tài)Bi-LSTM 泛化能力明顯高于前兩者。因此,基于動(dòng)態(tài)深度神經(jīng)網(wǎng)路建立的預(yù)測(cè)模型也具有較好的泛化能力。模型的評(píng)價(jià)指標(biāo)采用均方誤差平方根(rooted mean squared error,RMSE)和平均絕對(duì)百分比誤差(mean absolute percentage,MAPE)。RMSE 和MAPE 的計(jì)算公式如下:
式中:yi為實(shí)際SCR 入口NOx濃度;模型預(yù)測(cè)值;n 為序列的總樣本數(shù)。
具體的對(duì)比數(shù)值如圖12、圖13 所示。比較三種模型的擬合和預(yù)測(cè)效果,KPLS 靜態(tài)模型對(duì)于訓(xùn)練樣本的擬合效果很好RMSET=4.88 mg/m3,但是對(duì)于測(cè)試樣本的預(yù)測(cè)精度較低RMSEP=22.3 mg/m3,模型泛化能力有限。動(dòng)態(tài)BPNN 模型雖然預(yù)測(cè)精度比KPLS 效果要好,但是擬合誤差和預(yù)測(cè)誤差還是比較大?;趧?dòng)態(tài)的Bi-LSTM 模型的擬合和預(yù)測(cè)效果都較好,訓(xùn)練樣本RMSET=5.21 mg/m3,測(cè)試樣本RMSEP=6.08 mg/m3, 模型反映了NOx排放模型隨負(fù)荷波動(dòng)的動(dòng)態(tài)過(guò)程。
圖12 不同模型的RMSE 對(duì)比Fig.12 RMSE comparison of different models
圖13 不同模型的MAPE 對(duì)比Fig.13 MAPE comparison of different models
為了測(cè)試本文提出方法的有效性,在該電廠實(shí)際安裝調(diào)試本文提出的預(yù)測(cè)方法。經(jīng)過(guò)一段時(shí)間的平穩(wěn)運(yùn)行后, 從DCS 中截取某時(shí)刻SCR 脫硝系統(tǒng)A、B 兩側(cè)預(yù)測(cè)的NOx質(zhì)量濃度與實(shí)際運(yùn)行測(cè)試曲線的對(duì)比圖,如圖14、圖15 所示。
圖14 A 側(cè)預(yù)測(cè)NOx 濃度與實(shí)際運(yùn)行曲線對(duì)比Fig.14 Comparison of predicted NOx concentration and actual operation curve on A side
圖15 B 側(cè)預(yù)測(cè)NOx 濃度與實(shí)際運(yùn)行曲線對(duì)比Fig.15 Comparison of predicted NOx concentration and actual operation curve on B side
從實(shí)際投運(yùn)該方法后的曲線對(duì)比圖可知,本文提出的方法可以較準(zhǔn)確的跟蹤實(shí)際運(yùn)行曲線,在現(xiàn)場(chǎng)可以很好地預(yù)測(cè)NOx趨勢(shì),為提前預(yù)測(cè)及進(jìn)一步噴氨優(yōu)化的實(shí)施提供了平臺(tái)。
為了提高SCR 脫硝系統(tǒng)入口NOx排放濃度模型的精度,為進(jìn)一步實(shí)施精準(zhǔn)噴氨控制打下基礎(chǔ)。本文在利用滑動(dòng)窗口平均濾波法對(duì)原始數(shù)據(jù)進(jìn)行濾波去噪,并采用隨機(jī)森林算法對(duì)輸入變量進(jìn)行特征選擇,進(jìn)而提出了一種基于Bi-LSTM 網(wǎng)絡(luò)的動(dòng)態(tài)NOx排放的建模方法。在該模型下對(duì)某電廠660 MW 超臨界燃煤電站鍋爐實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行處理仿真,并與動(dòng)態(tài)淺層神經(jīng)網(wǎng)絡(luò)BPNN 模型和靜態(tài)KPLS 模型進(jìn)行對(duì)比,結(jié)果表明本文進(jìn)行的數(shù)據(jù)處理和隨機(jī)森林變量選擇可以降低模型的復(fù)雜度,提出的Bi-LSTM動(dòng)態(tài)模型精度較高,并有效地提高了模型的泛化能力。