劉長(zhǎng)良, 曹 威, 王梓齊
(1.華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院,河北 保定 071003; 2.華北電力大學(xué) 新能源電力系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 102206)
火力發(fā)電是我國(guó)主要的發(fā)電形式,燃煤產(chǎn)生的氮氧化物成為空氣污染的主要因素[1]。然而氣體分析儀對(duì)NOX的測(cè)量存在滯后,嚴(yán)重影響了脫硝系統(tǒng)的控制品質(zhì)。因此,高精度的NOX軟測(cè)量方法對(duì)提高脫硝系統(tǒng)控制品質(zhì),減少氮氧化物排放有著重要意義。
NOX軟測(cè)量方法主要有神經(jīng)網(wǎng)絡(luò)法、支持向量機(jī)法和組合預(yù)測(cè)方法等。白建云等將BP神經(jīng)網(wǎng)絡(luò)用于硫化床鍋爐NOX軟測(cè)量,大大減小了傳感器測(cè)量的遲滯,改善了脫硝系統(tǒng)的控制品質(zhì)[2];王雅彬等在分析了NOX排放量影響因素的基礎(chǔ)上,構(gòu)建了基于最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)的NOX排放軟測(cè)量模型,提高了NOX的測(cè)量精度[3];丁知平等對(duì)基于LSSVM的NOX軟測(cè)量模型采用改進(jìn)引力優(yōu)化算法(Improved Gravitation Optimization Algorithm,IGSA)進(jìn)行優(yōu)化[4];石饒橋等提出基于卡爾曼濾波與數(shù)據(jù)融合技術(shù)的NOX濃度測(cè)量方法,有效克服測(cè)量滯后問(wèn)題,并具有較快的測(cè)量響應(yīng)速度和較高的測(cè)量精度[5]。上述NOX軟測(cè)量方法均實(shí)現(xiàn)了減小測(cè)量遲滯、提高測(cè)量精度的目的,但是機(jī)器學(xué)習(xí)算法普遍存在訓(xùn)練時(shí)間長(zhǎng)、泛化能力差等問(wèn)題。
針對(duì)這一問(wèn)題,毛劍琴等提出了一種基于二叉樹(shù)結(jié)構(gòu)的模糊T-S模型建模算法,簡(jiǎn)稱(chēng)模糊樹(shù)模型(Fuzzy Tree,F(xiàn)T)[6]。模糊樹(shù)模型有著結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練快、泛化能力強(qiáng)等優(yōu)點(diǎn),適用于非線(xiàn)性、強(qiáng)耦合的復(fù)雜工程問(wèn)題[7]。Zhang等人基于模糊樹(shù)模型建立了硫化床鍋爐SO2軟測(cè)量模型,準(zhǔn)確預(yù)測(cè)了SO2排放量并基于模糊樹(shù)算法建立了NOX和SO2軟測(cè)量模型,對(duì)燃燒異常情況進(jìn)行檢驗(yàn),驗(yàn)證了模糊樹(shù)軟測(cè)量模型的有效性[8,9];王梓齊等提出采用復(fù)相關(guān)系數(shù)的時(shí)滯聯(lián)合估計(jì)方法,對(duì)影響NOX生成量的模型輸入變量進(jìn)行時(shí)滯估計(jì),最后基于模糊樹(shù)模型建立了SCR反應(yīng)器入口NOX生成量動(dòng)態(tài)模型[10]。
除此之外,由于選擇性催化還原器(Selective catalytic reduction,SCR)入口NOX濃度受到機(jī)組負(fù)荷、煙氣溫度、煙氣流量、煙氣含氧量等多種因素影響,導(dǎo)致模型的輸入變量較多,增加了模型的訓(xùn)練時(shí)間,因此有必要對(duì)模型的輸入變量進(jìn)行降維。董澤等人采用互信息(Mutual Information,MI)對(duì)NOX軟測(cè)量模型的輸入變量進(jìn)行篩選[11];趙文杰等人利用互信息不僅篩選出了影響NOX濃度的主要變量,還實(shí)現(xiàn)了對(duì)輸入變量的時(shí)滯估計(jì),提高了模型的精度[12];趙建軍等提出了基于核主元分析和LSSVM的SCR入口NOX濃度軟測(cè)量方法,有助于解決SCR入口NOX濃度的準(zhǔn)確測(cè)量問(wèn)題[13]。上文獻(xiàn)中利用互信息均實(shí)現(xiàn)了從眾多影響因素中篩選主要影響變量的目的,但是由于NOX的生成機(jī)理復(fù)雜,影響因素眾多,導(dǎo)致互信息篩選后仍有較多輸入變量的問(wèn)題。針對(duì)這一問(wèn)題應(yīng)該對(duì)篩選后的變量進(jìn)行二次降維,進(jìn)一步減少輸入變量數(shù)量。
局部保持投影(Locality Preserving Projection,LPP)可以在降低空間維度的同時(shí),較好的保持內(nèi)部固定的局部結(jié)構(gòu)。馬玉鑫基于LPP對(duì)輸入變量進(jìn)行降維,提取出有效的低維特征后再用LSSVM建立預(yù)測(cè)模型[14];張?jiān)茝?qiáng)等人基于Parzen窗和成對(duì)約束的半監(jiān)督局部保持投影算法對(duì)磨粒圖像的紋理特征降維[15]。LPP雖然可以達(dá)到降維的目的,但是LPP的本質(zhì)是對(duì)拉普拉斯特征映射方法的線(xiàn)性逼近,對(duì)于非線(xiàn)性強(qiáng)的系統(tǒng)有效性差。另外,LPP僅僅考慮了樣本的局部結(jié)構(gòu)特性,并未考慮樣本的全局結(jié)構(gòu)特性。主元分析法(Principal Component Analysis,PCA)在降維時(shí)考慮了樣本的全局結(jié)構(gòu)特性,綜合PCA 與LPP 的特點(diǎn),可以在降維過(guò)程中同時(shí)保持?jǐn)?shù)據(jù)樣本的局部結(jié)構(gòu)特征和全局結(jié)構(gòu)特征[16]。
針對(duì)機(jī)器學(xué)習(xí)算法存在訓(xùn)練時(shí)間長(zhǎng)和LPP對(duì)非線(xiàn)性系統(tǒng)降維有效性差的問(wèn)題,首先通過(guò)查閱文獻(xiàn)大體確定NOX軟測(cè)量模型的輸入變量;再利用核方法將LPP推廣到適用于非線(xiàn)性系統(tǒng)的KLPP(Kernel LPP,KLPP),并將KLPP與PCA相結(jié)合,以達(dá)到同時(shí)保持樣本的全局結(jié)構(gòu)特性和局部結(jié)構(gòu)特性的目的;最后基于模糊樹(shù)算法建立NOX軟測(cè)量模型。應(yīng)用某600 MW燃煤機(jī)組的實(shí)際運(yùn)行數(shù)據(jù)對(duì)該NOX軟測(cè)量方法進(jìn)行了實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)結(jié)果表明,該方法滿(mǎn)足實(shí)際對(duì)SCR入口NOX軟測(cè)量的要求。
互信息是定量計(jì)算兩個(gè)隨機(jī)變量之間共有信息量的計(jì)算工具,是表示兩個(gè)隨機(jī)變量相關(guān)性的有效值指標(biāo)?;バ畔⒌乃惴ㄈ缦?。
兩個(gè)隨機(jī)變量X、Y的互信息為
(1)
式中:P(x,y)為X、Y的聯(lián)合分布;P(x)、P(y)分別為X、Y的邊界分布。然而公式(1)只考慮了兩變量之間的最大相關(guān),并沒(méi)有考慮信息冗余。因此又提出了一種最大相關(guān)、最小冗余的變量篩選法,該方法的評(píng)價(jià)函數(shù)如下:
(2)
式中:fi∈F為待選變量;β為懲罰因子,主要是用來(lái)調(diào)節(jié)候選變量與各個(gè)已選變量之間的互信息之和;c為主導(dǎo)變量;sj∈S為已選變量。但是公式(2)沒(méi)有考慮到已選變量個(gè)數(shù)對(duì)算法的影響,因此導(dǎo)致互信息篩選后可能還有較多變量。所以在公式(2)的基礎(chǔ)上加入已選變量數(shù)目的懲罰因子進(jìn)行改進(jìn),改進(jìn)后的評(píng)價(jià)函數(shù)如下:
(3)
式中:‖S‖為S的范數(shù)。從式(3)可以看出,改進(jìn)后的算法考慮到了變量數(shù)目的影響,將已選變量數(shù)目的影響作為懲罰項(xiàng)加入到評(píng)價(jià)函數(shù)中,除以|S|可以減小待選變量與主導(dǎo)變量的互信息對(duì)變量重要性的影響,從而控制了互信息篩選出的變量數(shù)目。
改進(jìn)互信息(Modified Mutual Information,MMI)的具體步驟如下:
(1)初始化:F為所有待選變量集合;已選變量S為空集;c為主導(dǎo)變量,即SCR入口NOX濃度;
(2)計(jì)算待選變量fi與主導(dǎo)變量c的互信息I(fi;c),選擇最大I(fi;c)對(duì)應(yīng)的fi存入S中并從F集合中刪除fi;
(3)循環(huán)以下兩個(gè)步驟,直至已選變量數(shù)目達(dá)到預(yù)測(cè)值K:
(a)計(jì)算所有待選變量與已選變量的互信息I(fi;sj);
(b)選取使評(píng)價(jià)函數(shù)J(fi)最大的fi,并存入S;
(4)已選變量集合S即為模型的輸入變量。
MMI算法的流程圖如圖1所示。
圖1 MMI 降維流程圖 Fig.1 Flow chart of MMI dimension reduction
PCA-KLPP降維法綜合了PCA和KLPP兩種降維法的優(yōu)勢(shì),全面考慮了樣本的局部結(jié)構(gòu)特性和全局結(jié)構(gòu)特性,不僅可以將同類(lèi)樣本按流形投影到低維空間,還可以保證異類(lèi)樣本間的分散性,避免了不同類(lèi)別而又靠得較近的數(shù)據(jù)在投影后還是靠得較近的問(wèn)題。
設(shè)X={x1,x2,…,xm},xi∈Rd(i=1,2,…,m)為高維空間Rd中的樣本,PCA-KLPP的目標(biāo)是找到一個(gè)轉(zhuǎn)換矩陣W,將X在低維空間Rl(l< PCA-KLPP降維法的整體目標(biāo)函數(shù)是基于KLPP的局部目標(biāo)函數(shù)和PCA的全局目標(biāo)函數(shù),從而使得整體目標(biāo)函數(shù)兼具KLPP和PCA的優(yōu)勢(shì)。 由于PCA 在降維時(shí)考慮了樣本的全局結(jié)構(gòu)特性,因此,全局目標(biāo)函數(shù)Jg(W)即為PCA-KLPP降維法的全局目標(biāo)函數(shù)。Jg(W)使投影前分散的兩點(diǎn)投影后仍保持分散,避免了LPP將高維空間中不同類(lèi)但靠得近的數(shù)據(jù)投影到低維空間中相鄰的問(wèn)題。Jg(W)目標(biāo)函數(shù)如下: (4) 由于KLPP 在降維時(shí)考慮了樣本的局部結(jié)構(gòu)特性,因此,局部目標(biāo)函數(shù)Jl(W)即為PCA-KLPP降維法的局部目標(biāo)函數(shù)。Jl(W)使投影前近鄰的數(shù)據(jù)投影后依然相鄰,保持?jǐn)?shù)據(jù)結(jié)構(gòu)相似[17]。Jl(W)目標(biāo)函數(shù)如下: (5) (6) (7) 其中,sij為近鄰的第i個(gè)樣本和第j個(gè)樣本之間的相似性程度;矩陣D是對(duì)角陣,對(duì)角元素dii為 (8) 為了消除隨機(jī)尺度因子的影響,求解中限定: WTXDXTW=I (9) 式中:I為單位矩陣。 結(jié)合全局目標(biāo)函數(shù)Jg(W)與局部目標(biāo)函數(shù)Jl(W),構(gòu)造PCA-KLPP的整體目標(biāo)函數(shù)如下: (10) 用拉格朗日法根據(jù)上式構(gòu)造極值函數(shù)為 (11) 對(duì)上式求導(dǎo)并置0,化簡(jiǎn)后得 L′(W)=2(C-XLXT)W-2λXDXTW=0 (12) (C-XLXT)W=λXDXTW (13) 從式(13)可以看出,求轉(zhuǎn)換矩陣W的過(guò)程,實(shí)際上是求以λ為廣義特征值的特征向量的過(guò)程。因此求出W后,便可實(shí)現(xiàn)降維的目的。PCA-KLPP 降維算法的基本流程如圖2所示。 圖2 PCA-KLPP 降維流程圖Fig.2 Flow chart of PCA-KLPP dimension reduction 模糊樹(shù)算法的核心是用二叉樹(shù)將輸入空間劃分成模糊子空間,二叉樹(shù)的結(jié)構(gòu)決定了模糊規(guī)則的個(gè)數(shù),并且模糊規(guī)則不受輸入變量維數(shù)的影響,因而不會(huì)導(dǎo)致“維數(shù)爆炸”。 對(duì)于一個(gè)模糊樹(shù)模型,對(duì)應(yīng)著一個(gè)嚴(yán)格二叉樹(shù)T。T中共有L個(gè)節(jié)點(diǎn),對(duì)于每個(gè)節(jié)點(diǎn)t,定義其隸屬度函數(shù)為μt(x)。對(duì)于根節(jié)點(diǎn),μt(x)=1;對(duì)于非根節(jié)點(diǎn),μt(x)的計(jì)算公式如下: (14) (15) 式中:α為模糊帶寬度;t為F(t)的右子節(jié)點(diǎn)α>0;CF(t)為F(t)上的線(xiàn)性參數(shù)向量Ct;θF(t)為F(t)上的數(shù)據(jù)重心,計(jì)算公式如下: (16) (17) 式中:Nt(x)為節(jié)點(diǎn)t的歸一化隸屬度函數(shù) (18) 經(jīng)過(guò)訓(xùn)練得到各節(jié)點(diǎn)上的線(xiàn)性參數(shù)向量Ct以及數(shù)據(jù)重心θt后,便確定了一個(gè)模糊樹(shù)模型。 首先通過(guò)查閱資料,大體確定影響SCR入口NOX濃度的影響因素,從而確定軟測(cè)量模型的輸入變量;由于輸入變量維數(shù)過(guò)多,先采用MMI方法對(duì)輸入變量進(jìn)行一次降維,對(duì)一次降維后的變量再采用PCA-KLPP方法進(jìn)行二次降維,在確定最佳維數(shù)的前提下,既保了留原始數(shù)據(jù)的結(jié)構(gòu)特征,又大大減少了模型輸入變量的數(shù)目,縮短了軟測(cè)量模型訓(xùn)練時(shí)間;最后對(duì)二次降維后的數(shù)據(jù)建立模糊樹(shù)模型,對(duì)NOX濃度進(jìn)行預(yù)測(cè)。MMI-PCA-KLPP二次降維的NOX軟測(cè)量流程圖如圖3所示。 圖3 二次降維和FT的NOX軟測(cè)量流程圖Fig.3 Flow chart of secondary dimensionality reduction and FT 通過(guò)相關(guān)資料,得知影響NOX濃度的主要因素。由于在平穩(wěn)工況下,A磨未啟動(dòng),A磨風(fēng)量、煤量、及一二次風(fēng)門(mén)開(kāi)度均為0,故將以上變量從輔助變量中剔除,剩下的輔助變量如表1所示,共30個(gè)輸入變量,輸出變量為SCR入口NOX濃度。其中,T1為空預(yù)器一次風(fēng)溫;T2為空預(yù)器二次風(fēng)溫;SA~SE、SAA~SDE為各二次風(fēng)門(mén)擋板開(kāi)度;SOFA1~SSOFA3為各燃盡風(fēng)門(mén)開(kāi)度;O2為煙氣含氧量;從而確定軟測(cè)量模型的輸入變量[18]。 采集某660 MW燃煤電廠SIS系統(tǒng)中26 h運(yùn)行數(shù)據(jù),采樣間隔為10 s,共8 640組。NOX濃度和機(jī)組負(fù)荷時(shí)間序列如圖4。選取第3 501~8 550組穩(wěn)定工況下的數(shù)據(jù),選擇前4 500組作為訓(xùn)練樣本,后650組作為測(cè)試樣本。平穩(wěn)工況下的NOX濃度和機(jī)組負(fù)荷時(shí)間序列如圖5所示。 圖4 NOX濃度和機(jī)組功率時(shí)間序列Fig.4 NOX concentration and unit power time series 圖5 平穩(wěn)工況下NOX濃度和機(jī)組功率時(shí)間序列Fig.5 NOX concentration and unit power time series under steady conditions 由于MMI和PCA-KLPP兩種方法需要先驗(yàn)確定樣本所要降低的維數(shù),維數(shù)降低過(guò)多會(huì)導(dǎo)致樣本失去本身的數(shù)據(jù)特征,過(guò)少則不能達(dá)到簡(jiǎn)化軟測(cè)量模型縮短訓(xùn)練時(shí)間的目的。因此,合理的維數(shù)是建立軟測(cè)量模型的關(guān)鍵。本文依次計(jì)算30維輔助變量與主導(dǎo)變量NOX濃度的互信息值,將30個(gè)互信息從大到小排序,尋找互信息曲線(xiàn)的拐點(diǎn),從而確定MMI降維法的最佳維數(shù)。圖6為維數(shù)從1到30時(shí)互信息值變化情況及曲線(xiàn)拐點(diǎn)。 圖6 各變量互信息值與最佳維數(shù)Fig.6 Mutual information value and optimal dimension of each variable 從圖6可以看出,不同輔助變量與主導(dǎo)變量的互信息值不同,說(shuō)明各輔助變量與主導(dǎo)變量的相關(guān)性不同。除此之外,拐點(diǎn)對(duì)應(yīng)的維數(shù)為26,從而確定降維后的輸入變量數(shù)目為26。 再根據(jù)MMI降維后的26維輔助變量,計(jì)算26維輔助變量的特征值。由于特征值的大小代表了矩陣正交化之后所對(duì)應(yīng)特征向量對(duì)于整個(gè)矩陣的貢獻(xiàn)程度,因此將26維輔助變量的特征值按大小排序,尋找特征值大于閾值的變量(閾值這里取0.98),從而確定PCA-KLPP降維法的降維數(shù)目。圖7為26維輔助變量的特征值曲線(xiàn)及最佳維數(shù)。 圖7 各變量特征值與最佳維數(shù)Fig.7 Characteristic value and optimal dimension of each variable 從圖7可以看出,不同輔助變量的特征值大小不同,說(shuō)明輔助變量對(duì)主導(dǎo)變量的貢獻(xiàn)程度不同。并且特征值曲線(xiàn)的拐點(diǎn)出現(xiàn)在維數(shù)為12,因此確定PCA-KLPP二次降維的最佳維數(shù)為12,再用模糊樹(shù)模型建立NOX軟測(cè)量模型。 模糊樹(shù)模型的精度受樹(shù)結(jié)構(gòu)的影響,復(fù)雜的樹(shù)結(jié)構(gòu)雖然會(huì)提高精度,但也會(huì)增加模型的訓(xùn)練時(shí)間。因此用模糊樹(shù)模型建立NOX軟測(cè)量模型之前,必須確定合適的樹(shù)結(jié)構(gòu)。表2為不同樹(shù)結(jié)構(gòu)下軟測(cè)量模型的精度和訓(xùn)練時(shí)間,RMSE為訓(xùn)練誤差。 表2 不同樹(shù)結(jié)構(gòu)下模型的精度和訓(xùn)練時(shí)間 Tab.2 Model error and training time of models under different structures 樹(shù)結(jié)構(gòu)1層1節(jié)點(diǎn)2層3節(jié)點(diǎn)3層5節(jié)點(diǎn)3層7節(jié)點(diǎn)RMSE3.683.573.193.17t/s5.0644.74103.48274.56 從表2可以看出,當(dāng)樹(shù)結(jié)構(gòu)為2層3節(jié)點(diǎn)時(shí),模型兼具了精度高和訓(xùn)練時(shí)間短的優(yōu)點(diǎn),因此本文采用樹(shù)結(jié)構(gòu)為2層3節(jié)點(diǎn)的模糊樹(shù)模型。除此之外還可以看出,模糊樹(shù)模型對(duì)非線(xiàn)性系統(tǒng)有良好的適用性并且精度高。圖8為FT、MI_FT和二次降維-FT三種模型訓(xùn)練預(yù)測(cè)值與實(shí)際值擬合圖,圖9為二次降維-FT的測(cè)試結(jié)果。 圖8 訓(xùn)練樣本預(yù)測(cè)值與實(shí)際值擬合圖Fig.8 Fitting predicted and actual values of training samples 圖9 二次降維-FT軟測(cè)量模型的測(cè)試曲線(xiàn)Fig.9 Test curve of the second dimension reduction-FT model 圖8可以看出,三種模型預(yù)測(cè)值均緊貼理想直線(xiàn),說(shuō)明三種模型能準(zhǔn)確測(cè)量NOX濃度,但是二次降維-FT模型的精度低于FT模型。為了進(jìn)一步研究幾種模型的訓(xùn)練時(shí)間及模型誤差,表3列出了三種模型的訓(xùn)練時(shí)間與誤差。其中,RMSE1為訓(xùn)練誤差,RMSE2為測(cè)試誤差,t為訓(xùn)練時(shí)間。 表3 幾種模型的誤差與訓(xùn)練時(shí)間 表3可以看出,雖然二次降維-FT模型在軟測(cè)量精度上與FT模型有差距,但是兩者精度相差不大,并且模型訓(xùn)練的時(shí)間較FT大大縮短,誤差也在工業(yè)可接受范圍,可以很好地解決NOX測(cè)量大遲滯的問(wèn)題。 針對(duì)火電廠氣體分析儀測(cè)量存在滯后和NOX軟測(cè)量不準(zhǔn)確的問(wèn)題,提出了一種基于MMI-PCA-KLPP二次降維和FT的SCR入口NOX濃度軟測(cè)量方法。首先查閱文獻(xiàn),大體確定軟測(cè)量模型的輸入變量;再依次確定MMI和PCA-KLPP兩種降維方法的最佳維數(shù),并用這兩種降維方法依次對(duì)原始數(shù)據(jù)進(jìn)行降維;最后選擇最佳的模糊樹(shù)結(jié)構(gòu),建立了SCR入口NOX濃度軟測(cè)量模型。實(shí)驗(yàn)結(jié)果表明,基于二次降維后,能在精度降低不多的情況下,大大縮短模糊樹(shù)模型的訓(xùn)練時(shí)間,滿(mǎn)足實(shí)際工程中NOX軟測(cè)量的要求。2.1 全局目標(biāo)函數(shù)
2.2 局部目標(biāo)函數(shù)
2.3 整體目標(biāo)函數(shù)
3 軟測(cè)量模型
3.1 模糊樹(shù)模型
3.2 基于MMI-PCA-KLPP二次降維的NOX軟測(cè)量
4 實(shí)驗(yàn)過(guò)程及結(jié)果分析
4.1 數(shù)據(jù)采集及預(yù)處理
4.2 確定最佳維數(shù)
4.3 確定模糊樹(shù)結(jié)構(gòu)
5 結(jié) 論
華北電力大學(xué)學(xué)報(bào)(自然科學(xué)版)2020年1期