孫宇航, 田 亮
(華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院,河北 保定 071003)
據(jù)《中國(guó)電力行業(yè)年度發(fā)展報(bào)告2021》數(shù)據(jù)顯示,截至2020年底,全國(guó)全口徑發(fā)電裝機(jī)容量220 204萬(wàn)kW,比上年增長(zhǎng)9.6%。其中火電124 624萬(wàn)kW,占比56.6%,比上年增長(zhǎng)4.8%(煤電107 912萬(wàn)kW,比上年增長(zhǎng)3.7%)。雖然我國(guó)處于能源結(jié)構(gòu)轉(zhuǎn)型的關(guān)鍵時(shí)期,但在可預(yù)見(jiàn)的時(shí)間里,國(guó)內(nèi)發(fā)電主力形式仍然是燃煤機(jī)組火力發(fā)電[1]。因此,如何實(shí)現(xiàn)電站鍋爐的高效率、低污染燃燒,對(duì)能源與環(huán)境的和諧發(fā)展具有重要意義。
燃燒調(diào)整實(shí)驗(yàn)通常在3個(gè)典型負(fù)荷660 MW、500 MW、330 MW下進(jìn)行(以660 MW鍋爐為例)。通過(guò)調(diào)整氧量、一次風(fēng)風(fēng)壓、二次風(fēng)門開(kāi)度等,探究可調(diào)參數(shù)變化對(duì)鍋爐燃燒效率及NOx等污染物排放產(chǎn)生的影響。但由于鍋爐燃燒存在變煤質(zhì)、變工況、深調(diào)峰等復(fù)雜情況,僅針對(duì)個(gè)別典型負(fù)荷進(jìn)行燃燒優(yōu)化調(diào)整實(shí)驗(yàn)會(huì)缺失大量燃燒過(guò)程中的關(guān)鍵信息,若對(duì)所有工況進(jìn)行燃燒優(yōu)化調(diào)整實(shí)驗(yàn),燃燒優(yōu)化成本則會(huì)大幅增加[2]。考慮到鍋爐運(yùn)行過(guò)程中積累了海量歷史數(shù)據(jù),蘊(yùn)含著適合機(jī)組真實(shí)特性的參數(shù)“場(chǎng)景”及運(yùn)行人員的調(diào)整經(jīng)驗(yàn),因此出現(xiàn)了對(duì)海量機(jī)組歷史運(yùn)行數(shù)據(jù)進(jìn)行優(yōu)化參數(shù)挖掘的方法。劉曉鵬[3]采用RBF神經(jīng)網(wǎng)絡(luò)基于滾動(dòng)化形成實(shí)現(xiàn)了對(duì)歷史數(shù)據(jù)的優(yōu)化調(diào)制、優(yōu)化分析與測(cè)算過(guò)程;鄭偉[4]等采用約束模糊關(guān)聯(lián)規(guī)則算法對(duì)數(shù)據(jù)進(jìn)行模糊處理,再通過(guò)FCM算法劃分模糊處理后的數(shù)據(jù)從而實(shí)現(xiàn)聚類過(guò)程;吳坡[5]等通過(guò)改進(jìn)最小二乘法、極大似然法等方法通過(guò)算法從歷史數(shù)據(jù)中辨識(shí)出鍋爐的特征運(yùn)行狀態(tài),選取特征狀態(tài)參數(shù)指導(dǎo)燃燒優(yōu)化;周小朋[6]采用粗糙集和屬性簡(jiǎn)約算法找出了與鍋爐NOx排放量高度相關(guān)且去除冗余信息的可調(diào)整優(yōu)化參數(shù),采用Apriori算法,并將CA算法引入到模糊關(guān)聯(lián)規(guī)則中,挖掘出用于指導(dǎo)鍋爐低NOx排放的規(guī)則;張尚志[7]等通過(guò)采用改進(jìn)置信區(qū)間判別相結(jié)合的滑動(dòng)判別算法確定不同工況下的穩(wěn)態(tài)數(shù)據(jù),并以穩(wěn)態(tài)數(shù)據(jù)為指導(dǎo)控制二次風(fēng)配風(fēng)方式從而實(shí)現(xiàn)燃燒優(yōu)化;李建強(qiáng)[8]利用粒子群優(yōu)化Apriori算法,挖掘精簡(jiǎn)后的數(shù)據(jù)庫(kù)中符合機(jī)組NOx減排要求的各個(gè)參數(shù)的最優(yōu)參考工況作為燃燒優(yōu)化的指導(dǎo)數(shù)據(jù)。目前火電機(jī)組燃燒優(yōu)化研究方法大多著重于利用智能優(yōu)化算法建立燃燒模型并求解復(fù)雜的非線性問(wèn)題,但當(dāng)機(jī)組負(fù)荷頻繁波動(dòng)時(shí),基于進(jìn)化算法的優(yōu)化方法在穩(wěn)定性和響應(yīng)速度方面往往不能達(dá)到很好的效果,且算法中存在隱式規(guī)律,不能直觀的展示。采用算法針對(duì)全工況進(jìn)行數(shù)據(jù)分析得到的結(jié)果雖然具體,但由于數(shù)據(jù)量過(guò)大,導(dǎo)致工程實(shí)踐過(guò)程中指導(dǎo)意義不強(qiáng)。
本文從工程應(yīng)用角度出發(fā),設(shè)計(jì)一種基于數(shù)據(jù)挖掘工況聚類的燃燒優(yōu)化方法。在對(duì)鍋爐海量歷史運(yùn)行數(shù)據(jù)進(jìn)行工況劃分并剔除離群點(diǎn)基礎(chǔ)上,采用KPCA-K-means++數(shù)據(jù)挖掘方法對(duì)各工況穩(wěn)態(tài)歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)降維、聚類,聚類結(jié)果能夠能精準(zhǔn)、凝練、直觀地反映鍋爐燃燒在不同工況下鍋爐燃燒控制規(guī)律,根據(jù)聚類結(jié)果將每種工況控制參數(shù)劃分出:鍋爐效率最優(yōu)、NOx排放最優(yōu)、鍋爐效率和NOx排放均衡三種燃燒優(yōu)化模式。針對(duì)GHJJ電廠海量歷史數(shù)據(jù)進(jìn)行KPCA-Kmeans++數(shù)據(jù)挖掘,得到典型工況下二次風(fēng)門優(yōu)化參數(shù),能夠滿足燃燒優(yōu)化在線指導(dǎo)的實(shí)際需要,實(shí)現(xiàn)多目標(biāo)燃燒優(yōu)化。
PCA即主成分分析法,是一種統(tǒng)計(jì)分析、簡(jiǎn)化數(shù)據(jù)集的方法。采用該算法能盡可能保留原本數(shù)據(jù)結(jié)構(gòu)分布,并在最小均方條件下進(jìn)行最能代表原始數(shù)據(jù)的投影查找,從而在特征空間中實(shí)現(xiàn)數(shù)據(jù)降維。采用該算法能夠?qū)υ紨?shù)據(jù)進(jìn)行線性變換,根據(jù)方差變化依次建立新坐標(biāo)系,將數(shù)據(jù)轉(zhuǎn)換到新坐標(biāo)系中。主成分分析法可以同時(shí)實(shí)現(xiàn)數(shù)據(jù)提取和去冗降維,使得數(shù)據(jù)結(jié)構(gòu)更加簡(jiǎn)單[9]。
通過(guò)對(duì)PCA進(jìn)行改進(jìn)即可得到核主成分分析法(KPCA)算法。KPCA方法可以避免遇到特征向量線性不可分的問(wèn)題,不僅適合解決線性問(wèn)題,而且能提供比PCA更多的特征數(shù)目,可以最大限度地提取特征信息。KPCA算法采用非線性的方式對(duì)其主成分進(jìn)行合理提取[10,11]。使用算法前需要對(duì)所有樣本進(jìn)行合理的非線性轉(zhuǎn)換:
xk→φ(xk)
(1)
式中:xk表示第k個(gè)樣本。
將所有樣本轉(zhuǎn)換至高維空間F中,數(shù)據(jù)樣本協(xié)方差矩陣為
(2)
協(xié)方差矩陣C的特征向量V與特征值λ滿足:
λV-CV=0
(3)
代入非線性函數(shù)φ(xk)可得
λφ(xk)V-Cφ(xk)V=0
(4)
將協(xié)方差矩陣特征向量由非線性函數(shù)表示為
(5)
引入核函數(shù)
Kij=K(xi,xj)=φ(xi)φ(xj)
(6)
將公式(3)、(5)代入公式(4)中得到
mλα-Kα=0
(7)
式中:α表示核函數(shù)矩陣K的特征向量。
對(duì)任意樣本數(shù)據(jù),在高維空間F中非線性函數(shù)φ(x)的投影表示:
(8)
進(jìn)行核主成分分析時(shí),保證累計(jì)貢獻(xiàn)率的值大于85%可以確保損失的信息不至于太多,也能夠達(dá)到減少變量、簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)的目的,便于提取出反映工業(yè)系統(tǒng)整體過(guò)程的前k個(gè)主成分。選擇累計(jì)貢獻(xiàn)率大于85%的影響因素替代原有全部影響因素,即
(9)
式中:s表示滿足該條件影響因素的數(shù)量[12,13]。
上述計(jì)算過(guò)程均在滿足:
(10)
(11)
式中:L表示m×m階系數(shù)為1/m的矩陣。
目前可選擇的核函數(shù)類型較多,本次實(shí)驗(yàn)選取徑向基核函數(shù):
(12)
Kmeans是一種經(jīng)典的基于劃分的聚類算法,其目標(biāo)是將對(duì)象集劃分為若干個(gè)簇,使得簇內(nèi)對(duì)象間的相似度較高,而簇間對(duì)象的相似度較。Kmeans++對(duì)Kmeans算法隨機(jī)選取初始聚類中心進(jìn)行了改進(jìn),該方法并不是隨機(jī)地給出若干個(gè)初始聚類中心,而是先隨機(jī)選取一個(gè)點(diǎn)作為第一個(gè)初始聚類中心,然后計(jì)算所有點(diǎn)到該聚類中心的距離,接著依據(jù)“聚類中心相互之間距離越遠(yuǎn)越好”的樸素原則[12],選取新的聚類中心,不斷重復(fù),直到選出k個(gè)聚類中心,最后將這些聚類中心作為初始聚類中心來(lái)運(yùn)行Kmeans通過(guò)計(jì)算與距離占比相關(guān)的概率逐一選取新的初始聚類中心,直到最后選取k個(gè)初始聚類中心[13-18]。Kmeans++算法過(guò)程如下:
(1)隨機(jī)選取一個(gè)樣本作為初始聚類中心x1,即X=x1;
(2)計(jì)算出每個(gè)樣本點(diǎn)的x到與其最近的聚類中心的距離D(x);
(3)每個(gè)樣本點(diǎn)被選為新的聚類中心的概率P:
(13)
(4)重復(fù)計(jì)算2、3兩步,直至選出K個(gè)初始聚類中心;
(5)采用計(jì)算出的K個(gè)初始聚類中心運(yùn)行Kmeans聚類算法。
算法框架如圖1所示。
圖1 Kmeans++算法框圖
本文以GHJJ電廠5號(hào)660 MW超超臨界機(jī)組四角切圓燃燒鍋爐為例,對(duì)預(yù)處理后的鍋爐燃?xì)v史運(yùn)行數(shù)據(jù)采用KPCA和Kmeans++進(jìn)行降維處理及聚類分析,過(guò)程如圖2所示。從電廠DCS系統(tǒng)中采集2個(gè)月的全工況歷史運(yùn)行數(shù)據(jù)進(jìn)行預(yù)處理后,根據(jù)工況劃分結(jié)果整理出194 467組運(yùn)行數(shù)據(jù),每組運(yùn)行數(shù)據(jù)包含110種運(yùn)行參數(shù),部分?jǐn)?shù)據(jù)見(jiàn)表1。
表1 部分ABCDEF工況數(shù)據(jù)
圖2 PCA-Kmeans++數(shù)據(jù)挖掘系統(tǒng)流程圖
由于在不同的工況下鍋爐燃燒過(guò)程會(huì)表現(xiàn)出不同的特性,因此需要選擇一個(gè)參數(shù)作為工況劃分的標(biāo)準(zhǔn)。本文以6臺(tái)磨的起磨方式進(jìn)行工況劃分,會(huì)出現(xiàn)64種6臺(tái)磨的排列組合結(jié)果。機(jī)組運(yùn)行規(guī)程要求運(yùn)行過(guò)程中保持至少三臺(tái)磨運(yùn)行且四角切圓燃燒方式不得出現(xiàn)燃燒器隔2層燃燒。按照上述要求剔除非法起磨方式后采用細(xì)分網(wǎng)格化的拼法,可以得到31種合法起磨方式,再根據(jù)起磨方式在燃燒過(guò)程中出現(xiàn)的時(shí)間及電廠的實(shí)際運(yùn)行情況可劃分為典型工況、常見(jiàn)工況、少數(shù)工況,如表2所示。
表2 合法工況及分類
由于分析的工況太多且每個(gè)工況下得到的控制規(guī)律不盡相同,所體現(xiàn)的數(shù)據(jù)規(guī)律性差,對(duì)燃燒系統(tǒng)的指導(dǎo)意義不能有效體現(xiàn)??紤]到火電機(jī)組對(duì)象特性并不具有非此即彼的性質(zhì),且不同工況之間往往存在一定的關(guān)聯(lián),若能將挖掘后的大量數(shù)據(jù)更準(zhǔn)確、更精煉地呈現(xiàn),使其有規(guī)律可循,那么挖掘后的數(shù)據(jù)對(duì)燃燒優(yōu)化更具有指導(dǎo)意義[19-21]。相較于典型工況和常見(jiàn)工況,少數(shù)工況在鍋爐運(yùn)行過(guò)程中所出現(xiàn)的時(shí)間短,對(duì)鍋爐燃燒優(yōu)化的指導(dǎo)意義不強(qiáng),為了找出盡可能精煉、準(zhǔn)確的規(guī)律,在后續(xù)降維、聚類分析過(guò)程中不再對(duì)少數(shù)工況進(jìn)行討論,防止挖掘的數(shù)據(jù)規(guī)律復(fù)雜化。排除少數(shù)工況后可得到ABC、ABCD、ABCDE、ABCDEF、ABD、ABCE、ABDEF、ACDEF、BCDE、ABCDF、BCDEF,共11組對(duì)鍋爐燃燒過(guò)程具有代表性的運(yùn)行工況控制參數(shù)。
過(guò)程參數(shù)的選取是實(shí)現(xiàn)燃燒優(yōu)化的重要內(nèi)容。過(guò)程參數(shù)選取過(guò)多,會(huì)導(dǎo)致控制規(guī)律復(fù)雜且不直觀;過(guò)程參數(shù)選取過(guò)少則會(huì)導(dǎo)致優(yōu)化過(guò)程不夠精確。這里將過(guò)程參數(shù)分為三類:可調(diào)參數(shù)、不可調(diào)參數(shù)和優(yōu)化參數(shù)。根據(jù)現(xiàn)場(chǎng)取得的實(shí)際運(yùn)行數(shù)據(jù),作如下分類,如表3所示。
表3 過(guò)程參數(shù)分類
上述過(guò)程參數(shù)在鍋爐運(yùn)行歷史數(shù)據(jù)中共包含110種參數(shù),顯然數(shù)據(jù)種類過(guò)于復(fù)雜,不利于發(fā)現(xiàn)主要運(yùn)行參數(shù)與性能指標(biāo)之間的關(guān)聯(lián)關(guān)系。因此采用KPCA對(duì)典型工況和常見(jiàn)工況穩(wěn)態(tài)下110種參數(shù)進(jìn)行降維處理,找出能包含所有過(guò)程參數(shù)85%以上信息的特征參數(shù)。
通過(guò)對(duì)表4的數(shù)據(jù)進(jìn)行分析可以發(fā)現(xiàn),前29個(gè)參數(shù)的累積貢獻(xiàn)率已經(jīng)超過(guò)85%,因此在接下來(lái)的研究中可以使用前29個(gè)特征參數(shù)作為下一步Kmeans++聚類的對(duì)象。另外,通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行分析可以發(fā)現(xiàn)在使用KPCA降維的過(guò)程中,可以最大程度的保留原始數(shù)據(jù)的基本信息,進(jìn)而實(shí)現(xiàn)不同過(guò)程參數(shù)的降維處理,即將原有的110個(gè)過(guò)程參數(shù)減少至29個(gè),使過(guò)程參數(shù)之間的冗余性降低,為后續(xù)聚類分析奠定基礎(chǔ)。
表4 過(guò)程參數(shù)特征值和累計(jì)貢獻(xiàn)率
對(duì)KPCA降維處理后確定的過(guò)程參數(shù)分別按11種工況進(jìn)行聚類分析,找出不同工況下隱含的控制規(guī)律。實(shí)驗(yàn)表明,聚類迭代次數(shù)為29次時(shí)可滿足所有工況聚類結(jié)果收斂。為了評(píng)價(jià)與衡量聚類的結(jié)果的好壞,需要指定統(tǒng)一的評(píng)價(jià)指標(biāo),這里采用業(yè)界比較常用的DBI指標(biāo)作為評(píng)價(jià)標(biāo)準(zhǔn):
(14)
式中:i、j為任意兩類別的類內(nèi)距離平方和;ci、cj表示第i、j個(gè)聚類中心。DBI越小意味著類內(nèi)距離越小,同時(shí)類間距離越大。所有聚類結(jié)果DBI指數(shù)經(jīng)計(jì)算均小于0.7,已實(shí)現(xiàn)較好的聚類效果。
通過(guò)分析聚類結(jié)果可將每個(gè)工況分出三種模式,模式1:NOx排放最優(yōu);模式2:鍋爐效率最優(yōu);模式3:鍋爐效率和NOx排放均衡。按照每種工況下三種模式的劃分方式可得到表5所示典型工況二次風(fēng)擋板開(kāi)度聚類結(jié)果參數(shù)表。
表5 部分典型工況二次風(fēng)擋板開(kāi)度聚類結(jié)果參數(shù)表
在GHJJ電廠5號(hào)機(jī)組鍋爐上進(jìn)行KPCA-Kmeans++數(shù)據(jù)挖掘燃燒優(yōu)化實(shí)驗(yàn)。該機(jī)組為660 MW參數(shù)變壓運(yùn)行螺旋管圈直流爐,爐型為一次再熱四角切圓型鍋爐,配置磨煤機(jī)6臺(tái)。KPCA-Kmeans++分析數(shù)據(jù)取自機(jī)組2021年7月至8月的歷史運(yùn)行數(shù)據(jù),共計(jì)26萬(wàn)7千組數(shù)據(jù),經(jīng)過(guò)聚類分析得到11種典型工況控制參數(shù)規(guī)律。
在磨組合為ABCDE工況下,考慮到現(xiàn)場(chǎng)應(yīng)用需要,在表5聚類結(jié)果基礎(chǔ)上對(duì)二次風(fēng)擋板數(shù)據(jù)做近似處理,優(yōu)化系統(tǒng)二次風(fēng)擋板開(kāi)度輸入?yún)?shù)如表6所示。機(jī)組應(yīng)用優(yōu)化參數(shù)2小時(shí)后,得到NOx排放、鍋爐效率運(yùn)行數(shù)據(jù),并與同工況條件下沒(méi)有應(yīng)用二次風(fēng)擋板優(yōu)化參數(shù)的運(yùn)行數(shù)據(jù)進(jìn)行比較(如圖3所示)。
圖3 鍋爐燃燒優(yōu)化前后對(duì)比
圖3(a)中,在模式1即NOx排放最優(yōu)模式下,采用優(yōu)化后的二次風(fēng)門擋板參數(shù),NOx排放濃度平均值下降45.6 mg/m3;圖3(b),在模式2即鍋爐效率最優(yōu)模式下,優(yōu)化后的鍋爐效率平均值提升0.18%;而在模式3即均衡模式下,圖3(c)和(d)中NOx排放濃度平均值下降29.2 mg/m3,鍋爐效率平均提升0.11%,實(shí)現(xiàn)了多目標(biāo)燃燒優(yōu)化。
(1)采用KPCA降維后,數(shù)據(jù)復(fù)雜度明顯降低,由110維降至29維,保證保留數(shù)據(jù)85%以上信息的同時(shí)降低了模型訓(xùn)練的復(fù)雜程度,達(dá)到了減少計(jì)算資源,節(jié)省實(shí)時(shí)優(yōu)化時(shí)間的目的。Kmeans++聚類將各工況下的大量數(shù)據(jù)根據(jù)其特征對(duì)數(shù)據(jù)進(jìn)行有效劃分,每種工況下劃分出三種典型模式,能在保證燃燒系統(tǒng)正常運(yùn)行同時(shí),根據(jù)實(shí)際需要調(diào)整燃燒優(yōu)化方式。KPCA與Kmeans++相結(jié)合的數(shù)據(jù)挖掘方法可以直觀展現(xiàn)鍋爐控制規(guī)律,保證優(yōu)化效果的同時(shí)對(duì)鍋爐燃燒優(yōu)化進(jìn)行精簡(jiǎn)、全面的指導(dǎo),為機(jī)組經(jīng)濟(jì)、高效、清潔運(yùn)行提供了有力支持。
(2)以GHJJ電廠5號(hào)660 MW超超臨界機(jī)組鍋爐運(yùn)行歷史數(shù)據(jù)為研究對(duì)象,對(duì)海量歷史運(yùn)行數(shù)據(jù)進(jìn)行工況劃分,得到典型工況、常見(jiàn)工況共11種有效工況。對(duì)11種工況進(jìn)行KPCA-Kmeans++數(shù)據(jù)分析,進(jìn)行KPCA降維后,采用Kmeans++聚類算法對(duì)降維后的數(shù)據(jù)進(jìn)行聚類,按照每種工況特性進(jìn)行模式劃分,每種工況下找到NOx排放最優(yōu)、鍋爐效率最優(yōu)、NOx排放-鍋爐效率均衡3種模式,并運(yùn)用于電廠燃燒優(yōu)化。針對(duì)二次風(fēng)擋板開(kāi)度進(jìn)行優(yōu)化調(diào)整實(shí)驗(yàn),在均衡模式下實(shí)現(xiàn)NOx排放濃度平均值下降29.2 mg/m3,鍋爐效率平均提升0.11%。