付文華,謝 珺,任密蜂,續(xù)欣瑩,閻高偉
(太原理工大學 a.電氣與動力工程學院,b.信息與計算機學院,太原 030024)
火力發(fā)電作為一種重要的發(fā)電方式,是保障充足穩(wěn)定電力供應的基礎,但其以燃煤機組為主,燃煤產(chǎn)生的NOx在一定條件下可破壞臭氧層、形成酸雨等,直接或間接地危害生態(tài)環(huán)境。近年來,我國不斷加強電力外送通道建設,使得國電外送規(guī)模持續(xù)創(chuàng)新高,這無疑加劇了對我國生態(tài)環(huán)境的影響。在國家節(jié)能減排政策的嚴格要求下,火力發(fā)電廠紛紛通過鍋爐燃燒優(yōu)化技術降低 NOx排放,在一定程度上提高火電機組的環(huán)保性。
鍋爐燃燒系統(tǒng)的優(yōu)化依賴于鍋爐燃燒預測模型的建立,一般采用回歸建模法。由于NOx排放量和其運行操控參數(shù)間存在很強的非線性關系,傳統(tǒng)建模方法難以準確地建立NOx排放預測模型。近年來,隨著統(tǒng)計學、機器學習、神經(jīng)網(wǎng)絡等不斷發(fā)展,國內外學者圍繞燃煤電站鍋爐NOx排放量預測模型的構建進行了大量的研究。其中BP神經(jīng)網(wǎng)絡、SVM、ELM等被廣泛用于電站鍋爐NOx排放建模預測中[1-4]。HU et al[5]將660 MW燃煤機組作為研究對象,采用BP神經(jīng)網(wǎng)絡建立了NOx排放預測模型。2006年,GUO et al[6]以一臺300 MW旋流對燃鍋爐為研究對象,建立了基于SVM的鍋爐燃燒過程中的NOx排放預測模型。李素芬等[7]基于粒子群優(yōu)化算法和LS-SVM建立電站鍋爐NOx排放預測模型。然而BP容易出現(xiàn)過擬合現(xiàn)象,SVM算法因需要二次規(guī)劃使得樣本數(shù)量受限而僅適用于小樣本建模。為了解決以上問題,TAN et al[8]基于從某電廠700 MW燃煤電站鍋爐采集的約5 d實際運行樣本數(shù)據(jù),建立了基于ELM的NOx模型,提高了模型的泛化性。陳琪[9]提出基于GMM的數(shù)據(jù)重采樣及SKPCA-ELM算法,建立鍋爐NOx排放模型,其中基于GMM的數(shù)據(jù)重采樣通過選擇代表性樣本有效地解決了樣本數(shù)據(jù)分布不均衡問題,縮短了模型訓練時間。然而以上算法仍存在局限性,一方面將SKPCA用于特征數(shù)據(jù)降維,沒有考慮特征屬性與決策屬性之間的關系,使模型不能達到很好的預測精度;另一方面使用ELM建模,模型的穩(wěn)定性和泛化性不理想。K-ELM的提出,有效地解決了ELM存在的缺陷?;贓LM的燃煤鍋爐NOx排放預測模型的穩(wěn)定性和泛化性與核函數(shù)密切相關,然而單一的核函數(shù)難以準確描述NOx排放與被操控運行變量之間的非線性關系,導致該預測模型的學習能力與泛化能力不足。
為了有效地平衡建模時間與模型預測準確度,本文提出了一種基于FAR和HK-ELM的燃煤電站鍋爐NOx排放預測方法。該方法以鍋爐NOx排放量為預測目標,首先利用FAR算法篩選出影響NOx排放量的主要影響因素,生成新樣本數(shù)據(jù)集;然后基于生成的新數(shù)據(jù)集采用HK-ELM建立NOx排放預測模型。實驗結果表明,本文所提方法能夠有效地建立NOx排放預測模型,同時保證模型提高預測精度、縮短建模時間。
燃煤電站鍋爐的燃燒過程是一個復雜的物理化學過程。在其運行過程中常常受到外部干擾及內部設備振動等諸多隨機因素的影響,使得特征屬性間存在冗余性和耦合性,這必然會影響NOx排放預測模型的建模效率及模型準確性。因此通過科學篩選影響NOx排放的核心影響屬性因子來提高建模效率和準確性顯得尤其重要。
粗糙集理論于1982年由波蘭數(shù)學家Z.Pawlak教授提出,由此眾多學者開始研究粗糙集,使其廣泛發(fā)展。目前粗糙集理論已經(jīng)被應用于特征選擇、模式識別和預測[10-12]等方面,其中屬性約簡[13]就是粗糙集研究的一個核心內容,主要在不改變原始樣本數(shù)據(jù)的基礎上,通過刪除冗余的屬性特征來保持信息系統(tǒng)的預測能力。而鄰域粗糙集模型的引入解決了經(jīng)典粗糙集只能處理名義型數(shù)據(jù)的問題,用于處理數(shù)值型數(shù)據(jù),在此基礎上,屬性約簡算法得到了進一步發(fā)展。
給定鄰域大小,有性質1:如果條件屬性子集B1、B2滿足B1?B2?C,且樣本集X?U,則對于論域U中的任一個樣本x,如果x∈POSB1(D),則x∈POSB2(D).
知識約簡定義:設P和Q是U中兩個等價關系組,若Q∈P,Q是獨立的,且ind(P)=ind(Q),則稱Q為P的一個約簡,記為red(P).
一般采用前向貪心搜索策略來進行屬性約簡,即依次將新屬性添加到已選條件屬性集,將粗糙集屬性依賴度作為屬性重要度的度量指標,重新依次判斷每一個樣本是否在正域內。2008年,胡清華等[14]根據(jù)性質1,表明新樣本的增加不會使原來屬于正域的樣本變?yōu)檫吔鐦颖?,基于Pawlak屬性約簡,提出一種鄰域粗糙集前向搜索屬性約簡快速算法(forward attribute reduction based on neighborhood rough sets and fast search,F(xiàn)ARNEMF),該算法所采取的加速思想僅會提高屬性約簡速度,并不會對屬性約簡結果產(chǎn)生影響。因此本文將其用于燃煤電站鍋爐NOx預測建模時大規(guī)模樣本數(shù)據(jù)的屬性特征選擇中。
ELM是黃廣斌等[15]提出的一種快速單隱層前饋神經(jīng)網(wǎng)絡(SLFNs).因結構簡單、速度較快、參數(shù)較少、泛化能力強等被廣泛應用于工業(yè)、農業(yè)等多個領域的分類及回歸問題中。2012年,通過對SVM、LS-SVM與ELM的算法機理進行對比,將核函數(shù)應用于ELM,提出了K-ELM[16].K-ELM不僅繼承了ELM的諸多優(yōu)點,同時解決了ELM模型輸出容易因隨機復制而出現(xiàn)隨機擾動的問題,使其泛化性、穩(wěn)定性進一步增強。
ELM的SLFNs模型可描述為:
f(x)=h(x)β=Hβ.
(1)
式中:x為樣本輸入,f(x)為神經(jīng)網(wǎng)絡的輸出,H表示隱含層特征映射矩陣,β表示輸出權重矩陣。
根據(jù)文獻[16],K-ELM對應的輸出為:
(2)
式中:C為正則化因子,T為樣本對應的輸出。
K-ELM的核矩陣定義如下所示:
ΩELM=HHT∶ΩELMi,j=h(xi)h(xj)=K(xi,xj) .
(3)
核函數(shù)有很多種類型,如線性核函數(shù)、小波核函數(shù)等。一般情況下,樣本輸入往往不同且有較大差異,使得難以選擇有效的核類型和核參數(shù)。文獻[17]選擇多項式核函數(shù)(Poly)和高斯徑向基核函數(shù)(RBF)線性相加構造一全新的混合核函數(shù)模型,使其兼具局部核函數(shù)學習能力較強和全局核函數(shù)泛化性較好的優(yōu)點,進而具有更好的學習能力和泛化性能?;旌虾撕瘮?shù)表達式為:
ΩELM=HHT∶ΩELMi,j=h(xi)h(xj)=Kmix(xi,xj) .
(4)
在這種情況下,混合核極限學習機(hybrid kernel ELM,HK-ELM)模型的輸出為:
(5)
式中:ΩELM為N×N對稱矩陣,Kmix(xi,xj)為混合核函數(shù),據(jù)Mercer原理和線性加權原則,得之比混合核函數(shù)Kmix也是Mercer函數(shù):
Kmix(x,xj)=rKpoly(x,xi)+(1-r)Krbf(x,xi),
(0≤r≤1) .
(6)
其中,參數(shù)r為平衡因子,用于調節(jié)局部核函數(shù)和全局核函數(shù)的作用大小,范圍為[0,1];Kpoly(x,xi)為多項式核函數(shù),Krbf(x,xi)為高斯徑向基核函數(shù),即
(7)
Kpoly(x,y)=(xTy+1)d.
(8)
在使用HK-ELM進行建模時,正則化因子C與核函數(shù)參數(shù)(γ,d,r)的設定直接影響HK-ELM模型的性能。
本文結合FAR與HK-ELM算法,提出了一種基于FAR-HK-ELM的燃煤電站鍋爐NOx排放預測方法?;贔AR-HK-ELM的燃煤電站鍋爐NOx預測模型,其基本方法是:
1) 首先,通過拉以達準則、線性插值法、歸一化處理等對采取的樣本數(shù)據(jù)進行數(shù)據(jù)預處理。
2) 其次,采用FAR算法對預處理后的樣本數(shù)據(jù)集進行屬性約簡,篩選影響NOx排放量的主要影響屬性變量,構建新的屬性子集,以作為NOx排放預測模型的輸入變量。
3) 最后,通過帶約束的權重線性遞減粒子群尋優(yōu)算法結合10-fold交叉驗證方法,優(yōu)化HK-ELM的正則化因子及核參數(shù),以實際數(shù)據(jù)和預測數(shù)據(jù)的均方根誤差最小化作為目標,基于屬性約簡后所構建的新樣本集,建立基于HK-ELM的NOx排放量預測模型。
基于FAR-HK-ELM的燃煤電站鍋爐NOx預測模型構建過程如圖1所示。
本文采用某電廠600 MW燃煤電站鍋爐的歷史運行數(shù)據(jù)對模型進行測試,采樣周期為1 s.在鍋爐實際運行中,鍋爐負荷、一次風、二次風等是影響其NOx排放的主要因素,本文充分考慮從燃煤電站鍋爐采集的實際測點數(shù)據(jù),選取共57維運行操控參數(shù)作為模型的輸入量,以鍋爐NOx排放量作為模型的輸出量,具體如表1所示。
圖1 基于FAR-HK-ELM的燃煤電站鍋爐NOx預測模型構建過程Fig.1 NOx prediction model construction process of coal-fired utility boiler based on FAR-HK-ELM
表1 NOx排放預測模型輸入量Table 1 Input of NOx emission prediction model
為保證燃煤鍋爐NOx排放量預測模型的性能,在模型訓練之前需要對樣本數(shù)據(jù)進行數(shù)據(jù)預處理,依次采取拉以達準則、線性插值法剔除數(shù)據(jù)離群點、補齊空值、替換異常值。然后隨機選取10%樣本數(shù)據(jù),共1 200組樣本數(shù)據(jù)歸一化處理到[-1,1],使其量綱達到同一數(shù)量級。
為了準確地評價本文所建立的基于FAR-HK-ELM的燃煤電站鍋爐NOx預測模型的性能,本文采用粗糙集屬性重要度作為度量指標衡量屬性特征的貢獻,采用擬合優(yōu)度R2、均方根誤差(root mean squared errors,RMSE)、平均相對誤差(mean relative error,EMRE)作為標準來衡量模型的學習能力和預測能力。
1) 粗糙集屬性重要度計算公式如下:
(9)
式中:|·|表示集合內元素的個數(shù);U為論域;B,D分別為條件屬性子集、決策屬性;POSB(D)為條件屬性子集B所確定的正域。
2) 衡量模型的學習能力和預測能力的計算公式如下:
(10)
(11)
(12)
在研究鍋爐NOx排放量預測模型時,為了保證模型預測精度同時減少建模時間,首先使用FAR算法將全部樣本數(shù)據(jù)用于屬性特征選擇,選定鄰域半徑計算參數(shù)、重要度下限的控制參數(shù)分別為6.1,0.000 1,以屬性重要度為評價指標,即條件屬性對決策屬性的貢獻,約簡后的樣本輸入屬性為{1,2,3,6,8,9,12,13,14,15,19,25,28,34,35,39,43,46,53},共計19個,各特征屬性的重要度如圖2所示。從燃煤電站鍋爐實際運行情況來進行分析,鍋爐NOx排放量主要取決于鍋爐負荷大小、一次風速、二次風速等影響,與排煙溫度等的關系并不是很密切,其與約簡結果基本一致。
圖2 屬性重要度Fig.2 Attribute importance
將屬性約簡后新的特征屬性構成的新樣本集用于HK-ELM建模,隨機選取其中80%的樣本數(shù)據(jù)作為訓練樣本,剩余20%作為測試樣本。HK-ELM模型的學習能力和泛化能力取決于HK-ELM的正則化因子C和混合核函數(shù)參數(shù)(γ,d,r).通過帶約束的權重線性遞減粒子群尋優(yōu)算法尋找HK-ELM模型的最優(yōu)參數(shù),以10-fold交叉驗證中10次測試的總測試均方根誤差的均值作為粒子群算法的適應度值(見公式(13)),以達到避免模型訓練中出現(xiàn)過擬合的目標。
(13)
為了平衡模型預測準確性與建模時間,多次調整迭代次數(shù)及核函數(shù)范圍,則帶約束的權重線性遞減粒子群尋優(yōu)算法及HK-ELM模型具體參數(shù)設置見表2.根據(jù)表2參數(shù)設置進行尋優(yōu),此時得到HK-ELM模型中的參數(shù)組(C,γ,d,r)為(189.043, 3.434 65, 3,0.436 496),建立NOx排放的HK-ELM模型,并對測試樣本進行預測,NOx排放量模型預測值與實際值的對比如圖3所示,可以看到FAR-HK-ELM模型的預測值與實際值有很好的一致性。模型對訓練樣本EMRE、R2、RMSE分別為1.90×10-11,1,1.33×10-11,測試樣本的EMRE、R2、RMSE分別為0.001 4,0.980 6,0.043 2,結果表明FAR-HK-ELM模型不僅學習能力很強,且具有較高的預測精度和擬合泛化能力,可以對燃煤鍋爐NOx排放量進行準確預測。
表2 粒群尋優(yōu)算法及HK-ELM模型具體參數(shù)設置Table 2 Particle swarm optimization algorithm and specific parameter setting of HK-ELM model
圖3 NOx排放量模型預測值與實際值的對比Fig.3 Comparison between the prediction values of NOx emission model and the real value
為了綜合評定FAR-HK-ELM預測燃煤鍋爐NOx排放量時時間復雜度、預測精度等方面的性能,將本文方法與其他算法進行比較,分別為BP神經(jīng)網(wǎng)絡、SVM、ELM、多項式核極限學習機(PK-ELM)、高斯徑向基核極限學習機(GK-ELM)、混合核極限學習機(HK-ELM),以R2,RMSE,EMRE作為評定指標進行實驗對比分析,均取20次實驗均值作為最后結果如表3.
實驗均隨機選取其80%作為訓練樣本,剩余20%作為測試樣本。實驗中所有對比算法的核函數(shù)參數(shù)、懲罰系數(shù)、初始權值等參數(shù)都通過粒子群優(yōu)化算法和10-fold交叉驗證進行參數(shù)尋優(yōu)。
由表3可知,針對電站鍋爐NOx排放量建立預測模型,BP神經(jīng)網(wǎng)絡模型學習能力和預測性能較差;ELM模型學習能力很強,但模型泛化性較差;SVM模型相較于BP、ELM模型,模型性能有了一定提升,但時間復雜度較高。引入核函數(shù)后,從訓練集的EMRE,R2,RMSE三個指標來看,PK-ELM模型的學習能力優(yōu)于GK-ELM模型;從測試集的EMRE,R2,RMSE來看,GK-ELM模型的泛化性能優(yōu)于PK-ELM模型。綜合PK-ELM和GK-ELM兩個模型優(yōu)點所建立的HK-ELM模型,與PK-ELM和GK-ELM模型相比,其學習能力和泛化性能都顯著提高,但混合核的引入增加了HK-ELM模型計算復雜度,使建模時間加長。為此通過屬性約減減少樣本屬性維度,在保證提高模型學習能力和泛化性能的同時降低模型計算復雜度。
綜合分析可知,F(xiàn)AR-HK-ELM模型學習能力和泛化性能均優(yōu)于其他模型,實現(xiàn)了模型預測準確性與建模時間之間的平衡,能夠較為精準地對NOx排放量進行預測,在鍋爐NOx預測中是一種可行且有效的方法。
表3 不同算法性能指標比較Table 3 Comparison of performance indexes of different algorithms
本文基于燃煤電站鍋爐實際運行情況,提出了一種基于FAR-HK-ELM的鍋爐NOx排放預測方法,采用領域粗糙集屬性約簡算法篩選建模樣本核心特征屬性,刪除屬性間的冗余信息,然后綜合考慮多項式核函數(shù)和高斯徑向基核函數(shù)的優(yōu)點構建基于HK-ELM的NOx排放預測模型,提高了預測模型的準確性與泛化性。通過與BP,SVM,ELM,PK-ELM,GK-ELM和HK-ELM的對比實驗,進一步驗證了本文所提出的FAR-HK-ELM建模方法,能夠很好地用于實際電站鍋爐NOx排放建模中,該模型不僅具有很好的學習能力,并且可以較為準確地預測NOx排放量,具有良好的擬合泛化性能力。