顧雅云,胡林獻(哈爾濱工業(yè)大學 電氣工程系,黑龍江 哈爾濱 150001)
廠級負荷優(yōu)化無需對現(xiàn)有設備進行硬件改造即可達到節(jié)能減排的目的,有效且簡便,是目前發(fā)電企業(yè)提高經(jīng)濟效益的重要手段。熱電廠除提供電負荷外,還提供不同品質(zhì)的熱負荷,負荷種類多,機組的熱力特性不單一、約束條件多,因此熱電廠的負荷優(yōu)化較凝汽式發(fā)電廠復雜很多,相關的文獻研究也相對較少。
汽輪機組的汽耗特性準確與否直接影響到負荷優(yōu)化的合理性。傳統(tǒng)上主要采用基于傳統(tǒng)熱動力學分析的方法,如熱平衡法、等效熱降法等[1-2],該類方法計算繁瑣,需大量機組參數(shù)。對此文獻[3]提出了改進方案:將復雜的供熱機組根據(jù)供熱循環(huán)和凝汽循環(huán)等效為一臺背壓機組和一臺凝汽機組,然后利用考慮輔助汽水因素的單元進水系數(shù)法得到等效機組的特性方程。文獻[4]使用循環(huán)函數(shù)法來建立汽耗特性模型,極大簡化了計算,提高了精度。近年來則一般采用線性擬合方法,根據(jù)擬合數(shù)據(jù)來源分為工況圖法[5]、熱力實驗法[6]、變工況計算法[7]和運行數(shù)據(jù)法[8]。汽耗特性隨機組老化而變化,因此工況圖法誤差大;熱力試驗需定期現(xiàn)場實測,要停機和采用專門的設備與系統(tǒng),費時、費用高;變工況計算復雜,且不能包括機組運行的全部工況;運行數(shù)據(jù)未加入任何假設和簡化,利用這些數(shù)據(jù)建立的模型更能貼近機組實際運行特性,且成本低,易于實現(xiàn)。
文獻[9]指出供熱機組汽耗特性同時存在非凸、非連續(xù)性特點,采用多元線性回歸方程并不能很好地逼近原非線性的汽耗曲線。M5’模型樹[10]算法是一種多輸入單輸出系統(tǒng)的分段線性化數(shù)據(jù)挖掘算法,在處理非凸形和非連續(xù)性的特性方程方面具有優(yōu)勢。文獻[10]基于M5’模型樹算法建立熱電機組的汽耗特性,但其數(shù)據(jù)預處理粗糙簡單,且最終生成的模型分段數(shù)太多,不利于實際應用。
本文首先詳細分析采集數(shù)據(jù)特點,提出一種數(shù)據(jù)預處理方案,以提高數(shù)據(jù)挖掘效果,并通過設置結點的最小樣本數(shù)來控制分段數(shù)目,使建模過程可控。然后在此基礎上建立實時廠級負荷優(yōu)化模型,給出應用差分進化算法的求解方法。實例表明:M5’模型樹算法建立的分段線性模型不僅精度高且具有實用價值,可方便應用于廠級負荷優(yōu)化。
M5’模型樹算法將樣本空間分為邊緣相互平行的長方形區(qū)域,對每個分區(qū)確定一個相應的回歸模型,包括樹的生長、樹的剪枝、樹的平滑、樹的實現(xiàn)等步驟。
M5’模型樹算法劈分標準是樣本屬性差異化原則
式中 T——要劈分的樣本空間;
T1、T2——劈分后的兩子空間;
||——樣本數(shù)函數(shù);
sd()——目標屬性標準差的函數(shù)。
按照該原則將樣本空間分割成一定數(shù)目的子空間,分割的子空間就是樹的結點。其中樹停止生長的條件有:
(1)結點的樣本數(shù)少于一定數(shù)量;
(2)結點的樣本目標屬性標準差與總體樣本目標屬性標準差的比例小于某個限定值。具體的分割實例請看文獻[10]。
M5’模型樹算法的剪枝原則
式中 RMSE、RMSEl、RMSEr——分別是根結點,左,右葉子結點擬合方程的均方根誤差;
當ER小于0時剪枝,該根結點成為葉子結點,以提高整個模型的簡潔性和效率。
使用平滑過程來補償樹相鄰葉子節(jié)點處的不連續(xù)性。平滑方法是將子結點與父結點的擬合方程合并為一個新的線性方程
式中 fparent、fchild、fnew——分別是父、子、新結點的擬合方程;
n——到達該子結點的樣本數(shù);
k——一個常數(shù)。
只有當fnew與fchild的RMSE值相差小于一定的閾值,才進行平滑處理。
Weka是基于java的一種數(shù)據(jù)挖掘工具,簡單、使用門檻低。導入預處理后的數(shù)據(jù)后,選擇classify中M5’的classifier,選擇目標屬性,點擊start就可以對導入數(shù)據(jù)進行訓練最后得出模型樹,有圖形和文字兩種表示方法。Weka還可以設置結點的最小樣本數(shù)來控制分段數(shù)目,使建模過程可控。
(1)樣本/記錄:運行數(shù)據(jù)在計算機中是以樣本/記錄的形式存儲,一個采樣時間點形成一個采樣樣本,一個樣本包括該時間點的汽耗流量、蒸汽負荷、熱負荷、電負荷、溫度、壓力等相關數(shù)據(jù)。
(2)壞數(shù)據(jù):數(shù)據(jù)采集過程可能被干擾,采集回路軟件和硬件可能會出現(xiàn)問題,所以采集的數(shù)據(jù)不可避免地會出現(xiàn)壞數(shù)據(jù)。
(3)量綱不同:與汽耗流量相關的有蒸汽負荷、熱負荷和電負荷等,這些參數(shù)的量綱不同,數(shù)量級不同,會影響數(shù)據(jù)挖掘的效果。
(4)不穩(wěn)定工況:熱電機組運行時可能會受到內(nèi)擾或外擾,擾動后,熱力系統(tǒng)處于動態(tài)調(diào)整中,此時采集的數(shù)據(jù)就是不穩(wěn)定工況數(shù)據(jù),不能真實反映機組的汽耗特性,不能用做數(shù)據(jù)挖掘的訓練樣本。
(5)數(shù)據(jù)不均勻:機組大部分運行在滿負荷附近,中高負荷較少,所以采集的運行數(shù)據(jù)非常不均勻。若采用不均勻的樣本訓練會導致訓練模型在中高負荷下精度不夠,而在滿負荷下泛化能力不足,且滿負荷附近大量冗余數(shù)據(jù)會影響數(shù)據(jù)挖掘速度和性能。
(6)數(shù)據(jù)連續(xù):自動化系統(tǒng)采集的數(shù)據(jù)都是關于時間連續(xù)的,即相鄰樣本相隔一個采樣周期。
(1)簡化樣本:運行數(shù)據(jù)樣本有很多屬性,有汽耗流量、蒸汽負荷、熱負荷等我們建模需要的,也有汽輪機型等我們不需要的,刪去我們不需要的屬性,簡化樣本。
(2)壞數(shù)據(jù):識別超過正常數(shù)值范圍或不滿足相關性檢測的數(shù)據(jù)為壞數(shù)據(jù),含壞數(shù)據(jù)的樣本稱為壞樣本。定義樣本鄰域為與該樣本相差不超過3個采樣周期的樣本。若壞樣本的鄰域有壞數(shù)據(jù),則判斷該壞樣本已經(jīng)無法通過插值法來精確補正,應直接刪除,并標記一個時間斷層。反之則通過插值法進行補正。
(3)不穩(wěn)定工況:在連續(xù)時間內(nèi),若兩個相鄰樣本的蒸汽溫度和蒸汽壓力的變化值超過一定范圍就可以判斷為不穩(wěn)定工況樣本,做刪除處理。
(4)數(shù)據(jù)不均勻:對于剩余樣本,首先按照機組的電負荷,將樣本簡要劃分成不同的區(qū)間,然后在每個區(qū)間抽取一定比例或一定數(shù)目的樣本,如中高負荷處可以全部抽取或大比例抽取,滿負荷處小比例抽取。這樣就可以有效提高數(shù)據(jù)的均勻度,利于建立精確、泛化能力強的汽耗特性模型。
(5)量綱不同:用標準差化,也就是 Z-score法,消除量綱。標準差化法如下式。
式中 xi、x′i——分別是標準差化前,后的數(shù)組;
p、q——分別是數(shù)組 xi的平均數(shù),標準差。
(1)設置數(shù)據(jù)窗口長度 t,從機組自動化系統(tǒng)[11]歷史數(shù)據(jù)庫中收集與抽取最新的時間長度為t的歷史數(shù)據(jù),形成建模樣本庫。
(2)對建模樣本庫,按照第2節(jié)介紹的方法進行數(shù)據(jù)預處理,形成數(shù)據(jù)挖掘的訓練樣本庫。
(3)將訓練樣本庫導入Weka,選擇其中的M5’分類器進行訓練,就能得到供熱機組汽耗特性的無量綱形式分段線性模型。根據(jù)實際需要,設置結點的最小樣本數(shù)來控制分段數(shù)目。
(4)模型還原,通過消除量綱的逆過程,還原量綱,得到還原量綱的汽耗特性模型。
(5)對模型進行評估并和單一線性擬合模型進行對比,評估指標是關聯(lián)度R、絕對差值率MAE、均方根誤差率RMSE。
熱電廠負荷優(yōu)化就是在滿足總的發(fā)電功率、供熱(汽)量以及各汽輪機組出力限制的條件下,使全廠的總汽耗量最少。
式中 Q、N、P∑、D1Σ、D2Σ——分別是熱電廠總耗汽量,熱電機組總臺數(shù),總電負荷,總蒸汽負荷,總熱負荷;
Hi、Pi、D1i、D2i、Pimin、Pimax、D1imin、D1imax、D2imin、D2imax——分別是第 i臺機組的汽耗特性方程,電負荷,蒸汽負荷,熱負荷及它們的最小最大值。
熱電負荷優(yōu)化模型是高維、分段線性化模型,傳統(tǒng)的優(yōu)化算法如優(yōu)先順序法、線性規(guī)劃法、動態(tài)規(guī)劃法等無法適用或者效果不好。只能尋求對模型無要求的智能算法來求解,如遺傳算法、粒子群算法、蟻群算法、模擬退火算法、差分進化算法等。本文就選擇原理簡單、受控參數(shù)少、魯棒性強的差分進化算法[12]求解熱電負荷優(yōu)化模型。差分進化算法應用于負荷優(yōu)化的流程如圖1。
圖中 NP、Tmax、F、CR——分別是種群規(guī)模、最大迭代次數(shù)、縮放因子、交叉概率因子;
Uj、Lj——分別是第 j維變量的上下限;
r1、r2、r3——都是[1,NP]的隨機整數(shù);
rand(0,1)、r4——都是(0,1)的隨機小數(shù);
r5——1到總維數(shù)的隨機整數(shù)。
設置適應度函數(shù)如下式
式中 a、b、c——等式約束項的懲罰系數(shù)。
圖1 差分進化算法應用于負荷優(yōu)化的流程圖
某熱電廠裝有3臺高溫高壓單抽機組,數(shù)據(jù)窗口長度設為一個月、采樣周期為1 min。設置結點的最小樣本數(shù),生成6個葉結點時機組一的汽耗特性模型如下:
采用傳統(tǒng)二元線性擬合,建立的模型如下
表1 二種方法建立汽耗特性模型的R,RMSE,MAE值
表1是對兩種方法建立的汽耗特性模型進行對比,評估指標是關聯(lián)度R、絕對差值率MAE、均方根誤差率RMSE。
由表1的關聯(lián)度R值可以看出:兩種方法建立的汽耗特性模型關聯(lián)度都很高,模型均有意義。由絕對差值率MAE、均方根誤差率RMSE可以看出:M5’模型樹算法建立的模型更精確,逼近實際特性的能力更強。
在熱電廠全部機組最新汽耗特性模型的基礎上建立全廠熱電負荷優(yōu)化模型,當總電負荷為65 MW,總汽負荷是70 t/h時,應用差分算法求解得到的最優(yōu)解為機組一承擔17 MW電負荷、7 t/h汽負荷,機組二承擔23 MW電負荷、36 t/h汽負荷,機組三承擔25 MW電負荷、27 t/h汽負荷,總耗汽411 t/h。由此可以看出,分段汽耗特性模型可應用于廠級負荷優(yōu)化分配,具有實用價值。
(1)汽耗特性模型是熱電廠負荷優(yōu)化的基礎。本文基于M5’模型樹算法、滾動利用機組最新歷史數(shù)據(jù)建立的分段線性化模型具有實時性強、預測能力高、建模過程可控等優(yōu)點。
(2)在分段線性化模型基礎上建立的實時廠級負荷優(yōu)化模型可應用差分算法求解其全局最優(yōu)解,實例計算表明:多段線性化模型可應用于實時廠級負荷優(yōu)化,具有實用價值。
[1]鐘文琪,顧利鋒,賈俊穎,等.供熱機組熱化發(fā)電率算法研究[J].熱力發(fā)電,2002(4):11-13.
[2]吉柱明.汽輪機汽耗量的確定[J].熱能動力工程.2012,27(5):565.
[3]李俊濤,馮霄.供熱機組的熱電負荷分配[J].西安交通大學學報,2006,40(3):311 -322.
[4]王培紅,江浩,朱玉娜,等.供熱機組特性分析的循環(huán)函數(shù)法及其應用[J].熱能動力工程,1999,14(83):397 -411.
[5]張煒.供熱發(fā)電機組耗量特性模型研究[J].電力學報,2002,17(2):83 -86.
[6]溫志剛,王勇,駱貴兵,等.模擬退火算法在供熱機組負荷分配中的應用研究[J].熱力發(fā)電,2003(7):18-20.
[7]黃錦濤,武學素.應用多元線性回歸原理建立300 MW抽汽凝汽式汽輪機組的特性方程[J].動力工程,1993,13(4):16-20.
[8]韓果,汪壽基,汪濟龍,等.供熱抽汽式汽輪發(fā)電機組之間在線最優(yōu)分配負荷的研究[J].四川聯(lián)合大學學報,1999,3(2):102 -107.
[9]徐帆,姚建國,耿建,等.機組耗量特性的混合整數(shù)模型建立與分析[J].電力系統(tǒng)自動化,2010,34(10):45 -50.
[10]章堅民,劉登濤,吳光中,等.采用 M5’模型樹和測量數(shù)據(jù)識別抽汽式機組汽耗量特性[J].中國電機工程學報,2011,31(23):21 -26.
[11]于達仁,李曉棟,胡清華,等.基于智能信息處理的電廠優(yōu)化運行技術[J].節(jié)能技術,2006,24(4):348 -653.
[12]禹超.母管制熱電機組負荷優(yōu)化分配方法研究[D].哈爾濱:哈爾濱工業(yè)大學,2011.