李海軍 夏靜 史恒惠 劉長良 王梓齊
摘要:針對工業(yè)過程的軟測量建模,為對輸入與輸出變量間的時滯關(guān)系進行準確、快速地估計,提出一種基于復(fù)相關(guān)系數(shù)的時滯聯(lián)合估計方法。該方法以模型輸入和輸出數(shù)據(jù)間的復(fù)相關(guān)系數(shù)為指標,將時滯聯(lián)合估計問題轉(zhuǎn)化為多維優(yōu)化問題,進而對各輸入變量的時滯時間進行尋優(yōu)。針對火電廠脫硝系統(tǒng)的NO,排放軟測量,基于實際的運行數(shù)據(jù)和最小二乘支持向量機算法,對所提出的方法進行驗證并與其他時滯估計方法進行對比。結(jié)果表明:基于復(fù)相關(guān)系數(shù)的時滯估計方法計算速度較快,時滯估計結(jié)果較準確,能在一定程度上提高軟測量模型的準確度。
關(guān)鍵詞:復(fù)相關(guān)系數(shù);時滯聯(lián)合估計;NOx排放;軟測量
中圖分類號:TP206 文獻標志碼:A 文章編號:1674-5124(2019)08-0140-05
收稿日期:2018-07-16;收到修改稿日期:2018-09-04
基金項目:北京市自然科學基金資助項目(4182061)
作者簡介:李海軍(1973-),男,河南焦作市人,工程師,研究方向為火電機組軟測量、遠程診斷。
0 引言
工業(yè)過程的軟測量建模,除了受輔助變量選取、建模方法等因素的決定外,輔助變量與主導(dǎo)變量間的時滯關(guān)系同樣會對模型準確度產(chǎn)生一定的影響[1]。若不考慮輔助變量的時滯,會在一定程度上對模型的準確度產(chǎn)生負面影響。對于復(fù)雜的生產(chǎn)過程,很難通過機理分析確定具體的時滯時間。因此,在實際應(yīng)用中多采用數(shù)據(jù)驅(qū)動方法估計輔助變量的時滯時間,主要分為單變量估計和聯(lián)合估計兩種。
單變量估計獨立地分析每個輔助變量與輸出變量間的時滯關(guān)系,有著便于實現(xiàn)、計算速度快等優(yōu)點。文獻[2]基于相關(guān)系數(shù)確定時間序列模型中的最優(yōu)時滯因子并應(yīng)用于交通流量的預(yù)測。文獻[3]基于歸一化互信息確定聚丙烯熔融指數(shù)預(yù)測模型中各自變量的時滯時間。文獻[4]提出了一種基于模糊曲線分析的單變量時滯估計方法。文獻[5]將模糊曲線分析時滯估計與選擇性集成高斯過程回歸算法進行結(jié)合,建立了脫丁烷塔底濃度的軟測量模型。但是,單變量估計在計算時中忽略了其他輔助變量對輸出的影響以及輔助變量之間的相互影響,有可能會導(dǎo)致估計結(jié)果的不準確。
聯(lián)合估計綜合考慮各輔助變量與輸出間以及各輔助變量之間的關(guān)系從而確定時滯時間。文獻[6]以所有輔助變量和主導(dǎo)變量間的聯(lián)合互信息作為目標函數(shù)對時滯時間進行尋優(yōu)。文獻[7]以軟測量模型的訓(xùn)練誤差作為目標函數(shù),使用混合差分進化算法對時滯時間進行尋優(yōu)。文獻[8]使用差分進化算法對時滯時間進行尋優(yōu),并結(jié)合偏最小二乘算法,建立了常壓塔干點的軟測量模型。但是,由于需要計算聯(lián)合互信息等復(fù)雜函數(shù)或需要對模型進行訓(xùn)練,時滯聯(lián)合估計在輸入維數(shù)高、樣本數(shù)量大的情況下往往運算時間較長,不利于實際的工程實踐。
復(fù)相關(guān)系數(shù)是反映一個因變量與一組自變量之間相關(guān)程度的指標[9],其常應(yīng)用于多元相關(guān)分析、多元線性回歸的評價等數(shù)理統(tǒng)計領(lǐng)域,文獻[10-11]將復(fù)相關(guān)系數(shù)應(yīng)用于確定數(shù)據(jù)包絡(luò)分析中自變量與因變量間的時間滯后關(guān)系。復(fù)相關(guān)系數(shù)是通過對輸入、輸出數(shù)據(jù)進行線性擬合進而計算得到的,相比于聯(lián)合互信息或訓(xùn)練數(shù)據(jù)驅(qū)動模型,其計算速度有明顯的優(yōu)勢。
因此,本文提出了一種基于復(fù)相關(guān)系數(shù)的時滯聯(lián)合估計方法。該方法以輔助變量和輸出變量間的復(fù)相關(guān)系數(shù)為指標,將時滯估計轉(zhuǎn)化為多維優(yōu)化問題進行求解,有著計算快、準確度高的特點。以火電廠脫硝系統(tǒng)NOx排放濃度的軟測量為例,基于實際運行數(shù)據(jù)對所提出方法進行了驗證。
1 基于復(fù)相關(guān)系數(shù)的時滯聯(lián)合估計
1.1 過程變量的時滯估計
傳統(tǒng)的軟測量建模中往往不考慮輔助變量的時滯問題,多直接使用同一采樣時刻的輔助變量和輸出變量數(shù)據(jù)建立模型。但對于工業(yè)過程特別是化工、冶煉、發(fā)電等相關(guān)領(lǐng)域,從工藝流程到測量儀表等環(huán)節(jié)均存在較大的時滯。因此,有必要在建模過程中考慮各輔助變量的時滯,從而進一步提高軟測量模型的準確度。
考慮輔助變量時滯的軟測量模型結(jié)構(gòu)如下:
y(t)=f[x1(t-τ1),x2(t-τ2),…,xn(t-τn)](1)式中:y(t)——軟測量模型的輸出變量;
xk(t-τk)——模型的輔助變量;
τk——輔助變量xk的時滯時間。
輔助變量的時滯估計是采用機理分析或數(shù)據(jù)驅(qū)動方法,計算輔助變量的時滯時間τ。對于復(fù)雜的工業(yè)過程,很難使用機理分析方法精確計算各輸入變量的時滯時間,常用數(shù)據(jù)驅(qū)動方法進行時滯估計。
數(shù)據(jù)驅(qū)動時滯估計方法的基本思想是將同一采樣時刻的歷史輸入數(shù)據(jù)X(t)∈Rn進行時序重構(gòu),得到新的輸入數(shù)據(jù)Xd(t)=[X1(t-τ1),X2(t-τ2),…,Xn(t-τn)]T。
之后基于某一給定的指標(如互信息、相關(guān)系數(shù)等)確定最優(yōu)的時滯時間。數(shù)據(jù)驅(qū)動時滯估計方法主要分為單變量估計和聯(lián)合估計兩種。
單變量時滯估計獨立地分析單個輔助變量與輸出間的時滯關(guān)系,即將時滯估計問題轉(zhuǎn)化為如下的優(yōu)化問題:其中,f1可為相關(guān)系數(shù)、互信息等目標函數(shù)。
單變量時滯估計通過數(shù)個一維優(yōu)化問題進行求解,計算速度相對較快。但在尋優(yōu)時僅考慮某個輔助變量與輸出的關(guān)系而忽略了其他輔助變量與輸出的關(guān)系以及輔助變量之間的關(guān)系,存在一定的片面性,可能會在一定程度上導(dǎo)致估計結(jié)果的不準確,從而影響軟測量模型的準確度。
時滯聯(lián)合估計方法綜合考慮各輔助變量與輸出以及各輔助變量之間的關(guān)系,對各輔助變量的時滯時間進行聯(lián)合尋優(yōu),即轉(zhuǎn)化為如下的優(yōu)化問題:其中,f2可為聯(lián)合互信息、軟測量模型訓(xùn)練誤差等目標函數(shù)。
時滯聯(lián)合估計通過多維優(yōu)化問題進行求解,相比于單變量估計從理論上更為準確。但是,聯(lián)合估計在尋優(yōu)過程中需要計算聯(lián)合互信息等復(fù)雜函數(shù)或需要對軟測量模型進行訓(xùn)練,在輸入維數(shù)高、樣本數(shù)量大的情況下耗時較長,不利于工程實踐。
1.2 復(fù)相關(guān)系數(shù)及其在時滯估計中的應(yīng)用
復(fù)相關(guān)系數(shù)R越大,表明因變量和該組自變量間的線性相關(guān)程度越大。復(fù)相關(guān)系數(shù)R通常使用以下步驟進行計算:
1)使用時序重構(gòu)后的輸入數(shù)據(jù)Xd(t)和輸出數(shù)據(jù)Y(t)進行多元線性回歸。
2)基于線性模型計算預(yù)測諽Y(t)。
3)計算實際值Y(t)和預(yù)測值Y(t)之間的簡單相關(guān)系數(shù),即為Y(t)和Xd(t)間的復(fù)相關(guān)系數(shù)R,具體的計算公式如下:其中,Y為實際值Y(t)的算術(shù)平均值。
除上述步驟外,復(fù)相關(guān)系數(shù)R也可以通過Xd(t)和Y(t)多元線性回歸后得到的決定系數(shù)R2開方得到。
基于復(fù)相關(guān)系數(shù)進行時滯聯(lián)合估計,即求解如下規(guī)劃問題:其中,由于時滯時間應(yīng)為采樣間隔的整數(shù)倍,故其定義域應(yīng)為自然數(shù)域N;T為時滯時間的上界。
上述規(guī)劃問題是非線性整數(shù)規(guī)劃問題,可采用分支定界法或啟發(fā)式算法進行求解。啟發(fā)式算法的結(jié)構(gòu)較為簡單、計算速度較快,但無法方便處理復(fù)雜的約束條件。由于以上規(guī)劃問題不含等式、非線性等復(fù)雜的約束條件,可使用啟發(fā)式算法進行求解。
相比于單變量時滯估計,復(fù)相關(guān)系數(shù)在計算時充分考慮了自變量間的相關(guān)關(guān)系,估計結(jié)果相對更為準確;相比于其他時滯聯(lián)合估計方法,進行多元線性回歸所需要的時間要遠小于計算聯(lián)合互信息或訓(xùn)練軟測量模型,實時性相對較好。因此,從理論上講,基于復(fù)相關(guān)系數(shù)的時滯聯(lián)合估計能夠更好地平衡估計結(jié)果的準確性和計算的快速性。
2 復(fù)相關(guān)系數(shù)時滯聯(lián)合估計在軟測量中的應(yīng)用
2.1 火電廠脫硝系統(tǒng)及NOx排放軟測量
圖1為火電廠脫硝系統(tǒng)工藝流程的示意圖。脫硝系統(tǒng)布置在鍋爐的省煤器與空預(yù)器之間,其基本工作過程如下[12]:氨氣與風機送來的空氣進行混合后通過噴嘴進入煙道,與省煤器出口來的煙氣充分混合后進入反應(yīng)器,在催化劑的催化作用下發(fā)生還原反應(yīng),將煙氣中的NOx還原為氮氣與水蒸氣。
脫硝系統(tǒng)中發(fā)生的主要化學反應(yīng)如下:
4NO+4NH3+O2→4N2+6H2O(6)
8NH3+6NO2→7N2+12H2O(7)
4NH3+3O2→22+6H2O(8)
除上述反應(yīng)外,還會發(fā)生一些副反應(yīng)并生成諸如硫酸氫銨等不利的副產(chǎn)物。
由于脫硝系統(tǒng)中氣體分析儀表的測量滯后較大且需要頻繁進行吹掃,導(dǎo)致傳統(tǒng)的控制策略往往難以長時間精確地控制噴氨量。噴氨量偏少會導(dǎo)致NOx排放超標,而過量噴氨除了會導(dǎo)致經(jīng)濟上的損失外,還會造成催化劑壽命縮短、下游設(shè)備堵塞、氨逃逸率增大等不良后果。因此,有必要建立準確的NOx排放濃度軟測量模型以進一步實現(xiàn)噴氨量的閉環(huán)優(yōu)化控制。
一般情況下,考慮輔助變量時滯估計的軟測量建模步驟如下:
1)根據(jù)過程機理以及現(xiàn)場實際測點情況,確定與輸出變量密切相關(guān)的輔助變量。
2)獲取相應(yīng)的運行數(shù)據(jù)并進行去離群點、濾波、歸一化等預(yù)處理操作,之后確定軟測量模型的訓(xùn)練樣本和測試樣本。
3)基于訓(xùn)練樣本以及相應(yīng)的時滯估計方法,確定各輔助變量的時滯時間并對訓(xùn)練、測試樣本進行時序重構(gòu)。
4)基于選定的軟測量建模方法,使用時序重構(gòu)后的訓(xùn)練、測試樣本對軟測量模型進行訓(xùn)練和測試。
2.2 輔助變量選取及數(shù)據(jù)預(yù)處理
結(jié)合2.1中的機理分析及數(shù)據(jù)庫中實際的測點情況,同時考慮機組負荷變化對脫硝過程產(chǎn)生的影響,選擇脫硝系統(tǒng)入口 NOx濃度、入口煙氣含氧量、出口煙氣含氧量、煙氣流量、入口煙氣溫度、噴氨量和機組負荷共7個變量作為軟測量模型的輔助變量,輸出變量為脫硝系統(tǒng)出口的NOx濃度。
從數(shù)據(jù)庫中導(dǎo)出一段變負荷工況下的運行數(shù)據(jù),采樣間隔為10s,共1200組?;诶肋_準則剔除離群點,之后基于滑動窗口法進行濾波。剩余1067組數(shù)據(jù)并從中選取1000組數(shù)據(jù)進行歸一化后參與軟測量建模,選擇前800組數(shù)據(jù)作為訓(xùn)練樣本,后200組數(shù)據(jù)作為測試樣本。歸一化前建模數(shù)據(jù)中各變量的變化范圍如表1所示。
2.3 基于復(fù)相關(guān)系數(shù)的輔助變量時滯估計
考慮到脫硝系統(tǒng)中氣體分析儀表的響應(yīng)時間一般為30~120s,故設(shè)定各輔助變量時滯時間的上界T=120s。為對比各時滯估計方法在估計結(jié)果上的不同,同時基于復(fù)相關(guān)系數(shù)法、相關(guān)系數(shù)法和聯(lián)合互信息法對7個輔助變量進行時滯估計。相關(guān)系數(shù)法使用枚舉法進行求解,復(fù)相關(guān)系數(shù)法和聯(lián)合互信息法均用遺傳算法求解。遺傳算法的種群規(guī)模設(shè)置為20,迭代次數(shù)為100。
各方法時滯估計的結(jié)果如表2所示。相關(guān)系數(shù)法計算耗時0.05s,復(fù)相關(guān)系數(shù)法耗時1.%s,聯(lián)合互信息法耗時51.46s。
從表中可以看出,復(fù)相關(guān)系數(shù)法和聯(lián)合互信息法的時滯估計結(jié)果較為接近,而與相關(guān)系數(shù)法存在一定的差異。從機理上分析,入口NOx濃度和煙氣含氧量這兩個測點均位于脫硝系統(tǒng)的入口處且使用同一氣體分析儀表進行測量,其與輸出變量的時滯關(guān)系應(yīng)基本一致;而出口煙氣含氧量和出口NOx濃度的測點位置和測量儀表均相同,兩者間應(yīng)不存在時滯關(guān)系。因此,復(fù)相關(guān)系數(shù)法和聯(lián)合互信息法的估計結(jié)果要比相關(guān)系數(shù)法更具有準確性。同時結(jié)合3種算法的計算時間,相比于相關(guān)系數(shù)法和聯(lián)合互信息法,復(fù)相關(guān)系數(shù)法時滯估計的準確性和計算速度均較快,有著一定的優(yōu)勢。
3 實驗結(jié)果及分析
火電廠的NOx排放濃度常用人工神經(jīng)網(wǎng)絡(luò)[13]、最小二乘支持向量機[14]等智能方法建立軟測量模型。相比于人工神經(jīng)網(wǎng)絡(luò)等機器學習方法,最小二乘支持向量機(least square support vector machine,LS-SVM)有著泛化能力較強、能夠收斂至全局最優(yōu)點、訓(xùn)練速度較快的優(yōu)點。因此,本文選擇LS-SVM算法建立NOx排放的軟測量模型。
LS-SVM的實現(xiàn)基于Matlab的LS-SVM工具箱,選擇LS-SVM的核函數(shù)為線性函數(shù),參數(shù)訓(xùn)練選擇貫序最小優(yōu)化(sequentialminimal optimization,SMO)算法?;贚S-SVM分別建立不進行輔助變量時滯估計和使用復(fù)相關(guān)系數(shù)法進行時滯估計兩種情況下的NOx排放軟測量模型。兩個模型預(yù)測值與實際值的對比以及預(yù)測殘差間的對比如圖2和圖3所示。
如圖2和圖3所示,使用復(fù)相關(guān)系數(shù)進行時滯估計后,軟測量模型的準確度和跟蹤能力均要顯著優(yōu)于無時滯估計的模型,說明引入輔助變量的時滯信息能有效提高軟測量模型的準確度。
為了比較各時滯估計方法對模型準確度的影響,分別基于相關(guān)系數(shù)法和聯(lián)合互信息法的時滯估計結(jié)果建立軟測量模型,并在測試樣本上與不進行時滯估計和復(fù)相關(guān)系數(shù)法進行比較,結(jié)果如表3所示。其中RMSE為模型在測試樣本上的均方根誤差, MRE為模型在測試樣本上的平均相對誤差。
由表可知,進行輔助變量時滯估計后,模型的準確度都有著一定程度的提高,而相關(guān)系數(shù)法準確度提高的程度要小于聯(lián)合互信息法和復(fù)相關(guān)系數(shù)法,與1.1中對單變量估計和聯(lián)合估計方法的理論分析以及2.3中基于測點位置的機理分析結(jié)果相一致。
4 結(jié)束語
本文提出了一種基于復(fù)相關(guān)系數(shù)的輔助變量時滯聯(lián)合估計方法并將其應(yīng)用于火電廠脫硝系統(tǒng)的NQ排放軟測量中?;谧冐摵晒r下的實際運行數(shù)據(jù),結(jié)合LS-SVM算法對所提出的估計方法進行了驗證,并與不進行時滯估計、相關(guān)系數(shù)法和聯(lián)合互信息法進行了對比。結(jié)果表明,進行時滯估計后軟測量模型的準確度有了一定的提高且相比于其他時滯估計方法,所提出方法的計算速度較快、估計結(jié)果較準確,有著更好的工程應(yīng)用價值。
參考文獻
[1]XIONG W,LI Y,ZHAO Y,et al.Adaptive soft sensor basedon time difference Gaussian process regression with localtime-delay reconstruction[J].Chemical Engineering Research&Design,2017,117:670-680.
[2]申貴成,管水城,孫方宇.考慮最優(yōu)時滯因子時空模型的高速公路短時交通流預(yù)測[J].科學技術(shù)與工程,2018,18(24):149-156.
[3]LOU H,SU H,XIE L,et al.Inferential model for industrialpolypropylene melt index prediction with embedded prioriknowledge and delay estimation[J].Industrial&EngineeringChemistry Research,2012,51(25):8510-8525.
[4]李妍君,熊偉麗,徐保國一種帶過程變量時滯估計的在線軟測量建模方法[J].信息與控制,2016,45(6):641-646.
[5]熊偉麗,李妍君.選擇性集成LTDGPR模型的自適應(yīng)軟測量建模方法[J].化工學報,2017,68(3):984-991.
[6]阮宏鎂,田學民,王平.基于聯(lián)合互信息的動態(tài)軟測量方法[J].化工學報,2014,65(11):4497-4502.
[7]王鈞炎,黃德先.基于混合差分進化算法的軟測量時延參數(shù)估計[J].化工學報,2008,59(8):2058-2064.
[8]阮宏鎂,田學民,王平.帶時延估計的時間差分PLS軟測量建模方法[J].石油化工自動化2013,49(6):35-39.
[9]MONDINI V,MANGIA A L,TALEVI L,et al.Sinc-windowing and multiple correlation coefficients improveSSVEP recognition based on canonical correlationanalysis[J].Computational Intelligence and Neuroscience,2018,2018:4278782.
[10]管燕,吳和成,黃舜.基于改進DEA的江蘇省科技資源配置效率研究[J].科研管理,2011,32(2):145-150.
[11]范德成,李昊,劉贇.基于改進DEA——以復(fù)相關(guān)系數(shù)為基準的滯后期的我國產(chǎn)業(yè)結(jié)構(gòu)演化效率評價[J].運籌與管理,2016,25(3):195-203.
[12]秦天牧,呂游,楊婷婷,等.SCR煙氣脫硝系統(tǒng)自適應(yīng)混合動態(tài)模型[J].儀器儀表學報,2016,37(12):2844-2850.
[13]馬平,李珍,梁薇.基于互信息的輔助變量篩選及在火電廠NOx軟測量模型中的應(yīng)用[J].科學技術(shù)與工程,2017,17(22):249-254.
[14]丁續(xù)達,劉瀟,金秀章.基于壓縮感知最小二乘支持向量機的NOx軟測量模型[J].熱力發(fā)電,2018,47(3):76-81.
(編輯:商丹丹)