張 峰, 張 蔚, 張建明
(浙江大學(xué)智能系統(tǒng)與控制研究所,杭州 310027)
?
原油冶煉中主精餾塔裝置的漸近辨識及分析
張 峰, 張 蔚, 張建明
(浙江大學(xué)智能系統(tǒng)與控制研究所,杭州 310027)
原油冶煉過程的精餾塔裝置屬于典型的強耦合多變量化工對象,對其進行控制需要準確、合理的數(shù)學(xué)模型,辨識模型的精確程度與控制效果和經(jīng)濟效益直接相關(guān)。出于安全和效率考慮,對原油精餾過程的測試需要在閉環(huán)條件下進行,漸近辨識方法在測試過程中能夠同時改變多路操作變量并根據(jù)頻域方法給出模型。本文基于漸近辨識理論,采用先升階再降階的解決方案,根據(jù)ARMAX模型描述精餾塔裝置,取得符合要求的辨識模型。由于新觀測數(shù)據(jù)能夠降低過程建模中的不確定性,以輸出誤差為指標考察了新的測量數(shù)據(jù)對改善辨識模型精度的影響,分析測試數(shù)據(jù)信息量與有效估計之間的聯(lián)系,量化分析新觀測數(shù)據(jù)的引入對降低模型參數(shù)不確定性的影響。
多變量系統(tǒng); 系統(tǒng)辨識; 漸近法; 性能分析
多變量系統(tǒng)的模型辨識問題,包括用脈沖傳遞函數(shù)矩陣描述、Markov參數(shù)描述和輸入輸出差分方程描述的多變量辨識方法[1]。與單變量系統(tǒng)辨識類似,多變量系統(tǒng)辨識利用系統(tǒng)的輸入和輸出數(shù)據(jù),在某種準則意義下,尋找與系統(tǒng)外特性等價的數(shù)學(xué)模型。由于輸入輸出變量之間存在著耦合,改變一組操作變量往往對多組被控變量產(chǎn)生影響,多變量系統(tǒng)的系統(tǒng)辨識與控制一直是流程工業(yè)中的難題。部分方法著眼于將系統(tǒng)解耦,但這種方法不適用于強耦合的復(fù)雜系統(tǒng)。
原油冶煉過程的精餾塔裝置是石化工業(yè)關(guān)鍵系統(tǒng)之一,該裝置對原油各組分進行分離提純,目前采用預(yù)測控制方法能夠取得較好的控制精度和經(jīng)濟效益[2]。預(yù)測控制方法需要以準確合理的過程模型為基礎(chǔ),當數(shù)學(xué)模型與實際過程失配程度較大時控制效果將惡化。因此,工程實踐上在過程辨識和驗證環(huán)節(jié)需要投入大量人力和經(jīng)濟資源,建模過程成本很高。目前對于精餾塔裝置,工業(yè)界采用區(qū)間控制,即要求操作變量和被控變量處于控制范圍之內(nèi)。出于安全和效益等因素考慮,測試過程不允許斷開反饋回路,以保證過程穩(wěn)定運行。但閉環(huán)測試數(shù)據(jù)輸入輸出相關(guān)度高,與開環(huán)測試相比,更難從測試數(shù)據(jù)提取信息用以構(gòu)建數(shù)學(xué)模型,而且閉環(huán)系統(tǒng)存在可辨識性的問題[3]。
常規(guī)辨識方法每次測試只改變一組操作變量,觀察并記錄各輸出變量,因此花費的時間相當多。漸近辨識方法提供多變量系統(tǒng)建模方案[4],能夠在測試過程中同時改變多組操作變量,并依據(jù)頻域方法給出待估計對象的數(shù)學(xué)模型,顯著節(jié)省了辨識測試中的時間和經(jīng)濟成本。本文以原油冶煉過程的精餾塔裝置為研究對象,采用了漸近辨識法對主精餾塔進行系統(tǒng)辨識和模型驗證,以線性差分模型來描述多變量化工對象,按照先升階再降階的方案進行模型辨識和驗證。
1.1 概述
依據(jù)人們對系統(tǒng)辨識的定義,辨識過程就是按照某個準則在一組模型類中選擇一個與數(shù)據(jù)擬合得最好的模型[5]。因此,系統(tǒng)辨識包括輸入輸出數(shù)據(jù)、模型類和準則3個基本要素,其中數(shù)據(jù)是其基礎(chǔ),而準則扮演著優(yōu)化目標的角色,模型類則給出可行范圍。建立模型的目的是保證控制算法良好運行,根據(jù)慳吝性原則辨識模型的參數(shù)應(yīng)盡可能少。Ljung從理論上分析得出當單變量黑箱傳遞函數(shù)模型階次趨于無窮時,輸出誤差趨向于零[6]; Zhu將漸近理論推廣到多變量系統(tǒng)中,拓展了該理論的適用范圍[7]。漸近理論雖然具有很好的性質(zhì),但前提是假設(shè)階次趨向無窮,條件過于苛刻。應(yīng)用漸近理論意味著使用階次相當高的模型。漸近辨識法大膽采用計算可行的高階模型,通過降階得到等價模型。采用先升階再降階的方案取得的效果不亞于采用直接估計方案[8]。
1.2 輸入信號設(shè)計
輸入信號設(shè)計作為一個細節(jié),其譜密度函數(shù)應(yīng)能覆蓋系統(tǒng)的全部模態(tài),但信號的幅度或功率要加以限制,并且工程上要容易實現(xiàn)。工程上常選用相關(guān)函數(shù)具有脈沖響應(yīng)特性的信號作為輸入信號,如白噪聲或偽隨機二位式序列等[9],這兩種信號共性之處在于它們對于低頻特性的側(cè)重。一般而言,提高輸入信號幅值對待估計過程模態(tài)激勵得更充分,但存在著干擾裝置或過程正常運行的弊端。從頻譜分析的角度,輸入信號u(k)的譜密度函數(shù)Su(ω)可表示為
(1)
其中Ru為信號的相關(guān)函數(shù)。如果只有某些頻率使Su(ω)>0,這種信號稱為有限階的持續(xù)激勵信號。
(2)
(3)
上式第二項負定,說明新觀測數(shù)據(jù)的加入有助于降低參數(shù)估計過程中的不確定性。
1.3 模型選擇
在得到輸入輸出數(shù)據(jù)之后,可以通過系統(tǒng)的某些特征來獲得備選模型集,從中選擇一個合適的模型。采用非線性Hammestain模型或Wiener模型[11-12],對于準確描述精餾過程動態(tài)特性有利,但會給實際工程應(yīng)用帶來障礙。本文選擇線性差分方程來描述對象,差分模型具有如下形式:
A(q)y(t)=B(q)u(t-k)+C(q)e(t)
(4)
其中:e(t)表示白噪聲;k表示過程時延;A(q)、B(q)、C(q)分別為多項式系數(shù),表達式分別為
當C(q)=1時差分模型為自回歸(ARX)模型,當C(q)≠1時差分方程為自回歸滑動平均(ARMAX)模型。將真實過程表示為
(5)
(6)
由于A(q)參數(shù)中輸出誤差是非線性的,參數(shù)估計過程中可能存在數(shù)值問題,這意味著沒有閉式解[13]。為了保證參數(shù)估計方法的漸近無偏性,假設(shè)模型階次估計準確且輸入信號滿足持續(xù)激勵條件,同時A(q)和B(q)沒有公因子。
1.4 階次估計
Akaike提出較為客觀的判定系統(tǒng)的模型階次的方法[14],在其基礎(chǔ)上發(fā)展出的最終預(yù)報誤差(FPE)定階方法利用極小化一個準則函數(shù)來估計模型的階次,當數(shù)據(jù)長度N充分大時,FPE準則表示為
(7)
(8)
無論哪種定階方法,都不能保證得到無偏的模型階次,模型結(jié)構(gòu)的先驗信息對確定模型結(jié)構(gòu)有積極作用。
1.5 模型辨識
假設(shè)真實過程為m輸入和p輸出過程
y(t)=G0(q)u(t)+v(t)
(9)
y(t)=G(q,θ)u(t)+H(q,θ)e(t)
(10)
參數(shù)估計過程實際上是最優(yōu)化計算的過程,即計算全局極小值,最優(yōu)計算過程表達為
(11)
?Φv(ω)
(12)
其中Φv(ω)=H0(eiw)R[H0(eiw)]T;-T是轉(zhuǎn)置的逆矩陣。
極大似然估計要求數(shù)據(jù)序列概率分布一致,通常還要假設(shè)服從高斯正態(tài)分布,具有漸近正態(tài)性等品質(zhì)。漸近辨識法實際上是極大似然法在頻域上的應(yīng)用,基本思路是先估計高階ARX模型,然后降階為ARMAX模型。選擇高階模型既是為了獲得模型的一致性,同時為了滿足漸近理論的前提條件,模型表達式為
A(q)y(t)=B(q)u(t)+e(t)
(13)
(14)
降階過程使用的最小化算法具有若干特點,首先高階ARX模型中的擾動影響有所減弱,另外初始值的獲得可以用不同方法,同時部分局部極小值可檢測。由于模型降階存在平滑效應(yīng),降階后模型的頻率響應(yīng)一般位于高階模型頻率響應(yīng)的中段,根據(jù)這個規(guī)律可剔除掉部分局部極小點。
f(z(k),…,z(k-na+1);
u(k),…,u(k-nb+1))
(15)
使得評價函數(shù)式(16)最小:
(16)
2.1 數(shù)據(jù)集及譜密度分析
實驗采用的數(shù)據(jù)集來自于精煉廠原油冶煉的主精餾的閉環(huán)測試,包括7組輸入變量和4組輸出變量,采樣周期為1 min。辨識模型將用于模型預(yù)測控制,其中輸入變量1~3表示溫度設(shè)定點,輸入變量4為流量設(shè)定,輸入變量5和6為流量比設(shè)定值,輸入變量7則是流量量測值,來自于預(yù)測控制器的可測擾動;輸出變量1表示精餾塔內(nèi)托盤之間的溫度差異,輸出變量2~4為在線儀表測量的產(chǎn)物質(zhì)量。預(yù)處理環(huán)節(jié)首先對輸入輸出數(shù)據(jù)取均值化,再將其標準差縮放到1。
數(shù)據(jù)集是信息源,辨識算法從中提取信息用于構(gòu)建模型,因此對于復(fù)雜多變量系統(tǒng)辨識過程,我們需要考慮輸入激勵程度和測試信號長度兩方面因素,使測試數(shù)據(jù)中信息量盡可能豐富,才有可能接近統(tǒng)計意義上的最佳模型。為判斷輸入測試信號是否對過程形成充分激勵,對4組輸出變量進行功率譜分析,得到各自功率譜密度函數(shù),如圖1所示。根據(jù)圖1結(jié)果,精餾塔對象主要特性表現(xiàn)在低頻段,符合過程對象的規(guī)律,同時說明在原油冶煉等建模過程中,輸入信號應(yīng)側(cè)重低頻段,在高頻段可加入相對較少激勵,既節(jié)省信號能量,又減少對系統(tǒng)擾動。
圖1 輸出變量譜密度分析Fig.1 Spectral density analysis of output variables
2.2 時延估計
原油冶煉過程存在顯著時延,如果參數(shù)不估計時延,辨識模型質(zhì)量將變差。時延估計與階次選擇有類似之處,即嘗試多種不同時延,檢測對應(yīng)的損失函數(shù),選擇使得損失函數(shù)最小的時延。對于每組輸出,通過估計模型來嘗試不同時延。根據(jù)工程先驗知識,輸出變量2的時延范圍為[50,110](單位:采樣周期),其他輸出變量時延范圍為[1,40]。因此輸出變量1、3和4的時延范圍選擇為[0∶2∶40],即[0 2 4 6 … 40];輸出變量2的時延范圍選擇為[50∶5∶110],即[50 55 60 … 110]。
在選擇時延的過程中,假設(shè)ARX模型階次為40,選擇輸出誤差作為衡量時延合適程度的指標。為簡潔起見,對于一個給定輸出,對所有輸入均采用同樣的時延。本文考慮的主精餾塔裝置有4組被控變量,將其分解為4個多輸入單輸出(MISO)過程,選擇輸出誤差較低點對應(yīng)的時延作為4組MISO過程的時延估計值,結(jié)果如圖2所示。
圖2橫軸表示時延值,縱軸則是按照輸出誤差準則計算得出的誤差值。從圖2得出可能的時延值有多種情況。根據(jù)這些情況開展的后續(xù)實驗結(jié)果表明,較為合適的時延估計值為[4,100,12,10]。
圖2 時延估計Fig.2 Time delay estimation
2.3 階次選擇
在時延確定后,首先采用計算復(fù)雜度較低的線性ARX模型對4組多輸入、單輸出(MISO)過程進行描述,針對每組輸出變量,估計其對應(yīng)的MISO過程的數(shù)學(xué)模型,在一定范圍內(nèi)選擇使誤差準則最小的階次。為便于討論,針對每組MISO模型,在ARX模型階次選擇方面假設(shè)na=nb。
對于給定的過程數(shù)據(jù),ARX模型階次比ARMAX模型階次更高。采用FOE準則,將最高階次設(shè)定為n=50。逐漸增高ARX模型階次,檢測相關(guān)的FOE變化情況,得到圖3。由圖3可見,當階次逐漸升高,FOE會不斷下降,對于輸出變量3和輸出變量4,模型階次超過10后FOE下降并不明顯。權(quán)衡模型的復(fù)雜程度和準確性等因素后,將描述4組MISO過程的高階ARX模型階次依次選擇為45、38、6和4。模型結(jié)構(gòu)確定后再降階得到可應(yīng)用的等價模型,同時根據(jù)參數(shù)估計計算出理論模型參數(shù)。
圖3 FOE隨ARX模型階次變化情況Fig.3 FOE changes with the order of the ARX mode
2.4 參數(shù)估計
參數(shù)估計的目的是得到無偏的最小方差的模型估計值,良好的參數(shù)估計方法在閉環(huán)測試中應(yīng)保持一致性,并取得最小方差,而且在數(shù)值上穩(wěn)定可靠。描述4個MISO過程的高階ARX經(jīng)過降階得到4組低階ARMAX模型,每組模型具有7組輸入變量,意味著式(13)中多項式B(q)存在7個分量。用時序數(shù)據(jù)來估計ARMAX模型階次和多項式參數(shù),同時給出均方誤差(MSE)和擬合程度。MSE的值越小,說明預(yù)測模型描述實驗數(shù)據(jù)具有更好的精確度。描述4組MISO過程的ARMAX模型參數(shù)估計結(jié)果如表1所示。表1中參數(shù)nb實際具有7個分量,表示MISO過程的ARMAX模型有7組輸入。前面的假設(shè)認為7個分量相同,如nb=3則說明分量為nb={3 3 3 3 3 3 3}。為說明估計模型的穩(wěn)定性,同時對降階前的高階ARX模型和降階后的ARMAX模型進行階躍響應(yīng)測試,以說明降階前后兩種數(shù)學(xué)模型在描述過程動態(tài)的一致性。
表1 ARMAX模型估計結(jié)果
圖4中虛線和實線軌跡分別代表依據(jù)ARX和ARMAX模型得到的階躍響應(yīng),精餾塔裝置有7組輸入變量和4組輸出變量,共28組階躍響應(yīng)。從階躍曲線觀察,兩種線性差分模型下均給出穩(wěn)定的響應(yīng)結(jié)果,而且趨勢較為吻合,實際上計算得到的兩種模型是同一裝置的不同描述形式,某種程度具有等價性,相比之下ARMAX模型給出的響應(yīng)更為平緩。
根據(jù)響應(yīng)曲線,每組輸入變量對4組被控變量均存在不同程度的影響。這種現(xiàn)象反映出如原油冶煉這類多變量過程高度的耦合。
2.5 模型驗證
得到的模型必須經(jīng)過驗證和評估才能為預(yù)測控制算法提供支撐。模型驗證的目的就是確認實際過程與辨識模型匹配程度是否達到要求。為避免過擬合,辨識和驗證數(shù)據(jù)應(yīng)采取不同的量測信號,我們將原始數(shù)據(jù)(共3 977個采樣點)分為兩部分,前60%個采樣點用于模型辨識,后40%個采樣點作為驗證數(shù)據(jù)。依據(jù)辨識算法給出的模型預(yù)測多變量系統(tǒng)在輸入激勵下的輸出量,與真實輸出變量進行對比,擬合程度高則說明匹配程度高,模型驗證結(jié)果如圖5所示。
從圖5擬合效果看,線性ARMAX模型在預(yù)測4組MISO過程特性中不僅趨勢吻合,擬合程度也相當高,起到以簡馭繁的效果。對于預(yù)測控制而言,提前一步預(yù)報的精度滿足實際應(yīng)用,多步預(yù)報能更加精確地驗證模型,但是多步預(yù)報可能會有更大的誤差,在實際應(yīng)用中有特殊要求時,需要進行多步預(yù)報。
考慮到測試數(shù)據(jù)量的變化對辨識模型精度帶來的影響,本文將原始數(shù)據(jù)按照20%、40%、60%、80%、100%的比例進行分割,分別對應(yīng)796、1 591、2 386、3 182和3 977個采樣點,進行獨立的辨識實驗,實驗結(jié)果如表2所示。
圖4 階躍響應(yīng)測試Fig.4 Step response test
圖5 ARMAX模型驗證Fig.5 ARMAX model validation
原始數(shù)據(jù)分割比例/%模型辨識模型精度輸出變量1輸出變量2輸出變量3輸出變量420ARX0.15101.14510.07800.2284ARMAX0.12551.09790.06250.360740ARX0.19110.27500.07640.1818ARMAX0.19790.29790.06980.128360ARX0.15630.30810.06170.1673ARMAX0.16270.25270.06070.100080ARX0.13630.31870.06650.2361ARMAX0.11840.25840.06650.1893100ARX0.18770.38140.07140.2446ARMAX0.16300.32940.06940.2220
根據(jù)表2給出的信息,可以發(fā)現(xiàn)高階ARX模型與等價ARMAX模型在輸出誤差方面接近,反映出ARMAX模型在描述多變量過程動態(tài)特性方面與高階ARX模型具有接近的準確程度,說明降階過程并沒有犧牲過多的精度。此外,增加數(shù)據(jù)量將使得輸出誤差指標下降(圖6),證明有效觀測數(shù)據(jù)的引入能夠降低建模過程中的不確定性,但輸出誤差的降低是有限的,反映出接近最佳有效估計邊界。
由圖6可以看出當數(shù)據(jù)量下降到原始數(shù)據(jù)總量40%的水平時,辨識算法給出的等價ARMAX模型的輸出誤差上升,特別是對于輸出變量2和輸出變量4。要得到這些變量過程的較好模型,至少需要60%的原有數(shù)據(jù),即2 386個采樣點才能支撐整個辨識算法。再增加數(shù)據(jù)量,性能指標基本持平,增加工作量的同時又帶來信息冗余的問題。
圖6 不同數(shù)據(jù)量下ARMAX模型輸出誤差Fig.6 Output error of ARMAX model under different data
針對原油冶煉過程的精餾塔裝置,采用漸近法進行多變量系統(tǒng)辨識,選取ARX、ARMAX模型描述過程,取得符合控制要求精度的模型。同時考慮到觀測數(shù)據(jù)中信息量對辨識模型精度的影響,本文將原始數(shù)據(jù)截取為多部分,分別進行獨立的辨識實驗。結(jié)果顯示,新觀測數(shù)據(jù)的引入有助于降低關(guān)于模型參數(shù)的不確定性,但這種提升是有限的,輸出誤差指標存在著最低邊界。當數(shù)據(jù)量達到某一閾值時,辨識算法可實現(xiàn)有效估計,再增加數(shù)據(jù)無助于提升模型精度。為量化考察指定數(shù)據(jù)集下能達到的最低指標邊界,后期工作擬考慮從Cramér-Rao下界的角度來展開討論。
[1] BACKX T C,DAMEN A A H.Identification for the control of MIMO industrial processes[J].IEEE Transactions on Automatic Control,1991,37(7):980-986.
[2] 錢積新.非線性預(yù)測控制 [M].北京:科學(xué)出版社,2015.
[3] HANSEN F,FRANKLIN G,KOSUT R.Closed-loop identification via the fractional representation:Experiment design[C]//American Control Conference.Pittsburgh,PA,USA:Wiley,1989:1-23.
[4] 朱豫才.過程控制的多變量系統(tǒng)辨識[M].長沙:國防科技大學(xué)出版社,2005.
[5] LJUNG L.System Identification,Theory for the User[M].[s.l.]:Prentice Hall PTR,1999.
[6] LJUNG L.Asym ptotic variance expressions for identified black-box transfer-functionmodels[J].IEEE Transactions on Automatic Control,1985,30(9):834-844.
[7] ZHU Yucai.Black-box identification of mimo transfer functions:Asymptotic properties of prediction error models[J].Kluwer Academic,1993,3(4):357-373.
[9] 方崇智.過程辨識[M].北京:清華大學(xué)出版社,1988.
[10] RAO C R.Information and the accuracy attainable in the estimation of statistical parameters[J].Bulletin of the Calcutta Mathematical Society,1945,37(3):81-91.
[11] ZHU Yucai.Identification of Hammerstein models for control using ASYM[J].International Journal of Control,2010,73(18):1692-1702.
[12] ZHU Y.Distillation column identification for control using Wiener model[J].IEEE,1999,5(5):3462-3466.
[13] EYKHOFF P.System Identification:Parameter and State Estimation[M].USA:John Wiley & Sons,1974:129-158.
[14] AKAIKE H.A new look at the statistical model identification [J].IEEE Transactions on Automatic Control,1974.19(6):716-723.
Multi-variate Identification of Crude Oil Refining Processes Using ASYM Method
ZHANG Feng, ZHANG Wei, ZHANG Jian-ming
(Institute of Cyber-Systems and Control,Zhejiang University,Hangzhou 310027,China)
The main distillation column of a crude unit at a refinery is a strong-coupled multivariate system.The precision of identifiable models has close relationship with performance of control and ecomonic benefit.Considering the safety and efficiency,test should be performed under closed-loop situations.ASYM method has the potential to change multiple manipulated variables at the same time,providing identified models based on frequency domain methods.This paper uses ARMAX model to describe the main distillation column by ASYM method.As efficient measured data reduce the uncertainty in the process of parameter estimation,this paper quantitatively analyzes accuracy improvement brought by new measured data,using output error as performance index.
multi-variate system; system identification; ASYM method; performance analysis
1006-3080(2017)03-0397-07
10.14135/j.cnki.1006-3080.2017.03.016
2016-10-10
國家高技術(shù)研究發(fā)展計劃(863計劃)重大項目(2012AA041702);國家自然科學(xué)基金創(chuàng)新研究群體項目(61621002)
張 峰(1993-),男,碩士生,從事系統(tǒng)辨識的研究。
張建明,E-mail:jmzhang@iipc.zju.edu.cn
TP391.41
A