陳顯鋒,孫京誥,張海峰
(華東理工大學信息科學與工程學院,上海 200237;華東理工大學能源化工過程智能制造教育部重點實驗室,上海 200237)
出于提高化工生產(chǎn)效率的目的,復雜化工過程控制的經(jīng)濟性指標被愈發(fā)重視,且此類系統(tǒng)通常伴隨強非線性、工藝約束條件復雜等特性,導致控制系統(tǒng)設(shè)計極具挑戰(zhàn).為了應對這些挑戰(zhàn),非線性模型預測控制(nonlinear model predictive control,NMPC)利用過程數(shù)學模型,采用在線優(yōu)化的方式,將操作約束、系統(tǒng)非線性及經(jīng)濟性指標等多個方面同時考慮在內(nèi),以確定最優(yōu)控制輸入[1].然而,經(jīng)濟性指標達到最優(yōu)往往伴隨著系統(tǒng)狀態(tài)運行于可行域的邊界[2],進而導致系統(tǒng)性能顯著惡化,甚至在模型不確定性的影響下造成經(jīng)濟損失和安全問題[2-3].
考慮到復雜系統(tǒng)存在嚴格的狀態(tài)量及輸出量約束,額外的魯棒性裕度應被引入以抵消模型不確定性的影響.最大最小方法一定程度上增強了NMPC的魯棒性[3],該方法通過最小化最壞情況下的損失函數(shù)獲取最優(yōu)控制輸入軌跡,同時確??煽康募s束滿足,但優(yōu)化是以開環(huán)方式針對最壞情況執(zhí)行的,并未利用任何的反饋信息,通常導致解決方案較為保守.
在文獻[4]中作者認為不確定性的有效處理需要反饋模型,因此通過求解開環(huán)優(yōu)化問題計算的控制輸入軌跡并不是最優(yōu)的.Lucia等人提出的多階段非線性模型預測控制(multi-stage nonlinear model predictive control,MSNMPC)[5]提供了一種利用反饋信息閉環(huán)優(yōu)化的思路,該方法通過將預測時域上的不確定性傳播用離散的場景樹表示,然后針對不同的場景計算不同的控制輸入軌跡.即MSNMPC式明確考慮了新的信息在未來的時間步中將變得可用,并且新的最優(yōu)控制輸入將被重新計算.這一概念在隨機規(guī)劃中通常被稱為追索權(quán)[6],是不確定條件下最優(yōu)決策的一個重要性質(zhì).
對于各種應用場景,MSNMPC方法已被證明比傳統(tǒng)的最小-最大NMPC方法具有更低的保守性[7-9].且文獻[10]中給出了MSNMPC方法的穩(wěn)定性和遞歸可行性的嚴格證明.盡管如此,為了確保場景樹中考慮的所有場景都滿足魯棒性約束,MSNMPC提供的解決方案仍將是保守的.選擇場景樹中不確定性的離散實現(xiàn)場景的常用方法是使用不確定參數(shù)的最大值、最小值和標稱值的組合.如果不確定參數(shù)考慮的范圍很大,則場景樹建模的跨度也很大,對于時不變的不確定性參數(shù),該解決方案將是保守的,盡管與傳統(tǒng)的最小-最大NMPC相比不那么保守.
半間歇聚合反應過程具有非線性、不確定性等復雜特性,如何在確保約束滿足的條件下(如:溫度約束、安全約束等),提升過程的生產(chǎn)效率是目前研究的重點[11].不同批次反應過程之間相對獨立,不確定參數(shù)在每個新的批次中是未知的常數(shù)(或較小范圍波動),對于這類問題可能需要從自適應框架而不是魯棒框架來處理,典型的自適應控制框架涉及參數(shù)估計器的使用,該參數(shù)估計器在線調(diào)整不確定參數(shù),使得它漸近收斂于真實系統(tǒng)[12].受到文獻[13-14]中自適應魯棒方法的啟發(fā),本文采用更新不確定性特征,而非不確定性參數(shù)的方法實現(xiàn)低保守性的不確定非線性系統(tǒng)的魯棒預測控制.
對應于自適應魯棒方法估計不確定性參數(shù)的所有可能值的不確定集的處理方式,本文提出了一種基于遞歸貝葉斯概率方法更新場景樹,該方法在每個時間步計算場景樹中每個場景的模型預測信息與實際過程輸出測量信息的偏差,為不同場景計算和分配貝葉斯權(quán)重;然后利用權(quán)重信息以固定步長更新場景來縮小場景樹的跨度.即通過計算不同不確定性離散實現(xiàn)場景的貝葉斯權(quán)重,逐漸消除不確定性集合中發(fā)生概率較低的情況,使得場景樹的跨度隨著時間的推移而縮小,從而降低標準的MSNMPC方法的保守性.總而言之,這是一種基于可用度量和模型預測在線更新場景樹的直觀方法.
MSNMPC是一種閉環(huán)魯棒控制方法,如圖1所示,它將不確定性參數(shù)在時間上的演變過程通過場景樹的形式表示,該樹在每個預測步驟中針對不確定性極值的組合進行分支,其中不確定性可能是參數(shù)擾動或外界干擾.假設(shè)過程全狀態(tài)可測量或估計,由樹結(jié)構(gòu)可以看出未來的控制輸入可根據(jù)先前的狀態(tài)信息做出調(diào)整,在一定的范圍內(nèi)抵消不確定性的影響.場景樹結(jié)構(gòu)不一定代表時變的不確定性或干擾,但它反映了一個事實,如果不確定性在當前采樣時刻是未知的,那么在下一個采樣時刻也是未知的.因此一個隨時間變化的新的場景樹必須被考慮.
圖1 MSNMPC的場景樹結(jié)構(gòu)圖Fig.1 Scenario tree structure of MSNMPC
在場景樹設(shè)定下,假設(shè)具有不確定性的非線性系統(tǒng)的離散時間式如下所示:
由上式可知時間步k+1的狀態(tài)是關(guān)于前一時間步的狀態(tài),控制輸入以及不確定性的函數(shù).假設(shè)場景樹在所有節(jié)點上具有相同數(shù)量的分支,在時間步k由給出不確定性的S個不同可能值.Si表示從根節(jié)點x0到其中一個葉節(jié)點的第i個場景.構(gòu)建場景樹的合理策略是將不確定性極值的所有可能組合視為分支.隨著預測時域的增加,優(yōu)化問題的規(guī)模呈指數(shù)增加.通過假設(shè)不確定性在特定魯棒時域后保持不變,以縮小優(yōu)化問題的規(guī)模[5].這種簡化的主要思想是,由于NMPC的滾動時域特性,對未來較遠時刻非常精確地建模并不是關(guān)鍵,因為最優(yōu)控制輸入都將在下一個采樣時刻被重新計算.
在每個時間步k基于場景的多階段式的最優(yōu)控制問題可以表示為
其中:I表示場景樹所覆蓋的節(jié)點相對應的所有索引組合(j,k),S表示場景的數(shù)目,wi為每個場景Si對應的權(quán)重.表示對場景樹的每個節(jié)點的狀態(tài)和控制的非線性約束.為了正確地表示實時決策問題,控制輸入不能預測在相應決策點之后實現(xiàn)的不確定性的值,因此非預期約束式(2d)要求具有相同父節(jié)點的控制輸入也必相等,以便施加正確的控制器因果關(guān)系.對于半間歇聚合反應過程,帶有權(quán)重wi的每個場景Si的損失函數(shù)定義如下:
其中:Np為預測時域,損失函數(shù)由狀態(tài)變量跟蹤的懲罰項和控制變量變化的懲罰項組成,Q和R分別為對應的對角加權(quán)矩陣.
傳統(tǒng)的MSNMPC通常選擇不確定性參數(shù)極值的組合作為場景樹中不確定性傳播的場景.一旦確定了不確定性參數(shù)及其范圍,固定的場景樹也就隨之生成.如果不確定性參數(shù)變化范圍很大,場景樹的表示范圍也會很廣.但對于時不變的不確定性參數(shù),該解決方案顯然過于保守.
提出的在線場景更新的MSNMPC方法,其結(jié)構(gòu)如圖2所示.在每個時間步k中,通過求解式(2)中的優(yōu)化問題獲取最優(yōu)控制輸入應用于實際過程和S個場景的預測模型中,然后根據(jù)每個場景的模型預測信息y(k,j)和實際過程的測量信息yk計算場景偏差,利用場景偏差計算貝葉斯概率權(quán)重,根據(jù)權(quán)重信息以固定的步長在線更新場景以預測不確定性值的真實實現(xiàn),使場景樹建模逼近不確定性的真實值.
圖2 MSNMPC在線場景更新方法Fig.2 MSNMPC online scenario update method
在半間歇聚合反應過程中,不確定性參數(shù)在新的批次中是未知的,如果僅考慮傳統(tǒng)的組合方案,可能導致該方法趨于保守,性能退化.因此需要考慮一種自適應的在線場景更新方法,在每個時間步k中,依據(jù)已經(jīng)獲取的信息推算該場景對應的不確定性值與實際過程中不確定性真實值的差距,采用自適應機制更新場景樹中可能性較低的場景來縮小場景樹的跨度,使控制器性能能夠隨著時間的推移逐漸提高.
對于實際的不確定性半間歇聚合反應過程,首先確定不確定參數(shù)的數(shù)量及相應的取值范圍,構(gòu)造初始不確定性集.然后利用在線場景更新的MSNMPC算法縮小場景樹對應的不確定性集D.該算法的具體實施步驟如下所述:
步驟1初始化每個場景的權(quán)重P(0,j)=1/S,j∈{1,···,S},其中S為場景樹的總場景數(shù),初始化不確定性集合D;
步驟2計算當前時間步k中S個場景對應的模型預測值y(k,j)
然后根據(jù)當前時間步k的模型預測值y(k,j)和過程測量值yk和計算殘差ε(k,j),其式描述為
步驟3利用殘差信息ε(k,j)和前一時間步的每個場景權(quán)重P(k?1,j)計算當前時間步k的貝葉斯概率權(quán)重P(k,j),其式描述為
其中K是一個加權(quán)矩陣,通常選擇為對角線,可以看作是殘差協(xié)方差的倒數(shù):
步驟4根據(jù)當前時間步k的每個場景的貝葉斯概率權(quán)重P(k,j),找到S個場景中最大的權(quán)重對應的場景pmax和最小的權(quán)重對應的場景pmin:
步驟5通過將最不可能的場景pmin移向最有可能的場景pmax來更新pmin和Dk+1.如下式表示了場景樹的更新過程:
其中β為自適應步長,可以控制不確定性集縮減的速度,應該保持在一個較小范圍;
步驟6在下一個時間步k+1,根據(jù)新的不確定集合構(gòu)建的場景樹求解MSNMPC最優(yōu)控制問題獲得最優(yōu)控制動作:
步驟7重新初始化每個場景的初始權(quán)重P(0,j)=1/S,j ∈{1,···,S};
步驟8重復步驟2-7,直至批次反應過程結(jié)束.
本文以實際工業(yè)半間歇聚合反應器模型(如圖3所示)為研究對象,該系統(tǒng)由一個進料單體的反應器組成,反應器配有一個夾套和一個外部熱交換器,它們可以用來控制反應釜內(nèi)溫度.根據(jù)物料守恒和能量守恒,該過程模型由8個常微分方程組成:
圖3 半間歇聚合反應工藝圖Fig.3 Semi-batch polymerization process diagram
基于上節(jié)中的半間歇聚合反應模型,考慮的不確定性參數(shù)為反應熱焓ΔHR和反應速率k0,它們的值在標稱值的±30%內(nèi)變化,因此ΔHR的不確定范圍為[665,1235],k0的不確定范圍為[4.9,9.1].不確定性值在每個新的批次中是時不變且無法測量估計的.場景樹中考慮不確定性的離散實現(xiàn)場景數(shù)為S=5,對應于兩個不確定性參數(shù)的最小值和最大值的組合.考慮的預測時域為Np=15,魯棒時域為Nr=1,采樣時間tstep=50 s.
考慮每個場景Si的經(jīng)濟型損失函數(shù)如下:
其中:q,r1,r2和r3分別為10000,0.004,0.02和0.004.本文求解過程首先采用有限元正交配置方法進行離散化處理,然后利用CasADi[15]工具包中的IPOPT求解器解決由此產(chǎn)生的非線性規(guī)劃問題.
首先,將提出的在線場景更新的MSNMPC方法與標準的NMPC方法和標準的MSNMPC固定場景樹方法應用于半間歇聚合反應模型中,其中在線場景更新的MSNMPC方法考慮的更新步長設(shè)置為β=0.05.在該仿真批次中不確定性參數(shù)考慮的真實值為ΔHR=950 kJ/kg,k0=7.仿真結(jié)果如圖4所示.可以看出,標準NMPC(黑色點線)最先完成規(guī)定產(chǎn)量的產(chǎn)品,但由于未考慮不確定性的影響違反了反應器內(nèi)溫度TR的約束.而另兩種方法由于將不確定性考慮到了優(yōu)化問題中,因此可以很好的將反應器內(nèi)溫度TR和安全溫度Tadiab控制在約束范圍內(nèi).并且,在線場景更新的MSNMPC方法(綠色點虛線)的批次反應時間為1.75 h相比于標準MSNMPC(藍色虛線)的1.861 h縮短了0.111 h,批次生產(chǎn)效率得到提升.
圖4 不同方法的單批次反應仿真對比圖Fig.4 Single batch reaction simulation comparison chart of different methods
場景樹的更新過程如圖5所示.由于控制器的最優(yōu)控制問題是所有場景的綜合損失函數(shù)最小,隨著場景樹的跨度逐漸縮小逼近不確定性的真實實現(xiàn),優(yōu)化問題求解的控制輸入也在逐步逼近最優(yōu)軌跡,控制器性能得到提升,從而縮短批次反應時間.
圖5 場景樹的在線場景更新過程Fig.5 Online scenario update process of scenario tree
為了驗證在線場景更新的MSNMPC方法的通用性,隨機選取100個不同批次的不確定性值進行測試(圖6).仿真結(jié)果如圖7所示,7(a)和7(b)分別表示100個不同批次的不確定性值,7(c)為在線場景更新的MSNMPC方法與標準MSNMPC方法在對應批次過程的反應時間對比圖.可以看出在線場景更新MSNMPC方法對應的批次反應時間更短.
圖6 100個不同批次的不確定性真實實現(xiàn)Fig.6 Real realization of uncertainty in 100 different batches
圖7 100個不同批次過程仿真對比Fig.7 Comparison of 100 different batch process simulations
由表3的批次反應時間對比數(shù)據(jù)可知,標準NMPC因未考慮不確定性因素,在許多不確定性的真實實現(xiàn)過程中會出現(xiàn)大幅度的違反約束,導致控制不可行.而在線場景更新的MSNMPC方法與標準MSNMPC方法對于不同場景均可滿足約束要求,完成反應過程,且前者在性能上更優(yōu).對于100個不同批次反應過程,標準MSNMPC方法的平均批次時間為1.961 h,而在線場景更新的MSNMPC 方法僅為1.807 h,縮短了0.154 h,進一步說明本文提出方法的有效性和優(yōu)越性.
表3 不同批次的反應時間對比Table 3 Reaction time comparison of different batches
為了更好理解場景更新過程,選取圖6中?標記的3個不同批次過程,其場景更新過程如圖8所示.
圖8 不同批次過程的場景更新過程Fig.8 Scenario update process of different batches
本文基于MSNMPC的場景樹框架,針對時不變不確定性參數(shù)不能直接估計的情況下場景樹生成的合理性問題,提出一種基于貝葉斯概率加權(quán)的在線場景更新的MSNMPC方法,通過計算每個場景的模型預測信息和狀態(tài)輸出測量信息的偏差,為不同場景計算和分配貝葉斯概率權(quán)重,然后在線更新場景樹中不確定性的離散實現(xiàn)場景,縮小場景樹的跨度,降低了標準MSNMPC方法的保守性.通過對半間歇聚合反應模型的仿真結(jié)果表明,與標準MSNMPC方法相比,在線場景更新的MSNMPC方法在確保約束滿足的條件下,針對多個不同批次的不確定性真實實現(xiàn)過程,具有更好的控制性能,更短的批次反應時間,從而提升提升了過程的生產(chǎn)效率.