馬樂樂 劉向杰
現(xiàn)代過程工業(yè)中存在著一類間歇過程[1],如半導(dǎo)體加工、制藥、注塑、發(fā)酵等.間歇過程通常具有重復(fù)特性,且對(duì)跟蹤精度要求較高,是典型的非連續(xù)操作.其控制任務(wù)是在每個(gè)生產(chǎn)批次內(nèi)跟蹤給定的參考軌跡[2].迭代學(xué)習(xí)控制(Iterative learning control,ILC)能夠利用過去批次的信息進(jìn)行優(yōu)化學(xué)習(xí),不斷調(diào)整控制輸入軌跡,逐步提高跟蹤性能,實(shí)現(xiàn)對(duì)參考軌跡的高精度跟蹤,因此被廣泛應(yīng)用于間歇過程控制中[3].但是由于ILC 是典型的開環(huán)控制,因此不能保證控制系統(tǒng)的時(shí)域穩(wěn)定性,難以處理實(shí)時(shí)干擾.模型預(yù)測控制(Model predictive control,MPC)作為先進(jìn)過程控制技術(shù)[4],不僅廣泛應(yīng)用于工業(yè)過程的優(yōu)化控制[5?6],同時(shí)也成功應(yīng)用于軌跡跟蹤控制[7].它通過預(yù)測未來的系統(tǒng)狀態(tài)及輸出,進(jìn)行滾動(dòng)時(shí)域優(yōu)化,能及時(shí)處理實(shí)時(shí)干擾,保證時(shí)域跟蹤性能及閉環(huán)系統(tǒng)穩(wěn)定性,彌補(bǔ)ILC 的不足.迭代學(xué)習(xí)模型預(yù)測控制(Model predictive iterative learning control,MPILC)結(jié)合了MPC 與ILC 的優(yōu)點(diǎn),因此成為控制間歇過程的有效方法.
早期的MPILC 算法大多基于輸入輸出模型,如受控自回歸積分滑動(dòng)平均(CARIMA)模型[8?9],脈沖響應(yīng)模型[10].而近年來基于狀態(tài)空間模型的MPILC 算法研究受到了更多關(guān)注,研究對(duì)象包括線性定常狀態(tài)空間模型[11]、帶干擾項(xiàng)的狀態(tài)空間模型[12]以及含不確定性的狀態(tài)空間模型[13].其控制器設(shè)計(jì)通常需要進(jìn)行狀態(tài)增廣以構(gòu)造二維誤差模型.為加強(qiáng)控制器魯棒性,很多學(xué)者在此基礎(chǔ)上提出控制器結(jié)構(gòu)改進(jìn)算法,如構(gòu)造分段優(yōu)化[14],改善學(xué)習(xí)機(jī)制[15].
典型的間歇過程通常具有強(qiáng)非線性,而現(xiàn)有的MPILC 算法大都是針對(duì)線性系統(tǒng)構(gòu)造的.文獻(xiàn)[14?15]將原非線性系統(tǒng)在工作點(diǎn)簡單線性化,文獻(xiàn)[10]沿參考軌跡進(jìn)行線性化.由線性化帶來的模型失配問題會(huì)在一定程度上影響時(shí)域跟蹤性能以及迭代學(xué)習(xí)速度,這在實(shí)際生產(chǎn)上將造成原料浪費(fèi)以及經(jīng)濟(jì)效率下降.近年來許多學(xué)者在MPILC 研究中通過各種建模手段來近似非線性系統(tǒng),包括T-S 模糊建模[16]、神經(jīng)網(wǎng)絡(luò)建模[17]、數(shù)據(jù)驅(qū)動(dòng)建模[18]等.但是這些方法需要大量過程數(shù)據(jù)的支持,以及極其復(fù)雜的調(diào)參、學(xué)習(xí)過程才能建立較為精確的模型.
線性參變(Linear parameter varying,LPV)蘊(yùn)含技術(shù)是處理復(fù)雜非線性的有效手段,已被廣泛應(yīng)用于非線性模型預(yù)測中[19].原非線性系統(tǒng)在工作區(qū)間的動(dòng)態(tài)特性可以包含在由LPV 系統(tǒng)構(gòu)成的多胞里.因此,只要保證基于LPV 模型的控制系統(tǒng)的穩(wěn)定,就能夠保證非線性控制系統(tǒng)的穩(wěn)定[20].由于LPV 模型中存在的參數(shù)不確定性,其控制求解一般通過線性矩陣不等式(Linear matrix inequality,LMI)約束下的目標(biāo)函數(shù)優(yōu)化來實(shí)現(xiàn).
間歇過程的參考軌跡會(huì)由于不同的產(chǎn)品規(guī)格、生產(chǎn)效率以及外在干擾而發(fā)生改變.比如半導(dǎo)體制造中的蝕刻系統(tǒng)必須跟蹤不同的操作軌跡來生產(chǎn)不同規(guī)格的晶片[21].而一旦參考軌跡發(fā)生變化,經(jīng)典迭代預(yù)測控制需要重新進(jìn)行初始化,并經(jīng)歷多個(gè)批次的學(xué)習(xí)來跟蹤新軌跡[10],適應(yīng)能力較差.近年來許多學(xué)者提出改進(jìn)的自適應(yīng)ILC 算法來解決變參考軌跡跟蹤控制問題.文獻(xiàn)[21]針對(duì)隨機(jī)系統(tǒng)變軌跡跟蹤問題,提出兩種自適應(yīng)ILC 策略,一是在控制器設(shè)計(jì)中選擇當(dāng)前批次的輸出軌跡與下一批次的參考軌跡的差值作為新的狀態(tài)變量,另一種是在每一個(gè)批次的末尾利用卡爾曼濾波器重新進(jìn)行系統(tǒng)辨識(shí);文獻(xiàn)[22]針對(duì)離散非線性系統(tǒng),設(shè)計(jì)模糊自適應(yīng)ILC 控制器,通過不斷更新模糊參數(shù)來近似變參考軌跡下的系統(tǒng)動(dòng)態(tài);文獻(xiàn)[23]設(shè)計(jì)基于數(shù)據(jù)驅(qū)動(dòng)的自適應(yīng)ILC 控制器,引入未來批次的參考軌跡作為反饋,并將過去批次的參考軌跡作為前饋以實(shí)現(xiàn)對(duì)變參考軌跡的跟蹤.這些基于ILC 的控制策略通常要求已知所有采樣時(shí)刻上的參考軌跡變化量,并且由于算法內(nèi)缺少預(yù)測環(huán)節(jié)導(dǎo)致了跟蹤性能和學(xué)習(xí)效率的下降.針對(duì)該問題,可將參考軌跡變化量視為迭代域中存在的有界擾動(dòng),構(gòu)造限制參考軌跡變化量對(duì)系統(tǒng)控制性能影響的H∞約束.這樣只要在每個(gè)采樣時(shí)刻的優(yōu)化中滿足此H∞約束,就可有效抑制變參考軌跡帶來的跟蹤誤差波動(dòng),且只需已知下一采樣時(shí)刻的參考軌跡變化量.H∞控制[24]可與MPILC 算法有效結(jié)合,利用預(yù)測控制的滾動(dòng)時(shí)域優(yōu)化提高時(shí)域跟蹤性能,從而加快學(xué)習(xí)速度.
本文提出一種基于LPV 模型的魯棒迭代學(xué)習(xí)模型預(yù)測控制(Robust model predictive iterative learning control,RMPILC)算法,實(shí)現(xiàn)間歇過程對(duì)變參考軌跡的跟蹤.采用LPV 模型描述非線性系統(tǒng)動(dòng)態(tài)特性,并通過狀態(tài)增廣建立二維誤差模型.為保證變參考軌跡下的跟蹤性能,引入H∞約束條件.將變軌跡跟蹤問題轉(zhuǎn)化為LMI 約束下的凸優(yōu)化問題.通過針對(duì)數(shù)值例子以及CSTR 系統(tǒng)的仿真驗(yàn)證了所提出算法的有效性.
假設(shè)非線性間歇系統(tǒng)由下式表示:
其中,x ∈Rnx是狀態(tài)變量,u ∈Rnu是控制輸入,y ∈Rny為輸出變量.t ∈(0,N],N為批次長度.
假設(shè)對(duì)任意x(t)、u(t)(t ∈(0,N])存在矩陣
滿足
那么,非線性系統(tǒng)(1)的動(dòng)態(tài)特性可由LPV 系統(tǒng)描述:
即任何關(guān)于LPV 系統(tǒng)(2)的性質(zhì)適用于非線性系統(tǒng)(1).
間歇過程的LPV 建模問題已經(jīng)得到了廣泛關(guān)注[25].其中,選擇合適的參數(shù)至關(guān)重要.對(duì)于簡單非線性系統(tǒng),可以通過直接計(jì)算非線性項(xiàng)的上下界確定.若被控系統(tǒng)的非線性比較復(fù)雜,可以基于系統(tǒng)平衡點(diǎn),采用數(shù)學(xué)變換的方法獲得合適的表達(dá)式[26].
建立相鄰迭代次序之間的動(dòng)態(tài)關(guān)系,得到
定義輸出參考軌跡為,那么跟蹤誤差可以定義為
將式(4)代入式(3),得到沿迭代軸的增廣迭代誤差狀態(tài)空間模型:
迭代次序跟蹤誤差的變化量?ek(t).則在第k次迭代中,為了將跟蹤誤差ek(t)控制到0,的參考軌跡應(yīng)為
由第1.2 節(jié)可知,系統(tǒng)(5)的輸出為相鄰
定義:
聯(lián)立式(5)和式(6),得到同時(shí)包含迭代域和時(shí)域動(dòng)態(tài)特性的二維增廣誤差模型
注1.Rk(t+1)包含了參考軌跡變化量,為已知有界時(shí)變量,與狀態(tài)變量、控制輸入變量均無關(guān),可以看作迭代域上的有界外部干擾.
注2.模型(7)與典型的二維Rosser 模型[27]不同,它將在同一個(gè)狀態(tài)方程中建立時(shí)域與迭代域上動(dòng)態(tài)關(guān)系,其中都是同時(shí)包含時(shí)域及迭代域信息的二維變量.
因此,系統(tǒng)(1)的軌跡跟蹤問題可以轉(zhuǎn)化為系統(tǒng)(7)的零點(diǎn)跟蹤問題.其控制任務(wù)包括:
2)限制參考軌跡變化量Rk(t+1)對(duì)控制性能的影響;
3)防止控制輸入波動(dòng)過大.
根據(jù)控制任務(wù)1)和3),結(jié)合魯棒H∞控制,定義控制性能指標(biāo)zk(t)∈Rnx+2ny+nu
mi(i=1,2,···,nx+2ny),nj(j=1,2,···,nu)為可調(diào)權(quán)重系數(shù).顯然,目標(biāo)函數(shù)可表述為zk(t)的二次型:
為實(shí)現(xiàn)控制任務(wù)2),引入H∞范數(shù)
設(shè)置H∞性能指標(biāo)
其中,ε>0 為給定的H∞性能上界.不等式(11)表示參考軌跡變化量Rk(t+1)對(duì)跟蹤性能指標(biāo)zk(t)的影響被限制在由ε定義的范圍內(nèi).
因此,滿足以上三項(xiàng)控制任務(wù)的優(yōu)化問題可以描述為:
滿足式(8)和式(12).
定義狀態(tài)反饋控制律
為表達(dá)簡潔,推導(dǎo)過程的書寫省略θ.考慮二次型函數(shù)可得
將式(14)從i=0 累加至i=∞,可得
聯(lián)立式(16)和(17),目標(biāo)函數(shù)(9)有以下形式
引理1.當(dāng)且僅當(dāng)Φ<0,能夠滿足H∞性能指標(biāo)(11).
證明.在式(14)兩端同時(shí)加上可得
若Φ<0,則有
式(22)與H∞約束(12)等價(jià).
在Φ<0 的條件下,可以得到目標(biāo)函數(shù)的上界
根據(jù)式 (7)中Rk(t+1)的定義可知,為有界值.設(shè)
聯(lián)立式(22)和(23),得
滿足
引理2.若優(yōu)化問題(25)在當(dāng)前時(shí)刻可行,當(dāng)滿足不等式
時(shí),由RMPILC 算法控制的閉環(huán)系統(tǒng)是魯棒穩(wěn)定的.
證明.聯(lián)立式(14)及條件(26),可得
將式(28)從i=0 到i=p ?1(p ∈[1,∞))進(jìn)行累加,可得
聯(lián)立式(23)、(26)和(28),可以推出
因此,對(duì)于任意未來時(shí)刻t+p,其狀態(tài)屬于不變集??xk:
注3.若參考輸出保持不變,即Rk(t+1)=0,那么RMPILC 控制下的閉環(huán)系統(tǒng)是Lyapunov 意義下穩(wěn)定的.
證明.根據(jù)式(27),若Rk(t+1)=0,能推出
為獲得滿足在魯棒穩(wěn)定條件(26)下優(yōu)化問題(25)的最優(yōu)解,將其轉(zhuǎn)化為線性矩陣不等式的形式.
引理3.滿足約束(25b)、(25c)及魯棒穩(wěn)定條件(26)的狀態(tài)反饋矩陣Fk(t)可通過Fk(t)=Y Q?1計(jì)算得到,其中Q=γP?1,Y為下述LMI約束下優(yōu)化問題的解:
對(duì)所有q=1,2,···,l,滿足
證明.采用Schur 補(bǔ)定理[28],式(25c)等價(jià)于
分別左乘右乘diag{P?1,I,I,I,I},得
將P=γQ?1,Fk(t)=Y Q?1代入式(33),式(31b)可以被推出.
注意式(26)為式(25b)的充分條件,也就是說只需要要滿足式(26),式(25b)也能被滿足.將P=γQ?1代入式(27),利用Schur 補(bǔ)定理,即可得到矩陣不等式(31c).
根據(jù)優(yōu)化得到的Fk(t),通過下式計(jì)算控制輸入uk(t):
其中,?uk(t ?1)、uk?1(t)為當(dāng)前批次當(dāng)前時(shí)刻的已知量.等于當(dāng)前狀態(tài)
間歇過程中需要考慮的控制輸入約束包括uk(t)、?uk(t)和δuk(t),通常表述為
推導(dǎo)uk(t),?uk(t),δuk(t)與δ?uk(t)的關(guān)系
從式(36)可以看出,uk(t),?uk(t),δuk(t)都可以表示成δ?uk(t)與其他已知量的和的形式.將其表述為以下通式
其中,uc是被約束量,um是已知量,H是用于選擇δ?uk(t)中某一控制輸入的向量.
式(35)中的約束條件可以統(tǒng)一表述為
其中,μ代表約束上界.
結(jié)合式(37),對(duì)不等式(38)進(jìn)行放縮
因此控制輸入約束下的魯棒迭代預(yù)測控制優(yōu)化問題可以描述為:
滿足式(31b),式(31c),式(40).
MPILC 控制系統(tǒng)的收斂性指的是當(dāng)?shù)螖?shù)趨近于無窮時(shí),跟蹤誤差收斂到零,即對(duì)于任意t ∈[0,N],當(dāng)k →∞時(shí),ek(t)→0.文獻(xiàn)[29]在xk?1(N)=xk(0)的前提下,證明了經(jīng)典MPILC算法的收斂性.而近年研究中,設(shè)計(jì)附加條件使成為保證收斂性更為常用的方法[9,11].在本文提出的RMPILC 算法中,基于包含參考軌跡變化量的LPV 模型(7),可以轉(zhuǎn)化為有關(guān)增廣狀態(tài)T的約束,將其加入到實(shí)時(shí)優(yōu)化中,就可以保證原非線性系統(tǒng)在RMPILC控制下沿迭代軸的收斂性.
首先,提出以下符合實(shí)際過程情況的假設(shè):
1)優(yōu)化問題(31)在初始時(shí)刻可行;
2)對(duì)于t ∈[0,N ?1],存在滿足約束式(31b),式(31c),式(40)的控制序列uk(t)令跟蹤誤差ek(t+1)等于0;
3)在t時(shí)刻,已知t+1 時(shí)刻的參考軌跡變化量.
定理1.若在每個(gè)采樣時(shí)刻的優(yōu)化中,對(duì)于q=1,2,···,l,j=1,2,···,ny滿足LMI 約束
證明.在當(dāng)前時(shí)刻t,為保證下一時(shí)刻的跟蹤誤差沿迭代軸收斂,即-,應(yīng)滿足以下不等式條件:
其中,j=1,2,···,ny.
根據(jù)式(5)有
聯(lián)立式(5)和(6)得
聯(lián)立式(43)、(44)和(45)可以得到
為不等式(43)的充分條件.(46)可以轉(zhuǎn)化為系統(tǒng)(7)的狀態(tài)約束:
本節(jié)設(shè)計(jì)兩組仿真實(shí)驗(yàn)以驗(yàn)證所提出的RMPILC 在處理變軌跡跟蹤問題方面的有效性.仿真1 針對(duì)非線性數(shù)值系統(tǒng),側(cè)重于對(duì)算法的理論分析和驗(yàn)證;仿真2 針對(duì)典型的間歇CSTR 系統(tǒng),側(cè)重于對(duì)RMPILC 的實(shí)際應(yīng)用效果檢驗(yàn).為進(jìn)行對(duì)比,同時(shí)設(shè)計(jì)經(jīng)典MPILC 算法的仿真實(shí)驗(yàn),其預(yù)測模型為:
gi,j ∈Rny(i)×nu(j)為j時(shí)刻施加的單位脈沖信號(hào)輸入在i時(shí)刻的脈沖響應(yīng)矩陣.通常矩陣G可以通過沿參考軌跡進(jìn)行線性化得到.經(jīng)典MPILC 算法的目標(biāo)函數(shù)為:
其中,Q1和R1為權(quán)重系數(shù)矩陣.
考慮如下非線性數(shù)值系統(tǒng)
控制輸入約束為
根據(jù)式(7),可以得到
仿真設(shè)置兩種參考軌跡如圖1 所示.第1 批次到第4 批次的目標(biāo)參考軌跡為yr1;從第5 批次開始,目標(biāo)參考軌跡變?yōu)閥r2.仿真時(shí)間為10 分鐘,采樣時(shí)間為0.025 分鐘.批次長度為400.第1 批次的控制輸入為零向量.H∞性能上界ε設(shè)為10.初始狀態(tài)為x(0)=[0,0]T.收斂條件(42)作為每次優(yōu)化的約束,保證跟蹤誤差的收斂性,其中a=0.9.權(quán)重矩陣取為
圖1 參考軌跡yr1, yr2Fig.1 The reference trajectories yr1, yr2
在每個(gè)采樣時(shí)刻,通過求解約束(42)下的LMI優(yōu)化問題(41)得到變量Y,Q,繼而通過式Fk(t)=Y Q?1計(jì)算當(dāng)前時(shí)刻的狀態(tài)反饋矩陣Fk(t).仿真分析中選擇參考軌跡轉(zhuǎn)折點(diǎn)第61 個(gè)采樣時(shí)刻來比較變軌跡前后的狀態(tài)反饋矩陣變化,其結(jié)果如表1 所示.圖2 和3 為RMPILC 的跟蹤曲線及對(duì)應(yīng)的控制輸入曲線.
在經(jīng)典MPILC 仿真中,設(shè)置Q1=I400×400,R1=0.00015I20×20,m=20.其跟蹤曲線如圖4 所示.
表1 Fk(t)優(yōu)化值Table 1 Optimized feedback control law
圖2 RMPILC 控制下參考軌跡跟蹤曲線Fig.2 The tracking trajectories under RMPILC
圖3 RMPILC 控制下控制輸入軌跡Fig.3 The control input trajectory under RMPILC
圖4 MPILC 控制下參考軌跡跟蹤曲線Fig.4 The tracking trajectories under MPILC
比較圖2 和圖4,在參考軌跡保持不變的第1~第4 批次,RMPILC 從第2 批次就能夠精確跟蹤yr1,而MPILC 直到第4 批次才能較好地跟蹤yr1.這是因?yàn)镽MPILC 采用了LPV 模型來描述原系統(tǒng)的非線性特性,避免出現(xiàn)模型失配問題,從而獲得了更快的收斂速度;在參考軌跡變?yōu)閥r2的第5~第8 批次,RMPILC 能快速跟蹤yr2,而MPILC難以及時(shí)適應(yīng)變參考軌跡,需要經(jīng)過幾次迭代才能達(dá)到較好的跟蹤效果.因而,RMPILC 采用H∞控制有效抑制了變參考軌跡的影響.
圖5 為RMPILC 和經(jīng)典MPILC 控制下各批次跟蹤誤差均方差(Main square error,MSE)的變化情況.RMPILC 控制下MSE 沿迭代軸收斂到零,且在參考軌跡變化的第5 批次,沒有明顯波動(dòng),保持收斂趨勢,而MPILC 控制下MSE 出現(xiàn)較大波動(dòng).這證明了RMPILC 在變參考軌跡下能夠保證跟蹤誤差沿迭代軸收斂.
圖5 MPILC 和RMPILC 控制下MSE 隨批次變化情況Fig.5 The MSE along batches under MPILC and RMPILC
圖6 RMPILC 控制下第5 批次當(dāng)ε=5.8、ε=10 和ε=15 時(shí)的跟蹤曲線Fig.6 The tracking trajectories in the fifth batch when ε=5.8,10,15
RMPILC 的控制性能與參考軌跡變化程度以及H∞性能上界ε的大小有較大關(guān)系.由式(11)可知,ε越小越有利于增強(qiáng)抗干擾能力.而式(26)表明ε減小將導(dǎo)致可行域的縮小.當(dāng)可行域縮小到不能包含當(dāng)前狀態(tài)時(shí),優(yōu)化問題將無解.因此,在選擇ε時(shí),要根據(jù)實(shí)際需要權(quán)衡變軌跡適應(yīng)能力和可行性問題.對(duì)于系統(tǒng)(52)能夠保證可行性的最小ε值為5.8.圖6 為參考軌跡發(fā)生變化的第5 批次中,RMPILC 在ε=5.8、ε=10 和ε=15 時(shí)的跟蹤情況,表明隨著ε增大,RMPILC 跟蹤性能下降.圖7 為x(0)=[0.01,0.05]T,ε分別取值5.8、10 和15時(shí)不變集??xk={x|xTQ?1x ≤1}在原狀態(tài)空間的象集.由于不變集的大小能夠反映可行域的大小,因此圖7 表明初始可行域隨ε減小而縮小.
圖7 RMPILC 控制下ε=5.8、ε=10 和ε=15 時(shí)的不變集 在原狀態(tài)空間的象集Fig.7 The image set of when ε=5.8,10,15
連續(xù)攪拌反應(yīng)釜系統(tǒng)中進(jìn)行恒定體積、放熱、不可逆化學(xué)反應(yīng)A →B.其控制任務(wù)為重復(fù)跟蹤給定的反應(yīng)溫度軌跡,且生成物B的產(chǎn)品質(zhì)量很大程度依賴于跟蹤精度.因此,采用MPILC 方法控制CSTR 系統(tǒng)能適應(yīng)其生產(chǎn)過程的重復(fù)性,并且提高產(chǎn)品質(zhì)量.
CSTR 系統(tǒng)具有以下非線性微分方程描述[31]:
其中,反應(yīng)溫度T(K)為被控量,冷卻劑溫度Tc(K)為控制輸入.其他參數(shù)的物理意義和取值見文獻(xiàn)[31].
在間歇反應(yīng)器控制中,反應(yīng)溫度T的參考軌跡可能會(huì)由于調(diào)整進(jìn)料濃度CA、啟動(dòng)速度、批次時(shí)間長度等發(fā)生變化.為了驗(yàn)證RMPILC 在適應(yīng)頻繁變化的參考軌跡的能力,在仿真中設(shè)置三種不同的參考軌跡,如圖8 所示,包括常規(guī)軌跡yr1、慢啟動(dòng)軌跡yr2以及快啟動(dòng)軌跡yr3.yr3中T上升較快,有利于提高產(chǎn)量;yr2中T上升較慢,后續(xù)反應(yīng)更加平穩(wěn),易于控制.在實(shí)際生產(chǎn)中可以根據(jù)不同的生產(chǎn)需求選擇不同的參考軌跡.
根據(jù)文獻(xiàn)[32]介紹的替換法,非線性系統(tǒng)(54)可以表述為如式(2)的LPV 模型,過程如下:
首先,計(jì)算系統(tǒng)(54)的平衡點(diǎn):
圖8 CSTR 反應(yīng)溫度T 參考軌跡Fig.8 The reference trajectories of CSTR reaction temperature T
選擇LPV 模型(2)中的參數(shù)θ為
那么系統(tǒng)(55)可以由如式(2)的LPV 模型描述,其多胞形的各頂點(diǎn)為
仿真基于LPV 模型設(shè)計(jì)控制律,并將優(yōu)化得到的控制輸入施加都原非線性系統(tǒng)(54)中.
控制輸入Tc的約束如下:
仿真時(shí)間為12 分鐘(min),采樣時(shí)間為0.03分鐘(min),批次長度為400.設(shè)置初始參考軌跡為yr1,在第6 批次、第7 批次分別變?yōu)閥r2、yr3,在第8 批次變回yr1.批次1 的初始控制輸入為幅度為330 K 的階躍信號(hào).初始狀態(tài)為[CA,T]T=[0.7 mol/L,340 K]T.H∞性能上界選為ε=20.權(quán)重系數(shù)矩陣選取同仿真1.同樣地,收斂條件(42)在每次優(yōu)化中作為約束(a=0.9),狀態(tài)反饋矩陣Fk(t)由Fk(t)=Y Q?1計(jì)算得到,各批次Fk(200)的優(yōu)化值如表2 所示.
表2 Fk(t)優(yōu)化值Table 2 Optimized feedback control law
在經(jīng)典MPILC 仿真中,設(shè)置m=10,Q1=I400×400,R1=I10×10.圖9 和-圖11為RMPILC 和MPILC 控制下的跟蹤曲線.相應(yīng)的RMPILC 控制輸入如圖10 所示.可以看出RMPILC 從第2 批次開始就可以準(zhǔn)確跟蹤yr1,且在批次6~8 能夠及時(shí)跟蹤變化軌跡.而MPILC 直至批次5 才能跟蹤上yr1,且在批次6~8 不能適應(yīng)參考軌跡變化.因此與經(jīng)典MPILC 相比,基于LPV 模型的RMPILC 快速跟蹤變參考軌跡,有利于提高CSTR 的生產(chǎn)效率.
圖9 RMPILC 控制下反應(yīng)溫度T 參考軌跡跟蹤曲線Fig.9 The tracking trajectories for T under RMPILC control
圖10 RMPILC 控制下控制輸入Tc 軌跡Fig.10 The trajectories of control input Tc under RMPILC
圖12 為變軌跡下RMPILC 和MPILC 仿真中MSE 隨迭代次數(shù)的變化情況.顯然,變參考軌跡下RMPILC 的跟蹤誤差沿迭代軸收斂,而MPILC 的跟蹤誤差發(fā)生較大波動(dòng),會(huì)導(dǎo)致產(chǎn)品質(zhì)量下降.
圖11 MPILC 控制下反應(yīng)溫度跟蹤曲線Fig.11 The tracking trajectories for T under MPILC
圖12 RMPILC、MPILC 控制下MSE 隨批次變化情況Fig.12 The MSE along batches under RMPILC and MPILC
本文針對(duì)具有重復(fù)特性的非線性間歇過程,提出一種能跟蹤變參考軌跡的魯棒迭代學(xué)習(xí)模型預(yù)測控制.控制器設(shè)計(jì)基于包含被控系統(tǒng)非線性動(dòng)態(tài)特性的LPV 模型,將LPV 模型進(jìn)行狀態(tài)增廣建立二維迭代誤差模型.在魯棒H∞預(yù)測控制框架下,設(shè)置H∞性能上界,并據(jù)此構(gòu)建LMI 約束下的目標(biāo)函數(shù)優(yōu)化問題.分析RMPILC 系統(tǒng)的魯棒穩(wěn)定性和迭代收斂性,將其充分條件作為約束加入每個(gè)采樣時(shí)刻的優(yōu)化中.仿真結(jié)果驗(yàn)證了RMPILC 在快速跟蹤變參考軌跡方面的優(yōu)勢,表明采用基于LPV 模型的RMPILC 算法能顯著減少迭代學(xué)習(xí)次數(shù),提高生產(chǎn)效率.
在實(shí)際生產(chǎn)中,間歇過程的參考軌跡可能會(huì)發(fā)生劇烈變化.若要保證魯棒穩(wěn)定條件和迭代收斂條件,可能會(huì)導(dǎo)致優(yōu)化問題不可行,或是可行域太小以至達(dá)不到期望的跟蹤精度.因此,未來的研究方向趨向于構(gòu)建軟約束RMPILC 算法.在優(yōu)化中引入松弛變量來放松約束,允許控制輸入在短時(shí)間內(nèi)超出約束以達(dá)到擴(kuò)大可行域的目的[33].基于軟約束的RMPILC 算法將能夠適應(yīng)劇烈變化的參考軌跡,提高間歇過程控制的魯棒性.