于樹友 馮陽陽 KIM Jung-Su 陳 虹 4
預(yù)測控制是對(duì)工業(yè)控制工程具有重大影響的先進(jìn)控制算法[1],大量應(yīng)用于化工、冶金制造等過程控制領(lǐng)域[2].預(yù)測控制要求在每一個(gè)采樣時(shí)刻,根據(jù)系統(tǒng)當(dāng)前時(shí)刻的狀態(tài)采樣值,最小化系統(tǒng)的目標(biāo)函數(shù)(性能指標(biāo)),獲得有限時(shí)域的開環(huán)控制序列或者無限時(shí)域的閉環(huán)反饋控制律.但只把控制序列或者反饋控制律的第一個(gè)片段作用于系統(tǒng),在下一個(gè)采樣時(shí)刻根據(jù)新的測量值重新求解優(yōu)化問題.由于采用了開環(huán)滾動(dòng)優(yōu)化、閉環(huán)反饋矯正的形式,預(yù)測控制可以解決非線性、約束系統(tǒng)的最優(yōu)控制問題[3?6];也由于在每一個(gè)采樣時(shí)刻重新求解優(yōu)化問題,在線修正預(yù)測軌跡,因而具有很強(qiáng)的抗干擾能力[7?8].
Grüne 在假設(shè)系統(tǒng)可控和優(yōu)化問題具有滾動(dòng)可行性的基礎(chǔ)上,提出了保證非線性預(yù)測控制穩(wěn)定性的策略[9].為了保證預(yù)測控制的穩(wěn)定性,另一種方法是在優(yōu)化問題中加入終端約束集和終端懲罰函數(shù)[10?11].Grüne 的方法被稱為無(終端)約束預(yù)測控制;與之相對(duì)應(yīng),Chen 等[10]和Mayne 等[11]的方法被稱為具有終端約束條件的預(yù)測控制.通過合理地選擇終端懲罰函數(shù)和終端約束集,在假設(shè)優(yōu)化問題在初始時(shí)刻具有可行解的條件下,具有終端約束條件的預(yù)測控制能夠保證優(yōu)化問題具有滾動(dòng)可行性和受控系統(tǒng)的漸近穩(wěn)定性.文獻(xiàn)[12]深入分析了在優(yōu)化問題中引入終端約束集和終端懲罰函數(shù)的優(yōu)點(diǎn)和缺點(diǎn).
終端懲罰函數(shù)、終端約束集和終端控制律構(gòu)成了保證穩(wěn)定性的非線性預(yù)測控制方法中優(yōu)化問題的基本要素,三者需要離線求解,共同決定了在線計(jì)算負(fù)擔(dān)和閉環(huán)系統(tǒng)的性能.如果系統(tǒng)是局部Lipschitz 連續(xù)的,文獻(xiàn)[10]給出了連續(xù)時(shí)間約束非線性系統(tǒng)終端約束集存在的充分條件.Mayne 等在總結(jié)預(yù)測控制已有成果的基礎(chǔ)上,給出保證受控系統(tǒng)漸近穩(wěn)定的終端要素需要滿足的“公理性”條件[11].文獻(xiàn)[13?14]將文獻(xiàn)[10]給出的終端約束集存在的充分條件推廣至離散時(shí)間非線性系統(tǒng).由于預(yù)測控制中終端約束集的大小決定了預(yù)測時(shí)域的選擇,而后者又決定了系統(tǒng)的在線計(jì)算負(fù)擔(dān),因而很多工作著眼于如何求得更大的終端約束集.利用非線性系統(tǒng)的局部線性微分包含,文獻(xiàn)[15?16]分別給出了橢球體和多面體型的終端約束集的求解方法.考慮線性時(shí)不變系統(tǒng),文獻(xiàn)[17]提出了時(shí)變的終端懲罰函數(shù)和時(shí)變的終端約束集的求取方法,其中終端約束集是一族終端約束集的凸包,并且凸包的加權(quán)系數(shù)是時(shí)變的.在文獻(xiàn)[17]工作的基礎(chǔ)上,文獻(xiàn)[18]進(jìn)一步研究了終端約束集族的構(gòu)造方法.文獻(xiàn)[19]討論了有限步終端懲罰函數(shù)和有限步終端約束集的構(gòu)造方法,可以得到更大的可行域(吸引域);當(dāng)步數(shù)選為1 時(shí),該方法就還原為經(jīng)典的終端懲罰函數(shù)和終端約束集的構(gòu)造方法.文獻(xiàn)[20]給出了非線性系統(tǒng)時(shí)變終端約束集和時(shí)變終端懲罰函數(shù)的計(jì)算方法,其中終端控制律可以是線性的,也可以是非線性的.通過估計(jì)非線性系統(tǒng)的高階非線性項(xiàng),文獻(xiàn)[21?22]給出了兩種求解非線性預(yù)測控制終端約束集的方法,可以用來求解高維非線性系統(tǒng)的終端懲罰函數(shù)和終端約束集.上述方法都將終端約束集選擇為終端懲罰函數(shù)的水平截集.
本文提出了一種非線性預(yù)測控制終端約束集、終端懲罰函數(shù)和終端控制律的優(yōu)化方法.與已有的方法相比,終端約束集不再是終端懲罰函數(shù)的水平截集.終端控制律將終端約束集和終端懲罰函數(shù)聯(lián)系起來:當(dāng)系統(tǒng)狀態(tài)位于終端約束集時(shí),在終端控制律的作用下,系統(tǒng)狀態(tài)保持在終端約束集中(正不變性);系統(tǒng)的終端懲罰函數(shù)是系統(tǒng)無窮維階段代價(jià)的上界.終端懲罰項(xiàng)和終端約束集的“解耦”通過在優(yōu)化問題中引入新的優(yōu)化變量實(shí)現(xiàn),因而提供了新的自由度,降低了求解的保守性.
符號(hào)說明.記 R 為實(shí)數(shù)域,Rn為n維歐幾里得空間,Z 為非負(fù)的整數(shù),Z+為正整數(shù),Z[1,N]是指區(qū)間[1,N] 內(nèi)的整數(shù).符號(hào)k+i|k代表在k時(shí)刻預(yù)測一個(gè)(無限或者有限維) 序列時(shí),該序列在k+i時(shí)刻的預(yù)測值.記M為n×n維的實(shí)數(shù)矩陣,M ?0和M ?0 分別表示矩陣M是正定對(duì)稱的、半正定對(duì)稱的,M ?0 和M ?0 分別表示矩陣M是負(fù)定對(duì)稱的、半負(fù)定對(duì)稱的.對(duì)于向量v ∈Rn,∥v∥Q=其中矩陣Q ∈Rn×n,Q ?0.矩陣I代表具有適當(dāng)維數(shù)的單位矩陣;對(duì)稱矩陣中的?代表對(duì)稱矩陣中按照對(duì)角線對(duì)稱的對(duì)應(yīng)元素;det(X)是指方陣X的行列式.
考慮離散時(shí)間非線性系統(tǒng)
考慮系統(tǒng)的輸入和狀態(tài)約束
其中,X和U為包含原點(diǎn)的有界閉集.
本文中假設(shè)系統(tǒng)的狀態(tài)xk是實(shí)時(shí)可測量的,并且不考慮外部擾動(dòng)、模型不確定性和測量噪聲對(duì)系統(tǒng)動(dòng)態(tài)的影響.
假設(shè)f:是二次連續(xù)的,(0,0)是系統(tǒng)的唯一平衡點(diǎn).
定義k時(shí)刻的控制輸入序列
則k時(shí)刻預(yù)測控制的有限時(shí)域優(yōu)化問題可以描述為:
問題 1.
其中,N為預(yù)測時(shí)域;N∈Z+;xk+i|k是在控制uk+i|k的作用下系統(tǒng)起始于xk|k的預(yù)測狀態(tài)軌跡;l(·,·) 是階段代價(jià)(Cost stage)函數(shù),目標(biāo)函數(shù)
階段代價(jià)l(x,u):X ×U →U關(guān)于自變量x和u均是連續(xù)的,并且滿足l(0,0)=0 和對(duì)所有的 (x,u)∈X ×U {0,0},l(x,u)>0.
終端約束集Xf是平衡點(diǎn)的一個(gè)鄰域;終端懲罰函數(shù)E(x) 是半正定的,并且當(dāng)且僅當(dāng)x=0 時(shí),E(x)=0.記κf(x) 為終端控制律,通常終端控制僅用來求解終端約束集Xf和終端懲罰函數(shù)E(x),不會(huì)直接作用于系統(tǒng).
下面的引理給出了為保證受控系統(tǒng)漸近穩(wěn)定,終端控制律、終端約束集和終端懲罰函數(shù)需要滿足的條件.在文獻(xiàn)[11]中Mayne 等將上述條件稱為保證預(yù)測控制系統(tǒng)漸近穩(wěn)定的“公理(Axioms)”.
引理 1[11].如果優(yōu)化問題1 在初始時(shí)刻k=0 有可行解,并且終端約束集Xf、終端控制律κf(x) 和終端懲罰函數(shù)E(x) 滿足如下的條件:
1)Xf ?X,Xf是一個(gè)閉集,0∈Xf;
2)κf(x)∈U,?x ∈Xf;
3)f(x,κf(x))∈Xf,?x ∈Xf;
4)E(xk+i+1|k)?E(xk+i|k) +l(xk+i|k,κ(xk+i|k))≤0,?x ∈Xf.
其中,終端懲罰函數(shù)E(·) 是非線性系統(tǒng) (1)的一個(gè)局部的Lyapunov 函數(shù).則
1)優(yōu)化問題1 在任意時(shí)刻k ≥0 均有可行解;
2)在預(yù)測控制的作用下,系統(tǒng)漸近穩(wěn)定.
條件1)和2)表明在終端約束集中狀態(tài)約束和控制約束均得到滿足;條件3)表明在終端控制律的作用下,終端約束集是一個(gè)控制的不變集(即在終端控制律的作用下,如果當(dāng)前時(shí)刻系統(tǒng)的狀態(tài)在終端約束集中,則下一時(shí)刻系統(tǒng)的狀態(tài)仍然在終端約束集中);條件4) 表明在終端約束集內(nèi),在終端控制律的作用下,代價(jià)函數(shù)沿著系統(tǒng)軌跡單調(diào)遞減.
記系統(tǒng)(1)在平衡點(diǎn) (0,0) 的局部Lipschitz 線性化系統(tǒng)為
假設(shè)系統(tǒng) (6)是可鎮(zhèn)定的,即存在一個(gè)線性反饋控制律Fx使得A+BF的特征根在單位圓內(nèi).選擇終端懲罰函數(shù)為系統(tǒng)局部的Lyapunov 函數(shù),終端約束集為終端代價(jià)函數(shù)的水平截集.針對(duì)連續(xù)時(shí)間非線性系統(tǒng)和離散時(shí)間非線性系統(tǒng),文獻(xiàn)[10,13]分別給出了終端約束集、終端控制律和終端懲罰函數(shù)存在的充分條件.
如果選取終端約束集為終端代價(jià)函數(shù)的水平截集
則條件4)就內(nèi)在地包含了條件3).此時(shí),終端懲罰函數(shù)、終端約束集和終端控制律需要滿足的4個(gè)條件就相應(yīng)地簡化為3 個(gè)條件:
針對(duì)離散時(shí)間非線性系統(tǒng),本文討論非線性預(yù)測控制終端約束集、終端控制律和終端懲罰項(xiàng)的優(yōu)化方法.本文的結(jié)果中,終端懲罰函數(shù)和終端約束集內(nèi)的局部Lyapunov 函數(shù)是不同的,終端約束集也可以不再是終端懲罰函數(shù)的水平截集.
為簡化,考慮如下多面體形式的狀態(tài)約束和控制輸入約束
本節(jié)首先介紹非線性系統(tǒng) (1)的多胞體線性微分包含[23?24],在此基礎(chǔ)上討論非線性預(yù)測控制終端約束集和終端代價(jià)函數(shù)的求解方法.非線性系統(tǒng)的線性微分包含本質(zhì)上是一個(gè)由系統(tǒng)構(gòu)成的集合,非線性系統(tǒng)只是集合內(nèi)的一個(gè)“元素”.如果集合(非線性系統(tǒng)的線性微分包含) 具有某種屬性,則作為集合中的一個(gè)特定元素的非線性系統(tǒng)也具有這一屬性.
假設(shè)
其中,
Co代表元素的凸組合,即存在L個(gè)非負(fù)的標(biāo)量 使得λi,i=1,2,···,L,
注 1.終端約束集是系統(tǒng)平衡點(diǎn)的某一個(gè)鄰域,因而在求取終端約束集時(shí)可以只關(guān)心平衡點(diǎn)某一鄰域的微分包含.具體地,可以尋找C0?C使得
其中,?0是平衡點(diǎn)鄰域C0的線性微分包含.當(dāng)然,在求取了終端約束集Xf后還需要檢查是否滿足Xf ??0.
下面的定理給出了求取非線性系統(tǒng) (1) 終端約束集、終端懲罰函數(shù)和終端控制律的方法.
定理 1.對(duì)非線性系統(tǒng) (1),假設(shè)系統(tǒng)的一個(gè)多胞體線性微分包含為式 (8).如果存在矩陣G,Y和對(duì)稱正定矩陣X1,X2,使得
則:
1)線性反饋控制律u=Fx,F=Y G?1可以選作系統(tǒng)的終端控制律;
2)橢圓域Xf:=可以選作系統(tǒng)的終端約束集;
證明.下面將逐一證明按照這種方式選擇的終端控制律、終端懲罰函數(shù)和終端約束集滿足引理1列舉的4 個(gè)條件.
1) 考慮線性反饋控制律u=Fx和二次終端懲罰函數(shù)條件
成立等價(jià)于
上式成立的充分條件[25?26]是對(duì)于任意的i=1,2,···,L,有
式(10)中{2,2}項(xiàng)表明X1?0;{1,1}項(xiàng)表明G+GT?X1.由于X1?0 和G+GT?X1,矩陣G是非奇異的.進(jìn)一步地,由于X1?0 和(G ?X1)T×?0,所以
考慮到F=Y G?1和式 (10) 表明
對(duì)式 (15) 兩端分別左乘 diag{X1G?T,I,I,I}和右乘 diag{G?1X1,I,I,I},可以得到式 (13) 成立.即在終端控制律的作用下,沿著系統(tǒng)的狀態(tài)軌跡優(yōu)化問題的代價(jià)函數(shù)是最優(yōu)的.
2) 采用與上述相似的推理,可以得到
考慮到F=Y G?1和,式 (11) 表明
對(duì)式 (17) 兩端分別左乘 diag{X2G?T,I}和右乘 diag{G?1X2,I},可以得到
利用Schur 補(bǔ)定理[23],有
如果在某一時(shí)刻h0,∈Xf,則對(duì)于任意的k ≥h0,xk ∈Xf.即在狀態(tài)反饋控制律u=Fx的作用下,橢圓域Xf是非線性系統(tǒng) (1) 的不變集.
3) 考慮到F=Y G?1和0?G+GT?X2?GT×G,式 (12) 表明
對(duì)式 (20) 兩端分別左乘 diag{X2G?T,I}和右乘 可以得到diag{G?1X2,I},
利用Schur 補(bǔ)定理,上式等價(jià)于
注 2.從形式上看,定理 1 中終端約束集Xf:={x ∈≤1}不再是終端懲罰函數(shù)的水平截集.
注 3.終端控制律沒有真正作用于系統(tǒng);終端控制律使得系統(tǒng)在終端約束集中是正不變的(系統(tǒng)狀態(tài)進(jìn)入終端約束集后將不再離開終端約束集);在終端控制律的作用下,在終端約束集中系統(tǒng)滿足輸出約束 (7);終端控制律使得系統(tǒng)的動(dòng)態(tài)軌跡具有某種最優(yōu)性(最優(yōu)代價(jià)).
橢圓域Xf:=的容量(橢圓域包含點(diǎn)的個(gè)數(shù))與 det(X2) 成正比[23].目標(biāo)函數(shù) det(·) 不是變量的凸函數(shù),但是可以通過對(duì)數(shù)變換[27]或者求取特征值的幾何均值[28]將求取對(duì)稱矩陣最大行列式的非凸優(yōu)化問題轉(zhuǎn)變?yōu)橥箖?yōu)化問題.本文采用文獻(xiàn)[28]介紹的求取特征值的幾何均值方法.
考慮如下的優(yōu)化問題:
問題 2.
問題 2 是一個(gè)凸優(yōu)化問題[28].通過求解凸優(yōu)化問題 2 可以得到參數(shù)矩陣X1,X2,Y和G.在此基礎(chǔ)上,利用F=Y G?1得到終端控制律u=Fx;相應(yīng)系統(tǒng)的終端懲罰項(xiàng)為系統(tǒng)的終端約束集為Xf:=
離散系統(tǒng)終端約束集也可以通過求解下面的優(yōu)化問題得到[29?30].
問題 3.
在問題 2 中,如果選擇X1=X2=G,則問題2和問題 3 等價(jià),從而由于在優(yōu)化問題中引入了新的自由變量X2和G,因而可以從理論上保證求取問題 2 得到的終端約束集更大.求取問題2和問題 3 得到的終端約束集均為橢圓集,區(qū)別在于求取問題 3 得到的終端約束集是終端懲罰函數(shù)的水平截集,求取問題 2 得到的終端約束集與增加的一個(gè)自由變量X2相關(guān),是正定函數(shù)xTX2x的水平截集.進(jìn)一步地,由于均采用線性矩陣不等式求解優(yōu)化問題,并且求取過程是離線進(jìn)行,設(shè)計(jì)過程復(fù)雜性的有限提高仍然在可接受范圍內(nèi).
需要強(qiáng)調(diào)的是,終端約束集變大有可能導(dǎo)致系統(tǒng)動(dòng)態(tài)性能變差.
考慮離散時(shí)間非線性系統(tǒng)
非線性系統(tǒng)(25)在平衡點(diǎn) (0,0) 處Jacobi 線性化得到的線性系統(tǒng)是開環(huán)不穩(wěn)定的,但是可控的.
考慮控制約束
階段代價(jià)函數(shù)l(x,u)=xTQx+uTRu中的權(quán)矩陣Q和R分別為
將系統(tǒng)(25)寫成如下形式
其中,μ=uk可以視為一個(gè)時(shí)變參數(shù).考慮到uk ∈[?1,1],則系統(tǒng)的一個(gè)多面體線性微分包含為
其中,
分別采用文獻(xiàn)[30]和本文介紹的方法求取系統(tǒng)的終端不變域,相應(yīng)的系統(tǒng)終端約束集如圖1,其中虛線對(duì)應(yīng)的橢圓是采用文獻(xiàn)[30]中介紹的方法(求解問題 3) 得到的,實(shí)線對(duì)應(yīng)的橢圓是采用本文介紹的方法得到的.從圖中可以看出,采用本文介紹的方法擴(kuò)大了系統(tǒng)的終端約束集.
圖1 終端約束集Fig.1 Terminal constraint set
圖2~ 圖4 給出了初始狀態(tài)為x0=[?1.5 1.5]T時(shí)系統(tǒng)的動(dòng)態(tài)響應(yīng),實(shí)線為采用本文方法求取的終端約束條件對(duì)應(yīng)的系統(tǒng)動(dòng)態(tài),虛線為采用文獻(xiàn)[30]中介紹的方法求取的終端約束條件對(duì)應(yīng)的系統(tǒng)動(dòng)態(tài).從圖中可以看出,在滿足控制輸入約束的情況下系統(tǒng)動(dòng)態(tài)軌跡漸近趨于平衡點(diǎn);并且采用本文介紹的方法并沒有使得系統(tǒng)的動(dòng)態(tài)性能變差.上述仿真中,預(yù)測時(shí)域和控制時(shí)域相等,均為5.
圖2 系統(tǒng)的動(dòng)態(tài)響應(yīng):x1Fig.2 Dynamic response of the system:x1
圖3 系統(tǒng)的動(dòng)態(tài)響應(yīng):x2Fig.3 Dynamic response of the system:x2
圖4 系統(tǒng)的動(dòng)態(tài)響應(yīng):uFig.4 Dynamic response of the system:u
需要指出的是,在狀態(tài)空間的某些點(diǎn)處,在相同的預(yù)測時(shí)域和控制時(shí)域下,本文介紹的方法有可行解,而采用文獻(xiàn)[30]中介紹的方法沒有可行解.
針對(duì)離散時(shí)間非線性系統(tǒng),本文提出了一種非線性預(yù)測控制終端約束集的優(yōu)化方法.從內(nèi)容上看,本文提出的優(yōu)化方法比文獻(xiàn)[29?30]中的經(jīng)典優(yōu)化算法多了自由變量,因而可以從理論上保證所求得的終端約束集比該經(jīng)典優(yōu)化方法更大,進(jìn)而可以通過選擇更短的預(yù)測時(shí)域來降低預(yù)測控制在線計(jì)算負(fù)擔(dān);從形式上看,本文提出的方法可以實(shí)現(xiàn)終端懲罰函數(shù)和終端約束集的某種解耦,即終端約束集不再是終端懲罰函數(shù)的水平截集.但終端約束集和終端懲罰函數(shù)仍然通過終端控制律聯(lián)系起來:終端約束集是受控系統(tǒng)在終端控制律作用下的不變集;當(dāng)系統(tǒng)狀態(tài)在終端約束集時(shí),在終端控制律的作用下,終端懲罰函數(shù)是系統(tǒng)的無窮時(shí)域階段代價(jià)的上界.最后通過仿真算例驗(yàn)證了所提方法的有效性.