汪磊 楊慧中 陶洪峰 Wojciech Paszke
(1.江南大學(xué) 教育部輕工過程先進(jìn)控制重點(diǎn)實(shí)驗(yàn)室,江蘇 無錫,214122;2.Institute of Control and Computation Engineering,University of Zielona Gora,ul.Szafrana 2,65- 516 Zielona Gora,Poland)
迭代學(xué)習(xí)控制(Iterative Learning Control,ILC)適用于有限時(shí)間重復(fù)運(yùn)行的控制過程,它通過反復(fù)學(xué)習(xí),利用系統(tǒng)以往的控制經(jīng)驗(yàn),不斷修正當(dāng)前的輸入信號(hào),實(shí)現(xiàn)控制系統(tǒng)對(duì)期望軌跡的完全跟蹤[1- 3]。迭代學(xué)習(xí)控制過程能夠同時(shí)改善系統(tǒng)在時(shí)間和周期兩個(gè)維度上的控制性能,顯示出巨大的優(yōu)越性,因此受到了學(xué)術(shù)界和工程界的廣泛關(guān)注[4- 5]。
以往對(duì)于迭代學(xué)習(xí)控制技術(shù)的研究大多著眼于被控系統(tǒng)在時(shí)域的收斂性[6- 7]。有關(guān)頻域范圍的迭代學(xué)習(xí)控制研究成果也比較常見,值得注意的是現(xiàn)有的迭代學(xué)習(xí)控制方法都是在全頻范圍內(nèi)討論系統(tǒng)的穩(wěn)定性,可保證系統(tǒng)在全頻范圍內(nèi)穩(wěn)定,但這樣設(shè)計(jì)其實(shí)具有較大的保守性。因?yàn)閷?shí)際系統(tǒng)往往只需要運(yùn)行在特定工作頻率范圍,只需保證系統(tǒng)在有限工作頻率范圍內(nèi)的穩(wěn)定性即可。隨著廣義KYP引理的應(yīng)用,迭代學(xué)習(xí)控制問題深入到有限頻域范圍。文獻(xiàn)[8]將線性重復(fù)過程在有限頻域的有界輸入有界輸出性能轉(zhuǎn)化為相應(yīng)的線性矩陣不等式(Linear Matrix Inequality,LMI)問題,并推廣到連續(xù)迭代學(xué)習(xí)控制系統(tǒng)中,但并未同時(shí)考慮系統(tǒng)的二維特性;文獻(xiàn)[9]基于KYP引理,探討了線性離散系統(tǒng)在有限頻域的魯棒收斂性;文獻(xiàn)[10]則在有限頻域范圍內(nèi)設(shè)計(jì)出前饋-反饋迭代學(xué)習(xí)控制策略,通過廣義KYP引理和LMI進(jìn)一步分析系統(tǒng)沿時(shí)間方向的穩(wěn)定性及沿迭代方向的收斂性;文獻(xiàn)[11]在有限頻域中利用KYP引理和LMI分析出了迭代學(xué)習(xí)控制系統(tǒng)單調(diào)收斂及控制器存在的必要條件。然而,上述研究成果關(guān)注于迭代學(xué)習(xí)控制系統(tǒng)在迭代批次方向的魯棒收斂性,對(duì)控制系統(tǒng)在時(shí)間方向上的性能關(guān)注較少,沒有展現(xiàn)出控制系統(tǒng)的動(dòng)態(tài)特征。
鑒于此,本研究將迭代學(xué)習(xí)控制過程的閉環(huán)極點(diǎn)置于指定區(qū)域內(nèi),基于有限頻域研究系統(tǒng)的控制器設(shè)計(jì)方法,在迭代學(xué)習(xí)控制作用下,先在時(shí)域中將線性重復(fù)過程轉(zhuǎn)化為二維(2D)連續(xù)Roesser模型;再利用KYP引理,將閉環(huán)系統(tǒng)的跟蹤性能分析和區(qū)域極點(diǎn)約束問題轉(zhuǎn)化為相應(yīng)的LMI問題,進(jìn)而獲得系統(tǒng)二維特性和動(dòng)態(tài)性能的充分條件;最后,通過實(shí)例仿真對(duì)文中所提方法的有效性進(jìn)行了驗(yàn)證。
文中,對(duì)于矩陣X,用XT表示其轉(zhuǎn)置,X>0和X<0分別表示矩陣X是正定和負(fù)定;I和0分別代表適當(dāng)維數(shù)的單位陣和零矩陣;符號(hào)“*”代表對(duì)稱位置上的元素的轉(zhuǎn)置;sym(A)=A+AT表示方陣A的Hermitian部分;Φ?P表示Kronecker乘積;diag{?}表示對(duì)角矩陣。
考慮式(1)所示的線性連續(xù)重復(fù)過程
(1)
式中:k=0,1,2,…,表示迭代次數(shù);t∈[0,T]為系統(tǒng)的連續(xù)時(shí)間變量;xk(t)∈Rn、uk(t)∈Rm和yk(t)∈Rp分別是系統(tǒng)的狀態(tài)、輸入和輸出;邊界條件xk(0)=x0是系統(tǒng)第k次迭代的初始條件;A、B、C和D是相應(yīng)的適當(dāng)維數(shù)的系統(tǒng)矩陣。
在式(1)所示的系統(tǒng)的迭代學(xué)習(xí)過程中,令其期望軌跡為yd(t),同時(shí)定義跟蹤誤差:
ek(t)=yd(t)-yk(t)
(2)
其中,期望軌跡滿足以下條件:
yd(0)=yk(0)=Cxk(0)。
本研究的目標(biāo)是設(shè)計(jì)一種迭代學(xué)習(xí)控制律,使得系統(tǒng)的實(shí)際輸出逐漸跟蹤上期望軌跡yd(t),同時(shí)系統(tǒng)的閉環(huán)極點(diǎn)位于復(fù)平面的指定區(qū)域,保證系統(tǒng)在時(shí)間方向上的性能。
對(duì)于式(1)所示系統(tǒng),考慮如下迭代學(xué)習(xí)控制律:
(3)
式中:uk(t)為本批次的控制輸入變量;uk-1(t)為前一批次的控制輸入量;Δuk(t)為對(duì)控制進(jìn)行更新的修正量。同時(shí)定義
ηk(t)=xk(t)-xk-1(t)
(4)
由式(1)所示系統(tǒng)的初始狀態(tài)可知ηk(0)=0。利用式(1)-(3)可得:
Aηk(t)+BΔuk(t)
(5)
ek(t)=ek-1(t)-[yk(t)-yk-1(t)]=
ek-1(t)-C[xk(t)-xk-1(t)]-
D[uk(t)-uk-1(t)]=
ek-1(t)-Cηk(t)-DΔuk(t)
(6)
設(shè)計(jì)迭代學(xué)習(xí)控制更新律如式(7)所示:
Δuk(t)=K1ηk(t)+K2ek-1(t)
(7)
從而可得如下的2D閉環(huán)系統(tǒng):
(8)
其中:A1=A+BK1,B1=BK2,C1=-C-DK1,D1=I-DK2。
引理1[12]假設(shè)W、L和V為給定的適當(dāng)維數(shù)的矩陣,且W和V為正定矩陣,則LTVL-W<0等價(jià)于
(9)
或者
(10)
引理2[13]給定適當(dāng)維數(shù)的矩陣X、Y,以及適當(dāng)維數(shù)的對(duì)稱矩陣Z,則對(duì)任意滿足ΔTΔ≤I的Δ,不等式
Z+XΔY+YTΔTXT<0
(11)
成立的充要條件是存在ε>0,使得
Z+εXXT+ε-1YTY<0
(12)
引理3[14](投影引理) 設(shè)、Λ、Σ為適當(dāng)維數(shù)的實(shí)矩陣,且=T,存在矩陣W使不等式
(13)
成立的充要條件為當(dāng)且僅當(dāng)以下兩個(gè)不等式成立
(14)
引理4[15]式(8)所描述的迭代學(xué)習(xí)控制系統(tǒng)穩(wěn)定的充要條件為以下條件同時(shí)成立:
(i)ρ(D1)<1,其模值嚴(yán)格小于1,保證閉環(huán)系統(tǒng)迭代批次方向上的漸近穩(wěn)定性;
(ii) 矩陣A1的所有特征值均位于復(fù)平面的左半平面,保證閉環(huán)系統(tǒng)在時(shí)間方向上的穩(wěn)定;
(iii) 傳遞函數(shù)矩陣G(s)=C1(sI-A1)-1·B1+D1,s=jω,?ω≥0,其模值嚴(yán)格小于1,同時(shí)保證閉環(huán)系統(tǒng)在時(shí)間和批次上的二維性能,使閉環(huán)系統(tǒng)穩(wěn)定。
引理5[16]考慮到系統(tǒng)(式(8))的傳遞函數(shù)G(s)和頻率響應(yīng)矩陣G(jω)=C1(jωI-A1)-1B1+D1,若存在對(duì)稱矩陣P以及適當(dāng)維數(shù)的正定矩陣Q,滿足下式
(15)
那么下列頻域不等式也成立
(16)
其中,Π為給定的實(shí)對(duì)稱矩陣,Ω表示頻率范圍,
Ψ=
此外,引理4的條件(iii)可改寫為以下不等式:
|G(jω)|<γ,?ω∈Ω,γ∈(0,1]
(17)
|Ge(jω)|<ε1,?ω∈Ω
(18)
(19)
(20)
其中:
則進(jìn)一步可得迭代學(xué)習(xí)控制更新律(式(7))的增益矩陣為
(21)
此時(shí)在低、中頻段范圍內(nèi),迭代學(xué)習(xí)控制律(式(3))作用下的閉環(huán)系統(tǒng)(式(8))穩(wěn)定,同時(shí)系統(tǒng)的跟蹤誤差單調(diào)收斂,且系統(tǒng)的閉環(huán)極點(diǎn)位于圓心(-q,0)、半徑為r的圓域內(nèi)。
證明若不等式(20)成立,則下列不等式也成立
(22)
(23)
(24)
根據(jù)引理3的結(jié)論,存在
使得
(Σ⊥)T
(25)
(Λ⊥)T
(26)
由式(25)可得
(Σ⊥)TΣ⊥=
(27)
若不等式(27)成立,當(dāng)且僅當(dāng)對(duì)角線上元素滿足
(28)
由式(20)成立可得,其左側(cè)矩陣對(duì)角線上的元素
(29)
由式(26)可得
(Λ⊥)T
(30)
即存在對(duì)稱矩陣P以及適當(dāng)維數(shù)的矩陣Q>0,滿足以下不等式
(31)
根據(jù)引理5,式(31)可進(jìn)一步改寫為
(32)
即不等式(18)成立。
另外,根據(jù)參考文獻(xiàn)[17],若矩陣A1的所有特征值都位于中心(-q,0)、半徑r的圓域內(nèi),則:
(33)
(34)
(35)
其中:
則迭代學(xué)習(xí)控制更新律(式(7))的增益矩陣為
(36)
此時(shí)在高頻段范圍內(nèi),迭代學(xué)習(xí)控制律(式(3))作用下的閉環(huán)系統(tǒng)(式(8))穩(wěn)定,同時(shí)系統(tǒng)的跟蹤誤差單調(diào)收斂,且系統(tǒng)的閉環(huán)極點(diǎn)位于圓心(-q,0)、半徑為r的圓域內(nèi)。
則(Σ⊥)TΣ⊥=
(37)
其余證明過程同定理1。
在式(8)所示模型的基礎(chǔ)上,進(jìn)一步考慮如下不確定性線性連續(xù)重復(fù)過程:
(38)
其中,系統(tǒng)的不確定性結(jié)構(gòu)為
(39)
式中:E1、E2、F1和F2是已知的常值矩陣,不確定性擾動(dòng)系數(shù)δ滿足
δTδ≤I
(40)
同樣采用迭代學(xué)習(xí)控制器(式(3))及其更新律(式(7)),得到2D閉環(huán)模型為
(41)
其中:A2=A+ΔA+(B+ΔB)K1,B2=(B+
ΔB)K2,C2=-(C+ΔC)-(D+ΔD)K1,
D2=I-(D+ΔD)K2。
(42)
(43)
則在低、中頻段范圍內(nèi)2D閉環(huán)系統(tǒng)(式(41))穩(wěn)定,同時(shí)系統(tǒng)的跟蹤誤差也單調(diào)收斂,并且系統(tǒng)的閉環(huán)極點(diǎn)都在圓心(-q,0)、半徑r的圓域內(nèi),此時(shí)迭代學(xué)習(xí)控制器更新律(式(7))的增益矩陣同樣為式(21)形式。
證明根據(jù)由定理1的結(jié)論,考慮系統(tǒng)的不確定性后,Η12就變?yōu)?/p>
(44)
由引理2可知,式(44)成立當(dāng)且僅當(dāng)存在標(biāo)量λ1>0,使得以下不等式成立
(45)
運(yùn)用引理1可得
(46)
(47)
(48)
證明在推論1的基礎(chǔ)上考慮系統(tǒng)的不確性,證明過程同定理2。
為驗(yàn)證文中算法的有效性,考慮典型的跟蹤伺服系統(tǒng),執(zhí)行機(jī)構(gòu)為單位質(zhì)量塊-彈簧-阻尼器組成的二階機(jī)械位移系統(tǒng)[19],式(1)中狀態(tài)空間模型參數(shù)為
3.1標(biāo)稱系統(tǒng)的仿真
控制系統(tǒng)低頻、中頻、高頻的閉環(huán)極點(diǎn)分別是{-3.557 5±j2.982 8}、{-4.343 7±j2.450 7}、{-3.621 1±j2.949 7},都在圓心、半徑r=8的圓域內(nèi)。仿真結(jié)果如圖1-3所示。由圖1-3可見,迭代學(xué)習(xí)控制系統(tǒng)在各頻段都保持穩(wěn)定。
圖1 標(biāo)稱系統(tǒng)頻域傳遞函數(shù)在低頻段的幅值特性曲線
Fig.1 AmplitudE-versus-frequency curve of the frequency domain transfer function of the nominal system over lowfrequency range
圖2 標(biāo)稱系統(tǒng)頻域傳遞函數(shù)在中頻段的幅值特性
Fig.2 AmplitudE-versus-frequency curve of the frequency domain transfer function of the nominal system over middle frequency range
圖3 標(biāo)稱系統(tǒng)頻域傳遞函數(shù)在高頻段的幅值特性曲線
Fig.3 AmplitudE-versus-frequency curve of the frequency domain transfer function of the nominal system over high frequency range
當(dāng)系統(tǒng)含有不確定性參數(shù)時(shí),控制系統(tǒng)的閉環(huán)極點(diǎn)分布如圖4-6所示,由圖4-6可見系統(tǒng)的閉環(huán)極點(diǎn)都在指定的圓域內(nèi)。圖7-9為不確定性系統(tǒng)閉環(huán)傳遞函數(shù)G(jω)的幅值特性,G(jω)的模值嚴(yán)格小于1,則由引理4可知,不確定性系統(tǒng)閉環(huán)系統(tǒng)在時(shí)間軸方向上穩(wěn)定性。
圖4 不確定性系統(tǒng)在低頻段的閉環(huán)極點(diǎn)分布圖
Fig.4 Closed-loop pole distribution plot for the uncertain system over low frequency range
圖5 不確定性系統(tǒng)在中頻段的閉環(huán)極點(diǎn)分布圖
Fig.5 Closed-loop pole distribution plot for the uncertain system over middle frequency range
圖6 不確定性系統(tǒng)在高頻段的閉環(huán)極點(diǎn)分布圖
Fig.6 Closed-loop pole distribution plot for the uncertain system over high frequency range
圖7 不確定性系統(tǒng)頻域傳遞函數(shù)在低頻段的幅值特性曲線
Fig.7 AmplitudE-versus-frequency curve of the frequency domain transfer function of the uncertain system over low frequency range
圖8 不確定性系統(tǒng)頻域傳遞函數(shù)在中頻段的幅值特性曲線
Fig.8 AmplitudE-versus-frequency curve of the frequency domain transfer function of the uncertain system over middle frequency range
圖9 不確定性系統(tǒng)頻域傳遞函數(shù)在高頻段的幅值特性曲線
Fig.9 AmplitudE-versus-frequency curve of the frequency domain transfer function of the uncertain system over high frequency range
文中研究了有限頻域范圍線性連續(xù)重復(fù)過程在區(qū)域極點(diǎn)約束下的迭代學(xué)習(xí)控制器設(shè)計(jì)方案。首先,結(jié)合2D系統(tǒng)理論,在時(shí)域中建立迭代學(xué)習(xí)控制系統(tǒng)的2D連續(xù)Roesser模型;然后利用KYP引理,將迭代學(xué)習(xí)控制系統(tǒng)在時(shí)間方向和迭代批次方向的性能分析和區(qū)域極點(diǎn)約束問題轉(zhuǎn)化為相應(yīng)的線性矩陣不等式問題,進(jìn)而給出控制器存在的充分條件及其增益矩陣;最后,通過仿真實(shí)驗(yàn)驗(yàn)證了文中所提方法的有效性。