李致富 胡躍明
(1.華南理工大學(xué)機(jī)械與汽車工程學(xué)院,廣東廣州510640;
2.華南理工大學(xué)精密電子制造裝備教育部工程研究中心,廣東廣州510640)
迭代學(xué)習(xí)控制[1-2](ILC)利用系統(tǒng)以前的控制信息不斷地修正控制輸入,使得被控系統(tǒng)產(chǎn)生期望的運(yùn)動軌跡.迭代學(xué)習(xí)控制因不需要精確的系統(tǒng)模型信息而受到了眾多學(xué)者的關(guān)注,已經(jīng)發(fā)展成為最主要的智能控制方法之一[3-5].然而,目前絕大部分的迭代學(xué)習(xí)收斂算法都是針對標(biāo)稱系統(tǒng)設(shè)計的[6-9].從工程應(yīng)用角度來看,在迭代學(xué)習(xí)控制中,不確定系統(tǒng)的魯棒性和輸出誤差的單調(diào)收斂性尤為重要,因此,近年來,迭代學(xué)習(xí)控制的魯棒單調(diào)收斂性問題逐漸成為迭代學(xué)習(xí)控制研究中的熱點[10].文獻(xiàn)[11]中基于μ分析方法對不確定性系統(tǒng)設(shè)計了魯棒單調(diào)收斂的有限時間區(qū)間迭代學(xué)習(xí)控制算法.文獻(xiàn)[12]中采用超級向量法對帶有馬爾可夫參數(shù)區(qū)間不確定性的系統(tǒng)設(shè)計了魯棒單調(diào)收斂的迭代學(xué)習(xí)控制算法.而采用線性矩陣不等式(LMI)方法來研究魯棒單調(diào)收斂問題的文獻(xiàn)較少.盡管文獻(xiàn)[13]中基于二維(2D)方法對帶有參數(shù)不確定性的時延線性系統(tǒng)設(shè)計了魯棒單調(diào)迭代學(xué)習(xí)控制算法,并得出了基于LMI的充分條件,但該算法需滿足初始狀態(tài)值等于期望初始狀態(tài)值的ILC復(fù)位條件.
文中基于LMI研究一類帶有初始狀態(tài)誤差的不確定離散線性系統(tǒng)的迭代學(xué)習(xí)單調(diào)收斂問題,提出了一種采用簡單P-型學(xué)習(xí)律的魯棒單調(diào)收斂的迭代學(xué)習(xí)控制策略.首先把魯棒單調(diào)迭代控制問題轉(zhuǎn)化為一維系統(tǒng)的H∞干擾抑制問題,然后給出系統(tǒng)的穩(wěn)定性分析和用LMI表示的魯棒單調(diào)收斂的充分條件,該LMI條件還可用于確定學(xué)習(xí)律的增益.最后,通過仿真實驗驗證了該魯棒單調(diào)迭代學(xué)習(xí)控制策略的有效性.
考慮如下帶有參數(shù)擾動的不確定離散線性系統(tǒng):
式中:時間變量 t=0,1,…,N;xk(t)∈Rn、uk(t)∈Rm和yk(t)∈Rp分別為系統(tǒng)在第k次迭代運(yùn)動中的狀態(tài)向量、輸入向量和輸出向量;A、B、C為合適維數(shù)的標(biāo)稱系統(tǒng)的實矩陣,不失一般性,假設(shè)B和C為滿秩矩陣;ΔA(t)和ΔB(t)為t時刻與矩陣A、B對應(yīng)的不確定擾動,滿足
W、F1、F2為合適維數(shù)的實常數(shù)矩陣,Σ(t)為未知的時變矩陣,且滿足ΣT(t)Σ(t)≤I,I為單位矩陣.
在系統(tǒng)(1)的迭代學(xué)習(xí)過程中,令其期望輸出為yd(t),對應(yīng)的期望狀態(tài)為xd(t),輸出誤差定義為ek(t)=yd(t)-yk(t),且作如下假設(shè):
(1)矩陣A是穩(wěn)定的;
(2)對于預(yù)先給定的期望輸出yd(t),存在唯一的輸入序列 ud(t),t∈[1,N],使得系統(tǒng)(1)成立;
(3)在迭代學(xué)習(xí)控制過程中,迭代初始狀態(tài)滿足xk(0)=x0,其中x0為有界的任意給定點.
考慮如下的P-型迭代學(xué)習(xí)律:
系統(tǒng)(1)在假設(shè)(1)-(3)成立的情況下,采用學(xué)習(xí)律(3)尋找合適的學(xué)習(xí)增益K,使得
(i)當(dāng) k ∞時,輸出誤差 ek(t)趨于0(t∈[1,N]);
(ii)輸出誤差2-范數(shù)單調(diào)收斂,即滿足
式中,γe∈(0,1],范數(shù)定義為
首先,考慮系統(tǒng)(1)不帶參數(shù)擾動時的情況,即ΔA(t)=ΔB(t)=0.
定理1 系統(tǒng)(1)不帶參數(shù)擾動時,在假設(shè)(1)-(3)成立的情況下采用學(xué)習(xí)律(3),如果存在標(biāo)量0<γ≤1、正定矩陣 P=PT>0和矩陣X,使得如下LMI成立:
式中,*表示對稱矩陣中的對稱部分.那么,當(dāng)k ∞時,輸出誤差 ek(t)趨于 0(t∈[1,N]),且式(4)單調(diào)收斂.此外,當(dāng)LMI(5)滿足時,增益K為
證明 定義 ηk(t)=xk+1(t-1)-xk(t-1),當(dāng)ΔA(t)=ΔB(t)=0時,由式(1)和(3)可得
和
從傳統(tǒng)一維系統(tǒng)的輸入-輸出角度,將式(7)和(8)中的t視為離散時間,ηk(t)視為狀態(tài)向量,ek(t)視為擾動輸入,ek+1(t)視為輸出向量.將系統(tǒng)的傳遞函數(shù)記
為G(z),由無窮范數(shù)定義可知由假設(shè)(3)可知,ηk(0)=0,再由假設(shè)(1),根據(jù)文獻(xiàn)[14]的引理4.1可知,的充要條件是:存在正定矩陣P1=>0,使得
成立.對式(10)分別左乘和右乘矩陣diag{■γP1,,可得
記P1=γP-1,X=K,并對式(11)分別左乘和右乘矩陣 diag{P/γ,1,P,1},則式(11)可轉(zhuǎn)化為等價的LMI(5).因此,由式(5)成立可得
由式(9)和(12)可知式(4)成立,而且
注意到系統(tǒng)在第一次迭代運(yùn)行(即k=0)時,其初始控制輸入u0(t)是有界的,而且系統(tǒng)是穩(wěn)定的,因此也是有界的.由式(13)可得,當(dāng)成立.因此易知,當(dāng)k ∞時,輸出誤差 ek(t)趨于0(t∈[1,N]).證畢.接下來討論系統(tǒng)(1)帶有參數(shù)不確定性的情況.引理1[15]給定合適維數(shù)矩陣 Q=QT、H、R,對任意滿足ΔTΔ≤I的Δ,使
成立的充分必要條件是:存在ε>0,使得
定理2 系統(tǒng)(1)帶有參數(shù)擾動(2)時,在假設(shè)(1)-(3)成立的情況下采用學(xué)習(xí)律(3),如果存在標(biāo)量0<γ≤1、ε>0、正定矩陣 P=PT>0和矩陣X,使得如下LMI成立:
則k ∞時,輸出誤差ek(t)趨于0(t∈[1,N]),且式(4)單調(diào)收斂.此外,當(dāng)LMI(5)滿足時,增益K=X.
證明 首先由式(1)和(3)可得和
式中,AΔ=A+ΔA,BΔ=B+ΔB.同理,把式(17)和(18)視為一維離散不確定系統(tǒng),由定理1和文獻(xiàn)[14]的定義4.1可知,系統(tǒng)是二次穩(wěn)定的,而且對于擾動輸入具有H∞干擾抑制度γ的充要條件是:存在正定矩陣P=PT>0和矩陣X,使得
同理,在假設(shè)(1)-(3)成立的情況下采用學(xué)習(xí)律(3),式(19)成立是系統(tǒng)(1)帶有參數(shù)擾動(2)時式(4)單調(diào)收斂的充分條件.
引理1可知,ψ<0成立的充要條件是:存在ε>0,使得
成立.式(21)可改寫為
式中,
應(yīng)用Schur補(bǔ)引理,由式(22)可得到式(16).其余部分的證明省略,因為其證明和定理1相似.
說明1 文獻(xiàn)[16]中推導(dǎo)出系統(tǒng)(1)在沒有參數(shù)擾動和采用學(xué)習(xí)律(3)時,輸出誤差一致收斂的充要條件:矩陣I-CBK是穩(wěn)定的.但文獻(xiàn)[16]中的ILC方法僅能保證系統(tǒng)的輸出誤差是漸近穩(wěn)定的,而不是單調(diào)收斂的.
說明2 由式(5)可知
成立,整理可得
因為0<γ≤1且P為正定矩陣,由式(6)和(23)可知,矩陣I-CBK不僅是穩(wěn)定的,而且還要滿足式(23).換句話說,式(5)比“矩陣I-CBK是穩(wěn)定”的約束更強(qiáng),這樣才能保證系統(tǒng)(1)在沒有參數(shù)擾動和采用學(xué)習(xí)律(3)時的輸出誤差是單調(diào)收斂的.
說明3 在定理1和2的證明過程中,定義ηk(t)=xk+1(t-1)-xk(t-1),同時從傳統(tǒng)一維系統(tǒng)的角度來考慮二維系統(tǒng),并將ηk(t)視為一維系統(tǒng)的狀態(tài)向量,這是文中基于LMI的迭代學(xué)習(xí)控制策略能滿足假設(shè)(3)的一個關(guān)鍵點.
初始狀態(tài)值為,?k≥1.顯然,xk(0)不等于期望的初始狀態(tài)值,存在初始狀態(tài)誤差.此外,矩陣A是穩(wěn)定的,滿足假設(shè)(1).采樣時間Ts=1ms.
使用Matlab的LMI工具箱對LMI(16)進(jìn)行求解,當(dāng) γ =0.9、ε =5 時,式(16)可解.因為 tmin=-0.026,滿足LMI有解的充要條件 tmin<0.此外,可得到X=0.2962,因此學(xué)習(xí)增益 K=X=0.2962.不確定離散線性系統(tǒng)應(yīng)用ILC學(xué)習(xí)律(3)、期望軌跡為式(24)時的仿真結(jié)果如圖1所示.顯然,基于LMI(16)求解得到的學(xué)習(xí)增益,可以保證帶有初始狀態(tài)誤差和參數(shù)不確定離散系統(tǒng)的輸出誤差2-范數(shù)是魯棒單調(diào)收斂的,當(dāng)?shù)降?3次時,輸出誤差2-范數(shù)開始趨近于0.
圖1 不確定離散線性系統(tǒng)迭代學(xué)習(xí)控制的仿真結(jié)果Fig.1 Simulation results of ILC for uncertain discrete linear system
將文獻(xiàn)[16]中的控制策略與文中的控制策略分別應(yīng)用到標(biāo)稱系統(tǒng)中進(jìn)行仿真實驗.其中參數(shù)的擾動設(shè)置為 0,即 Σ(t)=diag(0,0).文獻(xiàn)[16]中只要求I-CBK穩(wěn)定即可,文中取K=0.5,滿足漸近穩(wěn)定的要求.由定理1,通過Matlab的LMI工具箱,取γ=0.9,解 LMI(5)可得 K=X=0.1487(tmin=-0.048).這兩種策略的仿真結(jié)果如圖2所示.顯然,文中的迭代學(xué)習(xí)律可以保證系統(tǒng)的輸出誤差是單調(diào)收斂的;對于文獻(xiàn)[16]的學(xué)習(xí)增益,系統(tǒng)的迭代過程是漸近穩(wěn)定而不是單調(diào)收斂的,迭代到第398次時,系統(tǒng)的輸出誤差2-范數(shù)達(dá)到一個極大值.產(chǎn)生此種現(xiàn)象的原因是K=0.5時LMI(5)是不可解的.
圖2 兩種控制策略的仿真結(jié)果比較Fig.2 Comparison of simulation results between two control schemes
文中采用簡單的P-型迭代學(xué)習(xí)律研究帶有參數(shù)不確定性和初始狀態(tài)誤差的離散線性系統(tǒng)的魯棒單調(diào)收斂迭代學(xué)習(xí)控制問題,通過將魯棒單調(diào)迭代控制問題轉(zhuǎn)化為一維系統(tǒng)的H∞干擾抑制問題,推導(dǎo)出一個基于LMI的魯棒單調(diào)收斂的充分條件,該LMI條件還可用于確定學(xué)習(xí)律的增益.文中最后通過仿真實例驗證了該魯棒控制策略的有效性.文中研究的迭代控制算法雖然可以達(dá)到初始狀態(tài)與期望狀態(tài)不一致的要求,但在迭代過程中還需要滿足初始狀態(tài)一致的條件,因此,將此條件放寬到“迭代過程中初始狀態(tài)誤差可在一個小的有界鄰域內(nèi)任意變化”的條件是下一步研究的方向.
[1]Arimoto S,Kawamura S,Miyazaki F.Bettering operation of bobotics by learning [J].Journal of Robotic Systems,1984,1(1):123-140.
[2]Bristow D A,Tharayil M,Alleyne A G.A survey of itera-tive learning control:a learning-based method for highperformance tracking control[J].IEEE Control Systems Magazine,2006,26(3):96-114.
[3]Ahn H S,Chen Y Q,Moore K L.Iterative learning control:brief survey and categorization [J].IEEE Transactions on Systems,Man,and Cybernetics,Part C:Applications and Reviews,2007,37(6):1099-1121.
[4]Li X D,Chow Tommy W S,Ho John K L,et al.Iterative learning control with initial rectifying action for nonlinear continuous systems[J].IET Control Theory and Applications,2009,3(1):49-54.
[5]Xu J X.A survey on iterative learning control nonlinear systems [J].International Journal of Control,2011,84(7):1275-1294.
[6]田森平,謝勝利,傅予力.一種新的迭代學(xué)習(xí)控制快速算法[J].華南理工大學(xué)學(xué)報:自然科學(xué)版,2002,30(5):37-40.Tian Sen-ping,Xie Sheng-li,F(xiàn)u Yu-li.Fast algorithm of iterative learning control[J].Journal of South China University of Technology:Natural Science Edition,2002,30(5):37-40.
[7]Tayebi A,Zaremba M B.Exponential convergence of an iterative learning controller for time-varying nonlinear systems[C]∥Proceedings of the 38th Conference on Decision and Control.Phoenix:IEEE,1999:1593-1598.
[8]毛祖永,李曉東.具有迭代初始誤差的高相對度線性離散系統(tǒng)的迭代學(xué)習(xí)控制[J].控制理論與應(yīng)用,2012,29(8):1078-1081.Mai Zu-yong,Li Xiao-dong.Iterative learning control for linear discrete systems with high relative degree and iterative initial error[J].Control Theory and Applications,2012,29(8):1078-1081.
[9]Moore K L,Chen Y,Bahl V.Monotonically convergent iterative learning control for linear discrete-time systems[J].Automatica,2005,41(9):1529-1537.
[10]阮小娥,樸光賢,卞增男.迭代學(xué)習(xí)控制技術(shù)回顧與長期學(xué)習(xí)控制展望[J].控制理論與應(yīng)用,2012,29(8):966-973.Ruan Xiao-e,Park Kwang-hyun,Bian Zeng-nan.Retrospective review of some iterative learning control techniques with a comment on prospective long-term learning[J].Control Theory and Applications,2012,29(8):966-973.
[11]Wijdeven J V D,Donkers T,Bosgra O.Iterative learning control for uncertain systems:robust monotonic convergence analysis[J].Automatica,2009,45(10):2383-2391.
[12]Ahn H S,Moore K L,Chen Y Q.Stability analysis of discrete-time iterative learning control systems with interval uncertainty[J].Automatica,2007,43(5):892-902.
[13]Meng D,Jia Y,Du J,et al.Monotonically convergent iterative learning control for uncertain time-delay systems:an LMI approach[C]∥Proceeding of the American Control Conference.St Louis:IEEE,2009:1622-1627.
[14]Xie L H.Output feedback H∞control of systems with parameter uncertainty[J].International Journal of Control,1996,63(4):741-750.
[15]吳敏,桂衛(wèi)華,何勇.現(xiàn)代魯棒控制[M].2版.長沙:中南大學(xué)出版社,2006:54-56.
[16]Fang Y,Tommy W S C.2-D analysis for iterative learning controller for discrete-time systems with variable initial conditions[J].IEEE Transactions on Circuit and Systems I:Fundamental Theory and Applications,2003,50(5):722-727.