金 奎,孫明軒
(浙江工業(yè)大學(xué) 信息工程學(xué)院,浙江 杭州 310023)
輸入限幅下的迭代學(xué)習(xí)控制
金 奎,孫明軒
(浙江工業(yè)大學(xué) 信息工程學(xué)院,浙江 杭州 310023)
基于Lyapunov-like方法,提出在有限作業(yè)區(qū)間上實現(xiàn)跟蹤的帶限幅的迭代學(xué)習(xí)控制器設(shè)計.針對含有非參數(shù)化及部分參數(shù)化不確定性的非線性系統(tǒng),設(shè)計魯棒迭代學(xué)習(xí)控制器,但該方法不要求已知不確定特性的范數(shù)界.針對參數(shù)化不確定非線性系統(tǒng),設(shè)計自適應(yīng)迭代學(xué)習(xí)控制器.在系統(tǒng)滿足有界輸入有界狀態(tài)(BIBS)假設(shè)條件及控制輸入飽和限幅作用下,統(tǒng)一對上述三類系統(tǒng)進(jìn)行分析.理論分析結(jié)果表明:該方案可保證閉環(huán)系統(tǒng)中所有變量的有界性,并且跟蹤誤差能夠在整個作業(yè)區(qū)間上收斂到零,實現(xiàn)完全跟蹤.仿真驗證了該算法的有效性.
迭代學(xué)習(xí)控制;輸入限幅;有界輸入有界狀態(tài)
迭代學(xué)習(xí)控制(ILC)適于有限區(qū)間[0,T]上完成重復(fù)作業(yè)的被控對象,利用系統(tǒng)先前的控制經(jīng)驗和輸出誤差修正當(dāng)前的控制作用,使系統(tǒng)在[0,T]上實現(xiàn)輸出完全跟蹤期望的控制任務(wù)[1].二十多年來,因其能達(dá)到常規(guī)反饋控制所不能的控制品質(zhì),已越來越多地受到人們的關(guān)注.早期的迭代學(xué)習(xí)控制理論以壓縮映像方法進(jìn)行收斂性分析.近年來興起的基于Lyapunov-like方法的學(xué)習(xí)控制,能有效結(jié)合其他主流控制方法.到目前為止,已發(fā)表文獻(xiàn)大多要求非線性不確定動態(tài)特性能夠被參數(shù)化.Sadegh N 和 Kuc T 等[2-3]較早引入 Lyapunov-like函數(shù),將滿足全局Lipschitz連續(xù)條件放寬為局部Lipschitz連續(xù)條件;French M等[4]則采用微分學(xué)習(xí)律處理常參數(shù)擾動,被學(xué)習(xí)參數(shù)前一次的終值與后一次初值相同,此方法又被稱為自適應(yīng)迭代學(xué)習(xí)控制;Dixon W E 等[5]針對一類周期系統(tǒng),基于 Lyapunov-like函數(shù)設(shè)計重復(fù)控制律分析系統(tǒng)的穩(wěn)定性與收斂性;Sun Ming-xuan等[6]研究了重復(fù)學(xué)習(xí)控制,它不要求初始定位操作,也不要求被學(xué)習(xí)量滿足周期性要求,回避了迭代學(xué)習(xí)控制中初始定位誤差問題;陳為勝等[7]針對周期時滯非線性參數(shù)化系統(tǒng)設(shè)計自適應(yīng)學(xué)習(xí)控制方案.但對于非參數(shù)化不確定非線性系統(tǒng)的學(xué)習(xí)控制研究成果不多.Xu Jian-xin等[8]設(shè)計變結(jié)構(gòu)迭代學(xué)習(xí)控制,保證了系統(tǒng)的有界性與收斂性,但所設(shè)計的控制器中包含符號函數(shù);Ham C等[9]基于Lyapunov直接方法設(shè)計魯棒迭代學(xué)習(xí)控制;文[10]利用狀態(tài)反饋線性化的方法研究其在無限時間區(qū)間上周期作業(yè)的跟蹤控制問題;陳彭年等[11]提出了跟蹤周期信號的自適應(yīng)控制律,保證閉環(huán)系統(tǒng)所有信號有界和跟蹤誤差趨于零;劉麗等[12]利用控制器中的魯棒部分保證系統(tǒng)穩(wěn)定性,利用學(xué)習(xí)控制部分有效消除系統(tǒng)跟蹤誤差.
實際中,執(zhí)行器飽和特性廣泛存在,它在很大程度上影響著控制系統(tǒng)的性能,甚至破壞系統(tǒng)的穩(wěn)定性.特別對于迭代學(xué)習(xí)控制系統(tǒng),信號沿迭代軸的積分特性以及一些不可重復(fù)性因素存在,使得執(zhí)行器飽和特性對控制系統(tǒng)性能的影響尤為突出.因此,對輸入進(jìn)行限幅對改善系統(tǒng)的性能是非常有必要的.Xu Jian-xin等[13]針對控制輸入矩陣已知的非線性不確定系統(tǒng),設(shè)計帶飽和的迭代學(xué)習(xí)控制器,實現(xiàn)系統(tǒng)完全跟蹤;孫明軒等[14]針對較為廣泛的一類在有限作業(yè)區(qū)間上重復(fù)運行的非線性系統(tǒng),提出重復(fù)學(xué)習(xí)控制方法,分別針對部分限幅和完全限幅學(xué)習(xí)兩種情形,證明系統(tǒng)的有界性和收斂性.
基于Lyapunov-like方法,分別針對非參數(shù)化,部分參數(shù)化及參數(shù)化三種情形,設(shè)計魯棒迭代學(xué)習(xí)控制器及自適應(yīng)迭代學(xué)習(xí)控制器,其中所給出的魯棒迭代學(xué)習(xí)律不需利用非參數(shù)化不確定特性的范數(shù)界.在假定系統(tǒng)有界輸入有界狀態(tài)下,考慮帶限幅的控制輸入,將控制輸入限制在一預(yù)先給定的范圍內(nèi),從而使得系統(tǒng)的狀態(tài)保持有界.所設(shè)計的帶輸入限幅的迭代學(xué)習(xí)控制器,既保證了閉環(huán)系統(tǒng)的有界性,同時實現(xiàn)了在有限區(qū)間[0,T]上完全跟蹤.
考慮下述輸入限幅下不確定非線性時變系統(tǒng),即
式中:k為系統(tǒng)運行的重復(fù)次數(shù);xk(t)=[x k,1(t),x k,2(t),…,x k,n(t)]T∈Rn為可測系統(tǒng)狀態(tài);uk(t)∈R1為限幅的控制輸入,其幅值可預(yù)先給定;f(xk(t),t),g(xk(t),t)∈R1為未知的光滑非線性連續(xù)函數(shù).
考慮系統(tǒng)在區(qū)間[0,T]上重復(fù)作業(yè).給定的期望軌跡xd(t)=[x d,1(t),x d,2(t),…,x d,n(t)]T∈Rn有界,它滿足
理想控制輸入ud(t)在預(yù)定的限幅范圍內(nèi).記各個狀態(tài)分量誤差ei,k(t)=x d,i(t)-x k,i(t),i=1,2,…,n狀態(tài)誤差為
要實現(xiàn)的控制目標(biāo)是尋找合適的控制輸入uk(t),使得在其作用下的狀態(tài)誤差ek(t)在整個作業(yè)區(qū)間[0,T]上收斂于零.為方便敘述,將略寫函數(shù),例如,f k(t)=f(xk(t),t),f d(t)=f(xd(t),t).
引入誤差函數(shù)為
其中:αi(i=1,2,…,m,αm=1)為 Hurwitz系數(shù),記α=[α1,α2,…,αm-1,1]T.
對于系統(tǒng)(1),我們作如下假設(shè):
假設(shè)1 在每次迭代開始時,系統(tǒng)滿足初始定位條件xk(0)=xd(0).
假設(shè)2 系統(tǒng)滿足BIBS條件.
假設(shè)3 控制輸入矩陣g k(t)關(guān)于xk(t)滿足局部Lipschitz條件
定義標(biāo)量a的飽和函數(shù)為
式中,a*為飽和函數(shù)的幅值.
為更好地分析系統(tǒng)收斂性,首先給出關(guān)于飽和函數(shù)的性質(zhì)P1.
P1 對于等式ν=sat(μ)+d,滿足
性質(zhì)P1的證明可參見文獻(xiàn)[13]性質(zhì)2.
注2 實際系統(tǒng)的能量總是有限的,會滿足有界輸入有界狀態(tài)這一條件.
假設(shè)2可得系統(tǒng)的有界性.本節(jié)分別針對含非參數(shù)化,部分參數(shù)化及參數(shù)化不確定性的非線性系統(tǒng)進(jìn)行討論,給出了在輸入限幅下迭代學(xué)習(xí)控制的收斂性證明.
為更好分析閉環(huán)系統(tǒng)的收斂性,給出如下引理.
引理 對于系統(tǒng)狀態(tài)誤差ek及誤差函數(shù)σk,滿足不等式
證明可參見文獻(xiàn)[15]引理3.該引理將狀態(tài)誤差與誤差函數(shù)聯(lián)系起來,從而為系統(tǒng)的性能分析帶來方便.
假設(shè)4f k(t)滿足局部Lipschitz條件.
本小節(jié)包含假設(shè)1-4.根據(jù)假設(shè)2,存在未知常數(shù)l f>0,滿足
根據(jù)式(3),并對誤差指標(biāo)函數(shù)σk進(jìn)行求導(dǎo),得
選取被學(xué)習(xí)量為ud(t),通過不斷對理想控制輸入進(jìn)行學(xué)習(xí),使得系統(tǒng)的跟蹤誤差收斂于零.為此,提出以下學(xué)習(xí)律為
假設(shè)5fk可被參數(shù)化,fk=,未知函數(shù)φk滿足局部Lipschitz條件,且時變函數(shù)θ 的上界為θ*.
本小節(jié)包含假設(shè)1-3.根據(jù)假設(shè)5,存在未知常數(shù)lφ>0,滿足
類似地,系統(tǒng)的控制輸入為
本小節(jié)包含假設(shè)1-3及假設(shè)6,根據(jù)式(4)得逆系統(tǒng)方程,得
定理 對于系統(tǒng)(1),給定期望軌跡(2),當(dāng)滿足結(jié)論C1時,系統(tǒng)狀態(tài)誤差在區(qū)間[0,T]上收斂于零,即
針對f k(t)非參數(shù)化與g k(t)非參數(shù)化及f k(t)參數(shù)化與g k(t)非參數(shù)化情形下,設(shè)計全飽和的魯棒迭代學(xué)習(xí)控制器,使得輸出限定在預(yù)先設(shè)定的幅值u*范圍內(nèi);而在f k(t)參數(shù)化及(t)參數(shù)化中,分別對兩被學(xué)習(xí)參數(shù)采取限幅措施,將輸出限定在范圍內(nèi).實際中,運行系統(tǒng)的執(zhí)行器都會受到飽和限制.因此,在設(shè)計控制器時,考慮控制輸入飽和限幅,可確??刂葡到y(tǒng)性能.
選取一單級倒立擺系統(tǒng)作為被控對象.倒立擺的動態(tài)方程[16]為
式中:xk,1,xk,2分別為擺的角位移和角速度;g=9.8 m/s2為重力加速度;mc為小車的質(zhì)量;m為擺的質(zhì)量;l為擺長的一半;uk為小車的推力(控制輸入);Δfk為該系統(tǒng)的干擾部分.控制目標(biāo)是使系統(tǒng)輸出yk在[0,2π]內(nèi)跟蹤上目標(biāo)y d=0.1sin(t).選取,mc=1 kg,m=0.1 kg,l=1 m及干擾部分d=sin(t).
采用控制律式(17),對該系統(tǒng)進(jìn)行仿真,記指標(biāo)J k=supt∈[0,T]|σk|.為使指標(biāo)Jk≤0.001,系統(tǒng)需經(jīng)過k=13次迭代.參數(shù)u*和γ1分別為5和10,系統(tǒng)初值xk(0)=[0,0.1]T.
圖1-3為系統(tǒng)在式(17)的仿真結(jié)果.圖1表明,指標(biāo)Jk隨著迭代次數(shù)增加而減?。挥蓤D2知,在第13次迭代時,系統(tǒng)輸出誤差δy k=y(tǒng) d-y k精度的數(shù)量級達(dá)到10-5;圖3為第13次迭代時系統(tǒng)的控制輸入;由仿真結(jié)果表明:指標(biāo)Jk關(guān)于k單調(diào)遞減,且在第13次迭代時系統(tǒng)的跟蹤誤差精度數(shù)量級達(dá)到10-5,從而可得收斂性結(jié)論(limk→∞ek(t)=0,t∈[0,2π]);系統(tǒng)的控制輸入被限制于預(yù)先設(shè)定的范圍內(nèi)(-5~5).仿真結(jié)果與理論分析結(jié)果相符,表明所提方法是可行的.
圖1 輸入限幅下的迭代學(xué)習(xí)控制的J k軌跡Fig.1 Performance index Jk by iterative learning control with input saturation
基于Lyapunov-like方法設(shè)計了帶飽和限幅的魯棒和自適應(yīng)迭代學(xué)習(xí)控制器.分別針對含有非參數(shù)化,部分參數(shù)化及參數(shù)化不確定特性的非線性系統(tǒng),討論了限幅學(xué)習(xí)下系統(tǒng)的穩(wěn)定性與收斂性..所提方法要求系統(tǒng)滿足BIBS假設(shè)條件,如何放松這一假設(shè)條件是一個需要進(jìn)一步研究的問題.我們只研究了帶飽和限幅的迭代學(xué)習(xí)問題,如何將結(jié)論推廣到重復(fù)控制及重復(fù)學(xué)習(xí)控制中也是我們今后的工作之一.
[1]ARIMOTO S,KAWAMURA S,MIYAZAKI F.Bettering operation of robotics by learning[J].Journal of Robotic Systems,1984,1(2):123-140.
[2]SADEGH N,HOROWITZ R,KAO W W,TOMIZUKA M.A unified approach to design of adaptive and repetitive controllers for robotic manipulators[J].ASME Journal of Dynamic Systems,1990,112(4):618-629.
[3]KUC T,NAM K,LEE J.An iterative learning control of robot manipulators[J].IEEE Journal of Robotics and Automation,1990,6(7):835-841.
[4]FRENCH M,ROGERS E.Nonlinear iterative learning by an adapative Lyapunov technique[J].International of Control,2000,73(11):840-850.
[5]DIXON W E,ZERGEROGLU E,DAWSON D M,et al.Repetitive learning control:a Lyapunov-based approach[J].IEEE Transactions on Robotics,2002,32(4):538-545.
[6]SUN Ming-xuan,GE S S.Adaptive repetitive learning control of robotic manipulators without the requirement for initial repositioning[J].IEEE Transactions on Robotics,2006,22(3):563-568.
[7]陳為勝,王元亮,李俊民.周期時變時滯非線性參數(shù)化系統(tǒng)的自適應(yīng)學(xué)習(xí)控制[J].自動化學(xué)報,2008,34(12):1556-1560.
[8]XU Jian-xin,QüZhi-hua.Robust iterative learning control for a class of nonlinear systems[J].Automatica,1998,34(8):983-988.
[9]HAM C,QüZhi-hua,Kaloust J.Nonlinear learning control for a class of nonlinear systems[J].Automatica,2001,37(3):419-428.
[10]MARINO R,TOMEI P.An iterative learning control for aclass of partially feedback linearizable systems[J].IEEE Transactions on Automatic Control,2009,54(8):1991-1996..
[11]陳彭年,秦化淑.不確定非線性系統(tǒng)的周期信號自適應(yīng)跟蹤[J].系統(tǒng)科學(xué)與數(shù)學(xué),2009,29(10):1343-1352.
[12]劉麗,孫明軒.不確定時變系統(tǒng)的魯棒學(xué)習(xí)控制算法[J].控制理論與應(yīng)用,2010,27(3):323-328.
[13]XU Jian-xin,TAN Ying,LEE T H.Iterative learning control design based on composite energy function with input saturation[J].Automatica,2004,40:1371-1377.
[14]孫明軒,王鄲維,陳彭年.有限區(qū)間非線性系統(tǒng)的重復(fù)學(xué)習(xí)控制[J].中國科學(xué),2010,40(3):433-444.
[15]XU Jian-xin,CAO Wen-jun.On functional approximation of the equivalent control using learning variable structure control[J].IEEE Transactions on Automatic Control,2002,47(5):997-1006.
[16]CHIEN J C.A combined adaptive law for fuzzy iterative learning control of nonlinear systems with varying control tasks[J].IEEE Transactions on Automatic Control,2008,16(1):40-50.
Iterative learning control with input saturation
JIN Kui,SUN Ming-xuan
(College of Information Engineering,Zhejiang University of Technology,Hangzhou 310023,China)
Based on Lyapunov-like approach,an iterative learning controller with input saturaiton for tracking in the limited time interval is proposed.For a class of nonlinear systems with nonparametric and partially parametric uncertainties,a robust iterative learning controller is designed.But this method does not require the known of the uncertain norm bounds.An adaptive iterator learning controller is designed for the nonlinear system with parametric uncertainties.The three kinds of systems above are analyzed under the systems to meet the bounded input bounded state(BIBS)assumptions and limiting the role of control input saturation.The results show that the proposed learning algorithm can guarantee boundedness of all variables in closedloop system.The tracking error can be guaranteed to converge to zero over entire time interval and perfect tracking can be achieved.The simulation result shows the algorithm is effective.
iterative learning control;input saturation;bounded input bounded state
TP391.41
A
1006-4303(2011)05-0579-07
2010-04-28
國家自然科學(xué)基金資助項目(60474041,60874041)
金 奎(1985-),男,浙江嵊州人,碩士研究生,研究方向為迭代學(xué)習(xí)控制,E-mail:zjszjk@163.com.通信作者:孫明軒教授,E-mail:mxsun@zjut.edu.cn.
book=5,ebook=113
(
劉 巖)