侯書超,趙 林
(青島大學(xué) 自動化學(xué)院,青島 266071)
在工業(yè)生產(chǎn)和日常生活中,機(jī)械臂由于結(jié)構(gòu)簡單、易于操作和高效等優(yōu)點得到了廣泛的應(yīng)用[1-2]。機(jī)械臂的跟蹤控制問題一直以來就是人們的研究重點,因為這需要很高的控制精度和穩(wěn)定性[3-4]。近些年來,關(guān)于機(jī)械臂的跟蹤控制問題,提出了很多的控制方法,比如模型預(yù)測控制[5]、自適應(yīng)滑模控制[6]和迭代學(xué)習(xí)算法控制等。因為機(jī)械臂通常的工作環(huán)境比較復(fù)雜,在工作時可能會受到各種干擾的影響,其模型的系統(tǒng)參數(shù)難以獲得。反步法是一種迭代控制算法[7],經(jīng)過多年的發(fā)展,目前已經(jīng)應(yīng)用到了很多領(lǐng)域,比如輸出調(diào)節(jié)、自適應(yīng)跟蹤控制[8]、滑模變結(jié)構(gòu)控制[9]等。傳統(tǒng)的反步法需要模型的具體信息,當(dāng)系統(tǒng)參數(shù)不確定時,其應(yīng)用將受到限制。反步控制通常與自適應(yīng)神經(jīng)控制[10]或自適應(yīng)模糊控制[11]相結(jié)合,以處理非線性系統(tǒng)的未知動力學(xué)建模和參數(shù)不確定性問題。對于高階非線性系統(tǒng),在反步設(shè)計過程中虛擬信號的重復(fù)微分會導(dǎo)致復(fù)雜性爆炸問題,這也限制了傳統(tǒng)反步設(shè)計在實踐中的進(jìn)一步發(fā)展。為了消除復(fù)雜性爆炸的影響,文獻(xiàn)[12]提出了動態(tài)面控制,引入了一階濾波器來解決虛擬信號的重復(fù)微分問題。當(dāng)動態(tài)面控制與神經(jīng)網(wǎng)絡(luò)或模糊邏輯系統(tǒng)逼近技術(shù)相結(jié)合時,它可以用于處理非線性系統(tǒng),比如機(jī)械臂系統(tǒng)的跟蹤問題[13-14]。然而,一階濾波器的引入將會帶來濾波誤差。在文獻(xiàn)[15]中首次提出了命令濾波反步法,這是一種改進(jìn)的反步控制方法,它將虛擬信號的導(dǎo)數(shù)近似代替命令濾波器的輸出。命令濾波反步法不僅可以解決復(fù)雜性爆炸問題,還可以通過結(jié)合補償信號來消除濾波誤差。雖然這些控制算法在理論上已經(jīng)取得了成功,但它們大多都是漸近穩(wěn)定,跟蹤誤差的上界無法確定。
對于機(jī)械臂系統(tǒng)的跟蹤問題,收斂時間是一個非常重要的指標(biāo),因此漸近收斂存在明顯的缺陷?;谶@個考慮,有學(xué)者提出了有限時間控制方法[16],可以使系統(tǒng)狀態(tài)在預(yù)期時間內(nèi)快速收斂。當(dāng)初始狀態(tài)接近平衡狀態(tài)時,有限時間控制比漸近收斂具有更好的控制性能,如收斂速度更快和更好的抗干擾能力。近些年來,有限時間機(jī)械臂控制研究[17-18]受初始值影響較大,當(dāng)初始值遠(yuǎn)離平衡態(tài)時,收斂時間會變慢。固定時間控制[19]的收斂時間是預(yù)先確定的,與初始狀態(tài)無關(guān)。固定時間機(jī)械臂控制考慮[20-21]最終的跟蹤誤差收斂到原點附近期望的領(lǐng)域內(nèi)。但齒隙廣泛存在于物理系統(tǒng)和設(shè)備中,比如電磁、機(jī)械等領(lǐng)域執(zhí)行器和機(jī)械手系統(tǒng)。雖然目前已經(jīng)有了針對齒隙問題的控制方案,但是對于不確定的機(jī)械臂系統(tǒng),同時考慮齒隙和固定時間的研究很少?;诖丝紤],本文將對帶有齒隙的不確定機(jī)械臂系統(tǒng),提出一種固定時間命令濾波反步方法。相比于其他方法,本文主要優(yōu)點如下所示:
(1)對比于文獻(xiàn)[17-18]中的有限時間機(jī)械臂系統(tǒng),本文使用固定時間控制,不受系統(tǒng)初始狀態(tài)影響,最后的收斂速度也會更快且更加穩(wěn)定;
(2)對比于文獻(xiàn)[20-21]中的固定時間機(jī)械臂系統(tǒng),本文使用命令濾波反步法,不僅避免了復(fù)雜性爆炸問題,而且結(jié)合補償信號消除了濾波誤差的影響,跟蹤誤差收斂到原點附近期望的足夠小的鄰域。
引理1[9]:對于正數(shù)λ1>0,λ2>0,γ∈(0,∞),如果一個連續(xù)函數(shù)滿足條件V˙(T)≤-λ1Va(t)-λ2Vb(t)+γ,存在?∈(0,1),那么V(t)將在時間Tr內(nèi)收斂到平衡點,Tr≤Tmax=
引理2[9]:存在一個正常數(shù)h>0,r>0 而且?(m,j)>0 滿足以下不等式:
引理3:對于xi∈R,i=1,…,N,0<q≤1,有以下不等式:
本文所研究的機(jī)械臂的動力學(xué)模型如下:
式中:q∈Rn,∈Rn,∈Rn分別表示關(guān)節(jié)的位置、速度和加速度;M(q)∈Rn×n為對稱正定慣性矩陣;C(q,)∈Rn×n為科里奧利向心矩陣;G(q)∈Rn為模型的重力力矩;ψ=?(τ)為關(guān)節(jié)力矩,由齒隙特征描述,τ= [τ1,…,τn]T∈Rn,?(τ)= [?1(τ1),…,?n(τn)]T∈Rn×n,而且有
式中:D>0 代表直線的恒定斜率,Sr>0,Sl<0 是恒定參數(shù),?i(t_)則代表?i(τi)沒有變化。
假設(shè)1:齒隙參數(shù)在已知范圍內(nèi)
然后,將?(τ)改寫為
式中:d(τ)= [d1(τ1),…,dn(τn) ]T,而且有
假設(shè)2:根據(jù)上述等式(5)和假設(shè)1,di(τi)滿足,其中λ 可表示為
注1:式(2)中的D 表示斜率,Sl和Sr表示非光滑齒隙非線性的寬度,所以在假設(shè)1 中的有界性假設(shè)是合理的。根據(jù)式(5)中di(τi)的定義,知道di(τi)是有界的,而控制器設(shè)計中不需要有界的λ。
關(guān)于動力學(xué)模型,如式(1),進(jìn)一步給出了以下性質(zhì):
性質(zhì)1:0<km1In<M(q)<km2In,其中km1,km2都是已知的正常數(shù)。
性質(zhì)2:動力學(xué)模型,如式(1),是具有未知動力學(xué)參數(shù)θ∈Rr1的線性參數(shù)。
性質(zhì)3:對于任何x∈Rn,都有xT(M˙(q)-2C(q,q˙))x=0。定義新的變量為
然后等式(1)可以被改寫為
式中:y∈Rn是系統(tǒng)的輸出。
將跟蹤誤差信號定義為
式中:xd是期望的輸 出信號;xi,c是 固定時間命令濾波器的輸出:
式中:αi-1是命令濾波器的輸入,i=2,…,n,ηi>0 是一個小的常數(shù),0<p<1,q>1。
定義虛擬控制信號α1和控制器τ 分別為
式中:k1,k2,c11,c12,c21,c22均為正常數(shù),關(guān)于自適應(yīng)更新律的定義如下:
式中:ρ>0,Γ 是一個正定對稱矩陣。定義補償跟蹤誤差信號如下:
式中:ξ1是誤差補償,而且:
定理1:對于機(jī)械臂系統(tǒng)來說,如式(1),如果虛擬控制信號α1和控制力矩τ 選取類似于式(12),誤差補償機(jī)制如式(15),自適應(yīng)更新律如式(13),那么跟蹤誤差會在固定時間內(nèi)收斂到原點附近的一個很小的期望鄰域內(nèi),而且閉環(huán)系統(tǒng)內(nèi)所有信號都有界。
證明:選擇李雅普諾夫函數(shù)為
對V1進(jìn)行求導(dǎo)得到:
接下來把α1和代入式(17),得到:
選擇另一個李雅普諾夫函數(shù):
同樣對V2求導(dǎo)得到:
根據(jù)性質(zhì)2 和性質(zhì)3 可得:
根據(jù)楊氏不等式,有:
代入式(22)可得:
根據(jù)引理2,可以得到以下不等式:
將式(25)的結(jié)果代入式(24)中,得到:
接下來考慮補償系統(tǒng)的李雅普諾夫函數(shù):
對式(27)求導(dǎo)得到:
根據(jù)有界性原則,有以下不等式:
代入可得:
設(shè)計李雅普諾夫函數(shù)
選擇李雅普諾夫函數(shù)
有:
根據(jù)不等式的性質(zhì),可以得到:
C1,C2都是設(shè)計的參數(shù)而且都大于0,根據(jù)前文的引理2,得到以下兩個不等式:
所以可得到:
令
則不等式(40)可以轉(zhuǎn)化為
其中:
根據(jù)以上的分析,存在一個常數(shù)0<?<1,使得?i最終在固定時間內(nèi)收斂到:
而且ξi在固定時間內(nèi)收斂到:
固定時間
注2:式(12)中的虛擬信號α1用來保證等式(9)中的第1 個子系統(tǒng)在第1 步的反步設(shè)計過程中有期望的性能。然而傳統(tǒng)的反步法對需要α1反復(fù)求導(dǎo),這會導(dǎo)致復(fù)雜性爆炸問題,如式(20)及式(22~26)所示。本文中使用命令濾波器的輸出來代替虛擬信號的導(dǎo)數(shù)α˙1,可以簡化計算過程。在濾波器如式(11)達(dá)到穩(wěn)定之前,濾波誤差(x2,c-α1)都會存在并且影響控制質(zhì)量。等式(15)的誤差補償機(jī)制可以消除濾波誤差帶來的影響,提高系統(tǒng)控制質(zhì)量,保證所需的控制性能。
注3:為了實現(xiàn)定理1,在參數(shù)選擇上,需要滿足以下要求:
由式(14)和式(46)~式(47)可得,跟蹤誤差的半徑由Δ1和Δ2決定,Δ1,Δ2的取值越大,跟蹤誤差的半徑就會越小。同理,固定時間控制的收斂時間Tr也和Δ1,Δ2有關(guān),Δ1,Δ2的取值越大,收斂時間越短,收斂速度就越快。
在本節(jié)中,將提出的算法應(yīng)用到單連桿機(jī)械臂系統(tǒng)中,利用Matlab 軟件進(jìn)行仿真分析,來證明此算法的有效性。單連桿關(guān)節(jié)機(jī)械臂系統(tǒng)的動態(tài)方程如下:
根據(jù)式(9),將下列方程作為本次仿真的研究對象:
式中:M=0.5,g=10,L=1,P=1,J=1。在仿真程序中,定義初始值為q(0)=0.159π rad,期望的輸出信號為xd=sin(t)rad。在參數(shù)選擇上,c11=c12=4,c21=c22=4,0.2,0.2}。關(guān)于齒隙參數(shù),選擇D=1,Sr=1,Sl=1。對于前文的性質(zhì)2 來說:
選擇動態(tài)回歸矩陣和θ:
虛擬控制信號α1和控制器τ 分別為
補償信號為
通過仿真得到的響應(yīng)曲線,如圖1~圖5所示。圖1展示了在固定時間控制下,關(guān)節(jié)構(gòu)型向量q 和期望輸出信號xd的跟蹤曲線圖,從圖中可以看出跟蹤效果良好。圖2是自適應(yīng)律?^的響應(yīng)曲線圖,可以看出,機(jī)械臂的關(guān)節(jié)配置向量最終在固定時間內(nèi)以足夠的精度收斂到參考信號,這意味著盡管存在不確定參數(shù)和未知齒隙,但仍能保證期望的跟蹤誤差。圖3是固定時間下濾波器輸出x2,c和虛擬控制信號α1的響應(yīng)曲線圖,可以看出在固定時間濾波器的作用下,虛擬控制信號被快速濾波。圖4和圖5分別是在固定時間控制和有限時間控制下,通過改變關(guān)節(jié)構(gòu)型向量的初始值q(0)來驗證固定時間的控制效果,以及對比有限時間控制的優(yōu)點。從這兩張圖可以看出,相比于有限時間控制,固定時間控制的收斂速度更快,而且不受初始狀態(tài)的影響,隨著時間的推移,最后的跟蹤誤差也更小,精確度更高。
圖1 機(jī)械臂系統(tǒng)的q 和xd 跟蹤響應(yīng)曲線Fig.1 Tracking response curve of q and xd of manipulator system
圖2 固定時間控制下(z=1,2,3,…)的響應(yīng)曲線Fig.2 Response curve of (z=1,2,3,…) under the fixed-time control
圖3 固定時間控制下的x2,c 和α1 的響應(yīng)曲線Fig.3 Response curve of x2,c and α1 under the fixed-time control
圖4 固定時間控制下改變初始值q(0)的響應(yīng)曲線Fig.4 Response curve of changing initial value q(0)under fixed time control
圖5 有限時間控制下改變初始值q(0)的響應(yīng)曲線Fig.5 Response curve of changing initial value q(0)under finite time control
針對參數(shù)不確定、齒隙未知的機(jī)械臂系統(tǒng),本文提出了一種自適應(yīng)固定時間命令濾波反步法來實現(xiàn)跟蹤控制。在高階非線性系統(tǒng)中,由于傳統(tǒng)反步法對虛擬控制信號的反復(fù)求導(dǎo)會導(dǎo)致復(fù)雜性爆炸,本文引入固定時間命令濾波器,用濾波器的輸出來代替虛擬控制信號的導(dǎo)數(shù),以此來避免復(fù)雜性爆炸問題。而且,提出的誤差補償機(jī)制可以補償濾波誤差,得到更好的控制質(zhì)量。因為固定時間控制的收斂時間是預(yù)先確定的,所以本文所使用的固定時間控制算法,可以不受初始狀態(tài)的影響。最終,閉環(huán)系統(tǒng)內(nèi)所有信號都有節(jié)且收斂,跟蹤誤差也在固定時間內(nèi)收斂到原點附近的期望領(lǐng)域內(nèi)。