孫玉嬌,楊洪勇,于美妍
(魯東大學(xué)信息與電氣工程學(xué)院,山東 煙臺 264025)
現(xiàn)在人工智能受到越來越多的關(guān)注,對于多機(jī)器人的編隊控制逐漸成為研究熱點。隨著機(jī)器人技術(shù)的發(fā)展,機(jī)器人被應(yīng)用到越來越多的領(lǐng)域,包括家庭、工作和社區(qū)等,機(jī)器人從各方面改變著我們的生活方式。
作為機(jī)器人家族的一種,輪式機(jī)器人是機(jī)器人運動控制的研究熱點之一。從輪式機(jī)器人運動控制入手[1],研究了在理想狀態(tài)下輪式機(jī)器人軌跡跟蹤的一般方法,通過仿真驗證了運動控制方法可行性。通過對復(fù)雜多機(jī)器人的運動一致性問題進(jìn)行研究[2],設(shè)計了一種分布式編隊控制協(xié)議,實現(xiàn)了多移動機(jī)器人的動態(tài)編隊。當(dāng)網(wǎng)絡(luò)出現(xiàn)數(shù)據(jù)包丟失和加性白噪聲等通信問題時,詹習(xí)生[3]等人采用頻域的方法研究了網(wǎng)絡(luò)化系統(tǒng)穩(wěn)定性問題,得到了網(wǎng)絡(luò)化系統(tǒng)穩(wěn)定所需信噪比的最小(極限)值。馮磊[4]研究了針對復(fù)雜環(huán)境下的編隊控制算法,并通過仿真進(jìn)行了驗證。根據(jù)機(jī)器人之間的局部信息交互,易國等[5]提出了領(lǐng)航—跟隨編隊分布式控制算法。針對非線性系統(tǒng),采用反步法和一致性理論對領(lǐng)航—跟隨編隊控制律進(jìn)行設(shè)計[6]。進(jìn)而研究了多智能體系統(tǒng)編隊避障控制算法[7],并用李雅譜諾夫穩(wěn)定性定理證明了控制器的穩(wěn)定性。后來針對基于領(lǐng)航—跟隨法的有限時間旋轉(zhuǎn)一致性問題和編隊問題進(jìn)行了研究[8]。劉海濤等[9]研究了具有參數(shù)不確定和外界干擾情況下機(jī)器人的軌跡跟蹤問題,結(jié)合Backstepping的反推設(shè)計控制器方法,提出了一種有限時間穩(wěn)定的跟蹤控制方法。王芳等[10]證明了通信拓?fù)錇槁?lián)合連通時提出的二階多智能體系統(tǒng)有限時間一致性協(xié)議的穩(wěn)定性。對于多機(jī)器人系統(tǒng),需要將問題轉(zhuǎn)換為軌跡追蹤問題[11],采用反步法逐步構(gòu)造出李雅普諾夫函數(shù),研究線性多智能體系統(tǒng)的有限時間一致性。吳小重等[12]在控制輸入受限的多機(jī)器人系統(tǒng)模型下,基于有限時間一致性,提出了有限時間編隊控制方案。針對收斂速率這一問題設(shè)計多機(jī)器人系統(tǒng)的一致性算法,應(yīng)用到多機(jī)器人編隊控制中,可以提高了收斂速率[13]。蔣國平等[14]討論了線性多機(jī)器人系統(tǒng)收斂時間的問題。王慶領(lǐng)[15]構(gòu)建了非線性機(jī)器人運動系統(tǒng),研究了飽和受限的非線性多機(jī)器人系統(tǒng)的一致性問題。
基于前面研究成果,本文擬研究非完整移動機(jī)器人系統(tǒng)的有限時間編隊控制問題。本文通過引入虛擬領(lǐng)航者把多機(jī)器人系統(tǒng)的編隊控制問題轉(zhuǎn)化為路徑跟蹤問題,構(gòu)建了具有輸入飽和受限約束的多機(jī)器人系統(tǒng)的有限時間編隊控制協(xié)議。
采用圖論知識描述非完整移動機(jī)器人間的通信拓?fù)潢P(guān)系。定義圖G=(V(G),E(G)),其中,V(G)={v1,v2,…,vn}為有限節(jié)點集,表示機(jī)器人。E(G)={e1,e2,…em}為有限邊集,由有序?qū)?vi,vj)表示機(jī)器人之間的通信連接關(guān)系:當(dāng)且僅當(dāng)?shù)趈個節(jié)點能夠直接接收第i個節(jié)點的消息時,此時,節(jié)點vj稱作節(jié)點vi的父節(jié)點,節(jié)點vi稱作節(jié)點vj的子節(jié)點。如果(vi,vj)∈E,則稱頂點i是頂點j的一個鄰居,節(jié)點vj的鄰居節(jié)點集合表示為其父節(jié)點的集合,即Nj=(vi∈V|(vj,vi)∈E)。文中,用子圖Gs的節(jié)點集V(Gs)={v1,v2,…,vn}表示跟隨者機(jī)器人集合,節(jié)點v0表示虛擬領(lǐng)導(dǎo)者機(jī)器人。跟隨者節(jié)點之間,A(Gs)=[aij]∈Rn×n,(j,i∈I,I={1,2,…,n})為加權(quán)鄰接矩陣,對于任意j,i∈I,ajj=0,aij=aji≥0(i≠j),當(dāng)(vj,vi)?E(Gs)時,aij=0,否則aij=1。在圖G中,定義向量B=(b1,b2,…,bn),當(dāng)節(jié)點v0是節(jié)點vj的鄰居節(jié)點時,bj=1,否則,bj=0。如果任意節(jié)點vj(j∈I)與節(jié)點v0之間都存在一條路徑,節(jié)點v0是全局可達(dá)的。節(jié)點vi與節(jié)點vj之間的路徑用一系列節(jié)點序列(vi,vk1),(vk1,vk2),…,(vkl,vj)表示,且若vj與vi之間有路徑存在,則稱vj與vi之間是可達(dá)的;否則稱vj與vi之間是不可達(dá)的。
定義1有向圖G的拉普拉斯矩陣定義為:
L=D-A
(1)
引理1考慮自治動力學(xué)系統(tǒng),假設(shè)存在一個C1上的連續(xù)可微函數(shù)V(x)定義在原點的領(lǐng)域,且實數(shù)c>0,α∈(0,1),使得:
1)V(x)正定;
引理3對于無向通信拓?fù)浣Y(jié)構(gòu)圖G,L(A)=[lij]∈Rn×n代表該無向圖的Laplacian矩陣,有如下性質(zhì):
引理4對于無向通信拓?fù)鋱DG,假如存在一個函數(shù)φ:R2→R滿足φ(xi,xj)=-φ(xj,xi),?i,j∈I,i≠j那么就有一組數(shù)列y1,y2,…,yn滿足:
(2)
本文的研究對象為非完整約束條件下的輪式機(jī)器人,系統(tǒng)由n+1個機(jī)器人組成,機(jī)器人序列用編號ξ={0,1,2,…,n}來表示,編號0的機(jī)器人為虛擬領(lǐng)導(dǎo)者,其余n個為跟隨者。vj表示機(jī)器人的線速度,機(jī)器人的位姿可以表示為P=[xj,yj,θj],xj、yj表示機(jī)器人的位置,θj表示機(jī)器人運動的速度向量v和X軸正方向的夾角(X-Y為全局坐標(biāo)系),wj是機(jī)器人運動的角速度,在驅(qū)動輪純滾動無滑動的情況下,機(jī)器人受非完整約束(如圖1所示),機(jī)器人j的動力學(xué)模型為:
圖1 非完整移動機(jī)器人圖
(3)
定義2非完整移動多機(jī)器人系統(tǒng)的跟隨機(jī)器人j(1≤j≤n)位姿滿足式(3)的要求,則系統(tǒng)在有限時間內(nèi)實現(xiàn)預(yù)期編隊目標(biāo)。如果式(4)成立,
(4)
考慮到多機(jī)器人系統(tǒng)的控制輸入飽和受限的條件,將機(jī)器人的坐標(biāo)變換進(jìn)行定義:
(5)
其中1≤j≤n,u1j(t)和u2j(t)為待設(shè)計的控制輸入,σμ1(u1j(t))和σμ2(u2j(t))為飽和受限下的控制輸入。定義σμ:R→R為輸入飽和函數(shù),表達(dá)式為σμ(x)=sign(x)·min{|x|,μ},μ>0;定義函數(shù)sig(x)α=sign(x)·|x|α,sign(x)為符號函數(shù),α∈(0,1)。
基于以上的設(shè)計,多機(jī)器人系統(tǒng)的動力學(xué)模型可以定義為:
(6)
其中,領(lǐng)航機(jī)器人的坐標(biāo)變換后的狀態(tài)信息如式(7):
(7)
對于非完整移動多機(jī)器人系統(tǒng),如果跟隨機(jī)器人j的各狀態(tài)量均在有限時間內(nèi)T∈[0,1)內(nèi)滿足一致性要求,則系統(tǒng)在有限時間內(nèi)收斂到預(yù)期編隊目標(biāo),即式(8)成立:
(8)
將式(5)分解為一個一階子系統(tǒng)式(9)和一個二階子系統(tǒng)式(10),設(shè)計有限時間一致性算法達(dá)到一致性要求,進(jìn)而實現(xiàn)編隊控制目標(biāo)。
(9)
(10)
下面將針對子系統(tǒng)設(shè)計有限時間一致性協(xié)議,并對一致性協(xié)議下的穩(wěn)定性進(jìn)行分析,證明非完整移動多機(jī)器人系統(tǒng)在輸入飽和受限的條件下有限時間內(nèi)能夠完成編隊控制目標(biāo)。
定理1對于無向網(wǎng)絡(luò)中的非完整移動多機(jī)器人系統(tǒng)(3),虛擬領(lǐng)導(dǎo)者是全局可達(dá)的,則對于任意初始狀態(tài),應(yīng)用設(shè)計的一致性協(xié)議,非完整移動多機(jī)器人系統(tǒng)能夠?qū)崿F(xiàn)有限時間編隊控制目標(biāo)。
證明:首先對一階子系統(tǒng)一致性進(jìn)行證明,考慮到控制輸入飽和受限的條件,提出一致性控制算法:
(11)
其中,0<α1<1,Δ1<μ1。
令跟蹤誤差為:
(12)
將式(11)求導(dǎo)后并將式(10)代入可以得到:
(13)
(14)
再由引理2可以得到:
(15)
根據(jù)引理3可以得到:
(16)
由式(14)、(15)可以得到:
(17)
由引理1知,當(dāng)t≥T(t(0))時一階子系統(tǒng)可以在有限時間內(nèi)達(dá)到一致性,此時跟隨機(jī)器人跟蹤上領(lǐng)航機(jī)器人的運動狀態(tài)。
(18)
(19)
(20)
其中,k2=2k1。
(21)
(22)
再由引理2可以得到:
(23)
(24)
由引理1可以知道二階系統(tǒng)在有限時間內(nèi)達(dá)到穩(wěn)定。
因此,一、二階子系統(tǒng)均在有限時間內(nèi)達(dá)到一致性,此時跟隨機(jī)器人均跟蹤上領(lǐng)航機(jī)器人的運動狀態(tài),非完整移動多機(jī)器人系統(tǒng)在有限時間完成編隊控制目標(biāo)。
本節(jié)對本文的理論結(jié)果進(jìn)行仿真驗證,分析非完整移動多機(jī)器人系統(tǒng)的有限時間編隊控制算法的有效性。
設(shè)由5個跟隨機(jī)器人和一個領(lǐng)航機(jī)器人組成的非完整移動多機(jī)器人系統(tǒng),用p=(x,y,θ)表示位姿信息,每個機(jī)器人的初始信息如表1所示。
表1 系統(tǒng)初始參數(shù)設(shè)置
將本文所提一致性協(xié)議應(yīng)用于多機(jī)器人系統(tǒng),將協(xié)議參數(shù)設(shè)為α1=0.8,輸入飽和參數(shù)設(shè)為Δ1=1.33,Δ2=8。仿真時間設(shè)為30 s,系統(tǒng)中機(jī)器人通信拓?fù)潢P(guān)系對應(yīng)的A矩陣和B向量分別取為
基于以上對機(jī)器人的初始參數(shù)設(shè)置,接下來對非完整移動多機(jī)器人系統(tǒng)輸入飽和受限條件下有限時間編隊控制進(jìn)行仿真,仿真結(jié)果如圖2~圖4所示。
圖2 狀態(tài)誤差z1j-z10變化曲線
圖3 狀態(tài)誤差z2j-z20變化曲線
圖4 狀態(tài)誤差z3j-z30變化曲線
圖2、圖3、圖4中的藍(lán)、橙、黃、紫、綠線分別表示跟隨機(jī)器人1-5的狀態(tài)信息,橫坐標(biāo)表示時間,單位為秒,縱坐標(biāo)分別表示角度狀態(tài)誤差,單位為弧度,x軸狀態(tài)誤差,單位為米,y軸狀態(tài)誤差,單位為米。從圖2~圖4可以看出,在一致性控制協(xié)議的作用下,隨著時間的推移,角度和位移分別在7 s,9 s,8 s的時候收斂到0,這時候表明跟隨機(jī)器人跟蹤上了領(lǐng)航機(jī)器人的運動狀態(tài)。
圖5表示機(jī)器人形成三角形編隊做圓周運動的過程,淺藍(lán)色實線表示虛擬領(lǐng)導(dǎo)者的運動軌跡,編隊由開始的正五邊形逐漸收斂成期望隊形——三角形,并一直重復(fù)進(jìn)行圓周運動。
圖5 多機(jī)器人系統(tǒng)編隊運動軌跡
把本文提出的多機(jī)器人編隊控制協(xié)議與已有成果進(jìn)行比較。圖6和圖7是機(jī)器人系統(tǒng)形成編隊所需的時間,圖6是應(yīng)用已有文獻(xiàn)[12]的控制協(xié)議得出的結(jié)果,大約6.5 s形成編隊;圖7是應(yīng)用本文的控制方法得出的結(jié)果,大約3.5 s形成編隊。由此可以看出本文設(shè)計的多機(jī)器人有限時間一致性協(xié)議,可以更加快速收斂,實現(xiàn)多機(jī)器人的運動編隊。
圖6 位置誤差與時間的關(guān)系
圖7 位置誤差與時間的關(guān)系
本文以多智能體系統(tǒng)為研究背景,以圖論為工具,研究了飽和受限多智能體有限時間一致性問題,提出了基于一致性理論的領(lǐng)導(dǎo)—跟隨方法編隊控制。隨著多智能體系統(tǒng)的廣泛應(yīng)用,關(guān)于一致性問題的研究進(jìn)展非常迅速,仍有很多問題值得進(jìn)一步探討,例如由于外界環(huán)境的干擾和系統(tǒng)模型本身的不確定性對系統(tǒng)穩(wěn)定性以及控制性能的影響,帶有模型不確定性的多智能體系統(tǒng)一致性等。