張 普, 薛惠鋒, 高 山, 左 軒
(西北工業(yè)大學(xué)自動化學(xué)院, 陜西 西安 710129)
近年來,多智能體協(xié)同控制在現(xiàn)代工業(yè)、軍事以及民用領(lǐng)域的廣泛應(yīng)用,如智能機器人、無人機、電網(wǎng)系統(tǒng)、衛(wèi)星姿態(tài)等,吸引了大量學(xué)者的廣泛關(guān)注,如編隊控制[1-3]、協(xié)同追蹤控制[4-6]、協(xié)同容錯控制[7-9]、聚合一致性控制[10]、復(fù)雜動態(tài)網(wǎng)絡(luò)協(xié)同控制[11]、城市交通網(wǎng)絡(luò)擁堵協(xié)同控制[12]、傳感器網(wǎng)絡(luò)估計[13]、復(fù)雜系統(tǒng)協(xié)同控制等[14],其中多智能體協(xié)同跟蹤控制是該領(lǐng)域最典型的熱點研究問題之一。在已有多智能體跟蹤研究中,所采用的模型均具有零輸入狀態(tài)的同構(gòu)跟隨者,而且領(lǐng)航者的位置和速度信息是已知的;此外,所采用的參考軌跡均已規(guī)劃好,即給定已知參考軌跡。然而,在實際應(yīng)用中,通常參考軌跡是按照時間函數(shù)變化的,并通過分布式控制實現(xiàn)協(xié)同跟蹤。
值得注意的是,與一般單系統(tǒng)的跟蹤控制相比,多智能體分布式協(xié)同跟蹤控制的局限性在于,多智能體編隊系統(tǒng)中只有個別智能體能夠獲得關(guān)于期望軌跡的全部信息,使得彼此之間的信息交互不全,導(dǎo)致跟蹤效果差。針對這一問題,已有文獻采用不同方法進行了相關(guān)研究。比如,基于行為法[15-16]、虛擬結(jié)構(gòu)法[17-18]、領(lǐng)導(dǎo)-跟蹤法[19-21]、基于圖論法[22]以及人工勢場法[23]等。然而,在實際應(yīng)用中,這些方法在解決高階非線性、系統(tǒng)參數(shù)未知或參數(shù)不確定、通信寬帶有限、有限時間收斂、輸入控制有界、網(wǎng)絡(luò)拓撲連通性差、智能體之間數(shù)據(jù)丟失以及自身通訊能力弱等問題時,仍具有一定的局限性。因此,研究多智能體編隊系統(tǒng)分布式自適應(yīng)控制策略,對于含有以上約束的該系統(tǒng)協(xié)同跟蹤研究具有一定的理論意義和工程應(yīng)用價值。
針對線性多智能體編隊系統(tǒng)在協(xié)同跟蹤中的研究,文獻[24]采用一種分布式自適應(yīng)的方法,研究了帶有未知參數(shù)的高階線性多智能體系統(tǒng),并給出了該系統(tǒng)實現(xiàn)協(xié)同跟蹤的充要條件是網(wǎng)絡(luò)拓撲中大部分智能體之間的交互通訊信號可測量。Ren[25]等人基于低增益反饋理論和李雅普諾夫穩(wěn)定性理論,針對具有切換拓撲結(jié)構(gòu)的二階非線性多智能體系統(tǒng),設(shè)計了一種控制協(xié)同跟蹤控制律,能夠有效地解決該系統(tǒng)在特定約束下的一致性跟蹤問題。文獻[26]針對智能體之間缺乏交互信息而不能保持一致的問題,提出了一種分布式線性協(xié)議方法,設(shè)計了一種協(xié)同跟蹤控制律,使得智能體之間在缺乏信息的情況下,能夠?qū)崿F(xiàn)一致性跟蹤的目的。
針對非線性多智能體系統(tǒng)的一致跟蹤研究,Yu[27]等人針對含有未知非線性部分的二階多智能體系統(tǒng),采用一種平均脈沖間隔和脈沖增益方法,有效地解決了二階非線性多智能體的耦合編隊跟蹤問題。Wang[28]等人針對追隨者信息未知的二階非線性多智能體系統(tǒng),采用分布式魯棒自適應(yīng)方法,有效地實現(xiàn)了該系統(tǒng)在有限時間的一致跟蹤。文獻[29]針對多智能體在拓撲信息交互動態(tài)時變下的一致性問題,基于圖論提出了多智能體系統(tǒng)實現(xiàn)一致性的條件是智能體之間的有向圖有足夠多的生成樹。文獻[30]針對通訊信號擁堵的二階非線性多智能體系統(tǒng),采用自適應(yīng)量化和控制通訊信號變化的方法,初步實現(xiàn)了對多智能體的輸入輸出量化反饋控制,有效地實現(xiàn)了該系統(tǒng)的一致性跟蹤。文獻[31]針對含有未知參數(shù)及干擾不確定的高階非線性多智能體系統(tǒng),提出一種自適應(yīng)模糊迭代學(xué)習(xí)算法,有效地實現(xiàn)了多智能體在某一區(qū)間內(nèi)能夠平穩(wěn)追蹤目標(biāo)的目的。文獻[32]針對高階非線性多智能體中存在集中信息干擾的問題,采用了一種分布式EOS拓展?fàn)顟B(tài)觀測器的新方法,有效地實現(xiàn)了該系統(tǒng)的一致性跟蹤。
綜上所述,對于智能體之間信息可測且網(wǎng)絡(luò)通信狀況良好的多智能體系統(tǒng),采用分布式自適應(yīng)方法能夠有效地實現(xiàn)系統(tǒng)的協(xié)同跟蹤控制。然而,對于智能體之間存在信息失真、丟包、延遲、網(wǎng)絡(luò)通信較弱、間歇性通訊等問題的高階非線性多智能體系統(tǒng),目前仍然沒有成熟和統(tǒng)一的控制律設(shè)計規(guī)則,能夠保證智能體實現(xiàn)預(yù)設(shè)性能的協(xié)同跟蹤。
因此,本文在文獻[27,32]研究的基礎(chǔ)上,針對多智能體編隊系統(tǒng)協(xié)同跟蹤的問題,研究其在弱通訊情況下的協(xié)同跟蹤控制,即跟蹤收斂性和跟蹤效果研究。通過對多智能體系統(tǒng)模型中的不同參數(shù)進行估計,使得智能體在平面內(nèi)整個追蹤過程中,對縱向、橫向以及任意兩個智能體之間的相對距離誤差進行補償控制,以保證其誤差快速收斂;同時引入時變參考軌跡,克服了常規(guī)的給定參考路徑的局限性,有利于工程實踐。相比文獻[27,32]的研究,本文的創(chuàng)新點為:① 基于反推技術(shù)和時變參考軌跡策略,能夠使多智能體在弱通訊情況下實現(xiàn)快速跟蹤,并保持一致性;② 能夠使在多智能體平面跟蹤過程中,其橫向跟蹤誤差、縱向跟蹤誤差、鎮(zhèn)定誤差以及任意兩個智能體之間的相對距離誤差均快速收斂;③ 針對系統(tǒng)中的不確定參數(shù)和非一致動態(tài)的非線性子系統(tǒng),所提方法能夠?qū)ζ溥M行準(zhǔn)確的估計,以便對該系統(tǒng)進行補償控制,實現(xiàn)有效的跟蹤。同時,該方法能夠應(yīng)用于多智能體編隊系統(tǒng)協(xié)同控制,實現(xiàn)以最優(yōu)軌跡避開障礙物,并保持穩(wěn)定跟蹤。
考慮由N個智能體組成的高階非線性系統(tǒng),這些智能體分別標(biāo)記為1,2,…,N。智能體之間的拓撲交互信息用圖論中的G=V×E表示,其中點集V={1,2,…,N}分別代表了N個智能體,邊集E=V×V。每個智能體#i可以與其鄰近的智能體進行信息交換。圖G的鄰接矩陣用A表示,其矩陣中元素aij=1表示智能體#i可以接受智能體#j的信息,反之a(chǎn)ij=0。在網(wǎng)絡(luò)拓撲結(jié)構(gòu)中,度矩陣采用D表示,其中D=diag{d1,d2,…,dN},di=card{j:(i,j)=E}。定義拉普拉斯矩陣為L=D-A。其中,D[dij]∈Rp×p稱為入度矩陣,當(dāng)i≠j時,dij=0;否則,
弱通訊是指智能體之間信息交互與共享過程中存在周期性間歇或者時延,會嚴重影響智能體系統(tǒng)的跟蹤或者協(xié)同控制。多智能體系統(tǒng)協(xié)同跟蹤過程中存在弱通訊,如圖1所示。
圖1 智能體之間信息交互弱通訊示意圖Fig.1 Schematic diagram of weak communication for information interaction among agents
在圖1中,弱通訊主要分為兩種類型:
(1) 完全周期性間歇。在有向圖中,智能體與其鄰近的智能體之間的信息傳遞會出現(xiàn)周期性中斷,則稱之為完全周期性間歇。
(2) 部分周期性間歇。在有向圖中相鄰僚機之間保持信息交互,但僚機與長機之間信息交互會出現(xiàn)周期性中斷,則稱之為部分周期性間歇。
引理 1對于多智能體系統(tǒng),如果滿足
(1)
則其能夠?qū)崿F(xiàn)信息的一致性。其中,x和v分別表示智能體的位置和速度,(i,j)表示兩個不同的智能體?;谑?1),t同時滿足圖1弱通訊傳輸?shù)臈l件,這也是本文基于此設(shè)計控制律的依據(jù)。
引理 2在圖1中,對于T>0,在間隔[mT,(m+1)T]內(nèi),定義信息的傳輸速率為ρ=δ/T。其中δ表示在有信號的情形下,傳輸過程所需要的時間,T表示在弱通訊情形下信號傳輸?shù)闹芷?包括有信號傳輸和無信號傳輸,其表達式為
(2)
式中,m∈Ν;k表示任意兩個智能體在信息傳遞過程的權(quán)重因子,其大小取決于其拓撲結(jié)構(gòu)中的拉普拉斯矩陣L;z表示跟蹤誤差;ui(t)表示第i個智能體的控制輸入。
針對含有弱通訊的多智能體系統(tǒng),建立其非線性模型:
(3)
Q(u)=p(u)u+Δ(u)
(4)
式中,Δ(u)表示任意兩個智能體在弱通訊情形下的控制信號誤差。在多智能體跟蹤過程中,視為一種干擾項。本文所設(shè)計的控制律是為了消除這種擾動對追蹤效果的影響。除此之外,p(u)的值取決于輸入信號的死區(qū)范圍:
(5)
式中,umin和umax分別表示控制信號u的死區(qū)上、下邊界。
在任意兩個智能體之間通訊正常,但通訊信號強度較弱情況下,其信號誤差滿足
Δ(u)≤λ|u|
(6)
式中,λ表示實常數(shù)。
在慣性坐標(biāo)下,領(lǐng)航者的導(dǎo)航模型為
(7)
式(7)對時間求導(dǎo),可得
(8)
式中,(ax,ay,az)表示空間3個方向的加速度。
根據(jù)式(8),可得領(lǐng)航者的動力學(xué)方程:
(9)
式中,(Fx,Fy,Fz)表示空間3個方向的力;m表示領(lǐng)航智能體的質(zhì)量。
引理 3存在正實數(shù)a,b,p,q,滿足1/p+1/q=1,則ab≤1/pap+1/qbq, 等號成立當(dāng)且僅當(dāng)ap=bq,此為楊氏不等式理論。
假設(shè) 1多智能體編隊系統(tǒng)的通信拓撲圖G是固定且有向的,確保多智能體編隊系統(tǒng)在追蹤過程中保持隊形恒定。
在追蹤控制律設(shè)計過程中,為了消除非線部分Δ(u),根據(jù)引理3,有
(10)
于是,可得
則式(10)成立。
假設(shè) 2多智能體之間的通訊是正常且順暢,僅信號的強度不同。
假設(shè) 3參考軌跡yr是光滑有界的,且對于整個編隊系統(tǒng)均已知,以此確保多智能體編隊系統(tǒng)均按照時變的參考軌跡跟蹤期望的位置信號,然后按照預(yù)設(shè)的隊形運動。
為避免在此跟蹤過程中多智能體與障礙物之間發(fā)生碰撞,引入人工勢場法建立多智能體避障模型,即智能體和障礙物帶有同種電荷時相互排斥,帶異種電荷時相互吸引。多智能體中任意一個智能體所受的合力為
fc i(t)=fi a(t)+fi r(t)+h(t)
(11)
式中,fc i表示第i個智能體所受的合力;fi a表示第i個智能體所受的引力;fi r(t)表示第i個智能體所受的斥力;h(t)表示調(diào)節(jié)函數(shù)。由于多智能體在追蹤過程中,易出現(xiàn)局部極小值點,為了打破這一平衡狀態(tài),設(shè)計函數(shù)
(12)
式中,sign(ε)表示自變量為ε的符號函數(shù),ε為很小的正常數(shù)。
除此之外,每個智能體所受的合力為
(13)
式中,mi和mj分別表示第i和j個智能體的質(zhì)量;rij表示第i個智能體與第j個智能體之間的相對距離;bij表示拉普拉斯矩陣L中第ij項的數(shù)值。
當(dāng)智能體靠近障礙物時,其相對距離變小,智能體所受的斥力大于引力,合力表現(xiàn)為斥力,智能體會遠離障礙物;當(dāng)智能體與障礙物遠離時,其相對距離減小,智能體所受的引力大于斥力,合力表現(xiàn)為引力,智能體會靠近障礙物;當(dāng)智能體與障礙物的相對距離為特定值時,斥力等于引力,此時會出現(xiàn)局部最小值點,通過函數(shù)h(t)微調(diào)其合力,表現(xiàn)為斥力或者引力,使智能體打破平衡狀態(tài)。同時,多智能體編隊系統(tǒng)以時變的參考估計跟蹤目標(biāo),因此多智能體會以最優(yōu)路徑避開障礙物,跟蹤運動目標(biāo),并保持隊形不變。
在本文中,多智能體系統(tǒng)由N個智能體構(gòu)成“領(lǐng)航者-跟隨者”分布式模式的編隊結(jié)構(gòu),其中包含1個領(lǐng)航者,N-1個追隨者?;谙到y(tǒng)模型式(3)、領(lǐng)航者動力學(xué)模型式(9)和避障模型式(11),針對弱通訊中完全周期性間歇的多智能體系統(tǒng),采用自適應(yīng)反演控制方法進行協(xié)同跟蹤控制律設(shè)計,以避開障礙物實現(xiàn)協(xié)同跟蹤。
定義智能體的追蹤誤差為
ki(yi(t)-yr(t))
(14)
式中,i=1,2,…,n,aij表示智能體#i和智能體#j之間信息傳遞的權(quán)重系數(shù);ki表示正常系數(shù);yi-yj表示智能體#i和智能體#j之間的相對距離差;yr為參考軌跡。
定義新誤差為
zi,2(t)=xi,2(t)-αi,1(t)
(15)
式(14)對時間求導(dǎo),并將式(15)代入求導(dǎo)結(jié)果,整理化簡得
(16)
構(gòu)造李雅普諾夫函數(shù):
(17)
式(17)對時間求導(dǎo),并將式(14)代入求導(dǎo)結(jié)果,整理可得
(18)
由式(18)可得虛擬控制律和調(diào)節(jié)函數(shù),分別表示為
(19)
(20)
將式(19)和式(20)代入式(18),可得
(21)
同時,將式(19)代入式(16),整理化簡可得
(22)
定義新誤差為
zi,3(t)=xi,3(t)-αi,2(t)
(23)
式(15)對時間求導(dǎo),并結(jié)合式(23),可得
(24)
式(19)對時間求導(dǎo),可得
(25)
將式(25)代入式(24),可得
(26)
構(gòu)造李雅普諾夫函數(shù)
(27)
式(27)對時間求導(dǎo),可得
(28)
將式(21)和式(26)代入式(28),可得
(29)
同理,由式(29)可得調(diào)節(jié)函數(shù)和虛擬控制律,分別表示為
(31)
將式(30)和式(31)代入式(29),可得
(32)
將式(31)代入式(26),可得
(33)
定義新誤差為
zi,q+1(t)=xi,q+1(t)-αi,q(t)
(34)
(35)
構(gòu)造李雅普諾夫函數(shù):
(36)
式中,Vi,q -1是第q-1步迭代設(shè)計過程中的李雅普諾夫函數(shù)。
(37)
由式(37)可得調(diào)節(jié)函數(shù)和虛擬控制律,分別表示為
(38)
αi,q(t)=-zi,q -1(t)-cqzi,q(t)-
(39)
定義誤差為
zi,n(t)=xi,n(t)-αi,n -1(t)
(40)
(41)
構(gòu)造李雅普諾夫函數(shù):
(42)
式中,Vi,n -1(t)是第n-1步迭代設(shè)計過程中的李雅普諾夫函數(shù)。
(43)
根據(jù)式(3)和式(4),結(jié)合式(43),可得調(diào)節(jié)函數(shù)和最終控制律分別為
(44)
(45)
因此,式(45)表示多智能體編隊系統(tǒng)處于弱通訊環(huán)境中的協(xié)同跟蹤控制律,確保系統(tǒng)穩(wěn)定。而多智能體編隊系統(tǒng)的模型為高階非線性系統(tǒng),于是所設(shè)計的控制律為n階非線性系統(tǒng)的追蹤控制律,包含給定的常系數(shù)、更新律以及跟蹤誤差。對于仿真驗證而言,給定二階系統(tǒng),即n=2,結(jié)合領(lǐng)航者動力學(xué)模型、初始設(shè)置的參數(shù),就可以得出具體的控制律:
(46)
將式(44)和式(45)代入式(43),可得
(47)
針對系統(tǒng)模型式(3),所設(shè)計的分布式自適應(yīng)跟蹤控制律和參數(shù)自適應(yīng)更新律,能夠使多智能體編隊系統(tǒng)跟蹤期望的指定位置,同時保持一致。在滿足假設(shè)1和假設(shè)2的條件下,為了驗證所設(shè)計的控制律在多智能體系統(tǒng)跟蹤和保持協(xié)同過程中系統(tǒng)的穩(wěn)定性,構(gòu)造整個多智能體編隊系統(tǒng)的二次型函數(shù)為
VN(t)=Vi,1(t)+Vi,2(t)+Vi,3(t)+…+Vi,n(t)=
(48)
式(48)對時間求導(dǎo),可得
(49)
(50)
式中,ck>0(k=1,2,…,n)。
圖2 障礙物、智能體以及目標(biāo)之間的受力關(guān)系圖Fig.2 Diagram of the force relationship among obstacle, agent and target
(51)
式中,多智能體編隊系統(tǒng)所受的合力為0,則多智能體之間的隊形保持不變,而且編隊系統(tǒng)避開障礙物,同時在完全周期性間歇情形下實現(xiàn)跟蹤的目的。在跟蹤和隊形保持過程中,智能體之間需要實時進行信息的傳遞,而在受限狀態(tài)(弱通訊)下,即信號時強時弱,導(dǎo)致通信受阻難以完成跟蹤與隊形保持任務(wù),而且極易發(fā)生碰撞。因此,本文設(shè)計了擾動補償控制律,能夠使多智能體編隊系統(tǒng)在受限狀態(tài)下依舊保持跟蹤效果和恒定隊形。
在本節(jié)中,采用5個智能體作為被控對象構(gòu)成多智能體編隊系統(tǒng),其中包含1個領(lǐng)航者(編號為5)和4個跟隨者(編號為1, 2, 3, 4)。每個智能體結(jié)構(gòu)和尺寸都相等,即是同構(gòu)的。同時,每個智能體具有相同的運動特性,包含相同的偏航角和相對位置;這5個智能體在平面內(nèi)運動,且其通訊是順暢的,拓撲結(jié)構(gòu)示意圖如圖3所示。
圖3 多智能體系統(tǒng)拓撲結(jié)構(gòu)示意圖Fig.3 Structure schematic diagram of the multi-agent system topology
表1 5個智能體的初始位置,期望指定位置以及參數(shù)估計值
由第1.1節(jié)圖論可知,鄰接矩陣A,度矩陣D以及拉普拉斯矩陣L,其關(guān)系為
L=D-A
(52)
同時,結(jié)合第1.1節(jié),圖3以及式(52),可得
為了驗證在弱通訊情況下所提方法在多智能體編隊追蹤過程中的收斂性,基于多智能體的系統(tǒng)模型和領(lǐng)航者的動力學(xué)模型,結(jié)合自適應(yīng)反推技術(shù),采用5個智能體進行仿真實驗,其結(jié)果如圖4~圖6所示。
圖4 多智能體系統(tǒng)前行速度誤差曲線Fig.4 Forward speed error curve of the multi-agent system
圖5 參數(shù)誤差曲線Fig.5 Curve of parameter error
圖6 鎮(zhèn)定誤差曲線Fig.6 Curve of stabilization error
圖4給出了多智能體系統(tǒng)前行速度誤差曲線。由圖4可知,隨著時間的變化,曲線大致呈現(xiàn)先緩慢減小后趨于穩(wěn)定的狀態(tài)。這是由于每個智能體從不同的位置出發(fā),各自以時變的參考軌跡運動,跟蹤各自期望的指定位置。在每個智能體跟蹤上各自期望的指定位置前,每個智能體與期望指定位置之間的相對速度逐漸縮小,相應(yīng)智能體前行速度誤差也相應(yīng)減小,當(dāng)智能體跟蹤上期望的指定位置時,此時指定期望位置也在運動,但是智能體的實際位置與指定的期望位置之間保持恒定的距離。因此,智能體的前行速度誤差基本接近0,并保持這種速度運動,協(xié)同達到一致運動的目的。在10 s之前,智能體#3和智能體#4曲線下降速度快,而智能體#5緩慢上升,這是由于其起點位置不同,而且初速度也不同,這使得每個智能體與期望的指定位置存在速度差。速度差最大為智能體#4,速度差最小的是智能體#5。在10 s之后,每個智能體前行速度誤差基本趨于0,也就是每個智能體已跟蹤上各自的期望指定位置,并保持一致運動。
圖6給出了系統(tǒng)鎮(zhèn)定誤差曲線圖。隨著時間的變化,該曲線大致呈現(xiàn)先緩慢下降后趨于穩(wěn)定狀態(tài)的趨勢。在5個智能體跟蹤期望的指定位置過程中,所提方法能夠?qū)崿F(xiàn)快速有效的跟蹤,并使得5個智能體達到一致性。本文所采用的核心技術(shù)是反推技術(shù),而反推技術(shù)在求解控制律過程,每一步均會設(shè)定鎮(zhèn)定誤差,逐步遞推,然后得到最終的控制律。由圖6可知,智能體#1~智能體#3的鎮(zhèn)定誤差曲線逐漸緩慢下降,這說明其在跟蹤期望的指定位置的過程先于智能體#4和智能體#5。智能體#4以非常緩慢的趨勢逼近期望指定位置,鎮(zhèn)定誤差變化很小,說明該智能體在跟蹤期望的指定位置過程中很平穩(wěn)。然而,智能體#5曲線變化比較大,先是瞬間下降后緩慢上升至穩(wěn)定狀態(tài),因為智能體#5作為領(lǐng)航者,其速度比智能體#4稍微小點,但比其他智能體均大,在跟蹤過程中需要保持隊形的一致性,因此該曲線變化趨勢明顯。
為了進一步驗證所設(shè)計分布式自適應(yīng)一致跟蹤方法的有效性,采用同樣的仿真環(huán)境和相同的初始條件,對5個智能體編隊系統(tǒng)進行跟蹤效果分析,如圖7~圖10所示。
圖7 多智能體系統(tǒng)在x方向的跟蹤誤差曲線Fig.7 Tracking error curve of multi-agent system in the x direction
圖8 多智能體系統(tǒng)在y方向的追蹤誤差曲線Fig.8 Tracking error curve of the multi-agent system in the y direction
圖9 多智能體系統(tǒng)在x方向的相對距離誤差曲線Fig.9 Relative distance exerror curve of the multi-agent system in the x direction
圖10 多智能體系統(tǒng)在y方向的相對距離誤差曲線Fig.10 Relative distance error curve of the multi-agent system in the y direction
圖7給出了多智能體系統(tǒng)在x方向的追蹤誤差曲線。隨著時間的變化,該曲線呈現(xiàn)正弦波的趨勢。5個智能體編隊系統(tǒng)從不同起點以時變的參考軌跡運動跟蹤期望的指定位置并保持一致運動,在此過程中分為跟蹤階段和保持階段。因此,在6 s之前,該曲線處于分離狀態(tài),這說明5個智能體以不同的初速度、偏航角以及控制參數(shù)進行運動,跟蹤指定的期望位置;通過調(diào)節(jié)系統(tǒng)的參數(shù)θ,進而實現(xiàn)不同的虛擬控制,使得每個智能體均能按照時變的參考軌跡跟蹤指定的期望位置。在6 s之后,該曲線呈現(xiàn)重合后正弦波的趨勢。這說明5個智能體在前進方向?qū)崿F(xiàn)了跟蹤后保持一致運動,采用的自適應(yīng)協(xié)同跟蹤算法可以實時控制每個智能體在x方向的速度、偏航角以及系統(tǒng)的參數(shù),實現(xiàn)對多智能體系統(tǒng)協(xié)同跟蹤目的。
圖8給出了多智能體系統(tǒng)在y方向的跟蹤誤差曲線。隨著時間的變化,該曲線呈現(xiàn)從分離狀態(tài)到重合狀態(tài)的波動趨勢。同樣地,5個智能體編隊系統(tǒng)在平面中以不同的速度和偏航角開始運動,然后按照時變的參考軌跡運動,追蹤各自期望的指定位置,形成模型中給出的五邊形隊形,并保持該隊形繼續(xù)運動。在此過程中,同樣分為跟蹤和保持一致性兩個階段。在10 s之前,5個智能體從不同起點運動,由于參考的軌跡是正弦變化的路徑,在y方向有相應(yīng)的運動,5個智能體的追蹤誤差曲線有較大的變化,這是由于每個智能體在追蹤過程中出現(xiàn)通訊能力弱的情況,基于反推技術(shù)的自適應(yīng)控制算法能夠使得每個智能體較快調(diào)整各自在y方向的速度和偏航角,使其盡快按照時變參考軌跡追蹤期望的指定位置,實現(xiàn)跟蹤目的。在10 s之后,5個智能體已跟蹤到期望的指定位置并形成模型中的五邊形隊形,然后保持該隊形運動,其在y方向的路徑跟蹤誤差為0,實現(xiàn)了較好的隊形保持目的。
圖9給出了多智能體系統(tǒng)在x方向的相對距離誤差曲線。隨著時間的變化,該曲線呈現(xiàn)先快速下降,然后緩慢下降至穩(wěn)定狀態(tài)的趨勢。5個智能體從不同起點出發(fā),以不同速度和偏航角跟蹤期望的指定位置,由于5個智能體的初速度均不相等,尤其領(lǐng)航者(智能體#5)速度較大,智能體#1~智能體#3的速度較小,智能體#4的速度最大,導(dǎo)致5個智能體跟蹤過程出現(xiàn)不等的相對距離差,智能體#2~智能體#4出現(xiàn)快速下降,而智能體#1出現(xiàn)較為緩慢的上升,之后5個智能體均跟蹤已確定的期望指定位置直至達到穩(wěn)定狀態(tài),這是由于基于反推技術(shù)的自適應(yīng)控制方法使得以參考軌跡快速跟蹤期望的指定位置,之后保持一致運動。因此,在10 s之前,5條曲線依次呈現(xiàn)不同的下降和上升的趨勢,直至35 s之后,曲線保持穩(wěn)定,實現(xiàn)5個智能體編隊系統(tǒng)跟蹤和保持一致性的目的。
圖10給出了多智能體系統(tǒng)在y方向的相對距離誤差曲線。隨著時間的變化,該曲線呈現(xiàn)快速下降后快速達到穩(wěn)定的趨勢。5個智能體編隊系統(tǒng)開始從不同位置以不同速度按照時變的參考軌跡運動,5個智能體在完成編隊跟蹤期望的指定位置和保持五邊形的隊形之余,還需要使得5個智能體中任意兩個智能體在通訊能力差的情況下保持之間的相對距離大于安全距離,實現(xiàn)在跟蹤過程中不發(fā)生碰撞。因此,在y方向曲線會呈現(xiàn)不同速率的下降趨勢,而后在自適應(yīng)控制算法的控制下,實現(xiàn)穩(wěn)定狀態(tài),也就是曲線呈現(xiàn)水平趨勢。在10 s前,智能體#3的速度相對比較大(V3=1.0 m/s),快速跟蹤期望的指定位置,在控制參考的調(diào)整下,曲線變化趨勢大;智能體#5作為領(lǐng)航者,其速度較大(V5=1.2 m/s),在跟蹤過程保持較為平穩(wěn)的追蹤,曲線變化趨勢平緩。在10 s之后,5個智能體在y方向相對距離誤差均為0,實現(xiàn)一致跟蹤的目的。
在本節(jié)中,基于避障模型式(11),采用相同的初始條件和相同的實驗環(huán)境,仿真結(jié)果如圖11和圖12所示。
圖11 多智能體避障曲線Fig.11 Collision avoidance curve of the multi-agent
圖12 多智能體避障過程相對距離誤差曲線圖Fig.12 Relative distance error curve of the multi-agent collision avoidance process
圖11給出了多智能體在平面運動的避障圖。由圖11可知,隨著時間的變化,該曲線呈現(xiàn)以最優(yōu)軌跡避開障礙物波動的趨勢。在多智能體跟蹤過程中,每個智能體由不同的起點位置以時變的參考軌跡跟蹤期望的指定位置,然后保持既定的編隊隊形運動。在此過程中,會遇到障礙物,本文采用人工勢場方法進行避障,其核心為智能體與障礙物之間的距離決定彼此遠離或者靠近,從而達到避障目標(biāo)。在5 s之前,智能體逐漸靠近障礙物,其相對距離減小,產(chǎn)生的斥力大于引力,使得多智能體稍微遠離障礙物而進行運動。同理,當(dāng)智能體所示斥力小于引力,則相互之間靠近,呈現(xiàn)一種以最優(yōu)軌跡避開障礙物運動。
圖12給出了多智能體避障過程相對距離誤差曲線。由圖12可知,隨著時間變化,該曲線首先快速上升,然后快速下降到很小,之后緩慢趨于穩(wěn)定狀態(tài)。這是由于多智能體編隊系統(tǒng)在剛開始逐漸靠近障礙物時,其合力為斥力,同時還繼續(xù)跟蹤期望的指定位置,從而使得其相對距離誤差變大;隨后,當(dāng)其距離逐漸增大,合力表現(xiàn)為引力;最后,智能體與障礙物之間的引力和斥力等大反向,達到動態(tài)平衡,其曲線處于水平狀態(tài)。
為了驗證本文所提出算法的追蹤效果,將與滑模控制(sliding mode control, SMC)方法,自適應(yīng)控制方法(adaptive control method, ACM)進行仿真對比分析,采用相同的初始條件和假設(shè),其結(jié)果如圖13所示。
圖13 多智能體跟蹤誤差曲線Fig.13 Tracking error curve of the multi-agent
圖13給出了多智能體跟蹤誤差曲線。在所提方法、ACM以及SMC方法的作用下,隨著時間的變化,曲線先快速上升到最高峰值,然后迅速下降,最后緩慢趨于穩(wěn)定狀態(tài)。這是由于智能體在不同的初始位置以不同的角度開始運動,根據(jù)參考軌跡跟蹤期望的指定位置,在峰值之前,曲線迅速上升,這是由于每個智能體以時變的軌跡快速跟蹤期望的指定位置,智能體與期望的指定位置之間的距離相距較遠,這使得其跟蹤誤差較大。當(dāng)該曲線從峰值到水平位置時,3種方法均迅速下降后緩慢上升至水平位置,這是由于智能體即將接近各自的期望指定位置,速度減小,對應(yīng)的相對距離誤差也隨之減小至0,則實現(xiàn)一致跟蹤的目的。然后,所提方法使得多智能體系統(tǒng)的跟蹤誤差最小,達到穩(wěn)態(tài)所需要的時間最短,ACM對應(yīng)的跟蹤效果次之,SMC方法跟蹤效果最差。
為了進一步直觀說明3種方法的跟蹤效果,對其追蹤過程中的穩(wěn)態(tài)誤差和穩(wěn)定時間進行對比分析,如表2所示。
表2 3種方法跟蹤效果指標(biāo)對比
由表2可知,本文所提方法能夠使多智能體在弱通訊情形下具有良好的追蹤效果。
本文基于反推技術(shù),提出分布式自適應(yīng)一致跟蹤控制方法,達到多智能體在弱通訊的情況能夠?qū)崿F(xiàn)有效的跟蹤和保持一致運動的目的。5個智能體作為被控對象構(gòu)成多智能體系統(tǒng),這5個智能體均攜帶有無線傳輸系統(tǒng),在復(fù)雜環(huán)境下,信號傳輸能力存在弱化情況。基于此,本文將5個智能體系統(tǒng)模型分解為5個子系統(tǒng)進行虛擬控制律設(shè)計,避免非線性系統(tǒng)的處理所帶來的困難,從而實現(xiàn)最終的控制律設(shè)計,實現(xiàn)對5個智能體系統(tǒng)進行有效控制。主要結(jié)論和存在問題如下:
(1) 所提出的多智能體分布式自適應(yīng)方法能夠使5個智能體在平面x和y方向進行有效追蹤,同時保持鎮(zhèn)定誤差收斂于很小的領(lǐng)域內(nèi),使多智能體編隊系統(tǒng)在弱通訊情形下完成跟蹤任務(wù),并以最優(yōu)軌跡避開障礙物并保持隊形恒定;
(2) 基于反推技術(shù),提出自適應(yīng)一致跟蹤控制律,能夠使多智能體在整個跟蹤過程具有較好的穩(wěn)定性,誤差收斂速度快;
(3) 盡管所提出的方法能夠使多智能體編隊系統(tǒng)在弱通訊情形下具有較好的追蹤效果,但本文是將弱通訊情況作為系統(tǒng)的擾動進行處理的,沒有分析其內(nèi)部的通訊機理,也未能建立精確的多智能體模型。因此,下一步工作將對弱通訊情況下的傳輸機理進行深入分析,建立準(zhǔn)確的多智能體模型,進行跟蹤控制。