柴 運,熊 濤
(南京郵電大學 自動化學院,南京 210023)
(*通信作者電子郵箱chaiyun_nupt@163.com)
基于二層鄰居信息的多智能體系統(tǒng)編隊控制
柴 運*,熊 濤
(南京郵電大學 自動化學院,南京 210023)
(*通信作者電子郵箱chaiyun_nupt@163.com)
為了加快多智能體編隊控制過程中的狀態(tài)收斂,提出基于多跳式網(wǎng)絡(luò)技術(shù)的編隊控制方法。首先將多智能體系統(tǒng)(MAS)中的每個智能體之間的相對速度偏移引入到控制協(xié)議中,然后引入每個智能體與標準位移之間的位置偏移,最后將多跳式網(wǎng)絡(luò)技術(shù)應(yīng)用在已定的通信拓撲之中,更多的機體信息被傳遞,每一個智能體能夠聯(lián)系上的鄰居數(shù)量更多。利用一個六智能體系統(tǒng)的編隊仿真進行驗證,仿真結(jié)果表明所提出的編隊控制方法可以使得多智能體系統(tǒng)形成指定隊形,并且與沒有引入多跳式網(wǎng)絡(luò)技術(shù)的控制方法相比,其狀態(tài)收斂所需時間減少了約10 s,收斂效率更高。
二階一致性;矩陣分析;多智能體系統(tǒng);編隊控制;二層鄰居信息
多智能體系統(tǒng)(Multi-Agent System, MAS)被廣泛應(yīng)用于飛船探測、災(zāi)難調(diào)查、網(wǎng)絡(luò)傳感器等實際生活中,也因此多智能體的分布式控制在近年來一直是研究熱點。在對于多智能體分布式控制的研究中,一個最核心的問題就是如何利用好自身和近鄰智能體的信息來設(shè)計分布式控制策略,使得智能體的所有狀態(tài)可以達到一致,即大家所熟知的一致性問題。依據(jù)不同的控制目標可以將控制多智能體的方法分為兩類:第一類的控制目標是使MAS的位置收斂到一個常值[1-2];第二類[3]是使MAS的位置和速度都收斂到一個常值(這個常值一般都不為零)。依據(jù)控制對象可以分為一階[4-6]和二階模型[7-8]兩類。國內(nèi)的研究人員在針對多智能體編隊的控制問題上,常常考慮到現(xiàn)實應(yīng)用中的一些限制條件,其中主要有MAS在編隊過程中的拓撲結(jié)構(gòu)的變換需求以及智能體之間的通信時延和輸入時延等[9-12]。其中:文獻[9]研究了在固定拓撲和變換拓撲結(jié)構(gòu)下,具有通信時延的MAS的H∞一致性問題;文獻[10]考慮到在現(xiàn)實應(yīng)用中通信時延可能只是隨機出現(xiàn),所以討論了隨機時延下的智能體一致性問題;文獻[11]分別設(shè)計了線性控制器和非線性控制器使得MAS能夠達到加權(quán)平均一致性;文獻[12]利用廣義Nyquist判據(jù)推導出使得系統(tǒng)達到一致的充分條件。進行一致性設(shè)計的過程中,有效的控制算法可以有效提升系統(tǒng)的一致性性能,而收斂速度是判斷一致性協(xié)議性能優(yōu)劣的重要參數(shù),經(jīng)過多年的研究,已經(jīng)有一些常見方法可以提高系統(tǒng)的收斂速度。第一種方法是在拓撲結(jié)構(gòu)改變的情況下,將方程平均一致的收斂速度界離散更新,以此得到收斂時間的上界[13-14];第二種方法是通過對局部的節(jié)點進行預(yù)測來提高收斂速度[15-16];第三種方法則是徹底推翻以前的控制方法,重新設(shè)計新的控制方法來提高收斂速度。第四種方法是通過對加權(quán)矩陣進行優(yōu)化來加速一致性協(xié)議[17-19]。
本文通過引入絕對位置和相對速度以及二層鄰居信息來設(shè)計二階一致性協(xié)議,并在此基礎(chǔ)上設(shè)計了多智能體的編隊控制方法。本文提出的一致性控制方法可以使多個智能體的狀態(tài)最終達到到預(yù)置的常值,而且與文獻[8]中的二階一致性控制協(xié)議相比,本文的編隊控制方法實現(xiàn)編隊控制的時間更短。該控制方法既不實質(zhì)改變MAS的通信拓撲,又提高了狀態(tài)收斂速度,進而優(yōu)化了一致性表現(xiàn)性能。最后對基于改進一致性協(xié)議的編隊控制方法進行了仿真,結(jié)果也表明本文提出的控制方法更加高效。
考慮有m個智能體在一個平面上移動,編號為1,2,…,m。本文假設(shè)每個智能體的機械結(jié)構(gòu)都是相同的,并且每個智能體的動力學模型都可以描述為:
(1)
其中:ri∈IRm,vi∈IRm分別表示智能體的位移和速度;ui∈IRm是控制律。
在有向圖(N,ε)中的m個節(jié)點分別代表m個智能體[20]。這里N表示有限非空點集;ε∈N2是有序節(jié)點對,表示邊。如果節(jié)點υi到節(jié)點υj存在一條有向邊,那么υi就是這條有向邊的父節(jié)點,υj就是這條有向邊的子節(jié)點。在有向圖中,有向路徑就是(υi1,υi2),(υi2,υi3),…這樣的有序邊的序列。其中υij∈N。如果有向圖不同節(jié)點之間都存在一條有向路徑,有向圖就是強連通的。有向樹是有向圖中所有的有向連接邊形成的。如果一個圖存在由圖的子集組成的樹,則稱該圖存在一個(有向)生成樹。
針對本文中的智能體動力學模型,所提出的一致性協(xié)議基于智能體自身的狀態(tài)信息和它近鄰智能體傳遞過來的相關(guān)位置速度信息,使得位移和速度可以和期望的位移和速度達到一致,即:
為了推導控制方法漸近穩(wěn)定所需滿足的條件,下面給出推導過程中所需要的兩個引理:
引理2 令Re(·)和lm(·)分別表示一個數(shù)字的實部和虛部,并且一個矩陣的特征值有如下形式:
這里λ,μ∈C。如果α≥0,Re(μ)<0,并且
那么就有Re(λ±)<0。
s1=γ2(A2-B2)+2ABγ2i
s3=γ2(A2-B2)+4A+(2ABγ2+4B)i
想要|s1|>|s3|,就有:
自然可以得到:
8Aγ2(A2+B2)+16(A2+B2)<0
再通過簡單的轉(zhuǎn)換,可以得到:
文獻[8]提出的一致性協(xié)議如下:
(2)
很明顯可以看出上面的一致性協(xié)議僅僅考慮了絕對速度偏移和相對位置偏移,這樣并沒有充分利用智能體自身的狀態(tài)信息。為了提高收斂速度以及編隊效率,在不實際改變MAS網(wǎng)絡(luò)拓撲的前提下,本文將二層鄰居信息引入到一致性協(xié)議中,并且考慮標準位置偏移和相對速度偏移,提出一種改進的一致性協(xié)議:
(3)
A和L是原通信拓撲圖的虛擬矩陣和拉普拉斯矩陣,有:
(4)
(5)
(6)
對協(xié)議(3)進行簡單的變換,可以得到:
(7)
(8)
這里通過求解det(λI2n-Σ)=0得到Σ的特征值:
(9)
由于:
(10)
通過比較式(9)和式(10),式(9)可以轉(zhuǎn)變?yōu)橄旅娴姆匠蹋?/p>
det((λ2+αλ+β)+γλui)
可以進一步得到:
λ2+αλ+β=γλμi
λ2+(α-γμi)λ+β=0
因此矩陣Σ的特征值如下:
上式結(jié)果表明矩陣Σ的特征值λi±與μi密切相關(guān)。
基于引理1和2,下面給出一致性協(xié)議(7)達到狀態(tài)一致的充分條件。
定理1 一致性協(xié)議(7)可以使得ri→rj→rd,vi→vj→vd,?i,即位移和速度都可以漸進地趨近給定的追蹤值的條件是多智能體的通信拓撲有生成樹,并且滿足:
為了將一致性協(xié)議(7)應(yīng)用在多智能體編隊控制上,需要對式(7)進行變形,目的在于使MAS可以實現(xiàn):ri-rj→δid和vi→vj→vd。不同于一般的編隊控制,編隊依賴于智能體之間的位置信息交換,使得智能體間的相對位移達到期望位移,這里δid表示的是智能體i與標準位移之間的期望絕對位移,也意味著智能體編隊依賴的是自身的位置信息,這樣既降低了編隊收到通信因素影響的可能,又減輕了智能體的負荷。這里令δi∈IRm,是一個常數(shù)??刂戚斎朐O(shè)計為:
(11)
這樣將一致性協(xié)議(7)變形后,就得到了基于絕對位移、絕對速度以及相對速度的多智能體編隊控制輸入,這樣充分利用智能體自身的狀態(tài)信息達到編隊飛行的目的,提高MAS編隊控制的效率。
4.1 一致性仿真
將本文提出的改進的一致性協(xié)議應(yīng)用在兩自由度的含有六個智能體的MAS中。原系統(tǒng)的通信拓撲圖如圖1所示。
圖1 六個智能體的拓撲圖Fig. 1 Topology of six Agents
將“二層鄰居”的虛擬通信結(jié)構(gòu)加入到通信拓撲圖中,每個智能體獲得的狀態(tài)信息更加豐富,鄰居智能體集中的機體數(shù)量更加龐大,此時的系統(tǒng)通信拓撲圖如圖2所示。
圖2 加入二層鄰居信息之后的拓撲圖Fig. 2 Topology with second-order information
相應(yīng)的原圖1的拉普拉斯矩陣為:
一致性協(xié)議(7)的仿真結(jié)果由圖3和圖4給出。圖3、4中的仿真結(jié)果表明,隨著時間的推進,六智能體系統(tǒng)中的所有機體的位移與標準位移之間的誤差趨近于零,以及所有的機體的速度與標準速度之間的誤差趨近于零。這就標示著所有機體的位移可以追隨給定的標準位移,可以形成并維持指定的編隊隊形。
仿真結(jié)果表明本文改進的一致性協(xié)議(7)可以使得每個智能體的狀態(tài)趨于一致,收斂到給定的追蹤值,這也意味著形成編隊隊形之后,六智能體系統(tǒng)可以保持給定的速度,維持指定隊形前進。即:
圖3 智能體位置誤差Fig. 3 Location error of Agents
圖4 智能體的速度一致性Fig. 4 Speed consistency of Agents
4.2 編隊仿真
要基于本文改進的一致性算法設(shè)計編隊控制就需要對一致性協(xié)議(7)進行變形,使得MAS在實際編隊飛行時可以避免碰撞,并且可以保持隊形。為了突顯本文編隊控制方法的優(yōu)勢,分別對文獻[8]中基于式(2)的編隊控制和本文中基于式(11)的編隊控制進行仿真。
首先為了將一致性協(xié)議(2)應(yīng)用到多智能體編隊控制中,需要對式(2)進行簡單變形,在控制律(2)中引入智能體之間的相對位移,在編隊飛行時避免碰觸,并且以此來確定編隊隊形,變形結(jié)果如下:
接下來對上面的由控制律(2)演變而來的編隊控制方法進行仿真實驗,并且設(shè)置vd=(3,2)。圖5和圖6分別表示的是智能體在編隊飛行過程中X和Y軸方向上的速度。從圖中可以看出,從控制律(2)變形而來的控制方法可以使得六智能體在編隊飛行時,當時間到達接近18 s時,智能體系統(tǒng)在X軸方向上的速度收斂并將保持在3 m/s,在Y軸方向上的速度會收斂并且保持在2 m/s,收斂到給定的標準值。
圖5 X方向上智能體的速度變化(文獻[8]方法)Fig. 5 Speed variation of Agents at X direction (method of literature [8])
然后將本文中的編隊控制策略(11)應(yīng)用到六智能體編隊飛行中,與上面的仿真實驗一致,設(shè)置vd=(3,2),圖7、8是此編隊控制方法的仿真實驗結(jié)果。從圖可以看到,無論是在X軸方向上面的速度Vx,還是在Y軸方向上面的速度Vy,都在接近8 s時趨近于設(shè)定的期望速度vd=(3,2),并且此后會保持這個期望速度繼續(xù)編隊飛行。
圖6 Y方向上智能體的速度變化(文獻[8]方法)Fig. 6 Speed variation of Agents at Y direction (method of literature [8])
圖7 X方向上智能體的速度變化(本文方法)Fig. 7 Speed variation of Agents at X direction (the proposed method)
圖8 Y方向上智能體的速度變化(本文方法)Fig. 8 Speed variation of Agents at Y direction (the proposed method)
通過圖5~8這四個仿真結(jié)果的兩兩對比,從時間消耗上面分析,以控制律(2)演變而來的編隊控制方法控制的智能體系統(tǒng)的速度收斂并保持期望值的時間是18 s,而以本文的編隊控制方法(11)所需的時間是8 s,由此可以簡單得出結(jié)論,本文中的編隊控制方法的收斂速度更快,編隊效率更高。
下面進行六智能體系統(tǒng)在編隊過程中的位置仿真,首先給出編隊控制方法(11)中的智能體與標準位移之間的期望位移差:δ1d=(-4,6),δ2d=(-2,-3),δ3d=(2,-3),δ4d=(4,0),δ5d=(2,3),δ6d=(-2,3)。在仿真實驗中,以智能體1為基準,以其他智能體與智能體1之間的位移差為輸出,得到的仿真結(jié)果如圖9所示;圖10表示的是六個智能體編隊飛行軌跡。通過這兩個仿真結(jié)果可以清晰看出六智能體之間的相對位置漸漸趨于穩(wěn)定,將在收斂到期望值之后按照預(yù)置的智能體之間的相對位移保持編隊隊形繼續(xù)飛行。
圖9 智能體1與其他智能體的相對距離Fig. 9 Relative distance between Agent 1 and others
圖10 編隊軌跡Fig. 10 Formation trajectory
本文主要研究了在不改變實際給定的通信拓撲的情況下,努力提高MAS收斂速度,提高多智能體編隊表現(xiàn)性能。在原本的一致性協(xié)議基礎(chǔ)上引入了標準位置偏移和相對速度偏移,并且將二層鄰居信息融入到一致性協(xié)議之中,充分利用信息交互提高收斂效率。仿真實驗的結(jié)果表明本文改進的一致性協(xié)議比原協(xié)議有更高的收斂速度,并且基于此協(xié)議的編隊控制方法能使智能體系統(tǒng)更快地達到期望編隊隊形,這在現(xiàn)實應(yīng)用中有很大意義。
References)
[1] CHOPRA N, SPONG M W. Passivity-based control of multi-Agent systems [M]// Advances in Robot Control: From Everyday Physics to Human-Like Movements. Berlin: Springer-Verlag, 2006: 107-134.
[2] CHUNG S-J, SLOTINE J-J E. Cooperative robot control and concurrent synchronization of lagrangian systems [J]. IEEE Transactions on Robotics, 2009, 25(3): 686-700.
[3] WANG H. Flocking of networked uncertain Euler-Lagrange systems on directed graphs [J]. Automatica, 2013, 49(9): 2774-2779.
[4] OLFATISABER R, MURRAY R M. Consensus problems in networks of Agents with switching topology and time-delays [J]. IEEE Transactions on Automatic Control, 2004, 49(9): 1520-1533.
[5] OLFATI-SABER R, FAX J A, MURRAY R M. Consensus and cooperation in networked multi-Agent systems[J]. Proceedings of the IEEE, 2007, 95(1): 215-233.
[6] REN W. Multi-vehicle consensus with a time-varying reference state [J]. Systems & Control Letters, 2007, 56(7/8): 474-483.
[7] CAO M, XIAO F, WANG L. Event-based second-order consensus control for multi-Agent systems via synchronous periodic event detection [J]. IEEE Transactions on Automatic Control, 2015, 60(9): 2452-2457.
[8] JIE Q, JIANG G. A simple second-order consensus and formation control for multi-vehicle systems [C]// Proceedings of the 2014 33rd Chinese Control Conference. Piscataway, NJ: IEEE, 2014: 1333-1337.
[9] 劉學良,胥布工.具有多個通信時延的多智能體系統(tǒng)分布式H∞一致性控制[J].控制與決策,2012,27(4):494-500. (LIU X L, XU B G. DistributedH∞consensus control for multiple-Agent systems with communication delays[J]. Control and Decision, 2012, 27(4):494-500.)
[10] 宗鑫,崔艷.具有隨機通信時延的二階多智能體系統(tǒng)的一致性控制[J].計算機應(yīng)用,2015,35(5):1358-1360. (ZONG X, CUI Y. Consensus of the second-order multi-Agent systems with random time-delays [J]. Journal of Computer Applications, 2015, 35(5): 1358-1360.)
[11] 俞輝,蹇繼貴,王永驥.多智能體時滯網(wǎng)絡(luò)的加權(quán)平均一致性[J].控制與決策,2007,22(5):558-561. (XU H, JIAN J G, WANG Y J. Weighted average-consensus for networks of multi-Agent with time-delays [J]. Control and Decision, 2007, 22(5):558-561.)
[12] 楊洪勇,張嗣瀛.離散時間系統(tǒng)的多智能體的一致性[J].控制與決策,2009,24(3):413-416. (YANG H Y, ZHANG S Y. Consensus of multi-Agent system with discrete-time [J]. Control and Decision, 2009, 24(3): 413-416.)
[13] OLSHEVSKY A, TSITSIKLIS J N. Convergence rates in distributed consensus and averaging [C]// Proceedings of the 2006 45th IEEE Conference on Decision and Control. Piscataway, NJ: IEEE, 2007: 3387-3392.
[14] ANGELI D, BLIMAN PIERRE-ALEXANDRE. Convergence speed of distributed consensus and topology of the associated information spread [C]// Proceedings of the 2007 46th IEEE Conference on Decision and Control. Piscataway, NJ: IEEE, 2007: 300-305.
[15] AYSAL T C, ORESHKIN B N, COATES M J. Accelerated distrib-uted average consensus via localized node state prediction [J].
IEEE Transactions on Signal Processing, 2009, 57(4): 1563-1576.
[16] ZHANG H-T, CHEN M Z Q, STAN G-B. Fast consensus via predictive pinning control [J]. IEEE Transactions on Circuits & Systems I: Regular Papers, 2011, 58(9): 2247-2258.
[17] XIAO L, BOYD S. Fast linear iterations for distributed averaging [J]. Systems & Control Letters, 2004, 53(1): 65-78.
[18] XIAO L, BOYD S, LALL S. A scheme for robust distributed sensor fusion based on average consensus [C]// IPSN 2005: Proceedings of the Fourth International Symposium on Information Processing in Sensor Networks. Piscataway, NJ: IEEE, 2005: 63-70.
[19] BOYD S, GHOSH A, PRABHAKAR B, et al. Randomized gossip algorithms [J]. IEEE Transactions on Information Theory, Special issue of IEEE Transactions on Information Theory and IEEE ACM Transactions on Networking, 2006, 52(6): 2508-2530.
[20] GODSIL C, ROYLE G. Algebraic Graph Theory [M]. Berlin: Springer-Verlag, 1975: 298.
[21] REN W, BEARD R W. Consensus seeking in multiagent systems under dynamically changing interaction topologies [J]. IEEE Transactions on Automatic Control, 2005, 50(5): 655-661.
[22] HORN R A, JOHNSON C R. Matrix analysis [J]. Graduate Texts in Mathematics, 2005, 169(8): 1-17.
This work is partially supported by the Natural Science Foundation of Nanjing University of Posts and Telecommunications (NY214075).
CHAIYun, born in 1992, M. S. candidate. His research interests include formation of Agents, formation of UAVs with time-delays.
XIONGTao, born in 1991, M. S. candidate. His research interests include nonlinear control, formation of UAVs.
Second-orderinformationbasedformationcontrolinmulti-Agentsystem
CHAI Yun*, XIONG Tao
(CollegeofAutomation,NanjingUniversityofPostsandTelecommunications,NanjingJiangsu210023,China)
In order to speed up the state convergence in the multi-Agent formation control process, a formation control method based on multi-hop network technology was proposed. Firstly, the relative velocity deviation between Agents of Multi-Agent System (MAS) was introduced into the control protocol. Then, the absolute displacement deviation between Agents and the standard displacement was introduced. Finally, the multi-hop network technology was applied in the communication topology, so more information was passed around and each Agent enlarges its “available” neighborhood. A six-Agent formation control example was used to verify the proposed protocol. The simulation results show that the proposed control method can make the system build up the specified formation; and the time required for state convergence is reduced by nearly 10 seconds compared with the control method that does not take into account multi-hop network technology, which verifies that the proposed method is more efficient.
second-order consensus; matrix analysis; Multi-Agent System (MAS); formation control; second-order neighbor information
TP18
A
2017- 01- 24;
2017- 03- 06。
南京郵電大學自然科學基金資助項目(NY214075)。
柴運(1992—),男,江蘇南京人,碩士研究生,主要研究方向:多智能體編隊飛行、通信延遲下的多無人機編隊飛行; 熊濤(1991—),男,江蘇南京人,碩士研究生,主要研究方向:非線性控制、無人機編隊。
1001- 9081(2017)08- 2264- 06
10.11772/j.issn.1001- 9081.2017.08.2264