王 兵, 王思奇, 董 巍, 康朝海
( 1. 中國(guó)石油大慶煉化公司,黑龍江 大慶 163318; 2. 中海油安全技術(shù)服務(wù)有限公司,天津 300452; 3. 東北石油大學(xué) 電氣信息工程學(xué)院,黑龍江 大慶 163318 )
?
保持拓?fù)溥B通的有限時(shí)間有界聚集控制
王兵1, 王思奇1, 董巍2, 康朝海3
( 1. 中國(guó)石油大慶煉化公司,黑龍江 大慶163318;2. 中海油安全技術(shù)服務(wù)有限公司,天津300452;3. 東北石油大學(xué) 電氣信息工程學(xué)院,黑龍江 大慶163318 )
針對(duì)個(gè)體動(dòng)態(tài)為一階積分器的多智能體網(wǎng)絡(luò),在有界控制輸入情況下,研究保持拓?fù)溥B通的有限時(shí)間聚集控制問(wèn)題。基于網(wǎng)絡(luò)誤差設(shè)計(jì)有界控制協(xié)議,采用代數(shù)圖論、矩陣?yán)碚摷胺枪饣治鲋械牟蛔兗恚ㄟ^(guò)引入約束函數(shù)方法設(shè)計(jì)控制協(xié)議,使多智能體網(wǎng)絡(luò)保持拓?fù)溥B通,并實(shí)現(xiàn)有限時(shí)間聚集控制。仿真實(shí)驗(yàn)表明,文中控制協(xié)議采用的算法可實(shí)現(xiàn)初始拓?fù)溥B通的無(wú)向網(wǎng)絡(luò)的有限時(shí)間有界聚集控制。該研究結(jié)果為多智能體網(wǎng)絡(luò)有限時(shí)間有界聚集控制提供新的思路。
多智能體網(wǎng)絡(luò); 聚集控制; 有限時(shí)間控制; 保持拓?fù)溥B通; 有界控制
近年來(lái),多智能體網(wǎng)絡(luò)協(xié)調(diào)控制[1-3]作為控制領(lǐng)域的前沿?zé)狳c(diǎn)問(wèn)題受到人們關(guān)注,其應(yīng)用包括無(wú)人機(jī)、分布式傳感器網(wǎng)絡(luò)、空中和地面交通系統(tǒng)、空間衛(wèi)星編隊(duì),以及通信網(wǎng)絡(luò)的協(xié)調(diào)控制等。聚集控制作為多智能體協(xié)調(diào)控制中的典型情況,在軍事及民用等方面具有大量潛在應(yīng)用,如人們希望具有有限移動(dòng)和通信能力的機(jī)器人,僅通過(guò)局部交互后可以到達(dá)共同目的地,進(jìn)行搜尋、營(yíng)救、地質(zhì)勘探[4]和環(huán)境勘測(cè)等。
Ando H等首次提出機(jī)器人聚集問(wèn)題[5],從而激發(fā)人們對(duì)多智能體網(wǎng)絡(luò)聚集控制問(wèn)題的研究興趣。針對(duì)連續(xù)時(shí)間線性多智能體網(wǎng)絡(luò),Hu J P等研究多領(lǐng)導(dǎo)者的靜態(tài)集合聚集問(wèn)題[6],其中假設(shè)所有領(lǐng)導(dǎo)者靜止且與跟隨者之間無(wú)向連通,設(shè)計(jì)控制方案使所有跟隨者聚集在多個(gè)領(lǐng)導(dǎo)者組成的凸包區(qū)域內(nèi)。針對(duì)個(gè)體具有非線性動(dòng)態(tài)的多智能體網(wǎng)絡(luò),在個(gè)體移動(dòng)過(guò)程存在拓?fù)渥兓闆r下,Shi G等設(shè)計(jì)控制協(xié)議使系統(tǒng)實(shí)現(xiàn)漸近聚集[7]。Cortés J等將Ando H等提出的實(shí)現(xiàn)聚集控制的外接圓算法拓展至更為一般情況,使智能體的運(yùn)動(dòng)可以不在同一平面內(nèi)時(shí),即使通信中斷的情況下也能實(shí)現(xiàn)聚集[8]。對(duì)于非完整的多機(jī)器人網(wǎng)絡(luò),Dimarogonas D V提出不連續(xù)反饋控制協(xié)議而實(shí)現(xiàn)聚集任務(wù)[9]。這些成果實(shí)現(xiàn)漸近協(xié)調(diào)控制。Hui Q研究一階積分器網(wǎng)絡(luò)在無(wú)向拓?fù)溥B通情況下的有限時(shí)間聚集控制[10],體現(xiàn)快速、準(zhǔn)確和強(qiáng)魯棒性等優(yōu)點(diǎn)[11],是有限時(shí)間聚集控制研究方面的代表性成果之一。于鏑等采用勢(shì)能函數(shù)法和變結(jié)構(gòu)控制思想,設(shè)計(jì)分布式非光滑有界控制協(xié)議,解決二階積分器的多智能體網(wǎng)絡(luò)的有限時(shí)間聚集控制問(wèn)題[12]。
由于智能體之間存在有限的傳感和通信范圍,因此在執(zhí)行協(xié)調(diào)任務(wù)過(guò)程中可能出現(xiàn)個(gè)體間通信失敗的情況。若多智能體網(wǎng)絡(luò)個(gè)體在運(yùn)動(dòng)過(guò)程中能夠保持拓?fù)溥B通,將有助于提升整個(gè)系統(tǒng)的執(zhí)行效率與安全性,如一組機(jī)器人在完成救災(zāi)搜救任務(wù)時(shí),如果不存在個(gè)體失蹤或掉隊(duì)的情況,則這組機(jī)器人可以更加順利高效地完成任務(wù)。因此,在保持拓?fù)溥B通前提下,研究聚集控制具有重要的理論意義和實(shí)際應(yīng)用價(jià)值。目前,多數(shù)保持拓?fù)溥B通聚集控制算法設(shè)計(jì)基于勢(shì)能函數(shù)的控制協(xié)議[13-14],但當(dāng)多智能體間距離接近傳感范圍時(shí),控制輸入趨于無(wú)限大,在實(shí)際應(yīng)用中很難實(shí)現(xiàn),促使人們開(kāi)始研究保持拓?fù)溥B通的有界控制策略。Gustavi T、Zhao D和Dimarogonas D V等通過(guò)引入不同的導(dǎo)航函數(shù),提出分散控制律以保證輸入有界[15-17]。
筆者借鑒約束函數(shù)方法[18],設(shè)計(jì)保持多智能體網(wǎng)絡(luò)拓?fù)溥B通的有界控制協(xié)議,分別從有限時(shí)間聚集控制和保持拓?fù)溥B通的有界控制兩方面證明該控制方案的有效性。
1.1圖論基礎(chǔ)
多智能體網(wǎng)絡(luò)中智能體間的信息交換可用有向或無(wú)向圖G加以描述。令λn={1,2,…n}代表指標(biāo)集,圖G=(V,E)由節(jié)點(diǎn)集V(G)={vi,i∈λn}和邊集E(G)?{(vi,vj)∶i,j∈λn}構(gòu)成。若(vi,vj)是圖G的一個(gè)邊,那么vi稱為父節(jié)點(diǎn),vj稱為子節(jié)點(diǎn)。在無(wú)向圖中邊均為無(wú)向,即節(jié)點(diǎn)vi和節(jié)點(diǎn)vj能夠互相獲取信息。有向圖由一系列有序的邊(vi1,vi2),(vi2,vi3),…構(gòu)成,其中vtj∈V(G)。若邊(vi,vj)∈E,表示節(jié)點(diǎn)vj能夠獲取節(jié)點(diǎn)vi的信息,則鄰接矩陣元素aij>0,vj∈Ni;否則,aij=0,?i,j∈λn,其中Ni={vj∈V,(vi,vj)∈E}為節(jié)點(diǎn)vi鄰居集。多智能體網(wǎng)絡(luò)中智能體之間的拓?fù)潢P(guān)系用Laplacian矩陣L=[lij]∈Rn×n表示,其中
1.2非光滑分析基礎(chǔ)
(1)
定義3[20]若給定一個(gè)局部Lipschitz函數(shù)F:Rd→R和一個(gè)集值映射f:Rd→B(Rd),則在x處F相對(duì)于f的集值李導(dǎo)數(shù)為
(2)
1.3問(wèn)題描述
考慮由n個(gè)智能體構(gòu)成的無(wú)向網(wǎng)絡(luò),其中第i個(gè)智能體的動(dòng)態(tài)表示為
(3)
式中:xi和ui分別代表第i個(gè)智能體的位置狀態(tài)和控制輸入,xi∈Rn,ui∈Rn。
每個(gè)智能體的傳感范圍設(shè)定為r。假設(shè)初始時(shí)刻多智能體網(wǎng)絡(luò)拓?fù)銰(t0)連通,設(shè)計(jì)分布式控制協(xié)議ui(t),使當(dāng)所有的t>t0時(shí),通信拓?fù)銰(t)保持連通,且所有智能體可以實(shí)現(xiàn)有限時(shí)間聚集。此外,控制輸入需要滿足‖ui(t)‖≤B,B為正實(shí)數(shù)。
設(shè)計(jì)保持拓?fù)溥B通有限時(shí)間有界聚集控制協(xié)議,滿足對(duì)任意j∈Ni(t),都有l(wèi)im‖xi(t)-xj(t)‖→0成立??刂茀f(xié)議為
(4)
式中:ξi為控制增益,ξi>0;Ni(t)為第i個(gè)智能體的時(shí)變鄰居集。
(5)
整個(gè)多智能體網(wǎng)絡(luò)系統(tǒng)保持拓?fù)溥B通的控制協(xié)議為
(6)
由于Ψr(·)有界,因此設(shè)計(jì)的控制協(xié)議也有界。
2.1有限時(shí)間聚集控制
定理1考慮由動(dòng)態(tài)式(3)描述的n個(gè)智能體組成的無(wú)向網(wǎng)絡(luò),在控制協(xié)議式(4)的作用下可實(shí)現(xiàn)有限時(shí)間聚集控制。
證明首先由控制協(xié)議式(4)和微分包含概念定義網(wǎng)絡(luò)誤差動(dòng)態(tài),進(jìn)而將有限時(shí)間聚集問(wèn)題轉(zhuǎn)化為網(wǎng)絡(luò)誤差有限時(shí)間收斂問(wèn)題;然后根據(jù)Lyapunov函數(shù)的集值李導(dǎo)數(shù)的二階信息,得出網(wǎng)絡(luò)可實(shí)現(xiàn)有限時(shí)間聚集控制。
(7)
則式(7)的Filippov解為微分包含
(8)
的絕對(duì)連續(xù)解,從而將由動(dòng)態(tài)式(3)描述的n個(gè)智能體組成的無(wú)向網(wǎng)絡(luò)的有限時(shí)間聚集問(wèn)題轉(zhuǎn)化為網(wǎng)絡(luò)誤差有限時(shí)間收斂問(wèn)題。
①當(dāng)xi≠xj,i,j=1,2,…n,i≠j,有
②對(duì)于某些i,j∈{1,2,…n},i≠j,有xi=xj,LfU(x)=?。
③當(dāng)x1=x2=…=xn,有LfU(x)={0}。
對(duì)于所有的x∈Q,有maxLfU(x)≤-ε或LfU(x)=?成立,由引理1可得該多智能體網(wǎng)絡(luò)是有限時(shí)間聚集的。
2.2保持拓?fù)溥B通的有界控制
定理2考慮動(dòng)態(tài)式(3)描述的n個(gè)智能體組成的無(wú)向網(wǎng)絡(luò)。令Ψr(·)滿足約束函數(shù)的兩個(gè)屬性。在控制協(xié)議式(4)的作用下,若初始拓?fù)銰(0)連通,則G(t)保持連通。若控制增益ξi≤B/APni,則智能體的控制輸入范數(shù)有界,界限B為正實(shí)數(shù)。
證明對(duì)于任意存在的拓?fù)溥B接,以(i,j)為例,考慮第i個(gè)智能體與第j個(gè)智能體之間的距離dij=‖xi(t)-xi(t)‖。令第i個(gè)智能體與第j個(gè)智能體分別有ni個(gè)與nj個(gè)鄰居,
得到
(9)
則
(10)
(11)
注Ψr(0)>0是多智能體系統(tǒng)實(shí)現(xiàn)聚集的必要條件。假設(shè)Ψr(0)=0,則在智能體運(yùn)動(dòng)過(guò)程中,當(dāng)兩個(gè)智能體運(yùn)動(dòng)到相同位置時(shí),在控制協(xié)議式(4)作用下,控制輸入變?yōu)?,多智能體停留在當(dāng)前位置。因此,若多個(gè)類似智能體停留在不同位置時(shí),多智能體網(wǎng)絡(luò)不能實(shí)現(xiàn)聚集控制。
圖1 初始多智能體網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)Fig.1 Initial multi-agent network topology
通過(guò)仿真實(shí)例驗(yàn)證文中控制協(xié)議采用的方法的正確性,初始多智能體網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)見(jiàn)圖1,其中多智能體網(wǎng)絡(luò)為無(wú)向連通。6個(gè)智能體(f1-f6)的初始位置可以隨機(jī)從三維集合{[5,10],[5,10],[5,10]}中選取,智能體的有限通信傳感范圍r=4;控制輸入范數(shù)界B=5。將P≤1作為設(shè)計(jì)的約束函數(shù)的最大值,約束函數(shù)[18]選為
在控制協(xié)議式(4)的作用下,多智能體網(wǎng)絡(luò)的仿真結(jié)果見(jiàn)圖2。在多智能體運(yùn)動(dòng)軌跡(見(jiàn)圖2(a))中,藍(lán)色圓圈代表智能體在初始時(shí)刻的位置,紅色星形代表智能體聚集目標(biāo)位置。所有智能體最終聚集到目標(biāo)點(diǎn),并且由在x、y、z軸方向上跟隨誤差曲線(見(jiàn)圖2(b-d))可見(jiàn),所有智能體大約在4 s內(nèi)實(shí)現(xiàn)聚集。在控制增益滿足ξi≤B/APni的前提下,控制協(xié)議式(4)可以使多智能體網(wǎng)絡(luò)實(shí)現(xiàn)有界輸入下保持拓?fù)溥B通的有限時(shí)間聚集控制,與定理1-2的結(jié)論相符。
圖2 多智能體運(yùn)動(dòng)軌跡及在x,y,z軸方向的誤差Fig.2 Moving trajectories of agents and error curves along x,y,z axis direction
針對(duì)個(gè)體動(dòng)態(tài)為一階積分器的多智能體網(wǎng)絡(luò),研究有界輸入下的保持拓?fù)溥B通有限時(shí)間聚集控制。文中引入約束函數(shù),設(shè)計(jì)有界的控制協(xié)議,并借助微分包含概念定義網(wǎng)絡(luò)誤差動(dòng)態(tài),將有限時(shí)間聚集問(wèn)題轉(zhuǎn)化成網(wǎng)絡(luò)誤差有限時(shí)間收斂問(wèn)題。然后根據(jù) Lyapunov 函數(shù)的集值李導(dǎo)數(shù)的二階信息得出網(wǎng)絡(luò)可實(shí)現(xiàn)有限時(shí)間聚集控制的結(jié)論,同時(shí)證明若初始多智能體網(wǎng)絡(luò)拓?fù)溥B通,則它可以實(shí)現(xiàn)保持拓?fù)溥B通的有界聚集控制。最后通過(guò)仿真實(shí)驗(yàn)驗(yàn)證理論結(jié)果的有效性和正確性。
[1]于鏑,李鋮,冷傳英,等.時(shí)變領(lǐng)航情況下多智能體網(wǎng)絡(luò)一致性分析與應(yīng)用[J].東北石油大學(xué)學(xué)報(bào),2014,38(2):109-113.
Yu Di, Li Chen, Leng Chuanying, et al. Consensus analysis and application of multi-agent network with a time-varying leader [J]. Journal of Northeast Petroleum University, 2014,38(2):109-113.
[2]黃守志,趙學(xué)增,Bilen S G,等.基于網(wǎng)格劃分的無(wú)線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)冗余分析[J].東北石油大學(xué)學(xué)報(bào),2013,37(3):112-116.
Huang Shouzhi, Zhao Xuezeng, Bilen S G, et al. Research on sensor nodes redundancy based on grid partition in wireless sensor networks [J]. Journal of Northeast Petroleum University, 2013,37(3):112-116.
[3]王中國(guó),徐明,李隆球,等.基于電力線載波通信技術(shù)的油田井下設(shè)備通信系統(tǒng)[J].東北石油大學(xué)學(xué)報(bào),20123,36(5):105-110.
Wang Zhongguo, Xu Ming, Li Longqiu, et al. Communication system of down-hole equipment based on power line carrier communication technology [J]. Journal of Northeast Petroleum University, 2013,37(3):112-116.
[4]鐘立國(guó),張守軍,魯?shù)?等.空氣輔助蒸汽吞吐采油機(jī)理[J].東北石油大學(xué)學(xué)報(bào),2015,39(2):108-115.
Zhong Liguo, Zhang Shoujun, Lu Di, et al. Research on EOR principles of air assisted CSS [J]. Journal of Northeast Petroleum University, 2015,39(2):108-115.
[5]Ando H, Suzuki I, Yamashita M. Formation and agreement problems for synchronous mobile robots with limited visibility [C]. Monterey: IEEE International Symposium on Intelligent Control, 1995:453-460.
[6]Hu J P, Yuan H W. Collective coordination of multi-agent systems guided by multiple leaders [J]. Chinese Physics B, 2009,18(9):3777-3782.
[7]Shi G, Hong Y G. Global target aggregation and state agreement of nonlinear multi-agent systems with switching topologies [J]. Automatica, 2009,45(5):1165-1175.
[8]Cortés J, Martínez S, Bullo F. Robust rendezvous for mobile autonomous agents via proximity graphs in arbitrary dimensions [J]. IEEE Transactions on Automatic Control, 2006,51(8):1289-1298.
[9]Dimarogonas D V, Kyriakopoulos K J. On the rendezvous problem for multiple nonholonomic agents [J]. IEEE Transactions on Automatic Control, 2007,52(5):916-922.
[10]Hui Q. Finite-time rendezvous algorithms for mobile autonomous agents [J]. IEEE Transactions on Automatic Control, 2011,56(1):201-211.
[11]Bhat S P, Bernstein D S. Finite-time stability of continuous autonomous systems [J]. SIAM Journal of Control and Optimization, 2000,38(3):751-766.
[12]于鏑,董巍,任偉建.保持拓?fù)溥B通的多智能體網(wǎng)絡(luò)有限時(shí)間聚集控制[J].控制與決策,2016,31(4):750-754.
Yu Di, Dong Wei, Ren Weijian. Finite-time rendezvous control of multi-agent networks with preserving topology connectivity [J].Control and Decision, 2016,31(4):750-754.
[13]Zavlanos M M, Jadbabaie A, Pappas G J. Flocking while preserving network connectivity [C]. New Orleans: The 46th IEEE Conf on Decision and Control, 2007:2919-2924.
[14]Su H, Wang X, Chen G. A connectivity-preserving flocking algorithm for multi-agent systems based only on position measurements [J]. International Journal of Control, 2009,82(7):1334-1343.
[15]Gustavi T, Dimarogonas D.V, Egerstedt M, et al. Sufficient conditions for connectivity maintenance and rendezvous in leader-follower networks [J]. Automatic, 2010,46(1):133-139.
[16]Zhao D, Li S, Gao F, et al. Low-pass-filter-based position synchronization sliding mode control for multiple robotic mainipulator systems [J]. System Control Engineering, 2011,255(8):1136-1148.
[17]Dimarogonas D V, Johansson K H. Bounded control of network connectivity in multi-agent systems [J]. IET Control Theory and Applications, 2010,4(8):1330-1338.
[18]Fan Y, Feng G, Gao Q. Bounded control for preserving connectivity of multi-agent systems using the constraint function approach [J]. IET Control Theory and Applications, 2012,6(11):1752-1757.
[19]Filipov A F. Differential equations with discontinuous right-hand side [J].American Mathematical Society Translations, 1964,42(2):191-231.
[20]Cortes J. Discontinuous dynamical systems: A tutorial on solutions, nonsmooth analysis, and stability [J]. IEEE Control Systems Magazine, 2008,28(3):36-73.
[21]Hui Q, Haddad W M, Bhat S P. Semistability, finite-time stability, differential inclusions, and discontinuous dynamical systems having a continuum of equilibria [J]. IEEE Transaction on Automatic Control, 2009,54(10):2465-2470.
2015-12-14;編輯:張兆虹
黑龍江省青年科學(xué)基金項(xiàng)目(QC2013C066)
王兵(1970-),男,碩士,工程師,主要從事工業(yè)自動(dòng)化控制、儀器儀表和多智能體協(xié)調(diào)控制方面的研究。
10.3969/j.issn.2095-4107.2016.02.013
TP391
A
2095-4107(2016)02-0099-06