李振濤,馮元珍,王正新
南京郵電大學(xué) 理學(xué)院,南京210023
近年來,多智能體系統(tǒng)因其在無人機編隊控制[1-2]、環(huán)境監(jiān)測[3]等多個領(lǐng)域的廣泛應(yīng)用吸引了眾多學(xué)者的關(guān)注。一致性問題作為多智能體系統(tǒng)協(xié)同控制的基礎(chǔ),已經(jīng)成為控制領(lǐng)域目前的研究熱點之一。值得注意的是,現(xiàn)有文獻主要針對多智能體系統(tǒng)的漸近一致性問題進行了研究。針對幾類具有不同動力學(xué)的多智能體系統(tǒng),文獻[4-8]分別給出了時間趨于無窮時系統(tǒng)實現(xiàn)一致性的條件。但在工程應(yīng)用中,這樣的收斂時長并不能滿足實際需求。與漸近一致性相比,有限時間一致性要求多智能體系統(tǒng)在有限時間內(nèi)實現(xiàn)一致性,故其可滿足實際應(yīng)用對系統(tǒng)收斂時長有限性的要求?;谖墨I[9]提出的有限時間穩(wěn)定性理論,文獻[10]針對由離散時間子系統(tǒng)和連續(xù)時間子系統(tǒng)組成的切換多智能體系統(tǒng),研究了其有限時間一致性問題。文獻[11]解決了具有不匹配擾動和非線性動力學(xué)的高階多智能體系統(tǒng)的有限時間一致性問題。然而,由于有限時間一致性中的收斂時間依賴于多智能體系統(tǒng)的初始狀態(tài),但系統(tǒng)的初始狀態(tài)很多時候并不易于獲取,由此導(dǎo)致有限時間一致性在工程應(yīng)用中有一定缺陷。
為克服有限時間一致性的局限性,許多學(xué)者進行了固定時間一致性的研究工作。固定時間一致性的實現(xiàn)不僅要求多智能體系統(tǒng)在有限時間內(nèi)實現(xiàn)一致性,還要求對任意初始狀態(tài),系統(tǒng)的收斂時間具有常值上界[12]。文獻[13]研究了有向拓撲結(jié)構(gòu)下帶領(lǐng)導(dǎo)者的非線性多智能體系統(tǒng)的固定時間一致性;文獻[14]研究了一般有向圖下帶領(lǐng)導(dǎo)者和不帶領(lǐng)導(dǎo)者的一階非線性多智能體系統(tǒng)的固定時間一致性;文獻[15]研究了具有符號有向圖的多智能體系統(tǒng)的有限時間二分一致性。然而,文獻[13-15]提出的控制協(xié)議均為連續(xù)控制協(xié)議,這意味著在實現(xiàn)一致性過程中,智能體之間需要頻繁地進行通信交流和控制更新,從而導(dǎo)致多智能體系統(tǒng)能源大量消耗?;谑录|發(fā)的控制策略可以有效解決這一問題。文獻[16]基于事件觸發(fā)機制,研究了在跟隨者拓撲圖為無向圖時帶領(lǐng)導(dǎo)者的一階多智能體系統(tǒng)的固定時間一致性。文獻[17]在文獻[16]的基礎(chǔ)上,研究了具有擾動的帶領(lǐng)導(dǎo)者一階多智能體系統(tǒng)的固定時間一致性問題。文獻[18]研究了帶領(lǐng)導(dǎo)者的一階非線性多智能體系統(tǒng)基于事件觸發(fā)機制的固定時間一致性問題。文獻[19]在文獻[16]和[17]的工作基礎(chǔ)上,考慮了具有輸入時滯的帶領(lǐng)導(dǎo)者一階多智能體系統(tǒng)的固定時間一致性。目前基于事件觸發(fā)機制的固定時間一致性問題研究,主要針對帶領(lǐng)導(dǎo)者的多智能體系統(tǒng),通過引入跟蹤誤差將一致性問題轉(zhuǎn)化為誤差系統(tǒng)的穩(wěn)定性問題;無領(lǐng)導(dǎo)者存在時的相關(guān)問題尚未深入開展。鑒此,本文研究了基于事件觸發(fā)機制的一階多智能體系統(tǒng)的固定時間二分一致性問題。本文的主要貢獻體現(xiàn)在以下三個方面:首先,與文獻[16-19]相比,本文將信息交流圖從無向正圖拓展到了符號有向圖,且多智能體系統(tǒng)中無領(lǐng)導(dǎo)者存在;其次,在文獻[15]工作的基礎(chǔ)上,設(shè)計了一種基于事件觸發(fā)機制的分布式控制協(xié)議,減少了能量損耗,并證明在所設(shè)計控制協(xié)議作用下一階多智能體系統(tǒng)可有效避免Zeno現(xiàn)象的發(fā)生,使控制協(xié)議更具現(xiàn)實意義;最后,給出了一階多智能體系統(tǒng)實現(xiàn)固定時間二分一致性的收斂時間常值上界表達式。
本章介紹本文要用到的圖論基礎(chǔ)知識[20]和相關(guān)引理,并簡單描述將要討論的問題。
令G={V,E,A}表示由N個結(jié)點組成的符號有向加權(quán)圖,其中V={v1,v2,…,vN}為點集合,E?V×V為邊集合,A=[aij]∈RN×N代表加權(quán)鄰接矩陣。當(vi,vj)∈E時aij≠0,否則aij=0。對于符號有向圖G,有向邊(vi,vj)∈E表示信息從結(jié)點vi流向結(jié)點vj。從vi1到viq的有向路徑指的是由一系列有向邊(vip,vip+1)∈E構(gòu)成的邊序列,其中p=1,2,…,q-1且該有向路徑中的結(jié)點彼此不同。如果符號有向圖G中的任意兩個結(jié)點之間都存在有向路徑,則稱G是強連通的。如果有向圖G的結(jié)點可以分為V1和V2兩組且滿足V1?V2=V,V1?V2=Φ,aij≥0(?vi,vj∈Vq,q=1,2)和aij≤0(?vi∈Vq,?vj∈Vr,q=1,2;r=3-q),則稱符號有向圖G是結(jié)構(gòu)平衡的;否則,G是結(jié)構(gòu)不平衡的。符號有向圖G的拉普拉斯矩陣定義為L=[lij]N×N,其中若符號有向圖G中的所有權(quán)值均非負,則稱G為正圖,這是一類特殊的符號有向圖。
引理1[21]若符號有向圖G是強連通的,則G是結(jié)構(gòu)平衡的當且僅當下列兩個條件中任意一條成立:
(1)存在矩陣D∈D使得DAD的所有元素均非負,其中D={diag{d1,d2,…,dN},di=±1}。
(2)G的拉普拉斯矩陣L有且僅有一個零特征值且L的秩為N-1。
引理2[15]若符號有向圖G是強連通結(jié)構(gòu)平衡的,則存在正向量η=[η1,η2,…,ηN]T和引理1中定義的對角矩陣D,使得ηTDL=01×N,其中L為符號有向圖G的拉普拉斯矩陣。
引理3[15]若符號有向圖G是強連通結(jié)構(gòu)平衡的,則存在矩陣D∈D使得DLD為一個正圖的拉普拉斯矩陣。定義向量集:
則有:
引理4[22]對于任意給定的xi>0(i=1,2,…,N)和s>μ≥1,下列不等式恒成立:
引理5[12]對于系統(tǒng)
如果存在一個連續(xù)正定的徑向無界函數(shù)V(x(t)):R→R+?{0}且滿足:
(1)V(x(t))=0?x(t)=0;
(2)系統(tǒng)的任意解x(t)滿足:
其中,α?>0,β?>0,0
1,則系統(tǒng)(1)實現(xiàn)全局固定時間穩(wěn)定且收斂時間T滿足:
引理6[15]若符號有向圖G是強連通結(jié)構(gòu)不平衡的,則存在對角陣Ω=diag{ω1,ω2,…,ωN}>0使得ΩL+LTΩ>0。
考慮由N個一階智能體組成的多智能體系統(tǒng),智能體i的動力學(xué)模型為:
其中,xi(t)∈Rm和ui(t)∈Rm分別表示第i個智能體的位置狀態(tài)和控制輸入。
注1為表述方便起見,不失一般性,本文僅在m=1時進行討論,m>1時相關(guān)結(jié)論可利用克羅內(nèi)克積的性質(zhì)進行推廣。
假設(shè)智能體間的信息交流圖G滿足以下條件:
注2文獻[16-19]研究了具有正圖的多智能體系統(tǒng)固定時間一致性問題。本文將信息交流圖拓展到符號有向情形,考慮了智能體間的權(quán)重可為負值的情況,即智能體間除相互協(xié)作外,還存在博弈、競爭等關(guān)系,在工程應(yīng)用中,更具有廣泛性。
定義[15]對具有符號有向圖的多智能體系統(tǒng)(2),若存在控制輸入ui(t),使得對任意初始狀態(tài)xi(0),都有:
且存在一個正常數(shù)Tmax,使得T≤Tmax恒成立,則稱多智能體系統(tǒng)(2)實現(xiàn)固定時間二分一致性,其中T為依賴于初始狀態(tài)的收斂時間。
本章考慮具有符號有向圖的一階多智能體系統(tǒng)(2)的固定時間二分一致性問題。為有效減少控制過程中多智能體系統(tǒng)的能源損耗,設(shè)計如下基于事件觸發(fā)的控制協(xié)議:
其中,控制增益a>0,b>0,控制參數(shù)0<α<1,β>1;s[a]定義為其中sign(?)為符號函數(shù)。定義,則在任意時間段為第j個智能體的最新觸發(fā)時刻。
令
多智能體系統(tǒng)可以簡寫為:
定理1若符號有向圖G是強連通的,設(shè)計分布式觸發(fā)函數(shù)φi(t):
其中,c>0,當?shù)趇個智能體的觸發(fā)函數(shù)φi(t)>0時,事件觸發(fā),此時該智能體的控制協(xié)議采集信息更新。
其中,λmax(LTH2L)為矩陣LTH2L的最大特征值,k1的定義見引理3及
ηi(i=1,2,…,N)的定義見引理2,ρ的定義見定理1證明過程。
否則,當G為結(jié)構(gòu)不平衡圖時,若
證明 考慮到符號有向圖分為結(jié)構(gòu)平衡圖和結(jié)構(gòu)不平衡圖。接下來,將在這兩種拓撲結(jié)構(gòu)下分別證明多智能體系統(tǒng)(2)在控制協(xié)議(3)和觸發(fā)函數(shù)(4)的作用下,均可實現(xiàn)固定時間二分一致性。
首先證明當G是結(jié)構(gòu)平衡圖時相關(guān)結(jié)論成立。構(gòu)造Lyapunov函數(shù):
其中,ηi的定義見引理2。
為方便證明,引入中間變量
由引理4可得:
和
聯(lián)立式(10)~(12),可得:
其中,γ1,γ2,p和q的定義見式(6)。由引理5可知,V在固定時間內(nèi)收斂到0,即y(t)=Lx(t)=0。由引理1知,L的秩為N-1且有LD1N=0,故有x(t)∈span{D1N},即,其中收斂時間T的上界為
其次,當圖G是結(jié)構(gòu)不平衡圖時,構(gòu)造Lyapunov函數(shù):
其中,ωi的定義見引理6。
綜上所述,當假設(shè)1成立時,應(yīng)用控制協(xié)議(3)和觸發(fā)函數(shù)(4),多智能體系統(tǒng)(2)實現(xiàn)固定時間二分一致性。證畢。
注3由式(5)和(7)知,若控制增益a=b,當控制增益增加時,固定時間一致性收斂時間上界T1max和T2max相應(yīng)減小。因此,在實際應(yīng)用中,可選取相對較大的控制增益來提高系統(tǒng)收斂速度。
注4當控制增益a=0或b=0時,應(yīng)用控制協(xié)議(3)和觸發(fā)函數(shù)(4),多智能體系統(tǒng)(2)可以實現(xiàn)有限時間二分一致性。
注5當強連通圖G為結(jié)構(gòu)不平衡圖時,其對應(yīng)的拉普拉斯矩陣L為可逆矩陣,由引理6可知L?為正定矩陣。
在實際應(yīng)用中,基于事件觸發(fā)的控制協(xié)議還需要保證事件觸發(fā)時間間隔τ>0,以確保整個多智能體系統(tǒng)在收斂過程中,不會在某一時間段內(nèi)無限次觸發(fā)控制協(xié)議,即避免Zeno行為發(fā)生。
定理2若假設(shè)1成立,通過應(yīng)用控制協(xié)議(3)和事件觸發(fā)函數(shù)(4),所有智能體均排除了Zeno行為的發(fā)生,且事件觸發(fā)時間間隔τi滿足以下條件:
其中
證明類似于文獻[23],定義:
對式(14)關(guān)于時間t求導(dǎo),可得:
其中μ1的定義見式(13)。
對式(15)求解得:
將式(16)化簡,可得觸發(fā)時間間隔τi的表達式為:
因此,通過使用控制協(xié)議(3)和觸發(fā)函數(shù)(4),多智能體系統(tǒng)(2)中的所有智能體均有效避免了Zeno行為的發(fā)生。證畢。
注6本文在文獻[15]的工作基礎(chǔ)上,進一步研究了多智能體系統(tǒng)的二分一致性問題。相比文獻[15]中采取的連續(xù)控制策略,本文提出的基于事件觸發(fā)機制的控制方法有效降低了系統(tǒng)控制過程中的能量消耗,并避免了Zeno行為的發(fā)生。
本章將通過數(shù)值仿真來驗證本文所得理論結(jié)果的有效性。
考慮由六個智能體組成的一階多智能體系統(tǒng),其拓撲關(guān)系圖如圖1所示,其中圖1(a)為結(jié)構(gòu)平衡圖,圖1(b)為結(jié)構(gòu)不平衡圖。圖1(a)和圖1(b)的鄰接矩陣分別為:
圖1 拓撲圖Fig.1 Topological graphs
和
選擇控制增益和參數(shù)分別為a=0.1,b=0.2,α=0.8和β=1.2,設(shè)置事件觸發(fā)函數(shù)參數(shù)c=0.5,當系統(tǒng)初始狀態(tài)為X(0)=[-10,8.7,2.3,-1.5,5.5,-7.3]T時,圖2和圖3分別顯示的是具有強連通拓撲結(jié)構(gòu)的多智能體系統(tǒng)中各智能體的位置軌跡和事件觸發(fā)時刻??梢园l(fā)現(xiàn),無論拓撲圖是結(jié)構(gòu)平衡圖還是結(jié)構(gòu)不平衡圖,多智能體系統(tǒng)均可在固定時間內(nèi)實現(xiàn)二分一致性。圖4顯示的是各智能體的控制輸入隨時間變化的趨勢。由圖4可知,當拓撲圖為強連通圖時,各智能體的控制輸入均為分段函數(shù),避免了能量的持續(xù)輸出,減少了系統(tǒng)的能量損耗。
圖2 智能體位置狀態(tài)軌跡圖Fig.2 Trajectories of position states
圖3 各智能體事件觸發(fā)時刻Fig.3 Triggering instants of all agents
圖4 智能體控制輸入Fig.4 Control inputs of all agents
本文研究了具有符號有向圖的一階多智能體系統(tǒng)的固定時間二分一致性問題。通過設(shè)計基于事件觸發(fā)機制的控制協(xié)議,以圖論和Lyapunov理論為主要研究工具,證明了多智能體系統(tǒng)中所有智能體狀態(tài)的絕對值均可在固定時間內(nèi)實現(xiàn)一致,且在控制過程中有效避免了Zeno行為的發(fā)生?;谑录|發(fā)機制設(shè)計的控制協(xié)議避免了對智能體的連續(xù)控制,有效降低了能量損耗。