張忠藝,徐冬梅
(上海工程技術(shù)大學(xué) 電子電氣工程學(xué)院,上海 201620)
在過(guò)去的10 年中,網(wǎng)絡(luò)化控制系統(tǒng)在學(xué)術(shù)研究和工程領(lǐng)域中受到廣泛研究。網(wǎng)絡(luò)化控制系統(tǒng)的一個(gè)重要分類(lèi)就是多智能體系統(tǒng),是由多個(gè)具有感知、通信、計(jì)算和執(zhí)行能力的智能體組成的系統(tǒng),所有智能體通過(guò)網(wǎng)絡(luò)拓?fù)溥M(jìn)行信息交互,從而完成復(fù)雜的任務(wù)。該領(lǐng)域的研究方向包括平均一致性、群集問(wèn)題、編隊(duì)控制、區(qū)域覆蓋問(wèn)題等[1-3]。
一致性是指通過(guò)設(shè)計(jì)合理的控制協(xié)議,所有智能體的狀態(tài)和速度都逐漸達(dá)到一個(gè)共同的值,這是多智能體系統(tǒng)協(xié)調(diào)控制的基礎(chǔ)。在實(shí)際系統(tǒng)中,智能體的資源,通信和執(zhí)行能力通常受到限制,因此設(shè)計(jì)適當(dāng)?shù)目刂茀f(xié)議,盡可能減少資源消耗非常重要。為了解決上述問(wèn)題,傳統(tǒng)的處理方式是周期采樣控制,即事先確定好采樣時(shí)刻,而不是動(dòng)態(tài)的根據(jù)智能體的狀態(tài)、時(shí)間確定,這種方式在一定程度上降低了計(jì)算和通信成本,具有局限性,當(dāng)連續(xù)兩次采樣數(shù)據(jù)間僅有微小變化或者臨近收斂狀態(tài)時(shí)刻時(shí),會(huì)造成不必要的資源浪費(fèi),從而縮短系統(tǒng)的使用壽命,而且基于周期采樣控制得到的大多數(shù)采樣數(shù)據(jù)都是多余的,對(duì)多智能體系統(tǒng)達(dá)到一致性沒(méi)有什么幫助,為了解決上述不足,事件觸發(fā)控制方法應(yīng)運(yùn)而生[4-5]?;谏鲜龅膬?yōu)點(diǎn),事件觸發(fā)控制被廣泛應(yīng)用到多智能體一致性的研究中,其中主要分為集中式事件觸發(fā)和分布式事件觸發(fā)兩種算法。集中式事件觸發(fā)機(jī)制的本質(zhì)就是為系統(tǒng)里的所有智能體設(shè)計(jì)一個(gè)共同的誤差和閾值,也就是共用相同的事件觸發(fā)條件。當(dāng)系統(tǒng)的整體誤差達(dá)到設(shè)定的閾值時(shí),所有智能體同時(shí)觸發(fā)一次事件,并且同時(shí)更新所有智能體的控制輸入,可以看出每個(gè)智能體的觸發(fā)時(shí)刻都是相同的,即共用一套觸發(fā)時(shí)刻序列[6]。然而分布式事件觸發(fā)機(jī)制的本質(zhì)就是為系統(tǒng)里的每個(gè)智能體設(shè)計(jì)一個(gè)事件觸發(fā)條件,每個(gè)智能體自己判斷決定是否觸發(fā)一次事件,并且僅僅更新自己的控制輸入,至于鄰居的控制輸入則保持不變??梢钥闯龇植际绞录|發(fā)機(jī)制中每個(gè)智能體都擁有一套特有的觸發(fā)時(shí)刻序列。與集中式事件觸發(fā)機(jī)制相比而言,分布式事件觸發(fā)機(jī)制可以有效地減少智能體之間的通訊交流,進(jìn)一步減少了通信資源的消耗[7-9]。Zhu 等人通過(guò)事件觸發(fā)機(jī)制研究了二階多智能體系統(tǒng)的一致性問(wèn)題[10];隨后研究學(xué)者們開(kāi)始運(yùn)用事件觸發(fā)機(jī)制來(lái)分析一般線性多智能體系統(tǒng)的一致性問(wèn)題[11-12];Zhu等人考慮了一般線性多智能體系統(tǒng)在具有輸入時(shí)間延遲的情況下,對(duì)于每個(gè)智能體的控制輸入更新設(shè)置都是基于事件的,并且為了實(shí)現(xiàn)領(lǐng)導(dǎo)-跟隨一致性提出了一個(gè)必要條件和兩個(gè)充分條件[13];Wang等人研究了基于事件觸發(fā)機(jī)制的混合多智能體系統(tǒng)的一致性問(wèn)題,即在離散時(shí)間和連續(xù)時(shí)間下的動(dòng)態(tài)個(gè)體構(gòu)成了一個(gè)混合多智能體群,同時(shí)也提出一個(gè)自觸發(fā)控制算法來(lái)避免對(duì)事件觸發(fā)條件的連續(xù)監(jiān)測(cè)[14]。
在事件觸發(fā)控制中,觸發(fā)條件設(shè)計(jì)得是否合理往往取決于能否有效地避免Zeno 現(xiàn)象,Zeno 現(xiàn)象是指事件在有限時(shí)間內(nèi)被觸發(fā)無(wú)數(shù)次,這在現(xiàn)實(shí)中是不可行的。因此周期事件觸發(fā)控制應(yīng)運(yùn)而生,其是一種結(jié)合周期采樣和事件觸發(fā)控制的機(jī)制,周期性的對(duì)事件觸發(fā)條件進(jìn)行檢測(cè),任意兩次觸發(fā)時(shí)刻的間隔存在一個(gè)正的下界,避免了Zeno 現(xiàn)象。Meng 等人研究了基于周期事件觸發(fā)機(jī)制的一階多智能體系統(tǒng)平均一致性問(wèn)題,所提出的事件觸發(fā)條件需要在所有檢測(cè)時(shí)刻進(jìn)行狀態(tài)信息更新。在此過(guò)程中,每個(gè)智能體需要接收其鄰居智能體的狀態(tài)信息,并將其自身的狀態(tài)信息發(fā)送給其鄰居智能體,從而導(dǎo)致了大量的通信次數(shù)和系統(tǒng)資源消耗[15]。
基于上述,本文研究了基于周期事件觸發(fā)機(jī)制的一階多智能體系統(tǒng)的平均一致性問(wèn)題,設(shè)計(jì)一個(gè)新的事件觸發(fā)條件,使用事件觸發(fā)狀態(tài)作為閾值,縮小每個(gè)智能體在每個(gè)采樣瞬間都必須與其鄰居智能體通信的需求。因此,只有在事件發(fā)生的瞬間,一個(gè)智能體才會(huì)把其狀態(tài)信息傳遞給其鄰居,進(jìn)而減少了控制輸入的更新次數(shù),減少了資源消耗,并且采樣周期選擇范圍更小,提高采樣精確性。
在多智能體系統(tǒng)的協(xié)調(diào)控制中,通常假設(shè)每個(gè)智能體通過(guò)智能體之間的通信來(lái)獲得其它智能體的狀態(tài)信息,通信網(wǎng)絡(luò)可以用通信圖來(lái)表示。記G =(V,E,A)表示有n個(gè)智能體的無(wú)向通信圖,其中V={1,2,…,n} 表示n個(gè)智能體,E?V × V表示智能體之間的通信連接。如果vi vj∈E是一條邊,則智能體vi和vj是相鄰的,或者說(shuō)智能體vj是vi的一個(gè)鄰居。類(lèi)似的,智能體vi的鄰居Ni可以定義為Ni={j |vi vj∈E,j≠i},在無(wú)向圖G中,如果對(duì)于任意兩個(gè)智能體v1,v2總存在一條路徑從v1到v2且從v2到v1,就稱(chēng)該無(wú)向圖為無(wú)向連通圖。
矩陣A =(aij)∈Rn×n是無(wú)向圖G的相鄰矩陣,表示各智能體之間的連接關(guān)系,定義為式(1):
根據(jù)智能體vi的度di定義圖G的度矩陣D,式(2):
度矩陣D是一個(gè)對(duì)角矩陣,其對(duì)角元素di是智能體vi的鄰居總數(shù)。在圖論中,一個(gè)重要工具是Laplacian 矩陣L,定義為:L =D- A。在無(wú)向圖G中,Laplacian 矩陣L是對(duì)稱(chēng)且半正定矩陣,即L =LT≥0,因此其特征值都是非負(fù)數(shù),記為0 ≤λ1≤λ2≤…≤λn,而且至少有一個(gè)特征值λ1=0,且其對(duì)應(yīng)的特征向量是全1 向量,即=,其中1n =(1,1,…1)T,0n =(0,0,…0)T。如果圖G是無(wú)向連通圖,則λ2>0,記為0=λ1<λ2≤…≤λn,第二個(gè)特征值λ2又稱(chēng)為圖的代數(shù)連通度,λn是Laplacian 矩陣L的最大特征值。
引理1[8]
其中λ2(L)和λn(L)分別是Laplacian 矩陣L的第二小特征值和最大特征值。
引理2[15]對(duì)于半正定矩陣A∈Rn×n,?a,b∈Rn,有,其中,Rn表示n維實(shí)向量構(gòu)成的集合。
考慮具有n個(gè)智能體的系統(tǒng),其中每個(gè)智能體都有能力進(jìn)行計(jì)算,移動(dòng)和相互通信。每個(gè)智能體的狀態(tài)遵循動(dòng)態(tài)方程(4):
式中:xi(t)∈Rn表示第i個(gè) 智 能體的狀態(tài),ui(t) 表示第i個(gè)智能體的控制輸入。
系統(tǒng)中智能體之間的通信拓?fù)浣Y(jié)構(gòu)可以由一個(gè)無(wú)向圖G =(V,E,A)來(lái)表示,在許多現(xiàn)有的關(guān)于一致性問(wèn)題的著作中,一個(gè)簡(jiǎn)單的控制律設(shè)計(jì)如式(5):
則系統(tǒng)的閉環(huán)控制方程(6)為:
寫(xiě)成向量形式有,其中x =(x1,x2,…,xN)T是所有智能體的列向量,L是圖G的Laplacian 矩陣。如果圖G是連通的,則系統(tǒng)中的所有智能體狀態(tài)將逐漸收斂到每個(gè)智能體的初始狀態(tài)的平均值,即為。
基于周期事件觸發(fā)機(jī)制研究一階多智能體系統(tǒng)的平均一致性問(wèn)題,其觸發(fā)原理流程圖如圖1 所示。
圖1 周期事件觸發(fā)控制Fig.1 Periodic event-triggered control
即預(yù)先設(shè)定一個(gè)固定采樣周期為h的采樣點(diǎn),所有智能體的采樣時(shí)間是同步的,并且每個(gè)智能體僅在采樣點(diǎn)進(jìn)行檢測(cè),所以事件觸發(fā)時(shí)刻也就僅發(fā)生在采樣點(diǎn)上,因此該驅(qū)動(dòng)機(jī)制保證了≥h,h >0,有效地避免了Zeno 行為,并且符合數(shù)字設(shè)備帶有采樣周期的特性。該機(jī)制減少相鄰智能體之間的通信,降低每個(gè)智能體的事件檢測(cè)能耗,并且保持了平均一致性。因此,在每個(gè)智能體上都配置了一個(gè)事件檢測(cè)器,用于確定何時(shí)應(yīng)該使用采樣的本地信息來(lái)更新其自身及其鄰居的控制操作。采樣時(shí)刻設(shè)計(jì)如下:t =mh,m =0,1,… 在控制器設(shè)計(jì)中,采用了事件觸發(fā)方案,減少了資源消耗,進(jìn)一步要求每個(gè)智能體只在指定的事件時(shí)間瞬間更新其控制輸入,,…。由于采用了周期采樣策略,事件只能在采樣時(shí)間瞬間發(fā)生,也就是0,1,…。其一致性協(xié)議(7):
系統(tǒng)的閉環(huán)控制方程(8)為:
系統(tǒng)的測(cè)量誤差為式(9):
測(cè)量誤差表示智能體i的最新事件觸發(fā)狀態(tài)與最新采樣狀態(tài)之間的差值。為了便于事件設(shè)計(jì),定義列向量x(t)=(x1(t),…,xN(t) )T,e(t)=(e1(t),…,eN(t) )T,結(jié)合的定義,在內(nèi),系統(tǒng)的閉環(huán)控制方程(10)可以定義如下:
L是通信圖G的Laplacian 矩陣,上式的等式可以寫(xiě)成這樣的緊湊形式(11):
因?yàn)榭刂戚斎朐趦蓚€(gè)連續(xù)的采樣時(shí)間內(nèi)為常數(shù),可以得到式(12):
當(dāng)智能體的測(cè)量誤差的絕對(duì)值達(dá)到預(yù)設(shè)定的閾值時(shí),就會(huì)引起事件觸發(fā),并且引起智能體控制器更新。提出事件觸發(fā)條件(13):
根據(jù)本文提出的事件觸發(fā)條件,可以看出這個(gè)閾值是非連續(xù)的,僅在事件觸發(fā)時(shí)刻更新,避免了對(duì)其鄰居狀態(tài)的連續(xù)測(cè)量,在實(shí)際中極大地減少了資源消耗。智能體i僅僅在自身的事件觸發(fā)時(shí)刻發(fā)送狀態(tài)和在鄰居的事件觸發(fā)時(shí)刻接收鄰居狀態(tài)時(shí)與其鄰居通信。如果事件觸發(fā)條件(13)不滿足時(shí),那么智能體i不需要進(jìn)行任何操作,忽略當(dāng)前采樣狀態(tài);如果滿足事件觸發(fā)條件(13)時(shí),智能體i將執(zhí)行控制輸入更新,并且發(fā)送自己的狀態(tài)信息給鄰居智能體,更新其控制輸入,同時(shí)重置測(cè)量誤差為0,即,事件觸發(fā)判斷條件得以再次滿足。
定義多智能體的平均狀態(tài)為式(14):
考慮圖G是無(wú)向連通圖,因?yàn)長(zhǎng)aplacian 矩陣的特征值λ1=0 對(duì)應(yīng)的特征向量為全1 向量,即=,將其應(yīng)用在公式(11)和(14)得到多智能體的平均狀態(tài)的導(dǎo)數(shù)為式(15):
所以多智能體的平均狀態(tài)是不變的常數(shù),且等于初始狀態(tài)的平均值,即式(16):
為了描述多智能體系統(tǒng)的平均一致性收斂性能,定義非一致向量σ(t),式(17):
當(dāng)t→∞時(shí),如果xi(t)→(i =1,2,…,n),則,所以多智能體系統(tǒng)是平均一致收斂的。
考慮一個(gè)無(wú)向連通圖G,現(xiàn)在將使用Lyapunov函數(shù)方法為多智能體系統(tǒng)設(shè)計(jì)出適當(dāng)?shù)氖录???紤]如下Lyapunov函數(shù)(18):
定理1考慮一組具有動(dòng)態(tài)方程(4)的n個(gè)智能體組成的系統(tǒng),假設(shè)系統(tǒng)對(duì)應(yīng)的通信圖G是無(wú)向連通圖時(shí),若條件(19)成立,其中λn是Laplacian矩陣L的最大特征值,則采用一致性協(xié)議(7)的系統(tǒng)(4)在事件觸發(fā)條件(13)下,所有智能體狀態(tài)將漸進(jìn)收斂至其初始平均狀態(tài)。
證明考慮函數(shù)(18)在t∈[mh,mh +h) 時(shí)間段內(nèi)得到V(t) 的導(dǎo)數(shù):
因?yàn)樵趖∈[mh,mh +h) 上,(t- mh) ≤h,再由引理1 得,式(20):
現(xiàn)在設(shè)是最新采樣時(shí)間mh之上或者之前的智能體i的最新事件觸發(fā)時(shí)刻,定義事件觸發(fā)狀態(tài),則有式(21):
將(22)代入到(20)中,得:
由引理2 得式(24):
將不等式(24)代入(23)中,得式(25):
結(jié)合事件觸發(fā)條件(13)得到式(26):
因?yàn)檫@是個(gè)無(wú)向連通圖,E ={x∈Rn |(t)=0}=span{1n},由于Lasalle 不變定理可知,閉環(huán)控制方程(8)是漸進(jìn)穩(wěn)定的,所以多智能體系統(tǒng)是平均一致收斂的。
通過(guò)一些仿真實(shí)驗(yàn)對(duì)得出的結(jié)論進(jìn)行驗(yàn)證。
考慮在固定無(wú)向連通圖下一個(gè)由4 個(gè)智能體組成的多智能體系統(tǒng)。圖2 是通信拓?fù)鋱D,其對(duì)應(yīng)的拉普拉斯矩陣為:
圖2 通訊拓?fù)鋱DFig.2 Communication topology
通過(guò)計(jì)算,矩陣L的最大特征值λn =4,為滿足條件(19),多智能體系統(tǒng)的檢測(cè)周期設(shè)置為h =0.002,每個(gè)智能體的事件觸發(fā)條件參數(shù)分別設(shè)置為:β1=0.06,β2=0.02,β3=β4=0.033。智能體的初始狀態(tài)設(shè)置為x0=[0.3-0.2 0.2-0.3]T。
在基于一致性協(xié)議(7)下,圖3 是多智能體狀態(tài)軌跡,可以看出所有多智能體的狀態(tài)隨著時(shí)間的推移會(huì)漸進(jìn)收斂到一致,實(shí)現(xiàn)了平均一致性。
圖3 多智能體狀態(tài)軌跡Fig.3 The state trajectory of multi-agent
多智能體的事件觸發(fā)時(shí)刻,由于采用了周期事件觸發(fā)機(jī)制,可以看出智能體的觸發(fā)時(shí)刻是異步的,并且每個(gè)智能體的觸發(fā)時(shí)刻也是非周期的,如圖4所示。
圖4 多智能體事件觸發(fā)時(shí)刻Fig.4 Event-triggered times of multi-agent
多智能體非一致向量范數(shù)的變化曲線如圖5 所示,可以看出當(dāng)t→∞時(shí),0,可以看出所有智能體都趨于其初始狀態(tài)的平均值,實(shí)現(xiàn)了平均一致性。
圖5 非一致向量范數(shù)Fig.5 Norm of the disagreement vector
智能體1 的事件觸發(fā)條件曲線如圖6 所示,其它3 個(gè)智能體的事件觸發(fā)條件曲線與圖6 類(lèi)似。在內(nèi),隨著測(cè)量誤差越來(lái)越大,當(dāng)滿足觸發(fā)條件(13)的時(shí)候,一個(gè)事件觸發(fā)了,則當(dāng)前采樣狀態(tài)成為新的觸發(fā)狀態(tài),即,同時(shí)將測(cè)量誤差置于0。
圖6 智能體1 的事件觸發(fā)條件Fig.6 Event-triggered condition of agent 1
多智能體事件觸發(fā)次數(shù)見(jiàn)表1,可以看出在相同的系統(tǒng)中,相比較傳統(tǒng)使用的事件觸發(fā)條件,采用本文提出的事件觸發(fā)條件能顯著減少每個(gè)智能體的事件觸發(fā)次數(shù),進(jìn)而減少了控制輸入的更新次數(shù)和系統(tǒng)對(duì)資源的消耗。
表1 多智能體事件觸發(fā)次數(shù)Tab.1 Event-triggered number of multi-agent
本文針對(duì)一階多智能體系統(tǒng),其通信拓?fù)浣Y(jié)構(gòu)為無(wú)向連通圖,通過(guò)引入了周期事件觸發(fā)機(jī)制及其一致性協(xié)議,避免了Zeno 現(xiàn)象,同時(shí)提出了一個(gè)新穎的事件觸發(fā)條件,其觸發(fā)條件的閾值是依賴(lài)于事件觸發(fā)狀態(tài)而不是采樣狀態(tài),所以不用在每個(gè)采樣時(shí)刻對(duì)閾值進(jìn)行更新,進(jìn)而減少了智能體之間的通信次數(shù)和控制輸入的更新次數(shù),在實(shí)際系統(tǒng)中極大地減少了資源消耗。今后將在二階動(dòng)力學(xué)方程和線性動(dòng)力學(xué)方程下繼續(xù)研究周期事件觸發(fā)機(jī)制。