張凱杰 王丹丹 呂躍祖
隨著計(jì)算機(jī)科學(xué)、人工智能和互聯(lián)網(wǎng)的發(fā)展,多智能體系統(tǒng)(Multi-Agent Systems,MASs)受到眾多研究者的關(guān)注,成為了控制學(xué)科和人工智能領(lǐng)域的研究熱點(diǎn)[1-2].MASs是由多個(gè)具有感知、通信、計(jì)算和執(zhí)行能力的個(gè)體(智能體)組成的系統(tǒng),智能體之間通過網(wǎng)絡(luò)拓?fù)渑c其他智能體進(jìn)行信息交互,從而協(xié)調(diào)完成較為復(fù)雜的任務(wù).在現(xiàn)實(shí)應(yīng)用中,智能體的通信資源、計(jì)算能力等通常是有限的,且智能體之間往往不能進(jìn)行實(shí)時(shí)通信,每個(gè)智能體的控制器也無法進(jìn)行實(shí)時(shí)更新.為了解決上述問題,提高線上資源的利用率,傳統(tǒng)的處理方式是采取時(shí)間觸發(fā),即觸發(fā)時(shí)刻是事先確定好的,而不是根據(jù)系統(tǒng)的狀態(tài)或時(shí)間進(jìn)行動(dòng)態(tài)確定的,甚至是周期控制[3].這種方式雖然在一定程度上降低了通信及計(jì)算成本,但具有一定的局限性:一方面是當(dāng)智能體的行為臨近收斂狀態(tài)時(shí)刻或者是在干擾較小的理想狀態(tài),如果繼續(xù)使用時(shí)間觸發(fā)采樣控制會(huì)使得網(wǎng)絡(luò)代價(jià)成本較高,造成不必要的資源浪費(fèi);另一方面是當(dāng)時(shí)間觸發(fā)中的采樣周期較小,即采樣頻率較高時(shí),網(wǎng)絡(luò)中會(huì)存在大量的冗余信息,從而會(huì)導(dǎo)致網(wǎng)絡(luò)堵塞,增加網(wǎng)絡(luò)傳感器的負(fù)擔(dān),甚至導(dǎo)致網(wǎng)絡(luò)系統(tǒng)的崩塌.
事件觸發(fā)是基于預(yù)先給定觸發(fā)條件的一種控制方式,若控制任務(wù)滿足觸發(fā)條件,例如系統(tǒng)的狀態(tài)誤差超過某一設(shè)定閾值(通常與系統(tǒng)狀態(tài)或時(shí)間有關(guān)),則事件發(fā)生,此時(shí)系統(tǒng)執(zhí)行觸發(fā)任務(wù),進(jìn)行鄰居之間信息的傳遞或者控制器的更新.與時(shí)間觸發(fā)控制相比,由于事件觸發(fā)控制的采樣時(shí)間取決于觸發(fā)條件是否滿足,因此它可以有效減少控制任務(wù)的執(zhí)行次數(shù),節(jié)約通信、計(jì)算資源,一定程度上解決了網(wǎng)絡(luò)擁堵的問題.在分布式控制系統(tǒng)中,文獻(xiàn)[4]更加清楚地描述了時(shí)間觸發(fā)和事件觸發(fā)的區(qū)別.在MASs分布式控制中,智能體之間進(jìn)行信息交互會(huì)產(chǎn)生一定程度的消耗,所以采用連續(xù)時(shí)間控制會(huì)很大程度上造成通信資源的浪費(fèi).由于事件觸發(fā)控制在節(jié)約通信、計(jì)算等資源方面的優(yōu)勢(shì),其在多智能體系統(tǒng)分布式控制中已得到廣大研究者的關(guān)注,并已經(jīng)被廣泛地應(yīng)用到各個(gè)領(lǐng)域[5-6].
1962年,事件觸發(fā)機(jī)制率先由Dorf等[7]提出,它是一種通過測(cè)量系統(tǒng)參數(shù)來改變采樣頻率的自適應(yīng)系統(tǒng).隨后,事件觸發(fā)的思想應(yīng)用于發(fā)動(dòng)機(jī)控制中,用來解決傳感器問題[8].早在1999年的IFAC(國(guó)際自動(dòng)控制聯(lián)合會(huì))會(huì)議上,有關(guān)事件觸發(fā)的論文[9-10]一經(jīng)發(fā)表就引起了科研工作者的廣泛關(guān)注,文獻(xiàn)[9-10]說明了與時(shí)間觸發(fā)控制相比,事件觸發(fā)控制具有的一些優(yōu)勢(shì).2002年,CDC(IEEE決策和控制會(huì)議)會(huì)議上Astr?m等[11]通過對(duì)比事件觸發(fā)采樣和周期采樣的區(qū)別,得到了事件觸發(fā)采樣的效果更好的結(jié)論.隨著越來越多研究者對(duì)事件觸發(fā)控制研究的關(guān)注,而后的CDC會(huì)議上針對(duì)事件觸發(fā)還設(shè)置了專題分會(huì),這在一定程度上反映了事件觸發(fā)控制在多智能體系統(tǒng)中的重要性.與此同時(shí),在人工智能飛速發(fā)展的浪潮下,智能體之間的通信成為了關(guān)鍵的傳遞信息的方式,它是維持多智能體系統(tǒng)保持協(xié)同一致以及追蹤的重要基礎(chǔ),在這樣的背景之下,對(duì)于通信資源的整合和利用變得愈加重要.在保證系統(tǒng)穩(wěn)定性的基礎(chǔ)上,事件觸發(fā)控制能夠更好地節(jié)約通信資源,帶來更大的經(jīng)濟(jì)效益,有著廣闊的應(yīng)用前景.
本文基于事件觸發(fā)通信,介紹了不同狀態(tài)下系統(tǒng)中智能體的通信情況,從時(shí)間方面分別分析了連續(xù)時(shí)間和離散時(shí)間下的觸發(fā)機(jī)制;給出了基于邊的事件觸發(fā)、自觸發(fā)控制、動(dòng)態(tài)事件觸發(fā)以及異步事件觸發(fā)的主要內(nèi)容;闡述了事件觸發(fā)在MASs實(shí)現(xiàn)一致性、分布式優(yōu)化以及博弈上的一些應(yīng)用.
本節(jié)主要從時(shí)間的角度介紹事件觸發(fā)的不同通信方式,包括連續(xù)時(shí)間下的事件觸發(fā)控制和離散時(shí)間下的事件觸發(fā)控制.在多智能體系統(tǒng)中,當(dāng)智能體狀態(tài)滿足事件觸發(fā)條件時(shí),它需要向其他智能體傳遞自身的狀態(tài)使得控制策略更新,進(jìn)而執(zhí)行相對(duì)應(yīng)的任務(wù),但是如何與其他智能體進(jìn)行通信,這是一個(gè)關(guān)鍵性的問題.
1.1.1 連續(xù)時(shí)間通信
連續(xù)事件觸發(fā)需要硬件連續(xù)對(duì)智能體的狀態(tài)進(jìn)行檢測(cè)判斷觸發(fā)條件是否滿足,連續(xù)時(shí)間狀態(tài)下事件觸發(fā)的運(yùn)行機(jī)制如圖1所示.在連續(xù)時(shí)間觸發(fā)控制中,檢測(cè)器會(huì)對(duì)智能體的狀態(tài)進(jìn)行實(shí)時(shí)的檢測(cè),當(dāng)觸發(fā)條件滿足時(shí)才進(jìn)行信息的傳輸.
圖1說明對(duì)于一階系統(tǒng)[12]
(1)
(2)
(3)
xi(t),vi(t),ui(t)分別代表智能體i的位置、速度和控制輸入.為了便于分析,文獻(xiàn)[13]中設(shè)置了兩種狀態(tài)誤差:
(4)
它所對(duì)應(yīng)的事件觸發(fā)控制為
(5)
然后利用穩(wěn)定性定理進(jìn)行分析證明,得到系統(tǒng)的狀態(tài)是收斂的.對(duì)于一般線性系統(tǒng)
(6)
文獻(xiàn)[14]為了實(shí)現(xiàn)領(lǐng)導(dǎo)者和追隨者的狀態(tài)一致,基于事件觸發(fā)機(jī)制設(shè)計(jì)控制協(xié)議如下:
(7)
1.1.2 離散時(shí)間通信
與連續(xù)通信相對(duì)應(yīng)的就是離散通信.不同于連續(xù)時(shí)間下的事件觸發(fā)控制,離散時(shí)間下的事件觸發(fā)是以周期進(jìn)行采樣的,也可稱為周期事件觸發(fā).周期事件觸發(fā)最早是由Heemels等[16]提出的,其觸發(fā)原理流程如圖2所示.
與連續(xù)時(shí)間觸發(fā)不同,圖2周期事件觸發(fā)控制是基于周期采樣器,周期性地對(duì)事件觸發(fā)條件進(jìn)行檢測(cè),當(dāng)系統(tǒng)觸發(fā)時(shí)智能體將采樣狀態(tài)進(jìn)行傳輸.周期事件觸發(fā)是一種結(jié)合了周期采樣和事件觸發(fā)的控制機(jī)制,由于它是周期性地對(duì)事件觸發(fā)條件進(jìn)行檢測(cè),任意兩次觸發(fā)的時(shí)間之間一定存在一個(gè)正的下界,因此這種觸發(fā)是不存在Zeno行為的.周期事件觸發(fā)實(shí)質(zhì)上是連續(xù)事件觸發(fā)的離散化,在實(shí)際應(yīng)用中連續(xù)的檢測(cè)需要耗費(fèi)一定的資源,因此周期事件觸發(fā)在系統(tǒng)控制中的應(yīng)用更加廣泛.周期事件觸發(fā)以時(shí)間間隔h進(jìn)行采樣,可由下面算法來判斷是否進(jìn)行傳輸:
[x((k+j)h-x(kh))]TΦ[x((k+j)h-x(kh))]≤ηxT((k+j)h)Φx((k+j)h),
(8)
其中Φ是一個(gè)對(duì)稱正定的矩陣,η∈[0,1),j=1,2,….
需要注意的是,若采樣狀態(tài)x(k+j)h滿足上述不等式(8)將不會(huì)被傳輸,只有超過上述不等式的閾值時(shí),采樣狀態(tài)才會(huì)被發(fā)送到控制器.由于周期事件觸發(fā)的一些優(yōu)良特質(zhì),它被應(yīng)用于很多方面.在一類由高維主系統(tǒng)和低維從系統(tǒng)構(gòu)成的主從耦合系統(tǒng)中,文獻(xiàn)[17]設(shè)計(jì)了一種事件觸發(fā)的采樣數(shù)據(jù)傳輸策略.在線性系統(tǒng)中,文獻(xiàn)[18]研究了基于觀測(cè)器的控制,并提出了一種新的事件觸發(fā)機(jī)制,這種機(jī)制可以減少傳感器到控制器通道和控制器到執(zhí)行器通道的通信.對(duì)于線性定常系統(tǒng),文獻(xiàn)[19]提出了基于周期事件觸發(fā)的滑??刂圃O(shè)計(jì)的方法,這種觸發(fā)機(jī)制在智能體狀態(tài)可測(cè)的那些瞬間進(jìn)行周期性評(píng)估,不再需要連續(xù)判斷事件觸發(fā)策略,實(shí)現(xiàn)起來更具有經(jīng)濟(jì)價(jià)值.
對(duì)于事件觸發(fā)控制,可以根據(jù)事件觸發(fā)條件設(shè)計(jì)的對(duì)象將其分為基于邊的事件觸發(fā)機(jī)制和基于點(diǎn)的事件觸發(fā)機(jī)制.基于邊的事件觸發(fā)建立在智能體之間的連邊上,當(dāng)事件觸發(fā)條件滿足時(shí),連邊上的智能體之間進(jìn)行信息交互.而基于點(diǎn)的事件觸發(fā)針對(duì)的是系統(tǒng)中的每個(gè)智能體,觸發(fā)條件滿足時(shí)智能體會(huì)與它所有的鄰居進(jìn)行信息交互,上述相關(guān)設(shè)計(jì)都是基于點(diǎn)的.
(9)
當(dāng)k屬于觸發(fā)時(shí)間集合時(shí),智能體i通過連邊向智能體j傳遞它此時(shí)的狀態(tài),否則智能體j保持上一時(shí)刻智能體i對(duì)其傳輸?shù)臓顟B(tài),事件觸發(fā)條件如下:
(10)
其中eij(k)是可調(diào)節(jié)的閾值.閾值和事件觸發(fā)的次數(shù)相關(guān),閾值越小,觸發(fā)次數(shù)越多,意味著智能體之間的通信越頻繁.文獻(xiàn)[20]研究基于邊的事件觸發(fā)機(jī)制下的網(wǎng)絡(luò)系統(tǒng)的協(xié)調(diào)問題.對(duì)于一般線性MASs的編隊(duì)控制問題,文獻(xiàn)[21]提出了四種基于邊的事件觸發(fā)控制協(xié)議,且每種協(xié)議都不存在Zeno行為.
由于事件觸發(fā)需要專門的硬件設(shè)施去實(shí)時(shí)監(jiān)測(cè)系統(tǒng)的狀態(tài),當(dāng)系統(tǒng)的狀態(tài)誤差滿足觸發(fā)條件時(shí),事件發(fā)生.正常的操作系統(tǒng)中,事件觸發(fā)機(jī)制是可以滿足的,但是在一些大規(guī)?;蛘弑容^極端的情況下,使用事件觸發(fā)機(jī)制可能會(huì)造成一些資源的浪費(fèi).與事件觸發(fā)相比,自觸發(fā)是主動(dòng)的一種通信方式,它可以提前根據(jù)上一觸發(fā)時(shí)刻的數(shù)據(jù)計(jì)算得到下一個(gè)觸發(fā)時(shí)刻,其原理如圖3所示.
圖3自觸發(fā)控制通過當(dāng)前的采樣值和采樣時(shí)刻來決定下一時(shí)刻的觸發(fā),通過這種機(jī)制直接進(jìn)行采樣狀態(tài)的傳輸.基于自觸發(fā)機(jī)制,下一個(gè)觸發(fā)時(shí)刻通過下述公式確定:
tk+1=tk+τk,
(11)
其中τk=Γ(x(tk)),Γ是x(t)在tk時(shí)刻的函數(shù).自觸發(fā)控制是Velasco等在實(shí)時(shí)系統(tǒng)中提出的一個(gè)概念[22],它和事件觸發(fā)控制有著一定的區(qū)別,主要體現(xiàn)在通信方式上,具體詳細(xì)闡述可參考文獻(xiàn)[23-24].由于自觸發(fā)控制只需要當(dāng)前智能體的信息狀態(tài)就能夠確定下一個(gè)觸發(fā)時(shí)刻,因此它在分布式控制中可以得到很好的應(yīng)用.文獻(xiàn)[25]分析了自觸發(fā)控制在具有一致目標(biāo)的MASs中的應(yīng)用.文獻(xiàn)[26]拋棄了傳統(tǒng)反饋控制律上的周期性的假設(shè),通過自觸發(fā)機(jī)制利用被測(cè)對(duì)象的當(dāng)前狀態(tài)來決定下一個(gè)被測(cè)狀態(tài)、計(jì)算控制律和更新執(zhí)行器的時(shí)刻.文獻(xiàn)[27]基于自觸發(fā)提出了一種協(xié)調(diào)算法,分析了在同步和異步情況下算法的正確性.
靜態(tài)事件觸發(fā)的觸發(fā)條件中只有智能體的狀態(tài)項(xiàng)和誤差項(xiàng),為了更好地對(duì)Zeno行為進(jìn)行分析,同時(shí)減少觸發(fā)次數(shù),通過引入動(dòng)態(tài)變量η,文獻(xiàn)[28]提出了如下動(dòng)態(tài)事件觸發(fā)機(jī)制:
(12)
(13)
其中βi>0,ξi∈[0,1],內(nèi)部動(dòng)態(tài)變量的初值ηi(0)>0.需要注意的是,觸發(fā)條件中的θi是后期待定的參數(shù),當(dāng)θi趨于無窮時(shí),式(12)就對(duì)應(yīng)于靜態(tài)事件觸發(fā)條件,靜態(tài)事件觸發(fā)實(shí)質(zhì)上是動(dòng)態(tài)事件觸發(fā)的特例.文獻(xiàn)[29]通過引入動(dòng)態(tài)變量證得閉環(huán)系統(tǒng)的穩(wěn)定性.文獻(xiàn)[30]的動(dòng)態(tài)事件觸發(fā)控制策略同時(shí)保證了干擾到輸出的有限Lp增益和事件觸發(fā)時(shí)間的嚴(yán)格正的下界.
事件觸發(fā)根據(jù)每個(gè)智能體是否同時(shí)觸發(fā)還可以分為同步事件觸發(fā)和異步事件觸發(fā).在控制系統(tǒng)中,如果事件觸發(fā)條件是針對(duì)所有的智能體,當(dāng)滿足觸發(fā)條件時(shí),所有的智能體都進(jìn)行信息的傳輸和策略的更新,這種觸發(fā)控制稱為同步事件觸發(fā),對(duì)于每個(gè)智能體而言該觸發(fā)通信是同步的.但是在一些實(shí)際情況中,同步更新并不一定能夠?qū)崿F(xiàn),因?yàn)樗枰玫较到y(tǒng)中所有智能體的狀態(tài)信息來判斷觸發(fā)條件是否滿足,而且可能造成不必要的資源浪費(fèi),這時(shí)需要對(duì)智能體單獨(dú)設(shè)計(jì)事件觸發(fā)條件,使得智能體的更新并不是同步的,即每個(gè)智能體都有自己的事件觸發(fā)時(shí)刻序列,此為異步事件觸發(fā).在具有完全狀態(tài)反饋的非線性系統(tǒng)中,文獻(xiàn)[31]提出了一種分布式的異步事件觸發(fā)方法,利用局部信息來確定從傳感器到中央控制器的傳輸時(shí)間,所提出的方法不僅保證了系統(tǒng)的穩(wěn)定性,也使得采樣的時(shí)間具有正下界,排除了Zeno現(xiàn)象.文獻(xiàn)[32]針對(duì)一組不在同一位置的傳感器,設(shè)計(jì)了分布式事件觸發(fā)控制器,其中傳感器不需要同步測(cè)量的采樣方式.在輸出測(cè)量和控制輸入受到噪聲干擾的系統(tǒng)中,文獻(xiàn)[33]根據(jù)控制器和被控系統(tǒng)的動(dòng)態(tài)輸出分別設(shè)計(jì)了事件觸發(fā)條件.
事件觸發(fā)控制在保證了底層需要的同時(shí),減少了智能體之間的通信頻率.一些研究人員已經(jīng)分析了它在各個(gè)領(lǐng)域的作用,比如在解決濾波問題[34]、網(wǎng)絡(luò)電力系統(tǒng)[35]以及在時(shí)延控制系統(tǒng)[36]中.下面簡(jiǎn)要分析事件觸發(fā)在MASs一致性、分布式優(yōu)化以及博弈方面的應(yīng)用.
fi(ei(t))≤Δi(zi(t)),
(14)
當(dāng)智能體的狀態(tài)不滿足事件觸發(fā)條件時(shí),智能體與其鄰居之間進(jìn)行通信,引發(fā)控制一致性協(xié)議更新,最終在事件觸發(fā)一致性控制下達(dá)到協(xié)同狀態(tài).在一般線性動(dòng)力學(xué)的多智能體系統(tǒng)的一致性問題上,文獻(xiàn)[38]利用事件觸發(fā)控制和自適應(yīng)控制技術(shù),提出了一種基于觀測(cè)器輸出反饋的分布式事件觸發(fā)控制策略.對(duì)于具有時(shí)變通信延遲的線性多智能體系統(tǒng)的事件觸發(fā)一致性問題,文獻(xiàn)[39]提出了一種新的控制器去解決.上述研究是針對(duì)線性系統(tǒng)下的分布式事件觸發(fā)一致性控制,其中單積分器和雙積分器可以當(dāng)作它的特殊情況.文獻(xiàn)[40]對(duì)多智能體系統(tǒng)的事件觸發(fā)一致性控制進(jìn)行了詳細(xì)的綜述.上述多數(shù)研究?jī)?nèi)容中,在確定系統(tǒng)相關(guān)參數(shù)時(shí)往往需要知道系統(tǒng)的全局信息,如系統(tǒng)通信拓?fù)浣Y(jié)構(gòu)的拉普拉斯矩陣的特征值或其范數(shù)等,從某種意義上來說并不是完全分布式的.為了解決上述問題,研究者就結(jié)合自適應(yīng)控制,提出了一種完全分布式的自適應(yīng)事件觸發(fā)控制協(xié)議,如文獻(xiàn)[41]中的基于事件觸發(fā)的自適應(yīng)協(xié)議是完全分布的和可擴(kuò)展的,它不依賴于網(wǎng)絡(luò)圖的任何全局信息,解決了無領(lǐng)導(dǎo)和領(lǐng)導(dǎo)-追隨者一致性問題.文獻(xiàn)[42]提出了一種完全分布式事件觸發(fā)控制策略,對(duì)于任意連通的無向通信圖,在完全分布的情況下都能解決一致性問題.針對(duì)具有通信時(shí)延和無通信時(shí)延的單積分器和雙積分器網(wǎng)絡(luò)情況,文獻(xiàn)[43]提出的事件觸發(fā)控制策略能保證智能體的行為平均一致收斂或者一致收斂到狀態(tài)平均值的鄰域范圍內(nèi).文獻(xiàn)[44]在無向圖上提出了基于事件觸發(fā)控制策略的一致性協(xié)議,該協(xié)議中的每個(gè)智能體都實(shí)現(xiàn)了與鄰居的解耦.
優(yōu)化與事件觸發(fā)結(jié)合主要體現(xiàn)在求解目標(biāo)函數(shù)的最優(yōu)值,研究較多的是凸優(yōu)化問題.文獻(xiàn)[45]針對(duì)二次凸優(yōu)化問題:
(15)
為了解決式(15)的凸優(yōu)化問題,基于事件觸發(fā)機(jī)制提出了分布式優(yōu)化算法:
(16)
ki是一個(gè)常數(shù),通過上述策略進(jìn)行智能體狀態(tài)的更新,最終得到優(yōu)化的目的.該算法是在無向連通圖的通信拓?fù)湎逻M(jìn)行更新的,它也可以推廣到有向圖和切換拓?fù)渲校畬?duì)于類似的分布式凸優(yōu)化問題,文獻(xiàn)[46]提出了一種事件觸發(fā)零梯度和的算法,該算法的通信過程是由節(jié)點(diǎn)監(jiān)控的觸發(fā)條件所驅(qū)動(dòng)的,在連續(xù)時(shí)間下基于采樣進(jìn)行監(jiān)控,離散時(shí)間下則使用所提出的算法,并且證明了此算法是指數(shù)收斂的.文獻(xiàn)[47]基于事件觸發(fā)通信,給出了一種步長(zhǎng)恒定的分布式優(yōu)化算法,并且利用小增益定理證明了收斂性.文獻(xiàn)[48]通過異步事件觸發(fā)方案,解決了多個(gè)智能體最優(yōu)化自身的目標(biāo)函數(shù)的問題,并且在忽略通信延遲的情況下可以保證系統(tǒng)的收斂性.對(duì)于帶有約束的優(yōu)化問題,文獻(xiàn)[49]提出了一種基于事件觸發(fā)通信的分布式次梯度方法,在該方法中,所有代理的狀態(tài)在步長(zhǎng)遞減和可加性條件以及觸發(fā)條件的閾值下漸近收斂于一個(gè)最優(yōu)解.在連續(xù)時(shí)間動(dòng)力學(xué)系統(tǒng)中,文獻(xiàn)[50]通過對(duì)系統(tǒng)設(shè)置事件觸發(fā)條件使得智能體的狀態(tài)漸近收斂到全局的最優(yōu)解.在二階多智能體的凸優(yōu)化問題中,文獻(xiàn)[51]將事件觸發(fā)和時(shí)間觸發(fā)算法相結(jié)合,使智能體協(xié)同收斂于優(yōu)化問題的最優(yōu)解.同樣在二階連續(xù)時(shí)間系統(tǒng)中,文獻(xiàn)[52]通過一種基于事件觸發(fā)的完全分布式優(yōu)化算法,證明了該系統(tǒng)的指數(shù)收斂性.
在一場(chǎng)博弈中,每個(gè)智能體都趨于使得自己的利益最大化或者成本最小化,將事件觸發(fā)機(jī)制引入到博弈中也是一種很好的應(yīng)用.在N個(gè)智能體下的聚合博弈中[53],每個(gè)博弈者i的目標(biāo)是解決如下的優(yōu)化問題:
(17)
穩(wěn)定性一直是系統(tǒng)研究的重要問題.在控制系統(tǒng)中穩(wěn)定性能夠保證智能體的狀態(tài)是收斂的,這在實(shí)際生活中有著重要的意義.因此在事件觸發(fā)控制中,觸發(fā)條件的設(shè)計(jì)必須保證系統(tǒng)的穩(wěn)定性.
在現(xiàn)代控制理論中,一般采用李雅普諾夫穩(wěn)定性(Lyapunov stability)去判斷該系統(tǒng)的特性.在事件觸發(fā)通信過程中,依舊可以通過構(gòu)造李雅普諾夫候選函數(shù),根據(jù)穩(wěn)定性定理證得智能體的狀態(tài)是收斂的.對(duì)于帶有時(shí)滯的控制系統(tǒng)[55],需要構(gòu)造Lyapunov泛函去證明系統(tǒng)的穩(wěn)定性.
可以利用輸入狀態(tài)穩(wěn)定性(input-to-state-stability)去分析系統(tǒng)的性能.文獻(xiàn)[56]研究了具有有界擾動(dòng)的事件觸發(fā)控制系統(tǒng),給出了具有觀測(cè)器輸出反饋的輸入狀態(tài)穩(wěn)定性的結(jié)果.
Zeno行為是指在事件觸發(fā)控制中,在有限時(shí)間內(nèi)發(fā)生無限次觸發(fā)的現(xiàn)象,這種情況在物理上是不可實(shí)現(xiàn)的,在現(xiàn)實(shí)中也是不合理的.Zeno行為存在與否與事件觸發(fā)條件的設(shè)置有關(guān),通常事件觸發(fā)條件的設(shè)置會(huì)保證兩次觸發(fā)的間隔有一個(gè)正的下界.對(duì)于周期事件觸發(fā)而言,由于其采樣的數(shù)據(jù)是周期性的,這種采樣是離散的,任意兩次采樣的時(shí)間間隔一定會(huì)大于一個(gè)正值,所以已經(jīng)避免了Zeno行為,但是對(duì)于其他方式的觸發(fā),需要分析Zeno行為是否存在.目前Zeno行為的分析沒有特定的方法,比較常見的方法如下.
事件觸發(fā)控制策略,由于它自身具有很多優(yōu)良的特點(diǎn),可以盡可能地實(shí)現(xiàn)資源的優(yōu)化,節(jié)省成本,在現(xiàn)實(shí)生活中發(fā)揮著重要的作用.越來越多的科研工作者對(duì)事件觸發(fā)控制進(jìn)行研究.本文首先從時(shí)間方面分析了連續(xù)時(shí)間和離散時(shí)間系統(tǒng)下的事件觸發(fā)機(jī)制,又介紹了幾種常見的事件觸發(fā)控制,例如自觸發(fā)控制、基于邊的事件觸發(fā)控制、動(dòng)態(tài)事件觸發(fā)控制以及異步事件觸發(fā)控制.然后分析了其在MASs一致性問題、分布式優(yōu)化以及博弈問題中的相關(guān)研究進(jìn)展.
雖然,關(guān)于事件觸發(fā)控制方面的研究已經(jīng)取得了很多不錯(cuò)的成果,但依然存在很多問題需要去解決.本文對(duì)于事件觸發(fā)控制的進(jìn)一步研究做出了如下展望:
1)目前分析Zeno行為的方法較少,沒有一套成熟的、可普遍適用的理論框架.一般情況下還是使用任意兩次觸發(fā)之間間隔的正下界性和反證法,對(duì)于其他的證明方法有待進(jìn)一步探究.
2)對(duì)于誤差狀態(tài)小于閾值的觸發(fā)條件來說,閾值的大小決定了事件觸發(fā)的頻率,閾值越大,觸發(fā)次數(shù)越少,可以更大程度地減少通信頻率,但系統(tǒng)的收斂速率就會(huì)相對(duì)較慢.所以如何更好地設(shè)計(jì)誤差觸發(fā)條件,在保證收斂性能的同時(shí)使得通信頻率也較少,這一問題值得更深層次的研究.
3)現(xiàn)階段的事件觸發(fā)分析是基于控制器已經(jīng)設(shè)定好的情況下,如何設(shè)計(jì)事件觸發(fā)條件和控制器結(jié)合起來的控制機(jī)制需要更多的科研工作者進(jìn)行研究.
4)在離散時(shí)間下,設(shè)計(jì)事件觸發(fā)條件時(shí)如何使用內(nèi)部動(dòng)態(tài)變量,這個(gè)問題有待解決.