張棟,馬蘇慧,呂石,王孟陽,唐碩
(1. 西北工業(yè)大學(xué) 航天學(xué)院,陜西,西安 710072;2. 陜西省空天飛行器設(shè)計重點實驗室,陜西,西安 710072)
多智能體系統(tǒng)(multi-agent systems,MASs)一致性是指由多個智能體組成的群體,能夠通過所設(shè)計的分布式協(xié)議進行信息交互,以合作或競爭等方式實現(xiàn)狀態(tài)的趨同及其任務(wù). 隨著MASs 規(guī)模的擴大和任務(wù)復(fù)雜性的提高,MASs 通信傳輸數(shù)據(jù)的量級不斷提高. 針對多種通信問題所設(shè)計的一致性協(xié)議,已經(jīng)無法高效、可靠地解決由軟硬件限制和大數(shù)據(jù)導(dǎo)致的傳輸延遲、數(shù)據(jù)丟包、帶寬限制等問題以及系統(tǒng)資源消耗過大的問題.
在20 世紀(jì)50 年代末,ELLIS[1]就已經(jīng)意識到最合適的采樣方法是指傳輸有意義的數(shù)據(jù),即當(dāng)數(shù)據(jù)以給定的增量改變獲得新值. 因此狀態(tài)變量可以進行更稀疏地采樣而不會影響控制性能. 這種當(dāng)測量值超過一定限度才進行采樣、依賴于信號的采樣方案被稱為Lebesgue 采樣[2],即事件觸發(fā)采樣;依賴于時間軸的周期采樣被稱為Riemann 采樣[2],是事件觸發(fā)采樣的特例[3]. 事件觸發(fā)采樣的思想是根據(jù)所定義的事件滿足與否,使作用對象采取特定的動作或決策. 相比于連續(xù)或周期通信的控制方案,事件觸發(fā)一致性方案能夠根據(jù)事件內(nèi)容使控制器更新或者通信連接進行稀疏、有效、靈活地響應(yīng),實現(xiàn)和保持一致性性能. 事件觸發(fā)一致性控制是從大規(guī)模通信、資源消耗問題的內(nèi)在因素出發(fā),在保證一致性實現(xiàn)的前提下,減少個體之間數(shù)據(jù)傳輸頻率,克服通信和資源的限制并提高通信傳輸效率;同時,稀疏通信傳輸也能使通信網(wǎng)絡(luò)攻擊難度提高,進而提高數(shù)據(jù)的安全性. 因此,事件觸發(fā)一致性控制方案是復(fù)雜大規(guī)模情況下有利于MASs 一致性表達和資源節(jié)省的重要手段.
OLFATI-SABER 等[4]給出了MASs 經(jīng)典一致性控制協(xié)議:
在該協(xié)議的作用下,所有智能體的狀態(tài)最終能夠收斂到初始狀態(tài)的平均值.
將事件觸發(fā)機制引入到MASs 一致性控制中,則事件觸發(fā)一致性協(xié)議可表示為
MASs 事件觸發(fā)一致性控制方案如圖1 所示.MASs 事件觸發(fā)一致性控制利用事件檢測器改變控制器輸入,其原理是:事件檢測器i對本地傳感器和外部通信網(wǎng)絡(luò)傳輸?shù)男畔⑦M行采集,根據(jù)定義的事件觸發(fā)函數(shù)進行解算,判斷是否滿足事件觸發(fā)的條件,在此基礎(chǔ)上對觸發(fā)信息的傳輸進行決策. 如式(4)(5)所示,事件檢測器i對相關(guān)變量進行監(jiān)聽,一旦發(fā)現(xiàn)誤差函數(shù)fi的數(shù)值大于閾值函數(shù)Vi的數(shù)值時,觸發(fā)控制的開關(guān)閉合,則智能體i的觸發(fā)信息將被發(fā)送給鄰居智能體、控制器i開始進行采樣更新且測量誤差ei(t)歸0;在相鄰的觸發(fā)間隔內(nèi),MASs 會采用零階保持器使得控制器的輸出保持為固定數(shù)值,因此執(zhí)行器i會得到一個分段連續(xù)的控制信號.
圖1 事件觸發(fā)一致性控制方案Fig. 1 Event-triggered consensus control schemes
在事件觸發(fā)一致性的實現(xiàn)過程中,智能體i的事件檢測裝置仍需消耗資源去實現(xiàn)狀態(tài)監(jiān)聽、事件檢測和觸發(fā)信號發(fā)送的功能;但對于分布式MASs 來說,來自遠程節(jié)點的鄰居信息才是控制器i采樣收集的數(shù)據(jù)主體. 相比于原來的一致性控制方案,事件觸發(fā)一致性協(xié)議只使用智能體i自身和鄰居觸發(fā)時刻的狀態(tài)信息,減少了通信和計算的負(fù)載,降低了資源消耗,提升了系統(tǒng)的可靠性.
在保證所設(shè)計的事件觸發(fā)協(xié)議和事件觸發(fā)函數(shù)能夠使得系統(tǒng)實現(xiàn)一致后,事件觸發(fā)一致性控制方案還需排除Zeno 行為的發(fā)生. Zeno 行為是指在有限時間內(nèi)發(fā)生無限次觸發(fā);一旦Zeno 行為發(fā)生,事件會在某個有限時間內(nèi)發(fā)生連續(xù)觸發(fā),這就違背了引入事件觸發(fā)的目的,因此應(yīng)該盡量避免Zeno 行為.
事件觸發(fā)一致性的關(guān)鍵是設(shè)計事件檢測器. 事件檢測器的內(nèi)容和工作方式將決定事件觸發(fā)的機制,進而影響系統(tǒng)通信計算頻率和一致性表現(xiàn). 經(jīng)典的事件檢測器結(jié)構(gòu)如圖2 所示. 事件觸發(fā)函數(shù)的輸入由事件檢測器的監(jiān)聽對象和監(jiān)聽方式定義,觸發(fā)函數(shù)的具體形式描述事件觸發(fā)的設(shè)計策略,事件檢測器輸入和輸出端口的位置影響事件檢測器的通信方式. 事件檢測器設(shè)計的差異會使得控制方案效果有所不同. 因此,本文將圍繞事件的監(jiān)聽機制、觸發(fā)函數(shù)的結(jié)構(gòu)設(shè)計和事件檢測器間的通信機制3 個特征,介紹事件觸發(fā)的設(shè)計策略以及具體的控制方案.
圖2 事件檢測器的結(jié)構(gòu)Fig. 2 The structure of event detector
2.1.1 監(jiān)聽對象
任務(wù)目標(biāo)和智能體動態(tài)的差異以及限制條件等影響下,事件檢測器監(jiān)聽對象zi(t)的定義是不同的.
表1 監(jiān)聽對象的定義Tab. 1 Definition of monitored objects
特別地,為使觸發(fā)間隔內(nèi)的控制輸入不是常值信號而是隨時間變化的連續(xù)信號,GARCIA 等[11]引入估計器的概念,其構(gòu)型為
此時事件檢測器的監(jiān)聽對象是估計變量,即zi(t)=x?i(t). 式(6)是一個開環(huán)估計. 開環(huán)估計器的設(shè)置可以使智能體之間進行無連續(xù)通信的同時,事件檢測器的監(jiān)聽對象又具有一定的動態(tài)特性,但會導(dǎo)致部分計算資源的占用.
2.1.2 監(jiān)聽方式
① 連續(xù)/離散
事件檢測器對相關(guān)變量進行實時監(jiān)聽的方式包括連續(xù)和離散兩種方式. 連續(xù)監(jiān)聽是指事件檢測器會在MASs 動力學(xué)方程的每個時間步長均進行采樣,離散監(jiān)聽則指檢測器會以動力學(xué)方程時間步長的倍數(shù)為時間間隔進行采樣.
文獻[5,11]設(shè)計了基于連續(xù)監(jiān)聽機制的事件觸發(fā)一致性控制方案,如式(3)(4)所示. MENG 等[12]和GUO 等[13]將采樣數(shù)據(jù)的思想應(yīng)用到事件觸發(fā)控制中,設(shè)計出基于離散監(jiān)聽機制的事件觸發(fā),又稱為基于采樣數(shù)據(jù)的事件觸發(fā)方案,如下所示.
圖3 連續(xù)MASs 基于采樣數(shù)據(jù)的事件觸發(fā)機制Fig. 3 Sampled-based event-triggered mechanism of continuous-time MASs
除固定周期的采樣監(jiān)聽以外,隨機采樣[14-16]的監(jiān)聽方式也被應(yīng)用在一致性研究中. 隨機采樣的監(jiān)聽機制中,事件檢測器的采樣間隔是完全隨機的序列或者以固定概率選擇某一大小的周期.
② 同步/異步
式(8)中,所有事件檢測器的采樣周期大小相同,這意味著所有智能體的監(jiān)聽時序是周期同步的. 基于隨機采樣數(shù)據(jù)的事件觸發(fā)方案則是非周期同步的.當(dāng)每個智能體的事件檢測器擁有不同大小的采樣周期,則稱該觸發(fā)方案是異步的. 在離散監(jiān)聽機制設(shè)計的基礎(chǔ)上,異步監(jiān)聽事件觸發(fā)機制[17-19]設(shè)計如下:
① 依賴狀態(tài)/不依賴狀態(tài)的閾值設(shè)計
在早期研究中,事件觸發(fā)函數(shù)是通過對MASs 進行一致性推導(dǎo)得出,式(5)中的閾值函數(shù)僅與狀態(tài)變量有關(guān),此時MASs 事件觸發(fā)的頻率會隨著系統(tǒng)規(guī)模的擴大而提高,容易導(dǎo)致Zeno 行為的發(fā)生. 針對這一現(xiàn)象,不依賴狀態(tài)的閾值函數(shù)被提出,通過對觸發(fā)函數(shù)結(jié)構(gòu)進行合適的設(shè)計并且調(diào)整不依賴狀態(tài)部分的相關(guān)參數(shù),可以在調(diào)整收斂速率的同時,避免Zeno 行為發(fā)生. 根據(jù)依賴或不依賴狀態(tài)事件觸發(fā)函數(shù)的設(shè)計策略,式(5)中的閾值函數(shù)可總結(jié)如下:
式中:δ1(t)和δ2(t)為與狀態(tài)變量無關(guān)的閾值參數(shù);Vi1(·)為狀態(tài)變量的函數(shù).
當(dāng)δ1(t)≠0時,閾值函數(shù)Vi依賴于狀態(tài)變量、狀態(tài)變量的組合以及時間變量,稱為依賴狀態(tài)的事件觸發(fā)函數(shù). CAO 等[10]設(shè)計出閾值函數(shù)為Vi(t)=δ1·(t)Θizi(t)的狀態(tài)依賴事件觸發(fā)控制方案,并指出其所研究的觸發(fā)方案只能使具有一般線性動態(tài)的MASs 實現(xiàn)漸近一致卻不能避免Zeno 行為. 依賴狀態(tài)的事件觸發(fā)控制方案對狀態(tài)變化敏感,能夠充分利用當(dāng)前智能體的狀態(tài)信息,使系統(tǒng)實現(xiàn)一致.
當(dāng)δ1(t)=0且δ2(t)≠0時,閾值函數(shù)Vi與狀態(tài)量無關(guān)僅與時間變量有關(guān),稱為不依賴狀態(tài)的事件觸發(fā)函數(shù). ZHANG 等[20]和YANG 等[21]設(shè)計不依賴狀態(tài)的事件觸發(fā)閾值函數(shù)為Vi(t)=αe-βt(α,β >0),包含該閾值函數(shù)的事件觸發(fā)方案使得一般線性MASs 在實現(xiàn)狀態(tài)一致或輸出一致的同時,避免了Zeno 行為.在周期采樣MASs 中,YANG 等[22]提出Vi(t)=αβt的閾值函數(shù). 不依賴狀態(tài)的事件觸發(fā)函數(shù)計算量較少,其對應(yīng)的方案可以避免Zeno 行為的發(fā)生.
GARCIA 等[11]研究了閾值函數(shù)為Vi(t)=δ1·(t)Θi zi(t)+c的事件觸發(fā)方案,該方案能夠使系統(tǒng)避免Zeno 行為的發(fā)生但只能實現(xiàn)有界一致性;CUI 等[23]也在異構(gòu)MASs 中發(fā)現(xiàn)將常數(shù)閾值c引入依賴狀態(tài)的事件觸發(fā)函數(shù)中可以使得MASs 不會發(fā)生Zeno 行為,但會降低一致性控制性能表現(xiàn).
② 基于動態(tài)參數(shù)的閾值設(shè)計
在MASs 事件觸發(fā)一致性方案的作用下,事件檢測器的監(jiān)聽變量會逐漸達到收斂的狀態(tài),并且測量誤差變化的幅度逐漸降低,這會導(dǎo)致式(5)中的誤差函數(shù)和閾值函數(shù)的實時輸出接近,進而使得事件觸發(fā)的頻率升高. 理想的觸發(fā)方案能夠在一致性協(xié)議作用初期以較大觸發(fā)間隔工作,在一致性快要實現(xiàn)時自動降低觸發(fā)間隔的大小,因此提出了動態(tài)事件觸發(fā)一致性方案,即對應(yīng)的閾值函數(shù)中δ1(t)或δ2(t)是由與狀態(tài)變量相關(guān)的微分方程或差分方程驅(qū)動的輔助變量. 基于采樣數(shù)據(jù)的事件觸發(fā)函數(shù),YIN[24]和GE 等[25]設(shè)計智能體i對應(yīng)的觸發(fā)閾值δ1(t)是由差分方程驅(qū)動的,且δ1(t)∈[0,1)是單調(diào)非增的時間序列. YI 等[26]提出了一類含有由微分方程驅(qū)動的閾值項δ2(t)的事件觸發(fā)方案,避免了Zeno 行為. 時變的閾值參數(shù)能夠動態(tài)地調(diào)整觸發(fā)時間間隔,以更好的響應(yīng)性去實現(xiàn)一致性的控制性能要求.
事件檢測器輸出端口的位置可以位于智能體內(nèi)部的傳感器和控制器之間,也可以處于智能體外部的觸發(fā)信息傳輸?shù)耐ㄐ胚B接上. 前者決定智能體自身的觸發(fā)時刻,使得智能體自身向其他所有鄰居智能體發(fā)送觸發(fā)信息,建立多條單向觸發(fā)數(shù)據(jù)鏈路;后者決定智能體之間的觸發(fā)信息傳輸時刻,使得通信連接邊兩端的智能體可以在觸發(fā)時刻共享觸發(fā)信息,建立單條雙向的觸發(fā)數(shù)據(jù)鏈路. 因此,根據(jù)事件檢測器輸出位置的設(shè)置MASs 觸發(fā)信息傳輸?shù)耐ㄐ啪W(wǎng)絡(luò)可以被分為廣播形式和點對點形式.
2.3.1 廣播形式
廣播通信形式是指智能體以一對多的方式廣播數(shù)據(jù)信息. 智能體i會在每次事件觸發(fā)時刻廣播信息,其鄰居智能體截獲到智能體i最新的觸發(fā)時刻信息并將該信息用于控制器的輸入. 根據(jù)事件檢測器利用其它智能體狀態(tài)信息的范圍大小,廣播形式的事件觸發(fā)器又可分為集中式、分布式、分散式.
① 集中式
一般的集中式事件觸發(fā)機制如圖4 所示,其控制方案如下:
圖4 集中式事件觸發(fā)機制(方案A1)Fig. 4 Centralized event-triggered mechanism (Scheme A1)
式中:Ui(·)代表智能體i的協(xié)議函數(shù).
集中式觸發(fā)方案的事件檢測器會對所有智能體發(fā)送的信息進行監(jiān)聽,并會將當(dāng)前的觸發(fā)狀態(tài)同時發(fā)送給所有智能體. 因此集中式事件觸發(fā)方案的觸發(fā)時間和控制器采樣更新時刻都是同步的,有tk,i=sk,i=tk(?i). 該類型的事件觸發(fā)方式,要求MASs有一個能夠及時收發(fā)信息和具有充足計算存儲資源的個體或者外部基站. 集中式的特性無法有效減少資源的浪費,而且很容易造成信道堵塞.
② 分散式
一般的分散式事件觸發(fā)機制,如圖5 所示,其控制方案如下所示.
圖5 分散式事件觸發(fā)機制(方案A2)Fig. 5 Decentralized event-triggered mechanism (Scheme A2)
分散式的檢測器只利用智能體i自身信息進行檢測,因此所有智能體的觸發(fā)時刻是異步的;智能體i的控制器采樣更新時刻由自身及其鄰居智能體的最新觸發(fā)時刻所決定,故智能體的通信僅在控制器層面體現(xiàn). 相對于集中式的事件觸發(fā)一致性控制方案,分散式觸發(fā)設(shè)計對本地事件檢測器的接收信息和計算信息的能力要求不高,具有更好的響應(yīng)性以及一定的安全性保障;但事件檢測器僅利用自身信息檢測,忽略了分布式系統(tǒng)廣播的鄰居觸發(fā)信息,對鄰居狀態(tài)的敏感性不高.
③ 分布式
文獻[5,29]提出如下的分布式事件觸發(fā)機制:
在事件觸發(fā)方案A3 中,智能體i的事件檢測器會連續(xù)監(jiān)聽智能體i和鄰居智能體j的狀態(tài)信息,且在事件觸發(fā)時需要標(biāo)記存儲特定數(shù)據(jù). 相較于一般一致性方案,雖然方案A3 能夠減少控制器更新頻率,但整個MASs 通信計算資源的浪費仍無法避免;相較于集中式和分散式事件觸發(fā)方案,智能體i對鄰居狀態(tài)的監(jiān)聽有效整合局部信息,使事件內(nèi)涵更豐富.
對觸發(fā)方案A3 進行改進,GARCIA 等[30]提出如圖6 所示的事件觸發(fā)機制,其控制方案為
圖6 分布式事件觸發(fā)機制(方案A4)Fig. 6 Distributed event-triggered mechanism (Scheme A4)
對于方案A4 而言,由于智能體i獲取鄰居的觸發(fā)信息是被動地接收,導(dǎo)致一旦鄰居智能體的數(shù)量過大,控制器的更新頻率也越大;但控制器和事件檢測器都只利用自身信息和鄰居觸發(fā)信息,減少了對遠程鄰居節(jié)點信息的獲取. 分布式的事件觸發(fā)機制多以該類型為主.
2.3.2 點對點形式
廣播形式的觸發(fā)一致性是由單點事件決定觸發(fā)時間,同理也可提出由邊事件驅(qū)動的一致性方案. 邊事件會決策一條邊上兩個智能體的控制器何時共享觸發(fā)狀態(tài)信息,其觸發(fā)通信方式是點對點的.
CAO 等[10]提出如下形式的點對點事件觸發(fā)一致性控制方案:
式中:zij(t)=xi(t)-xj(t)為邊狀態(tài),F(xiàn)l(l=1,2,···)為基于邊(i,j)的多條事件觸發(fā)函數(shù)規(guī)則. 在邊事件驅(qū)動的一致性框架下,通信邊上的兩個智能體的實時信息是一直共享的;當(dāng)所定義的多條事件觸發(fā)規(guī)則中的一條不被滿足時邊事件觸發(fā),與此同時智能體i與j之間的觸發(fā)邊狀態(tài)zij(tk,ij)更新. 方案A6 中的事件檢測器仍需與鄰居智能體進行連續(xù)的通信,但智能體i的控制器只需在智能體i與其所有鄰居智能體之間最新的邊觸發(fā)時刻進行更新.
無須保持鄰居間的連續(xù)通信,WU 等[32]僅利用觸發(fā)時刻的邊狀態(tài)信息進行事件檢測,如圖7 所示,具體控制方案為
圖7 點對點事件觸發(fā)機制(方案A7)Fig. 7 Node-to-node event-triggered mechanism (scheme A7)
事件觸發(fā)一致性控制方案要求事件檢測器至少要連續(xù)地對本地狀態(tài)信息進行實時監(jiān)聽. 為進一步減少本地連續(xù)監(jiān)聽的頻率,文獻[5,34]設(shè)計了僅利用觸發(fā)信息的事件方案,如下所示.
自觸發(fā)機制也可分為集中式[34]和分布式[35-37].DIMAROGONASIS 等[5]和FAN 等[9]分別在事件觸發(fā)方案A3 和A5 的基礎(chǔ)上,設(shè)計了分布式自觸發(fā)迭代算法. 針對事件觸發(fā)方案A5 進行改進,F(xiàn)AN 等[35]也提出一類分布式自觸發(fā)算法,并通過仿真實驗與文獻[5]的分布式自觸發(fā)方案、文獻[9]的自觸發(fā)迭代算法進行比較;其仿真對比實驗表明事件觸發(fā)方案的選擇對自觸發(fā)迭代算法的設(shè)計有影響. 通過將事件觸發(fā)和自觸發(fā)控制方案作仿真比較,文獻[5,37]顯示自觸發(fā)方案比事件觸發(fā)控制的魯棒性更好. 在MASs 中,自觸發(fā)機制完全避免了連續(xù)監(jiān)聽動作的執(zhí)行,但其設(shè)計過程相對復(fù)雜.
將時間觸發(fā)和事件觸發(fā)結(jié)合起來,便能得到混合觸發(fā)機制. 混合觸發(fā)設(shè)計思路有兩種,一種是在設(shè)計觸發(fā)方案時直接將時間和事件的觸發(fā)機制混合起來,另一種是設(shè)計混雜MASs 的事件觸發(fā)控制方案.
基于采樣數(shù)據(jù)的事件觸發(fā)機制將事件檢測動作固定在每個采樣點,直接將事件驅(qū)動和時間驅(qū)動結(jié)合起來. XING 等[38]在隨機MASs 中將分布式的事件觸發(fā)機制與分段時間結(jié)合,形式如下
式中:{Tl,l=0,1,···}為固定時間序列. 不同于方案A9,方案A10 在某一時間段內(nèi)控制輸入為0,其余時間正常工作. 方案A10 比方案A9 進一步降低了控制器的更新頻率,也避免了Zeno 行為的發(fā)生.
針對離散時間和連續(xù)時間動態(tài)構(gòu)成的混雜MASs,WANG 等[42]通過令連續(xù)子系統(tǒng)的離散監(jiān)聽周期大小與離散子系統(tǒng)的采樣周期大小相等,統(tǒng)一觸發(fā)函數(shù)形式,解決了一致性問題.
不同類型的事件觸發(fā)機制與設(shè)計策略將會影響MASs 收斂表現(xiàn). 除此以外,事件觸發(fā)還需考慮個體差異、通信連接和外部因素對一致性的影響. 諸多學(xué)者開展了事件觸發(fā)一致性的相關(guān)研究,影響事件觸發(fā)一致性的主要因素可歸納為拓?fù)浣Y(jié)構(gòu)、網(wǎng)絡(luò)通信、個體動態(tài)特性和外部作用4 個方面.
當(dāng)通信拓?fù)涔潭〞r,一致性控制系統(tǒng)實際的信息流會在任務(wù)時段的每個時間節(jié)點形成符合要求的拓?fù)浣Y(jié)構(gòu),而事件觸發(fā)控制卻不一定. 在事件觸發(fā)方案A2、A4、A5 和A7 中,智能體僅需利用鄰居智能體的觸發(fā)信息,因此觸發(fā)信息的數(shù)據(jù)鏈路構(gòu)成的網(wǎng)絡(luò)就是MASs 實際的通信網(wǎng)絡(luò);由于每個智能體的事件觸發(fā)時刻序列不完全相同,智能體的觸發(fā)信息數(shù)據(jù)流將按照固定的次序流通,這會導(dǎo)致實際的通信網(wǎng)絡(luò)在任意時刻不總是滿足特定拓?fù)渚W(wǎng)絡(luò)的要求,而是在某些時間段內(nèi)以聯(lián)合地形式形成一定的拓?fù)浣Y(jié)構(gòu),如無向連通[9]、含有一個有向生成樹[13]、有向強連通權(quán)重平衡[43]和有向強連通[44]等.
文獻[45 - 47]在MASs 事件觸發(fā)一致性控制中考慮了切換拓?fù)涞那樾?,?dāng)通信拓?fù)湓诙鄠€無向連通圖之間進行切換或者通信網(wǎng)絡(luò)聯(lián)合地包含有向生成樹時,所設(shè)計的事件觸發(fā)方案使MASs 實現(xiàn)一致.除了給定的拓?fù)淝袚Q時間序列,事件觸發(fā)一致性控制也研究了拓?fù)淝袚Q是一個半馬爾科夫過程[48-49]的情形. 切換拓?fù)涞脑O(shè)定,使得事件檢測器會在拓?fù)淝袚Q時刻也進行采樣計算或者使得本地控制器的采樣更新會直接使用最新切換時刻所有鄰居的狀態(tài)信息,因此控制器的更新計算頻率會有所提高.
雖然事件觸發(fā)一致性控制方案的設(shè)計使得MASs 信息傳輸頻率降低,但隨著智能體的規(guī)模擴大以及任務(wù)環(huán)境的復(fù)雜性提高,MASs 仍無法完全避免通信網(wǎng)絡(luò)出現(xiàn)傳輸時滯、數(shù)據(jù)丟包等現(xiàn)象. 因此研究網(wǎng)絡(luò)通信情況對事件觸發(fā)一致性的影響也是必要的.
對于傳輸時滯和數(shù)據(jù)丟包的現(xiàn)象,事件觸發(fā)一致性控制方案的設(shè)計主要考慮存在固定時延[27,50]、時變時延[51-52]和隨機時延[53]的情況,以及數(shù)據(jù)丟包發(fā)生在通信網(wǎng)絡(luò)間[51]、傳感器內(nèi)部[54]、事件檢測器和控制器之間[55]、控制器內(nèi)部[56]的情形. 這些研究都是從通信問題的表征著手.
造成通信網(wǎng)絡(luò)存在傳輸時滯、數(shù)據(jù)丟包的主要原因是,網(wǎng)絡(luò)傳輸數(shù)據(jù)過多但通信帶寬有限造成了網(wǎng)絡(luò)連接滿負(fù)載的情況. 為進一步減少數(shù)據(jù)傳輸?shù)呢?fù)載,信號量化技術(shù)可對原始狀態(tài)信息進行編碼和量化,降低數(shù)據(jù)存儲的大小. ZHANG 等[57-58]分別在連續(xù)監(jiān)聽和固定周期采樣的事件觸發(fā)機制中應(yīng)用均勻量化器和對數(shù)量化器,使得智能體的狀態(tài)收斂到有界域內(nèi). ZHANG 等[57]還將經(jīng)過量化和未量化的MASs 事件觸發(fā)頻率進行對比,結(jié)果表明使用量化信息的事件觸發(fā)機制的觸發(fā)次數(shù)更少. 針對應(yīng)用均勻量化器的MASs,WU 等[59]設(shè)計了不依賴狀態(tài)的事件觸發(fā)方案,使系統(tǒng)實現(xiàn)了有界一致性. 信號量化雖然能在事件觸發(fā)一致性控制的基礎(chǔ)上進一步降低資源消耗,但會降低一致性表現(xiàn).
實際物理對象的動態(tài)是高動態(tài)、復(fù)雜的,因此以一階、二階線性MASs 為主要研究對象的事件觸發(fā)一致性在實際應(yīng)用中存在局限性. 為更好地將物理實體的特性映射到被控對象的數(shù)學(xué)模型上、更準(zhǔn)確清晰地描述物理現(xiàn)象,事件觸發(fā)控制需要研究由分?jǐn)?shù)階或非線性個體組成的MASs.
分?jǐn)?shù)階MASs 主要應(yīng)用Caputo 分?jǐn)?shù)階微分的概念和性質(zhì)建立個體的動力學(xué)方程并實現(xiàn)相關(guān)理論證明,但其所設(shè)計的事件觸發(fā)一致性協(xié)議和事件觸發(fā)函數(shù)的形式仍舊是整數(shù)冪形式. 例如,WANG 等[60]和YE 等[61]在分?jǐn)?shù)階MASs 中分別設(shè)計了集中式和分散式的不依賴狀態(tài)事件觸發(fā)控制方案,使智能體能夠?qū)崿F(xiàn)跟蹤一致性;REN 等[62]則研究了分?jǐn)?shù)階MASs 依賴狀態(tài)的分布式事件觸發(fā)機制和自觸發(fā)算法.
為在非線性MASs 中設(shè)計合適的事件觸發(fā)方案,往往假設(shè)動力學(xué)方程的非線性項滿足Lipschitz 條件.GIRARD 等[63]針對具有非線性動態(tài)特性的智能體,提出了含有自適應(yīng)動態(tài)項的集中式事件觸發(fā)機制,所設(shè)計的一致性協(xié)議能夠在給定非線性項滿足Lipschitz 條件假設(shè)下使系統(tǒng)實現(xiàn)漸近一致. PENG 等[64]則在非線性MASs 中,將依賴狀態(tài)和不依賴狀態(tài)的兩個分布式事件觸發(fā)函數(shù)進行集成,設(shè)計了基于采樣數(shù)據(jù)的集成式事件觸發(fā)方案. 當(dāng)智能體動力學(xué)的非線性項是不確定的或未知的,事件觸發(fā)一致性的理論推導(dǎo)已經(jīng)無法通過給定條件給出. 針對MASs具有未知光滑有界的非線性動態(tài)時,YANG 等[65]利用神經(jīng)網(wǎng)絡(luò)中多個已知激活函數(shù)的線性組合去逼近非線性項,所設(shè)計的含有神經(jīng)網(wǎng)絡(luò)訓(xùn)練權(quán)重結(jié)果的事件觸發(fā)控制方案能使系統(tǒng)實現(xiàn)一致. ZHANG 等[66]則應(yīng)用RBF 神經(jīng)網(wǎng)絡(luò)估計未知光滑非線性函數(shù),設(shè)計了解決n階非嚴(yán)格反饋MASs 跟蹤問題的事件觸發(fā)控制方案. 除神經(jīng)網(wǎng)絡(luò)技術(shù)外,ZHENG 等[67]和LI[68]還使用模糊邏輯系統(tǒng)去處理智能體動力學(xué)的未知光滑非線性項,研究自適應(yīng)分布式事件觸發(fā)一致控制方案.
在實際工程中,物理設(shè)備會產(chǎn)生噪聲,控制和傳感等零件的輸出量會受到限制,物理攻擊或其他原因也會使MASs 控制出現(xiàn)故障. 為了將事件觸發(fā)一致性理論推廣應(yīng)用于工程中,事件觸發(fā)一致性控制方案的設(shè)計需要考慮噪聲、飽和和故障等情況的發(fā)生.
在MASs 對噪聲模擬中,往往假設(shè)智能體動力學(xué)方程存在有界隨機變量,在隨機因素作用下系統(tǒng)不能以一般收斂方式實現(xiàn)狀態(tài)一致. 例如,HU 等[69]和SU 等[70]針對含有獨立標(biāo)準(zhǔn)白噪聲MASs 設(shè)計的集中式事件觸發(fā)控制方案使系統(tǒng)以均方收斂的形式實現(xiàn)狀態(tài)一致.
當(dāng)系統(tǒng)的控制器或傳感器存在飽和時,系統(tǒng)控制輸入或測量輸出的大小被限定在一定的范圍內(nèi),會影響系統(tǒng)的穩(wěn)定性. WANG 等[71]和MA 等[72]分別針對控制輸入和傳感輸出飽和的現(xiàn)象,設(shè)計的分布式事件觸發(fā)方案解決了一致性問題.
MASs 會在實體物理層面和通信層面發(fā)生故障,影響系統(tǒng)的控制性能. 實體物理層面中,事件觸發(fā)一致性主要關(guān)注執(zhí)行機構(gòu)發(fā)生故障的情形. 為解決因執(zhí)行機構(gòu)故障導(dǎo)致未知的執(zhí)行效率降低以及執(zhí)行動作發(fā)生偏移的問題,LUO 等[73]和XU[74]提出了自適應(yīng)的事件觸發(fā)一致性控制方案. WANG 等[75]則研究了已知執(zhí)行機構(gòu)故障間歇發(fā)生下的不確定非線性MASs,通過狀態(tài)估計未知期望軌跡信息并設(shè)計分布式的事件觸發(fā)函數(shù)和自適應(yīng)的事件觸發(fā)一致性協(xié)議,實現(xiàn)了對期望軌跡的跟蹤. 通信層面發(fā)生的故障是由外部攻擊產(chǎn)生的,例如拒絕服務(wù)攻擊和欺騙攻擊,會使控制器無法接收到正常的傳輸數(shù)據(jù). 在拒絕服務(wù)攻擊發(fā)生下,PENG 等[76]提出了非脆弱的基于采樣數(shù)據(jù)的分布式事件觸發(fā)方案,所設(shè)計事件觸發(fā)機制使得在拒絕服務(wù)攻擊的間隔內(nèi)至少會發(fā)生一次事件觸發(fā),保證系統(tǒng)的一致性;XU 等[77]和PENG 等[78]利用估計器分別設(shè)計了點對點通信事件觸發(fā)機制和混合事件觸發(fā)機制,能夠保證MASs 在一定攻擊頻率和間隔設(shè)置的前提下安全地實現(xiàn)一致性. 針對可篡改信息的欺騙攻擊,王譽達等[79]設(shè)計了考慮給定欺騙攻擊發(fā)生概率的分散式事件觸發(fā)一致性控制方案.
面對因自身發(fā)生故障或者受到攻擊而傳播錯誤信息的惡意智能體,可通過忽略異常狀態(tài)信息剔除惡意節(jié)點對一致性的影響. 基于該思路,WANG 等[80]和AMIRIAN 等[81]分別應(yīng)用MSR(mean subsequencereduced)算法和W-MSR(weighted-MSR)算法,設(shè)計了事件觸發(fā)彈性一致性控制方案.
證明MASs 事件觸發(fā)一致性的方法主要有兩種:一種方法是直接利用矩陣論和圖論等數(shù)學(xué)知識直接推導(dǎo)目標(biāo)狀態(tài)的收斂特性[21];另一種方法是是應(yīng)用Lyapunov 穩(wěn)定性理論分析系統(tǒng)一致性表現(xiàn). 在保證事件觸發(fā)一致性的控制性能后,需要給出排除控制方案出現(xiàn)Zeno 行為的分析,目前有兩種思路.
思路一:直接證明事件觸發(fā)間隔的下界嚴(yán)格大于0,以保證有限時間內(nèi)不會發(fā)生無限次觸發(fā). 文獻[5,63]應(yīng)用微分方程中的比較定理給出測量誤差的上界,并與事件觸發(fā)的邊界條件進行聯(lián)合求解,驗證了最小觸發(fā)間隔的存在性. FAN 等[9]則通過對測量誤差求導(dǎo),利用微分的基本概念和事件觸發(fā)條件,直接得出觸發(fā)間隔正下界的數(shù)值.
思路二:利用反證法間接證明Zeno 行為不會出現(xiàn). 文獻[26,82 - 83]利用反證法和觸發(fā)信息證明不存在觸發(fā)時間序列收斂的智能體. 根據(jù)Zeno 行為的定義,YU 等[84]將驗證目標(biāo)定位為相關(guān)狀態(tài)有限時間的收斂性,推導(dǎo)得出發(fā)生Zeno 行為的智能體集合為空集.
事件觸發(fā)機制的設(shè)計決定了事件觸發(fā)一致性方案的控制效果和觸發(fā)效率. 為避免Zeno 行為,連續(xù)MASs 可以應(yīng)用基于采樣數(shù)據(jù)的事件觸發(fā)方案,一般MASs 可以采用包含駐留時間或者間歇通信的混合觸發(fā)機制,但這兩類方案會導(dǎo)致事件檢測器對系統(tǒng)部分關(guān)鍵數(shù)據(jù)的忽略. 僅與時間相關(guān)的閾值函數(shù)可以排除Zeno 行為,但其構(gòu)建的事件觸發(fā)機制缺乏對鄰居智能體狀態(tài)的敏感性. 含有常數(shù)項的事件觸發(fā)函數(shù)也能保證Zeno 行為不會發(fā)生,卻只能使系統(tǒng)實現(xiàn)有界一致性. 因此,應(yīng)用上述避免Zeno 行為的觸發(fā)機制會對事件觸發(fā)效率或者一致性控制性能有影響.
對目標(biāo)狀態(tài)進行連續(xù)監(jiān)聽、閾值函數(shù)依賴狀態(tài)且不含常數(shù)項的分布式事件觸發(fā)方案,能夠使得事件檢測器對自身和鄰居智能體的狀態(tài)進行充分利用.但一般的分布式事件觸發(fā)方案無法有效避免Zeno行為. 針對一致性問題,DIMAROGONAS 等[5]設(shè)計的事件觸發(fā)條件如下.
式(21)形式的動態(tài)事件觸發(fā)方案能夠有效避免Zeno 行為,且其觸發(fā)間隔會隨著一致性誤差的減小而增大,比一般的靜態(tài)事件觸發(fā)方案更高效.
MASs 事件觸發(fā)一致性主要應(yīng)用在以無人機、機器人、航天器等實體為對象的編隊控制和姿態(tài)控制問題中. ZHOU 等[85]針對隨機切換通信拓?fù)涞亩嗨男頍o人機系統(tǒng),研究了動態(tài)事件觸發(fā)編隊跟蹤一致性方案. 蘇博等[86]設(shè)計的基于自適應(yīng)模糊干擾觀測器的事件觸發(fā)編隊控制方案,提升了多自主水下機器人的編隊效率. NAIR 等[87]為存在干擾的多機器人系統(tǒng)設(shè)計了事件觸發(fā)的快速有限時間收斂積分滑膜控制器. VILLARREAL-CERVANTES 等[88]針對多移動機器人系統(tǒng)的編隊控制問題設(shè)計了周期事件觸發(fā)控制策略,顯著減小了控制更新的頻率. MU 等[89]考慮時變通信延遲,提出了多移動機器人的異步周期事件觸發(fā)交會控制方法. 針對非完整移動機器人,YANG 等[90]研究了無速度測量信息的事件觸發(fā)編隊跟蹤方案. YI 等[91]考慮航天器執(zhí)行機構(gòu)故障和外部擾動,設(shè)計了分布式事件觸發(fā)航天器編隊自適應(yīng)容錯姿態(tài)一致性算法. XU 等[92]對存在模型不確定性、外部擾動和通信受限情況下的航天器編隊姿態(tài)同步跟蹤問題,提出了分布式自適應(yīng)事件觸發(fā)控制律. 基于衛(wèi)星編隊的Euler-Lagrange 姿態(tài)動力學(xué)模型,王智鵬等[93]研究了分布式事件觸發(fā)的相對姿態(tài)自適應(yīng)控制算法.
除此以外,事件觸發(fā)一致性還被應(yīng)用于傳感網(wǎng)絡(luò)濾波器[94]的設(shè)計,神經(jīng)網(wǎng)絡(luò)[95]和基因調(diào)控網(wǎng)絡(luò)[96]的同步問題研究,以及微電網(wǎng)的電壓同步[97]和無功功率平衡[98-99]的方案設(shè)計.
① 在邊一致性框架下設(shè)計事件觸發(fā)方案. 在當(dāng)前的研究中,點對點事件觸發(fā)通信是建立在對邊狀態(tài)信息監(jiān)聽的基礎(chǔ)上,其對應(yīng)的控制方案目標(biāo)是實現(xiàn)所有智能體個體狀態(tài)同步. 個體狀態(tài)的同步目標(biāo)實際上可以轉(zhuǎn)換為對邊狀態(tài)收斂于0 的要求,如文獻[100]. 直接在邊一致性的框架下設(shè)計有效的事件觸發(fā)方案仍待研究,且邊一致性的視角能否為邊事件觸發(fā)方案的設(shè)計提供更多的思路和靈感也值得商榷.
② 設(shè)計完全分布式的事件觸發(fā)一致性方案. 一些分布式的事件觸發(fā)方案的控制增益和觸發(fā)參數(shù)設(shè)計仍舊需要部分全局信息,例如智能體的總數(shù)和通信拓?fù)鋵?yīng)的拉普拉斯矩陣信息等. 而依賴全局信息設(shè)計的控制方案不利于在大規(guī)模系統(tǒng)中應(yīng)用. 因此,設(shè)計真正完全分布式的事件觸發(fā)一致性控制方案也是一個挑戰(zhàn).
③ 在兩跳或多跳通信下設(shè)計事件觸發(fā)一致性方案. 針對存在惡意節(jié)點的MASs,YUAN 等[101]基于兩跳通信方式,設(shè)計了擁有分布式檢測能力的彈性一致性方案. 雖然在YUAN 等[101]中兩跳通信的應(yīng)用提升了系統(tǒng)可靠性,但同時也增加了通信傳輸負(fù)擔(dān).此時,應(yīng)用事件觸發(fā)技術(shù)降低兩跳甚至多跳通信下MASs 分布式一致性控制方案的通信頻率就顯得尤為重要.
④ 事件觸發(fā)控制方案在大規(guī)模集群的實物驗證. 事件觸發(fā)一致性在大規(guī)模編隊、集群等方面均有理論研究和仿真實驗,但其半實物或者實物驗證比較少.