范曉宇,賈新春?,李彬,謝云飛
(1.山西大學(xué)自動化與軟件學(xué)院,山西 太原 030031;2.山西大學(xué)數(shù)學(xué)科學(xué)學(xué)院,山西 太原 030006)
近年來,多智能體系統(tǒng)獲得了迅速的發(fā)展,它可以刻畫許多自然現(xiàn)象[1]、移動機器人[2]、分布式電力調(diào)度[3]和傳感器網(wǎng)絡(luò)[4]。一致性是多智能體系統(tǒng)協(xié)同控制的核心問題,受到了學(xué)界的廣泛關(guān)注[5-6]。然而,刻畫不同群體之間的交互關(guān)系并不僅有合作關(guān)系,同時考慮合作和對抗交互的二分一致性更具研究意義[7-8]。關(guān)于二分一致性研究已有不少工作,其中:文獻[9]針對異構(gòu)線性多智能體系統(tǒng)設(shè)計了一種二分固定時間補償器以實現(xiàn)輸出編隊-包圍追蹤控制目標;文獻[10]研究了多智能體系統(tǒng)的預(yù)設(shè)時間二分一致性的事件觸發(fā)控制;文獻[11]利用一個三選項決策機制研究了多智能體系統(tǒng)的二分一致性以避免不受約束的控制協(xié)議設(shè)計值;文獻[12]提出了一個針對網(wǎng)絡(luò)攻擊的二分追蹤一致性的安全反饋控制方案。
多智能體系統(tǒng)的拓撲圖是刻畫其信息交互的有效方式。由于有向通信拓撲下2 個智能體之間的耦合權(quán)重大概率不同,因此針對于雙向權(quán)值不同的符號圖,一個被稱為“細節(jié)平衡結(jié)構(gòu)”的新的拓撲概念被提出[13]。文獻[14]在此基礎(chǔ)上研究了有限時間一致性協(xié)議。文獻[15]研究了細節(jié)平衡對抗交互下多智能體系統(tǒng)的有限時間二分一致性。
回顧多智能體系統(tǒng)的一致性研究,采樣控制已是不可或缺的一個分支,針對單個智能體,多數(shù)研究僅考慮了單率采樣機制。為了避免單率采樣中采樣頻率高的數(shù)據(jù)等待采樣頻率低的數(shù)據(jù)導(dǎo)致部分數(shù)據(jù)傳輸延遲、影響控制效果,多率采樣機制被作為一種較好的解決方案被提出。多率采樣機制可以針對智能體內(nèi)部對應(yīng)不同采樣頻率的傳感器及時地進行數(shù)據(jù)采樣傳輸,使得控制更具實時性。在網(wǎng)絡(luò)化系統(tǒng)中,文獻[16]提出了一個新穎的匹配機制來使得多率觀測器和系統(tǒng)的多率采樣信息同步,解決了帶有輸入時延的一般網(wǎng)絡(luò)化系統(tǒng)在多率采樣下的鎮(zhèn)定問題??紤]到系統(tǒng)的輸出采用多率采樣,文獻[17]提出一個分散式事件觸發(fā)方法解決了網(wǎng)絡(luò)化系統(tǒng)的耗散控制問題。文獻[18]將多率采樣機制擴展到了對多智能體系統(tǒng)的研究,采用動態(tài)補償器的方法解決了異構(gòu)和同構(gòu)多智能體系統(tǒng)在多率采樣下的輸出和狀態(tài)一致性。文獻[19]在拒絕服務(wù)攻擊下,基于多率采樣機制實現(xiàn)了多智能體系統(tǒng)的安全一致性。
雖然多率采樣機制可以充分利用采樣數(shù)據(jù),更具實時性地完成多智能體系統(tǒng)的控制目標,但是隨著通信技術(shù)的成熟,控制動作和信號傳輸都高度依賴于通信網(wǎng)絡(luò),而在系統(tǒng)狀態(tài)未發(fā)生較大變化時,多率采樣數(shù)據(jù)并不需要高頻次的傳輸,從而導(dǎo)致通信資源的浪費,甚至有堵塞網(wǎng)絡(luò)的風(fēng)險。為解決這一問題,事件觸發(fā)機制作為一個有效的方案被引入多智能體系統(tǒng)的控制中[20-21]。文獻[22]在切換拓撲下研究了多智能體系統(tǒng)的事件觸發(fā)二分一致性。為了進一步降低事件觸發(fā)的頻次,一種動態(tài)事件觸發(fā)機制在文獻[23]中被提出。通過引入一個內(nèi)部動態(tài)變量,動態(tài)事件觸發(fā)可以更有效地降低通信資源的消耗[24]。文獻[25]在引入內(nèi)部動態(tài)變量的情況下,利用鄰居智能體觸發(fā)時刻廣播的狀態(tài)信息,設(shè)計一個基于事件的控制協(xié)議實現(xiàn)了一致性目標。在考慮輸入飽和的情形下,文獻[26]研究了基于觀測器的動態(tài)事件觸發(fā)二分一致性。
可以發(fā)現(xiàn),在針對多智能體系統(tǒng)的二分一致性研究中,較少有多率采樣機制下實現(xiàn)控制目標的成果展現(xiàn),而且在多率采樣機制下引入動態(tài)事件觸發(fā)機制,可以充分利用采樣數(shù)據(jù),同時在一致性誤差容許范圍內(nèi)避免文獻[18]中智能體之間冗余數(shù)據(jù)傳輸,并可根據(jù)系統(tǒng)狀態(tài)誤差變化動態(tài)調(diào)整觸發(fā)閾值?;谏鲜龇治觯疚脑诩毠?jié)平衡的拓撲結(jié)構(gòu)下,研究多率采樣機制下多智能體系統(tǒng)的動態(tài)事件觸發(fā)二分一致性。首先,在多智能體系統(tǒng)二分一致性的研究中引入多率采樣機制,構(gòu)造一個緩存器解決多率采樣時序的不匹配問題;其次,設(shè)計一類多率觀測器便于獲得系統(tǒng)的估計狀態(tài)以實現(xiàn)控制目標,通過引入動態(tài)事件觸發(fā)機制,大幅減少事件觸發(fā)次數(shù);最后,基于觸發(fā)時刻的觀測器狀態(tài)信息設(shè)計分布式控制協(xié)議,實現(xiàn)多智能體系統(tǒng)的二分一致性,并排除芝諾行為。
符號圖G=(V,E,H),其 中:V={v1,v2,…,vN}是節(jié)點集;E ?V×V 是邊集;(vj,vi) ?E 表示存在一個邊從智能體j到智能體i;H=[hij] ?RN×N為鄰接矩陣。此外,hij>0,(vj,vi) ?E 表示智能體j和智能體i之間是 協(xié)同合 作的關(guān) 系,而hij<0,(vj,vi) ?E 表 示2 個智能體之間是對抗競爭的關(guān)系。若hij=0,則說明(vj,vi) ?E。而對于智能體i而言,其鄰居智能體可通過一個集合Ni={j|vj?V,(vj,vi) ?E,j≠i} 來表示。一個有向符號圖G 中如果存在一條路徑從任意節(jié)點vi到vj,并存在另一條路徑從vj到vi,則稱此圖是強連通圖。
圖G 的Laplacian 矩陣表示為:
定義1[7]如果對于圖 G 存在2 個子集 V1和V2滿足V1∪V2=V,同時V1∩V2=?,則稱此圖為結(jié)構(gòu)平衡圖,并且具有以下特性:hij≥ 0,?vi,vj?V1(V2)和hij≤0,?vi?V1,vj?V2。
定義2[13]如果存 在一些常數(shù)γi>0,i?{1,2,…,N} 使 得γihij=γjhji對于任意的i,j?{1,2,…,N}均成立,則稱有向符號圖 G 是細節(jié)平衡圖。存在一個正定對角矩陣Γ=diag{γ1,γ2,…,γN}使得LD=ΓL 為一個對稱矩陣。
假設(shè)1本文所研究的有向符號圖 G 是具有細節(jié)平衡結(jié)構(gòu)的結(jié)構(gòu)平衡強連通圖。
假設(shè)2假設(shè)矩陣對(A,B)是可鎮(zhèn)定的,矩陣對(A,C)是可觀測的。
引理1[5,7]對于一個結(jié)構(gòu)平衡的有向符號圖G,存在一個符號矩陣S=diag{s1,s2,…,sN},si?{1,-1}使得矩陣SHS中的所有元素均為非負的,即SHS>0。
引理2[7,13]假設(shè)一 個有向 符號圖 G 是帶有 細節(jié)平衡拓撲結(jié)構(gòu)的結(jié)構(gòu)平衡圖,則相對應(yīng)的符號Laplacian 矩陣LD有一個非負向量[s1,s2,…,sN]T作為其相對于單一零特征值的特征向量,并且LD的特征值可重新排序為λ1(LD)≤λ2(LD)≤…≤λN(LD),其中,λ1(LD)=0 。
考慮一個由N個智能體組成的多智能體系統(tǒng),其中第i個智能體的動力學(xué)描述如下:
其中:xi(t) ?Rn、yi(t) ?Rm、ui(t) ?Rp分別表示系統(tǒng)的狀態(tài)、輸 出、控制輸 入;A?Rn×n、B?Rn×p、C?Rm×n分別表示系統(tǒng)矩陣、輸入矩陣、輸出矩陣。
智能體對應(yīng)于不同系統(tǒng)特征的輸出狀態(tài)應(yīng)由不同的傳感器進行多率采樣,類似于文獻[16,18]所研究的多率采樣機制,本文考慮多率采樣機制如下:假設(shè)智能體i的系統(tǒng)輸出的m個分量根據(jù)其所選傳感器組的采樣頻率不同分為r組子向量,即yi(t)=并且其中,均為整數(shù)。
如圖1 所示,一個智能體的不同的輸出分量有其不全相同的采樣頻率,表示第r個傳感器組的采樣時刻,其中?N 并且表示第r個傳感器組的采樣周期。采用一個緩存器來儲存不同傳感器組所采樣的輸出數(shù)據(jù),并通過零階保持機制來獲得單個智能體的緩存器組合輸出狀態(tài)數(shù)據(jù):
圖1 多率采樣機制下動態(tài)事件觸發(fā)二分一致性控制框架Fig.1 The framework of dynamic event-triggered bipartite consensus control with a multi-rate sampling mechanism
通過以一個升序的方式重新排列智能體i的各傳感器組的采樣時刻,可以得到一個多率采樣時間序列緩存器中的數(shù)據(jù)在每一個采樣時刻更新,不同采樣周期的傳感器組在其多率采樣時刻將采樣數(shù)據(jù)送入緩存器,通過緩存器后,提供至多率觀測器的系統(tǒng)采樣數(shù)據(jù)為緩存器的組合輸出:
由式(3)可看出,多率采樣的時序不匹配問題得到解決,任意采樣周期不同的傳感器組數(shù)據(jù)均可轉(zhuǎn)換為一連續(xù)時間下的輸出yˉi(t)。
注1由式(2)及式(3)可以得出,傳感器組Sr所采樣的輸出變量在時刻到達緩存器,而緩存器的組合輸出狀態(tài)yˉi(t)只更新所對應(yīng)的第r個子向量,剩余的子向量均保持上一次更新的數(shù)據(jù)不變。因此,多率采樣機制可以利用更為實時的采樣數(shù)據(jù),同時還避免了整個采樣輸出變量的同時更新。
如圖1 所示,對于式(1)所示的多智能體系統(tǒng),構(gòu)造一組多率觀測器以實現(xiàn)對于系統(tǒng)狀態(tài)的觀測并提供連續(xù)數(shù)據(jù)以便于控制器的設(shè)計,并由后續(xù)設(shè)計的動態(tài)事件觸發(fā)機制確定其廣播狀態(tài)數(shù)據(jù)至通信網(wǎng)絡(luò)的事件時刻。
其中:R?Rn×m為待設(shè)計的觀測器增益矩陣,其設(shè)計要求A+RC是Hurwitz 的。
針對式(1)所示的多智能體系統(tǒng),提出多率采樣機制下具有細節(jié)平衡對抗交互的二分一致性控制協(xié)議如下:
為了實現(xiàn)動態(tài)事件觸發(fā)機制的設(shè)計,首先定義一個估計偏差向量判斷是否將智能體i的多率觀測器狀態(tài)廣播至通信網(wǎng)絡(luò)的時刻由下列觸發(fā)函數(shù)確定:
引理3對于給定的標量?i(0)、μi和βi,動態(tài)輔助參數(shù)?i(t)>0,i?{1,2,…,N}。
證明對于根據(jù)動態(tài)輔助參數(shù)?i(t)的動力學(xué)描述[見式(7)]可得:
因此,對于t?[0,∞),均有?i(t) >0 成立。
定義3若對任意的智能體i?{1,2,…,N},j?Ni,在任意的初始條件下,滿足:
則稱多智能體系統(tǒng)達到了二分一致性。
定理1若假設(shè)1 和假設(shè)2 成立,如果存在正定對稱矩陣Q>0 和2 個常數(shù)ρ1,ρ2>0 滿足:
則所構(gòu)造的多率觀測器可以有效地跟蹤智能體的狀態(tài)。進一步地,式(1)所示多智能體系統(tǒng)可以通過所設(shè)計的控制協(xié)議[見式(5)]在引入動態(tài)事件觸發(fā)機制[見式(6)]的基礎(chǔ)上實現(xiàn)二分一致性,且控制增益矩陣K=-BTP,而矩陣P可由下列代數(shù)黎卡提方程求解得出:
根據(jù)上述定義,可以推導(dǎo)得出:
基于上述分析,構(gòu)造一個李雅普諾夫函數(shù):
對其求導(dǎo)可得:
本節(jié)通過后續(xù)2 種情境的分析排除事件觸發(fā)過程中芝諾行為的發(fā)生。
情境1對于智能體i而言,在范圍內(nèi)沒有鄰居智能體 滿足條件觸發(fā),則由可得出:
綜上所述,芝諾行為被排除。
芝諾行為意味著系統(tǒng)需要在有限時間內(nèi)無限次地更新狀態(tài),這在實際應(yīng)用中是不可能的,通過上述分析可知,連續(xù)兩次事件觸發(fā)時刻之間的間隔與系統(tǒng)控制、動態(tài)輔助參數(shù)、觀測器設(shè)計及多率采樣誤差有關(guān)。在相關(guān)應(yīng)用中,理論分析已確保芝諾行為不會發(fā)生,并可通過調(diào)節(jié)上述參數(shù),依托于場景特征,給出兩次觸發(fā)之間的間隔下界以滿足實際需求。
在本節(jié)中,通過一個包含3 種控制方案(多率采樣動態(tài)事件觸發(fā)、多率采樣靜態(tài)事件觸發(fā)、單率采樣動態(tài)事件觸發(fā))的仿真對比來驗證所提控制協(xié)議的有效性??紤]一個由9 個智能體組成的多智能體系統(tǒng),其滿足細節(jié)平衡結(jié)構(gòu)的通信網(wǎng)絡(luò)拓撲如圖2 所示(彩色效果見《計算機工程》官網(wǎng)HTML 版,下同)。
圖2 帶有細節(jié)平衡結(jié)構(gòu)的網(wǎng)絡(luò)拓撲Fig.2 A network topology with a detail-balanced structure
智能體的系統(tǒng)矩陣、輸入矩陣和輸出矩陣分別表示如下:
基于鄰接矩陣,可得到相對應(yīng)的矩陣Γ為:
Γ=diag{2,1,4,1,2,3,5,1,2}
通過求解代數(shù)黎卡提方程[見式(12)]可以得到:
控制增益矩陣K可選為:
通過極點配置法可得到觀測器增益矩陣R為:
智能體初始狀態(tài)為:x1(0)=col{3,-2,3},x2(0)=col{2,3,3},x3(0)=col{1,5,2},x4(0)=col{-2,2,-3},x5(0)=col{-3,-4,-2},x6(0)=col{-1,1,-3},x7(0)=col{2,-1,-2},x8(0)=col{-2,4,1},x9(0)=col{1,1,1} 。為便于對比分析,3 種控制方案下系統(tǒng)狀態(tài)初值均一致。
取動態(tài)事件觸發(fā)閾值參數(shù)的初值為靜態(tài)事件觸發(fā)機制下的閾值,其初始取值如下:?1(0)=10,?2(0)=15,?3(0)=28,?4(0)=13,?5(0)=19,?6(0)=12,?7(0)=10,?8(0)=20,?9(0)=15。顯然,在靜態(tài)事件觸發(fā)機制中,閾值保持不變,而在動態(tài)事件觸發(fā)機制中,觸發(fā)閾值是時變的。各智能體相關(guān)的控制參數(shù)見表1。
表1 控制參數(shù)Table 1 Control parameters
多率采樣機制動態(tài)事件觸發(fā)控制方案下多智能體系統(tǒng)的狀態(tài)軌跡如圖3 所示,其最終狀態(tài)實現(xiàn)二分一致性。各智能體的動態(tài)事件觸發(fā)時刻在圖4 中展示。圖5 中顯示了動態(tài)輔助參數(shù)的軌跡,可看出,隨著多智能體系統(tǒng)中智能體狀態(tài)及一致性誤差的變化,關(guān)于智能體是否觸發(fā)的這一參數(shù)會在一致性誤差較大時取相對應(yīng)的較大值以降低觸發(fā)次數(shù),隨著系統(tǒng)一致性的逐步實現(xiàn),這一參數(shù)會進一步減小以保證更好的系統(tǒng)一致性能。
圖3 多率采樣動態(tài)事件觸發(fā)控制下9 個智能體的狀態(tài)軌跡Fig.3 The states trajectories of nine agents under a dynamic event-triggered control with a multi-rate sampling mechanism
圖4 多率采樣機制下各智能體動態(tài)事件觸發(fā)時刻Fig.4 The dynamic event-triggered instants of each agent with a multi-rate sampling mechanism
圖5 多率采樣機制下動態(tài)事件觸發(fā)輔助參數(shù)狀態(tài)軌跡Fig.5 The state trajectories of dynamic event-triggered auxiliary parameters with a multi-rate sampling mechanism
圖6 給出了3 種控制方案下收斂性能對比,同時表2 給出了不同控制方案下平均事件觸發(fā)次數(shù)對比。分析可得,多率采樣機制可利用更為實時的系統(tǒng)數(shù)據(jù),控制目標的實現(xiàn)更為迅速,并利用多率采樣下的動態(tài)事件觸發(fā)機制,可在大幅降低觸發(fā)次數(shù)、減少通信負擔(dān)的同時,保證更優(yōu)的系統(tǒng)一致性能。
表2 事件觸發(fā)次數(shù)對比Table 2 Comparison of event-triggered times 單位:次
圖6 3 種控制方案下收斂性能對比Fig.6 Comparison of convergence performance under three control schemes
本文研究多率采樣機制下多智能體系統(tǒng)的動態(tài)事件觸發(fā)二分一致性。在解決多率采樣時序不匹配的問題后,設(shè)計一類多率觀測器便于獲得系統(tǒng)的估計狀態(tài)以構(gòu)造分布式動態(tài)事件觸發(fā)控制協(xié)議。利用代數(shù)黎卡提方程和李雅普諾夫穩(wěn)定性理論證明系統(tǒng)可以在帶有細節(jié)平衡結(jié)構(gòu)的通信網(wǎng)絡(luò)中實現(xiàn)二分一致性并排除芝諾行為。仿真對比結(jié)果證明了所提控制協(xié)議的有效性。未來的工作將考慮通信網(wǎng)絡(luò)中存在惡意攻擊的情形,研究多率采樣機制下多智能體系統(tǒng)的動態(tài)事件觸發(fā)二分一致性。