劉遠(yuǎn)山 楊洪勇 劉 凡 李玉玲 楊怡澤
(1.魯東大學(xué)信息與電氣工程學(xué)院,山東煙臺(tái) 264025;2.新南威爾士大學(xué)電氣工程與信息學(xué)院,悉尼)
受到自然界中動(dòng)物集體運(yùn)動(dòng)(或者集群、編隊(duì))行為的啟發(fā),人們發(fā)現(xiàn)由多個(gè)具有自主“計(jì)算”能力的個(gè)體組成的分布式網(wǎng)絡(luò)系統(tǒng)通常能夠完成相對(duì)復(fù)雜的任務(wù),且具有單個(gè)個(gè)體所不具有的能力.多智能體系統(tǒng)的一致性控制[1–4]作為分布式多智能體協(xié)同控制的基礎(chǔ),在智能交通、無人機(jī)編隊(duì)、分布式計(jì)算等領(lǐng)域的廣泛應(yīng)用引起了研究者的關(guān)注.
在實(shí)際的工程應(yīng)用中,控制系統(tǒng)總能受到未建模動(dòng)態(tài),參數(shù)攝動(dòng)和外部干擾等影響,這些不確定因素會(huì)嚴(yán)重影響著系統(tǒng)的動(dòng)態(tài)性能.文獻(xiàn)[5]通過研究垂直軸磁懸浮軸承中的旋轉(zhuǎn)擾動(dòng),設(shè)計(jì)了一種非線性擾動(dòng)觀測器來估計(jì)干擾,最終使得系統(tǒng)達(dá)到穩(wěn)定值.文獻(xiàn)[6–8]通過干擾觀測器可以有效估計(jì)外部擾動(dòng),設(shè)計(jì)了基于干擾觀測器的控制協(xié)議,使得具有固定拓?fù)浜妥儞Q拓?fù)涞亩嘀悄荏w系統(tǒng)達(dá)到一致穩(wěn)定.文獻(xiàn)[9]研究了存在外部干擾的時(shí)滯高階多智能體系統(tǒng),并利用L2–L∞方法研究了系統(tǒng)的一致性問題,并且得到了閉環(huán)系統(tǒng)達(dá)到一致的條件.針對(duì)直流–直流(direct current-direct current,DC–DC)降壓變換器的控制和魯棒性分析問題,文獻(xiàn)[10]提出了一種基于擾動(dòng)觀測器的控制方法.該方法通過構(gòu)造干擾補(bǔ)償增益,消除了輸出電壓通道中不匹配的不確定性擾動(dòng).文獻(xiàn)[11]對(duì)現(xiàn)有的擾動(dòng)或者不確定性估計(jì)方法進(jìn)行了系統(tǒng)和全面的回顧,討論了各種補(bǔ)償技術(shù)和集成干擾等不確定性補(bǔ)償.文獻(xiàn)[12]研究了帶有異質(zhì)擾動(dòng)的一階多智能體系統(tǒng)的平均一致濾波問題,設(shè)計(jì)了干擾觀測器估計(jì)系統(tǒng)中存在的擾動(dòng),利用矩陣?yán)碚摵皖l域分析,在沒有和具有相同通信延遲的情況下分別得到了系統(tǒng)收斂的充要條件.在上述的研究中,大都考慮的是連續(xù)時(shí)間系統(tǒng)的情形,智能體的狀態(tài)信息不斷地在各個(gè)節(jié)點(diǎn)之間傳輸,這就會(huì)占用大量的網(wǎng)絡(luò)帶寬,并且消耗大量的能源.為了解決上述問題,文獻(xiàn)[13–15]中提出多智能體系統(tǒng)的事件觸發(fā)控制機(jī)制,分別研究了集中式觸發(fā)、分布式觸發(fā)和自觸發(fā)等控制策略.文獻(xiàn)[16]研究了分布式一階多智能體系統(tǒng)的領(lǐng)導(dǎo)跟隨一致性,文中提出控制協(xié)議中的領(lǐng)導(dǎo)者的控制協(xié)議為全局信息.文獻(xiàn)[17]研究并給出了非線性多智能體系統(tǒng)的基于Lyapunov方法和駐留時(shí)間方法兩種事件觸發(fā)機(jī)制的設(shè)計(jì)策略.文獻(xiàn)[18]針對(duì)強(qiáng)連通網(wǎng)絡(luò)提出一種自適應(yīng)事件觸發(fā)控制方案,該方案根據(jù)采樣數(shù)據(jù)動(dòng)態(tài)改變系統(tǒng)參數(shù)實(shí)現(xiàn)觸發(fā)時(shí)刻間隔的動(dòng)態(tài)調(diào)節(jié).文獻(xiàn)[19–20]中研究了異構(gòu)多智能體系統(tǒng)的輸出收斂問題,設(shè)計(jì)了一個(gè)事件觸發(fā)下的輸出控制機(jī)制.文獻(xiàn)[21]研究了基于事件觸發(fā)機(jī)制的高階非線性多智能體系統(tǒng)領(lǐng)導(dǎo)者跟隨一致性問題,控制協(xié)議采用基于相鄰智能體的相對(duì)輸出量的反饋控制方法,最終推導(dǎo)出系統(tǒng)一致收斂的充分條件.文獻(xiàn)[22]針對(duì)一階多智能體系統(tǒng)研究了其事件觸發(fā)的一致性問題,文中采用了領(lǐng)導(dǎo)跟隨結(jié)構(gòu)的自適應(yīng)一致性算法,智能體的控制輸入由集中式事件觸發(fā)條件決定.另外,考慮了多智能體系統(tǒng)在具有相同輸入延遲的情況,并且獲得了線性矩陣不等式形式的一致性收斂條件.
在實(shí)際應(yīng)用中,多智能體的輸入通道中不可避免地會(huì)存在外部擾動(dòng).干擾的存在會(huì)影響到系統(tǒng)的運(yùn)動(dòng)狀態(tài),所以研究干擾對(duì)系統(tǒng)產(chǎn)生的影響是十分必要的,但現(xiàn)在對(duì)于這個(gè)問題的研究相對(duì)較少.本文在總結(jié)前人研究工作的基礎(chǔ)上設(shè)計(jì)了一種線性干擾觀測器估計(jì)系統(tǒng)中出現(xiàn)的擾動(dòng),并提出了一種基于事件觸發(fā)機(jī)制的干擾主動(dòng)控制協(xié)議,研究了具有干擾的多智能體系統(tǒng)一致收斂的充分條件.
符號(hào)說明:表示向量或矩陣的歐幾里德范數(shù);符號(hào)AT表示矩陣或向量A的轉(zhuǎn)置;使用1N(0N)來表示所有元素為1或者0的N維列向量,符號(hào)diag{x1,x2,…,xn}表示對(duì)角元素xi為對(duì)角矩陣;用符號(hào)A ?B表示矩陣A和B的Kronecker積.
智能體與外部系統(tǒng)之間的信息交流一般是通過無向圖或者有向圖來描述.一個(gè)圖可以被描述為G=(V,ε),其中:V={1,2,…,N}是一個(gè)與N個(gè)智能體相關(guān)聯(lián)的非空點(diǎn)集,ε ?V ×V是該智能體集合的邊集.(i,j)∈ε意味著節(jié)點(diǎn)i可以從節(jié)點(diǎn)j獲取信息,節(jié)點(diǎn)j叫做節(jié)點(diǎn)i的鄰居節(jié)點(diǎn),節(jié)點(diǎn)i的鄰居的集合可以定義為Ni={j:(i,j)∈ε}.加權(quán)鄰接矩陣被定義為如果(i,j)∈ε,那么aij=aji>0,否則aij=0.在這里,本文假設(shè)aii=0,i∈IN,這就意味著每一個(gè)節(jié)點(diǎn)沒有自環(huán).與鄰接矩陣A相關(guān)聯(lián)的拉普拉斯矩陣定義為lij=?aij,
在本文中,考慮有N個(gè)跟隨者智能體和一個(gè)領(lǐng)導(dǎo)者智能體組成的多智能體系統(tǒng)的領(lǐng)導(dǎo)跟隨一致性問題.跟隨者智能體與外部的領(lǐng)導(dǎo)者智能體之間的通信拓?fù)鋱D用是一個(gè)節(jié)點(diǎn)集,并且是一個(gè)邊集;節(jié)點(diǎn)0代表領(lǐng)導(dǎo)者(外部系統(tǒng)).定義bi為跟隨者和領(lǐng)導(dǎo)者之間的連接權(quán)重,其中i=1,2,…,N.令B=diag{b1,b2,…,bN},如果第i個(gè)跟隨者與領(lǐng)導(dǎo)者連通,則bi >0,否則bi=0.
為了方便下面的公式推導(dǎo)與證明,提出以下引理:
引理1[21]L為圖G的Laplacian矩陣,
1)λ1=0是L中的一個(gè)特征值,且其對(duì)應(yīng)的特征向量為1,即滿足L1=0;
引理2[23]對(duì)于任意維度的矩陣M,N,P和Q,并且M和N是可逆矩陣,Kronecker積具有以下特性:
考慮一個(gè)帶有領(lǐng)導(dǎo)者的多智能體系統(tǒng),其中跟隨者i的動(dòng)力學(xué)方程為
假設(shè)1假設(shè)干擾di(t)在控制通道中為諧波噪音或者周期性的噪聲,它可以用如下外部系統(tǒng)來表示:
定義1(領(lǐng)導(dǎo)跟隨一致性)如果對(duì)于任意的初始狀態(tài)x0(0)和xi(0),存在控制輸入ui(t)可以使得
對(duì)于所有的智能體i均成立,則多智能體系統(tǒng)(1)達(dá)到了領(lǐng)導(dǎo)跟隨一致性,其中i=1,2,…,N.
引理3假設(shè)多智能體系統(tǒng)(1)的狀態(tài)是可以獲得的,構(gòu)造系統(tǒng)(1)的干擾觀測器如下:
證定義干擾觀測器的干擾誤差
由干擾觀測器(3)和干擾估計(jì)誤差(4)得到
由于(W,Y)是可觀測的,則一定存在矩陣K,使得矩陣(W ?KY)是Hurwitz的,那么誤差系統(tǒng)(5)是漸近穩(wěn)定的.因此干擾觀測器的干擾估計(jì)誤差(t)能夠漸近地跟蹤系統(tǒng)(1)中的干擾實(shí)際值. 證畢.
針對(duì)帶有外部擾動(dòng)的領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)(1),其傳統(tǒng)的連續(xù)時(shí)間下的一致性控制協(xié)議為
其中:r >0,α>0為待設(shè)計(jì)的控制協(xié)議的反饋控制增益,為干擾估計(jì)項(xiàng).
為了降低跟隨者智能體控制協(xié)議的更新次數(shù),節(jié)約智能體有限的計(jì)算資源和能源的消耗,所以針對(duì)智能體i設(shè)計(jì)分布式事件觸發(fā)函數(shù)?i(t).由?i(t)0得到一系列離散的事件觸發(fā)時(shí)刻
其中:k=1,2,…代表第k次的事件觸發(fā)時(shí)刻,i=1,…,N.設(shè)計(jì)第i個(gè)智能體的分布式事件觸發(fā)下的領(lǐng)導(dǎo)跟隨一致性控制協(xié)議為
注1一致性控制協(xié)議(6)中所用到的采樣狀態(tài)量為在事件不被觸發(fā)的時(shí)間段內(nèi),兩個(gè)采樣值均存放在臨時(shí)的寄存器或者零階保持器中,當(dāng)?shù)趇個(gè)(或者第j個(gè))智能體的事件分別被觸發(fā)的時(shí)候才會(huì)更新相應(yīng)的(或者
為了分析多智能體系統(tǒng)(1)在控制協(xié)議(6)的作用下能夠?qū)崿F(xiàn)領(lǐng)導(dǎo)跟隨一致性.定義狀態(tài)誤差ei(t)=那么
那么多智能體系統(tǒng)(1)變更為
定理1如果多智能體系統(tǒng)(1)的拓?fù)浣Y(jié)構(gòu)是固定拓?fù)?且具有一棵全局生成樹,領(lǐng)導(dǎo)者為根節(jié)點(diǎn).對(duì)于任意的xi(t)|t=t0∈m選取合適的0<ηi <1,?i∈{1,2,…,N},設(shè)計(jì)分布式事件觸發(fā)函數(shù)如下:
其中:r >0,α>0為控制協(xié)議的控制增益,|Ni|表示了智能體i的直接相連的鄰居智能體的數(shù)目.在控制協(xié)議(6)的作用下,當(dāng)時(shí),多智能體系統(tǒng)(1)可以實(shí)現(xiàn)領(lǐng)導(dǎo)跟隨一致性.
證構(gòu)造Lyapunov函數(shù)
對(duì)于狀態(tài)誤差ei(t),可以得到
所以
如果存在ηi∈(0,1]可以使得
注2由于該事件觸發(fā)條件是分布式的,對(duì)于智能體i只要滿足事件觸發(fā)控制器將會(huì)提取自身及其鄰居的狀態(tài)來更新控制器(6).
注3在分布式事件觸發(fā)函數(shù)(10)中的為方程(5)的解.因?yàn)樵谝?中被證明是漸近穩(wěn)定的,所以是有界的.由于事件觸發(fā)函數(shù)(10)中實(shí)際干擾與估計(jì)的干擾值的誤差項(xiàng)是存在的,所以使得變得更容易滿足,并且該項(xiàng)使得(10)變?yōu)楦颖J氐挠|發(fā)條件.
當(dāng)兩個(gè)事件觸發(fā)時(shí)刻之間的間隔為0時(shí),稱為芝諾效應(yīng).如果出現(xiàn)這種情況,則事件觸發(fā)機(jī)制不能被使用.為表明本文所提事件觸發(fā)策略不會(huì)在極小的時(shí)間段內(nèi)被觸發(fā)無限次,特給出如下定理及其證明.
定理2假設(shè)圖中Leader作為一個(gè)全局可達(dá)點(diǎn),考慮帶有一個(gè)領(lǐng)導(dǎo)者的多智能體系統(tǒng)(1)–(2),應(yīng)用一致性協(xié)議(6)和分布式事件觸發(fā)函數(shù)(10).則多智能體系統(tǒng)(1)–(2)中的任意一個(gè)智能體q,得到的所有的觸發(fā)時(shí)刻為τ0… τk τk+1,它的任意兩個(gè)連續(xù)事件觸發(fā)時(shí)刻之間的間隔不小于
證構(gòu)造(t)/(t)的動(dòng)力學(xué)方程如下:
當(dāng)t∈[tk,tk+1)時(shí),
由于上式中ed(t)為觀測器的估計(jì)值與輸入通道中的外部擾動(dòng),通過上面的分析,可以得到所以可以將上式變?yōu)?/p>
解上式微分方程可得
所以,可以得到
證畢.
在這一部分,將利用MATLAB軟件來仿真驗(yàn)證本文所提的控制算法和分布式事件觸發(fā)函數(shù).在本次實(shí)驗(yàn)中考慮由4個(gè)Follower和1個(gè)Leader組成的多智能體網(wǎng)絡(luò)系統(tǒng).假設(shè)每個(gè)Follower智能體的鄰居為N1={4},N2={3,4},N3={2},N4={1,2},那么可以得到多智能體系統(tǒng)(1)如圖1所示的拓?fù)浣Y(jié)構(gòu).
圖1 多智能體系統(tǒng)的通信拓?fù)鋱DFig.1 Communication topology of multi-agent systems
那么多智能體系統(tǒng)(1)相應(yīng)的Laplacian矩陣和領(lǐng)導(dǎo)跟隨矩陣如下:
假設(shè)外源干擾信號(hào)由以下外部系統(tǒng)產(chǎn)生:
應(yīng)用線性矩陣不等式為了使矩陣(W ?KY)為Hurwitz的,那么可以選取干擾觀測增益K為[3 3]T.假設(shè)
分別為擾動(dòng)系統(tǒng)(13)的初始狀態(tài).對(duì)于控制協(xié)議ui(t),選取
智能體的初始狀態(tài)為
在上述初始狀態(tài)下,按照給出的控制器來調(diào)控系統(tǒng)可以得到智能體位置狀態(tài)仿真圖2–3.
圖2 帶有外部擾動(dòng)和干擾觀測器的多智能體系統(tǒng)的運(yùn)動(dòng)軌跡Fig.2 Trajectories of multi-agent systems with external disturbance observer
圖3 4個(gè)智能體干擾觀測器的觀測誤差Fig.3 Observation errors of 4 agents with the disturbance observer
系統(tǒng)仿真圖2是帶有外部擾動(dòng)和干擾觀測器的多智能體系統(tǒng)的運(yùn)動(dòng)狀態(tài)的實(shí)際值,盡管多智能體的輸入通道中存在外部擾動(dòng)的影響,但是由于控制協(xié)議中加入了擾動(dòng)抑制項(xiàng),4個(gè)跟隨者的位置狀態(tài)仍然可以一致起來并且跟蹤到領(lǐng)導(dǎo)者,表現(xiàn)出了較好的控制效果.由此可以看出采用本文的控制協(xié)議和分布式事件出發(fā)機(jī)制能夠抑制外部擾動(dòng)的影響.
系統(tǒng)仿真圖3是干擾觀測器對(duì)受擾動(dòng)多智能體系統(tǒng)(1)中每個(gè)智能體的干擾觀測誤差.干擾觀測器能夠計(jì)算出智能體的輸入通道中存在的擾動(dòng),各個(gè)智能體的觀測誤差很快趨近于0.說明干擾觀測器可以估計(jì)出時(shí)變的干擾,從而表現(xiàn)出良好的性能.
表1為帶有外部擾動(dòng)的多智能體系統(tǒng)在分布式事件觸發(fā)機(jī)制下的事件觸發(fā)次數(shù)和觸發(fā)比率,由表中數(shù)據(jù)可以看出采用本文的控制協(xié)議可以大范圍降低智能體的采樣和控制器的更新次數(shù).
表1 4個(gè)跟隨者智能體的事件觸發(fā)次數(shù)和觸發(fā)比率(存在擾動(dòng)帶有擾動(dòng)抑制項(xiàng))Table 1 Event-triggered times and ratios for 4 followers with disturbance rejection
由系統(tǒng)仿真圖4可以看出每個(gè)智能體的事件觸發(fā)時(shí)刻不是在同一時(shí)刻,表明本文設(shè)計(jì)的觸發(fā)機(jī)制確實(shí)是分布式的.選取智能體4觀察其誤差范數(shù),從系統(tǒng)仿真圖5中可以看出,在多智能體系統(tǒng)剛開始運(yùn)行的時(shí)候觸發(fā)間隔較小且誤差范數(shù)相對(duì)較大,隨著時(shí)間的推移誤差范數(shù)在不斷減小且觸發(fā)時(shí)刻變得稀疏,這與預(yù)期的結(jié)果是一致的.
圖4 4個(gè)跟隨者智能體的分布式觸發(fā)時(shí)刻Fig.4 Distributed triggered intervals for 4 followers
圖5 智能體4的狀態(tài)誤差的范數(shù)Fig.5 Error norms of 4 agents
為了更好地表明本文提出的基于事件觸發(fā)的多智能體系統(tǒng)的干擾主動(dòng)控制器的優(yōu)勢,在初始條件和控制參數(shù)相同的情況下與文獻(xiàn)[16]的結(jié)果進(jìn)行比較.系統(tǒng)仿真圖6是基于事件觸發(fā)的控制算法但是沒有對(duì)擾動(dòng)進(jìn)行抑制的智能體系統(tǒng)的運(yùn)動(dòng)狀態(tài),從圖6中以看出如果不對(duì)通道中的外部干擾進(jìn)行適當(dāng)?shù)囊种?那么多智能體系統(tǒng)的位置狀態(tài)將不能達(dá)到漸進(jìn)一致,且無法追蹤到系統(tǒng)中領(lǐng)導(dǎo)者.系統(tǒng)仿真圖7表示每個(gè)智能體的事件觸發(fā)時(shí)刻,與系統(tǒng)仿真圖4相比較事件觸發(fā)時(shí)刻更加密集且不均勻的.
通過比較表1和表2可以發(fā)現(xiàn),當(dāng)存在外部擾動(dòng)時(shí),變化幅度較大的狀態(tài)會(huì)使得事件觸發(fā)機(jī)制變得更容易觸發(fā),從而增加了事件觸發(fā)的次數(shù)和頻率,本文基于分布式事件觸發(fā)和干擾主動(dòng)控制的領(lǐng)導(dǎo)跟隨一致性算法不僅可以消除擾動(dòng)的影響,更能減少事件觸發(fā)次數(shù)和節(jié)約多智能體系統(tǒng)的通信資源.
圖6 具有外部擾動(dòng)但不帶干擾觀測器的多智能體系統(tǒng)的運(yùn)動(dòng)軌跡Fig.6 Trajectories of multi-agent systems without external disturbance observer
圖7 4個(gè)跟隨者智能體的分布式觸發(fā)時(shí)刻Fig.7 Distributed triggered intervals of 4 followers
表2 4個(gè)跟隨者智能體的事件觸發(fā)次數(shù)和觸發(fā)比率(無擾動(dòng)抑制項(xiàng))Table 2 Event-triggered times and ratios for 4 followers without disturbance rejection
本文考慮了帶有外部擾動(dòng)的多智能體系統(tǒng)在固定無向拓?fù)浣Y(jié)構(gòu)下的領(lǐng)導(dǎo)跟隨一致性問題,提出了一種基于干擾觀測器的分布式事件觸發(fā)控制機(jī)制.控制器的狀態(tài)更新依賴于觸發(fā)函數(shù),本文在分布式事件觸發(fā)機(jī)制的控制下每個(gè)智能體可以實(shí)現(xiàn)領(lǐng)導(dǎo)跟隨一致.通過理論分析證明了本文所設(shè)計(jì)的分布式事件觸發(fā)機(jī)制不會(huì)存在芝諾行為.仿真結(jié)果表明本文所提事件觸發(fā)控制算法能夠抑制擾動(dòng),并且能實(shí)現(xiàn)多智能體系統(tǒng)的領(lǐng)導(dǎo)跟隨一致性.
實(shí)際的多智能體系統(tǒng)的拓?fù)浣Y(jié)構(gòu)往往不是固定不變的,所以,下一步的工作將是對(duì)在切換拓?fù)浜陀邢驁D的情況下的多智能體系統(tǒng)事件觸發(fā)領(lǐng)導(dǎo)跟隨一致性的研究.