羅毅平,蔡 聰,肖 星,林國(guó)漢
(湖南工程學(xué)院 電氣與信息工程學(xué)院,湘潭411104)
多智能體系統(tǒng)一致性在許多領(lǐng)域有著廣泛的應(yīng)用,如電網(wǎng)[1]、無(wú)人機(jī)編隊(duì)[2-3]、生物系統(tǒng)[4]等領(lǐng)域.由于其通信成本低、效率高,受到了大量科研人員的關(guān)注,成為了控制領(lǐng)域的研究熱點(diǎn).
大量科研人員投入到智能體的研究熱潮中,并通過(guò)不同的角度、不同的模型充分地研究一階多智能體系統(tǒng),并獲得了許多成果[5-7].然而在上述成果中,考慮的都是一階智能體系統(tǒng).但在實(shí)際應(yīng)用中,大多數(shù)都是二階甚至高階系統(tǒng),僅僅考慮位移一致性是遠(yuǎn)遠(yuǎn)不夠的,特別是同時(shí)受位置和速度控制的智能體,比如編隊(duì)控制中的無(wú)人機(jī),必須同時(shí)保證智能體的位移和速度一致,才能精確地保證狀態(tài)一致.Ren等[8]也指出二階智能體系統(tǒng)與一階系統(tǒng)不同,生成樹(shù)的存在并不是二階智能體系統(tǒng)實(shí)現(xiàn)一致的充要條件.由此表明,將一階一致性算法簡(jiǎn)單地應(yīng)用在二階系統(tǒng)上是不合適的,換句話說(shuō),從一階系統(tǒng)擴(kuò)展到二階系統(tǒng),并不是在一階模型上的簡(jiǎn)單延伸,因此,研究二階系統(tǒng)是非常有挑戰(zhàn)性的,也是很有必要的.
近年來(lái),已有許多學(xué)者對(duì)二階多智能系統(tǒng)的一致性控制進(jìn)行了研究[9-12],研究?jī)?nèi)容主要圍繞一致性算法展開(kāi),一般來(lái)說(shuō),二階智能一致性算法分為無(wú)領(lǐng)導(dǎo)跟隨一致性算法和只有一個(gè)領(lǐng)導(dǎo)者的領(lǐng)導(dǎo)跟隨一致性算法.例如文獻(xiàn)[9-10],就是通過(guò)無(wú)領(lǐng)導(dǎo)跟隨一致性算法解決了二階系統(tǒng)達(dá)成一致性問(wèn)題.文獻(xiàn)[11-12]討論了在一個(gè)領(lǐng)導(dǎo)者的情況下,跟隨者在控制協(xié)議作用下追蹤領(lǐng)導(dǎo)者,最后與領(lǐng)導(dǎo)者狀態(tài)達(dá)成一致.需要注意的是在上述文獻(xiàn)中都是基于多智能體系統(tǒng)是線性的前提下進(jìn)行研究的.然而,在智能體系統(tǒng)模型中各個(gè)智能體內(nèi)部諸因素之間更多地呈現(xiàn)出一種非線性關(guān)系,如在無(wú)人機(jī)編隊(duì)控制系統(tǒng)中,各個(gè)無(wú)人機(jī)內(nèi)部因素肯定是一個(gè)非線性因素.因此,研究帶有非線性因素的智能體系統(tǒng)是非常有實(shí)際意義的.為了解決非線性因素對(duì)一致性問(wèn)題帶來(lái)的影響,Li等[13]利用Lipschitz公式對(duì)非線性因素進(jìn)行線性化處理,最后得出多智能體系統(tǒng)達(dá)成二階一致的充分條件,在Li的基礎(chǔ)上,Wang等[14]研究了非均勻擾動(dòng)的二階非線性系統(tǒng)的一致性問(wèn)題,提出線性化處理的前提,并不再要求非線性函數(shù)滿足任何全局Lipschitz條件,這也大大弱化了線性化處理的要求.這樣,線性化處理很快地被引入到多智能體系統(tǒng)控制中,并迅速地產(chǎn)生了大量研究成果.
然而,上述研究成果都沒(méi)有考慮系統(tǒng)中的時(shí)延.由于智能體之間需要相互通信,這樣智能體之間的信息傳輸就不可避免的產(chǎn)生時(shí)間延遲.時(shí)延的產(chǎn)生必將影響系統(tǒng)的穩(wěn)定性和控制性能.目前,已有許多論文研究了帶有時(shí)滯的多智能體系統(tǒng)一致性控制問(wèn)題,如Li等[15]研究離散系統(tǒng)中的步長(zhǎng)和時(shí)滯參數(shù)一致性,給出了系統(tǒng)達(dá)成一致的參數(shù)集,并證明了該研究結(jié)果也適用于具有輸入時(shí)滯的系統(tǒng)中.需要指出的是,以上分析帶有時(shí)滯的多智能體一致性控制的文獻(xiàn)中,都只是關(guān)注一階系統(tǒng)的一致性.涉及時(shí)延二階系統(tǒng)中的一致性控制這方面的研究很少.Ma等[16]研究在不確定時(shí)滯下,二階智能體系統(tǒng)魯棒一致性,但僅限于非領(lǐng)導(dǎo)跟隨模型.目前,具有時(shí)滯的二階智能體系統(tǒng)仍有許多問(wèn)題需要更深入地研究.
在研究智能體通信時(shí)滯的同時(shí),還需要考慮智能體之間信息傳輸?shù)耐ǖ佬诺廊萘浚捎谕ㄐ刨Y源是有限的,所以每個(gè)智能體與相鄰智能體之間的通信不可能一直持續(xù).為了節(jié)約通信成本,許多科學(xué)家提出采樣數(shù)據(jù)控制.傳統(tǒng)的采樣系統(tǒng)是通過(guò)預(yù)先設(shè)定采樣周期,同步觸發(fā)控制器更新[17-18],由于其設(shè)計(jì)的便利性,得到了廣泛應(yīng)用.傳統(tǒng)的采樣控制設(shè)計(jì)重點(diǎn)在于采樣周期取值,若采樣的周期過(guò)短,則會(huì)造成通信資源大量浪費(fèi),并且產(chǎn)生數(shù)據(jù)冗余,阻塞信道.相反,周期設(shè)定過(guò)長(zhǎng),系統(tǒng)的控制性能將大大降低.因此時(shí)間觸發(fā)通信系統(tǒng)的采樣周期設(shè)定是保守的,資源利用率較低.
為了提高通信資源利用率,提出事件觸發(fā)通信方式來(lái)提高通信資源利用率,并減少通信負(fù)擔(dān)[19-20].不同于時(shí)間觸發(fā)方案,事件觸發(fā)不需要預(yù)先設(shè)定觸發(fā)周期,而是設(shè)定一個(gè)系統(tǒng)可承受的誤差閾值,一旦智能體的局部誤差超過(guò)這一閾值,控制器才進(jìn)行更新.這樣大大減少了通信資源損耗,并有效地緩解通信通道的阻塞,同時(shí)又保證了控制性能.近年來(lái)科研人員對(duì)事件觸發(fā)機(jī)制進(jìn)行了充分的研究,并迅速產(chǎn)生大量的成果[21-24].Liu等[21]基于無(wú)向拓?fù)浣Y(jié)構(gòu)下,提出事件觸發(fā)機(jī)制,研究了一階系統(tǒng)的平均一致性.Yang等[22]則研究了高階系統(tǒng)下基于觀測(cè)器的領(lǐng)導(dǎo)跟蹤輸出一致性問(wèn)題,并同時(shí)考慮事件觸發(fā)方案.在二階系統(tǒng)中,Xie等[23]分別通過(guò)集中式事件觸發(fā)策略和分散式事件觸發(fā)策略對(duì)二階領(lǐng)導(dǎo)跟隨系統(tǒng)的一致性問(wèn)題進(jìn)行了研究,然而,Xie等人并沒(méi)有考慮系統(tǒng)時(shí)滯和系統(tǒng)的非線性因素,而現(xiàn)實(shí)應(yīng)用系統(tǒng)中,往往這二者都同時(shí)存在,然而在現(xiàn)有的二階一致性文獻(xiàn)中,幾乎都沒(méi)有將二者同時(shí)考慮在內(nèi),現(xiàn)有的方法可能無(wú)法同時(shí)處理系統(tǒng)中的時(shí)滯與非線性項(xiàng).
受上述啟發(fā),本文研究一類同時(shí)具有輸入時(shí)滯和非線性動(dòng)力學(xué)因素的二階多智能體系統(tǒng)的事件觸發(fā)一致性控制問(wèn)題,本文的貢獻(xiàn)有三個(gè)方面:首先,本文研究的是一類二階領(lǐng)導(dǎo)跟隨模型,在考慮了系統(tǒng)固有的非線性動(dòng)力學(xué)因素基礎(chǔ)上,同時(shí)考慮輸入時(shí)滯對(duì)系統(tǒng)的影響.其次,針對(duì)具有輸入時(shí)滯和非線性因素的二階領(lǐng)導(dǎo)跟隨模型,獲得了實(shí)現(xiàn)事件觸發(fā)策略下該系統(tǒng)一致性的充分條件,并排除了Zeno行為,有效地降低了通信成本.最后,在仿真結(jié)果中驗(yàn)證了領(lǐng)導(dǎo)者的加速度設(shè)定的大小對(duì)系統(tǒng)穩(wěn)定性產(chǎn)生影響.
為了方便問(wèn)題描述,給出以下定義:Rn和Rn×m分別代表n維實(shí)數(shù)矩陣和n×m實(shí)數(shù)矩陣,I和0分別表示為合適維度的單位矩陣和零矩陣.1N表示所有元素為1的列向量,sup表示最小上確界.
跟隨者的動(dòng)力學(xué)行為:
其中t∈(-τ,+∞),xi(t),vi(t)∈RN,分別代表跟隨多智能體i的位置、速度狀態(tài)量.x0(t)、v0(t)分別代表領(lǐng)導(dǎo)者的位置、速度狀態(tài)量.p(t) ∈RN代表智能體i的驅(qū)動(dòng)函數(shù)以及ui(t)∈RN代表智能體i的控制輸入.f(vi(t),t)、f(v0(t),t)代表跟隨者智能體i的動(dòng)力學(xué)特性的連續(xù)可微非線性向量函數(shù)和領(lǐng)導(dǎo)者的動(dòng)態(tài)輸入.
定義1二階領(lǐng)導(dǎo)跟隨系統(tǒng)如果滿足下列條件就說(shuō)明該系統(tǒng)(1)(2)達(dá)到一致性.
引理1對(duì)于任意具有合適維度的向量x,y以及合適維度的對(duì)稱正定矩陣Z,都具有下列不等式:±xTy≤xTZx+yTZ-1y
引理2具有合適維度的矩陣A、B、C、D,利用克羅內(nèi)克積公式,可以得到:
(1)(A+B)?C=A?C+B?C
(2)(A?B)T=AT?BT
(3)(A?B)(C?D)=(AC)?(BD)
引理3舒爾定理:下列對(duì)稱線性不等式:
等價(jià)于下列式子:
假設(shè)1非線性函數(shù)f(vi(t),t)是連續(xù)可微的向量函數(shù),存在一個(gè)正的標(biāo)量ρ,使得滿足下列不等式:
在本篇文章中,將通過(guò)設(shè)計(jì)合適的控制器以及提出集中式事件觸發(fā)機(jī)制來(lái)解決在無(wú)向連接拓?fù)鋱D下的二階領(lǐng)導(dǎo)跟隨系統(tǒng)(1)(2)的一致性問(wèn)題.
在假設(shè)控制器輸入時(shí)滯為固定常時(shí)滯下,提出集中式事件觸發(fā)策略,智能體在滿足事件觸發(fā)條件時(shí)觸發(fā)通信采樣,一般來(lái)說(shuō),事件觸發(fā)條件是一個(gè)包含全局狀態(tài)測(cè)量誤差閾值的不等式,當(dāng)實(shí)際測(cè)量誤差超過(guò)這一閾值便觸發(fā)控制器更新.其觸發(fā)函數(shù)具體表達(dá)式在式(6)中給出.
為了解決系統(tǒng)(1)(2)的一致性問(wèn)題,設(shè)計(jì)的控制器目的為了解決控制輸入常時(shí)滯與智能體內(nèi)部的非線性因素的影響,其具體控制協(xié)議如(3)式:
其中,κ代表控制增益,且κ>0,τ為大于0的常數(shù),代表控制器輸入時(shí)滯,aij>0為智能體i,j相連的耦合強(qiáng)度,bi>0以及j∈Ni.tk,tk+1分別代表第k次、第k+1觸發(fā)時(shí)刻.Tk=tk+1-tk代表的是采樣周期,當(dāng)t∈[tk,tk+1),每個(gè)智能體i在這一期間廣播其狀態(tài)xi(tk)、x0(tk)、vi(tk)和x0(tk),即在兩次相鄰觸發(fā)時(shí)刻之間,系統(tǒng)的控制輸入保持不變.
將(3)式中控制器帶入(2)式,設(shè)ξi(t)=xi(t)-x0(t),ηi(t)=vi(t)-v0(t).
e1(t)=ξ(tk)-ξ(t),e2(t)=η(tk)-η(t),其中誤差量e1(t),e2(t)∈RN.將誤差量代入,
并令e(t)=[ eT1(t),eT2(t)]T,再設(shè)置y(t)為[ ξT(t),ηT(t)]T,所以我們得到:
其中對(duì)應(yīng)的矩陣表達(dá)式如下:
觸發(fā)函數(shù):
觸發(fā)條件為:
在式(5)(6)中,其中k1、k2、k3都是大于0的常數(shù),Q、M1、M2、M3為合適維度的矩陣.
在式(6)中的集中式觸發(fā)條件,實(shí)際上是設(shè)定了一個(gè)全局狀態(tài)誤差閾值e(t),也稱為系統(tǒng)(1)(2)在一致性下所能忍耐的最大誤差值,一旦系統(tǒng)誤差超過(guò)此值,系統(tǒng)一致性便會(huì)被破壞,為了維持系統(tǒng)一致性的穩(wěn)定,此刻事件機(jī)制會(huì)迅速觸發(fā)控制器(3)更新輸入,此刻測(cè)量誤差將重置為0.
定理1對(duì)于無(wú)向連通拓?fù)湎碌亩A多智能體系統(tǒng)(1)(2),如果存在正定對(duì)稱矩陣P,R,Q,W和矩陣M1,M2,M3,使得下列線性矩陣不等式成立,當(dāng)觸發(fā)函數(shù)(5)在滿足觸發(fā)條件(6)下將觸發(fā)控制器(3)更新,該系統(tǒng)達(dá)成一致性.
上式子中k1,k2,k3均大于0,當(dāng)g(e(t),t)漸近于0時(shí),所有跟隨者的控制器將會(huì)被觸發(fā),每個(gè)多智能體的控制輸入將會(huì)被更新.
證明:對(duì)于閉環(huán)系統(tǒng)(4),構(gòu)造李雅普諾夫函數(shù)如下:
對(duì)時(shí)間t求導(dǎo)后再根據(jù)Jensen不等式可得:
將(4)式代入(9)式后,根據(jù)引理1,并通過(guò)假設(shè)1和引理2中的克羅內(nèi)克積公式可以將帶有 |Fˉ|的式子進(jìn)行轉(zhuǎn)化,最后為了方便計(jì)算,設(shè)定
δ(t)=[ yT(t)yT(t-τ)eT(t-τ)]T,化簡(jiǎn)
寫成矩陣形式:
根據(jù)式(11)可以得到v˙(t)≤δT(t)Jδ(t)≤0,因此閉環(huán)系統(tǒng)(4)漸近穩(wěn)定一致,這也意味著跟隨者智能體位移,速度狀態(tài)與領(lǐng)導(dǎo)者的差值在全局狀態(tài)誤差閾值e(t)范圍內(nèi),即滿足定義1中xli→m∞‖xi(t)- x0(t)‖=0,xli→m∞‖vi(t)- v0(t)‖=0.證 明成立.
另外需要注意的,除了保證系統(tǒng)(1)(2)在控制器(3)下達(dá)成一致性外,還需要確保在時(shí)間軸上沒(méi)有事件的累積點(diǎn),即沒(méi)有Zeno行為,這點(diǎn)可以通過(guò)嚴(yán)格采樣周期Tk來(lái)保證,以下給出定理2.
定理2對(duì)于二階多智能體系統(tǒng)(1)(2),假設(shè)無(wú)向拓?fù)鋱D論G是連通的,在任意初始條件下,控制協(xié)議(3)與集中式事件觸發(fā)策略(5)(6)漸進(jìn)解決了多智能體系統(tǒng)的一致性問(wèn)題,另外,通過(guò)式(12)計(jì)算采樣周期的最小值,閉環(huán)系統(tǒng)不會(huì)出現(xiàn)Zeno行為.
在本章節(jié)中,主要通過(guò)數(shù)值仿真來(lái)驗(yàn)證該集中式事件觸發(fā)協(xié)議的有效性.
該仿真研究的是由1個(gè)領(lǐng)導(dǎo)者和5個(gè)跟隨者構(gòu)成的多智能體系統(tǒng),其智能體系統(tǒng)拉普拉斯矩陣L和局部度B如下所示.系統(tǒng)的無(wú)向拓?fù)鋱D如圖1所示,其中0代表領(lǐng)導(dǎo)者,數(shù)字1~5代表跟隨者智能體.
圖1 智能體系統(tǒng)的無(wú)向連接拓?fù)鋱D
為了驗(yàn)證系統(tǒng)(1)(2)在控制協(xié)議(3)作用下能夠達(dá)成一致性,我們?cè)O(shè)定智能體的初始狀態(tài),各智能體的位移分別:x0(t)=1.2683 ,x1(t)=2.7346,x2(t)=-2.432,x3,(t)=4.8951,x4(t)=7.1191,x5(t)=-4.732.
各智能體速度分別為:
v0(t)=-2.71,v1(t)=0.7329,v2(t)=-3.1691, v3(t)=4.112,v4(t)=2.7316,v5(t)=-8.511
對(duì)于系統(tǒng)中的非線性參數(shù),我們?cè)O(shè)定為
f(vi(t),t)=sin(10t)-0.12vi(t),輸入時(shí)滯τ=0.01.系統(tǒng)中領(lǐng)導(dǎo)者的加速度p(t)=0.2tsin(10t).控制器參數(shù)k=7.68,定理1中的參數(shù)k1=k2=k3=9.4.其仿真圖如圖2~圖5所示.通過(guò)仿真驗(yàn)證了本文思路的可行性.
圖2 智能體位移狀態(tài)變化圖
圖3 智能體速度狀態(tài)變化圖
圖4 測(cè)量誤差范數(shù)‖ ? e(t)‖變化
圖5 事件觸發(fā)時(shí)間間隔圖
本文研究的是一類二階多智能體領(lǐng)導(dǎo)跟隨一致性控制問(wèn)題,給出了該系統(tǒng)達(dá)成一致性的充分條件.該系統(tǒng)同時(shí)考慮了輸入時(shí)滯和存在非線性因素的情況,基于李雅普諾夫穩(wěn)定性理論與矩陣不等式設(shè)計(jì)了與時(shí)滯相關(guān)的控制器,并利用事件觸發(fā)機(jī)制,有效地降低了通信成本,提高了資源利用率和系統(tǒng)的控制性能.最后數(shù)值仿真驗(yàn)證了該方法的可行性,然而考慮到每個(gè)智能體在執(zhí)行任務(wù)供給的能量有限,如何權(quán)衡能量的消耗與性能的優(yōu)化是我們下一步需要進(jìn)行研究和解決的問(wèn)題.