董鑫淼 李傳東 王欣 曹正然
隨著人工智能的發(fā)展,多智能體系統(tǒng)[1]作為人工智能的一個重要分支,受到了廣泛的關(guān)注并成為研究的熱點.在各學(xué)科專家、學(xué)者的共同努力下,多智能體系統(tǒng)在一致性[2-3]、同步[4-5]、群集[6-7]、協(xié)調(diào)[8-9]、優(yōu)化控制[10]等領(lǐng)域取得了豐碩的成果.此外,關(guān)于一致性問題有兩個常見的研究方向,一個是領(lǐng)導(dǎo)跟隨模型[11],另一個是無領(lǐng)導(dǎo)監(jiān)督模型[12].
領(lǐng)導(dǎo)跟隨一致性[13-16],意味著多智能體系統(tǒng)內(nèi),跟隨者的動態(tài)行為要與領(lǐng)導(dǎo)者達(dá)到統(tǒng)一.需要指出的是,一致性類型有很多,如漸近一致性[17]、指數(shù)一致性[18]、有限時間一致性[19]、固定時間一致性[20-21]等.指數(shù)一致性作為一種特殊的漸近一致性,已經(jīng)被很多學(xué)者研究.然而,漸近一致性和指數(shù)一致性通常是在時間趨于無窮時實現(xiàn)的,這在現(xiàn)實生活中很難實現(xiàn).近年來,有限時間一致性的概念被提出,解決了漸近一致性和指數(shù)一致性的缺陷,且達(dá)到一致的時間是可計算的.但它仍有缺陷,因為該時間依賴于系統(tǒng)的初始狀態(tài).作為一種特殊的有限時間一致,固定時間一致是避免這種缺陷的好方法[22-24].但現(xiàn)有關(guān)于領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)的文獻(xiàn)中,研究固定時間的成果相對較少.因此,研究領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)的固定時間一致性具有重要的意義.不失一般性,本文建立的是最基本的非線性領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)模型.
當(dāng)多智能體之間的連接很弱時,沒有控制器就很難實現(xiàn)系統(tǒng)的同步.迄今為止,已經(jīng)發(fā)表了很多控制方案,如自適應(yīng)控制[25]、事件觸發(fā)控制[26-27]、協(xié)同控制[28]、脈沖控制[29]、狀態(tài)反饋控制[30]、采樣數(shù)據(jù)控制[31]、間歇控制[32]等.脈沖控制是一種典型的控制方法,廣泛應(yīng)用于生物、醫(yī)學(xué)、物理、航天等領(lǐng)域.一方面,系統(tǒng)不可避免地會受到干擾和中斷,脈沖效應(yīng)可以很好地模擬狀態(tài)的突變;另一方面,它可以有效緩解信息傳遞的壓力.
由于通信信道的比特率、能量和帶寬是有限的,信息量化[33]在控制方案中起著重要作用.一般有兩種量化器:均勻量化器[34-36]和對數(shù)量化器[37-39].本文考慮對數(shù)量化器.
考慮到上述幾個因素,本文通過量化脈沖控制的方法分析了非線性領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)的一致性問題.本文的新穎之處在于:1)建立領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)模型,并設(shè)計了合適的控制協(xié)議;2)將通信數(shù)據(jù)量化,且在脈沖時刻進(jìn)行系統(tǒng)內(nèi)的信息交換,大大降低了通信帶寬和能耗;3)所建立的模型是最基本的非線性多智能體系統(tǒng).
本文的其余內(nèi)容如下所示:第1節(jié)是預(yù)備知識,并介紹一些必要的假設(shè)、定義和引理;第2節(jié)建立了非線性領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)模型,并基于李雅普諾夫函數(shù)給出了定理;第3節(jié)通過選擇合適的參數(shù)進(jìn)行仿真,驗證了上述理論分析的正確性;第4節(jié)是結(jié)論.
注1本文中,R表示實數(shù)集,IN表示N×N單位矩陣,XT表示矩陣X的轉(zhuǎn)置矩陣,diag(x1,x2,…,xN)表示N×N對角陣,max{xi}表示x1,x2,…,xN的最大值.令M為一個實對稱矩陣,則M>0(M<0)表示正(負(fù))定矩陣.
通過計算L=D-A可以得到拉普拉斯矩陣L=(lij)N×N,其元素滿足:
(1)
量化器關(guān)于原點對稱,且滿足Q(m)=(1+Ξi)m,?Ξi∈[-ζ,ζ].而且,如果m∈Rn,有Q(m)=(Q(m)1,Q(m)2,…,Q(m)N).
在這部分,將介紹后續(xù)證明需要用到的假設(shè)、定義和引理.
假設(shè)1給定利普希茨常數(shù)lf>0滿足
|f(t,sj(t))-f(t,si(t))|≤lf|sj(t)-si(t)|.
假設(shè)2給定利普希茨常數(shù)lξ1,lξ2,…,lξN>0滿足|ξi(sj(t))-ξi(si(t))|≤lξi|sj(t)-si(t)|,其中i=1,2,…,N.
引理3[42]假設(shè)在(t,T)區(qū)間上有脈沖序列τ=t1,t2,…,令T表示平均脈沖間隔,Kξ(t,t0)表示給定區(qū)間內(nèi)的脈沖次數(shù),存在K0∈N+和T∈R+滿足
本節(jié)建立了領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)模型.此外,通過構(gòu)造李雅普諾夫函數(shù)得到了同步標(biāo)準(zhǔn)和一些充分條件,證明了領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)在量化脈沖控制下的固定時間一致性,并給出了同步時間.
(1)
其中,xi∈R描述第i個多智能體的狀態(tài),f:R×R→R是一個非線性函數(shù),且ui∈R是第i個多智能體的控制協(xié)議.
標(biāo)記為0的多智能體稱為領(lǐng)導(dǎo)者,是根據(jù)實際情況設(shè)定的理想目標(biāo)軌跡,s0(t)可以被動態(tài)描述為
(2)
第i個多智能體的控制協(xié)議被設(shè)計為
(3)
其中,控制參數(shù)α,β>0,x,y,p和q都是正奇數(shù),且滿足x
在控制協(xié)議(3)下,系統(tǒng)(1)被改寫為
(4)
令ci(t)=si(t)-s0(t),可以得到誤差系統(tǒng).
(5)
定理1假定假設(shè)1和2滿足且γk∈(0,1).當(dāng)(IN+GΞ+G)T(IN+GΞ+G)-γkIN<0時,非線性多智能體系統(tǒng)(4)將在固定時間內(nèi)達(dá)到領(lǐng)導(dǎo)跟隨一致性,一致時間為
(6)
根據(jù)假設(shè)1,有
(7)
其中,η1=2lf>0.
(8)
根據(jù)引理4,有
(9)
(10)
綜上所述,李雅普諾夫函數(shù)可以被改寫為
(11)
當(dāng)t=tk時,
(12)
由于(IN+GΞ+G)T(IN+GΞ+G)-γkIN是負(fù)定的,因此
(13)
方便起見,用γ=max{γ1,γ2,…,γk}來代替γk.
根據(jù)式(6)—(13),可以推導(dǎo)出
(14)
因此構(gòu)建如下比較系統(tǒng)[45]:
考慮0<γ<1,為了方便計算,當(dāng)ν(t)≥1時,假設(shè)r(t)=ν1-ω(t),式(15)可改寫為
其中,γ1=γ1-ω≥1.如果畫出r(t)關(guān)于ν(t)的曲線,可以看出連續(xù)部分大致是下降的,且當(dāng)ν(t)→1時,r(t)→1,當(dāng)ν(t)→∞時,r(t)→0.
式(16)的解可以通過數(shù)學(xué)歸納法[46]求出.
(18)
接下來求解T1,
(19)
(20)
(21)
(22)
接下來考慮另一種情況0<ν(t)<1,設(shè)定r(t)=ν1-υ,可以得到
(23)
其中0<γ2<1滿足γ2=γ1-υ.如果畫出r(t)關(guān)于ν(t)的曲線,可以看出連續(xù)部分大致是上升的,且當(dāng)ν(t)→1時,r(t)→1,當(dāng)ν(t)→0時,r(t)→0.
通過數(shù)學(xué)歸納法,可推出
(24)
這表明r(t)是單調(diào)遞增的,且r(T1)=1.
因此,式(24)可以重寫為
(25)
t-T1=2TaN0+
T2=2TaN0+
(26)
根據(jù)上述分析可以得到同步時間為
T=T1+T2=
(27)
注2估算的T值是最大同步時間,且不確定是在連續(xù)時間還是脈沖跳變點.
本節(jié)選擇一些合適的參數(shù)通過仿真驗證以上理論分析的有效性.
考慮如下多智能體系統(tǒng),網(wǎng)絡(luò)拓?fù)淙鐖D1所示.
圖1 網(wǎng)絡(luò)拓?fù)鋱DFig.1 Network topology map
和
其中,s0是一個孤立的控制節(jié)點,滿足初始值s0(0)=0.5,其余4個多智能體滿足初始值為s0(0)=[-0.1,-2.7,1.8,2.4]T.F(t,m(t))=[f(t,m1(t)),f(t,m2(t)),f(t,m3(t)),f(t,m4(t))].f(t,mi(t))=cos2(mi(t))-|sin(mi(t))|,滿足常數(shù)為lf=[1,1,1.8,1.2]T的利普希茨條件.如圖2所示.s(t)的拉普拉斯矩陣為
令步長為0.000 1,脈沖間隔為0.002,脈沖增益γ=0.8.取α=4.3,β=2.5,x=1,y=3,p=5,q=3.經(jīng)過計算得,η1=4.4,η2=9.798 8,η3=16.459 1,且
(IN+GΞ+G)T(IN+GΞ+G)-γkIN<0也滿足.
0.173 8s.
顯而易見,定理1是有效的,圖2展示了跟隨者將在約0.18 s的位置與領(lǐng)導(dǎo)者達(dá)到一致.
圖2 在脈沖控制下s(t)中的每一個節(jié)點都與s0(t)達(dá)到一致Fig.2 Every node of s(t) achieves soon consensus with s0(t) under impulsive control
通過選擇合適的脈沖控制協(xié)議,解決了非線性領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)的固定時間一致性問題.為減少通信損失,脈沖控制協(xié)議保證多智能體系統(tǒng)內(nèi)的多智能體在脈沖時刻進(jìn)行信息交互.利用李雅普諾夫函數(shù)、凸分析和利普希茨條件,得到了兩個充分條件,使系統(tǒng)在固定時間內(nèi)達(dá)到一致,該時間可計算且與初始狀態(tài)無關(guān).最后通過仿真驗證了理論推導(dǎo)的可行性.