杜向陽(yáng),李偉勛,陳增強(qiáng),張利民
(1.天津職業(yè)技術(shù)師范大學(xué)理學(xué)院,天津 300222;2.南開(kāi)大學(xué)人工智能學(xué)院,天津 300350;3.中原工學(xué)院電子信息學(xué)院,鄭州 451191)
近年來(lái),多智能體系統(tǒng)的分布式協(xié)調(diào)控制得到了廣泛的關(guān)注和研究[1-5]。編隊(duì)控制作為多智能體協(xié)調(diào)控制里重要且基礎(chǔ)的一部分,在各種系統(tǒng)里面實(shí)用性比較強(qiáng),所以有必要對(duì)它進(jìn)行深入研究。目前對(duì)編隊(duì)控制的研究大致分為3個(gè)方面,基于行為的方法[6]、領(lǐng)導(dǎo)者-跟隨者的方法[7-8]和虛擬結(jié)構(gòu)的方法[9]。
在面對(duì)復(fù)雜的任務(wù)和環(huán)境時(shí),對(duì)多智能體系統(tǒng)進(jìn)行分組去完成一個(gè)共同的目標(biāo)或者多目標(biāo)更有優(yōu)勢(shì)。文獻(xiàn)[10]通過(guò)引入雙樹(shù)形變換,解決了具有時(shí)滯的切換拓?fù)湎碌亩嘀悄荏w系統(tǒng)組的一致性問(wèn)題。文獻(xiàn)[11]設(shè)計(jì)了混雜協(xié)議,得到了多智能體系統(tǒng)組一致性的充分條件。文獻(xiàn)[12]首次將文獻(xiàn)[10]中的保守假設(shè)推廣到智能體在不同組的信息權(quán)重之和為一常數(shù)的前提下,得到了多智能體系統(tǒng)組一致性的充分條件。文獻(xiàn)[13]則針對(duì)線性多智能體系統(tǒng)得到了實(shí)現(xiàn)組一致性的充要條件。多智能體系統(tǒng)的編隊(duì)控制和一致性控制有著異曲同工之妙,例如在基于領(lǐng)導(dǎo)跟隨一致性控制分析里面,是讓跟隨者隨著時(shí)間逐步收斂到領(lǐng)導(dǎo)者的狀態(tài),而編隊(duì)控制相較于一致性控制多了編隊(duì)向量,即讓跟隨者隨著時(shí)間收斂到領(lǐng)導(dǎo)者與編隊(duì)向量的和的形式。當(dāng)編隊(duì)控制里面的編隊(duì)向量趨于零時(shí),編隊(duì)控制就轉(zhuǎn)化為一致性控制問(wèn)題,而當(dāng)組一致性問(wèn)題里面添加編隊(duì)向量時(shí),就形成了組編隊(duì)控制問(wèn)題,此時(shí)每一個(gè)子組的智能體就會(huì)構(gòu)成一個(gè)期望編隊(duì)結(jié)構(gòu)。
事實(shí)上,無(wú)論在自然界還是人類社會(huì),群體中的多個(gè)個(gè)體通過(guò)形成一定的結(jié)構(gòu)來(lái)完成目標(biāo)任務(wù)的現(xiàn)象是非常普遍的,如多任務(wù)移動(dòng)機(jī)器人的分散形成以及多利益沖突的社會(huì)社區(qū)的分裂形成。所以對(duì)于多編隊(duì)控制問(wèn)題的研究具有很大的實(shí)際和應(yīng)用意義。截止到目前為止對(duì)多編隊(duì)控制問(wèn)題的研究結(jié)果并不多見(jiàn),主要是對(duì)組一致性,集群一致性,多跟蹤問(wèn)題的研究。不依賴大多數(shù)相關(guān)研究工作中提出的一些保守假設(shè),文獻(xiàn)[14]得到了一些可以保證多智能體系統(tǒng)達(dá)成群體共識(shí)的很有前途的標(biāo)準(zhǔn)。文獻(xiàn)[15]研究了具有幾種不同子群的一種新的聚類共識(shí),基于馬爾可夫鏈和非負(fù)矩陣分析,分別得到了具有固定拓?fù)浜颓袚Q拓?fù)涞膬煞N新的聚類一致準(zhǔn)則。文獻(xiàn)[16]基于智能體是向同一目標(biāo)移動(dòng)還是向單獨(dú)的目標(biāo)移動(dòng),提出了兩種潛在的函數(shù)來(lái)進(jìn)行群集算法,研究了一種多智能體系統(tǒng)的多目標(biāo)跟蹤群集算法。文獻(xiàn)[17]研究了非線性領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)的多編隊(duì)控制問(wèn)題,給出了基于相鄰信息的多編隊(duì)控制協(xié)議。
綜上所述,另考慮到非線性系統(tǒng)[18-19]對(duì)實(shí)際大部分現(xiàn)象和規(guī)律具有較優(yōu)越的吻合度,本文主要解決了在沒(méi)有保守假設(shè)下,組內(nèi)組間都存在耦合的非線性領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)的多編隊(duì)控制問(wèn)題?;谙到y(tǒng)的拉普拉斯矩陣,跟隨者和領(lǐng)導(dǎo)者的連接矩陣,提出了新的控制協(xié)議去實(shí)現(xiàn)帶有多領(lǐng)導(dǎo)者的二階非線性系統(tǒng)和雙積分器系統(tǒng)的組編隊(duì)跟蹤控制。
為了下面討論的方便,定義如下的映射
考慮一個(gè)含有M+N個(gè)非線性耦合的多智能系統(tǒng),其跟隨者的二階動(dòng)力學(xué)系統(tǒng)描述為
(1)
其中,xi(t)∈Rn,vi(t)∈Rn分別代表智能體i的位置和速度,ui(t)∈Rn,f(vi(t),t)∈Rn分別為第i個(gè)智能體的控制輸入和內(nèi)部動(dòng)力學(xué),f是一個(gè)非線性連續(xù)可微向量函數(shù)。其M個(gè)領(lǐng)導(dǎo)者的二階動(dòng)力學(xué)描述為
(2)
假設(shè)1非線性連續(xù)可微向量函數(shù)f滿足一個(gè)全局的利普希茨條件,如果存在一個(gè)正的常數(shù)ρ使得
|f(v1,t)-f(v2,t)|≤ρ|v1-v2|,?v1,v2∈Rn
假設(shè)2一個(gè)含有M+N個(gè)智能體的系統(tǒng),假定其領(lǐng)導(dǎo)跟隨連接矩陣B=diag(b1,b2,…,bN)≠0,即存在i∈V,使得第i個(gè)跟隨者與第δ(i)個(gè)領(lǐng)導(dǎo)者有信息交換,bi>0。
定義1針對(duì)帶有領(lǐng)導(dǎo)者的多智能體系統(tǒng)(1)、(2),如果對(duì)任一子組l∈[1,2,…,M]和任意的初始狀態(tài)都存在一個(gè)控制協(xié)議,使得同一組的所有智能體形成一個(gè)被設(shè)計(jì)的隊(duì)形,即
其中,hi∈Rn是智能體i相對(duì)于領(lǐng)導(dǎo)者δ(i)的編隊(duì)向量,則稱多智能體系統(tǒng)達(dá)到了組編隊(duì)一致性。
注2由定義1可以看到,當(dāng)編隊(duì)向量hi=0時(shí),多智能體系統(tǒng)的編隊(duì)控制問(wèn)題就轉(zhuǎn)化成了一致性或組一致性問(wèn)題,也即組一致性問(wèn)題是組編隊(duì)控制問(wèn)題的特殊情況。所以組編隊(duì)控制問(wèn)題的研究具有更一般的普遍性。
引理1[20]對(duì)于一個(gè)連通的無(wú)向圖G,如果至少存在一個(gè)跟隨者與領(lǐng)導(dǎo)者有信息連接,即B≥0,則矩陣L+B>0。
引理2[21]矩陣不等式(Schur補(bǔ)引理)
其中,Q(x)=QT(x),R(x)=RT(x),等價(jià)于如下的條件之一:(1)Q(x)>0,R(x)-ST(x)Q-1(x)S(x)>0;(2)R(x)>0,Q(x)-ST(x)R-1(x)S(x)>0。
引理3[22]假設(shè)兩個(gè)厄米特矩陣A,B∈Rn×n,α1≥…≥αn,β1≥…≥βn,γ1≥…≥γn分別為A,B和A+B的特征根,則有
αi+βn≤γi≤αi+β1,i=1,2,…,n
引理4[23]對(duì)于任意合適維度的向量x,y∈Rn以及合適維度的對(duì)稱正定矩陣Z∈Rn×n,都有
±2xTy≤xTZx+yTZ-1y
通過(guò)設(shè)計(jì)一種新的控制協(xié)議,結(jié)合李雅普諾夫穩(wěn)定性理論和代數(shù)圖論證明了系統(tǒng)的穩(wěn)定性。
為解決多編隊(duì)控制問(wèn)題,設(shè)計(jì)控制器為
(3)
其中α,β>0為耦合強(qiáng)度,bi,δ(i)為智能體i和領(lǐng)導(dǎo)者δ(i)的連接權(quán)重,k>0為控制增益。
注3相較于文獻(xiàn)[17]基于分組的假設(shè),即對(duì)于一個(gè)子組,從其他子組接收到的信息總數(shù)為零而設(shè)計(jì)的如下的控制協(xié)議
本文中的控制器強(qiáng)化了不同組之間智能體的通訊能力,使得多智能體系統(tǒng)面對(duì)復(fù)雜的實(shí)際環(huán)境可以有更好的靈活性和抗干擾性。
定理1在假設(shè)條件(1)~(2)下,通信網(wǎng)絡(luò)為無(wú)向拓?fù)涞姆蔷€性耦合領(lǐng)導(dǎo)跟隨多智能體系統(tǒng)在控制協(xié)議(3)下,可以實(shí)現(xiàn)多編隊(duì)跟蹤控制,如果系統(tǒng)參數(shù)滿足如下兩個(gè)條件
(4)
和
(5)
證明:令
得到其誤差系統(tǒng)為
(6)
將誤差系統(tǒng)寫成向量形式
(7)
其中,
將Lyapunov泛函重新寫為
(8)
計(jì)算V(t)沿軌跡(7)的時(shí)間導(dǎo)數(shù),得到
根據(jù)假設(shè)1和引理4有
(9)
和
(10)
其中,取正定矩陣Z為單位矩陣IN,整理得
注4對(duì)定理1的分析,可以看到控制增益k的取值取決于耦合強(qiáng)度α,β,利普希茨常數(shù)ρ以及矩陣L和B的特征根的共同作用,也就是多智能體系統(tǒng)之間的交互拓?fù)浜婉詈蠌?qiáng)度對(duì)控制增益有影響。
考慮智能體的內(nèi)部動(dòng)力學(xué)f≡0,則多智能體系統(tǒng)可以簡(jiǎn)化為如式(11)的形式
(11)
領(lǐng)導(dǎo)者的動(dòng)態(tài)為
(12)
這表明領(lǐng)導(dǎo)者的參考速度為恒定常數(shù)?;诳刂茀f(xié)議(3)有
寫成矩陣形式為
(13)
對(duì)于對(duì)稱矩陣H的定義和上面討論的一樣,從定理1的結(jié)論和證明可以很容易得到推論1。
推論1在無(wú)向通信拓?fù)浜图僭O(shè)條件(2)下,控制協(xié)議(3)可以讓多智能體系統(tǒng)(11)和(12)實(shí)現(xiàn)多編隊(duì)跟蹤控制,如果系統(tǒng)參數(shù)滿足如下的條件
(14)
例1考慮一個(gè)具有7個(gè)跟隨者和2個(gè)領(lǐng)導(dǎo)者的二階非線性多智能體系統(tǒng)。其拓?fù)浣Y(jié)構(gòu)如圖1所示,7個(gè)跟隨者被分為兩個(gè)子組,分別為V1=[1,2,3],V2=[4,5,6,7],領(lǐng)導(dǎo)者為l1,l2。假設(shè)網(wǎng)絡(luò)的每條連接權(quán)重均為1。故其權(quán)重矩陣和拉普拉斯矩陣為
圖1 通信拓?fù)鋱DG Fig.1 The communication topology G
圖2 帶有非線性動(dòng)態(tài)的位置軌跡Fig.2 Trajectory of position with nonlinear dynamics
(15)
領(lǐng)導(dǎo)者的非線性動(dòng)態(tài)如式(16):
(16)
令耦合強(qiáng)度α=β=1,利普希茨常數(shù)ρ=0.05,增益k=4,顯然可以看到假設(shè)1和假設(shè)2滿足,并且定理1成立。設(shè)h1=(0,0.5),h2=(-0.5,0),h3=(0.5,0)為組1的跟隨者的期望隊(duì)形向量。組2的跟隨者的期望編隊(duì)向量為h4=(0,0.5),h5=(0.5,0),h6=(-0.5,0),h7=(0,-0.5)。
圖3 帶有非線性動(dòng)態(tài)的位置和速度變化Fig.3 Changes in position and velocity with nonlinear dynamics
圖4 帶有非線性動(dòng)態(tài)的位置和速度誤差Fig.4 Position and velocity errors with nonlinear dynamics
圖5 雙積分器系統(tǒng)的位置軌跡Fig.5 Position trajectory of a double integrator system
在控制協(xié)議(3)下,非線性系統(tǒng)的隊(duì)形仿真結(jié)果如圖2所示。圖3刻畫了跟隨者的位置和速度分別沿著x軸和y軸隨時(shí)間變化的狀態(tài)。圖4刻畫了每個(gè)跟隨者在x軸方向和y軸方向的位置誤差和速度誤差。由圖2-4的仿真結(jié)果可知非線性耦合引領(lǐng)跟隨多智能體的多編隊(duì)控制在無(wú)向拓?fù)浣Y(jié)構(gòu)下實(shí)現(xiàn)了。
例2取耦合強(qiáng)度α=β=1,增益k=4,非線性動(dòng)態(tài)為零。在相同的結(jié)構(gòu)拓?fù)湎?,雙積分器的多編隊(duì)仿真效果如圖5所示。
圖6為跟隨者沿x軸和y軸的位置與速度的狀態(tài)變化,圖7為跟隨者在x軸和y軸方向上的位置誤差和速度誤差。由圖5~圖7可以很容易看出雙積分器耦合引領(lǐng)跟隨多智能體的多編隊(duì)控制問(wèn)題解決了。
圖6 雙積分器系統(tǒng)的位置和速度變化Fig.6 Changes in position and velocity of a double integrator system
圖7 雙積分器系統(tǒng)的位置和速度誤差Fig.7 Position and velocity errors in a double integrator system
本文在無(wú)向拓?fù)浣Y(jié)構(gòu)下基于領(lǐng)導(dǎo)跟隨的方法研究了具有非線性動(dòng)態(tài)和雙積分器的多智能體系統(tǒng)。沒(méi)有借助于傳統(tǒng)的保守假設(shè),設(shè)計(jì)了一種新的控制協(xié)議,根據(jù)李雅普諾夫穩(wěn)定性理論和代數(shù)圖論,得到了系統(tǒng)實(shí)現(xiàn)多組編隊(duì)控制的充分條件,并在最后通過(guò)仿真實(shí)例說(shuō)明了所得結(jié)論的正確性。另外,考慮到多智能體系統(tǒng)中存在具有不同動(dòng)態(tài)的個(gè)體以及時(shí)變的幾何結(jié)構(gòu),會(huì)在接下來(lái)的工作中研究異質(zhì)多智能體系統(tǒng)的時(shí)變編隊(duì)跟蹤控制問(wèn)題。