王冬梅 方華京
(華中科技大學(xué)控制科學(xué)與工程系 武漢 430074)
近年來(lái),群集行為引起了研究人員的極大關(guān)注,逐漸成為復(fù)雜性科學(xué)研究的一個(gè)焦點(diǎn).Reynolds[1]最早給出了構(gòu)成群集行為的3條基本規(guī)則,稱之為 Reyno lds模型.在此基礎(chǔ)上,Vicsek[2]提出了一種基于速度匹配規(guī)則的簡(jiǎn)單群集模型.基于這2個(gè)模型研究者展開(kāi)了大量的研究:Tanner,R.O Saber,Long Wang等學(xué)者[3-6]從二階系統(tǒng)的角度研究了Reynolds模型,通過(guò)構(gòu)建微分方程組將群集運(yùn)動(dòng)進(jìn)行抽象化實(shí)現(xiàn)了群集運(yùn)動(dòng)控制.而 Jadbabaie,Moreau,W.Ren等[7-8]則運(yùn)用動(dòng)態(tài)圖理論研究解決了Vicsek模型的收斂性問(wèn)題.
由于互異的個(gè)體狀態(tài)表現(xiàn)出了互不相同的個(gè)性特征,個(gè)體在運(yùn)行過(guò)程中除了主要根據(jù)鄰近規(guī)則的決策下一步行為外,還應(yīng)根據(jù)各自的個(gè)性特征進(jìn)行判斷和決策;個(gè)體的運(yùn)行狀態(tài)應(yīng)由個(gè)體的內(nèi)部和外部環(huán)境同時(shí)決定.
本文旨在初步探討個(gè)體的個(gè)性特征即內(nèi)部因素對(duì)群集行為的影響.通過(guò)引入具有記憶能力的智能個(gè)體,利用記憶能力總結(jié)個(gè)體運(yùn)動(dòng)的歷史“經(jīng)驗(yàn)”,并估計(jì)將來(lái)的運(yùn)動(dòng)趨勢(shì).通過(guò)若干記憶單元記錄該個(gè)體最近的歷史狀態(tài)信息,根據(jù)歷史狀態(tài)信息在線預(yù)測(cè)估計(jì)個(gè)體的下一時(shí)刻的運(yùn)行狀態(tài),并以此作為虛擬領(lǐng)航者引導(dǎo)群體運(yùn)行.仿真結(jié)果表明有記憶的智能群體最終以較快的速度形成穩(wěn)定的群集運(yùn)動(dòng);但在穩(wěn)定運(yùn)行階段個(gè)體的狀態(tài)在穩(wěn)態(tài)附近上下波動(dòng),這與自然界群集現(xiàn)象相吻合.
最小二乘法是一常用回歸方法.基本思路是令f(X)=a1 h1(X)+a2 h2(X)+…+am hm(X)式中:{hk(X)}(k<N)是一組事先選定的線性無(wú)關(guān)的函數(shù);{ak}mk=1是一組待定系數(shù).尋求系數(shù){ak}m
k=1使得Yi與f(Xi)的距離di的平方和最小.該方法最關(guān)鍵的一步是恰當(dāng)?shù)剡x取線性無(wú)關(guān)的基函數(shù){hk(X)(m<N).通過(guò)對(duì)基本群集運(yùn)動(dòng)的理論分析和實(shí)驗(yàn)仿真發(fā)現(xiàn),群體經(jīng)過(guò)起初短暫的無(wú)秩序運(yùn)動(dòng)之后,群體將以相同的速度按近似的線性軌跡運(yùn)行;而且由于個(gè)體的運(yùn)動(dòng)軌跡在較小的采樣周期內(nèi)可以用直線近似,因此可以采用線性回歸這種簡(jiǎn)單的預(yù)測(cè)模型.
設(shè)某個(gè)個(gè)體的位置為 p=(x,y)T,個(gè)體的運(yùn)行軌跡在較小的采樣周期T內(nèi)與時(shí)間t成線性關(guān)系,則線性回歸方程
當(dāng)m個(gè)記憶單元存滿時(shí),根據(jù)m次觀測(cè)數(shù)據(jù)(tk,pk),用最小二乘法求出a,b,c,d的估計(jì)值.
式中:a,b,c,d為未知待估參數(shù).從t1時(shí)刻開(kāi)始,以較小的采樣周期T=tk+1-tk,(K=1,2,…,m)為時(shí)間間隔;通過(guò)m次觀測(cè)利用m個(gè)記憶單元存儲(chǔ)時(shí)間和位置信息(tk,pk),得到
根據(jù)a,b,c,d的估計(jì)值,利用式(1)估算t=tm+1時(shí)刻個(gè)體的位置信息.由于個(gè)體運(yùn)行軌跡不斷的變化,因此應(yīng)采用新的觀測(cè)數(shù)據(jù)去刷新歷史數(shù)據(jù)重新估計(jì)a,b,c,d的值以減小誤差.方法是當(dāng)tm+1時(shí)刻個(gè)體的位置信息 pm+1的實(shí)際值產(chǎn)生時(shí),遺棄記憶單元中最初的t1時(shí)刻的采樣值,利用t2至tm+1之間的觀測(cè)值重新估計(jì)a,b,c,d,根據(jù)新的a,b,c,d估計(jì)值預(yù)測(cè)新時(shí)刻的個(gè)體位置信息.依此類(lèi)推,記憶單元總是存儲(chǔ)記錄最近m個(gè)時(shí)刻的較小采樣周期時(shí)間內(nèi)的個(gè)體狀態(tài)信息.
本文采用虛擬領(lǐng)航者策略利用具有記憶能力的智能個(gè)體記錄個(gè)體先前的位置信息,以此模擬個(gè)體的運(yùn)行過(guò)程中積累的“經(jīng)驗(yàn)”,根據(jù)該“經(jīng)驗(yàn)”預(yù)測(cè)估計(jì)下一步的運(yùn)行狀態(tài),以該狀態(tài)作為虛擬領(lǐng)航者引導(dǎo)個(gè)體運(yùn)行,個(gè)體的“經(jīng)驗(yàn)”反映了內(nèi)部環(huán)境的影響.
在建立群體模型之前,首先給出以下定義.
定義(鄰接圖G) 鄰接圖G(V,ε(p))是一個(gè)無(wú)向圖.其中:V={n1,…,nN}表示頂點(diǎn)集;ε(p)={(ni,nj)∈V×V}表示邊集,由個(gè)體間的鄰接關(guān)系確定.
考慮由N個(gè)個(gè)體組成的群體,其動(dòng)態(tài)方程為p i=q i,q i=u i,i=1,2,…,N.其中:p i為個(gè)體的位置;qi=(xi,yi)T為速度向量,ui=(uxi,uyi)T為控制輸入;p ij=p i-p j為個(gè)體i,j間相對(duì)位置矢量;‖p ij‖為個(gè)體i,j間的相對(duì)距離.
群集運(yùn)動(dòng)是一種基于勢(shì)場(chǎng)原理的運(yùn)動(dòng),它的控制由兩部分來(lái)實(shí)現(xiàn):u i=ai+βi,i=1,2,…,N.式中:ai由人工勢(shì)能來(lái)實(shí)現(xiàn),用于控制個(gè)體間的距離實(shí)現(xiàn)避碰和聚集;βi用于調(diào)整個(gè)體的速度使群體的速度匹配.第i個(gè)體的虛擬領(lǐng)導(dǎo)者的狀態(tài)用(piL,qiL)進(jìn)行描述,根據(jù)個(gè)體最近m個(gè)時(shí)刻用最小二乘估計(jì)產(chǎn)生.
式中:Ni為i個(gè)體的鄰居集,NiΔ={j:‖p ij‖≤R}?{1,2,…,N},R為個(gè)體的通訊作用能力;k1為常數(shù).在群集運(yùn)動(dòng)中個(gè)體的運(yùn)動(dòng)狀態(tài)同時(shí)取決于個(gè)體的內(nèi)外部環(huán)境,但外部環(huán)境(周?chē)徑鼈€(gè)體的狀態(tài))起主導(dǎo)作用,故體現(xiàn)個(gè)體內(nèi)部因素的作用項(xiàng)的系數(shù)k1應(yīng)在(0,1)范圍內(nèi);U ij為勢(shì)能函數(shù),是關(guān)于個(gè)體i與j之間的相對(duì)距離‖pij‖的非負(fù)、可微函數(shù),是關(guān)于個(gè)體i與其虛擬領(lǐng)航者間的勢(shì)能函數(shù).均應(yīng)滿足:當(dāng)‖pij‖→0,Uij(‖pij‖)→∞;當(dāng)個(gè)體i與j之間的相對(duì)距離‖p ij‖達(dá)到一定值時(shí),U ij取得惟一最小值.
由于在(p,q)坐標(biāo)系下,系統(tǒng)的解最終將趨向無(wú)窮、無(wú)界.故將系統(tǒng)轉(zhuǎn)換到相對(duì)坐標(biāo)系(r,v)下,即 ri=pi-p,vi=qi-q,其中 p,q表示群體的
下面基于LaSalle不變?cè)斫o出該模型的穩(wěn)定性分析,考慮如下的半正定函數(shù):W=
定理 考慮一個(gè)由N個(gè)個(gè)體組成的群體,其運(yùn)動(dòng)控制律由式(3)描述,假設(shè)群體所對(duì)應(yīng)的鄰接圖G是連通的,那么所有的個(gè)體最終能夠達(dá)到速度矢量相等,相互間的距離穩(wěn)定,并且個(gè)體之間不發(fā)生碰撞,群體內(nèi)部的總勢(shì)能達(dá)到最小.
由LaSalle不變?cè)砜芍?如果系統(tǒng)的初始狀態(tài)在集合Ω內(nèi),系統(tǒng)的軌跡將收斂到區(qū)域S={(r,v)∈Ω:W=0}內(nèi)的最大不變集.因此,由 W=‖vi-vj‖2<0可知,群體進(jìn)入穩(wěn)定狀態(tài)時(shí),v1=v2=…=vN,且所有個(gè)體收斂到固定位置p*,使得總勢(shì)能∑V(p*)達(dá)到最小值.
本文選取5個(gè)具有相同二階動(dòng)態(tài)性能的個(gè)體,在MATLAB環(huán)境下進(jìn)行仿真.在保證群體對(duì)應(yīng)的連接圖G連通的前提下,個(gè)體隨機(jī)分布在[-2.5,2.5]的矩形區(qū)域內(nèi),初始速度大小在(0,1)的范圍內(nèi).R=2,A=5,L=1.
在初始條件相同的情況下,本文進(jìn)行了兩組比較仿真實(shí)驗(yàn).第一組實(shí)驗(yàn)比較了無(wú)記憶和有記憶兩群體的運(yùn)動(dòng)特性.(如圖1~圖4所示)實(shí)驗(yàn)結(jié)果顯示兩群體最終均以較快的速度形成穩(wěn)定的群集運(yùn)動(dòng);但在穩(wěn)定運(yùn)行階段有記憶群體的個(gè)體的狀態(tài)在穩(wěn)態(tài)附近的波動(dòng)幅度較大.證實(shí)了群集現(xiàn)象中個(gè)體的內(nèi)部因素對(duì)群集運(yùn)動(dòng)存在著影響.第二組實(shí)驗(yàn)對(duì)內(nèi)部因素作用項(xiàng)-c▽piViL的影響程度進(jìn)行了比較仿真(如圖5~圖6所示),結(jié)果顯示當(dāng)增大作用項(xiàng)的系數(shù)c時(shí),個(gè)體的狀態(tài)在穩(wěn)態(tài)附近的波動(dòng)幅度加大;因此應(yīng)限制該項(xiàng)的大小使它小于外部因素的影響,原因在于內(nèi)部因素反映了個(gè)體的個(gè)性特征,當(dāng)個(gè)體的個(gè)性特征太突出時(shí),群體將較難達(dá)到協(xié)調(diào)一致.這與現(xiàn)實(shí)中太有個(gè)性的群體難于領(lǐng)導(dǎo)達(dá)到共識(shí)的現(xiàn)象相吻合.
圖1 無(wú)記憶群體的運(yùn)行軌跡
圖2 無(wú)記憶群體的速度收斂過(guò)程
圖3 C=0.2時(shí)有記憶群體的運(yùn)行軌跡
圖4 C=0.2時(shí)有記憶群體的速度收斂過(guò)程
圖5 C=0.45時(shí)有記憶群體的運(yùn)行軌跡
圖6 C=0.45時(shí)有記憶群體的速度收斂過(guò)程
本文提出了具有記憶能力的智能群集控制模型,通過(guò)記憶單元的信息預(yù)測(cè)估計(jì)個(gè)體的運(yùn)行趨勢(shì),并以此作為虛擬領(lǐng)航者引導(dǎo)群體運(yùn)行.該模型反映了群集運(yùn)動(dòng)中個(gè)體不僅受局部外界環(huán)境影響,同時(shí)也受個(gè)體的自身內(nèi)部環(huán)境因素的影響.
[1]Reynold CW.FIocks,herds and school:a distributed behavioralmodel[J].Computer Graphics,1987,2l(4):25-34.
[2]V icsek T,Czirok A,Jacob E,et al,Novel type of phase transition in a system of self-deriven particles[J].Physical Review Letters,1995,75(6):1226-1229.
[3]Tanner H,Jadbabaie A,Pappas G J.Flocking in_xed and switching networks[J].IEEE Transactions on Automatic Control,2007,52(5):863-868.
[4]Saber R O.Flocking for multi-agent dynam ic systems:A lgorithms and theory[J].IEEE Transactions on Automatic Control,2006,51(3):401-420.
[5] Wang Long,Shi H ong,Chu Tianguang.Flocking contro l of groups of mobile autonomous agents via local feedback[C]//Proc of the 2005 IEEE International Symposium on Intelligent Control.Limasso l,Cyprus,2005.
[6] Jadbabaie A,Lin J,Morse A S.Coordination o f groups ofmobile agents using nearest neighbor ru les[J].IEEE Trans on Automatic Contro l,2003,48(6):988-1001.
[7] Moreau L.Stability of multi-agent systems with time-dependent communication links[J].IEEE Trans on Automatic Control,2005,50(2):169-182.
[8]Ren W,Beard RW.Consensus seeking inmu ltiagent systems under dynam ically changing interaction topologies[J].IEEE Trans.on Automatic Contro l,2005,50(5):655-661.