張 旺,侯海良
(湖南人文科技學(xué)院 信息學(xué)院,湖南 婁底 417000)
近幾年來(lái),隨著人工智能的普及,多智能體系統(tǒng)協(xié)同控制受到了廣泛關(guān)注。包含控制作為其中一個(gè)重要的分支,在實(shí)際中有著廣泛的應(yīng)用前景,如無(wú)人機(jī)護(hù)航編隊(duì)、多機(jī)器人協(xié)同避障等。文獻(xiàn)[1]提出了一種走走停停的控制策略,解決了固定無(wú)向通信拓?fù)湎碌陌瑔?wèn)題,并首次明確了包含控制的目標(biāo)是將一組跟隨者智能體驅(qū)動(dòng)到由領(lǐng)導(dǎo)者構(gòu)成的凸區(qū)域內(nèi)。文獻(xiàn)[2-4]研究了固定網(wǎng)絡(luò)下的包含控制問(wèn)題。文獻(xiàn)[5-6]研究了無(wú)向切換網(wǎng)絡(luò)的包含控制問(wèn)題。文獻(xiàn)[7]分別研究了領(lǐng)導(dǎo)者運(yùn)動(dòng)和靜止兩種情況下有向切換網(wǎng)絡(luò)的包含控制問(wèn)題。以上研究均未考慮時(shí)滯問(wèn)題,實(shí)際上由于信息采集、傳輸、處理等需要時(shí)間,時(shí)滯問(wèn)題不可避免,必定會(huì)對(duì)控制產(chǎn)生影響。文獻(xiàn)[8-11]研究了固定網(wǎng)絡(luò)下考慮通信時(shí)滯的包含控制問(wèn)題。文獻(xiàn)[12]提出了一種基于投影的非線性包含控制算法,解決了有向切換網(wǎng)絡(luò)中存在通信時(shí)滯的包含控制問(wèn)題。文獻(xiàn)[13]分別針對(duì)一階和二階系統(tǒng)提出了兩種不同的包含控制算法,解決了有向切換網(wǎng)絡(luò)中存在通信時(shí)滯的包含控制問(wèn)題。文獻(xiàn)[14]將文獻(xiàn)[13]的研究?jī)?nèi)容拓展到離散系統(tǒng)中,并改進(jìn)了包含控制算法。
上述研究[1-14]假定智能體的控制輸入和狀態(tài)可以任意變化。但在實(shí)際應(yīng)用中,受物理?xiàng)l件的限制,智能體運(yùn)動(dòng)不可避免地要受到一些約束,如受能耗影響,機(jī)器人的速度只可能在一定范圍內(nèi)變化。文獻(xiàn)[15-16]研究了受約束的多智能體系統(tǒng)控制問(wèn)題,其所受約束為凸性,這往往與實(shí)際不符。例如艦艇在水中可以朝各個(gè)方向運(yùn)動(dòng),速度最快的方向?yàn)榕炌У那斑M(jìn)方向,各個(gè)方向的運(yùn)動(dòng)速度形成了一個(gè)非凸區(qū)域。在文獻(xiàn)[15-16]研究的基礎(chǔ)上,文獻(xiàn)[17-19]進(jìn)一步研究了受非凸速度約束以及非凸輸入約束的控制問(wèn)題。需要強(qiáng)調(diào)的是文獻(xiàn)[15-19]都是研究多智能體系統(tǒng)一致性問(wèn)題。文獻(xiàn)[20]提出了一種基于投影的非線性包含控制算法,解決了連續(xù)系統(tǒng)輸入受約束的包含控制問(wèn)題。
文獻(xiàn)[1-20]中提到的系統(tǒng)均是離散的或者連續(xù)的。在實(shí)際應(yīng)用中通常智能體使用的控制器為計(jì)算機(jī)或微處理器,智能體的狀態(tài)信息需要經(jīng)過(guò)采樣后傳輸給鄰居智能體,且在某些特定的環(huán)境中只能獲得采樣數(shù)據(jù)。與連續(xù)系統(tǒng)相比,采樣系統(tǒng)只需要對(duì)采樣數(shù)據(jù)進(jìn)行傳輸,減少了通信能耗。與離散系統(tǒng)相比,采樣系統(tǒng)不需要將控制系統(tǒng)做離散化處理,且進(jìn)行周期采樣得到的數(shù)據(jù)便于處理。文獻(xiàn)[21-22]研究了固定網(wǎng)絡(luò)下采樣系統(tǒng)的包含控制問(wèn)題。文獻(xiàn)[23]研究了切換網(wǎng)絡(luò)和通信時(shí)滯的采樣系統(tǒng)包含控制問(wèn)題,但都沒(méi)有考慮采樣系統(tǒng)的約束問(wèn)題。
該研究受輸入約束和通信時(shí)滯影響的采樣多智能體系統(tǒng)包含控制問(wèn)題,提出了一種基于投影的分布式協(xié)調(diào)控制算法。首先針對(duì)跟隨者智能體設(shè)計(jì)了一種基于投影的非線性包含控制算法,將所有跟隨者智能體到凸包的最大距離定義為李雅普諾夫函數(shù),根據(jù)李雅普諾夫穩(wěn)定性理論證明只要每個(gè)跟隨者智能體能直接或間接至少收到一個(gè)領(lǐng)導(dǎo)者的信息,受限包含控制問(wèn)題就能解決。最后通過(guò)數(shù)字案例證明了該包含控制方法的有效性。
G(ν,ε,A)表示含n個(gè)節(jié)點(diǎn)的有向圖,ε?{(i,j):i,j∈ν}表示邊集,ν={1,2,…,n}表示節(jié)點(diǎn)集,A=[aij]∈n×n表示鄰接矩陣的權(quán)值。aij≥0表示邊的權(quán)值,(j,i)∈ε表示節(jié)點(diǎn)i能接收到節(jié)點(diǎn)j接收的消息,當(dāng)(j,i)∈ε且i≠j時(shí)有aij>0,否則aij=0。在有向圖G(ν,ε,A)中,有向路徑由有序邊序列(i1,i2),(i2,i3),…構(gòu)成,其中(ij,ij+1)∈ν。多個(gè)有向圖G1,G2,…,GN的并集為GM,GM仍是一個(gè)有向圖,且GM的邊集等于全部有向圖Gj,j=1,2,…,M邊集的并集。+表示所有正整數(shù)的集合,g表示g維實(shí)列向量的集合。‖x‖表示向量x的標(biāo)準(zhǔn)歐幾里得范數(shù)。PY(x)表示x在封閉區(qū)域Y上的投影,定義為:
引理1:設(shè)凸集Q∈r為非空封閉凸集,γi∈r表示任意向量,如果ai≥0,i=(1,2,…,n)滿足那么有
定義1:設(shè)Ui?r是一個(gè)有界的非空封閉集合,當(dāng)x=0時(shí),SUi(0)=0,當(dāng)x≠0時(shí),則將SUi(x)稱為約束算子。此外其中均是正常數(shù)。
約束算子SUi(x)的物理意義是找到與矢量x方向相同的矢量SUi(x)使其滿足‖SUi(x)‖≤‖x‖,并且對(duì)于任意θ∈[0,1],都滿足θSUi(x)∈Ui。值得指出的是,該約束算子不要求Ui為凸性(如圖1所示)。
圖1 約束算子示意圖
設(shè)多智能體系統(tǒng)由l+n個(gè)智能體組成,包括l個(gè)領(lǐng)導(dǎo)者智能體(下文簡(jiǎn)稱領(lǐng)導(dǎo)者)和n個(gè)跟隨者智能體(下文簡(jiǎn)稱跟隨者),F(xiàn)={1,2,…,n}表示跟隨者集合,L={n+1,n+2,…,n+l}表示領(lǐng)導(dǎo)者集合。xi(k)∈r表示跟隨者在kT時(shí)刻的位置,ui(k)∈r表示跟隨者在kT時(shí)刻的控制輸入。T>0表示采樣周期,為了簡(jiǎn)便起見(jiàn),后面統(tǒng)一用k表示kT。所有領(lǐng)導(dǎo)者和跟隨者構(gòu)成了通信拓?fù)鋱DG(ν,ε,A)的節(jié)點(diǎn)集。
xi(k+1)=xi(k)+SUi(ui(k))T
(1)
考慮通信時(shí)滯影響,設(shè)計(jì)包含控制算法為:
ci(k)[xi(k)-PYi(k)(xi(k))]
(2)
式中,τij(i≠j)為跟隨者i與j之間的通信時(shí)滯,τij<τmax,τmax為最大通信時(shí)滯。如果aij>0,假設(shè)aij>λ,λ為一個(gè)正常數(shù)。跟隨者i如果能至少接收到一個(gè)領(lǐng)導(dǎo)者的信息,則有ci(k)>0,否則ci(k)=0。同樣假設(shè)如果ci(k)>0,則ci(k)≥λ。
為了便于后續(xù)分析,定義一個(gè)新的變量hi(k),當(dāng)k≥0時(shí)有:
xi(k))-ci(k)(xi(k)-PYi(k)(xi(k)))]T=
τij)-xi(k))-hi(k)Tci(k)(xi(k)-
PYi(k)(xi(k)))=
hi(k)Tci(k)xi(k)+hi(k)Tci(k)PYi(k)(xi(k))=
hi(k)Tci(k)PYi(k)(xi(k))
(3)
假設(shè)1:在kT時(shí)刻,通信拓?fù)鋱D的并集中任意跟隨者與領(lǐng)導(dǎo)者之間至少存在一條有向的路徑。
(4)
根據(jù)式(3)和引理1可得:
(5)
因?yàn)閅i(k)?Y,所以PYi(k)(xi(k))=PY(PYi(k)(xi(k)))。
‖xi(k+1)-PY(xi(k+1))‖≤
hi(k)Tci(k)V(k)+hi(k)Tci(k)≤
(1-hi(k)ci(k)T)V(k)
(6)
由假設(shè)2可得0≤(1-hi(k)ci(k)T)≤1,即V(k)≤V(k+1)=‖xi(k+1)-PY(xi(k+1))‖,可得出V(k)為單調(diào)非增,即跟隨者到凸區(qū)域Y的最大距離不會(huì)增大。為了最終能實(shí)現(xiàn)包含控制,必須證明V(k)會(huì)隨時(shí)間減小,下面分兩步來(lái)證明。
第一步:對(duì)于任意跟隨者i∈F,當(dāng)k≤κ且0≤ζ1<1時(shí),如果有‖xi(κ)-PY(xi(κ))‖≤ζ1V(k),那么對(duì)于0≤ζ2<1,有‖xi(κ+1)-PY(xi(κ+1))‖≤ζ2V(k)。
根據(jù)公式(6)有:
‖xi(κ+1)-PY(xi(κ+1))‖≤
ci(κ)))](1-ζ1)V(k)≤[1-(1-
ΨmaxT)](1-ζ1)V(k)
(7)
根據(jù)假設(shè)2和式(7)可推導(dǎo)出‖xi(κ+1)-PY(xi(κ+1))‖≤ζ2V(k),此時(shí)ζ2=1-(1-ΨmaxT)(1-ζ1)。
第二步:對(duì)于任意跟隨者iz∈F,設(shè)iz能接收到iw∈F∪L的信息,即aiziw(κ)>0,有aiziw(κ)≥λ;ciz(κ)>0,有ciz(κ)≥λ。當(dāng)k≤κ時(shí),如果有‖xiw(κ-τiziw)-PY(xiw(κ-τiziw))‖≤ζ1V(k),那么有‖xiz(κ+1)-PY(xiz(κ+1))‖≤ζ2V(k),此時(shí)0≤ζ1<1,0≤ζ2<1。
證明過(guò)程如下:
‖xiz(κ+1)-PY(xiz(κ+1))‖≤
aiziw(κ)TV(k)-aiziw(κ)T(1-ζ1)V(k)≤
[1-hiz(κ)Tciz(κ)]V(k)-aiziw(κ)T(1-
ζ1)V(k)≤(1-aiziw(κ)T(1-ζ1))V(k)≤
(1-λT(1-ζ1))V(k)
(8)
由式(8)可得‖xiz(κ+1)-PY(xiz(κ+1))‖≤ζ2V(k),此時(shí)ζ2=1-λT(1-ζ1),很顯然0<ζ2<1。
根據(jù)假設(shè)1至少存在一個(gè)跟隨者if1∈F在kT時(shí)刻能接收到領(lǐng)導(dǎo)者的消息,即ci(k)≥λ。由第二步可得‖xif1(k+1)-PY(xif1(k+1))‖<ζif1V(k),通過(guò)第一步運(yùn)用遞歸法則可得,對(duì)于任意S≥1有ζif1,SV(k)>‖xif1(k+S+1)-PY(xif1(k+S+1))‖,此時(shí)0<ζif1,S<1。
同理,存在一個(gè)跟隨者if2,f2≠f1在(k+1+τif1if2)T時(shí)刻能接收到if1或者部分領(lǐng)導(dǎo)者的消息。根據(jù)第二步可得‖xif2(k+τif1if2+1)-PY(xif2(k+τif1if2+1))‖<ζif2,1V(k),此時(shí)0<ζf2,1<1。通過(guò)使用遞歸法則可得,‖xif2(k+τif1if2+1+S)-PY(xif2(k+τif1if2+1+S))‖<ζif2,S+1V(k),此時(shí)0<ζif2,S+1<1、S≥1。
為了證明控制算法的有效性,本節(jié)通過(guò)兩次仿真案例對(duì)設(shè)計(jì)的算法進(jìn)行驗(yàn)證。在第一次仿真中考慮由6個(gè)智能體n1,n2,…,n6和4個(gè)領(lǐng)導(dǎo)者m1,m2,m3,m4構(gòu)成的多智能體系統(tǒng),其通信拓?fù)淙鐖D2所示(多智能體系統(tǒng)通信拓?fù)?),由三個(gè)拓?fù)浣Y(jié)構(gòu)G1,G2,G3組成,在系統(tǒng)運(yùn)行過(guò)程中每隔1秒切換一次拓?fù)?,顯然G1∪G2∪G3滿足假設(shè)1的條件。令aij(k)=1.5,ci(k)=0.23,采樣周期T=0.2,顯然滿足假設(shè)2的條件。
圖2 多智能體系統(tǒng)通信拓?fù)?
將所有跟隨者的輸入約束范圍設(shè)置為由半圓x2+(y-0.75)2=0.75(y≥0.75)、x2+(y+0.75)2=0.75(y≤-0.75)與四條線段y=-x+1.5(0.75
第二次仿真采用的通信拓?fù)淙鐖D5所示(多智能體系統(tǒng)通信拓?fù)?),三個(gè)拓?fù)浣Y(jié)構(gòu)對(duì)應(yīng)的通信時(shí)滯為0.1 s,0.2 s,0.3 s。仿真結(jié)果如圖6、7所示,假設(shè)多智能體系統(tǒng)包括n1,n2,…,n6等6個(gè)跟隨者和L1,L2,L3,L4等4個(gè)領(lǐng)導(dǎo)者。通信拓?fù)浒凑誈a,Gb,Gc順序依次切換,每個(gè)拓?fù)涞某掷m(xù)時(shí)間為1 s,顯然Ga∪Gb∪Gc滿足假設(shè)1的條件。假設(shè)三個(gè)拓?fù)浣Y(jié)構(gòu)中智能體間的通信時(shí)滯分別為0.1 s,0.2 s,0.3 s。
圖3 跟隨者輸入約束1 圖4 跟隨者運(yùn)動(dòng)軌跡1
圖5 多智能體系統(tǒng)通信拓?fù)?
令aij(k)=0.12,ci(k)=0.1,采樣周期T=0.2,顯然能使假設(shè)2滿足。4個(gè)領(lǐng)導(dǎo)者的初始位置為:L1:(-1,1),L2:(1,1),L3:(-1,-1),L4:(1,-1)。6個(gè)跟隨者的初始位置分別為:n1:(-3,3),n2:(0,3),n3:(3,3)n4:(-3,-3),n5:(0,-3),n6:(3,-3)。將所有跟隨者的輸入約束范圍設(shè)置為:半圓(x-0.5)2+y2=0.5(x≥0.5)、(x+0.5)2+y2=0.5(x≤-0.5)與四條線段y=-x+1(0
圖6 跟隨者輸入約束2 圖7 跟隨者運(yùn)動(dòng)軌跡2
該文研究了受輸入約束的多智能體系統(tǒng)包含控制問(wèn)題,考慮了跟隨者受通信時(shí)滯影響,同時(shí)該系統(tǒng)通信拓?fù)錇橛邢蚯袚Q的。針對(duì)該問(wèn)題設(shè)計(jì)了一種基于鄰居位置信息以及投影的包含控制算法,將跟隨者與凸區(qū)域的距離構(gòu)建為李雅普諾夫函數(shù),運(yùn)用凸分析、模型轉(zhuǎn)換等方法首先證明了領(lǐng)導(dǎo)者與凸區(qū)域的距離不會(huì)隨時(shí)間變化增大,接著證明了所有能與領(lǐng)導(dǎo)者直接或間接通信的跟隨者與凸區(qū)域間的距離隨時(shí)間變化減小,最終所有跟隨者與凸區(qū)域間的距離收斂到0,即所有控制輸入受約束的跟隨者均能進(jìn)入到由領(lǐng)導(dǎo)者構(gòu)成的凸區(qū)域中。最后通過(guò)數(shù)值仿真證明了理論結(jié)果的正確性。文中考慮的系統(tǒng)為一階采樣系統(tǒng),下一步工作將探究受輸入約束和時(shí)延影響的二階采樣多智能體系統(tǒng)包含控制問(wèn)題以及動(dòng)態(tài)領(lǐng)導(dǎo)者的情況。