馬晨,陳雪波
(遼寧科技大學(xué) 電子與信息工程學(xué)院,遼寧 鞍山 114051)
多智能體的運動一致性在本質(zhì)上與復(fù)雜網(wǎng)絡(luò)的同步問題非常相似,都是要使網(wǎng)絡(luò)中各個智能體的狀態(tài)趨于一個一致的解,除了網(wǎng)絡(luò)本身的性質(zhì)對一致性的影響以外,各智能體之間的協(xié)調(diào)對于改善同步能力也是非常重要的[1]。近年來,結(jié)合網(wǎng)絡(luò)一致性的多智能體群集控制一直是控制學(xué)者關(guān)注的問題,并且得到了許多重要的結(jié)論。如文獻[2-5]討論了一致性問題中系統(tǒng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的影響;文獻[6-8]通過設(shè)計一個勢能函數(shù)來實現(xiàn)多智能體的群集控制;文獻[9]提出了同時考慮位移與速度協(xié)調(diào)的二階一致性協(xié)議。另一方面,包含原理以及由其引申出的對對分解[10-13],可以充分地利用各子系統(tǒng)間的互聯(lián)關(guān)系,在處理多重疊互聯(lián)系統(tǒng)的協(xié)調(diào)控制時具有獨特的優(yōu)勢。包含原理在運動體的協(xié)調(diào)控制方面有很廣泛的應(yīng)用,如自動車組系統(tǒng)[13-15]以及無人機編隊[16]等的協(xié)調(diào)控制。由于前述文獻中的系統(tǒng)運動模型是基于相對位置構(gòu)建的,因而只適合于處理各運動體按鏈型結(jié)構(gòu)排列的情況。本文將文獻[13-14]中的系統(tǒng)擴展為2個軸向,考慮按網(wǎng)型結(jié)構(gòu)排列的多智能體系統(tǒng),為其建立一個多重疊的偏差狀態(tài)方程,在包含原理的概念下分別為每一組在網(wǎng)絡(luò)拓?fù)渲邢噜彽闹悄荏w對設(shè)計一致性控制狀態(tài)反饋矩陣,以收縮得到適用于原系統(tǒng)的協(xié)調(diào)控制器。系統(tǒng)網(wǎng)絡(luò)拓?fù)涞幕ヂ?lián)關(guān)系主要體現(xiàn)在一致性協(xié)調(diào)控制器中。
系統(tǒng)的包含原理有擴展與收縮2個方面,可以有效地處理系統(tǒng)的重疊互聯(lián)結(jié)構(gòu),從而簡化復(fù)雜系統(tǒng)的分析與設(shè)計工作。通過對系統(tǒng)重疊的各個組成部分或子系統(tǒng)近似解耦,可以得到原系統(tǒng)在擴展空間中的對應(yīng),并且在滿足包含原理相關(guān)的條件下,該擴展系統(tǒng)包含了原系統(tǒng)所有的性質(zhì)。這樣一來,可以在擴展空間中為每一個解耦的子系統(tǒng)進行并行且獨立的觀測器和控制器設(shè)計,經(jīng)過適當(dāng)?shù)恼虾?,可以將得到的結(jié)果再收縮回原系統(tǒng)空間,進而實現(xiàn)對原系統(tǒng)的重疊分散與一致性協(xié)調(diào)控制。關(guān)于系統(tǒng)包含原理以及重疊互聯(lián)系統(tǒng)協(xié)調(diào)控制方面的詳細(xì)內(nèi)容請見文獻[10-13]。
考慮一線性定常連續(xù)的重疊互聯(lián)系統(tǒng),具有N(N≥ 3)個子系統(tǒng):
(1)
式中:xi(t)∈Rni,ui(t)∈Rmi和yi(t)∈Rli分別是在時間t∈R子系統(tǒng)Si的狀態(tài)、輸入和輸出向量;Aii、Bii和Cii是系統(tǒng)Si的系數(shù)矩陣,Aij表示子系統(tǒng)Si與子系統(tǒng)Sj的互聯(lián)關(guān)系。
對于式(1),系統(tǒng)中所有的互聯(lián)關(guān)系都是建立在每一對子系統(tǒng)間的信息結(jié)構(gòu)約束之上的,因而可以在式(1)中任意選擇系統(tǒng)S的一對子系統(tǒng)Si與Sj,稱
(2)
為系統(tǒng)S的一個基本互聯(lián)子系統(tǒng)對。在式(2)中,只需要關(guān)注特定子系統(tǒng)Si與Sj之間的互聯(lián)關(guān)系,而這2個子系統(tǒng)與其他任意子系統(tǒng)間的互聯(lián)關(guān)系可以暫時不做考慮,這樣可以在很大程度上簡化了復(fù)雜互聯(lián)系統(tǒng)的分析工作,又不會損失細(xì)節(jié)。
重疊互聯(lián)系統(tǒng)的對對分解需要考慮擴展空間中子系統(tǒng)對Sij的排列順序,即循環(huán)逆序排列,假設(shè)系統(tǒng)S具有全網(wǎng)絡(luò)結(jié)構(gòu),則有各子系統(tǒng)對按倒序下標(biāo)循環(huán)排列為
式中:Ik是對應(yīng)子系統(tǒng)Sk的單位子矩陣。從而有列組置換矩陣P與行組置換矩陣P-1由一系列相鄰列組與行組初等置換矩陣按順序右累乘與左累乘得到
(3)
置換后可得
UP=UpA
QP=QPB
SP=SpC
(4)
其中各系數(shù)矩陣分別為
(5)
考慮用每個智能體位移的變化量和速度的變化量來描述其運動狀態(tài),可以寫出每個智能體的二階偏差方程為
(6)
為簡便起見以下將省略變化量符號,式(6)中di=[dixdiy]T,vi=[vixviy]T,ui=[uixuiy]T,分別表示智能體i在x和y軸上的位移與速度變化量以及控制輸入。
如圖1所示,考慮由N=20個智能體組成的網(wǎng)型結(jié)構(gòu)系統(tǒng)。容易想象,對于這樣的網(wǎng)型拓?fù)浣Y(jié)構(gòu),當(dāng)每一對智能體間的距離均相等時,一定會形成圖中正三角形網(wǎng)格的網(wǎng)型結(jié)構(gòu),即是文獻[8]中定義的α-lattice。不過,文獻[8]的群集算法主要考慮智能體的勢能關(guān)系,這樣一來各智能體對相互距離的判斷可能會產(chǎn)生誤差,在實際形成的網(wǎng)型拓?fù)浣Y(jié)構(gòu)中各邊的長度可能不會完全相等,即形成準(zhǔn)α-lattice。本文在接下來要介紹的多智能體一致性協(xié)調(diào)控制將直接考慮各智能體位移和速度的變化量,因而在平穩(wěn)狀態(tài)下各智能體間的距離將是完全相等的。
圖1 多智能體系統(tǒng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu), N=20Fig.1 Network topology of a multi-agent system, N=20
圖1表示的系統(tǒng)狀態(tài)空間模型為
(7)
式中:
根據(jù)圖1所示的網(wǎng)絡(luò)結(jié)構(gòu),擴展系統(tǒng)中各子系統(tǒng)對的循環(huán)逆序可以寫成
Sij:S12,S34,S14,S45,S25,S15,S56,S26,S37,S78,S48,S38,S89,S59,S49,S9,10,S6,10,S5,10,S8,11,S7,11,S11,12,S9,12,S8,12,S12,13,S10,13,S9,13,S13,14,S10,14,S11,15,S15,16,S12,16,S11,16,S16,17,S13,17,S12,17,S17,18,S14,18,S13,18,S16,19,S15,19,S19,20,S17,20,S16,20.(8)
這樣,根據(jù)式(3)可以選擇系統(tǒng)狀態(tài)的擴展和收縮變換矩陣為
(9)
系統(tǒng)輸入、輸出的擴展和收縮變換矩陣結(jié)構(gòu)與式(9)類似。系統(tǒng)的置換矩陣若要按照定義式來選擇稍顯不夠直觀,這里可以參照文獻[17]中的式(6),即
式中:符號P(m,n)b表示P中單位子矩陣I的塊位置。補償矩陣的選擇可以參照文獻[12-13]。這樣即可根據(jù)式(4)、(5)得到原多智能體系統(tǒng)的擴展系統(tǒng)。
考慮多智能體系統(tǒng)偏差模型(7),控制目標(biāo)是要使各智能體的位移和速度變化量為0,且整體系統(tǒng)實現(xiàn)運動狀態(tài)的一致。針對重疊解耦后的擴展系統(tǒng),以其中的每個子系統(tǒng)對為基本單位,參照文獻[9]中提出的二階一致性協(xié)議,可以構(gòu)造智能體對的一致性控制律為
ui=fic+fir=
aij[-(di-dj)-ci(vi-vj)]+(-rddi-rvvi)
i,j=1,2,…,N,i≠j
(10)
式中:fic是為保證系統(tǒng)運動一致性的實現(xiàn),fir是為保證各智能體的位移與速度變化量為0,各參數(shù)aij、ci、rd和rv取合適的值。從而可以把式(11)整理成狀態(tài)反饋矩陣的形式:
KDij=
(11)
即可得到擴展系統(tǒng)的狀態(tài)反饋控制矩陣為
(12)
需要注意的是,根據(jù)文獻[12-13],在整合擴展系統(tǒng)控制矩陣時需要考慮整體系統(tǒng)的信息結(jié)構(gòu),即需要參照由包含原理得到的擴展系統(tǒng)狀態(tài)矩陣的信息結(jié)構(gòu),對控制矩陣進行補償。這里由于系統(tǒng)的狀態(tài)矩陣中對應(yīng)的信息結(jié)構(gòu)約束項為0,從而相應(yīng)的協(xié)調(diào)補償器也為0。
然后需要根據(jù)包含原理相關(guān)條件將擴展系統(tǒng)的協(xié)調(diào)控制器(12)收縮回原空間,由文獻[12-13]有
實際上,考慮基于包含原理得到的一致性控制律u=-Kx,其基本結(jié)構(gòu)與常規(guī)的一致性協(xié)議如文獻[4,9]中提到的是相同的,差別僅在于每一路控制輸入整體的系數(shù)上。這主要是因為常規(guī)的一致性協(xié)議使用系統(tǒng)網(wǎng)絡(luò)的Laplacian矩陣來描述網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),而該矩陣在構(gòu)造時是以網(wǎng)絡(luò)中各節(jié)點的互聯(lián)項作為基準(zhǔn)單位,而本文的描述方式是以該節(jié)點本身作為基準(zhǔn)單位,二者相差的系數(shù)恰好是節(jié)點所含的互聯(lián)項的數(shù)目。
首先考慮圖1所示的多智能體系統(tǒng),各智能體僅能與存在信息結(jié)構(gòu)約束的其他智能體進行信息交換,即是在一致性控制律(10)中,i與j需要滿足Sij存在于子系統(tǒng)的循環(huán)逆序排列里。系統(tǒng)的重疊偏差模型如式(7),設(shè)智能體1在1≤t≤10 s內(nèi)在x軸和y軸上均受到一個正單位的擾動,控制律中各參數(shù)在整個仿真過程中是固定的,分別為aij=10,ci=1,rd=rv=10,使用MATLAB仿真如圖2。
(a)智能體位移偏差曲線
(b)智能體速度偏差曲線 圖2 N=20時多智能體系統(tǒng)的響應(yīng)曲線Fig.2 Response curves of the multi-agent system, N=20
假設(shè)系統(tǒng)經(jīng)調(diào)節(jié)后處于平穩(wěn)運行狀態(tài),智能體21的加入將分別給智能體17、18和20一個正單位的擾動,智能體21本身受到一個負(fù)單位的擾動,控制律中各參數(shù)不變。仿真結(jié)果如圖4,這里各智能體所受擾動為瞬時值,因而速度變化量的調(diào)節(jié)時間很短。智能體17、18和20在系統(tǒng)網(wǎng)絡(luò)中的地位和作用很接近,其位移與速度變化量的響應(yīng)曲線也很相似,并且與智能體21的響應(yīng)曲線變化方向相反,其他智能體的響應(yīng)曲線波動依然是按照其各自的互聯(lián)情況不同而有一定的差別,這與圖2顯示的結(jié)果是基本一致的。以上仿真結(jié)果表明,在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)改變的情況下,系統(tǒng)仍然可以很快地調(diào)節(jié)回平衡位置。
圖3 向系統(tǒng)中加入一個智能體,N=21Fig.3 Add one more agent to the former system, N=21
(a)智能體位移偏差曲線
(b)智能體速度偏差曲線 圖4 N=21時多智能體系統(tǒng)的響應(yīng)曲線Fig.4 Response curves of the multi-agent system, N=21
本文在包含原理的概念下考慮多智能體系統(tǒng)的運動一致性問題。通過對系統(tǒng)重疊偏差方程進行擴展、為每個智能體對單獨設(shè)計控制律、再將結(jié)果整合并收縮這樣的過程,可以實現(xiàn)原系統(tǒng)的一致性協(xié)調(diào)控制。區(qū)別于之前的工作,本文解決了在2個運動軸向上應(yīng)用包含原理進行系統(tǒng)重疊分解的問題。文中各智能體間距離相等的網(wǎng)型結(jié)構(gòu)是有現(xiàn)實意義的,在自動車組的隊形保持或多機器人系統(tǒng)的群集控制中均有應(yīng)用價值。另一方面,不只是本文提到的一致性問題,基于置換包含原理的對對分解也同樣適用于處理更加復(fù)雜的控制算法以及網(wǎng)絡(luò)結(jié)構(gòu)的動態(tài)變化。
參考文獻:
[1]段志生, 黃琳. 幾類協(xié)調(diào)控制問題及其應(yīng)用[J]. 控制工程, 2010, 17(suppl): 1-8.
DUAN Zhisheng, HUANG Lin. Several harmonic control problems and their applications[J]. Control Engineering of China, 2010, 17(suppl): 1-8.
[2]JUSTH E W, KRISHNAPRASAD P S. A simple control law for UAV formation flying, 2002-38[R]. Institute for System Research, University of Maryland, 2002.
[3]JADBABIE A, LIN J, MORSE A S. Coordination of groups of mobile agents using nearest neighbor rules[J]. IEEE Transactions on Automatic Control, 2003, 48(6): 988-1001.
[4]OLFATI-SABER R, MURRAY R M. Consensus problems in networks of agents with switching topology and time-delays[J]. IEEE Transactions on Automatic Control, 2004, 49(9): 1520-1533.
[5]OLFATI-SABER R, FAX J A, MURRAY R M. Consensus and cooperation in networked multi-agent systems[J]. Proceedings of the IEEE, 2007, 95(1): 215-233.
[6]TANNER H G. Flocking with obstacle avoidance in switching networks of interconnection vehicles[C]//IEEE International Conference on Robotics and Automation. [S.l.], 2004: 3006-3011.
[7]TANNER H G, JADBABAIE A, GAPPAS G J. Flocking in fixed and switching networks[J]. IEEE Transactions on Automatic Control, 2007, 52(5): 863-868.
[8]OLFATI-SABER R. Flocking for multi-agent dynamic systems: algorithms and theory[J]. IEEE Transactions on Automatic Control, 2006, 51(3): 401-420.
[9]REN W, ATKINS E. Distributed multi-vehicle coordinated control via local information exchange[J]. International Journal of Robust and Nonlinear Control, 2007, 17(10/11): 1002-1033.
[10]CHEN X B, STANKOVIC S S. Decomposition and decentralized control of systems with multi-overlapping structure[J]. Automatica, 2005, 41: 1765-1772.
[11]CHEN X B, STANKOVIC S S. Overlapping decentralized approach to automatic generation control of multi-area power systems[J]. International Journal of Control, 2007, 80: 386-402.
[12]CHEN X B, XU W B, HUANG T Y, et al. Pair-wise decomposition and coordinated control of complex systems[J]. Information Science, 2012, 185: 78-99.
[13]陳雪波. 系統(tǒng)包含原理及其應(yīng)用[M]. 北京: 科學(xué)出版社, 2012: 12-17.
[14]陳雪波. 車組距離與速度偏差系統(tǒng)的建模與仿真[C]//第20屆中國控制會議論文集. 大連, 中國, 2001: 553-558.
CHEN Xuebo. Modeling and simulation for car-string velocity and distance bias systems[C]//Proceedings of the 20thChina Control Conference. Dalian, China: 2001: 553-558.
[15]STANKOVIC S S, STANJEVIC M J, SILJAK D D. Decentralized suboptimal LQG control of a platoon of vehicles[C]//The 7thBalkan Conference on Operational Research. Constanta, Romania, 2005: 12-15.
[16]STIPANOVIC D M, INALHAN G, TEO R, et al. Decentralized overlapping control of a formation of unmanned aerial vehicles[J]. Automatica, 2004, 40: 1285-1296.
[17]CHEN X B, MA C. Coordinated control of a four-area power system under structural perturbation[C]//The 9thAsian Control Conference. Istanbul, Turkey, 2013:14-17.
[18]馬晨, 陳雪波. 互聯(lián)系統(tǒng)的動態(tài)信息結(jié)構(gòu)約束[J]. 系統(tǒng)科學(xué)與數(shù)學(xué), 2013, 33(11): 1301-1320.
MA Chen, CHEN Xuebo. Dynamic of interconnected system information structure constraints[J]. Journal of System Science and Mathematical Science, 2013, 33(11): 1301-1320.