杜柏陽, 張國良, 孫一杰, 徐 君
(第二炮兵工程大學,西安 710025)
編隊控制問題在分布式多機器人協(xié)同控制的研究中占有重要地位,它要求各機器人利用自身調(diào)整,使所有的個體形成并保持一定的幾何構(gòu)型[1]。在諸如多機械臂協(xié)同裝配[2]、無人機編隊[3]、衛(wèi)星編隊[4]、集群航天器深空探測[5]中得到廣泛研究。領(lǐng)航者模式下的多機器人編隊問題,指在多機器人系統(tǒng)中,研究一類分散控制的方法,使得一個或幾個領(lǐng)航者地位的機器人引領(lǐng)整個編隊系統(tǒng)向著期望的網(wǎng)絡(luò)拓撲收斂,最終與領(lǐng)航者的運動狀態(tài)趨近一致。領(lǐng)航者模式中,領(lǐng)航者的運動是獨立的,而跟隨者(系統(tǒng)中其他的機器人)受到領(lǐng)航者與其他跟隨者的共同影響。
JADBABAIE 在Vicsek 模型的基礎(chǔ)上,運用代數(shù)圖論,證明了一致性的可實現(xiàn)性;文獻[6]結(jié)合這樣的結(jié)論,對一致性問題深入分析,并得到系統(tǒng)取得一致性的充分條件;文獻[7]則針對帶虛擬領(lǐng)航者的二階系統(tǒng)進一步進行探討,提出了保持連通性的一致性協(xié)議?;陬I(lǐng)航者模式的一致性理論,不僅包含連續(xù)系統(tǒng)一致性,而且包括離散系統(tǒng)一致性,二者的分析思路有所區(qū)別。針對線性離散系統(tǒng)的分布式協(xié)調(diào)一致性問題,文獻[8]提出基于觀測器的降階一致性協(xié)議,在給出的協(xié)議下,系統(tǒng)可實現(xiàn)一致性,同時可獲得系統(tǒng)的收斂速率;事實上,采樣時間對系統(tǒng)的穩(wěn)定性及對原時間連續(xù)系統(tǒng)的可復(fù)現(xiàn)性有較大影響,甚至起著決定性的作用,并且文獻[9]中所采用的二階離散模型的采樣時間并不是很小時,系統(tǒng)誤差較大。
本文利用零階保持器對多機器人系統(tǒng)的二階連續(xù)模型進行采樣,可得二階離散模型。針對領(lǐng)航者模式下的多機器人系統(tǒng),采用有向圖通信拓撲的方式,進而為該系統(tǒng)的編隊控制設(shè)計了離散時間一致性協(xié)議。通過使用矩陣分析對該算法的穩(wěn)定性進行分析,得到該系統(tǒng)在Lyapunov 意義下穩(wěn)定的充分條件,并得到了系統(tǒng)穩(wěn)定時采樣時間與反饋控制增益及通信拓撲圖的Laplacian 矩陣特征值之間的關(guān)系。
多機器人通訊的拓撲結(jié)構(gòu)是用圖論來描述的。文獻[10]中介紹了針對多機器人系統(tǒng)描述的圖論知識,有向圖G(V(G),E(G))由兩個集合構(gòu)成,V(G)和E(G)分別為兩個集合,頂點的集合V(G)表示為V(G)={V1,V2,…,VN},共有N 個頂點,邊的集合E(G)表示為E(G)={(Vi,Vj),Vi,Vj∈V(G)},邊數(shù)由具體的個體關(guān)系確定。每一條邊是由兩個頂點Vi,Vj確定的,表示有向線段(Vi,Vj)從頂點Vi指向頂點Vj,并且這條邊與從頂點Vi指向頂點Vj的有向線段(Vi,Vj)不存在關(guān)聯(lián)。一個圖中,如果同時存在從頂點Vi指向頂點Vj的有向線段(Vi,Vj)和從頂點Vj指向頂點Vi的有向線段(Vj,Vi),則該圖被稱為是無向的或者是對稱的。
如果在一個圖中,至少存在一個頂點,它能夠通過有向路徑到達任意其他頂點,那么稱這個有向圖包含有向生成樹,一個圖的有向生成樹是一個包含圖中所有頂點的有向樹。在一個p 頂點的圖中,其附加權(quán)重的鄰接矩陣A 被定義為
式中:Rp×p為p ×p 維的實數(shù)矩陣的集合;aij為矩陣A中第i 行,第j 列的元素,i,j∈{1,2,…,p};邊集的元素(j,i)∈E(G)。圖的類型不同,其中的元素具有不同的特點。當該圖為有向圖時,鄰接矩陣A 的對角元素aii=0 且aij>0。當該圖為無向圖時,鄰接矩陣A 的對角元素aii=0 且aij=aji>0。
此外,Laplacian 矩陣L 可表示為
式中,lij為矩陣L 中第i 行,第j 列的元素,i,j∈{1,2,…,p},并且對角元素,非對角元素lii= -aij。當矩陣L 表達一個圖,滿足
特別地,有別于有向圖,只有無向圖的Laplacian 矩陣是對稱半正定的。
在領(lǐng)航者模式下,考慮如下多智能體系統(tǒng)
其中,領(lǐng)航者(假定為1#機器人)的運動狀態(tài)為
考慮整體表達系統(tǒng),當前的多機器人動力學系統(tǒng)為二階離散系統(tǒng),即
式中:X(k)為在k 時刻的機器人位置狀態(tài)信息向量;V(k)為在k 時刻的機器人速度狀態(tài)信息向量;U(k)為在k 時刻的機器人激勵信息向量;T 為整個機器人的系統(tǒng)中狀態(tài)更新的周期。
通過控制激勵信息影響不同時刻的機器人速度狀態(tài)信息,利用動力學連續(xù)系統(tǒng)的方程,經(jīng)過零階保持器離散化[11],獲得機器人的位置狀態(tài)信息與機器人速度狀態(tài)信息、激勵信息的關(guān)系,得到機器人的動力學二階離散系統(tǒng)模型。這種模型相比動力學一階離散系統(tǒng)模型對機器人狀態(tài)描述更加精確,狀態(tài)信息也更為豐富[12]。相比二階連續(xù)系統(tǒng)模型更容易在現(xiàn)有平臺上實現(xiàn)。
本文研究的目的是考察在領(lǐng)航者模式下多機器人的一致性收斂問題,機器人之間的通信拓撲關(guān)系是固定的,信息交互是不平衡有向的。
引理1[13]實對稱矩陣的特征值都是實數(shù)。
引理2[10]假設(shè)Z 為一個p 維的列向量,Z 中的元素都是實數(shù)域中的,L 為一個p ×p 的實矩陣(L 為Laplacian 矩陣),那么它存在4 個等價條件:1)L 含有單個0 特征值,并且它的特征向量是p 維的1n向量,其他的特征均為正數(shù)或者是正的實部;2)若存在Z,使得LZ =0,那么Z 向量中各個元素都相等;3)系統(tǒng)= -LZ,則該系統(tǒng)是漸近穩(wěn)定的一致性系統(tǒng);4)用L表達的有向圖包含一條有向生成樹。
在領(lǐng)航者模式下,領(lǐng)航者發(fā)布信息,跟隨者接收信息。不妨令第一個機器人為領(lǐng)航者,其他為非領(lǐng)航者。在本文研究中,暫不考慮領(lǐng)航者自身的運動變化,假設(shè)其速率的變化是一個定常值。
那么,參考許多學者在研究一致性問題中[9]針對文獻中連續(xù)時間系統(tǒng)模型,采用零階保持器進行時間采樣,考慮各個機器人具有剛性間隔,附加期望的隊形,參考文獻[14]的研究,整合單個機器人的一致性協(xié)議,在領(lǐng)航者模式下的多機器人編隊控制,針對固定拓撲結(jié)構(gòu),一致性協(xié)議為
式中:1n為單位列向量;Id為d 階單位陣;共有n 個機器人,每個機器人包含d 維的位置信息和速度信息,總稱X(k)和V(k);?為矩陣的Kronecker 積運算;Laplacian 矩陣L 表達多機器人的通訊拓撲關(guān)系;定常向量P 為多機器人的相對位置;ud(k)表達的是領(lǐng)航者自身的運動學約束;α 為一致性協(xié)議中相對位置控制參數(shù);γ 為一個增益系數(shù),它和α 共同構(gòu)成的參數(shù)αγ 是一致性協(xié)議中相對速度控制參數(shù),該形式能夠簡化多機器人一致性協(xié)議的矩陣表達。
臨時建立表征狀態(tài)信息的一組變量,令
式中:向量P 為期望的隊形位置;xd(k)和vd(k)分別為在k 時刻理想狀態(tài)下編隊中心的位置和速度。
結(jié)合式(6),根據(jù)上述協(xié)議,列寫一致性協(xié)議下的機器人狀態(tài)變化方程,化簡整理,得
Research on Common Generation Type of Wave Energy and Ocean Current Energy in Conjunction with Wind Power Generation ZHANG Yiqiang(60)
定理1 若對任意B0和D0,存在,其中,1nd為nd 維的全1 列向量,yB為某nd 維列向量,那么,在一致性協(xié)議(7)的作用下,實現(xiàn)
定理2 包含生成樹的有向圖中,設(shè)Φ1=(2 -Tα)Ind-(γ+T/2)TL*,Φ2=(Tα-1)Ind+(γ-T/2)TL*,如果Φ1和Φ2為非負矩陣,且各主對角元素大于零,那么成立。
證明 已知k+1 時刻與k 時刻,k 時刻與k-1 時刻之間的方程(兩式相似)為
兩式相互迭代,可求出Bk的前向變化方程,進而推導(dǎo)出
按照上述Φ1和Φ2的定義
下面尋求α,γ,T 的范圍,使得Φ1非負。
對形如(C1Ind- C0L)的矩陣,其中,C0∈R,C1∈R,令dm=max(Li,j),當且僅當C1≥0,C0>C1dm,矩陣(C1Ind-C0L)為非負矩陣且主對角線元素不為零。其中,L 為有向圖的Laplacian 矩陣。結(jié)合Φ1,Φ2的定義,列寫α,γ 和T 的范圍
即,當α,γ 和T 在所求的范圍內(nèi),Φ1和Φ2就是非負的,進而成立,包含生成樹的有向圖拓撲結(jié)構(gòu)的多機器人就能實現(xiàn)漸近一致到期望隊形。
應(yīng)用仿真實驗驗證文中算法的正確性,設(shè)置一個由6 個機器人Ri組成的系統(tǒng),位置信息用xi=(xix,xiy,θi)T表達,速度信息用vi=(vix,viy,ωi)T表達,其中,xix,xiy,θi分別表示機器人Ri在全局坐標系下x 方向位移、y 方向位移和轉(zhuǎn)動角度,vix,viy,ωi為機器人Ri在全局坐標系下x 方向速度、y 方向速度和轉(zhuǎn)動角速度。
初始化仿真參數(shù)如表1 所示。
機器人期望的編隊隊形是正六邊形,初始位置、初始速度隨機設(shè)置。期望編隊的幾何隊形及通信拓撲圖如圖1 所示。
表1 仿真參數(shù)Table 1 Parameters of simulation
圖1 機器人隊形和通信拓撲Fig.1 Formation and communication topology of multi-robot system
通信拓撲圖的Laplacian 矩陣L 為
算例1 如圖2 ~圖4 所示,在該情況下,取采樣時間T=0.1 s,在收斂解區(qū)域中選取合適的控制參數(shù)α=1,γ =1,期望速度為vd=(0.1,0.1,0)T。該組機器人的運動軌跡如圖2 所示。
圖2 一組機器人在T=0.1 s,α=1,γ=1時的運動軌跡Fig.2 Trajectory of a group of robots when T=0.1 s,α=1 and γ=1
在各個時刻,各個機器人在x 方向和y 方向的位移和速度的變化曲線分別如圖3 和圖4 所示。由此可以證實,在求取的收斂解區(qū)域中選取控制參數(shù),領(lǐng)航者模式下的一組機器人能夠收斂到期望隊形,速度也能夠收斂到期望值vd=(0.1,0.1,0)T。
圖3 x 方向和y 方向的位置變化曲線Fig.3 Curve of position change in x and y direction
圖4 x 方向和y 方向的速度變化曲線Fig.4 Curve of velocity change in x and y direction
本文針對在領(lǐng)航者模式下的多機器人編隊控制穩(wěn)定性問題,從一致性角度,分析了離散時間編隊控制穩(wěn)定和狀態(tài)收斂性的條件,提出一種保持機器人編隊穩(wěn)定的控制方法。該方法在Lyapunov 意義下的離散時間多機器人系統(tǒng)一致性穩(wěn)定的充分條件和反饋控制參數(shù)的收斂解區(qū)域,為設(shè)計控制器提供了依據(jù)。最后通過一組算例的Matlab 仿真,表明本文提出的控制方法的有效性和正確性。
[1] 柳林.多機器人系統(tǒng)任務(wù)分配及編隊控制研究[D].長沙:國防科學技術(shù)大學,2006.(LIU L.Research on multirobot system task allocation and formation control[D].Changsha:National University of Defense Technology,2006.)
[2] LI Z J,LI J X,KANG Y. Adaptive robust coordinated control of multiple mobile manipulators interacting with rigid environments[J]. Automatica,2010,46(12):2028-2034.
[3] ABDESSAMEUD A,TAYEBI A. Formation control of VTOL unmanned aerial vehicles with communication delays[J].Automatica,2011,47(11):2383-2394.
[4] BEARD R W,LAWTON J,HADAEGH F Y. A coordination architecture for spacecraft formation control[J].IEEE Transactions on Control Systems Technology,2001,9(6):777-790.
[5] SMITH R S,HADAEGH F Y. Control of deep-space formation-flying spacecraft:relative sensing and switched information[J]. Journal of Guidance,Control and Dynamics,2009,28(1):106-114.
[6] REN W,BEARD R. Consensus seeking in multiagent systems under dynamically changing interaction topologies[J]. IEEE Transactions on Automatic Control,2005,50(5):655-661.
[7] SU H S,CHEN G R,WANG X F,et al. Adaptive secondorder consensus of networked mobile agents with nonlinear dynamics[J]. Automatica,2011,47(2):368-375.
[8] LI Z K,LIU X D,LIN P,et al. Consensus of linear multiagent systems with reduced-order observer-based protocols[J]. Systems & Control Letters,2011,60(7):510-516.
[9] 李建禎.多智能體系統(tǒng)一致性若干問題研究[D]. 南京:南京理工大學,2011.(LI J Z. Some researches on consensus problems of multi-agent systems[D]. Nanjing:Nanjing University of Science and Technology,2011.)
[10] REN W. Multi-vehicle consensus with a time-varying reference state[J]. Systems & Control Letters,2007,56(7/8):474-483.
[11] FRANKLIN G F,POWELL J D,WORKMAN M L.Digital control of dynamic systems[M]. 3rd ed. MA:Addison Wesley,1997.
[12] 鄭軍,顏文?。活惙植际疥犘慰刂萍捌浞€(wěn)定性分析[J].自動化學報,2008,34(9):1107-1112.(ZHENG J,YAN W J. A distributed formation control algorithm and stability analysis[J].Acta Automatica Sinica,2008,34(9):1107-1112.)
[13] 程云鵬,張凱院,徐仲.矩陣論[M].3 版.西安:西北工業(yè)大學出版社,2006.(CHENG Y P,ZHANG K Y,XU Z.The theory of matrices[M]. 3rd ed. Xi'an:Northwestern Polytechnical University Press,2006.)
[14] REN W. Consensus based formation control strategies for multi-vehicle systems[C]//Proceedings of the American Control Conference Minneapolis,Minnesota,USA,2006:4237-4243.