丁 勐,陳 蓓
(上海工程技術大學 電子電氣工程學院,上海 201620)
多智能體系統(tǒng)(Multi-Agent Systems,MASs)由多個帶有自治性的智能體組成,其目標是將復雜系統(tǒng)構建成易于管理、智能體之間能夠進行通信和協(xié)調(diào)作業(yè)的系統(tǒng)。隨著網(wǎng)絡通信與控制技術的不斷進步與融合,多智能體系統(tǒng)已經(jīng)發(fā)展為復雜系統(tǒng)分析與模擬的重要思想方法與工具,研究內(nèi)容涉及智能體的目標、技能、規(guī)劃以及讓智能體之間采取協(xié)調(diào)一致的行動來完成任務。近年來,多智能體系統(tǒng)在編隊控制[1]、水下協(xié)同控制[2]以及無人機集群控制[3]等領域得到了廣泛應用。
一致性問題[4-8]是多智能體系統(tǒng)中協(xié)同控制領域的基本問題。為解決多智能體系統(tǒng)一致性問題,學者們提出多種控制方法,包括預測控制[9]、自適應控制[10]、模糊控制[11]以及滑??刂芠12]等。其中,滑??刂茟{借對外界干擾和參數(shù)不確定性的強魯棒性,在多智能體系統(tǒng)一致性問題中得到了學者的廣泛關注[13-15]。文獻[14]研究有向拓撲網(wǎng)絡中二階多智能體系統(tǒng)的固定時間一致性跟蹤問題,針對雙積分器多智能體系統(tǒng)設計了滑模面并在其基礎上構造非線性一致性協(xié)議。文獻[15]針對機器人多智能體系統(tǒng)的一致性跟蹤問題提出了一種基于投影遞歸神經(jīng)網(wǎng)絡的最優(yōu)滑??刂萍夹g。
在控制領域中,度是評價系統(tǒng)性能的一個重要指標。對于多智能體系統(tǒng)而言,實現(xiàn)有限時間一致性跟蹤具有顯著的實際意義。根據(jù)達成一致性的收斂速度,可分為漸進一致性[16]和有限時間一致性[17-19]。在文獻[20]搭建的多智能體系統(tǒng)中,當時間趨向無窮大時,一致性跟蹤誤差會根據(jù)設計的滑模控制律到達指定的滑模面,然后沿著滑模面移動,最終收斂到0。與漸進一致性相比,有限時間一致性要求系統(tǒng)的狀態(tài)在有限時間內(nèi)收斂到指定范圍。為確保有限時間一致性跟蹤,文獻[21]提出了一種分布式非奇異快速終端滑模方法來加快系統(tǒng)的收斂速度,并且給出了達到一致性的時間上界。
但是,上述工作大多基于理想的網(wǎng)絡通訊環(huán)境,即信息可以在智能體之間完整傳輸。實際上,在網(wǎng)絡通信下,不可避免地存在時滯和隨機干擾等因素的影響,難以保證理想的通信環(huán)境。近年來,信道衰落下多智能體系統(tǒng)的一致性問題開始受到關注。文獻[22]分別對不同數(shù)量智能體系統(tǒng)進行討論,建立信道衰落模型,根據(jù)固定拓撲下的仿真數(shù)據(jù)得到信道衰落對于多智能體系統(tǒng)一致性的影響。文獻[23]設計了一種分布式控制器以解決具有信道衰落現(xiàn)象的離散時間多智能體系統(tǒng)一致性問題。
本文針對信道衰落下二階多智能體系統(tǒng)的有限時間一致性控制問題,根據(jù)從鄰居智能體接收到的衰落數(shù)據(jù)得到一致性誤差函數(shù),構造非奇異終端滑模面,提出一種有限時間一致性控制策略。在該策略作用下,誤差函數(shù)的狀態(tài)將在有限時間到達并保持在所設計的滑模面上,最終實現(xiàn)多智能體系統(tǒng)的有限時間一致性跟蹤。
本文采用的數(shù)學符號:Rn和Rm×n分別表示n維的歐式空間和m×n的實矩陣集,?表示Kronecker積,sgn(x)表示符號函數(shù),符號|·|和‖·‖分別表示歐幾里得范數(shù)和向量范數(shù),1N=[1,1,…,1]T,0N=[0,0,…,0]T。
由一個領導者和N個跟隨者組成二階多智能體系統(tǒng),其動力學模型為
(1)
其中,xi(t)∈Rm、vi(t)∈Rm、ui(t)∈Rm、fi(t)∈Rm分別為第i個跟隨者的位置、速度、控制輸入和擾動;x0(t)∈Rm、v0(t)∈Rm、u0(t)∈Rm、f0(t)∈Rm分別為領導者的位置、速度、控制輸入和擾動。
假設1假設式(1)中的干擾fi(t)和f0(t)滿足Lipschitz條件(干擾上界μ為Lipschitz常數(shù))
‖fi(t)-f0(t)‖≤μ‖vi(t)-v0(t)‖
(2)
為了實現(xiàn)多智能體系統(tǒng)的有限時間一致性,定義第i個跟隨者的一致性誤差函數(shù)為
(3)
其中,ε1i(t)和ε2i(t)分別為跟隨者的跟蹤位置和速度誤差狀態(tài)變量;aij為鄰接矩陣A中的一個元素;領導者的度矩陣hi決定了領導者和跟隨者i之間是否有信息交互,hi>0說明跟隨者i可以接收領導者發(fā)送的信息。
將一致性跟蹤誤差簡化為緊湊形式
(4)
H?diag(h1,h2,…,hN)。
對式(4)求導得到
(5)
由于時滯、隨機噪聲等干擾因素的影響,信息在跟隨者之間傳輸不可避免地受到信道衰落影響??紤]到追隨者之間傳輸信號的振幅大小可能受到隨機干擾,網(wǎng)絡信道可以視為具有增益的連續(xù)信道。
假設2本文考慮的信道衰落現(xiàn)象只發(fā)生在跟隨者的信息交互中,假設領導者和跟隨者之間的信息傳遞過程中不存在衰落現(xiàn)象。
考慮如下衰落模型
(6)
基于式(6)的信道衰落模型,推出式(3)為
(7)
其中,Λ1(t)?diag(0,φ12(t),…,φ1N(t)),…,ΛN(t)?diag(φN1(t),φN2(t),…,0)。
(8)
引理1[24]如果有向圖G存在有向生成樹,則矩陣L+H可逆。
引理2Cp不等式:假設存在實數(shù)a、b和p,且p>0,則滿足
(|a|+|b|)p≤Cp(|a|p+|b|p)
(9)
其中,Cp的值滿足
(10)
(11)
其中,0<β<1,c>0。則非線性函數(shù)f(x)是局部有限時間穩(wěn)定,并給出關于初始狀態(tài)x0的有限時間上界
(12)
第i個智能體的滑模面函數(shù)設計為
(13)
其中,c和α均為標量且c>0,1<α<2。
將式(12)化簡為緊湊形式
(14)
(15)
根據(jù)式(5)和式(15),得到式(14)導數(shù)如下所示。
(16)
由于信道衰落現(xiàn)象,智能體之間無法進行正常的信息交互,第i個跟隨者無法從其他跟隨者處接收到準確完整的信息,則信道衰落下的滑模面函數(shù)為
(17)
將式(17)改寫為緊湊形式
(18)
設計滑模控制器如下所示。
(19)
本文提出了基于終端滑模控制的有限時間一致控制算法。在此控制算法下,多智能體的跟蹤誤差量可以在有限時間內(nèi)到達設計的非奇異終端滑模面上,并沿著滑模面趨于穩(wěn)定,保證多智能體系統(tǒng)的有限時間一致性。
本文基于構造的非奇異終端滑??刂坡?借助Lyapunov函數(shù)方法分析在信道衰落現(xiàn)象下多智能體系統(tǒng)的一致性和可達性。
定理1考慮多智能體系統(tǒng)在信道衰落下,滑模控制器能夠保證非奇異終端滑模面可達性。
證明構造Lyapunov函數(shù)
(20)
對式(20)求導得
(21)
根據(jù)式(19),得
(22)
由假設1,可知
‖f(t)-1N?f0(t)‖≤(‖fi(t)-1N?f0(t)‖),…,
(‖fN(t)-1N?f0(t)‖)≤
‖(μ‖vi(t)-1N?v0(t)‖),…,
(μ‖vN(t)-1N?v0(t)‖)≤
μ|‖(L+H)-1?ε2(t)‖
(23)
因此,由式(23)進一步推出式(22)如下所示。
(24)
對式(24)兩邊取數(shù)學期望,可得
(25)
根據(jù)上述關系式,代入式(25)可得
(26)
定理2考慮多智能體系統(tǒng)在信道衰落現(xiàn)象下,本文設計的滑模函數(shù)和滑模控制律能夠保證多智能體系統(tǒng)的有限時間一致性。
證明構造Lyapunov函數(shù)
(27)
對其求導可得
(28)
當s(t)=0時,推出
(29)
根據(jù)式(29)和Cp不等式(引理2),有
(30)
由式(30),可得
(31)
由1個領導者和4個跟隨者組成二階多智能體系統(tǒng),其中智能體之間的通信拓撲如圖1所示。
圖1 多智能體系統(tǒng)的通信拓撲Figure 1. Communication topolopy of MASs
在圖1中,實線表示跟隨者之間的信息交互方向,且不存在信道衰落現(xiàn)象,信息可以完整傳遞,虛線表示跟隨者之間的信息交互方向且存在信道衰落現(xiàn)象,信息傳遞過程中幅值衰減。假設智能體之間的鄰接權值為1。
根據(jù)跟隨者和領導者之間的拓撲結構可以得到該多智能體系統(tǒng)的鄰接矩陣A、領導者的入度矩陣B和拉普拉斯矩陣L。
領導者的控制輸入為u0=[cos(t),sin(t)]T,滑??刂破髦械膮?shù)設計為c=1.0,k=0.1,α=1.5,擾動參數(shù)μ=0.1。領導者的初始位置和速度狀態(tài)量為x0=[10,-10]T,v0=[10,-10]T,跟隨者的位置和速度的初始值為:x1=[10,-2]T,v1=[20,-2]T,x2=[15,15]T,v2=[20,3]T,x3=[25,5]T,v3=[15,0]T,x4=[45,15]T,v4=[35,0]T。
仿真結果如圖2~圖5所示。其中,圖2為多智能體系統(tǒng)在指定的滑模面和滑??刂坡上碌臓顟B(tài)軌跡曲線。從圖2可以看出,跟隨者(i=1,2,3,4)可以準確地跟蹤領導者,多智能體系統(tǒng)一致性達成。
圖2 多智能體的狀態(tài)軌跡Figure 2. State trajectories of the multi-agents
圖3和圖4分別顯示了每個跟隨者的位置誤差和速度誤差函數(shù)軌跡曲線。其中,上標e1iq和e2iq分別為第i個跟隨者的第q個狀態(tài)量的位置和速度誤差曲線。從圖3和圖4可以看出,位置誤差和速度誤差在有限時間內(nèi)收斂。觀察跟隨者3和跟隨者4,可以看出其位置誤差和速度誤差函數(shù)軌跡在收斂的過程中動態(tài)性能差于跟隨者1和跟隨者2,這是由于在信道衰落現(xiàn)象的影響下,跟隨者3和跟隨者4只能接收跟隨者1和跟隨者2發(fā)送的衰落信息,而跟隨者1和跟隨者2可以接受領導者的準確信息。圖5為跟隨者的滑模函數(shù)s(t)狀態(tài)軌跡,其中,上標siq為第i個跟隨者的第q個狀態(tài)量的滑動變量曲線。其中,跟隨者3和跟隨者4的軌跡表明,雖然由于信道衰落影響下產(chǎn)生的震蕩現(xiàn)象影響了跟隨者3和跟隨者4一致性達成的收斂過程,但本文設計的分布式滑??刂扑惴ㄈ阅芸朔诺浪ヂ鋵ο到y(tǒng)的影響,最終多智能體系統(tǒng)的有限時間一致性得以保證。
圖3 跟隨者的位置誤差(a)跟隨者1的位置誤差 (b)跟隨者2的位置誤差 (c)跟隨者3的位置誤差 (d)跟隨者4的位置誤差 Figure 3. Position error of the followers(a)Position error of the followers 1 (b)Position error of the followers 2 (c)Position error of the followers 3 (d)Position error of the followers 4
圖4 跟隨者的速度誤差(a)跟隨者1的速度誤差 (b)跟隨者2的速度誤差 (c)跟隨者3的速度誤差 (d)跟隨者4的速度誤差 Figure 4. Velocity error of the followers(a)Velocity error of the followers 1 (b)Velocity error of the followers 2 (c)Velocity error of the followers 3 (d)Velocity error of the followers 4
圖5 跟隨者的滑動變量(a)跟隨者1的滑動變量 (b)跟隨者2的滑動變量 (c)跟隨者3的滑動變量 (d)跟隨者4的滑動變量 Figure 5. Sliding variables of the followers(a)Sliding variables of the followers 1 (b)Sliding variables of the followers 2 (c)Sliding variables of the followers 3 (d)Sliding variables of the followers 4
本文針對信道衰落下的二階多智能體系統(tǒng)有限時間一致性跟蹤問題提出了基于滑模控制的分布式控制算法。根據(jù)智能體的拓撲結構搭建了數(shù)學模型,基于誤差函數(shù)設計一致性協(xié)議將系統(tǒng)的一致性問題轉化為誤差系統(tǒng)的穩(wěn)定性問題。在此基礎上,構造合適的Lyapunov函數(shù),證明了滑模面有限時間可達性和多智能體系統(tǒng)的穩(wěn)定性。最后,通過仿真實驗可以看出該多智能體系統(tǒng)能夠達成一致性,且過程中各智能體的動態(tài)性能存在顯著差異,這是由信道衰落現(xiàn)象所引起的。