摘 要 針對具有外部擾動和非線性動力學的二階領導者-跟隨者多智能體系統(tǒng)的有限時間一致性問題,提出一種全分布式自適應遞歸終端滑??刂扑惴?。首先,在避免奇異性的基礎上,提出一種新的自適應算法,有效克服了多智能體系統(tǒng)中常見的控制器抖動現(xiàn)象;然后,用神經(jīng)網(wǎng)絡估計系統(tǒng)中未知的非線性動力學,使控制器不再需要已知精確的模型信息。最后,用仿真算例驗證了該算法的優(yōu)越性,算法結構簡單,不包含任何圖論信息和模型信息,具有一定的通用性。
關鍵詞 遞歸終端滑??刂?神經(jīng)網(wǎng)絡 多智能體系統(tǒng) 自適應算法
中圖分類號 TP18" "文獻標志碼 A" "文章編號 1000-3932(2024)06-0965-08
多智能體系統(tǒng)具有較高的物理可實現(xiàn)性,在無人機[1]、智能機器人編隊[2]、無人船[3]等領域應用廣泛。具有代表性的多智能體控制問題是指每個智能體只與相鄰的智能體交互,使整個群體相互協(xié)調,最終達到共同目標。隨著研究的深入,多智能體系統(tǒng)的魯棒性和非線性控制問題成為一個重要的研究方向。
滑模變結構控制方法具有較強的抗干擾特性并易于物理實現(xiàn),因此越來越多的學者通過引入滑模算法來提高多智能體全系統(tǒng)的魯棒性,并取得了豐碩的成果[4~6]。與傳統(tǒng)的一階滑模相比,高階滑模不僅在收斂速度上具有優(yōu)勢[7],而且可以顯著提高系統(tǒng)的穩(wěn)態(tài)精度[8]。因此,引入高階滑??商岣叨嘀悄荏w系統(tǒng)的整體性能。針對多智能體跟蹤問題,文獻[9]提出非奇異終端滑??刂扑惴ǎ稍谟邢迺r間內將跟蹤誤差控制在零的較小鄰域,但算法未考慮外部擾動,并且需要假定系統(tǒng)的非線性動力學完全已知。文獻[10]研究了具有不確定動力學和有界外部擾動的二階多智能體系統(tǒng)的一致跟蹤控制問題,但整個系統(tǒng)只能保證局部有限時間收斂,且需要知道擾動上界。文獻[11]研究了具有未知擾動上界的高階非線性系統(tǒng)的自適應協(xié)同跟蹤控制,考慮了未知擾動上界和未知系統(tǒng)動態(tài)狀態(tài),并保證系統(tǒng)在有限時間內達到穩(wěn)定階段,然而該算法控制輸入的峰值較高,控制器在穩(wěn)態(tài)后會抖動?;谝陨嫌懻?,筆者提出一種新的自適應終端滑模控制算法,算法考慮了系統(tǒng)未知非線性動力學和未知擾動上界,以期有效克服多智能體控制器中常見的抖振現(xiàn)象;利用神經(jīng)網(wǎng)絡對系統(tǒng)的非線性動力學進行估計,使控制器不再依賴精確的模型信息,從而提高算法的通用性。
1 圖論
設通信拓撲圖G=(V,ε,A),G的節(jié)點集合V={1,2,…,n},G的邊集ε?奐V×V。考慮用有序節(jié)點
(i,j)描述邊,表示節(jié)點i可以向節(jié)點j發(fā)送信息,節(jié)點j也稱為節(jié)點i的鄰節(jié)點。鄰接矩陣A=[a■]表示節(jié)點與邊之間的關系,(i,j)∈ε,a■>0,如果a■=0則表示節(jié)點i和節(jié)點j之間沒有路徑,即無數(shù)據(jù)交換。G的拉普拉斯量L=D-A,其中D為度矩陣且有D=diag{d■,d■,…,d■},d■=■a■。
本研究中,假設拓撲圖G=(V,ε,A)表示由n+1個智能體組成的Leader-Follower多智能體系統(tǒng)的通信拓撲圖,其中,V=V∪{0},0表示領導者;拓撲圖G是G的一個子拓撲圖,表示所有追隨者之間的通信拓撲結構;ε?奐V×V是圖論G的邊集;A表示節(jié)點與邊之間的關系。輸入矩陣B=diag{b■,b■,…,b■},如果領導者將位置、速度等信息發(fā)送給跟隨者i,則b■=1;如果跟隨者沒有接收到信息,則b■=0。圖論矩陣H=L+B,表示整個多智能體系統(tǒng)的通信信息。
2 系統(tǒng)描述
考慮如下多智能體系統(tǒng):
■■=v■■■=f■(x■,v■)+η■(x■)u■+d■,i=0,1,2,…,n(1)
其中,x■∈R■表示第i個智能體的位置,■■和
v■∈R■表示第i個智能體的速度,v■是x■的一階導數(shù),■■表示第i個智能體的加速度;f■(x■,v■)∈R■表示智能體本身的未知非線性特征;η■(x■)∈R■表示控制器增益,且η■(x■)是一個非奇異矩陣;u■∈R■表示第i個智能體的控制輸入;d■表示有界的外部未知擾動。
式(1)描述了擁有一個領導者(i=0)和多個跟隨者(i=1,2,…,n)的二階多智能體系統(tǒng)。
本研究的控制目標是提出一個多智能體系統(tǒng)的自適應遞歸終端滑??刂扑惴?,保證系統(tǒng)狀態(tài)通過無抖振的方式在固定時間內收斂。
假設1[12] 外部擾動d■是有界且未知的。
假設2[13] 拓撲圖G包含一個以根節(jié)點為領
導節(jié)點的生成樹。
引理1[14] 當且僅當假設2成立時,圖論矩陣H是半正定的,并且具有正實特征值。
3 控制方案設計
3.1 多智能體動態(tài)模型
本地相鄰節(jié)點的狀態(tài)一致性誤差可寫為:
e■=■a■(x■-x■)+b■(x■-x■)e■=■a■(v■-v■)+b■(v■-v■)(2)
其中,N為自然數(shù);x■和v■分別表示領導者的位置和速度。因此,整個多智能體系統(tǒng)的一致性誤差可表示為:
e■=(H?茚I)θ■∈R■e■=(H?茚I)θ■∈R■(3)
θ■=(θ■■,θ■■,…,θ■■)■∈R■θ■=(θ■■,θ■■,…,θ■■)■∈R■θ■=x■-x■∈R■θ■=v■-v■∈R■(4)
其中,I為單位矩陣;?茚表示克羅內克積;θ■和θ■分別為第i個跟隨者與領導者之間的位置誤差和速度誤差;θ■和θ■分別為θ■和θ■的集合。
記Z■=H?茚I,Z■=Z■■。那么,多智能體系統(tǒng)的誤差動態(tài)模型為:
■■=e■Z■■■=-■+F+ηu+d(5)
其中,e■和e■分別為diag(e■,e■,…,e■)■和
diag(e■,e■,…,e■)■;X=(x■,x■,…,x■)■∈R■,且X二階連續(xù)可導,其二階導數(shù)記作■。F=(f■,f■,…,
f■)■∈R■表示系統(tǒng)的未知非線性特性。η、u、d分別表示整個系統(tǒng)的增益、控制輸入、外部擾動的集合。
3.2 神經(jīng)網(wǎng)絡
神經(jīng)網(wǎng)絡具有非線性擬合能力強、學習規(guī)則簡單、魯棒性強、易于物理實現(xiàn)等特點,因此在非線性控制領域廣泛應用。
本研究采用神經(jīng)網(wǎng)絡對未知非線性f■進行近似,f■可表示為:
f■=W■■φ■(X■)+ε■(6)
其中,W■為理想的神經(jīng)網(wǎng)絡權重;φ■為激活函數(shù);X■為系統(tǒng)狀態(tài)的集合;ε■為近似誤差。
激活函數(shù)選擇高斯函數(shù):
φ■=exp■,z=1,2,…,p(7)
其中,■和ξ表示高斯函數(shù)中需要設計的參數(shù);p為節(jié)點i的神經(jīng)元數(shù)量。
那么,神經(jīng)網(wǎng)絡的估計值■■為:
■■=■■■φ■(8)
其中,■■表示W(wǎng)■的估計值。
神經(jīng)網(wǎng)絡權值更新規(guī)律設計如下:
■■=r■s■φ■(X■)-r■μ■■■(9)
其中,s■為待設計的遞歸終端滑模變量;κ表示向量■■中的第κ個元素;r■和μ■表示神經(jīng)網(wǎng)絡的權重更新率,而且r■和W■可整理為矩陣r和W:
r■=diag(r■I■,r■I■,…,r■I■)r=diag(r■,r■,…,r■)W■=(W■,W■,…,W■)■W=(W■,W■,…,W■)■(10)
3.3 控制器設計
考慮如下快速非奇異終端滑模變量:
ρ■=■■+k■e■+k■sig(e■)■(11)
其中,k■、k■和α■表示第i個智能體的滑模變量參數(shù);sig(e■)■=|e■|■sign(e■),sign(·)為符號函數(shù)。
那么,遞歸終端滑模變量可表示為:
s■=ρ■+k■ χ■(12)
其中,χ■的一階導數(shù)滿足等式■■=sig(ρ■)■,k■和β■表示第i個智能體的滑模變量參數(shù)。
將k■、k■、k■分別整理為k■、k■、k■:
k■=diag{k■I,k■I,…,k■I}∈R■k■=diag{k■I,k■I,…,k■I}∈R■k■=diag{k■I,k■I,…,k■I}∈R■(13)
那么,整個多智能體系統(tǒng)的遞歸終端滑模變量可寫為:
ρ=■■+k■e■+k■ sig(e■)■s=ρ+k■χ(14)
其中,ρ、α、s、 χ分別為ρ■、α■、s■、 χ■的集合。
遞歸終端滑模變量s的導數(shù)為:
■=■■+k■■■+σ+k■■(15)
其中,σ的表達式如下:
σ■=(k■α■|e■|■e■,k■α■|e■|■e■,…,k■α■|e■|■e■)■σ=(σ■■,σ■■,…,σ■■)(16)
定義如下變量:
?諄=Z■(σ+k■■■+k■■)(17)
?準=ε+?諄+d-■■(18)
如果將■■記為?準■=(ε■+?諄■+d■-■■)的估計值,那么自適應更新律可以設計為:
■■=τ■|s■|-τ■μ■■■(19)
其中,τ■和μ■為需要設計的參數(shù),記為:
τ=diag(τ■,τ■,…,τ■)∈R■(20)
那么,可以得到整個多智能體系統(tǒng)的自適應更新律:
■=τ|s|-τμ■■(21)
選擇一個正常數(shù)δ為邊界層,自適應律可以寫為:
u■=sign(s■)■■,■>1■|■■|" ,■≤1(22)
那么,可以得到u■為:
u■=(u■,u■,…,u■)■(23)
綜上,節(jié)點i的控制策略可以寫為:
u■=η■■(-■■-μ■ s■-u■)(24)
其中,μ■>0為需要設計的參數(shù)。
引理2[15] 對于本文所考慮的多智能體系統(tǒng)(1),在假設1和假設2成立的前提下,控制策略(24)將保證整個系統(tǒng)在有限時間內收斂,且滑模變量s■將收斂到下式:
|s■|≤■(25)
其中,π■和π■為需要設計的參數(shù),且滿足如下不等式:
0<π■<10<π■<■(26)
4 仿真分析
為了說明上述控制方法的有效性,筆者用文獻[10]中的二階多智能體非線性系統(tǒng)作為仿真對象,其動態(tài)模型簡化如下:
■■=v■■■=f■(x■,v■)+η■u■+d■(27)
未知的非線性動力學可描述為:
f■(x■,v■)=4x■sin(0.25π+0.5v■)f■(x■,v■)=4x■cos(0.5v■)(28)
跟隨者的初始狀態(tài)為:
x■(0)=(0.3,0.2)■,v■(0)=(0,-0.1)■x■(0)=(0.1,0.1)■,v■(0)=(0.3,0.2)■x■(0)=(-1.8,1.4)■,v■(0)=(-0.1,-0.1)■x■(0)=(0.4,0.5)■,v■(0)=(0.2,0.3)■x■(0)=(-0.1,-0.5)■,v■(0)=(0.1,-0.2)■(29)
領導者的變化軌跡為:
x■(t)=(0.5sin t,0.5cos t)■v■(t)=(0.5cos t,-0.5sin t)■(30)
遞歸終端滑模變量s■=(s■,s■)■,外部未知擾動選擇d■=(0.1sin t,0.1cos t)■。此外,系統(tǒng)狀態(tài)x■=
(x■,x■)■,v■=(v■,v■)■,控制輸入u■=(u■,u■)■,擾動d■=(d■,d■)■。
仿真中的相關參數(shù):μ■=10,π■=0.2,π■=0.005,τ■=11,μ■=0.008,η■=I■,其中I■表示二階單位矩陣。
神經(jīng)網(wǎng)絡輸入X■=[s■,■■)■,r■=60,高斯函數(shù)的參數(shù)c■=-1.0,-0.5,0,0.5,1.0-1.0,-0.5,0,0.5,1.0■,b■=8.6。遞歸終端滑模變量的參數(shù)k■=1.4,k■=0.1,k■=2,α■=1.8,
β■=0.8。
考慮以領導者為根節(jié)點的多智能體無向通信拓撲圖如圖1所示,則矩陣L和B為:
L=" 2?搖?搖 -1?搖?搖" "0?搖?搖" " 0?搖?搖" -1-1?搖?搖" 2?搖?搖" -1?搖?搖" " 0?搖?搖" " 0" 0?搖?搖 -1?搖?搖" "2?搖?搖" -1?搖?搖" " 0" 0?搖?搖" "0?搖?搖" -1?搖?搖" "2?搖?搖" -1-1?搖?搖" "0?搖?搖" "0?搖?搖" -1?搖" "?搖 2(31)
B=1?搖?搖" 0?搖?搖" 0?搖?搖" 0?搖?搖" 00?搖?搖nbsp; 0?搖?搖" 0?搖?搖" 0?搖?搖" 00?搖?搖" 0?搖?搖" 0?搖?搖" 0?搖?搖" 00?搖?搖" 0?搖?搖" 0?搖?搖" 0?搖?搖" 00?搖?搖" 0?搖?搖" 0?搖?搖" 0?搖?搖" 0(32)
在筆者控制方法的作用下,控制律u■和u■的變化曲線如圖2所示,可以看出筆者方法沒有明顯的控制器抖動。
圖3為每個智能體的跟蹤軌跡變化曲線,可以看出每一個跟隨者經(jīng)過短暫的調節(jié)過程后都能夠與領導者的變化保持一致。
圖4為跟隨者的位置跟蹤誤差和速度跟蹤誤差,位置跟蹤誤差在穩(wěn)定10 s后能夠達到10-5數(shù)量級,速度跟蹤誤差能夠達到10-4數(shù)量級,說明筆者算法有很高的控制精度,跟蹤誤差能夠很快收斂。
自適應更新律的曲線變化如圖5所示,由于系統(tǒng)穩(wěn)定后,神經(jīng)網(wǎng)絡的預測誤差很小,為了直觀地看出自適應律在該方法中起到的作用,令D=?諄+d-■0。
圖6展現(xiàn)了神經(jīng)網(wǎng)絡對系統(tǒng)非線性動力學估計的效果,其中?資=1,2,可以看出,隨著系統(tǒng)的自適應調整,神經(jīng)網(wǎng)絡可以有效地近似系統(tǒng)的非線性動力學。
遞歸終端滑模變量的曲線變化如圖7所示,可以看出滑模變量能夠快速收斂。
圖8為?滋3對一致性誤差上界的影響,可以看出,適當放大?滋3的取值可以提高系統(tǒng)的整體性能。
5 結束語
針對一類二階領導者-跟隨者多智能體系統(tǒng),提出基于無向通信的自適應控制算法。該控制算法是一種完全分布式的控制算法,可以在不存在外部擾動上界的情況下解決控制器抖動問題,并且控制器不包含任何圖論信息。仿真結果表明,所提算法能夠保證多智能體系統(tǒng)在短時間內達到預期的軌跡和跟蹤性能。
參 考 文 獻
[1]" DONG X W,ZHOU Y,REN Z,et al.Time-Varying Formation Tracking for Second-Order Multi-Agent Systems Subjected to Switching Topologies with Application to Quadrotor Formation Flying[J].IEEE Transactions on Industrial Electronics,2017,64(6):5014-5024.
[2]" "KHOO S Y,XIE L H,MAN Z H.Robust Finite-Time Consensus Tracking Algorithm for Multirobot Systems[J].IEEE/ASME Transactions on Mechatronics,2009,14(2):219-228.
[3]" BAI W W, ZHANG W J, CAO L,et al. Adaptive Control for Multi-Agent Systems with Actuator Fault via Reinforcement Learning and Its Application on Multi-Unmanned Surface Vehicle[J].Ocean Enginee-ring,2023,280:114545.
[4]" "LI W,NIU Y G,CAO Z R,et al.Sliding Mode Control for Multi-Agent Systems under Stochastic Communication Protocol[J].International Journal of Robust and Nonlinear Control,2022,32(13):7522-7535.
[5]" "婁如思,王璐瑤,馬丹.二階非線性多智能體系統(tǒng)有限時間分布式優(yōu)化[J].控制理論與應用,2021,38(7):1015-1022.
[6]" "朱偉,周雙.基于終端滑??刂频亩嘀悄荏w系統(tǒng)有限時間跟蹤控制[J].重慶郵電大學學報(自然科學版),2023,35(4):696-705.
[7]" NI J K, WEN C Y, ZHAO Y.Fixed-Time Leader-Follower Quantized Output Consensus of High-Order Multi-Agent Systems over Digraph[J].Information Sciences,2022,587:408-434.
[8]" ZHANG Z C,ZUO Z Q,WANG Y J.Finite-Time Consensus of Neutrally Stable Multi-Agent Systems in the Presence of Input Saturation[J].Journal of the Franklin Institute-Engineering and Applied Mathemat-ics,2019,356(2):894-907.
[9]" "DONG L J,YU D Y,NGUANG S K.Novel Nonsingular Terminal Sliding Mode Control for Multi-Agent Tracking Systems with Application to Jerk Circuit[J].IEEE Transactions on Circuits and SystemsⅡ:Express Briefs,2020,67(8):1429-1433.
[10]" ZOU A M,KUMAR K D,HOU Z G.Distributed Consensus Control for Multi-Agent Systems Using Terminal Sliding Mode and Chebyshev Neural Networks[J].International Journal of Robust and Nonlinear Control,2013,23(3):334-357.
[11]" ZHANG H W,LEWIS F L.Adaptive Cooperative Tracking Control of Higher-Order Nonlinear Systems with Unknown Dynamics[J].Automatica,2012,48(7):1432-1439.
[12]" YU Z Y,YU S Z,JIANG H J,et al.Distributed Consensus for Multi-Agent Systems via Adaptive Sliding Mode Control[J].International Journal of Robust and Nonlinear Control,2021,31(15):7125-7151.
[13]" "ZHAO L, YU J P,LIN C, et al.Distributed Adaptive Fixed-Time Consensus Tracking for Second-Order Multi-Agent Systems Using Modified Terminal Sliding Mode[J].Applied Mathematics and Computation,2017,312:23-35.
[14]" "HU J P, FENG G. Distributed Tracking Control of Leader-Follower Multi-Agent Systems under Noisy Measurement[J].Automatica,2010,46(8):1382-1387.
[15]" "JIA C,SHANGGUAN X,ZHENG L.Dynamic bound-ary layer super-twisting sliding mode control algorit-hm based on RBF neural networks for a class of leader-follower multi-agent systems[J].International Journal of Robust and Nonlinear Control,2024,34(3):2109-2140.
(收稿日期:2024-02-28,修回日期:2024-10-21)
Adaptive Recursive Terminal Sliding Mode Control Algorithm Based on Multi-agent System
JIA Chao1, 2, WANG Hong-kun1, 2, SHANGGUAN Xuan-yue 1,2
(1.School of Electrical Engineering and Automation, Tianjin University of Technology;2. Tianjin Key Laboratory of Control Theory and Application for Complex Systems)
Abstract" "Aiming at the finite-time consensus of second-order leader-following multi-agent system with external disturbances and nonlinear dynamics, a fully-distributed adaptive recursive terminal sliding mode control algorithm was proposed, including having the avoiding singularity based to propose a new adaptive algorithm to overcome the controller’s vibration in multi-agent system; then, having the neural network employed to estimate unknown nonlinear dynamics in the system so that the controller needs to know the precise model information no longer; finally, making use of simulation example verify superiority of the algorithm. The results show that, this algorithm has a simple structure without any graph theory information and model information and has certain versatility.
Key words" "recursive terminal sliding mode control, neural network, multi-agent system, adaptive algorithm