陳世明 姜根蘭 張 正
多智能體系統(tǒng)控制在近些年發(fā)展迅速,廣泛應用于無人機編隊、傳感器網(wǎng)絡、機械臂裝配、多導彈聯(lián)合攻擊等領域.一致性作為協(xié)同控制的基礎,成為多智能體系統(tǒng)研究中的核心問題.近年來,學者們針對多智能體系統(tǒng)不同類型的一致性問題進行了大量研究,如完全一致性[1?4]、領導-跟隨一致性[5]、群體一致性[6]、比例一致性[7?9]等.以上一致性成果主要集中在設計控制器使智能體狀態(tài)誤差最終趨于零.但是在實際系統(tǒng)中,由于執(zhí)行器偏差、計算誤差和惡劣環(huán)境,智能體系統(tǒng)會存在通信約束(如通信時滯[10?11]、數(shù)據(jù)量化[12]等)、外部干擾、未知耦合等情況,若仍要求每個智能體的真實運動狀態(tài)之間的偏差趨于零,這在有限條件下往往難以實現(xiàn).因此,Dong 等[13]提出使智能體狀態(tài)偏差函數(shù)在某一確定有界區(qū)間內波動的實用一致性概念,可適用于更為復雜的實際系統(tǒng).
為解決不同非理想網(wǎng)絡環(huán)境中的一致性問題,學者們對基于實用一致性概念的多智能體控制算法進行了深度研究[13?17].文獻[13]研究了有向通信拓撲下具有外部擾動、相互作用不確定和時變時滯的一般高階線性時不變群系統(tǒng)實用一致性問題.在實際系統(tǒng)中,當采樣周期變大時,若要使智能體狀態(tài)誤差趨于零,初始狀態(tài)就須非常接近,顯然限制了系統(tǒng)的有效性.基于文獻[13],文獻[14]進一步探討了二階多智能體系統(tǒng)齊次采樣下的實用一致性.為解決初始控制輸入量過大,出現(xiàn)輸入飽和而導致削弱系統(tǒng)性能的問題,文獻[15]利用時基發(fā)生器,提出多智能體系統(tǒng)的固定時間實用一致性框架.具有振蕩器的系統(tǒng),也難以實現(xiàn)智能體狀態(tài)誤差最終趨于零,因此文獻[16]研究了異質網(wǎng)絡上非線性非均勻Stuart-Landa 振子的實用動態(tài)一致性.文獻[17]研究了帶未知耦合權重的領導-跟隨多智能體系統(tǒng)的實用一致性.以上已有的實用一致性研究只考慮非理想網(wǎng)絡環(huán)境中智能體之間的合作關系,即用非負權重的通信拓撲來表示.在許多實際系統(tǒng)中,合作與競爭關系同時存在.
文獻[18]率先設通信拓撲權重為負以表示智能體間的競爭關系,提出結構平衡圖假設,利用拉普拉斯算子證明了智能體系統(tǒng)能實現(xiàn)二分一致.隨后該結論被推廣至更一般的線性多智能體系統(tǒng)[19?20].文獻[21]研究了切換拓撲下多智能體系統(tǒng)的二分一致性,建立了智能體穩(wěn)態(tài)與拉普拉斯矩陣間的聯(lián)系.文獻[22]引入正負生成樹概念,得出矩陣加權網(wǎng)絡實現(xiàn)二分一致的充要條件,但只適用于結構平衡圖.對于結構不平衡下的矩陣加權網(wǎng)絡,文獻[23]通過矩陣耦合,得出了實現(xiàn)二分一致的代數(shù)條件.文獻[24]針對含有對抗關系和時變拓撲的耦合離散系統(tǒng),考慮了拓撲切換后出現(xiàn)結構不平衡或結構平衡的兩個子系統(tǒng)成員隨時間變化的情況,實現(xiàn)了有界雙向同步.上述二分一致性的研究大部分考慮智能體間的誤差最終能趨于零,本文將著重考慮受到通信時延、數(shù)據(jù)量化影響下智能體間的誤差收斂于可控區(qū)間的二分實用一致性.
量化一致性概念最早由文獻[25]提出,隨后文獻[26]基于矩陣譜理論分別研究了通訊信息在一致量化和對數(shù)量化下多智能體系統(tǒng)的一致性問題.文獻[27]構建了基于磁滯效應量化的多智能體網(wǎng)絡的混雜系統(tǒng)模型,該混雜系統(tǒng)能夠有效避免震顫現(xiàn)象,并進一步分析了系統(tǒng)解的有限時間收斂性.文獻[28]考慮競爭關系和通信量化下多智能體系統(tǒng)的二分一致性.文獻[29]研究了具有量化通信約束的非線性多智能體系統(tǒng)分布式二分一致性問題.以上論文對通信量化做了大量研究,但均未考慮通信時滯,而時滯也是影響多智能體系統(tǒng)一致性的重要因素.
綜合考慮上述因素,本文將以帶有通信時滯和量化數(shù)據(jù)等通信約束且同時存在合作、競爭關系的實際系統(tǒng)為對象,研究其二分實用一致性問題,提出了基于融合時滯項、取整函數(shù)、符號函數(shù)的量化器的右端不連續(xù)控制協(xié)議.根據(jù)微分包含理論和菲利波夫解的框架證明了控制器在右端不連續(xù)情況下仍能求得系統(tǒng)的全局解,實現(xiàn)智能體位置狀態(tài)收斂至模相同但符號不同的可控區(qū)間.相較于文獻[17],本文同時考慮了智能體間的合作與競爭關系.相較于文獻[18,20],本文考慮了通信時滯、量化數(shù)據(jù)等通信約束對智能體系統(tǒng)的影響.在文獻[25,28]的基礎上,本文將漸近一致性推廣至實用一致性,使智能體間的誤差收斂于一個可控區(qū)間,且收斂上界值與任何全局信息和初始值無關.
引入一類正交矩陣C,其定義如下:
易得,C滿足CTC=CCT=I,且C?1=C.diag{σ1,σ2,···,σn}表示對角矩陣,其對角線元素為{σ1,σ2,···,σn}.對于固定無向網(wǎng)絡拓撲和零通信時延的多智能體系統(tǒng),常采用控制協(xié)議x˙(t)=u(t)=?Lx(t),對其規(guī)范變換.令z=Cx,C ∈C,由C?1=C,x=Cz,則
其中,LD=CLC=D ?CAC為規(guī)范變換后拉普拉斯矩陣,
引理 1[18].L與LD等譜,即具有相同的特征值集合sp(L)=sp(LD).
針對右端不連續(xù)微分方程,在微分包含理論和菲利波夫解的框架基礎下求全局解.考慮如下m維微分方程
考慮包含n個智能體的系統(tǒng),智能體i的動力學方程為
其中xi(t)∈R 表示智能體i的位置狀態(tài)變量,ui(t)∈R表示智能體i的控制輸入.
定義 3.給定的控制器ui,i=1,2,···,n,若對任意初始值xi(0),i=1,2,···,n,都存在一個不依賴任何全局信息和初始值的正數(shù)ε,使得
則稱系統(tǒng)(6)能實現(xiàn)二分實用一致.
針對多智能體系統(tǒng)(6),提出如下控制器,
其中Q(x) 為 量化函數(shù),定義Q(x)=?(x/ηγ)+0.5」γ,i=1,2,···,n,γ為量化水平參數(shù),η ∈(0,1] 為量化器精度,τ為智能體j向智能體i通信傳輸時發(fā)生的通信延遲,?·」為向下取整函數(shù),s ign(·) 為符號函數(shù).
本文討論的是有向強連通符號圖下多智能體系統(tǒng)二分實用一致性問題,系統(tǒng)鄰接矩陣中存在負元素,由式(2)得變換后的鄰接矩陣為,
其中σi,σj={?1,1}.
上述量化器是將連續(xù)狀態(tài)空間映射到離散信息符號碼集合,智能體狀態(tài)僅取整數(shù),在控制器(8)作用下,系統(tǒng)(6)本質上是一個右端不連續(xù)的非光滑系統(tǒng),其解需要在菲利波夫意義下討論.
定義 4.如果函數(shù)x(t):[?τ,T)→Rn滿足:
則 [x(t),w(t),w′(t)]:[?τ,T)→Rn×Rn為系統(tǒng)(6)滿足初始條件 (?(t),ψ(t),ψ′(t)) 的解.
定理 1.對任意初始向量函數(shù)?(t) 和任意可測向量輸出函數(shù)ψ(t)、ψ′(t),系統(tǒng)(11)存在全局解.
證明.1)局部解的存在性
基于參考文獻[2]對引理1 的證明,易得系統(tǒng)(11)在 [ 0,T) 上存在局部解.依據(jù)泛函微分方程理論,通過局部解的有界性可得存在全局解.故進一步證明局部解的有界性.
2)設系統(tǒng)(11)的解為[x(t),w(t),w′(t)]:[?τ,T)→Rn×Rn,令
若能證明Y(t) 對t為非增函數(shù),y(t) 對t為非減函數(shù),則上述解有界.我們將利用反證法證明該解的有界性.首先分四步證明Y(t) 對t為非增函數(shù).
定理 2.假設多智能體系統(tǒng)的固定有向通信拓撲G為強連通符號圖,考慮存在通信時延和量化數(shù)據(jù)通信約束的多智能體系統(tǒng)(6),在控制器(8)的作用下,系統(tǒng)在任意初始條件下均能實現(xiàn)二分實用一致,即
其中,?ε>0.
證明.構造如下Lyapunov 函數(shù):
由式(1),對?ε>0,有
由此可得,對任意一個智能體i的狀態(tài)xi(t) 都能收斂到集合 [ (θ ?0.5)γη,(θ+0.5)γη] 中.由此可得,
實例 1.考慮由6個智能體構成的多智能體系統(tǒng),其有向通信拓撲結構如圖1 所示.該拓撲圖滿足結構平衡,圖中兩個子群分別為V1={1,2,3}和V2={4,5,6},子群之間為競爭關系,子群內部為合作關系.
圖1 拓撲圖Fig.1 Topological graph
由通信拓撲圖不難得到鄰接矩陣A,對鄰接矩陣A規(guī)范變換,取轉換矩陣為C=diag{1,1,1,?1,?1,?1}. 其中,轉換矩陣C為正交矩陣,C=diag{σ1,σ2,···,σn},σi={?1,1},滿足CTC=CCT=I,C?1=C; d iag{σ1,σ2,···,σn}表示對角矩陣,其對角線元素為{σ1,σ2,···,σn}.
取η=1,γ=3,τ=0.1,各智能體初始值x(t)=[1 2.5 6?1?4?3],t ∈[?0.1,0).由式(29)易得,l imt→∞(|xi(t)|?|xj(t)|)=γη=3.
圖2 為系統(tǒng)(6)在控制器(8)的作用下各智能體位置狀態(tài)變化曲線,由圖可知各智能體位置狀態(tài)絕對值的誤差收斂于可控區(qū)間 [0,3],存在競爭關系的兩個子群最終能實現(xiàn)收斂,即通信受限的多智能體系統(tǒng)能實現(xiàn)二分實用一致.
圖2 γ =3, η =1 智能體位置狀態(tài)軌跡Fig.2 γ =3, η =1 The trajectories of all agents
圖3、圖4 為在相同初始值狀態(tài)下分別取γ=1、γ=0.1時的各智能體位置狀態(tài)曲線,表明通過改變γ值可以控制智能體位置狀態(tài)絕對值誤差的波動區(qū)間,所設計的γ值越小,智能體位置狀態(tài)絕對值的誤差波動區(qū)間也越小.
圖3 γ =1, η =1 智能體位置狀態(tài)軌跡Fig.3 γ =1, η =1 The trajectories of all agents
圖4 γ =0.1,η =1 智能體位置狀態(tài)軌跡Fig.4 γ =0.1,η =1 The trajectories of all agents
實例 2.為了進一步說明本文的研究意義,選用8個智能體組成的最鄰近耦合小世界網(wǎng)絡系統(tǒng),智能體互連構成的有向拓撲圖如圖5 所示,此處無向圖為一種特殊的有向圖,圖中未標權重的連邊權重設為1.其中,兩個子群V1={1,2,3,4}、V2={5,6,7,8},取η=1,γ=0.5,τ=0.1,智能體初始狀態(tài)分別為x(t)=[1 2 4 5?1?2?4?5],t ∈[?0.1,0).
圖5 最鄰近耦合小世界網(wǎng)絡Fig.5 Nearest-neighbor coupled network
對鄰接矩陣A規(guī)范變換,取轉換矩陣為C=diag{1,1,1,1,?1,?1,?1,?1}.由式(29) 易得,limt→∞(|xi(t)|?|xj(t)|)≤ε=γη=0.5.
圖6 為系統(tǒng)(6)在控制器(8)的作用下各智能體位置狀態(tài)變化曲線.由圖可知,各智能體位置狀態(tài)絕對值的誤差收斂于可控區(qū)間 [ 2.8,3.2],存在競爭關系的兩個子群最終能實現(xiàn)收斂,運用本文所設計的控制策略,最鄰近耦合小世界網(wǎng)絡系統(tǒng)能實現(xiàn)二分實用一致.
圖6 γ =0.5,η =1 智能體位置狀態(tài)軌跡Fig.6 γ =0.5,η =1 The trajectories of all agents
本文研究了有向強連通符號圖下通信受限的多智能體子群系統(tǒng)二分實用一致性問題,設計了一種基于量化器的分布式控制協(xié)議,使智能體位置狀態(tài)絕對值的誤差收斂于可控區(qū)間,并得到了誤差收斂上界值,該上界值不依賴于任何全局信息和初始狀態(tài),僅與量化器參數(shù)有關,所設計量化水平參數(shù)越小,收斂區(qū)間也越小.后續(xù)工作將考慮推廣至離散系統(tǒng)和高階系統(tǒng).