陳 俠, 李 露
(沈陽航空航天大學(xué),沈陽 110000)
近年來,多智能體系統(tǒng)在編隊(duì)控制[1]、協(xié)同控制[2]、集群[3]等領(lǐng)域有著廣泛的應(yīng)用。一致性控制是多智能體系統(tǒng)的重要研究內(nèi)容,它是指通過設(shè)計一致性協(xié)議,利用自身信息與其他智能體信息交互來更新自己的狀態(tài)信息,使所有個體信息最終收斂一致。目前,多智能體的一致性控制已得到了快速發(fā)展,取得了一些有價值的研究成果[4]。在實(shí)際應(yīng)用中,系統(tǒng)一致性控制往往受到動力學(xué)模型的不確定性等因素的影響,因而研究不確定多智能體一致性控制已受到了國內(nèi)外學(xué)者們高度重視。文獻(xiàn)[5]研究了不確定多智能體的最優(yōu)協(xié)同控制問題;文獻(xiàn)[6]研究了不確定多智能體的控制協(xié)議,提出了基于辨識-評價結(jié)構(gòu)的在線自適應(yīng)最優(yōu)控制方案。
隨著科技發(fā)展,網(wǎng)絡(luò)的引入使得控制系統(tǒng)在處理速度等方面均有顯著提高,但同時也帶來了新的挑戰(zhàn),例如網(wǎng)絡(luò)攻擊、網(wǎng)絡(luò)延遲等問題。如何降低網(wǎng)絡(luò)攻擊對系統(tǒng)的影響是目前研究熱點(diǎn)之一。文獻(xiàn)[7]研究了受到網(wǎng)絡(luò)延時和數(shù)據(jù)丟包的多智能體一致性的問題;文獻(xiàn)[8]研究了無線網(wǎng)絡(luò)環(huán)境利用事件觸發(fā)機(jī)制來降低欺騙攻擊對系統(tǒng)的影響;文獻(xiàn)[9]研究了在網(wǎng)絡(luò)通信帶寬受限和網(wǎng)絡(luò)攻擊下,對基于事件觸發(fā)的控制系統(tǒng)的改進(jìn)。
在多智能體一致性控制中,事件觸發(fā)機(jī)制[10-11]通過預(yù)先設(shè)置觸發(fā)條件來決定數(shù)據(jù)是否被傳輸。當(dāng)同步性能指標(biāo)無法滿足要求時,需要控制器在不同時期設(shè)計不同的觸發(fā)條件,因此,事件觸發(fā)機(jī)制無法滿足要求。與事件觸發(fā)相比,動態(tài)觸發(fā)機(jī)制[12]可在事件觸發(fā)機(jī)制中引入一個動態(tài)變量對系統(tǒng)的觸發(fā)閾值進(jìn)行動態(tài)調(diào)整,使其能夠動態(tài)地對觸發(fā)規(guī)則進(jìn)行改變,更合理地減少采樣次數(shù),有效節(jié)約了網(wǎng)絡(luò)資源;文獻(xiàn)[13]提出利用動態(tài)事件觸發(fā)機(jī)制對網(wǎng)絡(luò)化系統(tǒng)進(jìn)行魯棒控制的方法,降低了網(wǎng)絡(luò)數(shù)據(jù)的傳輸次數(shù),加強(qiáng)了系統(tǒng)魯棒性能;文獻(xiàn)[14]通過動態(tài)事件觸發(fā)機(jī)制給出了狀態(tài)反饋控制器的設(shè)計方法,加強(qiáng)了對網(wǎng)絡(luò)化系統(tǒng)容錯的控制;針對系統(tǒng)存在故障環(huán)節(jié);文獻(xiàn)[15]通過引入動態(tài)變量,實(shí)現(xiàn)系統(tǒng)故障容錯同步并充分降低狀態(tài)信息在網(wǎng)絡(luò)通信中的傳播次數(shù)。然而,目前研究基于動態(tài)事件觸發(fā)機(jī)制的一致性控制文獻(xiàn)模型都比較簡單,沒有考慮網(wǎng)絡(luò)攻擊和不確定多智能體對控制器的影響,網(wǎng)絡(luò)攻擊下不確定多智能體系統(tǒng)動態(tài)事件觸發(fā)一致性研究還較少見。
本文研究了具有網(wǎng)絡(luò)攻擊及不確定的一般線性多智能體系統(tǒng)一致性問題,考慮了網(wǎng)絡(luò)延遲和網(wǎng)絡(luò)攻擊兩個因素對控制系統(tǒng)的影響,并且使用動態(tài)事件觸發(fā)機(jī)制對系統(tǒng)進(jìn)行采樣以節(jié)約網(wǎng)絡(luò)資源。在時變延遲控制輸入下,建立了閉環(huán)控制系統(tǒng)的數(shù)學(xué)模型?;贚yapunov穩(wěn)定性理論、線性矩陣不等式和代數(shù)圖論,證明了所提出的動態(tài)事件觸發(fā)控制策略能有效地實(shí)現(xiàn)多智能體系統(tǒng)一致性。最后,通過仿真實(shí)例驗(yàn)證了該方法的可行性與有效性。
圖論是研究多智能體系統(tǒng)的基礎(chǔ)理論,將一個智能體表示為圖論中的一個節(jié)點(diǎn),智能體之間的信息交互為圖論中的邊,用G=(V,E,A)來表示,如圖1所示。
圖1 多智能體系統(tǒng)模型Fig.1 Multi-agent system model
其中:V={v1,…,vN},表示節(jié)點(diǎn)集;E?V×V,表示邊集;eij=(vi,vj),表示第i個到第j個智能體的有向邊;A=[ai j],表示加權(quán)矩陣,若(vi,vj)?E,則ai j=0,否則ai j>0;度矩陣D=diag(di),D∈RN×N;Laplacian矩陣L=[li j]可表示為
L=D-A
(1)
(2)
考慮到一個含有N個智能體的不確定多智能體系統(tǒng),每個智能體的線性微分方程可表示為
(3)
ΔA=E1φ1(t)E2
(4)
ΔB=E3φ2(t)E4
(5)
考慮到不確定性和延遲的影響,根據(jù)事件觸發(fā)控制策略設(shè)計如下一致性控制器
(6)
式中,K∈RN×N,為常數(shù)增益矩陣。
將不確定智能體的動態(tài)數(shù)學(xué)模型式(3)和一致性控制器式(6)寫成緊湊形式,即
(7)
定義1[16]在不確定多智能體系統(tǒng)式(3)中,如果每個智能體的狀態(tài)xi,在設(shè)計的控制器下均滿足
(8)
則該不確定多智能體系統(tǒng)滿足一致性。
為了盡可能地減少系統(tǒng)之間的觸發(fā)次數(shù),降低網(wǎng)絡(luò)帶寬,通過引入一個動態(tài)變量ι來滿足要求
(9)
式中:β(ι)是滿足Lipschitz連續(xù)的K∞函數(shù);σ是事件觸發(fā)機(jī)制頻率;Ω是一個大于零的參數(shù);er(t)是閾值誤差;ι(t)在所有時刻上均滿足ι(t)≥0,且ι(0)=ι0。則設(shè)計動態(tài)事件觸發(fā)規(guī)則為
(10)
由于網(wǎng)絡(luò)攻擊會導(dǎo)入錯誤數(shù)據(jù),使得系統(tǒng)的性能降低。f(x(t-η(t)))表示網(wǎng)絡(luò)攻擊,網(wǎng)絡(luò)攻擊的表達(dá)式為
(11)
式中:0≤η(t)≤ηM,表示網(wǎng)絡(luò)攻擊的延時;0≤α(t)≤1,是伯努利變量;d(t)是事件觸發(fā)機(jī)制的延時。
動態(tài)事件觸發(fā)機(jī)制的控制器設(shè)計為
(12)
通過式(12)建立系統(tǒng)的閉環(huán)控制方程
(13)
將一致性問題轉(zhuǎn)換為穩(wěn)定性問題,需要引入不一致的新變量,即樹形轉(zhuǎn)換法[17],利用樹形轉(zhuǎn)換法得到分歧系統(tǒng)
(14)
將由以下定理給出閉環(huán)系統(tǒng)一致性的充分必要條件。需要引用的引理如下。
引理1[18]對于任意x,y∈R和任意對稱矩陣X∈RN×N,有不等式
2xTy≤xTXx+yTX-1y
(15)
成立。
引理2[19]對任意標(biāo)量t>t-τ≥0和常矩陣M=MT>0,有以下不等式成立
(16)
引理3[20]對任意標(biāo)量t>t-τ≥0和常矩陣M=MT>0,有以下不等式成立
(17)
則式(14)系統(tǒng)保持穩(wěn)定且閉環(huán)系統(tǒng)在均方意義下實(shí)現(xiàn)一致性。
證明選取以下Lyapunov函數(shù)
V(zt,l)=V1(zt,l)+V2(zt)+V3(zt)
(18)
(19)
(20)
(21)
由分歧系統(tǒng)及引理1可得
(22)
由式(22)可知,V(zt)>0的情況。
(23)
式中:
(24)
(25)
(26)
(27)
通過Matlab仿真對本文的設(shè)計結(jié)果進(jìn)行驗(yàn)證。以如下智能體的運(yùn)動模型為例進(jìn)行仿真
(28)
給出具有4個智能體的多智能體系統(tǒng),如圖2所示。
圖2 多智能體系統(tǒng)圖Fig.2 Diagram of multi-agent system
圖3 不確定多智能體系統(tǒng)狀態(tài)圖Fig.3 Status diagram of uncertain multi-agent system
圖4 多智能體速度響應(yīng)曲線圖Fig.4 Multi-agent speed response graph
由圖3和圖4可以看出,4個智能體在不同的初始狀態(tài)下,通過動態(tài)事件觸發(fā)機(jī)制,在一致性控制器作用下,50 s左右可達(dá)到一致。證明本文設(shè)計的控制器能使不確定多智能體達(dá)到一致。
圖5描述了本文的網(wǎng)絡(luò)攻擊曲線。
圖5 網(wǎng)絡(luò)攻擊響應(yīng)曲線Fig.5 Network attack response curve
然后可得到隨機(jī)網(wǎng)絡(luò)攻擊f(x(t))上界J=diag(0.02,0.13,0.07,0.2)。
圖6所示為靜態(tài)、動態(tài)事件觸發(fā)時間頻率圖。
從圖6可得到智能體的觸發(fā)時刻和觸發(fā)時間間隔。在相同的觸發(fā)時間(15 s)內(nèi),靜態(tài)事件的觸發(fā)頻率高于動態(tài)事件的觸發(fā)頻率。在保證系統(tǒng)穩(wěn)定的前提下,可以看出動態(tài)事件機(jī)制的觸發(fā)區(qū)間更長且能夠減少觸發(fā)次數(shù),節(jié)約了網(wǎng)絡(luò)帶寬和資源。
表1所示為靜態(tài)事件觸發(fā)機(jī)制和動態(tài)事件觸發(fā)機(jī)制執(zhí)行時間的平均值。
表1 兩種機(jī)制平均執(zhí)行時間比較Table 1 Average execution time comparisonbetween the two mechanisms s
在相同的σ值下,動態(tài)事件觸發(fā)機(jī)制的平均執(zhí)行時間大于靜態(tài)事件觸發(fā)機(jī)制。結(jié)合圖6分析可知,相較于靜態(tài)事件觸發(fā)機(jī)制,動態(tài)事件觸發(fā)機(jī)制能夠減少采樣次數(shù),在采樣頻率上有著更優(yōu)的性能。因此,動態(tài)事件觸發(fā)機(jī)制在實(shí)際的系統(tǒng)中能夠節(jié)約通信資源。
本文針對網(wǎng)絡(luò)攻擊和不確定多智能體一致性,設(shè)計了一種利用動態(tài)觸發(fā)機(jī)制的控制器。為更加接近實(shí)際情況,考慮了網(wǎng)絡(luò)延遲和隨機(jī)網(wǎng)絡(luò)攻擊。網(wǎng)絡(luò)攻擊采用隨機(jī)伯努利變量來描述。在定理1的證明中,利用Lyapunov漸近穩(wěn)定性理論和線性不等式來證明控制器的穩(wěn)定性和一致性。最后通過仿真實(shí)驗(yàn)驗(yàn)證了算法的可行性和有效性。下一步工作將研究更高階的動態(tài)觸發(fā)系統(tǒng)和網(wǎng)絡(luò)攻擊下多智能體的一致性問題。