羅俊芝 詹 環(huán) 張雪飛 閔祥娟
(陸軍裝甲兵學(xué)院基礎(chǔ)部 北京 100072)
多智能體系統(tǒng)(Multi-agent systems)是指由大量局部相互作用的簡單個體(稱為Agent)組成的復(fù)雜系統(tǒng)[1]。多智能體系統(tǒng)有廣泛的應(yīng)用背景,其理論運用到了車輛編隊、無人機協(xié)調(diào)飛行、物流供應(yīng)鏈系統(tǒng)控制等實際問題。尤其是隨著科學(xué)技術(shù)的發(fā)展,多智能體系統(tǒng)的應(yīng)用研究變得日益重要,近些年來成為控制界學(xué)者的關(guān)注的焦點[2~11]。
一致性控制問題是多智能體系統(tǒng)研究的重要方面,所謂一致性控制是指基于多智能體系統(tǒng)中個體之間有限的信息交換,設(shè)計一致性協(xié)議,使得所有智能體的某一個狀態(tài)量或是所有狀態(tài)量趨于相等,即使得智能體之間能夠達(dá)到協(xié)調(diào)一致性,最終完成復(fù)雜任務(wù)。如Wen G H[2]針對具有無向連通拓?fù)浣Y(jié)構(gòu)的多智能體系統(tǒng),假設(shè)每個Agent 的狀態(tài)方程為連續(xù)線性模型,研究了系統(tǒng)的分布式一致性控制問題。Liu S[3]則針對有向拓?fù)浣Y(jié)構(gòu)的智能體系統(tǒng),考慮了帶有虛擬的Leader Agent情形,設(shè)計了含有時滯的一致性控制協(xié)議,給出了多智能體系統(tǒng)的一致性控制的條件。Zhang J[4]利用滑??刂茖Ψ蔷€性多智能體系統(tǒng)一致性控制問題進(jìn)行了研究。Li Z K 等[5]考慮了系統(tǒng)在有向拓?fù)浣Y(jié)構(gòu)下,分析了在帶有界輸入下的分布式一致性跟蹤問題。Shen Q K 等[6]研究了固定拓?fù)浣Y(jié)構(gòu)下的多智能體系統(tǒng)的自適應(yīng)一致性控制問題。
注意到文獻(xiàn)[2~6]研究中,智能體之間采用的是固定拓?fù)浣Y(jié)構(gòu),但是在實際問題中,如車輛編隊控制問題,車輛的相對位置關(guān)系可能隨時間的演變發(fā)生變化,從而各智能體之間的拓?fù)浣Y(jié)構(gòu)相應(yīng)也會發(fā)生;再比如,在移動機器人進(jìn)行通訊過程中,由于網(wǎng)絡(luò)的故障造成信息傳遞丟失,多智能體系統(tǒng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)也可能發(fā)生變化,因此具有時變拓?fù)浣Y(jié)構(gòu)的多智能體系統(tǒng)的研究引起了人們的關(guān)注。目前有些文獻(xiàn)對此問題也進(jìn)行了研究,如Hu J P[7]在研究了在拓?fù)浣Y(jié)構(gòu)是時變的情形下,系統(tǒng)有Leader領(lǐng)導(dǎo)下多智能體系統(tǒng)的跟蹤控制問題,Porfri M[8]分別針對無向定拓?fù)浜陀邢蚨ㄍ負(fù)鋬煞N情形給出了保證系統(tǒng)幾乎必然一致的充分條件,Sun Y G[9]研究了在有向拓?fù)浣Y(jié)構(gòu)下的多智能體系統(tǒng)的的一致性問題,其中系統(tǒng)的拓?fù)浣Y(jié)分為固定有向拓?fù)浜涂勺冇邢蛲負(fù)淝樾?。邵俊倩等?0]研究了在變拓?fù)渚W(wǎng)絡(luò)結(jié)構(gòu)下的多無人機系統(tǒng)的一致性控制問題。林敏等[11]研究了時變拓?fù)浣Y(jié)構(gòu)下的多無人機領(lǐng)航跟隨一致性和軌跡跟蹤問題。Xue D 等[12]研究了多智能體系統(tǒng)在隨機切換拓?fù)浣Y(jié)構(gòu)下的編隊控制問題。
上述文獻(xiàn)中,假定系統(tǒng)的拓?fù)浣Y(jié)構(gòu)是變化的,這種假定符合實際問題的情況,本文也考慮到實際問題中各智能體之間的拓?fù)浣Y(jié)構(gòu)的變化,并假設(shè)各拓?fù)浣Y(jié)構(gòu)的切換符合馬爾可夫過程,且設(shè)計了依賴于切換拓?fù)涞囊恢滦詤f(xié)議,給出系統(tǒng)的一致性控制的條件。與文獻(xiàn)[7~12]不同的是,本文給出的一致性條件與拓?fù)浣Y(jié)構(gòu)的鄰接矩陣的特征值有關(guān),設(shè)計了與系統(tǒng)切換拓?fù)浣Y(jié)構(gòu)切換的轉(zhuǎn)移概率相關(guān)的一致性協(xié)議,并且通過理論和數(shù)值仿真可以證明在此一致性協(xié)議下推導(dǎo)得到的系統(tǒng)一致性條件,能夠使多智能體的狀態(tài)能夠趨于一致。
假設(shè)多智能體系統(tǒng)含有N個智能體,以每個智能體為節(jié)點,該系統(tǒng)可以抽象為包含N個節(jié)點的有向加權(quán)圖G(V,ε,A) ,其中V={v1,v2,…vN},ε?V×V,代表圖中任意兩個節(jié)點vi,vj的有向邊,鄰接矩陣為A=[aij],其中aij≥0,如果aij=0,說明節(jié)點vi到vj沒有邊連接。如果aij=aji,則該圖為無向圖。L=[cij]表示鄰接矩陣對應(yīng)的Laplace 矩陣。
本文考慮智能體之間的拓?fù)浣Y(jié)構(gòu)為無向圖。
假設(shè)多智能體系統(tǒng)的第i個Agent的動態(tài)模型為
設(shè)計的一致性控制協(xié)議形式如式(2):
其中Kσ為控制器的增益,c為各智能體之間的耦合系數(shù),aij(k)為鄰接矩陣的元素,反映了智能體之間在時刻k時信息交互情況。
下面基于時變拓?fù)浣Y(jié)構(gòu)下研究多智能體系統(tǒng)的一致性控制問題,首先拓?fù)浣Y(jié)構(gòu)的變化滿足如下的假設(shè)。
下面將針對多智能系統(tǒng)(1),進(jìn)行數(shù)值模擬仿真,具體的系統(tǒng)參數(shù)取值如下:
假設(shè)由6 個Agent 組成的多智能體系統(tǒng),即N=6,其動態(tài)拓?fù)浣Y(jié)構(gòu)圖在如下四種情形(圖1-圖4)之間進(jìn)行切換,且各拓?fù)浣Y(jié)構(gòu)對應(yīng)的轉(zhuǎn)移概率矩陣為
圖1 拓?fù)浣Y(jié)構(gòu)1
圖2 拓?fù)浣Y(jié)構(gòu)2
圖3 拓?fù)浣Y(jié)構(gòu)3
圖4 拓?fù)浣Y(jié)構(gòu)4
利用Matlab工具,求解條件(6),進(jìn)一步求得
P1=[0.9082 0.1146;0.1146 0.9049];P2=[0.9082 0.1146;0.1146 0.9049];
P3=[0.9158 0.1071;0.1071 0.9123];P4=[0.9079 0.1149;0.1149 0.9046]。K1=[-0.5042 0.6807];K2=[-0.4989 0.6735];K3=[-0.5039 0.6802];K4=[-0.5022 0.6779]。
取c=0.5 ,e(0)=[1,2,1,2,3,5,3,0.2,0.3,0.6,5,4],進(jìn)行仿真得到切換信號曲線和誤差系統(tǒng)曲線如圖5和圖6。
圖5 多智能體系統(tǒng)的拓?fù)淝袚Q信號
圖6 多智能體系統(tǒng)的狀態(tài)曲線
結(jié)論:從仿真圖形5和圖形6可以看出,在系統(tǒng)的拓?fù)浣Y(jié)構(gòu)變化的情況下,通過設(shè)計與拓?fù)浣Y(jié)構(gòu)相關(guān)的一致性協(xié)議,多智能體誤差系統(tǒng)的狀態(tài)曲線趨于穩(wěn)定,即各智能體的狀態(tài)變量趨于一致,這說明了本文所提出的控制方案的有效性。
本文針對多智能體系統(tǒng),研究了系統(tǒng)的一致性控制問題。通過設(shè)計依賴于諸節(jié)點的時變的拓?fù)浣Y(jié)構(gòu)的一致性協(xié)議,且假定了該時變的拓?fù)浣Y(jié)構(gòu)的變化符合馬爾可夫過程,利用了隨機穩(wěn)定性理論,給出了系統(tǒng)達(dá)到一致的充分條件,并給出了一致性協(xié)議的具體表達(dá)形式,借助Matlab 軟件,對系統(tǒng)進(jìn)行了仿真,驗證了所提方案的有效性。