晉守博
(宿州學院數(shù)學與統(tǒng)計學院,安徽宿州234000)
多智能體系統(tǒng)是一種特殊的分布式系統(tǒng),被廣泛應用于飛行器編隊控制、機器人編隊控制和集群控制等方面,對于復雜問題具有較強的處理能力。目前,一致性控制是多智能體系統(tǒng)研究的核心問題,許多學者都在關注如何提高多智能體系統(tǒng)實現(xiàn)一致性的收斂速度,研究表明,影響收斂速度的主要因素包括通信拓撲結(jié)構(gòu)、通訊協(xié)議和協(xié)議權(quán)值等[1-5]。Olfati-Saber等證明了多智能體系統(tǒng)實現(xiàn)一致性的收斂速度正比于拉普拉斯矩陣的第二最小特征值,指出了代數(shù)連通度是提高收斂速度的決定因素[6]。隨后,Olfati-Saber發(fā)現(xiàn)在小世界網(wǎng)絡中,通過幾個智能體經(jīng)過不多的步數(shù)就與相鄰智能體連接的方法,實現(xiàn)一致性的收斂速度會更快[7]。Xiao等證明了改變拓撲結(jié)構(gòu)的權(quán)重可以提高收斂速度,并給出了收斂速度最大時對應的最優(yōu)權(quán)重[8]。Kim等提出利用最佳頂點配置的方法增大拓撲結(jié)構(gòu)的代數(shù)連通性,從而加快收斂速度[9]。Jin 等證明了不改變權(quán)重,只改變信息傳遞方式同樣能夠提高收斂速度[10]。上述文獻主要是從拓撲結(jié)構(gòu)、通訊協(xié)議和協(xié)議權(quán)值方面研究如何提高實現(xiàn)一致收斂的速度,本文將給出一種具有加權(quán)項的時滯狀態(tài)導數(shù)反饋一致性協(xié)議,研究多智能體系統(tǒng)實現(xiàn)一致收斂的速度,在一定程度上完善了文獻[11]的方法。本文主要研究下面一階多智能體系系統(tǒng)
這里xi(t)∈?表示智能體i的狀態(tài),ui(t)代表智能體i的輸入變量。
對于具有時滯的多智能體系統(tǒng),Olfati-Saber等提出了線性一致性協(xié)議[6]
并證明了在無向連通網(wǎng)絡下,系統(tǒng)實現(xiàn)漸近平均一致的充要條件是通訊時滯τ<π 2λN,這里λN對應拉普拉斯矩陣的最大特征值,文獻[11]用xi(t-τ+β)替換協(xié)議(2)中的xi(t-τ),并通過近似計算提出了一類具有時滯狀態(tài)導數(shù)反饋的線性一致性協(xié)議,證明了對于無向連通網(wǎng)絡拓撲,在不改變拓撲結(jié)構(gòu)的條件下,通過調(diào)節(jié)反饋強度,能夠同時提高系統(tǒng)的時滯魯棒性和實現(xiàn)一致性的收斂速度,但是他們采用的方法對于較大的反饋強度存在誤差偏大的問題。為了降低誤差,本文令xi(t-τ+β)≈v1xi(t-τ)+v2βx˙i(t-τ),提出如下具有加權(quán)項的時滯狀態(tài)導數(shù)反饋的一致性協(xié)議
其中反饋強度β滿足0 <β<τ,權(quán)重常數(shù)v1>v2>0。
定 義 1[11]將通訊時滯τ∈(0,τmax)分割為(0,τ1],(τ1,τ2),[τ3,τ4],…,[τk-1,τk],(τk,τmax),當τ∈(τ1,τ2)?(τ3,τ4)?…?(τk,τmax)時,多智能體系統(tǒng)(1)稱為超臨界時滯多智能體系統(tǒng);當τ∈(0,τ1]?[τ2,τ3]?…?[τk-1,τk]時,多智能體系統(tǒng)(1)成為亞臨界時滯多智能體系統(tǒng)。
多智能體系統(tǒng)(1)在一致性協(xié)議(3)下的閉環(huán)形式為
下面討論具有加權(quán)項的時滯狀態(tài)導數(shù)反饋的一致性協(xié)議對實現(xiàn)一致性收斂速度的影響。
為了分析具有加權(quán)項的時滯狀態(tài)導數(shù)反饋對多智能體系統(tǒng)實現(xiàn)一致性的收斂速度的影響,需要討論反饋強度對閉環(huán)形式(4)極點的影響,記x(t)=[x1(t),x2(t),…,xN(t)],將閉環(huán)系統(tǒng)轉(zhuǎn)化為如下緊湊形
這里L是相應的拉普拉斯矩陣。
定理1當多智能體系統(tǒng)(1)為超臨界時滯多智能體系統(tǒng)時,存在正常數(shù)β*,使得當時滯狀態(tài)導數(shù)反饋強度β∈(0,min{τ,β*})時,多智能體系統(tǒng)(1)在一致協(xié)議(3)下能夠提高實現(xiàn)一致收斂的速度。
證明對(5)式兩邊進行拉普拉斯變換,可以得到特征方程det[sI+e-sτ(v1+v2βs)L]=0,利用網(wǎng)絡拓撲的連通性,經(jīng)過計算可以得到
從(6)式可以看出,s=0為其單根,當s≠0時,分析方程s+λie-τs(v1+v2βs)=0的根。
令s=pi+jqi,其中pi,qi∈?和j2=-1,經(jīng)過計算可得
于是,由(7)式進一步計算可得
對(7)式兩邊關于β分別求導可得
和
利用克萊姆法則得
由(7)式,將λi,β,v1,v2,τ看作常量,理論上可以求出pi=pi(β;λi,v1,v2,τ),qi=qi(β;λi,v1,v2,τ),將此式代入到(11)式,可以求出但是,在一般情況下,很難求出的具體表達式,下面將考慮特殊情況下的符號。
實際上,由文獻[11]可知,多智能體系統(tǒng)(1)在協(xié)議(3)下保證實現(xiàn)一致收斂的最大通訊時滯為τmax=且當τ=τimax時,pi=0,此時(7)、(8)式變?yōu)?/p>
從(9)和(10)式入手,并利用克萊姆法則和(12)式可得:
上式進一步化簡后得
所以Ψ(α)=0有且僅有一個解,記為,而且當時,Ψ(αi)>0;當αi=α*i時,Ψ(αi)=0;當αi>時 ,Ψ(αi)< 0。 由可知存在,使得且 當時 ,關于變量τ的連續(xù)性可知,存在使得對任意則對任意β∈(0,β*)和τ∈(τmax-,τmax),有故當τ接近最大通訊時滯τ時,通過給定imax恰當強度的時滯狀態(tài)導數(shù)反饋可以提高實現(xiàn)一致收斂的速度。
(2)通信時滯τ=0的情況
令τ=0,則(7)式變?yōu)?/p>
故當通訊時滯τ充分小時,對于帶有任意強度的時滯狀態(tài)導數(shù)反饋,減少了一致收斂的速度。
(3)超臨界和亞臨界時滯多智能體系統(tǒng)
設正函數(shù)V=V(p2,p3,…,pN)為多智能體系統(tǒng)的收斂速度,理論上將pi=pi(β;λi,τ,v1,v2)代入函數(shù)V可以得到收斂速度顯示表達式V=V(p2(β;λi,τ,v1,v2),p3(β;λi,τ,v1,v2),…,pN(β;λi,τ,v1,v2) ),但是計算方式過于復雜,一般情況下無法使用該方法估計收斂速度。然而利用多智能體系統(tǒng)的收斂速度和閉環(huán)極點關系仍然可得,對于任意i∈{2 ,3,…,N}有由情況(1)和(2)的結(jié)論,并使用復合函數(shù)求導法則可知,當τ∈(0,τ0min)和β∈和β∈(0,β*)時。
綜上所述,當多智能體系統(tǒng)(1)為超臨界時滯多智能體系統(tǒng)時,引入時滯狀態(tài)導數(shù)反饋可以提高實現(xiàn)一致收斂的速度;當多智能體系統(tǒng)(1)為亞臨界時滯多智能體系統(tǒng)時,引入時滯狀態(tài)導數(shù)反饋不能提高實現(xiàn)一致收斂的速度。
考慮具有如下通信拓撲結(jié)構(gòu)的多智能體系統(tǒng),如圖1所示,該系統(tǒng)的拉普拉斯陣為
在具有加權(quán)項的時滯狀態(tài)導數(shù)反饋一致性協(xié)議(3)下,當通訊時滯τ=0.58 時,對于不同反饋強度β=0 和β=0.13,多智能體系統(tǒng)(1)仿真結(jié)果如圖2 所示。從圖2 可以看出,對于具有加權(quán)的時滯狀態(tài)導數(shù)反饋的多智能體系統(tǒng),假定通訊時滯τ=0.58,當反饋強度β=0時,圖2(a)顯示多智能體在t>10后才能消除震蕩;然而,當反饋強度β=0.13時,圖2(b)顯示多智能體在t>5后就能消除震蕩;當t=5時,利用所有智能體的狀態(tài)與平均一致狀態(tài)之間的誤差函數(shù)可知,此時不同反饋強度下的誤差為E(0.13)=0.040 1 <E(0)=0.256 2。因此引入適當反饋強度β=0.13可以有效提高多智能體系統(tǒng)實現(xiàn)一致性的收斂速度。
圖1 多智能體系統(tǒng)的無向加權(quán)連通圖
圖2 多智能體系統(tǒng)應用協(xié)議(3)在τ=0.58 及不同反饋強度β=0 和β=0.13下的狀態(tài)
研究發(fā)現(xiàn),在無向通訊拓撲下,當一階時滯多智能體系統(tǒng)具有加權(quán)項的時滯狀態(tài)導數(shù)反饋協(xié)議時,通過對該系統(tǒng)閉環(huán)形式極點的討論可以得出,超臨界時滯多智能體系統(tǒng)必定存在恰當?shù)姆答亸姸?,使得系統(tǒng)(1)在一致協(xié)議(3)下能夠有效提高實現(xiàn)一致收斂的速度。