李 雙, 尤 文, 曲 娜, 王正通
(長(zhǎng)春工業(yè)大學(xué) 電氣與電子工程學(xué)院, 吉林 長(zhǎng)春 130012)
智能體目前沒(méi)有一個(gè)被大家廣泛接受的準(zhǔn)確定義,從它的特性出發(fā)智能體分強(qiáng)、弱定義。從智能體特性角度說(shuō)明弱定義是有自主性、社會(huì)性、反應(yīng)性及預(yù)動(dòng)性特性的實(shí)體,在強(qiáng)定義中,智能體在弱定義基礎(chǔ)上還增加了人的特性。多智能體系統(tǒng)包含多個(gè)智能體,智能體間存在邏輯關(guān)系,可以進(jìn)行雙向、單向的傳遞狀態(tài)信息,集體共同完成一個(gè)智能體無(wú)法解決的問(wèn)題。
由于個(gè)體能力的有限性對(duì)整體問(wèn)題的解決不能產(chǎn)生很好的效果這一問(wèn)題,人類受自然界啟發(fā),在自然界中發(fā)現(xiàn)簡(jiǎn)單個(gè)體,利用簡(jiǎn)單的規(guī)則產(chǎn)生奇妙的現(xiàn)象[1]。比如昆蟲和動(dòng)物無(wú)領(lǐng)導(dǎo)的遷移現(xiàn)象、大雁有組織的飛行、沙丁魚聚集成一團(tuán)抵御攻擊、螞蟻覓食現(xiàn)象等,多個(gè)有限的個(gè)體共同協(xié)作解決復(fù)雜的問(wèn)題,此現(xiàn)象引起科學(xué)家注意,希望能夠運(yùn)用到各種生活領(lǐng)域中,如無(wú)人機(jī)編隊(duì)、水下自主航行裝置[2]、運(yùn)輸網(wǎng)絡(luò)、傳感器網(wǎng)絡(luò)、電力系統(tǒng)、通信系統(tǒng)、醫(yī)療等方面,對(duì)于科技和經(jīng)濟(jì)的發(fā)展產(chǎn)生重要意義,對(duì)人們生活產(chǎn)生重要影響。且智能體具有自治性、協(xié)作能力、通訊能力等特點(diǎn),以及多智能體系統(tǒng)功能性強(qiáng)、魯棒性好、靈活性高的優(yōu)勢(shì)。一致性理論已在電力系統(tǒng)中得到越來(lái)越多的應(yīng)用[3]。
一致性問(wèn)題主要是設(shè)計(jì)一個(gè)一致性算法,它能保證系統(tǒng)中所有智能體的狀態(tài)最終趨于一致[4]。通過(guò)設(shè)計(jì)智能體局部之間的通信法則,使所有智能體的狀態(tài)或輸出信息最終趨于共同的值[5]。一致性包含有領(lǐng)導(dǎo)跟隨的一致性研究和虛擬領(lǐng)導(dǎo)的一致性研究[6]。對(duì)于領(lǐng)導(dǎo)者、跟隨者的問(wèn)題也是追蹤問(wèn)題,也就是控制協(xié)議令所有跟隨者的狀態(tài)與領(lǐng)導(dǎo)者的狀態(tài)一致。領(lǐng)導(dǎo)者不需要考慮網(wǎng)絡(luò)中全部智能體的狀態(tài),只需要將信息傳遞給一部分智能體。虛擬領(lǐng)導(dǎo)也是無(wú)領(lǐng)導(dǎo)的一致性問(wèn)題,也需要控制協(xié)議,令全部智能體信息狀態(tài)趨于一個(gè)平衡值,但是這個(gè)平衡值不能提前設(shè)定,并且與全部智能體的初始狀態(tài)有關(guān)。目前多智能體已經(jīng)滲透到很多行業(yè)領(lǐng)域,為使微網(wǎng)內(nèi)部功率平衡實(shí)時(shí)調(diào)節(jié)控制,采取協(xié)調(diào)控制的方法合理對(duì)分布式電源出力調(diào)節(jié)[7]。提出一種利用多智能體系統(tǒng)研究配電系統(tǒng)管理的方法,模擬配電系統(tǒng)的特性[8]。文中主要研究領(lǐng)導(dǎo)跟隨一致性。
多智能體系統(tǒng)中通信網(wǎng)絡(luò)用圖G(V,e,A)表示,V={v1,v2,…,vi,…,vn}為節(jié)點(diǎn)集,i={1,2,…,n},n為節(jié)點(diǎn)總數(shù),(vi,vj)∈e構(gòu)成邊集,表示從智能體vj向vi傳遞信息,A=(aij)表示加權(quán)鄰接矩陣,aij表示從vi指向到vj的連接權(quán)值,用bi表示多智能體與領(lǐng)導(dǎo)者間的權(quán)值,當(dāng)領(lǐng)導(dǎo)者與跟隨者之間存在通信時(shí),bi>0,vi節(jié)點(diǎn)總數(shù)稱為入度,從vi發(fā)出的總數(shù)稱為出度,vi能夠接收鄰居節(jié)點(diǎn)的信息,同時(shí)將自己的信息傳遞給其鄰居節(jié)點(diǎn)。L是圖G的Laplacian矩陣L=D-A,D是圖G的度矩陣。取
(1)
設(shè)領(lǐng)導(dǎo)者動(dòng)態(tài)模型為
(2)
一階智能體動(dòng)力學(xué)描述為
(3)
式中:x0----領(lǐng)導(dǎo)者狀態(tài)信息;
ui----控制輸入。
使用一致性協(xié)議為
(4)
式中:Ni----節(jié)點(diǎn)鄰居節(jié)點(diǎn)的集合;
D1=xj(k)-xi(k);
D2=x0(k)-xi(k)。
定義當(dāng)t→時(shí),有
則領(lǐng)導(dǎo)跟隨智能體系統(tǒng)趨于一致。
“大信不約,好校長(zhǎng)何止十百,大愛(ài)無(wú)疆,好老師何止百千,大成不反,好學(xué)生何止千萬(wàn),大道不違,好學(xué)校就在此間。”這是屈哨兵局長(zhǎng)在《廣州教育賦》中的話,但絕非詩(shī)意的虛言。隨著“好教育進(jìn)行時(shí)”現(xiàn)場(chǎng)報(bào)告會(huì)對(duì)于廣州好教育的展示、“教育熱點(diǎn)面對(duì)面”電視節(jié)目對(duì)廣州好教育的討論、“媒體探營(yíng)”小組深入“家門口的好學(xué)?!边M(jìn)行采訪,隨著向全社會(huì)征集好教育的標(biāo)準(zhǔn),由全社會(huì)評(píng)選家門口的好學(xué)校,不知不覺(jué)間,好學(xué)校、好校長(zhǎng)、好教師、好學(xué)生、好的教育生態(tài)這些廣州教育發(fā)展的關(guān)鍵詞已經(jīng)掛在老百姓的嘴邊。
令
ηi=xi-x0,
所以當(dāng)t→時(shí),有
多智能體系統(tǒng)達(dá)到一致。
令
η=[η1,η2,…,ηn]T,
所以有
(5)
式中:F1=xj(k)-x0(k);
F2=xi(k)-x0(k)。
矩陣形式表示為
(6)
故當(dāng)式(6)穩(wěn)定時(shí),系統(tǒng)實(shí)現(xiàn)一致,也即-(L+B)特征值在復(fù)平面左半平面時(shí)系統(tǒng)穩(wěn)定。
為驗(yàn)證多智能體領(lǐng)導(dǎo)跟隨一致性,給出了一個(gè)領(lǐng)導(dǎo)者、三個(gè)跟隨者,假設(shè)多智能體系統(tǒng)的網(wǎng)絡(luò)拓?fù)鋱DG如圖1所示。
圖中,標(biāo)號(hào)為0的為領(lǐng)導(dǎo)者,其余三個(gè)為跟隨者,智能體之間的通信用線連接,智能體間的權(quán)值為1。
系統(tǒng)無(wú)向拓?fù)浣Y(jié)構(gòu)的鄰接矩陣A為
(7)
根據(jù)圖1可以得到跟隨者拉普拉斯變換矩陣L,并求出相應(yīng)的B。
(8)
根據(jù)以上信息,當(dāng)初值為x1=105,x2=85,x3=105,x0=0時(shí),用MATLAB進(jìn)行仿真,仿真結(jié)果如圖2所示。
在多智能體系統(tǒng)中,智能體之間相互通信,并在一致性協(xié)議下,經(jīng)過(guò)一定時(shí)間,跟隨者最終會(huì)與領(lǐng)導(dǎo)者保持一致,達(dá)到追蹤一致性。