鄭曉宏,董國(guó)偉,周 琪,魯仁全
(廣東工業(yè)大學(xué)廣東省智能決策與協(xié)同控制重點(diǎn)實(shí)驗(yàn)室,廣東廣州 510006)
近年來(lái),多智能體系統(tǒng)協(xié)同控制在傳感器網(wǎng)絡(luò)、移動(dòng)機(jī)器人和無(wú)人機(jī)編隊(duì)等眾多領(lǐng)域有著巨大的應(yīng)用前景[1–6],而一致性跟蹤問(wèn)題作為多智能體系統(tǒng)協(xié)同控制的基本問(wèn)題之一,更是受到了專家學(xué)者的廣泛關(guān)注[7–13].文獻(xiàn)[11]將代數(shù)圖論與控制方法相結(jié)合研究了二階多智能體的一致性問(wèn)題.針對(duì)高階非線性多智能體系統(tǒng),文獻(xiàn)[12–13]提出了自適應(yīng)神經(jīng)網(wǎng)絡(luò)一致性控制方案.眾所周知,隨機(jī)干擾在工程系統(tǒng)中往往是不可避免的,是影響系統(tǒng)穩(wěn)定的主要因素之一,因此對(duì)于隨機(jī)系統(tǒng)的研究一直是控制領(lǐng)域的熱點(diǎn)[14–17].文獻(xiàn)[15]提出人工勢(shì)場(chǎng)法解決了一類隨機(jī)多智能體編隊(duì)的避障問(wèn)題.文獻(xiàn)[16–17]利用反步法技術(shù)討論了一類隨機(jī)多智能體系統(tǒng)的自適應(yīng)控制.但由于反步法的應(yīng)用需要對(duì)系統(tǒng)中的虛擬控制器進(jìn)行反復(fù)求導(dǎo),會(huì)造成“復(fù)雜性爆炸”問(wèn)題.為了克服這個(gè)困難,文獻(xiàn)[18]針對(duì)一類嚴(yán)格反饋非線性系統(tǒng),引入了動(dòng)態(tài)面技術(shù),在此基礎(chǔ)上設(shè)計(jì)了魯棒自適應(yīng)跟蹤控制算法.文獻(xiàn)[19]則結(jié)合動(dòng)態(tài)面技術(shù)解決了帶有死區(qū)輸入的嚴(yán)格反饋隨機(jī)多智能體系統(tǒng)的控制問(wèn)題.
值得注意的是,以上提及的研究成果不能直接應(yīng)用于非嚴(yán)格反饋形式的系統(tǒng)中,相比于嚴(yán)格反饋系統(tǒng),非嚴(yán)格反饋系統(tǒng)中的非線性項(xiàng)包含了所有的狀態(tài)變量,采用上述控制方法如傳統(tǒng)的反步法進(jìn)行控制器設(shè)計(jì)會(huì)產(chǎn)生代數(shù)環(huán)問(wèn)題.文獻(xiàn)[20–21]運(yùn)用神經(jīng)網(wǎng)絡(luò)的性質(zhì)突破了傳統(tǒng)反步法控制設(shè)計(jì)應(yīng)用于非嚴(yán)格反饋系統(tǒng)的限制.盡管現(xiàn)有研究對(duì)非線性隨機(jī)系統(tǒng)的自適應(yīng)控制研究已經(jīng)取得了很大進(jìn)展,但卻很少有同時(shí)考慮輸出約束和執(zhí)行器故障對(duì)非嚴(yán)格反饋隨機(jī)多智能體系統(tǒng)造成的影響.
事實(shí)上,許多控制系統(tǒng)需要系統(tǒng)輸出保持在一定范圍內(nèi),否則在系統(tǒng)運(yùn)行過(guò)程中會(huì)導(dǎo)致性能下降.對(duì)此,利用障礙李雅普諾夫函數(shù)特性能為處理輸出約束問(wèn)題提供有效途徑[22–25].另一方面,控制系統(tǒng)會(huì)因復(fù)雜的工作環(huán)境、部件老化等因素的影響發(fā)生故障,故障的存在嚴(yán)重影響了系統(tǒng)的穩(wěn)定性,甚至?xí)斐砂踩[患,所以研究系統(tǒng)的故障問(wèn)題是十分有必要的[25–29].基于以上討論,本文對(duì)含有輸出約束和執(zhí)行器故障的非嚴(yán)格反饋的隨機(jī)多智體系統(tǒng),提出自適應(yīng)神經(jīng)網(wǎng)絡(luò)容錯(cuò)控制的設(shè)計(jì)方案.
本文的主要貢獻(xiàn)如下:1)采用的系統(tǒng)模型為非嚴(yán)格反饋形式的非線性隨機(jī)多智能體系統(tǒng),更具有一般性.此外,系統(tǒng)中的隨機(jī)干擾和非線性項(xiàng)是完全未知的,且消除了一般研究中隨機(jī)干擾的有界假設(shè);2)在反步法設(shè)計(jì)中結(jié)合動(dòng)態(tài)面技術(shù)解決“復(fù)雜性爆炸”問(wèn)題的同時(shí),引入神經(jīng)網(wǎng)絡(luò)的性質(zhì)[21],克服了非嚴(yán)格反饋形式產(chǎn)生代數(shù)環(huán)的問(wèn)題;3)基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)容錯(cuò)控制的設(shè)計(jì)方法,同時(shí)考慮輸出約束和執(zhí)行器故障問(wèn)題,使本文的控制方案更具有適用性.
本文的組織結(jié)構(gòu)如下:第2節(jié)詳細(xì)介紹了系統(tǒng)的數(shù)學(xué)模型和相關(guān)的準(zhǔn)備工作;第3節(jié)提出了一種自適應(yīng)神經(jīng)網(wǎng)絡(luò)容錯(cuò)控制設(shè)計(jì)方案及其穩(wěn)定性分析,第4節(jié)通過(guò)仿真研究驗(yàn)證了該方法的有效性;第5節(jié)對(duì)本文的工作進(jìn)行總結(jié).
為了方便系統(tǒng)分析,引入圖論知識(shí)來(lái)描述多智能體之間的通訊拓?fù)潢P(guān)系.本文用G=(?,I)表示有向圖,其中:?={?1,…,?N}代表智能體的非空節(jié)點(diǎn)集,I ??×?代表邊集合.(?j,?i)∈I表示第j個(gè)智能體能接收到第i個(gè)智能體的信息,鄰接節(jié)點(diǎn)集合表示為Ni={?j|(?j,?i)∈I}.有向圖G的通訊拓?fù)潢P(guān)系用鄰接矩陣A=[aij]∈N×N表示,其中aij0.有向圖G的拉普拉斯矩陣定義為L(zhǎng)=Λ ?A,其中Λ=為入度矩陣,為第i個(gè)智能體的入度.如果有向圖G含有生成樹,說(shuō)明至少存在一個(gè)根節(jié)點(diǎn),該根節(jié)點(diǎn)到其它任一節(jié)點(diǎn)都有有向路徑.如果節(jié)點(diǎn)0是生成樹的根節(jié)點(diǎn),定義H=diag{a10,a20,…,aN0},則矩陣L+H為非奇異.
考慮由N個(gè)跟隨者和1個(gè)領(lǐng)導(dǎo)者組成的非嚴(yán)格反饋隨機(jī)多智能體系統(tǒng),第i個(gè)多智能體的動(dòng)態(tài)模型如下:
本文考慮的執(zhí)行器故障類型為偏差和增益故障,偏差故障的表達(dá)式如下:其中wi(t)為有界函數(shù),且增益故障的表達(dá)式如下:
其中ri為未知失控率,滿足0ri <1.因此,根據(jù)文獻(xiàn)[26],結(jié)合兩種故障類型得
控制目標(biāo):針對(duì)含有輸出約束和執(zhí)行器故障的非嚴(yán)格反饋隨機(jī)多智體系統(tǒng)(1),提出一種自適應(yīng)神經(jīng)網(wǎng)絡(luò)容錯(cuò)控制的設(shè)計(jì)方案,使閉環(huán)系統(tǒng)中所有信號(hào)依概率有界,系統(tǒng)一致跟蹤誤差收斂到原點(diǎn)的鄰域內(nèi).
假設(shè)1[26]領(lǐng)導(dǎo)者的輸出信號(hào)yr是光滑函數(shù),且都有界,即
為了處理系統(tǒng)(1)中的執(zhí)行器故障問(wèn)題,本文引入了Nussbaum增益技術(shù),Nussbaum函數(shù)一般具有以下性質(zhì):
許多函數(shù)滿足以上性質(zhì),本文選擇exp(ξ2)cosξ2.
引 理1[20]定 義為Nussbaum函數(shù),其中ξi(t)在區(qū)間[0,tf]為光滑函數(shù),如果存在正定徑向無(wú)界的函數(shù)V(t,x)滿足以下不等式:
則E(V(t,x)),ξi(t)和在區(qū)間[0,tf]是有界的.其中:?為微分算子,E(·)為期望算子,ki為設(shè)計(jì)參數(shù),同時(shí)C >0和0.
考慮隨機(jī)系統(tǒng)如下:
其中:x∈為系統(tǒng)狀態(tài)向量,是r維的標(biāo)準(zhǔn)維納過(guò)程.
定義1[21]考慮系統(tǒng)(3),假設(shè)存在一個(gè)正定、徑向無(wú)界并且二次連續(xù)可微的函數(shù)V(x),其微分算子?定義如下:
其中tr{·}代表矩陣的跡.
引理2[21]給定任意精度ε>0且t →∞時(shí),存在E|yi(t)?yr(t)|4ε,則表明在有向圖下,系統(tǒng)(1)中的領(lǐng)導(dǎo)者和跟隨者之間的跟蹤誤差依概率半全局一致最終有界.
定義2[24]定義在包含原點(diǎn)的開放域Ξ的系統(tǒng)dx=f(x)dt+g(x)d?中,障礙李雅普諾夫函數(shù)V(x)為正定連續(xù)的標(biāo)量函數(shù),且其在Ξ中的每一個(gè)點(diǎn)都存在一階偏導(dǎo)數(shù),根據(jù)V(x)→∞時(shí),x收斂于Ξ的邊界的性質(zhì),則存在b為正常數(shù)且?t0時(shí),V(x(t))b成立.
本文采用的障礙李雅普諾夫函數(shù)形式如下:
其中:log(·)表示自然對(duì)數(shù),ki,b為si,1的約束.
引理3[24]對(duì)于任意的正常數(shù)ki,b,如果所有的si,1都能夠滿足|si,1| 系統(tǒng)(1)中的未知非線性函數(shù)可以用如下徑向基神經(jīng)網(wǎng)絡(luò)來(lái)逼近處理,具體形式如下: 其中:θ=[θ1θ2… θκ]T為權(quán)重向量,基函數(shù)向量表示為φ(ζ)=[φ1(ζ)φ2(ζ)… φκ(ζ)]T,并且高斯函數(shù)φi(ζ)的形式如下: 其中:i=[1 2… κ],ιi=[ιi1ιi2… ιiq]T為高斯函數(shù)的中心向量,ωi表示高斯函數(shù)的寬度.一般來(lái)說(shuō),對(duì)于定義在緊集? ?上的未知非線性函數(shù)f(ζ),能用具有足夠多節(jié)點(diǎn)的徑向基神經(jīng)網(wǎng)絡(luò)(4)逼近到任意精度?>0,即 其中:?(ζ)表示逼近誤差,??為常數(shù),θ?為理想加權(quán)向量,具體定義為θ?:= 引理4[21]狀態(tài)向量=[x1x2… xq]T,且為徑向基神經(jīng)網(wǎng)絡(luò)的基函數(shù)向量,對(duì)于任意正數(shù)pq,則 本節(jié)將對(duì)系統(tǒng)(1)設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器,首先,基于通信拓?fù)?對(duì)第i個(gè)跟隨者系統(tǒng)進(jìn)行坐標(biāo)變換如下: 其中:si,h為誤差面,zi,h為濾波誤差,αi,h和分別為虛擬控制器和濾波器輸出信號(hào).令ai0,qi,k=1,k=2,…,ni ?1.ai0為正常數(shù),表示領(lǐng)導(dǎo)者和跟隨者之間的通訊關(guān)系,當(dāng)且僅當(dāng)?shù)趇個(gè)跟隨者能夠接收到領(lǐng)導(dǎo)者的信息時(shí),ai0=1,否則ai0=0. 為了設(shè)計(jì)方便,定義以下符號(hào)和參數(shù):λi,?,li,?,μi,?,ci,?,σi,?表示正設(shè)計(jì)參數(shù);定義令為Θi,?的估計(jì),則估計(jì)誤差定義i,?=[xi,1xi,2… xi,?]T,其中?=1,…,k. 步驟1結(jié)合式(1)和式(6)可得 選取李雅普諾夫函數(shù)為 結(jié)合式(1)和式(7),則?Vi,1為 將式(9)–(11)代入式(8)中得 由Young’s不等式得 結(jié)合式(13)–(16),則式(12)可重寫如下: 為了避免對(duì)αi,2反復(fù)偏微分,定義在時(shí)間常數(shù)τi,2下,讓?duì)羒,2通過(guò)一階濾波器得到則 根據(jù)文獻(xiàn)[18],濾波誤差zi,2的動(dòng)態(tài)方程為 上式中Bi,2和Ci,2是基于式(14)中αi,2的偏導(dǎo)獲得.故存在常數(shù)滿足以下不等式: 步驟2(2kni ?1)由式(1)和式(6)可得 選取李雅普諾夫函數(shù)為 結(jié)合式(1)和式(17),則?Vi,k為 根據(jù)Young’s不等式得 將式(19)–(23)代入式(18)得 其中ηi,k為正設(shè)計(jì)參數(shù),且 由式(5)得 由Young’s不等式和引理4可得 虛擬控制器αi,k+1設(shè)計(jì)如下: 再由Young’s不等式得 結(jié)合式(25)–(29),式(24)可以重寫為 在時(shí)間常數(shù)τi,k+1下,讓?duì)羒,k+1通過(guò)一階濾波器得到則 濾波誤差zi,k+1的動(dòng)態(tài)方程表示如下: 步驟3由式(1)–(2)和式(6)可得 選取李雅普諾夫函數(shù)為 結(jié)合式(1)和式(31),則?Vi,ni為 其中 當(dāng)k=ni時(shí),將式(25)–(26)代入式(33)中,則控制器ui和ξi的動(dòng)態(tài)方程如下: 當(dāng)k=ni時(shí),應(yīng)用式(29),同時(shí)結(jié)合式(34)–(36),式(33)可化簡(jiǎn)為 根據(jù)式(37)–(39),則?V為 則式(40)可重寫為 定理1對(duì)于含有輸出約束和執(zhí)行器故障的非嚴(yán)格反饋隨機(jī)多智體系統(tǒng)(1),通過(guò)設(shè)計(jì)實(shí)際控制器(34),中間虛擬控制器(14)和(27)以及參數(shù)自適應(yīng)律(15)(28)(36),保證了閉環(huán)系統(tǒng)中的所有信號(hào)是依概率半全局一致最終有界,且通過(guò)合理選擇設(shè)計(jì)參數(shù),跟蹤誤差能夠收斂到原點(diǎn)的鄰域內(nèi). 考慮由4個(gè)跟隨者和1個(gè)領(lǐng)導(dǎo)者組成的非嚴(yán)格反饋形式的隨機(jī)多智能體系統(tǒng),具體形式如下: 領(lǐng)導(dǎo)者的輸出信號(hào)yr=sin(0.5t)+0.5 sin(1.5t).圖1表示智能體之間的通訊拓?fù)鋱D,由圖1可知,跟隨者的鄰接矩陣 且H=diag{0,1,0,0}. 圖1 通訊拓?fù)鋱DFig.1 Communication topology 選擇適當(dāng)?shù)脑O(shè)計(jì)參數(shù)為 其中i=1,2,3,4.設(shè)置跟隨者的初始狀態(tài)如下: 且設(shè)置自適應(yīng)參數(shù)的初始狀態(tài)如下: 系統(tǒng)的仿真結(jié)果如圖2–6所示.圖2為跟隨者輸出信號(hào)yi與領(lǐng)導(dǎo)者輸出信號(hào)yr的跟蹤軌跡曲線,其跟蹤誤差軌跡則由圖3表示,圖4描述了系統(tǒng)控制器ui的軌跡曲線,圖5–6則為自適應(yīng)參數(shù)的軌跡曲線.由以上仿真結(jié)果可知,本文所提出的方案保證了系統(tǒng)的穩(wěn)定性,同時(shí)驗(yàn)證了設(shè)計(jì)的控制器能保證跟蹤性能,系統(tǒng)的輸出信號(hào)能夠被限定在指定范圍內(nèi). 圖2 領(lǐng)導(dǎo)者和跟隨者的輸出信號(hào)Fig.2 Output signals of the followers and leader 圖3 跟蹤誤差si,1Fig.3 Tacking errors si,1 圖4 控制器uiFig.4 Controllers ui 圖5 自適應(yīng)參數(shù)i,1Fig.5 Adaptive parametersi,1 圖6 自適應(yīng)參數(shù)Fig.6 Adaptive parameters 本文針對(duì)一類非嚴(yán)格反饋的非線性隨機(jī)多智能體系統(tǒng),考慮了在輸出約束和執(zhí)行器故障情況下的協(xié)同控制一致性問(wèn)題,結(jié)合有向拓?fù)鋱D知識(shí)設(shè)計(jì)了一種基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)容錯(cuò)控制方案.在反步法的基礎(chǔ)上,構(gòu)造障礙李雅普諾夫函數(shù)解決了輸出約束問(wèn)題,綜合考慮動(dòng)態(tài)面技術(shù)和Nussbaum函數(shù),設(shè)計(jì)了一種有效的自適應(yīng)容錯(cuò)控制器.最后通過(guò)李雅普諾夫穩(wěn)定性定理,證明了閉環(huán)系統(tǒng)的穩(wěn)定性.本文提出的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制方案擴(kuò)展了嚴(yán)格反饋非線性系統(tǒng)的研究成果,未來(lái)的研究將把本文的結(jié)果推廣到有限時(shí)間或固定時(shí)間的非線性隨機(jī)多智能體中.2.5 徑向基神經(jīng)網(wǎng)絡(luò)
3 神經(jīng)網(wǎng)絡(luò)控制器設(shè)計(jì)和穩(wěn)定性分析
4 仿真研究
5 總結(jié)