楚東港,劉 燁
(上海工程技術(shù)大學(xué),上海 201620)
目前多智能體系統(tǒng)已在飛行器的編隊、分布式傳感器網(wǎng)絡(luò)、多機械臂協(xié)同裝備以及網(wǎng)絡(luò)的資源分配等領(lǐng)域廣泛應(yīng)用[1-2]。多智能體系統(tǒng)經(jīng)過廣大學(xué)者多年深入研究,不論低階亦或高階系統(tǒng)都已有許多成果。其中的一致性控制問題得到了廣泛的關(guān)注,而基于自適應(yīng)控制的分布式一致性控制方法則是在多智能體系統(tǒng)問題研究過程誕生的重要方法。需要注意的是,使用傳統(tǒng)遞歸控制方法處理高階系統(tǒng)問題時,文獻[3]中存在的“微分爆炸”難題將無法避免,這會大幅度的提高計算的復(fù)雜度。為了克服“微分爆炸”難題,文獻[4-5]引入了基于一階低通濾波器的動態(tài)面控制技術(shù)解決了“微分爆炸”難題,降低了計算負擔(dān)。但是使用動態(tài)面控制技術(shù)會引入濾波器誤差,這會影響控制精度。而文獻[6-8]使用了基于正可積時變函數(shù)的新型非線性濾波器,該濾波器可完全補償邊界層誤差,但會在每一步增加一個自適應(yīng)項,過多的自適應(yīng)項會增加計算復(fù)雜性。得益于命令濾波器的出現(xiàn),在原有的濾波器的基礎(chǔ)上引入了動態(tài)的補償方程[9-10],從而消除了濾波器誤差。但是文獻[9-10]中所使用的動態(tài)補償方程中含有符號函數(shù),這將增加系統(tǒng)的抖振行為,不利于系統(tǒng)的穩(wěn)定。隨著多智能體系統(tǒng)在各個領(lǐng)域內(nèi)的發(fā)展,系統(tǒng)的內(nèi)部問題存在著多樣性以及復(fù)雜性等特征,這極大地提高了控制器算法設(shè)計的難度。文獻[11]為解決非線性嚴格反饋多智能體系統(tǒng)的有限時間一致控制問題,通過逆向設(shè)計,構(gòu)造了針對各智能體的自適應(yīng)模糊跟蹤控制器,從而保證了所有智能體的輸出能夠在有限的時間內(nèi)跟蹤一個共同的期望軌跡,一致性誤差卻未收斂到零。而本文的最終控制目標(biāo)是在有限的時間獲得優(yōu)秀的控制性能,并且當(dāng)時間趨于無窮時,一致性誤差漸近收斂至零。
值得注意的是,隨著工業(yè)界對精度要求的不斷提高,基于智能材料的執(zhí)行器逐漸被應(yīng)用,例如壓電陶瓷和離子聚合物金屬復(fù)合材料等,但是它們也有非光滑、非線性等多重特性,磁滯的存在會嚴重影響控制系統(tǒng)精確性和穩(wěn)定性[12]。通常解決非線性磁滯輸入的方法一般有2種方式:一是通過設(shè)計自適應(yīng)磁滯逆控制器來補償磁滯現(xiàn)象[13];另一個則是類似于文獻[14]對磁滯的處理方法,將磁滯現(xiàn)象建模為線性項和非線性項,通過自適應(yīng)算法消除磁滯的影響。而常見的模型有死區(qū)磁滯模型、PI磁滯模型和Bouc-Wen磁滯模型等。本文將使用Bouc-Wen磁滯模型來描述執(zhí)行器的磁滯現(xiàn)象。
綜上所述,對于具有未知磁滯輸入、未知非線性函數(shù)和未知外部擾動的多智能體系統(tǒng),有必要開發(fā)一種新的自適應(yīng)控制算法,該算法不僅可以消除磁滯輸入和未知非線性的影響,還可以使此系統(tǒng)在有限的時間內(nèi)達到規(guī)定的性能要求,并且一致性誤差漸近收斂至零。本文提出了一種新的基于命令濾波器的有限時間分布式自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制算法,主要貢獻如下:
(1) 本文基于文獻[15-17],進一步構(gòu)造了新型性能函數(shù),提出了基于新型性能函數(shù)的有限時間Funnel控制方案,不僅使得一致性誤差具有良好的瞬態(tài)性能和快速的收斂速度還實現(xiàn)了有限時間內(nèi)達到預(yù)設(shè)置的跟蹤性能要求。
(2) 不同于文獻[9-10],本文改進了命令濾波器的補償項,將其中的符號函數(shù)改進為光滑的反正切函數(shù),避免了可能出現(xiàn)的抖振問題,通過此補償項補償了動態(tài)面控制技術(shù)所具有的邊界層誤差,并結(jié)合有界正時變積分函數(shù),最終實現(xiàn)了一致性誤差漸近收斂至零。
(3) 通過使用命令濾波器,解決了傳統(tǒng)遞歸方法固有的“微分爆炸”難題,降低了計算負擔(dān)。
考慮如下包含未知磁滯輸入、未知非線性函數(shù)和未知外部干擾的多智能體系統(tǒng)
(1)
式中:xi=(xi,1,…,xi,ni)T∈ni和yi分別是智能體的狀態(tài)和輸出;di=[di,1(t),…,di,ni(t)]T∈ni表示未知外部擾動;fi=[fi,1(xi,1),…,fi,ni(xi,1…xi,ni)]T∈ni表示未知的光滑非線性函數(shù);ui為控制輸入,作為磁滯執(zhí)行機構(gòu)的輸入;Hi(ui)則為輸出,其數(shù)學(xué)表達式被定義為
(2)
(3)
式中:|||χi|||、Ψi分別與振幅和磁滯形狀相關(guān)的未知參數(shù);mi≥1;,ζi為有界的連續(xù)函數(shù)[7,19]。
由于本文的控制目標(biāo)是領(lǐng)導(dǎo)者-跟隨者輸出一致,在這里將領(lǐng)導(dǎo)者的動力學(xué)方程定義為
(4)
式中:f(x)為光滑的非線性函數(shù);y為領(lǐng)導(dǎo)者的輸出。
為了實現(xiàn)對非線性多智能體系統(tǒng)式(1)的控制目標(biāo),現(xiàn)提出如下假設(shè)和引理:
假設(shè)1:在系統(tǒng)式(1)中,只存在一個以領(lǐng)導(dǎo)者作為根節(jié)點的有向樹。
假設(shè)2:領(lǐng)導(dǎo)者的輸出y及其一二階導(dǎo)數(shù)均為光滑的有界函數(shù)。
假設(shè)3:存在2個光滑可積的正時變函數(shù)ωi(t)和σi(t)滿足
(5)
假設(shè)4:系統(tǒng)式(1)中的未知擾動滿足
(6)
式中hi將在下文中被定義。
引理[7]1:對于正常數(shù)λ以及ρ∈R,滿足
(7)
引理[18]2:對于正常數(shù)η以及γ∈R,滿足
0≤|||γ|||-γtanh(γ/η)≤δη
(8)
式中δ=0.278 5。
引理[11]3:對于未知的連續(xù)函數(shù)f(x)可以使用徑向基神經(jīng)網(wǎng)絡(luò)函數(shù)逼近,可將f(x)表示為
f(x)=θTφ(x)+ε(x)
(9)
式中φ(x)=[φ1(x),…,φl(x)]T∈l是基函數(shù)向量;ε(x)為逼近誤差;l>1是神經(jīng)元的個數(shù);選取如下高斯徑向基函數(shù)
(10)
式中:μm=[μm,1,…,μm,q]T為高斯徑向基函數(shù)的中心點坐標(biāo)矢量;m=1,…,l;σ為高斯徑向基函數(shù)的寬度;θ=[θ1,…,θl]T∈l為神經(jīng)網(wǎng)絡(luò)權(quán)值,被定義為
(11)
式中Ω∈R。
本文基于新型有限時間性能函數(shù),為系統(tǒng)(1)設(shè)計了分布式有限時間自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制方案。具體的設(shè)計過程如下:
根據(jù)文獻[7,9]等所描述的圖論知識,定義一致性誤差為
(12)
選取命令濾波器為
(13)
在此將一致性誤差轉(zhuǎn)換函數(shù)定義為
(14)
式中Fφi為新型性能函數(shù)。Fφi被定義為
(15)
(16)
式中:Tc為正的設(shè)計參數(shù);hi,0≥1為性能函數(shù)的初始值;0 (17) (18) 故在時間(T,Tc)內(nèi),函數(shù)H存在小于0的值,證明完畢。 在以往的文獻中,Funnel控制是一種利用時變控制增益來控制已知的相對一階或二階高增益系統(tǒng)的控制方法,而文獻[16]通過構(gòu)造誤差轉(zhuǎn)換函數(shù)從而消除了階數(shù)的限制。結(jié)合文獻[15-17]以及本文提出的新型性能函數(shù),本文提出了一種新的有限時間Funnel控制方案。 求得ei,1的一階導(dǎo)數(shù)為 (19) 此外還要對濾波器輸入與輸出之間的邊界層誤差進行補償,得到被補償后的位置誤差變量為 si,j=ei,j-ξi,j,j=1,…,ni (20) 式中ξi,j為改進的誤差補償變量。 (21) (22) (23) (24) (25) 為步驟1選取如下Lyapunov函數(shù) (26) (27) (28) (29) (30) 為步驟j選取如下李雅普諾夫函數(shù) (31) (32) (33) (34) (35) (36) (37) 為步驟ni選取Vi,ni為 (38) (39) (1)閉環(huán)系統(tǒng)內(nèi)的所有信號半全局一致有界; (2)跟隨者子系統(tǒng)能夠在有限的時間內(nèi)跟蹤領(lǐng)導(dǎo)者的輸出,達到預(yù)定義的性能指標(biāo),且一致性誤差漸近收斂至0。 為證明上述定理,首先定義緊集Ω1和Ω2為 (40) 式中R1和R2為正常數(shù)。 現(xiàn)將整體系統(tǒng)的李雅普諾夫函數(shù)選取為 (41) 對式(41)求導(dǎo)并將式(39)代入可得 (42) 進而在區(qū)間[0,t]對其積分,可得: (43) (44) (45) 求得式(44)的一階導(dǎo)數(shù),并將式(45)代入則有 (46) (47) 多機械臂系統(tǒng)的仿真分析動力學(xué)模型[20]為 (48) 結(jié)合本文所研究的內(nèi)容,可將式(48)建模為: (49) 式(49)代表著由4個單連桿機械臂子系統(tǒng)組成的多智能體系統(tǒng),其領(lǐng)導(dǎo)者以及子系統(tǒng)之間的通信情況由圖1所示的通信拓撲圖決定。圖1中節(jié)點0表示領(lǐng)導(dǎo)者,節(jié)點1~4表示跟隨者,可知:hi=1,a1,0=a2,1=a3,1=a4,3=1,其余皆為0。 圖1 通訊拓撲結(jié)構(gòu) 為使得各個跟隨子系統(tǒng)的輸出均與領(lǐng)導(dǎo)者輸出y=0.5sin(t)趨于一致,設(shè)置機械臂系統(tǒng)、補償項和磁滯執(zhí)行器中的參數(shù)為:0.08,hi,0=1;ρi=0.5,i=2,χi=0.5,Ψi=1,mi=3。 本文將跟隨者的狀態(tài)x1,1(0),x2,1(0)的初始值設(shè)計為0.05,其余狀態(tài)初始值皆設(shè)計為0。仿真結(jié)果如圖2~圖5所示,圖2展示了跟隨者跟蹤領(lǐng)導(dǎo)者輸出的情況;圖3展示了在新型有限時間Funnel控制下的一致性誤差收斂情況;圖4為實際控制輸入信號的變化曲線;圖5為磁滯回路曲線。圖2中跟隨者1,2,3曲線較為近似,所以難以區(qū)分。 圖2 子系統(tǒng)輸出跟蹤領(lǐng)導(dǎo)者輸出的性能 圖3 一致性誤差 圖4 控制輸入信號曲線 圖5 磁滯回路曲線 本文研究了具有未知磁滯輸入、未知非線性函數(shù)和外部干擾的多智能體系統(tǒng)的領(lǐng)導(dǎo)者-跟隨者一致性控制問題。首先,為保證系統(tǒng)的跟蹤性能,本文提出了基于新型性能函數(shù)的有限時間Funnel控制方案,使得跟隨者能夠在有限的時間內(nèi)跟蹤領(lǐng)導(dǎo)者的輸出;其次我們利用徑向基神經(jīng)網(wǎng)絡(luò)函數(shù)消除了未知的非線性;最后,令虛擬控制律通過命令濾波器,從而解決了傳統(tǒng)遞歸方法的微分爆炸問題,并且改進了命令濾波器的補償項,避免了由于補償項符號頻繁改變帶來的抖振現(xiàn)象,還補償了邊界層誤差。上述的實例仿真結(jié)果也驗證了本文控制方案的有效性。3 穩(wěn)定性分析
4 仿真分析
5 結(jié)論