董朝陽,張文強,王 青
(1. 北京航空航天大學航空科學與工程學院,北京 100191;2. 北京航空航天大學自動化科學與電氣工程學院,北京 100191)
近些年來,多智能體編隊控制的研究和應用吸引了很多學者和專家的關注。其廣泛應用在無人機[1-2],航天器[3-4],移動機器人[5-6],水面艦艇[7-8],水下機器人[9-10]等領域。多智能體編隊的核心問題是如何利用有限的鄰域信息來構建控制律從而實現(xiàn)全局穩(wěn)定編隊[11]。Ren曾在文獻[12]中提出基于協(xié)同理論的方法框架來解決編隊問題。之后,基于這種框架的多智能體編隊控制研究就成為了全新熱點。
作為現(xiàn)代發(fā)展迅速的運載器,無人機作為應用對象廣泛地出現(xiàn)在多智能體編隊的研究成果中。文獻[12-13]研究了飛行器二階系統(tǒng)時不變編隊控制問題。然而,在實際應用過程中,比如無人機合圍或追蹤任務,時不變編隊顯然無法滿足任務需求。為此,文獻[14-15]對無人機二階系統(tǒng)的時變編隊控制問題展開廣泛研究。然而上述成果都是基于無向通信拓撲,這意味著無人機間的通信是雙向的,這在編隊控制過程中不僅是不必要的,而且也是對通信資源的極大浪費。為此,基于有向拓撲通信的無人機時變編隊控制成為了更具有實際應用價值的研究方向[16-17]。
此外,無人機編隊控制中另一個十分重要的問題就是如何處理編隊過程中出現(xiàn)的不確定性。文獻[18]針對多無人機時變編隊問題,提出了在切換拓撲下的分布式編隊控制律,然而該文獻中的控制方法沒有考慮不確定性帶來的影響,因此在無人機集群編隊的實際應用過程中會存在一些局限性。無人機在實際運行過程中可能遇到的不確定性十分復雜,具體可能包括無人機本身產生的未知非線性動態(tài),或者外部產生的各種時變干擾。近來,一些學者注意到了這些問題,展開了一些研究[13,19-20]。文獻[19]和文獻[20]分別通過構建終端滑模觀測器和擴張狀態(tài)觀測器(Extended state observer,ESO)來估計和補償不確定性,然而他們研究的是編隊跟蹤問題,需要有領導者飛行器才能使編隊得以實現(xiàn)。文獻[13]利用反步控制方法和指令濾波器設計提出了一種魯棒自適應控制策略,從而有效解決航天器受到的時不變干擾,但對于時變干擾和模型不確定動態(tài)難以奏效?;谏鲜鰡栴},本文針對存在內部不確定非線性動態(tài)和外部時變干擾的多無人機系統(tǒng),開展了基于有向通信拓撲的抗擾時變編隊控制問題研究。
符號R代表實數(shù)集,Rn×n和Rn分別代表n階方陣和n維列向量。IN代表N階單位矩陣,1表示元素都為1的列向量,?代表克羅內克積。對于方陣A,λ(Α)代表方陣A的特征值,AT代表方陣A的轉置。
對于有向拓撲圖G,其拉普拉斯矩陣L具有如下性質。
引理1[21]. 如果有向拓撲圖G具有至少一個有向生成樹,那么其拉普拉斯矩陣L具有一個對應特征向量為1的簡單特征值1,并且其他非零特征值具有正實部。
考慮如下N個帶有不確定非線性動態(tài)和外部時變干擾的二階無人機系統(tǒng)
(1)
式中:i∈{1,2,…,N},fi(xi,vi)∈R是連續(xù)可微的未知函數(shù),代表多無人機系統(tǒng)的未知非線性動態(tài)。di(t)∈R是外部時變干擾,yi(t)∈R是系統(tǒng)輸出。
di(t)+ui(t))
(2)
假設1.有向拓撲圖G至少包含一條有向生成樹。
定義多無人機系統(tǒng)(2)的擴張狀態(tài)為
ζi(t)=fi(xi,vi)+di(t)
(3)
則分布式ESO可以設計為
(4)
(5)
根據(jù)多無人機系統(tǒng)(2)和擴張狀態(tài)觀測器(4),定義觀測誤差向量為ηi(t)=[ηx,i(t),ηv,i(t),ηζ,i(t)]T,i∈{1,2,…,N}
(6)
可以得到觀測誤差的動態(tài)為
(7)
為了實現(xiàn)基于有向拓撲通信的多無人機系統(tǒng)的抗擾時變編隊,提出編隊控制律
(8)
值得注意的是ESO的ε值為了觀測器性能要取得盡量小,但是會導致“peaking”現(xiàn)象,嚴重影響系統(tǒng)穩(wěn)定性。為避免這種影響,本文將控制律優(yōu)化設計為sat(ui(t)),i∈{1,2,…,N},飽和函數(shù)sat(·)∈R為標準的飽和函數(shù),定義為sat(ui(t))=sgn(ui(t))·min{Ui,|ui(t)|},i∈{1,2,…,N},其中Ui為第i個無人機的控制飽和限幅。
注釋2.本文提出的控制律(8)是對多無人機系統(tǒng)而言更為一般形式的控制律,一些已有文獻中的編隊控制律可以看作是控制律(8)的一種不考慮干擾的特殊形式,例如文獻[18]。
(9)
(10)
(11)
(12)
(13)
注釋3.如果多無人機系統(tǒng)(9)能夠實現(xiàn)抗擾時變編隊h(t),從定義1可知,編隊參照函數(shù)c(t)描述了編隊整體的運行軌跡。通過文獻[22]中的定理2可知,c(t)的具體表達式可以從式(12)直接得出。
(14)
算法1.控制律(8)的參數(shù)確定可遵循以下四個步驟:
1)選擇合適的參數(shù)矩陣K1來調整A+BK1的特征值,從而來設計編隊參照函數(shù)c(t)的運動軌跡。為了讓編隊整體運行能夠在可視范圍內,K1的選取一般使得A+BK1是Hurwitz的。因為(A,B)的可控性,所以K1存在。
2) 給定一個正數(shù)κ,解下列線性矩陣不等式(LMI)得到對稱正定矩陣E
(A+BK1)E+E(A+BK1)T-BBT+κE<0
(15)
值得注意的是E的存在也可以通過(A,B)的可控性來保證。
3)參數(shù)矩陣K2可以通過下式得到
K2=BTE-1
(16)
(17)
根據(jù)算法1和引理1~2,多無人機系統(tǒng)(9)的編隊實現(xiàn)充要條件在下列定理中提出。
定理1.考慮帶有不確定非線性動態(tài)和外部時變干擾的多無人機系統(tǒng)(9),如果編隊控制律按照算法1設計,假設1-3都滿足,而且控制量飽和限幅Ui,i∈{1,2,…,N}可以合適選取。那么對于任意初始狀態(tài),整個多無人機閉環(huán)系統(tǒng)對于任意t*>0,在t∈[t*,∞)上滿足
(18)
并且多無人機系統(tǒng)(9)可以實現(xiàn)時變編隊h(t)的充要條件為:對于i,j∈{1,2,…,N},i≠j,
(19)
為了證明定理1,首先需要證明兩個命題。
命題1.多無人機系統(tǒng)(9)實現(xiàn)抗擾時變編隊當且僅當
(20)
(21)
其中
(22)
(23)
(Ue1)?φ1(t)=1N?φ1(t)
(24)
(25)
為了進一步分析,考慮下列準李雅普諾夫函數(shù)
(26)
(27)
(28)
擴張狀態(tài)ζi(t)對時間的導數(shù)為
(29)
(30)
(31)
根據(jù)式(7),(30)和(31),Vi(ηi)在時間間隔[0,t2]內的導數(shù)可以寫成
(32)
(33)
由式(32),Vη(η)的導數(shù)滿足
(34)
(35)
有式(35)成立,那么在時間區(qū)間[0,t2]內有
(36)
(37)
將式(16)代入式(37)可以得到
(38)
(39)
從式(14),(15)和(39)可得
(40)
將式(17)代入式(40)中可得
(41)
注釋4.從命題2的證明過程中可以發(fā)現(xiàn),存在合適的控制輸入限幅Ui,i∈{1,2,…,N}使得觀測器導致的控制輸入“Peaking”現(xiàn)象得以避免,同時該限幅在閉環(huán)系統(tǒng)穩(wěn)定階段可以不發(fā)揮作用。
定理1證.通過命題1知道多無人機系統(tǒng)(9)實現(xiàn)抗擾時變編隊當且僅當式(20)成立。從式(13)可知,對于任意初始狀態(tài),式(20)成立當且僅當
(42)
(43)
同時成立并且線性系統(tǒng)(27)漸進穩(wěn)定。
為了證明直觀,式(42)可以等價地寫成如下形式
(44)
式中:
充分性:如果式(19)成立,對于?i∈{1,2,…,N}和j∈Qi,可以得到
(45)
進而可以得到
(46)
將L=UJU-1代入式(46)并且兩邊同時乘以U-1?I2可以得到
(47)
即條件(19)對于式(44)的成立是充分的。
(48)
(1N-1?I2)SN(t))=0
(49)
(50)
從式(50)可知,對于任意i∈{1,2,…,N}和j∈Qi有
(51)
所以結合αi(t)和βi(t)的結構,并考慮假設1,可以得到條件(19)成立,所以條件(19)是式(44)成立的必要條件。由此,條件(19)是式(42)的充要條件,即定理1得證。
注釋 5.值得注意的是條件(19)的滿足在理論上可以確保多無人機系統(tǒng)隨著ε→0和t→∞是漸進穩(wěn)定的,但是實際應用中參數(shù)ε可以取得很小但并不能取0。因此,該多無人機系統(tǒng)編隊的穩(wěn)定性收斂實際上是一種工程意義上的收斂。
這部分,通過對由6個無人機組成多無人機系統(tǒng)進行仿真來對上述理論進行驗證。通信權重為0-1的有向通信拓撲G0結構如圖1所示。
圖1 通信有向拓撲G0Fig.1 Directed interaction topology G0
該仿真考慮在一個三維立體空間(XYZ)內進行。定義γi(t)=[xiX(t),viX(t),xiY(t),viY(t),xiZ(t),viZ(t)]T,每個無人機的動態(tài)可以重新寫為
6個無人機的不確定性定義為
i∈{1,2,…,6}
該多無人機系統(tǒng)期望實現(xiàn)一個位置和速度都在三維空間繞時變編隊參考函數(shù)c(t)旋轉的六邊形,并且該六邊形隨著c(t)的運動而運動。則時變編隊函數(shù)定義為hi(t)=[hx,iX(t),hv,iX(t),hx,iY(t),hv,iY(t),hx,iZ(t),hv,iZ(t)]T,i∈{1,2,…,6}
多無人機系統(tǒng)的初始狀態(tài)取xi(0)=[i(2Θ-1),i(2Θ-1),i(2Θ-1)]T,vi(0)=[0.5i(Θ-0.5),0.5i(Θ-0.5), 0.5i(Θ-0.5)]T,i∈{1,2,…,6},其中Θ是0~1之間的一個隨機數(shù)。
圖2是六個無人機的位置和速度分別在t=0 s,t=10 s,t=20 s時的編隊情況??梢郧宄乜吹?,多無人機系統(tǒng)在t=10 s和t=20 s時,位置和速度都已經穩(wěn)定的實現(xiàn)了編隊,并且六邊形編隊繞著編隊中心不停旋轉,因而該編隊是時變的。圖3是多無人機系統(tǒng)的編隊誤差曲線,從中可以清楚地看到多無人機系統(tǒng)的編隊誤差在3 s左右收斂到0附近,證明在本文提出的控制律下,存在不確定非線性動態(tài)和外部時變干擾的多無人機系統(tǒng)可以快速穩(wěn)定地實現(xiàn)時變編隊。圖4是整個閉環(huán)多無人機系統(tǒng)的ESO真實觀測誤差曲線。從中可見,整個閉環(huán)多無人機系統(tǒng)的ESO觀測誤差在很短的時間內收斂,時間遠遠小于多無人機系統(tǒng)編隊收斂時間,這也印證了本文的控制律設計基于ESO穩(wěn)定的前提的正確性和合理性。
圖2 多無人機系統(tǒng)的位置和速度分別在t=0 s,t=10 s,t=20 s時的編隊情況Fig.2 Position and velocity trajectory snapshots of the six UAVs at t=0 s,t=10 s and t=20 s
綜上,該仿真證明了存在復雜不確定性的多無人機系統(tǒng)(9),在提出的基于ESO的控制律(8)下,只要滿足條件(19),就可以穩(wěn)定實現(xiàn)抗擾時變編隊。
在文獻[18]中,針對多無人機系統(tǒng)提出的時變編隊控制律如下式所示
(52)
可見在上述編隊控制律中,不包含任何抗擾因素,為了對比驗證,結合文獻[18]考慮具有下面動態(tài)特性的多無人機系統(tǒng)
圖3 多無人機系統(tǒng)的編隊誤差曲線Fig.3 Formation error of the multi-UAV system
圖4 多無人機系統(tǒng)的ESO真實觀測誤差Fig.4 The real observation error of ESOs
(53)
式中:di(t)取值與第3.1節(jié)中相同,α=[αx,αv]=K1=[-1,-1.2],K=K2=[1.0429,1.4787],其他仿真條件和第3.1節(jié)中完全相同。圖5顯示了存在外部擾動情況下控制律(53)的仿真結果。和圖2對比可見,在存在外部干擾di(t)的情況下,控制律(53)無法實現(xiàn)預設的時變編隊,而本文提出的控制律(8)則可以很好的實現(xiàn)。
圖5 文獻[18]在存在干擾的情況下分別在t=0 s,t=10 s,t=20 s時的編隊情況Fig.5 The formation snapshots with external disturbance of the six UAVs at t=0 s,t=10 s and t=20 s under the protocol in [18]
本文針對存在不確定非線性動態(tài)和外部時變干擾的多無人機系統(tǒng)編隊問題,提出了基于ESO的編隊抗擾控制方法。首先建立分布式ESO對多無人機系統(tǒng)的不確定性進行估計,基于ESO的輸出設計抗擾控制器,并提出算法對控制器進行參數(shù)選定。同時通過理論分析得出多無人機系統(tǒng)實現(xiàn)抗擾時變編隊的充分必要條件,并給出嚴格的理論證明。最后給出的仿真實例說明了理論成果的正確性和有效性。