馮 政, 吳 傲, 王謙喆
(1.空軍工程大學(xué)空管領(lǐng)航學(xué)院,西安 710000; 2.陜西省電子信息系統(tǒng)綜合集成重點實驗室,西安 710000)
對于入侵我方領(lǐng)海的以中小型海面艦艇為代表的敵方海面目標,可采用無人機集群來打擊。一是因為該類目標體積大、價值高、機動性差,是合適的“靶目標”;二是因為艦載防空系統(tǒng)主要是針對各類反艦導(dǎo)彈和飛機,應(yīng)對“低慢小”目標能力有限[1]。無人機集群利用數(shù)量多、雷達紅外特征弱的特點,攜帶多種類型的武器彈藥,從多個方向?qū)λ媾炌嵤╋柡凸鬧2],將對敵方高價值目標造成巨大威脅。
隨著未來作戰(zhàn)模式逐漸向協(xié)同化轉(zhuǎn)變,無人機協(xié)同作戰(zhàn)相關(guān)技術(shù)已成為目前的研究熱點[3]。本文重點研究協(xié)同打擊中的時空協(xié)同問題。精準的時空耦合是集群發(fā)揮協(xié)同優(yōu)勢的關(guān)鍵,從系統(tǒng)控制角度看,可將其視為帶時間參數(shù)的群系統(tǒng)編隊控制問題。
編隊控制方面的研究成果包括有限時間控制[4]、固定時間控制[5-9]以及指定時間控制[10]。有限時間控制中,系統(tǒng)在有限時間收斂,但收斂時間上界與系統(tǒng)的初始狀態(tài)有關(guān)。固定時間控制中收斂時間上界不受初始條件影響,只與參數(shù)有關(guān)[11];但是,由于固定時間控制的收斂時間與控制參數(shù)有著復(fù)雜的耦合關(guān)系,繁瑣的多調(diào)參變量和函數(shù)關(guān)系限制了固定時間控制法在集群控制中的應(yīng)用[12];與固定時間控制相比,指定時間控制要求收斂時間能獨立輸入且自由預(yù)置,具有更大的應(yīng)用潛力。文獻[13]提出了指定時間一致性問題,研究了多智能體線性系統(tǒng)指定時間控制,系統(tǒng)可以根據(jù)任務(wù)要求離線預(yù)置收斂時間,但是系統(tǒng)的期望狀態(tài)是非時變的;文獻[14]研究了多智能體系統(tǒng)的指定時間編隊控制問題,但其指定時間仍然是上限。
本文以指定時間協(xié)同控制方法為支撐,主要解決集群指定時間和指定時長協(xié)同打擊問題。
無人機集群對海上目標發(fā)起協(xié)同打擊指定時間構(gòu)型控制包含兩個控制目標。
1) 構(gòu)型生成。無人機集群在指定的打擊時刻tf生成打擊構(gòu)型,同時對目標發(fā)起飽和打擊。
2) 構(gòu)型保持。無人機集群生成打擊構(gòu)型后在指定的時間段te內(nèi)保持打擊構(gòu)型,持續(xù)對目標發(fā)起打擊,如圖1所示。
圖1 無人機集群指定時間協(xié)同打擊構(gòu)型控制示意圖Fig.1 Configuration control diagram of UAV swarm for cooperative attacking at designated time
用Ui表示編隊中編號為i的無人機,其中,i=0,1,2,…,n,U0表示海面目標。令epi(t)=[epix(t),epiy(t),epiz(t)]T∈R3,evi(t)=[evix(t),eviy(t),eviz(t)]T∈R3及eui(t)=[euix(t),euiy(t),euiz(t)]T∈R3分別表示慣性系(北東地坐標系)中Ui的位置狀態(tài)、速度狀態(tài)及加速度狀態(tài)。接下來定義Ui的狀態(tài)向量為exi(t)=[epix(t),evix(t),epiy(t),eviy(t),epiz(t),eviz(t)]T∈R6。
為了描述無人機群所期望的時變編隊,將每架無人機與海面目標的相對狀態(tài)ef(t)定義為慣性坐標系下的編隊參數(shù)向量,有
ef(t)=[ef0(t),ef1(t),…,efn(t)]T
(1)
其中,對于i=0,1,2,…,n有
efi(t)=exi(t)-ex0(t)
(2)
efi(t)=[efix(t),efiy(t),efiz(t)]T
(3)
efix(t)=[efixp(t),efixv(t)]T
(4)
efiy(t)=[efiyp(t),efiyv(t)]T
(5)
efiz(t)=[efizp(t),efizv(t)]T
(6)
efi(t)反映了達成期望構(gòu)型時Ui與海面目標的期望位置差與速度差,易得ef0(t)=0。那么,編隊中Ui與Uj之間期望的相對狀態(tài)可以用Δefi j(t)∈R6來表示,即
Δefi j(t)=efi(t)-efj(t)。
(7)
定義1對于tf,te兩個時間參數(shù),無人機集群達成了指定時間構(gòu)型控制,當且僅當對于i,j∈0,1,2,…,n,Ui與Uj滿足下列兩個條件:
1) 構(gòu)型生成條件
(8)
2) 構(gòu)型保持條件
exi(t)-exj(t)≡Δefi j(t)tf (9) 指定時間編隊控制器將被設(shè)計用于實現(xiàn)定義1的控制目標,控制模型如圖2所示。 圖2 無人機控制模型Fig.2 Control model of UAV 圖2中:外環(huán)為編隊協(xié)同控制層,負責根據(jù)期望構(gòu)型、參考航跡和速度等鄰居個體的狀態(tài)信息,計算本機的期望姿態(tài)角;內(nèi)環(huán)控制根據(jù)外環(huán)得到的控制輸入,結(jié)合自身動力學(xué)特性計算期望控制量,對本機油門、電機轉(zhuǎn)速等進行控制,實現(xiàn)期望的姿態(tài)。在外環(huán)控制層,可將無人機視為一個質(zhì)點,其運動方程可用二階積分器描述為 (10) (11) (12) 式中,ai j根據(jù)通信鄰接關(guān)系取值為0或1。 根據(jù)無人機動力學(xué)模型,無人機間的相對狀態(tài)滿足 (13) (14) (15) 令X(t)∈R6(n+1),U(t)∈R6(n+1)及Y(t)∈R6(n+1)分別代表系統(tǒng)的狀態(tài)向量、輸入向量和輸出向量,即 X(t)=[ex0(t),ex1(t),…,exn(t)] (16) U(t)=[eu0(t),eu1(t),…,eun(t)] (17) (18) 那么系統(tǒng)的狀態(tài)空間方程可表示為 (19) (20) e(t)=Yd(t)-Y(t)。 (21) 定義1中的兩個條件用e(t)來表示,轉(zhuǎn)化為 1) 構(gòu)型生成條件 (22) 2) 構(gòu)型保持條件 e(t)≡0tf (23) 為實現(xiàn)指定時間的構(gòu)型控制,將最優(yōu)控制理論中的有限時間時變最優(yōu)跟蹤器引入編隊控制系統(tǒng)。二次代價函數(shù)的一般形式為 (24) 式中:t0和t1分別表示指定的初始和末端時刻;F∈R6(n+1)×6(n+1),是一個表示末端時刻誤差代價的對稱非負時不變矩陣;Q(t)∈R6(n+1)×6(n+1)和R(t)∈R6(n+1)×6(n+1)均為對稱正定時變矩陣,分別代表控制過程中實時的誤差代價和控制代價,是連續(xù)的,并且在區(qū)間t∈[t0,t1]內(nèi)有界。 設(shè)計二次代價函數(shù)中的F,Q(t)和R(t)??紤]到空間3個維度方向上的位置誤差和速度誤差是等權(quán)重的,因此,F選擇單位矩陣,即 F=I6(n+1)。 (25) 然而,對于不同的控制階段,控制目標是不同的,因此Q(t)和R(t)也是不同的。 1) 構(gòu)型生成階段t∈[0,tf]。 t0=0,t1=tf,要求系統(tǒng)在末端時刻tf生成期望的編隊構(gòu)型。R(t)反映的是整個控制過程中實時的控制代價,在構(gòu)型生成階段關(guān)注的是末端時刻構(gòu)型的生成,因此,越接近末端時刻tf控制代價應(yīng)該越大。這意味著在初始階段有較大的控制輸入使得期望構(gòu)型能夠更快速地生成,并且隨著時間的增長,控制輸入應(yīng)該逐漸減少,直至t=tf時減少到0。因此在構(gòu)型生成階段,設(shè)計R(t)為 (26) 構(gòu)型生成階段僅關(guān)注末端時刻tf的控制誤差,不關(guān)注過程中的構(gòu)型誤差,因此設(shè)計Q(t)為 Q(t)=0。 (27) 2) 構(gòu)型保持階段t∈(tf,tf+te]。 t0=tf,t1=tf+te,要求系統(tǒng)在t∈(tf,tf+te]時間段內(nèi)一直保持期望的時變編隊構(gòu)型。由于該階段關(guān)注的是整個控制過程,所以過程誤差應(yīng)該盡可能小。除此之外,控制誤差和控制代價在構(gòu)型保持時間段內(nèi)都應(yīng)該是等價的,因此,Q(t)和R(t)在該階段均被設(shè)計為單位矩陣,即 R(t)=I6(n+1) (28) Q(t)=I6(n+1)。 (29) 對于最優(yōu)控制理論中的有限時間跟蹤系統(tǒng),如果矩陣對{A,C}是完全可觀的,那么對于二次代價函數(shù)式(24)必有唯一的最優(yōu)控制,即 U*(t)=-R-1(t)BT[P(t)X(t)-g(t)] (30) (31) Riccati方程的末端約束為 P(t1)=CTFC (32) Riccati方程中的g(t)∈R6(n+1)是滿足如下向量微分方程的伴隨向量,即 (33) 向量微分方程的末端約束為 g(t1)=CTFYd(t1) (34) 根據(jù)式(31)和式(32)可知,P(t)的求解是獨立于系統(tǒng)的期望輸出與初始狀態(tài)的,因此對于t∈[t0,t1]的P(t)可以事先離線求解。Yd(t)代表了集群的期望構(gòu)型,對于控制器而言是已知的。因此,伴隨向量g(t)可基于邊界條件式(34)得到 (35) 其中,t∈[t0,t1],Ψ(t,t0)為式(33)的狀態(tài)轉(zhuǎn)移矩陣。 已知P(t)和g(t)可得U*(t),將U*(t)代入系統(tǒng)的開環(huán)狀態(tài)方程式(19)即可得到系統(tǒng)的閉環(huán)狀態(tài)方程為 (36) 式(36)的邊界條件為 X(t0)=X0。 (37) (38) 采用Matlab模擬無人機集群打擊海上動態(tài)目標。 場景設(shè)為5架無人機打擊海面目標。設(shè)海面目標編號U0,無人機編號為Ui,i=1,2,…,5。無人機初始橫坐標為 epix(0)=5i-10 (39) 無人機其余初始狀態(tài)參數(shù)均為零。 為實現(xiàn)對海面目標的全向飽和打擊,同時增加自身防御,設(shè)置期望的編隊構(gòu)型為半徑r=10 m,旋轉(zhuǎn)角速度ω=0.1 rad/s的圓周構(gòu)型。構(gòu)型參數(shù)為 (40) 定義位置誤差向量ep(t)∈R3和速度誤差向量ev(t)∈R3 (41) (42) 設(shè)海面目標U0的初始狀態(tài)向量為ex0(0)=[01 0100]T,當t∈(0,10]∪(20,50]∪(60,70](單位為s)時,海面目標保持速度為1.5 m/s的勻速直線運動;當t∈(10,20](單位為s)時,海面目標按照ω0(t)=-π/20 rad/s的角速度勻速右轉(zhuǎn)彎;當t∈(50,60]時,海面目標按照ω0(t)=π/30 rad/s的角速度勻速左轉(zhuǎn)彎。 時間參數(shù)可設(shè)為無人機群20 s時在目標上空形成打擊構(gòu)型,發(fā)起時長為50 s的打擊。 采用上文設(shè)計的控制律,集群編隊的仿真軌跡見圖3。 圖3 無人機集群對動目標打擊軌跡俯視圖Fig.3 Top view of attack trajectory of UAV swarm against moving target 無人機集群成功地在t=20 s時生成了期望的打擊構(gòu)型,并且在接下來的50 s時間段內(nèi)穩(wěn)定地保持打擊構(gòu)型,同時跟蹤海面目標運動。 圖4則展示了打擊過程中的位置誤差和速度誤差,在構(gòu)型生成時刻誤差正好收斂到向量0,在構(gòu)型保持階段誤差持續(xù)穩(wěn)定在向量0附近。 圖4 無人機集群位置誤差和速度誤差曲線Fig.4 Curve of position error and velocity error of UAV swarm 仿真實驗結(jié)果證明,在指定的時間參數(shù)下,無人機集群能夠成功地生成并保持期望的編隊構(gòu)型,對動態(tài)目標能夠?qū)崿F(xiàn)跟蹤。值得注意的是,圖4所示的誤差曲線與式(22)和式(23)中的控制目標是一致的。編隊誤差恰好在tf時刻收斂到向量0,說明tf是精準的構(gòu)型生成時刻,并且是獨立的系統(tǒng)輸入,不受控制器參數(shù)的影響,這極大地提高了集群控制的靈活性。 本文所提的方法可以驅(qū)動無人機群在指定的時刻精準地生成打擊構(gòu)型,實現(xiàn)“同時到達”的打擊策略,并在后續(xù)指定時段內(nèi)保持打擊構(gòu)型,實現(xiàn)持續(xù)打擊。下一步工作可以采取無人機集群實飛來驗證。2 指定時間協(xié)同控制律設(shè)計及求解
2.1 集群編隊控制系統(tǒng)描述
2.2 最優(yōu)控制二次代價函數(shù)設(shè)計
2.3 基于龍格庫塔法的控制律求解
3 仿真分析
3.1 仿真參數(shù)設(shè)置
3.2 仿真結(jié)果
4 結(jié)論