趙恩嬌,楊 明,晁 濤,王松艷
(哈爾濱工業(yè)大學(xué)控制與仿真中心,哈爾濱 150080)
近年來,隨著作戰(zhàn)形式與航空航天技術(shù)的不斷發(fā)展,傳統(tǒng)采用單一飛行器攻擊的困難日益增大,因此,多飛行器協(xié)同作戰(zhàn)的理念逐漸得到重視[1-2]。相比于傳統(tǒng)的一對(duì)一攔截方式,多飛行器協(xié)同制導(dǎo)具有較大的優(yōu)勢,協(xié)同制導(dǎo)能夠提高制導(dǎo)精度和攔截概率,進(jìn)而取得更好的攔截效果。因此,對(duì)多飛行器協(xié)同攔截方法的研究具有非常重要的工程意義。
齊射攻擊是協(xié)同作戰(zhàn)中一種典型的作戰(zhàn)形式,要求來自不同方向和位置的導(dǎo)彈同時(shí)擊中目標(biāo)[3]。齊射攻擊不僅能夠大大提高命中概率,還能明顯增強(qiáng)攻擊效果。近年來,多導(dǎo)彈協(xié)同制導(dǎo)的研究已逐漸引起國內(nèi)外學(xué)者的關(guān)注[4-10]。現(xiàn)有多數(shù)關(guān)于協(xié)同制導(dǎo)方法的研究,均是假設(shè)各飛行器之間的通信處于理想條件下,實(shí)際通信拓?fù)涔潭āH欢鴱?fù)雜的戰(zhàn)場環(huán)境中,通信極有可能受到干擾,同時(shí),由信息傳輸引起的隨機(jī)時(shí)延也無法避免。因此,在設(shè)計(jì)多飛行器協(xié)同制導(dǎo)方法時(shí),必須考慮時(shí)變拓?fù)鋵?duì)制導(dǎo)效果的影響。多枚飛行器齊射攻擊這類問題與多智能體協(xié)同控制具有相似之處,都是研究和探索由個(gè)體之間的相互作用所產(chǎn)生的群體協(xié)調(diào)現(xiàn)象的內(nèi)在機(jī)制和原理,其中一致性理論已經(jīng)被大量研究,并應(yīng)用在相關(guān)背景中,如衛(wèi)星編隊(duì)控制[11],無人機(jī)協(xié)同控制[12],多機(jī)器人系統(tǒng)分布式控制[13]等。因此,多智能體協(xié)同控制的一些研究結(jié)果對(duì)于多飛行器協(xié)同制導(dǎo)律的研究具有一定的借鑒意義。
在末制導(dǎo)過程中,目標(biāo)的逃逸機(jī)動(dòng)是影響制導(dǎo)精度的主要因素。針對(duì)機(jī)動(dòng)目標(biāo)的跟蹤,卡爾曼濾波技術(shù)是一種常用的方法,但其算法復(fù)雜,且需要精確知道系統(tǒng)模型和特性,不利于在飛行器攻防對(duì)抗過程中使用,需要探索不依賴于目標(biāo)機(jī)動(dòng)模型的目標(biāo)信息估計(jì)新方法。擴(kuò)張狀態(tài)觀測器(Extended state observer, ESO)可對(duì)系統(tǒng)中的不可測狀態(tài)以及未知擾動(dòng)進(jìn)行觀測,它是自抗擾控制[14]等非線性控制技術(shù)的重要組成部分,在干擾估計(jì)、故障診斷中發(fā)揮著重要作用,被應(yīng)用到很多工程領(lǐng)域[15-17]。由于擴(kuò)張狀態(tài)觀測器理論日趨成熟以及擴(kuò)張狀態(tài)觀測器表現(xiàn)出的種種優(yōu)勢,因此進(jìn)一步探索擴(kuò)張狀態(tài)觀測器在協(xié)同攔截制導(dǎo)律研究中的應(yīng)用具有重要的工程意義。
針對(duì)上述討論中存在的問題,研究提出了一種適用于通信拓?fù)淝袚Q情況下的多飛行器協(xié)同攔截方法。將目標(biāo)的狀態(tài)視作擾動(dòng),并擴(kuò)張成為新的一階狀態(tài),再利用特定的非光滑非線性誤差反饋,然后選擇適當(dāng)?shù)挠^測器參數(shù),得到系統(tǒng)所有狀態(tài)的觀測值,將得到的機(jī)動(dòng)目標(biāo)的狀態(tài)在制導(dǎo)律中進(jìn)行相應(yīng)的補(bǔ)償。利用有限時(shí)間一致性理論,為各飛行器設(shè)計(jì)一致性協(xié)議,使得各飛行器的剩余飛行時(shí)間能夠收斂到一致,從而保證同時(shí)攔截機(jī)動(dòng)目標(biāo),最后驗(yàn)證了此方法的有效性。
多個(gè)飛行器間通信關(guān)系可以用圖G=(v,ε,A)來描述,非空節(jié)點(diǎn)的集合v={1,2,3,…,n},它的節(jié)點(diǎn)數(shù)目稱為階,邊的集合ε?v×v={(i,j):i,j∈v}。加權(quán)鄰接矩陣A=[aij]∈Rn×n,i,j=1,2,…,n,其中aij表示以i為起點(diǎn),j為終點(diǎn)的邊的權(quán)值。根據(jù)邊有無方向,圖分為有向圖和無向圖,如果無向圖的鄰接矩陣是對(duì)稱的,則從節(jié)點(diǎn)i到節(jié)點(diǎn)j之間有一條邊,也就是說(i,j)∈ε?(j,i)∈ε,則aij=aji>0,無向圖的鄰接矩陣一般是不對(duì)稱的且節(jié)點(diǎn)之間的邊是有方向的。節(jié)點(diǎn)j稱作節(jié)點(diǎn)i的鄰居,而節(jié)點(diǎn)i的所有鄰居用集合可以表示為Ni={j∈v:(i,j)∈ε,j≠i}。
考慮如下非線性系統(tǒng)
(1)
式中:f(x):U→Rn為在包含原點(diǎn)的開區(qū)域U上對(duì)x的連續(xù)函數(shù)。
論文研究目的是為網(wǎng)絡(luò)中的各個(gè)飛行器設(shè)計(jì)一個(gè)協(xié)同攔截方案。網(wǎng)絡(luò)由n個(gè)飛行器組成,并將飛行器序號(hào)順序標(biāo)記為從1到n。
考慮平面內(nèi)多個(gè)飛行器協(xié)同攔截單個(gè)高價(jià)值機(jī)動(dòng)目標(biāo)的情況,平面幾何關(guān)系如圖1所示。XOY為慣性參考坐標(biāo)系,M代表飛行器,下角標(biāo)為飛行器的編號(hào),即Mi代表第i個(gè)飛行器,T為目標(biāo);帶有下腳標(biāo)i和t的變量分別表示第i個(gè)飛行器和目標(biāo)的狀態(tài)量;V,a,θ,λD以及R分別代表飛行器的速度、法向加速度、彈道傾角、視線高低角和彈目相對(duì)距離。
圖1 多飛行器與目標(biāo)的相對(duì)運(yùn)動(dòng)關(guān)系Fig.1 Relative kinematics of flight vehicles and target
由圖中的飛行器和目標(biāo)間的相對(duì)運(yùn)動(dòng)關(guān)系,以第i個(gè)飛行器為例,可以得到如下第i個(gè)飛行器與目標(biāo)的相對(duì)運(yùn)動(dòng)關(guān)系。
(2)
(3)
式中:wR和uRi分別是目標(biāo)加速度和第i個(gè)飛行器加速度在視線方向上的分量;wλ和uλi分別是目標(biāo)加速度和第i個(gè)飛行器加速度在視線法向上的分量。
當(dāng)多個(gè)飛行器協(xié)同攔截空中來襲機(jī)動(dòng)目標(biāo)時(shí),如果采用齊射攻擊的作戰(zhàn)方式,也就是要求來自不同位置和方向的多個(gè)飛行器同時(shí)擊中目標(biāo),就可以大大提高命中目標(biāo)的概率,并增強(qiáng)摧毀目標(biāo)的效果。研究中要求多個(gè)飛行器同時(shí)擊中目標(biāo),也就是要求各飛行器的剩余飛行時(shí)間達(dá)到一致,因此也屬于一致性問題。
根據(jù)上節(jié)描述飛行器與目標(biāo)之間的相對(duì)運(yùn)動(dòng)關(guān)系,以第i個(gè)飛行器與目標(biāo)的相對(duì)運(yùn)動(dòng)關(guān)系為例給出協(xié)同制導(dǎo)模型。在視線坐標(biāo)系下相對(duì)運(yùn)動(dòng)方程描述為
(4)
式中:Ri表示第i個(gè)飛行器與目標(biāo)之間的相對(duì)距離;VRi表示第i個(gè)飛行器與目標(biāo)之間視線方向的相對(duì)速度分量;Vλi表示第i個(gè)飛行器與目標(biāo)之間視線法向的相對(duì)速度分量;uRi和uλi分別表示第i個(gè)飛行器的加速度在飛行器與目標(biāo)的視線方向及視線法向的加速度分量;wRi和wλi分別表示目標(biāo)的加速度在飛行器i與目標(biāo)的視線方向及視線法向的加速度分量。
在多飛行器系統(tǒng)執(zhí)行協(xié)同攔截任務(wù)時(shí),為了達(dá)到同時(shí)擊中目標(biāo)的目的,要求各飛行器具有時(shí)間一致性,也就是剩余飛行時(shí)間一致。Tgoi表示飛行器i與目標(biāo)之間末制導(dǎo)剩余時(shí)間,采用下式估計(jì)飛行器的剩余飛行時(shí)間,這種估算方法在制導(dǎo)末期估計(jì)精度較高
(5)
為了得到Tgoi的變化率,對(duì)上式求導(dǎo)可得
(6)
為了實(shí)現(xiàn)多飛行器同時(shí)攔截目標(biāo),需要對(duì)各飛行器末制導(dǎo)剩余飛行時(shí)間進(jìn)行控制,使得多個(gè)飛行器的Tgoi能達(dá)到一致,式(6)中uRi即為剩余時(shí)間變化的控制量。
在末制導(dǎo)過程中,當(dāng)彈目接近速度小于零、視線轉(zhuǎn)率接近于零時(shí),根據(jù)平行接近原理,導(dǎo)彈與目標(biāo)在視線方向上的加速度分量對(duì)于導(dǎo)彈攔截目標(biāo)沒有影響,因此在制導(dǎo)律設(shè)計(jì)時(shí)可以不考慮目標(biāo)在視線方向的加速度分量[19]。因此,在研究中,考慮多個(gè)飛行器協(xié)同攔截來襲目標(biāo)的情況,彈目接近速度一定小于零,可以假設(shè)目標(biāo)機(jī)動(dòng)加速度在視線方向的分量為零,即wRi=0,則式(4)中第二個(gè)方程可以化簡為
(7)
令
(8)
將上式代入式(4)、式(7)并結(jié)合式(6),可以得到如下協(xié)同制導(dǎo)模型
(9)
在本研究中采用切換的通信拓?fù)浣Y(jié)構(gòu),各飛行器根據(jù)通信拓?fù)浣Y(jié)構(gòu)與相鄰的飛行器也進(jìn)行信息交互,達(dá)到各飛行器的剩余飛行時(shí)間一致。在協(xié)同攔截問題的研究中,多對(duì)一制導(dǎo)律的設(shè)計(jì)包括兩個(gè)主要內(nèi)容:①通過對(duì)目標(biāo)狀態(tài)的精確估計(jì)來設(shè)計(jì)合理的制導(dǎo)律對(duì)目標(biāo)的機(jī)動(dòng)進(jìn)行補(bǔ)償,保證每個(gè)飛行器與目標(biāo)間的視線旋轉(zhuǎn)運(yùn)動(dòng)趨于穩(wěn)定;②對(duì)多個(gè)飛行器到達(dá)目標(biāo)的時(shí)間進(jìn)行協(xié)調(diào),以實(shí)現(xiàn)同時(shí)攔截的目的。
(10)
(11)
(12)
根據(jù)ESO理論,對(duì)式(12)設(shè)計(jì)如下的ESO
(13)
在本文協(xié)同攔截機(jī)動(dòng)目標(biāo)的研究中,假設(shè)各飛行器分別對(duì)目標(biāo)的狀態(tài)進(jìn)行估計(jì),然后將觀測結(jié)果補(bǔ)償?shù)街茖?dǎo)律中。
根據(jù)上文的研究成果,本節(jié)給出攔截機(jī)動(dòng)目標(biāo)時(shí)利用ESO的估計(jì)結(jié)果進(jìn)行協(xié)同攔截制導(dǎo)律的設(shè)計(jì)方法。
協(xié)同制導(dǎo)模型可知,多飛行器的協(xié)同攔截問題被轉(zhuǎn)化為多飛行器系統(tǒng)的時(shí)間一致性問題。不僅需要設(shè)計(jì)合理的制導(dǎo)律對(duì)機(jī)動(dòng)目標(biāo)加速度進(jìn)行補(bǔ)償,還需要設(shè)計(jì)合理的一致性控制協(xié)議,保證各飛行器的剩余飛行時(shí)間達(dá)到一致。
(14)
(15)
此時(shí),引入新的變量Tfi,定義Tfi為在t時(shí)刻預(yù)測得到的第i個(gè)飛行器與目標(biāo)的交會(huì)時(shí)刻,則有
Tfi=t+Tgoi
(16)
對(duì)式(16)求導(dǎo),并結(jié)合式(9)中剩余飛行時(shí)間變化規(guī)律可以得到
(17)
根據(jù)有限時(shí)間一致性理論,為第i枚飛行器設(shè)計(jì)視線方向的控制量
(18)
用Tgoj-Tgoi替換式中的Tfj-Tfi,Tgoi為第i枚飛行器到達(dá)目標(biāo)的剩余飛行時(shí)間,Tgoj為第j枚飛行器到達(dá)目標(biāo)的剩余飛行時(shí)間,因此可以得到多飛行器系統(tǒng)有限時(shí)間一致性定理。
假設(shè)1[21]. 假設(shè)飛行器間的通信拓?fù)涫菬o向聯(lián)通的,即對(duì)應(yīng)于無限的時(shí)間序列[ts,ts+1),s=0,1,2,…,存在切換信號(hào)σ: [0, ∞)→P和常數(shù)T1,T2滿足T1>T2>0,其中0 定理1. 對(duì)于協(xié)同制導(dǎo)系統(tǒng)(9),存在正常數(shù)T2>0使得假設(shè)1成立,采用如下控制協(xié)議 (19) 可以保證多飛行器同時(shí)攔截目標(biāo),且末制導(dǎo)剩余時(shí)間的一致時(shí)間 (20) 在每個(gè)區(qū)間[ts,ts+1),s=0,1,2,…,上,選取半正定函數(shù) (21) 作為一致性分析的Lyapunov函數(shù)。 由于G(A)是連通的,V1(Tgo)=0表示對(duì)于任何i,j,都有Tgoi=Tgoj。由矩陣A的對(duì)稱性可知 (22) 因此, (23) 顯然 (24) 如果V1(Tgo)≠0, (25) 令L(A)的根λ1(LA),λ2(LA), …,λn(LA)按照增序排列。因?yàn)镚(A)是聯(lián)通的,根據(jù)引理1,得λ1(LA)=0,λ2(LA)>0。并且, (26) 因此, (27) 給定初始狀態(tài)Tgo(0),如果V1(0)≠0,根據(jù)微分相似原則可以得到 (28) 并且 (29) 因此,V1(t)會(huì)在有限時(shí)間t1收斂到0,V1(t)與G(A)的代數(shù)連通性是近似相關(guān)的,因此定理1能夠解決有限時(shí)間一致性問題。 (30) 飛行器法向控制指令由設(shè)計(jì)的導(dǎo)引律給出,本文設(shè)計(jì)有限時(shí)間導(dǎo)引律并對(duì)目標(biāo)機(jī)動(dòng)進(jìn)行補(bǔ)償 (31) 式中:wλi為估計(jì)得到的目標(biāo)加速度值,βi>0, -1<ηi<1。 為了驗(yàn)證本文設(shè)計(jì)的利用擴(kuò)張狀態(tài)觀測器(ESO)的協(xié)同制導(dǎo)律的在通信拓?fù)淝袚Q情況下的制導(dǎo)性能,采用如下仿真條件進(jìn)行仿真校驗(yàn)。目標(biāo)的機(jī)動(dòng)信號(hào)采用機(jī)動(dòng)頻率為0.5 Hz,最大機(jī)動(dòng)能力為amax=±3的方波信號(hào)為機(jī)動(dòng)目標(biāo)信號(hào)。綜合考慮系統(tǒng)的估計(jì)精度、動(dòng)態(tài)響應(yīng)速度等因素,以第1枚飛行器為例,參數(shù)取值分別為β11=40,β12=140,δ1=0.001,α1=0.4,其他飛行器的參數(shù)取值與第1枚飛行器相同。仿真步長(系統(tǒng)的基礎(chǔ)采樣時(shí)間)為0.005 s。 各飛行器的初始狀態(tài)參數(shù)如表1所示。 表1 飛行器初始狀態(tài)參數(shù)Table 1 Initial state parameters of flight vehicles 三個(gè)飛行器間的通信拓?fù)浣Y(jié)構(gòu)如圖2所示,飛行器間的通信拓?fù)浣Y(jié)構(gòu)以8 s為周期,每2 s切換一次,切換順序依次為(a)→(b)→(c)→(d)。 圖2 通信拓?fù)浣Y(jié)構(gòu)Fig.2 Communication topologies 可以得到對(duì)應(yīng)的鄰接矩陣為 (32) 利用上述仿真初始條件,得到如下仿真結(jié)果。圖3為目標(biāo)機(jī)動(dòng)加速度估計(jì)值,圖4為各飛行器的飛行軌跡圖,圖5為各飛行器與目標(biāo)之間的距離變化曲線,圖6給出了各飛行器的剩余飛行時(shí)間變化曲線,圖7給出了各飛行器視線法向控制量變化曲線,圖8給出了飛行器1和飛行器2之間的通信拓?fù)溥B接權(quán)值。對(duì)比圖3目標(biāo)加速度的實(shí)際值和估計(jì)值可知,經(jīng)過前期的調(diào)整,利用擴(kuò)張狀態(tài)觀測器得到的目標(biāo)加速度估計(jì)值后期與實(shí)際值曲線完全重合,可見觀測精度較高,說明設(shè)計(jì)的狀態(tài)觀測器是有效的。由圖4展示的三枚飛行器協(xié)同攔截空中來襲機(jī)動(dòng)目標(biāo)的場景可知,來自不同方向和位置的三枚飛行器給來襲的目標(biāo)形成了包圍的態(tài)勢,大大減小了機(jī)動(dòng)目標(biāo)逃逸的可行性,提高了摧毀目標(biāo)的概率。觀察圖5的彈目距離曲線可知,各飛行器到目標(biāo)的距離在初始階段有很大差異,因此需要對(duì)飛行器的狀態(tài)進(jìn)行適當(dāng)?shù)恼{(diào)整,圖7的剩余飛行時(shí)間曲線也體現(xiàn)了這一點(diǎn),經(jīng)過對(duì)剩余時(shí)間的調(diào)整,剩余飛行時(shí)間收斂到一致,并且各飛行器的彈目距離也在同一時(shí)刻變?yōu)榱?,說明三枚飛行器同時(shí)擊中目標(biāo),實(shí)現(xiàn)了對(duì)來襲的機(jī)動(dòng)目標(biāo)的協(xié)同攔截。通過在控制指令中對(duì)機(jī)動(dòng)目標(biāo)的加速度進(jìn)行補(bǔ)償,圖9的飛行器法向加速度指令變化曲線后期趨于穩(wěn)定,因此各飛行器的視線轉(zhuǎn)率在控制作用下能夠穩(wěn)定在零附近,保證飛行器能夠擊中目標(biāo)。因此論文中設(shè)計(jì)的協(xié)同制導(dǎo)方法在通信拓?fù)淝袚Q的情況下是有效的。 圖3 目標(biāo)加速度估計(jì)值Fig.3 Estimation of the target acceleration 圖4 飛行軌跡Fig.4 Trajectories of flight vehicles 圖5 彈目相對(duì)距離Fig.5 Distance between flight vehicles and the target 圖6 剩余飛行時(shí)間Fig.6 Time-to-go of flight vehicles 圖7 法向加速度指令Fig.7 Control command perpendicular to the LOS 圖8 飛行器1和飛行器2之間通信權(quán)值Fig.8 Communication connection weight value between flight vehicle 1 and flight vehicle 2 為驗(yàn)證本文設(shè)計(jì)方法的有效性及分析通信拓?fù)淝袚Q對(duì)仿真結(jié)果的影響,這里給出相同仿真條件下固定拓?fù)錀l件下的部分仿真結(jié)果圖,其中通信拓?fù)洳捎脠D2(c)所示的結(jié)構(gòu)圖。選取仿真結(jié)果中比較有代表性的剩余飛行時(shí)間和彈目相對(duì)距離仿真結(jié)果圖與通信拓?fù)淝袚Q情況下的仿真結(jié)果進(jìn)行對(duì)比。 圖9 固定拓?fù)錀l件下的剩余飛行時(shí)間Fig.9 Time-to-go of flight vehicles in fixed topology 圖10 固定拓?fù)錀l件下的彈目相對(duì)距離Fig.10 Distance between flight vehicles and the target in fixed topology 觀察固定拓?fù)錀l件下同樣仿真條件得到的剩余飛行時(shí)間曲線和彈目相對(duì)距離曲線如圖9和圖10可知,本文設(shè)計(jì)的協(xié)同攔截方法在通信拓?fù)涔潭ê颓袚Q兩種情況下都能實(shí)現(xiàn)剩余飛行時(shí)間的一致,從而完成協(xié)同攔截任務(wù),由彈目相對(duì)距離曲線可知,兩次仿真的彈目相對(duì)距離都能在同一時(shí)間收斂到零。同時(shí),對(duì)比兩種情況下的剩余飛行時(shí)間,通過局部放大圖可以發(fā)現(xiàn),通信拓?fù)淝袚Q條件下的一致收斂時(shí)間在7 s左右,而固定拓?fù)錀l件下的一致收斂時(shí)間在4.5 s左右,由此可見,切換的網(wǎng)絡(luò)會(huì)影響一致收斂時(shí)間,使的系統(tǒng)達(dá)到一致的時(shí)間延長。 本文針對(duì)機(jī)動(dòng)目標(biāo)加速度的協(xié)同攔截問題,提出了一種適用于通信拓?fù)淝袚Q的基于擴(kuò)張狀態(tài)觀測器實(shí)現(xiàn)協(xié)同攔截機(jī)動(dòng)目標(biāo)的新思路。設(shè)計(jì)擴(kuò)張狀態(tài)觀測器估計(jì)目標(biāo)加速度,并在有限時(shí)間制導(dǎo)律中進(jìn)行相應(yīng)的補(bǔ)償,保證各飛行器能夠命中目標(biāo)。同時(shí),基于有限時(shí)間一致性理論設(shè)計(jì)了多飛行器系統(tǒng)協(xié)調(diào)控制量,使得各飛行器剩余飛行時(shí)間達(dá)到一致,并對(duì)系統(tǒng)有限時(shí)間穩(wěn)定性進(jìn)行分析,從而保證了在通信拓?fù)淝袚Q的情況下多個(gè)飛行器能夠同時(shí)到達(dá)目標(biāo)。仿真研究表明,基于擴(kuò)張狀態(tài)觀測器估計(jì)目標(biāo)加速度的方法具有算法簡單、收斂速度快、估計(jì)精度高的優(yōu)點(diǎn),且無須建立機(jī)動(dòng)目標(biāo)模型。并且利用多智能體一致性理論設(shè)計(jì)的控制協(xié)議能夠使得飛行器狀態(tài)快速收斂,實(shí)現(xiàn)了有限時(shí)間一致性。表明本文設(shè)計(jì)的協(xié)同攔截方法是有效的。5 仿真分析
6 結(jié) 論