郭志強(qiáng),周紹磊,于運(yùn)治,李曉寶
(1. 海軍航空大學(xué),煙臺(tái) 264001;2. 海軍潛艇學(xué)院,青島 266199)
多個(gè)攔截彈通過(guò)信息共享[1-2]、功能互補(bǔ)[3]的群體優(yōu)勢(shì)可以實(shí)現(xiàn)攔截能力的提高和任務(wù)范圍的拓寬。但在應(yīng)對(duì)多彈協(xié)同制導(dǎo)問(wèn)題時(shí),經(jīng)典制導(dǎo)律如比例導(dǎo)引等在攔截機(jī)動(dòng)目標(biāo)時(shí)往往難以取得理想效果,而最優(yōu)制導(dǎo)律由于要對(duì)目標(biāo)的機(jī)動(dòng)規(guī)律進(jìn)行假設(shè)也導(dǎo)致其實(shí)用性被大大限制。微分對(duì)策制導(dǎo)律由于對(duì)目標(biāo)信息的依賴性小且適用于機(jī)動(dòng)目標(biāo)的攔截而引起了相關(guān)學(xué)者的重視和研究。這類制導(dǎo)方法將攔截彈和目標(biāo)視作正在進(jìn)行博弈的雙方,分別得出所有對(duì)策參與者的最優(yōu)策略[4-6],無(wú)需對(duì)目標(biāo)的機(jī)動(dòng)規(guī)律做任何形式的假設(shè),可將目標(biāo)機(jī)動(dòng)對(duì)制導(dǎo)性能產(chǎn)生的影響降到最小。
目前關(guān)于協(xié)同攔截問(wèn)題的研究,包括文獻(xiàn)[4-6],大多是在小角度偏差假設(shè)的基礎(chǔ)上,將系統(tǒng)模型線性化之后進(jìn)行制導(dǎo)律的設(shè)計(jì)。但是現(xiàn)實(shí)中的系統(tǒng)其本質(zhì)上是非線性的,當(dāng)小角度偏差的假設(shè)不能滿足或者目標(biāo)在其當(dāng)前速度下具有很強(qiáng)的機(jī)動(dòng)能力時(shí),則需考慮借助其它方法來(lái)解決非線性的制導(dǎo)問(wèn)題。
基于狀態(tài)相關(guān)黎卡提方程(State-dependent Riccati-Equation,SDRE)的方法是求解非線性系統(tǒng)反饋控制律的一種有效方法,具有很好的實(shí)時(shí)性和靈活性。文獻(xiàn)[6-7]均指出,當(dāng)小角度偏差假設(shè)不成立時(shí)可采用基于SDRE的方法解決制導(dǎo)律設(shè)計(jì)問(wèn)題,但二者都未給出推導(dǎo)過(guò)程。文獻(xiàn)[8]首次基于SDRE方法和微分對(duì)策理論對(duì)帶有角度約束的一對(duì)一追逃問(wèn)題進(jìn)行了研究。文獻(xiàn)[9-10]進(jìn)一步對(duì)一對(duì)一的攔截問(wèn)題進(jìn)行了研究,并利用SDRE方法分別推導(dǎo)得出了不帶角度約束和帶角度約束的非線性追逃對(duì)策制導(dǎo)律。
上述文獻(xiàn)[4-10]均未對(duì)非線性的協(xié)同對(duì)策問(wèn)題展開討論,目前也尚未檢索到采用SDRE方法對(duì)協(xié)同微分對(duì)策制導(dǎo)律展開研究的文獻(xiàn)?;诖朔N現(xiàn)狀,本文考慮在末制導(dǎo)階段攔截彈與目標(biāo)不滿足初始小角度偏差假設(shè)的情況下,在微分對(duì)策理論的基礎(chǔ)上結(jié)合SDRE方法,將難以求解的最優(yōu)化問(wèn)題轉(zhuǎn)化為方便求解的次優(yōu)問(wèn)題,提出了一種非線性的協(xié)同制導(dǎo)律。該制導(dǎo)律具有解析形式,可在線應(yīng)用且不依賴于剩余時(shí)間,避免了剩余時(shí)間的估計(jì)精度不足對(duì)制導(dǎo)律性能造成的影響。
為簡(jiǎn)單計(jì),本文考慮兩枚攔截彈M1和M2(追蹤者)攔截單個(gè)機(jī)動(dòng)目標(biāo)T(逃逸者)的工況。該追逃對(duì)策(Pursuit-Evasion Strategy)問(wèn)題的狀態(tài)方程可寫為
式中,x∈n為系統(tǒng)狀態(tài)向量;u=[uu]T,u∈n1121和u∈n2分別為攔截彈M1和M2的控制向量;2v∈nv為目標(biāo)T的控制向量;t0為系統(tǒng)初始時(shí)間。
攔截彈和目標(biāo)的控制向量滿足邊界條件:
本文所討論的攔截過(guò)程屬于有限時(shí)間的范疇,但文獻(xiàn)[11]的結(jié)果表明,在無(wú)限時(shí)間條件下推導(dǎo)得出的制導(dǎo)律依然適用。故選擇性能指標(biāo)泛函如下:
如果f(x)∈C1,且有f(0)=0,則系統(tǒng)狀態(tài)方程(1)可寫成狀態(tài)相關(guān)系數(shù)形式:
為使該問(wèn)題可解,系統(tǒng)需滿足可控性和可觀性。下面在討論該對(duì)策問(wèn)題的解之前先給出鞍點(diǎn)策略的定義。
定義1 如果對(duì)策雙方采取的策略u(píng)*和v*存在且滿足
則稱(u*,v*)為該對(duì)策問(wèn)題的鞍點(diǎn)策略(Saddle Point Strategy,SPS)。
本文研究的微分對(duì)策問(wèn)題本質(zhì)上是一種雙邊優(yōu)化問(wèn)題,是對(duì)策雙方(兩枚攔截彈作為一方而目標(biāo)作為另一方)之間的一種動(dòng)態(tài)博弈過(guò)程,目的是求得雙方的最優(yōu)機(jī)動(dòng)策略(鞍點(diǎn)),假如某一方不按其最優(yōu)策略進(jìn)行機(jī)動(dòng),則它將因此而受損,同時(shí)另一方因此而獲益,這種對(duì)策又稱二人零和微分對(duì)策。由于求解微分對(duì)策問(wèn)題的鞍點(diǎn)策略要涉及到哈密頓-雅克比-貝爾曼-艾薩克斯(Hamilton-Jacobi-Bellman-Isaacs,HJBI)偏微分方程的求解,而求此類問(wèn)題解析解的過(guò)程往往是十分復(fù)雜的,甚至是不可能的。此時(shí)可以考慮將系統(tǒng)狀態(tài)方程表達(dá)成如式(3)所示的形式,利用SDRE方法使難以求解的最優(yōu)問(wèn)題轉(zhuǎn)化為方便求解的次優(yōu)問(wèn)題。下面對(duì)求解非線性對(duì)策問(wèn)題的SDRE方法進(jìn)行討論。
如果上述微分對(duì)策問(wèn)題的狀態(tài)相關(guān)黎卡提方程
存在唯一的正定對(duì)稱解P(x)∈n×n,則攔截彈和目標(biāo)基于SDRE的控制策略可分別寫成狀態(tài)相關(guān)的形式:
引理1[10]對(duì)于一般的多變量系統(tǒng),式(6)(7)給出的SDRE控制滿足:
式中,H為系統(tǒng)的哈密頓函數(shù)。
引理2[10]對(duì)于多變量系統(tǒng),在漸近穩(wěn)定條件下,若A(x)、B(x)、C(x)、P(x)、Q(x)、R1(x)、R2(x)及其梯度在原點(diǎn)的Ω鄰域內(nèi)有界,則當(dāng)x趨近于0時(shí),基于SDRE的非線性控制滿足如下伴隨方程:
式中,λ為伴隨狀態(tài)。
引理3[10]假設(shè)在原點(diǎn)的Ω鄰域內(nèi),?x∈Ω,則:
1)A(.)∈C1,且{A(x),B(x)}、{A(x),C(x)}滿足可控性,{Q12(x),A(x)}滿足可觀性;
2)對(duì)于給定ρ,式(5)存在唯一對(duì)稱正定解P(x),則當(dāng)v=0或v=v*=ρ-2CT(x)P(x)x時(shí),由式(6)可得系統(tǒng)的局部漸近穩(wěn)定閉環(huán)解。
引理4[12]若狀態(tài)相關(guān)系數(shù)具有可控性和可觀性,則式(6)所示控制使得平衡點(diǎn)全局漸近穩(wěn)定的充分條件是對(duì)于任意x,下列關(guān)系式成立:
假設(shè)彈目相對(duì)運(yùn)動(dòng)可在兩個(gè)正交平面內(nèi)解耦,雙方的二維相對(duì)運(yùn)動(dòng)關(guān)系如圖1所示。圖1中:XI-OI-YI表示笛卡爾慣性坐標(biāo)系,Mi表示第i(i=1,2)個(gè)攔截彈,T表示目標(biāo);V、a、γ分別表示速度、側(cè)向加速度和航向角,下標(biāo)i和T分別對(duì)應(yīng)于攔截彈Mi和目標(biāo);ri表示攔截彈Mi與目標(biāo)T之間的距離;φi表示攔截彈Mi與目標(biāo)T之間的視線角。
圖1 對(duì)策雙方的平面相對(duì)運(yùn)動(dòng)關(guān)系Fig.1 Planar engagement geometry of the players
極坐標(biāo)下攔截彈與目標(biāo)之間的運(yùn)動(dòng)方程為
式(11)中,Vci表示彈目接近速度。式(13)中,aj為攔截彈和目標(biāo)的加速度,假設(shè)雙方自動(dòng)駕駛儀均具有理想動(dòng)態(tài)特性,則有a1=u1,a2=u2,aT=v。
將攔截彈的視線角速度表示為θi,即
對(duì)式(14)求導(dǎo)則有:
定義 2 從當(dāng)前時(shí)刻t起,攔截彈和目標(biāo)均不再施加任何控制,以當(dāng)前狀態(tài)運(yùn)行至命中時(shí)刻tf時(shí)的脫靶量稱為零控脫靶量,它與視線角速度的關(guān)系為[10]
從式(16)可以看出,攔截彈為了命中目標(biāo),可采取控制使視線角速度趨近于零且使彈目相對(duì)速度Vci<0從而達(dá)到攔截目的,而對(duì)于目標(biāo)而言則要盡可能使視線角速度增大以擺脫攔截。
本文暫不考慮其它約束條件,以碰撞攔截為目的,選取視線角速度x=[θ1θ2]T作為對(duì)策問(wèn)題的狀態(tài)變量,則系統(tǒng)狀態(tài)方程可寫成如式(3)所示的狀態(tài)相關(guān)系數(shù)形式,其中,
為了后面討論方便,將A(x)、B(x)、C(x)中的元素分別記為
根據(jù)引理 3,{A(x),B(x)}、{A(x),C(x)}應(yīng)滿足可控性,其可控性矩陣為
根據(jù)系統(tǒng)可控性秩判據(jù),在彈目接近速度Vc1、Vc2和彈目距離r1、r2均不為零的條件下,系數(shù)矩陣應(yīng)滿足
令
式中,q1>0、q2>0分別為狀態(tài)變量θ1和θ2的加權(quán)系數(shù)。根據(jù)引理3,矩陣對(duì){Q12(x),A(x)}應(yīng)滿足可觀性,其可觀性矩陣為
由系統(tǒng)可觀的秩判據(jù)易知式(27)滿足可觀性要求。
由式(6)可知,欲求基于SDRE的反饋控制律,需先求出黎卡提方程式(5)的解P(x)。假設(shè)R1(x)、R2(x)均為單位陣,下面基于SDRE的舒爾解法求解P(x)。
系統(tǒng)的哈密頓矩陣為
式中,F(xiàn)(x)=BBT-ρ-2CCT,A(x)、B(x)、C(x)分別如式(17)~(19)所示。對(duì)稱陣F(x)的元素分別為
則可求得哈密頓矩陣H的特征值為
式中,
系統(tǒng)的SDRE存在對(duì)稱正定解P(x)的條件是哈密頓矩陣在虛軸上無(wú)特征值,這就需要選取合適的權(quán)值q1、q2使得下面的關(guān)系成立:
將哈密頓矩陣H的兩個(gè)負(fù)特征值和對(duì)應(yīng)的特征向量組成的新矩陣V:
根據(jù)舒爾方法將矩陣V分割成兩個(gè)方陣:
可得對(duì)稱矩陣P(x):
式中,
由于P為正定陣,則權(quán)值q1、q2和系數(shù)ρ的選取還應(yīng)使下面的關(guān)系成立:
根據(jù)式(6)(7),對(duì)策雙方解析形式的制導(dǎo)律為
對(duì)于本文所研究的二對(duì)一追逃對(duì)策問(wèn)題,由于目標(biāo)需要綜合考慮兩枚攔截彈的狀態(tài)信息(即視線角速度θi)來(lái)尋求自身的最優(yōu)逃逸策略(使兩個(gè)彈目視線角速度最大的策略),而兩枚攔截彈又要根據(jù)各自相對(duì)于目標(biāo)的視線角速度分別尋求自身的最優(yōu)追蹤策略(使各自的彈目視線角速度最小的策略),在這一過(guò)程中,兩枚攔截彈的控制量通過(guò)目標(biāo)的控制量產(chǎn)生耦合,因此所求得的兩枚攔截彈的制導(dǎo)策略式(43)(44)也具有耦合形式。從式(43)等號(hào)右邊第二項(xiàng)和式(44)等號(hào)右邊第一項(xiàng)可以看到,攔截彈一方面追求自身視線角速度趨近于零,同時(shí)也對(duì)另一枚攔截彈的視線角速度產(chǎn)生影響,以期達(dá)到與目標(biāo)完全相反的目的,體現(xiàn)了一種顯式的協(xié)同關(guān)系。
注釋1由于采用SDRE方法的微分對(duì)策制導(dǎo)律不需討論剩余時(shí)間的估計(jì)問(wèn)題,但作為協(xié)同制導(dǎo)問(wèn)題,需要對(duì)整個(gè)對(duì)策過(guò)程的結(jié)束時(shí)間做出定義。為了下節(jié)仿真的方便,本文將對(duì)策的結(jié)束時(shí)間規(guī)定為目標(biāo)被其中一枚攔截彈首先命中的時(shí)間,即
式中,tf1、tf2分別為攔截彈M1和M2的終端時(shí)刻。
本節(jié)將對(duì)前面所設(shè)計(jì)的制導(dǎo)律進(jìn)行仿真驗(yàn)證。為了方便敘述,以下將本文提出的基于SDRE方法的非線性協(xié)同微分對(duì)策制導(dǎo)律(Nonlinear Cooperative Differential Games Guidance Law Based on SDRE)簡(jiǎn)稱為SDRE-NCDG制導(dǎo)律。這里假設(shè)攔截彈和目標(biāo)自動(dòng)駕駛儀均具有理想動(dòng)態(tài)特性,不計(jì)重力影響,且彈目各自速度均為常值,仿真參數(shù)如表1所示。
表1 仿真參數(shù)Tab.1 Simulation parameters
為了驗(yàn)證所提制導(dǎo)律性能,下面根據(jù)目標(biāo)機(jī)動(dòng)與否將彈目運(yùn)動(dòng)情況分為如表2所示的四種情況,然后對(duì)制導(dǎo)律性能進(jìn)行分析。
表2 彈目初始位置和目標(biāo)機(jī)動(dòng)情況Tab.2 Initial positions and target maneuvers
3.1.1 目標(biāo)不機(jī)動(dòng)
在表2中的情況Ⅰ、情況Ⅱ下,兩枚攔截彈從不同距離對(duì)目標(biāo)進(jìn)行攔截的仿真結(jié)果分別如圖2、圖3所示。
圖2 目標(biāo)不機(jī)動(dòng)時(shí)的彈目軌跡Fig.2 Trajectories of interceptors and target in case I and II
圖3 目標(biāo)不機(jī)動(dòng)時(shí)的攔截彈加速度指令Fig.3 Acceleration profiles of interceptors in case I and II
由圖2可以看出,當(dāng)目標(biāo)不機(jī)動(dòng)時(shí),采用SDRENCDG方法,攔截彈在兩種初始彈目距離下均能對(duì)目標(biāo)進(jìn)行攔截(脫靶量均小于0.5 m)。在兩種彈目距離下,攔截彈完成攔截所需側(cè)向加速度指令如圖3所示,從圖中可以看出,當(dāng)初始彈目距離較近時(shí),攔截彈需要更大的側(cè)向加速度來(lái)克服航向誤差帶來(lái)的影響。
3.1.2 目標(biāo)機(jī)動(dòng)
當(dāng)目標(biāo)以v=50 m/s2進(jìn)行機(jī)動(dòng)時(shí),攔截彈從不同距離對(duì)目標(biāo)進(jìn)行攔截的結(jié)果如圖4、圖5所示。
圖4 目標(biāo)機(jī)動(dòng)時(shí)的彈目軌跡Fig.4 Trajectories of interceptors and target in case III and IV
圖5 目標(biāo)機(jī)動(dòng)時(shí)的攔截彈加速度指令Fig.5 Acceleration profiles of interceptors in case III and IV
由圖4可以看出,當(dāng)目標(biāo)以v=50 m/s2進(jìn)行機(jī)動(dòng)時(shí),攔截彈在情況Ⅲ、情況Ⅳ下均能對(duì)目標(biāo)實(shí)施攔截(脫靶由量均小于0.7 m)。在情況Ⅲ、情況Ⅳ下,攔截彈完成攔截所需加速度如圖5所示。與情況Ⅰ、情況Ⅱ相比可以看出,在情況Ⅲ、情況Ⅳ下,由于目標(biāo)機(jī)動(dòng),在攔截末期攔截彈所需加速度較大,但這一現(xiàn)象符合預(yù)期。
為了進(jìn)一步驗(yàn)證本文制導(dǎo)律的性能,下面將本文的 SDRE-NCDG制導(dǎo)律與文獻(xiàn)[4]所提出的線性二次型微分對(duì)策協(xié)同(CLQDG)制導(dǎo)律進(jìn)行對(duì)比。
仿真對(duì)比的背景條件如下:
1)SDRE-NCDG制導(dǎo)方法相關(guān)參數(shù)的選取仍如表1所示;
2)CLQDG制導(dǎo)方法相關(guān)參數(shù)的選取為:α=105,αE=105,βE=1.5;
3)攔截彈和目標(biāo)的初始航向角、速度仍如表1所示;
4)攔截彈和目標(biāo)的初始位置以及目標(biāo)機(jī)動(dòng)如表2中的情況Ⅲ、情況Ⅳ所示。
兩種制導(dǎo)方法的仿真結(jié)果如圖6~7所示。圖6為兩種制導(dǎo)方法在情況Ⅲ、情況Ⅳ下的彈目運(yùn)動(dòng)軌跡,從圖中可以看出,兩種制導(dǎo)方法均能對(duì)目標(biāo)實(shí)施攔截(實(shí)現(xiàn)攔截的攔截彈均為攔截彈M1),但相較而言,CLQDG方法下的攔截彈彈道則更為彎曲。
圖7為兩種制導(dǎo)方法下的加速度指令,可以看出,SDRE-NCDG方法中的攔截彈M1完成攔截所需最大加速度均小于采用CLQDG方法的情況。在情況Ⅲ、情況Ⅳ下,攔截彈利用兩種方法完成協(xié)同攔截所消耗控制能量如表3所示。由表3可以看出,本文SDRENCDG方法可以有效降低攔截彈所消耗的控制能量(約降低了25%的能量消耗)。
圖6 兩種制導(dǎo)方法下的彈目運(yùn)動(dòng)軌跡Fig.6 Trajectories of interceptors and target in two methods
圖7 兩種制導(dǎo)方法下的攔截彈加速度指令Fig.7 Acceleration profiles of interceptors in the two methods
表3 兩種制導(dǎo)方法消耗的控制能量Tab.3 Control energy of two guidance laws
注釋 2 本文提出的制導(dǎo)律本質(zhì)上不同于以同時(shí)到達(dá)或同時(shí)命中為目的的制導(dǎo)律。由于本文規(guī)定對(duì)策的結(jié)束時(shí)間為首先命中目標(biāo)的攔截彈的終端時(shí)間,故在圖4和圖6中,雖可看到在攔截彈M1首先命中目標(biāo)時(shí)攔截彈M2與目標(biāo)之間仍然存在一段距離,但這段距離這并不代表攔截彈M2的最終脫靶量。此時(shí),仍可進(jìn)一步利用微分對(duì)策理論分析僅存在攔截彈M2與目標(biāo)時(shí)的情況,只是對(duì)策問(wèn)題已由二對(duì)一的協(xié)同對(duì)策轉(zhuǎn)變成一對(duì)一的非協(xié)同對(duì)策,而一對(duì)一的微分對(duì)策問(wèn)題可參閱文獻(xiàn)[8-10]等。
本文針對(duì)非線性協(xié)同制導(dǎo)問(wèn)題,基于SDRE方法提出了一種微分對(duì)策制導(dǎo)律。該方法將SDRE和微分對(duì)策理論結(jié)合應(yīng)用于多彈協(xié)同制導(dǎo),不需對(duì)剩余時(shí)間估計(jì)的精度進(jìn)行考慮,避免了剩余時(shí)間估計(jì)誤差對(duì)制導(dǎo)性能的影響。仿真結(jié)果表明本文方法能夠?qū)C(jī)動(dòng)目標(biāo)進(jìn)行攔截,并可降低攔截彈的加速度要求以及控制能量的消耗,對(duì)于不滿足小角度假設(shè)等線性化條件的協(xié)同制導(dǎo)問(wèn)題具有一定的參考意義。