花文華,陳興林
(哈爾濱工業(yè)大學(xué)航天學(xué)院,哈爾濱 150001)
近年來,微分對策理論在飛行器姿態(tài)控制[1]、威脅規(guī)避[2]、火力分配[3],目標(biāo)攔截[4]等方面得到了較為廣泛的研究。在目標(biāo)攔截中,由于目標(biāo)的獨立性,其機(jī)動策略一般是無法預(yù)測的。因此,將攔截情形定義為最優(yōu)控制問題并不合適[5],而對于微分對策雙邊優(yōu)化問題而言,雙方都是獨立控制的,一方要求性能指標(biāo)的最大化,而另一方要求性能指標(biāo)的最小化。
文獻(xiàn)[6]假設(shè)目標(biāo)是靜止的,給出了一種具有終端碰撞角度約束且適用于任意階控制導(dǎo)彈的最優(yōu)制導(dǎo)律。文獻(xiàn)[7]考慮任意階導(dǎo)彈機(jī)動動態(tài),給出了一種滿足終端角度約束的微分對策制導(dǎo)律,但在具體推導(dǎo)過程中,為得到解析解,假設(shè)攔截導(dǎo)彈和目標(biāo)具有理想機(jī)動動態(tài),使得最終結(jié)果并不適用于任意階控制的攔截導(dǎo)彈和目標(biāo)的情形。本文基于微分對策雙邊優(yōu)化理論,給出了一種可適用于具有任意階控制的攔截導(dǎo)彈和目標(biāo)的一般形式微分對策制導(dǎo)律。首先,對所要研究的問題進(jìn)行描述和建模,給出任意階控制的攔截導(dǎo)彈和目標(biāo)的狀態(tài)方程;然后,進(jìn)行一般形式微分對策制導(dǎo)律的推導(dǎo),給出解析解;針對一類具有一階正當(dāng)傳遞函數(shù)的攔截導(dǎo)彈,進(jìn)行制導(dǎo)律的驗證和仿真,給出該情形下的制導(dǎo)增益和對策空間分析。
制導(dǎo)末端的彈目運動關(guān)系如圖1所示,X軸沿初始視線方向,下標(biāo)P和E分別對應(yīng)攔截導(dǎo)彈和目標(biāo)的相關(guān)狀態(tài),y表示攔截導(dǎo)彈和目標(biāo)相對于初始視線方向的位移?;谙率黾僭O(shè)進(jìn)行問題分析:
(1)攔截導(dǎo)彈和目標(biāo)可近似為具有線性動態(tài)特性的質(zhì)點,并可沿初始視線方向進(jìn)行線性化;
(2)攔截導(dǎo)彈和目標(biāo)速度大小不變,導(dǎo)彈機(jī)動能力大于目標(biāo)。
圖1 平面彈目運動關(guān)系Fig.1 Planar engagement geometry
基于圖1和假設(shè)(1),攔截導(dǎo)彈和目標(biāo)相對運動關(guān)系可表示為
n階導(dǎo)彈機(jī)動動態(tài)為
式中aP為導(dǎo)彈加速度;pP為其余的(n-1)個狀態(tài)變量;a1和b1為標(biāo)量;a21,aT12和b2為(n-1)×1的向量;a22為(n-1)×(n-1)的矩陣。
參考n階導(dǎo)彈機(jī)動動態(tài)定義,m階目標(biāo)機(jī)動動態(tài)可表示為
則系統(tǒng)狀態(tài)方程可表示為
基于假設(shè)(1)和(2),攔截導(dǎo)彈飛行時間為
式中r0為彈目初始距離;vc為接近速度,約為vP+vE。
待飛時間可表示為
定義線性二次型性能指標(biāo)
其中,G,R,Q為加權(quán)設(shè)計參數(shù),R>0,Q>0,G=diag(g00 0 0 0 0),g0→∞表示零脫靶量攔截情形,脫靶量趨于零,g0<∞時脫靶量為非零的有限值;Q反映了目標(biāo)相對于導(dǎo)彈的機(jī)動能力,當(dāng)假設(shè)目標(biāo)具有較強的機(jī)動能力時,Q取較小值,Q→∞則表示對非機(jī)動目標(biāo)攔截的情形,由假設(shè)(2),Q/R>1。
結(jié)合式(7),構(gòu)造哈密頓(Hamiltonian)函數(shù):
式中 p為待定的協(xié)態(tài)向量。
由協(xié)態(tài)方程可得
其中,Φ為相應(yīng)于系統(tǒng)狀態(tài)式(4)的轉(zhuǎn)移矩陣,結(jié)合橫截條件,則有
由上述條件,可得攔截導(dǎo)彈和目標(biāo)的最優(yōu)控制為
將式(12)和式(13)代入式(4),并從t~tf進(jìn)行積分,可得
定義 D=[1 0 0 0 0 0],結(jié)合式(4)并應(yīng)用拉氏反變換,可得
代入式(14),可得
對于這一雙邊優(yōu)化問題,z(t)表示零效脫靶量,對應(yīng)于攔截導(dǎo)彈和目標(biāo)由給定的時間t起不施加任何控制,以該瞬時參數(shù)飛行,至命中所產(chǎn)生的脫靶量。
將式(18)代入式(12)和式(13),則一般形式最優(yōu)制導(dǎo)策略可表示為
式中NP和NE分別為攔截導(dǎo)彈和目標(biāo)制導(dǎo)增益。
式中 sat()為飽和函數(shù)。
攔截導(dǎo)彈機(jī)動動態(tài)采用分子分母同為一階(biproper)的傳遞函數(shù)表示:
數(shù)字出版產(chǎn)業(yè)目前仍然存在著一些問題,例如,數(shù)字出版物的模式單一、盈利相對較少,品牌建設(shè)力量不足,數(shù)字出版物的侵權(quán)問題等。
式中d表示直接控制部分,d>0時系統(tǒng)是最小相位,d<0時系統(tǒng)是非最小相位;τP為導(dǎo)彈機(jī)動時間常數(shù)。
假設(shè)目標(biāo)具有一階機(jī)動動態(tài)特性:
式中 τE為目標(biāo)機(jī)動時間常數(shù)。
為便于分析問題,定義如下無量綱變量:
目標(biāo)與攔截導(dǎo)彈機(jī)動時間常數(shù)比:
tg0對τP的歸一化:
基于高階控制導(dǎo)彈和目標(biāo)一般形式最優(yōu)制導(dǎo)策略式(21)和式(22),該類型攔截導(dǎo)彈和目標(biāo)的最優(yōu)制導(dǎo)策略可表示為
當(dāng)tg0→0時:
對于零脫靶量攔截情形,g0→∞,NP1與攔截導(dǎo)彈自動駕駛儀直接控制部分成反比。由于目標(biāo)具有一階機(jī)動動態(tài),目標(biāo)制導(dǎo)增益NE1趨于零。攔截導(dǎo)彈和目標(biāo)對應(yīng)于不同g0值的制導(dǎo)增益變化曲線如圖2所示。
圖2 制導(dǎo)增益 NP1、NE1(d=0.1,R=1,Q=2,ε =1)Fig.2 Guidance gains NP1 and NE1(d=0.1,R=1,Q=2,ε =1)
將式(36)兩邊微分,并代入式(31)和(32)可得
假設(shè)初始條件已知,求解z1(t),可表示為
當(dāng)g0<∞時,z1(t)是一個與初始條件相關(guān)的非零值:
較大的g0值有助于目標(biāo)的攔截,但也會增加導(dǎo)彈在攔截末端的機(jī)動性能要求,如圖2(a)所示。隨著g0的不斷增大,導(dǎo)彈制導(dǎo)末端增益隨之增大。g0體現(xiàn)了導(dǎo)彈機(jī)動性能與目標(biāo)攔截要求間的設(shè)計折中。
則存在共軛點。對于微分對策雙方優(yōu)化問題,共軛點不存在的充分條件是存在鞍點解,而鞍點解當(dāng)且僅當(dāng)系統(tǒng)狀態(tài)方程(4)所對應(yīng)的Riccati微分方程的解P(t)是有限時才存在[8]:
其中,P(tf)=G。而當(dāng)且僅當(dāng)制導(dǎo)增益有界時,P(t)才能保持是有限的[9]。進(jìn)一步由式(47),可得
由式(39)知,φ(d,η)≥0,f(d,η)是單調(diào)增加的,式(49)分母在處取得最大值,而當(dāng)ε不斷增加時,項ε3增加,項 φ(0,τ)dτ減少,因此Q存在最大值。圖3為ε∈[0,1]范圍內(nèi)存在共軛時的Q最大值變化曲線,此時目標(biāo)具有較大的機(jī)動動態(tài)優(yōu)勢。如圖3所示,當(dāng)近似ε>0.69時,系統(tǒng)不存在共軛點,且當(dāng)坐標(biāo)點(ε,Q)位于曲線上方時,同樣也不存在共軛點,如(ε =0.5,Q=2)。
圖3 Q最大值隨 ε變化曲線(g0→∞,d=0.1,R=1)Fig.3 Relationship between themaximum Q and ε(g0→∞,d=0.1,R=1)
圖4(a)為不存在共軛點時的攔截對策空間,對策值收斂到零。圖4(b)為存在偶共軛點[10]時的攔截對策空間,該共軛點為對應(yīng)Q取得最大值時的點,此時式(34)對應(yīng)的Riccati微分方程的解在該共軛點兩邊是半正定的,屬于鞍點解的特殊情況。圖4(c)為存在一般共軛點時的攔截對策空間。
可見,只有當(dāng)近似θ<0.68時,才存在最優(yōu)彈道使得對策值收斂到零。因此,在目標(biāo)和攔截導(dǎo)彈機(jī)動時間常數(shù)比一定的情況下,為實現(xiàn)導(dǎo)彈在整個待飛時間段內(nèi)不出現(xiàn)共軛點,導(dǎo)彈應(yīng)具有足夠的機(jī)動性能,即Q/R足夠大。為了保證系統(tǒng)不出現(xiàn)共軛點,除了選取適當(dāng)?shù)膮?shù)外,結(jié)合式(44),還可通過取有限的g0值實現(xiàn),即有限脫靶量情形。圖5為g0取有限值時,對于不同初始條件的脫靶量曲線,為保證鞍點解的存在,系統(tǒng)性能被折中。
圖4 攔截對策空間Fig.4 Intercept game space
基于微分對策雙邊優(yōu)化理論,給出了一種可適用于具有任意階控制的攔截導(dǎo)彈和目標(biāo)的一般形式線性二次型微分對策制導(dǎo)律。針對一類具有一階正當(dāng)傳遞函數(shù)的攔截導(dǎo)彈進(jìn)行了制導(dǎo)律的推導(dǎo),給出了解析表達(dá)式,并對其制導(dǎo)增益和對策空間進(jìn)行了分析,在目標(biāo)和攔截導(dǎo)彈機(jī)動時間常數(shù)比一定時,為實現(xiàn)對目標(biāo)的零脫靶量攔截,攔截導(dǎo)彈應(yīng)保證具有足夠的機(jī)動優(yōu)勢。同時,仿真結(jié)果也驗證了該一般形式微分對策制導(dǎo)律。由于只針對彈目相對質(zhì)心運動模型進(jìn)行了研究,未就攔截導(dǎo)彈姿態(tài)控制回路對制導(dǎo)回路的影響加以考慮,且該部分也屬于集成制導(dǎo)與控制的研究范疇,將作為后續(xù)基于微分對策制導(dǎo)理論研究的重點。
圖5 有限脫靶量對策空間(g0=2 000,d=0.1,R=1,ε =0.5,Q=1.5)Fig.5 Finitem iss distance game space
[1] 蘇曉丹.飛行器姿態(tài)控制系統(tǒng)綜合的一種微分對策方法[J].航天控制,2009,27(3):72-75.
[2] 王長青,史曉麗,王新民,等.基于LQ微分對策的最優(yōu)規(guī)避策略與決策算法[J].計算機(jī)仿真,2008,25(9):74-78.
[3] 李登峰,羅飛.艦艇編隊信息戰(zhàn)火力分配微分對策模型及求解[J].控制理論與應(yīng)用,2008,25(6):1163-1166.
[4] 馬禮舉,魏志鵬.基于目標(biāo)姿態(tài)信息的導(dǎo)彈微分對策制導(dǎo)律研究[J].彈箭與制導(dǎo)學(xué)報,2009,29(3):43-46.
[5] Anderson GM.Comparison of optimal control and differential game Intercept guidance laws[J],Journal of Guidance and Control,1981,4:109-115.
[6] Ryoo C K,Cho H,Tahk M J.Optimal guidance laws with terminal impact angle constraint[J].Journal of Guidance,Control and Dynamics,2005,28(4):724-732.
[7] Shafferman V,Shima T.Linear quadratic differential games guidance law for imposing a terminal intercept angle[J].Journal of Guidance,Control and Dynamics,2008,31(5):1400-1412.
[8] Bryson E A,Ho C Y.Applied optimal control[M],Blaisdell,Waltham,MA,1969,9:282-289.
[9] Ben-Asher JZ,Yaesh I.Advances inmissile guidance theory[M].Progress in Astronautics and Aeronautics,AIAA,Reston,VA,1998,180:25-90.
[10] Bernhard P.Linear-quadratic,two-person,zero sum differential games:Necessary and sufficient conditions[J].Journal of Optimization Theory and Applications,1979,27(1):51-69.