胡任祎 賀彥峰 史麗楠 馬洋洋 泮斌峰
1.北京航天自動控制研究所,北京 100854 2.西北工業(yè)大學航天學院,西安 710072
隨著戰(zhàn)場環(huán)境的日益復雜化和防御體系的發(fā)展完善,僅考慮單一命中精度要求的導彈末制導律已經(jīng)不能滿足現(xiàn)代戰(zhàn)爭需要。例如,對于反艦作戰(zhàn),不僅需要導彈能夠精確命中目標,還需要滿足特定的攻擊角度以增加毀傷效果;對于協(xié)同作戰(zhàn),為保證導彈同時命中目標,需要滿足攻擊時間約束等。因此,研究復雜環(huán)境多約束條件下制導律,以增加毀傷效果和提高作戰(zhàn)效能,具有重要的理論價值和應(yīng)用前景[1,2]。
除了傳統(tǒng)的比例導引律,先進制導律的研究工作主要依賴于最優(yōu)控制、滑模變結(jié)構(gòu)控制、李雅普諾夫理論、反饋線性化等控制理論。文獻[3]針對再入飛行器含終端位置約束和落角約束的末制導問題,引入了二次型性能指標函數(shù),將含約束的末制導問題描述為線性二次型最優(yōu)控制問題,推導了Riccati方程以提供時變反饋增益,最終得到一種次優(yōu)末制導律。文獻[4]基于滑模控制理論提出了一種以期望落角攔截靜止和勻速運動目標的制導律。該方法在有限時間內(nèi)選擇合適的導彈橫向加速度并在設(shè)計的開關(guān)表面上施加非奇異的終端滑模,進而實現(xiàn)期望的撞擊角。文獻[5]針對含有攻擊時間和終端落角的末制導問題,提出了一種既可用于反艦導彈的有效齊射攻擊也可用于無人飛行器的協(xié)同任務(wù)的新型制導律,該制導律可以導引導彈在指定的攻擊時間內(nèi)以規(guī)定的撞擊角度打擊目標。另外,基于深度學習和強化學習理論的導彈智能制導技術(shù)也得到了充分發(fā)展[6-7],本文不再展開討論。
近年來,模型預測靜態(tài)規(guī)劃(Model Predictive Static Programming, MPSP)算法在軌跡優(yōu)化以及制導控制領(lǐng)域得到廣泛研究和應(yīng)用。它結(jié)合模型預測控制和靜態(tài)規(guī)劃思想,能夠高效解決含終端約束的兩點邊值問題,具有在線計算潛力。文獻[8]針對彈道導彈再入段含終端落角約束的末制導問題,以制導過程消耗能量最少作為性能指標,建立最優(yōu)控制問題,采用MPSP算法將動態(tài)規(guī)劃問題轉(zhuǎn)換成靜態(tài)規(guī)劃問題,進而得到解析最優(yōu)控制量,在打擊靜止和機動目標兩種場景中驗證了該制導律的有效性。文獻[9]針對多枚導彈協(xié)同制導問題,以含攻擊時間約束的制導律作為初始猜測,采用MPSP算法對控制變量進行迭代更新直至滿足落點和落角約束,從而得到能夠同時滿足攻擊時間和攻擊角度約束的次優(yōu)協(xié)同制導律。文獻[10]在MPSP算法基礎(chǔ)上,推導終端輸出和終端時間誤差與控制量增量之間的關(guān)系,并在目標函數(shù)中添加終端時間誤差項,建立控制量增量和終端時間誤差的靜態(tài)優(yōu)化框架,從而設(shè)計出可變終端時間的三維非線性次優(yōu)制導律。文獻[11]提出MPSP算法等價于欠定方程組求根問題的牛頓迭代法,并存在牛頓法的缺點,即當初始猜測遠離真實解時,收斂性較差。文獻[11]進一步引入阻尼增穩(wěn)技術(shù),通過阻尼參數(shù)調(diào)節(jié)迭代步長的大小,提高算法收斂性。
本文在上述研究和分析的基礎(chǔ)上,首先給出傳統(tǒng)MPSP算法的推導過程,然后采用線搜索和信賴域策略發(fā)展出兩種改進型MPSP算法,最后通過數(shù)值仿真驗證了兩種改進型MPSP算法的有效性。
本節(jié)將MPSP算法等價于欠定系統(tǒng)求根問題的牛頓迭代法,并給出推導過程和計算步驟,進而為后文改進型算法奠定基礎(chǔ)。
考慮離散形式的系統(tǒng)動力學方程和輸出方程:
(1)
式中:xi∈n,ui∈m和yi∈p分別為ti時刻下的狀態(tài)矢量、控制矢量和輸出矢量;i=1,2,…,N表示離散形式的時間步長。
考慮典型問題即尋找合適的控制量U使得系統(tǒng)滿足終端約束方程:
(2)
將式(1)代入式(2),可以得到:
(3)
式中:F:mN→p為終端約束函數(shù);U∈mN為離散形式的控制序列,即
因此,上述典型問題可以重新表述為欠定系統(tǒng)的求根問題,如下所示:
(4)
牛頓法是一種高效、常用的迭代算法。從初始猜測U0開始,其迭代公式可以表示為:
(5)
式中:雅可比矩陣F′(Uk)∈p×mN定義為:
(6)
(7)
考慮到式(5)中的迭代方向dUk存在無數(shù)個解,必須施加附加條件使得迭代方向唯一確定。最典型的思路是求解如下最小二范數(shù)問題:
(8)
問題(8)可以利用Lagrange乘子法解析求解,進而得到迭代增量:
dUk=-F′(Uk)+F(Uk)
(9)
式中:F′(Uk)+為雅可比矩陣F′(Uk)的摩爾-彭若斯廣義逆矩陣,其計算公式為:
F′(Uk)+=F′(Uk)T[F′(Uk)F′(Uk)T]-1
(10)
因此,傳統(tǒng)MPSP算法的計算步驟可以概括如下所示:
1. 令k=0,給出控制量初始猜測U0;2. 計算控制量迭代增量dUk;3. 更新控制量Uk+1=Uk+dUk;4. 判斷收斂條件Uk+1-Uk≤ε是否滿足,若滿足,轉(zhuǎn)步驟5,否則,令k=k+1,轉(zhuǎn)步驟2;5. 獲得原問題的解Uk+1,結(jié)束。
牛頓法收斂速度快,計算效率高,但是對初始猜測比較敏感;而線搜索和信賴域是解決牛頓法收斂性的關(guān)鍵技術(shù)。因此,本節(jié)分別基于線搜索和信賴域策略發(fā)展出兩種改進型MPSP算法。
線搜索方法[12]的基本思路是先確定迭代變量的更新方向d,然后在該方向上確定一個最佳的步長α,使得目標函數(shù)沿d方向前進α距離后下降最多。在迭代方向式(9)的基礎(chǔ)上,線搜索的迭代公式可以表示為:
Uk+1=Uk+αdUk
(11)
式中:α為迭代步長,且滿足下述優(yōu)化問題:
(12)
直接求解優(yōu)化問題(12)比較困難,計算量較大。常用的思路是盡可能選擇較大的步長,使得目標函數(shù)值盡可能降低。比如回溯策略從步長為1開始,判斷是否滿足充分下降條件,如果滿足就停止搜索,否則縮小步長,再次判斷,直到滿足充分下降條件為止。
下面給出基于線搜索的MPSP算法的計算步驟,如下所示:
1. 令k=0,給出控制量初始猜測U0和參數(shù)c;2. 計算控制量迭代增量dUk;3. 判斷F(Uk+αdUk)≥(1-α/2)F(Uk)是否滿足,若不滿足,令α=cα,再次判斷,直到滿足條件;4. 更新控制量Uk+1=Uk+αdUk;5. 判斷收斂條件Uk+1-Uk≤ε是否滿足,若滿足,轉(zhuǎn)步驟6,否則,令k=k+1,轉(zhuǎn)步驟2;6. 獲得原問題的解Uk+1,結(jié)束。
信賴域方法[12]的基本思路是先用一個簡單模型近似目標函數(shù),然后確定一個信賴域半徑,在該半徑范圍內(nèi)尋找一個使得近似模型下降最多的更新量。直觀意義上,線搜索方法先確定迭代方向,再確定迭代步長;而信賴域方法先確定最大迭代步長,再確定方向和實際步長。
首先構(gòu)造信賴域子問題,如下所示:
(13)
同理,直接求解優(yōu)化問題式(13)比較困難,計算耗時長。折線法可以利用柯西點和牛頓點近似求解該約束優(yōu)化問題。其中,柯西點即為不考慮信賴域約束情況時問題式(13)的最速下降點,其迭代增量表示如下:
(14)
牛頓點即為不考慮信賴域約束情況時問題式(13)的牛頓下降點,其迭代增量同式(9),表示如下:
(15)
在利用折線法得到信賴域子問題式(13)的近似解后,計算目標函數(shù)的真實下降值,即:
(16)
計算目標函數(shù)的預測下降值,即:
(17)
定義比值rk:
rk=Aredk/Predk
(18)
比值rk代表近似模型與目標函數(shù)的逼近程度,rk越接近1,表示逼近程度越高,并根據(jù)比值rk調(diào)整信賴域半徑Δk的大小。
下面給出基于信賴域的MPSP算法的計算步驟,如下所示:
1. 令k=0,給出控制量初始猜測U0和相關(guān)參數(shù) 0<θmin<θmax<1,0<δmin<δ;2. 計算牛頓點的迭代增量dUkNP,若dUkNP≤δ,則計算dUk=dUkNP,轉(zhuǎn)步驟4,否則,轉(zhuǎn)步驟3;3. 計算柯西點的迭代增量dUkCP,若dUkCP≥δ,則計算dUk=δ·dUkCP/dUkCP,轉(zhuǎn)步驟4,否則,計算dUk=dUkCP+τ(dUkNP-dUkCP),轉(zhuǎn)步驟4;4. 計算Aredk和Predk,并判斷Aredk 考慮導彈三自由度質(zhì)點動力學方程: (19) 式中:[x,y,z]T為導彈的位置矢量;V為速度大??;γ為飛行路徑角;ψ為航向角;m為導彈質(zhì)量;g為重力加速度;az和ay分別為法向和橫向指令加速度。D表示阻力大小,計算公式為: (20) (21) 式中:CD0為零升阻力系數(shù),K為誘導阻力因子,兩者均為速度的函數(shù)。 仿真模型中考慮一階延遲環(huán)節(jié),如下所示: (22) 式中:τ為時間常數(shù)。 制導算法的任務(wù)是求解合適的制導指令az和ay使得導彈能夠擊中目標,并且能夠滿足攻擊時間約束和攻擊角度約束。這里,終端約束條件可以表示為: (23) 本文考慮導彈的初始質(zhì)量為m=150kg,參考面積為S=0.0324m2,氣動參數(shù)參考文獻[13]。導彈的初始狀態(tài)設(shè)置如下: (24) 期望終端位置設(shè)置為(0,0,0)m,終端飛行路徑角和航向角設(shè)為(-40,190)°,終端時間設(shè)為28s。 首先需要給出控制量的初始猜測U0。這里采用2種生成方式:1)采用擴展比例導引律生成初始猜測,記作良好初始猜測;2)采用零控導引律作為初始猜測,即將控制量全部設(shè)置為0,記作差初始猜測。本節(jié)分別利用傳統(tǒng)MPSP算法和2種改進型MPSP算法,并考慮2種初始猜測進行仿真試驗和比較分析。 圖1表示基于傳統(tǒng)MPSP和2種改進型MPSP算法的導彈三維運動軌跡曲線。當采用良好初始猜測時,3種算法均能夠使得導彈命中目標。當采用差初始猜測時,傳統(tǒng)MPSP算法無法收斂,而兩種改進型MPSP算法均能夠保證收斂。 圖1 導彈三維運動軌跡曲線 圖2和圖3分別表示法向和橫向指令加速度變化曲線??梢钥闯觯敳捎昧己贸跏疾聹y時,3種算法得到的指令加速度有少許差異,但變化趨勢保持一致。然而,同一種算法基于2種不同初始猜測得到的指令加速度的變化趨勢存在明顯差別。因此,同一種算法基于不同初始猜測得到的狀態(tài)軌跡、飛行路徑角以及航向角的變化趨勢也存在差別,如圖1、圖4和圖5所示。 圖2 法向指令加速度變化曲線 圖3 橫向指令加速度變化曲線 圖4 飛行路徑角變化曲線 圖5 航向角變化曲線 圖4~5分別表示飛行路徑角和航向角的變化曲線??梢钥闯?,當采用良好初始猜測時,3種算法均能同時滿足攻擊時間和攻擊角度約束。當采用差初始猜測時,兩種改進型MPSP算法也能同時滿足設(shè)定的終端約束。 相比傳統(tǒng)MPSP算法,基于線搜索的改進型MPSP算法需要多消耗大約16.3%的計算時間,基于信賴域的改進型MPSP算法需要多消耗大約28.7%的計算時間。盡管如此,兩種改進型算法仍能保證一定的計算效率,同時具有更強的收斂性。 針對多約束條件下導彈末段制導問題,提出了兩種改進型MPSP制導律算法。傳統(tǒng)MPSP算法對初始猜測比較敏感,收斂性較差;而本文提出的改進型MPSP算法利用線搜索和信賴域策略能夠明顯降低其對初始猜測的依賴性,增強收斂性。仿真結(jié)果表明,兩種改進型MPSP制導律算法,即使在較差初始猜測條件下,均能夠有效地完成飛行任務(wù)。3 數(shù)值仿真
4 結(jié)論