明瑞晨, 劉小雄, 李煜, 章衛(wèi)國
(1.西北工業(yè)大學 自動化學院, 陜西 西安 710129; 2.陜西省飛行控制與仿真技術重點實驗室, 陜西 西安 710129)
飛行空戰(zhàn)研究一直以來都是飛行控制領域的重點難點,并且空戰(zhàn)的研究方法也在不斷地改進。早期的空戰(zhàn)決策研究中,大多數采用博弈論、最優(yōu)控制等思想。Jarmark[1-2]建立雙機對抗微分博弈模型,然后使用微分動態(tài)規(guī)劃法來求解。Imado等[3]使用了最優(yōu)控制方法,通過對迎角和推力的控制實現空戰(zhàn)中對導彈的規(guī)避。這些方法的主要思路都是首先建立理想的空中對抗模型,然后使用一些數學方法,比如微分動態(tài)規(guī)劃法來得到最優(yōu)解,而實際的空戰(zhàn)模型非常復雜,加上這一時期的研究中幾乎沒有建立態(tài)勢模型,因此優(yōu)化目標通常是飛機的狀態(tài)信息,得出的最優(yōu)解的應用范圍比較小。
為解決這種方法的不足,關于空戰(zhàn)的架構研究開始發(fā)展起來。Byrnes[4]提出了一種概念無人機FQ-X,這種無人機采用了觀察、判斷、決策、執(zhí)行回路(observation,orientation,decision,action,OODA)和能量機動結構,并在OODA的框架下設計了無人機自主作戰(zhàn)決策。李清偉等[5]提出了一種空戰(zhàn)分層決策模型,使用經驗知識將復雜高維的戰(zhàn)場決策分解成數個低維的模塊,決策模型更加符合空戰(zhàn)作戰(zhàn)經驗。OODA作為這一時期的空戰(zhàn)架構,給眾多研究者指明了空戰(zhàn)中的研究重點和研究方向,其中態(tài)勢評估可以作為OODA的評價標準也成為研究重點。
態(tài)勢評估作為空戰(zhàn)博弈的感知和評價[6]在空戰(zhàn)決策模型中起到至關重要的作用。在眾多的態(tài)勢評估研究成果中,幾乎都是基于導彈攻擊區(qū)進行設計的,其中角度態(tài)勢尤為重要。史振慶等[7]在估計角度態(tài)勢時,考慮了敵機的攻擊區(qū)對我機的影響。蘭軼冰等[8]使用幾何學方法對角度態(tài)勢進行評估。王光輝等[9]使用區(qū)間數和模糊綜合評判結合的方法得到空戰(zhàn)威脅評估模型。趙克新等[10]使用改進的決策樹方法估計空戰(zhàn)態(tài)勢。Xuan等[11]使用灰色模糊貝葉斯網絡表示空戰(zhàn)態(tài)勢。姜龍亭等[12]根據貝葉斯概率提出一種動態(tài)變權重的態(tài)勢評估方法。此外,態(tài)勢評估還可以應用在強化學習的獎懲函數上,以強化學習為基礎的空戰(zhàn)策略也流行開來。
近年來,隨著計算機算力的提升,信息化、人工智能等技術的發(fā)展,深度學習、強化學習等人工智能計數的研究流行開來,而基于這種人工智能思路的空戰(zhàn)決策的研究也已有不少。謝建峰等[13]使用強化學習的思想對遺傳算法進行改進,設計了無人機空戰(zhàn)機動決策算法。謝俊潔等[14]在空戰(zhàn)決策中使用Q-learning的強化學習方法進行目標分配,使用智能優(yōu)化算法進行火力分配。Lowe等[15]使用了actor-critic方法的強化學習研究了多智體的協(xié)同對抗問題。2020年DARPA舉行了阿爾法狗斗試驗,表明了空戰(zhàn)決策技術日益成熟,且愈加得到重視。
空戰(zhàn)研究不僅體現在頂層的空戰(zhàn)決策上,而且在底層的控制研究也有不少,藍偉華等[16]根據不同空戰(zhàn)環(huán)境設計了瞄準攻擊、逃逸等控制律。劉佩等[17]采用復合控制思想,在原始控制中加入限幅、指令淡化等功能,來實現空戰(zhàn)機動的飛行軌跡控制。反步法作為一種成熟的非線性控制方法已經應用于各類控制領域上。反步法是在20世紀90年代初,由Kanellakopoulos等提出,該方法在設計之處就考慮了Lyapunov穩(wěn)定性,通過引入虛擬控制的概念,采用逐步反推的思想對每一環(huán)進行控制器設計。反步法發(fā)展至今,有著諸多的改進,其中約束反步法能夠有效解決常規(guī)反步法沒有考慮系統(tǒng)輸入和狀態(tài)的約束問題。在設計約束反步法控制器中,一種方案是引入誤差的修正量,通過對修正量的更新,保證系統(tǒng)穩(wěn)定;另一種方案是引入障礙Lyapunov函數,由此設計的控制器會在范圍的邊界附近阻止狀態(tài)越界。反步法作為目前非線性控制中較為成熟的方法,在飛行控制方面有著諸多研究。
針對飛行機動過程中沒有考慮態(tài)勢信息,導致己機在機動時飛行安全受到影響的問題,比如飛機執(zhí)行一個斤斗等類似的機動,整個機動做完耗費的時間基本上都超過20 s,有人機由于過載限制,所用時間會更長,而在這段時間內,己機的路徑都是固定的,很容易被預測并針對。本文提出了帶態(tài)勢信息約束的反步法的空戰(zhàn)機動控制方法,該方法可以保證飛機在做特定機動過程中,通過設計特定的Lyapunov函數,運用帶約束的反步法,將角度態(tài)勢信息考慮到控制中,得到帶有角度態(tài)勢約束的反步法控制律。最后通過仿真驗證了在斤斗機動和上半滾倒轉機動中,該方法能考慮到態(tài)勢變化并有效地使得飛機角度態(tài)勢朝優(yōu)勢發(fā)展。
一對一空戰(zhàn)過程中,己機通常根據敵機的相對位置、航向等信息,采取相應的機動進行應對。因此空戰(zhàn)決策通??梢苑譃閼B(tài)勢評估部分和機動動作設計部分。
一對一空戰(zhàn)態(tài)勢模型實質上是敵我兩機在對方導彈攻擊區(qū)的可能性模型。而導彈攻擊區(qū)是指載機在一定的發(fā)射條件下導彈可以命中的空間范圍。在態(tài)勢評估中,通常將這種模型分解成4個方面,分別是速度、高度、距離和角度。
本文主要目標是將態(tài)勢信息引入到底層控制中,用角度態(tài)勢對飛機的橫滾模態(tài)進行修正。
圖1 空戰(zhàn)基本態(tài)勢
在對角度態(tài)勢建模時,忽略導彈最大離軸發(fā)射角和最大搜索方位角,認為在目標進入角不變時,目標方位角為0時態(tài)勢最優(yōu),為π時態(tài)勢最劣,基于這種思想,對目標方位角進行劃分,可以得到近似的角度態(tài)勢模型為
Sa=
(1)
式中,Sa為角度態(tài)勢值,范圍在[-1,1],大于0時表示優(yōu)勢,小于0時表示劣勢。其態(tài)勢與目標方位角和目標進入角之間的關系如圖2所示。
圖2 角度態(tài)勢圖
通常機動動作庫的設計有2種思路:①NASA提出的7種基本的機動動作;②使用典型戰(zhàn)術機動的動作庫,比如眼鏡蛇機動、斤斗等。本節(jié)內容主要針對第二種,對斤斗機動和上半滾倒轉機動進行設計。
斤斗動作能夠降低前進速度,能將劣勢態(tài)勢轉為優(yōu)勢,同時在躲避空空導彈上也起到作用。關于斤斗動作的控制通常是分階段的,根據飛機所處的不同狀態(tài),選擇合適的控制目標。下面給出斤斗動作的執(zhí)行流程。
表1 斤斗動作流程
上半滾倒轉在前半段同斤斗一樣,使飛機拉起,后面通過控制滾轉角,將飛機回正。因此,可以給出上半滾倒轉機動流程。
表2 上半滾倒轉動作流程
飛行過程中,飛機的狀態(tài)量存在各類物理條件下的約束,比如速度迎角和高度應該在飛行包線內,控制律的舵面輸出存在速度和位置的限制等。這些約束在常規(guī)飛行下不會影響飛機的穩(wěn)定,然而當飛機在機動飛行或者需要給出大的指令信號時,由控制律輸出的數值很容易導致舵面飽和,進而影響系統(tǒng)的穩(wěn)定性。
本節(jié)將對這類自身約束的飛機進行反步法的飛行控制律設計。
以六自由度飛機模型為例,給出飛機速度,氣流角和角速度的微分方程
(2)
(2)式可寫成
(3)
其中,角度回路中,系統(tǒng)狀態(tài)為氣流角和角速率
(4)
根據模型(3)設計控制律,首先對速度通道控制律進行設計。
zV=V-Vref
(5)
(6)
式中,χV為誤差的修正量。設Lyapunov函數為
(7)
對(7)式求導
(8)
(9)
(10)
由(9)式和(10)式可得控制律為
(11)
(12)
然后對氣流角回路控制律進行設計,定義氣流角誤差變量和修正誤差變量
zαβφ=xαβφ-xαβφ,ref
(13)
(14)
式中,χαβφ為氣流角修正值。可得虛擬控制律為
(15)
(16)
可得控制律為
式中:u0為控制律解算出的結果;u表示由指令濾波器輸出后的結果,指令濾波器結構如圖3所示。
圖3 控制律輸出的指令濾波器結構
設Lyapunov函數為
(21)
兩邊求導
(22)
將(16)式和(20)式帶入(22)式可得
(23)
由(4)式可以看出gαβφ(x),gpqr(x)都是滿秩的,因此二者可以直接求逆,并且控制律結果是唯一的,不存在奇異情況。
將虛擬控制律(15)式和控制律(19)式帶入(23)式得
(24)
在空戰(zhàn)過程中,飛機在采取特殊機動,如斤斗、上半滾倒轉這類機動時,能夠通過這類機動取得優(yōu)勢,但同時,這種特殊機動需要持續(xù)約20~60 s不等的時間,而在這段時間內,己機的未來運動軌跡很容易被預測,如果敵機采取針對動作時,己機需要盡快切出這個機動,否則會十分被動。
因此飛機在做機動的過程中,還應該考慮兩機之間的態(tài)勢變化,如果在做常規(guī)的機動控制中包含態(tài)勢的信息,將更有利于空戰(zhàn)中己機的生存率。
這里將角度約束增加到控制律中,對角度態(tài)勢改變最有效的是控制航跡滾轉角,由前文內容可知約束反步法的控制律輸出,在帶有態(tài)勢約束的情況下,設修正誤差為
(25)
式中:χμ為航跡滾轉角的修正量;c為方向參數,取值為±1。則可得虛擬控制律和修正量χμ的更新律為
(26)
(27)
式中:kμ為正數,是控制律增益,同時也表示修正量收斂到0的快慢;f(*)為態(tài)勢到修正程度的函數,根據態(tài)勢的優(yōu)劣程度,設置相應的函數使得修正量始終向態(tài)勢變優(yōu)的方向發(fā)展。因此控制律的重點就在于求解f(*)的表達形式。
在(27)式的作用下,當態(tài)勢值為優(yōu)勢時,此時χμ在f(Sa,χμ)控制下應該朝向0變化。當態(tài)勢為劣勢時,在f(Sa,χμ)控制下χμ存在一定的偏差來修正原本的控制量。因此可以得到f(Sa,χμ)的大致表達式
f(Sa,χμ)=Sa(-kμχμ+kS(1-Sa))
(28)
(29)
由(29)式可知,在初始時刻,c為1,然后c的取值將由上一拍的c決定。如果態(tài)勢朝優(yōu)勢變化,則c不變,認為此時的修正量對誤差的修正方向不變;如果態(tài)勢朝劣勢變化,則c取反,認為此時的修正量對誤差的修正方向應該反向。
修正誤差更新律是將態(tài)勢信息轉換成航跡滾轉角的指令數值,這一過程中需要考慮修正誤差的定義范圍。這里引入障礙Lyapunov函數,障礙Lyapunov函數是一種特殊的Lyapunov函數,常見形式有分數形式,對數形式或者正切形式。當狀態(tài)量在區(qū)間邊界附近時,其導數會非常大,阻止狀態(tài)量越出邊界。
對于原修正誤差χμ,可以定義Lyapunov函數為
(30)
則(30)式的導數為
(31)
當態(tài)勢為優(yōu)勢時,即Sa>0時,忽略χμ的更新輸入,有
(32)
現使用障礙Lyapunov函數進行改進
(33)
式中,L為χμ的邊界,即可認為χμ∈(-L,L),則χμ的更新律可改進為
(34)
設Lyapunov函數為
(35)
對其求導得
(36)
將(26)式和(34)式帶入(36)式可得
(37)
當態(tài)勢為優(yōu)勢時,即Sa>0時,設Lyapunov函數為
(38)
對(38)式求導,將(34)式代入,在不考慮輸入時
(39)
所以可得χμ→0成立。
由穩(wěn)定性分析可知,在系統(tǒng)處于優(yōu)勢時,此時修正量會很快趨于零,即優(yōu)勢狀態(tài)下,基本不會對系統(tǒng)指令進行修正。而在系統(tǒng)處于劣勢時,此時控制律的修正量將起作用,通過對滾轉角虛擬控制律進行修正,確保系統(tǒng)的態(tài)勢向優(yōu)勢變化。
仿真中使用F-16飛機進行空中對抗模擬。首先給出初始狀態(tài)己機為劣勢時,采用斤斗機動的仿真結果。其中飛機的初始狀態(tài)包括三軸位置以及速度、航跡傾斜角和航機方位角用[x,y,h,V,γ,χ]表示,敵機初始狀態(tài)為[1 500,4 000,3 000,150,0,0],己機初始狀態(tài)為[0,0,3 000,150,0,0]。
圖4 直接斤斗機動雙機軌跡
圖5 帶角度態(tài)勢約束的斤斗機動雙機軌跡
圖6 上半滾倒轉機動2種方法舵面輸出對比
圖7 斤斗機動2種方法角度態(tài)勢對比
由仿真結果可以看出,在仿真起始時,己機處于劣勢態(tài)勢,此時在修正誤差的作用下,己機向右側偏,態(tài)勢逐漸增大。隨后在斤斗翻轉的過程中,己機最終會從劣勢轉成優(yōu)勢。帶了態(tài)勢約束的斤斗機動比直接機動在系統(tǒng)態(tài)勢上有了一定提升。
然后給出己機在初始狀態(tài)處于互為均勢時,采用上半滾倒轉的仿真結果。其中飛機的初始狀態(tài)包括三軸位置以及速度、航跡傾斜角和航機方位角[x,y,h,V,γ,χ],敵機為[1 000,3 000,3 000,150,0,0],己機為[0,0,3 000,150,0,0]。
圖8 直接上半滾倒轉機動雙機軌跡
圖9 帶角度態(tài)勢約束的上半滾倒轉機動雙機軌跡
由仿真結果可以看出,開始時己機處于互為均勢,在修正誤差的作用下,己機開始向右側偏,到飛機俯仰角翻轉180°后,己機態(tài)勢最終變?yōu)閮?yōu)勢。帶了態(tài)勢約束的上半滾倒轉機動比直接機動在系統(tǒng)態(tài)勢上有了一定提升。
圖10 上半滾倒轉機動2種方法舵面輸出對比
圖11 上半滾倒轉機動2種方法態(tài)勢值對比
針對機動飛行過程中,己機會受到敵機機動飛行的影響,導致態(tài)勢變差的問題,本文提出了一種帶有態(tài)勢約束的機動控制律設計方法。將態(tài)勢信息作為約束,引入到底層控制律中,當飛機處在劣勢態(tài)勢時,控制律會通過修正誤差使飛機態(tài)勢朝優(yōu)勢變化;而當飛機優(yōu)勢時,則修正誤差會很快收斂至零。通過斤斗機動和上半滾倒轉機動的仿真驗證表明,將態(tài)勢信息引入控制律設計中,己機的飛行軌跡更優(yōu),態(tài)勢得到了很大提升。本文為飛機空戰(zhàn)的控制提供了一種新的思路,這和微分對策等最優(yōu)求解的方法有所不同。微分對策這類方法則更重視對優(yōu)化目標函數的求解,以得到最優(yōu)空戰(zhàn)態(tài)勢,而本文的方法認為態(tài)勢信息不止作為決策的輸入,還可以作為控制器的補償值,這種方法更加看重系統(tǒng)的穩(wěn)定性,其次是提升空戰(zhàn)態(tài)勢。最后,本文只是引入了態(tài)勢估計的一部分,即角度態(tài)勢,并補償到橫滾通道控制量中,而對于更全面的態(tài)勢,以及對應的控制分配問題還需要進一步的研究。