王 杰,丁達(dá)理,董康生,庫 碩
(空軍工程大學(xué)航空航天工程學(xué)院,西安 710038)
自主制空作戰(zhàn)代表著無人作戰(zhàn)飛機(Unmanned Combat Aerial Vehicle,UCAV)的必然發(fā)展方向??諔?zhàn)行為是以機動軌跡的形式表現(xiàn)的,其目的就是要通過機動獲取戰(zhàn)場態(tài)勢優(yōu)勢,因此,空戰(zhàn)戰(zhàn)術(shù)機動建模與軌跡生成是實現(xiàn)UCAV自主空戰(zhàn)的關(guān)鍵技術(shù)之一。對UCAV空戰(zhàn)復(fù)雜機動進行建模,并以此為基礎(chǔ)建立準(zhǔn)確、完備的空戰(zhàn)機動動作庫[1],是實現(xiàn)自主空戰(zhàn)機動軌跡規(guī)劃與控制的基礎(chǔ)。
針對機動動作建模與軌跡生成問題,文獻(xiàn)[2]設(shè)計了一種包含描述參數(shù)的機動動作庫設(shè)計方法,對不同機動動作,采用一個或多個參量進行定量描述,以體現(xiàn)其空間和時間特性,但并未給出控制參數(shù)的自適應(yīng)調(diào)整機制,且機動動作的持續(xù)時間及參數(shù)設(shè)置合理性等問題有待于進一步研究;文獻(xiàn)[3]提出依靠擴展操縱動作庫[1]的拼接的實現(xiàn)復(fù)雜機動,但操縱動作庫設(shè)計時往往采用極限操縱,且控制量參數(shù)設(shè)置在某一范圍內(nèi)不可變,難以實際應(yīng)用;文獻(xiàn)[4-5]提出以控制量變化率為優(yōu)化對象,對標(biāo)準(zhǔn)機動動作進行優(yōu)化,這種方式控制量變化較為靈活,但需要較多的飛行統(tǒng)計數(shù)據(jù),給動作庫的設(shè)計造成一定困難。
綜合考慮機動動作建模的準(zhǔn)確性和多約束條件下軌跡生成的快速性,將戰(zhàn)術(shù)機動動作建模與軌跡生成問題分解為控制量尋優(yōu)和飛行參數(shù)解算兩個過程,建立了機動軌跡最優(yōu)控制模型,設(shè)計了基于自適應(yīng)遺傳算法的求解策略,快速求解得到優(yōu)化的控制量變化率,運用UCAV質(zhì)點運動動力學(xué)模型對所求控制量變化率進行解算,得到機動軌跡的具體參數(shù),并以斤斗機動為例進行了仿真驗證。
本文將機動動作建模與軌跡生成問題中分解為控制量尋優(yōu)和飛行參數(shù)解算兩個過程。UCAV機動過程可以由運動微分方程描述,其過程與實際飛行中UCAV飛行控制系統(tǒng)通過舵面、油門等操控飛機,在機理上完全一致。以軌跡優(yōu)化模型確定控制輸入量的取值來模擬飛行控制系統(tǒng)對飛機的操縱,而以質(zhì)點運動動力學(xué)模型對控制輸入量的反應(yīng)解算結(jié)果來模擬UCAV對操縱指令的反應(yīng),這就是用計算機模擬UCAV機動飛行的全部[6]。其基本邏輯關(guān)系如圖1所示。
圖1 UCAV空戰(zhàn)機動模型結(jié)構(gòu)
為了準(zhǔn)確描述機動過程中UCAV的狀態(tài)特性,必須選擇合適的坐標(biāo)系并對空戰(zhàn)機動軌跡進行精細(xì)建模。
本文考慮的主要坐標(biāo)系包括:慣性坐標(biāo)系,描述UCAV的空間位置;航跡坐標(biāo)系,描述機動軌跡狀態(tài);機體坐標(biāo)系,描述UCAV的姿態(tài)變化。
考慮到模型復(fù)雜度和解算快速性的要求,建立三自由度質(zhì)點運動動力學(xué)模型,模型的參數(shù)定義如圖2所示。
圖2 質(zhì)點模型參數(shù)示意圖
1)慣性坐標(biāo)系下,UCAV質(zhì)點運動方程
2)航跡坐標(biāo)系下,UCAV質(zhì)點動力學(xué)方程
3)氣動力模型
4)燃料消耗近似模型
式中,c為燃料消耗系數(shù)。
5)推力模型
考慮到發(fā)動機模型的復(fù)雜度,采用簡化的推力計算模型[9]:
式中,δ為油門設(shè)置;Tmax為發(fā)動機最大推力。
1)飛行包線約束。考慮UCAV實際飛行包線對復(fù)雜機動軌跡的影響,保證機動動作實施時的平臺可飛行,在UCAV三自由度模型的基礎(chǔ)上,設(shè)置約束如下[10]:
考慮UCAV飛控能力的限制,對偽控制量及其多階導(dǎo)數(shù)進行約束:
考慮平臺的結(jié)構(gòu)安全性,同時保證平臺安全返航,需滿足:
式中,nz為UCAV法向過載,有;nmax為UCAV所能承受的最大法向過載,mmin為保證UCAV安全飛行的前提下最小質(zhì)量。
2)狀態(tài)參量約束??紤]實際飛行環(huán)境,確保安全飛行,需滿足:
為了提高UCAV飛行控制系統(tǒng)對機動動作的控制能力,減小機動動作實施過程中的狀態(tài)偏差,建立以控制量變化率為優(yōu)化對象的機動軌跡最優(yōu)控制模型。將機動動作根據(jù)軌跡特性,劃分為彼此相連的軌跡片斷,每個片段有相同的控制量變化率,并將控制量變化率作為整個過程中的優(yōu)化參數(shù)[4],記為 f。
將機動動作按軌跡特性劃分為彼此相連的軌跡片斷,預(yù)留了較多的退出窗口,保證了機動的及時退出,符合空戰(zhàn)實際,因而具有較強的適用性。軌跡片段的終止條件為:
式中,Xi表示第i時刻的狀態(tài)向量,Xmf表示第m個軌跡片斷終止的狀態(tài)向量,ξ為一個很小的數(shù)。
3.1.1 性能指標(biāo)要求
考慮性能指標(biāo)函數(shù)對不同機動動作的廣泛適應(yīng)性,函數(shù)應(yīng)主要包括以下內(nèi)容:
1)關(guān)鍵點的狀態(tài)約束。按照一定的規(guī)則設(shè)置關(guān)鍵點,并施加相應(yīng)的狀態(tài)約束,以修正動作實施過程中的狀態(tài)偏差。關(guān)鍵點的選取可以根據(jù)統(tǒng)計數(shù)據(jù)獲得,也可以根據(jù)需要自適應(yīng)地選取。
2)控制量變化率約束。用以保證機動過程中狀態(tài)參量的穩(wěn)定過渡,增強系統(tǒng)的穩(wěn)定性和安全性。
3)時間狀態(tài)約束。設(shè)置時間約束,保證機動動作的快速進入和有效實施。按需劃分出時間范圍片段,并設(shè)置相應(yīng)的狀態(tài)參量范圍。
4)其他約束??紤]到不同機動可能需要分別建模,預(yù)留窗口,以適應(yīng)不同的機動類型。
3.1.2 性能指標(biāo)函數(shù)
為了消除函數(shù)各部分之間由于量綱或數(shù)量級不同而對總體目標(biāo)函數(shù)產(chǎn)生影響力的差距,對性能指標(biāo)函數(shù)的4個部分均進行歸一化處理[4]。表示形式如式(11)所示。
式中,n表示關(guān)鍵點的個數(shù),m表示軌跡片斷數(shù),l表示時間狀態(tài)片段的個數(shù),ωi為函數(shù)各部分的權(quán)重系數(shù)。
Pi(X)表示第i個關(guān)鍵點超出標(biāo)準(zhǔn)約束的罰函數(shù),定義有:
式(12)中,wi,a表示第 i個關(guān)鍵點第 a個參數(shù)的權(quán)重,pi,a表示第i個關(guān)鍵點第a個參數(shù)的罰函數(shù);ri表示第 i個關(guān)鍵點的權(quán)重[4]。
Fj為相鄰軌跡片段控制量變化率差值的歸一化表述,有:
Smax和Smin分別表示控制量變化率差值的最大值與最小值;sj表示第j個變化率差值所具有權(quán)重,通常情況下,各個軌跡變化率差值的權(quán)重相同,即。
Tk表示第k個時間片段,各狀態(tài)量超出標(biāo)準(zhǔn)約束的罰函數(shù)。在每個時間段內(nèi),存在多個狀態(tài)點,為保證操縱的連續(xù)性,應(yīng)使盡可能多地滿足約束。為簡化計算,設(shè)每個狀態(tài)點均需要符合約束要求,定義有:
式中,ssk表示第k個時間片斷的狀態(tài)點的個數(shù),有,ΔTk為該時間段的時長,Δt為仿真步長;wk,i,r和 pk,i,r分別表示第 k 個時間片段第 i個狀態(tài)點第r個參數(shù)的權(quán)重和罰函數(shù)。qk表示第k個時間片段所具有的權(quán)重。
為了驗證所建模型的有效性,以斤斗機動動作為例,建立斤斗機動最優(yōu)控制模型。斤斗機動是典型的鉛垂面機動,主要有爬升和俯沖兩個過程,具有大機動、大迎角的特點,在典型機動動作中具有很好的代表性。
以航跡傾角γ為劃分對象,每10°航跡傾角劃分一個軌跡片斷,對于一個完整的斤斗動作,可劃分為36個彼此相連的軌跡片斷,每個軌跡片斷均有相同的控制量變化率。假設(shè)斤斗機動過程中,航跡滾轉(zhuǎn)角u=0,發(fā)動機保持最大工作狀態(tài),即油門設(shè)置δ=1,則斤斗機動過程中,優(yōu)化參數(shù)為迎角變化率fα,仿真過程中,取。
3.2.1 關(guān)鍵點的選取
關(guān)鍵點對機動狀態(tài)進行數(shù)學(xué)表征,保證UCAV及時修正動作偏差,但過多的關(guān)鍵點會造成數(shù)據(jù)冗余和計算量的增加。因此,關(guān)鍵點的選取,應(yīng)在保證動作正常完成的同時,設(shè)置數(shù)量盡量地少。仿真以航跡傾角γ為劃分對象,需要進行參數(shù)判斷的關(guān)鍵點設(shè)置為4個,如表1所示。
表1 斤斗機動操縱關(guān)鍵點
對于斤斗機動過程中的4個關(guān)鍵點,設(shè)置狀態(tài)約束及超出標(biāo)準(zhǔn)約束的罰函數(shù)。其中兩個關(guān)鍵點的約束及對應(yīng)的罰函數(shù)如表2所示。罰函數(shù)設(shè)置時,對狀態(tài)參數(shù)進行了歸一化處理。狀態(tài)參數(shù)的閾值范圍由數(shù)據(jù)統(tǒng)計獲得。
3.2.2 時間狀態(tài)約束
為了克服斤斗機動實施過程中出現(xiàn)的進入機動過慢,導(dǎo)致爬升高度過高,高點速度過低的典型錯誤,需要對時間狀態(tài)進行約束。狀態(tài)約束及其超限的罰函數(shù)如表3所示。
表2 斤斗機動關(guān)鍵點狀態(tài)約束及其罰函數(shù)
表3 斤斗機動時間狀態(tài)約束及其罰函數(shù)
3.2.3 軌跡判斷終止條件
判斷斤斗動作的終止?fàn)顟B(tài)參數(shù)為航跡傾角γ[4],判斷條件為:
式中,γj,f為軌跡片斷的終止條件,ξ為一個很小的數(shù),仿真取 ξ=0.1°。
綜上,斤斗戰(zhàn)術(shù)機動動作最優(yōu)軌跡控制過程是一個多約束的最優(yōu)控制問題,控制對象為第2節(jié)所建立的非線性時變系統(tǒng),性能指標(biāo)為4個關(guān)鍵點狀態(tài)約束、36個控制量變化率約束和1個時間狀態(tài)約束,求解對象為使式(11)所描述的性能指標(biāo)函數(shù)達(dá)到最優(yōu)的36組迎角變化率序列。
機動動作最優(yōu)控制模型的求解是一個對于非線性時變系統(tǒng)的函數(shù)優(yōu)化問題,遺傳算法具有較強的適應(yīng)性。本文根據(jù)遺傳算法的基本原理,設(shè)計了基于自適應(yīng)遺傳算法[11]的最優(yōu)軌跡控制問題求解策略。基本步驟如下:
第1步:確定決策變量及約束條件
選擇合適的控制量,根據(jù)軌跡片斷的劃分方式,分別確定其變化率序列長度及取值區(qū)間。
第2步:建立優(yōu)化模型
根據(jù)機動動作狀態(tài)約束,確定性能指標(biāo)函數(shù)J的類型及數(shù)學(xué)表示形式,如式(11)所示。
第3步:確定編碼方式
采用十進制編碼方式,對染色體進行編碼,將控制量變化率序列對應(yīng)染色體上的基因片段。對于斤斗機動,每一個染色體對應(yīng)一個由36個迎角變化率構(gòu)成的序列。
第4步:確定個體評價方法
如式(11)所示,性能指標(biāo)函數(shù)非負(fù),優(yōu)化目標(biāo)是求函數(shù)的最小值。遺傳算法以個體適應(yīng)度的大小來確定該個體被遺傳到下一代群體中的概率,個體適應(yīng)度值越大,其被選擇的概率就越大,因此,遺傳算法適合求解適應(yīng)度函數(shù)的最大值。故將性能指標(biāo)函數(shù)的倒數(shù)作為適應(yīng)度函數(shù),定義為:
f為個體適應(yīng)度函數(shù),J為性能指標(biāo)函數(shù)。適應(yīng)度函數(shù)的計算流程如圖3所示。
第5步:設(shè)計遺傳算子
選擇運算采用順序選擇策略。首先按適應(yīng)值大小對個體進行排序,適應(yīng)度值最大的個體選擇概率為q,排序后的第j個個體選擇概率為:,NP為種群數(shù)量。保證每個個體都能夠被選中產(chǎn)生后代,保持種群的多樣性。
交叉與變異運算采用自適應(yīng)策略[12],使交叉概率和變異概率能夠隨適應(yīng)度值大小自動改變,當(dāng)種群各個體適應(yīng)度趨于一致或趨于局部最優(yōu)時,交叉概率和變異概率二者同時增加,而當(dāng)種群適應(yīng)度比較分散時,兩者均自適應(yīng)減小。交叉運算使用單點交叉算子,變異運算采用基本位變異算子,交叉概率Pc和變異概率Pm計算方式如下
其中,fmax為種群中的最大適應(yīng)度值;favg為群體平均適應(yīng)度值;f為要交叉的個體中較大的適應(yīng)度值;f′為要變異的個體的適應(yīng)度值,為雜交常數(shù),為變異常數(shù)。
第6步:設(shè)定遺傳算法的運行參數(shù)
根據(jù)實際需要確定染色體編碼長度L,種群大小NP,進化代數(shù)NG,選擇概率q,雜交常數(shù),變異常數(shù)。
圖3 適應(yīng)度函數(shù)計算流程
以斤斗動作為例,對UCAV戰(zhàn)術(shù)機動模型進行驗證。
仿真實驗中,忽略風(fēng)場擾動的影響,UCAV初始方位設(shè)置為(0,0,1 000)km,初始速度 vu0=220 m/s,迎角 α=0°,航跡傾角 γ=0°,航跡偏角 ψ=0°,航跡滾轉(zhuǎn)角 μ=0°;油門設(shè)置 δ=1;仿真步長 h=0.1 s;UCAV性能參數(shù)參照文獻(xiàn)[6]。性能指標(biāo)函數(shù)各部分權(quán)重之比為,即優(yōu)先保證系統(tǒng)的穩(wěn)定性;關(guān)鍵點的權(quán)重之比為,即盡可能地滿足機動改出條件;關(guān)鍵點各狀態(tài)參量的權(quán)重相同。
遺傳算法的性能參數(shù)設(shè)置如下:種群數(shù)量NP=500,進化代數(shù)NG=1 000,染色體編碼長度L=36,雜交常數(shù),變異常數(shù)。
適應(yīng)度函數(shù)進化的曲線如圖4所示。由圖4可知,種群均值和最優(yōu)適應(yīng)度函數(shù)值隨進化代數(shù)迅速增加,至159代時趨于平穩(wěn),第840代時,收斂到全局最優(yōu),最優(yōu)控制量變化率曲線如圖5所示。
圖4 適應(yīng)度函數(shù)進化曲線
圖5 迎角變化率曲線
圖6 迎角隨航跡傾角變化曲線
參照所建立的UCAV空戰(zhàn)機動模型結(jié)構(gòu),將所求得的最優(yōu)控制量變化率序列帶入質(zhì)點運動動力學(xué)模型進行飛行參數(shù)解算,得到狀態(tài)變量[x,y,h,v,γ,ψ,m]T的具體值。
控制量迎角隨航跡傾角的變化曲線如圖6所示。綜合圖5和圖6可知,斤斗機動迎角變化過程分為兩個階段,第1個階段0°≤γ≤250°,迎角隨航跡傾角逐漸增大,至γ=250°,迎角達(dá)到最大值;第2階段250°<γ≤360°,迎角隨航跡傾角增大逐漸減小,直至滿足終端約束要求,斤斗動作正常改出。
航跡變化曲線如圖7所示,UCAV姿態(tài)角度由式(7)求得。機動過程中,鉛垂方向,最大高度差值為1 851 m;水平方向,最大水平跨度為1 987 m。
圖7 航跡變化曲線
圖8和圖9分別表示過載隨時間和航跡傾角的變化曲線。過載產(chǎn)生主要受升力L、推力T和迎角α的影響,參照氣動力變化曲線(如下頁圖10)及過載轉(zhuǎn)化公式,可知升力L對法相過載的產(chǎn)生起著決定性作用。機動過程中,法向過載變化過程可分為4個階段,大致與升力變化曲線保持一致,當(dāng)γ=40.71°,仿真時間t=6.1 s時,法向過載取最大值,為nz=5.29。仿真飛行時間為33.5 s。仿真過程中,速度隨航跡傾角的變化曲線如下頁圖11所示,可見,機動實施時,先短暫加速,以完成進入機動前的準(zhǔn)備,之后進行減速爬升和加速俯沖兩個過程,這與飛行實際是相吻合的。
圖8 法向過載隨時間的變化曲線
圖9 法向過載隨航跡傾角的變化曲線
綜上可知,所建模型,能夠準(zhǔn)確描述和表征機動動作;求解策略能夠迅速收斂到全局最優(yōu),并得到控制量變化率;生成的軌跡符合機動動作的幾何形態(tài)和狀態(tài)特性,并滿足時間窗口限制。
圖10 氣動力隨航跡傾角的變化曲線
圖11 速度隨航跡傾角的變化曲線
本文面向UCAV自主空戰(zhàn)技術(shù)的迫切需求,對UCAV戰(zhàn)術(shù)機動動作建模與軌跡生成問題進行了研究,提出了實現(xiàn)UCAV空戰(zhàn)機動動作的模型結(jié)構(gòu),建立了精細(xì)的UCAV質(zhì)點運動模型,設(shè)計了以控制量變化率為優(yōu)化對象的機動軌跡最優(yōu)控制模型,并給出了基于自適應(yīng)遺傳算法的求解策略,仿真表明所建立的模型可以較好地體現(xiàn)機動動作的幾何形態(tài)和狀態(tài)特性。研究成果對UCAV空戰(zhàn)戰(zhàn)術(shù)決策、空戰(zhàn)戰(zhàn)法模擬、以及飛行員輔助駕駛等問題具有廣泛的適用性。