張濤, 于雷, 周中良, 李飛
(1.空軍工程大學 工程學院, 陜西 西安 710038;2.中國人民解放軍 94831部隊, 浙江 衢州 324001)
基于變權重偽并行遺傳算法的空戰(zhàn)機動決策
張濤1,2, 于雷1, 周中良1, 李飛1
(1.空軍工程大學 工程學院, 陜西 西安 710038;2.中國人民解放軍 94831部隊, 浙江 衢州 324001)
針對空戰(zhàn)機動決策中態(tài)勢多樣化對機動決策的影響以及控制量的細化問題,以敵我雙機空戰(zhàn)為背景,利用空戰(zhàn)優(yōu)勢函數值作為空戰(zhàn)機動決策的依據,基于滾動時域控制方法,采用變權重自適應偽并行遺傳算法解決空戰(zhàn)決策問題。重點分析了隱身優(yōu)勢函數以及變權重函數的建立、遺傳編碼方式、操作算子的確定,最后對空戰(zhàn)決策進行了仿真。仿真結果驗證了隱身優(yōu)勢函數的合理性,以及該理論在空戰(zhàn)機動決策方面的有效性。
自適應偽并行遺傳算法; 變權重; 機動決策; 優(yōu)勢函數
當前,隨著機載武器、傳感器和飛機本身性能的不斷提高,現代空戰(zhàn)的空間范圍不斷擴大,目標、武器以及本機之間的相互關系也變得越來越復雜。為了減輕駕駛員的負擔,提高空戰(zhàn)效能,對空戰(zhàn)機動決策的研究愈顯重要[1]。針對現代空戰(zhàn)的需求,世界各軍事大國都在加緊空戰(zhàn)機動決策及其生成技術的研究和應用開發(fā)。空戰(zhàn)機動決策問題是NP(Nondeterministic Polynomial)難問題,目前解決此問題的方法有:神經網絡法、影響圖法、Petri網法、蟻群算法、粒子群算法等,其中神經網絡法很難獲得真實的空戰(zhàn)數據來對神經網絡進行學習訓練,影響圖法及蟻群算法的計算時間較長,難以滿足空戰(zhàn)的實時性要求,文獻[2]提出了遺傳算法在戰(zhàn)術飛行動作決策方面的應用,將48種戰(zhàn)術動作進行編碼、遺傳優(yōu)化,但文中沒有給出具體編碼及仿真過程。目前國內的研究主要是依據典型機動動作庫進行機動決策,沒有考慮到控制量的細化問題。本文提出了基于滾動時域的控制方法,對具體控制量進行細化、離散化,采用變權重自適應偽并行遺傳算法解決機動決策問題。
滾動時域方法的實質是用隨時間反復進行的一系列小規(guī)模優(yōu)化問題求解的過程取代一個靜態(tài)的大規(guī)模優(yōu)化問題求解的結果,以達到在優(yōu)化的前提下降低計算量并適應不確定性變化的目的[3]。本文將空戰(zhàn)過程分為多個時間階段,利用滾動時域控制的理論進行求解[4],從而達到作戰(zhàn)要求。
遺傳算法(Genetic Algorithm,GA)是近年來迅速發(fā)展起來的一種基于遺傳學進化思想的隨機搜索優(yōu)化算法[5-6]。該算法作為一種新的全局優(yōu)化搜索算法[7],其具有隱含并行性和全局解空間搜索的特點[8]。自適應偽并行遺傳算法將算法自身隱含的并行性及并行計算相結合,提高了優(yōu)化計算效率、收斂速度,有效抑制了“早熟”現象[7]。
1.1 角度優(yōu)勢函數
角度優(yōu)勢函數主要與雷達最大探測角及空空導彈發(fā)射角有關,戰(zhàn)斗機要進行搜索、跟蹤及武器發(fā)射、制導,必須控制載機使目標在一定的角度范圍內。因此角度優(yōu)勢函數表示為[9]:
(1)
式中,QI為我機速度矢量與目標線的夾角;αmax為空空導彈最大發(fā)射角;βmax為雷達最大探測角。S1取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.2 速度優(yōu)勢函數
速度優(yōu)勢函數為:
(2)
式中,VI為我機速度;VT為目標機速度;VmaxI,VmaxT,VminI,VminT分別為我機和目標機的最大、最小飛行速度。S2取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.3 隱身優(yōu)勢函數
由于飛機的雷達反射面積SRC決定了被發(fā)現的概率及攻擊概率等,直接影響飛機的安全性,因此有必要引入隱身優(yōu)勢函數:
(3)
式中,SRC0為門限SRC差值;SRCT為目標機的雷達反射面積;SRCI為我機的雷達反射面積。S3取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.4 攻擊優(yōu)勢函數
攻擊優(yōu)勢函數的主要決定因素是載機所攜帶導彈的射程,射程與角度優(yōu)勢及隱身優(yōu)勢函數相關,因此攻擊函數引入角度及隱身優(yōu)勢函數,攻擊優(yōu)勢函數為:
(4)
式中,RI為我機機載空空導彈的射程;RT為目標機機載空空導彈的射程。S4取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.5 高度優(yōu)勢函數
高度優(yōu)勢函數為[10]:
(5)
式中,H為我機與目標機的相對高度差,我機在上為正;H0為門限高度差,其值隨空戰(zhàn)形式的不同而變化,可由決策者根據經驗設定。S5取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.6 破壞跟蹤函數
S6=
(6)
式中,ωT為目標機相對我機的角速度;αTmax為目標機最大雷達視場跟蹤角;ωI為我機相對目標機的角速度。S6取值范圍為(0,1),取值越大,優(yōu)勢越大。
1.7 綜合優(yōu)勢函數及變權重的確定
空戰(zhàn)態(tài)勢是決策者進行空戰(zhàn)決策的依據,空戰(zhàn)樣式及時間階段的不同,對各優(yōu)勢函數的敏感度也就不同。為體現決策者的經驗和偏好,綜合交戰(zhàn)雙方的角度、速度、高度、飛機性能、武器性能及攻擊等因素,綜合優(yōu)勢函數為各優(yōu)勢函數及偏好權向量的乘積。偏好權向量W的表達式為:
W=[W1,W2,W3,W4,W5,W6]
(7)
綜合優(yōu)勢函數S為:
S=W1S1+W2S2+W3S3+W4S4+
W5S5+W6S6
(8)
不同作戰(zhàn)態(tài)勢及作戰(zhàn)階段下各影響因素重要程度的變化,通過調整加權系數來體現。根據空戰(zhàn)機動決策過程中的各影響因素的重要性,確定第i影響因素的權重為:
(9)
1.8 目標運動狀態(tài)的預測
假設在當前時刻測定目標位置及運動狀態(tài)已知,目標保持當前運動狀態(tài),根據式(1)預測下一決策時刻目標位置及運動狀態(tài),并根據目標位置及運動狀態(tài)對優(yōu)勢函數進行預測,以備進行決策優(yōu)化時使用。
本文的并行遺傳算法采用粗粒度模型(也稱孤島模型),其原理為將初始的種群分為若干個子種群,并將子種群分配到各子節(jié)點上單獨進行遺傳進化,每隔一定代數,將各子種群中的最優(yōu)個體遷移到其它子種群中,并接納其它子群體送來的最優(yōu)個體[11]。實際應用時可以在一臺計算機上串行實現粗粒度并行遺傳算法,即偽并行遺傳算法。雖然偽并行遺傳算法不具有并行計算的速度優(yōu)勢,但仍具有避免“早熟”的性質,有效地降低了遺傳算法在全局搜索能力方面固有的缺陷[12]。
算法流程如下:
(1)初始化。根據實際問題確定編碼方式,并生成初始群體,編碼方式有二進制編碼和實數編碼。
(2)設計適應度函數,計算每個個體的適應度值。
(3)選擇操作。按照一定的規(guī)則從種群中分別選擇一定數目的染色體進入下一代群體。本文采用多種選擇方法,首先采用最佳個體保留策略,即將適應度值最高的個體不進行交叉和變異,直接選擇進入下一代群體;其余的個體按照適應度值比例法,又稱輪盤賭法[13]。
(4)交叉變異。將選擇的染色體作為父代,根據交叉概率和變異概率,選擇一定數目的染色體進行交叉和變異,得到下一代染色體。交叉概率Pc計算如下:
(10)
式中,Pc∈[Pc1,Pc2],Pc1,Pc2∈(0,1),一般情況下交叉概率Pc1,Pc2∈(0.3,0.9);fmax為群體中的最大適應度值;f′為要交叉的兩個個體中較大的適應度值;favg為群體的平均適應度值。
變異概率Pm計算如下:
(11)
式中,Pm∈[Pm1,Pm2],Pm1,Pm2∈(0,1),一般情況下變異概率Pm1,Pm2∈(0.005,0.300);f為變異個體的適應度值。
(5)遷移。將適應度值高的個體根據規(guī)則發(fā)給其它子種群。本文采用自適應循環(huán)遷移算子,即根據子種群的相對適應度值調整遷移概率,將子種群中適應度高的個體發(fā)給其它子種群[14]。遷移概率Pq計算如下:
(12)
式中,k為比例系數,根據實際問題而定。
3.1 飛機運動模型
飛機本身是一個彈性體,載荷的消耗和使用、操縱系統的運動和飛行員的移動使得質心位置隨時變化,如果考慮這些因素,那么運動方程極為復雜,無法求解。本文假設飛機質量為常數,將飛機視為質點,在慣性坐標系中,用3個描述質心運動的運動學方程確定飛機的運動規(guī)律。
基于地理坐標系(北-天-東)建立運動學方程。假設飛機側滑角和迎角均為0°,發(fā)動機安裝角為0°,則飛機的運動學方程為:
(13)
(14)
式中,Vt為飛機速度;a為飛機加速度;θt為飛機航跡俯仰角;Δθ為飛機航跡俯仰角變化率;φt為飛機航跡偏轉角;Δφ為飛機航跡偏轉角變化率。
因a與當前飛行速度相關,根據飛機飛行規(guī)律可知:在最大速度時的加速度最大為0,在最小速度時的加速度最小為0。因此可以將加速度的取值范圍表示為:
(15)
3.2 基于改進遺傳算法的機動決策模型
首先將戰(zhàn)斗機的飛行控制量離散化,組成染色體群體,每一個染色體代表一組控制量。其基本思想是n個染色體位數代表一個控制量,一條染色體可由多段控制量染色體組成。由3.1節(jié)可知,戰(zhàn)斗機機動可總結為3個控制量進行控制,其中將控制量Δθ,Δφ及a的值域劃分N=2n份,每一數值代表了3個控制量的大小,如表1所示。確定每個控制量對應的染色體位數n(向絕對值大的方向取整),則總的染色體位數為3n。其中,Δφ向右為正,Δθ向上為正,其編碼控制方式如圖1所示。
表1 編碼方式
圖1 飛機機動方式及編碼示意圖
由于控制量的值域范圍不是相對0左右對稱的,尤其是Δθ和a,因此本文假設其分別對其正負兩部分進行N/2等分,具體計算公式如下:
(16)
Δφ和a的計算方式同上。那么任意一個染色體對應的控制量即可根據式(16)來計算得到。
在完成了控制量的離散化及編碼之后,通過自適應偽并行遺傳算法對染色體種群進行尋優(yōu)。本文研究的目的是在空戰(zhàn)中占據主動,增加我方的優(yōu)勢,因此選取我方的優(yōu)勢函數S為目標函數。
(17)
其余的遺傳操作按照第2節(jié)的步驟進行。通過多次迭代后可得到最優(yōu)結果,對應的染色體即為最優(yōu)的染色體,通過式(16)可計算染色體對應的3個控制量值,即為此決策過程中最優(yōu)的機動決策方案。經多次決策就可完成整個空戰(zhàn)過程的機動決策。
仿真條件:假設敵我兩架戰(zhàn)斗機進行空戰(zhàn),我機初始坐標為(0,4,0) km,速度為300 m/s,初始航跡偏轉角為0°,雷達反射面積SRCI為3 m2和0.1 m2,導彈最大射程為15 km,速度范圍為200~400 m/s,雷達最大搜索方位角為60°,導彈最大發(fā)射角為45°;敵機初始坐標為(15.0,4.5,15.0) km,速度為250 m/s,初始航跡偏轉角為180°,雷達反射面積為3 m2,導彈最大射程為10 km,敵機按照預定軌跡飛行;門限高度值為1 km;初始權重為(0.0,0.1,0.2,0.1,0.5,0.1),調整系數為(0.5,0.0,0.0,0.0,-0.5,0.0),每3 s進行一次機動決策。將初始群體分為兩個子種群,每個子種群有20個染色體,每個群體進化50代,仿真結果如圖2和圖3所示。圖2中,n為進化代數。
由圖2可以看出,該算法的進化收斂速度很快。圖2(a)和(b)分別在第一個子種群進化至19和20代時即已尋找到最優(yōu)個體,因此兩個子種群的自適應偽并行遺傳算法可以保證機動決策的最優(yōu)性。通過圖3可以看出,SRCI=3 m2時,敵我隱身優(yōu)勢相當,在初始階段,敵我雙方距離較遠時我機通過爬升機動占據有利位置,在10 s時達到最高高度4.948 km,隨著敵我雙方距離的縮短,角度優(yōu)勢函數權重變大,高度優(yōu)勢函數權重變小,因此我機逐漸轉向角度瞄準;SRCI=0.1 m2時,我機隱身優(yōu)勢及攻擊優(yōu)勢函數值較大,因此我機主要進行角度瞄準,以提前進入攻擊位置。仿真結果驗證了通過變權重自適應并行遺傳算法計算得到的最優(yōu)機動決策結果完全達到了機動決策的目的。
圖2 最優(yōu)個體適應度值與進化代數的關系
圖3 機動決策軌跡圖
本文對戰(zhàn)斗機空戰(zhàn)機動決策進行了研究,利用滾動時域控制思想,將機動決策問題階段化,將控制量細化、離散化,并將變權重自適應并行遺傳算法應用到機動決策中,重點分析了目標函數的建立、編碼以及變權重的確定,并對理論進行了仿真驗證。由仿真結果可以看出,變權重自適應并行遺傳算法在空戰(zhàn)機動決策方面是有效可行的,為空戰(zhàn)機動決策研究提供了參考依據。
[1] James S,Jonathan P,Brian W,et al.Air-combat strategy using approximate dynamic programming[J].Journal of Guidance,Control,and Dynamics,2010,33(5):1641-1654.
[2] 周德云,李鋒,蒲小勃,等.基于遺傳算法的飛機戰(zhàn)術飛行動作決策[J].西北工業(yè)大學學報,2002,20(2):109-112.
[3] 劉東坡.基于滾動機制的有限時域設備更新方法[D].濟南:山東大學,2010.
[4] Benjamin R Carter.Time-optimization of high performance combat maneuvers [D].Monterey:Naval Postgraduate School,2005.
[5] 徐瑋.一種基于復形調優(yōu)遺傳算法的多學科優(yōu)化方法[J].系統工程與電子技術,2010,32(4):869-872.
[6] 張涵璐,吳振森,張昌民,等.BRDF的遺傳算法和遺傳模擬退火算法建模及比較[J].系統工程與電子技術,2010,32(7):1529-1531.
[7] 李正光,黃明,梁旭.改進偽并行遺傳算法求解作業(yè)車間調度問題[J].數學的實踐與認識,2010,40(1):133-138.
[8] 焦李成,尚榮華,馬文萍,等.多目標優(yōu)化免疫算法、理論和應用[M].北京:科學出版社,2010.
[9] 肖冰松,方洋旺,胡詩國,等.一種新的超視距空戰(zhàn)威脅評估方法[J].系統工程與電子技術,2009,31(9):2162-2166.
[10] 郭昊,周德云,張堃.無人作戰(zhàn)飛機空戰(zhàn)自主機動決策研究[J].電光與控制,2010,18(8):28-32.
[11] 李培,郝曉光,周文.基于偽并行遺傳算法的無源電力濾波器優(yōu)化設計[J].電測與儀表,2011,48(7):75-81.
[12] 王萍萍,潘豐.基于改進偽并行遺傳算法的函數優(yōu)化[J].江南大學學報,2010,9(1):12-16.
[13] 元昌安,彭昱忠,覃曉, 等.基因表達式編程算法原理與應用[M].北京:科學出版社,2010.
[14] 陳勇,劉勇,鮑勝利.基于偽并行遺傳算法的路徑測試數據自動生成[J].四川大學學報,2009,41(5):141-145.
(編輯:姚妙慧)
Decision-makingforaircombatmaneuveringbasedonvariableweightpseudo-parallelgeneticalgorithm
ZHANG Tao1,2, YU Lei1, ZHOU Zhong-liang1, LI Fei1
(1.Engineering Institute, Air Force Engineering University, Xi’an 710038, China;2.94831 Unit of the PLA, Quzhou 324001, China)
Considering a scenario of air combat involving two opposed fighters, a decision-making model based on variable weight adaptive parallel genetic algorithm is established by the continually updated preponderance function. This paper mainly discusses the preponderance function, variable weight function, coding mode and operator. The experiment results demonstrated that this algorithm is feasible because it could complete the decision-making for air combat.
adaptive pseudo-parallel genetic algorithm;variable weight;decision-making for maneuvering;preponderance function
E844
A
1002-0853(2012)05-0470-05
2011-12-26;
2012-04-24
航空科學基金資助(20095196012);校博士生創(chuàng)新基金資助(Dx2010106)
張濤(1982-),男,山東新泰人,博士研究生,主要研究方向為航空武器系統總體、仿真與控制。