徐星光, 王曉峰, 姚 璐, 任 章
(1. 北京機(jī)電工程研究所, 北京 100074; 2. 北京航空航天大學(xué)自動(dòng)化科學(xué)與電氣工程學(xué)院, 北京 100191;3. 復(fù)雜系統(tǒng)控制與智能協(xié)同技術(shù)重點(diǎn)實(shí)驗(yàn)室, 北京 100074)
編隊(duì)構(gòu)型設(shè)計(jì)體現(xiàn)固定翼無人機(jī)任務(wù)需求多樣性,通信拓?fù)鋬?yōu)化是平衡協(xié)同控制、網(wǎng)絡(luò)通信性能、集群隱蔽性的信息交互基礎(chǔ)?;诂F(xiàn)代優(yōu)化理論和智能算法,需要分析影響集群綜合作戰(zhàn)效能的隊(duì)形與網(wǎng)絡(luò)通信設(shè)計(jì)關(guān)鍵指標(biāo),建立優(yōu)化模型。特別地,在飛行速度日益加快、飛行任務(wù)不斷豐富的需求背景下,優(yōu)化模型對(duì)關(guān)鍵指標(biāo)的覆蓋程度、計(jì)算實(shí)時(shí)性、部署實(shí)用性問題愈加重要。為適應(yīng)復(fù)雜高強(qiáng)度對(duì)抗環(huán)境,攻防雙方集群編隊(duì)規(guī)模均可能呈幾何增長,這將給飛行器隊(duì)形與網(wǎng)絡(luò)連通性在線設(shè)計(jì)帶來成倍計(jì)算復(fù)雜度,而飛行器計(jì)算資源與通信帶寬有限,因而如何在確保優(yōu)化準(zhǔn)確度基礎(chǔ)上提升規(guī)模編隊(duì)下計(jì)算速度是編隊(duì)構(gòu)型與拓?fù)鋬?yōu)化問題中面臨的一個(gè)難點(diǎn)。所以,如何建立編隊(duì)構(gòu)型與通信拓?fù)渲笜?biāo)體系,如何設(shè)計(jì)考慮攻防對(duì)抗態(tài)勢(shì)與最小信息流要求的優(yōu)化模型,并保證計(jì)算精度與實(shí)時(shí)性均衡,是首先要解決的關(guān)鍵問題。
多飛行器編隊(duì)構(gòu)型與通信拓?fù)鋬?yōu)化問題是指在滿足各種規(guī)范和某些特定要求的前提下,使編隊(duì)在空間域物理構(gòu)型、信息域通信拓?fù)涞哪撤N廣義性能指標(biāo)最佳,在所有可用的協(xié)同方案中找出飛行器在編隊(duì)中的最優(yōu)站位,同時(shí)減少總的通信代價(jià)。編隊(duì)構(gòu)型與通信拓?fù)湓O(shè)計(jì)具有重要應(yīng)用價(jià)值,為多飛行器聯(lián)合執(zhí)行任務(wù)提供了關(guān)鍵理論支撐。據(jù)美國海軍官網(wǎng)報(bào)道,2021年6月,美國在伊利諾伊州成功完成“黃貂魚”MQ-25A無人機(jī)技術(shù)驗(yàn)證機(jī)向F/A-18“超級(jí)大黃蜂”有人機(jī)的空中加油測試,這種空中云臺(tái)的實(shí)現(xiàn)很大程度上源于針對(duì)加油任務(wù)優(yōu)化出了多飛行器隊(duì)形及成員飛行器在編隊(duì)中的站位。解決編隊(duì)構(gòu)型與通信拓?fù)鋬?yōu)化設(shè)計(jì)問題的關(guān)鍵是建立全面準(zhǔn)確的數(shù)學(xué)模型,優(yōu)化設(shè)計(jì)研究方向涵蓋設(shè)計(jì)變量選擇、約束條件分析、目標(biāo)函數(shù)設(shè)計(jì)和優(yōu)化算法計(jì)算。下面從多飛行器編隊(duì)構(gòu)型、通信拓?fù)湓O(shè)計(jì)優(yōu)化方面對(duì)現(xiàn)有文獻(xiàn)加以概述。
編隊(duì)構(gòu)型設(shè)計(jì)變量分為拓?fù)洹⑿螤钆c尺寸變量。按照工程實(shí)際應(yīng)用的項(xiàng)目階段劃分,概念設(shè)計(jì)階段可進(jìn)行拓?fù)鋬?yōu)化,由編隊(duì)規(guī)模建立優(yōu)化的框架與層級(jí);基本設(shè)計(jì)階段可進(jìn)行形狀優(yōu)化,明確編隊(duì)的基本隊(duì)形組成的數(shù)量、形態(tài);詳細(xì)設(shè)計(jì)階段開展尺寸優(yōu)化,調(diào)整預(yù)先確定的隊(duì)形形狀長度、角度特征。有關(guān)學(xué)者針對(duì)不同設(shè)計(jì)變量優(yōu)化方式取得了一系列成果。文獻(xiàn)[2,4]針對(duì)大規(guī)模固定翼飛行器提出了多層規(guī)劃模型的拓?fù)鋬?yōu)化框架,將整體隊(duì)形優(yōu)化問題轉(zhuǎn)化為分層節(jié)點(diǎn)排布對(duì)比分析問題,通過改進(jìn)粒子群優(yōu)化(particle swarm optimization, PSO)算法及遺傳算法求解出最優(yōu)隊(duì)形,并給出了相對(duì)整體隊(duì)形優(yōu)化的計(jì)算實(shí)時(shí)性優(yōu)勢(shì)。文獻(xiàn)[5-6]借鑒雁群編隊(duì)飛行行為機(jī)制,將“V”形編隊(duì)構(gòu)型引入到無人機(jī)群協(xié)同飛行中,設(shè)計(jì)縱向、橫向距離參數(shù)增升減阻,經(jīng)仿真算例證明了減少燃油消耗量的效果。文獻(xiàn)[7]設(shè)計(jì)了直線、菱形、半菱形、“V”形隊(duì)形,通過不同編隊(duì)規(guī)模下的流體力學(xué)仿真給出了適用一類翼身融合飛行器的減阻陣列選型建議。文獻(xiàn)[8]針對(duì)有翼飛行器給出了編隊(duì)合圍跟蹤隊(duì)形,為攻擊、偵查、誘餌功能提供集成框架。
在設(shè)計(jì)編隊(duì)構(gòu)型時(shí),有必要考慮隊(duì)形的基本約束問題。隊(duì)形約束主要包括但不限于兩方面原因:一是隊(duì)形參數(shù)在實(shí)際通信環(huán)境中存在取值上下限;二是隊(duì)形合理性要有效銜接編隊(duì)控制的可實(shí)現(xiàn)性。文獻(xiàn)[9]在構(gòu)建飛行器編隊(duì)協(xié)同作戰(zhàn)效能指標(biāo)時(shí)引入飛行器間最大通信距離、最小安全距離、最大搜索半徑、最大搜索角、最大機(jī)動(dòng)半徑等參數(shù)約束,并采用PSO算法優(yōu)化出合適隊(duì)形。文獻(xiàn)[10]結(jié)合一般線性系統(tǒng)動(dòng)力學(xué)特性給出了分段連續(xù)可微編隊(duì)向量形式和編隊(duì)可行域擴(kuò)展算法,之后在切換拓?fù)湎绿岢隽嘶谝恢滦苑椒ǖ臅r(shí)變編隊(duì)控制器,為無人機(jī)系統(tǒng)實(shí)際應(yīng)用奠定理論基礎(chǔ)。
為了實(shí)現(xiàn)飛行器編隊(duì)綜合效能最大化,國內(nèi)外學(xué)者在設(shè)計(jì)編隊(duì)構(gòu)型時(shí)充分考慮戰(zhàn)場態(tài)勢(shì)信息和飛行器編隊(duì)狀態(tài)以構(gòu)造綜合目標(biāo)函數(shù)。文獻(xiàn)[13-14]基于敵我對(duì)抗態(tài)勢(shì)建立了敵我戰(zhàn)損比目標(biāo)函數(shù),采用遺傳算法優(yōu)化隊(duì)形設(shè)計(jì),并對(duì)空中作戰(zhàn)平臺(tái)對(duì)抗過程中的隊(duì)形適應(yīng)性進(jìn)行了驗(yàn)證。文獻(xiàn)[1]利用彈目間的戰(zhàn)術(shù)幾何關(guān)系,建立了涵蓋任務(wù)載荷配置、捕獲概率、角度優(yōu)勢(shì)、速度優(yōu)勢(shì)、距離優(yōu)勢(shì)的綜合優(yōu)勢(shì)函數(shù),采用禁忌搜索與離散PSO算法對(duì)多彈協(xié)同打擊目標(biāo)群的作戰(zhàn)構(gòu)型尋優(yōu)。
優(yōu)化算法選擇是編隊(duì)構(gòu)型優(yōu)化設(shè)計(jì)的另一個(gè)重要問題,方法選擇的主要依據(jù)包括計(jì)算準(zhǔn)確性與時(shí)間復(fù)雜度,重點(diǎn)是針對(duì)特定模型探索工程適用性強(qiáng)的手段。文獻(xiàn)[15]采用基于均值漂移的差分演化算法設(shè)計(jì)了飛行器編隊(duì)協(xié)同突防-攻擊一體化隊(duì)形,該隊(duì)形兼顧了協(xié)同突防和協(xié)同攻擊需求。文獻(xiàn)[16]針對(duì)大規(guī)模直升機(jī)空戰(zhàn)編隊(duì)問題,采用遺傳算法進(jìn)行優(yōu)化。文獻(xiàn)[17]在隨機(jī)散布建筑物威脅的數(shù)字地圖下,采用改進(jìn)PSO算法獲得收斂速度與優(yōu)化質(zhì)量滿足要求的無人機(jī)站位。
飛行器在編隊(duì)飛行過程中只需部分通信鏈路即可實(shí)現(xiàn)隊(duì)形控制,該部分通信鏈路為隊(duì)形保持情況下的通信拓?fù)?屬整個(gè)通信網(wǎng)絡(luò)子集,這就為給定編隊(duì)構(gòu)型前提下減少通信路由代價(jià)提供了理論支撐。目前針對(duì)通信拓?fù)錁?gòu)成形式方面已有一定成果,以編隊(duì)控制方法為依據(jù),通信拓?fù)渚唧w包括:面向領(lǐng)導(dǎo)者-跟隨者編隊(duì)控制策略,采用通信網(wǎng)絡(luò)中一顆有向生成樹;面向行為或虛擬結(jié)構(gòu)編隊(duì)控制策略,采用通信網(wǎng)絡(luò)中一個(gè)雙向環(huán);面向基于一致性的編隊(duì)控制策略,采用的通信拓?fù)渲辽僖粋€(gè)子集隸屬通信網(wǎng)絡(luò)的一顆有界生成樹。
在通信拓?fù)浼s束條件分析方面的研究成果集中在3個(gè)方面:一是編隊(duì)控制方法約束;二是領(lǐng)導(dǎo)者飛行器約束;三是通信鏈路故障約束。文獻(xiàn)[11]分析了四旋翼無人機(jī)通信拓?fù)錁?gòu)建條件,考慮基于一致性的編隊(duì)控制策略,提出如切換通信拓?fù)涿總€(gè)子集存在一條從領(lǐng)導(dǎo)者到跟隨者的生成樹,則可以實(shí)現(xiàn)穩(wěn)定的編隊(duì)跟蹤隊(duì)形,并給出了具有1個(gè)領(lǐng)導(dǎo)者和3個(gè)跟隨者的四旋翼無人機(jī)飛行實(shí)驗(yàn)。文獻(xiàn)[18]分析了不同領(lǐng)導(dǎo)者無人機(jī)站位約束下的編隊(duì)通信拓?fù)錁?gòu)建問題,提出了編隊(duì)領(lǐng)導(dǎo)者節(jié)點(diǎn)等效交換算法。文獻(xiàn)[21]研究了編隊(duì)跟蹤隊(duì)形下的通信質(zhì)量與考慮領(lǐng)導(dǎo)者未知運(yùn)動(dòng)約束的協(xié)同控制律之間的關(guān)系,從中可以看出對(duì)領(lǐng)導(dǎo)者飛行器的機(jī)動(dòng)位置估計(jì)偏差,會(huì)產(chǎn)生生成樹丟失風(fēng)險(xiǎn)。
通信拓?fù)涞膬?yōu)化目標(biāo)是在保證任務(wù)成功率基礎(chǔ)上降低編隊(duì)通信代價(jià)。文獻(xiàn)[22]將通信鏈路數(shù)量作為通信拓?fù)渖赡繕?biāo),但沒有考慮不同無人機(jī)之間通信鏈路對(duì)應(yīng)通信代價(jià)的不同。文獻(xiàn)[23]考慮了通信路由賦權(quán)問題,提出最優(yōu)持久編隊(duì)。文獻(xiàn)[24]提出了一種通信能耗均衡的三維最佳持久通信拓?fù)渖伤惴?將優(yōu)化目標(biāo)函數(shù)設(shè)計(jì)為從網(wǎng)絡(luò)拓?fù)渲羞x擇合適的子集,使得各智能體中通信剩余能量持續(xù)時(shí)間最大化,之后引入離線優(yōu)化算法進(jìn)行迭代估計(jì),通過理論分析與仿真算例驗(yàn)證了計(jì)算復(fù)雜度與求解質(zhì)量。
優(yōu)化與決策理論在通信拓?fù)渥顑?yōu)求解方面應(yīng)用廣泛。文獻(xiàn)[25-26]采用Dijkstra最短路徑算法優(yōu)化領(lǐng)導(dǎo)者-跟隨者編隊(duì)飛行框架下的通信拓?fù)?。文獻(xiàn)[27]采用兩種不同的Nesterov加速算法,提出分布式加速最快梯度下降理論,下降收斂速率優(yōu)于集中式方法,滿足通信網(wǎng)絡(luò)高度動(dòng)態(tài)變化的航空適用需求。文獻(xiàn)[28]在大規(guī)模異構(gòu)無人機(jī)集群通信網(wǎng)絡(luò)多邊穩(wěn)定匹配問題上,提出了雙層穩(wěn)定匹配分布式優(yōu)化算法,通過與差分進(jìn)化算法的對(duì)比仿真證明了所提方法在求解速度與質(zhì)量方面的優(yōu)越性。此外,研究人員將粒子群算法、蟻群算法、螢火蟲算法應(yīng)用到無人機(jī)動(dòng)態(tài)組網(wǎng)路由優(yōu)化配置中。
本文研究了考慮攻防對(duì)抗態(tài)勢(shì)與最小信息流要求的編隊(duì)構(gòu)型與拓?fù)鋬?yōu)化問題,主要貢獻(xiàn)如下:針對(duì)高動(dòng)態(tài)任務(wù)背景下多固定翼無人機(jī)在空間域、信息域快速優(yōu)化問題給出了優(yōu)化算法;針對(duì)編隊(duì)構(gòu)型優(yōu)化提出了基于態(tài)勢(shì)場的分層編隊(duì)構(gòu)型結(jié)構(gòu)優(yōu)化方法;針對(duì)通信拓?fù)鋬?yōu)化提出了基于Q學(xué)習(xí)的網(wǎng)絡(luò)連通性控制方法,解決了考慮攻防對(duì)抗態(tài)勢(shì)與最小信息流要求的編隊(duì)構(gòu)型與拓?fù)鋬?yōu)化問題,實(shí)現(xiàn)了兼具快速性與全局最優(yōu)性的大規(guī)模編隊(duì)構(gòu)型及拓?fù)鋬?yōu)化效果。
考慮架固定翼無人機(jī)通過通信拓?fù)溥B接而成的一個(gè)多無人機(jī)集群系統(tǒng),按照編隊(duì)構(gòu)型()進(jìn)行時(shí)變編隊(duì)協(xié)同飛行。通信拓?fù)渲械倪?span id="j5i0abt0b" class="subscript">意味著無人機(jī)和無人機(jī)之間能夠進(jìn)行相互通信。結(jié)合固定翼無人機(jī)作戰(zhàn)任務(wù),建立編隊(duì)構(gòu)型效能指標(biāo)體系,用以定量、準(zhǔn)確評(píng)估編隊(duì)構(gòu)型參數(shù)對(duì)無人機(jī)集群系統(tǒng)協(xié)同編隊(duì)任務(wù)的影響。
本節(jié)的主要目的是綜合考慮戰(zhàn)場態(tài)勢(shì)信息與無人機(jī)自身特性,面向圖1所示的編隊(duì)構(gòu)型效能最大化,設(shè)計(jì)滿足計(jì)算精度與實(shí)時(shí)性要求的多無人機(jī)編隊(duì)構(gòu)型優(yōu)化模型,并有針對(duì)性地開展選型定參工作??紤]集群作戰(zhàn)網(wǎng)絡(luò)規(guī)模大,提出了分層編隊(duì)構(gòu)型結(jié)構(gòu)模型,將無人機(jī)集群編隊(duì)進(jìn)行分層,集群分層的每個(gè)節(jié)點(diǎn)均可表示一種基本編隊(duì)構(gòu)型,最終得到整個(gè)無人機(jī)集群的設(shè)計(jì)隊(duì)形。
圖1 編隊(duì)構(gòu)型效能指標(biāo)體系Fig.1 Formation configuration efficiency index system
根據(jù)編隊(duì)構(gòu)型的任務(wù)需求與工程實(shí)現(xiàn),將三維編隊(duì)構(gòu)型分解為水平和垂直兩個(gè)平面上的二維隊(duì)形,通過基本隊(duì)形組合形成立體協(xié)同編隊(duì)?wèi)B(tài)勢(shì)。基本隊(duì)形共設(shè)計(jì)8種,采用二進(jìn)制編碼對(duì)編隊(duì)進(jìn)行編碼,具體如表1所示。
表1 基本隊(duì)形及其編碼表Table 1 Basic formation and its coding table
集群系統(tǒng)中固定翼無人機(jī)數(shù)量眾多,一般由多種基本編隊(duì)構(gòu)型組成,編隊(duì)規(guī)模較大,為便于解析化描述,引入分層編碼解碼機(jī)制。針對(duì)網(wǎng)絡(luò)規(guī)模為的無人機(jī)集群系統(tǒng),對(duì)編隊(duì)自頂向下進(jìn)行共計(jì)(>1)層的分層劃分,直至不同分層獲得基本編隊(duì)構(gòu)型,在第層得到最小編隊(duì)單元,在編隊(duì)結(jié)構(gòu)體系構(gòu)建過程中按照每層構(gòu)建次序得出編碼序列。反過來,由編碼表對(duì)特定編碼序列進(jìn)行依次解碼,反演獲得分層編隊(duì)構(gòu)型。在編解碼過程中,根據(jù)各層節(jié)點(diǎn)中隊(duì)形在其上層節(jié)點(diǎn)隊(duì)形中的排布方式,按照從上到下、從左向右順序進(jìn)行編碼和解碼,如圖2所示。
圖2 分層編隊(duì)構(gòu)型編解碼過程Fig.2 Hierarchical formation coding and decoding process
選取編隊(duì)整體位置的幾何中心作為領(lǐng)導(dǎo)者無人機(jī),上述位置無實(shí)體無人機(jī)時(shí)稱為虛擬領(lǐng)導(dǎo)者無人機(jī)。以上述幾何中心作參考點(diǎn),描述不同基本隊(duì)形的具體設(shè)計(jì)參數(shù),記為
(1)
固定翼無人機(jī)態(tài)勢(shì)場模型主要考慮無人機(jī)探測能力、生存能力、通信能力、攻擊能力等4方面因素,第架無人機(jī)態(tài)勢(shì)模型為
=(,,,,,)=(++)
(2)
式中:(,,)表示地面坐標(biāo)系下無人機(jī)的位置坐標(biāo);(,,)表示地面坐標(biāo)系下對(duì)抗目標(biāo)的位置;表示無人機(jī)的探測能力;表示無人機(jī)的攻擊能力;表示無人機(jī)的生存能力;表示無人機(jī)的通信能力;、、分別表示攻擊能力、生存能力、通信能力的權(quán)重值,采用三角模糊數(shù)指標(biāo)權(quán)重求解方法確定。
(1) 探測能力
固定翼無人機(jī)根據(jù)任務(wù)需求配裝不同功能的任務(wù)載荷,針對(duì)對(duì)抗目標(biāo)的探測設(shè)備主要包括雷達(dá)和紅外搜索跟蹤裝置,探測能力模型如下:
=ln(1+)
(3)
式中:表示無人機(jī)的探測能力參數(shù),具體表達(dá)式為
(4)
式中:表示末制導(dǎo)設(shè)備最大作用距離;?表示末制導(dǎo)設(shè)備最大搜索方位角;為對(duì)抗目標(biāo)捕獲概率;為末制導(dǎo)體制衡量系數(shù);為末制導(dǎo)可同時(shí)跟蹤的對(duì)抗目標(biāo)數(shù)量。
(2) 攻擊能力
攻擊能力模型為
=ln(1+)
(5)
式中:表示無人機(jī)的攻擊能力參數(shù),具體表達(dá)式為
(6)
式中:為制導(dǎo)方式修正系數(shù),半主動(dòng)雷達(dá)末制導(dǎo)=1,主動(dòng)雷達(dá)末制導(dǎo)=15;為無人機(jī)單發(fā)命中概率;為無人機(jī)攻擊范圍角;為無人機(jī)最大可用過載;為無人機(jī)最大跟蹤角速度;為無人機(jī)距計(jì)算點(diǎn)的距離;為無人機(jī)最大射程;為無人機(jī)最小攻擊距離。
(3) 生存能力
無人機(jī)生存能力模型建立如下:
=ln(1+)
(7)
式中:表示生存能力參數(shù),具體表達(dá)式為
(8)
式中:為無人機(jī)長度;為無人機(jī)翼展;為雷達(dá)發(fā)射面積;為易損系數(shù),0<<1;表示戰(zhàn)場環(huán)境控制區(qū)域最大距離。
(4) 通信能力
無人機(jī)協(xié)同編隊(duì)通過編隊(duì)支撐網(wǎng)絡(luò)實(shí)現(xiàn)信息交換和共享,通信能力實(shí)現(xiàn)載體為數(shù)據(jù)鏈設(shè)備。數(shù)據(jù)鏈通信品質(zhì)與無人機(jī)間距離相關(guān),建立通信能力模型如下:
(9)
式中:為數(shù)據(jù)鏈設(shè)備的可靠性;為數(shù)據(jù)鏈最大通信距離;為與第架無人機(jī)的距離。
(5) 交換比
為表征編隊(duì)規(guī)模對(duì)綜合效能的影響,引入交換比概念,表征無人機(jī)集群系統(tǒng)在完成特定任務(wù)時(shí)收益與資源投入比較。設(shè)己方一架無人機(jī)作戰(zhàn)成本為cos (),則可定義交換比為
(10)
則在整個(gè)戰(zhàn)場環(huán)境下,己方無人機(jī)集群編隊(duì)系統(tǒng)產(chǎn)生的態(tài)勢(shì)場由不同節(jié)點(diǎn)成員在空間中的態(tài)勢(shì)疊加而成,具體表達(dá)式為
(11)
節(jié)點(diǎn)平均態(tài)勢(shì)為
(12)
在無人機(jī)集群編隊(duì)對(duì)抗目標(biāo)過程中,攔截方考慮部署個(gè)節(jié)點(diǎn),按照上述公式同理可計(jì)算攔截方態(tài)勢(shì)場如下:
(13)
戰(zhàn)場空間中攔截方部署情況包括離散的先驗(yàn)已知威脅和僅獲取概略情報(bào)的非合作概率威脅,故在選取適應(yīng)度函數(shù)表征無人機(jī)編隊(duì)效能時(shí),應(yīng)將戰(zhàn)場環(huán)境內(nèi)概率威脅進(jìn)行建模,基于態(tài)勢(shì)場的無人機(jī)隊(duì)形適應(yīng)度函數(shù)為
(14)
式中:Area(->0)表示己方態(tài)勢(shì)場大于敵方態(tài)勢(shì)場的戰(zhàn)場環(huán)境局部面積;Area(Bat)表示戰(zhàn)場環(huán)境整體面積;表示攔截力量部署的概率分布區(qū)域。
固定翼無人機(jī)主要通過數(shù)據(jù)鏈實(shí)現(xiàn)信息交互,按照有無信息中繼平臺(tái),通信鏈路可以劃分為無人機(jī)-星-無人機(jī)、無人機(jī)間兩種形式。涉及無人機(jī)間協(xié)同組網(wǎng)通信的研究成果,主要從控制與通信兩方面分立開展,對(duì)于協(xié)同制導(dǎo)控制框架下對(duì)通信拓?fù)涞姆聪蛟O(shè)計(jì)研究結(jié)果較少。
本節(jié)從協(xié)同控制的最小需求出發(fā),從適用編隊(duì)控制協(xié)議一般性的角度,給出通信拓?fù)湫枰獫M足的最小條件。
在固定翼無人機(jī)執(zhí)行協(xié)同編隊(duì)任務(wù)過程中,各成員通過無人機(jī)間信息交互形成的通信拓?fù)渥钚l件是,包含一條生成樹的有向圖,且根節(jié)點(diǎn)為虛擬領(lǐng)導(dǎo)者無人機(jī)。
為定量準(zhǔn)確評(píng)估通信網(wǎng)絡(luò)建立路由過程對(duì)無人機(jī)集群系統(tǒng)協(xié)同編隊(duì)任務(wù)的影響,建立通信網(wǎng)絡(luò)拓?fù)鋮?shù)效能指標(biāo)體系,如圖3所示。
圖3 通信網(wǎng)絡(luò)拓?fù)鋮?shù)效能指標(biāo)體系Fig.3 Performance index system of communication network topology parameters
本節(jié)的主要目的是提出自主、智能的網(wǎng)絡(luò)連通性控制算法,對(duì)節(jié)點(diǎn)間連通情況進(jìn)行優(yōu)化設(shè)計(jì),使得無人機(jī)集群系統(tǒng)在編隊(duì)協(xié)同控制基礎(chǔ)上,實(shí)現(xiàn)路由低開銷,在提升通信強(qiáng)度和降低被敵方發(fā)現(xiàn)概率間優(yōu)化,得到最佳匹配。
針對(duì)固定翼無人機(jī)集群系統(tǒng)成員向成員構(gòu)建通信鏈路的過程,建立無人機(jī)通信網(wǎng)絡(luò)路由模型,主要涉及通信強(qiáng)度、通信鏈路成本、端機(jī)功耗和被敵探測概率等四方面因素,具體如下:
(15)
式中:Com1表示通信強(qiáng)度;Com2表示通信鏈路成本;Com3表示端機(jī)功耗;Com4表示被敵探測概率;1,、2,、3,、4,分別表示通信強(qiáng)度、通信鏈路成本、端機(jī)功耗、被敵探測概率的權(quán)重值,權(quán)重由三角模糊數(shù)指標(biāo)權(quán)重方法解算。
(1) 通信強(qiáng)度
集群系統(tǒng)編隊(duì)協(xié)同的首要基礎(chǔ)之一是建立較強(qiáng)的通信能力、信息感知能力,以實(shí)現(xiàn)高效的數(shù)據(jù)傳輸與信息共享。通信強(qiáng)度模型為
(16)
式中:為成員與成員間距離;為無人機(jī)間數(shù)據(jù)鏈最大作用距離。
(2) 通信鏈路成本
(17)
(3) 端機(jī)功耗
數(shù)據(jù)鏈端機(jī)作為通信網(wǎng)絡(luò)在無人機(jī)端側(cè)部署的載體,在高動(dòng)態(tài)工作條件下需無人機(jī)提供大量能源,功耗與數(shù)據(jù)鏈作用距離和通信帶寬有關(guān)。端機(jī)功耗模型如下:
Com3=ln(1+Wt)
(18)
式中:Wt表示無人機(jī)的端機(jī)工作功率,具體表達(dá)式為
(19)
式中:代表通信帶寬;為標(biāo)準(zhǔn)狀態(tài)下通信帶寬;表示標(biāo)稱狀態(tài)下端機(jī)功耗。
(4) 被敵探測概率
在無人機(jī)數(shù)據(jù)通信中產(chǎn)生的電磁信號(hào)會(huì)作為敵偵查探測的目標(biāo)電子特征信息,與通信強(qiáng)度、端機(jī)功耗、工作頻段相關(guān),建立被敵探測概率模型:
(20)
式中:fr為頻段系數(shù),0 下面基于PSO算法,給出網(wǎng)絡(luò)規(guī)模為的固定翼無人機(jī)集群系統(tǒng)編隊(duì)構(gòu)型參數(shù)設(shè)計(jì)方法。 算法1 固定翼無人機(jī)集群系統(tǒng)編隊(duì)構(gòu)型參數(shù)設(shè)計(jì)方法 步驟1 在首層分別進(jìn)行8種基本隊(duì)形的節(jié)點(diǎn)平均態(tài)勢(shì)場計(jì)算,采用PSO算法優(yōu)化編隊(duì)構(gòu)型參數(shù),計(jì)算每種基本隊(duì)形下適應(yīng)度最大的隊(duì)形參數(shù),對(duì)比分析后擇優(yōu)選取。步驟2 計(jì)算最優(yōu)基本隊(duì)形各實(shí)體單元坐標(biāo),作為下一層節(jié)點(diǎn)最優(yōu)隊(duì)形站位的中心位置。在下一層采用PSO算法開展隊(duì)形選型定參工作,確定本層采取的基本隊(duì)形與隊(duì)形參數(shù)。步驟3 重復(fù)步驟2,直至隊(duì)形分解的無人機(jī)數(shù)量達(dá)到N。步驟4 整合各層級(jí)隊(duì)形優(yōu)化結(jié)果,得到全局隊(duì)形優(yōu)化方案。 隨著編隊(duì)網(wǎng)絡(luò)規(guī)模的增加,通信網(wǎng)絡(luò)可建路由數(shù)量龐大,如采用基于規(guī)則的路由設(shè)計(jì)方法對(duì)式(15)進(jìn)行優(yōu)化,將給專家系統(tǒng)和計(jì)算實(shí)時(shí)性帶來較大負(fù)擔(dān)。本節(jié)在網(wǎng)絡(luò)路由過程中引入強(qiáng)化學(xué)習(xí)技術(shù)。 接下來需要給出網(wǎng)絡(luò)連通性控制方法,通過多輪迭代的Q學(xué)習(xí)策略尋找各網(wǎng)絡(luò)節(jié)點(diǎn)的最優(yōu)行動(dòng)值,即選取相應(yīng)的最優(yōu)路由方向。 本節(jié)旨在建立固定翼無人機(jī)集群系統(tǒng)的網(wǎng)絡(luò)通信關(guān)系,路由過程遍歷各編隊(duì)成員,選擇狀態(tài)量對(duì)應(yīng)編隊(duì)規(guī)模,記狀態(tài)空間={1,2,…,}。每個(gè)成員無人機(jī)周邊的鄰居節(jié)點(diǎn)作為行動(dòng)空間的變量。(,)為初值為任意值的二維空間。每個(gè)成員無人機(jī),需要找到最佳的路由方向,使得通信網(wǎng)絡(luò)拓?fù)鋮?shù)效能最優(yōu)。 根據(jù)假設(shè)1,路由的最終目標(biāo)是建立從領(lǐng)導(dǎo)者無人機(jī)到當(dāng)前節(jié)點(diǎn)的有向路徑。節(jié)點(diǎn)與領(lǐng)導(dǎo)者無人機(jī)可建立直接通信鏈路時(shí),需要獲得最大獎(jiǎng)勵(lì),故回報(bào)函數(shù)設(shè)為;節(jié)點(diǎn)可與周邊鄰居建立多跳關(guān)聯(lián)時(shí),需要獲得最佳網(wǎng)絡(luò)通信路由,故回報(bào)函數(shù)設(shè)為Com。策略選擇機(jī)制方面,采用貪婪策略來探索新的動(dòng)作序列。 算法2 基于Q學(xué)習(xí)的網(wǎng)絡(luò)拓?fù)鋬?yōu)化方法 步驟1 根據(jù)固定翼無人機(jī)集群系統(tǒng)不同節(jié)點(diǎn)間距離,結(jié)合數(shù)據(jù)鏈建立鏈路的距離限制,建立無人機(jī)可建最大通信拓?fù)?計(jì)算初始狀態(tài)的累計(jì)回報(bào)Q矩陣:Qij=0,rij≤Rdl-1,rij>Rdl{步驟2 針對(duì)整個(gè)無人機(jī)編隊(duì)中某一節(jié)點(diǎn)i,將其狀態(tài)初始化為si,將其預(yù)處理成與Q網(wǎng)絡(luò)的輸入結(jié)構(gòu)相同。步驟3 回報(bào)函數(shù)的計(jì)算fR(s,a)=Fmax,(v0,vj);j=1,2,…,NFmaxComij,(vi,vj);j=1,2,…,N;i≠0ì?í????式中:建立領(lǐng)導(dǎo)者向某節(jié)點(diǎn)通信鏈路時(shí),表示為(v0,vj),回報(bào)函數(shù)取Fmax。建立其他通信鏈路時(shí),表示為(vi,vj),回報(bào)函數(shù)取Fmax/Comij。步驟4 動(dòng)作設(shè)置與優(yōu)化根據(jù)無人機(jī)可建路由行動(dòng)空間,將臨近節(jié)點(diǎn)作為建立鏈路的可選動(dòng)作,選擇Q值最大的動(dòng)作,獲得即時(shí)獎(jiǎng)勵(lì)fR(s,a),并進(jìn)而完成Q值的更新:Q(st+1,at+1)=(1-α)Q(st,at)+α[fR(st,at)+γmaxQ′(st+1,at+1)]步驟5 重復(fù)執(zhí)行步驟2~步驟4,直至Q網(wǎng)絡(luò)收斂。步驟6 選擇距離領(lǐng)導(dǎo)者無人機(jī)最遠(yuǎn)的節(jié)點(diǎn),根據(jù)Q矩陣推理獲得最優(yōu)動(dòng)作,建立通信主鏈路。步驟7 如通信主鏈路涵蓋所有成員,計(jì)算結(jié)束;如存在通信主鏈路外成員,則此無人機(jī)選擇最短路徑與通信主鏈路建立路由,形成整體網(wǎng)絡(luò)通信拓?fù)洹?/p> 在本節(jié)中,將對(duì)編隊(duì)規(guī)模為8的察打一體固定翼無人機(jī)集群系統(tǒng),遂行30 km×30 km戰(zhàn)場環(huán)境范圍內(nèi)的目標(biāo)群對(duì)抗任務(wù),進(jìn)行編隊(duì)構(gòu)型與通信拓?fù)鋬?yōu)化。戰(zhàn)場環(huán)境在地面坐標(biāo)系平面內(nèi)柵格化成300×300區(qū)域網(wǎng)格,各固定翼無人機(jī)性能指標(biāo)見表2。存在規(guī)模=5的攔截編隊(duì),其位置部署在3 km×2 km的概率分布區(qū)域內(nèi),如圖4所示。虛擬領(lǐng)導(dǎo)者無人機(jī)處于編隊(duì)集群中心位置,仿真初始時(shí)刻位置=-1 200 m,=12 250 m,=-500 m,航跡傾斜角=0°,航跡偏轉(zhuǎn)角=0°,初始速度為250 m/s。虛擬領(lǐng)導(dǎo)者無人機(jī)朝向動(dòng)態(tài)集結(jié)點(diǎn)飛行,集結(jié)點(diǎn)初始位置為戰(zhàn)場原點(diǎn),速度=50 m/s,=0,=50 m/s。要求虛擬領(lǐng)導(dǎo)者無人機(jī)在飛行末段實(shí)現(xiàn)帶有攻擊角度約束的入射,期望角度設(shè)計(jì)為=0°、=45°,跟隨者無人機(jī)以虛擬領(lǐng)導(dǎo)者無人機(jī)為中心建立期望的編隊(duì)構(gòu)型與通信拓?fù)洹?/p> 表2 固定翼無人機(jī)性能指標(biāo)Table 2 Fixed-wing UAVs performance indicators 圖4 戰(zhàn)場環(huán)境部署Fig.4 Battlefield environment deployment 針對(duì)虛擬領(lǐng)導(dǎo)者無人機(jī)運(yùn)動(dòng)軌跡,亦即固定翼無人機(jī)集群系統(tǒng)整體運(yùn)動(dòng)參考軌跡,在地面坐標(biāo)系下、平面內(nèi)采用魯棒自適應(yīng)制導(dǎo)律求解。設(shè)定虛擬領(lǐng)導(dǎo)者無人機(jī)到達(dá)集結(jié)點(diǎn)的條件為偏移量小于1 m。仿真結(jié)果如圖5所示,虛擬領(lǐng)導(dǎo)者無人機(jī)最終以距離集結(jié)點(diǎn)0.045 m的偏移量實(shí)現(xiàn)帶有攻擊角度約束的入射。虛擬領(lǐng)導(dǎo)者無人機(jī)運(yùn)動(dòng)設(shè)計(jì)過程不是本文研究重點(diǎn),這里僅給出設(shè)計(jì)結(jié)果。 圖5 虛擬領(lǐng)導(dǎo)者無人機(jī)運(yùn)動(dòng)曲線Fig.5 Virtual leader unmanned aerial vehicle motion curve 針對(duì)跟隨者無人機(jī)站位設(shè)計(jì),在飛行不同時(shí)刻均以虛擬領(lǐng)導(dǎo)者無人機(jī)為中心構(gòu)建編隊(duì)構(gòu)型。取=5.35 s開展基于態(tài)勢(shì)場的分層編隊(duì)構(gòu)型設(shè)計(jì)與優(yōu)化,來驗(yàn)證本文算法的實(shí)際效果,此時(shí)虛擬領(lǐng)導(dǎo)者無人機(jī)位于圖4所示戰(zhàn)場區(qū)域原點(diǎn)。對(duì)于第1層,建立8種基本隊(duì)形的態(tài)勢(shì)場模型,假設(shè)編隊(duì)成員距離在1~6.5 km范圍內(nèi),應(yīng)用PSO算法優(yōu)化編隊(duì)構(gòu)型,使用規(guī)模20的粒子群迭代30次。圖6繪制出了編隊(duì)規(guī)模為2的010基本隊(duì)形、編隊(duì)規(guī)模為3的100基本隊(duì)形的參數(shù)優(yōu)化過程,其余基本隊(duì)形演化曲線與這兩種隊(duì)形相似。從圖6可以看出,本算法能在20次迭代范圍內(nèi)搜索到模型的最優(yōu)解,有效解決編隊(duì)構(gòu)型快速優(yōu)化問題。從圖7可以看出,針對(duì)基本隊(duì)形100,隨優(yōu)化迭代進(jìn)程,零勢(shì)線不斷向?qū)鼓繕?biāo)區(qū)域壓縮,編隊(duì)構(gòu)型對(duì)戰(zhàn)場態(tài)勢(shì)的控制效益不斷提升,態(tài)勢(shì)場由最初的0.767逐步增長為0.796。 圖6 編隊(duì)構(gòu)型優(yōu)化過程Fig.6 Formation configuration optimization process 圖7 基本隊(duì)形100下態(tài)勢(shì)場演化過程Fig.7 Evolution process of situation field under basic formation 100 編隊(duì)構(gòu)型優(yōu)化過程見表3和圖8。可以看出,在第1層,從8種隊(duì)形中選出最優(yōu)基本隊(duì)形100,隊(duì)形參數(shù)經(jīng)迭代優(yōu)化設(shè)置為2.5時(shí),可獲得對(duì)戰(zhàn)場空間0.796的控制比例。繼續(xù)運(yùn)用基于態(tài)勢(shì)場分層編隊(duì)構(gòu)型優(yōu)化算法完成第2層、第3層計(jì)算,得到的編隊(duì)構(gòu)型最終結(jié)果見表4和圖9,其中“—”表示上一層級(jí)已在本節(jié)點(diǎn)分層結(jié)束,本層級(jí)不作分層。 表3 第1層不同基本隊(duì)形迭代優(yōu)化過程Table 3 The 1st iteration optimal process of different basic formations 圖8 第1層不同基本隊(duì)形的適應(yīng)度直方圖Fig.8 The 1st fitness histogram of different basic formations 表4 優(yōu)化隊(duì)形參數(shù)Table 4 Optimization of formation parameters 圖9 編隊(duì)構(gòu)型優(yōu)化結(jié)果Fig.9 Optimized result of formation configuration 為證明本策略兼顧隊(duì)形全局優(yōu)化和計(jì)算實(shí)時(shí)性的優(yōu)勢(shì),對(duì)于同一種仿真場景,采用整體隊(duì)形優(yōu)化的方法對(duì)固定翼無人機(jī)集群編隊(duì)構(gòu)型進(jìn)行優(yōu)化,最終得到與圖9基本一致的最優(yōu)隊(duì)形。采用整體法時(shí)的PSO算法的適應(yīng)度曲線如圖10所示,可以看到適應(yīng)度收斂到一個(gè)最大值,說明整體法能得到最優(yōu)解,而由分層編隊(duì)構(gòu)型算法計(jì)算的隊(duì)形與整體法相似,檢驗(yàn)了分層算法計(jì)算精度的有效性。但是,因集群整體隊(duì)形復(fù)雜,迭代1次耗時(shí)5 ms,適應(yīng)度計(jì)算時(shí)間約為6.325 s,遠(yuǎn)大于分層算法1.935 s的計(jì)算時(shí)間,證明了本文算法在時(shí)間復(fù)雜度方面的優(yōu)勢(shì)。 圖10 整體優(yōu)化與本文算法對(duì)比Fig.10 Comparison of global optimization and the proposed algorithm 在不同網(wǎng)絡(luò)連通性配置下,本節(jié)基于網(wǎng)絡(luò)通信路由模型對(duì)所提理論、其他路由策略的通信性能進(jìn)行仿真對(duì)比,對(duì)所提算法優(yōu)越性進(jìn)行驗(yàn)證。針對(duì)仿真場景中編隊(duì)規(guī)模=8的固定翼無人機(jī)集群編隊(duì),采用算法2生成最小信息流網(wǎng)絡(luò)拓?fù)溥B接。圖11描述了網(wǎng)絡(luò)可建路由分支為17的設(shè)定下無人機(jī)通信網(wǎng)絡(luò)訓(xùn)練空間,節(jié)點(diǎn)1~8表示各跟隨者無人機(jī),節(jié)點(diǎn)9代表虛擬領(lǐng)導(dǎo)者無人機(jī)。以4號(hào)無人機(jī)為例,其優(yōu)化前可分別與3號(hào)、6號(hào)、8號(hào)無人機(jī)建立通信路由,通過Q學(xué)習(xí)策略對(duì)最優(yōu)路由策略尋優(yōu)的訓(xùn)練過程如圖12所示??梢钥闯?在前70個(gè)訓(xùn)練周期中,4號(hào)無人機(jī)與其余無人機(jī)的路由效果存在持續(xù)波動(dòng)現(xiàn)象,這是由于在這個(gè)階段,值網(wǎng)絡(luò)輸出以探索各種可能的策略為主。經(jīng)過前70個(gè)訓(xùn)練周期后,值網(wǎng)絡(luò)對(duì)整個(gè)樣本空間進(jìn)行了相對(duì)全面的采樣。基于采樣數(shù)據(jù),通過訓(xùn)練不斷對(duì)值進(jìn)行泛化,直至趨近于常數(shù)。與3號(hào)(藍(lán)色曲線)、6號(hào)(黑色曲線)、8號(hào)(紅色曲線)無人機(jī)建立路由的穩(wěn)態(tài)值分別為0.67、0.58、0.32。4號(hào)無人機(jī)據(jù)此建立與3號(hào)無人機(jī)的有向通信鏈路。其余路由優(yōu)化過程與4號(hào)無人機(jī)類似。 圖11 可建立路由的無人機(jī)編隊(duì)設(shè)定Fig.11 Unmanned aerial vehicle formation available for routing settings 圖12 4號(hào)無人機(jī)Q值網(wǎng)絡(luò)訓(xùn)練過程及效果Fig.12 Q value network training process and effect of No.4 unmanned aerial vehicle 經(jīng)優(yōu)化設(shè)計(jì),無人機(jī)2、3分別經(jīng)6、3跳后與虛擬領(lǐng)導(dǎo)者無人機(jī)9建立路由,形成通信拓?fù)渲麈溌?存在一條以虛擬領(lǐng)導(dǎo)者無人機(jī)9為根節(jié)點(diǎn)的生成樹,通信拓?fù)渥罱K設(shè)計(jì)結(jié)果如圖13所示。 圖13 通信拓?fù)鋬?yōu)化結(jié)果Fig.13 Communication topology optimization results 除了Q學(xué)習(xí)外,進(jìn)一步引入擴(kuò)展場景,和其他兩個(gè)路由策略進(jìn)行對(duì)比: (1) 隨機(jī)路由策略:每個(gè)固定翼無人機(jī)在數(shù)據(jù)鏈建立通信范圍內(nèi)隨機(jī)選擇與其他成員建立信息鏈路; (2) 就近路由策略:每個(gè)固定翼無人機(jī)與離自己最近的其他成員建立信息鏈路。 圖14對(duì)比了不同路由策略,給定不同的網(wǎng)絡(luò)可建路由分支,每個(gè)策略所能實(shí)現(xiàn)的最優(yōu)效果。橫坐標(biāo)為網(wǎng)絡(luò)可建路由分支,縱坐標(biāo)為整個(gè)網(wǎng)絡(luò)的通信性能。 圖14 不同路由策略在不同設(shè)定下的最優(yōu)表現(xiàn)Fig.14 Optimal performance of different routing strategies under different settings 仿真實(shí)驗(yàn)結(jié)果表明: (1) 基于Q學(xué)習(xí)的網(wǎng)絡(luò)連通控制方法在4種編隊(duì)規(guī)模中(編隊(duì)規(guī)模依次為5、8、12、16)均比其他策略具備顯著優(yōu)勢(shì),就近路由策略表現(xiàn)次之,隨機(jī)路由策略表現(xiàn)最差。 (2) 在網(wǎng)絡(luò)連通性較低的配置下,由于優(yōu)化動(dòng)作空間有限,各個(gè)策略在路由選擇方面的差距不是很明顯,當(dāng)整個(gè)編隊(duì)空間分布較為聚集時(shí),由于可建路由分支增加,Q學(xué)習(xí)一直保持明顯優(yōu)勢(shì)。 進(jìn)一步考察Q學(xué)習(xí)的路由策略,從圖14可以看出,在可建路由分支滿足數(shù)據(jù)鏈建網(wǎng)標(biāo)準(zhǔn)的情況下,對(duì)任何一種網(wǎng)絡(luò)分布情況,Q學(xué)習(xí)均能自動(dòng)學(xué)習(xí)出路由分配策略,即綜合考慮通信強(qiáng)度與突防性能建立最小信息流網(wǎng)絡(luò)拓?fù)?避開通信代價(jià)較高的節(jié)點(diǎn)鏈路。算法分析與仿真算例表明,在路由分配問題上,Q學(xué)習(xí)不僅求解效果優(yōu)于其他策略,且具備優(yōu)良的可解釋性。 本文研究了固定翼無人機(jī)時(shí)變編隊(duì)構(gòu)型設(shè)計(jì)及拓?fù)鋬?yōu)化問題,考慮了空間分布與通信拓?fù)鋬煞N優(yōu)化對(duì)象。將無人機(jī)劃分為領(lǐng)導(dǎo)者、跟隨者兩類,跟隨者無人機(jī)以領(lǐng)導(dǎo)者無人機(jī)運(yùn)動(dòng)軌跡為中心建立編隊(duì)構(gòu)型與通信拓?fù)?。在大?guī)模集群編隊(duì)系統(tǒng)高動(dòng)態(tài)任務(wù)需求背景下,提出分層編隊(duì)構(gòu)型設(shè)計(jì)模型,設(shè)計(jì)隊(duì)形編解碼方法和態(tài)勢(shì)場模型,采用PSO算法進(jìn)行隊(duì)形參數(shù)優(yōu)化。針對(duì)集群系統(tǒng)通信拓?fù)錁?gòu)建問題,建立了通信網(wǎng)絡(luò)路由模型,提出了基于Q學(xué)習(xí)網(wǎng)絡(luò)連通性控制算法,解決了協(xié)同一致性與網(wǎng)絡(luò)路由代價(jià)的平衡優(yōu)化。仿真算例驗(yàn)證了本文設(shè)計(jì)的時(shí)變編隊(duì)構(gòu)型及通訊拓?fù)湓O(shè)計(jì)優(yōu)化算法的有效性。2 編隊(duì)構(gòu)型與通信拓?fù)鋬?yōu)化算法
2.1 編隊(duì)構(gòu)型優(yōu)化算法
2.2 通信拓?fù)鋬?yōu)化算法
3 仿真實(shí)驗(yàn)分析
3.1 編隊(duì)構(gòu)型優(yōu)化仿真
3.2 通信拓?fù)鋬?yōu)化仿真
4 結(jié) 論