董希旺 于江龍 化永朝 李清東 任章
(1. 北京航空航天大學(xué) 人工智能研究院, 北京 100083; 2. 北京航空航天大學(xué) 自動化科學(xué)與電氣工程學(xué)院, 北京 100083)
世界各軍事強國逐漸發(fā)展并完善本國的防空反導(dǎo)系統(tǒng),單枚精確制導(dǎo)類飛行器的打擊/攔截作戰(zhàn)效能急劇下降。 然而,通過高速、機動、隱身、抗干擾等方面來提升單體飛行器作戰(zhàn)效能,將會花費極大代價。 多飛行器協(xié)同制導(dǎo)技術(shù)將會是提升作戰(zhàn)效能的可行途徑[1-2]。
協(xié)同制導(dǎo)指的是多枚相同種類(或不同種類)的飛行器,在一定的分布式協(xié)同策略基礎(chǔ)上,通過個體之間的信息傳輸,實現(xiàn)制導(dǎo)系統(tǒng)狀態(tài)變量的協(xié)調(diào)一致(如攻擊角度、攻擊時間等)。 隨著彈載計算機技術(shù)、彈載通信技術(shù)的發(fā)展,多彈協(xié)同制導(dǎo)具備初步的工程可行性。 多飛行器協(xié)同制導(dǎo)可以極大提高低成本飛行器編隊的對機動目標(biāo)的攔截能力、對高價值固定/慢速移動目標(biāo)的毀傷能力,受到了各軍事強國的廣泛關(guān)注。
針對協(xié)同制導(dǎo)問題,可以通過制導(dǎo)任務(wù)表現(xiàn)形式來進(jìn)行劃分,一般可以分為攻擊時間一致性協(xié)同制導(dǎo)[3]、攻擊角度一致性協(xié)同制導(dǎo)[4]、博弈對抗協(xié)同制導(dǎo)[5]、任務(wù)約束協(xié)同制導(dǎo)[6]等。 上述不同協(xié)同制導(dǎo)方法均有不同優(yōu)點,不同協(xié)同制導(dǎo)方法的使用應(yīng)該結(jié)合具體場景選擇,甚至可以組合[7]及分段[8]使用。
本文主要針對攻擊時間一致性協(xié)同制導(dǎo)技術(shù)的發(fā)展進(jìn)行綜述。 攻擊時間一致性協(xié)同制導(dǎo)具有十分重要的戰(zhàn)術(shù)任務(wù)意義,筆者認(rèn)為主要有以下4 方面原因:①在對高價值固定/慢速移動目標(biāo)的協(xié)同毀傷場景下,攻擊時間一致性能夠?qū)崿F(xiàn)“飽和攻擊”。 在此場景下,多低成本的自殺式固定翼無人機、巡航類飛行器通過高密度飽和打擊能夠極大提升低空突防概率和目標(biāo)毀傷效能。 ②在對高速高機動無人機/導(dǎo)彈的協(xié)同攔截場景下,多攔截飛行器同時到達(dá)遭遇點實現(xiàn)協(xié)同殺傷,可以使得多個破片類戰(zhàn)斗部協(xié)同工作,提升攔截效能。③針對有人戰(zhàn)斗機的攔截問題,多地空/空空導(dǎo)彈同時實現(xiàn)對目標(biāo)鎖定與末制導(dǎo),則飛行員的心理壓力將會提升,導(dǎo)致其突防逃逸效能下降。 ④針對協(xié)同末制導(dǎo)陣位的形成,必須通過多約束協(xié)同中制導(dǎo)來實現(xiàn),協(xié)同中制導(dǎo)的本質(zhì)也是多飛行器能夠同時到達(dá)預(yù)測交班點。 綜上,攻擊時間一致性協(xié)同制導(dǎo)技術(shù)在大多數(shù)制導(dǎo)問題中有非常大的應(yīng)用價值。
目前,已經(jīng)有許多學(xué)者發(fā)表了多篇較為完善的協(xié)同制導(dǎo)技術(shù)的綜述論文[9-12]。 這些綜述類論文主要站在整體的角度對協(xié)同制導(dǎo)架構(gòu)[9]、協(xié)同制導(dǎo)模式[10]和協(xié)同制導(dǎo)方法[11]進(jìn)行全面的綜述,讓讀者能夠?qū)f(xié)同制導(dǎo)理論和方法有一個全局的認(rèn)識和把握。 而本文則是對協(xié)同制導(dǎo)問題的一個重要分支進(jìn)行方法和技術(shù)層面的綜述。 攻擊時間協(xié)同制導(dǎo)盡管是研究較早、成果較完善的一種理論方法(文獻(xiàn)[12]較為完善地綜述了單飛行器攻擊時間約束下的制導(dǎo)方法),然而尚缺乏對其優(yōu)勢和研究途徑的總結(jié)。 本文用“打擊目標(biāo)”來刻畫協(xié)同制導(dǎo)問題,用“攻擊時間一致性”來刻畫多飛行器同時命中目標(biāo)的協(xié)同特性。 首先,本文將協(xié)同制導(dǎo)問題分為協(xié)同打擊固定目標(biāo)和協(xié)同打擊運動/機動目標(biāo)的協(xié)同制導(dǎo)問題。 從控制系統(tǒng)角度來看,這2 類協(xié)同制導(dǎo)系統(tǒng)分別為自治系統(tǒng)和非自治系統(tǒng),具有方法層面的差異。 其次,通過歸納總結(jié)國內(nèi)外對多飛行器攻擊時間一致性的協(xié)同制導(dǎo)技術(shù)的主要研究成果,從研究方法層面來綜述各種協(xié)同制導(dǎo)方法的優(yōu)缺點及其適應(yīng)的問題場景。 最后,在現(xiàn)有的研究基礎(chǔ)上,對本領(lǐng)域的相關(guān)技術(shù)挑戰(zhàn)與難點進(jìn)行了總結(jié),并且嘗試對未來發(fā)展方向進(jìn)行展望。
針對高價值固定目標(biāo)的時間一致性協(xié)同制導(dǎo)問題,由于其映射“飽和攻擊”概念具有十分鮮明的工程意義,研究成果相對較多。 從方法技術(shù)角度上,主要分為以下5 類方法:基于誤差反饋的時間一致性協(xié)同制導(dǎo)方法、基于優(yōu)化技術(shù)的時間一致性協(xié)同制導(dǎo)方法、基于軌跡跟蹤的時間一致性協(xié)同制導(dǎo)方法、基于推力控制的時間一致性協(xié)同制導(dǎo)方法和基于智能學(xué)習(xí)技術(shù)的時間一致性協(xié)同制導(dǎo)方法。 下面對這5 類方法進(jìn)行詳細(xì)介紹。
在基于誤差反饋的時間一致性協(xié)同制導(dǎo)問題中,先建立剩余飛行時間動力學(xué)模型,然后以設(shè)定的期望剩余飛行時間或者通過局部信息交互得到的平均剩余飛行時間作為跟蹤指令,構(gòu)建剩余飛行時間跟蹤誤差動力學(xué)模型。 文獻(xiàn)[13]較早地提出了一種基于期望剩余飛行時間誤差反饋的偏置比例導(dǎo)引律形式(稱為攻擊時間控制制導(dǎo)律,ITCG),實現(xiàn)了對靜止目標(biāo)帶有期望攻擊時間的打擊,并且擴展成為經(jīng)典的時間一致協(xié)同制導(dǎo)?;谏鲜黾軜?gòu),文獻(xiàn)[14]較早地構(gòu)建了雙層協(xié)同制導(dǎo)架構(gòu),頂層為一致性協(xié)調(diào)變量層,通過一致性協(xié)調(diào)算法得到期望剩余飛行時間指令,底層則采用攻擊時間控制制導(dǎo)律實現(xiàn)協(xié)同制導(dǎo)。 上述方法中,攻擊時間一致性誤差通過與比例導(dǎo)引律進(jìn)行“加性”負(fù)反饋,同樣,如果進(jìn)行“乘性”負(fù)反饋,則從直觀上也能實現(xiàn)攻擊時間一致性誤差的收斂。文獻(xiàn)[15-16]則應(yīng)用此思想,將剩余飛行時間跟蹤誤差乘性作用于比例導(dǎo)引律的導(dǎo)航比中,也有效地實現(xiàn)了期望的攻擊時間一致性。 由于近年來一致性協(xié)同控制理論的發(fā)展與應(yīng)用,多飛行器剩余飛行時間一致性收斂恰好可以作為一致性協(xié)同控制的典型應(yīng)用,二者在原理和思想方面存在天然相同點。 為此,文獻(xiàn)[17-21]則構(gòu)建了剩余飛行時間動力學(xué)模型,將其轉(zhuǎn)化為低階非線性模型,進(jìn)而利用一致性控制[17-19]和一致性跟蹤控制[20-21]研究了無領(lǐng)導(dǎo)者/有領(lǐng)導(dǎo)者模式下的攻擊時間一致性協(xié)同制導(dǎo)方法。
雙層架構(gòu)的優(yōu)點是直觀、物理意義明顯,在未來協(xié)同決策-協(xié)同制導(dǎo)一體化作戰(zhàn)模式下,對制導(dǎo)時間要求嚴(yán)格的場景中將會有較大應(yīng)用價值,然而現(xiàn)有的方法對于期望攻擊飛行時間指令大多為固定值,選擇區(qū)間相對有限。 “乘性”負(fù)反饋類協(xié)同制導(dǎo)方法,可能會由于初始誤差加大導(dǎo)致初始過載較大。 基于一致性算法的協(xié)同制導(dǎo)方法盡管期望攻擊時間依賴于初始條件或領(lǐng)彈,但是具備一定的自組織性,實現(xiàn)起來較為方便,在近距高動態(tài)格斗、期望攻擊時間要求相對寬松的場景下具有應(yīng)用價值。
由于針對固定目標(biāo)的制導(dǎo)系統(tǒng)本質(zhì)是自治系統(tǒng),因此可利用最優(yōu)控制/優(yōu)化方法,將攻擊時間作為一個約束,進(jìn)行優(yōu)化設(shè)計。 文獻(xiàn)[22]將帶有攻擊時間約束的制導(dǎo)問題轉(zhuǎn)化為帶有終端約束的連續(xù)系統(tǒng)最優(yōu)控制問題,并通過數(shù)值方法得到攻擊時間控制制導(dǎo)律,并可以直接擴展為攻擊時間一致性協(xié)同制導(dǎo)律。 文獻(xiàn)[23]則是將協(xié)同制導(dǎo)系統(tǒng)進(jìn)行離散化,構(gòu)建多約束離散的最優(yōu)控制問題,通過模型預(yù)測控制方法獲得攻擊時間一致性協(xié)同制導(dǎo)律指令。 文獻(xiàn)[24]則構(gòu)建了圓弧式協(xié)同制導(dǎo)律,構(gòu)建了圓弧制導(dǎo)律參數(shù)與剩余飛行時間的參數(shù)映射關(guān)系,通過優(yōu)化制導(dǎo)參數(shù)可以實現(xiàn)多飛行器對目標(biāo)的同時打擊。 在彈目速度較大時,為了提高上述優(yōu)化問題求解速度,文獻(xiàn)[25-26]則將帶有終端攻擊時間約束的最優(yōu)協(xié)同制導(dǎo)問題進(jìn)一步線性化與離散化,引入序列凸優(yōu)化技術(shù)實現(xiàn)了協(xié)同制導(dǎo)律的快速求解。
基于優(yōu)化技術(shù)的時間一致性協(xié)同制導(dǎo)方法的優(yōu)點較多,且能夠同時處理復(fù)雜多約束條件。 當(dāng)飛行器規(guī)模增大的時候,基于優(yōu)化技術(shù)的協(xié)同制導(dǎo)算法實時性、制導(dǎo)精度、穩(wěn)定性將會受到一定局限,但是隨著彈載計算機技術(shù)的發(fā)展,這一類方法在未來還是具有較大的應(yīng)用前景。
基于軌跡跟蹤技術(shù)的時間一致性協(xié)同制導(dǎo)方法,一般根據(jù)1.1 節(jié)介紹的雙層協(xié)同制導(dǎo)架構(gòu)進(jìn)行設(shè)計,在設(shè)定期望剩余飛行時間或通過局部信息交互得到平均剩余飛行時間作為指令以后,構(gòu)建帶有期望飛行時間指令構(gòu)型的參數(shù)化軌跡模型,通過優(yōu)化軌跡參數(shù)可以獲得帶有期望攻擊時間指令的軌跡解析表達(dá)式,在制導(dǎo)層面可以設(shè)計軌跡跟蹤協(xié)同制導(dǎo)律實現(xiàn)多飛行器同時攻擊。 由于參數(shù)化軌跡模型的自變量不同,協(xié)同制導(dǎo)模型也會不同。 目前較多的學(xué)者采用前置角作為自變量,文獻(xiàn)[27-30]構(gòu)建了前置角參數(shù)化軌跡模型,同時引入攻擊時間指令作為優(yōu)化代價函數(shù)或約束條件,通過參數(shù)優(yōu)化方法可以得到帶有期望攻擊時間指令的軌跡解析表達(dá)式。 文獻(xiàn)[31]構(gòu)建了視線角作為自變量的協(xié)同制導(dǎo)模型,并且得到帶有攻擊時間約束的視線角軌跡曲線。 文獻(xiàn)[32]則是直接將過載曲線進(jìn)行參數(shù)化設(shè)計,通過閉環(huán)系統(tǒng)動力學(xué)分析求解剩余飛行時間,進(jìn)而優(yōu)化過載參數(shù)模型。
上述策略中,前置角參數(shù)化模型能夠處理視場約束,這是因為前置角在一定條件下可以和視場角關(guān)聯(lián),通過對前置角軌跡的規(guī)劃,能夠同時保障目標(biāo)在視場范圍之內(nèi)。 視線角、過載參數(shù)化模型的優(yōu)點在于參考軌跡的跟蹤控制更加方便。
當(dāng)飛行器具備速度調(diào)節(jié)能力(或推力控制能力)時,則可以通過軸向過載和法向過載同時調(diào)節(jié)剩余飛行時間,實現(xiàn)攻擊時間一致性協(xié)同制導(dǎo)。文獻(xiàn)[33-34]將攻擊時間一致性協(xié)同制導(dǎo)轉(zhuǎn)化為分布式一致性控制問題,并且基于一致性理論設(shè)計了攻擊時間一致性協(xié)同制導(dǎo)律。 文獻(xiàn)[35]基于領(lǐng)導(dǎo)者-跟隨者架構(gòu),將攻擊時間一致性協(xié)同制導(dǎo)轉(zhuǎn)化為分布式一致性跟蹤控制問題,構(gòu)建了攻擊時間可調(diào)的協(xié)同制導(dǎo)律。 在此基礎(chǔ)上,有學(xué)者研究了復(fù)雜多約束條件下的協(xié)同制導(dǎo)問題。 文獻(xiàn)[36]研究了飛行速度帶有上下界約束的攻擊時間一致性協(xié)同制導(dǎo)問題。 文獻(xiàn)[37]研究了無視線角速率測量情況下的攻擊時間一致性協(xié)同制導(dǎo)問題。 文獻(xiàn)[38]則研究了無彈目相對速度測量情況下的攻擊時間一致性協(xié)同制導(dǎo)問題。
上述策略引入了速度調(diào)節(jié)能力,這在現(xiàn)實中也是可以獲得解決方案的。 例如,在固定翼/旋翼無人機的協(xié)同制導(dǎo)場景、巡飛彈/巡航彈的協(xié)同制導(dǎo)場景下均是可以應(yīng)用的。
在上述4 類方法中,為了實現(xiàn)攻擊時間的協(xié)調(diào)一致,不可避免地需要使用剩余飛行時間這一狀態(tài)變量。 然而,剩余飛行時間與軌跡(或過載)是耦合的,這也就使得剩余飛行時間只能通過近似估計得到。 剩余飛行時間在軌跡相對平直的情況下近似誤差較小,然而在軌跡較為彎曲或目標(biāo)存在運動/機動的情況下,其近似誤差則可能會變大。 對于這種具有非隨機不確定性因素的協(xié)同制導(dǎo)模型,人工智能技術(shù)有一定的解決可行性。 文獻(xiàn)[39]指出可以采用離線學(xué)習(xí)和動態(tài)調(diào)整相結(jié)合的方法,實現(xiàn)智能自主制導(dǎo)。 目前也有學(xué)者開展相關(guān)的研究。 文獻(xiàn)[40]采用神經(jīng)網(wǎng)絡(luò)來估計剩余飛行時間,并且構(gòu)建了相應(yīng)的攻擊時間一致的智能協(xié)同制導(dǎo)律。 文獻(xiàn)[41-42]則利用強化學(xué)習(xí)方法,將攻擊時間協(xié)同制導(dǎo)問題用數(shù)值優(yōu)化的方式進(jìn)行智能求解,通過離線大規(guī)模訓(xùn)練及在線使用的方式,實現(xiàn)了多飛行器對目標(biāo)的同時打擊。
隨著人工智能技術(shù)的發(fā)展,智能導(dǎo)彈是未來導(dǎo)彈的發(fā)展方向,智能協(xié)同制導(dǎo)也將會成為未來智能導(dǎo)彈的重要技術(shù)基礎(chǔ)。
針對運動/機動目標(biāo)的時間一致性協(xié)同制導(dǎo)問題,由于目標(biāo)的未知運動/機動信息給協(xié)同制導(dǎo)系統(tǒng)帶來不確定性,而且協(xié)同制導(dǎo)可行域?qū)M(jìn)一步被壓縮,存在一定的研究難度和技術(shù)挑戰(zhàn)。然而,在工程應(yīng)用中,由于這種方法能夠?qū)崿F(xiàn)對空中運動/機動目標(biāo)的有效打擊,十分有現(xiàn)實意義。從方法技術(shù)角度上,本節(jié)的問題解決方法與固定目標(biāo)協(xié)同制導(dǎo)問題解決方法較為類似,主要分為以下5 類方法:基于剩余飛行時間誤差反饋的時間一致性協(xié)同制導(dǎo)方法、基于預(yù)測命中點的時間一致性協(xié)同制導(dǎo)方法、基于期望軌跡跟蹤的時間一致性協(xié)同制導(dǎo)方法、基于速度調(diào)節(jié)的時間一致性協(xié)同制導(dǎo)方法和基于動態(tài)規(guī)劃的時間一致性協(xié)同制導(dǎo)方法。 下面對這5 類方法進(jìn)行詳細(xì)介紹。
針對運動/機動目標(biāo),在基于誤差反饋的時間一致性協(xié)同制導(dǎo)問題中,剩余飛行時間跟蹤誤差動力學(xué)模型將會受到目標(biāo)的未知運動/機動信息影響,這一部分將會作為未知外部干擾而影響系統(tǒng)的穩(wěn)定性與制導(dǎo)精度。 文獻(xiàn)[43]在靜止目標(biāo)時間一致性協(xié)同制導(dǎo)律基礎(chǔ)上,將目標(biāo)機動進(jìn)行補償。 文獻(xiàn)[44-46]針對帶有目標(biāo)未知運動/機動信息的剩余飛行時間跟蹤誤差動力學(xué)模型,設(shè)計期望攻擊時間指令,并且利用魯棒控制或變結(jié)構(gòu)控制方法,實現(xiàn)了對未知擾動的補償,保障攻擊時間一致性誤差或期望剩余飛行時間跟蹤誤差能夠有限時間收斂。 此外,文獻(xiàn)[47]利用反饋線性化方法,建立了期望相對距離跟蹤誤差系統(tǒng)動力學(xué)模型,并且利用變結(jié)構(gòu)控制與干擾估計方法實現(xiàn)了多飛行器彈目相對距離的一致,進(jìn)而實現(xiàn)了攻擊時間的一致性。 文獻(xiàn)[48]構(gòu)建了目標(biāo)未知運動/機動信息濾波器,并且將協(xié)同制導(dǎo)系統(tǒng)線性化,引入期望攻擊時間作為終端約束,利用最優(yōu)控制方法得到了攻擊時間協(xié)同制導(dǎo)律。
針對目標(biāo)的運動/機動給協(xié)同制導(dǎo)系統(tǒng)帶來的未知干擾信息,上述方法具有一定的魯棒性。然而,期望攻擊時間指令的選擇將會影響協(xié)同制導(dǎo)系統(tǒng)的收斂性。
針對單飛行器對運動/機動目標(biāo)的打擊/攔截問題,將其轉(zhuǎn)化為對預(yù)測命中點的打擊/攔截是一個較為有效的技術(shù)。 在協(xié)同制導(dǎo)問題中,也有一些學(xué)者將此技術(shù)進(jìn)行應(yīng)用。 文獻(xiàn)[49-51]利用預(yù)測命中點技術(shù),將對機動目標(biāo)的協(xié)同制導(dǎo)問題轉(zhuǎn)化為對固定目標(biāo)的協(xié)同制導(dǎo)問題。 文獻(xiàn)[52]則在預(yù)測命中點思想上,將目標(biāo)的機動信息也引入到目標(biāo)軌跡預(yù)測,修正了僅依賴目標(biāo)當(dāng)前位置和速度外推的預(yù)測命中點計算方法。 文獻(xiàn)[53]則是構(gòu)建了一個虛擬目標(biāo)點,并且結(jié)合分段制導(dǎo)思想,構(gòu)建了帶有攻擊時間和角度約束的制導(dǎo)律,進(jìn)而在指定期望攻擊實現(xiàn)后,可以通過雙層協(xié)同制導(dǎo)架構(gòu)實現(xiàn)攻擊時間一致性協(xié)同制導(dǎo)。
由于存在目標(biāo)運動/機動,期望協(xié)同制導(dǎo)軌跡規(guī)劃會受到不確定因素的影響,因此,協(xié)同制導(dǎo)軌跡的形式及參數(shù)選擇將會影響協(xié)同制導(dǎo)效果。 文獻(xiàn)[54]構(gòu)建了前置角參數(shù)化軌跡模型,同時引入攻擊時間指令作為期望終端條件,通過參數(shù)優(yōu)化方法可以得到帶有期望攻擊時間約束的軌跡解析表達(dá)式,以勻速直線運動目標(biāo)的協(xié)同制導(dǎo)場景進(jìn)行了仿真驗證。 文獻(xiàn)[55]則建立了帶有期望攻擊時間誤差收斂特性的動力學(xué)模型,并且參數(shù)優(yōu)化得到了帶有期望收斂性能的協(xié)同制導(dǎo)律,以勻速直線運動目標(biāo)的協(xié)同制導(dǎo)場景進(jìn)行了仿真驗證。 文獻(xiàn)[56]提出了一種新的虛擬目標(biāo)軌跡跟蹤控制方法,能夠?qū)崿F(xiàn)帶有攻擊角度和時間約束的協(xié)同制導(dǎo)。 文獻(xiàn)[57]設(shè)計了帶有攻擊時間約束的視線角/角速率曲線,并且給出了視線角跟蹤制導(dǎo)律,實現(xiàn)了帶有期望攻擊時間控制的制導(dǎo),同樣,通過雙層協(xié)同制導(dǎo)架構(gòu),可以實現(xiàn)多飛行器對機動目標(biāo)的攻擊時間一致性協(xié)同制導(dǎo)。
可以看出,由于目標(biāo)未知運動/機動的影響,這一類協(xié)同制導(dǎo)方法對于期望軌跡的設(shè)計要求較高,相關(guān)參數(shù)也有一定的敏感性。
與1.4 節(jié)類似,當(dāng)飛行器具備速度調(diào)節(jié)能力時,則可通過軸向過載實現(xiàn)攻擊時間一致性協(xié)同制導(dǎo)。 文獻(xiàn)[58-59]針對無領(lǐng)導(dǎo)者架構(gòu),將攻擊時間一致性協(xié)同制導(dǎo)轉(zhuǎn)化為分布式一致性控制問題,并且設(shè)計了攻擊時間一致性協(xié)同制導(dǎo)律。 同樣,文獻(xiàn)[60-62]基于領(lǐng)導(dǎo)者-跟隨者架構(gòu),將攻擊時間一致性協(xié)同制導(dǎo)問題轉(zhuǎn)化為分布式一致性跟蹤控制問題,利用有限時間收斂方法,構(gòu)建了攻擊時間誤差有限時間收斂的協(xié)同制導(dǎo)律。 在此基礎(chǔ)上,有學(xué)者研究了復(fù)雜多約束條件下的協(xié)同制導(dǎo)問題,如文獻(xiàn)[63]則研究了無相對速度測量情況下的攻擊時間一致性協(xié)同制導(dǎo)問題。
同樣,上述策略引入了速度調(diào)節(jié)能力,在實際固定翼/旋翼無人機的協(xié)同制導(dǎo)打擊地面車輛場景、巡飛彈/巡航彈的協(xié)同制打擊水面/地面移動目標(biāo)場景中均有應(yīng)用潛力。
由于目標(biāo)存在機動能力時,從控制論的角度,制導(dǎo)問題也可以看作一個微分對策問題。 因此,多飛行器協(xié)同制導(dǎo)就成為了一個協(xié)同微分對策問題[64]。 協(xié)同微分對策刻畫了目標(biāo)逃逸和協(xié)同打擊這2 個方面的博弈,體現(xiàn)了二者之間的智能特性。 對于帶有攻擊時間一致性的協(xié)同博弈制導(dǎo)問題,在運動學(xué)回路,可以通過求解協(xié)同微分對策問題得到解析解或者數(shù)值解。 然而,當(dāng)考慮復(fù)雜非線性運動特性(或制導(dǎo)系統(tǒng)動力學(xué)特性)時,往往得不到解析解。 自適應(yīng)動態(tài)規(guī)劃方法則是相對有效的解決方案。 文獻(xiàn)[65-67]將攻擊時間一致性約束下的機動目標(biāo)協(xié)同制導(dǎo)問題轉(zhuǎn)化為非線性最優(yōu)控制問題,利用自適應(yīng)動態(tài)規(guī)劃方法得到了協(xié)同制導(dǎo)律的近似解,實現(xiàn)了攻擊時間一致性。
針對運動/機動目標(biāo)的協(xié)同打擊問題,動態(tài)規(guī)劃制導(dǎo)方法或微分對策制導(dǎo)方法本質(zhì)也是最優(yōu)制導(dǎo)方法的推廣,并且能夠發(fā)展成為帶有智能特性的協(xié)同博弈制導(dǎo)方法,可以有效處理攻擊時間一致性等多約束條件下的協(xié)同制導(dǎo)問題,并且具備最優(yōu)特性,同時此類方法需要的信息量相對較多,問題求解時間將會隨著問題規(guī)模增大而增大。 隨著人工智能技術(shù)的發(fā)展,這一類方法在智能導(dǎo)彈中也會有一定的應(yīng)用前景。
2.1 節(jié)~2.5 節(jié)綜述了目標(biāo)存在運動/機動特性下的攻擊時間一致性協(xié)同制導(dǎo)問題。 然而,針對合作型目標(biāo)(運動/機動特性已知)和非合作型目標(biāo)(運動/機動特性未知),上述方法的適用性仍需要進(jìn)一步分析。
針對合作型目標(biāo),可以通過軌跡預(yù)測、衛(wèi)星/載機信息探測等手段獲取其運動/機動信息,因此,目標(biāo)的運動/機動影響可以在協(xié)同制導(dǎo)律中進(jìn)行補償。 針對基于預(yù)測命中點的時間一致性協(xié)同制導(dǎo)方法[49-53],大多將目標(biāo)的未知動態(tài)進(jìn)行估計與預(yù)測,轉(zhuǎn)化為對合作類目標(biāo)的協(xié)同制導(dǎo)問題。針對基于軌跡跟蹤的時間一致性協(xié)同制導(dǎo)方法[54-57]、基于微分對策的協(xié)同制導(dǎo)方法[64],其協(xié)同制導(dǎo)律中也大多用到了目標(biāo)的運動信息。
針對非合作目標(biāo),帶有攻擊時間一致性的協(xié)同制導(dǎo)問題本身就是一個比較有挑戰(zhàn)性的問題,而且如果不依賴于目標(biāo)的運動/機動信息,處理起來會更加困難。 因此,僅有部分基于誤差反饋的時間一致性協(xié)同制導(dǎo)方法[43-47]、基于自適應(yīng)動態(tài)規(guī)劃的時間一致性協(xié)同制導(dǎo)方法[65-67]能夠?qū)崿F(xiàn)期望的同時攻擊,然而攻擊時間一致性誤差也有一定的殘差、協(xié)同制導(dǎo)可行域也相對較窄。 另外,基于推力控制的時間一致性協(xié)同制導(dǎo)方法則能夠同時針對2 類目標(biāo)實現(xiàn)攻擊時間一致性。 因此,針對非合作目標(biāo)帶有攻擊時間一致性的協(xié)同制導(dǎo)問題,仍是本領(lǐng)域的研究熱點和難點。
從制導(dǎo)信息獲取途徑的角度,協(xié)同制導(dǎo)方法可以分為分布式協(xié)同制導(dǎo)和集中式協(xié)同制導(dǎo)2 類。 可以看出,基于誤差反饋的時間一致性協(xié)同制導(dǎo)方法、基于推力控制的時間一致性協(xié)同制導(dǎo)方法,以及部分基于動態(tài)規(guī)劃的時間一致性協(xié)同制導(dǎo)方法可以實現(xiàn)分布式信息獲取;而基于預(yù)測命中點的時間一致性協(xié)同制導(dǎo)方法、基于軌跡跟蹤的時間一致性協(xié)同制導(dǎo)方法,以及第1.2 節(jié)中的基于優(yōu)化技術(shù)/智能學(xué)習(xí)的時間一致性協(xié)同制導(dǎo)方法,大多數(shù)是集中式的協(xié)同制導(dǎo)架構(gòu)。 由于分布式協(xié)同制導(dǎo)架構(gòu)自組織性、自適應(yīng)性更好,因此這也是時間一致性協(xié)同制導(dǎo)領(lǐng)域的重點問題。
隨著飛行器技術(shù)的發(fā)展,集群作戰(zhàn)將會成為未來重要的作戰(zhàn)方式。 從世界各國的集群武器發(fā)展現(xiàn)狀來看,飛行器集群武器已初現(xiàn)端倪,美國“小精靈”、“郊狼”等飛行器集群已經(jīng)逐漸形成作戰(zhàn)能力,初步具備對高價值目標(biāo)的協(xié)同毀傷能力。針對防御方,多空空/地空導(dǎo)彈攔截機動目標(biāo)的作戰(zhàn)樣式也在逐漸完善。 攻擊時間一致性協(xié)同制導(dǎo)技術(shù)是上述協(xié)同作戰(zhàn)任務(wù)執(zhí)行層面的關(guān)鍵環(huán)節(jié)之一。 隨著任務(wù)場景的復(fù)雜化、目標(biāo)隱身/突防/機動能力的提升,攻擊時間一致性協(xié)同制導(dǎo)應(yīng)該向著智能性、實時性、魯棒性、寬域性和多約束性等方面發(fā)展。 主要方向介紹如下。
在未來作戰(zhàn)場景中,目標(biāo)運動/機動的能力將會提升,攻擊時間一致性協(xié)同制導(dǎo)問題必然將會遇到目標(biāo)不確定機動干擾帶來的影響,形成協(xié)同博弈對抗態(tài)勢。 隨著彈載計算機技術(shù)的發(fā)展,將基于強化學(xué)習(xí)、深度學(xué)習(xí)的智能控制、智能估計等方法引入到協(xié)同制導(dǎo)問題中,實現(xiàn)對機動目標(biāo)作用下剩余時間的精準(zhǔn)估計及攻擊時間一致性協(xié)同制導(dǎo)律的設(shè)計,將會非常有意義。
基于1.2 節(jié)和2.5 節(jié)的分析,基于優(yōu)化技術(shù)的攻擊時間一致性協(xié)同制導(dǎo)方法能夠處理更多約束、更復(fù)雜的模型。 然而隨著飛行器規(guī)模的增大,無論是集中式還是分布式的算法,實時性將會受到一定的挑戰(zhàn)。 因此,在大規(guī)模飛行器協(xié)同作戰(zhàn)的場景下,需要建立更加精準(zhǔn)的協(xié)同制導(dǎo)模型,結(jié)合一些智能算法,簡化方法,來提升最優(yōu)協(xié)同制導(dǎo)算法的實時性。
在實際應(yīng)用中,魯棒性體現(xiàn)在協(xié)同制導(dǎo)系統(tǒng)對不確定噪聲、不確定環(huán)節(jié)的不敏感性。 在現(xiàn)有的研究中,有部分結(jié)果并未考慮實際導(dǎo)引信息獲取途徑是否可行,如紅外導(dǎo)引頭較難獲取相對速度,因此剩余飛行時間較難直接測量。 導(dǎo)引信息中的噪聲也會對協(xié)同制導(dǎo)效果產(chǎn)生較大影響。 此外,目標(biāo)的未知運動/機動信息也會對協(xié)同制導(dǎo)精度產(chǎn)生較大影響。 因此在實際應(yīng)用中,需要進(jìn)一步探討攻擊時間一致性魯棒協(xié)同制導(dǎo)問題。
在現(xiàn)有研究中,部分攻擊時間一致性協(xié)同制導(dǎo)算法收斂性對初始條件非常敏感,同時期望的攻擊時間可行域相對狹窄。 在高動態(tài)環(huán)境下,為了形成可行的攻擊時間協(xié)同制導(dǎo),多飛行器初始陣位必須處于可行域,這就要求協(xié)同制導(dǎo)可行域具備寬域性,即對初始條件、攻擊時間指令具有大范圍適應(yīng)能力。
攻擊時間協(xié)同制導(dǎo)律是協(xié)同制導(dǎo)的一種典型制導(dǎo)律。 正如引言中提到的,未來協(xié)同制導(dǎo)問題將會收到多約束條件限制,如攻擊時間/攻擊角度/視場角等多約束組合。 盡管現(xiàn)在已經(jīng)有較多成果,然而大多數(shù)都是基于有推力的情況,對于無速度調(diào)節(jié)能力的飛行器,能夠?qū)崿F(xiàn)多約束條件下的協(xié)同制導(dǎo)也是一個重要的發(fā)展方向。
攻擊時間一致性協(xié)同制導(dǎo)是協(xié)同制導(dǎo)的基本問題,具有很重要的戰(zhàn)術(shù)意義。 盡管現(xiàn)有成果較為豐富,通過對現(xiàn)有方法的總結(jié)來看,仍存在一些局限性。 從解析解角度來看,需要進(jìn)一步探索攻擊時間一致性協(xié)同制導(dǎo)律的新形式、新設(shè)計方法,來提升對初始條件和目標(biāo)機動的適應(yīng)性。 從數(shù)值解角度來看,隨著人工智能技術(shù)和彈載計算機技術(shù)的發(fā)展,一些先進(jìn)的、智能的攻擊時間一致性協(xié)同制導(dǎo)方法將會在未來得到應(yīng)用。 此外,作為基本的協(xié)同制導(dǎo)模式,盡管攻擊時間、攻擊角度、視場角3 類協(xié)同制導(dǎo)約束均有分離或組合模式下的研究,然而相關(guān)方法適應(yīng)性和智能性仍需進(jìn)一步提高,未來一方面需要繼續(xù)探索多種協(xié)同條件約束下的協(xié)同制導(dǎo)律設(shè)計,另一方面需要進(jìn)一步面向?qū)崙?zhàn)場景,探索作戰(zhàn)任務(wù)牽引的新型協(xié)同制導(dǎo)模式及其協(xié)同制導(dǎo)律設(shè)計方法。