周尚輝,曾德賢,胡晶晶,3,張岐龍,楊江波
(1.航天工程大學, 北京 101416;2.中國人民解放軍95806部隊, 北京 100076;3.中國人民解放軍31638部隊, 昆明 650100)
隨著航天技術在國家安全、經(jīng)濟、社會服務和軍事等眾多領域的廣泛應用,人類對太空的依賴性日益增強,太空已成為維護國家安全和國家利益的戰(zhàn)略制高點[1]。世界各航天強國紛紛致力于推動航天發(fā)射任務和太空武器建設,試圖搶占有限的太空資源。由此引發(fā)了太空目標數(shù)量呈指數(shù)級的增長和太空武器技術呈多樣化的發(fā)展,給預警監(jiān)視任務中雷達組網(wǎng)有限的資源調(diào)配帶來了嚴峻挑戰(zhàn)。截至2021年底,地球上空已有超過4900顆衛(wèi)星、空間站、航天飛船等航天器保持穩(wěn)定在軌運行。預計到2028年,隨著“星鏈”(starlink)、“一網(wǎng)”(oneweb)等全球大量低軌互聯(lián)網(wǎng)通信衛(wèi)星星座完成發(fā)射部署,地球太空軌道上將有超過50 000顆衛(wèi)星[2-4]。與此同時,臨近空間飛行器、高超音速導彈等一系列新型太空武器也相繼問世。基于經(jīng)驗、半經(jīng)驗模型的雷達組網(wǎng)人工資源調(diào)度方法已難以與日益繁重的預警監(jiān)視任務相適應。
針對當前預警監(jiān)視任務中雷達組網(wǎng)資源調(diào)度方法難以與太空目標數(shù)量井噴式增長、太空武器多樣化發(fā)展的趨勢相適應的問題,基于人工智能算法,面向反導預警和空間目標監(jiān)視2類任務開展雷達組網(wǎng)資源調(diào)度方法研究,合理調(diào)配系統(tǒng)資源,充分發(fā)揮雷達組網(wǎng)探測效能,推動系統(tǒng)向自主任務處理、自動目標分配與自適應指揮控制方向發(fā)展,可為提高預警監(jiān)視能力建設水平和戰(zhàn)斗力生成發(fā)揮重要技術支撐作用。
預警監(jiān)視雷達組網(wǎng)作為預警監(jiān)視系統(tǒng)的主體部分,集“戰(zhàn)略預警”與“天域感知”于一體,利用系統(tǒng)中多種類型的專用裝備和兼用裝備構建預警監(jiān)視網(wǎng),在反導預警和空間目標監(jiān)視作戰(zhàn)任務中對目標進行跟蹤探測,通過各傳感器節(jié)點間的信息共享實現(xiàn)“一點發(fā)現(xiàn)、全網(wǎng)皆知”,是國家遂行戰(zhàn)略安全任務的“壓艙石”與“制高點”。預警監(jiān)視雷達組網(wǎng)的工作效能在很大程度上取決于對組網(wǎng)內(nèi)各雷達有限探測資源的合理分配調(diào)度。同時,在“陸、海、空、天、電”五位一體的現(xiàn)代高技術局部戰(zhàn)爭中,諸如電磁干擾、反輻射導彈等作戰(zhàn)手段都給預警監(jiān)視雷達組網(wǎng)中裝備的生存帶來了極大威脅。因此,對預警監(jiān)視雷達組網(wǎng)內(nèi)資源的合理調(diào)度,對于提升系統(tǒng)效能和魯棒性具有極其重要的意義。
面向預警監(jiān)視任務的雷達組網(wǎng)資源調(diào)度,是在滿足任務需求和約束條件的基礎上,通過對其所包含探測資源在時間維度上的合理調(diào)度[5],優(yōu)化目標分配排序作業(yè)方案,以實現(xiàn)對預警監(jiān)視目標更加精準高效探測的過程。而以最優(yōu)資源調(diào)度為目標的探測任務旨在資源受限的條件下盡可能地提高協(xié)同探測性能,或在滿足任務需求情況下盡可能地降低系統(tǒng)資源消耗[6],由此帶來資源調(diào)度問題場景復雜、計算量大、精度要求高的特性[1]。
1.2.1反導預警任務中的資源調(diào)度原則
反導預警任務是指在面臨來襲的彈道導彈目標時,根據(jù)探測后計算得到的導彈運動參數(shù)預測導彈的飛行彈道與時序,為我方開展相應防御行動提供預警時間以避免或減小遇襲損失,同時指示彈道導彈防御系統(tǒng)對其進行攔截的一類作戰(zhàn)任務,主要由反導預警系統(tǒng)負責實施[7]。
反導預警任務的最終目的是對來襲導彈發(fā)出預警,從而開展防御攔截行動。因此,預警力量將更多地關注投入到具有實質(zhì)性威脅的彈頭目標上,同時對系統(tǒng)的目標截獲能力提出了很高的要求,確保威脅目標在波束掃描過程中不被漏掉。通常情況下,預警雷達會根據(jù)任務需要設立搜索屏,在目標穿屏時將其截獲,也會通過增設搜索屏的方式提高系統(tǒng)的目標截獲能力。反導預警任務中,雷達組網(wǎng)將盡可能掌握威脅目標和提高目標截獲概率作為其資源調(diào)度的原則。
1.2.2空間目標監(jiān)視任務中的資源調(diào)度原則
空間目標監(jiān)視任務是指利用雷達等探測設備對所有人造天體進入、離開空間以及在空間中運行的過程進行探測,并據(jù)此結合相關太空目標情報資料,綜合處理分析出目標軌道、功能、威脅等基本信息,生成全要素的空間態(tài)勢,以向各類航天活動提供有效信息支持的一類作戰(zhàn)任務[8]。其主要特點是探測活動的非合作性、信息要素的完備性以及監(jiān)視過程的長期性等。
空間目標監(jiān)視任務旨在監(jiān)視空間目標在軌狀態(tài),通過獲取的軌道信息生成全要素的空間態(tài)勢。因此,監(jiān)視力量需要以較高的測量精度對目標精確定軌,將其作為識別編目工作的依據(jù)??臻g目標監(jiān)視任務中,雷達組網(wǎng)將保證雷達對目標的測量精度作為其資源調(diào)度的原則。
實戰(zhàn)條件下的預警監(jiān)視雷達組網(wǎng)往往承擔著預警與監(jiān)視2個類別中的多項作戰(zhàn)任務。當面臨多個任務沖突時,需要依據(jù)任務的優(yōu)先級給出雷達組網(wǎng)有限資源的調(diào)配建議,供指揮員決策參考,最終制定生成一套全局作戰(zhàn)方案,確保投入的作戰(zhàn)力量與任務的優(yōu)先級成正比。為了更加科學、合理地對任務進行評估,采用層次分析法對任務優(yōu)先級進行劃分。
基于層次分析法的任務優(yōu)先級劃分將任務優(yōu)先級作為目標層;將任務重要程度、任務緊急程度、先驗情報完備程度以及作戰(zhàn)決心作為準則層;將待劃分的各作戰(zhàn)任務(以3個任務為例)作為方案層,構建遞階層次結構模型,如圖1所示。
圖1 遞階層次結構模型
模型將復雜問題分解為多個組成因素便于分析,分析過程中以相對重要程度為依據(jù),采用兩兩比較的方式構造判斷矩陣An*n,其中元素aij表示該層次中對象Bi與對象Bj基于上一層次的重要程度之比,aji=1/aij,取值采用1~9標度法表示,并通過計算一致性指標C.I.和一致性比率C.R.檢驗判斷矩陣的一致性。
在構造判斷矩陣的基礎上,運用特征值法求得本層次各對象相對于上一層次的權重系數(shù),填充權重矩陣,如表1所示。由任務優(yōu)先級的計算公式計算各作戰(zhàn)任務的任務優(yōu)先級OPi,并按照從大到小的順序進行任務優(yōu)先排序[9]。
表1 任務優(yōu)先級權重矩陣
OPi=wC1wC1i+wC2wC2i+wC3wC3i+wC4wC4i
(4)
假設預警監(jiān)視雷達組網(wǎng)由N部雷達組成,在K個單位作戰(zhàn)時間內(nèi)對M個目標進行協(xié)同探測,在滿足充分利用探測資源的條件下,盡可能實現(xiàn)探測目標價值累積與跟蹤質(zhì)量最大化。定義三維分配矩陣Xm*n*k,表示各時刻雷達對目標探測的跟蹤資源分配,如圖2所示,同一目標的跟蹤情況用同一顏色表示,其中元素xijt為0-1變量。當xijt=1時,表示t時刻分配第j部雷達資源對第i個目標進行跟蹤探測[10],否則xijt=0。
圖2 三維分配矩陣示意圖
N部雷達具有不同的跟蹤測量精度pj和探測容量cj,M個目標依據(jù)價值不同被賦予不同價值等級wi。用tij0、tijs分別表示第i個目標進入和飛出第j部雷達探測范圍的時刻,其差值為第i個目標在第j部雷達探測范圍內(nèi)的駐留時間tij。
tij=tijs-tij0
(5)
當目標進入雷達探測范圍,雷達對目標進行搜索,截獲方向與雷達陣面法線方向之間存在波束指向角eij[11]。雷達天線在不同波束指向角條件下用于發(fā)射/接收能量的等效口徑面積不同,因而雷達波束的能量大小也不同,直接影響雷達對目標的搜索截獲及探測效果,如圖3所示,天線等效口徑面積As為法線方向時面積A在等相面上的投影。隨著波束指向角增大,天線等效口徑面積減小,天線增益隨之下降,等效天線方向用于搜索截獲目標的雷達波束能量相應減弱。
圖3 波束指向角對天線等效口徑面積的影響
由此可得目標函數(shù):
式中,K1、K2、K3分別為對目標價值等級、雷達測量精度、波束指向能量的賦權值。依據(jù)不同任務場景及用戶需求靈活取值,表示對影響目標跟蹤探測效能3個因素的不同看重程度。
在反導預警和空間目標監(jiān)視2類任務場景中,探測任務對預警監(jiān)視雷達組網(wǎng)的目標跟蹤探測提出了不同的需求,且任務對象具有不同特性,由此帶來2類任務場景下模型參數(shù)的不同配置。
在反導預警任務中,彈道導彈目標作為任務對象,包括彈頭、彈體、誘餌、碎片等多類目標,且在飛行過程中呈多組團目標分布,每組團目標中主體目標周圍有若干伴飛物[12],各目標依據(jù)威脅程度不同被賦予不同威脅等級,即價值等級wi。雷達在對團目標進行探測時,由于團目標內(nèi)各目標間距離相對于探測距離而言可以小到忽略不計,因此近似認為同一團目標內(nèi)各目標均在tij0和tijs時刻進入和飛出雷達探測范圍,即駐留時間tij相同。反導作戰(zhàn)的特殊性決定了預警監(jiān)視雷達組網(wǎng)的“不容閃失”,首要任務就是預警來襲的彈頭目標,及時截獲并傳遞信息給攔截武器,以清除對我防衛(wèi)目標的威脅。因此模型目標函數(shù)應更加關注目標威脅程度和搜索截獲能力帶來的影響,適當增加目標價值等級和波束指向能量在目標函數(shù)中的權重,使K1、K3高于K2。
在空間目標監(jiān)視任務中,空間目標飛行在大氣層以外的外層空間,距離探測雷達很遠,而精確定軌是進一步開展識別編目的前提條件,從而對預警監(jiān)視雷達組網(wǎng)的測量精度提出了很高的要求[13]。同時,空間目標監(jiān)視任務為監(jiān)視活動,旨在監(jiān)視目標在軌狀態(tài),目標不存在直接威脅,僅依據(jù)關注程度劃分價值等級。因此模型目標函數(shù)應更加關注測量精度帶來的影響,弱化對目標價值的區(qū)分和截獲時效性,適當增加雷達測量精度在目標函數(shù)中的權重,使K2高于K1、K3。
2.3.1時間約束
在反導預警任務場景中,遠程預警雷達跟蹤探測目標后引導交接給精確識別雷達,最終生成火力攔截引導信息。攔截武器具有安全近界,需要目標在安全近界之外進行火力攔截才有效,同時遠程預警雷達需要一定時長生成引導信息并向后傳遞。因此雷達的有效探測受限于一個時間約束的距離區(qū)間,包括一個近界和一個遠界,近界為預警截止時間tijl帶來的約束,遠界為雷達最大探測距離,受到目標進入雷達探測范圍時刻tij0的約束。
xijt=0 ?t∈(0,tij0)∪(tijl,∞), ?i,j
(7)
在空間目標監(jiān)視任務場景中,雷達對目標的探測目的為監(jiān)視目標在軌狀態(tài),不需要向攔截武器傳遞信息,僅受限于目標進入和飛出雷達探測范圍的時刻tij0、tijs。
xijt=0 ?t∈(0,tij0)∪(tijs,∞), ?i,j
(8)
2.3.2方向約束
執(zhí)行預警監(jiān)視任務的相控陣雷達由大量獨立可控的小型天線元件構成其天線陣面,包含多個陣元。雷達可通過計算機系統(tǒng)控制各陣元電流的相位,以達到改變波束掃描方向的目的,陣元數(shù)目越多,則波束掃描方位的范圍就越大[14]。而預警監(jiān)視雷達組網(wǎng)中部分相控陣雷達陣面固定,不具備隨動功能,受限于旁瓣能量衰減和陣元數(shù)目有限,僅能夠在與雷達陣面法線一定夾角范圍內(nèi)進行有效探測,即存在方位約束角θ。該約束僅取決于雷達裝備性能,在反導預警與空間目標監(jiān)視任務場景下均成立。
xijt=0 ?eij>θ, ?i,j,t
(9)
2.3.3容量約束
雷達同一時刻可探測的目標數(shù)量受限于裝備的探測容量,表現(xiàn)為預警監(jiān)視系統(tǒng)探測資源的飽和。該約束僅取決于雷達裝備性能,在反導預警與空間目標監(jiān)視任務場景下均成立。
2.3.4冗余約束
在預警監(jiān)視雷達組網(wǎng)探測過程中,多部雷達共同探測同一目標可通過融合手段有效提升協(xié)同探測整體效果,并增強系統(tǒng)的魯棒性,但過多的重復探測則會造成探測資源的浪費,形成目標占用冗余。通常認為2~3部雷達共同探測較為合理,多于3部雷達重復探測則屬于資源浪費,違背了充分利用跟蹤探測資源的初衷。該約束僅取決于提高資源利用率原則,在反導預警與空間目標監(jiān)視任務場景下均成立。
2.3.5連續(xù)性約束
在反導預警任務場景中,目標被劃分為多組團目標,團目標內(nèi)各目標間距離相近,區(qū)分難度大。為保證目標跟蹤的連續(xù)性,避免因雷達頻繁交接而帶來時空配準偏差,最終導致目標交叉匹配錯誤,因此在跟蹤探測目標過程中需要盡可能減少雷達間交接。當一個雷達資源被分配對目標i進行跟蹤探測,則自此時刻起,該雷達保持對目標i的持續(xù)探測,直至無法對目標i進行有效探測,不在中途向其他雷達交接。
在空間目標監(jiān)視任務場景中,目標獨立在軌運行,不存在團目標內(nèi)目標交叉匹配錯誤的問題,且目標運動遵循開普勒定律,軌跡相對穩(wěn)定,不受雷達交接頻次的限制。而雷達通過對空間目標飛行軌跡中一個弧段的跟蹤探測,多次取樣獲取不同時刻的目標位置信息,從而計算軌道參數(shù),取樣次數(shù)越多,定軌精度就越高。為滿足空間目標監(jiān)視定軌精度的要求,需要對每部雷達限制最小連續(xù)探測時長,用于生成有效監(jiān)視弧段。因此,雷達對目標的連續(xù)探測時長不得小于有效監(jiān)視弧段時長tmin[15]。
3.1 基礎算法概述
3.1.1模擬退火算法
模擬退火算法(simulated annealing,SA)是一種基于概率的隨機全局優(yōu)化算法,其基本思想源于對物理學中固體物質(zhì)冷卻退火過程的模擬。模擬退火過程中,處于高溫的固體物質(zhì)內(nèi)能極大,內(nèi)部分子呈無序運動,隨著溫度的降低,固體物質(zhì)逐漸冷卻,內(nèi)部分子的運動逐漸從無序化向有序化過渡,直到某一低溫時固體物質(zhì)內(nèi)能降至最小,達到相對穩(wěn)定的狀態(tài)。
模擬退火算法依據(jù)Metropolis準則以一定的概率接受較差的新解,能夠在解空間內(nèi)不斷概率性地跳出局部最優(yōu)解,具有較強的全局搜索能力[16]。
3.1.2粒子群算法
粒子群算法(particle swarm optimization,PSO)是一種基于群體智能的優(yōu)化算法,其基本原理源于對鳥群覓食行為的研究,以信息的社會共享為基礎,利用多個帶有記憶的粒子作為個體在空間中進行最優(yōu)解搜索。在搜索過程中,各粒子既保留自身向認知區(qū)域最優(yōu)解靠近的趨勢,又通過粒子之間的信息傳遞獲取群體的經(jīng)驗,在搜索空間中追隨最優(yōu)粒子,實現(xiàn)“和而不同”的粒子群搜索。
粒子群算法采用速度-位移的簡單模型,通過慣性因子對前次迭代的速度進行繼承,并通過學習因子在“自我認知”與“社會經(jīng)驗”間進行平衡,在保留自身認知的同時追隨最優(yōu)粒子,在每一步長搜索后,利用自身的記憶功能對個體最佳位置和群體最佳位置進行更新,逐次迭代更新直至搜索到全局最優(yōu)解[17]。
根據(jù)建立的雷達組網(wǎng)資源調(diào)度模型,將粒子群算法引入資源調(diào)度問題的求解,通過其與模型目標函數(shù)、約束條件的有機結合,并融合模擬退火算法的優(yōu)化思想,對算法適應度函數(shù)、編碼方式及執(zhí)行策略等進行改進,提出面向目標分配排序作業(yè)的模擬退火混合離散粒子群算法(improved simulated annealing &binary particle swarm optimization algorithm,ISABPSO),將雷達組網(wǎng)的目標分配排序作業(yè)方案視作粒子,每一種方案對應一個三維分配矩陣Xm*n*k。由此將問題轉(zhuǎn)化為離散空間的組合優(yōu)化問題,運用二進制離散粒子群算法,將模型目標函數(shù)直接作為適應度函數(shù),在眾多方案中搜索使適應度函數(shù)取得最大值的方案,即最優(yōu)解。
3.2.1編碼離散化
大量粒子在D維目標搜索空間中進行搜索,任一粒子c在空間中的位置可由D維位置矢量Xc表示,粒子單位步長移動的距離,即飛行速度可由D維速度Vc表示,粒子的優(yōu)劣程度可由適應度F(Xc)表示。每個粒子對應的三維分配矩陣Xm*n*k由m×n×k個元素xijt構成,取值為{0,1},每個元素代表一個維度??蓪⑷S分配矩陣Xm*n*k變換為一行m×n×k列的向量粒子,其中元素xijt按照i、j、t依次遞增遍歷的順序排列,如圖4所示。
圖4 粒子編碼結構
Xc=(xc1,xc2,…,xcD)
(14)
Vc=(vc1,vc2,…,vcD)
(15)
D=m×n×k
(16)
粒子在各維度的尋優(yōu)空間限定在0~1,即任一粒子c位置矢量在d維上的分量xcd取值為{0,1}。粒子在各維度的飛行速度可通過Sigmoid函數(shù)轉(zhuǎn)換為一個范圍[0,1]的概率選擇參數(shù)s,用于判定粒子在該維度移動后的位置矢量取值為0或1,使算法完成編碼離散化,適用于離散二進制空間。
3.2.2初始化粒子群
按照設定的群體規(guī)模M,隨機生成M個向量粒子,作為初始粒子群,其中每個粒子有D個元素,各元素在{0,1}中取值。資源調(diào)度問題求解的目的是在滿足充分利用探測資源的條件下,盡可能實現(xiàn)探測效益的最大化,原則上所有目標在整個作戰(zhàn)時間內(nèi)都會被3部雷達探測到。為了提高算法的求解效率,在構造初始粒子群中的每個粒子時,生成3×m×k個1元素,隨機放入一行m×n×k列的向量粒子中,其他各元素取值為0,使各粒子的適應度更接近于問題最優(yōu)解的最大適應度,以此加快收斂速度。
3.2.3極值更新
在每次迭代過程中,粒子(c)都以個體極值Pbest,c和全局極值Gbest等2個極值為目標來實現(xiàn)自我更新,并通過對比適應度存儲新的極值,經(jīng)歷多次迭代,最終得到適應度最大的最優(yōu)粒子。其中,個體極值Pbest,c為粒子自身搜索到的歷史最優(yōu)解,用以表示目前個體最佳位置,全局極值Gbest為整個粒子群搜索到的歷史最優(yōu)解,用以表示經(jīng)所有粒子搜索后的群體最佳位置。
Pbest,c=(pc1,pc2,…,pcD)
(18)
Gbest=(g1,g2,…,gD)
(19)
3.2.4粒子更新
在粒子更新過程中,運用完全型粒子群算法公式對粒子各維度的速度和位置進行更新。粒子在每一步長的運動中,均以追尋當前2個極值為目標,通過對自身速度和位置在各維度上的更新,實現(xiàn)迭代尋優(yōu)。
粒子c的d維速度更新公式為:
可見速度更新公式由慣性部分、認知部分、社會部分等3個部分組成。慣性部分通過慣性因子w控制粒子前次迭代速度對當前迭代速度的影響大小;認知部分通過自我學習因子c1調(diào)節(jié)粒子移動步長受自我影響因素的大小;社會部分通過群體學習因子c2調(diào)節(jié)粒子移動步長受群體影響因素的大小[18]。其中,學習因子c1和c2均不為0,避免出現(xiàn)“盲目從眾”或“盲目自大”的現(xiàn)象。式(22)中r1和r2均表示取值范圍[0,1]的隨機數(shù),用于增強算法的搜索隨機性。粒子在3個部分的共同作用下,綜合各影響因素以決定下一步的移動,如圖5所示,其中,灰色線條表示前次迭代速度對粒子的影響,藍色線條表示個體最佳位置對粒子的影響,紅色線條表示群體最佳位置對粒子的影響。粒子更新的速度變化范圍限定在[-vmax,d,vmax,d]內(nèi)。
圖5 粒子更新示意圖
在粒子速度得到更新后,通過對概率選擇參數(shù)s的判斷,完成粒子位置的更新。隨機產(chǎn)生一個0到1之間的隨機數(shù)ρ,若ρ小于此刻的Sigmoid函數(shù)值,則粒子位置矢量在該維度更新后取值為1,否則取值為0。
粒子c的d維位置更新公式為:
3.2.5模擬退火機制
針對二進制離散粒子群算法易陷入局部最優(yōu)的問題,在算法執(zhí)行過程中增加模擬退火機制,利用模擬退火算法在搜索過程中概率突跳的能力對其進行混合改進,增強其全局搜索能力。
根據(jù)初始粒子群中全局極值的適應度計算得出模擬退火機制的初始控制溫度T0,并設定降溫函數(shù)。
Tk+1=λTk
(25)
基于Metropolis準則,通過將個體極值Pbest,c和全局極值Gbest視作模擬退火的新解和舊解,計算各Pbest,c的退火適應度,用于確定接受較差新解的概率[19]。
運用輪盤賭選擇法,從所有個體極值Pbest,c中選取一個作為本次迭代的新解,用以替換全局極值Gbest舊解。通過對各Pbest,c的退火適應度依次累加,計算得到累積概率comfit(n),隨機產(chǎn)生一個0到1之間的隨機數(shù)pBet,使累積概率無限逼近它,選用滿足條件comfit(r-1) 在粒子更新后判定是否滿足終止條件,若滿足則輸出最優(yōu)解,否則通過降溫函數(shù)降低控制溫度后,在新的控制溫度Tk下,再次迭代搜索最優(yōu)解。 算法步驟如下。 步驟1將三維分配矩陣Xm*n*k中元素xijt按照i、j、t依次遞增遍歷的順序排列,進行m×n×k位的二進制編碼,并通過Sigmoid函數(shù)將粒子速度轉(zhuǎn)換為用于判定的概率選擇參數(shù)s,使粒子的位置更新適應二進制編碼,完成離散化處理。 步驟4根據(jù)全局極值的適應度計算得到模擬退火過程的初始控制溫度T0。 步驟5基于Metropolis準則,計算當前溫度下各粒子個體極值的退火適應度。 步驟6通過對各粒子個體極值的退火適應度依次累加,計算得到累積概率comfit(n),運用輪盤賭選擇法,依累積概率從所有粒子個體極值中選取一個替換速度更新公式中的全局極值。 步驟7通過粒子的速度和位置更新公式對粒子進行更新。 步驟8粒子更新后依據(jù)約束條件對其進行判定,若不滿足約束條件需進行群體修正后轉(zhuǎn)入后續(xù)步驟。 步驟9通過對比各粒子與其個體極值的適應度,更新個體極值,通過對比全局所有粒子個體極值的適應度,更新全局極值。 步驟10判定是否滿足終止條件,若目標函數(shù)值收斂或達到最大迭代次數(shù),則對當前全局極值進行解碼,輸出最優(yōu)目標分配排序作業(yè)方案,否則依降溫函數(shù)進行退火操作后返回步驟5。 算法的流程圖如圖6所示。 圖6 ISABPSO算法流程 選用計算時間、資源節(jié)省率和算法合格率作為評價指標,通過與枚舉法對比以驗證算法的可靠性與先進性。其中,計算時間是指在設定的計算機配置條件下,算法從開始運行直至結束所消耗的時間;資源節(jié)省率是指在滿足任務要求情況下空閑單位探測資源數(shù)量占總探測資源數(shù)量的比例;算法合格率是指蒙特卡洛實驗環(huán)境下超過設定目標函數(shù)合格線(最大值的90%)的實驗次數(shù)占總實驗次數(shù)的比例。 構建一個空間目標監(jiān)視任務仿真實例:4部雷達裝備(如表2所示)組成預警監(jiān)視雷達組網(wǎng),在15個單位作戰(zhàn)時間內(nèi)對16個價值等級不同的空間目標(如表3所示)進行協(xié)同探測。設定有效監(jiān)視弧段時長tmin為3個單位作戰(zhàn)時間;各目標進入和飛出雷達探測范圍的時刻tij0、tijs以及各雷達截獲目標時的波束指向角eij如表4所示。 表2 雷達裝備指標 表3 空間目標價值等級 表4 目標進出雷達探測范圍時刻及截獲時波束指向角 以仿真實例為背景,在2.8 GHz Intel Core i7處理器和8G內(nèi)存的計算機配置條件下進行計算,分別用枚舉法(ENUM)和ISABPSO算法求解,ISABPSO算法參數(shù)取值如表5所示。 表5 ISABPSO算法參數(shù)取值 2種方法下目標函數(shù)曲線分別如圖7和圖8所示,ENUM算法中目標函數(shù)在循環(huán)800次時取得最大值0.726 57;而ISABPSO算法中目標函數(shù)僅在迭代70次時取得最大值0.7873。以甘特圖形式表示ISABPSO算法下的最優(yōu)目標分配排序作業(yè)方案,如圖9所示,并記錄2種方法下的評價指標數(shù)值,如表6所示。 表6 ISABPSO算法與ENUM算法對比 圖7 ENUM算法目標函數(shù)曲線 圖8 ISABPSO算法目標函數(shù)曲線 圖9 最優(yōu)目標分配排序作業(yè)方案甘特圖 本研究創(chuàng)造性地提出“預警任務+監(jiān)視任務”的研究思路,將層次分析法和人工智能算法引入預警監(jiān)視雷達組網(wǎng)資源調(diào)度,面向預警與監(jiān)視任務場景構建資源調(diào)度模型,在模擬退火算法和粒子群算法的基礎上提出了ISABPSO算法,對預警監(jiān)視任務中的雷達組網(wǎng)資源調(diào)度問題進行求解。根據(jù)仿真實驗可得出以下結論: 1) ISABPSO算法有效提高了求解方法的運算速度。 2) ISABPSO算法有效提高了資源調(diào)度方案的資源利用率。 3) ISABPSO算法有效提高了求解方法的魯棒性。 綜上所述,運用ISABPSO算法,可通過更具優(yōu)勢的智能手段解決預警監(jiān)視任務中的雷達組網(wǎng)資源調(diào)度問題,探索了一條開展預警監(jiān)視系統(tǒng)資源調(diào)度研究的新途徑、新思路,能夠在一定程度上為預警監(jiān)視領域研究學者和裝備操控技術人員開展后續(xù)研究提供幫助。3.3 算法流程
4 仿真驗證
5 結論