李志匯,劉昌云,王 剛
(空軍工程大學防空反導學院,西安 710051)
多目標傳感器協(xié)同探測的資源優(yōu)化問題*
李志匯,劉昌云,王 剛
(空軍工程大學防空反導學院,西安 710051)
針對反導作戰(zhàn)傳感器任務規(guī)劃問題,提出了一種對多目標任務分解的傳感器協(xié)同探測任務規(guī)劃方法。首先將整個預警任務分解為元任務,并以分解的元任務為核心,建立基于元任務的任務規(guī)劃模型,在此基礎上,以探測收益為代價函數(shù),分析任務規(guī)劃模型及算法流程。仿真結果表明,該方法不僅保持了較高的元任務加權探測收益值,而且能夠給出較為合理的任務規(guī)劃方案。
傳感器協(xié)同,任務分解,探測收益,任務規(guī)劃
彈道導彈具有攻擊距離遠、目標雷達散射面積小、飛行速度快、命中精度高、靈活性強等突出特點,單個傳感器只能提供導彈飛行某一階段的信息,不能滿足上主動段、中段或再入段的全程指揮和攔截的要求[1]。對彈道導彈的預警探測需要建立在多階段、多手段、多特征的基礎之上,這就需要傳感器之間相互協(xié)同,從而實現(xiàn)彈道目標的多層次合理預警探測。
多傳感器間的協(xié)同主要屬于任務規(guī)劃范疇,是當前的研究重點和難點,并且多傳感器動態(tài)任務規(guī)劃技術是反導作戰(zhàn)管理的關鍵技術之一[2]。在傳感器任務規(guī)劃的實現(xiàn)方法中,文獻[3]提出了適應反導作戰(zhàn)需求的傳感器任務規(guī)劃體系架構,并深入分析了體系架構中各類agent的主要功能,為反導作戰(zhàn)傳感器任務規(guī)劃技術提供了一種高效率、智能化的方法。文獻[4]綜合考慮了任務的優(yōu)先級和傳感器的使用代價,建立了任務需求驅動下的傳感器管理模型,通過與持續(xù)量測更新策略對比仿真表明,在保證跟蹤精度的條件下能夠把傳感器資源合理地分配給目標,同時有效減少了傳感器的工作時間,但該方法并不一定適應反導作戰(zhàn)條件下。文獻[5]建立了末段雙層反導火力-目標分配模型,并將匹配優(yōu)化任務進行分解,采用了改進粒子群優(yōu)化算法進行求解,算法具有高實效性,但該方法是末段反導下的火力-目標分配,并不一定適應傳感器的任務規(guī)劃。
在相控陣雷達資源調度方面,文獻[6-7]中利用修正的EDF算法用于空間目標監(jiān)視任務調度,在資源平衡性、任務完成率等方面都取得了良好的效果;文獻[8]針對相控陣雷達同時多任務在時間窗約束下實時優(yōu)化調度問題,在綜合考慮調度時刻前后任務請求、調度限制和可用資源等因素基礎上,提出了一種利用任務綜合規(guī)劃的相控陣自適應調度算法。上述算法分別針對預警探測系統(tǒng)中的某一個傳感器節(jié)點內部單獨進行分析的,而在指揮控制、作戰(zhàn)管理與通信(Command and Control,Battle Managementand Communications,C2BMC)系統(tǒng)中,把傳感器作為一個任務節(jié)點來進行任務的安排,屬于傳感器外部的任務規(guī)劃范疇,因而上述算法就很難適應反導預警探測系統(tǒng)整體的任務規(guī)劃。本文基于彈道導彈目標軌跡可預測性的這一條件,采用任務分解的方法將多傳感器的整個預警協(xié)同任務分解為元任務,并結合相控陣雷達實時系統(tǒng)調度理論,提出了一種基于任務分解的傳感器協(xié)同探測任務規(guī)劃算法,在滿足任務規(guī)劃高探測效益的基礎上,兼顧了任務規(guī)劃的實時性需求。
根據(jù)預警探測系統(tǒng)中裝備的特點,傳感器對目標的協(xié)同探測任務與時間是緊密對應的,因此,綜合考慮復雜的時間和空間模型,從時間的角度進行傳感器任務規(guī)劃,傳感器與目標的對應關系如圖1所示。
圖1 傳感器與目標的對應關系
傳感器與目標的可視化時間段是指從目標進入傳感器的作用范圍開始到離開傳感器的作用范圍為止的時間段。由于已知傳感器的基本性能和作用范圍,在暫不考慮傳感器資源的約束條件下,可以計算得到目標在傳感器作用范圍內的可視化時間段:,其中表示目標進入傳感器作用范圍的時間點,表示目標離開傳感器作用范圍的時間點,可視化時間段的長度為dij=-。
傳感器與目標對應的探測時間段是指在傳感器與目標的可視化時間段內,傳感器對目標從開始執(zhí)行探測的時間點到結束執(zhí)行探測的時間點,即。
在C2BMC中,需要解決多傳感器對多目標的協(xié)同探測問題,而由于彈道目標的特殊性,目標彈道與傳感器之間存在復雜的時域/空域對應關系,利用任務分解的方法[9-11],對多傳感器多目標的協(xié)同探測任務進行任務分解,把多屬性決策的任務決策分解為一個個元任務。
進行任務分解時,要滿足以下約束條件:
①元任務的時間段長度不能太長,保證任務執(zhí)行的靈活性,防止某一元任務長期占用關鍵的傳感器資源,假設元任務的最長時間短為Dmax;
②元任務的時間段長度不能太短,保證在此時間段內至少能完成對目標軌跡的預測,同時避免傳感器之間頻繁的交接,假設元任務的最短時間段為Dmin。
根據(jù)以上約束,對多個目標進行任務分解如圖1所示。
圖2 任務分解過程
任務分解的詳細步驟為(Dmin取10s,Dmax取20s):
步驟1:計算所有傳感器與目標之間的可視化時間段;
步驟2:找出所有可視化時間段的開始時刻和結束時刻,同時根據(jù)時間把這些時刻按照從小到大的順序排列,然后從前往后兩兩時刻之間組成一個時間段,從而將整個任務分解為時間段上的元任務集;
步驟3:根據(jù)約束①,從元任務集中篩選出長度大于Dmax的所有時間段,繼續(xù)對它們進行均勻拆分,保證時間段長度在區(qū)間[Dmin,Dmax]內;
步驟4:根據(jù)約束②,對步驟3得到時間段進行篩選,將時間段長度小于Dmin的元任務從元任務集中刪除。
協(xié)同任務經(jīng)過任務分解,對整個任務的執(zhí)行就轉化為對每個元任務的執(zhí)行。在每個元任務對應的時間段內,傳感器與目標存在著兩種關系:目標是否在傳感器的可視化時間段內;如果目標在傳感器的可視化時間段內,傳感器是否執(zhí)行對目標進行探測。
根據(jù)上述分析建立了元任務任務規(guī)劃模型。假設有m個傳感器平臺,第i個傳感器的目標容量為Bi,有n個來襲目標,wj為目標j的威脅度,這里目標威脅度是指根據(jù)影響目標威脅程度的主要因素運用威脅評估的方法[12],對多個目標的威脅進行排序,得到反映目標威脅大小的指標,pij為傳感器i對目標j的探測有利度,pij=dij/max(dij),其中max(dij)為所有傳感器對目標可視化時間段長度的最大值。
對預警任務進行任務分解,得到t個元任務,即元任務集合為 T={T1,T2,T3,…,Tt},第 k 個元任務所處的時間段為[tk1,tk2]。
①決策變量
在時間段[tk1,tk2]內,已知條件:目標 j在傳感器i的可視化時間段內,xijk=1,否則,xijk=0;未知條件:傳感器i對目標j執(zhí)行探測,yijk=1,否則,yijk=0。
②目標函數(shù)
元任務進行任務規(guī)劃的目標是使其加權探測收益Wk達到最大,即:
根據(jù)目標的威脅度等條件,對目標的優(yōu)先級進行排序,威脅度越大,優(yōu)先級就越高,目標越優(yōu)先被探測;傳感器與目標的可視化時間段越長,對目標的探測越有利。綜合考慮目標的威脅度和探測有利度,給出傳感器i對目標j的探測收益值,其中λ為權重系數(shù),事先量化給定,為前k-1個元任務對第k個元任務的探測收益補償,γl為補償系數(shù)。
③約束條件
資源約束:第i個傳感器預留目標容量為Sik,則資源約束滿足:
可行性約束:目標在傳感器的可視化時間段內,傳感器才能夠對目標進行探測,即:
假設條件:系統(tǒng)時間為tp,i表示元任務的序號,j表示系統(tǒng)進行任務分解的次數(shù),T為任務重分解周期,用元任務的個數(shù)來表示,Q表示對新目標探測任務的指示,Q=0表示沒有新目標到達,Q=1表示有新目標到達。
初始化:根據(jù)目標的預測軌跡計算得到各傳感器與各目標對應的可視化時間段,根據(jù)任務分解方法對當前時刻預警任務進行分解,令j=1,得到Nj個按時間先后順序排列的元任務,并存入等待執(zhí)行任務鏈表。根據(jù)元任務的任務規(guī)劃模型求解第一個元任務的最優(yōu)解。
步驟1:令i=1,tp=t11,表示系統(tǒng)時間與第一個元任務的開始時間對準。
步驟2:將第i個元任務轉移到正在執(zhí)行任務鏈表,根據(jù)求得的最優(yōu)解即各傳感器與目標之間的探測時間段執(zhí)行第i個元任務,同時tp按照標準時間逐漸增加。
步驟3:如果tp>ti2,則將第i個元任務轉移到已經(jīng)執(zhí)行任務鏈表,執(zhí)行步驟4;否則返回步驟2。
步驟4:根據(jù)元任務的任務規(guī)劃模型求解第i+1個元任務的最優(yōu)解,判斷是否滿足條件:Q=1或者i>T。如果滿足,清空等待執(zhí)行任務鏈表,令i=1,j=j+1,則執(zhí)行步驟5;否則執(zhí)行步驟6。
步驟5:對當前時刻預警任務進行任務重分解,得到Nj個按時間先后順序排列的元任務并存入等待執(zhí)行任務鏈表,根據(jù)元任務的任務規(guī)劃模型求解第一個元任務的最優(yōu)解,執(zhí)行步驟1。
步驟 6:i=i+1,如果 i≤Nj+1,則返回步驟 2,否則,執(zhí)行步驟7。
步驟7:任務執(zhí)行完畢。
仿真想定采用2顆低軌衛(wèi)星和3部地基雷達組成預警系統(tǒng),其中2顆低軌衛(wèi)星凝視型紅外傳感器的目標容量為2個,3部地基雷達的目標容量分別為4個、6個和4個。假設初始情況下有3個來襲戰(zhàn)術彈道導彈(Tactical Ballistic Missile,TBM)目標,其目標威脅度分別為 0.962、0.683、0.412,160 s后預警系統(tǒng)又探測到有2個新TBM目標其威脅度分別為0.864和0.635,λ取0.8,γl=0.001/(2k-(l+1))。根據(jù)彈道預測算法和各傳感器空間位置計算得到各傳感器與目標的可視化時間段如表1所示,Dmax取20 s,Dmin取10 s。
表1 傳感器對TBM的可視化時間段
根據(jù)本文任務分解方法和任務規(guī)劃算法思想,對該任務分解,得到16個元任務,新目標到達前的每個元任務對應的時間段分別為:[160,173]、[173,189]、[196,215]、[215,234]、[234,253]、[262,278]、[278,294]、[294,311]、[311,326]。進行一次任務重分解后每個元任務對應的時間段分別 為 :[326,336]、[336,353]、[353,370]、[370,387]、[387,404]、[410,428]、[428,446]、[446,464]、[464,482]、[482,499]、[504,519]、[519,534]、[542,562]、[562,579]、[579,595]、[595,609]。
計算得到新目標到達前和到達后傳感器對目標的探測有利度如表2所示。
表2 傳感器對TBM的探測有利度
在每個元任務對應的時間段內,根據(jù)元任務規(guī)劃模型,并將對每個元任務求得的結果在時間段上進行聚合,計算出了每個傳感器與目標的探測時間段,即最優(yōu)的任務規(guī)劃方案,結果如圖3所示,指控中心即可根據(jù)此方案執(zhí)行對傳感器的調度。同時每個元任務的最大加權探測收益值如圖4所示。
圖3 傳感器最優(yōu)任務規(guī)劃方案
圖4 元任務最大加權探測收益值
從圖4可以看出,在傳感器資源較為充足時,元任務的最大加權探測收益值相對較大,反之,元任務的最大加權探測收益值嚴重惡化。通過執(zhí)行任務重分解,既達到了完成對新到來的目標進行及時探測,又在一定時間范圍[196,534]內保持了元任務的最大加權探測收益值不因為新目標的到達而突然降低。
傳感器協(xié)同探測的目的是在有限的傳感器資源下,以任務需求為目標充分利用傳感器資源來實現(xiàn)對目標的探測。本文針對反導作戰(zhàn)條件下的傳感器協(xié)同問題,對預警任務進行分解,建立了基于元任務的任務規(guī)劃模型,并設計了傳感器協(xié)同任務規(guī)劃算法流程,能夠在有限時間內保持最大加權探測收益值和設計出較為合理的任務規(guī)劃方案。
本文以傳感器協(xié)同探測的資源優(yōu)化問題為研究重點,但協(xié)同探測問題還涉及到傳感器對目標的探測精度、多傳感器組網(wǎng)和數(shù)據(jù)融合等方面的問題。進一步的研究工作為:①考慮傳感器對目標的探測精度;②考慮盡可能的減少傳感器之間的交接次數(shù),提高系統(tǒng)的穩(wěn)定性;③考慮多傳感器組網(wǎng)條件下的多目標多傳感器協(xié)同探測。
[1]李旭東.彈道導彈預警信息處理系統(tǒng)研究[J].現(xiàn)代雷達,2011,33(5):17-20.
[2]王剛,王明宇,楊少春,等.反導作戰(zhàn)管理技術研究[J].現(xiàn)代防御技術,2012,40(1):26-30.
[3]吳林鋒,王剛,劉昌云,等.基于多智能體的反導傳感器任務規(guī)劃算法[J].現(xiàn)代防御技術,2012,40(3):88-93.
[4]王琳,于雷,寇英信,等.以任務需求為驅動的多傳感器資源管理方法[J].系統(tǒng)工程與電子技術,2010,32(9):1925-1930.
[5]李龍躍,劉付顯,梅穎穎.末段反TBM火力-目標匹配優(yōu)化及APSO求解算法[J].系統(tǒng)工程與電子技術,2013,35(5):993-999.
[6]盧建斌.相控陣雷達資源優(yōu)化資源的理論和方法[D].長沙:國防科學技術大學,2007.
[7]盧建斌,胡衛(wèi)東,郁文賢.空間探測相控陣雷達系統(tǒng)中的任務規(guī)劃算法[J].系統(tǒng)工程與電子技術,2007,29(10):1631-1634.
[8]鄭世友,鄭瑤.基于任務綜合規(guī)劃的相控陣自適應調度方法[J].計算機仿真,2013,30(7):11-16.
[9]馮明月,李國輝,易先清.一種基于任務的預警衛(wèi)星傳感器規(guī)則調度方法 [J].計算機應用,2007,27(12):3095-3098.
[10]馮明月,李國輝,易先清.天基預警系統(tǒng)傳感器調度方法[J].計算機工程與應用,2009,45(2):225-228.
[11]杜占帥,易先清.天基預警系統(tǒng)資源調度方法[J].火力與指揮控制,2009,34(7):32-36.
[12]王昌金,張永輝,黃彬.灰色模糊物元分析的要地防空威脅評估[J].火力與指揮控制,2013,38(8):47-54.
Problem of ResourceOptim ization in M ulti-target Sensor CooperativeDetection
LIZhi-hui,LIUChang-yun,WANGGang
(School of Air and Missile Defense,Air Force Engineering University,Xi’an 710051,China)
In allusion to the task programming problem for sensor cooperative in antiballistic missile operation,a task programming method of sensor cooperative detection for multiple targets task decomposition is presented.Firstly,it decomposes the early warning tasks into many sub tasks.Then the sub task programmingmodel is established at the core of decomposed sub tasks.Furthermore a task programming model and process based on detection gains is analyzed.Experimental results show that thismethod not only canmaintain a high sub task weighed detection gains,but can obtain a reasonable task programming scheme.
sensorscooperative,task decomposition,detection gains,task programming
E917;TP212
A
1002-0640(2015)11-0001-04
2014-10-08
2014-11-07
國家自然科學基金資助項目(61102109)
李志匯(1991- ),男,河南周口人,碩士研究生。研究方向:反導作戰(zhàn)傳感器管理技術。