張哲璇,龍騰,*,徐廣通,王仰杰
1. 北京理工大學(xué) 宇航學(xué)院,北京 100081 2. 北京理工大學(xué) 飛行器動力學(xué)與控制教育部重點(diǎn)實(shí)驗(yàn)室,北京 100081
多無人機(jī)協(xié)同能夠遂行軍事和民事領(lǐng)域多項(xiàng)任務(wù),包括區(qū)域偵察、搜索救援、地形勘察等,相比于單機(jī)具有更高的任務(wù)執(zhí)行效率與容錯(cuò)性[1],已成為無人機(jī)發(fā)展的必然趨勢。多無人機(jī)協(xié)同搜索是利用無人機(jī)攜帶傳感器偵察任務(wù)區(qū)域,并使用通信網(wǎng)絡(luò)共享探測信息,實(shí)現(xiàn)對目標(biāo)的捕獲。協(xié)同搜索規(guī)劃是引導(dǎo)多無人機(jī)高效執(zhí)行目標(biāo)捕獲任務(wù)的關(guān)鍵技術(shù)之一,已經(jīng)得到了廣泛的研究[2]。為保證協(xié)同搜索效能,便于無人機(jī)認(rèn)知當(dāng)前環(huán)境信息并根據(jù)探測信息合理規(guī)劃搜索路徑,需要進(jìn)行合理的搜索環(huán)境建模并設(shè)計(jì)高效的協(xié)同搜索規(guī)劃方法。
在搜索環(huán)境建模方面,主要通過概率圖模型描述環(huán)境信息。概率圖模型是一種用圖形模式描述基于概率相關(guān)模型的總稱[3],概率圖模型利用圖論的思想建立問題模型,利用概率論的思想更新模型,能夠有效描述不確定環(huán)境信息,并反映任務(wù)環(huán)境態(tài)勢變化[4]。概率圖模型包括貝葉斯網(wǎng)絡(luò)[5]、馬爾科夫模型[6]、譜系圖[7]等。相比于其他模型,基于貝葉斯網(wǎng)絡(luò)的概率圖模型能夠更加清晰地描述數(shù)據(jù)間的關(guān)系,充分結(jié)合先驗(yàn)信息與樣本信息反映全局模型信息,因此本文使用貝葉斯網(wǎng)絡(luò)建立不確定環(huán)境模型。
多無人機(jī)協(xié)同搜索規(guī)劃方法主要包括光柵式搜索[8]、區(qū)域分割搜索方法[9-10]、搜索決策方法[11]等。其中,光柵式搜索與區(qū)域分割搜索等遍歷式搜索方法具有簡單、區(qū)域覆蓋率高等優(yōu)點(diǎn),但難以高效求解灰色區(qū)域協(xié)同搜索問題[12]。基于搜索信息圖的搜索決策方法因其能夠考慮目標(biāo)先驗(yàn)信息,重點(diǎn)搜索目標(biāo)存在可能性大的區(qū)域,在灰色區(qū)域協(xié)同高效搜索問題方面得到了廣泛研究與應(yīng)用。文獻(xiàn)[13]提出一種基于分布式模型預(yù)測控制(DMPC)的多無人機(jī)搜索規(guī)劃方法,在環(huán)境搜索信息圖的基礎(chǔ)上,將集中式多無人機(jī)優(yōu)化決策問題轉(zhuǎn)化為小規(guī)模分布式優(yōu)化問題,提高了多無人機(jī)協(xié)同搜索效率。文獻(xiàn)[14-15]提出了一種基于分布式蟻群優(yōu)化的協(xié)同搜索規(guī)劃方法,通過信息素圖描述環(huán)境信息,基于滾動時(shí)域求解架構(gòu)提高多無人機(jī)搜索航跡求解效率,同時(shí)考慮無人機(jī)飛行范圍約束與環(huán)境障礙,設(shè)計(jì)狀態(tài)轉(zhuǎn)移準(zhǔn)則,引導(dǎo)無人機(jī)安全高效執(zhí)行搜索打擊任務(wù)。田菁等[16]提出一種模型預(yù)測控制(MPC)與遺傳算法(GA)結(jié)合的多無人機(jī)協(xié)同搜索算法,建立環(huán)境搜索信息圖,使用貝葉斯準(zhǔn)則更新環(huán)境信息,并將航跡收益作為優(yōu)化目標(biāo),基于滾動求解架構(gòu)高效獲取多無人機(jī)協(xié)同搜索航跡。劉重等[17]提出一種帶信息素回訪機(jī)制的多無人機(jī)分布式協(xié)同目標(biāo)搜索方法。通過建立環(huán)境信息素地圖描述環(huán)境信息,并利用信息素“釋放-傳播-揮發(fā)”的特性,設(shè)計(jì)基于信息素的網(wǎng)格回訪機(jī)制,引導(dǎo)無人機(jī)回訪重點(diǎn)區(qū)域,提高了無人機(jī)協(xié)同搜索效率。上述工作主要圍繞靜態(tài)目標(biāo)協(xié)同搜索問題展開研究,難以處理考慮移動目標(biāo)的協(xié)同搜索規(guī)劃問題。
針對移動目標(biāo)協(xié)同搜索規(guī)劃問題,Sun和Liu[18]提出一種基于擴(kuò)散加權(quán)不確定模型的移動目標(biāo)協(xié)同搜索方法,通過為各無人機(jī)分配搜索區(qū)域,協(xié)調(diào)各無人機(jī)之間的搜索航跡,使用基于滾動時(shí)域規(guī)劃的電勢場算法高效求解各無人機(jī)搜索航跡。但是,該方法僅能夠搜索單一移動目標(biāo)。文獻(xiàn)[19]提出針對動態(tài)目標(biāo)的協(xié)同搜索方法,使用馬爾科夫鏈表征目標(biāo)隱潛運(yùn)動,并預(yù)測目標(biāo)位置,在分布式模型預(yù)測控制的基礎(chǔ)上使用貪婪迭代算法求解無人機(jī)協(xié)同搜索航跡。該方法通過預(yù)測目標(biāo)位置,提高無人機(jī)對移動目標(biāo)的捕獲能力,但是難以求解目標(biāo)初始位置分布未知的灰色區(qū)域協(xié)同搜索問題,而且未考慮傳感器虛警導(dǎo)致的目標(biāo)誤判問題。
本文針對執(zhí)行任務(wù)時(shí)間受限的灰色區(qū)域移動目標(biāo)協(xié)同搜索問題,考慮傳感器探測概率與虛警概率,提出一種重訪機(jī)制驅(qū)動的多無人機(jī)協(xié)同搜索規(guī)劃(Revisit Mechanism Driven Cooperative Search Planning, RMD-CSP)方法。以無人機(jī)飛行性能為約束,以協(xié)同搜索效能為目標(biāo)函數(shù)建立多無人機(jī)協(xié)同搜索模型。構(gòu)建任務(wù)區(qū)域搜索信息圖,描述搜索環(huán)境信息,并使用貝葉斯準(zhǔn)則更新搜索信息圖。為減少由于傳感器探測概率與虛警概率造成的目標(biāo)遺漏與誤判,定制重訪機(jī)制,在搜索過程中引導(dǎo)無人機(jī)側(cè)重搜索長時(shí)間未重訪與發(fā)現(xiàn)新的疑似目標(biāo)的重點(diǎn)區(qū)域。在此基礎(chǔ)上,使用滾動時(shí)域規(guī)劃方法高效求解各無人機(jī)搜索航跡。最后通過數(shù)值仿真對所提方法的有效性進(jìn)行驗(yàn)證。
針對灰色任務(wù)區(qū)域內(nèi)存在的多個(gè)移動目標(biāo)(指揮車、發(fā)射車、雷達(dá)車等),通過衛(wèi)星偵察、雷達(dá)探測等情報(bào)偵察手段獲取部分?jǐn)撤綉?zhàn)場信息作為初始先驗(yàn)信息。由于先驗(yàn)信息可能存在一定誤差,同時(shí)目標(biāo)的移動導(dǎo)致任務(wù)區(qū)域先驗(yàn)信息的可信度進(jìn)一步降低,因此指派多架無人機(jī)進(jìn)入任務(wù)區(qū)域,利用攜帶傳感器(紅外、可見光設(shè)備)進(jìn)行偵察,獲取任務(wù)區(qū)域的目標(biāo)信息。
圖1為多無人機(jī)協(xié)同搜索典型任務(wù)想定。任務(wù)區(qū)域中存在若干雷達(dá)車、導(dǎo)彈發(fā)射車等移動目標(biāo),指派4架無人機(jī)執(zhí)行目標(biāo)搜索任務(wù),重點(diǎn)探測目標(biāo)存在概率高的區(qū)域。由于傳感器存在一定的虛警概率,無人機(jī)在首次發(fā)現(xiàn)疑似目標(biāo)后,需要再次訪問該位置,對疑似目標(biāo)進(jìn)行再次確認(rèn),圖中“□”表示無人機(jī)捕獲的目標(biāo)。
圖1 多無人機(jī)協(xié)同搜索任務(wù)示意圖Fig.1 Multi-UAV cooperative search mission
本文將無人機(jī)當(dāng)作空間中的質(zhì)點(diǎn),僅考慮無人機(jī)的平動運(yùn)動。將矩形任務(wù)區(qū)域劃分為Lx×Wy個(gè)離散網(wǎng)格C,將每個(gè)網(wǎng)格標(biāo)記為Cxy(x=1,2,…,Lx;y=1,2,…,Wy),將無人機(jī)的運(yùn)動范圍離散化處理[20],假設(shè)無人機(jī)每次移動步長為一個(gè)網(wǎng)格,無人機(jī)移動步長大于無人機(jī)最小航跡段約束,θ為無人機(jī)最大轉(zhuǎn)彎角。通過限制航跡的最大轉(zhuǎn)彎角與最小航跡段長度來滿足無人機(jī)法向過載約束,從而保證規(guī)劃航跡的可飛性。無人機(jī)在每個(gè)時(shí)刻有8種可能的運(yùn)動方向,如圖2所示。
圖2 無人機(jī)運(yùn)動方向離散化示意圖Fig.2 Diagram of UAV flight direction discretization
無人機(jī)在搜索過程中,根據(jù)傳感器探測信息不斷更新目標(biāo)存在概率。由于傳感器測量的不確定性與環(huán)境遮擋等因素,可能出現(xiàn)目標(biāo)遺漏或誤判的情況。假設(shè)無人機(jī)傳感器探測概率為PD∈[0,1],表示目標(biāo)存在的情況下,傳感器探測到目標(biāo)的概率;虛警概率為PF∈[0,1],表示目標(biāo)不存在的情況下,傳感器探測到目標(biāo)的概率。
考慮無人機(jī)飛行性能約束與無人機(jī)機(jī)間避碰約束,以最大化任務(wù)執(zhí)行效能為性能指標(biāo),建立多無人機(jī)協(xié)同搜索問題模型如下:
(1)
Ui(t)∩Uj(t)=? ?j=1,2,…,NU;j≠i
(2)
Ui(t)∈F
(3)
1) 目標(biāo)搜索收益JS
目標(biāo)搜索收益表示無人機(jī)搜索過程中捕獲目標(biāo)的可能性,即無人機(jī)搜索過程中能夠探測到的目標(biāo)存在概率之和,即
(4)
(5)
其中:ζ(x,y,t)=1表示網(wǎng)格Cxy處存在目標(biāo),ζ(x,y,t)=0表示網(wǎng)格Cxy處不存在目標(biāo);δP為目標(biāo)存在閾值。
2) 環(huán)境搜索效益JE
環(huán)境搜索收益JE表示無人機(jī)搜索過程中,環(huán)境不確定度的減少量,如式(6)所示。該子目標(biāo)通過增加無人機(jī)對不確定度較高區(qū)域的搜索力度,降低搜索過程中遺漏目標(biāo)的情況。
(6)
3) 期望探測收益JD
為了盡可能引導(dǎo)無人機(jī)探測不確定度與目標(biāo)存在概率較大的區(qū)域,設(shè)置期望探測收益,使無人機(jī)在執(zhí)行后續(xù)任務(wù)時(shí)能夠保證較大的探測收益,子目標(biāo)JD的描述為
(7)
4) 協(xié)同收益JC
為提高多無人機(jī)協(xié)同搜索效率,減少各無人機(jī)航跡的重合,將協(xié)同收益定義為無人機(jī)環(huán)境搜索狀態(tài)o(x,y,t)的函數(shù)(詳見2.3節(jié)),具體描述為
(8)
圖3 無人機(jī)搜索區(qū)域示意圖Fig.3 UAV search region
(9)
式中:vn為目標(biāo)概率峰值寬度;cn為目標(biāo)存在概率峰值。
無人機(jī)在執(zhí)行搜索任務(wù)過程中,根據(jù)自身傳感器的探測信息動態(tài)更新任務(wù)區(qū)域目標(biāo)存在概率p(x,y,t)??紤]傳感器探測概率與虛警概率,使用貝葉斯準(zhǔn)則更新目標(biāo)存在概率,具體描述如下[23]:
1) 當(dāng)b(x,y,t)=1時(shí)
p(x,y,t)-p(x,y,t-1)=
(10)
2) 當(dāng)b(x,y,t)=0時(shí)
p(x,y,t)-p(x,y,t-1)=
(11)
式中:b∈{0,1}為傳感器探測信息,b=1表示傳感器探測到目標(biāo),b=0表示傳感器未探測到目標(biāo)。
-p(x,y,t)log2p(x,y,t)-(1-p(x,y,t))·
log2(1-p(x,y,t))
(12)
隨著無人機(jī)對任務(wù)環(huán)境的搜索,網(wǎng)格被探測次數(shù)不斷增加,環(huán)境不確定度不斷減小,具體更新方式為
(13)
式中:η∈[0,1]為環(huán)境不確定度衰減因子[25];m為同時(shí)搜索當(dāng)前網(wǎng)格的無人機(jī)數(shù)量。
環(huán)境搜索狀態(tài)圖o(x,y,t)∈{0,1}表征t時(shí)刻網(wǎng)格Cxy是否被無人機(jī)搜索。o(x,y,t)=0表示網(wǎng)格Cxy未被無人機(jī)搜索,o(x,y,t)=1表示已有無人機(jī)搜索網(wǎng)格Cxy。無人機(jī)搜索過程中,根據(jù)無人機(jī)對各網(wǎng)格的探測情況更新環(huán)境搜索狀態(tài)圖。
本節(jié)提出重訪機(jī)制驅(qū)動的協(xié)同搜索規(guī)劃(RMD-CSP)方法,定制基于環(huán)境不確定度圖更新的重訪機(jī)制與基于目標(biāo)權(quán)重系數(shù)更新的重訪機(jī)制,通過滾動規(guī)劃,高效獲取協(xié)同搜索航跡。
為提高多無人機(jī)協(xié)同搜索規(guī)劃問題求解效率,基于滾動時(shí)域控制思想[26],將大規(guī)模搜索規(guī)劃問題轉(zhuǎn)化為一系列短時(shí)域規(guī)劃問題,建立多無人機(jī)協(xié)同搜索滾動規(guī)劃模型,如式(14)所示。在每個(gè)決策時(shí)刻tp,使用貪婪算法[27]求解規(guī)劃時(shí)域[tp,tp+Tp]內(nèi)的最優(yōu)搜索航跡,p=1,2,…,M。無人機(jī)按照執(zhí)行時(shí)域內(nèi)航跡不斷探測目標(biāo),并根據(jù)傳感器探測結(jié)果更新環(huán)境信息,以引導(dǎo)無人機(jī)快速捕獲移動目標(biāo)。
s.t.t∈[tp,tp+Tp],i=1,2,…,NU
Eqs. (2)and(3)
(14)
式中:tp為滾動規(guī)劃時(shí)刻;Tp為規(guī)劃時(shí)域長度。
滾動規(guī)劃過程如圖4所示,假設(shè)當(dāng)前時(shí)刻為tp,無人機(jī)規(guī)劃時(shí)域[tp,tp+Tp]內(nèi)最優(yōu)搜索航跡,并在執(zhí)行時(shí)域[tp,tp+Te]內(nèi)沿規(guī)劃航跡執(zhí)行搜索任務(wù)。當(dāng)?shù)竭_(dá)下一滾動規(guī)劃時(shí)刻tp+1時(shí),重復(fù)上述步驟。
重訪機(jī)制驅(qū)動的多無人機(jī)協(xié)同搜索規(guī)劃方法偽代碼如表1所示,具體步驟描述如下。
步驟1 初始化。設(shè)置環(huán)境先驗(yàn)信息,無人機(jī)性能參數(shù)F、初始位置,傳感器性能參數(shù)PD、PF。設(shè)置算法參數(shù),包括滾動規(guī)劃時(shí)域長度Tp與執(zhí)行時(shí)域長度Te,目標(biāo)發(fā)現(xiàn)閾值δP,目標(biāo)存在信息ζ(x,y,t)與各子目標(biāo)權(quán)重系數(shù)w1、w2、w3、w4。根據(jù)環(huán)境先驗(yàn)信息,利用式(9)和式(12),分別初始化目標(biāo)概率分布圖、環(huán)境不確定度圖與環(huán)境搜索狀態(tài)圖。
步驟2 判斷是否達(dá)到最大迭代步驟tp 步驟3 根據(jù)搜索概率圖信息,規(guī)劃Tp時(shí)域內(nèi)無人機(jī)搜索航跡。 步驟4 根據(jù)式(1)所示的目標(biāo)函數(shù)計(jì)算可行航跡收益,使用貪婪算法確定各無人機(jī)的最優(yōu)搜索航跡。 步驟5 各無人機(jī)在執(zhí)行步長Te內(nèi)沿步驟4中規(guī)劃航跡飛行,并使用自身攜帶傳感器探測目標(biāo)。 步驟6 若無人機(jī)攜帶的傳感器未探測到目標(biāo),按照更新準(zhǔn)則式(13)減小目標(biāo)存在概率與環(huán)境不確定度;若探測到目標(biāo),增大目標(biāo)存在概率并減小環(huán)境不確定度,同時(shí)根據(jù)基于目標(biāo)權(quán)重更新的重訪機(jī)制更新各子目標(biāo)權(quán)重系數(shù)(詳見3.3節(jié)),引導(dǎo)無人機(jī)重訪發(fā)現(xiàn)疑似目標(biāo)的區(qū)域。 步驟7 根據(jù)基于環(huán)境不確定度圖更新的重訪機(jī)制(詳見3.3節(jié)),提高當(dāng)前網(wǎng)格處的環(huán)境不確定度,引導(dǎo)無人機(jī)對長時(shí)間未被重訪區(qū)域進(jìn)行重搜索。 步驟8 根據(jù)式(5)的目標(biāo)存在準(zhǔn)則判斷是否發(fā)現(xiàn)目標(biāo),若確定任務(wù)區(qū)域存在目標(biāo),輸出目標(biāo)位置信息,轉(zhuǎn)步驟2;否則,直接轉(zhuǎn)步驟2,繼續(xù)執(zhí)行搜索任務(wù)。 表1 RMD-CSP偽代碼Table 1 Pseudocode of RMD-CSP 為減少無人機(jī)遺漏以及誤判目標(biāo)的情況,本節(jié)提出2種重訪機(jī)制,基于環(huán)境不確定度圖更新的重訪機(jī)制和基于目標(biāo)權(quán)重系數(shù)更新的重訪機(jī)制,具體如下所述。 1) 基于環(huán)境不確定度圖更新的重訪機(jī)制 由于目標(biāo)在任務(wù)環(huán)境中不斷運(yùn)動,目標(biāo)仍有出現(xiàn)在已探測區(qū)域的可能性,因此通過增加長時(shí)間未被探測區(qū)域的環(huán)境不確定度,引導(dǎo)無人機(jī)對該區(qū)域進(jìn)行及時(shí)的重訪。假設(shè)t0為網(wǎng)格Cxy上次被訪問時(shí)刻,T0為重訪時(shí)限,t為當(dāng)前訪問時(shí)刻。重訪機(jī)制觸發(fā)條件I定義為:某區(qū)域未被探測的時(shí)間長度大于設(shè)定的重訪時(shí)限,即(t-t0)>T0,觸發(fā)基于環(huán)境不確定度圖更新的重訪機(jī)制。通過提高該區(qū)域在t時(shí)刻的環(huán)境不確定度,增加無人機(jī)進(jìn)行重搜索的概率,從而引導(dǎo)無人機(jī)重訪該區(qū)域,更新方法為 (15) 式中:τ為環(huán)境不確定度增強(qiáng)因子,具體取值詳見4.3節(jié)。終止條件I定義為:當(dāng)前規(guī)劃步結(jié)束時(shí),該重訪機(jī)制終止。在后續(xù)搜索規(guī)劃過程中,環(huán)境不確定度圖更新方式如式(13)所示(詳見2.2節(jié))。通過基于環(huán)境不確定度圖更新的重訪機(jī)制,減少無人機(jī)遺漏目標(biāo)情況,提升無人機(jī)捕獲移動目標(biāo)的能力。 2) 基于目標(biāo)權(quán)重更新的重訪機(jī)制 考慮傳感器存在探測概率與虛警概率,易出現(xiàn)目標(biāo)遺漏或誤判的問題,定制基于目標(biāo)權(quán)重更新的重訪機(jī)制,通過增大一定時(shí)間內(nèi)的目標(biāo)搜索收益這一子目標(biāo)的權(quán)重,引導(dǎo)發(fā)現(xiàn)目標(biāo)的無人機(jī)或附近無人機(jī)快速重訪發(fā)現(xiàn)新疑似目標(biāo)的區(qū)域,對疑似目標(biāo)進(jìn)行再次確認(rèn),防止目標(biāo)逃離探測范圍,同時(shí)不影響后續(xù)無人機(jī)協(xié)同搜索效能。重訪機(jī)制觸發(fā)條件II的定義為:無人機(jī)首次發(fā)現(xiàn)新的疑似目標(biāo)。具體更新方法為 Jtp=w1JS+w2JE+w3JD+w4JC (16) 式中:tp為無人機(jī)首次發(fā)現(xiàn)新目標(biāo)的時(shí)刻;k為無人機(jī)重訪發(fā)現(xiàn)疑似目標(biāo)區(qū)域需要的最大規(guī)劃步數(shù)。終止條件II的定義為:當(dāng)達(dá)到規(guī)劃時(shí)刻tp+k時(shí),該重訪機(jī)制終止,即無人機(jī)完成對存在疑似目標(biāo)區(qū)域的重訪,目標(biāo)函數(shù)權(quán)重系數(shù)重置為初值。通過快速引導(dǎo)無人機(jī)重訪發(fā)現(xiàn)疑似目標(biāo)區(qū)域,并對疑似目標(biāo)進(jìn)行再次確認(rèn),減小因傳感器虛警造成的目標(biāo)誤判的情況,減小因探測間隔較長造成的移動目標(biāo)遺漏的情況,提高無人機(jī)對移動目標(biāo)的捕獲能力。 多無人機(jī)在執(zhí)行搜索任務(wù)的過程中需要考慮機(jī)間避碰問題,本文使用人工勢場法[28]實(shí)現(xiàn)機(jī)間避碰[29]。人工勢場法將其他無人機(jī)視為軟威脅,將其他無人機(jī)j對當(dāng)前正在規(guī)劃的無人機(jī)i施加的綜合抗力以勢函數(shù)Fi(t)的形式表示,則t時(shí)刻全部其他無人機(jī)j作用到當(dāng)前無人機(jī)i上的綜合抗力為 (17) 式中:Fij(t)為t時(shí)刻無人機(jī)j對無人機(jī)i的抗力。Fij(t)受無人機(jī)位置關(guān)系影響,具體表達(dá)為 Fij(t)= (18) 式中:Rmax、βmax、φmax分別為無人機(jī)j與無人機(jī)i之間產(chǎn)生抗力作用的最大允許距離、最大允許角度與最大允許方位角之差;Rij為無人機(jī)j與無人機(jī)i之間的最短距離;Rij為對應(yīng)的單位向量;βi表示當(dāng)前無人機(jī)i的轉(zhuǎn)彎角;φij為無人機(jī)i與無人機(jī)j之間方位角度差;參數(shù)k1為無人機(jī)間距為0時(shí)的抗力大小,參數(shù)μ>0為抗力隨無人機(jī)間距增大而減小的速率。將勢函數(shù)Fi(t)疊加到目標(biāo)函數(shù)中,以最大化任務(wù)效能與最小化無人機(jī)避碰勢函數(shù)為目標(biāo)函數(shù),更新1.3節(jié)中多無人機(jī)協(xié)同搜索問題模型。考慮機(jī)間避碰的協(xié)同搜索規(guī)劃問題目標(biāo)函數(shù)為 (19) 本節(jié)面向典型的灰色區(qū)域協(xié)同搜索想定,開展數(shù)值仿真研究,對比分析RMD-CSP、光柵式搜索方法[30]與標(biāo)準(zhǔn)概率啟發(fā)式搜索方法[12],驗(yàn)證所提方法的有效性。仿真硬件環(huán)境為Inter Core i7-6700 3.4 GHz PC機(jī),編程環(huán)境為MATLAB 2017b。 灰色任務(wù)區(qū)域大小為60 km×60 km的矩形,將任務(wù)區(qū)域均勻劃分為60×60的正方形網(wǎng)格,單元網(wǎng)格大小為1 km×1 km,假設(shè)同一時(shí)刻每個(gè)單元網(wǎng)格中至多存在一個(gè)移動目標(biāo)(Moving Target, MT)。根據(jù)預(yù)先任務(wù)情報(bào)信息可知任務(wù)區(qū)域內(nèi)存在若干移動目標(biāo),指派4架無人機(jī)執(zhí)行搜索任務(wù)。目標(biāo)初始位置分布在x∈[10,45] km,y∈[10,45] km范圍內(nèi),目標(biāo)存在閾值設(shè)置為δP=0.85。無人機(jī)初始位置、初始速度方向與性能約束如表2所示,傳感器性能參數(shù)如表3[31]所示,人工勢場法參數(shù)與RMD-CSP方法參數(shù)設(shè)置分別如表4和表5所示。 根據(jù)目標(biāo)先驗(yàn)信息確定目標(biāo)概率初始化分布參數(shù)如表6所示,初始目標(biāo)概率分布與環(huán)境不確定度初始分布如圖5和圖6所示。設(shè)定總仿真時(shí)間為7 000 s,將仿真時(shí)間離散為700個(gè)規(guī)劃步,規(guī)劃時(shí)間間隔為10 s。 表2 無人機(jī)初始狀態(tài)信息與性能約束Table 2 Initial state information and performance constraints of UAVs 表3 傳感器性能參數(shù)[31]Table 3 Parameters of sensor performance[31] 表4 人工勢場法參數(shù)Table 4 Parameters of artificial potential field 表5 RMD-CSP算法參數(shù)Table 5 Parameters of RMD-CSP 表6 目標(biāo)存在概率初始化參數(shù)Table 6 Initial parameters of target probability 圖5 目標(biāo)初始概率分布Fig.5 Initial probability distribution of targets 圖6 環(huán)境不確定度初始分布Fig.6 Initial distribution of environment uncertainty 針對灰色區(qū)域協(xié)同搜索任務(wù),RMD-CSP規(guī)劃結(jié)果如圖7所示。圖7(a)為t=390 s時(shí)刻的協(xié)同搜索航跡規(guī)劃結(jié)果。 由圖7(a1)可知,位于(27, 24) km網(wǎng)格內(nèi)的目標(biāo)存在概率超過閾值,認(rèn)為無人機(jī)在此捕獲目標(biāo);由圖7(a2)可知,經(jīng)過無人機(jī)搜索,已搜索區(qū)域環(huán)境不確定度與初始時(shí)刻相比降低;由圖7(a3)可知,規(guī)劃的航跡能夠引導(dǎo)無人機(jī)對目標(biāo)存在概率較大與環(huán)境不確定度較低的區(qū)域進(jìn)行搜索;由圖7(a4)可知,UAV-Ⅲ首次發(fā)現(xiàn)位于(27, 24) km的移動目標(biāo),算法通過更新規(guī)劃時(shí)域內(nèi)的目標(biāo)權(quán)重,引導(dǎo)UAV-Ⅳ重訪疑似目標(biāo)區(qū)域,通過再次訪問確定目標(biāo)真?zhèn)?。圖7(b)與圖7(c)分別為仿真時(shí)刻t=930 s 與t=2 880 s的協(xié)同搜索規(guī)劃結(jié)果。由圖7(b4)可知,在UAV-Ⅱ發(fā)現(xiàn)新疑似目標(biāo)后,本方法能夠快速引導(dǎo)UAV-Ⅰ重訪該區(qū)域,對疑似目標(biāo)進(jìn)行再次確認(rèn)。從圖7(c4)可以看出,通過UAV-Ⅱ自身快速重訪疑似目標(biāo)區(qū)域,確認(rèn)存在目標(biāo)。仿真結(jié)果表明RMD-CSP能夠有效引導(dǎo)多架無人機(jī)協(xié)同搜索并捕獲灰色區(qū)域中的移動目標(biāo)。滾動規(guī)劃過程中,單步規(guī)劃耗時(shí)最大值為0.068 s,平均值為0.036 s,中位數(shù)為0.034 s。仿真結(jié)果表明,在每一滾動規(guī)劃時(shí)域,RMD-CSP均能在0.1 s內(nèi)輸出搜索航跡,能夠滿足協(xié)同搜索任務(wù)的實(shí)時(shí)性需求。 圖7 搜索規(guī)劃結(jié)果Fig.7 Search planning results 為了分析重訪機(jī)制中增強(qiáng)因子τ對搜索效能的影響,以0.02為間隔等步長選取不同的增強(qiáng)因子值,范圍設(shè)置為[1.1, 1.4]。針對每一增強(qiáng)因子值,分別進(jìn)行100次蒙特卡羅仿真,仿真設(shè)置同4.1節(jié)。增強(qiáng)因子不同取值條件下,RMD-CSP引導(dǎo)無人機(jī)捕獲目標(biāo)數(shù)量如圖8所示。 由仿真結(jié)果可知,增強(qiáng)因子取值在1.1~1.22 之間時(shí),無人機(jī)捕獲目標(biāo)數(shù)量沒有明顯的變化。然而,當(dāng)增強(qiáng)因子取值超過1.22之后,隨著增強(qiáng)因子數(shù)值的增大,無人機(jī)捕獲目標(biāo)數(shù)量逐漸減小。根據(jù)式(15)可知,增強(qiáng)因子取值過大,會導(dǎo)致長時(shí)間未被探測區(qū)域的環(huán)境不確定度增長較多。環(huán)境不確定度較大的變化會影響式(1)中子函數(shù)JE與JF,導(dǎo)致各子目標(biāo)函數(shù)權(quán)重失衡,在后續(xù)規(guī)劃過程中忽略對目標(biāo)存在概率較大區(qū)域的搜索,制約了無人機(jī)對移動目標(biāo)的捕獲能力。因此,增強(qiáng)因子取值應(yīng)不大于1.22,以保證無人機(jī)協(xié)同搜索效能。 在增強(qiáng)因子取值不同情況下,每一滾動規(guī)劃步規(guī)劃耗時(shí)統(tǒng)計(jì)如圖9所示,由仿真結(jié)果可知,單步規(guī)劃耗時(shí)的中位數(shù)均小于0.05 s,單步規(guī)劃最大耗時(shí)不足0.1 s,能夠滿足協(xié)同搜索規(guī)劃的實(shí)時(shí)性要求。 圖8 捕獲目標(biāo)數(shù)量隨增強(qiáng)因子變化圖Fig.8 Number variations of captured targets with different enhancement factors 圖9 不同增強(qiáng)因子下單步規(guī)劃耗時(shí)Fig.9 Runtime in each planning horizon with different enhancement factors 為分析無人機(jī)數(shù)量對搜索效能的影響,分別指派4~12架無人機(jī)搜索任務(wù)區(qū)域。針對不同的無人機(jī)數(shù)量,分別進(jìn)行100次蒙特卡羅仿真。設(shè)定總仿真時(shí)間為4 000 s,將仿真時(shí)間離散為400個(gè)規(guī)劃步,規(guī)劃時(shí)間間隔為10 s。統(tǒng)計(jì)捕獲目標(biāo)數(shù)量如圖10所示。 由仿真結(jié)果可知,在無人機(jī)數(shù)量少于8架時(shí),隨著無人機(jī)數(shù)量的增加,無人機(jī)捕獲目標(biāo)數(shù)量增多,協(xié)同搜索效率隨著無人機(jī)數(shù)量增加而提升。但是,當(dāng)無人機(jī)數(shù)量超過8架之后,無人機(jī)捕獲目標(biāo)數(shù)量基本不變,例如,無人機(jī)9架次與12架次時(shí),目標(biāo)捕獲數(shù)量幾乎相等。因此,在搜索區(qū)域大小與搜索時(shí)間一定的條件下,無人機(jī)數(shù)量持續(xù)增加不會使搜索效能持續(xù)提升,因此需要根據(jù)具體想定選擇合適的無人機(jī)數(shù)量,避免資源浪費(fèi)。 不同無人機(jī)數(shù)量情況下,每一滾動規(guī)劃步規(guī)劃耗時(shí)統(tǒng)計(jì)如圖11所示。由于單步規(guī)劃中需要為每架無人機(jī)規(guī)劃搜索航跡,因此隨著無人機(jī)架次的增加,單步規(guī)劃耗時(shí)增加。但是,單步規(guī)劃均能夠在0.3 s內(nèi)得到各無人機(jī)搜索航跡,能夠滿足協(xié)同搜索規(guī)劃的實(shí)時(shí)性需求。仿真結(jié)果表明,本文提出了基于滾動規(guī)劃架構(gòu)的RMD-CSP能夠在線高效求解多無人機(jī)協(xié)同搜索問題。 圖10 捕獲目標(biāo)數(shù)量隨無人機(jī)數(shù)量變化圖Fig.10 Number variations of captured targets with different UAV numbers 圖11 不同無人機(jī)數(shù)量下單步規(guī)劃耗時(shí)Fig.11 Runtime in each planning horizon with different UAV numbers 本節(jié)通過對比分析光柵式搜索方法、標(biāo)準(zhǔn)概率啟發(fā)式搜索方法以及RMD-CSP在不同探測概率條件下的規(guī)劃結(jié)果,進(jìn)一步驗(yàn)證本文算法的有效性。設(shè)置5組蒙特卡羅仿真仿試驗(yàn),探測概率分別為0.5,0.6,0.7,0.8和0.9,每組均進(jìn)行100次仿真,仿真時(shí)間為7 000 s,統(tǒng)計(jì)不同方法對應(yīng)的捕獲目標(biāo)數(shù)量與誤判次數(shù)。 仿真統(tǒng)計(jì)結(jié)果分別如圖12和圖13所示,相比于光柵式搜索方法與標(biāo)準(zhǔn)概率啟發(fā)式搜索方法,RMD-CSP能夠引導(dǎo)無人機(jī)捕獲更多移動目標(biāo),同時(shí)保證誤判次數(shù)最少。在探測概率為0.9時(shí),RMD-CSP引導(dǎo)無人機(jī)捕獲目標(biāo)數(shù)量為7.80,相比于光柵式搜索方法(2.02)與標(biāo)準(zhǔn)概率啟發(fā)式搜索方法(4.07)分別提升了2.86倍與0.92倍;RMD-CSP的平均誤判次數(shù)(0.27)比光柵式搜索方法(3.76)與標(biāo)準(zhǔn)概率啟發(fā)式搜索方法(0.57)分別降低了92.8%與52.6%。 光柵式搜索方法的固定搜索模式難以應(yīng)對目標(biāo)移動的隨機(jī)特性,同時(shí)由于傳感器存在虛警概率,光柵式搜索無法通過重訪對疑似目標(biāo)進(jìn)行再次確認(rèn),因此造成大量誤判情況,工程實(shí)用性較差。標(biāo)準(zhǔn)概率啟發(fā)式搜索方法能夠根據(jù)環(huán)境信息圖不斷調(diào)整無人機(jī)搜索航跡,在一定程度上緩解傳感器虛警造成的目標(biāo)誤判情況,但由于其重訪效率低,容易遺漏目標(biāo),因此其捕獲目標(biāo)數(shù)量少于RMD-CSP,不適用于求解灰色區(qū)域移動目標(biāo)搜索問題。RMD-CSP能夠利用環(huán)境先驗(yàn)信息,根據(jù)定制的重訪機(jī)制,快速重訪發(fā)現(xiàn)新的疑似目標(biāo)區(qū)域,對疑似目標(biāo)進(jìn)行再次,減少目標(biāo)誤判情況;重訪環(huán)境不確定度較高的區(qū)域,減少目標(biāo)遺漏情況,提高了多無人機(jī)協(xié)同搜索效能,具有更好的魯棒性與工程實(shí)用性。 圖12 捕獲目標(biāo)數(shù)量Fig.12 Numbers of captured real targets 圖13 誤判次數(shù)Fig.13 Numbers of judgmental errors 為提高多無人機(jī)協(xié)同搜索灰色區(qū)域內(nèi)移動目標(biāo)的效率,本文考慮傳感器探測概率與虛警概率,提出一種重訪機(jī)制驅(qū)動的多無人機(jī)協(xié)同搜索規(guī)劃方法,并開展數(shù)值仿真試驗(yàn),得到了如下結(jié)論: 1) 考慮實(shí)際作戰(zhàn)中,無人機(jī)攜帶的傳感器存在一定的探測概率與虛警概率,可能存在目標(biāo)遺漏與誤判的情況,定制了基于環(huán)境不確定度圖更新的重訪機(jī)制與基于目標(biāo)函數(shù)權(quán)重更新的重訪機(jī)制,引導(dǎo)無人機(jī)快速重訪長時(shí)間未被重訪區(qū)域或發(fā)現(xiàn)疑似目標(biāo)的區(qū)域,減少由于傳感器探測概率與虛警概率造成的目標(biāo)遺漏與誤判情況,提高灰色區(qū)域協(xié)同搜索效率與移動目標(biāo)捕獲能力。 2) 通過蒙特卡羅仿真試驗(yàn)分析了增強(qiáng)因子τ與無人機(jī)數(shù)量對協(xié)同搜索效率的影響。結(jié)果表明,增強(qiáng)因子取值超過1.22后,隨著增強(qiáng)因子取值的增加,無人機(jī)捕獲目標(biāo)數(shù)量下降,協(xié)同搜索效率降低,因此增強(qiáng)因子應(yīng)在[1.1, 1.22]內(nèi)取值。隨著無人機(jī)數(shù)量的增加,RMD-CSP捕獲目標(biāo)數(shù)量增加。當(dāng)無人機(jī)數(shù)量超過8架次后,隨著無人機(jī)數(shù)量的增加,協(xié)同搜索效率的增加趨勢逐漸減小。因此需要根據(jù)具體任務(wù)想定選擇合適的無人機(jī)數(shù)量,避免任務(wù)資源的浪費(fèi)。 3) 通過與光柵式搜索和標(biāo)準(zhǔn)概率啟發(fā)式搜索方法對比,表明本文方法能夠引導(dǎo)無人機(jī)高效執(zhí)行灰色區(qū)域移動目標(biāo)探測任務(wù)。相比于光柵式搜索方法與標(biāo)準(zhǔn)概率啟發(fā)式搜索方法,RMD-SCP均能保證較高的捕獲移動目標(biāo)概率與較低的誤判概率。本文方法能夠降低由于傳感器性能不足造成的誤判情況,能夠提高無人機(jī)的協(xié)同搜索效能,引導(dǎo)無人機(jī)捕獲更多的移動目標(biāo)。 本文假設(shè)各無人機(jī)間通訊良好,暫未考慮通訊距離、延時(shí)等通訊約束對多無人機(jī)協(xié)同搜索的影響,后續(xù)研究中可考慮各無人機(jī)之間的通訊約束,進(jìn)一步完善多無人機(jī)協(xié)同搜索方法。3.3 重訪機(jī)制
3.4 機(jī)間避碰方法
4 仿真對比分析
4.1 想定設(shè)置與方法參數(shù)設(shè)置
4.2 協(xié)同搜索規(guī)劃結(jié)果
4.3 增強(qiáng)因子τ對搜索效能的影響
4.4 無人機(jī)數(shù)量對搜索效能的影響
4.5 方法性能對比
5 結(jié) 論