張嘉玲 姜永超 李博宸 王成罡 宋 磊 黃 丹
由于水雷具有隱蔽性強(qiáng)、易布難除、效費(fèi)比高等特點(diǎn)[1],反水雷任務(wù)當(dāng)前面臨風(fēng)險(xiǎn)高、效率低、作業(yè)復(fù)雜等挑戰(zhàn).在未來(lái)海戰(zhàn)中,為了保證作戰(zhàn)行動(dòng)不被水雷威脅影響而貽誤戰(zhàn)機(jī),快速性成為了反水雷作戰(zhàn)的第一要訣[2].與傳統(tǒng)大型獵掃雷艦艇相比,無(wú)人反水雷裝備具有零傷亡、機(jī)動(dòng)強(qiáng)和成本低等諸多優(yōu)勢(shì)[3],例如,探雷無(wú)人機(jī)快速掃描雷區(qū)并生成較清晰的水雷分布、滅雷無(wú)人艇搭載大型滅雷設(shè)備執(zhí)行獵掃雷任務(wù)等.為充分發(fā)揮無(wú)人機(jī)、無(wú)人艇等海空異構(gòu)裝備的能力優(yōu)勢(shì),有必要優(yōu)化設(shè)計(jì)空海協(xié)同反水雷方案,完成對(duì)雷區(qū)的偵察和覆蓋,從而實(shí)現(xiàn)高效水雷清掃.
未來(lái)的無(wú)人反水雷作戰(zhàn)可為如下形式: 數(shù)艘無(wú)人機(jī)對(duì)重點(diǎn)水域進(jìn)行偵察,獲取情報(bào)信息并回傳給指揮中心.結(jié)合回傳信息,指揮中心對(duì)潛在雷區(qū)進(jìn)行識(shí)別,并派遣無(wú)人艇編組深入敵方雷區(qū),應(yīng)用滅雷具和前置式獵雷系統(tǒng)等武器進(jìn)行滅雷作業(yè).以上作戰(zhàn)樣式中,提升反水雷效率的關(guān)鍵是結(jié)合異構(gòu)裝備能力屬性,合理對(duì)??諢o(wú)人編組進(jìn)行規(guī)劃部署,解決以快速性為主要指標(biāo)的多智能體覆蓋問(wèn)題.現(xiàn)有研究一般通過(guò)設(shè)計(jì)覆蓋成本函數(shù)劃分給定區(qū)域,并進(jìn)行軌跡規(guī)劃驅(qū)動(dòng)智能體至最優(yōu)位置.CORTES 等首次在覆蓋問(wèn)題中使用維諾分區(qū)法[4],并證明每個(gè)維諾單元的質(zhì)心為最優(yōu)傳感位置.在此基礎(chǔ)上,大量學(xué)者針對(duì)影響覆蓋控制的各種因素,如覆蓋區(qū)域特征[5]、智能體動(dòng)力學(xué)模型[6]及特定任務(wù)需求[7-8]等展開研究.為充分發(fā)揮異構(gòu)裝備能力優(yōu)勢(shì),如無(wú)人機(jī)的機(jī)動(dòng)能力、無(wú)人艇的搭載能力等,有必要進(jìn)一步研究異構(gòu)多智能體的覆蓋問(wèn)題.針對(duì)異構(gòu)智能體覆蓋問(wèn)題的研究考慮了智能體動(dòng)力學(xué)[9-10]、能耗[11]、傳感能力[12-13]等屬性.此類研究根據(jù)異構(gòu)智能體的性能差異,調(diào)整覆蓋成本中的代價(jià)函數(shù)及覆蓋的分區(qū)方式,以滿足不同任務(wù)需求.在反水雷任務(wù)中,提升掃滅雷效率是制勝的關(guān)鍵.因此,無(wú)人裝備的機(jī)動(dòng)能力成為影響覆蓋規(guī)劃算法設(shè)計(jì)的關(guān)鍵因素.文獻(xiàn)[14-15]在算法的設(shè)計(jì)中考慮了智能體的個(gè)體能力差異,通過(guò)加法加權(quán)維諾圖調(diào)整各分區(qū)邊界,使智能體的主導(dǎo)區(qū)域大小與其能力屬性正相關(guān),但文獻(xiàn)[15]中針對(duì)智能體編隊(duì)異構(gòu)性的研究,集中在無(wú)人機(jī)與無(wú)人船的續(xù)航能力、靈活性、探測(cè)準(zhǔn)確度等性能差異上,未能充分發(fā)揮編組內(nèi)智能體的速度優(yōu)勢(shì)進(jìn)而提升覆蓋效率.面向反水雷任務(wù),覆蓋問(wèn)題中的智能體主導(dǎo)區(qū)域?qū)?yīng)每艘無(wú)人艇被分配的滅雷區(qū)域,為了保證該過(guò)程的快速性,將無(wú)人艇的機(jī)動(dòng)能力作為主導(dǎo)區(qū)域劃分的主要依據(jù),提出了速度乘法加權(quán)維諾分區(qū)法,從而適配反水雷任務(wù)需求.
無(wú)人艇編組執(zhí)行獵掃雷任務(wù)的前提是初步獲得水雷分布,該分布在覆蓋問(wèn)題中對(duì)應(yīng)區(qū)域內(nèi)關(guān)鍵信息的密度函數(shù).現(xiàn)有研究一般通過(guò)高斯估計(jì)[16]、貝葉斯估計(jì)[17]等算法,預(yù)測(cè)目標(biāo)區(qū)域內(nèi)的密度函數(shù),從而實(shí)現(xiàn)環(huán)境信息建模.但以上算法難以平衡估計(jì)準(zhǔn)確性、計(jì)算復(fù)雜度及估計(jì)時(shí)間等要素[18],無(wú)法直接應(yīng)用于雷區(qū)偵察過(guò)程中的水雷分布估計(jì).高斯過(guò)程回歸(GPR)算法是一種非參數(shù)貝葉斯機(jī)器學(xué)習(xí)方法,該方法能夠在考慮觀測(cè)噪聲的前提下,利用部分采樣數(shù)據(jù)預(yù)測(cè)未知函數(shù),在多智能體覆蓋問(wèn)題研究中有廣泛應(yīng)用,現(xiàn)已被應(yīng)用于規(guī)劃最大信息路徑、精準(zhǔn)重構(gòu)環(huán)境模型等任務(wù)[19],其中,文獻(xiàn)[20]依據(jù)GPR 算法的方差特性對(duì)高精度環(huán)境密度函數(shù)進(jìn)行預(yù)測(cè),為最優(yōu)區(qū)域覆蓋提供了支撐.應(yīng)用高斯過(guò)程回歸算法,根據(jù)無(wú)人機(jī)編組在偵察過(guò)程中獲取的采樣數(shù)據(jù)估計(jì)水雷分布密度函數(shù),為無(wú)人艇編組的滅雷任務(wù)提供關(guān)鍵態(tài)勢(shì)信息.
結(jié)合以上分析,主要工作如下: 1)提出了一種??諈f(xié)同反水雷策略,該策略中無(wú)人機(jī)編組用于快速掃描雷區(qū),應(yīng)用高斯過(guò)程回歸處理采樣數(shù)據(jù),從而生成水雷分布.2)提出了基于速度差異乘法加權(quán)的最優(yōu)覆蓋規(guī)劃算法,依據(jù)水雷分布進(jìn)行雷區(qū)劃分,結(jié)合無(wú)人艇異構(gòu)特性,以速度為權(quán)重設(shè)計(jì)代價(jià)函數(shù),最優(yōu)化雷區(qū)劃分方式.在欠驅(qū)動(dòng)運(yùn)動(dòng)學(xué)模型約束下,設(shè)計(jì)軌跡跟蹤算法引導(dǎo)無(wú)人艇進(jìn)行雷區(qū)覆蓋.3)在相同水雷分布場(chǎng)景下,仿真部分設(shè)置6 艘初始位置不同的無(wú)人艇對(duì)雷區(qū)進(jìn)行覆蓋,并與傳統(tǒng)算法的覆蓋時(shí)間進(jìn)行比較,驗(yàn)證了所提出算法在提升反水雷效率方面的有效性.
結(jié)合典型無(wú)人反水雷作戰(zhàn)場(chǎng)景,提出基于無(wú)人機(jī)、艇協(xié)同的時(shí)間最優(yōu)覆蓋規(guī)劃問(wèn)題,并介紹解決該問(wèn)題使用的高斯過(guò)程回歸及維諾分割算法.
圖1 所示的典型??諈f(xié)同反水雷場(chǎng)景中,含潛在雷區(qū)的海域可用凸區(qū)域表示.由n 艘無(wú)人艇和m 架無(wú)人機(jī)構(gòu)成作戰(zhàn)編組協(xié)同執(zhí)行水雷清掃任務(wù).假設(shè)潛在雷區(qū)有界,且水雷分布不會(huì)出現(xiàn)驟變,可用連續(xù)有界的密度函數(shù)來(lái)描述水雷分布情況,表示目標(biāo)區(qū)域內(nèi)任意點(diǎn)q 水雷出現(xiàn)的概率.
圖1 ??諈f(xié)同反水雷場(chǎng)景Fig.1 Sea-air coordination anti-mine scene
圖2 標(biāo)準(zhǔn)維諾圖Fig.2 Standard voronoi diagram
根據(jù)任務(wù)需求,無(wú)人機(jī)編組利用自身裝載的電磁探雷設(shè)備,根據(jù)給定路徑探測(cè)潛在埋雷區(qū)域.母船利用無(wú)人機(jī)編組收集到的疑似目標(biāo)位置,結(jié)合信號(hào)強(qiáng)度評(píng)估D 內(nèi)水雷概率密度分布.母船可將水雷分布信息共享至位置向量為的無(wú)人艇編組,并規(guī)劃其掃雷部署方案.
考慮無(wú)人艇編組的異構(gòu)特性,其覆蓋效果可通過(guò)成本函數(shù)定量描述.根據(jù)覆蓋控制的任務(wù)目標(biāo)、覆蓋過(guò)程中的約束以及密度函數(shù),可定義成本函數(shù)如下:
表1 符號(hào)列表Table 1 Symbol list
介紹與無(wú)人艇編組在海上雷區(qū)覆蓋規(guī)劃與控制相關(guān)的基礎(chǔ)知識(shí),具體包含GPR 和維諾分割兩類工具,分別用于估計(jì)水雷分布密度及目標(biāo)雷區(qū)分割.
1.2.1 高斯過(guò)程回歸
環(huán)境的密度函數(shù)用于描述目標(biāo)區(qū)域內(nèi)某些固有屬性,如溫度、水雷分布等.這些信息在有限區(qū)域內(nèi)一般不會(huì)出現(xiàn)驟變、無(wú)界等現(xiàn)象.因此,假設(shè)水雷分布密度函數(shù)在目標(biāo)區(qū)域內(nèi)有界連續(xù),可用高斯過(guò)程回歸對(duì)其進(jìn)行估計(jì)并生成水雷分布圖,以此作為雷區(qū)覆蓋的依據(jù).將高斯過(guò)程的先驗(yàn)表示為:
在高斯過(guò)程中,可以利用核函數(shù)生成相關(guān)系數(shù)矩陣來(lái)衡量任意兩點(diǎn)間的距離.所以,核函數(shù)決定了高斯過(guò)程的性質(zhì).高斯核函數(shù)是最常用的核函數(shù)之一,也被稱為徑向基函數(shù)(radial basis function,RBF),其基本形式如下:
1.2.2 維諾區(qū)域分割法
具體介紹水雷分布密度函數(shù)未知情況下的時(shí)間最優(yōu)覆蓋規(guī)劃與控制方法.不同于傳統(tǒng)的維諾圖分割,考慮了不同無(wú)人艇的速度差異,并據(jù)此調(diào)整其對(duì)潛在雷區(qū)的主導(dǎo)區(qū)域,使無(wú)人艇到達(dá)區(qū)域內(nèi)任意潛在滅雷位置的時(shí)間最短.
所提出的海空協(xié)同反水雷覆蓋算法流程如圖3所示,假設(shè)存在一艘母船作為指揮中心,m 架無(wú)人機(jī)根據(jù)預(yù)先規(guī)劃的路徑對(duì)海面上的目標(biāo)區(qū)域D 進(jìn)行偵察.偵察結(jié)束后,無(wú)人機(jī)將所得水雷分布信息共享,使用高斯過(guò)程回歸估計(jì)水雷分布,并以此為依據(jù),規(guī)劃待命無(wú)人艇的部署方案.
圖3 ??諈f(xié)同時(shí)間最優(yōu)覆蓋算法流程圖Fig.3 Flowchart of the time-optimal coverage algorithm in sea-air coordination
圖4 無(wú)人艇坐標(biāo)示意圖Fig.4 Schematic diagram of unmanned ship vessel(USV)coordinates
結(jié)合無(wú)人艇的初始位置及速度,母船對(duì)待覆蓋區(qū)域進(jìn)行加權(quán)維諾分割.在規(guī)劃過(guò)程中,無(wú)人艇結(jié)合設(shè)計(jì)的以時(shí)間為代價(jià)的全局成本函數(shù)梯度值,來(lái)判斷當(dāng)下的覆蓋進(jìn)程.若無(wú)人艇編組未到達(dá)最優(yōu)位置,則迭代前述過(guò)程,直至每艘無(wú)人艇都移動(dòng)至其主導(dǎo)區(qū)域的質(zhì)心處.
假設(shè)點(diǎn)q 為凸區(qū)域D 內(nèi)的隨機(jī)目標(biāo)點(diǎn).考慮到無(wú)人艇編組內(nèi)部不同個(gè)體的最大速度差異,僅依據(jù)距離進(jìn)行覆蓋區(qū)域的劃分并不能保證無(wú)人艇滅雷過(guò)程的快速性.因?yàn)樘嵘郎缋仔实年P(guān)鍵在于使隨機(jī)點(diǎn)q 被響應(yīng)的時(shí)間最短.因此,為充分發(fā)揮無(wú)人艇的機(jī)動(dòng)能力,速度快的無(wú)人艇應(yīng)該負(fù)責(zé)監(jiān)控更大的區(qū)域,從而提高整體滅雷效率.定義第i 艘無(wú)人艇運(yùn)動(dòng)到主導(dǎo)區(qū)域內(nèi)任意點(diǎn)的時(shí)間是則在維諾分區(qū)的定義中,引入時(shí)間最優(yōu)的邊界條件:
一般情況下,無(wú)人艇編組在目標(biāo)區(qū)域的分布相對(duì)稀疏,因此,第i 艘無(wú)人艇在單位時(shí)間內(nèi)可以到達(dá)的區(qū)域可用其最大速度vi近似:
前文提到,覆蓋效果的提升可以依靠降低其成本函數(shù)來(lái)實(shí)現(xiàn).除了上述優(yōu)化分區(qū)外,還需對(duì)成本函數(shù)中的位置代價(jià)函數(shù)進(jìn)行最小化求解:
根據(jù)乘法加權(quán)的維諾分區(qū)法,在獲取雷區(qū)的概率密度分布后,對(duì)目標(biāo)區(qū)域的最優(yōu)覆蓋應(yīng)以每個(gè)無(wú)人艇到達(dá)其主導(dǎo)區(qū)域內(nèi)任意位置的時(shí)間是否最短來(lái)衡量.因此,在成本函數(shù)中考慮無(wú)人艇最大速度的差異,選用時(shí)間成本來(lái)代替位置成本,則有:
為了滿足無(wú)人艇最優(yōu)覆蓋潛在雷區(qū)的目的,需要使用梯度下降法最小化式(9)中的時(shí)間成本.
其梯度表達(dá)式可以簡(jiǎn)化為:
別是第i 艘無(wú)人艇加權(quán)乘法維諾區(qū)域的質(zhì)量和質(zhì)心.假設(shè)無(wú)人艇的單體積分動(dòng)力學(xué)第i 艘無(wú)人艇基于時(shí)間代價(jià)的梯度下降控制器為:
為了方便后續(xù)的計(jì)算,在保證無(wú)人艇最大速度約束的情況下,對(duì)以上控制器進(jìn)行簡(jiǎn)化.式(11)中的控制器乘以增益則有:
以往關(guān)于覆蓋問(wèn)題的研究一般假設(shè)被控對(duì)象在向目標(biāo)點(diǎn)移動(dòng)的過(guò)程中,可以產(chǎn)生任意方向的瞬時(shí)初速度.然而無(wú)人艇是一個(gè)欠驅(qū)動(dòng)系統(tǒng),難以產(chǎn)生橫向側(cè)移,進(jìn)一步引入無(wú)人艇欠驅(qū)動(dòng)運(yùn)動(dòng)模型,探究其對(duì)于作戰(zhàn)編組整體覆蓋效果的影響.
第i 艘無(wú)人艇運(yùn)動(dòng)學(xué)方程為:
為了求解跟蹤誤差,定義如下誤差方程:
通過(guò)仿真示例驗(yàn)證所提出的算法對(duì)水雷分布的估計(jì)精度以及對(duì)雷區(qū)的覆蓋效果.仿真軟件為MATLAB 2019b,仿真平臺(tái)的處理器為Intel core i9,內(nèi)存16 GB.具體實(shí)驗(yàn)設(shè)置如下: 在坐標(biāo)范圍的區(qū)域內(nèi),隨機(jī)分布4 枚水雷.設(shè)置6 艘待執(zhí)行覆蓋任務(wù)的無(wú)人艇初始位置坐標(biāo)如下:
所有無(wú)人艇除速度外其余配置相同,假設(shè)無(wú)人艇的最小速度為單位速度,則無(wú)人艇編組的最大速度可表示為此外,線速度和角速度的控制器增益
圖5 為水雷分布圖,其中,圖5(a)為設(shè)置的水雷分布參考值.圖中的顏色和高度漸變表示著水雷存在概率的變化,水雷出現(xiàn)概率和豎直方向高度成正比.
圖5 水雷分布圖Fig.5 Mine distribution map
假設(shè)無(wú)人機(jī)探測(cè)到的水雷分布如下:
圖5(b)為無(wú)人機(jī)將采樣數(shù)據(jù)通過(guò)高斯過(guò)程回歸算法建立的水雷分布圖.圖5(c)為GPR 估計(jì)誤差分布,其中,估計(jì)誤差最大值處,與真實(shí)值的差距僅為3.5%.因此,GPR 算法能根據(jù)采樣數(shù)據(jù)對(duì)水雷分布密度進(jìn)行高精度離線估計(jì).
在第2.3 節(jié)和第2.4 節(jié)中,分別推導(dǎo)了對(duì)潛在雷區(qū)考慮無(wú)人艇速度差異性的覆蓋,并引入了欠驅(qū)動(dòng)運(yùn)動(dòng)學(xué)模型約束下的無(wú)人艇覆蓋控制器.為了證明該算法的有效性,設(shè)計(jì)了包含6 艘無(wú)人艇的滅雷編組在兩種不同覆蓋場(chǎng)景下的實(shí)驗(yàn).
為驗(yàn)證所提出算法的有效性,對(duì)比了3 種覆蓋算法在速度差異無(wú)人船編組的應(yīng)用性能.如圖6 所示,無(wú)人艇編組以相同初始位置形成3 種不同的覆蓋構(gòu)型及運(yùn)動(dòng)路徑.圖6 中,顏色漸變的部分為3.1節(jié)GPR 算法估計(jì)的水雷分布密度.圖6(a)中,無(wú)人艇采用標(biāo)準(zhǔn)維諾分區(qū)進(jìn)行區(qū)域覆蓋.圖6(b)中,以速度為權(quán)重的雷區(qū)分割算法充分利用了無(wú)人艇編組的機(jī)動(dòng)性,無(wú)人艇的運(yùn)動(dòng)路徑也更加平滑.速度較快的無(wú)人艇3 所覆蓋的區(qū)域顯著大于速度較慢的無(wú)人艇1.在圖6(b)的基礎(chǔ)上,圖6(c)進(jìn)一步考慮了無(wú)人艇欠驅(qū)動(dòng)運(yùn)動(dòng)學(xué)模型的約束.相比于圖6(b)中運(yùn)用全驅(qū)動(dòng)運(yùn)動(dòng)學(xué)模型的軌跡,圖6(c)的無(wú)人艇運(yùn)動(dòng)軌跡存在轉(zhuǎn)彎半徑,更加契合實(shí)際應(yīng)用場(chǎng)景.
圖6 無(wú)人艇覆蓋結(jié)果圖Fig.6 Coverage results of unmanned surface vessels
為驗(yàn)證所提出算法在滅雷效率方面的優(yōu)勢(shì),對(duì)不同覆蓋方法所需時(shí)間進(jìn)行統(tǒng)計(jì).假設(shè)P 為水雷出現(xiàn)概率閾值,P 值越大說(shuō)明此區(qū)域內(nèi)水雷存在的概率越高.無(wú)人艇覆蓋目標(biāo)為到達(dá)p>P 區(qū)域內(nèi)的目標(biāo)點(diǎn).在給定區(qū)域內(nèi)生成一定數(shù)量的目標(biāo)點(diǎn),計(jì)算無(wú)人艇從質(zhì)心位置到達(dá)這些目標(biāo)點(diǎn)的平均時(shí)間,結(jié)果如圖7所示.
圖7 覆蓋時(shí)間對(duì)比圖Fig.7 Comparison chart of coverage time
由圖7 可知,隨著P 值的增大,兩種覆蓋方法下無(wú)人艇到達(dá)目標(biāo)點(diǎn)所需的時(shí)間整體上都呈下降趨勢(shì).由表2 可知,所提出的時(shí)間最優(yōu)覆蓋方法平均所需時(shí)間顯著低于標(biāo)準(zhǔn)覆蓋方法,說(shuō)明該方法能夠充分利用無(wú)人艇編組的機(jī)動(dòng)能力.此外,圖7 中的藍(lán)色曲線反映了時(shí)間最優(yōu)覆蓋相比標(biāo)準(zhǔn)覆蓋的效率提升百分比.可見隨著P 值的增大,所提出方法的覆蓋效率提升效果也更明顯.
面向無(wú)人化反水雷的任務(wù)需求,提出了一種基于速度差異乘法加權(quán)的最優(yōu)覆蓋規(guī)劃算法,利用高斯過(guò)程回歸進(jìn)行水雷分布估計(jì),在考慮無(wú)人艇編組的機(jī)動(dòng)能力差異以及欠驅(qū)動(dòng)特性的基礎(chǔ)上,設(shè)計(jì)速度乘法加權(quán)的時(shí)間最優(yōu)覆蓋策略.仿真結(jié)果表明,所提方法在探雷階段可以較小估計(jì)誤差生成水雷分布態(tài)勢(shì);在滅雷階段,通過(guò)時(shí)間最優(yōu)覆蓋配置,無(wú)人艇可以在概率意義上最快訪問(wèn)區(qū)域內(nèi)任意水雷位置.相比于傳統(tǒng)覆蓋策略,所提出的方法充分發(fā)揮了異構(gòu)裝備的機(jī)動(dòng)能力,使滅雷效率大幅提升,可為未來(lái)的無(wú)人反水雷作戰(zhàn)提供策略支持.