郭強(qiáng),何勝杰,程家林,王興虎,孫亙,郭菲
成都飛機(jī)工業(yè)(集團(tuán))有限責(zé)任公司,四川 成都 610091
無人機(jī)規(guī)避導(dǎo)彈問題屬于追逃問題,追擊者為導(dǎo)彈,逃逸者為無人機(jī)。導(dǎo)彈根據(jù)自身導(dǎo)引律追擊無人機(jī),無人機(jī)根據(jù)方法策略規(guī)避導(dǎo)彈。無人機(jī)規(guī)避導(dǎo)彈的方法有專家系統(tǒng)法[3-4]、最優(yōu)控制法[5-7]、微分對策法[8-10]和深度強(qiáng)化學(xué)習(xí)法[11-13]。專家系統(tǒng)法依靠相關(guān)領(lǐng)域經(jīng)驗,根據(jù)不同情況做出不同決策。當(dāng)增加新的經(jīng)驗時,需要對以前的策略進(jìn)行增加或修改。最優(yōu)控制、微分對策方法依賴于模型,需要對方程求解,但實際中模型很難準(zhǔn)確知道。深度強(qiáng)化學(xué)習(xí)使用神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)的結(jié)合,通過大規(guī)模仿真訓(xùn)練,優(yōu)化出適合規(guī)避導(dǎo)彈的模型。但基于深度強(qiáng)化學(xué)習(xí)的方法,需要大規(guī)模的訓(xùn)練,且對于狀態(tài)空間的覆蓋有限,對于某些點可能存在無效的情況。Khatib 于1986 年提出了人工勢場法,并在機(jī)器人領(lǐng)域得到應(yīng)用。相比機(jī)器人路徑規(guī)劃,無人機(jī)同樣可以使用人工勢場法對導(dǎo)彈的勢場構(gòu)建[14-16],并通過使用此方法的決策,控制無人機(jī)飛行。
綜上所述,本文將人工勢場法用于無人機(jī)規(guī)避導(dǎo)彈問題中,構(gòu)建一套無人機(jī)規(guī)避導(dǎo)彈系統(tǒng)。使用人工勢場法實時構(gòu)建導(dǎo)彈的勢場,無人機(jī)沿勢場梯度方向運(yùn)動,規(guī)避導(dǎo)彈。本文提出在運(yùn)動的無人機(jī)和導(dǎo)彈坐標(biāo)系中構(gòu)建導(dǎo)彈人工勢場,并提出距離+導(dǎo)彈進(jìn)入角勢場函數(shù)對導(dǎo)彈威脅度評估,將人工勢場的決策轉(zhuǎn)化為無人機(jī)的控制指令。為了驗證該方法的有效性,使用六自由度無人機(jī)模型、質(zhì)點導(dǎo)彈模型進(jìn)行仿真驗證。
為了討論無人機(jī)規(guī)避導(dǎo)彈問題,首先需要構(gòu)建無人機(jī)規(guī)避導(dǎo)彈的追逃模型,如圖1 所示。其中,Vm為導(dǎo)彈速度,Vu為無人機(jī)速度。qm為導(dǎo)彈進(jìn)入角,即導(dǎo)彈速度矢量與視線方向的夾角,λ為無人機(jī)進(jìn)入角,即無人機(jī)速度矢量與視線的夾角。
圖1 無人機(jī)和導(dǎo)彈相對運(yùn)動模型Fig.1 Relative motion model of UAV with missile
導(dǎo)彈使用比例導(dǎo)引追蹤目標(biāo),無人機(jī)使用適當(dāng)?shù)囊?guī)避策略來逃脫導(dǎo)彈追擊。本文主要進(jìn)行方法層面的驗證工作,未考慮傳感器影響。在仿真中,無人機(jī)能夠?qū)崟r獲取戰(zhàn)場態(tài)勢和導(dǎo)彈態(tài)勢。
創(chuàng)建勢場函數(shù)時,為了構(gòu)建勢場的直觀性,本文以導(dǎo)彈為中心建立勢場函數(shù),根據(jù)無人機(jī)相對導(dǎo)彈位置,評估導(dǎo)彈勢場對無人機(jī)的作用。而在無人機(jī)規(guī)避導(dǎo)彈問題中,導(dǎo)彈和無人機(jī)使用的坐標(biāo)系不同。無人機(jī)的坐標(biāo)不能直接在導(dǎo)彈的坐標(biāo)系中表示。因此,需要有統(tǒng)一的坐標(biāo)系,將導(dǎo)彈和無人機(jī)的相對位置表示在坐標(biāo)系中,以導(dǎo)彈為中心建立勢場函數(shù)。
使用導(dǎo)彈和無人機(jī)的經(jīng)緯度信息,在地心軸系下,計算導(dǎo)彈和無人機(jī)的相對坐標(biāo)。由于最終需要對無人機(jī)進(jìn)行控制,因此將相對坐標(biāo)從地心軸系轉(zhuǎn)到無人機(jī)牽連地軸系。無人機(jī)牽連地軸系原點定義在無人機(jī)體軸系原點,x軸指向正北,y軸指向正東,z軸鉛垂向下。如圖2 所示,從地心坐標(biāo)系向無人機(jī)牽連地軸系旋轉(zhuǎn)變換,可以通過以下三步實現(xiàn):(1)繞Z軸轉(zhuǎn)動經(jīng)度λ,形成坐標(biāo)系X1Y1Z1,其中X1垂直于地面方向向上,Y1在赤道平面內(nèi)與赤道相切指向東,Z1垂直于赤道平面指向北;(2)繞Y1軸轉(zhuǎn)動緯度?φ,形成坐標(biāo)系X2Y2Z2,其中X2垂直于地面方向向上,Y2在緯度平面內(nèi)與緯線相切指向東,Z2與經(jīng)線相切指向北;(3)繞Y2軸轉(zhuǎn)動-90°,與無人機(jī)牽連地軸系重合。
⑦地方政府確保投入。地方各級政府要將水土保持治理經(jīng)費(fèi)列入當(dāng)年年度財政預(yù)算,并隨著財政收入好轉(zhuǎn)逐步增加水土保持工作經(jīng)費(fèi)。根據(jù)規(guī)劃,每年市和縣級財政應(yīng)當(dāng)安排治理水土流失生態(tài)修復(fù)投資1 000萬元以上,確保目標(biāo)任務(wù)的全面完成。
圖2 地心坐標(biāo)系向無人機(jī)牽連地軸系旋轉(zhuǎn)過程Fig.2 Rotation of earth center coordinate system to aircraft traction ground coordinate system
由于無人機(jī)的牽連地軸系以無人機(jī)為中心,因此需將坐標(biāo)系原點移動到導(dǎo)彈中心。假設(shè)導(dǎo)彈在無人機(jī)牽連地軸系的位置為M(x0,y0,z0)。由于需要以導(dǎo)彈為中心構(gòu)建勢場,則無人機(jī)在人工勢場中的坐標(biāo)設(shè)置為N(?x0,?y0,?z0)。將此坐標(biāo)代入人工勢場的公式,即可求取無人機(jī)受到導(dǎo)彈的勢場力。因此,所有在無人機(jī)牽連地軸系的矢量,通過減去M(x0,y0,z0),可轉(zhuǎn)為以導(dǎo)彈為中心的矢量。
假設(shè)無人機(jī)關(guān)于導(dǎo)彈的相對位置為(xt,yt,zt),則導(dǎo)彈與無人機(jī)的距離為
式中:(xt,yt,zt)為無人機(jī)相對于導(dǎo)彈的位置,D為導(dǎo)彈與無人機(jī)的距離。
距離勢場函數(shù)可以創(chuàng)建為如下形式
式中:kD為正的系數(shù),D為導(dǎo)彈與無人機(jī)的距離,σ為小量,防止分母為0 和乘數(shù)為0,造成(0,0)點突變。Dbound為距離邊界,大于此值勢場作用為0。UD為距離勢場函數(shù)。
根據(jù)上述公式,繪制不同高度時的距離人工勢場如圖3所示。圖3 中z方向代表勢場大小,顏色映射勢場的大小,紅色為勢場大的地方,藍(lán)色為勢場小的地方。由圖3可知,勢場大小以(0,0)點為中心,向四周不斷下降。當(dāng)無人機(jī)沿勢場減小的方向運(yùn)動時,將增大與導(dǎo)彈的距離,遠(yuǎn)離導(dǎo)彈的威脅。
圖3 高度為0m、1000m、5000m時距離人工勢場Fig.3 Distance APF at h=0,h=1000m,h=5000m
在無人機(jī)規(guī)避導(dǎo)彈問題中,由于距離勢場函數(shù)考慮高度的影響。而無人機(jī)爬升性能并沒有導(dǎo)彈強(qiáng),導(dǎo)彈在發(fā)射后,急速提高速度,短期速度增加能力比無人機(jī)高。因此,使用距離勢場函數(shù)時,可以去掉高度的影響,即
導(dǎo)彈對無人機(jī)的威脅不僅可以從距離角度考慮,也可以從導(dǎo)彈進(jìn)入角(導(dǎo)彈速度方向與視線方向的夾角)考慮。設(shè)導(dǎo)彈進(jìn)入角為qm,導(dǎo)彈速度為(vx,vy,vz),同樣不考慮高度的影響,導(dǎo)彈進(jìn)入角計算公式如下所示
式中:qm為導(dǎo)彈進(jìn)入角,Vm為導(dǎo)彈速度矢量,MP為無人機(jī)與導(dǎo)彈的視線矢量。導(dǎo)彈進(jìn)入角的勢場函數(shù)創(chuàng)建為如下形式
式中:ka為正的系數(shù),qm為導(dǎo)彈進(jìn)入角,σ為小量,防止分母為0和乘數(shù)為0。Dbound為距離邊界,Ua為導(dǎo)彈進(jìn)入角勢場函數(shù)。
假設(shè)導(dǎo)彈速度方向沿x軸方向,繪制高度為0時的導(dǎo)彈進(jìn)入角勢場函數(shù),如圖4所示。
圖4 高度為0時導(dǎo)彈進(jìn)入角勢場函數(shù)Fig.4 Missile aspect angle APF at h=0
人工勢場以x軸正方向(導(dǎo)彈速度方向),往x軸負(fù)方向(背離導(dǎo)彈速度方向),勢場不斷下降。沿勢場減小的方向,能夠使導(dǎo)彈的速度方向與視線方向不一致,從而耗散導(dǎo)彈的能量。進(jìn)一步考慮距離勢場函數(shù)與導(dǎo)彈進(jìn)入角勢場函數(shù)的結(jié)合,如下形式
式中:kw為權(quán)重系數(shù),調(diào)節(jié)距離勢場和導(dǎo)彈進(jìn)入角勢場之間的比例關(guān)系。Ut為距離+導(dǎo)彈進(jìn)入角勢場函數(shù)。其他參數(shù)與其他勢場函數(shù)中意義相同。
繪制不同權(quán)重系數(shù)下的勢場函數(shù),如圖5 所示。圖5中,權(quán)重系數(shù)越大,勢場函數(shù)越偏向于導(dǎo)彈進(jìn)入角勢場;反之,越偏向于距離勢場。
圖5 高度為0時距離+導(dǎo)彈進(jìn)入角勢場函數(shù)Fig.5 Distacne+missile aspect angle APF at h=0
創(chuàng)建勢場函數(shù)后,使用梯度下降法對三維x,y,z方向分別求偏導(dǎo),得出輸出勢場函數(shù)對于x,y,z的偏導(dǎo)數(shù),即dUx,dUy,dUz。將求導(dǎo)得出的勢場力方向作為無人機(jī)速度使用,則無人機(jī)以此速度方向運(yùn)動,可以有效規(guī)避導(dǎo)彈。
式中:dUx,dUy,dUz為x,y,z方向的偏導(dǎo)數(shù),Vapfx,Vapfy,Vapfz為速度矢量在x,y,z方向的分量。將上述速度矢量轉(zhuǎn)化為控制指令
式中:|Vapf|為速度矢量,Vc為速度指令,γc為爬升角指令,χc為航向指令。勢場函數(shù)控制無人機(jī)方向,飛控中,將速度/爬升角/航向指令進(jìn)一步轉(zhuǎn)化為過載指令控制無人機(jī)飛行。
為了驗證不同勢場函數(shù)規(guī)避導(dǎo)彈的效果,使用自主開發(fā)的仿真軟件進(jìn)行仿真分析。仿真中設(shè)置同樣的初始條件,設(shè)置發(fā)射導(dǎo)彈無人機(jī)(攻擊機(jī))和規(guī)避導(dǎo)彈無人機(jī)(規(guī)避機(jī))的初始高度都為5000m,初始速度為Ma0.9。
本文使用的模型假設(shè)條件包括:(1)無人機(jī)使用六自由度模型,導(dǎo)彈使用質(zhì)點模型,考慮導(dǎo)彈的升阻特性和推力特性;(2)導(dǎo)彈采用比例導(dǎo)引制導(dǎo);(3)不考慮風(fēng)的影響。
導(dǎo)彈模型參考AIM-120 進(jìn)行配置。AIM-120 是第四代雷達(dá)型空空導(dǎo)彈,是現(xiàn)有空空導(dǎo)彈系統(tǒng)的重要力量,將該型導(dǎo)彈選為仿真試配對象具有代表性,所得結(jié)論對于無人機(jī)規(guī)避導(dǎo)彈具有普適指導(dǎo)意義。在本仿真中,配置導(dǎo)彈瞄準(zhǔn)線最大角速率為32,主動段距離15km,最大過載限制22,發(fā)動機(jī)工作時間5.6s,最大速度可達(dá)Ma4,制導(dǎo)方式為指令制導(dǎo)+慣性制導(dǎo)+主動雷達(dá)末制導(dǎo),制導(dǎo)率為比例導(dǎo)引,殺傷半徑10m。
使用不同的勢場函數(shù)進(jìn)行仿真,觀測仿真結(jié)果。圖6為迎頭條件下,無人機(jī)使用距離人工勢場規(guī)避導(dǎo)彈的仿真結(jié)果示意圖。圖6中,無人機(jī)發(fā)現(xiàn)導(dǎo)彈后,距離勢場函數(shù)控制無人機(jī)急速轉(zhuǎn)彎,將導(dǎo)彈置于尾后。之后保持與導(dǎo)彈方向相同,無人機(jī)成功規(guī)避導(dǎo)彈。仿真過程中,導(dǎo)彈的速度、升力系數(shù)、阻力系數(shù)、推力與無人機(jī)距離的變化如圖7所示。
圖6 無人機(jī)使用距離人工勢場規(guī)避導(dǎo)彈Fig.6 Missile avoidance by distance APF
圖7 仿真過程中導(dǎo)彈數(shù)據(jù)變化Fig.7 Missile data changes in simulation
使用導(dǎo)彈入射角勢場函數(shù)的仿真結(jié)果如圖8所示。圖8中,使用導(dǎo)彈進(jìn)入角勢場函數(shù),人工勢場法決策無人機(jī)擴(kuò)大導(dǎo)彈進(jìn)入角。無人機(jī)通過不斷轉(zhuǎn)彎,增大導(dǎo)彈進(jìn)入角。在此過程中,導(dǎo)彈能量被消耗,最終無人機(jī)使用導(dǎo)彈進(jìn)入角人工勢場成功規(guī)避導(dǎo)彈。
圖8 無人機(jī)使用導(dǎo)彈進(jìn)入角人工勢場規(guī)避導(dǎo)彈Fig.8 Missile avoidance by aspect angle APF
使用距離+導(dǎo)彈進(jìn)入角勢場函數(shù),能夠同時擁有距離勢場和導(dǎo)彈進(jìn)入角勢場的效果,如圖9 所示。圖9 中,迎頭態(tài)勢下,距離+導(dǎo)彈進(jìn)入角的勢場函數(shù)控制無人機(jī)進(jìn)入尾追態(tài)勢,之后通過增加導(dǎo)彈進(jìn)入角耗散導(dǎo)彈的能量。
圖9 無人機(jī)使用距離+導(dǎo)彈進(jìn)入角人工勢場規(guī)避導(dǎo)彈Fig.9 Missile avoidance by distance+aspect angle APF
本文使用人工勢場法研究無人機(jī)規(guī)避導(dǎo)彈問題。將人工勢場建立在無人機(jī)牽連地軸系,使用相對坐標(biāo),將坐標(biāo)原點建立在導(dǎo)彈中心。根據(jù)無人機(jī)在導(dǎo)彈威脅勢場中的梯度方向,在線決策無人機(jī)的運(yùn)動方向。通過仿真手段,本文驗證了人工勢場方法能夠控制無人機(jī)規(guī)避導(dǎo)彈,并提出距離+導(dǎo)彈進(jìn)入角勢場函數(shù)評估導(dǎo)彈的威脅度,利用距離勢場和導(dǎo)彈進(jìn)入角的特點規(guī)避導(dǎo)彈。
人工勢場能夠?qū)崟r根據(jù)無人機(jī)和導(dǎo)彈的相對態(tài)勢,在線作出決策。本文使用的人工勢場規(guī)避方法可通過構(gòu)建不同的勢場函數(shù),采取不同的威脅度評估方法,即不同策略規(guī)避導(dǎo)彈。