閆怡汝, 王 寅
(南京航空航天大學 航天學院,江蘇 南京 210016)
近年來無人機(unmanned aerial vehicles, UAV)廣泛應(yīng)用于各個領(lǐng)域.在偵查和監(jiān)視任務(wù)中,無人機需要依次飛越一系列目標,并利用機載探測裝置對目標進行觀測.規(guī)劃無人機飛行航路時,應(yīng)綜合考慮無人機飛行性能和機載探測裝置的可視范圍,以滿足任務(wù)的偵查要求.無人機航路規(guī)劃是指搜索從起點到終點的最短路徑,并滿足環(huán)境因素、無人機飛行特性以及傳感器性能等約束.目前的求解方法可分為確定性方法和啟發(fā)式算法兩類.
確定性的方法首先將優(yōu)化問題進行離散化,通過搜索笛卡爾空間中的最短曲線以獲得最優(yōu)解.如Dijkstra算法[1-2],人工勢場法[3]等基于圖論的尋優(yōu)算法被廣泛地應(yīng)用于無人系統(tǒng)最優(yōu)系統(tǒng)路徑的求解問題中.但這些方法往往基于局部信息搜索最優(yōu)解,其所得路徑的全局性較差[4].此外,如何選擇合適的離散化尺度也缺乏理論依據(jù),較大的尺度可以提高問題求解的效率,但所得解的精度較低而導致算法過早收斂[5].而過小的搜索尺度將使得計算復雜度急劇增加,發(fā)生維數(shù)災(zāi)難.
為解決基于圖論搜索方法的固有局限性, 尹高揚等[6]提出了一種基于自適應(yīng)邊界快速擴展隨機樹(RRT)的求解方法,提高了基于概率搜索算法在處理復雜、大規(guī)模優(yōu)化問題的效率.基于元啟發(fā)式的優(yōu)化方法,如遺傳算法[7]、粒子群優(yōu)化算法[8-9]在解決組合優(yōu)化問題中表現(xiàn)出優(yōu)越的性能.由于地表環(huán)境的遮擋目標可能無法始終處于探測裝置的可視區(qū)域之內(nèi),Wang等[10]研究城市環(huán)境中的傳感器可見區(qū)域,并提出以目標觀測時間作為性能指標求解最優(yōu)跟蹤路徑問題.邱華鑫等[11]提出了一種鴿群優(yōu)化(pigeon inspired optimization, PIO)算法,并在無人機編隊控制和圖像配準問題中獲得了成功的應(yīng)用.但是,在用于離散優(yōu)化問題時其求解效率和性能迅速下降.
目前,關(guān)于無人機航路規(guī)劃的研究方法大多僅考慮環(huán)境威脅以及無人機飛行性能等約束,對目標可探測范圍以及地表遮擋等因素的研究工作還不多見.因此,筆者針對復雜環(huán)境中的無人機偵查航路規(guī)劃問題開展研究,提出了一種基于動態(tài)規(guī)劃和鴿群優(yōu)化框架的混合規(guī)劃方法.
為了簡化分析,假設(shè)無人機在設(shè)定高度以恒定速度飛行,并忽略無人機偏航角和俯仰角的影響,無人機的運動學特性可以表示為[10]:
(1)
假設(shè)無人機的飛行姿態(tài)與探測裝置的視軸指向相互獨立.給定探測裝置的視場角和無人機的飛行高度,探測裝置的理論最大可探測范圍為可視錐體與地面的相交平面.但由于地表特征的遮擋,目標不能在任意角度被完整觀測.
根據(jù)探測裝置指向、視場參數(shù)、目標位置以及地面特征等條件,探測裝置對地面目標的可視范圍可以由視線傳播算法(sight of line propagation, LoS Propagation)進行求解[10],即計算視點與理論最大可探測范圍內(nèi)任意一點的連線是否與地表特征相交.若不相交,則說明地表上點為可探測點,反之為不可探測點.
假設(shè)無人機在恒定高度飛行,給定探測裝置的視場、視軸指向等參數(shù),地面目標的最大可探測區(qū)域可以表示為以目標為中心的半球.在此范圍內(nèi),通過分析探測裝置與目標的相對位置以及地表遮擋條件,移除視圖中被阻擋部分,目標的可探測區(qū)域為無人機飛行高度剖面與探測裝置可視半球的相交平面,如圖1(a)所示.因此,依次分析每個目標周圍的地形特征,可以求解出各個目標的可被觀測范圍,如圖1(b)所示.
圖1 目標可被觀測區(qū)域簡化模型Fig.1 Simplifed model of the target′s visibility regions
為使得無人機探測裝置能夠有效觀察目標,假設(shè)無人機在飛越目標附近空域時,必須至少接觸可視范圍內(nèi)的任何一點.
偵查任務(wù)的目的是以最小的時間代價獲取所有目標區(qū)域的有效信息.如果無人機的速度和高度恒定,則該問題等價于求解旅行商問題(travelling salesmen problem, TSP).標準的PIO算法針對連續(xù)優(yōu)化問題設(shè)計,由于目標偵查航路規(guī)劃問題的離散性,使用標準的PIO方法進行求解效率較低且準確性差.為此,筆者提出了一種離散化的PIO改進方法,改善離散優(yōu)化問題的性能.
由前文的分析可知,由于地表環(huán)境的遮擋,機載探測裝置不能在所有角度觀測到目標. 因此,在搜索最佳路徑時應(yīng)考慮探測裝置的可視區(qū)域.為了解決這一問題,筆者提出首先根據(jù)目標的空間分布確定無人機飛越各個目標的順序,得到初始航點.然后再根據(jù)目標的可視區(qū)域與無人機飛行性能的約束,基于動態(tài)規(guī)劃方法對初始航點進行優(yōu)化,以保證無人機能從適當?shù)慕嵌冗M入目標區(qū)域,實現(xiàn)對目標有效觀測.
鴿群優(yōu)化算法中,每個個體表示問題域中的一個可行解.在無人機偵查航路規(guī)劃問題中,鴿群中個體的位置和速度矢量可表示為:
(2)
式中:i=1,2,…N表示鴿群的規(guī)模;xiD為整數(shù),表示飛越目標的順序;D是目標的編號;Vi是與位置矢量具有相同維數(shù)的速度矢量.根據(jù)量子行為的演化過程,改進的地圖和磁場算子如下:
“你們是誰?想干什么?”雪螢掙扎著,拿腳去踢墨鏡男的腿。墨鏡男把雪螢的雙手反綁起來,脫掉她的高跟鞋,用一塊抹布把她的嘴堵起來,任她在車里折騰。墨鏡男掏出手機給范堅強打了個電話。
(3)
p=f1·pbesti+(1-f1)·gbest;
(4)
Xi(t+1)=p+β·|mbest-Xi(t)|·log(1/u)·
(exp(-R·NC))+Vi(t+1);
(5)
Vi(t+1)=Vi(t)·e-R·t+rand(gbest-Xi(t)),
(6)
式中:mi(t)是到第t次迭代時第i個鴿子的最優(yōu)解;mbest表示N只鴿子的平均最佳位置;f1表示0和1之間的隨機數(shù);pbest是第i只鴿子的最優(yōu)位置;gbest為所有個體的最優(yōu)解;β是創(chuàng)造力系數(shù);Xi(t+1)是(t+1)次迭代中第i只鴿子的相關(guān)位置信息;u是0和1之間的隨機數(shù).
基于連續(xù)鴿群優(yōu)化的更新方式,所得解Xi(t+1)可能無法正確表示要訪問目標的順序,出現(xiàn)大量無效解,降低算法的尋優(yōu)性能.為解決這一問題,筆者首先通過對初始解取整獲得離散解.但由于舍入解決方案可能不包含所有目標的標記,因此將缺少的部分添加到位置初始解Xi(t+1)中,該向量由路徑規(guī)劃問題的有效解組成.采用“取整補全”方法對位置矢量進行離散化處理,第一步采用四舍五入取整法,將優(yōu)化結(jié)果全部取整,篩選出超出所需離散范圍以及重復出現(xiàn)的數(shù),將不符合要求的位置矢量均置0;第二步對其補全,將遺漏的位置變量進行排列組合,并將所有排列組合一次放入遺漏的位置變量中,再挑選出適應(yīng)值更優(yōu)的排列方式,以完成對可行航跡優(yōu)化路線的離散化處理.
地標算子使得鴿群的整體運動向中心聚攏,從而加快算法的收斂速度,是一種局部搜索策略.當全局搜索不夠充分,鴿群尚未到達最優(yōu)解附近時,基于未改進的更新策略可能會使得算法陷入局部最小值中.為避免早熟收斂的問題,筆者采用次優(yōu)解作為鴿群的地標,在實現(xiàn)鴿群總體向中心聚攏的同時,具有一定的全局搜索能力:
(7)
(8)
Xi(t+1)=Xi(t)+rand·(mbest-Xi(t)),
(9)
式中:Nc是地標算子中定義的種群大小.
在第一步求解中,只需要確定無人機的航點排序,因此可以采用無人機航路的長度評估每個個體的適應(yīng)度:
fc=dist(Xi),
(10)
式中:函數(shù)dist()用于計算給定目標順序Xi的航路長度.用于優(yōu)化偵察航跡的完整代價函數(shù)為:
(1-f2)×(180-arccos(((yi+1-yi,n)2+
(xi+1-xi,n)2+(yi,n-yi-1)2+
(xi,n-xi-1)2-(yi+1-yi-1)2-
(11)
如前文所述,為實現(xiàn)對目標的有效觀測,無人機應(yīng)當根據(jù)探測裝置的可視區(qū)域飛越目標.因此,無人機的飛行航點應(yīng)至少位于各個目標可視范圍的邊界上.筆者基于動態(tài)規(guī)劃策略,對所得的初步航點進行優(yōu)化,如圖2所示,考慮3個相鄰的目標區(qū)域,固定飛越第i-1和i+1兩個航點,通過PIO算法確定第i個目標可視范圍的邊界,從而得到滿足目標觀測要求和飛行性能約束的最優(yōu)航點.無人機的轉(zhuǎn)彎半徑與飛行速度與滾轉(zhuǎn)角約束有關(guān),因此其最大可跟蹤航路可由Dubins方法進行求解.
圖2 基于動態(tài)規(guī)劃的航點優(yōu)化示意圖Fig.2 Schematic diagram illustrate the polygon point selection process
所得的優(yōu)化航點除了滿足對目標的有效觀測外,還應(yīng)當考慮無人機航程和機動性能的約束,因此所得航點的代價可以表示為:
fc=f2·d+(1-f2)×(180-A),
(12)
式中:f2是一個會影響所得路線長度和轉(zhuǎn)角的權(quán)重因子.給定3個連續(xù)的多邊形,距離和轉(zhuǎn)角可以如圖2計算.
為了驗證所提算法的有效性和準確性,筆者將其與標準PIO算法以及量子粒子群優(yōu)化算法(quantum particle swarm optimization, QPSO)進行比較,用于解決復雜環(huán)境中的偵查路徑優(yōu)化問題.上述3種算法在個人計算機(Intel i7 3.6 GHz和16 GB內(nèi)存)上使用MATLAB實現(xiàn),可調(diào)參數(shù)根據(jù)相關(guān)文獻和標準Benchmark數(shù)據(jù)集測試來確定.仿真針對復雜環(huán)境下的目標偵查航路規(guī)劃問題,基本設(shè)計如下:隨機生成15個多邊形用于表示目標的可探測區(qū)域.對于PIO算法,以每個多邊形的中心作為無人機需飛越的航點.初始參數(shù)設(shè)置及取值為R=0.1,N=100,D=15,C1=400,C2=600.
圖3為采用標準PIO算法和筆者所提出方法所得到的最優(yōu)飛行航路.從圖3(a)可以看出,由于無人機轉(zhuǎn)彎半徑的約束,通過標準PIO算法獲得的可跟蹤路徑不能夠完成對所有目標區(qū)域的有效探測.如圖3(b)所示,由于筆者所提出的航路優(yōu)化算法同時考慮了對目標觀測和無人機機動性能的約束,所得到的航路在滿足對目標區(qū)域有效觀測的同時,所得到的航線也更加平滑.
圖3 標準PIO算法(a)和所提出的方法(b)產(chǎn)生的路徑Fig.3 The resulting path obtained through the standard PIO algorithm (a) and the proposed method (b)
從圖4可以看到,筆者所提出方法具有更快的收斂速度和更好的尋優(yōu)能力.這是因為對PIO算法的兩種導航算子進行了離散化改進,提高了其用于解決非連續(xù)優(yōu)化問題的能力.此外,所提出的方法利用改進的地標算子考慮到在最優(yōu)性附近產(chǎn)生更多的解,從而進一步增加收斂速度.
圖4 不同算法的收斂曲線Fig.4 Illustrate the convergence of different methods
為了驗證所提方法面向大規(guī)模復雜問題中的性能, 進一步將上述算法應(yīng)用于由1 000個目標組成的場景中.為了消除初始化的影響,所有算法都運行20次,這些方法的性能如表1~3所示.
表1 使用不同方法的路徑規(guī)劃的航程比較Tab.1 Comparison of the ranges for route planning using different methods
表2 使用不同方法的路徑規(guī)劃的未覆蓋目標數(shù)量比較Tab.2 Comparison of the number of uncovered targets for route planning using different methods
從表1可以看出,從所得到最優(yōu)航路的航程上來看,所提出的方法比基于QPSO的規(guī)劃方法稍差,略優(yōu)于標準的PIO算法.這是因為基于QPSO的規(guī)劃方法沒有考慮目標的可探測性,而是僅以總的航程為最優(yōu)指標對航路進行規(guī)劃.
從表2中可以看出,標準PIO和QPSO這兩種方法均未能實現(xiàn)對所有目標的有效探測,不能完整地完成目標偵查的任務(wù).表3統(tǒng)計了3種規(guī)劃算法的執(zhí)行時間,可以看到筆者提出方法的總時間要高于另外兩種算法(耗時增加約35%),這是因為筆者所研究算法綜合目標可探測性和無人機機動性,對航點進行了進一步優(yōu)化.從任務(wù)完成度和算法效率兩方面綜合考慮,方法的整體性能要優(yōu)于標準PIO方法和基于QPSO的規(guī)劃方法.
表3 使用不同方法的路徑規(guī)劃的平均運行時間比較Tab.3 Comparison of the average running time for route planning using different methods
筆者研究了復雜環(huán)境下的無人機偵查航路規(guī)劃問題,針對機載探測裝置與地表特征間的相對空間關(guān)系給出了目標可視范圍模型,并將其作為被優(yōu)化的要素用于求解最優(yōu)航路.針對標準PIO算法不用直接用于求解非連續(xù)優(yōu)化問題,筆者提出了離散化改進算法,改善了其用于離散優(yōu)化問題的性能.仿真結(jié)果表明,與標準PIO算法和QPSO算法相比,筆者所提出的航路規(guī)劃方法具有更快的收斂速度和尋優(yōu)能力,并極大提高了偵查任務(wù)的完成度.