摘 要:針對(duì)多無人機(jī)協(xié)同路徑規(guī)劃問題,提出了一種決策學(xué)習(xí)型蜣螂優(yōu)化算法(DLDBO)。傳統(tǒng)蜣螂優(yōu)化算法(DBO)種群之間缺乏信息互換,容易陷入局部最優(yōu)解。因此,利用Pearson相關(guān)系數(shù)計(jì)算個(gè)體之間的相似性,通過相似性指標(biāo)判斷并作出決策:若不相似,利用折射反向?qū)W習(xí)計(jì)算得到候選解,在一定程度上提高個(gè)體之間影響的同時(shí)增強(qiáng)算法跳出局部最優(yōu)的能力;若相似,利用所提出的鏈?zhǔn)洁徑鼘W(xué)習(xí)引導(dǎo)蜣螂個(gè)體,增加影響個(gè)體更新的因素,充分促進(jìn)個(gè)體之間的信息交流。在CEC2017測(cè)試套件的29個(gè)測(cè)試函數(shù)上進(jìn)行了充分的對(duì)比實(shí)驗(yàn),結(jié)果表明,DLDBO性能明顯優(yōu)于其他六種先進(jìn)的變體算法。利用DLDBO規(guī)劃無人機(jī)群的飛行路徑,最終能夠得到較為理想的協(xié)同路徑并且有效避開威脅,優(yōu)于其余三種優(yōu)秀的協(xié)同路徑規(guī)劃算法,滿足了無人機(jī)協(xié)同飛行的需求。
關(guān)鍵詞:蜣螂優(yōu)化算法;折射反向?qū)W習(xí);鏈?zhǔn)洁徑鼘W(xué)習(xí);無人機(jī)協(xié)同路徑規(guī)劃
中圖分類號(hào):TP18;V249.4"" 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2025)01-027-0196-09
doi: 10.19734/j.issn.1001-3695.2024.06.0178
UAV collaborative path planning based on decision learning dung beetle optimization algorithm
Abstract:A decision learning dung beetle optimization algorithm (DLDBO) solves the problem of multi-UAV collaborative path planning. The traditional dung beetle optimization algorithm (DBO) lacks information exchange among populations and easily falls into local optimal solutions. Therefore, this paper used the Pearson correlation coefficient to calculate the similarity between individuals and used the similarity index to make decisions. If individuals were not similar, it applied refraction reverse learning to calculate the candidate solution, which improved interaction among individuals and enhanced the algorithm’s ability to escape local optima. If individuals were similar, it guided dung beetle individuals using the proposed chain proximity learning, increasing factors affecting individual renewal and promoting information exchange. Comparative experiments on 29 test functions of the CEC2017 test suite show that the DLDBO algorithm significantly outperforms six other advanced variants. Using DLDBO for UAV flight path planning obtains an ideal collaborative path, effectively avoiding threats and surpassing three other excellent collaborative path planning algorithms, meeting the needs of UAV collaborative flight.
Key words:dung beetle optimization algorithm; refraction reverse learning; chain proximity learning; UAV collaborative path planning
0 引言
無人機(jī)技術(shù)的快速發(fā)展為許多領(lǐng)域帶來了革命性的變革,據(jù)估計(jì),數(shù)百萬臺(tái)無人機(jī)(UAV)已被廣泛應(yīng)用于各種現(xiàn)實(shí)生活場(chǎng)景,包括民用領(lǐng)域,如監(jiān)視、交通管理、環(huán)境監(jiān)測(cè)、農(nóng)業(yè)服務(wù)和救援等[1~3]。結(jié)合啟發(fā)式算法和無人機(jī)技術(shù),不僅可以提高問題求解的效率,還能拓展應(yīng)用領(lǐng)域,實(shí)現(xiàn)更加智能化和自動(dòng)化的解決方案。如文獻(xiàn)[4,5]中,啟發(fā)式算法與無人機(jī)技術(shù)的結(jié)合將為未來智能化系統(tǒng)帶來更多可能性,推動(dòng)無人機(jī)應(yīng)用的進(jìn)一步發(fā)展,為社會(huì)各行業(yè)帶來更多便利和效益。啟發(fā)式算法在目前一些測(cè)試集上的尋優(yōu)速度更快,解決一些工程性的問題也更有優(yōu)勢(shì)?;诖?,為了更快速且高效地解決不同場(chǎng)景下的無人機(jī)協(xié)同路徑規(guī)劃問題,研究者們提出了許多基于智能優(yōu)化算法的解決方法。文獻(xiàn)[6]通過改進(jìn)混合粒子群算法對(duì)多架無人機(jī)進(jìn)行路徑規(guī)劃,并在與KTSP-GA以及K-MEANS+LG-PSO算法的對(duì)比中占據(jù)優(yōu)勢(shì)。文獻(xiàn)[7]利用改進(jìn)的和聲搜索算法得到每架無人機(jī)遍歷節(jié)點(diǎn)的最優(yōu)順序,進(jìn)而獲得各無人機(jī)的規(guī)劃路徑。文獻(xiàn)[8]以最大化受災(zāi)群眾滿意度為目標(biāo)建立了卡車-無人機(jī)協(xié)同物資配送模型,并使用了自適應(yīng)大鄰域搜索算法對(duì)模型進(jìn)行求解,從而得到理想的飛行路徑。文獻(xiàn)[9]提出了一種基于三階段的智能優(yōu)化算法,先后對(duì)多無人機(jī)區(qū)域覆蓋路徑以及車輛協(xié)同路徑進(jìn)行規(guī)劃,快速構(gòu)造可行解,而后基于自適應(yīng)大規(guī)模鄰域搜索算法對(duì)可行解進(jìn)行優(yōu)化。基于上述的一些研究案例,當(dāng)前無人機(jī)協(xié)同路徑規(guī)劃問題依舊存在一些共性難點(diǎn)。在算法方面,需要設(shè)計(jì)有效的協(xié)同策略,使多架無人機(jī)能夠協(xié)調(diào)行動(dòng),避免沖突和資源浪費(fèi),同時(shí)實(shí)現(xiàn)任務(wù)目標(biāo);無人機(jī)之間需要實(shí)時(shí)通信來共享位置信息和狀態(tài)數(shù)據(jù),使得約束條件大大增加;隨著無人機(jī)數(shù)量的增加,路徑規(guī)劃的計(jì)算復(fù)雜度呈指數(shù)級(jí)增長(zhǎng)。上述問題都要求高效的算法在合理時(shí)間內(nèi)找到最優(yōu)或近似最優(yōu)路徑。
蜣螂優(yōu)化算法是文獻(xiàn)[10]提出的一種新的元啟發(fā)式算法,其模仿了蜣螂的各種習(xí)性,具有原理簡(jiǎn)單、收斂速度快、適用范圍廣等優(yōu)點(diǎn)??梢娫撍惴ㄒ簿哂泻芨叩难芯恳约皯?yīng)用價(jià)值。因此在其誕生不久,就已經(jīng)出現(xiàn)了很多種基于該算法基礎(chǔ)之上的變體算法,并被應(yīng)用到了如光伏發(fā)電功率預(yù)測(cè)、群體智能避障等多種優(yōu)化問題上。如天下沒有免費(fèi)的午餐定律(NFL)所說,并不存在任何一種算法適用于所有的優(yōu)化問題。因此針對(duì)不同的實(shí)際問題,需要從不同的側(cè)重點(diǎn)對(duì)算法作出改進(jìn)。為了增強(qiáng)移動(dòng)機(jī)器人在復(fù)雜環(huán)境中進(jìn)行路徑規(guī)劃的搜索能力,文獻(xiàn)[11]提出了一種混合策略改進(jìn)的蜣螂優(yōu)化算法。其利用ISPM混沌策略初始化種群;結(jié)合貪婪選擇策略與透鏡成像反向?qū)W習(xí)策略,改進(jìn)蜣螂覓食更新方式;引入Lévy飛行并加入改進(jìn)動(dòng)態(tài)權(quán)重更新方式,改進(jìn)盜竊者的位置更新方式。文獻(xiàn)[12]以海洋牧場(chǎng)三維環(huán)境為研究對(duì)象,采用改進(jìn)的蜣螂優(yōu)化算(IDBO)實(shí)現(xiàn)水下傳感器網(wǎng)絡(luò)的覆蓋。在初始化階段引入Chebyshev混沌映射;小蜣螂覓食階段利用自適應(yīng)權(quán)重因子以及Lévy飛行改進(jìn)覓食更新公式,提升了算法的收斂能力。文獻(xiàn)[13]引入Cubic混沌映射、t分布擾動(dòng)以及高斯編譯擾動(dòng)改進(jìn)蜣螂優(yōu)化算法(IDBO),利用IDBO設(shè)計(jì)了優(yōu)化混合核極限學(xué)習(xí)機(jī)(HKELM)的系統(tǒng)諧波阻抗估計(jì)模型。文獻(xiàn)[14]利用提出的多策略改進(jìn)的蜣螂優(yōu)化算法(MIDBO)優(yōu)化油浸式變壓器的故障診斷,引入了Bernoulli混沌映射、Lévy飛行以及動(dòng)態(tài)權(quán)重策略。
針對(duì)協(xié)同路徑規(guī)劃問題,本文著重考慮了種群之間的交流以及相互之間的影響,從而提出了鏈?zhǔn)洁徑鼘W(xué)習(xí)策略,改善種群之間的學(xué)習(xí)效率。結(jié)合折射反向?qū)W習(xí),根據(jù)種群相似度的差異性作出相應(yīng)決策,增強(qiáng)了算法的綜合性能。
1 蜣螂優(yōu)化算法
1.1 偽隨機(jī)數(shù)初始化種群
通過偽隨機(jī)數(shù)的方式生成初始種群,利用單個(gè)矩陣存儲(chǔ)每只蜣螂在各個(gè)維度的位置信息,針對(duì)不同維度的優(yōu)化問題,可調(diào)整矩陣的大小。矩陣X的第i行存儲(chǔ)了第i只蜣螂的位置信息,其中包括了個(gè)體在不同維度中的位置數(shù)據(jù),若存在pop只蜣螂同時(shí)迭代尋優(yōu),即種群規(guī)模大小為pop。
其中:[X1i,X2i,…,XDi]包含了t時(shí)刻第i只蜣螂在D個(gè)維度上的位置信息分量。
1.2 滾球行為
在光照的引導(dǎo),且在無障礙模式下,滾球蜣螂保持正常路徑行進(jìn)。位置更新為
Xt+1i=Xti+α·k·Xt-1i+b·ΔX(2)
ΔX=Xti-Xworst(3)
其中:Xt+1i為更新后滾球蜣螂子代個(gè)體的位置信息;k∈[0,0.2],代表偏轉(zhuǎn)系數(shù);b∈(0,1],是一個(gè)常系數(shù);ΔX利用最差位置Xworst模擬了太陽光照的變化;α是一個(gè)非-1則1的值,α=-1時(shí)表明蜣螂偏離軌跡。α=1時(shí),不存在偏離的情況。若存在障礙物阻礙蜣螂前進(jìn)時(shí),需要通過跳舞行為重新調(diào)整方向,其更新模式為
Xt+1i=Xti+tan(θ)Xti-Xt-1i(4)
其中:θ∈(0,π)。
1.3 繁殖行為(卵球)
雌性蜣螂為了給后代提供一個(gè)安全的成長(zhǎng)環(huán)境,會(huì)選擇一個(gè)安全區(qū)域產(chǎn)卵,利用邊界選擇策略模擬了一個(gè)嚴(yán)格的產(chǎn)卵區(qū)域如式(5)所示。確定產(chǎn)卵區(qū)域后,卵球的位置會(huì)在動(dòng)態(tài)區(qū)域內(nèi)更新變化,如式(6)所示。
Lb*=max(Xtbest(1-r),Lb)Ub*=min(Xtbest(1+r),Ub)(5)
Xt+1i=Xtbest+b1(Xti-Lb)+b2(Xti-Ub)(6)
其中:Xtbest表示當(dāng)前局部最優(yōu)位置;Lb*和Ub*分別表示產(chǎn)卵區(qū)域的上下界;r=1-t/Tmax,Tmax表示最大迭代次數(shù);Xti為卵球i經(jīng)t次迭代的位置;b1和b2表示兩個(gè)獨(dú)立的隨機(jī)向量。
1.4 覓食行為
一些在最佳覓食區(qū)覓食的甲蟲被稱為小蜣螂,最佳覓食區(qū)域的邊界定義如式(7)所示。確定最佳覓食區(qū)域后,小蜣螂在區(qū)域內(nèi)迭代更新,位置更新公式如式(8)所示。
Lbb=max(Xtgbest(1-r),Lb)Ubb=min(Xtgbest(1+r),Ub)(7)
Xt+1i=Xti+C1(Xti-Lbb)+C2(Xti-Ubb)(8)
其中:Xtgbest表示當(dāng)前全局最優(yōu)的位置;Lbb和Ubb分別表示最佳覓食區(qū)域的下限和上限;Xti表示小蜣螂i經(jīng)t次迭代后的位置;C1表示服從正態(tài)分布的隨機(jī)數(shù);C2表示屬于(0,1)的隨機(jī)向量。
1.5 盜竊行為
一些被稱為小偷的蜣螂會(huì)從其他蜣螂那里偷糞球,迭代過程中,小偷的位置信息被更新,并且可以描述為
Xt+1i=Xtgbest+S·g(Xti-Xtgbest+Xti-Xtbest)(9)
其中:Xti表示經(jīng)t次迭代時(shí)第i個(gè)小偷蜣螂的位置信息;g是維度大小為1×D的隨機(jī)向量;S表示常數(shù)值。
2 決策學(xué)習(xí)型蜣螂優(yōu)化算法(DLDBO)
針對(duì)每個(gè)蜣螂個(gè)體獨(dú)立迭代,缺少個(gè)體之間的相互影響力,替換比較的過程也只存在于迭代前后,導(dǎo)致每個(gè)個(gè)體一旦陷入局部最優(yōu)的極值點(diǎn)且沒有外部因素影響的情況下,很難通過隨機(jī)迭代的方式跳出局部最優(yōu)點(diǎn)。這種搜索過程極為單一,對(duì)解空間的搜索不徹底。因此,本文提出鏈?zhǔn)洁徑鼘W(xué)習(xí)策略提高個(gè)體之間的交流,加深個(gè)體之間的相互影響。此種方法使得不同類型蜣螂之間相互約束。此外,為了避免算法精度的降低,利用Pearson相關(guān)系數(shù)計(jì)算兩個(gè)體之間的相關(guān)性,利用該指標(biāo)判定不同維度上位置信息的相似性。若相似,則采取折射反向?qū)W習(xí)策略生成反方向的候選解;若不相似,則采取本文鏈?zhǔn)洁徑鼘W(xué)習(xí)策略改善全局尋優(yōu)性能。
2.1 Pearson相關(guān)系數(shù)
Pearson相關(guān)系數(shù)是一種衡量?jī)蓚€(gè)變量之間線性關(guān)系強(qiáng)度和方向的統(tǒng)計(jì)量。它衡量了兩個(gè)變量之間的線性相關(guān)程度,取值為-1~1,其中1表示完全正相關(guān),-1表示完全負(fù)相關(guān),0表示沒有線性相關(guān)性。Pearson相關(guān)系數(shù)通過計(jì)算變量之間的協(xié)方差和各自標(biāo)準(zhǔn)差的比值來計(jì)算。因此,本文將兩個(gè)體的位置信息作為多維變量,利用Pearson相關(guān)系數(shù)計(jì)算兩個(gè)體之間的線性相關(guān)性,以此來判斷兩個(gè)體位置信息的相似性。Pearson相關(guān)系數(shù)的公式如下:
2.2 折射反向?qū)W習(xí)
折射反向?qū)W習(xí)機(jī)制是在反向?qū)W習(xí)的基礎(chǔ)上引入光的折射原理來尋找最優(yōu)解。為了規(guī)避后期易陷入局部最優(yōu),導(dǎo)致收斂精度和速度變差的問題,在個(gè)體之間普遍相似時(shí),利用折射反向?qū)W習(xí)生成候選解,幫助算法跳出局部最優(yōu)。具體原理如圖1所示。
圖1中,原折射反向?qū)W習(xí)中以當(dāng)前靠近邊界的兩個(gè)個(gè)體作為介質(zhì)的端點(diǎn)。本文為了降低算法的時(shí)間復(fù)雜度,避免在每次迭代之后計(jì)算介質(zhì)端點(diǎn)的位置信息,直接采用邊界點(diǎn)作為介質(zhì)端點(diǎn)。α和β分別表示入射角和折射角,L和L*分別表示入射光線和折射光線。由幾何關(guān)系得出
其中:由折射原理中的折射率定義可得η=sin α/sin β,結(jié)合式(11)(12)得到
令=L*/L,并定義為一個(gè)隨迭代次數(shù)非線性遞減的變量,數(shù)學(xué)模型為
其中:g是分布于[0,1]的隨機(jī)數(shù),代入式(13),定義n=1,變換之后得到
2.3 鏈?zhǔn)洁徑鼘W(xué)習(xí)策略
本文提出了一種用于加強(qiáng)種群之間信息交流的鏈?zhǔn)洁徑鼘W(xué)習(xí)策略,旨在通過不斷鏈接鄰近個(gè)體,加深鄰近個(gè)體之間的信息交流,使所有粒子之間或多或少都有一些影響。整個(gè)種群被鏈接成一個(gè)整體,而非個(gè)體之間獨(dú)立搜索互不影響。為了在不增大時(shí)間復(fù)雜度的前提下充分提升個(gè)體之間的信息交流度,定義了一個(gè)學(xué)習(xí)率μ,μ∈[0,1]且服從正態(tài)分布。針對(duì)不同的學(xué)習(xí)率,采取不同的更新策略。當(dāng)μ∈[0,0.5],更新方式為
Xt+1i=Xti+((2ω-1)μ)(Xti-1-Xgbest)+r(Xt-1i+1-Xti)(16)
其中:Xti-1表示迭代序列中第i-1個(gè)粒子經(jīng)t次迭代后的個(gè)體位置;Xt-1i+1表示迭代序列中第i+1個(gè)粒子經(jīng)t-1次迭代后的個(gè)體位置。模型如圖2所示。
當(dāng)μ∈[0,0.5],更新方式為
Xt+1i=Xti+((2ω-1)μ)(Xti+1-Xgbest)+r(Xt+1i-1-Xti)(17)
其中:Xt+1i-1表示迭代序列中第i-1個(gè)粒子經(jīng)t+1次迭代后的個(gè)體位置。模型如圖3所示。
結(jié)合式(16)(17)兩種不同學(xué)習(xí)率下的更新方式,得到鏈?zhǔn)洁徑鼘W(xué)習(xí)的更新公式為
2.4 改進(jìn)策略的偽代碼
通過以上兩種策略結(jié)合對(duì)不同個(gè)體之間相似性的計(jì)算并作出適應(yīng)性的決策,整個(gè)改進(jìn)機(jī)制的偽代碼如下所示。
2.5 時(shí)間復(fù)雜度分析
時(shí)間復(fù)雜度是衡量算法性能的重要指標(biāo)之一,它描述了算法運(yùn)行時(shí)間隨著輸入規(guī)模增加而增加的趨勢(shì)。若時(shí)間復(fù)雜度較高,意味著隨著問題規(guī)模的增大,算法的運(yùn)行時(shí)間會(huì)呈指數(shù)級(jí)增長(zhǎng),導(dǎo)致算法在處理大規(guī)模數(shù)據(jù)時(shí)效率低下。假設(shè)DBO種群數(shù)量為pop,最大迭代次數(shù)為M,輸入數(shù)據(jù)維度為D,則DBO的時(shí)間復(fù)雜度可表示為O(D×M×pop)。表1為不同算法的時(shí)間復(fù)雜度對(duì)比。
3 算法性能測(cè)試
為了驗(yàn)證DLDBO算法的尋優(yōu)性能,本文選取CEC2017測(cè)試套件,與其他先進(jìn)變體進(jìn)行對(duì)比測(cè)試并排序。利用數(shù)學(xué)工具Wilcoxon檢驗(yàn)和Friedman檢驗(yàn)綜合驗(yàn)證了DLDBO的優(yōu)越性。所有算法的參數(shù)設(shè)置如表2所示。仿真實(shí)驗(yàn)的環(huán)境為Windows10 64位,仿真軟件為MATLAB 2019a,處理器Intel CoreTM i5-7300HQ CPU @ 2.50 GHz。
3.1 CEC2017測(cè)試套件
CEC2017測(cè)試函數(shù)共有29個(gè)單目標(biāo)測(cè)試函數(shù),分別是單峰函數(shù)(F1、F3)、簡(jiǎn)單多峰函數(shù)(F4~F10)、混合函數(shù)(F11~F20)和組合函數(shù)(F21~F30)。表3中展示了這29個(gè)測(cè)試函數(shù)。
3.2 測(cè)試結(jié)果與對(duì)比分析
利用CEC2017測(cè)試套件與其他六種先進(jìn)的變體進(jìn)行性能比較,其中包括AMDBO[15]、GODBO[16]、MSADBO[17]、LMHHO[18]、QOWOA[19]、AGWO[20]。每個(gè)算法獨(dú)立測(cè)試運(yùn)行30次,通過最優(yōu)值、平均值、標(biāo)準(zhǔn)差三個(gè)指標(biāo)評(píng)價(jià)算法的性能。為了保證測(cè)試的嚴(yán)謹(jǐn)性,統(tǒng)一設(shè)定種群數(shù)pop=30,最大評(píng)估次數(shù)為10 000×D,其中維度D=30。為了明確算法之間存在的性能差異程度,在0.05顯著性水平下進(jìn)行Friedman檢驗(yàn)和Wilcoxon秩和檢驗(yàn)。測(cè)試結(jié)果如表4所示。
從表4的實(shí)驗(yàn)結(jié)果來看,在單峰函數(shù)(F1、F3)測(cè)試中,DLDBO的最優(yōu)值、平均值和標(biāo)準(zhǔn)差均不及DBO的其他三個(gè)變體,但對(duì)比DBO以及其他變體優(yōu)勢(shì)明顯。在F3的測(cè)試當(dāng)中,DLDBO的最優(yōu)值最接近理論值。對(duì)于簡(jiǎn)單多峰函數(shù)(F4~F10),DLDBO的總體優(yōu)勢(shì)并不明顯,其中主要表現(xiàn)在F4、F6和F10。此外,DLDBO在其余幾個(gè)函數(shù)中的穩(wěn)定性較優(yōu)。在混合函數(shù)(F11~F20)當(dāng)中,DLDBO表現(xiàn)出了絕對(duì)的優(yōu)勢(shì),最優(yōu)值、平均值和標(biāo)準(zhǔn)差都取得了第一。其中僅有F18和F21略差于MSADBO,并與另外幾類DBO變體性能持平。對(duì)于組合函數(shù)(F21~F30),DLDBO的最優(yōu)值往往能得到最接近理論最優(yōu)的值,在穩(wěn)定性上略有欠缺。綜合所有函數(shù)的測(cè)試數(shù)據(jù),利用Friedman檢驗(yàn)測(cè)試得到DLDBO以2.569 0的數(shù)值排名第一,可見DLDBO的綜合性能優(yōu)異。利用30次實(shí)驗(yàn)的平均值,繪制平均收斂對(duì)比曲線,如圖4所示。直觀地展現(xiàn)了DLDBO的卓越性能,特別是在F6、F10、F12、F14、F15、F16、F19、F23及F26的測(cè)試中,DLDBO可以穩(wěn)定地計(jì)算得到相對(duì)理想的結(jié)果。
4 多無人機(jī)協(xié)同路徑規(guī)劃
4.1 建立代價(jià)函數(shù)
協(xié)同航跡規(guī)劃的目標(biāo)是使m架無人機(jī)從起始區(qū)域到目標(biāo)區(qū)域的總耗能最小,同時(shí)m架無人機(jī)必須避開威脅區(qū)域且不相互碰撞。還需要考慮飛行軌跡的平均總長(zhǎng)度、平均高度、路徑平滑度。此外,還需納入每架無人機(jī)之間的距離約束、無人機(jī)兩兩之間存在的最小安全距離。
路徑長(zhǎng)度代價(jià)是評(píng)價(jià)路徑優(yōu)劣的指標(biāo)之一,路徑越短,燃油損耗越小,其中路徑長(zhǎng)度代價(jià)模型如式(19)所示。
由于無人機(jī)在轉(zhuǎn)彎時(shí)會(huì)受到空氣阻力的影響,所以在無人機(jī)轉(zhuǎn)彎時(shí),轉(zhuǎn)角越小,受到的空氣阻力越大,從而造成更多的能量損耗,飛行的平滑度代價(jià)同樣也是無人機(jī)飛行的重要指標(biāo)之一。假設(shè)最大轉(zhuǎn)角為ρ,當(dāng)前轉(zhuǎn)角為θ, χj是路段j的矢量,其數(shù)學(xué)模型如式(20)~(22)所示。
穩(wěn)定的飛行高度有助于提高無人機(jī)的飛行效率和能源利用率。為了維持飛行高度的穩(wěn)定性,設(shè)計(jì)的高度代價(jià)數(shù)學(xué)模型為
其中:H0為地形無人機(jī)垂直映射在地面的海拔高度。
針對(duì)無人機(jī)之間的協(xié)同問題,本文首先考慮到無人之間的距離約束。本文定義了無人機(jī)之間的安全距離ds,在保持安全距離的同時(shí),需要維持無人機(jī)兩兩之間的距離相對(duì)較近。數(shù)學(xué)模型為
綜合上述四類因素,本文的代價(jià)模型可表示為
4.2 實(shí)驗(yàn)結(jié)果與分析
本文在MATLAB 2019a環(huán)境中建立了一個(gè)三維地圖,其中包含了若干可控的柱形障礙物。在此環(huán)境下對(duì)各算法進(jìn)行測(cè)試對(duì)比。設(shè)置各權(quán)重的值,λ=0.2,λ=0.1,λ=0.1,λ=0.6,無人機(jī)群的飛機(jī)數(shù)量為4個(gè)。為了驗(yàn)證決策學(xué)習(xí)型蜣螂優(yōu)化算法在編隊(duì)無人機(jī)協(xié)同路徑規(guī)劃中的優(yōu)化效果與優(yōu)勢(shì),在該環(huán)境下與幾種先進(jìn)的路徑規(guī)劃算法進(jìn)行比較,其中包括:a)兩階段求解算法TSGA[21],初始解采用貪婪算法生成,設(shè)計(jì)了禁忌搜索的思想改善優(yōu)化了遺傳算法;b)基于蟻群粒子群融合的多機(jī)器人避障路徑規(guī)劃算法ACO-PSO[22],該方法運(yùn)用粒子群算法預(yù)規(guī)劃各機(jī)器人的最優(yōu)參考路徑后,使用蟻群算法對(duì)這些路徑進(jìn)行轉(zhuǎn)換或信息素增強(qiáng),經(jīng)過蟻群算法的迭代計(jì)算后,最終獲得各機(jī)器人全局最優(yōu)的避障路徑;c)融合改進(jìn)模擬退火以及LKH的算法,即SA-LKH[23],該算法融合K-均值聚類法和凸包插入法生成初始解,利用LKH算法優(yōu)化每組無人機(jī)和車輛路徑。在對(duì)應(yīng)場(chǎng)景下,上述算法能夠高效地規(guī)劃出各單位全局最優(yōu)的避障路徑,確保有效避開所有障礙物并消除各無人機(jī)或機(jī)器人之間的碰撞,具有顯著的整體時(shí)效性。與這三種算法進(jìn)行實(shí)驗(yàn)對(duì)比,能夠凸顯DLDBO在協(xié)同路徑問題中的優(yōu)勢(shì)。為了達(dá)到實(shí)驗(yàn)的公平性,統(tǒng)一設(shè)置迭代種群數(shù)量為30,最大迭代次數(shù)為150。設(shè)置在公共參數(shù)相同的情況下進(jìn)行10次路徑規(guī)劃仿真測(cè)試,所得實(shí)驗(yàn)結(jié)果如表5所示。各算法的仿真結(jié)果如圖5~8所示,圖9對(duì)比了10次實(shí)驗(yàn)的最優(yōu)值。
通過對(duì)比幾種優(yōu)秀的協(xié)同路徑規(guī)劃算法,DLDBO在三個(gè)指標(biāo)上有著絕對(duì)的優(yōu)勢(shì)?;趯?duì)個(gè)體之間交流程度的改進(jìn),DLDBO能夠計(jì)算得到相對(duì)緊湊的四條路徑,W相對(duì)最小。圖5~8展示了DLDBO以及其他三個(gè)路徑規(guī)劃算法的仿真圖,從結(jié)果看,DLDBO能夠找到最短的四條路徑,平滑度以及高度上的差異并不明顯,因此本文設(shè)置兩者的權(quán)重較小。圖9清晰地展現(xiàn)了四個(gè)算法10次實(shí)驗(yàn)的最優(yōu)值,DLDBO多次以取得最低代價(jià)的表現(xiàn)排名第一,10次實(shí)驗(yàn)的最優(yōu)值、平均值和方差對(duì)比其他算法皆有優(yōu)勢(shì)。由Friedman檢驗(yàn)得到,DLDBO的綜合排序指標(biāo)為1.00。上述實(shí)驗(yàn)結(jié)果都驗(yàn)證了DLDBO在解決協(xié)同路徑規(guī)劃問題上的實(shí)用性。
5 結(jié)束語
本文主要針對(duì)蜣螂優(yōu)化算法對(duì)于四個(gè)子種群之間交流不充分,并為了更有效地解決無人機(jī)協(xié)同路徑規(guī)劃的問題,提出了一種決策學(xué)習(xí)型的蜣螂優(yōu)化算法。其中利用了兩種學(xué)習(xí)策略,包括折射反向?qū)W習(xí)以及本文鏈?zhǔn)洁徑鼘W(xué)習(xí)策略。利用Pearson相關(guān)系數(shù),計(jì)算不限于同類子種群之間的相關(guān)性,并根據(jù)相關(guān)性指標(biāo)作出決策進(jìn)行學(xué)習(xí)性的迭代。使得算法在全局探索以及局部開發(fā)之間有所平衡,增強(qiáng)了算法跳出局部最優(yōu)的能力。在CEC2017測(cè)試套件上進(jìn)行算法性能測(cè)試,并與其余六種優(yōu)秀變體進(jìn)行對(duì)比。從結(jié)果可以看出,精度上DLDBO具有較高的優(yōu)勢(shì)。依據(jù)實(shí)驗(yàn)數(shù)據(jù),30次實(shí)驗(yàn)中DLDBO的魯棒性更好。為了驗(yàn)證DLDBO中個(gè)體之間的信息交流有所提升,本文利用DLDBO解決無人機(jī)協(xié)同路徑規(guī)劃問題。與幾種先進(jìn)的協(xié)同路徑規(guī)劃算法進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果展現(xiàn)了DLDBO在該問題上的優(yōu)勢(shì),進(jìn)一步驗(yàn)證了DLDBO的優(yōu)越性和實(shí)用性。進(jìn)一步地,考慮到實(shí)際應(yīng)用環(huán)境的復(fù)雜性和多變性,提升其在動(dòng)態(tài)環(huán)境下的實(shí)時(shí)路徑規(guī)劃能力顯得尤為重要。未來的研究將致力于增強(qiáng)DLDBO在快速變化條件下的響應(yīng)速度和適應(yīng)能力,以滿足無人機(jī)在高動(dòng)態(tài)場(chǎng)景中的操作需求。這將涉及開發(fā)更高效的更新機(jī)制和適應(yīng)性策略,使算法能夠迅速調(diào)整并優(yōu)化路徑規(guī)劃,以確保任務(wù)的成功和安全執(zhí)行。
參考文獻(xiàn):
[1]蘆艷春, 周開園, 張建杰. 無人機(jī)的發(fā)展現(xiàn)狀及其在航空應(yīng)急救援領(lǐng)域的應(yīng)用綜述 [J]. 醫(yī)療衛(wèi)生裝備, 2023, 44 (10): 108-113. (Lu Yanchun, Zhou Kaiyuan, Zhang Jianjie. Development status of UAV and its application in aviation emergency rescue [J]. Chinese Medical Equipment Journal, 2023, 44 (10): 108-113.)
[2]呂金虎, 冉茂鵬, 王成才, 等. 有人/無人機(jī)智能協(xié)同: 機(jī)遇與挑戰(zhàn) [J]. 中國(guó)科學(xué): 技術(shù)科學(xué), 2024, 54 (5): 968-978. (Lyu Jinhu, Ran Maopeng, Wang Chengcai, et al. Manned/unmanned aerial vehicle intelligent cooperation: opportunities and challenges [J]. Scientia Sinica Technologica, 2024, 54 (5): 968-978.)
[3]劉樹光, 王歡. 有人/無人機(jī)協(xié)同編隊(duì)控制研究綜述 [J]. 飛行力學(xué), 2022, 40 (5): 1-8. (Liu Shuguang, Wang Huan. Review on cooperative formation control for manned/unmanned aerial vehicles [J]. Flight Dynamics, 2022, 40 (5): 1-8.)
[4]王若凡, 任國(guó)鳳. 求解無人機(jī)航跡規(guī)劃問題的精英引領(lǐng)自適應(yīng)樽海鞘群算法 [J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40 (9): 2704-2712. (Wang Ruofan, Ren Guofeng. Track planning method of unmanned aerial vehicles based on elite leading and adaptive salp swarm algorithm [J]. Application Research of Computers, 2023, 40 (9): 2704-2712.)
[5]王智慧, 代永強(qiáng), 劉歡. 基于自適應(yīng)飛蛾撲火優(yōu)化算法的三維路徑規(guī)劃 [J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40 (1): 63-69. (Wang Zhihui, Dai Yongqiang, Liu Huan. 3D path planning based on adaptive moth-flame optimization algorithm [J]. Application Research of Computers, 2023, 40 (1): 63-69.)
[6]田雨露, 米志超, 周雁翎, 等. 基于改進(jìn)混合粒子群算法的無人機(jī)協(xié)同充電路徑規(guī)劃 [J]. 兵器裝備工程學(xué)報(bào), 2023, 44 (3): 182-190. (Tian Yulu, Mi Zhichao, Zhou Yanling, et al. UAV collaborative charging path planning based on an improved hybrid particle swarm optimization algorithm [J]. Journal of Ordnance Equipment Engineering, 2023, 44 (3): 182-190.)
[7]李鴻一, 陳錦濤, 任鴻儒, 等. 基于隨機(jī)采樣的高層消防無人機(jī)協(xié)同搜索規(guī)劃 [J]. 中國(guó)科學(xué): 信息科學(xué), 2022, 52 (9): 1610-1626 (Li Hongyi, Chen Jintao, Ren Hongru, et al. Random-sampling-based multi-UAV cooperative search planning for high-rise firefighting [J]. Scientia Sinica Informationis, 2022, 52 (9): 1610-1626.)
[8]安子軒. 災(zāi)后應(yīng)急救援背景下卡車-無人機(jī)協(xié)同配送路徑規(guī)劃 [J]. 物流科技, 2024, 47 (10): 92-98,111. (An Zixuan. Path planning of truck-drone cooperative distribution in the context of post-disaster emergency rescue [J]. Logistics Sci-Tech, 2024, 47 (10): 92-98, 111.)
[9]劉瑤, 夏陽升, 石建邁, 等. 車載多無人機(jī)協(xié)同多區(qū)域覆蓋路徑規(guī)劃方法 [J]. 系統(tǒng)工程與電子技術(shù), 2023, 45 (5): 1380-1390. (Liu Yao, Xia Yangsheng, Shi Jianmai, et al. Path planning method for multi-area coverage by cooperated ground vehicle multi-drone [J]. Systems Engineering and Electronics, 2023, 45 (5): 1380-1390.)
[10]Xue Jiankai, Shen Bo. Dung beetle optimizer: a new meta-heuristic algorithm for global optimization [J]. The Journal of Supercomputing, 2023, 79(7): 7305-7336.
[11]萬怡華, 張雪梅. 混合多策略改進(jìn)蜣螂算法的避障路徑規(guī)劃 [J]. 電子測(cè)量技術(shù), 2024, 47 (2): 69-78. (Wan Yihua, Zhang Xuemei. Obstacle avoidance path planning of hybrid multi-strategy improved dung beetle optimizer [J]. Electronic Measurement Technology, 2024, 47 (2): 69-78.)
[12]付雷, 王驥. 基于改進(jìn)蜣螂優(yōu)化算法的海洋牧場(chǎng)三維UWSN覆蓋方法 [J]. 中山大學(xué)學(xué)報(bào):自然科學(xué)版(中英文) , 2024, 63 (2): 115-122. (Fu Lei, Wang Ji. 3D UWSN coverage method for marine ranching based on improved dung beetle optimization algorithm [J]. Acta Scientiarum Naturalium Universitatis Sunyatseni, 2024, 63 (2): 115-122.)
[13]夏焰坤, 黃鵬, 任俊杰, 等. 改進(jìn)蜣螂算法優(yōu)化混合核極限學(xué)習(xí)機(jī)的系統(tǒng)諧波阻抗估計(jì) [J/OL]. 電力系統(tǒng)及其自動(dòng)化學(xué)報(bào). (2024-03-06) [2024-04-18]. https://doi. org/10. 19635/j. cnki. csu-epsa. 001431. (Xia Yankun, Huang Peng, Ren Junjie, et al. Improved dung beetle optimizer for optimizing hybrid kernel extreme learning machine for system harmonic impedance estimation [J/OL]. Proceedings of the CSU-EPSA. (2024-03-06) [2024-04-18]. https://doi. org/10. 19635/j. cnki. csu-epsa. 001431.)
[14]趙鑫, 王東麗, 彭泓, 等. 基于多策略改進(jìn)蜣螂算法優(yōu)化的變壓器故障診斷 [J]. 電力系統(tǒng)保護(hù)與控制, 2024, 52 (6): 120-130. (Zhao Xin, Wang Dongli, Peng Hong, et al. Transformer fault diagnosis based on a multi-strategy improved dung beetle optimizer [J]. Power System Protection and Control, 2024, 52 (6): 120-130.)
[15]遠(yuǎn)翔宇, 楊風(fēng)暴, 楊童瑤. 基于自適應(yīng)蜣螂算法的無人機(jī)三維路徑規(guī)劃方法 [J]. 無線電工程, 2024, 54 (4): 928-936. (Yuan Xiangyu, Yang Fengbao, Yang Tongyao. UAV 3D path planning method based on adaptive dung beetle algorithm [J]. Radio Engineering, 2024, 54 (4): 928-936.)
[16]Wang Zilong, Shao Peng. A multi-strategy dung beetle optimization algorithm for optimizing constrained engineering problems [J]. IEEE Access, 2023, 11: 98805-98817.
[17]潘勁成, 李少波, 周鵬, 等. 改進(jìn)正弦算法引導(dǎo)的蜣螂優(yōu)化算法 [J]. 計(jì)算機(jī)工程與應(yīng)用, 2023, 59(22):92-110. (Pan Jincheng, Li Shaobo, Zhou Peng, et al. Dung beetle optimization algorithm guided by improved sine algorithm [J]. Computer Engineering and Applications, 2023, 59(22):92-110.)
[18]Hussain K, Zhu W, Salleh M N M.Long-term memory Harris hawk optimization for high dimensional and optimal power flow problems [J]. IEEE Access, 2019, 7: 147596-147616.
[19]Simhadri K S, Mohanty B. Performance analysis of dual-mode PI controller using quasi-oppositional whale optimization algorithm for load frequency control [J]. International Trans on Electrical Energy Systems, 2020, 30: e12159.
[20]Meng Xianqiu, Jiang Jianhua, Wang Huan. AGWO: advanced GWO in multi-layer perception optimization [J]. Expert Systems with Applications, 2021, 173: 114676.
[21]馬華偉, 閆伯英. 面向防疫物資分區(qū)配送車機(jī)協(xié)同路徑規(guī)劃問題 [J/OL]. 系統(tǒng)仿真學(xué)報(bào). (2023-11-22) [2024-06-02]. https://doi. org/10. 16182/j. issn1004731x. joss. 23-1022 (Ma Huawei, Yan Boying. Vehicle routing problem with drones considering zoned distribution of epidemic prevention materials [J/OL]. Journal of System Simulation. (2023-11-22) [2024-06-02]. https://doi. org/10. 16182/j. issn1004731x. joss. 23-1022.)
[22]黃駿, 朱強(qiáng). 基于蟻群粒子群融合的多機(jī)器人協(xié)同路徑規(guī)劃算法 [J]. 遼東學(xué)院學(xué)報(bào):自然科學(xué)版, 2023, 30 (4): 298-304. (Huang Jun, Zhu Qiang. Multi-robot collaborative path planning algorithm based on ant colony particle swarm fusion [J]. Journal of Liaodong University :Natural Science Edition , 2023, 30 (4): 298-304.)
[23]徐金華, 汪飛, 韓飛, 等. 一種多車輛協(xié)同多植保無人機(jī)作業(yè)路徑規(guī)劃方法 [J]. 東北大學(xué)學(xué)報(bào):自然科學(xué)版, 2024, 45 (2): 296-304. (Xu Jinhua, Wang Fei, Han Fei, et al. A method for path planning of multi-vehicles collaboration with multi-agricultural UAVs [J]. Journal of Northeastern University:Natural Science, 2024, 45 (2): 296-304.)