王永琦,江瀟瀟
(上海工程技術(shù)大學(xué)電子電氣工程學(xué)院,上海 201620)
機(jī)器人路徑規(guī)劃RPP(Robot Path Planning)是機(jī)器人技術(shù)領(lǐng)域一項(xiàng)極其重要的課題,該課題的研究目的在于以優(yōu)化目標(biāo)(如線路長度、能源消耗)為指導(dǎo)確定一條從起點(diǎn)到終點(diǎn)的最佳路徑[1]。近年來,智能化技術(shù)獲得了快速發(fā)展,而不斷推進(jìn)的產(chǎn)業(yè)智慧升級(jí)則進(jìn)一步開拓了移動(dòng)機(jī)器人的應(yīng)用前景,相應(yīng)的實(shí)際應(yīng)用場(chǎng)景包含智慧生產(chǎn)、貨物搬運(yùn)、水下作業(yè)和異常環(huán)境探測(cè)等方面[2]。鑒于此,進(jìn)行RPP問題的算法設(shè)計(jì)研究具有極其重要的理論意義和工程價(jià)值。
國內(nèi)外學(xué)者圍繞RPP問題開展了大量的研究工作,并取得了豐碩的成果[3]。經(jīng)典的路徑規(guī)劃算法包括視圖法、人工勢(shì)場(chǎng)法、自由空間法和A*算法等,簡(jiǎn)單實(shí)用的性質(zhì)使得上述經(jīng)典算法具有一定的工程應(yīng)用價(jià)值,然而相關(guān)算法的缺陷同樣限制了其在不同類型RPP問題方面的應(yīng)用。例如,視圖法的路徑由多條直線構(gòu)建而成,線路棱角明顯,難以確保全局最優(yōu);人工勢(shì)場(chǎng)法易陷入局部最優(yōu),存在終點(diǎn)不可達(dá)的缺陷;自由空間法計(jì)算復(fù)雜性較高,對(duì)復(fù)雜障礙空間的RPP問題適用性較差。近年來快速發(fā)展的進(jìn)化算法技術(shù)為解決RPP問題提供了新思路,現(xiàn)階段已有多種相關(guān)算法在RPP問題上獲得了成功應(yīng)用,包括蟻群算法、遺傳算法和粒子群算法等。與此同時(shí),基本蟻群算法搜索時(shí)間長且易停滯,遺傳算法易生成包含障礙物的不可行路徑,以上缺陷一定程度上限制了進(jìn)化算法求解RPP問題的效率。鑒于此,以進(jìn)化算法為基礎(chǔ),構(gòu)建高效可靠的機(jī)器人路徑規(guī)劃方法成為學(xué)者努力追尋的目標(biāo)。
受灰狼群體捕獵行為的啟發(fā),Mirjalili等[4]于2014年提出了一種新型進(jìn)化算法——灰狼GWO(Grey Wolf Optimization)算法。相較于其他算法,GWO算法具有架構(gòu)簡(jiǎn)單、控制參數(shù)少和計(jì)算效率高等優(yōu)點(diǎn)。研究表明,GWO算法的整體尋優(yōu)性能相比于遺傳算法、粒子群算法以及人工蜂群算法等更具優(yōu)勢(shì)[5]。目前,該算法在眾多工程領(lǐng)域獲得了廣泛應(yīng)用,包括車間調(diào)度、數(shù)值優(yōu)化、圖像融合以及電力系統(tǒng)配置等[6-8]。鑒于GWO算法在眾多領(lǐng)域的良好表現(xiàn),本文將其運(yùn)用于RPP這一重要工程問題。
GWO算法采用隨機(jī)方法構(gòu)建初始解,這在一定程度上限制了算法的搜索效率;同時(shí),該算法僅以優(yōu)質(zhì)解引導(dǎo)種群進(jìn)化,這使得搜索過程易陷入局部最優(yōu)。針對(duì)以上不足,本文提出HGWO(Hybrid Grey Wolf Optimization)算法,在其設(shè)計(jì)過程中融入反向?qū)W習(xí)機(jī)制和融合了歷史信息的個(gè)體位置更新方法。具體而言,在初始化階段,HGWO算法采用反向?qū)W習(xí)方法構(gòu)建初始種群,力求提高初始解的質(zhì)量;在進(jìn)化過程中,HGWO算法首先引入PSO思想來改善GWO算法的個(gè)體位置更新過程,通過融合每個(gè)灰狼個(gè)體的歷史信息以構(gòu)筑更高效的種群進(jìn)化方法;同時(shí),借助精英反向?qū)W習(xí)策略探索當(dāng)前種群中精英個(gè)體的反向解空間,力求增強(qiáng)算法的勘探能力。
灰狼以群居生活方式為主,各群體中平均存在5~12只灰狼,并具有嚴(yán)格的等級(jí)制度,圖1展示了灰狼群體的金字塔分層示意圖。整個(gè)群體包括α、β、δ和ω4層。第1層為種群中的頭狼,稱為α狼,該灰狼個(gè)體負(fù)責(zé)群體各項(xiàng)決策事務(wù);第2層為β狼,負(fù)責(zé)協(xié)助管理決策;第3層為δ狼,負(fù)責(zé)偵察、放哨和捕獵等相關(guān)事務(wù);第4層為ω狼,負(fù)責(zé)平衡種群內(nèi)部的關(guān)系。
Figure 1 Hierarchy of grey wolves圖1 灰狼群體等級(jí)結(jié)構(gòu)
GWO算法以灰狼個(gè)體表示待優(yōu)化問題的解,并通過模擬灰狼的等級(jí)制度和狩獵行為實(shí)現(xiàn)對(duì)測(cè)試問題的迭代尋優(yōu)。對(duì)于當(dāng)前待優(yōu)化問題,適應(yīng)度最佳的灰狼個(gè)體設(shè)為α狼,次優(yōu)和第3優(yōu)的灰狼個(gè)體分別以β狼和δ狼表示,其余個(gè)體稱為ω狼。在GWO算法中,低等級(jí)的灰狼個(gè)體必須服從高等級(jí)灰狼個(gè)體的指導(dǎo),整個(gè)尋優(yōu)過程由優(yōu)勢(shì)灰狼個(gè)體指導(dǎo)種群向目標(biāo)獵物包圍。算法的種群進(jìn)化公式歸納如下:
D=|C·Xp(t)-X(t)|
(1)
C=2·r1
(2)
X(t+1)=Xp(t)-A·D
(3)
A=2a·r2-a
(4)
(5)
其中,式(1)和式(2)定義了灰狼個(gè)體與目標(biāo)獵物之間的距離D,t為當(dāng)前迭代次數(shù),X(t)表示當(dāng)前種群中某一灰狼個(gè)體的位置,Xp(t)為目標(biāo)獵物的位置,距離調(diào)節(jié)系數(shù)C由[0,1]上均勻分布的隨機(jī)變量r1確定。式(3)~式(5)定義了灰狼個(gè)體的更新方式,其中r2表示[0,1]上均勻分布的隨機(jī)變量,T為最大迭代次數(shù),收斂因子a隨著迭代搜索的進(jìn)行從2線性遞減為0。位置調(diào)節(jié)系數(shù)A由a和r2確定。
鑒于獵物目標(biāo)的位置(即當(dāng)前問題的解)通常是未知的,GWO算法充分利用優(yōu)勢(shì)灰狼個(gè)體的位置信息進(jìn)行迭代尋優(yōu),即利用α、β和δ狼的位置信息判斷獵物的大致位置,進(jìn)而指導(dǎo)狼群逐步逼近獵物目標(biāo),相應(yīng)的數(shù)學(xué)公式描述如下:
Dα=|C1·Xα(t)-X(t)|
(6)
Dβ=|C2·Xβ(t)-X(t)|
(7)
Dδ=|C3·Xδ(t)-X(t)|
(8)
X1(t)=Xα(t)-A1·Dα
(9)
X2(t)=Xβ(t)-A2·Dβ
(10)
X3(t)=Xδ(t)-A3·Dδ
(11)
(12)
其中,Xα(t)、Xβ(t)和Xδ(t)分別表示當(dāng)前種群中α、β和δ狼的位置,C1,C2,C3為距離調(diào)節(jié)參數(shù),由式(2)生成。X(t)為某一ω狼的位置。式(8)~式(10)計(jì)算了α、β和δ狼與候選ω狼之間的距離Dα、Dβ和Dδ。A1、A2、A3為位置調(diào)節(jié)系數(shù),由式(4)生成?;诖?,式(9)~式(12)定義了ω狼更新后的最終位置。圖2所示為GWO算法的實(shí)現(xiàn)原理。
Figure 2 Schematic diagram of GWO圖2 GWO算法原理示意圖
綜合以上描述,GWO算法的實(shí)現(xiàn)流程歸納如下:
步驟1初始化:利用隨機(jī)方法構(gòu)建初始灰狼種群。
步驟2種群排序:計(jì)算每個(gè)灰狼個(gè)體的適應(yīng)度值,并據(jù)此確定當(dāng)前種群中的α、β、δ和ω狼。
步驟3參數(shù)更新:確定GWO算法的參數(shù)a、A和C。
步驟4種群進(jìn)化:依據(jù)式(6)~式(12)更新ω狼的位置。
步驟5終止條件判斷:若滿足算法的終止條件,終止迭代并輸出最優(yōu)解;否則,轉(zhuǎn)步驟2。
Eberhart和Kennedy兩位學(xué)者通過模擬鳥類覓食行為提出了PSO算法,并用其求解各類復(fù)雜優(yōu)化問題[9]。在PSO算法中,鳥群中的每只鳥被抽象為一個(gè)粒子,每個(gè)粒子具有位置和速度,食物與當(dāng)前粒子間的距離被定義為適應(yīng)度,其數(shù)值大小決定了當(dāng)前粒子的優(yōu)劣,其計(jì)算公式依據(jù)實(shí)際問題特征進(jìn)行設(shè)定。在算法迭代過程中,每個(gè)粒子借助自身歷史最優(yōu)位置和整個(gè)種群的全局最優(yōu)位置進(jìn)行位置更新。
假設(shè)待優(yōu)化問題的維度為D′,以符號(hào)N表示種群規(guī)模,當(dāng)前種群中第i個(gè)粒子在第d維的速度和位置信息分別記為Vid和Xid,則算法采用以下公式進(jìn)行粒子的速度更新和位置更新:
Vid(t+1)=ω′·Vid(t)+c1·r1·
(Pid-Xid(t))+c2·r2·(Pgd-Xid(t))
(13)
Xid(t+1)=Xid(t)+Vid(t+1)
(14)
其中,t表示當(dāng)前迭代次數(shù);ω′為慣性因子,取值在[1,3]時(shí)算法的優(yōu)化性能較好;學(xué)習(xí)因子c1和c2為非負(fù)常數(shù),一般取c1=c2=2;r1和r2表示[0,1]上的隨機(jī)數(shù)。Pid表示第i個(gè)粒子自身歷史最優(yōu)位置在第d維的取值,Pgd表示整個(gè)種群全局最優(yōu)位置在第d維的取值。
綜合以上描述,PSO算法的實(shí)現(xiàn)過程如圖3所示。
Figure 3 Flow chart of PSO圖3 PSO算法實(shí)現(xiàn)流程
本文借助反向?qū)W習(xí)機(jī)制和融合歷史信息的個(gè)體位置更新方法構(gòu)筑HGWO求解算法。具體而言,在初始化階段,采用反向?qū)W習(xí)方法構(gòu)建初始種群,力求提高初始解的質(zhì)量;在進(jìn)化過程中,引入PSO思想來改善算法的個(gè)體位置更新過程,借助每個(gè)灰狼個(gè)體的歷史信息指導(dǎo)種群進(jìn)化;同時(shí),結(jié)合精英反向?qū)W習(xí)策略,探索當(dāng)前種群中精英個(gè)體的反向解空間,著力克服算法易陷入局部最優(yōu)的缺陷。
為提升初始狼群的質(zhì)量,HGWO算法借助反學(xué)習(xí)方法生成初始解[10]。具體而言,算法首先通過隨機(jī)的方式生成N個(gè)灰狼個(gè)體,隨后為每個(gè)個(gè)體生成一個(gè)反向解,最后以優(yōu)化目標(biāo)為依據(jù)對(duì)2N個(gè)解進(jìn)行評(píng)價(jià),并選取其中最優(yōu)的N個(gè)解構(gòu)建初始種群。
步驟1分別令i←1和d←1,并轉(zhuǎn)步驟2。
步驟2若i≤N成立,轉(zhuǎn)步驟3;否則,轉(zhuǎn)步驟7。
步驟3若d≤D′成立,轉(zhuǎn)步驟4;否則,轉(zhuǎn)步驟5。
步驟5令d←d+1,若d>D′,令d←1,轉(zhuǎn)步驟6;否則,轉(zhuǎn)步驟3。
步驟6令i←i+1,并轉(zhuǎn)步驟2。
在個(gè)體位置更新環(huán)節(jié),GWO算法僅考慮ω狼與當(dāng)前種群中優(yōu)勢(shì)灰狼個(gè)體(α、β和δ狼)間的信息交流,而忽略了其自身經(jīng)驗(yàn)的引導(dǎo)。研究表明,自身經(jīng)驗(yàn)對(duì)進(jìn)化算法的個(gè)體更新過程具有重要影響[11]。鑒于此,本文引入PSO思想來改善GWO算法的個(gè)體位置更新過程,力求構(gòu)筑更高效的種群進(jìn)化方法,新的個(gè)體位置更新方法歸納如下:
X(t+1)=ω1·X1(t)+ω2·X2(t)+ω3·X3(t)+
c·r·(Xbest(t)-X(t))
(15)
(16)
(17)
(18)
其中,式(15)的第1部分表示群體優(yōu)勢(shì)個(gè)體的經(jīng)驗(yàn)對(duì)ω狼的引導(dǎo),慣性權(quán)重系數(shù)ω1、ω2和ω3采用式(16)~式(18)進(jìn)行自適應(yīng)調(diào)整,力求動(dòng)態(tài)地權(quán)衡算法的全局和局部搜索性能;式(15)的第2部分為自身歷史經(jīng)驗(yàn)對(duì)ω狼的引導(dǎo),c為學(xué)習(xí)因子,r為[0,1]上的隨機(jī)數(shù)。
加強(qiáng)對(duì)優(yōu)秀個(gè)體周圍空間的搜索對(duì)強(qiáng)化進(jìn)化算法勘探新解的能力具有重要影響,為此,本文將精英反向?qū)W習(xí)策略融合于HGWO算法,以探索當(dāng)前種群中精英個(gè)體的反向解的空間信息,力求提升算法的性能[12]。
反向解定義如下:以參數(shù)D′表示當(dāng)前待優(yōu)化問題的維度,在第t次迭代過程中,以Xid表示當(dāng)前種群中解向量Xi在第d維的取值,則Xi的反向解X′i為:
(19)
在每次迭代過程中,HGWO算法率先采用融合歷史信息的個(gè)體位置更新方法實(shí)現(xiàn)種群進(jìn)化,隨后對(duì)更新后的種群進(jìn)行個(gè)體排序。結(jié)合相關(guān)研究和實(shí)際測(cè)試效果[13],選取其中前10%的優(yōu)秀灰狼個(gè)體構(gòu)建精英種群Pb,依據(jù)反向解的定義生成Pb的反向種群P′b,選取混合種群Pb∪P′b中前50%的優(yōu)秀解進(jìn)入下一代。
基于以上描述,HGWO算法的實(shí)現(xiàn)流程歸納如下:
步驟1初始化:利用反向?qū)W習(xí)初始化方法構(gòu)建初始種群,并計(jì)算每個(gè)解的目標(biāo)函數(shù)值。
步驟2種群排序:依據(jù)適應(yīng)度值對(duì)當(dāng)前種群進(jìn)行排序,劃分α、β、δ和ω狼。
步驟3參數(shù)更新:確定GWO算法的參數(shù)a、A和C。
步驟4更新歷史信息:確定各灰狼個(gè)體的自身歷史最優(yōu)解。
步驟5種群進(jìn)化:依據(jù)式(15)~式(18)更新ω狼的位置。
步驟6精英搜索:采取精英反向?qū)W習(xí)策略更新種群。
步驟7終止條件判斷:若滿足終止條件,停止迭代并輸出最優(yōu)解;否則,轉(zhuǎn)步驟2。
圖4展示了機(jī)器人路徑規(guī)劃問題的環(huán)境模型,其中灰色方塊為起點(diǎn),黑色方塊為終點(diǎn),黑色圓表示一系列障礙物。在當(dāng)前坐標(biāo)系下,每個(gè)障礙物的數(shù)學(xué)表達(dá)式為:
(x-a)2+(y-b)2=r2
(20)
其中,點(diǎn)(a,b)表示障礙物的坐標(biāo)中心,r為半徑。
Figure 4 Environment model圖4 環(huán)境模型
本文采用導(dǎo)航點(diǎn)模型構(gòu)建機(jī)器人路徑,當(dāng)前問題的解以π={(x0,y0),(x1,y1),…,(xn,yn),(xn+1,yn+1)}表示,(x0,y0)為起點(diǎn),(xn+1,yn+1)為終點(diǎn),剩余其他點(diǎn)表示算法所需規(guī)劃的坐標(biāo)。顯然,當(dāng)前問題的決策維度由導(dǎo)航點(diǎn)的數(shù)目確定。此外,通過直接將路徑點(diǎn)相連而獲得的線路圖棱角較為明顯。
在確保求解精度的前提條件下,為降低問題的優(yōu)化維度并對(duì)線路曲線進(jìn)行平滑處理,本文借助Spline樣條插值法構(gòu)造路徑曲線,圖5給出了相應(yīng)的示意圖[14]。其中,采樣導(dǎo)航點(diǎn)為測(cè)試算法所需優(yōu)化的點(diǎn)坐標(biāo),而其余的插值導(dǎo)航點(diǎn)則由Spline樣條插值法確定。相對(duì)而言,該方法僅需優(yōu)化較少數(shù)目的采樣導(dǎo)航點(diǎn)坐標(biāo),算法求解難度進(jìn)一步降低;同時(shí),插值法所得的路徑曲線更為平滑流暢,求解效果更佳。
Figure 5 Spline interpolation圖5 Spline樣條插值法示意圖
當(dāng)前機(jī)器人路徑規(guī)劃問題以最小化線路長度為優(yōu)化目標(biāo),借助懲罰函數(shù)法處理避障約束條件,相應(yīng)的路徑評(píng)價(jià)函數(shù)構(gòu)造如下:
(21)
(22)
其中,?為懲罰系數(shù),K為障礙物總數(shù),(ak,bk)表示當(dāng)前環(huán)境中障礙物k的中心,rk為其半徑。
為驗(yàn)證本文提出的HGWO算法的性能,分別將其應(yīng)用于基準(zhǔn)測(cè)試函數(shù)以及機(jī)器人路徑規(guī)劃問題,在2.4 GHz、內(nèi)存4 GB、Intel(R) Core(TM) i5-2430M CPU的計(jì)算機(jī)上進(jìn)行仿真實(shí)驗(yàn),編程平臺(tái)選用Matlab 2017a。
為驗(yàn)證HGWO算法的性能,選取文獻(xiàn)[15]中的5個(gè)基準(zhǔn)函數(shù)進(jìn)行仿真。表1歸納了測(cè)試函數(shù)的相關(guān)情況,其中參數(shù)D′表示問題維度,f1、f2和f3具有單峰性質(zhì),f4和f5具有多峰性質(zhì),上述函數(shù)極其復(fù)雜,難以取得全局最優(yōu)解,因此常用于評(píng)價(jià)進(jìn)化算法的搜索性能。
Table 1 Benchmark functions
為驗(yàn)證HGWO算法的搜索性能,首先開展HGWO與GWO 2種測(cè)試算法的對(duì)比分析,力求驗(yàn)證改進(jìn)措施的有效性。測(cè)試過程相關(guān)參數(shù)設(shè)置如下:測(cè)試函數(shù)的維度D′分別設(shè)為20和40,GWO和HGWO算法的種群歸納和最大迭代次數(shù)分別設(shè)置為50和2 000,HGWO算法的學(xué)習(xí)因子c設(shè)為2,對(duì)比算法的其他參數(shù)維持與文獻(xiàn)[4]相同的取值。針對(duì)各個(gè)測(cè)試算例,2種算法均獨(dú)立運(yùn)行20次,表2歸納了2種算法的測(cè)試結(jié)果。
Table 2 Comparison of test results between GWO and HGWO
由表2的測(cè)試結(jié)果可知,相比于GWO算法,HGWO算法在各測(cè)試問題上獲得的均值更小,這表明本文所提出的HGWO算法的整體優(yōu)化效果更令人滿意。同時(shí),HGWO算法獨(dú)立運(yùn)行20次所得結(jié)果的標(biāo)準(zhǔn)差相較于GWO算法更具優(yōu)勢(shì),這說明HGWO算法的穩(wěn)定性更強(qiáng)。
為進(jìn)一步驗(yàn)證HGWO算法的尋優(yōu)性能,將其與另外3種改進(jìn)灰狼算法進(jìn)行對(duì)比,包括CGWO(Chaotic Grey Wolf Optimization)算法[16]、EGWO(Enhanced Grey Wolf Optimization)算法[17]和LGWO(Grey Wolf Optimizer with Lévy flight)[18]算法。測(cè)試過程相關(guān)參數(shù)設(shè)置如下:測(cè)試函數(shù)的維度D′設(shè)為40,4種測(cè)試算法的種群規(guī)模和最大迭代次數(shù)分別設(shè)為50和2 000,對(duì)比算法的其他參數(shù)設(shè)為與文獻(xiàn)[16-18]相同的值。此外,針對(duì)各個(gè)測(cè)試算例,算法均獨(dú)立運(yùn)行20次,表3歸納了4種算法的測(cè)試結(jié)果。
由表3的測(cè)試結(jié)果可知,HGWO算法所得測(cè)試結(jié)果的均值優(yōu)于CGWO、EGWO和LGWO算法的,這表明反向?qū)W習(xí)機(jī)制和融合歷史信息的個(gè)體位置更新方法的嵌入,顯著提升了GWO算法的性能。同時(shí),HGWO算法多次獨(dú)立運(yùn)行結(jié)果的標(biāo)準(zhǔn)差更小,表明該算法的魯棒性更強(qiáng),能更高效穩(wěn)定地求解各類復(fù)雜函數(shù)優(yōu)化問題。
Table 3 Comparison of test resultsamong four improved GWOs
為進(jìn)一步驗(yàn)證HGWO的尋優(yōu)性能,進(jìn)行CGWO、EGWO、LGWO和HGWO算法求解簡(jiǎn)單環(huán)境以及復(fù)雜環(huán)境中路徑規(guī)劃問題的對(duì)比實(shí)驗(yàn)。2種環(huán)境下的障礙物總數(shù)分別設(shè)為6和12,且采樣導(dǎo)航點(diǎn)數(shù)和插值點(diǎn)數(shù)目分別設(shè)為10和100。測(cè)試過程的算法參數(shù)設(shè)置如下:4種算法的種群規(guī)模和最大迭代次數(shù)分別設(shè)置為30和300,HGWO算法的學(xué)習(xí)因子c設(shè)為2,對(duì)比算法的其他參數(shù)維持與參考文獻(xiàn)[16-18]相同的取值;對(duì)于2種測(cè)試環(huán)境,4種測(cè)試算法均獨(dú)立運(yùn)行20次。實(shí)驗(yàn)結(jié)果如圖6~圖9以及表4和表5所示。
Figure 6 Optimal paths obtained by four GWOs in a simple environment圖6 簡(jiǎn)單環(huán)境中4種灰狼算法得到的最優(yōu)路徑
Figure 7 Optimal paths obtained by four GWOs in a complex environment圖7 復(fù)雜環(huán)境中4種灰狼算法得到的最優(yōu)路徑
Figure 8 Convergence curves obtained by four GWOs in a simple environment圖8 簡(jiǎn)單環(huán)境中4種灰狼算法的最優(yōu)進(jìn)化曲線
Figure 9 Convergence curves obtained by four GWOs in a complex environment圖9 復(fù)雜環(huán)境中4種灰狼算法的最優(yōu)進(jìn)化曲線
圖6和圖7分別展示了4種測(cè)試算法在簡(jiǎn)單環(huán)境和復(fù)雜環(huán)境下所得的最優(yōu)路徑,據(jù)此可知本文提出的HGWO算法所尋得的路徑曲線最短,特別是在復(fù)雜環(huán)境下,HGWO算法的優(yōu)越性更為顯著。與此同時(shí),圖8和圖9給出了4種灰狼算法在
Table 4 Comparison of results obtained byfour GWOs in a simple environment
Table 5 Comparison of results obtainedby four GWOs in a complex environment
2種測(cè)試環(huán)境中的最優(yōu)進(jìn)化曲線,據(jù)此可知,反向?qū)W習(xí)初始化方法使得HGWO算法在初期能夠獲得高質(zhì)量的解,而融合歷史信息的個(gè)體位置更新方法和精英反向?qū)W習(xí)策略增強(qiáng)了算法的勘探能力,克服了傳統(tǒng)GWO算法易陷入局部最優(yōu)的不足。表4和表5歸納了各測(cè)試算法20次獨(dú)立運(yùn)行所得結(jié)果,據(jù)此可知,本文提出的HGWO算法所得的路徑曲線在最優(yōu)、最劣和均值3方面均獲得了最佳表現(xiàn)。
本文構(gòu)建了一種混合灰狼算法,并將其與Spline樣條插值法相結(jié)合以求解機(jī)器人路徑規(guī)劃問題。HGWO算法采用反向?qū)W習(xí)方法生成初始種群,著力提高初始解的質(zhì)量;在進(jìn)化過程中,借助灰狼個(gè)體的歷史信息指導(dǎo)種群進(jìn)化,并融合精英反向?qū)W習(xí)策略探索當(dāng)前種群中精英個(gè)體的反向解的空間信息,以達(dá)到增強(qiáng)算法勘探能力的目的。在實(shí)驗(yàn)部分,進(jìn)行了函數(shù)優(yōu)化以及路徑規(guī)劃2組對(duì)比實(shí)驗(yàn),HGWO算法的橫縱向?qū)Ρ葘?shí)驗(yàn)驗(yàn)證了其良好的優(yōu)化精度和穩(wěn)健的魯棒性。