王 茂 周少武 張紅強(qiáng) 吳亮紅 周 游 何昕杰
(1.湖南科技大學(xué)信息與電氣工程學(xué)院,湖南湘潭 411201;2.湖南理工職業(yè)技術(shù)學(xué)院,湖南湘潭 411206)
群體智能是受自然界社會(huì)型生物的群體行為所啟發(fā),是簡(jiǎn)單信息處理單元在信息交互中涌現(xiàn)的解決問(wèn)題的能力,信息處理單元之間相互獨(dú)立,是一種分布式方法.群機(jī)器人系統(tǒng)是以簡(jiǎn)單機(jī)器人為信息處理單元的群體智能系統(tǒng),具有典型的分布式的特點(diǎn),而機(jī)器人個(gè)體有著同構(gòu)、結(jié)構(gòu)簡(jiǎn)單的特點(diǎn)[1].機(jī)器人與機(jī)器人之間以及機(jī)器人與環(huán)境之間有著簡(jiǎn)單的交互,根據(jù)交互獲得的信息,各個(gè)機(jī)器人進(jìn)行分布式運(yùn)動(dòng),而在整個(gè)機(jī)器人系統(tǒng)上涌現(xiàn)出智能行為,進(jìn)而可以完成一定的任務(wù)[2].群機(jī)器人技術(shù)可廣泛應(yīng)用于災(zāi)后搜救[3-4]、物料搬運(yùn)[5]、環(huán)境探測(cè)[6]、目標(biāo)圍捕[7-9]、火災(zāi)監(jiān)控等任務(wù)中[10],在軍用、工業(yè)和民用等領(lǐng)域有著廣泛的應(yīng)用[11-14].
目標(biāo)搜索是群機(jī)器人的一個(gè)應(yīng)用方向,可運(yùn)用于搜救、搜尋某種信號(hào)源、勘探自然資源、探測(cè)敵軍位置等[15].XUE等[16]將群機(jī)器人搜索映射到粒子群優(yōu)化(particle swarm optimization,PSO)并提出時(shí)變字符群(time-varying character swarm,TVCS)的概念后,基于預(yù)期演化位置的控制原理,提出了一種異步通信策略,該通信策略在搜索效率體現(xiàn)出一定優(yōu)越性;ZHANG等[17]針對(duì)多目標(biāo)搜索提出多目標(biāo)搜索中的合作協(xié)同和競(jìng)爭(zhēng)協(xié)同以擴(kuò)大感知范圍降低空間沖突;類比于物理環(huán)境中引力等引入人工勢(shì)場(chǎng)函數(shù)[18-19],ZHANG等[20]針對(duì)復(fù)雜環(huán)境提出一種基于簡(jiǎn)化虛擬受力模型的循障方法,ZHOU等[21]引入簡(jiǎn)化虛擬受力模型的循障與避碰方法于群機(jī)器人搜索中,使得機(jī)器人兼顧避障與搜索;CAO等[22]將Glasius仿生神經(jīng)網(wǎng)絡(luò)(Glasius bio-inspired neural network,GBNN)和仿生級(jí)聯(lián)跟蹤控制方法結(jié)合,提出了一種多自主水下航行器協(xié)同團(tuán)隊(duì)集成算法,該方法參數(shù)少,并可解決速度跳躍問(wèn)題;LI等[23]提出一種概率有限狀態(tài)機(jī)和三角形梯度估計(jì)的方法,平衡了探測(cè)與搜索、并行性與協(xié)作性,并提高了一定的搜索效率;TANG等[24]提出一種自適應(yīng)機(jī)器人蝙蝠算法,考慮了避障問(wèn)題及跳出局部最優(yōu)的機(jī)制.然而上述方案中沒(méi)有針對(duì)復(fù)雜障礙物的高效避障方法,且在搜索方法上未充分利用可獲取的目標(biāo)信號(hào).
以上述研究為基礎(chǔ),本文提出一種邊界掃描的避障策略和一種目標(biāo)位置估計(jì)的粒子群算法(boundary scan obstacle avoidance strategy and target position estimation particle swarm optimization,BSOA-TPEPSO),與其他方法相比有效地提高了針對(duì)復(fù)雜障礙物的避障效率,同時(shí)也提高了目標(biāo)搜索的效率.在下面的內(nèi)容中,第2節(jié)構(gòu)建合適的模型以便驗(yàn)證分析所提方法;第3節(jié)詳述所提的新方法;第4節(jié)分析文中所提方法的收斂性;第5節(jié)將文中所提方法與基于簡(jiǎn)化虛擬受力分析模型的循障避碰方法(simplified virtualforce obstacle avoidance method,SVF)、擴(kuò)展粒子群算法(extended particle swarm optimization,EPSO)、自適應(yīng)機(jī)器人蝙蝠算法(adaptive robotic bat algorithm,ARBA)仿真比較,驗(yàn)證所提方法的搜索性能,并分析仿真結(jié)果;第6節(jié)總結(jié)文章內(nèi)容并對(duì)后續(xù)研究做出展望.
有限的二維空間內(nèi),全集A={R ∪T ∪B},其中群機(jī)器人R={Ri|i=1,2,···,NR;NR≥10},目標(biāo)T={Tj|j=1,2,···,NT;NT>1},障礙物B={Bs|s=1,2,···,NB;NB≥1},三者位置分別表示為Xi(t),Tj(xj,yj),Bs(xs,ys),機(jī)器人及目標(biāo)用質(zhì)點(diǎn)表示.群機(jī)器人R作為搜索主體,任務(wù)是搜索到所有目標(biāo)T,同時(shí)避免與障礙物及其他機(jī)器人發(fā)生碰撞.當(dāng)存在機(jī)器人與某個(gè)目標(biāo)的距離Td小于目標(biāo)到達(dá)閾值L0,即視為搜索到該目標(biāo).機(jī)器人的通信與感知都是局部的,考慮最大通信半徑Lcm,最大障礙物感知半徑LB,最大目標(biāo)感知半徑LT,機(jī)器人與其他機(jī)器人、目標(biāo)、障礙物的歐式距離分別為Rd,Td,Bd.機(jī)器人可在特定條件下實(shí)現(xiàn)特定功能:Rd≤Lcm時(shí),機(jī)器人之間可通信;Td≤LT時(shí),可探測(cè)目標(biāo)信號(hào);Bd≤LB時(shí),可探測(cè)障礙物位置.
機(jī)器人搜索目標(biāo)時(shí),無(wú)法得知目標(biāo)的位置,但可以不間斷地通過(guò)傳感器探測(cè)周圍目標(biāo)的信號(hào).假設(shè)每個(gè)待搜索的目標(biāo)類似,但目標(biāo)信號(hào)頻率有所區(qū)別,機(jī)器人可根據(jù)探測(cè)到的目標(biāo)信號(hào)頻率區(qū)分目標(biāo).機(jī)器人探測(cè)到的目標(biāo)信號(hào)將滿足目標(biāo)響應(yīng)函數(shù)
其中:Iij表示機(jī)器人探測(cè)到的目標(biāo)信號(hào);η為環(huán)境干擾的隨機(jī)量;機(jī)器人無(wú)法獲取Td,但Td影響機(jī)器人探測(cè)目標(biāo)信號(hào)的大小;G(Td)表示在無(wú)干擾的環(huán)境中目標(biāo)信號(hào)的衰減函數(shù),搜索前可根據(jù)目標(biāo)信號(hào)與距離的數(shù)值關(guān)系求得近似解.
群機(jī)器人在搜索目標(biāo)時(shí),總?cè)蝿?wù)是搜索到所有目標(biāo),而搜索某個(gè)目標(biāo)可以視為一個(gè)子任務(wù),完成相同子任務(wù)的機(jī)器人所成集合稱為子聯(lián)盟,該過(guò)程中的機(jī)器人所處狀態(tài)稱為協(xié)同搜索狀態(tài),機(jī)器人按照以下方式組成子聯(lián)盟.
借鑒文獻(xiàn)[21,29]中任務(wù)分工方法,將可獲取目標(biāo)信號(hào)的機(jī)器人分為兩類:由自身傳感器探測(cè)到目標(biāo)信號(hào)的機(jī)器人記為I類機(jī)器人,由機(jī)器人之間的通信獲取目標(biāo)信號(hào)的機(jī)器人記為II類機(jī)器人.當(dāng)I類機(jī)器人探測(cè)到多個(gè)目標(biāo)的信號(hào),先選擇Iij >Imin的目標(biāo)作為備選目標(biāo),再選取上一步相同的目標(biāo),若無(wú)相同目標(biāo)則經(jīng)輪盤(pán)賭法選擇當(dāng)前唯一的協(xié)同搜索目標(biāo),其中Imin表示目標(biāo)響應(yīng)閾值.輪盤(pán)賭法可用以下等式表示:
其中ki表示被機(jī)器人Ri作為備選目標(biāo)的數(shù)量.當(dāng)P(i,j-1) 在上述子任務(wù)分配后,相同子聯(lián)盟中機(jī)器人可能過(guò)多,造成機(jī)器人資源浪費(fèi).因此進(jìn)一步引入閉環(huán)調(diào)節(jié),即在上述子任務(wù)分配結(jié)束后,再評(píng)估各個(gè)子聯(lián)盟的資源分配[29].當(dāng)某個(gè)子聯(lián)盟的機(jī)器人數(shù)g >gmax,該子聯(lián)盟擇優(yōu)選取gmax個(gè)機(jī)器人作為該子聯(lián)盟個(gè)體,其中g(shù)max為子聯(lián)盟機(jī)器人最大允許個(gè)數(shù)(擇優(yōu)原則為:優(yōu)先選擇I類機(jī)器人,I類機(jī)器人中優(yōu)先選擇目標(biāo)信號(hào)強(qiáng)者,II類機(jī)器人選擇距離通信機(jī)器人近者).選取示例詳見(jiàn)表1[21]. 表1 子任務(wù)機(jī)器人排序Table 1 Sequence of subtask robots 取gmax=6,表1中按照擇優(yōu)原則排序,最終機(jī)器人R79,R8,R81,R59,R92,R156個(gè)機(jī)器人保持聯(lián)盟完成子任務(wù),機(jī)器人R61,R96退出子聯(lián)盟. 組成子聯(lián)盟的機(jī)器人搜索對(duì)應(yīng)的目標(biāo);每個(gè)子聯(lián)盟作為子種群,以目標(biāo)位置估計(jì)的粒子群算法優(yōu)化機(jī)器人位置,以實(shí)現(xiàn)目標(biāo)搜索;其他的機(jī)器人則進(jìn)行漫游搜索,依據(jù)簡(jiǎn)化虛擬受力模型運(yùn)動(dòng);當(dāng)機(jī)器人搜索到目標(biāo)后,完成狀態(tài)聲明.上述可總結(jié)為機(jī)器人的3種狀態(tài):組成子聯(lián)盟的協(xié)同搜索,按照簡(jiǎn)化虛擬受力運(yùn)動(dòng)的漫游搜索,搜索到目標(biāo)后的狀態(tài)聲明[27].3種狀態(tài)的遷移可用圖1表示. 圖1 狀態(tài)遷移關(guān)系Fig.1 State transition relationship 目標(biāo)搜索需在同等情況下盡可能減小運(yùn)動(dòng)軌跡長(zhǎng)度及搜索時(shí)長(zhǎng),本文按照位置迭代的方式進(jìn)行搜索,因此搜索時(shí)間用迭代步數(shù)t替代.本文提出一種邊界掃描的避障策略及目標(biāo)位置估計(jì)的粒子群算法以提高目標(biāo)搜索效率. 文中考慮二維環(huán)境下的目標(biāo)搜索,機(jī)器人的運(yùn)動(dòng)學(xué)方程可表示為 在此介紹提出的目標(biāo)位置估計(jì),以便進(jìn)一步介紹目標(biāo)位置估計(jì)的粒子群算法(TPEPSO).存在環(huán)境干擾的情況下,由式(1)可估計(jì)機(jī)器人與目標(biāo)的距離Td≈G?1(Iij).在群機(jī)器人搜索目標(biāo)時(shí),目標(biāo)響應(yīng)函數(shù)無(wú)法得知,因此G?1(Iij)無(wú)法直接獲取.在進(jìn)行目標(biāo)搜索之前,測(cè)試目標(biāo)信號(hào)與距離的數(shù)值關(guān)系:在與目標(biāo)信號(hào)源距離為(1,LT)之間均勻取?個(gè)不同距離,分別獨(dú)立測(cè)量100次信號(hào),對(duì)每個(gè)位置的信號(hào)取平均值得到距離為dξ時(shí)平均的目標(biāo)信號(hào)為Iξ,以此為基礎(chǔ)進(jìn)行插值,即可得到Td與Iij之間的近似函數(shù)關(guān)系 環(huán)境中存在干擾,因此方程(8)無(wú)解,此處考慮最小二乘解,由式(8)兩邊移項(xiàng)開(kāi)根號(hào)后得到殘量范數(shù) Tj(xj,yj)≈Test(x,y)=arg min(f(x,y))為所求,本文采用基于雜交的粒子群算法,求其近似解. 將群機(jī)器人的協(xié)同搜索過(guò)程映射到PSO算法迭代過(guò)程[16],以迭代更新機(jī)器人位置.因在群機(jī)器人搜索目標(biāo)時(shí)僅可獲取子任務(wù)的目標(biāo)信號(hào),全局最優(yōu)取子聯(lián)盟的最優(yōu),即半全局最優(yōu);而個(gè)體歷史最優(yōu)取加入子聯(lián)盟后的歷史最優(yōu).粒子群算法與上述的目標(biāo)位置估計(jì)結(jié)合,得到目標(biāo)位置估計(jì)的粒子群算法(TPEPSO): 其中:Vip(t+1)為TPEPSO計(jì)算得到的(t+1)步機(jī)器人Ri的速度;Vif(t+1)為(t+1)步Ri考慮運(yùn)動(dòng)慣性后的期望速度;Xif(t+1)為(t+1)步Ri的理想位置;c1,c2,c3分別為認(rèn)知系數(shù)、社會(huì)系數(shù)、位置估計(jì)系數(shù);r1,r2,r3是服從U(0,1)的隨機(jī)數(shù);ω為慣性權(quán)重;α是運(yùn)動(dòng)慣性環(huán)節(jié);pbi為個(gè)體歷史最優(yōu);sgb為半全局最優(yōu);Test為式(10)得到的位置估計(jì). 在目標(biāo)搜索過(guò)程中,不論漫游搜索狀態(tài)或協(xié)同搜索狀態(tài),機(jī)器人都可能遇到凸或非凸的障礙物.凸障礙物即障礙物點(diǎn)所成集合為凸集,凸障礙物避障比較簡(jiǎn)單,但對(duì)非凸障礙物避障時(shí)容易陷入局部最優(yōu)問(wèn)題.傳統(tǒng)的處理方法是考慮最近兩個(gè)障礙點(diǎn)所成方向左或向右循障運(yùn)動(dòng),這種方法雖解決了非凸障礙物避障的問(wèn)題,但是避障距離較長(zhǎng).這里將機(jī)器人探測(cè)到障礙物的情形進(jìn)行歸類后簡(jiǎn)化,提出一種邊界點(diǎn)掃描的避障策略(BSOA). 假設(shè)函數(shù)F(θ)的表達(dá)式如下: 避障方向分為兩種:順時(shí)針避障和逆時(shí)針避障.F(〈Vi(t+1)〉-〈Vif(t+1)〉)<0 為順時(shí)針避障,F(〈Vi(t+1)〉-〈Vif(t+1)〉)>0 為逆時(shí)針避障,其中Vi(t+1)為考慮避障后速度. 在有障礙物的環(huán)境下搜索目標(biāo),不需要避障的情形有兩種:1)機(jī)器人傳感器掃描區(qū)域內(nèi)沒(méi)有探測(cè)到障礙物;2)機(jī)器人的傳感器掃描區(qū)域內(nèi)有障礙物,但期望速度Vif(t+1)方向無(wú)障礙物,如圖3(a)所示.機(jī)器人無(wú)需避障時(shí),速度Vi(t+1)=Vif(t+1). 圖3 障礙物情況分類Fig.3 Classification of obstacles 需要避障的情形有兩種:1)如圖3(b)(c),機(jī)器人探測(cè)到連續(xù)障礙物:前者探測(cè)的是凸障礙物,后者探測(cè)的是非凸障礙物,可將其都簡(jiǎn)化為探測(cè)到連續(xù)障礙物的情形;2)如圖3(d),機(jī)器人探測(cè)到不連續(xù)障礙物,圖中表示機(jī)器人探測(cè)到三段障礙物,其他不連續(xù)障礙物的情形與此類似[25]. 探測(cè)到障礙物后,為了保證障礙物附近的目標(biāo)可被探測(cè),避障僅考慮可探測(cè)且在目標(biāo)探測(cè)范圍內(nèi)的障礙物.將該范圍內(nèi)障礙物投影到圓弧上,得到圖4的障礙物簡(jiǎn)化圖,粗弧線表示障礙物投影,圖4(a)中①②及圖4(b)中①~⑥均表示邊界點(diǎn).圖4(a)表示連續(xù)障礙物的情況,圖4(b)表示不連續(xù)障礙物的情況. 圖4 障礙物簡(jiǎn)化Fig.4 Simplified obstacle 在需要避障的情形下,下一步速度可以表示為 考慮NP為邊界點(diǎn)數(shù);SF=0,1,2為避碰標(biāo)志符號(hào),0,1和2分別表示:上一步無(wú)避障、上一步順時(shí)針避障和上一步逆時(shí)針避障;Pj(xj,yj)(j=1,2,···,NP),Q1(x1,y1),Q2(x2,y2)分別表示機(jī)器人Ri可探測(cè)障礙物的邊界點(diǎn)、最近點(diǎn)、第二近點(diǎn);l2為強(qiáng)制避障距離;下面求取角度a: 群機(jī)器人在未知環(huán)境下進(jìn)行目標(biāo)搜索時(shí),具體流程如圖5所示. 圖5 未知環(huán)境下多目標(biāo)搜索流程圖Fig.5 Flow chart of multi-target search in unknown environment 表2 邊界掃描的避障策略Table 2 Boundary scan obstacle avoidance strategy 本文借鑒文獻(xiàn)[28]所用收斂性分析方法,為便于討論,有關(guān)內(nèi)容以定義、定理方式給出. 定義1所有迭代步所成集合為迭代總集,記為Num;漫游的迭代步所成集合為漫游迭代集,記為Numr;協(xié)同搜索的迭代步所成集合為協(xié)同迭代集,記為Numg;迭代總集Num對(duì)應(yīng)全部機(jī)器人搜索路徑長(zhǎng)度記為Pth,迭代總集Num中機(jī)器人Ri對(duì)應(yīng)搜索路徑長(zhǎng)度記為Pthi. 推論1 定義2對(duì)于任意的正數(shù)ε都存在t,使得不等式|Xi(t+1)-Xi(t)|<ε成立,則Xi(t)收斂. 漫游搜索過(guò)程中,據(jù)式(5)、圖2,若?Rdis<2LR,不同機(jī)器人之間相互排斥,機(jī)器人將均勻分布于搜索區(qū)域,探測(cè)到目標(biāo)的信號(hào)后進(jìn)入?yún)f(xié)同搜索狀態(tài).因此漫游搜索對(duì)機(jī)器人能否搜索到目標(biāo)無(wú)影響,僅影響探測(cè)目標(biāo)信號(hào)的速率,從而影響目標(biāo)的搜索速率.下面討論協(xié)同搜索,即部分的收斂性. 圖2 簡(jiǎn)化虛擬受力模型Fig.2 Simplified virtual force model 推論2存在定值ψ,使得=ψ成立,則Xi(t)收斂. 定義2與推論2在群機(jī)器人上的體現(xiàn)為,機(jī)器人根據(jù)該算法到達(dá)某位置后,速度趨近于0,由于機(jī)器人在L0范圍內(nèi)即可探測(cè)到目標(biāo)位置,完成搜索任務(wù),因此對(duì)于機(jī)器人目標(biāo)搜索只需|ψ-Xi(t)|≤L0. 定理1當(dāng)參數(shù)滿足式(25),協(xié)同搜索過(guò)程收斂. 證將式(11)速度與位置的關(guān)系整理得 由式(26)易得 由式(31)可知方程收斂的充要條件為0<‖λ‖<1;聯(lián)立上式可得收斂區(qū)間 式(27)代入式(32),整理可知定理1得證. 證畢. 為分析算法性能,本文在Core i5-8300H、內(nèi)存為24 GB的硬件環(huán)境下,運(yùn)用MATLAB 2019a進(jìn)行了若干組仿真實(shí)驗(yàn).將避障方法與搜索算法綜合考慮,對(duì)6種搜索模式:BT,BE,BA,ST,SE,SA 分別仿真;分析BSOA和TPEPSO與傳統(tǒng)方法在綜合搜索性能上的提升,每種模式對(duì)應(yīng)的具體方法如表3所示. 表3 搜索模式Table 3 Search mode 根據(jù)參考文獻(xiàn)[17,26],可假設(shè)式(1)所述函數(shù)關(guān)系表示為式(33),仿真時(shí)由式(33)生成數(shù)據(jù),并結(jié)合式(7)估計(jì)G?1(Iij). 式中:m為環(huán)境衰減系數(shù),0 仿真比較時(shí),需設(shè)置環(huán)境、機(jī)器人、目標(biāo)、搜索過(guò)程等的參數(shù),本文的參數(shù)設(shè)置如表4所示. 表4 參數(shù)設(shè)置Table 4 Parameter setting 未知環(huán)境下,考慮凸障礙物與非凸障礙物,以N=50為例,演示仿真的目標(biāo)搜索過(guò)程,主要搜索過(guò)程如圖6所示,圖中藍(lán)色圓圈表示漫游搜索的機(jī)器人,綠色實(shí)心圓圈表示協(xié)同搜索并可探測(cè)到目標(biāo)信號(hào)的機(jī)器人,即A類機(jī)器人,藍(lán)色實(shí)心圓圈表示協(xié)同搜索但僅由通信獲取目標(biāo)信號(hào)的機(jī)器人,軌跡上的箭頭表示運(yùn)動(dòng)方向. 圖6(a)中t=1,地圖、機(jī)器人位置和目標(biāo)位置初始化,所有機(jī)器人位于左下角100×100的空間內(nèi),所有目標(biāo)隨機(jī)分散于地圖右上角的800×800的范圍內(nèi),機(jī)器人無(wú)法得知目標(biāo)信號(hào)及障礙物位置,圖中黑色的不規(guī)則形狀表示障礙物. 圖6 未知環(huán)境下多目標(biāo)搜索過(guò)程Fig.6 The process of multi-target search in an unknown environment 圖6(b)中t=15,機(jī)器人R44探測(cè)到目標(biāo)T8的信號(hào),并通過(guò)通信將目標(biāo)信息廣播至其半徑Rcm范圍內(nèi)的所有機(jī)器人,距R44最近的5個(gè)機(jī)器人與R44結(jié)成子聯(lián)盟,開(kāi)始協(xié)同搜索T8.如圖6(c)所示t=29時(shí),R23與T8之間的距離小于L0,機(jī)器人搜索到T8,R23聲明T8被其搜索到并停止搜索任務(wù),其他機(jī)器人退出子聯(lián)盟重新進(jìn)入漫游搜索狀態(tài)并繼續(xù)后續(xù)的目標(biāo)搜索. 圖6(d)中t=49,機(jī)器人R15探測(cè)到目標(biāo)T2的信號(hào),然后與較近的5個(gè)機(jī)器人組為子聯(lián)盟,參與搜索T8的R44也在該子聯(lián)盟中.圖6(e)中,t=49~65期間有R6,R9,R15,R24,R35,R37,R44,R45先后參與子聯(lián)盟,但同一時(shí)刻子聯(lián)盟的機(jī)器人總數(shù)不超過(guò)Gmax.上述8個(gè)機(jī)器人的軌跡如圖所示,協(xié)同搜索期間子聯(lián)盟根據(jù)基于目標(biāo)響應(yīng)函數(shù)的動(dòng)態(tài)分工原則對(duì)成員機(jī)器人進(jìn)行動(dòng)態(tài)調(diào)整,以適應(yīng)搜索進(jìn)程及環(huán)境的變化.例如圖6(e)中,在R35避開(kāi)凸障礙物的過(guò)程中,由于R24逐漸比R35更接近通信機(jī)器人,R35退出子聯(lián)盟進(jìn)入漫游搜索狀態(tài).搜索過(guò)程中,機(jī)器人逐漸接近目標(biāo),最終在t=65時(shí),R44搜索到T2并聲明搜索成功,其他機(jī)器人退出子聯(lián)盟,同時(shí)進(jìn)入漫游搜索狀態(tài)繼續(xù)搜索其他目標(biāo). 圖6(f)中t=65,同樣也表示機(jī)器人探測(cè)到目標(biāo)并廣播目標(biāo)信號(hào),并與較近的機(jī)器人組成子聯(lián)盟.圖6(g)中顯示了機(jī)器人對(duì)目標(biāo)T7的搜索,在搜索過(guò)程中,機(jī)器人有效地以較短路徑避開(kāi)了非凸障礙物,具體的避障過(guò)程以R5和R50的軌跡所示. 群機(jī)器人按照基于目標(biāo)響應(yīng)函數(shù)的動(dòng)態(tài)分工及本文提出的BSOA,TPEPSO方法對(duì)目標(biāo)進(jìn)行搜索,最終在t=200時(shí),搜索到所有目標(biāo),所有的目標(biāo)及機(jī)器人的位置如圖6(h)所示. 分別運(yùn)用:BT,BE,BA,ST,SE,SA.按照機(jī)器人數(shù)N=20,40,60,80,100的順序,在上述環(huán)境中分別獨(dú)立仿真30次.統(tǒng)計(jì)每次獨(dú)立運(yùn)行完成所有目標(biāo)搜索的迭代步數(shù),全體機(jī)器人的總運(yùn)動(dòng)距離--總能耗,求取平均值,對(duì)運(yùn)行結(jié)果最大值、最小值、平均值進(jìn)行比較,得到對(duì)比數(shù)據(jù)如表5. 由表5可知隨著參與目標(biāo)搜索的機(jī)器人總數(shù)增加,搜索總迭代步數(shù)逐漸減小,總能耗逐漸增加:將總迭代步數(shù)與總能耗的平均值為縱軸,總機(jī)器人數(shù)為橫軸,對(duì)搜索效率及總能耗進(jìn)行比較,如圖7所示.BT分別與BE,BA,ST,SE,SA比較,其搜索效率分別提高5.32%,11.25%,21.30%,26.11%,30.31%,總能耗分別減少4.17%,15.05%,20.47%,23.99%,28.75%. 表5 6種不同搜索模式下的搜索步數(shù)及能耗Table 5 Search efficiency and energy consumption of six different search modes 圖7 多目標(biāo)搜索迭代步數(shù)和能耗Fig.7 Iterative steps and energy consumption of multi-target search 本文提出了一種邊界掃描的避障方法(BSOA)及一種目標(biāo)位置估計(jì)的粒子群算法(TPEPSO),將其與傳統(tǒng)的簡(jiǎn)化虛擬受力的循障策略(SVF)、擴(kuò)展粒子群算法(EPSO)、自適應(yīng)機(jī)器人蝙蝠算法(ARBA)綜合比較,可知BSOA搜索效率提高21.58%、總能耗減少19.11%;TPEPSO相比于EPSO,ARBA搜索效率分別提高5.72%,11.35%,總能耗分別減少4.30%,12.73%,且在機(jī)器人總數(shù)較少時(shí),仍保持較高搜索效率. 本文考慮未知且包含凸障礙物和非凸障礙物的二維環(huán)境,進(jìn)行多目標(biāo)搜索.優(yōu)化搜索算法與避障策略,對(duì)于搜索算法,考慮群機(jī)器人搜索時(shí)的目標(biāo)信號(hào)強(qiáng)度與目標(biāo)位置的數(shù)值關(guān)系,利用目標(biāo)信號(hào)估計(jì)目標(biāo)位置,并與PSO算法結(jié)合,得到目標(biāo)位置估計(jì)的粒子群算法(TPEPSO),該方法在保證不陷入局部最優(yōu)的前提下,進(jìn)一步提高目標(biāo)搜索效率;對(duì)于避障方法,將障礙物簡(jiǎn)化成兩類,并以不同的方式趨向某一邊界點(diǎn)運(yùn)動(dòng),得到邊界掃描的避障策略(BSOA),策略在保證搜索范圍的前提下,提高了避障的效率.經(jīng)仿真驗(yàn)證,文中所提算法的搜索效率及搜索總能耗均優(yōu)于傳統(tǒng)的算法. 所提出的方法旨在提供一種可以廣泛運(yùn)用于未知環(huán)境下群機(jī)器人對(duì)特定目標(biāo)的搜索方法,例如運(yùn)用于災(zāi)后搜救、雷區(qū)探雷、資源探尋等領(lǐng)域.但是標(biāo)準(zhǔn)的二維環(huán)境在現(xiàn)實(shí)中基本不存在,而且目標(biāo)可能是動(dòng)態(tài)的,同時(shí)在該模型中,多目標(biāo)搜索的分工是以機(jī)器人可根據(jù)目標(biāo)信號(hào)區(qū)分不同目標(biāo)為假設(shè),現(xiàn)有傳感器中難以廣泛地實(shí)現(xiàn)該功能,因此今后的工作中可考慮在崎嶇路面的三維環(huán)境或者三維空間,動(dòng)態(tài)目標(biāo)的搜索,同時(shí)在算法模型上進(jìn)一步完善.2.3 群體狀態(tài)協(xié)調(diào)控制
3 群機(jī)器人系統(tǒng)控制
3.1 機(jī)器人運(yùn)動(dòng)模型
3.2 目標(biāo)位置估計(jì)
3.3 目標(biāo)位置估計(jì)的粒子群算法
3.4 邊界掃描的避障策略
3.5 群機(jī)器人目標(biāo)搜索步驟
4 算法收斂性分析
5 仿真與驗(yàn)證
5.1 障礙物環(huán)境的目標(biāo)搜索
5.2 仿真結(jié)果分析
6 結(jié)論