徐 博,王朝陽
(哈爾濱工程大學(xué)智能科學(xué)與工程學(xué)院,哈爾濱 150001)
近年來,隨著傳感器、控制算法理論等關(guān)鍵技術(shù)的發(fā)展,無人系統(tǒng)在長航時、小型化等多個方向取得了突破性進展。微小型無人智能體組成的無人集群系統(tǒng)已經(jīng)成為國內(nèi)外專家學(xué)者共同關(guān)注的熱點課題[1-2]。
微小型無人智能體組成的無人集群在執(zhí)行任務(wù)過程中具有高度動態(tài)性、不確定性、強對抗性等特點,因此如何提高無人集群的自主性和適應(yīng)性是無人集群技術(shù)面臨的關(guān)鍵問題[3]。針對無人集群控制問題,目前常用的方式主要包括集中式和分布式。集中式控制是指通過一個中央控制器對整個集群進行統(tǒng)一調(diào)配與控制。這種方式可以獲得全局最優(yōu)狀態(tài),但這種控制方法不僅計算量大,而且對大型無人集群計算資源要求苛刻,當一個環(huán)節(jié)出現(xiàn)延遲,編隊容錯率便會降低[4-5]。分布式控制不存在中心控制器,集群內(nèi)的個體都是獨立的,通過信息之間的交互可以達到控制目的。與集中式控制相比,分布式控制盡管很難保證全局的最優(yōu),但它具有模塊化、可擴展等優(yōu)點[6-9]。針對集群避障、保持、路徑規(guī)劃等問題,國內(nèi)外學(xué)者針對人工勢場法、虛擬結(jié)構(gòu)法、圖論法等進行了深入研究,但這些方法控制器分析大多依賴于現(xiàn)代控制理論,通過微分方程和差分方程描述數(shù)學(xué)模型,對參數(shù)的依賴性過大。當其應(yīng)用于超過一定數(shù)量的無人集群時,參數(shù)所造成的復(fù)雜程度也隨之增加。
針對集群編隊保持問題,文獻[10]通過跟隨者與領(lǐng)航者的預(yù)定隊形跟蹤參考軌跡,實現(xiàn)了集群弱通信條件下的隊形保持。文獻[11-12]結(jié)合模糊邏輯系統(tǒng)和滑??刂?,保持水下無人集群的編隊形狀。針對集群避障的問題,文獻[13]提出了一種預(yù)測制導(dǎo)避障算法,研究了當只有一部分智能體具有障礙物動態(tài)信息或每個智能體具有局部交互時多智能體系統(tǒng)的協(xié)調(diào)避障算法,實現(xiàn)了交互弱條件下的協(xié)調(diào)避障。此外,國內(nèi)外研究人員在自組織協(xié)同控制方面也開展了一些研究。這種方式?jīng)]有固定的通信路線,個體與個體之間的相對運動可以使得通信發(fā)生改變。文獻[14]針對無人機集群編隊系統(tǒng),提出了一種基于個體間相對行為的路徑規(guī)劃方法。
自然界中生物可以通過單體簡單的個體行為表現(xiàn)出集群的復(fù)雜行為,如鳥群、魚群、蟻群躲避敵害,共同覓食[15]。通過簡單行為得到的集群控制效果可以使得系統(tǒng)穩(wěn)定性提高和算法計算量降低。因此,仿生集群的研究引起了世界范圍內(nèi)的廣泛關(guān)注。生物集群的研究最早開始于20世紀80年代,Reynolds 提出了分離、聚集、速度一致3 個基本法則。
Vicsek 等[16]在研究過程中,發(fā)現(xiàn)生物群體具有聚集行為和磁鐵特性,即鳥的飛行速度向量如同磁聚一樣具有自適應(yīng)性。但簡單的模型模仿生物集群的思維模式與實際生物集群的行為相差很多。因此,針對基礎(chǔ)Vicsek 模型,眾多學(xué)者相繼進行了改進。吳渝等[17]在模型基礎(chǔ)上引入了速度加權(quán)均值調(diào)整集群運動過程中的問題。但上述模型沒有考慮到個體之間距離所帶來影響,因此文獻[18]提出了WAR-Vicsek 模型,重點考慮了相鄰個體之間距離所帶來的影響,降低了系統(tǒng)收斂效率。文獻[19]在此基礎(chǔ)上考慮到集群中個體的體積,提出了IV-Vicsek 模型,降低了集群成員在運動過程中碰撞概率。文獻[20]引入了集群內(nèi)個體體力模型,并且個體體積越大,相對影響力越高,使得模型更加貼近復(fù)雜網(wǎng)絡(luò)模型,提升整體收斂速度。
考慮到個體組成的集群擁擠程度對狀態(tài)的影響以及無人集群運動過程中遇到的邊界問題,本文在上述基礎(chǔ)上,提出了MRF-Vicsek 模型。首先,建立多域感知范圍模型并通過改進后的生物行為法則使得集群運動更貼近生物集群行為,并得到自由空間初速度相同條件下的狀態(tài)更新函數(shù)。再通過集群擁擠程度和集群規(guī)模建立模糊規(guī)則,對上述狀態(tài)更新進行優(yōu)化,得到初速度隨機條件下自由空間狀態(tài)更新算法。最后,通過對規(guī)則空間的區(qū)域劃分以及生物行為準則,得到在規(guī)則空間條件下初始狀態(tài)隨機的狀態(tài)更新方程,達到集群收斂更類似復(fù)雜網(wǎng)絡(luò)模型的目的。
傳統(tǒng)Vicsek 模型已經(jīng)具備了仿生集群運動的部分特征,由N個運動體組成的離散系統(tǒng)用集合表示,每個個體的初始位置和速度都是隨機的,在狀態(tài)更新時受到一個高斯白噪聲干擾。IV-Vicsek 模型在傳統(tǒng)的Vicsek 模型中增加了避碰區(qū)域,其系統(tǒng)權(quán)重大小受到個體之間的距離影響。
本文在IV-Vicsek 模型基礎(chǔ)上考慮了個體與個體之間是如何相互影響以及邊界對集群運動的影響,可以使得集群在隨機初始速度狀態(tài)下在規(guī)則空間內(nèi)運動。本文將個體i的感知區(qū)域分為避碰層、保持層、內(nèi)聚層和連通層。每層存在的其他個體的數(shù)量和距離對該個體狀態(tài)的影響各不相同,通過分配各區(qū)域權(quán)重,使得模型更加貼進生物集群運動。
如圖1所示,(r1,r2,R1,R2)分別為避碰層、保持層、內(nèi)聚層和連通層的感知半徑,其他個體對中心個體的影響隨著區(qū)域的不同而改變。為更加貼近生物集群在規(guī)則空間內(nèi)運動行為,在模型中加入了規(guī)則邊界,如圖2所示,在L1,L2構(gòu)成的規(guī)則邊界(H,H1,H2,H3)中,邊界對個體的影響依次增加。當個體i處于不同的區(qū)域時,通過不同的控制方法對其進行控制。
圖1 個體感知區(qū)域示意圖Fig.1 Individual perception area
圖2 規(guī)則空間邊界示意圖Fig.2 Regular space boundary diagram
生物集群行為研究與大型無人集群的組網(wǎng)有很多相似之處,生物集群的行為主要滿足以下3個性質(zhì)。
(1)分離性。在生物集群中,生物體之間存在安全距離,使得生物體之間碰撞與沖突減少。
(2)一致性。生物集群在穩(wěn)定運動過程中,生物體之間保持相對一致的狀態(tài),使得集群的狀態(tài)穩(wěn)定。
(3)聚集性。當存在生物體落單時,通過吸引其他生物體形成一個緊密的生物集群。
本文在原有性質(zhì)的基礎(chǔ)上,增加了3 條狀態(tài)約束規(guī)則。
(1)在生物集群運動過程中,生物體之間的距離越接近一定值,生物體之間的狀態(tài)一致性更高。
(2)當生物集群運動過至邊界時,距離邊界最近的生物體狀態(tài)改變,不受距離邊界遠的生物體影響。
(3)當生物體之間的距離達到一定值時,該生物體將適當擴大感知距離。
定義影響個體i的運動狀態(tài)集合由個體自身當前時刻位置為中心的4 個感知區(qū)域內(nèi)所有個體組成。由N個運動體組成的仿生集群K中,設(shè)為當前時刻個體狀態(tài),為個體向量之間的歐氏距離,因此t時刻個體i在避碰層、保持層、內(nèi)聚層和連通層的相鄰個體集合為:
設(shè)無人集群所有個體初始速度為V,當集群在H范圍內(nèi)運動中未觸及邊界影響范圍時,個體i在t時刻的狀態(tài)受避碰層、保持層、內(nèi)聚層和連通層的個體影響。因此,個體i在t+1 時刻的位置更新為:
式中,α,β,ε分別為避碰層因子、保持層因子、內(nèi)聚層因子。分別為避碰層、保持層和內(nèi)聚層的個體數(shù)量。為使得個體i與保持層狀態(tài)更為一致,保持層因子應(yīng)大于另外兩個。
在實際生物集群運動中,集群內(nèi)各成員的初始位置和初始速度都是隨機的。并且在運動過程中,當個體之間的距離小于一定值時,個體之間的相對狀態(tài)會迅速改變。例如,速度降低或運動方向改變,這種狀態(tài)的改變有一定范圍。當個體i在t時刻感知范圍內(nèi)避碰層的個體對其造成影響時,該個體會改變其運動狀態(tài),以達到保持距離的目的。
如圖3所示,避碰層的個體傾向于散開,以保持個體之間距離;一致層是集群理想的運動狀態(tài)層,處于該層的個體更傾向于狀態(tài)保持;而內(nèi)聚層的個體動作更傾向于向一致層靠攏。
圖3 集群簡單行為示意圖Fig.3 Cluster simple behavior
當個體i遠離集群時,即感知范圍連通層內(nèi)無其他個體,此時依據(jù)生物行為規(guī)則,該個體的速度將處于隨機狀態(tài),其狀態(tài)更新為:
當個體的初始狀態(tài)為隨機狀態(tài)時,即集群內(nèi)各成員初始速度在(a,b)上隨機分布,初始角度在(0,2π)上隨機分布。為使得集群內(nèi)個體狀態(tài)更貼近生物行為,本文將集群期望速度和個體鄰域集合內(nèi)個體加權(quán)后的速度之差作為當前時刻速度的誤差,從而更好地調(diào)節(jié)集群速度。設(shè)集群的期望速度為Ve?(a,b),其狀態(tài)更新為:
生物集群內(nèi)個體之間的影響難以用公式準確表示,本文通過引入模糊規(guī)則優(yōu)化這種情況。模糊控制是基于模糊邏輯將人類經(jīng)驗轉(zhuǎn)化為控制邏輯。其中,包括模糊化、模糊集、模糊推理和解模糊4 個模塊。根據(jù)MRFC-Vicsek 模型個體狀態(tài)控制結(jié)構(gòu),為下一時刻輸出,為當前時刻輸入,α,β,ε,u為當前時刻控制器參數(shù)。則當前速度更新為式(10),角度更新為:
設(shè)模糊狀態(tài)更新輸入變量為集群大小M1和擁擠程度M2(避碰層數(shù)量),輸出變量為感知范圍避碰層、保持層和內(nèi)聚層的因子α,β,ε。取值范圍見表1。
表1 模糊輸入輸出論域Table 1 Fuzzy input and output domain
采用高斯隸屬函數(shù)進行模糊化:
式中,x為模糊變量,另外是參數(shù)模糊語言變量集合為“擁擠(C)”“正常(N)”“稀疏(S)”“較高(G)”“穩(wěn)定(W)”和“較?。╔)”。
模糊規(guī)則依據(jù)如下:
(1)α,β,ε的意義是個體感知范圍內(nèi)不同層所占權(quán)重,參數(shù)越大,該層的個體狀態(tài)對其中心個體的影響作用越大。
(2)u的意義是個體狀態(tài)的改變意愿,當感知范圍內(nèi)避碰成員增加時,個體改變狀態(tài)的意愿更為強烈。
通過模糊邏輯和模糊語言,將上述依據(jù)轉(zhuǎn)化為模糊控制規(guī)則,見表2~5。
表2 α 模糊規(guī)則Table 2 Fuzzy ruleα
表3 β 模糊規(guī)則Table 3 Fuzzy rule β
表4 ε 模糊規(guī)則Table 4 Fuzzy rule ε
表5 u 模糊規(guī)則Table 5 Fuzzy rule u
最后,通過重心法對其進行解模糊,得到α,β,ε,u。
一般生物集群在自由空間內(nèi)運動時,集群內(nèi)個體只需考慮自身感知范圍內(nèi)成員即可,不需要考慮外界環(huán)境條件。
在無人集群的實際應(yīng)用場景中,許多集群無法在空間內(nèi)自由運動,活動范圍受限,類似池塘中的魚群。但這些集群在運動過程中遇見邊界時,距離邊界最近的個體會率先進行減速和轉(zhuǎn)彎,而處于集群距離較遠的成員,會提前進行狀態(tài)改變。邊界對于集群的影響在2.1 節(jié)已經(jīng)闡述。因此,本文提出了MRFC-Vicsek 模型實現(xiàn)規(guī)則空間下集群的控制,其框圖如圖4所示。
圖4 規(guī)則空間下集群狀態(tài)更新整體框圖Fig.4 Overall block diagram of cluster state update in rule space
如圖4所示,運動個體通過模糊多權(quán)重狀態(tài)優(yōu)化將其感知范圍不同區(qū)域內(nèi)成員狀態(tài)整合至下一刻的輸入,得到自由空間集群運動狀態(tài)更新方法。在此基礎(chǔ)上,引入規(guī)則邊界影響范圍,當個體運動到一定范圍時,將受到外界環(huán)境的影響。此刻的運動個體在速度和方向上受到邊界影響的權(quán)重大于集群對其的影響。邊界對該個體的影響是根據(jù)個體所在的集群時刻調(diào)整,進而影響該個體相鄰個體,達到在規(guī)則空間下集群運動更貼近生物行為準則的目的。
通過這種方法,可以使得集群在規(guī)則空間內(nèi)的運動行為與實際生物集群行為更加接近,在遇到外界突發(fā)情況時,可以通過降速與轉(zhuǎn)向達到集群穩(wěn)定的目的。
本文將邊界影響范圍劃分為H1,H2,H3,其中H1對集群影響最弱,H3受到橫向邊界和縱向邊界影響,對集群影響最強。
當個體運動至H1H2H3 區(qū)域內(nèi),邊界對個體的影響為:
式中,d1,d2,d3分別為區(qū)域H1,H2,H3的安全距離。因此,當個體運動至區(qū)域Hn時,其速度狀態(tài)更新公式為:
鄰域個體分布指數(shù)為:
為驗證本文所提出的MRFC-Vicsek 模型對集群的控制性能,本節(jié)進行了仿真實驗。設(shè)置初始化參數(shù),迭代運動時間T=1000 s,集群總數(shù)N為200、400、800,噪聲大小δ?(-0.2,0.2),感知范圍避碰層半徑r1 =0.3 m,r2 =0.5 m,R1 =0.8 m,R2=1.2 m,規(guī)則區(qū)域邊界長度L1=L2 =10 m。速度的模值大小和方向分別在(-0.2,0.2),(0,2 π)上隨機分布。如圖5所示,集群初始狀態(tài)為隨機狀態(tài)。
圖5 初始狀態(tài)Fig.5 Initial state
通過仿真得到集群在1000s 過程中的數(shù)據(jù),其過程如圖6~8所示。
圖6 集群個數(shù)200 過程圖Fig.6 Number of clusters 200 processes
圖6~8 中,(a)、(b)、(c)、(d)分別對應(yīng)初始時刻、400s、800s、1000s 的集群分布情況。由于空間是規(guī)則的,因此集群運動最終會收斂為一個或幾個集群。當遇見邊界后,集群最外側(cè)開始改變狀態(tài),同時影響著集群內(nèi)側(cè)的個體有改變狀態(tài)的趨勢,通過個體的簡單的減速與轉(zhuǎn)向,使得整個集群完成穩(wěn)定的避開邊界,達到了在規(guī)則空間下集群仿生運動的目的。通過圖6~8 的比較,可以看出當集群的數(shù)量增多,形成集群的時間節(jié)點越靠后。當集群在200~400 時,集群的收斂效果更好,但還需進一步驗證。其速度和速度序參量如圖9 和圖10所示。
圖7 集群個數(shù)400 過程圖Fig.7 Number of clusters 400 processes
圖9 集群內(nèi)所有個體速度Fig.9 Speed of all individuals in the cluster
圖10 不同個數(shù)集群速度序參量Fig.10 Cluster speed order parameter
可以看出,當集群的復(fù)雜度隨著數(shù)量的增加而增加時,遇見邊界時速度更不穩(wěn)定;當數(shù)量達到800 時,速度很難穩(wěn)定;當集群數(shù)量為200時,集群的速度收斂時間最短,遇見邊界時速度更穩(wěn)定。
圖8 集群個數(shù)800 過程圖Fig.8 Number of clusters 800 processes
圖11、圖12 展示了規(guī)則空間下不同集群數(shù)量的個體認可度與個體鄰域分布指數(shù),可以看出集群在遇到邊界時,集群的一致性與個體之間的穩(wěn)定性受到比較大的影響。當集群數(shù)量較少時,集群的收斂性較快,可以很早地達到相對穩(wěn)定;當遇到邊界時,可以很快調(diào)整至相對穩(wěn)定狀態(tài);當集群數(shù)量增加時,集群遇到邊界時,調(diào)整能力降低。
圖11 不同個數(shù)集群個體認可度Fig.11 Cluster individual recognition
根據(jù)約束后仿生集群的行為準備,本文建立了多智能體與規(guī)則空間的多區(qū)域模型,再通過模糊規(guī)則解出不同區(qū)域所對應(yīng)的權(quán)重,同時將不同的權(quán)重與邊界影響區(qū)域結(jié)合,最后得到了規(guī)則空間集群控制方法。仿真結(jié)果表明,該方法可以實現(xiàn)規(guī)則空間下的集群控制,行為方式與生物集群相似,這為自組織協(xié)同控制避障與執(zhí)行任務(wù)提供了思路。但本文方法也存在不足,當集群數(shù)量增加時,集群更為擁擠,該算法的收斂速度與穩(wěn)定程度會下降,如何在集群數(shù)量增加時保證控制算法的穩(wěn)定性是一個值得繼續(xù)深入研究的問題。