丁 偉,張 峰,宋 敏,崔 龍,王宏偉,劉釗銘,繆 磊
(1. 沈陽工程學院自動化學院,沈陽 110136;2. 中國科學院沈陽自動化研究所機器人學國家重點實驗室,沈陽 110169)
撲翼飛行機器人通過機器人機翼撲動拍打空氣產生的反作用力提供推力和升力,并通過飛行機器人尾翼和側翼的位置偏移來調節(jié)機身的運動方向[1]。撲翼飛行機器人能夠完成垂直升降、懸停和滑翔等高難度運動,具有較高的運動靈活性和敏捷性。撲翼飛行機器人相較于固定翼飛行機器人和旋翼飛行機器人,具有體積小、隱蔽性高和機動性強等多方面的優(yōu)勢。
隨著仿生學、機械制造、微納米加工、空氣動力學和智能控制等技術的進一步發(fā)展,飛行機器人的研究引起越來越廣泛的關注,仿生撲翼飛行機器人技術也得到了進一步的發(fā)展和提升[2]。微型化、智能化、集成化和集群化成為飛行機器人的發(fā)展趨勢和方向,飛行機器人能夠模仿鳥類和昆蟲的飛行方式,靈活地完成低空偵察、監(jiān)控以及搜索等任務。
國內外研究團隊己在仿生撲翼飛行機器人的飛行機理[3]、動力學分析[4-5]、撲翼機械結構設計[6-10]、飛行控制方法[11-14]和機器人視覺[15]等方面取得了大量研究成果。其中,國外對撲翼飛行機器人開展研究較早,較多機構進行了撲翼飛行機器人系統的設計和研發(fā)工作。
2005 年,美國AeroVironment 公司開發(fā)的仿蜂鳥撲翼飛行機器人“Nano Hummingbird[16]”質量約19 g,翼展約17 cm,能夠持續(xù)飛行11 min。
德國Festo 公司研制的一款翼展為50 cm 的仿生蝴蝶“eMotion Butterflies[17]”。其機翼骨架采用碳纖維材料,通過兩個獨立的伺服電機進行機翼驅動與控制。
美國麻省理工學院的“Phoenix[18]”。寬大的柔性翼利用碳纖維棒構成了一個三角形的結構,可提供300 W 的強大升力。該仿生撲翼飛行機器人可實現水平穩(wěn)定飛行,速度大約為4 m/s,能夠攜帶GPS 等多種傳感器。但其控制系統有待完善,只能以手持方式起飛,無法完成復雜飛控動作。
國內關于撲翼飛行機器人的相關研究起步較晚,但自2000 年以來也取得了一定的發(fā)展和進步[19-21]。
北京航空航天大學孫茂等[22]專注于空氣動力學相關原理研究,并揭示了昆蟲飛行時的非定??諝鈩恿C理。
西北工業(yè)大學[23-24]研制的“信鴿”仿鴿撲翼飛行機器人采用碳纖維材料搭建骨架,利用聚酯薄膜聚合物作為翼膜,翼展50 cm,質量220 g,續(xù)航時間30 min。其在控制飛行方面,可實現自主起飛和航行,飛行機器人具有一定的抗風能力,可應用于救援和偵察等實際現場。
上海交通大學[25]研究了基于仿昆蟲飛行模式的數學建模,選取光刻膠SU-8 作為結構材料,采用微機電加工技術,設計了仿昆蟲微型撲翼飛行機器人。
北京科技大學[26]設計了“USTB-Dove”仿鳥撲翼飛行機器人,翼展70 cm,質量220 g,可以通過手控或自控方式實現穩(wěn)定飛行,續(xù)航時間為40 min。
從整體來看,國內對于仿生撲翼飛行機器人的研究成果相對集中在理論研究方面,實物實驗平臺的搭建相對較少,仍具有較大的進步空間。
飛行機器人集群編隊是指飛行機器人集群根據不同的任務需求,構成一定的幾何形態(tài)來協作執(zhí)行任務,同時對環(huán)境具有感知能力,能作出適應性動態(tài)調整行為的多智能體系統。
群體模型通常來自自然界和生物集群,如鳥群、蟻群、獸群、魚群和粒子群等。集群智能系統由一群簡單的個體組成,個體按照相關規(guī)則在彼此之間進行信息交互,智能體也可以與環(huán)境進行信息交互。群體智能在數量上表現為多數量,在群體層面表現為分散化、去中心化和自組織的群體特征。
總體來說,飛行機器人集群編隊研究內容主要包括集群構型設計與切換、控制與保持、路徑跟蹤、障礙規(guī)避等協作行為。飛行機器人集群編隊的研究仍處于探索階段。
集群系統比人工系統具有更優(yōu)越的自主性、協調性和智能性。隨著飛行任務復雜度的提升,對撲翼飛行機器人在大區(qū)域中執(zhí)行任務時的機動性、快速性和效率等性能提出了更高的要求,單撲翼機器人較難實現。在面對遠距離、大環(huán)境信息量和高能量消耗等復雜任務時,撲翼飛行機器人集群具有感知信息量大、節(jié)省時間、作業(yè)效率高、群體能量消耗少和隱蔽性好等多方面優(yōu)勢,如圖1所示。
圖1 撲翼飛行機器人的技術優(yōu)勢Fig.1 Technical advantages of flapping-wing flying robot
仿生撲翼飛行機器人是以飛行鳥類為仿生對象,在仿生撲翼機器人集群飛行方面也需要從鳥類進化的集群機理中得到啟發(fā)。通過陣型變換提升撲翼飛行機器人集群的搜索能力和環(huán)境避障能力,可以提升集群的任務執(zhí)行力。所以,撲翼飛行機器人集群在遠距離軍事偵察、大范圍環(huán)境監(jiān)測、長時間災難監(jiān)測等軍事或民用領域具有廣泛的應用前景。
綜上所述,對仿生撲翼飛行機器人集群控制的研究,能夠很好地解決撲翼飛行機器人集群陣型選擇和變換的問題。利用集群控制,實現撲翼飛行機器人集群大范圍搜索、低空偵察和目標覆蓋等復雜應用任務。
現階段,由于固定翼飛行機器人和旋翼飛行機器人的控制技術發(fā)展相對成熟,集群編隊控制主要集中于上述兩類飛行機器人。相比之下,撲翼飛行機器人具有獨特的功能優(yōu)勢以及良好的仿生性能,其集群編隊作為一門前沿發(fā)展科學,具有廣闊的應用前景。
2014 年,匈牙利羅蘭大學Tamas Vicsek 團隊[27]借鑒生物集群行為機理,在通信延遲、GPS丟失等情況下,利用10 架四旋翼飛行機器人完成了障礙物躲避、陣型穩(wěn)定保持和多目標跟蹤等多項任務。2015 年,美國海軍研究院Timothy Chung團隊[28]實現了50 余架固定翼飛行機器人的集群編隊飛行,利用無線自組織網絡進行信息交互和共享。2018 年,美國國防預先研究計劃局設立的“小精靈”項目[29]通過集群內部的信息收集與傳遞,協同破壞敵方防御系統,執(zhí)行情報偵察與電子干擾攻擊等破壞性任務。
飛行機器人編隊飛行的主要目標是驅動飛行機器人形成并保持固定陣型,其控制方法主要分為長機-僚機方法、基于行為方法、虛擬結構方法和一致性方法。
傳統的長機-僚機方法主要由長機跟蹤預設軌跡,僚機與長機保持相對位置跟隨長機飛行。美國賓夕法尼亞大學Desai 團隊[30]提出的長機-僚機改進控制方案通過以上技術實現了無人飛行機器人在非GPS 定位環(huán)境中的集群編隊飛行。基于行為方法是一種通過定義飛行機器人幾種基本控制行為并對其進行執(zhí)行和優(yōu)化的編隊控制方法。北京航空航天大學段海濱團隊[31]提出了一種基于鴿群層級群聚特性的集群控制方法,并通過多無人飛行機器人對該集群控制方法進行了仿真驗證。國防科技大學王祥科團隊[32]針對大規(guī)模固定翼無人機集群的編隊控制問題,提出了一種分層分組控制方法,并通過100 架固定翼無人機集群的全流程數值仿真,驗證了集群控制方法的有效性。西北工業(yè)大學符小衛(wèi)團隊[33]針對切換拓撲結構下的集群編隊控制問題,設計了只需個別無人機獲取虛擬長機信息也能保證集群連通性的編隊控制算法,并進行了仿真實驗,驗證了算法的有效性。日本慶應大學Kuriki 教授團隊[34]結合模型預測控制和一致性控制方法,成功進行了無人飛行機器人自主防碰撞的編隊飛行實驗。
以上幾種飛行機器人集群控制方法各有其特點和適應場合,基于行為的控制方法符合人工智能的發(fā)展思路,設計合理的機器人集群行為,可有效實現集群的智能控制。
根據無人機的資源利用和作戰(zhàn)任務不同,飛行機器人集群的任務通常分為以下三類:(1)訪問任務;(2)打擊任務;(3)察打一體任務。其中,訪問任務具體包括三種任務類型:(1)覆蓋任務;(2)搜尋作業(yè);(3)評估任務。
無人機群訪問任務是在滿足偵測設備與能量約束的情況下,通過對機器人集群進行合理的任務分配,有效搜索、覆蓋或評估訪問目標, 實現訪問收益最大化的過程。飛行機器人集群覆蓋任務是對局部目標進行連續(xù)監(jiān)視和對特定區(qū)域的探測搜尋[35]。根據任務的執(zhí)行策略不同,可以將其歸類為行為式覆蓋和非行為式覆蓋[36]。行為式覆蓋策略是基于某種飛行機器人行為,優(yōu)化各機器人的方向和飛行時間,以實現對任務區(qū)域最大化覆蓋的目的,如圖2所示。
圖2 飛行機器人覆蓋任務的優(yōu)化策略Fig.2 Optimization strategy of flying robot covering tasks
搜索覆蓋率就是飛行機器人在搜索過程中覆蓋的區(qū)域面積與區(qū)域總面積的比值。搜索覆蓋率可按搜索面積或搜索點來進行計算,如圖2(a)所示。圖中,將飛行機器人需要覆蓋的面積進行網格化的處理,得到了6 × 10 個網格單元,飛行機器人從初始點(1,1)開始進行基于行為的巡航覆蓋,直到完成覆蓋任務,停止于坐標點(3,9),共對6 × 10 網格區(qū)域的42 個子區(qū)域進行了巡檢覆蓋。因此,基于行為的覆蓋策略,其搜索覆蓋率為42/60 × 100% = 70%。而以豎“一”字形編隊通過搜索覆蓋區(qū)域,其覆蓋率為編隊覆蓋區(qū)域/總搜索面積,覆蓋率為6/60 ×100%=10%。
避障通過率就是飛行機器人編隊在面對寬敞或狹窄等不同飛行通道環(huán)境的情況下,其飛行編隊根據自身隊形實現的障礙環(huán)境通過飛機數量與總飛機數量的比值。如圖3 所示,飛行機器人編隊以豎“一”字形編隊通過最大通過寬度為一架飛行機器人的障礙環(huán)境時,其障礙通過率為100%,而當飛行機器人編隊以橫“一”字形編隊通過最大通過寬度為一架飛行機器人的障礙環(huán)境時,其障礙通過率為1/5 × 100%=20%。因此,可以看出,基于行為的覆蓋搜索策略有較高的搜索效率。
圖3 飛行機器人集群編隊隊形變換和飛行任務場景示意圖Fig.3 Schematic diagram of formation transformation and flight mission scenario of flying robot cluster
針對開放的非結構化的區(qū)域進行環(huán)境監(jiān)測,飛行機器人集群可利用單機間的信息交互和合作,達到監(jiān)測區(qū)域的動態(tài)變化,形成快速響應。對于空間搜尋、區(qū)域覆蓋與監(jiān)測等任務,機器人集群都是非常好的解決方法。
雁群每年會隨著季節(jié)變化而進行大規(guī)模遷徙,在遷徙過程中,雁群會以“V”字陣型或“一”字陣型進行編隊排布,在保持穩(wěn)定隊形基礎上,借助集群陣型提升群體的障礙通過性和飛行效率。
單架撲翼飛行機器人在執(zhí)行長距離偵察、巡邏以及多目標搜索等任務時,通常會出現續(xù)航不足的問題。利用雁陣的不同隊形,可實現撲翼飛行機器人集群的大范圍空間搜索、巡檢和覆蓋任務,“一”字陣型有利于提升集群的障礙通過率和安全性,“人”字和“V”字陣型有利于提升集群巡檢的搜索覆蓋率,提升巡檢任務的作業(yè)效率,如圖3所示。
2.1.1 單仿生撲翼飛行機器人模型與控制
為方便仿生撲翼飛行機器人模型建模和控制器設計,在假設地面坐標系為慣性坐標系的條件下,通過拉格朗日建模方法,可以得到仿生撲翼飛行機器人的非線性動力學模型
式中,qi=[qtiT,qriT]T=[xiyiziαiβiγi]T表示撲翼飛行機器人的位置及姿態(tài)狀態(tài)向量。
L表示一個使等式成立的矩陣。旋轉矩陣RIB=(RIB)-1=CB2C21C1I通過三個旋轉矩陣得到
式中,χ,α,γ表示機體坐標系下的姿態(tài)信息量。
在主要考慮撲翼飛行機器人位置跟蹤的情況下,通過將式(1)進行分解可得位置回路動力學模型
qt=[x,y,z]T表示撲翼飛行機器人在慣性坐標系下的位置向量,τt表示位置控制輸入量。
2.1.2 仿生撲翼飛行機器人編隊陣型排布與集群模型
陣型切換思想主要源于大雁長途遷徙現象:雁群在整個遷徙過程中,會以“V”字陣型飛行實現整體能量優(yōu)化,同時也會根據環(huán)境變化隨時改變群體陣型,可將雁陣變換思想應用于撲翼飛行機器人集群,以提升飛行機器人集群的巡檢能力和效率。
按照“V”字陣型排布,第三排的撲翼飛行機器人與第一排的撲翼飛行機器人之間的橫向距離為πb/2,縱向距離為4b,垂直距離不變,對應的最大升力和阻力變化量分別為ΔL'= 0.0113 N 和ΔD'= 0.0018 N。
由于ΔL'?ΔL以及ΔD'?ΔD,在陣型分析過程中只考慮前排撲翼飛行機器人對其最近后排撲翼飛行機器人的影響。前排飛行的撲翼飛行機器人產生的翼尖渦流方向主要為機翼的正后方,同排飛行的撲翼飛行機器人之間的橫向距離為πb/2,其對應的升阻力變化值同樣遠小于ΔL和ΔD,如圖4所示。
圖4 撲翼飛行機器人集群編隊陣型Fig.4 Flapping wing flying robot cluster formation
在穩(wěn)定飛行情況下,通過拉格朗日建模方法,可以得到仿生撲翼飛行機器人集群位置回路的非線性動力學模型
式中,qi=[qtiT,qriT]T=[xiyiziαiβiγi]T表示第i個撲翼飛行機器人的位置向量,Mti表示慣性矩陣,Gti=[0,0,-mig]T表示第i個撲翼飛行機器人的重力向量,τti=[τix,τiy,τiz]T表示第i個撲翼飛行機器人的控制輸入量,uti表示第i個撲翼飛行機器人在翼尖渦流影響下受到的額外升阻力向量,當i為“長機”時uti=0,Fti=[-Fxi,Fyi,Fzi]T表示第i個撲翼飛行機器人在三軸方向所受到的阻力、側向力與升力。第i個撲翼飛行機器人的旋轉矩陣RiBI通過式(3)~(5)所示的三個旋轉矩陣得到。在此僅考慮偏航角γ為統一變化值,橫滾角χ和俯仰角α為固定值的情況。
2.2.1 仿生運動行為綜述
仿生學誕生于上個世紀60 年代,仿生技術是在研究生物體、生命系統等結構與功能原理的基礎上,根據這些生命特征原理形成的先進技術和應用。
生物行為就是具有某些特征的生物動作序列和集合。而機器人行為與生物行為類似,通過仿生運動行為控制將機器人的特征行為進行精確的建模和應用。
在20 多年的發(fā)展過程中,多機器人編隊控制形成了多種具有代表性的研究方法[37-41],包括領航-跟隨法、基于行為的方法、人工勢場法和虛擬結構法等?;谛袨榈姆椒ㄝ^為形象并易于理解,在機器人導航、編隊與協作、機器人足球和人機交互等方面獲得了廣泛的應用。
上世紀80 年代,美國麻省理工學院的Rodney Brooks[42]提出了機器人行為控制方法和包容式的體系結構,將行為引入到機器人研究中。2004 年,Naffin等在協作、通信、運動、編隊保持和傳感等方面為多機器人編隊設計了16 種行為,以執(zhí)行和完成編隊任務[43]。2009 年,Ray 等為多機器人編隊設計的分布式行為選擇機制,取決于編隊開始時處于領航者地位的機器人的初始狀態(tài)[44]。
在國內,經過多年的積累,也形成了一系列的多撲翼飛行機器人集群編隊控制算法的研究成果[45-51]。2021 年,北京航空航天大學段海濱等研究了鴿群導航行為模型,探索了信鴿歸巢多種復雜行為學的內在機理。信鴿歸巢導航過程呈現出了三個階段:(1)Map-and-Compass 階段,信鴿處于高熵狀態(tài),對應依靠地圖羅盤的導航行為;(2)Leg Length 階段,信鴿處于中熵狀態(tài),對應飛行中重定向期間的導航行為;(3)Immediate Home階段,信鴿處于低熵狀態(tài),對應鴿子在鴿房附近快速歸巢的行為。
2.2.2 仿生運動行為控制核心思想和理論模型
仿生行為控制的核心思想就是把底層的具體運動細節(jié)交給執(zhí)行機構,控制系統高層只負責整體運動規(guī)劃。在傳統的遙操作機器人控制系統中,期望軌跡在機器人核心控制器中生成,并對期望軌跡采樣,以對機器人進行實時的運動控制,對于操作者來說工作量較大。
基于仿生運動行為的控制系統架構不再傳輸離散的軌跡采樣點和基礎數據,而是直接傳輸參數化的軌跡函數。參數化的軌跡函數,是指利用變換函數,把軌跡映射到一些定義的運動行為函數上,通過對行為函數的線性組合就可以還原參考軌跡。通信系統只需要傳輸幾個運動行為函數參數,即可實現軌跡控制。在這種架構下,通信傳輸量將大幅下降而控制精度卻能夠得到保證。
仿生運動行為控制框架的系統結構如圖5 所示。仿生行為控制字母表中的行為函數為二元組f=(v,γ)T的形式,允許每個行為函數在一個任意長的時間段內執(zhí)行。在仿生行為控制系統結構中,機器人控制器可進行路徑規(guī)劃和機器人的軌跡生成,并通過仿生行為生成器生成仿生行為序列。隨后,將運動行為序列發(fā)送給運動行為解析器,以控制機器人執(zhí)行機構,來完成機器人的路徑規(guī)劃和作業(yè)任務。
圖5 仿生運動行為控制理論框架的控制系統結構Fig.5 Control system configuration of BCBC framework
在仿生運動行為控制框架下,用運動機對機器人系統進行建模,用以描述機器人在離散時間接收仿生運動行為命令并產生連續(xù)運動的特征。仿生運動行為控制的模型稱為運動狀態(tài)機模型,就是生成從狀態(tài)空間到輸出空間的映射關系模型,其狀態(tài)方程為
式中,x,y和u為時間變量的矢量函數,G為矩陣,h和k是矢量空間之間的映射。
二元組(fi,ψi)稱為“行為函數”,由這些二元組構成的集合稱為“字母表”。機器人控制程序表示為由字母表中的行為函數構成的符號串的形式。如果運動機的初始狀態(tài)為x0=x(t0),在接收到符號串(f1,ψ1,T1)(f2,ψ2,T2)…(fn,ψn,Tn)后,其運動規(guī)律可以描述為
式中,u、x、y均是時間t的函數。u是連續(xù)輸入控制函數。x是n維系統狀態(tài)函數。y是一個系統輸出函數。k是狀態(tài)反饋。
(f1,ψ1)行為函數含義實例說明如下:
當飛行機器人以前進方向趨近于期望直線時,飛行機器人方位角θ將趨向于期望直線的角度β,行為函數(f1,ψ1)中相應的符號定義為
式中,v0為常數,k1和k2是控制增益常數,β為給定直線的傾角。
ψ1是定義在機器人輸出空間上的函數,取值為整數值,即ψ1:Y->Z,用于確定下一采樣周期內將要執(zhí)行的行為函數相對于當前行為函數的位置。
(f2,ψ2)和(f3,ψ3)的符號定義和函數說明參考(f1,ψ1)。根據以上行為函數的定義,可以得到實現飛行機器人位姿鎮(zhèn)定的運動字母表
將一個連續(xù)系統分段表示,然后將每一段用參數化的運動行為函數(f,ψ)表達,就可以用一串離散的符號序列來驅動一個連續(xù)系統。在仿生行為控制框架下,從初始時刻開始,仿生運動行為編譯器接收到一個運動行為函數的序列,隨后編譯器將這個序列翻譯成分段映射。仿生行為過程用運動行為函數表達,將行為構成的符號串用于運動規(guī)劃。
微型撲翼飛行機器人實驗系統由飛行機器人本體和地面控制單元兩大部分組成。撲翼飛行機器人機身本體系統由高強度碳纖維機身、X 型翼、機載微型電路板、微型電機和傳動機構等組部件構成。
撲翼飛行機器人集成了MEMS 工藝的仿生彈性翼,X 型翼在工程上較易實現,可實現翅翼單自由度上、下撲動。撲翼飛行機器人翼展14 cm,可連續(xù)穩(wěn)定飛行13 min 以上,質量僅有6 g,如圖6(a)所示。飛行機器人機身可安裝陀螺儀等傳感器,可實現撲翼飛行機器人的自平穩(wěn)飛行、轉彎和避障等飛行功能。
圖6 撲翼飛行機器人結構及地面控制站和圖傳單元Fig.6 Flapping-wing flying robot structure, ground control station and image transmission unit
地面控制單元裝置包括接收天線、線路放大器、計算機等結構組部件。撲翼飛行機器人地面控制單元如圖6(b)所示,其控制手柄包括四個方向按鍵和加減速按鍵,通過天線將控制單元的數據級和行為級指令發(fā)送給撲翼機器人,同時可將撲翼機器人狀態(tài)信息和機器人視覺信息回傳給地面控制單元。地面控制和接收單元主要用來接收機器人機載信息和視覺傳感器實時回傳的信息,并將數據和信息進行記錄和存儲。
撲翼飛行機器人單機可利用機載視覺進行導航,撲翼飛行機器人的載荷可達5 g。圖傳模塊利用模擬圖傳,頻率為5.8 GHz,質量僅為2 g,可實現圖片與視頻的高速、高帶寬傳輸。撲翼飛行機器人的載荷能力完全能夠承載圖傳單元等載荷。導航實驗方面,在室內進行撲翼飛行機器人三機的初步編隊飛行實驗,三機編隊飛行利用地面控制器來對三撲翼飛行機器人進行飛行機器人本體驗證和編隊初步驗證。
撲翼飛行機器人實驗環(huán)境如圖7所示,利用兩根豎桿和桿連接線纜來模擬線纜巡檢任務和作業(yè)環(huán)境。通過設計實驗,以七架撲翼飛行機器人編隊為實驗研究對象,在集群編隊“人”字形到“V”字形的轉換、“人”字形到“一”字形的轉換、編隊避障與掉頭控制和編隊手動控制與仿生行為控制等多種情況下進行實驗研究,以驗證仿生集群行為控制方法的有效性。
圖7 微型撲翼飛行機器人集群飛行實驗Fig.7 Cluster flight experiment of micro flapping-wing flying robot
飛行機器人編隊的“人”字形定義為飛行機器人頭機處于飛行方向的中間最前列,其他飛行機器人在頭機的側后方依次后向排列,如圖4 所示為人字形排列。而“V”字形排列為飛行機器人編隊頭機處于飛行方向的中間最后列,其他飛行機器人在頭機的側前方向依次排列,為“人”字形排列的反方向陣型。橫“一”字形為多飛行機器人沿著飛行方向并行飛行。豎“一”字形為多飛行機器人沿著飛行方向前后跟隨飛行,形成豎向排列的陣型。
飛行機器人在X、Y和Z三維空間進行軌跡運動。飛行機器人的控制方式是給定了機器人的初始位置、機器人的運動速度和空間控制角度,飛行機器人即可進行飛行軌跡運動。飛行過程中,可根據飛行機器人的位置、姿態(tài)和算法進行編隊調整,以完成飛行機器人的作業(yè)任務。
微型撲翼飛行機器人飛行實驗如圖7所示,外圈藍色虛線為飛行機器人編隊的飛行軌跡方向曲線,實驗以三個撲翼飛行機器人為三角形編隊,形成了三角形飛行機器人編隊的陣型,如圖7 中藍色三角形隊形所示。撲翼飛行機器人的行為就是具有相似特征的機器人動作集合,如平面圓形飛行等,并且機器人行為與運動行為函數符號相對應。通過對多撲翼飛行機器人集群編隊特點進行分析,結合鴿群三階段歸巢行為模型,將撲翼飛行機器人導航過程分為:(1)第一階段——高熵自然羅盤導航階段;(2)第二階段——中熵重定向導航行為階段;(3)第三階段——低熵狀態(tài)快速歸巢行為階段。設計十一個行為函數和字母表對飛行機器人編隊進行控制,其仿生集群行為函數如表1所示。
表1 飛行機器人空間運動的仿生集群行為函數表Table 1 Function table of BCBC for flying robot space motion
實驗地面平臺的控制方式采用基礎行為集合:上、下、左、右,基于作業(yè)任務分析的機器人集群特征行為集合:編隊“V”字形變換f5、編隊避障f9、編隊掉頭運動f10、編隊隊形保持f11…。(f1,ψ1)、(f2,ψ2)、(f3,ψ3)、(f4,ψ4)…中,f為機器人運動狀態(tài)控制函數,ψ為機器人運動切換函數。
通過以上撲翼飛行機器人的行為規(guī)劃,可實現撲翼機器人的智能行為控制,無需根據撲翼機器人的飛行狀態(tài)和飛行環(huán)境實時發(fā)送控制命令,通過基于仿生運動行為控制的智能控制策略可大量節(jié)省控制器實時控制的負荷,大量減少底層位置控制的壓力,基于集群行為的智能控制方法為人處于控制閉環(huán)的機器人遙操作提供了有力的控制解決方案。
撲翼飛行機器人機身上裝有微型陀螺儀用來記錄撲翼飛行機器人的姿態(tài)數據。飛行機器人陀螺儀的數據采用了四元數法,記錄數據如表2所示。
表2 撲翼飛行機器人陀螺儀數據表Table 2 Flapping-wing flying robot gyro data sheet
根據撲翼飛行機器人陀螺儀的姿態(tài)數據,可以更多了解飛行機器人集群的姿態(tài)信息和數據信息,為撲翼飛行機器人集群控制提供了更多的硬件保證和數據支持。
利用豎桿和橫桿作為實驗場地的飛行標記點位,實驗的目的是利用三撲翼飛行機器人的三角形編隊變換來驗證撲翼機編隊變換,以形成初步編隊變換驗證數據并進行數據分析。以地面桿作為標記點,利用地面控制臺對飛行編隊進行加速和行為控制,實現正三角撲翼機器人編隊向倒三角飛行機器人編隊的陣型轉換。
根據以上仿生行為函數的定義和規(guī)劃,設計以下一些仿真實驗來驗證基于雁陣變換的撲翼飛行機器人集群行為控制的有效性。飛行機器人編隊軌跡生成實驗是仿真軟件實驗,本實驗考慮將撲翼飛行機器人簡化為三維智能體點,重點研究編隊的軌跡規(guī)劃、編隊軌跡和編隊通過率及避障等后續(xù)問題。
(1)“人”字形—V字形轉換
七個撲翼飛行機器人分別從各自的初始位置[七個坐標點:(4,4);(4,0);(0,4);(4,2);(2,4);(4,-2);(-2,4)]出發(fā),機器人的運動方向為與XOY平面呈45°的直線方向。然后,給七個撲翼飛行機器人發(fā)送隊形轉換行為函數指令,七個撲翼機器人經過隊形轉換后,變成倒三角隊形,由原來的“人”字形編隊變?yōu)椤癡”字形編隊隊形。隨后發(fā)送隊形轉換行為函數結束命令,七個撲翼機器人繼續(xù)以“V”字形進行勻速直線運動,如圖8所示。
圖8 基于仿生集群行為控制的“人”字形轉換“V”字形運動行為空間軌跡圖Fig.8 Space trajectory of “V” type movement behavior of “herringbone” type transformation based on BCBC
(2)“人”字形-橫“一”字形轉換
七個撲翼機器人分別從各自的初始位置出發(fā),機器人的運動方向為與XOY平面呈45°的直線方向。隨后,給撲翼飛行機器人編隊發(fā)送仿生運動行為控制指令,撲翼機器人編隊進行隊形變換,變?yōu)闄M“一”字形隊形。隨后,撲翼機編隊繼續(xù)進行勻速直線運動,如圖9所示。
圖9 基于仿生集群行為控制的“人”字形轉換橫“一”字形運動行為空間軌跡圖Fig.9 Space trajectory of “herringbone” type transformation “一” type movement behavior controlled by BCBC
由七個撲翼飛行機器人組成的集群編隊分別從初始位置出發(fā),沿與XOY平面呈45°的平面勻速飛行。隨后給撲翼機編隊發(fā)送仿生編隊行為變換指令,撲翼機編隊在調整成橫“一”字形后,集體旋轉90°,隊形變?yōu)樨Q“一”字形編隊。隊形調整結束后,以豎“一”字形繼續(xù)進行勻速直線運動,如圖10所示。
圖10 基于仿生集群行為控制的“人”字形轉換橫“一”字形運動行為空間軌跡圖Fig.10 Spatial trajectory of “herringbone” type transformation horizontal “一” type movement behavior controlled by BCBC
如圖9所示,飛行機器人編隊以“人”字形通過最大通過寬度為一架飛行機器人的狹窄障礙通道時,其障礙通過率為14%。而“人”字形的飛行機器人編隊搜索覆蓋率較高,可達到70%以上。所以,飛行機器人編隊控制的策略是:在進行搜索覆蓋任務的情形下,以“人”字形編隊可提升覆蓋率;而在通過狹窄通道任務情形下,以豎“一”字形編隊方式,可大大提升障礙通過率,如圖10所示。
(3)集群避障與掉頭行為
由七個撲翼機器人組成的集群編隊由初始位置出發(fā),沿與XOY平面呈45°的平面運動,如圖11 所示。隨后給撲翼機編隊發(fā)送編隊避障行為指令,集群編隊在調整為橫“一”字形后,以90°角向下集體運動,以完成90°角集群避障行為。
圖11 基于仿生集群行為控制的集群避障行為和掉頭行為空間軌跡圖Fig.11 Space trajectory of obstacle avoidance behavior and turning behavior of the cluster based on BCBC
隨后給撲翼機器人編隊發(fā)送編隊掉頭行為指令,集群在調整為橫“一”字形后,以掉頭180°角反向運動,以完成集群掉頭避障行為,如圖11所示。
(4)編隊手動控制比較
通過將實驗的集群手動控制方式和仿生集群行為控制方式進行對比來觀察其缺點和優(yōu)點。以手柄控制器控制的手動控制方式,操作者通過視覺進行實時判斷,手動控制地面控制器存在抖動現象,飛行機器人飛行軌跡同樣存在隨機抖動。因此,飛行機器人編隊軌跡存在抖動和軌跡非連續(xù)運動的不足,如圖12(a)所示,抖動軌跡放大如圖12(b)所示。抖動尺寸范圍為0.1~0.4 cm,抖動呈現隨機分布,均值在0.1~0.2 cm,運動范圍在0~20 cm,在1cm 的范圍之內抖動有1~7 次左右,也呈現隨機狀態(tài)。因此,抖動幅度占總運動幅度比率12%左右。飛行機器人抖動相對較小,在可控范圍之內。
圖12 基于手動控制與仿生集群行為控制的飛行機器人編隊的空間運動軌跡對比圖Fig.12 Comparison of space motion trajectory of flying robot formation based on manual control and BCBC
手控方式需要操作者進行實時判斷和操控,操作者工作量大且較易疲勞。而在仿生集群行為控制方式下,利用機器人半智能行為級指令進行編隊控制,操作者只需進行編隊監(jiān)控和少量編隊指令交互即可,大量節(jié)省了操作者的工作量,并且控制軌跡平滑,如圖12(c)所示。因此,基于仿生集群行為控制的多飛行機器人集群控制方法有明顯的算法優(yōu)勢。
通過以上集群編隊“人”字形到“V”字形的轉換、“人”字形到“一”字形的轉換、編隊避障與掉頭控制和編隊手動控制與仿生行為控制的多種情況的實驗比較和驗證,基于仿生集群行為控制的多撲翼飛行機器人集群控制方法,能夠有效地完成飛行機器人集群編隊控制的作業(yè)任務。
本文提出了基于雁陣變換的多微型撲翼飛行機器人集群編隊行為控制方法。針對多撲翼飛行機器人實驗任務定義了多個編隊行為控制函數,實現了飛行機器人編隊的隊形轉換和避障行為控制。并以多撲翼飛行機器人搭建了實驗平臺系統,通過“人”字形、“V”字形、“一”字形等典型雁陣陣型轉換、編隊避障掉頭和手動控制等多種情況下的實驗驗證,最終驗證了基于雁陣變換的多微型撲翼飛行機器人集群行為控制方法的可行性和有效性。與傳統的撲翼飛行機器人實時控制相比,控制工作量大幅降低。下一步的研究工作主要集中在以下兩個方面:(1)將蟻群、魚群等群體智能算法應用于撲翼飛行機器人集群控制;(2)將機器人的視覺感知和環(huán)境建模應用于撲翼飛行機器人集群,朝著群體智能和智能機器人集群感知的方向發(fā)展。