武文亮 周興社 沈 博 趙 月
隨著感知技術、通信技術、計算機與智能技術以及控制技術等的不斷發(fā)展以及復雜應用場景的持續(xù)推動,集群機器人系統(tǒng)正在得到越來越廣泛的研究與應用,并積累了大量理論、方法與技術研究成果,特別是在無人機(Unmanned aerial vehicle,UAV)集群系統(tǒng)協(xié)同控制方面[1?5].集群機器人系統(tǒng)的設計靈感最早起源于對自然界中蟻群、蜂群、鳥群、魚群等社會性簡單生物集群行為的觀察與模擬[6?7].人們在研究過程中發(fā)現(xiàn),盡管在這些生物集群中的個體都相對簡單,但整個系統(tǒng)卻能夠通過個體間的相互通信與協(xié)作涌現(xiàn)出宏觀有序的群體智能行為[8?9].相對于單體機器人系統(tǒng)而言,集群機器人系統(tǒng)具有許多明顯的優(yōu)勢[10?11]:1)可以實現(xiàn)單體機器人無法實現(xiàn)的復雜任務;2)設計和制造多個相對簡單的機器人比單個復雜機器人更容易、成本更低;3)多個機器人間的并行性可以極大提高系統(tǒng)執(zhí)行任務的效率;4)針對不同的具體情況,可以提供更多的解決方案并優(yōu)化選擇方案;5)通過增加冗余度、消除失效點,可以增加解決方案的魯棒性.因而,集群機器人系統(tǒng)更適合于區(qū)域監(jiān)測/遍歷、外界環(huán)境過于危險和具有冗余性要求的任務.在民用領域,集群機器人系統(tǒng)可用于勘探測繪、航空攝影、環(huán)境研究、核輻射探測等方面,又可用于水災探測、防火和救援工作、電力線路檢查等方面,同時在城區(qū)監(jiān)視、大型牧場巡查等方面也具有非常廣泛的市場前景.在軍事領域,將大量的微型機器人迅捷地散布在敏感區(qū)域,可用以在大范圍時空域內實時監(jiān)控、感知敵情變化;由大規(guī)模UAV、無人坦克、無人艦艇等不同形態(tài)的機器人進行搜索、偵查、圍捕、攔截與打擊等作戰(zhàn)任務,可最大限度地減少人員傷亡.
集群機器人系統(tǒng)是群體智能的一個重要應用研究領域,也是機器人系統(tǒng)未來發(fā)展的重要方向之一.人工智能在過去幾十年中取得的快速發(fā)展很大程度上取決于人工智能系統(tǒng)及其算法的評價[12].已有研究成果表明,對機器人系統(tǒng)特性進行有效的評價或者制定相關的評價標準,具有技術引領作用,好的系統(tǒng)特性評價體系可以極大地促進機器人系統(tǒng)更好更快地向前發(fā)展.集群機器人系統(tǒng)特性評價問題相對復雜,不僅包含系統(tǒng)關鍵特性的評價,而且還包含系統(tǒng)綜合特性的評價,同時不僅包含對單體機器人系統(tǒng)特性的評價,而且更為關注對整個集群機器人系統(tǒng)特性的評價.集群機器人系統(tǒng)具有自主性、智能性、協(xié)同性、靈活性、魯棒性和可擴展性等諸多期望特性,這些特性是保證集群機器人系統(tǒng)安全、可靠并高效率完成任務的關鍵.近年來,越來越多的研究學者開始關注集群機器人系統(tǒng)特性的評價問題.適時地對這些研究成果進行總結與分析,對于集群機器人系統(tǒng)的研究、應用與發(fā)展具有積極的推動作用.
本文以集群機器人系統(tǒng)特性評價為核心,基本結構安排如下:第1 節(jié)概述集群機器人系統(tǒng)概念及其基本分類;第2 節(jié)梳理關鍵的集群機器人系統(tǒng)期望特性;第3 節(jié)介紹與比較代表性的集群機器人系統(tǒng)特性評價標準;第4 節(jié)述評已有集群機器人系統(tǒng)特性評價指標體系;第5 節(jié)總結與比較現(xiàn)有集群機器人系統(tǒng)特性評價方法;第6 節(jié)概括當前集群機器人系統(tǒng)特性評價研究工作的不足,并給出未來發(fā)展的主要方向.
集群機器人系統(tǒng)具體指由一定規(guī)模的同構或異構的、單功能或多功能的單體機器人共同組成,在交感網絡的支撐下,利用信息交互與反饋、激勵與響應等交感行為,可實現(xiàn)單體機器人行為自主決策,集群機器人間行為協(xié)同,適應動態(tài)環(huán)境,最終產生能力涌現(xiàn),共同完成特定任務的自主式移動機器人系統(tǒng)[13].構成集群機器人系統(tǒng)的個體可以是空中機器人、地面機器人、水面機器人和水下機器人等作業(yè)于不同空間的單體機器人.集群機器人系統(tǒng)不是多機器人的簡單編隊,其能力也不是多機器人單一能力的簡單疊加,而是由多機器人通過科學的方法聚集后,經過集群自組織與行為調控機制的有機耦合,產生了新的能力或原有能力發(fā)生了質的變化.
目前國內外關于集群機器人系統(tǒng)的研究已相當普遍,典型的集群機器人系統(tǒng)主要包括:群智能機器人系統(tǒng)、自重構機器人系統(tǒng)、智能機器人協(xié)作系統(tǒng)和足球機器人系統(tǒng).群智能機器人系統(tǒng)是由許多無差別的自主機器人組成的分布式系統(tǒng),它主要研究如何使能力有限的個體機器人通過交互產生群體智能[14?15].代表性的群智能機器人系統(tǒng)主要有:Kilobot[16]、Kobot[17]、Khepera[18]、I-Swarm[19]、Pherobots[20]和SwarmBot[21]等.群智能機器人系統(tǒng)有別于傳統(tǒng)意義上的多機器人系統(tǒng),在個體自主性、功能、感知、通信能力、移動性、集群的規(guī)模、異構性、控制方式等方面都有一定的限制.自重構機器人系統(tǒng)以一些具有相同或不同功能的標準模塊為組件,根據(jù)目標任務的需要,對這些模塊進行相應的組合,進而形成具有不同功能的系統(tǒng).代表性的自重構機器人系統(tǒng)主要有:CEBOT[22]、CKBot[23]、M-Blocks[24]、Ubot[25]和Sambot[26]等.智能機器人協(xié)作系統(tǒng)是指由多個具有一定智能的自主機器人組成,機器人之間通過高級通信實現(xiàn)相互協(xié)作,以完成復雜任務的系統(tǒng).代表性的智能機器人協(xié)作系統(tǒng)主要有:ALLIANCE[27]、SDR[28]、ASyMITRe[29]和ASyMTRe-D[30]、CESAR Emperor[31]和CESAR Nomads[32]等.在上述三類集群機器人系統(tǒng)中,機器人之間的關系都是合作.而在足球機器人系統(tǒng)中,同隊的機器人之間的關系是合作,不同球隊的機器人之間的關系則是對抗.由于足球機器人系統(tǒng)的對抗性強,對個體間協(xié)作的實時性要求高,因而成為一個具有挑戰(zhàn)性的課題.國際上專門設立機器人足球賽來促進該項研究,其中最具有影響的兩項賽事分別是RWC (Robot-soccer World Cup,機器人足球世界杯決賽)和RoboCup (Robot World Cup,機器人世界杯足球錦標賽).
集群機器人系統(tǒng)可以依據(jù)控制方法、協(xié)作機制、組織結構、控制結構、通信方式和集群組成等多種屬性分類.這些分類屬性對集群機器人系統(tǒng)構建及其特性形成與表現(xiàn)程度具有重要影響.
1)按照控制方法的不同,可以劃分為基于分層遞階的集群機器人協(xié)同控制和基于自組織的集群機器人協(xié)同控制.
分層遞階是一種經典的智能系統(tǒng)控制方法,最早由Lima 等[33]提出,主要由組織級、協(xié)調級和執(zhí)行級組成,遵循 “精度遞增伴隨智能遞減”的原則分級管理系統(tǒng).受此啟發(fā),基于分層遞階的集群機器人協(xié)同控制結構被提出,具體如圖1 所示[34].該結構包括3個決策層和1個控制層.第3 層基于市場機制進行編隊任務分配;第2 層負責對編隊成員間的協(xié)同任務進行協(xié)調,包括協(xié)同搜索、協(xié)同攻擊、協(xié)同毀傷評估等;第1 層負責航跡規(guī)劃;第0 層負責平臺控制.這種基于分層遞階的集群機器人協(xié)同控制方法采用自頂向下的解決方案,有效地降低了問題求解難度,但這種逐層分解問題的過程也注定了集群機器人控制和決策的實時性難以保障.
圖1 基于分層遞階的集群機器人協(xié)同控制結構Fig.1 Cooperative control process of swarm robots based on hierarchical structure
基于自組織的集群機器人協(xié)同控制最初起源于對簡單生物群落的研究[35],并逐漸發(fā)展形成了群體智能理論[36].這類方法通過模擬蜂群、鳥群、魚群等生物群體行為實現(xiàn)集群機器人分布式自組織控制,采用自底向上的數(shù)據(jù)驅動和建模策略,將簡單對象構成大集合,通過簡單智能主體的聚集協(xié)同來實現(xiàn)全局的智能行為.按照Boyd 提出的觀察?判斷?決策?執(zhí)行(Observe-Orient-Decide-Act,OODA)環(huán)理論[37],基于自組織的集群機器人協(xié)同控制流程如圖2 所示[38].
圖2 基于自組織的集群機器人協(xié)同控制流程Fig.2 Cooperative control process of swarm robots based on self-organization
該結構主要包括協(xié)同觀察、協(xié)同判斷、協(xié)同決策和協(xié)同執(zhí)行4個功能單元.協(xié)同觀察單元負責分布式協(xié)同環(huán)境感知理解與分布式目標狀態(tài)融合估計等功能,協(xié)同判斷單元負責分布式協(xié)同任務決策等功能,協(xié)同決策單元負責分布式航跡協(xié)調規(guī)劃等功能,協(xié)同執(zhí)行單元負責分布式編隊控制和集群蜂擁與集結等功能.不同于自頂向下的解決方案,該方法更加強調個體對環(huán)境的動態(tài)反應,以及多個個體之間基于規(guī)則的行為協(xié)調,以此來實現(xiàn)全局的智能行為,因此具有計算簡單、魯棒性好等優(yōu)點.
2)按照協(xié)作機制的不同,主要可以劃分為無意識協(xié)作和有意識協(xié)作.無意識協(xié)作主要模擬簡單社會性生物群落的運行機制,利用大量簡單的自主個體,通過局部交互和自組織作用,使整個系統(tǒng)呈現(xiàn)協(xié)調、有序的狀態(tài).有意識協(xié)作是多個個體通過信息交換來協(xié)調各自行為,共同完成某一任務或實現(xiàn)共同目標,主要用于異構集群機器人系統(tǒng)的協(xié)作技術研究,并更多依賴規(guī)劃來提高協(xié)作效率.按照研究方法的不同,有意識協(xié)作又可以劃分為協(xié)商反應式方法和多智能體方法[39].
3)按照組織結構的不同,主要可以劃分為集中式、分布式和混合式.集中式結構適用于強協(xié)調任務,分主、從機器人,由主機器人負責系統(tǒng)協(xié)調,具有完全的控制權.該方式可減少協(xié)商通信的開銷,并獲得全局最優(yōu)解,但實時性與動態(tài)性較差,結構靈活性不足、魯棒性較差.分布式結構適用于弱協(xié)調任務,機器人之間無隸屬關系,通過交互或通信實現(xiàn)協(xié)調.該方式可降低系統(tǒng)的復雜性,提高擴展性和魯棒性,但對通信要求較高,不能保證目標的全局最優(yōu)性.混合式結構本質上是一種層次結構,上層的領導機器人動態(tài)生成,且對下層的機器人只有部分控制權.該方式可實現(xiàn)集中式和分布式結構的互補,提高系統(tǒng)靈活性和協(xié)調效率,但復雜性高、實現(xiàn)難度大.
4)按照控制結構的不同,主要可以劃分為慎思型和反應型.當一個團隊在應對環(huán)境改變時可以根據(jù)策略重新組織整個團隊的行為,則為慎思型結構.當團隊中每個機器人在應對環(huán)境變化時,僅僅對自己所采取的策略進行重組,以更好地完成自身的任務,則為反應型結構.
5)按照通信方式的不同,主要可以劃分為隱式通信和顯式通信.其中,隱式通信主要利用個體行為對環(huán)境產生的變化影響其他個體行為,以此達到信息交流和自組織目的;顯式通信通常需要專用硬件通信設備以及復雜的信息表示模型,個體之間可直接進行信息交換.按照通信范圍的不同,顯式通信又可進一步分為全局通信和局部通信.
6)按照集群組成的不同,主要可以劃分為同構集群機器人系統(tǒng)和異構集群機器人系統(tǒng).
除了上述分類方法外,集群機器人系統(tǒng)還可以按照團隊規(guī)模、可重構性、作業(yè)空間、個體處理能力和協(xié)作能力等屬性進行分類[40].通信作為機器人間相互溝通的基本手段,還可以按照通信拓撲、帶寬和實現(xiàn)方式等進行分類.
盡管目前集群機器人系統(tǒng)研究已取得了大量成果,但針對集群機器人系統(tǒng)特性評價一直尚未形成通用的評價標準,研究者主要沿襲控制系統(tǒng)特性和生物集群系統(tǒng)特性對集群機器人系統(tǒng)的期望特性進行總結與描述.這些特性也被認為是研究集群機器人系統(tǒng)的動機.
1)自主性(Autonomy)
在很多相關研究中都對機器人系統(tǒng)自主性進行了定義,但以美國國家標準技術研究所(National Institute of Standards and Technology,NIST)無人系統(tǒng)自主性等級(Autonomy levels for unmanned systems,ALFUS)工作組[41]提出的定義比較全面和規(guī)范,該組織定義:自主性即無人系統(tǒng)擁有感知、觀察、分析、交流、計劃、制定決策和行動的能力,并且通過人機交互完成人類布置給它的任務.這里描述的無人系統(tǒng)即一般意義上的移動機器人系統(tǒng).由該定義可以看出,自主性即機器人系統(tǒng)獨立于操作者的管理程度和自我管理的能力.與很多自主性研究中提出的定義相似的是,機器人系統(tǒng)的自主性可以通過以下4 項基本功能實現(xiàn),即觀察、判斷、決策和行動[42].考慮到自主性在計算能力、傳感器的真實程度、人和計算機之間知識的傳遞障礙等方面的限制,為了確保機器人系統(tǒng)的獨立性,同時又不限制操作者對于自主性局限性的彌補,一些研究學者也關注可變的自主性研究[43?44].單體機器人系統(tǒng)自主性是集群機器人系統(tǒng)自主性的重要組成,集群機器人系統(tǒng)自主性強調的是自主的單體機器人通過相互通信與協(xié)作在群體層面體現(xiàn)的自主,因此強調個體在上述4 項基本功能上的自主協(xié)同.
2)智能性(Intelligence)
從信息論的角度看,智能性具體指系統(tǒng)在一定環(huán)境下針對特定目標而有效地獲取信息、處理信息和利用信息從而成功地達到目標的能力[45].集群機器人系統(tǒng)智能性主要通過群體智能實現(xiàn).國內外很多研究學者都對群體智能的概念進行了研究[46?50],盡管在研究對象和關注點上有所不同,但這些學者一致認為,群體智能的本質內涵是群體具有優(yōu)于個體或個體總和的智能性或能力.為了更具針對性,將信息論中關于智能性的定義、NIST ALFUS 工作組關于自主性的定義與上述群體智能本質內涵相結合,本文認為集群機器人系統(tǒng)智能性是指通過自主協(xié)同感知、分析、決策和判斷等行為所涌現(xiàn)出優(yōu)于個體智能或個體智能總和的群體行為特性或能力.
通過對比分析自主性與智能性內涵可知,自主表達的是行為方式,而智能則是完成行為過程的能力.兩者間的關系為[51]:智能依賴自主,智能的等級取決于自主權的高低.智能生成的一般過程,是在自主的前提下綜合運用各方面能力,去獲取、處理并利用信息以盡可能達到符合自然規(guī)律的目的[52].
3)協(xié)同性(Cooperation)
集群機器人系統(tǒng)協(xié)同性是指多個機器人通過協(xié)同機制,可以完成單體機器人無法完成的任務的功能特性[53].通過適當?shù)膮f(xié)同機制,集群機器人系統(tǒng)可以獲得系統(tǒng)級的非線性功能增量[54],從而突破單體機器人系統(tǒng)在感知、決策及執(zhí)行能力等方面受到的限制,從本質上提高系統(tǒng)的性能,甚至完成單體機器人無法實現(xiàn)的任務[55?56].
4)靈活性(Flexibility)
集群機器人系統(tǒng)靈活性是指集群通過多種不同的演化模式適應環(huán)境變化的特性[57].一個高度靈活的集群機器人系統(tǒng)具有重分配和再分配的能力[58],可以用相同的軟件或軟件的微小變化來處理不同的任務[15],能夠針對不同任務產生模塊化的解決策略,解決當前任務并響應環(huán)境變化[14].集群機器人系統(tǒng)中存在多樣性、涌現(xiàn)性、局部交互性等多個側面體現(xiàn)其靈活性[59].多樣性指集群系統(tǒng)具有多種不同的演化模式,涌現(xiàn)性指集群系統(tǒng)可以根據(jù)環(huán)境的變化創(chuàng)造整體的新狀態(tài),而局部交互性通過分散的決策能力使得集群系統(tǒng)具有冗余.
5)魯棒性(Robustness)
集群機器人系統(tǒng)魯棒性是指集群即使在個體發(fā)生故障或環(huán)境干擾的情況下也能夠堅持完成目標任務的特性[14].集群機器人系統(tǒng)的魯棒性實現(xiàn)主要取決于系統(tǒng)冗余、分布式協(xié)調、個體簡單化和感知多重性.系統(tǒng)冗余指集群系統(tǒng)中個體的損失和故障均可以通過另一個個體得到補償;分布式協(xié)調指集群系統(tǒng)中的任一個體都不會阻礙系統(tǒng)的運行;個體簡單化指相比于執(zhí)行相同任務的單個復雜系統(tǒng)而言,集群系統(tǒng)中的個體相對簡單;感知多重性即大量個體分布式的感知可以增加系統(tǒng)總的信噪比.
6)可擴展性(Scalability)
集群機器人系統(tǒng)可擴展性是指集群能夠在各種規(guī)模下運行,并且保證系統(tǒng)運行的協(xié)調機制相對不受其規(guī)模變化影響的特性[14].可擴展性的實現(xiàn)要求集群系統(tǒng)中不能夠存在中央控制節(jié)點[58],個體的感知與通信通力是有限的且個體間的交互是局部的,并允許個體在任何時刻加入或退出任務[15],使得它能夠像自然界中的生物集群一樣可以擴展至成百上千個節(jié)點.
在上述特性中,自主性、智能性與協(xié)同性主要針對的是一般的機器人系統(tǒng)提出的三個關鍵期望特性;而靈活性、魯棒性與可擴展性主要針對的是集群機器人系統(tǒng)提出的三個關鍵期望特性,它們可以蘊藏于集群機器人系統(tǒng)自主性、智能性與協(xié)同性的實現(xiàn)中.除了這些特性之外,由于應用研究對象的差異與關注點的不同,適應性、可重構性、涌現(xiàn)性、穩(wěn)定性、并行性、實時性、可靠性、安全性、經濟性等[15,55,60?61]在一些研究中也被作為集群機器人系統(tǒng)的期望特性.由于這些特性的含義多與上述特性內涵相近或目前研究尚淺,本文不作詳細闡述.
評價標準是人們在評價活動中應用于對象的價值尺度和界限.伴隨著機器人系統(tǒng)應用研究的持續(xù)發(fā)展,許多組織機構和研究學者對機器人自主性(特別是自主性等級劃分)與智能性評價設定了相關標準.其中,部分研究雖非直接針對集群機器人系統(tǒng),但對持續(xù)深化集群機器人系統(tǒng)特性評價規(guī)范仍然具有一定參考價值.
國內外許多研究機構或學者都對機器人系統(tǒng)的自主性等級劃分標準進行了研究,其中多數(shù)標準不僅可以度量單體機器人系統(tǒng)的自主性,也可以度量集群機器人系統(tǒng)的自主性,但目前多數(shù)機器人系統(tǒng)自主性等級劃分基本還停留在較高層次的定性描述階段,缺乏合理有效的理論支撐,也沒有具體的定量指標.一些代表性的機器人系統(tǒng)自主性等級劃分標準的綜合比較如表1 所示.其中,Zeigler[62]將自主性等級劃分為3 級,分別是:1)實現(xiàn)所描述目標的能力;2)適應主要環(huán)境變化的能力;3)發(fā)展自我目標的能力.Sheridan[63]提出的自動裝置等級并不是直接針對機器人系統(tǒng)提出的,但因機器人系統(tǒng)本身大多是一種自動裝置,因此該標準對機器人系統(tǒng)的自主性評價仍具有一定的參考價值,但該標準考慮的因素太過簡單,也因此往往只能反映機器人系統(tǒng)某個側面的自主性.
表1 不同自主性等級劃分標準比較Table 1 Comparison of different autonomy level classification standards
美國國防部(Department of Defense,DOD)于2000 年發(fā)布第一版UAV 路線圖[64]時就提出了自主控制等級(Autonomy control level,ACL)劃分,2002 版和2005 版UAV 路線圖也采用了同一劃分[65?66].該劃分主要包含遙控引導(1 級)、實時健康診斷、適應故障與飛行條件、飛行路徑重規(guī)劃、團隊協(xié)調、團隊戰(zhàn)術重規(guī)劃、團隊戰(zhàn)術目標、分布控制、團隊戰(zhàn)略目標和完全自主群體(10 級)共10個等級.其主要存在兩方面缺陷:1) 對各個等級沒有詳細說明,且1~6 級劃分偏細,而7~10 級過于粗糙,等級劃分離散,關聯(lián)度低;2) 該劃分并非精準的量化標準,只能反映自主控制水平的模糊值和相對值,且代表性功能描述模糊、性能指標缺乏.美國國防部在2007 版和2009 版無人系統(tǒng)路線圖中回避了自主性分級話題;在2011 版無人系統(tǒng)路線圖中以人–機權限視角將自主性劃分為人操作、人委派、人監(jiān)督和完全自主4個級別[67?68];2013 版無人系統(tǒng)路線圖仍沿用該劃分,并指出該劃分需改進.
美國陸軍科學委員會(Army Science Board,ASB)[69]提出的標準主要面向陸地機器人,描述了一套從遙控到自主集結的自主水平集合.NIST ALFUS 工作組[41]主要從任務復雜度、環(huán)境復雜度和人機交互程度三個維度對各種移動機器人系統(tǒng)的自主性進行了等級劃分.在實際應用中,這三個維度的因素如何度量、權值如何分配以及如何定義自主等級都是不容忽視的問題.在定義自主性等級時,不同的權值分配方案會產生不同的評價結果.
Draper 實驗室[70]主要從運動控制、任務規(guī)劃和狀態(tài)理解三個維度,設置了4個等級評價機器人系統(tǒng)的自主性.美國空軍研究實驗室(Air Force Research Laboratory,AFRL)[71]對其進一步改進,按照OODA 模型確立了UAV 的自主性控制等級,分為遙控駕駛(0 級)、執(zhí)行預先規(guī)劃任務、可變任務、實時故障/事件的魯棒響應、故障/事件自適應、實時多平臺協(xié)調、實時多平臺協(xié)同、戰(zhàn)場認識、戰(zhàn)場認知、戰(zhàn)場集群認知和完全自主(10 級)共11個等級,各個等級對UAV 系統(tǒng)的OODA 基本要素提出了不同的需求.Suresh 等[72]對該標準進行了深入的研究,并通過大量文獻對每一級自主性進行詳細的解釋,把每一級細分為幾個亞層.NASA 飛行器系統(tǒng)計劃高空長航部[73]認為AFRL 提出的劃分標準對于預想中的高空長航程科學任務而言太多而且太細,于是采用了一種精簡的自主等級,包含遙控(0 級)、簡單的自動操作、遠程操作、半自主、完全自主和協(xié)同操作(5 級)共6個級別,并且用了一個很直觀的數(shù)據(jù),即人在UAV 飛行中掌控時間的多少來顯示自主性等級的高低.
考慮到OODA 模型在描述單架UAV 與其他作戰(zhàn)單元或指揮控制單元之間的協(xié)同交互關系方面存在較大的缺陷,不能夠表達單架UAV 的對外屬性,國防科技大學的研究團隊[74]建立了協(xié)同OODA 模型(Cooperation OODA,Co-OODA),具體如圖3 所示.在該模型中,單架UAV 在完成自身OODA 決策循環(huán)的同時,還考慮到與操作員之間的交互過程以及與其他作戰(zhàn)單元之間的協(xié)同過程,即增加了OODA 模型對協(xié)同和交互性能的描述.該模型能夠從本質上描述UAV 系統(tǒng)的自主能力,構成了自主等級劃分的直接依據(jù),即通過任務情況、環(huán)境情況以及人機交互情況三方面對該模型的各個度量要素進行映射,明確任務能力對系統(tǒng)各個方面的能力需求,以感知與認知、分析與判斷、規(guī)劃與決策、協(xié)同與交互及執(zhí)行性能5個度量依據(jù)細劃了UAV 自主性等級劃分.北京航空航天大學[75]的研究團隊學習和引用DOD 所提標準中科學與合理的內容,從等級的命名上以及結構上作出了一些新的調整.與DOD 所提標準相比,取消了不能歸為智能活動的分布式控制等級,修改了原有等級命名中技術層次的概括,修改后的等級命名全部反映該等級的軍事應用特征,更適用于我國UAV 的發(fā)展狀況.
圖3 協(xié)同OODA 模型Fig.3 Co-OODA model
概括而言,上述標準整體上呈現(xiàn)由一維標準向多維標準擴展的趨勢,并通過協(xié)同與交互/通信的度量強化了對集群機器人系統(tǒng)自主性評價的支持,有利于設計更完備、更詳細的指標體系.但由于目前對各維度均采用的是定性的評價標準,因此在實施評價中都需要依賴于專家的主觀經驗,評價專家的專業(yè)性與權威性至關重要.針對這些定性評價標準實施系統(tǒng)特性評價,一種可行的途徑是組織多名專家一起實施評價,另一種可探索的途徑是采用模擬模糊思維的廣義智能化評價方法使結果相對更為客觀.
目前國內外直接針對機器人系統(tǒng)智能性的評價標準并不多見,有的標準只適用于單體機器人系統(tǒng),有的標準既適用于單體機器人系統(tǒng)也適用于集群機器人系統(tǒng),而有的則只適用于集群機器人系統(tǒng).
無人車(Unmanned ground vehicle,UGD)是一種典型的地面機器人.針對UGV 系統(tǒng)智能性等級劃分問題,北京理工大學的研究團隊[76]依據(jù)NIST ALFUS 框架模型中的三個維度,即任務復雜度、環(huán)境復雜度和人機交互程度的等級劃分,提出了UGV系統(tǒng)智能性等級分類標準.該分類標準的提出為推動我國UGV 智能駕駛行為的發(fā)展起到了積極的指導作用,為歷屆中國 “智能未來車挑戰(zhàn)賽”在測試內容與測試環(huán)境的設計上提供了思路.該標準雖面向UGV 單體系統(tǒng),但也可以擴展到集群機器人系統(tǒng)中.其優(yōu)勢在于,不僅支持細化的定性度量標準,同時還增加了一個通過細化的評價指標體系與方法支持的定量度量標準即行駛質量得分,因此可以局部支持客觀的量化評價方法.
從本質上講,機器人系統(tǒng)屬于智能控制系統(tǒng),因此智能控制系統(tǒng)的智能性評價標準仍然適用.按照智能性的高低,研究人員一般認為智能控制可分為初級、中級和高級三個層次[77].其中,初級智能控制具體指基于專家系統(tǒng)等人工智能技術與傳統(tǒng)的控制理論相結合的控制;中級智能控制除了具有初級智能控制水平之外,還具有對新知識學習、生成和在線修改知識庫及控制的功能;而高級智能控制除了具有初、中級智能控制水平之外,同時還具有仿人的組織、協(xié)商和決策的能力.在圖靈測試和人類智商測評方法的啟發(fā)下,一種廣義智能評價理論體系被提出[78],具體包括1個定義、2個標準和3個規(guī)范.定義規(guī)定廣義智能評價是專門針對機器或系統(tǒng)進行的智能評價.標準1 特指系統(tǒng)性能標準,定義如果系統(tǒng)具有自學習、自聯(lián)想、自推理、自規(guī)劃、自協(xié)調等擬人智能特性之一,那么該系統(tǒng)就是智能系統(tǒng);標準2 特指系統(tǒng)技術標準,定義如果系統(tǒng)采用了專家系統(tǒng)、人工神經網絡、模糊控制等人工智能技術方法之一,那么該系統(tǒng)就是智能系統(tǒng).規(guī)范1定義如果系統(tǒng)具有的智能特性多且采用的人工智能技術方法多,則其智能性就高;規(guī)范2 定義如果系統(tǒng)具有的智能特性較多且采用的人工智能技術方法較多,則其智能性就較高;規(guī)范3 定義如果系統(tǒng)僅具有智能特性或僅采用人工智能技術方法,那么它也有智能,只是其體現(xiàn)的智能等級可能不同.廣義智能評價理論體系在前人對智能測試的相關理論和方法的基礎上,突出了對智能特性的區(qū)分和對智能性的測度,包括對人工智能技術方法運用狀況的考察,留下了廣義的空間來容納對目前已有和將來可能有的智能系統(tǒng)進行智能測度和評價,因此既支持集群機器人系統(tǒng)智能性評價也支持單體機器人系統(tǒng)智能性評價.由于這兩種標準通用性較高,因此適用于各類集群機器人系統(tǒng)智能性評價.
人們對群體智能系統(tǒng)性的認知最早來自于社會性生物集群行為的觀察與模擬.Millonas[79]針對社會性生物集群提出了評判其是否體現(xiàn)為群體智能的5 項基本準則:1)鄰近性:所有群體成員都應能夠進行簡單的空間與時間計算;2)品質性:群體成員應能夠響應環(huán)境中的品質因子;3)多樣性:群體行為范圍不應該太窄;4)穩(wěn)定性:群體不應在每次環(huán)境發(fā)生變化時都改變其行為;5)適應性:在所需代價不高的情況下,群體應能夠適時改變其行為.該組準則的提出為我們認知簡單生物群體智能的概念提供了極大便利,并且它們還被認為是簡單生物群體行為演化的重要原則.在UAV 集群研究中,Banks 等[80]對UAV 集群作戰(zhàn)行為進行了建模,并將上述5 項基本準則擴展為了評價UAV 集群是否體現(xiàn)為群體智能的基本準則.由于該工作主要是受社會性生物集群行為啟發(fā)進行設計與實現(xiàn)的,因此這5 項基本準則也主要適用于基于自組織的集群機器人系統(tǒng).
綜上所述,目前絕大多數(shù)的標準是不區(qū)分集群機器人系統(tǒng)類型的,即使區(qū)分也只限于應用對象操作空間不同.由于這些標準不是僅為集群機器人系統(tǒng)而提出的,因此針對性相對較差.同時,由于研究角度的不同,實際上難以建立統(tǒng)一的評價標準以指導集群機器人系統(tǒng)特性評價.一種可行的途徑是面向特定需求定義一種專用的評價標準,另一種可行途徑是綜合多個相近的需求共同定義一種較為通用的評價標準.
評價指標主要解決的是評價什么的問題.構建科學合理的評價指標體系是整個系統(tǒng)特性評價研究的重要環(huán)節(jié)之一,特別是針對受多方面因素影響的系統(tǒng)期望特性評價以及系統(tǒng)綜合評價.
4.1.1 系統(tǒng)自主性評價指標體系
針對機器人系統(tǒng)自主性等級評價問題,盡管多數(shù)研究機構與人員已經逐漸地將等級劃分依據(jù)由一個維度向多個維度擴展,但在劃分等級時大都缺乏詳細且量化的指標支持.幾種具有代表性的系統(tǒng)自主性等級評價指標體系的比較如表2 所示.其中,Draper 實驗室提出用動態(tài)控制、任務規(guī)劃和情景感知三個維度評價機器人系統(tǒng)的自主性,完全是從系統(tǒng)內部的自主能力出發(fā)的,各個維度也沒有更詳細的評價指標支持.AFRL 的自主性等級分類標準主要可以從感知、分析、決策和執(zhí)行4個維度評價UAV 系統(tǒng)自主性等級高低.該結構能夠從本質上反映UAV 系統(tǒng)的自主性,但各個維度同樣沒有更詳細的評價指標支持.NIST ALFUS 工作組認為主要可以從任務復雜度、環(huán)境復雜度和人機交互程度三個維度評價機器人系統(tǒng)的自主性等級,并提出了一種通用的三軸評價模型,具體如圖4 所示.該模型中,每個維度都涉及一組更加詳細的評價指標.該指標體系雖比較詳細,但實際上是混淆了內部的自主能力與外部的自主需求.
表2 系統(tǒng)自主性等級評價指標體系比較Table 2 Comparison of autonomy level evaluation index systems
圖4 NIST ALFUS 的三軸模型Fig.4 3-axis model proposed by NIST ALFUS
國防科技大學的研究團隊提出了一種基于任務層次模型和Co-OODA 模型關聯(lián)映射的UAV 系統(tǒng)自主性等級劃分,主要從感知、分析、規(guī)劃、協(xié)同、執(zhí)行5個維度評價UAV 系統(tǒng)自主性.該結構加入了對自主機器人間合作的衡量,也就是說能衡量群體的自主性,并且從任務復雜度和環(huán)境復雜度兩個維度出發(fā),建立了任務層次模型的量化指標體系,但并未指明這些指標如何量化.北京航空航天大學的研究團隊從自主功能、自主類別、智能屬性和信息互通能力4 方面評價UAV 系統(tǒng)自主性等級,進一步豐富了UAV 系統(tǒng)自主性的評價范圍.楊哲等[81]在NIST ALFUS 所提3個維度的基礎上,增加了系統(tǒng)狀態(tài)穩(wěn)定度作為第4個評價維度.盡管其對各個維度的相關影響進行了分析,但并未建立詳細的評價指標.其中,自主性等級主要包含全手動式、監(jiān)督式和全自主式3 種定性度量,而4個評價維度各含4 種定性度量.李靜等[82]從體現(xiàn)UGV 系統(tǒng)自主性應具備的能力要素出發(fā),分為感知能力、規(guī)劃能力、運動控制能力、行為能力和學習能力5個維度,并且每個維度都設計了更詳細的評價指標.盡管該結構相對更加詳細,但對于各個指標并未給出量化標準.Zhang 等[83]針對UAV 在遭遇突發(fā)威脅時的規(guī)劃問題,建立了UAV 系統(tǒng)自主性等級評價指標體系.該指標體系不僅設計相對詳細,而且給出了所有指標的量化標準.其中,一級指標為UAV 自主性等級,主要包含半自主與全自主兩種定性度量;二級指標包括UAV 規(guī)劃能力、操作員的工作狀態(tài)和威脅感知;三級指標包括任務影響程度、規(guī)劃精度、規(guī)劃時間、反應時間、工作強度、可控UAV 數(shù)量、威脅程度、威脅感知時間和威脅數(shù)量.各級指標主要基于模糊函數(shù)和層次分析法相結合實現(xiàn)自主性等級量化度量.
4.1.2 系統(tǒng)智能性評價指標體系
目前針對機器人系統(tǒng)智能性構建的評價指標體系并不多見,且主要以UGV 系統(tǒng)為評價對象.針對UGV 系統(tǒng)智能性等級分類問題,北京理工大學的研究團隊依據(jù)NIST 提出的ALFUS 框架,設計了UGV 系統(tǒng)評測模型,具體如圖5 所示[76].
圖5 無人駕駛車輛評測模型Fig.5 Testing and evaluation model of UGV
該模型主要從任務復雜度、環(huán)境復雜度和人工干預程度三個維度劃分UGV 系統(tǒng)智能性等級.其中,任務復雜度的評價因素主要包括完成任務的數(shù)量和完成任務的難度;環(huán)境復雜度的評價因素主要包括環(huán)境的類型(高速公路、城市道路、鄉(xiāng)村道路等),關鍵交通環(huán)境元素(交通標志、交通信號燈、障礙物、行人等)的變化性及其數(shù)量,天氣,光照條件和外界干擾等;人工干預維的評價因素主要為感知、理解、分析、規(guī)劃和決策中的人工干預比率,但該結構并未給出詳細的評價指標體系以及量化的評價標準.盡管智能與自主并非同一概念,但該指標體系用于評價UGV 智能性存在相似的問題,即實際上是混淆了智能的內部功能實現(xiàn)與外部需求.但從長遠發(fā)展來看,該研究對UGV 的智能性發(fā)展仍具有一定的指導意義,且對于集群機器人系統(tǒng)的智能性評價也有一定的參考價值.針對UGV 系統(tǒng)智能性定量評價問題,北京理工大學的研究團隊從基本車輛控制行為、基本行車行為、基本交通行為、高級行車行為、高級交通行為5 種智能行為出發(fā),建立了詳細的層次化UGV 智能行為評價指標體系.通過對各級指標和次級指標的量化,可以直觀地得出UGV 哪幾項指標存在不足,指出以后改進的方向,但該研究只適用于單個UGV 系統(tǒng)智能性評價.
基于人工生命的智能控制系統(tǒng)的提出,對于如何考慮與認識移動機器人系統(tǒng)等智能控制系統(tǒng)的智能性起到了很好的啟示作用.北京科技大學的研究團隊[84]基于人工生命智能控制系統(tǒng)的智能特征,從體系結構、智能感受器、智能控制器、智能執(zhí)行器和控制效果5個維度出發(fā),建立了詳細的層次化智能控制系統(tǒng)的智能性評價指標體系.該結構也適用于機器人系統(tǒng),但同樣只適用于單體機器人系統(tǒng)的智能性評價.
北京理工大學和北京科技大學提出的系統(tǒng)智能性量化評價指標體系的比較,如表3 所示.盡管這兩種評價指標體系均主要面向單體機器人系統(tǒng),但對于集群機器人系統(tǒng)評價指標體系的構建在研究思路上具有一定的指導作用,即集群機器人系統(tǒng)的智能性評價指標體系面向實際需求并結合現(xiàn)實中的測試條件合理構建.
表3 系統(tǒng)智能性量化評價指標體系比較Table 3 Comparison of system intelligence quantitative evaluation index systems
4.1.3 系統(tǒng)協(xié)同性評價指標體系
集群機器人協(xié)同執(zhí)行任務可以克服單個機器人資源、能力的有限性,但需要通過機器人間的通信交流,才能達到協(xié)同效果.因此,集群機器人協(xié)同完成任務的關鍵在于時空同步和自主決策.要實現(xiàn)集群機器人時空同步,需要各平臺狀態(tài)信息的共享.自主決策與協(xié)同的問題在于消除 “集體”和 “個體”之間的矛盾,這也是通過個體的信息共享來實現(xiàn).基于上述分析,海軍航空工程學院的研究團隊[85]針對協(xié)同性評價提出了協(xié)同時間和協(xié)同數(shù)據(jù)量兩個主要指標,并針對這兩項指標,在總結各種集群機器人協(xié)同體系結構執(zhí)行任務過程中的共性基礎上,以感知單元、決策單元、執(zhí)行單元和環(huán)境為系統(tǒng)組成構建了集群機器人協(xié)同體系結構,具體如圖6 所示.由于該指標體系是基于通用的協(xié)同體系結構提出的,因此適用于各類集群機器人系統(tǒng).
圖6 協(xié)同體系結構Fig.6 Cooperative architecture
上述結構中,感知單元從環(huán)境中感知戰(zhàn)場態(tài)勢,將態(tài)勢信息傳遞給決策單元;決策單元作出決策,將指控信息傳遞給執(zhí)行單元;執(zhí)行單元實施具體行為和動作.在一次協(xié)同過程中,協(xié)同時間具體由感知單元從環(huán)境中感知與接收戰(zhàn)場態(tài)勢的耗時、感知單元將戰(zhàn)場態(tài)勢傳遞給決策單元的耗時、決策單元的決策耗時、決策單元將決策得到的指控信息傳遞給執(zhí)行單元的耗時和執(zhí)行單元根據(jù)指控信息執(zhí)行任務的耗時5 部分組成,而協(xié)同數(shù)據(jù)量具體由參與協(xié)同的單架UAV 感知到的戰(zhàn)場態(tài)勢信息大小和向參與協(xié)同的單架UAV 發(fā)出的指控信息大小兩部分組成.
社會性生物集群系統(tǒng)不僅是集群機器人系統(tǒng)設計靈感的來源,同樣也是集群機器人系統(tǒng)評價靈感的來源.Camazine 等[86]最早沿襲傳統(tǒng)控制理論中系統(tǒng)特性評價指標,對簡單生物集群系統(tǒng)特性進行了總結與描述,認為生物集群系統(tǒng)應該具備魯棒性、適應性和可擴展性3 項基本特性.受此啟發(fā),針對集群機器人系統(tǒng)特性評價問題,Sahin[14]把這3 項系統(tǒng)特性定義為集群機器人系統(tǒng)期望特性.雖然這3 項系統(tǒng)特性主要是受社會性生物集群系統(tǒng)啟發(fā)提出的,最初也主要適用于基于自組織的集群機器人系統(tǒng),但從系統(tǒng)控制需求的角度來看,基于分層遞階的集群機器人系統(tǒng)也具有對這3 項特性的需求.但無論針對哪類集群機器人系統(tǒng),這3 項特性都已不能完備地反映當下集群機器人系統(tǒng)特性的需求與實現(xiàn).
Oztemel 等[60]以醫(yī)療應用為背景研發(fā)的智能機器人集群系統(tǒng)(Intelligent robot swarm for attendance,recognition,cleaning and delivery,IWARD)為參照,提出了一種綜合性的集群機器人系統(tǒng)特性評價指標框架,該框架具體由指標設定、報告、特性監(jiān)控和特性評價4 元素構成.以提高系統(tǒng)的通用性為目的,該框架分別定義了通用指標與具體應用指標兩類評價指標.其中,通用指標不涉及具體應用,具體包含個體功能性、健壯性、溝通技能與信息交互、及時性與響應性、同步性、群體智能、可靠性、可用性和可訪問性9 類指標.盡管該框架對所有個體機器的所有指標均采用的是定性的等級評價,而且并未討論如何對系統(tǒng)整體進行綜合評價,但其所提的對系統(tǒng)特性指標進行分類的觀點對于深化通用集群機器人系統(tǒng)特性評價框架研究仍值得借鑒.
綜上所述,目前集群機器人系統(tǒng)期望特性的評價指標研究主要以自主性、智能性與協(xié)同性為主,而靈活性、魯棒性和可擴展性等評價指標還有待于繼續(xù)深化.系統(tǒng)綜合特性評價指標體系研究相對較少,并且由于研究角度的不同,評價指標體系的完備性與可擴展性也存在著顯著差異.
評價方法主要解決的是如何評價的問題.從方法論角度看,集群機器人系統(tǒng)特性的基本評價方法主要包括基于解析的方法、基于模擬的方法和基于統(tǒng)計的方法三類.這三種方法各有長短,在實踐中各有其適用范圍,還常?;旌鲜褂?取長補短.其中,基于解析的方法和基于模擬的方法均是根據(jù)集群機器人系統(tǒng)基本原理特性構成模型,兩者的區(qū)別是構成模型的方法不同,即從實際系統(tǒng)到模型的抽象方法不同,前者是用數(shù)學方法加以抽象,而后者是用模擬程序加以抽象.由于這三種方法具有較強的通用性,因此適用于各類集群機器人系統(tǒng)各種特性的評價.
5.1.1 基于解析的方法
基于解析的方法的特點是根據(jù)系統(tǒng)特性指標和給定條件(常常是低層次的特性指標和系統(tǒng)執(zhí)行的所有任務與環(huán)境條件)之間函數(shù)關系的解析表達式來計算系統(tǒng)特性指標值,這些解析表達式可以直接根據(jù)概率論、隨機過程論、排隊論等數(shù)學理論來建立,也可以從用數(shù)學方法建立的特性方程中得到.基于解析法的系統(tǒng)特性評價與優(yōu)化步驟為:1)對系統(tǒng)特性指標及其可能的影響因素進行初步分析;2)根據(jù)一定的限定條件和合理假設,對系統(tǒng)特性指標及其影響因素進行描述,確定系統(tǒng)特性指標及其參數(shù)之間的函數(shù)關系,抽象出系統(tǒng)特性指標的數(shù)學分析模型;3)利用數(shù)學分析模型對問題進行求解,根據(jù)求解結果分析影響系統(tǒng)特性指標的參數(shù);4)找出影響系統(tǒng)特性指標的瓶頸參數(shù),從而達到優(yōu)化系統(tǒng)性能的目的.
針對集群機器人系統(tǒng)特性評價問題,Hecker等[87]以不同實驗條件下的任務執(zhí)行效率測量值為自變量,建立了蟻群機器人系統(tǒng)容錯性、靈活性和可擴展性的量化模型.容錯性的度量如式(1)所示,其中E1表示假設沒有錯誤的演化策略的效率,E2表示存在錯誤的演化策略的效率.靈活性的度量如式(2)所示,其中E1表示給定資源分布演化的最佳策略的效率,E2表示針對不同資源分布演化但在給定資源分布上進行評估的替代策略的效率.可擴展性的度量如式(3)所示,其中E1表示單個機器人的效率,E2表示大規(guī)模集群中每個機器人的效率.
其他一些基于解析法的代表性研究如下.Harwell 等[57]分別以集群規(guī)模的變化值、預測與觀察的性能增長值、預期與實際的性能損失值作為自變量,建立了集群機器人系統(tǒng)可擴展性和涌現(xiàn)性度量模型,并且基于曲線相似性的數(shù)學方法,提出了一種集群機器人系統(tǒng)適應性評價方法.Fukuda 等[59]將容錯性和局部優(yōu)勢視為集群機器人系統(tǒng)靈活性的評價指標,并分別以任務執(zhí)行效率與系統(tǒng)沒有出錯的比率之間的關系、交互的比率之間的關系度量建立了集群機器人系統(tǒng)容錯性和局部優(yōu)勢量化模型.Szabo 等[88]以交互作為系統(tǒng)涌現(xiàn)性的度量,分別提出了絕對的和相對的評價標準,并通過實驗對所提標準的優(yōu)勢與局限性進行了分析.Wang 等[89]提出了一種基于復雜網絡理論的UAV 集群系統(tǒng)魯棒性評估方法,該方法對UAV 集群的動態(tài)重構和信息失聯(lián)的動態(tài)演化進行分析和建模,建立了綜合的魯棒性度量和兩種評價策略.
基于解析的方法的優(yōu)點是計算速度快,能夠得到特性參數(shù)的公式解,可在系統(tǒng)特性參數(shù)和系統(tǒng)輸入?yún)?shù)間建立起明晰關系,從而有助于更深入地了解系統(tǒng)的特性.其缺點是基本上純數(shù)學解析問題,在工程實際中由于受到理論的不完善以及群體機理認識的不全面等影響,基于解析的方法在評價應用中受到很大的限制.
5.1.2 基于模擬的方法
基于模擬的方法的實質是以計算機仿真模型為基礎,在給定數(shù)值條件下運行模型,對系統(tǒng)的全部或部分行為進行仿真,由實驗得到系統(tǒng)進程和結果的數(shù)據(jù),直接或經處理后給出系統(tǒng)特性相關信息.基于模擬法的系統(tǒng)特性評價與優(yōu)化步驟為:1)明確和規(guī)范系統(tǒng)仿真所要研究的問題、目標及系統(tǒng)仿真描述特性參數(shù),并針對仿真對象制定詳細的計劃,提出可行的研究方案;2)建立系統(tǒng)的概念模型和數(shù)學模型,搜集用于仿真實現(xiàn)和驗證的相關數(shù)據(jù),通過自行開發(fā)或使用仿真工具實現(xiàn)系統(tǒng)仿真模型,并驗證其是否和實際系統(tǒng)相符合;3)利用仿真模型完成具體場景仿真,同時設計仿真實驗序列,利用仿真工具進行仿真實驗,并利用分析工具和數(shù)學知識進行仿真結果分析和處理.利用仿真方法獲得可靠的系統(tǒng)特性指標參數(shù),仿真工具的選擇尤為關鍵.集群機器人系統(tǒng)的仿真工具可以選擇自行開發(fā),也可以使用現(xiàn)有的仿真工具,例如Matlab、Player/stage和Gazebo 等.
針對集群機器人系統(tǒng)特性評價問題,基于模擬法的代表性研究如下.Gazi 等[90]基于其所提的集群聚集與搜索行為連續(xù)時間模型,用理論證明和模擬實驗的方法證明了集群能夠成群的沿著環(huán)境梯度移動并最終穩(wěn)定地聚集在目標區(qū)域內.Liu 等[91]基于其提出的具有固定通信拓撲結構的集群模型,給出了在感知延遲和異步存在的情況下集群也能在移動過程中保持凝聚力的條件,并通過模擬實驗的方法進行了驗證.陳世明等[92]基于其提出的基于個體局部信息的智能群體模型,通過模擬實驗的方法驗證了大規(guī)模智能群體動態(tài)行為的穩(wěn)定性.薛志斌[93]采用仿真測試的方法驗證了其基于拉格朗日框架構建的有限感知和指數(shù)型隨機兩類集群智能系統(tǒng)動力學模型的正確性與有效性,并針對集群智能系統(tǒng)協(xié)調行為的軟控制中涉及到的一致性問題,用仿真測試的方法驗證了這兩類集群智能系統(tǒng)模型的穩(wěn)定性.
基于模擬的方法的優(yōu)點是可根據(jù)需求設計所需的系統(tǒng)模型,具有較強的靈活性,比真實實驗高效,但也會受到模擬器的限制,同時真實度也要受到一定的影響.如果對系統(tǒng)行為有一個詳細的仿真,那將會得到一個比用解析法更為精確的數(shù)值,而且模擬法還可以檢測到不同的因素對系統(tǒng)特性的影響.但基于模擬的方法的計算量太大,沒有解析法簡單明了,如果仿真模型不正確,那么得出的結果和現(xiàn)實將大相徑庭.因此,在分析研究系統(tǒng)特性上使用模擬法,必須對仿真模型進行仔細的推理和驗證,確定完全正確后方能繼續(xù)進行分析.
5.1.3 基于統(tǒng)計的方法
基于統(tǒng)計的方法的特點是運用數(shù)理統(tǒng)計方法,依據(jù)實驗所獲得的有效信息來評價系統(tǒng)特性,其前提是實驗數(shù)據(jù)的隨機特性可以清楚地用模型表示并相應地加以利用,其關鍵在于系統(tǒng)特性指標值的準確獲取與分析.基于統(tǒng)計法的系統(tǒng)特性評價與優(yōu)化步驟為:1)針對已運行的系統(tǒng)進行測量,收集各種參數(shù);2)對收集到的各種參數(shù)進行數(shù)據(jù)分析與處理,對系統(tǒng)特性進行量化評價與優(yōu)化.常用的統(tǒng)計法主要有抽樣調查、參數(shù)估計、假設檢驗、回歸分析和相關分析等.目前,集群機器人系統(tǒng)特性評價中,主要以基于對比實驗所獲得統(tǒng)計信息構建的圖表模型為依據(jù),對系統(tǒng)特性進行評價與相關分析.
針對集群機器人系統(tǒng)特性評價問題,基于統(tǒng)計法的代表性研究如下.Bahgeci 等[94]在利用進化方法開發(fā)集群機器人聚集行為的過程中,通過對對比實驗的結果進行統(tǒng)計分析發(fā)現(xiàn),集群機器人系統(tǒng)完成聚集任務的性能與進化參數(shù)間存在一些經驗性規(guī)律.該研究同樣可用于指導基于進化方法開發(fā)集群機器人的其他行為.Lerman 等[95]分別以簡化了的和完整的搜索任務為典型應用場景,通過對對比實驗的結果進行統(tǒng)計分析發(fā)現(xiàn):1)在簡化的搜索場景中,集群機器人系統(tǒng)總體的搜索性能會隨著系統(tǒng)規(guī)模的增加而提高,但這種性能的提升是次線性的,即每個機器人個體的性能是隨著系統(tǒng)規(guī)模增加而減少的;2)在完整的搜索場景中,集群機器人系統(tǒng)存在一個最佳的系統(tǒng)規(guī)模可最大限度地提高系統(tǒng)總體的性能.Rybski 等[96]通過對比實驗的方法,定量分析了集群規(guī)模、目標的物理分布和環(huán)境中的障礙物密度都會對系統(tǒng)完成目標搜索任務的影響.Soysal等[97]在基于狀態(tài)轉移概率方法開發(fā)集群機器人聚集行為過程中,通過對比實驗定量分析了集群規(guī)模、轉移概率、等待時間、區(qū)域大小等參數(shù)變化對系統(tǒng)任務執(zhí)行能力的影響.Sugawara 等[98]以搜索任務為研究對象,通過分析研究發(fā)現(xiàn)群體中個體數(shù)量與系統(tǒng)任務執(zhí)行能力之間的關系和個體間相互作用的持續(xù)時間相關,并且無論在固定、不固定位置的資源分布情況下,該持續(xù)時間都存在一個最優(yōu)值.
基于統(tǒng)計的方法不僅能給出系統(tǒng)特性的評價值,而且還能顯示集群規(guī)模、任務與環(huán)境復雜性參數(shù)等內、外部參數(shù)對系統(tǒng)特性指標值的影響,從而為改進系統(tǒng)特性提供定量分析依據(jù).對于集群機器人系統(tǒng)而言,基于統(tǒng)計的方法是評價其特性指標的基本方法,由于測量和評價真實系統(tǒng)的成本較高,且重新配置資源與場景較難,運用起來不靈活,因此該方法多與基于模擬的方法一起使用,在系統(tǒng)設計或建立之前預測其性能.
除上述系統(tǒng)特性的基本評價方法外,有許多系統(tǒng)綜合評價方法被用于求解機器人系統(tǒng)期望特性評價問題,這些方法各有利弊,有的研究雖不能直接應用于集群機器人系統(tǒng),但方法本身并非不可借鑒.
5.2.1 機器人系統(tǒng)自主性評價方法
縱觀目前國內外關于機器人系統(tǒng)自主性的評價方法,主要包括定性等級量表法、時間序列預測法、三維智能空間圖表法、多維區(qū)間打分法、蛛網評價模型、模糊綜合評價法和云重心評價法等.這些方法的簡單比較具體如表4 所示.
表4 機器人系統(tǒng)自主性的不同評價方法比較Table 4 Comparison of different autonomy evaluation methods of robotic system
1)定性等級量表法
定性等級量表法是最容易操作且最為普遍應用的一類機器人系統(tǒng)自主性評價方法.系統(tǒng)評價者可以以已有的機器人系統(tǒng)自主性等級分類標準為依據(jù),對機器人系統(tǒng)的自主性進行評價;也可以先按照預期的機器人系統(tǒng)自主行為特性或能力要求將其自主性劃分為不同的級別,然后以此為依據(jù),再對機器人系統(tǒng)的自主性進行評價.目前,國內外許多研究機構和學者都對機器人系統(tǒng)的自主性等級分類標準進行了研究.這種方法的優(yōu)點是簡便易操作,缺點是操作上的簡便使人們容易做表面工作,在進行等級評定的時候容易敷衍了事,另外當評價標準表述的比較抽象和模糊時,可能會導致不同的人對同一系統(tǒng)的評定結果不一致的現(xiàn)象存在.
2)時間序列預測法
時間序列預測法綜合考慮自主性等級和時間兩個因素,自主性等級坐標軸上標注有自主性的等級和內涵,時間軸上依次標注有自主性發(fā)展的年代.通過雙坐標軸可以清楚地看到,在特定的時間內、特定無人系統(tǒng)所達到的自主性等級.比較具有代表性的有DOD 提出的ACL 發(fā)展路線圖,如圖7 所示[66].該方法的優(yōu)點在于,便于科研人員和政府部門按照機器人系統(tǒng)自主性等級實際情況對其未來發(fā)展作出科學合理的規(guī)劃與決策.缺點是發(fā)展路線中的指定時間與機器人系統(tǒng)自主性等級的實現(xiàn)時間可能不完全吻合,并且由于自主性等級設定具有計劃性,實際發(fā)展可能與預設等級有一定出入,因此按照該方法制定的發(fā)展路線需要周期性更新.
圖7 ACL 發(fā)展路線圖Fig.7 ACL development roadmap
3)三維智能空間圖表法
Draper 實驗室將Los Alamos 國家實驗室的三維度量改為三維智能空間,即移動能力控制、任務規(guī)劃和態(tài)勢感知,每一維又分為了4個等級,當需要對一個機器人系統(tǒng)進行自主性等級劃分時,其結果就會形成一張雷達圖,如圖8 所示.該方法看起來很直觀,這讓管理人員很愿意使用.但是該方法存在一些缺點,比如任務規(guī)劃這個軸需要重新定義,因為有些自主系統(tǒng)完全是基于反應式行為的.
圖8 自主控制系統(tǒng)初始ACL 雷達圖Fig.8 Initial ACL radar chart of autonomous control systems
4)多維區(qū)間打分法
多維區(qū)間打分法是一種常見的綜合評價法.該方法的基本操作是,首先按照預設的等級分類標準對各指標進行打分,然后再將單項評分基于確定好的權重通過線性加權求和得到綜合評分.NIST ALFUS 工作組給出的無人系統(tǒng)自主性等級參考分類標準以及北京理工大學的研究團隊提出的UGV 系統(tǒng)智能性等級分類標準就是基于多維區(qū)間打分法實施的,在具體實施過程中對各個維度的等級分類標準均為5 級,各個維度權重的確定采用的是等權法,然后以綜合評分為依據(jù),將機器人系統(tǒng)自主性等級和UGV 系統(tǒng)智能性劃分為10 級.該方法可適用于非連續(xù)性變量的評價,且不受指標形式的限制,雖簡便易操作,但過于粗糙.
5)蛛網評價模型
中國科學院沈陽自動化研究所[99]提出了蛛網模型用于機器人系統(tǒng)自主性評估,蛛網模型的每條軸代表不同的評估方面,每條軸上的等級代表不同評估方面的技術成熟度[100?113],不同軸上等級對應點連接起來構成一張 “蛛網”,具體如圖9 所示.
圖9 自主性評價的蛛網模型Fig.9 Cobweb model for autonomy evaluation
蛛網模型具有軸可擴展、等級可定制的特征,因此是一種普適性的方法.對于特定系統(tǒng)、特定任務,不同評估方面的等級評估結果連線構成其蛛網自主評估模型.蛛網評估模型中軸的定義以及軸上技術成熟度的定制是決定評估模型好壞的關鍵.
6)模糊綜合評價法
模糊綜合評價法最早由我國學者江培莊提出,該方法主要運用模糊變換原理和最大隸屬度原則,考慮與被評價事物相關的各個因素,對評估對象作出綜合評價.其主要思想為:首先定義一組評語集合;然后通過多個專家打分,獲取所有評價指標的評價矩陣;接著利用一組設定的隸屬度函數(shù)將所有指標的評價值轉化為隸屬度、隸屬度權重,最終生成相應隸屬度權重矩陣;最后通過引入指標權重向量,經過模糊變換運算最終得到一個具體的評價結果.通過對UAV 系統(tǒng)任務完成度、環(huán)境變化度、人機交互程度、系統(tǒng)穩(wěn)定度以及UAV 平臺的特征分析,楊哲等[81]確定了4 種不同程度的定性評價結果,并運用層次分析法確定了不同指標的權重,采用模糊綜合評價法實現(xiàn)了UAV 系統(tǒng)自主性等級評價.考慮到UAV 在威脅情境下的重規(guī)劃問題,Zhang等[83]以UAV 的規(guī)劃能力、操作員的工作條件、UAV的威脅感知為主要評價維度,構建了UAV 系統(tǒng)自主性的評價指標體系,采用層次分析法確定了各級指標的權重,并采用模糊綜合評價法實現(xiàn)了UAV系統(tǒng)自主性等級定量評價.該方法可將不完全、不確定的信息轉化為模糊概念,使定性問題定量化,提高評估的準確性與可信性,且數(shù)學模型簡單、易于掌握,但計算復雜,隸屬度與權重的確定、模糊合成算子的選取等帶有較強的主觀性,且當指標集過大時,評價結果會出現(xiàn)超模糊現(xiàn)象,因此常和層次分析法一起使用.
7)云重心評價法
云重心評價法采用云理論將傳統(tǒng)模糊集理論和概率論相結合,綜合考慮概念的模糊性(邊界亦此亦彼)與隨機性(發(fā)生的概率),用云模型實現(xiàn)定性概念與定量數(shù)值間的轉換.為解決地面智能機器人自主性評價過程中評價體系單一、未考慮評價過程及系統(tǒng)自身不確定性等問題,閻巖等[102]通過評價指標分類、評價值獲取以及評價云的生成與綜合等過程實現(xiàn)了地面智能機器人自主性定量評價.
云重心評價法適用于模糊性和不確定性的綜合評價問題,是將定性評價轉化為定量評價的重要手段,更符合專家評判的主觀偏好,更好地滿足了機器人系統(tǒng)自主性評價的實際需求,并為其他復雜智能系統(tǒng)的評估研究提供了可借鑒的方法.
由于這些評價方法具有較強的通用性,因此適用于各類集群機器人系統(tǒng)的自主性評價.除這些評價方法之外,也有研究者[103?104]采用公式法對機器人系統(tǒng)的自主性進行了定義.這種定義的好處是可以量化與規(guī)范化機器人系統(tǒng)自主性,但該方法通常對函數(shù)的設計、變量的選擇和權值/指數(shù)的確定有很高的要求,需要大量的經驗和數(shù)據(jù)作為基礎,并且只針對特定系統(tǒng).
5.2.2 機器人系統(tǒng)智能性評價方法
盡管目前國內外針對機器智能性評價方法的研究[105?107]已相當普遍,但其中絕大多數(shù)研究都是圍繞計算機程序系統(tǒng)開展的,因此很難適用于機器人系統(tǒng)智能性評價.極少有直接針對機器人系統(tǒng)進行智能性的評價研究.
1)層次分析法與可拓層次分析法
針對UGV 系統(tǒng)智能性的評價,北京理工大學的研究團隊分別采用層次分析法和可拓層次分析法確定了UGV 系統(tǒng)智能性評價指標權重,并采用成本函數(shù)法、模糊綜合評價法對UGV 系統(tǒng)智能性進行了定量評價,其研究成果在 “第四屆中國智能未來挑戰(zhàn)賽”得到了實際應用.雖然該研究面向對象為單體機器人系統(tǒng),但從評價方法上對于集群機器人系統(tǒng)智能性評價并非不可借鑒.
層次分析法是由美國著名運籌學家薩蒂創(chuàng)立的一種解決多目標復雜問題的系統(tǒng)分析方法.其基本思想是先按問題要求建立一個描述系統(tǒng)功能或特征的遞階層次結構,通過兩兩比較評價因素的相對重要性,給出相應的比例尺度,構成上層某因素對下層相關因素的判斷矩陣,以給出相關因素對上層某因素的相對重要程度組成的重要序列[108].該方法的主要優(yōu)點是具有較強的適用性、邏輯性、準確性和系統(tǒng)性,不僅能夠吸收應用評價者的定性分析和邏輯判斷,還能夠基于不完全信息和精確數(shù)據(jù)進行一定的量化評價,使定性與定量方法相結合,能夠得到比較科學的判據(jù),并且其一致性檢驗能夠保證評估結果的不確定性因素的影響降至最小,能夠克服評價者在定性分析過程中可能出現(xiàn)的邏輯判斷失誤.該方法雖然能夠實現(xiàn)UGV 系統(tǒng)智能性評價指標權重的獲取,但在確定各指標權重時也存在一些缺點:a)模糊判斷矩陣明確化;b)需要一致性檢驗.
為了解決上述問題,北京理工大學的研究團隊在層次分析法中引入了可拓展理論,提出了可拓層次分析法,用區(qū)間數(shù)代替點值數(shù)構造可拓展判斷矩陣,克服了層次分析法在解決專家經驗方面的模糊性問題.將指標權重計算與判斷矩陣一致性檢驗結合進行,并考慮專家判斷的模糊性和多位決策者的實踐經驗,有效避免了層次分析法中的大量試算工作.這樣既保證了專家判斷結果的真實性,又保證了判斷矩陣的一致性,使得確定的UGV 系統(tǒng)智能性各個評價指標的權重更加合理.
2)成本函數(shù)法
在我國UGV 智能性定量評價研究中,還引入了成本函數(shù)的方法對技術指標量化.采用技術指標成本函數(shù)為導向的評價方法,必然會促使參賽車輛在技術研究的過程中朝著成本函數(shù)最小的方向發(fā)展.這樣就引導參賽車輛不僅要完成任務,而且要高質量地完成任務.從而提高我國UGV 的技術水平,進一步提高其自然環(huán)境感知與智能行為決策能力,最終達到甚至超過人工駕駛的水平.成本函數(shù)法以系統(tǒng)完成任務過程中的總成本為度量對系統(tǒng)進行綜合評價,如式(4)所示.其中Ci為某項基本或高級智能行為的成本函數(shù),它們可以采用相同的方法得到,未參加規(guī)定測試項時可通過倍增因子施以懲罰.針對不同的測試項可建立不同的成本函數(shù),以 “更換車道”為例,可以用更換車道的時間與該時間內車輛所行駛距離的乘積表示.
通過定義成本函數(shù)的方法將不同層次的、不同形式的指標進行量化,其優(yōu)點是可以使被評價系統(tǒng)朝著低成本的方向發(fā)展,缺點是成本函數(shù)的設計存在很大的人為主觀性,不同的人很有可能得到的成本函數(shù)不同.
3)模擬人類智商評價方法
智商的全稱為智力商數(shù),是由美國心理學家特爾曼提出的一種客觀度量人的智力高低的定量化概念,主要通過分類測試和數(shù)理統(tǒng)計的方法得到.北京科技大學的研究團隊[84]借鑒人類的智商定義與智商測試方法,定義了智能控制系統(tǒng)廣義智商量化模型,如式(5)所示.其中,M為中等智商值,F為系統(tǒng)個體得分,B為團體平均值,S為同類產品或系統(tǒng)測試得分的標準差.
不同的是,人的智商建立在所有人的智力遵從正態(tài)分布的前提下,而智能控制系統(tǒng)的智商建立在對某一類系統(tǒng)的一般需求之上.
智商不僅是用于測量人類個體智力高低的概念,而且之后被進一步擴展到人類團體.群體智能本質上也是一種智力,因此國外一些研究學者認為人類個體的智商測試方法完全可以用于群體系統(tǒng)智能性評價,這些方法對機器人群體智能評價同樣值得借鑒.Brown 等[109]認識到群體智能同 “人的智商”一樣能夠被度量,設計出 “群體智商”作為群體智能的測度標準,以測定不同環(huán)境下群體智能的高低.Szuba[110]設計了度量群體智能的模型,提出了聯(lián)合智商的定義,即 “在N元推理的時間和空間域范圍內的概率函數(shù),它反映了社會結構的推理”,用于測算群體智能的高低.此外,還有研究學者用團隊智商記分卡來記錄團隊智商.團隊智商記分卡著眼于高效團隊應具有的態(tài)度、技能和原則,旨在分析團隊現(xiàn)實能力和應用潛力之間的差異,通過支持團隊創(chuàng)建進步路標,發(fā)現(xiàn)團隊工作中的不足之處,作出及時調整,以使團隊利益最大化.盡管有的方法并非直接以集群機器人系統(tǒng)為研究對象,在考慮評價指標時沒有考慮到其運動特性,但也并非不能用于這類系統(tǒng).
由于模擬人類智商的方法主要是通過測試對評價指標進行量化并通過特定系統(tǒng)綜合評價方法進行綜合量化的,因此對集群機器人系統(tǒng)的類型并不嚴格區(qū)分,分類屬性本身可能被作為評價指標對待.
4)基于信息熵的方法
熵指的是體系混亂的程度,最早作為一個物理學概念被提出,之后被進一步發(fā)展到信息論等學科.在物理學中,熵作為溝通熱力學宏觀狀態(tài)與微觀狀態(tài)間的橋梁,建立起了熱力學宏觀物理量和微觀物理量之間的定量關系.在信息論中,熵作為現(xiàn)代信息論的基礎,建立起了信息和知識的某種度量.考慮到自然界生物群體行為中的速度?精度權衡問題是群體智能行為的一個重要體現(xiàn),其本質對應熵增?熵減的動態(tài)過程,Wei 等[111]從信息傳遞、系統(tǒng)結構、行為機制的角度出發(fā),將熵理論引入群體系統(tǒng)智能行為的量化分析中,運用信息論的方法,提出了群體熵的概念與初步的群體熵模型.群體熵的組成結構具體如圖10 所示.
圖10 群體熵的組成結構Fig.10 Composition structure of swarm entropy
在該結構中,群體熵具體由環(huán)境熵、結構熵、行為熵和傳遞熵組成,各局部熵之間相互影響,但群體熵并不是各個局部熵的簡單疊加,而是依賴于群體系統(tǒng)特征的各個局部熵的合成.以結構熵為例,該研究以群體系統(tǒng)中個體間信息的發(fā)送和反饋的時效性為基礎,量化了系統(tǒng)組織結構優(yōu)劣,具體如式(6)所示.其中,N表示群體規(guī)模,Pij表示系統(tǒng)中任意兩個個體間的信息傳遞時效概率.
在實例分析部分,該研究以鴿群飛行實驗數(shù)據(jù)為例,采用其所提出的群體熵模型對鴿群飛行行為進行了仿真分析.群體熵的概念和模型的提出為度量群體智能行為提供了一種新的工具.由于這種方法主要面向的是社會性生物集群系統(tǒng),因此也主要適用于基于自組織的集群機器人系統(tǒng).后現(xiàn)代的西方社會學家將熵的概念移植到社會學中,從宏觀上表示世界和社會在進化過程中的混亂程度[112].相關研究成果顯示:人類社會作為一個生物群落,也呈現(xiàn)出了高度的群體智能行為(技術進步),而社會熵恰好可以認為是對人類群體智能大小的度量.
在薩里迪斯的遞階智能控制理論中,智能控制系統(tǒng)的各級均采用信息熵作為測度[113].組織級涉及知識的表示與處理,具有信息論的含義,采用香農熵來衡量所需的知識;協(xié)調級采用信息熵測量協(xié)調的不確定性;執(zhí)行級用博爾茨曼的熵函數(shù)表示系統(tǒng)的執(zhí)行代價,它等價于系統(tǒng)所消耗的能量.把這些熵加起來成為總熵,用于表示控制作用的總代價,設計與建立智能控制系統(tǒng)的原則就是要使所得總熵為最小.由于這種方法本身是針對基于分層遞階結構提出的,因此也適用于基于分層遞階的集群機器人系統(tǒng)智能性評價.
5.2.3 機器人系統(tǒng)協(xié)同性評價方法
根據(jù)以感知單元、決策單元、執(zhí)行單元和環(huán)境構建的多無人平臺協(xié)同體系結構,海軍航空工程學院的研究團隊分別定義了一次協(xié)同時間模型和一次協(xié)同數(shù)據(jù)量模型,分別如式(7)和式(8)所示.
在式(7)中,T1、T3和T5分別表示感知單元從環(huán)境中感知與接收戰(zhàn)場態(tài)勢的耗時、決策單元的決策耗時和執(zhí)行單元根據(jù)指控信息執(zhí)行任務的耗時,T2和T4分別表示感知單元將戰(zhàn)場態(tài)勢傳遞給決策單元的耗時、決策單元將決策得到的指控信息傳遞給執(zhí)行單元的耗時.在式(8)中,u1表示單架UAV感知到的戰(zhàn)場態(tài)勢信息大小,u2表示向單架UAV發(fā)送的指控信息大小,n表示參與協(xié)同的UAV 數(shù)目.在此基礎上,還進一步分析與比較了基于地面站的、基于中心節(jié)點的、基于多Agent 的和基于工作流的4 種協(xié)同體系結構的一次協(xié)同時間和一次協(xié)同數(shù)據(jù)量,以及自主協(xié)同體系結構的系統(tǒng)協(xié)同性能.由于該方法是在基于通用的協(xié)同體系結構上提出的,因此適用于各類集群機器人系統(tǒng).
除了上述系統(tǒng)綜合評價方法之外,實際上還有許多系統(tǒng)綜合評價方法都可以應用于集群機器人系統(tǒng)期望特性的綜合評價,特別是一些現(xiàn)代智能化綜合評價理論與方法,例如灰色系統(tǒng)綜合評價方法、Vague集綜合評價法、神經網絡、支持向量機、物元分析法等.常規(guī)的系統(tǒng)綜合評價方法偏向于用經典數(shù)學方法,處理實際復雜系統(tǒng)評價問題將日趨困難,其不足主要體現(xiàn)在很難結合或利用專家、決策者系統(tǒng)評價時所作選擇和判斷過程中所蘊含的經驗、知識、智慧,很難利用評價過程中的思維規(guī)律和人腦的智能特征,很難進行定性分析與定量計算的綜合集成.隨著計算機技術的進步,智能化方法在社會生活中的應用越來越廣泛.智能化方法具有自適應和自組織的能力,具有很強的魯棒性、隱含的并行性,對于解決定性和定量問題、確定性和非確定性問題有著很強的優(yōu)勢.
梳理關鍵的期望特性是保證集群機器人系統(tǒng)研發(fā)質量的重要前提,這些特性受集群機器人系統(tǒng)分類屬性等眾多因素影響.集群機器人系統(tǒng)特性評價主要針對其動態(tài)行為進行研究和優(yōu)化,不僅是集群機器人系統(tǒng)評價研究的重要內容,也是集群機器人系統(tǒng)理論研究、設計研發(fā)以及領域應用的重要支撐.其主要研究內容包括設定評價標準、構建評價指標體系和提出評價方法等,它們分別解決的是定義評價尺度、評價什么和如何評價的問題.其中,設定評價標準是實施評價的前提,構建評價指標體系是實施評價的基礎,提出評價方法是對實施評價的支撐.盡管目前國內外在集群機器人系統(tǒng)特性評價研究方面已取得了一些研究成果,但相關工作仍有待于進一步擴展與持續(xù)深化,目前主要存在以下不足需要改善.1)相對通用的集群機器人系統(tǒng)特性評價規(guī)范尚未建立.由于研究領域和關注點的不同,有必要定義評價相關術語、目標、準則以及標準等,以促進集群機器人系統(tǒng)特性需求與實現(xiàn)表征相一致.2)部分集群機器人系統(tǒng)特性評價指標體系尚缺乏理論模型支撐,多以定性度量為主,缺乏大樣本數(shù)據(jù)支持,評價過程很大程度依賴于專家的主觀判斷,需通過新型信息化手段提升評價的客觀性,并進一步關注評價方法的可信度、難易度與區(qū)分度.3)現(xiàn)有集群機器人系統(tǒng)特性評價數(shù)據(jù)主要來源于系統(tǒng)仿真,需強化實際應用場景下的集群機器人系統(tǒng)驗證,并構建真實測試場景與數(shù)據(jù)采集系統(tǒng)以支持集群機器人系統(tǒng)特性量化評價.
伴隨著集群機器人系統(tǒng)應用研究的不斷發(fā)展,集群機器人系統(tǒng)特性評價問題將變得日趨復雜,本文認為可從以下三方面持續(xù)深化研究.1)設計應用場景驅動的集群機器人系統(tǒng)特性評價方案.集群機器人系統(tǒng)特性通常與其應用場景相關,不同的應用場景對集群機器人系統(tǒng)特性的具體要求不同.如何準確定義場景和分析場景對評價結果的影響都需要進一步研究.2)構建合理且細化的評價指標體系.除了遵循評價指標構建的一般原則外,能夠基于成熟的理論模型構建集群機器人系統(tǒng)特性的評價指標體系.對于多級指標間復雜關聯(lián),網狀化的評價指標體系也值得探討.3)應用智能化綜合評價理論與方法.常規(guī)的系統(tǒng)評價方法偏向于經典數(shù)學方法,處理集群機器人系統(tǒng)特性評價問題將日趨困難,智能化綜合評價方法應該逐漸成為解決此類問題的重要途徑.