如今,無人機(jī)表演已成為一種備受歡迎的“大型燈光秀”。在表演中,成百上千架無人機(jī)按照編程設(shè)定好的路徑飛行,在天空中共同勾勒出復(fù)雜絢麗的形狀和圖案。當(dāng)一切按計(jì)劃進(jìn)行時,無人機(jī)表演場面頗為壯觀,然而,一旦有一架或多架無人機(jī)出現(xiàn)故障則可能會對地面觀眾構(gòu)成嚴(yán)重威脅,比如近期在美國佛羅里達(dá)、紐約等地發(fā)生的事故。
無人機(jī)表演事故的發(fā)生讓人們意識到在“多智能體系統(tǒng)”中保障安全依然面臨挑戰(zhàn)。多智能體系統(tǒng)由多個相互協(xié)調(diào)、協(xié)作并經(jīng)過計(jì)算機(jī)編程的智能體組成,常見的比如無人機(jī)、機(jī)器人和自動駕駛汽車等。
如今,美國麻省理工學(xué)院的工程師團(tuán)隊(duì)開發(fā)出一種針對多智能體系統(tǒng)的訓(xùn)練方法,能夠確保這些系統(tǒng)即便在擁擠復(fù)雜的環(huán)境中也能安全運(yùn)行。研究人員發(fā)現(xiàn),利用這種方法訓(xùn)練少量智能體后,它們學(xué)到的安全邊界和控制策略可以自動擴(kuò)展應(yīng)用到更多的智能體上,進(jìn)而提高整個系統(tǒng)的安全性。
在實(shí)際演示過程中,該團(tuán)隊(duì)訓(xùn)練了幾架微型無人機(jī)成功完成不同任務(wù),比如在飛行過程中同時變換位置并降落在移動的機(jī)器人上面。在模擬實(shí)驗(yàn)里,同樣的程序在幾架無人機(jī)上訓(xùn)練后,可以復(fù)制并擴(kuò)展到數(shù)千架無人機(jī),使大規(guī)模系統(tǒng)能夠安全地完成任務(wù)。
“對于任何需要多智能體協(xié)作的應(yīng)用場景,比如搜索救援無人機(jī)、倉庫機(jī)器人以及自動駕駛汽車等,這種方法都有望成為行業(yè)標(biāo)準(zhǔn)。這就像是構(gòu)筑了一道‘安全屏障’,能讓每個智能體在執(zhí)行任務(wù)的同時保障安全?!甭槭±砉W(xué)院航空航天學(xué)副教授范楚楚表示。
在設(shè)計(jì)多智能體系統(tǒng)的安全機(jī)制時,研究人員通常需要考慮每個智能體相對于系統(tǒng)中其他智能體的潛在運(yùn)動路徑,這種兩兩之間的路徑規(guī)劃不僅耗時且計(jì)算成本高昂。即便如此,也無法完全確保安全。
“在無人機(jī)表演中,每架無人機(jī)都被預(yù)先設(shè)定好了特定軌跡,包括一系列路徑和時間點(diǎn),然后它們就‘閉上眼睛’按照這個計(jì)劃飛行。由于它們只知道需要自己的既定路徑,一旦發(fā)生意外情況就不知道該如何進(jìn)行調(diào)整?!边@項(xiàng)研究的主要作者張宋元(音譯)指出。
與傳統(tǒng)方法不同,麻省理工學(xué)院團(tuán)隊(duì)嘗試開發(fā)一種新的方法,先訓(xùn)練少量智能體安全運(yùn)行,然后讓這種安全策略能有效擴(kuò)展到系統(tǒng)中的所有智能體。更關(guān)鍵的是,這種方法不再為單個智能體規(guī)劃具體路徑,而是讓它們能夠持續(xù)‘繪制’自己的安全邊界(即一旦超出就可能不安全的區(qū)域邊界)。這樣一來,智能體只要始終處于安全邊界范圍內(nèi),就可以選擇任意路徑完成任務(wù)。
從某種程度上來說,團(tuán)隊(duì)提出的這種方法和人們在日常生活中直觀地導(dǎo)航周圍環(huán)境很相似?!跋胂笠幌?,你身處一個人很多的購物中心,為了安全行走且不撞到別人,你通常只會留意自己周圍數(shù)米范圍內(nèi)的人,而不會去關(guān)注相距更遠(yuǎn)的人,我們的研究采用的就是類似的局部方法。”蘇奧斯瑞解釋道。
在這項(xiàng)新研究中,團(tuán)隊(duì)提出了一種名為“GCBF+”的方法,即“圖控制屏障函數(shù)”。在機(jī)器人技術(shù)領(lǐng)域,屏障函數(shù)是一個數(shù)學(xué)概念,用于計(jì)算安全邊界,一旦智能體越過這個邊界就很可能變得不安全。在多智能體系統(tǒng)中,由于智能體的移動,對于任何一個智能體而言,其安全區(qū)域隨時都可能發(fā)生變化。
通常情況下,設(shè)計(jì)人員在計(jì)算多智能體系統(tǒng)中某個智能體的屏障函數(shù)時,需要考慮它與系統(tǒng)中所有其他智能體的潛在路徑和交互情況。但麻省理工學(xué)院團(tuán)隊(duì)的方法不同,他們只計(jì)算少數(shù)智能體的安全區(qū)域,而且計(jì)算方式足夠精確,能夠反映系統(tǒng)中更多智能體的動態(tài)變化。
“計(jì)算出少數(shù)智能體的屏障函數(shù)后,我們可以將其復(fù)制并應(yīng)用到每個智能體上,這樣就能快速得到適用于系統(tǒng)中任意數(shù)量智能體的安全區(qū)域圖?!碧K奧斯瑞表示。
在計(jì)算智能體的屏障函數(shù)時,團(tuán)隊(duì)首先考慮了智能體的“感知半徑”,即根據(jù)其傳感器能夠觀察到的環(huán)境范圍。就像在購物中心的例子里,研究人員假設(shè)智能體只需關(guān)注其感知半徑內(nèi)的其他智能體,就能保證安全并避免碰撞。
接下來,團(tuán)隊(duì)利用計(jì)算機(jī)模型模擬智能體的特定機(jī)械能力和限制,設(shè)計(jì)出一個“控制器”,也就是一組關(guān)于智能體及其相似個體應(yīng)該如何移動的指令。然后,他們讓多個智能體按照特定軌跡移動并進(jìn)行模擬,記錄它們之間是否發(fā)生碰撞或其他交互情況。
“有了這些軌跡數(shù)據(jù),我們就能計(jì)算出一些最小化的規(guī)則,比如當(dāng)前控制器中出現(xiàn)了多少次安全違規(guī)情況,然后據(jù)此更新控制器,提高安全性?!睆埶卧硎?。
通過這種方式,控制器可以被編程到智能體中,讓智能體在即時環(huán)境中感知其他智能體信息,持續(xù)繪制自己的安全區(qū)域,并在安全區(qū)內(nèi)移動來完成任務(wù)。
“我們的控制器具有實(shí)時反應(yīng)能力。它不會提前規(guī)劃好固定路徑,而是不斷收集無人機(jī)的行進(jìn)方向、速度,以及其他無人機(jī)的速度等信息,利用這些信息實(shí)時生成計(jì)劃,并且每次都會重新規(guī)劃路徑。所以,一旦環(huán)境發(fā)生變化,它能夠迅速響應(yīng)調(diào)整,確保安全。”范楚楚表示。
團(tuán)隊(duì)在一個由8架微型四旋翼無人機(jī)組成的系統(tǒng)中對GCBF+方法進(jìn)行了演示。這些無人機(jī)的任務(wù)是在空中飛行并變換位置。如果無人機(jī)直接沿最短路徑直線飛行,肯定會相撞,但在經(jīng)過團(tuán)隊(duì)方法訓(xùn)練后,無人機(jī)能夠在飛行過程中實(shí)時調(diào)整,相互避讓,始終保持在各自的安全區(qū)域內(nèi),成功在空中完成了位置切換。
類似地,團(tuán)隊(duì)還讓無人機(jī)飛行并降落在特定的輪式機(jī)器人上,這個機(jī)器人持續(xù)繞著大圈行駛,無人機(jī)在降落過程中也能避免相互碰撞。
“使用我們的框架,只需要告訴無人機(jī)它們的目的地,而不是整個無碰撞的路徑軌跡,無人機(jī)就能自己找出如何到達(dá)目的地而不發(fā)生碰撞?!狈冻硎?。她設(shè)想,這種方法可以應(yīng)用到任何多智能體系統(tǒng)中來保障安全,比如無人機(jī)表演、倉庫機(jī)器人、自動駕駛汽車以及無人機(jī)配送系統(tǒng)等。