張雷
(珞石(北京)科技有限公司,北京, 110108)
近年人們見證了機器人產(chǎn)業(yè)的蓬勃發(fā)展,機器人正在從工業(yè)應用向著人機協(xié)作的方向發(fā)展,這對機器人能力提出更高的要求,需要機器人對它們的周圍環(huán)境和其他智能體(如人或機器人)進行感知并與之互動。大量應用場景(家里,醫(yī)院,養(yǎng)老)需要自主與協(xié)作機器人[1],機器人的有效部署可以提高人類工人的工作質(zhì)量和經(jīng)驗。
傳統(tǒng)工業(yè)環(huán)境的結構化對機器人的使用十分有利,然而在非結構化環(huán)境中,機器人應用有很遠的路要走。在非結構化環(huán)境中,機器人需要更好地理解要執(zhí)行的任務,需要一個魯棒的感知系統(tǒng)來檢測和跟蹤周圍動態(tài)環(huán)境的變化,進行智能的、自適應的動作和運動規(guī)劃,并綜合考慮環(huán)境的變化[2]。在這種情況下,機器人必須能夠在操作任務中成功地進行合作和協(xié)作。更確切地說,物品移交被定義為一個給予者將一個物品傳遞給接收者的聯(lián)合運動。盡管交接是人類之間頻繁的合作行為,但它是雙方主體在預測、感知、行動、學習和調(diào)整方面的共同努力才能達成的,要實現(xiàn)像人與人之間一樣高效和流暢地完成人與機器人物品移交任務,對機器人領域是一個全新的挑戰(zhàn)。
一個成功的聯(lián)合運動依賴于參與者之間分享表示、動作預測和整合自身和他人行為的預測效果。聯(lián)合運動比單獨動作要復雜得多. 聯(lián)合運動的最小體系結構應該包括表示、監(jiān)視和預測等流程[3]。預測自己動作的結果和其他智能體的動作有助于智能體之間的更好協(xié)作。
在聯(lián)合運動中,人類會考慮搭檔的需要,并且會根據(jù)對搭檔行為預測來規(guī)劃自己的行動。雖然兩個智能體的共同目標是完成物體的移交,但在交互過程中,他們分別有各自的目標。給予者的目標是:用恰當?shù)姆绞綄⑽锲方唤o對方,如何保持物體穩(wěn)定,直至可以釋放手中物品完成交接。接收者的目標是:保證給予者安全和體驗等前提下接過物體,并且在交接之后執(zhí)行相關的任務。
在大多數(shù)情況下,傳遞物品是為了讓接收者執(zhí)行特定的任務,給予者應考慮接收者將對所移交的物品執(zhí)行的后續(xù)任務。移交過程可分為移交前階段和移交階段,移交前階段包括智能體之間的顯式和隱式通信,以及給予者對物體的抓取和傳送。移交階段是從接收者第一次接觸物體開始。當給予者將手從物體上移開,而物體完全在接收者的手中時,這個階段就結束了。
通信在任何聯(lián)合運動中都是至關重要的。通信表示出移交任務即將開始的意圖,并且在開始后協(xié)調(diào)動作。人類非常善于傳達自己的意圖(即要干什么和要傳遞的物體是什么),并給出何時何地進行交接的線索[4]。這表明,機器人也需要這種溝通技巧和適應能力,以便在與人類伙伴互動時達到人類的表現(xiàn)。
語言可以用來表達人類移交物體的意圖,也可以用來協(xié)調(diào)交互過程中的動作。語言可以被用來發(fā)起動作,而語言的使用可以被認為是聯(lián)合運動的一種形式。因此,很多信息可以通過語言傳達給對方。例如,一個機器人和人可以通過對話來決定他們在互動中的角色,然后協(xié)調(diào)動作[5]。
除了說話,人類還會使用其他一些方式,如身體姿勢和位置、手臂姿勢、手勢(用手臂、手)和目光凝視來傳達其移交物體的意圖,以及何時何地將進行交接等。例如伸出手臂并遞出目標物體,使物體向接收者方向傾斜,都是表達要傳遞物體的意圖[6-7]。對機器人而言,對運動特征的分析可以自動檢測出要移交物體的意圖,例如使用機器學習分類器[8]。在文獻[9]中提出的另一種基于學習的方法,認為人的朝向和聯(lián)合注意力(在物體或?qū)l(fā)生交接的位置上)是人機互動的重要線索。
人類目光凝視也是傳達行動意圖和協(xié)調(diào)行動的有效方法,人能夠通過觀察他人的凝視來解讀他人的行動意圖[10]。因此,在交接過程中,機器人的注視作用會積極地影響交互,從而使人類接收者能夠更快地接收物體,更自然地感知交互[11-12]。同樣地,凝視也能在更快的人類反應時間方面對協(xié)作產(chǎn)生影響[13]。
在移交過程中,給予者會考慮如何根據(jù)接收者的任務來規(guī)劃動作。例如給予者考慮如何抓住物體,以便以盡可能好的方式將目標物體提供給接收者,也就是說,在使用物體用于其預期用途之前,盡可能減少接收者對物體的操縱[14]。這是對物體操作的二階規(guī)劃的一個例子,即對一個物體操作行為,不僅基于當前的任務需求,還基于下一個要執(zhí)行的任務[15]。因此,在移交任務中,給予者的抓取方式也要考慮接收者所要執(zhí)行的任務。實際上,給予者的抓取方式影響了接收者的抓取,因為后者只能在物體的無遮擋部分上抓取該物體。給予者的抓取方式可以影響接收者是否可以直接使用該物體來完成任務,或者必須重新對物體操作后才能在后續(xù)任務中使用它。
當對抓取方式進行規(guī)劃時,諸如物體形狀、物體功能和安全性等因素都是需要考慮的重要因素[16]。物體約束和接收者的任務是抓取姿態(tài)選取的關鍵因素[17]。示教學習是一種可以用來探索對抓取物體進行語義分割的可行辦法[18]。機器人通過觀察人類行為來學習抓取位置已被證明是一種可行的解決方案[19]。
文獻[20]提出利用功能可見性軸的概念學習抓取構型。給予者的抓取適應與一些理論相一致,這些理論認為抓取是人類固有的以任務為導向或有目的的行為,涉及感覺和運動控制系統(tǒng)[21]。
Gibson[22]創(chuàng)造了“功能可見性”這個術語來定義物體及其環(huán)境所提供的行動可能性。Norman[23]為功能可見性的概念添加了一個感知維度,不僅將其與個體的能力聯(lián)系起來,還將其與他們要執(zhí)行的任務聯(lián)系起來。目前的研究仍然需要在感知和運動協(xié)調(diào)方面繼續(xù)努力[24]。
機器人為接收者,設計者必須仔細考慮物體的哪個區(qū)域可以進行抓取,并據(jù)此調(diào)整機器人的抓取策略。當要執(zhí)行的任務對接收者有較少的約束時,例如只是簡單地把物體放下,那么機器人就會有更多適合的抓取位置。然而,當要用該物體執(zhí)行復雜的任務時,機器人的抓取姿態(tài)就會受到嚴格的限制[17]。
在人向機器人物品移交過程中,感知系統(tǒng)是極其重要的。首先,要檢測到機器人需要抓取的物體位置,同時,為了保證人的安全,準確地識別出并分割手的位置也是十分重要的[7]。有一些研究工作,試圖采用跟蹤方法來跟蹤物體和手的位置進而規(guī)劃機器人的動作[25],或者利用大型數(shù)據(jù)集來訓練手和物體之間的位姿關系[26]。
在抓取時,機器人由于視覺傳感器的視角狹小等原因,手和物體可能會被嚴重遮擋。不同的是,這個問題可以作為一個抓取分類問題來解決[6],通過對人抓取物體的姿態(tài)進行分類,可以將這個信息用來引導機器人規(guī)劃出合理的抓取姿態(tài)。
為了提高安全性,機器人除對物體和人手進行識別外,對人體進行跟蹤也是有必要的[27]。對人的感知實時反饋十分關鍵,有研究工作是對人類動作進行預測,如使用DMP[28]成功地預測人的運動。實時估計人體運動也可以利用最小抖動軌跡的概念[29],最小Jerk 模型可以結合回歸變量來預測人在什么時候、什么方向會轉移物品[30]。
在人與人的交接過程中,動作通常是平滑的,而不是被分成單獨的、分階段的[31]。因此,機器人與人的物品移交的聯(lián)合動作需要足夠的安全性、魯棒性、可預測性,并能夠使機器人從觀察的動作中推測出目標。人類希望,在與機器人交互過程中,機器人的構型能夠更加地像人或自然一些,這樣便于人讀懂機器人的意圖[32],這個問題需要用到機器人的逆運動學來解決。
另外,在向人方向接近時,機器人保證人的安全也是一個需要考慮的問題。安全可以通過軟件或硬件方法來實現(xiàn)[33-34]。
運動規(guī)劃和控制應該被限制在整個交互過程中風險最小的情況下進行,例如采用無碰撞規(guī)劃路徑[35]。
此外,機器人的動作應該足夠靈活,以適應多變的環(huán)境和不同搭檔的行為。為了實現(xiàn)這個功能,在設計人機交互系統(tǒng)時魯棒性和反應性應該被考慮在內(nèi)[36]。因此,某些預規(guī)劃的方法因缺乏適應性難以應用在人機交接任務上。
文獻[37]提出一種混合使用全局與局部規(guī)劃器的機制來克服上述缺點。
一項人類研究表明,對于人類接收者的主觀體驗來說,互動的速度可能比機器人的空間準確性更重要。當機器人作為一個接收者時,自適應到達比完全預先規(guī)劃的到達運動更好[38]。人類可以根據(jù)搭檔的動作自適應,機器人也應該這樣[39]。
阻抗控制和導納控制在人機交互領域是比較常見的方法[40],動態(tài)運動基元和其他變體有良好的自適應性,也是一種不錯的選擇[41-43]。與動態(tài)運動基元類似的算法還有SEDS[44],其通過添加穩(wěn)定約束條件對高斯混合模型進行參數(shù)優(yōu)化,最終獲得適應性的軌跡生成器。
本文綜述機器人物品傳遞研究的結果和相關文獻中相應的技術與應用,總結了人與機器人物品移交任務中必須注意的問題:既要考慮人的交互體驗,又要保證安全,并且機器人在做運動規(guī)劃時要考慮機器人自身下一階段的任務。
物品移交任務的工作場景不像工業(yè)場景那樣結構化,而是復雜多變的,讓機器人具有適應能力來解決這個問題一直是重要的研究方向。此外,如何做到物體的通用抓取是一個具有挑戰(zhàn)的任務。