劉雪飛,張文昌,吳 航,陳 煒*
(1.天津理工大學(xué)機(jī)械工程學(xué)院天津市先進(jìn)機(jī)電系統(tǒng)設(shè)計(jì)與智能控制重點(diǎn)實(shí)驗(yàn)室,天津 300382;2.天津理工大學(xué)機(jī)械工程學(xué)院機(jī)電工程國(guó)家級(jí)實(shí)驗(yàn)室教學(xué)示范中心,天津 300382;3.軍事科學(xué)院系統(tǒng)工程研究院衛(wèi)勤保障技術(shù)研究所,天津 300161)
災(zāi)害救援環(huán)境復(fù)雜多變,傳統(tǒng)的人力方式給救援人員帶來(lái)巨大的生理和心理壓力,采用智能機(jī)器人手段代替人力方式是未來(lái)重要的發(fā)展方向。救援機(jī)器人按照運(yùn)動(dòng)機(jī)構(gòu)形式分為輪式、履帶式和腿足式。然而,在復(fù)雜地形環(huán)境中,輪式和履帶式救援機(jī)器人的適應(yīng)能力和靈活性較低,很難完成復(fù)雜的現(xiàn)場(chǎng)救援任務(wù)。而腿足式救援機(jī)器人結(jié)構(gòu)靈活、適應(yīng)能力強(qiáng),可以提高救援現(xiàn)場(chǎng)的作業(yè)效率。腿足式救援機(jī)器人主要分為仿生串聯(lián)和并聯(lián)結(jié)構(gòu)形式[1],運(yùn)動(dòng)特點(diǎn)是足端與地面的接觸不連續(xù),可以選擇合適的立足點(diǎn),躲避障礙,但也導(dǎo)致了其運(yùn)動(dòng)失衡的問(wèn)題。因此,應(yīng)采用高效合理的控制算法實(shí)現(xiàn)腿足式救援機(jī)器人的穩(wěn)定運(yùn)動(dòng),提高偵察和救援效率,保障后送傷員安全。高效合理的控制算法將成為腿足式救援機(jī)器人處理應(yīng)急事件的重要技術(shù)手段。本文以腿足式救援機(jī)器人的模型控制算法、仿生控制算法和機(jī)器學(xué)習(xí)控制算法為主要內(nèi)容進(jìn)行綜述,重點(diǎn)介紹這3種控制算法的研究現(xiàn)狀、優(yōu)缺點(diǎn)和發(fā)展趨勢(shì)。
穩(wěn)定的運(yùn)動(dòng)狀態(tài)是腿足式機(jī)器人需要解決的首要問(wèn)題,學(xué)者們也針對(duì)此問(wèn)題展開(kāi)了深入研究,并且取得了較大的研究進(jìn)展。起初是圍繞機(jī)器人的結(jié)構(gòu)特點(diǎn)展開(kāi)研究,總結(jié)出了模型控制算法,其中包括穩(wěn)態(tài)判據(jù)控制算法、虛擬模型控制算法(virtual model control,VMC)、彈簧倒立擺控制算法(spring-loaded inverted pendulum,SLIP)[2];隨著各種學(xué)科的不斷發(fā)展,仿生控制算法被提出,將計(jì)算機(jī)科學(xué)和生物學(xué)有效地結(jié)合在一起[3],使腿足式機(jī)器人可以靈活運(yùn)動(dòng),達(dá)到了仿生效果;僅有靈活的運(yùn)動(dòng)能力并不能應(yīng)對(duì)復(fù)雜環(huán)境中的突發(fā)情況,因此,將機(jī)器學(xué)習(xí)控制算法作為腿足式機(jī)器人的高層控制,以應(yīng)對(duì)復(fù)雜環(huán)境中的突發(fā)情況。3種控制算法的發(fā)展及應(yīng)用,豐富了腿足式機(jī)器人的運(yùn)動(dòng)模式,提高了機(jī)器人的執(zhí)行效率。
模型控制算法是腿足式機(jī)器人的基本控制算法,即底層控制算法。首先,根據(jù)機(jī)器人物理樣機(jī)的尺寸和質(zhì)量參數(shù)確定運(yùn)動(dòng)學(xué)或動(dòng)力學(xué)模型;其次,建立機(jī)器人足部運(yùn)動(dòng)參數(shù)和力/力矩的關(guān)系方程式;最后,求解模型中的參數(shù),得到驅(qū)動(dòng)系統(tǒng)的實(shí)際控制量。根據(jù)模型控制算法的應(yīng)用方式,分為穩(wěn)態(tài)判據(jù)控制算法、虛擬模型控制算法和彈簧倒立擺控制算法。
其中,穩(wěn)態(tài)判據(jù)控制算法是模型控制算法中較為經(jīng)典的算法,由Vukobratovic等[3]提出,虛擬模型控制算法和彈簧倒立擺控制算法均由穩(wěn)態(tài)判據(jù)控制算法演化而來(lái),保證機(jī)器人質(zhì)心總是落在支撐足端構(gòu)成的多邊形內(nèi)部,實(shí)現(xiàn)機(jī)器人穩(wěn)定運(yùn)動(dòng)。隨著計(jì)算機(jī)控制技術(shù)的發(fā)展,McGhee等[4-5]結(jié)合穩(wěn)態(tài)判據(jù)控制算法研制了世界上首臺(tái)采用計(jì)算機(jī)控制的腿足式機(jī)器人Phony Pony,精確描述了腿足式救援機(jī)器人的靜態(tài)步態(tài)數(shù)學(xué)模型和腿部的擺動(dòng)順序,提高了機(jī)器人在平整地形上的流暢度和穩(wěn)定性,但是穩(wěn)態(tài)判據(jù)控制算法只適用于平整地形環(huán)境,對(duì)復(fù)雜地形的適應(yīng)性較低,而虛擬模型控制算法和彈簧倒立擺控制算法的提出,彌補(bǔ)了穩(wěn)態(tài)判據(jù)控制算法對(duì)復(fù)雜地形適應(yīng)性低的不足。
1.1.1 穩(wěn)態(tài)判據(jù)控制算法
腿足式救援機(jī)器人在救援現(xiàn)場(chǎng)需要穩(wěn)定的運(yùn)動(dòng)狀態(tài),需要保證機(jī)器人質(zhì)心的垂直投影必須在支撐足端所組成的多邊形內(nèi)部,將質(zhì)心垂直投影與支撐足端所形成的多邊形的位置關(guān)系作為腿足式機(jī)器人穩(wěn)定運(yùn)動(dòng)的判據(jù),稱(chēng)其為穩(wěn)定性判據(jù)。目前,國(guó)內(nèi)外應(yīng)用較為廣泛的穩(wěn)定性判據(jù)包括零力矩點(diǎn)判據(jù)(zero moment point,ZMP)[6-9]、能量穩(wěn)定裕度判據(jù)(energy stability margin,ESM)[10]和動(dòng)態(tài)穩(wěn)定裕度判據(jù)(dynamic stability margin,DSM)[11]。
穩(wěn)態(tài)判據(jù)控制算法的共同特點(diǎn)是規(guī)劃好機(jī)器人足端運(yùn)動(dòng)軌跡和質(zhì)心的位移,簡(jiǎn)化機(jī)器人控制,明確機(jī)器人運(yùn)動(dòng)規(guī)律,但是降低了機(jī)器人的流暢度和運(yùn)動(dòng)速度。早在1995年就有學(xué)者關(guān)注了這個(gè)問(wèn)題,普渡大學(xué)機(jī)器人實(shí)驗(yàn)室的學(xué)者Pack等[12]將動(dòng)態(tài)穩(wěn)定裕度判據(jù)和A*搜索法結(jié)合,使機(jī)器人可以選擇合理的立足點(diǎn),提高了運(yùn)動(dòng)的穩(wěn)定性。A*搜索法如圖1所示。但是機(jī)器人在運(yùn)動(dòng)時(shí)卡頓嚴(yán)重,流暢度較低,執(zhí)行效率嚴(yán)重下降,產(chǎn)生這種問(wèn)題是因?yàn)闆](méi)考慮到能量消耗。日本東京工業(yè)大學(xué)福島實(shí)驗(yàn)室在此問(wèn)題的基礎(chǔ)上提出方向歸一化能量穩(wěn)定裕度判據(jù)算法[13],此算法可以提高機(jī)器人的外部干擾能力和流暢性。波士頓動(dòng)力公司在研究腿足式機(jī)器人初期,為使機(jī)器人站立穩(wěn)定,大量應(yīng)用此算法在機(jī)器人身上。但是應(yīng)用此算法的前提是低速無(wú)擾動(dòng),因此穩(wěn)態(tài)判據(jù)控制算法更適用于對(duì)運(yùn)動(dòng)速度要求低的場(chǎng)合。
上海交通大學(xué)高峰教授的團(tuán)隊(duì)基于前述理論研發(fā)了2款腿足式救援機(jī)器人,第一款為帶腰仿生六足機(jī)器人,如圖2(a)所示[14]。在這款機(jī)器人的控制方面應(yīng)用了能量穩(wěn)定裕度判據(jù)算法,提高了機(jī)器人的穩(wěn)定性并改善了能耗問(wèn)題,可用于野外環(huán)境探測(cè)與作業(yè),代替救援人員攜帶檢測(cè)設(shè)備進(jìn)入事故發(fā)生地點(diǎn),探測(cè)災(zāi)后環(huán)境,搬運(yùn)救災(zāi)物資等。第二款為“六爪章魚(yú)”機(jī)器人,如圖2(b)所示,團(tuán)隊(duì)同樣將能量穩(wěn)定裕度判據(jù)算法應(yīng)用在機(jī)器人的控制方面,使移動(dòng)自如的“六足”具有良好的復(fù)雜環(huán)境適應(yīng)能力,可在核輻射、水下和火災(zāi)等極端環(huán)境下完成搬運(yùn)、搜索、探測(cè)和救援作業(yè)等任務(wù)[15]。這2款腿足式救援機(jī)器人融合了上述理論,在實(shí)際的應(yīng)用和測(cè)試中都展現(xiàn)出令人滿(mǎn)意的效果。
圖1 A*搜索法[12]
圖2 救援機(jī)器人
1.1.2 虛擬模型控制算法
虛擬模型控制算法由Pratt等[16]在《虛擬模型控制:兩足行走的直觀方法》一文中首先提出,主要原理是在機(jī)器人外部連接虛擬的彈簧和阻尼等,算出機(jī)器人機(jī)構(gòu)平衡時(shí)的虛擬力,再通過(guò)功能關(guān)系求出機(jī)器人的關(guān)節(jié)力。Pratt等[16]在Spring Turkey機(jī)器人樣機(jī)上應(yīng)用了虛擬模型控制算法,在實(shí)驗(yàn)過(guò)程中展現(xiàn)出滿(mǎn)意的結(jié)果,然而虛擬模型的盲目應(yīng)用也會(huì)導(dǎo)致控制算法失效。意大利理工學(xué)院高級(jí)機(jī)器人實(shí)驗(yàn)室Winkler團(tuán)隊(duì)將虛擬模型控制算法應(yīng)用于HyQ四足機(jī)器人上[17],并在模型上新增加了向前反饋扭矩傳感器,提高了機(jī)器人系統(tǒng)的精度和高度順從性,避免了側(cè)向沖擊的干擾。
國(guó)內(nèi)在此方面也開(kāi)展了研究。山東大學(xué)的劉斌等[18]提出一種基于虛擬模型控制算法的腿足式機(jī)器人緩沖策略,在Scalf-2機(jī)器人上得到了驗(yàn)證,如圖3所示,通過(guò)假想的彈簧阻尼系統(tǒng)驅(qū)動(dòng)機(jī)器人按照預(yù)期的軌跡運(yùn)動(dòng),為足式機(jī)器人的抗沖擊能力提供了控制基礎(chǔ),增加了機(jī)器人運(yùn)動(dòng)的穩(wěn)定性。Scalf-2為腿足式機(jī)器人,質(zhì)量為120 kg,可承擔(dān)質(zhì)量75 kg,全速運(yùn)動(dòng)時(shí)速度達(dá)到3 km/h,應(yīng)用緩沖策略后可以在冰雪環(huán)境和復(fù)雜山地環(huán)境下運(yùn)送救援物資,減輕救援人員負(fù)擔(dān)。北京理工大學(xué)和北京交通大學(xué)在前述基礎(chǔ)上,提出了基于虛擬模型控制的動(dòng)態(tài)平衡控制和抗干擾控制算法[19],并在如圖4所示的四足機(jī)器人上得到驗(yàn)證,增強(qiáng)了四足機(jī)器人的魯棒性、地形適應(yīng)性和動(dòng)態(tài)平衡性。但是,無(wú)論是虛擬模型控制算法還是傳統(tǒng)動(dòng)力學(xué)控制算法都需要建立精確的力學(xué)模型,如果機(jī)器人本體結(jié)構(gòu)及其所應(yīng)用的環(huán)境復(fù)雜,其模型也隨之復(fù)雜,給控制算法的研究工作增添了挑戰(zhàn)性。
圖3 山東大學(xué)研制的Scalf-2機(jī)器人[18]
圖4 北京理工大學(xué)和北京交通大學(xué)研制的四足機(jī)器人[19]
1.1.3 彈簧倒立擺控制算法
彈簧倒立擺控制算法的靈感來(lái)源于對(duì)足式動(dòng)物運(yùn)動(dòng)的觀察,此算法是由Geyer等[20]最先提出,分別應(yīng)用到人體運(yùn)動(dòng)和腿足式機(jī)器人運(yùn)動(dòng)控制方面,彈簧倒立擺模型如圖5所示。被廣泛熟知的波士頓動(dòng)力公司的大狗機(jī)器人[21]除采用液壓缸和柴油發(fā)動(dòng)機(jī)等硬件作為驅(qū)動(dòng)部分外,在腿部控制方面結(jié)合了彈簧倒立擺控制算法的思想,被成功地應(yīng)用到救援物資的運(yùn)輸中。但是此控制算法的數(shù)學(xué)模型是非線(xiàn)性模型,不存在解析解,為求解帶來(lái)了困難。為此,英國(guó)比爾肯特大學(xué)的研究員在原模型的基礎(chǔ)上引入阻尼,如圖6所示,推導(dǎo)出了一個(gè)高精度的近似解析解模型[22],并且引入了額外的校正來(lái)補(bǔ)償由重力引起的非對(duì)陣角動(dòng)量影響,經(jīng)測(cè)試表明該方法在阻尼顯著的情況下產(chǎn)生的平均誤差低于2%,明顯提高了近似解析解的精度。
圖5 彈簧倒立擺模型[20]
目前國(guó)內(nèi)對(duì)彈簧倒立擺控制算法的研究也逐漸成熟,華中科技大學(xué)在考慮到三維環(huán)境中受到外部擾動(dòng)的情形后,提出了彈簧-負(fù)載倒立擺三維動(dòng)態(tài)平衡控制算法[23],提升了原算法的抗擾動(dòng)性,擴(kuò)展了彈簧-倒立擺控制算法的應(yīng)用范圍。哈爾濱工業(yè)大學(xué)將此算法應(yīng)用到了雙足機(jī)器人模型上,并在此基礎(chǔ)上研究了線(xiàn)性倒立擺模型預(yù)測(cè)控制算法[24],使足式機(jī)器人驅(qū)動(dòng)執(zhí)行力增強(qiáng)、負(fù)載剛度提高,因此在大型起重設(shè)備無(wú)法進(jìn)入救援現(xiàn)場(chǎng)時(shí),可應(yīng)用此款足式機(jī)器人完成救援現(xiàn)場(chǎng)的起重工作,緩解救援人員的操作壓力。哈爾濱工業(yè)大學(xué)提出的線(xiàn)性倒立擺模型概念,主要優(yōu)勢(shì)在于使動(dòng)力學(xué)模型線(xiàn)性化,求解出解析解;考慮了偏航角動(dòng)量問(wèn)題,減緩了機(jī)器人足端與地面之間的碰撞。
圖6 彈簧-阻尼倒立擺模型[22]
如果只在接收簡(jiǎn)單的、低維度的輸入信號(hào)的情況下,控制系統(tǒng)能夠產(chǎn)生高維度、有節(jié)奏的輸出信號(hào),將為控制腿足式機(jī)器人帶來(lái)很大方便。學(xué)者們也從生物神經(jīng)學(xué)方面得到了靈感,提出仿生控制的概念,即有脊椎和無(wú)脊椎動(dòng)物體內(nèi)存在一種可以產(chǎn)生節(jié)奏性信號(hào)的神經(jīng)回路,可以在不接收節(jié)律信號(hào)輸入的情況下產(chǎn)生節(jié)律性的神經(jīng)活動(dòng)。學(xué)者們從此種仿生角度探尋出新的腿足式機(jī)器人控制方法,其中廣為關(guān)注的是基于中樞模式發(fā)生器的控制算法(central pattern generators,CPG)[25],此類(lèi)算法基本分為兩類(lèi)[26]:一類(lèi)是以Matsuoka控制算法為代表的神經(jīng)元算法模型,另一類(lèi)是以Hopf控制算法為代表的非線(xiàn)性振蕩算法模型。
Venkataraman[27]首次把CPG應(yīng)用到六足機(jī)器人步態(tài)生成和控制方面,成功實(shí)現(xiàn)了機(jī)器人腿部節(jié)律運(yùn)動(dòng)的控制,由于首次研究只關(guān)注了節(jié)律信號(hào)的生成,所以運(yùn)動(dòng)的生成比較簡(jiǎn)單。為生成自適應(yīng)性運(yùn)動(dòng),CPG產(chǎn)生的節(jié)律信號(hào)應(yīng)該更具有合適的頻率、相位,而日本科學(xué)家Matsuoka[28]于1985年提出的Matsuoka控制算法初步解決了上述問(wèn)題,這也使CPG首次模型化,為后續(xù)CPG的改進(jìn)和其他CPG數(shù)學(xué)模型的提出提供了依據(jù)。Matsuoka控制算法在腿足式機(jī)器人控制方面具有2個(gè)特點(diǎn):第一,可以產(chǎn)生穩(wěn)定的節(jié)奏模式,系統(tǒng)在受到瞬態(tài)擾動(dòng)后可以迅速恢復(fù)其正常的節(jié)律;第二,Matsuoka控制算法通常具有一些控制參數(shù)(如驅(qū)動(dòng)信號(hào)),允許調(diào)節(jié)運(yùn)動(dòng),如速度和方向甚至步態(tài)類(lèi)型。因此,正確調(diào)節(jié)算法參數(shù),使高級(jí)別控制器直接產(chǎn)生多維命令,簡(jiǎn)化了控制命令。然而,此類(lèi)Matsuoka控制算法參數(shù)繁多,增加了調(diào)參難度,限制了所需形狀節(jié)律信號(hào)的產(chǎn)生,降低了在復(fù)雜環(huán)境中運(yùn)動(dòng)的適應(yīng)性。
為解決這一問(wèn)題,中南大學(xué)王勇團(tuán)隊(duì)提出了一個(gè)新的Matsuoka控制算法改進(jìn)框架[29],將模型的重心輸出轉(zhuǎn)化成一個(gè)標(biāo)準(zhǔn)化的極限環(huán),并將極限環(huán)與機(jī)器人反饋相結(jié)合,進(jìn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)生成所需信號(hào)。通過(guò)機(jī)器人自適應(yīng)全方位行走控制實(shí)驗(yàn),表明該改進(jìn)的算法框架明顯提高了機(jī)器人行走的適應(yīng)性,如圖7所示。雖然此研究改善了Matsuoka控制算法信號(hào)的生成問(wèn)題,但增加了控制過(guò)程步驟,同時(shí)增加了機(jī)器人硬件匹配的難度。除Matsuoka控制算法外,還有Hopf控制算法、Van der Pol控制算法和Toda-Rayleigh控制算法[30-32],這3種算法的優(yōu)勢(shì)在于理論參數(shù)簡(jiǎn)潔,實(shí)用性強(qiáng)。波蘭羅茲理工大學(xué)分別采用這3種控制算法研究了八足機(jī)器人的腿部運(yùn)動(dòng)和受力問(wèn)題[如圖8(a)所示],并提出一種新的正弦控制算法模型,通過(guò)機(jī)器人能量的消耗方式評(píng)估4種中樞模式發(fā)生器;經(jīng)仿真實(shí)驗(yàn)發(fā)現(xiàn)相頻特性影響Hopf控制算法、Van der Pol控制算法和Toda-Rayleigh控制算法的振幅和頻率,而對(duì)新提出的正弦控制算法只影響振蕩的頻率[33]。新提出的算法結(jié)合八足機(jī)器人本身小巧靈活的特點(diǎn),在救援前期的偵察工作中能發(fā)揮重要作用,為工作人員提供現(xiàn)場(chǎng)實(shí)際情況,提高救援效率。
圖7 機(jī)器人適應(yīng)性行走試驗(yàn)[29]
構(gòu)建完整的CPG網(wǎng)絡(luò)是靈活控制足式機(jī)器人不可或缺的步驟,也是亟待解決的實(shí)際問(wèn)題。哈爾濱工業(yè)大學(xué)從模擬生物CPG網(wǎng)絡(luò)出發(fā),構(gòu)建了一種較為完善的多層CPG網(wǎng)絡(luò),使CPG整體簡(jiǎn)單、結(jié)構(gòu)清晰[34],并驗(yàn)證了多層CPG網(wǎng)絡(luò)的可行性。浙江大學(xué)在研究多足式機(jī)器人控制時(shí)采用了這種CPG網(wǎng)絡(luò),并在此基礎(chǔ)上提出一種基于強(qiáng)化學(xué)習(xí)的模態(tài)控制器自整定法,解決了大部分CPG應(yīng)用的局部性和CPG的不完整性[35],并將自整定法應(yīng)用到六足機(jī)器人上,如圖8(b)所示,其中由18個(gè)伺服電動(dòng)機(jī)作為驅(qū)動(dòng)元件,3個(gè)電動(dòng)機(jī)為一組,分布在6條三自由度的串聯(lián)腿上,使機(jī)器人有較高的自由度,同時(shí),配備了外部相機(jī)來(lái)跟蹤機(jī)器人并提供反饋信息,使其在崎嶇不平的地形中可以像蜘蛛一樣順暢通過(guò),為現(xiàn)場(chǎng)救援、地形勘測(cè)帶來(lái)了福音。但是,強(qiáng)耦合性是CPG不可避免的問(wèn)題,調(diào)整腿部相位時(shí)容易產(chǎn)生較大影響。由此可見(jiàn),CPG更適合于對(duì)周?chē)h(huán)境變化較小的機(jī)器人控制系統(tǒng)。
圖8 多足機(jī)器人模型
機(jī)器學(xué)習(xí)是人工智能的核心,在腿足式機(jī)器人領(lǐng)域的主要應(yīng)用是對(duì)機(jī)器人進(jìn)行模擬控制,不斷學(xué)習(xí)和積累經(jīng)驗(yàn),提高腿足式機(jī)器人的運(yùn)動(dòng)性能。目前,機(jī)器學(xué)習(xí)各種網(wǎng)絡(luò)模型均采用了BP(back propagation)算法,即誤差后向傳播算法[36],最早是由Werbos[37]在1974年的博士論文中首次論證,但當(dāng)時(shí)沒(méi)有引起較大的重視;1982年加州理工學(xué)院的物理學(xué)家Hopfield[38]提出著名的Hopfield模型理論,解決了旅行商[39]問(wèn)題,推動(dòng)了人工智能的快速發(fā)展;1986年在Rumelhart等[40]的努力下,BP算法被再次優(yōu)化,并廣泛應(yīng)用于升級(jí)網(wǎng)絡(luò)的訓(xùn)練中。如今,機(jī)器學(xué)習(xí)控制算法開(kāi)發(fā)均采用了1986年經(jīng)典的BP算法思想,但是由于此算法在執(zhí)行過(guò)程中采用弱監(jiān)督學(xué)習(xí)的方式,缺乏認(rèn)知性控制,所以存在不易學(xué)習(xí)、容易陷入決策困難等問(wèn)題[41-43]。
為解決上述問(wèn)題,加州大學(xué)Peng等[43]提出一種由數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)控制算法,用于訓(xùn)練模型的控制策略,通過(guò)對(duì)Atlas機(jī)器人的行走、奔跑、后空翻和側(cè)踢等復(fù)雜動(dòng)作的實(shí)驗(yàn),展現(xiàn)出此算法可以提高機(jī)器人的整體性,如圖9所示。機(jī)器學(xué)習(xí)使機(jī)器人模型從零開(kāi)始學(xué)習(xí),無(wú)形中增加了機(jī)器人的控制難度和研制周期,而且基于機(jī)器學(xué)習(xí)算法的腿足式機(jī)器人的研究主要局限于仿真環(huán)境。如果機(jī)器學(xué)習(xí)算法能夠?qū)崿F(xiàn)無(wú)模型化,那么在一系列具有挑戰(zhàn)性的控制任務(wù)中都能提高救援機(jī)器人的決策性和感知性,而且能解決容易陷入決策困難的問(wèn)題。如前所述,對(duì)于腿足式機(jī)器人的學(xué)習(xí)控制局限于仿真環(huán)境,搭建的仿真環(huán)境雖然很?chē)?yán)格,但是都與真實(shí)的環(huán)境有一定的差異,致使在仿真環(huán)境中開(kāi)發(fā)的學(xué)習(xí)策略在真實(shí)環(huán)境下可應(yīng)用的概率很小。Google的Tan等[44]實(shí)現(xiàn)了學(xué)習(xí)策略從仿真環(huán)境到現(xiàn)實(shí)環(huán)境的遷移,如圖10所示,解決了腿足式機(jī)器人控制方法從仿真環(huán)境到真實(shí)環(huán)境的轉(zhuǎn)移問(wèn)題。Lee等[45]在仿真環(huán)境中直接學(xué)習(xí)真實(shí)環(huán)境中的運(yùn)動(dòng),這一思路大大提高了學(xué)習(xí)速度。
圖9 模型技能訓(xùn)練實(shí)驗(yàn)[43]
圖10 算法遷移試驗(yàn)[44]
國(guó)內(nèi)對(duì)機(jī)器學(xué)習(xí)控制算法的理論研究較少,更多體現(xiàn)在此控制算法的實(shí)際應(yīng)用中。目前,騰訊公布了在腿足式機(jī)器人研究方面的新進(jìn)展:四足移動(dòng)機(jī)器人Jamoca,如圖11(a)所示[46]。Jamoca本體質(zhì)量70 kg,長(zhǎng)1 m、寬0.5 m、站高0.75 m。騰訊Robotics X實(shí)驗(yàn)室在機(jī)器人本體之上,基于機(jī)器學(xué)習(xí)控制技術(shù),為Jamoca打造了一個(gè)能應(yīng)對(duì)復(fù)雜環(huán)境的智能大腦,這個(gè)大腦使Jamoca能行走、小跑和跳躍,并賦予了它自主定位和避障的能力。除騰訊外,國(guó)內(nèi)宇樹(shù)科技研發(fā)的萊卡狗[47],如圖11(b)所示,是國(guó)內(nèi)首個(gè)腿足式機(jī)器人,質(zhì)量?jī)H22 kg,但其自行研發(fā)的電動(dòng)機(jī)系統(tǒng)能輸出高達(dá)18 kW的瞬時(shí)功率,功率密度比一般跑車(chē)高將近1倍,這是萊卡狗強(qiáng)大動(dòng)態(tài)性能的基礎(chǔ)。另外,萊卡狗可以完全擺脫外部供電,自帶電池一次充電可以支持2~3 h的行走。今后,在救援方面可以應(yīng)用這2款機(jī)器人完成地形勘探和信息搜索工作,提高偵察救援工作效率。
圖11 基于機(jī)器學(xué)習(xí)的四足機(jī)器人
腿足式機(jī)器人經(jīng)過(guò)十幾年的發(fā)展,在結(jié)構(gòu)上逐漸完善,煥然一新的結(jié)構(gòu)也層出不窮,與這些結(jié)構(gòu)相匹配的控制算法也層見(jiàn)疊出,不斷優(yōu)化和改進(jìn)。這些控制算法在腿足式機(jī)器人控制方面已經(jīng)取得了一定成效,但是在面對(duì)不同環(huán)境的情況下也是各有利弊,基本集中在算法的復(fù)雜程度、計(jì)算時(shí)長(zhǎng)、所需數(shù)據(jù)量的多少以及對(duì)機(jī)器人的控制效果等方面。下面將針對(duì)3種算法的特點(diǎn)分別闡述優(yōu)缺點(diǎn),詳見(jiàn)表1。
表1 各算法特點(diǎn)對(duì)比
模型控制算法是腿足式機(jī)器人研究中的基本控制算法,應(yīng)用較為廣泛。模型控制算法優(yōu)勢(shì)如下:(1)具有精確的模型,可以很好地控制機(jī)器人的運(yùn)動(dòng)規(guī)律;(2)參數(shù)都有精確的物理含義,可以實(shí)現(xiàn)精確的實(shí)時(shí)控制;(3)可控性強(qiáng),易于理解。模型控制算法的不足之處就在于它需要具體模型,建模過(guò)程困難,求解煩瑣,計(jì)算量大,對(duì)研究的硬件設(shè)備有較高的要求,而且模型多為復(fù)雜的微分方程,求解結(jié)果不唯一,有時(shí)模型可能無(wú)解,這些都給建立控制系統(tǒng)帶來(lái)了麻煩。所以模型控制算法更適用于機(jī)構(gòu)模型簡(jiǎn)單的機(jī)器人。
仿生控制算法的提出開(kāi)啟了機(jī)器人仿生控制的大門(mén),這種控制算法的優(yōu)點(diǎn)如下:(1)不需要精確的模型;(2)只需產(chǎn)生低維信號(hào),就可以對(duì)機(jī)器人關(guān)節(jié)進(jìn)行控制。此算法也有不足之處,仿生模型產(chǎn)生信號(hào)是無(wú)量綱的,沒(méi)有具體的物理意義,與機(jī)器人結(jié)構(gòu)的關(guān)聯(lián)性較弱,需要對(duì)信號(hào)進(jìn)行后期處理,而且仿生模型具有強(qiáng)耦合性,容易引起腿部控制的干擾。仿生控制算法更適用于模型復(fù)雜和模型所處環(huán)境變化不大的控制系統(tǒng)。
機(jī)器學(xué)習(xí)控制算法是目前研究的熱點(diǎn),是人工智能的核心問(wèn)題,也是未來(lái)腿足式機(jī)器人深化研究的大方向。機(jī)器學(xué)習(xí)控制算法的優(yōu)點(diǎn)如下:(1)對(duì)于模型中難以確定的參數(shù),可以通過(guò)機(jī)器人的學(xué)習(xí)進(jìn)行調(diào)整;(2)機(jī)器學(xué)習(xí)控制算法可以使機(jī)器人不斷學(xué)習(xí)和積累經(jīng)驗(yàn),做出相對(duì)靈活的動(dòng)作;(3)機(jī)器人可以通過(guò)機(jī)器學(xué)習(xí)控制算法,從仿真環(huán)境中直接學(xué)習(xí),在真實(shí)環(huán)境中實(shí)現(xiàn)大部分人類(lèi)很難做到的高難度動(dòng)作,提高機(jī)器人整體的運(yùn)動(dòng)性能。但是這些都需要大量的數(shù)據(jù)存儲(chǔ)空間和強(qiáng)大的配套硬件設(shè)備,對(duì)機(jī)器人訓(xùn)練需要海量數(shù)據(jù),大大增加了計(jì)算時(shí)間,而且對(duì)于多維度、結(jié)構(gòu)復(fù)雜的腿足式機(jī)器人,機(jī)器學(xué)習(xí)控制算法很難保證控制的實(shí)時(shí)性。所以機(jī)器學(xué)習(xí)控制算法主要應(yīng)用在對(duì)實(shí)時(shí)性要求不高的機(jī)器人運(yùn)動(dòng)規(guī)劃場(chǎng)合。
目前在移動(dòng)式機(jī)器人控制領(lǐng)域,腿足式救援機(jī)器人控制已經(jīng)取得了一些進(jìn)展,現(xiàn)有的救援機(jī)器人技術(shù)也在不斷完善,為了能更好地將腿足式救援機(jī)器人投入到救援工作中,多控制算法融合、控制算法高效規(guī)劃等關(guān)鍵性技術(shù)應(yīng)該是未來(lái)腿足式機(jī)器人控制技術(shù)發(fā)展的側(cè)重點(diǎn)。
由于災(zāi)后或戰(zhàn)后救援,腿足式救援機(jī)器人需要處理一些復(fù)雜的任務(wù),單一運(yùn)動(dòng)控制算法難以滿(mǎn)足任務(wù)對(duì)機(jī)器人運(yùn)動(dòng)精度的要求。此外,盡管不同控制算法在機(jī)器人不同運(yùn)動(dòng)控制問(wèn)題上均有一些優(yōu)勢(shì),但也存在一定程度的不足。因此,通過(guò)結(jié)合多種運(yùn)動(dòng)控制算法,可以有效整合各自算法的優(yōu)勢(shì),彌補(bǔ)各自的不足,從而為腿足式救援機(jī)器人運(yùn)動(dòng)控制精度提供保障,國(guó)內(nèi)外目前也都在考慮這方面的技術(shù)問(wèn)題。
近幾年,腿足式救援機(jī)器人的運(yùn)動(dòng)控制算法規(guī)劃方法主要停留在先運(yùn)動(dòng)后應(yīng)對(duì)的思想上,即在運(yùn)動(dòng)過(guò)程中,機(jī)器人會(huì)按照預(yù)先規(guī)定的軌跡運(yùn)動(dòng),隨后根據(jù)感知反饋信息對(duì)突發(fā)情況進(jìn)行反應(yīng)和適應(yīng)。當(dāng)機(jī)器人在復(fù)雜地形運(yùn)動(dòng)時(shí),一種更加高效的方法是直接根據(jù)當(dāng)前環(huán)境預(yù)先生成相應(yīng)的運(yùn)動(dòng)軌跡,再利用前述的控制策略應(yīng)對(duì)運(yùn)動(dòng)過(guò)程中的偏差和地形不確定性,即先規(guī)劃后應(yīng)對(duì)的思想。因此,需要對(duì)腿足式救援機(jī)器人基于地形的全身運(yùn)動(dòng)規(guī)劃算法進(jìn)行研究。
隨著腿足式機(jī)器人技術(shù)的不斷成熟,腿足式救援機(jī)器人控制算法得到了快速發(fā)展,并取得了一定成果,但各國(guó)的腿足式救援機(jī)器人控制算法與全智能化控制算法的理念相比還存在一定的距離,主要體現(xiàn)在運(yùn)動(dòng)算法的規(guī)劃方面。為了更好地實(shí)現(xiàn)偵察救援和機(jī)器人的強(qiáng)自主適應(yīng)性,腿足式救援機(jī)器人控制算法應(yīng)朝著根據(jù)當(dāng)前環(huán)境實(shí)時(shí)規(guī)劃運(yùn)動(dòng)軌跡的方向發(fā)展,并結(jié)合5G技術(shù)提高信息傳輸效率以應(yīng)對(duì)地形的不確定性。未來(lái),隨著控制算法不斷優(yōu)化,智能技術(shù)不斷更新,腿足式救援機(jī)器人會(huì)被廣泛應(yīng)用到偵察救援等復(fù)雜的工作領(lǐng)域。