摘要:模仿動(dòng)物軀干的構(gòu)造,搭建了六足機(jī)器人平臺(tái);提出了在線的自適應(yīng)運(yùn)動(dòng)控制器,通過(guò)模仿人類手臂的順應(yīng)性關(guān)節(jié)運(yùn)動(dòng)來(lái)實(shí)現(xiàn)阻抗控制參數(shù)的在線學(xué)習(xí)。與現(xiàn)有的虛擬運(yùn)動(dòng)神經(jīng)系統(tǒng)結(jié)合,使得六足機(jī)器人可在線適應(yīng)行走步態(tài)和速度,以應(yīng)對(duì)不同的復(fù)雜地形。自適應(yīng)運(yùn)動(dòng)控制器可以適應(yīng)不同的任務(wù)和未知的機(jī)器人動(dòng)力學(xué),使得軌跡跟蹤行為更穩(wěn)定。仿真模型和六足機(jī)器人實(shí)體測(cè)試結(jié)果證明,該方法可有效提高機(jī)器人的適應(yīng)性。
關(guān)鍵詞:六足機(jī)器人;自適應(yīng)控制;中樞神經(jīng)系統(tǒng);虛擬運(yùn)動(dòng)網(wǎng)絡(luò)
中圖分類號(hào):TP242
Adaptive Impedance Control of Hexapod Robots Based on Virtual Motoneuron System
LIU Chunchao1 ZHU Yaguang1,2* ZHOU Yating1 HAN Zhigang1
1.Key Laboratory of Road Construction Technology and Equipment of MOE,Changan University,Xian,710064
2.Anhui Provincial Key Laboratory of Multi-modal Cognitive Computing(Anhui University),Hefei,230601
Abstract: A hexapod robot platform was established by emulating the structural configuration of an animal torso. An online adaptive motion controller was introduced, which achieved impedance control parameter online learning by mimicking the compliant joint motions of the human arm. Integrated with the existing virtual motoneuron system, the hexapod robot dynamically adapted walking gaits and sped online to cope with diverse complex terrains. The adaptive motion controller exhibited versatility in accommodating different tasks and unknown robot dynamics, enhancing trajectory tracking stability. Finally, through simulation models and physical testing of the hexapod robots, the results demonstrate the effectiveness of the proposed approach in enhancing the robots adaptability.
Key words: hexapod robot; adaptive control; central pattern generator(CPG); virtual motoneuron network
0 引言
現(xiàn)有的腿足機(jī)器人大多可以實(shí)現(xiàn)復(fù)雜地形上的步態(tài)切換和穩(wěn)定運(yùn)動(dòng),但在不平坦和未知地形上實(shí)現(xiàn)機(jī)器人的自適應(yīng)運(yùn)動(dòng)行為仍然是一項(xiàng)具有挑戰(zhàn)的任務(wù)[1]。
為了使機(jī)器人穿越不同的地形,需要各種適應(yīng)性(如調(diào)節(jié)步態(tài)、運(yùn)行速度和辨識(shí)地面環(huán)境)。例如BJELONIC等[2-3]、PRGR等[4]和ZENKER等[5]使用基于視覺的控制系統(tǒng)來(lái)適應(yīng)機(jī)器人的運(yùn)動(dòng)參數(shù),使得機(jī)器人能夠適應(yīng)其移動(dòng)的表面結(jié)構(gòu),以實(shí)現(xiàn)更低的成本和更高的穩(wěn)定性。
朱雅光等[6]、KESPER等[7]使用紅外傳感器和/或立體攝像頭檢測(cè)障礙物,從而相應(yīng)地改變機(jī)器人的行走姿勢(shì)和腳的位置。此類依靠外傳感器的技術(shù)能夠有效提高機(jī)器人的行走性能[2-5,7-8],但增加了系統(tǒng)的復(fù)雜程度。為了權(quán)衡外部傳感器和整機(jī)附加質(zhì)量的限制,F(xiàn)OCCHI等[9]、ZHU等[10]、XIONG等[11-12]通過(guò)機(jī)器人本體感覺反饋與傳感運(yùn)動(dòng)相結(jié)合的方法,提出自適應(yīng)控制算法在線學(xué)習(xí)剛度和阻尼控制參數(shù),提高了機(jī)器人對(duì)不同平面和步態(tài)的適應(yīng)能力。中樞神經(jīng)系統(tǒng)(central pattern generator, CPG)誘導(dǎo)了一種自然步態(tài),對(duì)代理的行動(dòng)空間有很強(qiáng)的先驗(yàn)知識(shí),從而顯著減少了控制參數(shù)的數(shù)量[13-14]。利用CPG可實(shí)現(xiàn)具有多個(gè)自由度的多足機(jī)器人運(yùn)動(dòng)控制,并表現(xiàn)出增強(qiáng)的協(xié)調(diào)性和多樣性[15-16]。此外,研究人員通過(guò)模擬仿生行為策略產(chǎn)生穩(wěn)定和可變?nèi)犴樀年P(guān)節(jié)運(yùn)動(dòng),以實(shí)現(xiàn)各種空間和時(shí)間尺度的任務(wù)[17-23]。YANG等[17-19]和 XIONG等[20-21]利用這一概念提出了兩自由度仿生機(jī)械手臂的控制方法。ZHANG等[22]將這一方法應(yīng)用在未知?jiǎng)討B(tài)模型的機(jī)器人上。朱雅光等[23]進(jìn)一步提出了仿生并聯(lián)軀干的柔順控制方法。上述文獻(xiàn)提出的控制系統(tǒng)為研究虛擬神經(jīng)網(wǎng)絡(luò)、自適應(yīng)運(yùn)動(dòng)控制、實(shí)現(xiàn)預(yù)期的在線學(xué)習(xí)提供了理論依據(jù)。
上述研究表明,自適應(yīng)運(yùn)動(dòng)控制系統(tǒng)可以提供機(jī)器人快速、連續(xù)的在線適應(yīng)能力以應(yīng)對(duì)未知地形,然而,應(yīng)用于機(jī)器人的自適應(yīng)運(yùn)動(dòng)控制研究大多集中在簡(jiǎn)單的機(jī)器人系統(tǒng)(即低自由度手臂機(jī)器人系統(tǒng))和簡(jiǎn)單的運(yùn)動(dòng)上,并且仍然受到高增益負(fù)誤差反饋控制的控制(例如PD控制)。本文提出了基于虛擬神經(jīng)運(yùn)動(dòng)網(wǎng)絡(luò)的自適應(yīng)運(yùn)動(dòng)控制(adaptive motion control,AMC)系統(tǒng),將其用于具有復(fù)雜運(yùn)動(dòng)的多自由度腿足式機(jī)器人系統(tǒng),使得機(jī)器人能夠穩(wěn)定地跟蹤軌跡,并進(jìn)行在線阻抗適應(yīng)來(lái)實(shí)時(shí)調(diào)整足力,以實(shí)現(xiàn)未知地形的多步態(tài)行走。這種方法避免了通常學(xué)習(xí)方法中需要多次訓(xùn)練的要求。在線自適應(yīng)運(yùn)動(dòng)控制的概念構(gòu)成了這項(xiàng)工作的核心,本文描述了如何將中樞神經(jīng)系統(tǒng)、虛擬運(yùn)動(dòng)神經(jīng)網(wǎng)絡(luò)和自適應(yīng)運(yùn)動(dòng)控制結(jié)合起來(lái),實(shí)現(xiàn)六足機(jī)器人的適應(yīng)性運(yùn)動(dòng),并用三種不同的未知地形來(lái)驗(yàn)證所提控制方法的魯棒性。
1 仿生六足機(jī)器人平臺(tái)
為了研究和驗(yàn)證所提出的在線自適應(yīng)運(yùn)動(dòng)控制系統(tǒng),本文使用六足機(jī)器人(robot with embodiedneural system hexapod2,RENS H2)作為實(shí)驗(yàn)平臺(tái)。機(jī)器人依據(jù)昆蟲的肢體特征搭建而成,結(jié)構(gòu)和硬件如圖1所示。為了降低腿部的質(zhì)量和慣性,膝關(guān)節(jié)的驅(qū)動(dòng)電機(jī)與髖關(guān)節(jié)的電機(jī)同軸地放置在大腿與機(jī)身連接處,并通過(guò)帶傳動(dòng)帶動(dòng)膝關(guān)節(jié)轉(zhuǎn)動(dòng)。機(jī)身的6條腿的結(jié)構(gòu)基本相同,均為三自由度結(jié)構(gòu),且相對(duì)于機(jī)身呈對(duì)稱分布。該結(jié)構(gòu)的布局設(shè)計(jì)緊湊,有效避免了腿部在運(yùn)動(dòng)過(guò)程中的相互干涉,可以實(shí)現(xiàn)多種足端軌跡。機(jī)身框架材料為鋁合金,整機(jī)總重約15.15 kg。足端的材料選用橡膠,用來(lái)增加與地面的摩擦力和減緩觸地時(shí)的沖擊。
2 自適應(yīng)神經(jīng)運(yùn)動(dòng)控制系統(tǒng)
受生物機(jī)制的啟發(fā),本研究提出的自適應(yīng)運(yùn)動(dòng)控制系統(tǒng)如圖2所示。該控制系統(tǒng)主要由用戶輸入、神經(jīng)控制系統(tǒng)、AMC以及機(jī)器人本體系統(tǒng)四部分組成。用戶通過(guò)遙控器提供機(jī)器人運(yùn)動(dòng)的必要參數(shù)。其中,步態(tài)參數(shù)g和速度v提供給CPG,用以生成機(jī)器人穩(wěn)定運(yùn)動(dòng)控制所需的節(jié)律信號(hào);步高h(yuǎn)和步長(zhǎng)s提供給虛擬運(yùn)動(dòng)網(wǎng)絡(luò)來(lái)生成腿部肌肉的神經(jīng)控制強(qiáng)度和機(jī)身軌跡。神經(jīng)控制系統(tǒng)參見文獻(xiàn)[6,8,24-25]。AMC中,自適應(yīng)控制器通過(guò)對(duì)誤差的跟蹤來(lái)穩(wěn)定運(yùn)動(dòng)軌跡,在線學(xué)習(xí)阻抗參數(shù)、調(diào)整足力,使得機(jī)器人能夠根據(jù)不同的運(yùn)動(dòng)環(huán)境來(lái)調(diào)整控制參數(shù),實(shí)現(xiàn)不同運(yùn)動(dòng)狀態(tài)和地形的自適應(yīng)。最后,輸入的關(guān)節(jié)扭矩作用于機(jī)器人系統(tǒng),機(jī)器人再將檢測(cè)到的關(guān)節(jié)數(shù)據(jù)返回,實(shí)現(xiàn)了完整的控制閉環(huán)。
2.1 中樞神經(jīng)系統(tǒng)
以σ-Hopf振蕩器為基礎(chǔ)的CPG只參與機(jī)器人步態(tài)和足端軌跡的生成,不參與足端軌跡強(qiáng)度調(diào)節(jié)[10,26-28]。它能夠降低機(jī)器人控制系統(tǒng)的復(fù)雜程度,并且增強(qiáng)機(jī)器人協(xié)調(diào)穩(wěn)定性及反應(yīng)速度,其公式為
υ·i=f(υi,μi,σi(ρi,λ,y0,t))-
∑nij∈Nikij(t)(υi-μiμjR(ΔΦij)υj)+u(t)
kij(t)=κije-η(t-t0)
R(ΔΦ)=cos ΔΦ-sin ΔΦsin ΔΦcos ΔΦ(1)
式中:μi為第i個(gè)振蕩器的振蕩幅度;λ為調(diào)節(jié)收斂速度的可變強(qiáng)度;y0為信號(hào)中的一個(gè)點(diǎn),調(diào)節(jié)將從那里開始;正標(biāo)量kij(t)為耦合增益,可以根據(jù)不同形式的運(yùn)動(dòng)而實(shí)時(shí)變化;η為下降因子,與時(shí)間相關(guān);κ為初始系數(shù);R(ΔΦ)為第i、j個(gè)振蕩器間相位差ΔΦij的二維旋轉(zhuǎn)變換,ΔΦij引導(dǎo)υi與υj同步;φ、ρ分別為周期參數(shù)、占空比,且φ、ρ不相關(guān);t0為參數(shù)更改開始的時(shí)間,當(dāng)信號(hào)變得穩(wěn)定時(shí),較短的時(shí)間會(huì)導(dǎo)致較大的收斂強(qiáng)度,反之亦然,收斂過(guò)程主要由k(t)的狀態(tài)決定。u(t)=-sgn(y),u為外部輸入項(xiàng),通過(guò)外部傳感信息控制振蕩信號(hào),振蕩信號(hào)以特定的相位差傳輸給每條腿,實(shí)現(xiàn)六足機(jī)器人的不同步態(tài)。
中樞神經(jīng)網(wǎng)絡(luò)包括6個(gè)σ-Hopf模塊和1個(gè)網(wǎng)絡(luò)同步模塊,如圖3所示。網(wǎng)絡(luò)同步模塊通過(guò)波形調(diào)節(jié)因子、頻率因子等參數(shù)調(diào)節(jié)整個(gè)振蕩器網(wǎng)絡(luò)的協(xié)同節(jié)律和波形變化。該網(wǎng)絡(luò)過(guò)渡過(guò)程穩(wěn)定、快速,波形精確,控制步態(tài)的波形切換時(shí)間低至0.3 s,可以避免步態(tài)行為切換時(shí)腿因不協(xié)調(diào)發(fā)生的觸碰或傾覆,具體調(diào)節(jié)過(guò)程參見文獻(xiàn)[24]。
2.2 虛擬運(yùn)動(dòng)神經(jīng)網(wǎng)絡(luò)
在機(jī)器人運(yùn)動(dòng)的控制中,足端軌跡規(guī)劃發(fā)揮著重要作用。貝塞爾曲線以其高度可調(diào)性和較少的控制參數(shù)而被廣泛應(yīng)用于這一領(lǐng)域?;谪惾麪柷€的虛擬運(yùn)動(dòng)神經(jīng)元模塊不僅具備貝塞爾曲線的數(shù)學(xué)特性,同時(shí)具有神經(jīng)網(wǎng)絡(luò)層的可擴(kuò)展性和學(xué)習(xí)能力,能夠通過(guò)輸入和外部傳感信息進(jìn)行調(diào)整,有效地滿足了機(jī)器人足端軌跡的需求。
對(duì)于機(jī)器人腿部控制,中樞神經(jīng)網(wǎng)絡(luò)輸出的節(jié)律信號(hào)將被用作虛擬運(yùn)動(dòng)神經(jīng)網(wǎng)絡(luò)的激活信號(hào),驅(qū)動(dòng)機(jī)器人腿部實(shí)現(xiàn)運(yùn)動(dòng)行為[8]。虛擬運(yùn)動(dòng)網(wǎng)絡(luò)如圖4所示,第一層神經(jīng)元的輸入為
F0(xCj(t))=λnanwP(xCj(t))+PnCnn(2)
Cin=n(n-1)…(n-i+1)/i!" i=1, 2,…, n
式中:xCj(t)為振蕩網(wǎng)絡(luò)的輸出;an為第n個(gè)目標(biāo)導(dǎo)向點(diǎn)與第n-1個(gè)目標(biāo)導(dǎo)向點(diǎn)的差,即an=Pn-Pn-1;權(quán)重參數(shù)wiB(t)=ti/(1-t)i和wiP(t)=(1-t)i。
神經(jīng)網(wǎng)絡(luò)的第一層輸出為
O1(xCj(t))=wB(xCj(t))F0(xCj(t))+F1(xCj(t))(3)
第i層輸出為
Oi(xCj(t))=wB(xCj(t))Oi-1(xCj(t))+Fi(xCj(t))
Fi(xCj(t))=ζλn-ian-iwP(xCj(t))+Pn-iCn-in
ζ=1" igt;n/2
-1i≤n/2 (4)
第i層的輸出進(jìn)行處理后為
Op(xCj(t))=wnP(xCj(t))∑ni=0wiB(xCj(t))Fn-i(xCj(t))(5)
式中:Fi為輸入神經(jīng)元,Oi為中間神經(jīng)元,i = 0, 1,…, n;Op為運(yùn)動(dòng)神經(jīng)元,代表中間神經(jīng)元的激活強(qiáng)度;Pi為目標(biāo)導(dǎo)向點(diǎn);λi為與不同的目標(biāo)導(dǎo)向點(diǎn)Pi相對(duì)應(yīng)的肌肉激活局部因子,對(duì)它進(jìn)行調(diào)節(jié)可以調(diào)整行為軌跡。
一般的行為運(yùn)動(dòng)由笛卡兒空間中的3個(gè)方向決定,因此,利用虛擬運(yùn)動(dòng)神經(jīng)網(wǎng)絡(luò)形成機(jī)器人控制3個(gè)控制方向上的運(yùn)動(dòng)控制網(wǎng)絡(luò)。通過(guò)調(diào)整參數(shù),可以得到控制機(jī)器人擺動(dòng)階段和站立階段的8階虛擬運(yùn)動(dòng)神經(jīng)網(wǎng)絡(luò),以及結(jié)合全向運(yùn)動(dòng)學(xué)得到的[25]機(jī)身運(yùn)動(dòng)跡3階虛擬運(yùn)動(dòng)神經(jīng)網(wǎng)絡(luò)。具體的機(jī)身和腿部的神經(jīng)控制網(wǎng)絡(luò)參見文獻(xiàn)[6]。
2.3 自適應(yīng)運(yùn)動(dòng)控制
為了實(shí)現(xiàn)快速、在線自適應(yīng)阻抗,以保持機(jī)器人的內(nèi)部狀態(tài)的平衡,本文在XIONG等[20]的基礎(chǔ)上開發(fā)了AMC方法。其靈感來(lái)自于人類運(yùn)動(dòng)中的肌肉控制,人類手臂可以產(chǎn)生可變的順應(yīng)性關(guān)節(jié)運(yùn)動(dòng),以實(shí)現(xiàn)各種空間和時(shí)間尺度的任務(wù)。AMC通過(guò)在線調(diào)節(jié)影響機(jī)器人關(guān)節(jié)運(yùn)動(dòng)的剛度和阻尼來(lái)維持機(jī)器人運(yùn)動(dòng)的穩(wěn)定。本研究中,一個(gè)由學(xué)習(xí)得到的前饋力和在線阻抗控制器被用于機(jī)器人單腿模型,如圖5所示,其核心的數(shù)學(xué)描述為
τi(t)=-F(t)-(K(t)+k)(q-q*)-(D(t)+d)(q·-q·*)(6)
i=1, 2,…, 6
式中:F(t)∈R3×1為學(xué)習(xí)的前饋力;q*(t)∈R3×1為虛擬運(yùn)動(dòng)神經(jīng)元輸出并且經(jīng)過(guò)逆運(yùn)動(dòng)學(xué)計(jì)算得到的關(guān)節(jié)期望角度;q·*(t)∈R3×1為關(guān)節(jié)期望角速度;q(t)∈R3×1為機(jī)器人運(yùn)動(dòng)過(guò)程中各關(guān)節(jié)實(shí)際角度;q·(t)∈R3×1為關(guān)節(jié)實(shí)際角速度;k、d作為固定阻抗參數(shù),保證了六足機(jī)器人穩(wěn)定和順應(yīng)性控制的下限;K(t)∈R3×3和D(t)∈R3×3為時(shí)變的剛度和阻尼矩陣。
阻抗矩陣K(t)和D(t)通過(guò)自適應(yīng)控制器在線調(diào)整,有
K(t)=khh(t)khk(t)kha(t)kkh(t)kkk(t)kka(t)kah(t)kak(t)kaa(t)
D(t)=dhh(t)dhk(t)dha(t)dkh(t)dkk(t)dka(t)dah(t)dak(t)daa(t)(7)
式中:k(t)、d(t)為機(jī)器人腿部模型的剛度和阻尼參數(shù),下標(biāo)h、a、k分別對(duì)應(yīng)跟關(guān)節(jié)、髖關(guān)節(jié)和膝關(guān)節(jié);對(duì)角線和非對(duì)角線元素分別對(duì)應(yīng)各個(gè)關(guān)節(jié)肌肉之間產(chǎn)生的阻抗。
通過(guò)以下最小化成本函數(shù)計(jì)算出阻抗和前饋的學(xué)習(xí)規(guī)律:
V(t)≡Vp(t)+Vc(t)(8)
成本函數(shù)Vc(t)由下式定義:
Vc(t)=12∫tt-T‖vec()‖2Qk+
‖vec()‖2Qd+‖‖2Qfdσ(9)
其中,‖·‖2Qd,Qk,Qf和vec(·)分別表示權(quán)重規(guī)范和列矢量化。、和分別被定義為剛度、阻尼和前饋力矩陣的實(shí)際值與預(yù)期值之間的差值[20]:
≡K(t)-KE(t)
≡D(t)-DE(t)
≡F(t)-FE(t)(10)
其中,KE、DE和FE分別表示在阻抗和前饋力實(shí)現(xiàn)運(yùn)動(dòng)穩(wěn)定的條件下,從K、D、F中優(yōu)化的結(jié)果。同時(shí)通過(guò)手臂動(dòng)力學(xué)保持控制穩(wěn)定性,成本函數(shù)的定義如下:
Vp(t)=∫tt-TV·(σ)dσ
V(t)=12εT(t)M(q)ε(t)(11)
其中,M(q)∈R3×1為三自由度腿部模型的慣性矩陣;ε(t)∈R3×1是時(shí)變的跟蹤誤差。有
ε≡e·(t)+βe(t)
e(t)≡q(t)-q*(t)
e·(t)≡q·(t)-q·*(t) (12)
其中,β為用于調(diào)節(jié)關(guān)節(jié)角度誤差增益的超參數(shù);e(t)∈R3×1表示關(guān)節(jié)角度誤差,e·(t)∈R3×1表示關(guān)節(jié)角加速度誤差。由最小化成本化函數(shù)求出的自適應(yīng)學(xué)習(xí)規(guī)律如下:
K(t)=F(t)eT(t)
D(t)=F(t)e·T(t)
F(t)=ε(t)/γ(t) (13)
其中,γ(t)是a和b為正的學(xué)習(xí)的遺忘因素,可以選擇a和b的值以適應(yīng)響應(yīng)速度:
γ(t)=a1+b‖ε(t)‖2(14)
任何γ(t) gt; 0的正值都可以用來(lái)產(chǎn)生收斂結(jié)果,但是太大的γ(t)會(huì)阻止轉(zhuǎn)矩和阻抗的良好積累,而較小的γ(t)會(huì)減慢轉(zhuǎn)矩和阻抗的減小或失靈。γ(t)的上述定義具有以下優(yōu)點(diǎn):當(dāng)跟蹤性能差時(shí),γ(t)小,反之亦然。AMC以人體手臂肌肉模型為參考,Lyapunov穩(wěn)定性理論為基礎(chǔ),阻抗控制器的關(guān)節(jié)剛度和阻尼矩陣元素被實(shí)時(shí)調(diào)整。算法的進(jìn)一步細(xì)節(jié)和穩(wěn)定性證明詳見文獻(xiàn)[20]。
3 仿真與實(shí)驗(yàn)驗(yàn)證
分別通過(guò)仿真和實(shí)驗(yàn)驗(yàn)證所提自適應(yīng)運(yùn)動(dòng)控制系統(tǒng)的性能。在本節(jié)中,設(shè)式(6)中的固定阻抗系數(shù)k=80,d=10;式(12)中的β=0.01;式(14)中的遺忘因素a=0.05,b=15。
3.1 仿真驗(yàn)證
機(jī)器人在ROS系統(tǒng)Gazebo中進(jìn)行仿真驗(yàn)證。分別進(jìn)行了穩(wěn)定行走仿真實(shí)驗(yàn)和復(fù)雜地形穩(wěn)定行走仿真實(shí)驗(yàn)。
3.1.1 穩(wěn)定行走仿真實(shí)驗(yàn)
為了便于對(duì)比,首先,采用傳統(tǒng)的PD控制,即保持剛度K和阻尼D不變,進(jìn)行機(jī)器人穩(wěn)定走直線測(cè)試。圖6a中,可以看到機(jī)器人的運(yùn)動(dòng)軌跡為弧線,已經(jīng)明顯偏航。圖6b中,機(jī)器人采用AMC,可以看到機(jī)器人運(yùn)動(dòng)軌跡為直線,穩(wěn)定走直線的效果明顯優(yōu)于傳統(tǒng)PD控制。結(jié)合圖7,隨著時(shí)間的推移,機(jī)器人質(zhì)心在世界坐標(biāo)系的x方向勻速運(yùn)動(dòng)。而在世界系的y方向,傳統(tǒng)PD控制的機(jī)器人質(zhì)心位置發(fā)生了嚴(yán)重的偏移,如圖7上半部分中的紅線所示。當(dāng)t=40 s時(shí),y方向幾乎偏移了0.1 m;當(dāng)接近運(yùn)動(dòng)結(jié)束時(shí),y方向已經(jīng)偏移了近0.8 m。采用AMC的曲線如藍(lán)線所示,當(dāng)t=80 s時(shí)質(zhì)心在y方向才開始出現(xiàn)偏移。整體來(lái)看,在AMC控制下,機(jī)器人穩(wěn)定走直線的能力有明顯的提升,反映出機(jī)器人跟隨期望質(zhì)心軌跡的能力更強(qiáng),為實(shí)現(xiàn)全向運(yùn)動(dòng)提供了保證。
3.1.2 復(fù)雜地形穩(wěn)定行走仿真實(shí)驗(yàn)
進(jìn)一步,在六足機(jī)器人行進(jìn)的前方設(shè)置障礙,并搭建瀝青路和木板結(jié)合的復(fù)雜仿真環(huán)境,測(cè)試所提方法對(duì)于復(fù)雜環(huán)境的適應(yīng)性。機(jī)器人分別采用傳統(tǒng)PD控制和AMC來(lái)穿越復(fù)雜地形。AMC穿越復(fù)雜地形的情況如圖8所示,機(jī)器人從平地出發(fā),在1.8 m處爬上了鋪滿瀝青的高2 cm的臺(tái)階后,其質(zhì)心軌跡指示線依然大致保持為直線(如圖8中機(jī)身后的黃線所示),表明機(jī)器人能夠保證穩(wěn)定行走的前提下克服穿越復(fù)雜地面。在圖9中,當(dāng)機(jī)器人爬上臺(tái)階時(shí),質(zhì)心在y方向都有相同幅度的偏移;但在x方向上,AMC控制的偏移量明顯小于PD控制的偏移量,依然能較好地保持期望質(zhì)心軌跡的跟隨,這表明AMC可以通過(guò)在線學(xué)習(xí)阻抗參數(shù)來(lái)提高機(jī)器人適應(yīng)復(fù)雜環(huán)境的能力。
3.2 實(shí)驗(yàn)驗(yàn)證
為了進(jìn)一步驗(yàn)證算法效果,將自適應(yīng)運(yùn)動(dòng)控制部署于REN H2上,進(jìn)行了多地形多步態(tài)行走實(shí)驗(yàn)和沙礫地面多步態(tài)自適應(yīng)性分析實(shí)驗(yàn)。每種步態(tài)都有其優(yōu)點(diǎn)和適用場(chǎng)景。三角步態(tài)是六足機(jī)器人最常用的步態(tài)之一,在支撐相時(shí)有3條腿同時(shí)著地支撐機(jī)器人。這種步態(tài)可以提供良好的穩(wěn)定性和機(jī)動(dòng)性,適用于各種不同類型的地形和環(huán)境。四足步態(tài)是另一種常見的步態(tài),6條腿被分為兩組,每組4條腿同時(shí)著地,適用于需要更強(qiáng)支撐和橫向穩(wěn)定性的情況。六足步態(tài)每次支撐相位有5條支撐腿著地,通常用于需要更大的穩(wěn)定性和負(fù)載能力的情況[24]。
3.2.1 多地形多步態(tài)行走實(shí)驗(yàn)
在線學(xué)習(xí)控制參數(shù)可以促進(jìn)機(jī)器人在不同平面的自適應(yīng)運(yùn)動(dòng)。機(jī)器人分別采用PD控制和AMC在硬質(zhì)地面、海綿和硬沙礫地面這3種不同的地形上行走,記錄運(yùn)動(dòng)參數(shù),并且通過(guò)對(duì)比兩種控制方法的實(shí)驗(yàn)效果來(lái)驗(yàn)證所提方法的優(yōu)勢(shì)。
圖10展示了機(jī)器人基于AMC在3種不同地形下的運(yùn)動(dòng)過(guò)程。結(jié)果顯示,自適應(yīng)阻抗控制的學(xué)習(xí)能力會(huì)使機(jī)器人腿部18個(gè)關(guān)節(jié)擁有不同的剛度和阻尼,以增強(qiáng)運(yùn)動(dòng)穩(wěn)定性。具體地,圖11a~圖11c表明,相比于PD控制,AMC能減小各關(guān)節(jié)的角度誤差約1°;圖11d~圖11f表明,機(jī)器人在不同地面以不同步態(tài)行走時(shí),相比于PD控制,AMC下的關(guān)節(jié)誤差均減小10%~20%。圖12對(duì)比了AMC與PD控制下六足機(jī)器人在硬質(zhì)路面以三角步態(tài)行走的各腿的電流能耗。可以看出,自適應(yīng)阻抗控制可以減小機(jī)器人在三種不同的地形下運(yùn)動(dòng)的關(guān)節(jié)角度誤差,而能耗并沒有額外的增加。
對(duì)于每條腿,由一個(gè)自適應(yīng)控制器來(lái)在線自適應(yīng)學(xué)習(xí)前饋力和阻抗。圖13展示了六足機(jī)器人以三角步態(tài)在多地形行走時(shí),三個(gè)關(guān)節(jié)前饋力和阻抗參數(shù)的在線學(xué)習(xí)的過(guò)程。以右中腿RM為例,自適應(yīng)控制器根據(jù)誤差在線學(xué)習(xí)適應(yīng)規(guī)律,構(gòu)成了前饋力F(t)、剛度參數(shù)K(t)和阻尼參數(shù)D(t)。單腿在擺動(dòng)階段(當(dāng)時(shí)間為2~4 s時(shí))控制參數(shù)保持不變,完成基本的軌跡跟隨,并不應(yīng)用自適應(yīng)控制。單腿在支撐階段(當(dāng)控制點(diǎn)為0~2 s時(shí))自適應(yīng)控制器的參數(shù)變化明顯。支撐態(tài)時(shí),阻抗參數(shù)和前饋力最初軟化關(guān)節(jié)以吸收外部載荷的沖擊,即當(dāng)外部負(fù)載增加時(shí),自適應(yīng)控制器會(huì)使關(guān)節(jié)變硬,以獲得更大的腳力和前進(jìn)力。
3.2.2 沙礫地面多步態(tài)自適應(yīng)性分析
自適應(yīng)控制通過(guò)在線學(xué)習(xí)控制參數(shù),以適應(yīng)不同的步態(tài)。機(jī)器人以三角步態(tài)、四足步態(tài)和波浪步態(tài)在沙礫地面上行走,如圖14所示。圖15展示了F(t)、K(t)和D(t)(以右中腿RM為例)的在線學(xué)習(xí)調(diào)整。六足機(jī)器人在細(xì)小的碎石上行走,當(dāng)t為16 s時(shí),由三角步態(tài)切換為四足步態(tài);當(dāng)t為33 s時(shí),由四足步態(tài)切換為波浪步態(tài);當(dāng)t為40 s時(shí),由波浪步態(tài)切換為四足步態(tài)。
從單種步態(tài)來(lái)看,無(wú)論是哪種步態(tài),機(jī)器人的支撐腿都會(huì)先獲得一個(gè)較小的前饋力F(t)和阻抗參數(shù)K(t)、D(t),然后過(guò)渡到一個(gè)較大的自適應(yīng)參數(shù),最后即將離開支撐相位時(shí)再獲得較小的自適應(yīng)參數(shù),如圖15所示。使得單腿支撐實(shí)現(xiàn)了類似加載—穩(wěn)定工作—卸載的階段,從而達(dá)到柔順觸地到穩(wěn)定支撐的過(guò)程。并且三個(gè)關(guān)節(jié)在支撐階段的控制參數(shù)是不同的,這是因?yàn)楦P(guān)節(jié)、髖關(guān)節(jié)和膝關(guān)節(jié)在控制機(jī)器人支撐腿部運(yùn)動(dòng)時(shí)具有不同的作用。髖關(guān)節(jié)和膝關(guān)節(jié)擁有更大的控制參數(shù),使得支撐腿能更穩(wěn)定地深入細(xì)沙,以提供前進(jìn)的動(dòng)力和穩(wěn)定的支撐力。
從步態(tài)切換來(lái)看,基于CPG的步態(tài)控制能夠提供快速且穩(wěn)定的足端軌跡生成。新生成的步態(tài)會(huì)以不同的相位頻率和支撐腿數(shù)與沙地環(huán)境交互,因而機(jī)器人需要適應(yīng)不同的未知?jiǎng)討B(tài)過(guò)程。AMC是一種可變阻抗控制,式(14)中的學(xué)習(xí)遺忘因素γ(t)會(huì)根據(jù)先前的軌跡跟蹤誤差ε(t)來(lái)快速獲得一個(gè)適應(yīng)性的前饋力F(t),而阻抗參數(shù)K(t)、D(t)則會(huì)根據(jù)式(13)的規(guī)律調(diào)節(jié)至系統(tǒng)穩(wěn)定。在圖15中可以看到,在步態(tài)切換后的短時(shí)間內(nèi)會(huì)獲得較大的F(t)和較小數(shù)K(t)、D(t);隨后的幾個(gè)步態(tài)周期中,F(xiàn)(t)減小、K(t)、D(t)增大,并且都逐漸趨于一個(gè)周期性的穩(wěn)定的值,這表明AMC能使機(jī)器人快速適應(yīng)新的步態(tài)和動(dòng)態(tài)環(huán)境并且讓機(jī)器人穩(wěn)定運(yùn)行。
從三種步態(tài)的對(duì)比來(lái)看,三角步態(tài)、四足步態(tài)和波浪步態(tài)的支撐腿數(shù)分別為3、4、5(圖14)。圖15中,隨著支撐腿數(shù)的增加,AMC所產(chǎn)生的前饋力F(t)和阻抗系數(shù)K(t)、D(t)減小,賦予單腿的控制力也更小。即當(dāng)支撐腿變多時(shí),腿部會(huì)變軟,反之亦然,這一結(jié)果與生理學(xué)實(shí)驗(yàn)相當(dāng)[11]。三種步態(tài)的對(duì)比實(shí)驗(yàn)證明本研究所提的自適應(yīng)控制通過(guò)在線學(xué)習(xí)控制參數(shù),能夠使六足機(jī)器人在不確定的環(huán)境下實(shí)現(xiàn)三種步態(tài)的快速切換和穩(wěn)定行走,展現(xiàn)出所提方法賦予六足機(jī)器人良好的適應(yīng)性運(yùn)動(dòng)。
4 結(jié)語(yǔ)
本文提出了一種新的六足機(jī)器人AMC方法,通過(guò)在線阻抗適應(yīng)來(lái)實(shí)時(shí)調(diào)整足力,以實(shí)現(xiàn)未知地形的多步態(tài)行走。將AMC與中樞神經(jīng)系統(tǒng)、虛擬運(yùn)動(dòng)神經(jīng)網(wǎng)絡(luò)結(jié)合起來(lái),得到自適應(yīng)神經(jīng)運(yùn)動(dòng)控制系統(tǒng),使得六足機(jī)器人僅依靠本體感知實(shí)現(xiàn)適應(yīng)性運(yùn)動(dòng)。將該方法應(yīng)用于六足機(jī)器人RENS H2,在硬質(zhì)地面、沙礫地面、海綿地面進(jìn)行了步態(tài)切換和多步態(tài)穩(wěn)定行走實(shí)驗(yàn)。結(jié)果表明,所提方法使六足機(jī)器人能夠?qū)崿F(xiàn)穩(wěn)定的運(yùn)動(dòng)軌跡,在不增加額外能耗的情況下,支撐腿的關(guān)節(jié)誤差都減小了10%~20%。自適應(yīng)調(diào)整阻抗參數(shù)和足端力讓機(jī)器人在不同的地面實(shí)現(xiàn)多步態(tài)運(yùn)動(dòng)。由于所提出的神經(jīng)自適應(yīng)運(yùn)動(dòng)控制缺少準(zhǔn)確的前向模型預(yù)測(cè)所需的關(guān)節(jié)轉(zhuǎn)矩,故后續(xù)研究可結(jié)合MPC[29]或深度學(xué)習(xí)[30]方法來(lái)計(jì)算優(yōu)化前饋力和虛擬運(yùn)動(dòng)神經(jīng)模型的參數(shù)。
參考文獻(xiàn):
[1] WETTERGREEN D. Robotic Walking in Natural Terrain:Gait Planning and Behavior-based Control for Statically-stable Walking Robots[M]. Pittsburgh:Carnegie Mellon University, 1995.
[2] BJELONIC M, HOMBERGER T, KOTTEGE N, et al. Autonomous Navigation of Hexapod Robots with Vision-based Controller Adaptation[C]∥2017 IEEE International Conference on Robotics and Automation(ICRA). Singapore, 2017:5561-5568.
[3] BJELONIC M, KOTTEGE N, HOMBERGER T, et al. Weaver:Hexapod Robot for Autonomous Navigation on Unstructured Terrain[J]. Journal of Field Robotics, 2018, 35(7):1063-1079.
[4] PRGR M, CˇEK P, FAIGL J. Cost of Transport Estimation for Legged Robot Based on Terrain Features Inference from Aerial Scan[C]∥2018 IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS). Madrid, 2018:1745-1750.
[5] ZENKER S, AKSOY E E, GOLDSCHMIDT D, et al. Visual Terrain Classification for Selecting Energy Efficient Gaits of a Hexapod Robot[C]∥2013 IEEE/ASME International Conference on Advanced Intelligent Mechatronics. Wollongong, 2013:577-584.
[6] 朱雅光, 劉春潮, 張亮. 基于虛擬運(yùn)動(dòng)神經(jīng)網(wǎng)絡(luò)的六足機(jī)器人行為控制[J]. 浙江大學(xué)學(xué)報(bào)(工學(xué)版), 2022, 56(6):1107-1118.
ZHU Yaguang, LIU Chunchao, ZHANG Liang. Behavior Control of Hexapod Robot Based on Virtual Motoneuron Network[J]. Journal of Zhejiang University(Engineering Science), 2022, 56(6):1107-1118.
[7] KESPER P, GRINKE E, HESSE F, et al. Obstacle/Gap Detection and Terrain Classification of Walking Robots Based on a 2D Laser Range Finder[C]∥Nature-Inspired Mobile Robotics. Shenzhen, 2013:419-426.
[8] ZHU Yaguang, ZHANG Liang, MANOONPONG P. Virtual Motoneuron Activation for Goal-directed Locomotion of a Hexapod Robot[C]∥2020 5th International Conference on Advanced Robotics and Mechatronics(ICARM). Shenzhen, 2020:380-386.
[9] FOCCHI M, del PRETE A, HAVOUTIS I, et al. High-slope Terrain Locomotion for Torque-controlled Quadruped Robots[J]. Autonomous Robots, 2017, 41(1):259-272.
[10] ZHU Yaguang, JIN Bo, LI Wei. Leg Compliance Control of a Hexapod Robot Based on Improved Adaptive Control in Different Environments[J]. Journal of Central South University, 2015, 22(3):904-913.
[11] XIONG Xiaofeng, WRGTTER F, MANOONPONG P. Adaptive and Energy Efficient Walking in a Hexapod Robot under Neuromechanical Control and Sensorimotor Learning[J]. IEEE Transactions on Cybernetics, 2016, 46(11):2521-2534.
[12] XIONG Xiaofeng, WRGTTER F, MANOONPONG P. Neuromechanical Control for Hexapedal Robot Walking on Challenging Surfaces and Surface Classification[J]. Robotics and Autonomous Systems, 2014, 62(12):1777-1789.
[13] HOMCHANTHANAKUL J, MANOONPONG P. Continuous Online Adaptation of Bioinspired Adaptive Neuroendocrine Control for Autonomous Walking Robots[J]. IEEE Transactions on Neural Networks and Learning Systems, 2022, 33(5):1833-1845.
[14] THOR M, MANOONPONG P. Versatile Modular Neural Locomotion Control with Fast Learning[J]. Nature Machine Intelligence, 2022, 4:169-179.
[15] MIRLETZ B T, BHANDAL P, ADAMS R D, et al. Goal-directed CPG-based Control for Tensegrity Spines with Many Degrees of Freedom Traversing Irregular Terrain[J]. Soft Robotics, 2015, 2(4):165-176.
[16] BING Zhenshan, CHENG Long, CHEN Guang, et al. Towards Autonomous Locomotion:CPG-based Control of Smooth 3D Slithering Gait Transition of a Snake-like Robot[J]. Bioinspiration amp; Biomimetics, 2017, 12(3):035001.
[17] YANG Chenguang, GANESH G, HADDADIN S, et al. Human-like Adaptation of Force and Impedance in Stable and Unstable Interactions[J]. IEEE Transactions on Robotics, 2011, 27(5):918-930.
[18] YANG Chenguang, JIANG Yiming, HE Wei, et al. Adaptive Parameter Estimation and Control Design for Robot Manipulators with Finite-time Convergence[J]. IEEE Transactions on Industrial Electronics, 2018, 65(10):8112-8123.
[19] YANG Chenguang, CHEN Chuize, HE Wei, et al. Robot Learning System Based on Adaptive Neural Control and Dynamic Movement Primitives[J]. IEEE Transactions on Neural Networks and Learning Systems, 2019, 30(3):777-787.
[20] XIONG Xiaofeng, MANOONPONG P. Adaptive Motor Control for Human-like Spatial-temporal Adaptation[C]∥2018 IEEE International Conference on Robotics and Biomimetics(ROBIO). Kuala Lumpur, 2018:2107-2112.
[21] XIONG Xiaofeng, MANOONPONG P. Online Sensorimotor Learning and Adaptation for Inverse Dynamics Control[J]. Neural Networks, 2021, 143:525-536.
[22] ZHANG Shuang, DONG Yiting, OUYANG Yuncheng, et al. Adaptive Neural Control for Robotic Manipulators with Output Constraints and Uncertainties[J]. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(11):5554-5564.
[23] 朱雅光, 朱建偉, 李茹月, 等. 基于神經(jīng)-肌肉架構(gòu)的仿生并聯(lián)軀干柔順控制[J]. 中國(guó)機(jī)械工程, 2022, 33(13):1576-1585.
ZHU Yaguang, ZHU Jianwei, LI Ruyue, et al. Neuromuscular Architecture Based Compliance Control of Bionic Parallel Torsos[J]. China Mechanical Engineering, 2022, 33(13):1576-1585.
[24] ZHU Yaguang, ZHANG Liang, MANOONPONG P. Generic Mechanism for Waveform Regulation and Synchronization of Oscillators:an Application for Robot Behavior Diversity Generation[J]. IEEE Transactions on Cybernetics, 2022, 52(6):4495-4507.
[25] ZHU Yaguang, ZHANG Liang, GUO Wanjin,et al. A Simple and Flexible Movement Control Method for a Hexapod Walking Robot[C]∥Synergy of Automation, IoT amp; AI. CLAWAR Association Ltd.Kuala Lumpur, 2019:79-86.
[26] ZHU Yaguang, GUO Tong, LIU Qiong, et al. A Study of Arbitrary Gait Pattern Generation for Turning of a Bio-inspired Hexapod Robot[J]. Robotics and Autonomous Systems, 2017, 97:125-135.
[27] ZHU Yaguang, WU Yongsheng, LIU Qiong, et al. A Backward Control Based on σ -Hopf Oscillator with Decoupled Parameters for Smooth Locomotion of Bio-inspired Legged Robot[J]. Robotics and Autonomous Systems, 2018, 106:165-178.
[28] ZHU Yaguang, ZHOU Shuangjie, GAO Dongxiao, et al. Synchronization of Non-linear Oscillators for Neurobiologically Inspired Control on a Bionic Parallel Waist of Legged Robot[J]. Frontiers in Neurorobotics, 2019, 13:59.
[29] GIBSON G, DOSUNMU-OGUNBI O, GONG Yukai, et al. Terrain-Adaptive, ALIP-based Bipedal Locomotion Controller via Model Predictive Control and Virtual Constraints[C]∥2022 IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS). Kyoto, 2022:6724-6731.
[30] SUN Yu, UBELLACKER W L, MA W L, et al. Online Learning of Unknown Dynamics for Model-based Controllers in Legged Locomotion[J]. IEEE Robotics and Automation Letters, 2021, 6(4):8442-8449.
(編輯 陳 勇)
作者簡(jiǎn)介:劉春潮,男,1998年生,博士研究生。研究方向?yàn)榉律鷻C(jī)器人、控制理論。E-mail: liuchunchao@chd.edu.cn。
朱雅光*(通信作者),男,1986年生,教授、博士研究生導(dǎo)師。研究方向?yàn)榭刂评碚?、機(jī)器人技術(shù)、智能檢測(cè)與模式識(shí)別、機(jī)電系統(tǒng)開發(fā)與信號(hào)分析、嵌入式系統(tǒng)開發(fā)與系統(tǒng)集成、人工智能技術(shù)。E-mail: zhuyaguang@chd.edu.cn。
本文引用格式:劉春潮,朱雅光,周亞婷,等.基于虛擬運(yùn)動(dòng)神經(jīng)系統(tǒng)的六足機(jī)器人自適應(yīng)運(yùn)動(dòng)控制[J]. 中國(guó)機(jī)械工程,2025,36(2):315-324.
LIU Chunchao, ZHU Yaguang, ZHOU Yating, et al. Adaptive Impedance Control of Hexapod Robots Based on Virtual Motoneuron System[J]. China Mechanical Engineering, 2025, 36(2):315-324.
基金項(xiàng)目:國(guó)家自然科學(xué)基金(62373064);多模態(tài)認(rèn)知計(jì)算安徽省重點(diǎn)實(shí)驗(yàn)室(安徽大學(xué))開放課題(MMC202101);陜西省國(guó)防科技工業(yè)“揭榜掛帥”項(xiàng)目(SXGF2023J008)