• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      剛柔耦合機器人綜述

      2022-06-11 12:11:48胡永贊胡凱吳佳勝陳旭黃志成
      南京信息工程大學學報 2022年3期
      關鍵詞:記憶合金軟體驅動器

      胡永贊 胡凱 吳佳勝 陳旭 黃志成

      0 引言

      隨著科學技術的不斷發(fā)展,機器人技術取得了非常顯著的進步,己經(jīng)被廣泛應用于工業(yè)生產(chǎn)、家庭服務等諸多領域.當前實際應用中的機器人多為硬質機械結構,由剛體部件構建而成.剛性機器人一直是機器人發(fā)展的重點,它能夠提高生產(chǎn)效率并且具有極強的可控性.但是,傳統(tǒng)的剛性機器人不易在復雜的地形條件下運動且缺乏靈活性[1].近年來,隨著機器人應用領域的不斷擴大,對機器人的柔順性提出了更高的要求.國際機器人協(xié)會對軟體機器人的定義[2]是:1)由某種特殊的柔軟彈性材料制成的機械裝置;2)由多個剛性部件構成,但能展現(xiàn)出類似軟體機器人變形特性的機電裝置.軟體機器人本體采用柔性材料加工而成,從原理上具有無限自由度,彌補了剛性機器人在這一方面的不足.因此,很多科學家開始致力于由柔軟材料或可變形材料制作的剛柔耦合機器人的研究工作.本文將從剛柔耦合機器人的國內外發(fā)展現(xiàn)狀、內置驅動、機器人運動分析建模[3]、控制方法等方面進行綜述,并對剛柔耦合機器人的發(fā)展趨勢和研究方向做出展望.

      1 概述

      1.1 國內發(fā)展現(xiàn)狀

      近年來,由于醫(yī)療、地質勘察、野外探險、水質監(jiān)測等領域的迫切需求,剛柔耦合機器人的發(fā)展速度相當迅速.2008年,河北工業(yè)大學的高鐵紅[4]研發(fā)了仿生水黽機器人,其本體用碳纖維材料,支撐腿和連接機構采用不銹鋼絲,以三個微型電磁鐵作為驅動器(圖1),通過控制系統(tǒng)驅動機器人運動,實現(xiàn)仿生水黽的運動以及轉彎.該仿生水黽在水質檢測、水面巡檢等領域有著廣闊的應用前景.2017年,中國科學技術大學的張林飛[5]研發(fā)了仿生的章魚腕足機械臂,并且以當下熱門的驅動材料形狀記憶合金(Shape Memory Alloys,SMA)作為驅動器,通過對SMA的電加熱和冷卻可以完成蜷縮和抓取動作,機械臂外部采用軟性材料制作而成,可以實現(xiàn)抓取物體而無任何形態(tài)損害.這種對不同形態(tài)大小物體抓取的普適性,在工業(yè)制造、醫(yī)療康復[6]、海洋巡檢等領域應用廣泛.2018年,中國海洋大學的譚俊哲等[7]制作出了仿生的水母機器人,實現(xiàn)了在海洋中的運動,它同樣采用了SMA作為驅動器,驅動器分為上下兩段控制,分別完成收縮和擴張運動,在制作完成的樣機中設置了冷卻室,以達到快速冷卻的目的,從而實現(xiàn)快頻率的收縮擴張運動(圖2).2018年,東南大學宋愛國教授團隊[8]以醫(yī)療輔助康復為目的,利用基于表面肌電圖像的手勢識別算法能自如控制假手完成8種手勢動作(圖3).

      圖1 仿生水黽機器人[4]Fig.1 Bionic water strider robot [4]

      圖2 仿生水母機器人結構[7]Fig.2 Structure of the bionic jellyfish robot [7]

      圖3 東南大學與丹陽假肢廠聯(lián)合研發(fā)的多指靈巧肌電假手[8]Fig.3 Multi-finger smart muscle electric prosthesis jointly developed by Southeast University and Danyang Prosthetic Factory [8]

      1.2 國外發(fā)展現(xiàn)狀

      美國麻省理工學院(MIT)的RUS課題組[9]研發(fā)了一種自主游動的軟體機器魚(圖4),用流體彈性驅動器(Fluidic Elastomer Actuator,FEA)作為魚尾驅動,實現(xiàn)了水下自由游動和快速逃逸.2015年,哈佛大學的WOOD課題組[10]采用3D打印技術,研制了一種彈跳機器人,將不同剛度梯度的材料組合到一起.該機器人包含了剛性驅動部件的可靠性和柔性材料的自由度高等特性,因此提高了自身的跳躍性能(圖5).同時,該機器人采用爆破能來驅動,雖然不可控,但是擺脫了傳統(tǒng)氣缸驅動的束縛,為機器人的小型化設計提供了新的方案.2020年,北卡州立大學Tang等[11]因受到獵豹的脊背柔軟且富有彈性,可以通過拉伸背部肌肉來控制脊背的快速彎曲以及伸長來實現(xiàn)高速奔跑的啟發(fā),設計了柔性脊背柔性機器人(圖6),其速度達每秒2.7個身長(187.5 mm/s).同時,它既可以實現(xiàn)水下軟機器人的快速游動,速度達每秒0.8個身長(117 mm/s),又可以用于可調節(jié)抓力的柔性器人抓手(可抓取易碎的生雞蛋,也可提起10 kg的啞鈴).

      圖4 軟體機器魚[9]Fig.4 Soft robotic fish[9]

      圖5 彈跳機器人[10]Fig.5 Bouncing robot [10]

      圖6 仿獵豹柔性機器人[11]Fig.6 Flexible robot imitating cheetah[11]

      2 剛柔耦合機器人的驅動方式

      驅動器是剛柔耦合機器人實現(xiàn)運動的必需的運動執(zhí)行機構,因此研究適用于機器人內置驅動的驅動器至關重要.

      剛柔耦合機器人本體的關鍵在于剛性材料和柔性材料的結合,柔性驅動器的設計[12-15]作為柔性機器人應用的關鍵技術,決定了柔性機器人的工作機理,如能設計出優(yōu)良而順滑的驅動方式,則會提高仿生機器人與人類的相容性.剛柔耦合機器人是模仿大自然中動物的肌肉組織或靜水骨骼結構來建立它的驅動器結構的[16].其驅動方式主要包括:氣動驅動、電活性聚合物(Electro Active Polymer,EAP)驅動或者形狀記憶合金(SMA)驅動等.

      2.1 氣動驅動器

      氣動驅動[17-18]是通過改變氣體壓強產(chǎn)生壓強差,來驅動機器人從而實現(xiàn)變形運動的,它具有反應速度快、功率大、運動平滑、易于控制等優(yōu)點.氣動驅動的特點在于,它需要外部設備如空氣壓縮機來提供動力,通過壓縮的氣體釋放到缸體內,從而為缸體運動提供驅動力.目前,應用較多的是氣動人工肌肉,如文獻[18]研制了人工肌肉氣動驅動的仿生青蛙(圖7),其外殼采用3D樹脂打印,減輕了機器人機身的質量.在機器人軀干上安裝了兩個容積分別為2 L的可反復充氣的氣瓶作為驅動氣源,并且通過滑模變結構控制進行測試實驗,結果表明控制系統(tǒng)穩(wěn)定可靠,實現(xiàn)了仿生青蛙在水中的游動.

      圖7 氣動驅動仿生青蛙[18]Fig.7 Pneumatic driven bionic frog[18]

      2.2 電活性聚合物驅動器

      電活性聚合物(EAP)[19-20]一般將電源作為驅動源,它是一種新型智能高分子材料,在外部電場的作用下,電活性聚合物內部結構發(fā)生改變,在薄膜表面的導電層之間的靜電引力促使薄膜發(fā)生壓縮與形變.根據(jù)電活性聚合物的致動機理,一般將EAP分為離子型EAP和電子型EAP兩類.因為電子型EAP如果想要發(fā)生形變,一般需要千伏級的驅動電壓,而離子型EAP在較低電壓下就可以發(fā)生形變(圖8),在電流的作用下可以改變EAP的外觀和大小,從左到右為初始狀態(tài)變化到通電狀態(tài),它具有比較大的彎曲響應的特點.另外,電活性聚合物的應變高、質量輕以及柔軟性好的特點,使其在仿肌領域得以飛速發(fā)展.EAP具有很好的機電性能以及較高的機電轉換效率,被廣泛應用在機器人領域.

      圖8 離子型EAP變形[19]Fig.8 Ionic EAP deformation[19]

      由于能量更容易以電能方式存儲,以電子電路的形式來計算,直接應用電能來驅動軟體驅動器更為方便.因此,有大量的學者致力于開發(fā)由電活性聚合物組成的電激活軟體驅動器.如文獻[19]提出了由兩個柔性桿組成“L”形軟體機器人驅動器,針對驅動器的輸入電壓和輸出位移,建立了由電化學和電動機械模型組成的多重物理量動態(tài)模型,應用瑞雷-里茲-邁羅維奇方法對軟體機器人的控制方程進行了求解,應用拉普拉斯算子獲得了軟體機器人的傳遞函數(shù),為精密控制奠定了基礎.

      2.3 形狀記憶合金驅動器

      形狀記憶合金[21]是一種特殊的合金.通過人為作用,可以使其記憶任何形狀,經(jīng)過加熱到某一溫度,它就會變長,遇冷就會收縮回到它所記憶的形態(tài),因此稱之為形狀記憶合金.根據(jù)形狀記憶合金這種受熱能伸縮的特點而制成的驅動器成為形狀記憶合金驅動器.常用的記憶合金是Ti Ni合金.圖9為意大利圣安娜高等學校Laschi等[22]研制的仿章魚機器人.這種仿章魚機器人采用形狀記憶合金驅動,形狀記憶合金可以在溫度不同的情況下恢復設定的形狀.Laschi等通過電阻絲熱量來實現(xiàn)這種溫度的變化,針對章魚的不同運動姿態(tài),可以設定形狀記憶合金的不同初始姿態(tài),實現(xiàn)仿章魚機器人的不同的運動狀態(tài).

      圖9 仿章魚機器人[22]Fig.9 A new robotic octopus tentacle[22]

      形狀記憶合金是利用合金的相變來進行能量轉換的,記憶合金做成的驅動器具有以下優(yōu)點:選擇適當規(guī)格的記憶合金可以將驅動器體型最小化,特別是仿生體型較小的動物;結構簡單、質量輕、柔順性好.但是,形狀記憶合金也有其存在的缺點:變形響應較慢、輸出力較小,難以供給爆發(fā)的輸出力,所以其工作效率較低,例如Laschi等[22]所設計的仿章魚機器人,通過相變產(chǎn)生的驅動力,機器人確實是做到了仿章魚的基本運動形態(tài),但眾所周知,海洋中的章魚游行時爆發(fā)力十足,而由SMA驅動器制成的仿生機器人難以與其媲美.SMA驅動的機器人做到了機器人輕量化,占用空間更小,但是,如何使得SMA驅動器產(chǎn)生更高的能量爆發(fā)還需要進一步研究.

      表1為三種驅動方式的優(yōu)點及工作原理比較.

      表1 驅動方式比較

      3 機器人的建模

      機器人的柔性部分的建模研究是一個難題,也是剛柔耦合機器人研究的重要部分.

      軟體機器人的運動學不同于傳統(tǒng)的機器人,軟體機器人變形連續(xù)且自由度高度冗余,對于它們的運動學描述只能采用連續(xù)體方程.基于軟體機器人變形后各部分曲率恒定或者分段恒定的現(xiàn)象,學者們在傳統(tǒng)的D-H變換的基礎上研究出一套分段常曲率(Piecewise Constant Curvature,PCC)理論模型[23].該模型用長度、曲率和偏轉角來描述一條曲線在構型空間下的位姿,通過改進的D-H轉換將曲線末端點映射到工作空間中,給出了從構型空間轉換到工作空間的通用齊次矩陣.而從軟體機器人的驅動空間到構型空間的映射因機器人本體的結構而異.通過變形后的幾何關系可得到構型空間下的位姿參數(shù)和三條驅動線纜長度的關系[24];用系統(tǒng)辨識的方法可建立輸入氣壓和構型空間參數(shù)的關系[25].但是PCC模型只適用于固定曲率的運動學求解,對于變曲率的軟體機器人運動學問題,需要新的方法,如將軟體連續(xù)臂分為多段,每段近似曲率恒定[26-27].對于流體驅動彈性體和纖維增強制動器等超彈性材料軟體機器人,因其本構關系比較復雜,學者們多采用有限元分析來研究幾何參數(shù)對運動學的影響[28-29].從變形前后的幾何關系來分析其變形機理,也是一個很好的嘗試.

      和剛體機器人相比,軟體機器人的逆運動學問題(通過控制曲率使機器人到達指定位置)具有更多的挑戰(zhàn).機器人自動避障、非結構環(huán)境下作業(yè)、自動抓取和放置物體等任務都離不開逆運動學問題的求解.目前,對于這方面的研究也展開了一些工作.如MIT的RUS團隊,在給定軟體機器人的起始點、終止點和期望的姿態(tài)后,通過級聯(lián)反饋曲率控制算法,迭代雅可比矩陣計算每一步需要的曲率并控制其達到期望值[30],并利用視覺反饋完成了二維平面內抓取[31]和在限制空間下運動規(guī)劃[32]等復雜任務.RUS團隊還建立了三維軟體機械臂的動力學模型,并完成了空間抓持任務[33].上海交通大學的Wang等[34]也利用視覺伺服控制軟體機械臂定位目標物體.

      表2為柔性機器人建模方法比較.

      表2 柔性機器人建模方法比較

      在研究機器人的剛柔耦合問題上,對機器人的建模是至關重要的.下面以形狀記憶合金(SMA)驅動的機器人為例,分析其建模問題.因SMA材料質量輕、靈活性高,2019年,Liu等[35]設計了仿人柔性機器人單元,其設計靈感來自于脊椎的工作方式,設計了一個柔性機器人結構,機器人外觀如圖10所示.

      圖10 模型外觀結構[35]Fig.10 Structure of the soft robot proposed in Ref.[35]

      假設機器人以低速勻速運動,考慮建立其運動學模型.如圖11所示,以機器人的兩個單元為例,由SMA驅動的上下6個關節(jié)點(T1,T2,T3,B1,B2,B3)做共球面運動,6個關節(jié)點兩兩對應分為3組,B1T1為整個機器人其中一個機械分支,根據(jù)柔性機器人建模方法,B1T1數(shù)學模型可表示為

      圖11 形狀記憶合金模型[35]Fig.11 Model of SMA[35]

      (1)

      B2T2分支的數(shù)學模型方程為

      (rsinθ2cosφ2+rsin 0)2+(rcosθ2-rcos 0)2,

      (2)

      B3T3分支的模型方程為

      (3)

      其中,r為運動球面的半徑,θ,φ為機器人的旋轉角度.

      然后根據(jù)機構的幾何形狀,可以推導出點與點之間的函數(shù)關系,最終建立完整的數(shù)學模型:

      (4)

      關于T2T3和T1T3的另外兩個模型方程也可以用同樣的方法得到.

      根據(jù)未知數(shù)的個數(shù)與方程的個數(shù)之間的關系,方程組有唯一解.該模型上下共分為2個單元,SMA作為對人體肌肉的模擬,機器人本體單元則用于脊柱單元的模擬,各個單元之間關節(jié)被設計成骨骼的關節(jié).各關節(jié)角作為模型的輸入,因此,根據(jù)上述幾何運動學關系,可以推導出對應于不同頂面位置的3個SMA彈簧的長度.

      對機器人建模是機器人研究中非常重要的一環(huán),特別是對于SMA柔性機器人,因為其具有無限多自由度,使得建模具有一定的難度,但通過適當?shù)慕S嬎惴椒ńK究可以克服.

      4 剛柔耦合機器人的控制技術

      控制算法在機器人中也是不可或缺的.近年來,結合深度學習和強化學習的控制算法已經(jīng)應用于剛柔耦合機器人,并且取得不少成果.為使問題簡單化并且獲得良好的控制效果,大多數(shù)機器人采用單回路閉環(huán)控制.在研究機器人的控制系統(tǒng)時,如何保證機器人有足夠高的精度和系統(tǒng)的穩(wěn)定性成為最大的難點,因此需要相應的控制算法才能實現(xiàn)對機器人運動的精確控制.常用的控制算法有PID控制、模糊控制、自適應控制、滑??刂坪蜕窠?jīng)網(wǎng)絡控制等.

      4.1 PID控制

      PID控制是線性系統(tǒng)理論中的控制算法,對于線性系統(tǒng)能夠達到精確的控制效果,在工業(yè)中也應用最多.PID控制就目前來說是一種較為簡單的控制方法,在小型的機器人系統(tǒng)中也是應用最為普遍的控制方法.Dehghani等[36]設計了一種PID控制器用于單連桿柔性關節(jié)機器人中,實現(xiàn)了具有柔性關節(jié)機器人的基本運動.為了實現(xiàn)低的超調值,他們又設計了FLST-PID(Fuzzy Logic Self-Tuning PID),FLST-PID是一種比較實用的系統(tǒng)優(yōu)化方法,具有克服不確定性和改變系統(tǒng)參數(shù)的能力.結果表明,經(jīng)此改進的單連桿柔性關節(jié)機器人控制速度快、超調量為零,使得柔性關節(jié)機器人的控制準確率有所提高.

      4.2 模糊控制

      模糊控制是一種智能控制方法,它本質上是一種非線性控制,適用于對難以建模的對象實施魯棒性控制,最終控制形式簡單、易于實現(xiàn).此外,對于不確定的控制系統(tǒng)得不到它精確的數(shù)學模型的問題,模糊控制就可以解決.

      Kha等[37]設計了一種自適應模糊PID控制器成功地應用于SMA驅動器的位置控制.實驗結果表明,自整定模糊PID控制器能夠較好地實現(xiàn)對不同輸入信號的跟蹤,從而補償了SMA執(zhí)行器的滯后現(xiàn)象.文獻[38]采用模糊PID控制器對氣動柔性球關節(jié)進行控制,克服了氣動人工肌肉結構數(shù)學模型不精確的缺點,實驗結果表明模糊PID控制基本可以滿足對該柔性機器人彎曲關節(jié)的精確控制和響應速度的需求.王斌銳等[39]使用模糊控制結合PI控制器對氣動肌肉肘關節(jié)(圖12)進行控制,以提高位置精度為目標,使用模糊控制對氣動肌肉肘關節(jié)的上、下臂角度比例K和PI參數(shù)進行實時調整.實驗結果表明,相對于PI控制而言,結合了模糊控制的PI控制使得肘關節(jié)的轉動角更大,而且跟蹤精度更高,實現(xiàn)了氣動驅動肘關節(jié)有效而且精確的控制.

      圖12 氣動肌肉仿生肘關節(jié)[39]Fig.12 Pneumatic muscle bionic elbow joint[39]

      4.3 自適應控制

      自適應控制根據(jù)系統(tǒng)參數(shù)或運行指標的變化改變控制參數(shù),從而使控制對象工作達到最優(yōu)狀態(tài),多用于具有一定不確定性的非線性系統(tǒng)控制中.自適應控制不完全依靠數(shù)學模型,需要不斷對控制模型的數(shù)據(jù)信息進行采集,然后不斷去完善它的數(shù)學模型,最終達到控制系統(tǒng)的性能指標.此特點決定了自適應控制在運動控制方面的優(yōu)越性.

      一種典型魯棒自適應PID控制算法流程如下:

      基于局部學習的神經(jīng)網(wǎng)絡,因為其學習速度較快,有較好的逼近性能,在控制領域受到了廣泛的關注,其逼近函數(shù)可以表示為

      (5)

      式中,w為可調權值向量,v為權系數(shù)選擇向量.設計神經(jīng)網(wǎng)絡在線學習系統(tǒng)不確定性和非線性:

      (6)

      設計魯棒自適應控制器為

      u=upid+uad=

      (7)

      ATP+PA=-Q,

      (8)

      神經(jīng)網(wǎng)絡權值調整規(guī)則為

      (9)

      (10)

      至此,得到最終的控制系統(tǒng),之后即可構造李雅普諾夫函數(shù)證明系統(tǒng)的穩(wěn)定性.

      在控制領域中,經(jīng)典的控制方法如PID控制等,智能控制如滑??刂啤⒆赃m應控制、神經(jīng)網(wǎng)絡控制等,它們在單獨應用在系統(tǒng)中,往往不能達到預期的控制要求,而多數(shù)情況下,兩種控制算法或者幾種控制算法結合,可以達到更穩(wěn)定、更精確的控制效果.

      在控制系統(tǒng)中,超調量較大會導致控制系統(tǒng)不穩(wěn)定,達不到預期的機器人控制效果.為了降低控制系統(tǒng)的超調量,Wang等[40]在魯棒自適應PID控制算法中加入了小腦模型關節(jié)控制器(Cerebellar Model Articulation Controller,CMAC)神經(jīng)網(wǎng)絡,CMAC是一種基于局部學習的神經(jīng)網(wǎng)絡,學習速度快,具有較好的逼近效果,控制結構是對氣球的方位系統(tǒng)進行控制,結合PID控制循環(huán)反饋給控制器實現(xiàn)自適應方位控制,利用逼近效果減少系統(tǒng)的超調量,實現(xiàn)精確的方位控制.

      4.4 滑模控制

      滑??刂频膬?yōu)點是能夠克服系統(tǒng)的不確定性,對干擾和未建模動態(tài)具有很強的魯棒性,尤其是對非線性系統(tǒng)的控制具有良好的控制效果.由于變結構控制系統(tǒng)算法簡單、響應速度快,對外界噪聲干擾和參數(shù)攝動具有魯棒性,在機器人控制領域得到了廣泛的應用.滑??刂茖儆诜蔷€性的控制方法,它的優(yōu)勢是不需要精確的數(shù)學模型,可以估計出不確定的干擾因素.滑??刂凭哂幸韵聝?yōu)點:控制響應速度快、不需要模型的在線辨識能力、對參數(shù)變化及外界擾動不是很敏感以及結構實現(xiàn)簡單.

      針對人工肌肉驅動器模型控制策略較為復雜、控制參數(shù)較多、調節(jié)過程較為繁瑣、通用性較差等問題,楊輝等[41]基于梯度法設計了無模型自適應滑??刂破?驅動器的動態(tài)方程可表示為

      (11)

      e=qd-q.

      (12)

      由人工肌肉驅動的柔性機器人系統(tǒng)是一種非線性系統(tǒng),而滑??刂茖Ψ蔷€性系統(tǒng)有著較好的控制效果,故取滑??刂破鞯幕C婧瘮?shù)為

      (13)

      其中c1,c2為常系數(shù),e為誤差.為保證運動點能夠在有限時間內到達滑模面,且到達滑模面時避免出現(xiàn)抖振現(xiàn)象,故取指數(shù)趨近律為

      (14)

      Rsetam等[42]提出了一種分層滑??刂品椒☉迷谌嵝躁P節(jié)機械手.利用兩個子系統(tǒng)對柔性關節(jié)機械手進行建模;根據(jù)非線性系統(tǒng)性質,構造了兩個子系統(tǒng)的誤差滑模面,位于第一級滑模態(tài).對于柔性機械手,滑模面子系統(tǒng)S1的目的是控制由機械手的柔性引起的幾何非線性項,滑模面子系統(tǒng)S2的目的是抑制滑??刂扑鶐淼亩墩耥?,從而提高控制系統(tǒng)的性能:

      (15)

      通過對柔性關節(jié)機器人的跟蹤性能、減振效果等控制目標的比較研究,表明該方法具有優(yōu)于傳統(tǒng)滑模控制的性能.

      提高跟蹤性能、減小振動效果是滑模控制領域一直追求的性能.2019年,Wang等[43]基于李雅普諾夫函數(shù)設計了一種自適應滑??刂破鱽硖幚磔斎爰s束、模型不確定性和外部干擾.為了控制機器人的位置和姿態(tài)角,實現(xiàn)機器人的軌跡跟蹤控制系統(tǒng),所設計的控制算法在仿真中得到了廣泛的驗證.

      滑??刂茖ο到y(tǒng)動態(tài)的模型以及動態(tài)模型中不確定因素的要求較高.然而滑??刂频娜秉c是在控制軌跡到達滑??刂频幕C鏁r很難沿著滑模面向平衡點移動,而是在面的兩側來回穿梭,這一現(xiàn)象被稱為抖振現(xiàn)象,所以在使用滑??刂茣r減少抖振現(xiàn)象是至關重要的.對于滑??刂浦谐霈F(xiàn)的抖振現(xiàn)象,較為常用的解決方法有:邊界層法、趨近律法和遺傳優(yōu)化等.

      4.5 神經(jīng)網(wǎng)絡控制

      神經(jīng)網(wǎng)絡控制是智能控制的一部分,它主要是將人工神經(jīng)網(wǎng)絡理論與控制理論兩者有機地結合起來.人工神經(jīng)網(wǎng)絡控制的實現(xiàn)主要是把神經(jīng)網(wǎng)絡作為控制系統(tǒng)結構中的辨識器或者主控器用于對數(shù)學模型不確定的控制系統(tǒng).

      多層感知器(Multi-Layer Perceptron,MLP)神經(jīng)網(wǎng)絡對非線性系統(tǒng)具有良好的直接控制性能.對于某些非線性動態(tài)系統(tǒng)的控制,采用神經(jīng)網(wǎng)絡控制器是有益的.彭濟根等[44]在關節(jié)柔性較弱的情況下,對柔性關節(jié)機器人操作手的軌跡跟蹤問題提出了一種基于奇異攝動理論的機器人神經(jīng)網(wǎng)絡控制設計方法,結果表明,基于奇異攝動理論的神經(jīng)網(wǎng)絡控制算法能夠有效地克服參數(shù)未知、模型未知等不確定因素,使得跟蹤誤差可以任意地小,如此,柔性機械手便可以減少控制誤差,使其控制更加準確.但該控制算法存在一種“微分爆炸”的現(xiàn)象.對于這一現(xiàn)象,劉金琨等[45]針對柔性關節(jié)機器人系統(tǒng),提出了一種自適應神經(jīng)網(wǎng)絡動態(tài)面控制,在神經(jīng)網(wǎng)絡動態(tài)面控制的設計過程中,仿照反演控制的“遞進式”設計方法,控制器設計分為4步,分別定義了4個誤差表面,其中,第4誤差面的輸出作為控制器的輸入,實現(xiàn)控制效果,而第3個誤差面到第4個誤差面的過程中使用低通濾波,其作用是在克服“微分爆炸”的同時克服外界干擾,第2個誤差面是為第3個誤差面提供經(jīng)神經(jīng)網(wǎng)絡逼近后的狀態(tài)輸入,第1個誤差面為第2個誤差面提供帶有一階低通濾波的輸入,作用是克服“微分爆炸”.

      Si=xi-xid,i=1,2,3,4,

      (16)

      一般來說,神經(jīng)網(wǎng)絡控制中,不管是MLP網(wǎng)絡還是徑向基函數(shù)(Radial Basis Function,RBF)網(wǎng)絡,其作用都是用來逼近計算,而RBF網(wǎng)絡是近幾年應用較多的網(wǎng)絡,它是一種高效的前饋式網(wǎng)絡,具有其他網(wǎng)絡所不具有的最佳逼近性能和全局最優(yōu)特性,而且結構簡單、訓練速度快.2017年,Wang等[46]針對柔性并聯(lián)機器人參數(shù)的不確定性,采用RBF神經(jīng)網(wǎng)絡進行逼近計算,結合李雅普諾夫穩(wěn)定性理論,分析了系統(tǒng)的穩(wěn)定性,并且設計了控制律減小近似誤差,柔性并聯(lián)機器人運行良好,驗證了方法的可行性和可靠性.2019年,Kim等[47]提出了一種神經(jīng)網(wǎng)絡動態(tài)表面控制算法用于柔性機器人的軌跡跟蹤,相對于神經(jīng)網(wǎng)絡控制,結合了動態(tài)面的神經(jīng)網(wǎng)絡可消除微分項的膨脹,使控制器和參數(shù)設計簡單,還能減少用于建模的神經(jīng)網(wǎng)絡及模糊系統(tǒng)輸入變量的數(shù)目.

      近年的深度學習(Deep Learning,DL)和強化學習(Reinforcement Learning,RL)不僅在人工智能領域是個熱門,而且結合控制算法也將是全新的研究方向.在控制工程領域,強化學習是傳統(tǒng)控制理論與自適應控制算法之間的橋梁.強化學習的基本思想是:智能體可以通過學習來解決不同的行為,而學習的結果對于特定的情形是最優(yōu)的.由于RL是一種端到端的學習方法,不需要知道機器人的模型,因此控制算法的設計者可以節(jié)省大量的工作,只需要提供反饋形式的獎勵函數(shù)即可.

      為了驗證強化學習可以解決SMA模型的柔性機器人位置控制問題,Liu等[35]提出了一種柔性機器人位置控制深度確定性策略梯度算法(Soft robot Position Control based on Deep Deterministic Policy Gradient,SPC-DDPG),應用在SMA驅動的柔性機器人中,將RL控制算法運用到SMA位置控制(圖13)中,在RL控制問題上,使用了Q函數(shù)來表示獎勵和期望值.Q函數(shù)的作用是通過智能體與環(huán)境之間的反饋進行學習并強化學習,Q函數(shù)使SMA機器人根據(jù)實時情況做出動態(tài)規(guī)劃,Q函數(shù)表示如下:

      圖13 形狀記憶合金扭轉示意圖[35]Fig.13 Torsional diagram of SMA[35]

      (17)

      SPC-DDPG算法是一種可行的控制算法,根據(jù)目標達成任務,設計獎勵函數(shù),該算法在不同的學習參數(shù)下都能很好地完成任務.

      強化學習與控制算法的交叉融合逐漸發(fā)展成為一種新的風向標.Subudhi等[48]對在NIT Rourkela電氣部門工業(yè)電子與機器人中心使用的quanser雙連桿柔性機械手進行了仿真研究,結果顯示,基于強化學習的直接自適應控制,其誤差小于0.01%,遠優(yōu)于仿真結果顯示的固定增益最優(yōu)控制.盡管所采用的解耦模型減小了葉頂質量對整個系統(tǒng)的影響,與其他自適應控制相比,該自適應控制不依賴于系統(tǒng)動力學,計算復雜度較低,但是基于強化學習的控制算法不能進行機器人移動過程中的點穩(wěn)定運動控制,限制了人工智能控制算法在運動控制中的應用.

      為了解決點穩(wěn)定的運動控制問題,2019年,Gao等[49]將深度強化學習應用到機器人點穩(wěn)定的運動控制,他們建立了兩個深度神經(jīng)網(wǎng)絡,并且復制為目標網(wǎng)絡,分別由策略網(wǎng)絡和值網(wǎng)絡組成,當機器人的點穩(wěn)定訓練完成后,目標網(wǎng)絡中的策略網(wǎng)絡參數(shù)和值網(wǎng)絡參數(shù)會分別隨著實時網(wǎng)絡中的策略網(wǎng)絡參數(shù)和值網(wǎng)絡參數(shù)進行更新.Gao等[49]提出的一種新的基于深度確定性策略梯度算法的點穩(wěn)定控制律,使移動機器人能夠通過移動機器人與環(huán)境的信息流成功地學習機器人的運動控制規(guī)律,該方法提供了一種新的運動控制方法.

      手術機器人固有的非線性和模型的不確定性,使得柔性手術機器人的運動控制變得具有挑戰(zhàn)性.針對這一問題,Chen等[50]提出了一種將演示編程與強化學習相結合的混合框架,采用高斯混合模型從人體模型中學習機械手的逆運動學模型,而強化學習通過實時最大化獎勵函數(shù)來解決不確定環(huán)境下的最優(yōu)決策,結合強化學習算法計算獎勵函數(shù),從而更新模型.設計過程中,采用基于E-M的強化學習算法,同時使用IK模型作為標準模型來計算柔性手術機器人機械手的輸出軌跡.實驗結果表明,結合了基于E-M強化學習的標準模型,可以解決非線性和模型不確定性的問題,而且對機械手的運動控制性能良好,所以強化學習是解決機器人軌跡控制問題的一種智能方法.人工智能算法用于機器人控制不僅可以解決模型不確定性的軌跡運動控制,而且從圖像的角度來說,同樣可以訓練機器人的運動學習和高維狀態(tài)動作空間中的位置控制問題.

      Wu等[51]讓一個機器人執(zhí)行一次任務運動來獲取電機和圖像數(shù)據(jù),然后使用卷積自動編碼器從原始圖像數(shù)據(jù)中提取圖像特征,圖像特征提取模塊采用了卷積自動編碼器(Convolutional Auto-Encoder,CAE),其結構如圖14所示.將提取的圖像特征與運動數(shù)據(jù)相結合,訓練遞歸神經(jīng)網(wǎng)絡 (Recurrent Neural Network,RNN),通過對圖像數(shù)據(jù)的深度學習來進行運動學習(圖15),使得機器人能夠獲取環(huán)境信息,并利用自身被動適應的優(yōu)勢來完成需要考慮環(huán)境變化的任務.

      圖14 CAE結構[51]Fig.14 Structure of CAE[51]

      圖15 利用圖像數(shù)據(jù)的運動學習系統(tǒng)[51]Fig.15 Motor learning system[51]

      隨著人工智能算法的發(fā)展,將其應用到控制算法中是一個新興而熱門的研究方向.機器人的設計思路是,先物理建模然后對模型設計控制算法,而具有智能算法的控制器將大大提高機器人的控制精度和工作效率.

      5 總結與展望

      本文首先介紹了國內外剛柔耦合機器人的研究現(xiàn)狀和研究成果;其次根據(jù)機器人的驅動器類型,分別介紹了氣動、電活性聚合物、形狀記憶合金等驅動方式在剛柔耦合機器人上的應用;然后著重對機器人的控制方法進行了綜述,從簡單的PID控制到模糊控制再到滑模控制最后到神經(jīng)網(wǎng)絡控制,并重點介紹深度學習和強化學習在控制算法中的應用.

      目前,傳統(tǒng)的剛性機器人和柔性機器人是較為普遍的,而由剛性部件和柔性部件結合而成的剛柔耦合機器人則是一個新的研究方向,其包括兩個主要研究內容:

      1)剛柔耦合機器人的建模問題.剛性機器人結構固定,通過D-H模型和齊次變換可以建立各關節(jié)變量和機器人末端的運動學模型.雖然軟體機器人通過模型可以建立其構型空間和操作空間的轉換關系,但是因其本體的變形是非線性的,各驅動變量之間又相互耦合,建立驅動空間和構型空間的關系十分困難.柔性部件的逆運動學問題很難找到解析解,只能通過數(shù)值分析和非線性優(yōu)化來求解,這對軟體機器人的控制提出了更高的要求.

      2)人工智能結合控制算法的問題.近年來,隨著人工智能技術的發(fā)展,人工智能中的網(wǎng)絡架構結合控制算法將會是一個在控制算法領域中的突破,傳統(tǒng)的MLP網(wǎng)絡、BP網(wǎng)絡、RBF網(wǎng)絡都已應用到神經(jīng)網(wǎng)絡控制中.深度學習和強化學習不僅在人工智能領域是個熱門,而且結合控制算法也將是一個重要的研究方向.目前國內外將人工智能算法在機器剛柔耦合問題上的應用研究沒有得到很好的發(fā)展,因此這將是一個新的研究熱點.

      猜你喜歡
      記憶合金軟體驅動器
      蚯蚓軟體機器人來到火星變身“農(nóng)夫”
      軍事文摘(2024年4期)2024-01-09 09:07:58
      晶格型模塊化軟體機器人自重構序列
      會捉蒼蠅的高速軟體機器人問世
      軍事文摘(2020年24期)2020-11-29 06:35:54
      藏起驅動器號確保數(shù)據(jù)安全
      電腦愛好者(2020年6期)2020-05-26 09:27:33
      形狀記憶合金及其研究進展綜述
      走進記憶合金
      壓電陶瓷驅動器的遲滯特性
      SiC基和Si基永磁同步電動機驅動器的比較
      基于形狀記憶合金的結構裂縫自修復研究
      鎳鈦記憶合金環(huán)抱器內固定術后聯(lián)合中藥治療鎖骨骨折59例
      秦安县| 华容县| 潞城市| 保靖县| 鸡西市| 建阳市| 宣汉县| 南澳县| 惠东县| 分宜县| 蒙山县| 前郭尔| 锡林郭勒盟| 新蔡县| 巴青县| 南部县| 象州县| 安龙县| 昆明市| 琼海市| 庆安县| 浦东新区| 涟水县| 凌源市| 寻甸| 林周县| 全南县| 佳木斯市| 峨边| 获嘉县| 金门县| 凤城市| 石柱| 丰宁| 宜城市| 梁山县| 余姚市| 独山县| 宁海县| 兴文县| 壶关县|