盧承華, 朱明超,王 棟, 吳清文
(1.中國(guó)科學(xué)院長(zhǎng)春光學(xué)精密機(jī)械與物理研究所,吉林 長(zhǎng)春 130033;2.中國(guó)科學(xué)院大學(xué),北京 100049;3.長(zhǎng)光衛(wèi)星技術(shù)有限公司,吉林 長(zhǎng)春 130033)
如今,機(jī)械臂被廣泛應(yīng)用到去毛刺、焊接、打磨等工業(yè)自動(dòng)化加工等領(lǐng)域,這些工作要求機(jī)械臂末端與環(huán)境接觸并對(duì)接觸面進(jìn)行跟蹤與預(yù)測(cè),且需要同時(shí)控制機(jī)械臂末端的位置與力信息[1-2]。針對(duì)機(jī)械臂末端力與位置的智能控制問題,國(guó)內(nèi)外學(xué)者已經(jīng)開展了很多研究。
力/位混合控制[3]、阻抗控制[4]是兩種主要的柔順控制方式。其中,力/位混合控制在控制過程中需要預(yù)先對(duì)力矩陣或位置矩陣進(jìn)行選擇,即控制過程中需要對(duì)力、位置控制模式來回切換,不能同時(shí)對(duì)二者進(jìn)行控制,這一缺點(diǎn)大大影響了機(jī)器人控制的柔順性[4-5]。而阻抗控制避開這一缺點(diǎn),成為一種性能優(yōu)良的控制算法。自1985年Hogan提出阻抗控制概念以來,該算法便受到了極大的關(guān)注并應(yīng)用到了機(jī)器人控制的各個(gè)領(lǐng)域[6]。Lasky與 Hsia首次將阻抗控制應(yīng)用到力跟蹤問題,他們將機(jī)械臂與環(huán)境接觸的模型等效為虛擬的質(zhì)量-彈簧-阻尼系統(tǒng),巧妙地簡(jiǎn)化了控制過程[7]。
阻抗控制與自適應(yīng)控制以及學(xué)習(xí)算法的結(jié)合也成為了國(guó)內(nèi)外學(xué)者研究的熱點(diǎn)。Seul使用自適應(yīng)控制對(duì)阻尼系數(shù)進(jìn)行優(yōu)化[8],Liu、段晉軍等人對(duì)剛度系數(shù)進(jìn)行優(yōu)化[8-11],但自適應(yīng)過程并未顯示優(yōu)化后的阻抗系數(shù)。Abdelhamid提出了四種可用于機(jī)器人的迭代學(xué)習(xí)控制方法[12],李琳、Liang等人將迭代學(xué)習(xí)應(yīng)用到了曲面跟蹤[13-15],并對(duì)末端軌跡偏移量進(jìn)行迭代學(xué)習(xí),但該算法需要經(jīng)歷較多的迭代次數(shù)才可達(dá)到理想效果。Li、Ge用基于線性二次調(diào)節(jié)的強(qiáng)化學(xué)習(xí)阻抗控制算法權(quán)衡并減小力與位置誤差[16-17],Loris利用強(qiáng)化學(xué)習(xí)與迭代學(xué)習(xí)步長(zhǎng)摩擦力并進(jìn)行了阻抗力控制[15],張鐵利用強(qiáng)化學(xué)習(xí)優(yōu)化了力誤差系數(shù)[18],但強(qiáng)化學(xué)習(xí)具有較高的計(jì)算復(fù)雜度。
為提升學(xué)習(xí)效率并簡(jiǎn)化學(xué)習(xí)過程,本文提出了一種基于梯度迭代的阻抗控制算法,適用于未知曲面的跟蹤過程,可以處理環(huán)境參數(shù)和機(jī)器人動(dòng)力學(xué)的不確定性。通過優(yōu)化機(jī)械臂阻抗模型的等效阻尼系數(shù),減小了跟蹤過程中力誤差與位置誤差,能夠在誤差允許范圍內(nèi)尋找到最優(yōu)的阻尼系數(shù)且使系統(tǒng)趨于穩(wěn)定。仿真結(jié)果證明,該算法具有較高的效率和較高的精度,具有可行性和正確性。
(1)
式中M是質(zhì)量矩陣,B是阻尼矩陣,K是剛度矩陣,ΔF(t)為實(shí)際接觸力F與期望接觸力Fd之差。該模型的傳遞函數(shù)為
(2)
不失一般性,以一維空間舉例,只考慮一維空間的機(jī)器人末端與曲面接觸模型為
(3)
圖1 機(jī)器人末端與環(huán)境接觸模型
其中e=xc-xr。Δf可分解為
Δf=f-fd
=ke(xe-xc)-fd
=kexe-kexc-fd
=kexe-ke(xr+k(s)Δf)-fd
(4)
將一維空間的傳遞函數(shù)代入得
Δf(ms2+bs+k+ke)
=(ms2+bs+k)[ke(xe-xr)-fd]
(5)
由此可得穩(wěn)態(tài)力跟蹤誤差
(6)
為使(5)式收斂于0,需對(duì)fd進(jìn)行討論:
若fd=0,存在xr=xe,必然使Δfss=0,因此穩(wěn)態(tài)力跟蹤誤差收斂于0。
同時(shí),在傳統(tǒng)載體基礎(chǔ)上,豐富教育手段。構(gòu)建一個(gè)或多個(gè)具有代表性的師生交流平臺(tái),培養(yǎng)一批少數(shù)民族學(xué)生意見領(lǐng)袖,充分利用互聯(lián)網(wǎng)渠道下的自媒體平臺(tái),擴(kuò)大意識(shí)培育宣傳覆蓋面。高校民族團(tuán)結(jié)進(jìn)步教育不止是在寢室民族團(tuán)結(jié)、主題班會(huì)等顯性教育上做文章,同時(shí)需將教育根植于文化理念中,在校園學(xué)習(xí)和生活中內(nèi)涵式的表達(dá)、浸潤(rùn)式的教育,潛移默化地影響學(xué)生。通過榜樣示范、民族文化展示等途徑激勵(lì)大學(xué)生自覺培養(yǎng)民族團(tuán)結(jié)精神和愛國(guó)主義精神。
若fd≠0,ke(xe-xr)-fd≠0,因此想要使穩(wěn)態(tài)誤差收斂于0,須置k=0,由此機(jī)器人末端與曲面接觸模型可簡(jiǎn)化為
(7)
其中e=xc-xr。由于環(huán)境參數(shù)未知,很難獲得精確的參考軌跡,因此以環(huán)境位置xe取代參考軌跡xr,則阻抗控制模型為
(8)
其中
=ke(xc-xe)-fd
=-kee-fd
(9)
即
(10)
未知曲面跟蹤與預(yù)測(cè)任務(wù)要求機(jī)器人及環(huán)境接觸的力盡量小,同時(shí)盡量貼合環(huán)境位置,因此曲面跟蹤與預(yù)測(cè)效果的好壞與力誤差和位置誤差有關(guān)。定義ef為實(shí)際接觸力f與期望力fd的差,ex為機(jī)器人末端實(shí)際位置xc與環(huán)境位置xe的差,即
(11)
在此,定義損耗函數(shù)Γ作為曲面跟蹤與預(yù)測(cè)效果的度量,即
(12)
其中,γ1和γ2是力誤差與位置誤差的權(quán)重系數(shù)。若機(jī)器人任務(wù)為純力跟蹤,可設(shè)γ2=0或γ1?γ2,反之同理。
圖2 控制結(jié)構(gòu)
在前一節(jié)式(7)已經(jīng)推導(dǎo)得出簡(jiǎn)化后的阻抗控制模型。由于質(zhì)量矩陣m的改變會(huì)導(dǎo)致系統(tǒng)不穩(wěn)定,因此一般將m設(shè)為定值[19],如下式
(13)
通過優(yōu)化阻尼系數(shù)b,可以達(dá)到曲面跟蹤與預(yù)測(cè)的良好效果。
本文使用基于梯度迭代的學(xué)習(xí)方法優(yōu)化阻尼系數(shù)。其優(yōu)化策略如下
bk=bk-1+α?Γbk-1
(14)
(15)
由式(8)、(9)和式(12)知
(16)
因此式(14)可以轉(zhuǎn)化為與誤差相關(guān)的函數(shù)
(17)
圖3 阻抗系數(shù)優(yōu)化流程
為驗(yàn)證所提方法的有效性,使用Matlab Simulink模塊以二自由度機(jī)械臂跟蹤未知曲面進(jìn)行仿真。曲面跟蹤任務(wù)為:在保證機(jī)器人末端與曲面有接觸的情況下,對(duì)曲面輪廓進(jìn)行檢測(cè)。
曲面跟蹤輪廓為圓心在(1m,1m)處、半徑0.2m的圓形二維曲面,曲面剛度系數(shù)為,但機(jī)器人對(duì)曲面信息未知,機(jī)器人末端運(yùn)動(dòng)的初始位置位于(0.8m,1.0m)處,采樣時(shí)間0.001s。
為防止機(jī)器人的質(zhì)量矩陣變化給系統(tǒng)帶來的不穩(wěn)定性,將質(zhì)量矩陣設(shè)為定值。阻尼系數(shù)的學(xué)習(xí)采用梯度上升策略,初始值為0,學(xué)習(xí)速度因子 設(shè)為10,損耗函數(shù) 中力誤差與位置誤差的權(quán)重系數(shù) 、 分別設(shè)置為2.5、7.5,這表明在此次仿真中,更看重軌跡跟蹤的效果,但學(xué)習(xí)速度因子和權(quán)重系數(shù)可以依據(jù)操作任務(wù)需求調(diào)整。理想情況下,對(duì)于曲面檢測(cè),應(yīng)將理想跟蹤力設(shè)為0,但為保證機(jī)器人與曲面接觸,將理想跟蹤力設(shè)為 N。將目標(biāo)理想跟蹤力誤差定為0.01N,目標(biāo)理想跟蹤位置誤差為3mm,當(dāng)實(shí)際跟蹤力和跟蹤位置誤差同時(shí)達(dá)到跟蹤誤差精度時(shí),迭代停止。
經(jīng)過10次迭代后,曲面跟蹤的效果較理想。機(jī)器人在與曲面接觸前期,接觸力波動(dòng)較大,后期波動(dòng)較??;隨著迭代次數(shù)的增加,接觸前期波動(dòng)幅度減小,后期逐漸接近理想跟蹤力設(shè)定值,其中第10次迭代得到的實(shí)際接觸力為0.0497N,與理想跟蹤力的誤差小于0.01N,如圖4。迭代前期,跟蹤軌跡與理想軌跡存在一定差距,經(jīng)過10次迭代后,機(jī)器人末端已經(jīng)可以較完美地跟蹤曲面軌跡,其中x方向的跟蹤效果逼近過程如圖5,首次與末次的二維跟蹤效果如圖6。
圖4 機(jī)器人與曲面力跟蹤迭代效果
圖5 機(jī)器人與曲面跟蹤X方向位置迭代過程
圖6 機(jī)器人與曲面軌跡跟蹤迭代效果
作為曲面跟蹤效果的度量,損耗函數(shù)顯示了迭代后的曲面跟蹤的結(jié)果,如圖7。由于損耗函數(shù)是與力跟蹤誤差、位置跟蹤誤差相關(guān)的函數(shù),因此其呈現(xiàn)的變化趨勢(shì)與圖4和圖5相似,但由于誤差只可減小并不可消除,因此損耗函數(shù)始終為正,但跟蹤效果顯示,經(jīng)過10次迭代,損耗函數(shù)呈現(xiàn)收斂趨勢(shì),在第10次迭代過程中已經(jīng)趨近于0。每次迭代過程中的最大位置跟蹤誤差是跟蹤效果穩(wěn)定性的評(píng)價(jià)標(biāo)準(zhǔn),圖5顯示了10次迭代過程中的最大位置誤差與描述最大位置誤差變化趨勢(shì)的最大誤差導(dǎo)數(shù),由圖可見,二者都呈現(xiàn)收斂趨勢(shì),可見該算法穩(wěn)定性良好。
圖7 損耗函數(shù)變化
圖8 最大位置誤差
在迭代過程中,阻尼系數(shù)由初始值0開始尋優(yōu),經(jīng)過10次迭代后,滿足了力跟蹤誤差和位置跟蹤誤差,且能夠在0.5s時(shí)間內(nèi)迅速響應(yīng)接近最優(yōu)阻抗系數(shù),如圖7。此時(shí)最優(yōu)的阻尼系數(shù)約為[24,0;0,24]。
圖9 第10次迭代過程中的阻尼系數(shù)
本文提出一種基于梯度迭代的阻抗控制算法,適用于機(jī)器人對(duì)未知環(huán)境的曲面跟蹤。對(duì)機(jī)器人末端執(zhí)行器與曲面接觸建立阻尼系數(shù)可變的新型阻抗控制模型,使用梯度上升迭代算法對(duì)阻尼系數(shù)進(jìn)行優(yōu)化,能夠在短時(shí)間內(nèi)迅速響應(yīng)至最優(yōu)阻尼系數(shù)。設(shè)置與力誤差、位置誤差相關(guān)的損耗函數(shù)作為跟蹤效果的度量。仿真結(jié)果證明,該算法能夠在10次迭代后達(dá)到理想的控制精度,具有較高的迭代穩(wěn)定性,能夠達(dá)到良好的曲面跟蹤效果,具有廣闊的應(yīng)用前景。