羅天洪,馬翔宇,劉 淼,徐向陽(yáng),陳 才
(重慶交通大學(xué) 機(jī)電與車輛工程學(xué)院,重慶 400074)
近年來,神經(jīng)網(wǎng)絡(luò)在機(jī)器人控制中得到廣泛的應(yīng)用。神經(jīng)網(wǎng)絡(luò)能夠通過在線或離線學(xué)習(xí),補(bǔ)償系統(tǒng)非線性和不確定性的影響,不斷改善系統(tǒng)的控制性能[1-3],其自適應(yīng)控制特點(diǎn)在模糊控制及故障診斷中也起到了一定的作用[4-5]。文獻(xiàn)[6]提出了穩(wěn)定的機(jī)械手神經(jīng)網(wǎng)絡(luò)控制方法;Sun[7-8]等將機(jī)械手神經(jīng)網(wǎng)絡(luò)控制推廣到了離散時(shí)間;文獻(xiàn)[9]針對(duì)機(jī)械手系統(tǒng)的軌跡跟蹤控制,提出一種帶有前饋和神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)臋C(jī)械手控制策略;文獻(xiàn)[10]提出一種帶有神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)臋C(jī)械手比例微分(Proportion-Derivative,PD)控制策略,解決了機(jī)械手工業(yè)應(yīng)用中常規(guī)的控制策略在處理機(jī)械手耦合和非線性特性時(shí)控制效果差的問題。近年來,高性能控制器的發(fā)展使神經(jīng)網(wǎng)絡(luò)在工業(yè)上的應(yīng)用成為可能。因此,有必要研究神經(jīng)網(wǎng)絡(luò)在機(jī)械手中的應(yīng)用,尤其是重載精密等特種工作場(chǎng)合。
文獻(xiàn)[11]采用帶修正項(xiàng)的神經(jīng)權(quán)值更新律和魯棒控制,為機(jī)器人設(shè)計(jì)了一個(gè)多層神經(jīng)網(wǎng)絡(luò)控制器,獲得了良好的控制性能;文獻(xiàn)[12]為水下機(jī)器人設(shè)計(jì)了自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器,證明控制系統(tǒng)的跟蹤誤差一致穩(wěn)定有界;文獻(xiàn)[13]為空間機(jī)器人設(shè)計(jì)了滑模神經(jīng)網(wǎng)絡(luò)控制器,實(shí)現(xiàn)了跟蹤誤差最終一致有界;文獻(xiàn)[14]針對(duì)考慮執(zhí)行器動(dòng)態(tài)的機(jī)械臂,提出魯棒神經(jīng)模糊網(wǎng)絡(luò)控制(Robust Neural Fuzzy Network Control,RNFNC)方案應(yīng)用于復(fù)雜的機(jī)器人系統(tǒng),獲得了良好的跟蹤性能;文獻(xiàn)[15]設(shè)計(jì)的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器不但實(shí)現(xiàn)了閉環(huán)系統(tǒng)所有信號(hào)的最終一致有界,而且在穩(wěn)定的控制過程中實(shí)現(xiàn)了部分神經(jīng)網(wǎng)絡(luò)權(quán)值收斂到最優(yōu)值,以及未知閉環(huán)系統(tǒng)動(dòng)態(tài)的局部準(zhǔn)確逼近。以上自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制方案均基于神經(jīng)網(wǎng)絡(luò)的通用逼近性展開,對(duì)神經(jīng)網(wǎng)絡(luò)是否真的逼近機(jī)器人系統(tǒng)的未知非線性并沒有進(jìn)行深入探討。鑒于神經(jīng)元之間的非線性特點(diǎn),本文利用神經(jīng)元的時(shí)空整合特點(diǎn),提出一種基于神經(jīng)元時(shí)空整合能力(Temporal Integration Capability,TIC)的重載精密機(jī)械手傳遞模式,針對(duì)機(jī)械手的速度、位移、角度的傳遞進(jìn)行展開,對(duì)于不同時(shí)間通過同一突觸傳入的信息具有時(shí)間整合功能,對(duì)于同一時(shí)間通過不同突觸傳入的信息具有空間整合功能。采用神經(jīng)元之間的聯(lián)系方式(輻散式、聚合式等神經(jīng)元)對(duì)神經(jīng)元接觸的信息進(jìn)行整合處理,類似于將機(jī)械手各關(guān)節(jié)處傳感器搜集的信息進(jìn)行整合處理,然后將整合結(jié)果分散到各個(gè)關(guān)節(jié)處,以對(duì)機(jī)械手的實(shí)際與理論之間的偏差進(jìn)行補(bǔ)償。
神經(jīng)元以細(xì)胞體為主體,有許多向周圍延伸的不規(guī)則樹枝狀纖維構(gòu)成的神經(jīng)細(xì)胞,其形狀像一棵枯樹的枝干,主要由細(xì)胞體、樹突、軸突和突觸(又稱神經(jīng)鍵)組成(如圖1)。樹突是樹狀的神經(jīng)纖維接收網(wǎng)絡(luò),它將電信號(hào)傳送到細(xì)胞體;細(xì)胞體對(duì)這些輸入信號(hào)進(jìn)行整合及閾值處理;軸突是單根長(zhǎng)纖維,它將細(xì)胞體的輸出信號(hào)導(dǎo)向其他神經(jīng)元傳遞信息的過程為多輸入、單輸出。神經(jīng)元對(duì)不同時(shí)間通過同一突觸傳入的神經(jīng)沖動(dòng)(激勵(lì))具有時(shí)間整合功能,對(duì)同一時(shí)間通過不同突觸傳入的神經(jīng)沖動(dòng)具有空間整合功能。
空間整合功能可以等效為機(jī)械手的不同關(guān)節(jié)或不同傳感器反饋的信息,控制系統(tǒng)將所收集的信息進(jìn)行整合處理,調(diào)整相關(guān)參數(shù),使傳遞的參數(shù)信息可對(duì)已達(dá)到的位姿要求進(jìn)行補(bǔ)償,以達(dá)到要求的位姿精度。神經(jīng)元模型如圖2所示。
圖中:∑表示求和;θj為閾值;{x1,x2,…,xn}為輸入,即其他神經(jīng)元的軸突輸出;n為輸入數(shù)目;{wj1,wj2,…,wjn}為其他n個(gè)神經(jīng)元與神經(jīng)元j的突觸連接強(qiáng)度,通常稱為權(quán)重,{wji}可正可負(fù),表示為興奮型突觸和抑制型突觸;f(·)通常為一非線性函數(shù),稱為神經(jīng)的激活函數(shù)或轉(zhuǎn)移函數(shù);sj為神經(jīng)元的求和輸出,常稱為神經(jīng)元的激活水平;yj為輸出。
機(jī)械手末端的速度與載荷的不同組合對(duì)機(jī)械手的位置精度存在一定影響,而且末端的速度和加速度對(duì)機(jī)械手的位置精度也有顯著的影響。為提高機(jī)械手的定位精度,常采用閉環(huán)控制方法,對(duì)機(jī)械手的輸入指令進(jìn)行補(bǔ)償修改。該方法與人體機(jī)能學(xué)中的神經(jīng)元控制原理一樣,神經(jīng)元包括細(xì)胞體、突起兩部分,突起又分為樹突和軸突,樹突接受外界刺激,并將刺激信號(hào)傳遞給細(xì)胞體;細(xì)胞體對(duì)信號(hào)進(jìn)行分析、綜合或存儲(chǔ),最終由軸突完成對(duì)刺激信號(hào)的反應(yīng)。神經(jīng)元按照其在反射弧中所處地位的不同,分為傳入神經(jīng)元、中間神經(jīng)元、傳出神經(jīng)元三種,它們之間的關(guān)系如圖3所示。
通常一個(gè)生物神經(jīng)元不只有一個(gè)輸入,具有n個(gè)輸入的神經(jīng)元如圖4所示。從圖4中可以看出,每一個(gè)標(biāo)量輸入x0i(i=1,2,…,n)經(jīng)過預(yù)處理函數(shù)單元I后,得到的輸出為
標(biāo)有a的方框是輸入函數(shù)(或激活函數(shù)),其輸入輸出關(guān)系為
式中:輸入函數(shù)a可以是任意的函數(shù);w為權(quán)向量;θ為閾值。凈輸入x1被送入一個(gè)變換函數(shù)(或傳輸函數(shù))f,在f中產(chǎn)生神經(jīng)元的標(biāo)量輸出y1。
根據(jù)上述神經(jīng)元的結(jié)構(gòu)特點(diǎn),結(jié)合機(jī)械手的精度誤差補(bǔ)償,求解相似的機(jī)械手結(jié)構(gòu)圖,如圖5 所示。圖中多輸入單輸出樣條函數(shù)
式中:zj為機(jī)械手一個(gè)關(guān)節(jié)的輸出,sj(xj)為自變量xj(即單個(gè)關(guān)節(jié)的輸入角度、角速度)的函數(shù)。圖6中的凈輸入有n個(gè)變量,因此有:
式中zs表示最終關(guān)節(jié)整體的輸出部分。
神經(jīng)元之間的聯(lián)系主要有聚合式、輻散式、環(huán)式、連鎖式幾種。其中:聚合式為許多神經(jīng)元通過其軸突末梢,共同與同一個(gè)神經(jīng)元建立突觸聯(lián)系,從而發(fā)生總和或整合作用(如圖6);輻散式為一個(gè)神經(jīng)元的軸突末梢分支與多個(gè)神經(jīng)元建立突觸聯(lián)系,從而使與其聯(lián)系的許多神經(jīng)元同時(shí)興奮或抑制(如圖7)。圖6和圖7中:1~4分別表示關(guān)節(jié)處不同的傳感器(對(duì)應(yīng)于神經(jīng)元的樹突),7表示對(duì)傳感器(細(xì)胞體)的信息進(jìn)行整合處理,8~11表示細(xì)胞體(控制系統(tǒng))整理后輸出的各關(guān)節(jié)的速度和角速度。
式(7)和式(8)分別表示聚合神經(jīng)元與輻散神經(jīng)元所對(duì)應(yīng)的數(shù)學(xué)模型,其中:f(x1),f(x2),f(x3)和f(x4)分別表示關(guān)節(jié)處檢測(cè)的數(shù)據(jù)信息;f(x1,x2,x3,x4)表示對(duì)各傳感器的信息綜合;f(x8),f(x9),f(x11)和f(x12)分別表示輸出的各關(guān)節(jié)速度、角速度。
神經(jīng)元之間的輻散式和聚合式結(jié)構(gòu)形式與機(jī)械手實(shí)現(xiàn)精密運(yùn)動(dòng)所需的各部件之間的聯(lián)系基本一致。鑒于此原理,本文求解了基于神經(jīng)元TIC 的重載精密機(jī)械手傳遞模式,如圖8 所示。圖中:1~4分別表示傳感器檢測(cè)的速度、加速度、位置、位姿;5~8分別表示控制系統(tǒng)整合處理后的速度、加速度、位置、位姿等信號(hào)。傳遞模式主要由輸入、控制系統(tǒng)、輸出三部分組成;輸入部分等同于神經(jīng)元中的傳入神經(jīng),由傳感器檢測(cè)時(shí)間上的速度、加速度和空間上的位置、位姿;控制系統(tǒng)等同于神經(jīng)元的中間神經(jīng)元,主要用來整合傳感器檢測(cè)的時(shí)間和空間信息;輸出部分等同于神經(jīng)元的傳出神經(jīng),用來將控制系統(tǒng)(中間神經(jīng)元)整合的速度、加速度、位置、位姿等信號(hào)傳遞到機(jī)械手末端的執(zhí)行機(jī)構(gòu)。
基于神經(jīng)元模型傳遞模式的數(shù)學(xué)模型為:
式中xi和xj分別表示各個(gè)關(guān)節(jié)在神經(jīng)元作用前后的輸出。
由機(jī)械手正向運(yùn)動(dòng)學(xué)指數(shù)積(Product of Exponentialm,POE)公式得
由慣性坐標(biāo)系{A}中描述的廣義剛體速度,得旋量坐標(biāo)形式為
因此,基于POE公式的機(jī)械手瞬時(shí)空間速度為
式中:{S}和{T}分別表示慣性坐標(biāo)系和工具坐標(biāo)系;gST:Q→SE(3)表示串聯(lián)機(jī)器人正向運(yùn)動(dòng)學(xué)的映射,其中關(guān)節(jié)的位形空間θ(t)∈Q,末端執(zhí)行器的位形空間gST(θ(t))∈SE(3)。
將式(9)和式(10)映射到式(13),分別得到基于神經(jīng)元模型機(jī)械手傳遞模式的數(shù)學(xué)模型:
式中Δ˙θ和θ分別表示各個(gè)傳感器時(shí)空整合后對(duì)各個(gè)關(guān)節(jié)的補(bǔ)償值。
為驗(yàn)證上述傳遞方式的合理性,本文采用6自由度、負(fù)載為50kg的重載機(jī)械手作為研究模型(如圖9),對(duì)其進(jìn)行簡(jiǎn)化處理后(如圖10)求解機(jī)械手末端的雅可比矩陣,得出各關(guān)節(jié)角速度對(duì)末端速度的影響因子,為定性分析關(guān)節(jié)角速度對(duì)終端速度的影響程度,只考慮一個(gè)關(guān)節(jié)角速度對(duì)終端速度的影響,分別計(jì)算關(guān)節(jié)3的誤差前后對(duì)終端速度的影響,利用神經(jīng)元模型對(duì)其精度進(jìn)行補(bǔ)償,以達(dá)到減小誤差的結(jié)果。
圖10中:數(shù)字1~6分別表示6個(gè)旋轉(zhuǎn)自由度,4和5表示俯仰及左右擺動(dòng)自由度,X1,X2和X3分別表示桿件長(zhǎng)度,當(dāng)前位形下各個(gè)關(guān)節(jié)對(duì)應(yīng)的運(yùn)動(dòng)副旋量坐標(biāo)如下:
因此,此機(jī)器人的雅可比矩陣為
因此,由式(10)得此6自由度重載機(jī)械手末端執(zhí)行器在慣性坐標(biāo)系{S}中的空間速度
根據(jù)機(jī)械手末端執(zhí)行器的瞬間空間角速度,物體速度與空間速度存在如下關(guān)系:
因此,機(jī)械手末端執(zhí)行器在x,y和z三個(gè)方向上的速度分別為:
式中:sθ1表示sinθ1,sθ1234表示sin(θ1+θ2+θ3+θ4),以此類推(下同)。
為簡(jiǎn)便地檢測(cè)基于神經(jīng)元TIC 的傳遞模式,本文對(duì)機(jī)械手末端執(zhí)行器在z軸方向的速度進(jìn)行仿真,同時(shí)只考慮vz隨著關(guān)節(jié)3 的旋轉(zhuǎn)角度θ3的變化關(guān)系,如式(20)所示。θ3~θ6等角度的變化范圍為-π/2~π/2,其他參量如下:
同理,分別考慮4~6關(guān)節(jié)在z軸方向?qū)C(jī)械手關(guān)節(jié)速度的影響,進(jìn)而綜合考慮3~6四個(gè)關(guān)節(jié)對(duì)機(jī)械手末端速度在補(bǔ)償前后的影響。
式(20)表示理論計(jì)算,式(21)表示在誤差Δθ=1rad的前提下,關(guān)節(jié)3對(duì)機(jī)械手的終端速度在z軸方向上的影響,Δθ′表示神經(jīng)元模型補(bǔ)償之后的誤差值(Δθ′=0.01rad)。本文通過角度θ3的理論值、θ3的誤差值以及θ3的時(shí)空整合值對(duì)vz的變化趨勢(shì)進(jìn)行仿真;根據(jù)式(20)對(duì)θ3進(jìn)行取值并計(jì)算相應(yīng)的vz;同理,角度θ2,θ4和θ5對(duì)機(jī)械手末端精度在z軸變化的數(shù)學(xué)模型分別為:
采用與關(guān)節(jié)3同樣的方法,得出關(guān)節(jié)2,4,5對(duì)機(jī)械手末端速度在z軸方向的影響趨勢(shì),如圖11所示。
從圖3可以看出,經(jīng)過時(shí)空整合后,機(jī)械手末端執(zhí)行器的速度與理論值幾乎接近。
為進(jìn)一步驗(yàn)證本文模型的正確性和有效性,選取文獻(xiàn)[16](如表1)進(jìn)行對(duì)比實(shí)驗(yàn)(本文只考慮關(guān)節(jié)2對(duì)機(jī)械手末端速度在z軸上這一影響因素)。
由式(23)得
從文獻(xiàn)[16]中選取0~3 000ms的數(shù)據(jù)如表1所示,基于TIC 的傳遞模式,將表1 中選取的數(shù)據(jù)進(jìn)行整合處理,反求出其對(duì)應(yīng)的關(guān)節(jié)角度,根據(jù)式(25)對(duì)關(guān)節(jié)引起的誤差進(jìn)行時(shí)空整合,計(jì)算結(jié)果如表1所示,速度變化趨勢(shì)如圖12所示。
表1 機(jī)械手末端速度在z軸的速度分量仿真數(shù)據(jù)
從圖12可以看出,經(jīng)過時(shí)空整合后,機(jī)械手末端執(zhí)行器的速度與理論值幾乎接近。
為了減小重載機(jī)械手末端速度對(duì)其位置精度的影響,本文采用基于神經(jīng)元TIC 的傳遞模式,將各個(gè)關(guān)節(jié)處時(shí)間上的速度變化在機(jī)械手空間上進(jìn)行整合,以減小關(guān)節(jié)角度、速度對(duì)機(jī)械手末端位置精度的影響。同時(shí),求解了各個(gè)關(guān)節(jié)速度、角度變化對(duì)末端速度的數(shù)學(xué)模型,并對(duì)速度在z軸的變化進(jìn)行了仿真,比較了時(shí)空整合前后的誤差。為進(jìn)一步驗(yàn)證模型的合理性和有效性,從文獻(xiàn)[16]中選取一定實(shí)驗(yàn)數(shù)據(jù)進(jìn)行仿真試驗(yàn),對(duì)TIC 的有效性進(jìn)行了證明。隨著機(jī)械手的智能發(fā)展,神經(jīng)網(wǎng)絡(luò)及細(xì)胞等生物學(xué)學(xué)科會(huì)被逐漸融入機(jī)器人學(xué)科,筆者也會(huì)在此方向繼續(xù)研究,希望將生物學(xué)等的理論應(yīng)用于機(jī)器人的動(dòng)態(tài)特性,從而實(shí)現(xiàn)機(jī)械手的智能化和自動(dòng)化。
[1]WU Yuxiang,WANG Cong.Deterministic learning based adaptive network control of robot in task space[J].Acta Automatic Sinica,2013,39(6):806-815.
[2]WU Yuxiang,WANG Cong.Adaptive neural network control and learning for uncertain robot[J].Control Theory &Applications,2013,30(8):990-997.
[3]JIA Heming,SONG Wenlong,CHEN Ziyin,et al.Path following controller for mobile robots based on neural network backstepping[J].Journal of Nanjing University of Science and Technology,2014,38(1):27-33.
[4]LIANG Jie,CHEN Li,LIANG Pin.Neural network adaptive control and vibration hierarchical fuzzy control of flexible arm space robot[J].Computer Integrated Manufacturing Systems,2012,18(9):1930-1937(in Chinese).[梁 捷,陳 力,梁 頻.柔性臂空間機(jī)器人的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制及振動(dòng)模態(tài)分級(jí)模糊控制[J].計(jì)算機(jī)集成制造系統(tǒng),2012,18(9):1930-1937.]
[5]GAO Tianrong,YU Dong,YUE Dongfeng.Probabilistic neural network based on adaptive error correction model and its application in failure diagnosis[J].Computer Integrated Man-ufacturing Systems,2013,19(11):2824-2833(in Chinese).[高甜容,于 東,岳東峰.基于自適應(yīng)誤差修正模型的概率神經(jīng)網(wǎng)絡(luò)及其在故障診斷中的應(yīng)用[J].計(jì)算機(jī)集成制造系統(tǒng),2013,19(11):2824-2833.]
[6]GUAN Xinping,TANG Yinggan,DUAN Guangren.Adaptive control for manipulator based on neural-network dynamic compensation[J].Control Theory &Applications,2003,20(1):101-104(in Chinese).[關(guān)新平,唐英干,段廣仁.機(jī)械手臂基于神經(jīng)網(wǎng)絡(luò)動(dòng)態(tài)補(bǔ)償?shù)淖赃m應(yīng)控制[J].控制理論與應(yīng)用,2003,20(1):101-104.]
[7]SUN Fuchun,SUN Zengqi,ZHANG R J,et al.Neural adaptive tracking controller for robot manipulators with unknown dynamics[J].IEE Proceedings-Control Theory and Applications,2000,147(3):366-370.
[8]SUN Fuchun,LI Hanxiong,LI Lei.Robot discrete adaptive control based on dynamic inversion using dynamical neural networks[J].Automatics,2002,38(11):1977-1983.
[9]WANG Liangyong,YANG Niao.Trajectory tracking control for robotic manipulators endowed with feedforward and neural networks[J].Electric Machines and Control,2013,17(8):113-118(in Chinese).[王良勇,楊 裊.帶有前饋和神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)臋C(jī)械手系統(tǒng)軌跡跟蹤控制[J].電機(jī)與控制學(xué)報(bào),2013,17(8):113-118.]
[10]WANG Liangyong,CHAI Tianyou.Neural network compensator based PD control of robotic manipulator[J].Proceedings of the CSEE,2009,29(12):110-115(in Chinese).[王良勇,柴天佑.帶有神經(jīng)網(wǎng)絡(luò)補(bǔ)償?shù)臋C(jī)械手PD 控制[J].中國(guó)電機(jī)工程學(xué)報(bào),2009,29(12):110-115.]
[11]LFWIS F L,YFGILDIRFK A,LIU K.Multilayer neural-net robot controller with guaranteed tracking performance[J].IEEE Transactions on Neural Networks,1996,7(2):388-399.
[12]YU Jiancheng,LI Qiang,ZHANG Aiqun,et al.Neural network adaptive control for underwater vehicles[J].Control Theory &Applications,2008,25(1):9-13(in Chinese).[俞建成,李 強(qiáng),張艾群,等.水下機(jī)器人的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制[[J].控制理論與應(yīng)用,2008,25(1):9-13.]
[13]ZHANG Wenhui,QI Nailiang,YIN Hongliang.Neural-network tracking control of space robot based on sliding-mode variable structure[J].Control Theory &Applications,2011,28(9):1141-1144(in Chinese).[張文輝,齊乃亮,尹洪亮.基于滑模變結(jié)構(gòu)的空間機(jī)器人神經(jīng)網(wǎng)絡(luò)跟蹤控制[J].控制理論與應(yīng)用,2011,28(9):1141-1144.]
[14]WAI R J,CHEN P C.Robust neural-fuzzy-network control for robot manipulator including actuator dynamics[J].IEEE Transactions on Industrial Electronics,2006,53(4):1328-1349.
[15]WU Yuxiang,WANG Cong.Adaptive neural network control and learning for uncertain robot[J].Control Theory &Applications,2013,30(8):990-997(in Chinese).[吳玉香,王聰.不確定機(jī)器人的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制與學(xué)習(xí)[J].控制理論與應(yīng)用,2013,30(8):990-997.]
[16]SONG Yixu,TAN Dalong.Velocity estimation of wheeled mobile robot with inner-sensors[J].Control Theory &Applications,2003,20(4):537-546(in Chinese).[宋亦旭,談大龍.基于內(nèi)部傳感器的輪式移動(dòng)機(jī)器人運(yùn)動(dòng)速度估計(jì)[J].控制理論與應(yīng)用,2003,20(4):537-546.]