張文輝,馬 靜,高九州
(1.哈爾濱工業(yè)大學(xué)航天學(xué)院,哈爾濱150001;2.東北農(nóng)業(yè)大學(xué)工程學(xué)院,哈爾濱150001)
基于多層感知器神經(jīng)元的空間柔性機(jī)器人位置跟蹤控制*
張文輝1,馬 靜2,高九州1
(1.哈爾濱工業(yè)大學(xué)航天學(xué)院,哈爾濱150001;2.東北農(nóng)業(yè)大學(xué)工程學(xué)院,哈爾濱150001)
針對(duì)基體位置及姿態(tài)均不受控的自由漂浮柔性空間機(jī)器人軌跡跟蹤問(wèn)題,提出了一種前饋多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)控制策略.建立了末端柔性的自由漂浮基機(jī)器人的耦合動(dòng)力學(xué)模型,再利用MLP神經(jīng)網(wǎng)絡(luò)良好的逼近能力來(lái)自適應(yīng)補(bǔ)償非線性柔性臂的逆動(dòng)力學(xué)模型,其誤差代價(jià)函數(shù)由PID控制器提供,權(quán)重及閥值的調(diào)整采用改進(jìn)的BP反傳算法.最后通過(guò)仿真比較詳細(xì)分析了所提方案的工作機(jī)理及對(duì)非線性強(qiáng)耦合系統(tǒng)控制的有效性.
多層感知器神經(jīng)網(wǎng)絡(luò);逆??刂?;PID控制;BP算法
柔性臂由于質(zhì)量輕、速度快等一系列優(yōu)點(diǎn)逐漸引起了學(xué)術(shù)界的廣泛興趣.但空間柔性機(jī)器人系統(tǒng)為非完整動(dòng)力學(xué)系統(tǒng),存在著強(qiáng)烈的動(dòng)力學(xué)耦合作用[1-3],從而導(dǎo)致空間柔性機(jī)器人在運(yùn)動(dòng)過(guò)程中出現(xiàn)振動(dòng),在運(yùn)動(dòng)結(jié)束時(shí)產(chǎn)生殘余振動(dòng),影響控制性能.由于傳統(tǒng)的動(dòng)力學(xué)控制方法已不能滿足空間柔性機(jī)器人動(dòng)力學(xué)控制的要求,為消除這些非線性因素的影響,目前自適應(yīng)控制、模糊控制等先進(jìn)的控制策略[4-7]已應(yīng)用到柔性空間機(jī)器人跟蹤控制中.
由于模糊控制無(wú)需知道被控制對(duì)象的精確數(shù)學(xué)模型,且控制器結(jié)構(gòu)簡(jiǎn)單,并具有學(xué)習(xí)能力,因而在空間控制領(lǐng)域的應(yīng)用日益廣泛,已取得了一定成果.文獻(xiàn)[4-5]提出了的一種模糊控制方案用于空間柔性臂,模糊規(guī)則通過(guò)自適應(yīng)律來(lái)調(diào)整,達(dá)到了較好的控制效果,但由于模糊規(guī)則的獲取需要先驗(yàn)的專家知識(shí),且過(guò)多的模糊規(guī)則將造成較大的將計(jì)算量,因而很難應(yīng)用于工程實(shí)際.文獻(xiàn)[6]考慮到柔性空間機(jī)器人在自由漂浮模式下動(dòng)力學(xué)模型難以準(zhǔn)確得到,并且容易受到非線性不確定性的影響,因而采用自適應(yīng)控制策略,獲得了較好的控制效果,但自適應(yīng)控制律的獲得需要參數(shù)線性化及回歸矩陣的確定,因此需要大量計(jì)算,影響了實(shí)時(shí)性.
本文針對(duì)基體的位置及姿態(tài)均不受控的漂浮柔性空間機(jī)器人,提出了一種改進(jìn)BP算法的前饋多層感知器神經(jīng)網(wǎng)絡(luò)逆??刂撇呗?利用 MLPNN良好的逼近能力來(lái)自適應(yīng)補(bǔ)償非線性柔性臂的逆動(dòng)力學(xué)模型.仿真結(jié)果詳細(xì)分析了所提方案的工作機(jī)理及對(duì)非線性強(qiáng)耦合系統(tǒng)控制的有效性.
由剛性桿B1及柔性桿B2組成的柔性漂浮空間機(jī)器人系統(tǒng)結(jié)構(gòu)如圖1所示.設(shè) O1在O0x0軸上與O0的距離為l0,OB1沿 O1x1的長(zhǎng)度為 a,Bi沿 Oixi的長(zhǎng)度為li(i=1,2),載體質(zhì)量為m0,慣量矩陣為I0,B1為剛性桿,質(zhì)量為m1,慣量矩陣為 I1.
圖1 柔性臂漂浮基空間機(jī)器人
B2為柔性桿,必然會(huì)在運(yùn)動(dòng)過(guò)程中產(chǎn)生形變,將其視為一段 Euler-Bernoulli梁處理,設(shè)其密度為ρ,柔性梁的彈性位移u的模態(tài)函數(shù)展開表示為
式中,φi(x2)為柔性桿第i階模態(tài)函數(shù),qi(t)為與φi(x2)對(duì)應(yīng)的模態(tài)坐標(biāo),n為截?cái)囗?xiàng)數(shù).
由于不考慮重力的作用,整個(gè)系統(tǒng)重力勢(shì)能為零,且柔性機(jī)器人為線彈性變形,故系統(tǒng)總勢(shì)能 U等于柔性連桿的彎曲應(yīng)變能.系統(tǒng)遵守對(duì)(OXY)的動(dòng)量守恒及相對(duì)O點(diǎn)的動(dòng)量矩守恒.設(shè)系統(tǒng)的初始動(dòng)量、動(dòng)量矩均為0,即有˙rc=rc=0.
由材料力學(xué)相關(guān)理論,系統(tǒng)彈性勢(shì)能為
式中,E為抗彎剛度,設(shè)α、θ1及θ2分別為載體姿態(tài)及機(jī)器人各個(gè)關(guān)節(jié)的相對(duì)轉(zhuǎn)角,在以α、θ1、θ2、q1及q2為廣義坐標(biāo)的情況下,設(shè)系統(tǒng)的總動(dòng)能為T,則系統(tǒng)的拉氏函數(shù)為
應(yīng)用拉格朗日方程可得
其中,L是系統(tǒng)的拉格朗日函數(shù),qi為系統(tǒng)的廣義坐標(biāo),Qi為廣義坐標(biāo)qi相對(duì)應(yīng)的廣義力.
結(jié)合式(3)~(4),經(jīng)過(guò)推導(dǎo)和整理,可以得到如下空間剛?cè)釞C(jī)器人系統(tǒng)的非線性動(dòng)力學(xué)方程:
其中 θ=[θ1θ2]T,q=[q1q2]T.D為 4 ×4 正定對(duì)稱廣義質(zhì)量陣.H為4×1哥氏力、離心力和彈性力的列陣.τ=[τ1τ20 0]T為控制力矩.
文中定義 φ=[θTqT]T為增廣輸入向量,φd=[qT]T為增廣的期望關(guān)節(jié)角,采用擴(kuò)展系統(tǒng)的增廣變量輸入法.則可以得出系統(tǒng)誤差向量e=φd-φ=[0],這里 eθ=θd-θ.
在式(5)不存在未建模動(dòng)態(tài)及外界擾動(dòng)的情況下,下面的控制器(6)可以保證系統(tǒng)的穩(wěn)定性.
這里定義Kp、Kd為反饋增益矩陣.
在實(shí)際中,空間柔性機(jī)器人的模型很難精確得到,只能建立估計(jì)模型.設(shè)估計(jì)模型為.對(duì)于估計(jì)模型,則控制律設(shè)計(jì)為
這里將控制律式(7)代入控制律式(6)中,得
為解決空間柔性機(jī)器人非線性動(dòng)力學(xué)模型的誤差影響,這里考慮采用多層感知器神經(jīng)網(wǎng)絡(luò)(MLPNN)來(lái)對(duì)柔性空間機(jī)器人的逆動(dòng)力學(xué)模型進(jìn)行逼近.
前饋多層感知器神經(jīng)網(wǎng)絡(luò)是大量具有神經(jīng)元級(jí)的聯(lián)層網(wǎng)絡(luò),同一層的所有神經(jīng)元通過(guò)單向分支連接鄰近層的所有神經(jīng)元,分支或連接僅能向一個(gè)方向,即“前饋方向”傳遞信息,已經(jīng)證明只要有足夠的神經(jīng)元,它就能以任意精度逼近非線性函數(shù).
圖2 多層感知器神經(jīng)網(wǎng)絡(luò)
由柔性空間機(jī)器人非線性動(dòng)力學(xué)模型(5)得
柔性空間機(jī)器人的MLP網(wǎng)絡(luò)逆模控制系統(tǒng)如圖3所示,這里控制輸入τ由PID反饋控制器τPD和MLP神經(jīng)網(wǎng)絡(luò)逆模學(xué)習(xí)控制器τNN組成.
設(shè)計(jì)PID反饋控制器為
MLP神經(jīng)網(wǎng)絡(luò)控制器設(shè)計(jì)為
其中,w為神經(jīng)網(wǎng)絡(luò)連接權(quán)值,b為神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)閥值.則
控制系統(tǒng)結(jié)構(gòu)如圖3所示.
圖3 神經(jīng)網(wǎng)絡(luò)逆??刂葡到y(tǒng)
由圖3中可以看出隨著τNN對(duì)逆動(dòng)力學(xué)模型學(xué)習(xí)的進(jìn)行,τPD越來(lái)越小.
由此可以定義MLP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)誤差δ為
為保證實(shí)時(shí)性,便于工程應(yīng)用,本文采用一種改進(jìn)的BP算法來(lái)完成包括網(wǎng)絡(luò)參數(shù)的更新訓(xùn)練,使學(xué)習(xí)誤差趨于0為實(shí)際網(wǎng)絡(luò)輸出向量,yd為網(wǎng)絡(luò)期望輸出向量.
這里設(shè)前向神經(jīng)網(wǎng)絡(luò)有M層,每層輸入輸出關(guān)系為
采用反向傳播算法,則前向網(wǎng)絡(luò)連接權(quán)值及閥值的修正公式為
通過(guò)上述前饋多層感知器神經(jīng)元的參數(shù)更新算法,在線邊學(xué)習(xí)邊控制,MLPNN將逐漸建立比較精確的空間柔性機(jī)器人的系統(tǒng)逆模型.
空間柔性機(jī)器人系統(tǒng)的慣性參數(shù)為l0=0.6m,l1=l2=1.2m,a=1m;各分體質(zhì)量或密度 m0=50kg,m1=5kg,ρ=0.6kg/m;均勻彎曲剛度為 E=360N·m2.各分體中心慣量矩 I0=35kg·m2,I1=0.8kg·m2.從泰勒的角度來(lái)看,忽略高階模態(tài),僅取前兩項(xiàng),柔性空間機(jī)器人兩關(guān)節(jié)期望的軌跡為
θ1d=1+0.2cos(πt) ;θ2d=1+0.2sin(πt);控制器增益 Kp=diag{20,20} ,Kd=diag{30,30};神經(jīng)網(wǎng)絡(luò)參數(shù)為λ=0.25,η=0.7;初始值分別取為 θ1(0)=θ2(0)=1.
圖4 本文的軌跡跟蹤情形圖
圖5 本文的關(guān)節(jié)速度跟蹤誤差圖
而由圖4可以看出,所設(shè)計(jì)的MLP神經(jīng)網(wǎng)絡(luò)的逆模PID控制器能在較短時(shí)間(t=2s)內(nèi)快速跟蹤期望軌跡,同時(shí)由圖5看出,角速度跟蹤誤差在2s后也收斂為0,說(shuō)明多層感知器神經(jīng)元能夠較好控制非線性強(qiáng)耦合的空間柔性機(jī)器人系統(tǒng).
針對(duì)自由漂浮的柔性空間機(jī)器人系統(tǒng)的關(guān)節(jié)位置跟蹤問(wèn)題,提出了一種改進(jìn)BP算法的前饋多層感知器神經(jīng)網(wǎng)絡(luò)逆??刂撇呗?利用多層感知前饋神經(jīng)網(wǎng)絡(luò)良好的逼近能力來(lái)自適應(yīng)補(bǔ)償非線性柔性臂的逆動(dòng)力學(xué)模型,神經(jīng)網(wǎng)絡(luò)的誤差代價(jià)函數(shù)由傳統(tǒng)的PID控制器提供,權(quán)值及閥值的調(diào)整采用改進(jìn)的BP反傳算法.仿真說(shuō)明了所提方案的有效性,對(duì)于非線性強(qiáng)耦合系統(tǒng)能夠獲得較高控制精度.
[1]Farzaneh A,Talebi H A,Rajnikant V P.A stable neural network-based observer with application to flexiblejointmanipulators[J].IEEE Trans on Neural Networks,2006,17(1):118-129
[2]Dubowsky S ,Papadopoulos E G.The kinematics, dynamics and control of free-flying space robotic systems[J].IEEE Trans on Robotics and Automation, 1993,9(5):531-543
[3]Amor J,William A.Experimental study on active vibration control of a single-Link flexible manipulator using tools of fuzzy logic and neural networks[J].IEEE Trans on Instrumentation and Measurement, 2005, 54(3):1200-1208
[4]Green A,Sasiadek JZ.Adaptive control of a flexible robot using fuzzy logic[C].AIAA Guidance, Navigation,and Control Conference and Exhibit, Providence, Aug.16-19,2004
[5]張曉東,賈慶軒,孫漢旭,等.空間機(jī)器人柔性關(guān)節(jié)軌跡控制研究[J].宇航學(xué)報(bào),2008,29(6):1865-1869
[6]Chen L.Adaptive and robust composite control of coordinated motion of space robot system with prismatic joint[C].The 4thWorld Congress on Intelligent Control and Automation, Shanghai,2002
Position Tracking Control for Space Flexib le Robot Based on M u ltilayer Percep tual Neural Network
ZHANG Wenhui1,MA Jing2, GAO Jiuzhou1
(1.School of Aerospace,Harbin Institute of Technology,Harbin 150001,China; 2.Department of Engineering,Northeast Agriculture University, Harbin 150001,China)
The problem of trajectory tracking for freefloating space robotwith flexible manipulators are considered.An improved multilayer perceptual neural network(MLPNN)inverse-model control algorithm based on the BP algorithm is proposed in this paper.High order liberation modal is ignored based on the assumed modalmethod,Lagrange principle and momentum con-
servation.The MLPNN based controller is used to adaptively learn and compensate the inverse-dynamics model of robot,neural network parameters can be adaptively adjusted on line,and the improved BP algorithm is adopted to learn rules.Error cost function is provided by PID controller.The controller improves the control accuracy and the asymptotic convergence of tracking error.The simulation results show that the presented controller has important value.
multilayer perceptual neural network; inverse-modal control; PID control; BP algorithm
TP242
A
1674-1579(2011)01-0059-04
10.3969/j.issn.1674-1579.2011.01.013
*中國(guó)航天科技聯(lián)合創(chuàng)新基金(CAST-HIT09C01)資助項(xiàng)目.
2010-09-15
張文輝(1980—),男,河南人,博士研究生,研究方向?yàn)榭臻g機(jī)器人智能控制 (e-mail:hit-zwh@126.com).