鄧玉龍,王從慶
(南京航空航天大學(xué)自動(dòng)化學(xué)院,南京210016)
空間機(jī)器人的SVM 非線性補(bǔ)償滑模控制研究
鄧玉龍,王從慶
(南京航空航天大學(xué)自動(dòng)化學(xué)院,南京210016)
為提高機(jī)械臂末端跟蹤目標(biāo)軌跡速度,提出了一種基于SVM(Support Vector Machine)非線性模型估計(jì)的滑??刂品椒?。該方法通過(guò)SVM對(duì)參數(shù)不確定非線性項(xiàng)進(jìn)行估計(jì),對(duì)空間機(jī)器人動(dòng)力學(xué)模型進(jìn)行補(bǔ)償。這種從整個(gè)閉環(huán)系統(tǒng)穩(wěn)定性出發(fā)設(shè)計(jì)的SVM非線性補(bǔ)償滑??刂破?,不需要確切的數(shù)學(xué)模型,從而提高了快速跟蹤目標(biāo)軌跡,減小跟蹤誤差的動(dòng)力學(xué)系統(tǒng)性能。仿真結(jié)果驗(yàn)證了該控制方法的有效性、可行性。
空間機(jī)器人;支持向量機(jī);非線性估計(jì);滑??刂?/p>
由于工作性質(zhì)的特殊性,空間機(jī)器人處于失重狀態(tài),其質(zhì)量隨著時(shí)間變化,空間機(jī)器人在操作過(guò)程中載體位置和姿態(tài)均不受控制。此外,空間機(jī)器人的動(dòng)力學(xué)模型非常復(fù)雜,并存在各種不確定性,如質(zhì)量、慣性矩陣及負(fù)載等,難以獲得精確的動(dòng)力學(xué)模型,且外部擾動(dòng)信號(hào)也會(huì)對(duì)控制產(chǎn)生一定影響??傊臻g機(jī)器人系統(tǒng)是一個(gè)高度耦合的非線性系統(tǒng)。
對(duì)空間機(jī)器人的動(dòng)力學(xué)建模及其控制方法,人們已經(jīng)在多方面進(jìn)行了研究。文獻(xiàn)[1]提出了一種自適應(yīng)控制方法,在設(shè)計(jì)過(guò)程中需要對(duì)動(dòng)力學(xué)方程進(jìn)行參數(shù)線性化,并進(jìn)行繁復(fù)的前期計(jì)算以確定回歸矩陣。對(duì)未知參數(shù)的準(zhǔn)確估計(jì),決定了自適應(yīng)控制能否成功實(shí)現(xiàn)控制目標(biāo)。文獻(xiàn)[2]利用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)模糊推理,使模糊控制具有自學(xué)習(xí)能力,提出了基于模糊神經(jīng)網(wǎng)絡(luò)的空間機(jī)械臂自學(xué)習(xí)控制策略,但該方法不能確保系統(tǒng)的穩(wěn)定性。文獻(xiàn)[3,4]提出了一種智能控制方法,不要求知道控制對(duì)象的精確模型,但該方法需要過(guò)多的調(diào)整參數(shù),占用較多的計(jì)算時(shí)間,不利于系統(tǒng)的實(shí)時(shí)性。針對(duì)不確定性系統(tǒng),文獻(xiàn)[5-8]分別介紹了基于神經(jīng)網(wǎng)絡(luò)的模型不確定性非線性函數(shù)逼近補(bǔ)償控制方法,該方法能較好地逼近目標(biāo)非線性函數(shù),但神經(jīng)網(wǎng)絡(luò)權(quán)值的調(diào)整需要消耗較多的計(jì)算時(shí)間,因而降低了逼近速度。
筆者針對(duì)空間機(jī)器人非線性系統(tǒng)的軌跡跟蹤,提出了一種基于SVM(Support Vector Machine)非線性估計(jì)的滑??刂品椒?。與基于神經(jīng)網(wǎng)絡(luò)的估計(jì)方法相比,基于SVM方法節(jié)省了權(quán)值調(diào)整時(shí)間。該方法經(jīng)采集樣本數(shù)據(jù)訓(xùn)練SVM,對(duì)空間機(jī)器人動(dòng)力學(xué)不確定非線性模型估計(jì)并補(bǔ)償。這種控制策略不需要確切的數(shù)學(xué)模型,取得了提高軌跡跟蹤速度和縮小跟蹤誤差的動(dòng)力學(xué)系統(tǒng)性能?;贚yapunov理論證明了閉環(huán)系統(tǒng)的穩(wěn)定性,并對(duì)一個(gè)3自由度的自由浮動(dòng)空間機(jī)械臂在平面內(nèi)的運(yùn)動(dòng)進(jìn)行了仿真驗(yàn)證。
筆者討論的是一個(gè)自由浮動(dòng)平面3關(guān)節(jié)空間機(jī)械臂(見(jiàn)圖1)。該機(jī)械臂系統(tǒng)由航天器基座和機(jī)械臂組成?;霃綖長(zhǎng)b,各連桿長(zhǎng)度分別為L(zhǎng)1,L2,L3,連桿附體坐標(biāo)系由Denavit-Hartenberg方法建立。圖1中,Σ0-O0X0Y0為慣性坐標(biāo)系;Σb-ObXbYb為固定于基座質(zhì)心的基座坐標(biāo)系;Σi-OiXiYi(i=1,2,3)為固定于機(jī)械臂第i關(guān)節(jié)的附體坐標(biāo)系;Σc-OcXcYc為固定于機(jī)械臂末端質(zhì)心的坐標(biāo)系;θi為各關(guān)節(jié)轉(zhuǎn)角;rb,ri,rc分別為慣性坐標(biāo)系原點(diǎn)到本體坐標(biāo)原點(diǎn)、各連桿質(zhì)心和機(jī)械手坐標(biāo)系原點(diǎn)的位置矢量。
圖1 空間機(jī)器人系統(tǒng)結(jié)構(gòu)Fig.1 Space robot system structure
圖1所示的3關(guān)節(jié)空間剛性機(jī)械臂,考慮摩擦力,其動(dòng)力學(xué)方程可表示為[9]
其中θ=[θ1,θ2,θ3]T∈R3×1,,分別表示關(guān)節(jié)轉(zhuǎn)角的位置、速度和加速度;M(θ)∈R3×3為對(duì)稱(chēng)正定的慣性矩陣;V(θ,)∈R3×3為科氏力和向心力矩陣;F()∈R3×1為摩擦力矢量;G(θ)∈R3×1為重力矢量,太空中機(jī)械臂為失重狀態(tài),可以忽略重力的影響;τ∈R3×1為控制轉(zhuǎn)矩輸入矢量。
關(guān)節(jié)矢量 θ 與末端位置矢量 Xc=[Xcx,Xcy,θc]T∈R3×1存在如下關(guān)系
其中J∈R3×3為關(guān)節(jié)空間到機(jī)械臂末端位置空間的廣義雅可比矩陣[10]。將式(2)代入式(1),得
考慮自由浮動(dòng)空間機(jī)械臂系統(tǒng)動(dòng)力學(xué)方程(3)。為減少機(jī)械臂動(dòng)力學(xué)建模參數(shù)不確定非線性對(duì)系統(tǒng)控制的影響,加快學(xué)習(xí)速度,實(shí)現(xiàn)自由浮動(dòng)機(jī)械臂末端軌跡跟蹤的目的,提出基于SVM不確定非線性補(bǔ)償?shù)幕?刂品椒?見(jiàn)圖2)。
圖2 基于SVM不確定性補(bǔ)償滑??刂瓶驁DFig.2 SVM uncertainty compensation sliding model control block diagram
采用快速終端滑??刂茖?shí)現(xiàn)機(jī)械臂末端的軌跡跟蹤控制,即在滑動(dòng)模態(tài)超平面的設(shè)計(jì)中引入非線性函數(shù),使滑模面上的跟蹤誤差在有限時(shí)間內(nèi)收斂到零。
由式(3)得
式(4)整理后得
取控制律
對(duì)式(7)求導(dǎo)可得
將式(6)代入式(8),得
定理 控制律(6)可保證系統(tǒng)從任意初始狀態(tài)收斂到滑模面。
證明 選取Lyapunov函數(shù)
對(duì)式(10)求導(dǎo)得
由式(11)得出,只要取正定對(duì)角常數(shù)矩陣Kv≥F,則有≤0,使系統(tǒng)趨于穩(wěn)定。即選取適當(dāng)?shù)脑O(shè)計(jì)參數(shù),可使控制律(6)有效控制機(jī)械臂末端跟蹤期望軌跡。
SVM回歸的基本思想是通過(guò)一個(gè)非線性映射Φ(·),將數(shù)據(jù)x映射到高維特征空間,并在這個(gè)空間進(jìn)行線性回歸。一般的回歸問(wèn)題可以表述為:給定w個(gè)訓(xùn)練樣本,學(xué)習(xí)機(jī)從中學(xué)習(xí)輸入、輸出變量之間的關(guān)系。假設(shè)給定了訓(xùn)練數(shù)據(jù){(xi,yi),i=1,2,…,w},其中xi∈Rn是第i個(gè)學(xué)習(xí)樣本點(diǎn)的n維輸入值,yi∈R為對(duì)應(yīng)的目標(biāo)值,w為訓(xùn)練樣本數(shù)目。目標(biāo)就是尋找一個(gè)函數(shù)f(x)使其能較好地逼近所有的樣本點(diǎn)[11]??傮w上,SVM的估計(jì)函數(shù)表示如下
在變換的高維特征空間中,最優(yōu)目標(biāo)函數(shù)將使如下?lián)p失函數(shù)最小
約束條件為
式(13)在約束條件下的最優(yōu)問(wèn)題,可用拉格朗日泛函引導(dǎo)的對(duì)偶優(yōu)化問(wèn)題表示為
此時(shí),非線性函數(shù)Φ(·)未知,特征空間的維數(shù)很高,因此ω*無(wú)法顯示地表達(dá)。SVM算法的特殊效果在于引入核函數(shù)技巧,使函數(shù)回歸繞過(guò)特征空間,直接在輸入空間上求取,從而避免了計(jì)算非線性映射Φ(·)。
設(shè)核函數(shù)k(x,x*)滿(mǎn)足
最終可得
此即為支持向量回歸機(jī)。
概括地說(shuō),SVM通過(guò)用內(nèi)積函數(shù)定義的非線性變換,將輸入空間變換到高維空間,利用輸入樣本對(duì)SVM訓(xùn)練實(shí)現(xiàn)對(duì)空間機(jī)械臂的非線性函數(shù)逼近,進(jìn)而以較小的逼近誤差對(duì)系統(tǒng)的非線性部分進(jìn)行補(bǔ)償,提高系統(tǒng)的動(dòng)態(tài)性能。
以自由浮動(dòng)三連桿空間機(jī)器人為仿真模型,驗(yàn)證所提出的控制方案的有效性。系統(tǒng)仿真參數(shù)如下。
本體:mb=2 000 kg, lb=2 m, Ib=1 000 kg·m2。
連桿 L1:m1=4 kg, l1=2.2 m, I1=2 kg·m2。
連桿 L2:m2=4 kg, l2=2.2 m, I2=2 kg·m2。
連桿 L3:m3=4 kg, l3=2.2 m, I3=2 kg·m2。
本體的初始位姿為:(2 m,0 m,0 rad)。
關(guān)節(jié)角初始值:θ1=π/6,θ2=π/3,θ3=π/2。
末端的初始位姿為:(2 m,2 m,0 rad)。末端期望軌跡為一個(gè)圓:
選取1 000對(duì)不確定性非線性項(xiàng)的輸入、輸出數(shù)據(jù),作為SVM的訓(xùn)練樣本和測(cè)試樣本集,其中700對(duì)數(shù)據(jù)用于訓(xùn)練,300對(duì)數(shù)據(jù)用于測(cè)試。選擇ε-SVR類(lèi)型的SVM,核函數(shù)類(lèi)型為RBF函數(shù),懲罰因子為2.2,核參數(shù)為0.1,松弛變量因子為0.01。選取Λ=3E3,p=5,q=3,Kv=5。其中E3為單位矩陣。仿真時(shí)間為5 s。仿真實(shí)驗(yàn)結(jié)果如圖3~圖7所示。
圖3 系統(tǒng)不確定非線性項(xiàng)及其SVM估計(jì)Fig.3 Uncertain nonlinear term of the system and its SVM estimation
圖4 未進(jìn)行不確定非線性補(bǔ)償?shù)能壽E跟蹤誤差Fig.4 Trajectory tracking error without uncertainty nonlinear compensat
圖5 進(jìn)行SVM不確定非線性補(bǔ)償?shù)能壽E跟蹤誤差Fig.5 Trajectory tracking error with uncertainty nonlinear compensation
圖6 未進(jìn)行不確定性補(bǔ)償?shù)哪┒宋恢酶橣ig.6 Position tracking of the end without uncertainty nonlinear compensation
圖7 進(jìn)行SVM不確定性補(bǔ)償?shù)哪┒宋恢酶橣ig.7 Position tracking of the end with uncertainty nonlinear compensation
圖3中逼近誤差Δ f非常小,表明經(jīng)樣本訓(xùn)練的SVM可以很好地逼近實(shí)際模型,且滿(mǎn)足Kv≥F的要求。圖4、圖5為末端軌跡跟蹤誤差曲線,其跟蹤目標(biāo)軌跡所需的時(shí)間分別為0.2 s和1 s,可見(jiàn),采用SVM不確定非線性補(bǔ)償方法提高了系統(tǒng)的動(dòng)態(tài)性能,節(jié)省了末端跟蹤目標(biāo)軌跡的調(diào)節(jié)時(shí)間。比較圖6和圖7可看出,經(jīng)SVM補(bǔ)償系統(tǒng)較未補(bǔ)償?shù)南到y(tǒng)的動(dòng)態(tài)性能得到了提高。仿真結(jié)果表明,筆者設(shè)計(jì)的基于SVM不確定非線性補(bǔ)償?shù)幕?刂坡墒怯行У?,也說(shuō)明了SVM具有很快的學(xué)習(xí)速度和很好的模型復(fù)現(xiàn)能力。
筆者針對(duì)自由漂浮空間機(jī)器人模型的不確定非線性特性,提出了一種基于SVM不確定非線性補(bǔ)償?shù)幕?刂品椒?。結(jié)合3關(guān)節(jié)空間機(jī)械臂系統(tǒng)建立了仿真模型,并基于Lyapunov理論證明了閉環(huán)系統(tǒng)的穩(wěn)定性。仿真結(jié)果證實(shí)了SVM的非線性函數(shù)快速逼近能力,表明了此控制器避免了對(duì)空間機(jī)器人動(dòng)力學(xué)模型的參數(shù)線性化要求以及設(shè)計(jì)控制器的繁多計(jì)算。仿真結(jié)果還表明,空間機(jī)械臂的軌跡跟蹤動(dòng)力學(xué)性能得到了提高,從而證明了控制方法的可行性和有效性。
[1]YOSHIDA K,HASHIZURME K,ABIKO S.Zero Reaction Maneuver Flight Validation with ETS-VII Space Robot and Extension to Kinemat-Iccally Redundant Arm[C]//Proceedings of the IEEE International Conference on Robotics and Automation.Piscataway,USA:[s.n.],2011:441-446.
[2]洪昭斌,陳力.基于神經(jīng)網(wǎng)絡(luò)的漂浮基空間機(jī)械臂的自學(xué)習(xí)模糊控制[J].機(jī)械科學(xué)與技術(shù),2009,28(7):976-980.HONG Zhaobin,CHEN Li.Self-Learning Fuzzy Control of A Free-Floating Space Manipulator Based on Neural Network[J].Mechanical Science and Technology for Aerospace Engineering,2009,28(7):976-980.
[3]KONSTANTIN V,ZMEU ELIYAA SHIPITKO,REY S PEREVOZCHIKOV.Linear Neural Model-Based Predictive Controller Design for Flexible Link Robot[C]//Proceedings of the 2004 IEEE International Symposium of Intelligent Control.Taipei,Taiwan:[s.n.],2004:293-298.
[4]NGUYEN V B,MORRIS A S.Using a Genetic Algorithm to Fully Optimize a Fuzzy Logic Controller for a Two Link Flexible Robot Arm[J].Robotic,2009,27(5):677-687.
[5]謝箭,劉國(guó)良,顏世佐,等.基于神經(jīng)網(wǎng)絡(luò)的不確定性空間機(jī)器人自適應(yīng)控制方法研究[J].宇航學(xué)報(bào),2010,31(1):123-129.XIE Jian,LIU Guoliang,YAN Shizuo,et al.Study on Neural Network Adaptive Control Method for Uncertain Space Manipulator[J].Journal of Astronautics,2010,31(1):123-129.
[6]高宏宇,邵克勇,李艷輝.不確定系統(tǒng)的上界自適應(yīng)動(dòng)態(tài)神經(jīng)滑??刂疲跩].吉林大學(xué)學(xué)報(bào):信息科學(xué)版,2010,28(3):292-297.GAO Hongyu,SHAO Keyong,LI Yanhui.Upper Bound Adaptive Dynamic Neural Sliding Mode Control of Uncertain Systems[J].Journal of Jilin University:Information Science Edition,2010,28(3):292-297.
[7]張文輝,高九州,馬靜,等.漂浮基空間機(jī)器人的徑向基神經(jīng)網(wǎng)絡(luò)魯棒自適應(yīng)控制[J].智能系統(tǒng)學(xué)報(bào),2011,6(2):114-118.ZHANG Wenhui,GAO Jiuzhou,MA Jing,et al.The RBF Neural Network Robust Adaptive Control of a Free-Floating Space Robot[J].CAAI Transactions on Intelligent Systems,2011,6(2):114-118.
[8]吳玉香,王聰.不確定機(jī)器人的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制與學(xué)習(xí)[J].控制理論與應(yīng)用,2013,30(8):990-997.WU Yuxiang,WANG Cong.Adaptive Neural Network Control and Learning for Uncertain Robot[J].Control Theory &Applications,2013,30(8):990-997.
[9]MANOJ MITTAL,CHUANG C H,JUANG JER-NAN.Nonlinear Control of Space Manipulators with Model Uncertainty[C]//The American Institute of Aeronautics and Astronautics.Langley Research Center,Hampton,VA:[s.n.],1994:1009-1019.
[10]YOJI UMETANI,KAZUYA YOSHIDA.Resolved Motion Rate Control of Space Manipulators with Generalized Jacobian Matrix[J].IEEE Transactions on Robotics and Automation,1989,5(3):303-314.
[11]JONGHO SHIN,H JIN KIM,YOUDAN KIM.Adaptive Support Vector Regression for UAV Flight Control[J].Neural Networks,2011,24(1):109-120.
(責(zé)任編輯:何桂華)
Research on SVM Nonlinear Estimation Sliding Mode Control of Space Robot
DENG Yulong,WANG Congqing
(School of Automation,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China)
A method of sliding mode control based on SVM(Support Vector Machine)nonlinear estimation of the robotic dynamics has been proposed to acquire faster trajectory tracking rate of the space manipulator end.SVM regression is used to estimate the parameter uncertainty of the nonlinear term and to compensate dynamic model of space robot.This SVM nonlinearity compensated sliding mode controller designed on the stability of the closedloop system,avoiding computing precise model,has improved the dynamics performance of the system,achieving faster target trajectory tracking rate and reducing the tracking error.The simulation results show that the presented method is effective and feasible.
space robot;support vector machine(SVM);nonlinear estimation;sliding mode control
TP242
A
1671-5896(2014)02-0166-06
2013-12-02
西安交通大學(xué)機(jī)械制造工程國(guó)家重點(diǎn)實(shí)驗(yàn)室基金資助項(xiàng)目(201002)
鄧玉龍(1988— ),男,湖南永州人,南京航空航天大學(xué)碩士研究生,主要從事空間機(jī)器人控制研究,(Tel)86-15195765149(E-mail)dengyu_long@126.com;王從慶(1960— ),男,南京人,南京航空航天大學(xué)教授,碩士生導(dǎo)師,主要從事智能控制及應(yīng)用研究,(Tel)86-13151426390(E-mail)wangcq@nuaa.edu.cn。