牟方厲,吳 丹,董云飛
(清華大學(xué)機(jī)械工程系,北京 100084)
機(jī)器人技術(shù)結(jié)合了當(dāng)代機(jī)械工程、自動(dòng)控制、材料、計(jì)算機(jī)、生命科學(xué)等多學(xué)科的發(fā)展成果,是本世紀(jì)偉大且具有代表性的技術(shù)成就之一.機(jī)器人系統(tǒng)是一個(gè)具有高度非線性和不確定性的復(fù)雜系統(tǒng),機(jī)器人的控制系統(tǒng)是它的核心,機(jī)器人控制中的一個(gè)重要問題是通過給定各關(guān)節(jié)力矩使得機(jī)器人關(guān)節(jié)狀態(tài)跟蹤理想軌跡.目前對(duì)機(jī)器人控制方法的研究已取得了豐富的成果,常見的控制算法有計(jì)算力矩法、前饋補(bǔ)償法、PID控制、魯棒控制、自適應(yīng)控制、模糊控制、神經(jīng)網(wǎng)絡(luò)控制、迭代學(xué)習(xí)控制、滑??刂坪头囱菘刂频萚1-3].
然而,實(shí)際機(jī)器人系統(tǒng)受到系統(tǒng)建模精度,環(huán)境不確定性,參數(shù)辨識(shí)能力,計(jì)算實(shí)時(shí)性等諸多方面因素的制約,因此依賴于系統(tǒng)數(shù)學(xué)模型的大多數(shù)現(xiàn)代控制理論方法目前仍未在實(shí)際機(jī)器人系統(tǒng)中得到廣泛的應(yīng)用.比例積分微分(proportion integral differential,PID)控制器由于具有不基于被控過程的模型,結(jié)構(gòu)簡(jiǎn)單,易于實(shí)現(xiàn)等優(yōu)點(diǎn),仍是當(dāng)前機(jī)器人系統(tǒng)(特別是關(guān)節(jié)層面)中最為主要的控制器形式.然而,受制于控制律形式,PID控制器將很難讓受控機(jī)器人兼顧良好的動(dòng)態(tài)性能和靜態(tài)性能,尤其當(dāng)需要機(jī)器人執(zhí)行高速、大范圍運(yùn)動(dòng)時(shí),PID控制將不再有效甚至導(dǎo)致受控系統(tǒng)的不穩(wěn)定[4].
自抗擾控制技術(shù)(active disturbance rejection control,ADRC)是韓京清教授于20世紀(jì)90年代末期,基于PID控制思想提出的一種新型控制方法[5].自抗擾控制器不依賴于系統(tǒng)精確的數(shù)學(xué)模型,以擴(kuò)張狀態(tài)觀測(cè)器(extended state observer,ESO)為核心,利用擾動(dòng)估計(jì),狀態(tài)誤差反饋和擾動(dòng)補(bǔ)償?shù)确椒ㄔ谙到y(tǒng)輸出產(chǎn)生影響之前實(shí)現(xiàn)對(duì)總擾動(dòng)的主動(dòng)補(bǔ)償[6].自抗擾控制器設(shè)計(jì)時(shí)只需要知道系統(tǒng)的階次和輸入輸出通道等少量系統(tǒng)信息,具有強(qiáng)抗擾能力和強(qiáng)控制魯棒性等優(yōu)點(diǎn),近年來在伺服控制系統(tǒng)[7]、工業(yè)過程控制[8]、航天航空[9]等領(lǐng)域內(nèi)得到了廣泛的應(yīng)用,具有良好的工程應(yīng)用前景.
而與前述領(lǐng)域相比,ADRC在機(jī)器人控制上的應(yīng)用目前還較少.Castaneda等[10]設(shè)計(jì)了基于ADRC的自適應(yīng)控制器,用以求解具有不確定動(dòng)力學(xué)模型的Delta并聯(lián)機(jī)器人的軌跡跟蹤問題.Nadhynee等[11]研究了基于擾動(dòng)估計(jì)的兩足機(jī)器人魯棒控制問題,提出了一種基于高增益類線性擴(kuò)展?fàn)顟B(tài)觀測(cè)器的魯棒控制器來實(shí)現(xiàn)擾動(dòng)消除.Castellanos等[12]基于ADRC設(shè)計(jì)了一種用于踝足矯形器(ankle foot orthosis,AFO)的步態(tài)跟蹤控制器.Yi Long等[13]提出了一種基于自抗擾控制的應(yīng)用于下肢康復(fù)外骨骼的步態(tài)跟蹤策略,數(shù)值仿真和實(shí)驗(yàn)結(jié)果均表明采用ADRC控制方法的康復(fù)系統(tǒng)能比傳統(tǒng)PID控制更準(zhǔn)確地跟蹤目標(biāo)的步態(tài).Ren等[14]針對(duì)協(xié)作機(jī)器人系統(tǒng)利用ESO提出了一種基于本體傳感器(編碼器和扭矩傳感器)的碰撞檢測(cè)方法.
以上研究展示了ADRC在機(jī)器人控制中的應(yīng)用潛力,但是對(duì)于具有高速、高精度要求的機(jī)器人關(guān)節(jié)控制器,控制參數(shù)整定等控制器設(shè)計(jì)方法上仍需要進(jìn)一步的研究.對(duì)機(jī)器人進(jìn)行動(dòng)力學(xué)前饋可以在提高穩(wěn)態(tài)、動(dòng)態(tài)性能的同時(shí)減少控制器設(shè)計(jì)和整定難度.機(jī)器人動(dòng)力學(xué)前饋方法主要可以分為兩類:一類是基于動(dòng)力學(xué)建模和動(dòng)力學(xué)參數(shù)辨識(shí)的計(jì)算力矩方式[15],如何構(gòu)建準(zhǔn)確的模型和設(shè)計(jì)有效的辨識(shí)算法是此類方法的關(guān)鍵;另一類是基于機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)方式[16],確保得到的系統(tǒng)穩(wěn)定和避免參數(shù)過學(xué)習(xí)是該類方法的重點(diǎn).本文將上述兩類方法進(jìn)行了結(jié)合,在動(dòng)力學(xué)建模和辨識(shí)的基礎(chǔ)上搭建了一個(gè)對(duì)建模誤差和不確定進(jìn)行補(bǔ)償?shù)纳疃壬窠?jīng)網(wǎng)絡(luò),以此來進(jìn)一步提高控制性能.
本文針對(duì)機(jī)器人關(guān)節(jié)控制器展開研究,提出了一種基于ADRC的機(jī)器人關(guān)節(jié)控制器,構(gòu)建Lyapunov函數(shù)證明了該控制器的穩(wěn)定性,基于遺傳算法(genetic algorithm,GA)完成了控制器參數(shù)的整定,在動(dòng)力學(xué)建模和參數(shù)辨識(shí)的基礎(chǔ)之上設(shè)計(jì)了一個(gè)多層感知器(multilayer perceptron,MLP)網(wǎng)絡(luò)以完成對(duì)動(dòng)力學(xué)建模不確定性的補(bǔ)償.最后,對(duì)提出的控制方法性能進(jìn)行了仿真分析和實(shí)驗(yàn)驗(yàn)證.
一個(gè)具有N自由度的串聯(lián)機(jī)器人如圖1所示.其動(dòng)力學(xué)模型可由以下的二階微分方程描述[17]:
圖1 N自由度串聯(lián)機(jī)器人模型Fig.1 Model of a N-joint robot
記x1=q,u=τ,則控制對(duì)象(1)可以描述為
為便于后續(xù)控制器設(shè)計(jì),下文忽略各關(guān)節(jié)間的耦合影響,采用模組設(shè)計(jì)思想對(duì)每個(gè)關(guān)節(jié)進(jìn)行獨(dú)立的控制器設(shè)計(jì).此時(shí)每個(gè)關(guān)節(jié)的控制對(duì)象均為如下形式:
自抗擾控制器主要由生成過渡過程(微分跟蹤器(tracking differentiator,TD))、擴(kuò)張觀測(cè)器(ESO)、誤差反饋律和擾動(dòng)補(bǔ)償這幾部分組成.以二階控制對(duì)象和三階擴(kuò)張觀測(cè)器為例,自抗擾控制器的結(jié)構(gòu)可由如圖2所示.
圖2 自抗擾控制器結(jié)構(gòu)Fig.2 Diagram of ADRC for second-order systems
圖中:v為期望輸入;u為系統(tǒng)控制輸入;uf為前饋補(bǔ)償輸入;y為系統(tǒng)實(shí)際輸出;v1為v的過渡過程;v2為過渡過程的微分;e1,e2為過渡過程信號(hào)與觀測(cè)信號(hào)的誤差函數(shù);u0為中間控制量;z1,z2,z3為系統(tǒng)狀態(tài)的觀測(cè)量;b0為增益參數(shù).
ADRC的離散表達(dá)如下:
1) 以控制目標(biāo)v0為輸入的TD微分器.
2) 以控制輸入量u和系統(tǒng)輸出y為輸入估計(jì)系統(tǒng)狀態(tài)和擾動(dòng)的擴(kuò)張狀態(tài)觀測(cè)器.
3) 誤差反饋律和系統(tǒng)擾動(dòng)補(bǔ)償:
其中:fhan為最速控制函數(shù),其具體形式可見文獻(xiàn)[5];h為系統(tǒng)采樣步長(zhǎng);r0為速度因子;g1(e),g2(e),g3(e)為擴(kuò)張觀測(cè)器反饋函數(shù);fcon(e1,e2)為控制律函數(shù);β01,β02,β03,b0為控制器參數(shù).
本文設(shè)計(jì)的ADRC控制器為機(jī)器人關(guān)節(jié)位置控制器,其輸出控制量為關(guān)節(jié)電機(jī)的期望力矩.將系統(tǒng)(3)中存在的非線性部分、動(dòng)態(tài)時(shí)變特性以及運(yùn)行過程中系統(tǒng)存在的擾動(dòng)整合為總擾動(dòng)
并將fw擴(kuò)張為新的系統(tǒng)狀態(tài)x3,此時(shí)系統(tǒng)擴(kuò)張為如下的線性控制系統(tǒng):
使用以下形式的三階線性ESO對(duì)擴(kuò)張系統(tǒng)進(jìn)行估計(jì)和觀測(cè):
結(jié)合TD跟蹤器和ESO觀測(cè)器,可得到以下表達(dá),其中:r1,r2為反饋律誤差函數(shù),e1,e2,e3為觀測(cè)誤差函數(shù).
由系統(tǒng)方程(7),ESO方程(8)和式(9)可得到如下線性觀測(cè)器誤差系統(tǒng):
定義如下系統(tǒng)狀態(tài)與給定信號(hào)的誤差函數(shù)s1,s2:
根據(jù)式(6),使用如下形式的誤差反饋控制律:
由式(7)(10)-(11),可得到誤差系統(tǒng)
定理1考慮對(duì)系統(tǒng)(7)構(gòu)建的ESO系統(tǒng)(8),在總擾動(dòng)fw連續(xù)可微的假設(shè)下[18],當(dāng)β01,β02,β03>0,β01β02>β03時(shí),可以保證該觀測(cè)器誤差系統(tǒng)是漸近穩(wěn)定的.
證記Y=E=[e1e2e3]T,ue=w,有
式中:
系統(tǒng)矩陣A的特征多項(xiàng)式為
當(dāng)β01,β02,β03>0,β01β02>β03時(shí),系統(tǒng)穩(wěn)定且狀態(tài)完全可控可觀,并有
根據(jù)文獻(xiàn)[3],提高β01,β02,β03可以減小對(duì)擴(kuò)張狀態(tài)的觀測(cè)誤差并提高觀測(cè)器的收斂速度,但相應(yīng)的觀測(cè)器對(duì)測(cè)量噪聲將更加敏感.在初步設(shè)計(jì)時(shí)可通過近似選取β01=3ωo,將參數(shù)調(diào)節(jié)轉(zhuǎn)換為觀測(cè)器帶寬ωo的選擇.
定理2考慮閉環(huán)系統(tǒng)(13),線性ESO(8)和誤差反饋控制律(12),通過調(diào)節(jié)合適的參數(shù)k1和k2,可以保證這個(gè)閉環(huán)系統(tǒng)(13)是大范圍一致漸近穩(wěn)定的.該定理的具體證明過程可見文獻(xiàn)[19].
根據(jù)文獻(xiàn)[4],k1,k2的調(diào)節(jié)原則可以與對(duì)應(yīng)的比例微分(proportion differential,PD)控制器整定過程類似,通過提高k1來加快響應(yīng)與減小殘差,通過提高k2來加快響應(yīng)與減小超調(diào),且越大系統(tǒng)的相對(duì)穩(wěn)定性越高.
從上節(jié)分析可知,與PID控制相比,ADRC的控制參數(shù)數(shù)量較多,TD跟蹤器中的參數(shù)有速度因子r0和濾波因子h0;ESO中的參數(shù)有β01,β02,β03,b0;誤差反饋律中的參數(shù)有k1,k2,b0.這些控制參數(shù)的選擇將對(duì)系統(tǒng)的控制性能產(chǎn)生較大的影響.
在這些參數(shù)中,速度因子r0和濾波因子h0可以根據(jù)實(shí)際控制器對(duì)快速性的需要和系統(tǒng)能提供的最大加速度進(jìn)行設(shè)置.
機(jī)器人關(guān)節(jié)控制器處于機(jī)器人控制架構(gòu)中的底層,故控制器參數(shù)整定應(yīng)盡可能的離線完成以減少在線調(diào)參可能帶來的風(fēng)險(xiǎn).下文在對(duì)ESO和誤差反饋律的控制參數(shù)設(shè)計(jì)時(shí)依據(jù)ADRC的分離性原理,即先基于系統(tǒng)響應(yīng)分別完成對(duì)擴(kuò)張觀測(cè)器和誤差反饋律進(jìn)行設(shè)計(jì),再根據(jù)完整閉環(huán)系統(tǒng)進(jìn)行參數(shù)的調(diào)整.
本文利用遺傳算法(GA)對(duì)剩余控制參數(shù)進(jìn)行離線優(yōu)化以實(shí)現(xiàn)最優(yōu)控制,該過程僅需要基于一能實(shí)現(xiàn)系統(tǒng)穩(wěn)定運(yùn)動(dòng)的激勵(lì)源.本文的激勵(lì)源為一簡(jiǎn)單設(shè)計(jì)的PID控制器(由于該控制器只需要考慮穩(wěn)定性,故設(shè)計(jì)和實(shí)現(xiàn)十分容易)完成系統(tǒng)響應(yīng)數(shù)據(jù)的采集.完整的參數(shù)設(shè)計(jì)過程如下:
算法1ADRC控制參數(shù)優(yōu)化過程:
1) 設(shè)計(jì)一穩(wěn)定的激勵(lì)源(文中為PID控制器0);
2) 采集在控制器0運(yùn)行下系統(tǒng)的控制輸入和系統(tǒng)響應(yīng);
3) 根據(jù)2)中結(jié)果離線優(yōu)化ESO參數(shù);
4) 根據(jù)2)中結(jié)果離線學(xué)習(xí)系統(tǒng)模型;
5) 基于3)-4)中獲得結(jié)果離線優(yōu)化誤差反饋律參數(shù);
6) 將上述離線優(yōu)化得到的參數(shù)根據(jù)閉環(huán)響應(yīng)進(jìn)行調(diào)整.
在ESO參數(shù)設(shè)計(jì)中使用遺傳算法進(jìn)行離線優(yōu)化,優(yōu)化變量為β01,β02,β03,b0,ESO的目標(biāo)是通過輸出信號(hào)根據(jù)控制輸入信號(hào)重構(gòu)系統(tǒng)狀態(tài),為使得獲得的ESO具有快速估計(jì)系統(tǒng)狀態(tài)的能力,對(duì)于文中系統(tǒng),其觀測(cè)狀態(tài)為關(guān)節(jié)角度、關(guān)節(jié)角速度和關(guān)節(jié)角加速度.因此一個(gè)良好的ESO將同時(shí)具有更小的角度觀測(cè)誤差和角速度觀測(cè)誤差,故在此使用誤差絕對(duì)值積分J1作為優(yōu)化指標(biāo)
單純使用J1作為優(yōu)化目標(biāo)可能導(dǎo)致過大的ESO參數(shù)β01,β02,β03,這意味著過高的觀測(cè)帶寬.由于學(xué)習(xí)數(shù)據(jù)為PID控制下的實(shí)驗(yàn)結(jié)果,故ESO的最大加速度補(bǔ)償輸出應(yīng)與PID控制量較為一致,為了提高得到的ESO對(duì)噪聲的抑制能力并使優(yōu)化中控制參數(shù)不會(huì)無限制增長(zhǎng),使用J2對(duì)優(yōu)化函數(shù)進(jìn)行正則
將上述指標(biāo)函數(shù)進(jìn)行加權(quán)組合,得到系統(tǒng)目標(biāo)優(yōu)化函數(shù)J為
則該優(yōu)化問題可由下式表述:
類似地,在誤差反饋律參數(shù)設(shè)計(jì)中構(gòu)建的優(yōu)化函數(shù)Je為
其中:J1主要反映了整個(gè)過程的快速性,J2體現(xiàn)了跟蹤過程的超調(diào)量,J3反映了最終的穩(wěn)態(tài)誤差,一個(gè)良好的控制律應(yīng)使被控對(duì)象同時(shí)具有快速性、小超調(diào)和低穩(wěn)態(tài)誤差.相應(yīng)的優(yōu)化問題為
本文的建模過程采用Lagrange方法,通過構(gòu)建參數(shù)集將式(1)的動(dòng)力學(xué)模型轉(zhuǎn)化為如下的基本參數(shù)集表述形式:
式中:KKK∈Rm×1(m <10n)為基本參數(shù)集;∈Rn×m為對(duì)應(yīng)的回歸矩陣;τf∈Rn×1為關(guān)節(jié)摩擦力矩.文中采用的關(guān)節(jié)摩擦模型為如下的庫侖-粘性摩擦形式:
參數(shù)辨識(shí)的目標(biāo)即為利用機(jī)器人跟蹤激勵(lì)軌跡的過程數(shù)據(jù)估計(jì)出基本參數(shù)集KKK和摩擦參數(shù)集{fc,fw},參數(shù)辨識(shí)過程詳見文獻(xiàn)[20].
實(shí)驗(yàn)中采用的激勵(lì)軌跡為基頻0.01 Hz,20階次疊加的傅里葉軌跡,實(shí)驗(yàn)使用的6自由度機(jī)器人(圖7所示)模型的基本參數(shù)集維度為22,摩擦參數(shù)集的維度為12.實(shí)驗(yàn)中關(guān)節(jié)輸出扭矩是通過測(cè)量關(guān)節(jié)電流而間接獲得的,該轉(zhuǎn)換操作已由設(shè)備廠商封裝好,實(shí)際上位機(jī)中可直接從數(shù)據(jù)幀中得到各關(guān)節(jié)的力矩值.
實(shí)驗(yàn)中使用滑動(dòng)平均法進(jìn)行辨識(shí)前的數(shù)據(jù)預(yù)處理,整個(gè)模型辨識(shí)過程在MATLAB環(huán)境下離線完成,對(duì)一次實(shí)驗(yàn)數(shù)據(jù)進(jìn)行辨識(shí)的時(shí)間消耗大約為25 min,使用多組辨識(shí)軌跡的辨識(shí)平均值作為最終的辨識(shí)模型.辨識(shí)結(jié)果如圖3所示.
采用關(guān)節(jié)誤差力矩的均方根誤差E1和最大關(guān)節(jié)誤差力矩比E2作為辨識(shí)精度指標(biāo),它們分別反映了平均辨識(shí)精度和最大辨識(shí)誤差水平,其定義如下:
式中:τr(i)為第i個(gè)數(shù)據(jù)點(diǎn)的測(cè)量力矩值,τp(i)為該點(diǎn)對(duì)應(yīng)的預(yù)測(cè)力矩值.參數(shù)辨識(shí)結(jié)果如表1所示,其中均方根誤差E1的單位為Nm,最大關(guān)節(jié)誤差力矩比E2為無量綱的比值.
圖3 關(guān)節(jié)力矩預(yù)測(cè)值與測(cè)量值Fig.3 Prediction and measurement of the joint torque
表1 參數(shù)辨識(shí)結(jié)果Table 1 Parameter identification results
上述辨識(shí)誤差主要來源于建模誤差、系統(tǒng)中難以建模部分和參數(shù)的不確定性.為減少補(bǔ)償誤差、進(jìn)一步提高控制性能,本文構(gòu)建了一個(gè)MLP補(bǔ)償網(wǎng)絡(luò)來完成對(duì)關(guān)節(jié)誤差力矩的實(shí)時(shí)估計(jì)與補(bǔ)償.該網(wǎng)絡(luò)的輸入為一定時(shí)間T內(nèi)(實(shí)驗(yàn)中為連續(xù)10個(gè)采樣周期)的各關(guān)節(jié)位置、速度信息,輸出為各關(guān)節(jié)相應(yīng)的誤差補(bǔ)償力矩.
基于辨識(shí)模型和MLP補(bǔ)償網(wǎng)絡(luò)的完整補(bǔ)償流程如圖4所示,最終獲得的動(dòng)力學(xué)前饋力矩τfw為辨識(shí)模型的計(jì)算力矩τ1和MLP網(wǎng)絡(luò)補(bǔ)償力矩τ2之和,即τfw=τ1+τ2.這種方式可以結(jié)合動(dòng)力學(xué)建模具有的可靠性及物理意義和深度神經(jīng)網(wǎng)絡(luò)具有的強(qiáng)大學(xué)習(xí)能力,減少神經(jīng)網(wǎng)絡(luò)所需的輸出值和學(xué)習(xí)負(fù)擔(dān)以及神經(jīng)元產(chǎn)生飽和的可能.
該MLP補(bǔ)償網(wǎng)絡(luò)的具體結(jié)構(gòu)如圖5所示.該網(wǎng)絡(luò)擁有4個(gè)隱層,層間均加有Dropout以減少過學(xué)習(xí),激活函數(shù)均為Relu 形式,共計(jì)24,710個(gè)學(xué)習(xí)參數(shù).該網(wǎng)絡(luò)在單個(gè)GPU環(huán)境下網(wǎng)絡(luò)訓(xùn)練時(shí)間約為1 h,對(duì)輸入進(jìn)行一次預(yù)測(cè)的時(shí)耗約45 μs.
圖4 動(dòng)力學(xué)前饋補(bǔ)償流程Fig.4 Dynamic feedforward compensation process
圖5 MLP補(bǔ)償網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Structure of MLP network
對(duì)相同測(cè)試數(shù)據(jù)同樣采用關(guān)節(jié)誤差力矩的均方根誤差E1和最大關(guān)節(jié)誤差力矩比E2作為精度指標(biāo),結(jié)果如表2所示.
表2 采用MLP補(bǔ)償后結(jié)果Table 2 Results using MLP compensation
從表中結(jié)果可知,采用MLP補(bǔ)償網(wǎng)絡(luò)后各關(guān)節(jié)誤差力矩的均方根誤差E1得到小幅優(yōu)化(約0.1~0.4 Nm),而各關(guān)節(jié)最大誤差力矩比E2均得到較大程度的改善(10%~30%),可見使用MLP補(bǔ)償網(wǎng)絡(luò)可以在不過度增加計(jì)算時(shí)間消耗的前提下減小辨識(shí)誤差,使補(bǔ)償力矩的可信度和精度均得到了提高.
仿真環(huán)境為MATLAB Simulink,在仿真中使用的模型物理參數(shù)為D=4,C=0.01,I=3.7.廣義擾動(dòng)項(xiàng)d由d1,d2,d33部分構(gòu)成,其中:d1為摩擦項(xiàng);d2為噪聲項(xiàng);d3為施加的系統(tǒng)擾動(dòng)項(xiàng),在仿真過程中擾動(dòng)項(xiàng)d1,d2總是存在,控制力矩輸出限制為15 Nm.GA優(yōu)化參數(shù)中種群大小為400,最大迭代次數(shù)為400,交叉率為0.8,變異率為0.2,個(gè)體遷移率為0.2.ESO優(yōu)化權(quán)值為λ1=1,λ2=2,控制律優(yōu)化權(quán)值為λ1=1,λ2=1.5,λ3=100,利用相同的優(yōu)化目標(biāo)函數(shù)和優(yōu)化參數(shù)分別對(duì)PID控制器和ADRC控制器進(jìn)行參數(shù)優(yōu)化設(shè)計(jì).
當(dāng)不存在系統(tǒng)擾動(dòng)項(xiàng)d3,跟蹤的期望軌跡為幅值等于10°的階躍信號(hào)時(shí),仿真結(jié)果如圖6(a)所示.從仿真結(jié)果可知,使用文中設(shè)計(jì)的ADRC控制器可以獲得比bang-bang控制器和PID控制器更好的控制效果,在實(shí)現(xiàn)關(guān)節(jié)快速穩(wěn)定的軌跡跟蹤的同時(shí)具有良好的控制精度.
圖6 系統(tǒng)在不同擾動(dòng)下關(guān)節(jié)控制效果對(duì)比Fig.6 Joint trajectories of the robot under different forms of disturbance
圖6(b)-6(c)展示了上述控制器在系統(tǒng)施加有不同形式系統(tǒng)擾動(dòng)項(xiàng)d3下的控制效果.圖6(b)給出了在外部施加正弦擾動(dòng)力矩下系統(tǒng)的控制效果.圖6(c)給出了在系統(tǒng)存在內(nèi)部擾動(dòng)下控制器的控制效果.從仿真結(jié)果可知,文中設(shè)計(jì)的ADRC控制器具有很好的魯棒性和較強(qiáng)的擾動(dòng)抑制能力,不論該擾動(dòng)是外部擾動(dòng)還是內(nèi)部擾動(dòng).
通過仿真研究驗(yàn)證了所設(shè)計(jì)的關(guān)節(jié)ADRC控制器的可行性和抗擾能力,為進(jìn)一步考量該方法在工程應(yīng)用中的有效性與實(shí)用性,在機(jī)器人系統(tǒng)實(shí)驗(yàn)平臺(tái)上進(jìn)行驗(yàn)證.
實(shí)驗(yàn)中使用的機(jī)器人為圖7所示的大族6自由度機(jī)器人,使用具有RT內(nèi)核的ROS環(huán)境完成算法1 kHz的實(shí)時(shí)運(yùn)行,使用EtherCAT進(jìn)行通信.在數(shù)據(jù)采集階段采用的PID控制器參數(shù)為P=10,I=0.1,D=5.優(yōu)化過程和優(yōu)化中使用的各項(xiàng)參數(shù)與上節(jié)的仿真中一致.
圖7 六自由度實(shí)驗(yàn)機(jī)器人Fig.7 Six degrees of freedom experimental robot
實(shí)驗(yàn)中各關(guān)節(jié)的期望跟蹤軌跡信號(hào)為幅值大于10°的階躍函數(shù),經(jīng)過優(yōu)化設(shè)計(jì)得到的ADRC控制器與機(jī)器人自帶PID控制器的對(duì)比實(shí)驗(yàn)結(jié)果如圖8所示.
圖8 實(shí)驗(yàn)機(jī)器人關(guān)節(jié)控制效果對(duì)比Fig.8 Response performances for different controllers of experimental robot
圖8(a)給出了機(jī)器人各關(guān)節(jié)的控制效果對(duì)比情況,圖8(b)給出了在文中設(shè)計(jì)的ADRC控制器下機(jī)器人各關(guān)節(jié)的跟蹤誤差曲線,圖8(c)給出了機(jī)器人關(guān)節(jié)2和關(guān)節(jié)5在施加外擾動(dòng)力矩下的效果對(duì)比.由實(shí)驗(yàn)結(jié)果可知,文中的ADRC控制器能控制實(shí)際機(jī)器人在約0.7 s內(nèi)完成各關(guān)節(jié)大角度階躍信號(hào)的高速平穩(wěn)跟蹤,實(shí)現(xiàn)無超調(diào)的目標(biāo)關(guān)節(jié)角度轉(zhuǎn)換,控制穩(wěn)態(tài)精誤差在0.012°之內(nèi),同時(shí)在受擾動(dòng)下更快的完成擾動(dòng)補(bǔ)償.該控制器可以獲得比傳統(tǒng)PID控制器更好的控制效果,在實(shí)現(xiàn)關(guān)節(jié)大范圍快速穩(wěn)定軌跡跟蹤的同時(shí)具有良好的控制精度和更強(qiáng)的擾動(dòng)抑制能力.
本文利用自抗擾控制算法實(shí)現(xiàn)了機(jī)器人的關(guān)節(jié)控制,該算法具有不依賴系統(tǒng)模型,抗干擾能力強(qiáng),能兼顧動(dòng)態(tài)性能和穩(wěn)態(tài)精度,控制律設(shè)計(jì)較為簡(jiǎn)單等優(yōu)點(diǎn).針對(duì)受控機(jī)器人系統(tǒng)特性給出了一套實(shí)際控制器的完整設(shè)計(jì)方法與參數(shù)整定方法,根據(jù)控制指標(biāo)設(shè)計(jì)相應(yīng)優(yōu)化函數(shù)并利用GA算法完成了最優(yōu)控制參數(shù)的優(yōu)化,在對(duì)機(jī)器人進(jìn)行動(dòng)力學(xué)參數(shù)辨識(shí)的基礎(chǔ)上設(shè)計(jì)了一深度MLP網(wǎng)絡(luò)完成對(duì)建模不確定性的實(shí)時(shí)補(bǔ)償,提高了控制補(bǔ)償精度與系統(tǒng)動(dòng)態(tài)性能.仿真和實(shí)驗(yàn)結(jié)果均表明該控制算法能夠?qū)崿F(xiàn)機(jī)器人快速穩(wěn)定的軌跡跟蹤,具有良好的控制精度并有很強(qiáng)的抗干擾能力,此外該算法不依賴于精確的系統(tǒng)模型,對(duì)硬件系統(tǒng)的要求較低,能完成對(duì)機(jī)器人的實(shí)時(shí)控制,具有較強(qiáng)的工程應(yīng)用價(jià)值.下一步研究將完善對(duì)控制律和控制參數(shù)的優(yōu)化設(shè)計(jì),并研究控制器在特定作業(yè)任務(wù)下的控制效果.