彭金柱,卞英楠,周樹亮(鄭州大學(xué) 電氣工程學(xué)院,河南 鄭州 450001)
在輪式機器人系統(tǒng)的軌跡跟蹤控制中,對系統(tǒng)中非線性不確定性的處理,提出了諸如PID[1]、自適應(yīng)、魯棒控制[2-3]、滑模控制[4]等不同的單一方法.但是,單一的控制策略無法取得理想的結(jié)果.因此,近年來,國內(nèi)外學(xué)者開始提出混合控制的方案.例如,在不校準(zhǔn)攝像機視覺參數(shù)的前提下,孫妍等[5]利用視覺反饋信息并結(jié)合模糊控制的方法對移動機器人線速度和角速度進行控制,仿真結(jié)果證明了該方法的有效性.Spandan等[6]構(gòu)思了一種將滑??刂婆c延時控制相結(jié)合的方法,將二者取長補短,最后基于仿真與單一的滑模控制對比,顯示了不錯的效果.為了使誤差在有限時間內(nèi)收斂,張揚名等[7]先采用有限時間控制方法,設(shè)計連續(xù)狀態(tài)反饋角速度的控制律,在前向角誤差趨于零時,結(jié)合反演設(shè)計的滑??刂萍夹g(shù),給出平面坐標(biāo)跟蹤誤差線速度的控制律并取得不錯的跟蹤效果.基于切換灰色預(yù)測的方法,Wong等[8]設(shè)計了模糊跟蹤系統(tǒng).在處理不確定環(huán)境下的機器人應(yīng)用上具有不錯的靈活性.為了減弱滑??刂频亩墩?,Yi[9]將情感學(xué)習(xí)算法與滑??刂扑惴ńY(jié)合,同模糊滑??刂萍耙话慊?刂茖Ρ龋炞C了所提算法的優(yōu)良性.考慮到機器人位置難以測量,Wang等[10]將視覺監(jiān)督系統(tǒng)與自適應(yīng)算法相結(jié)合,設(shè)計了一種能滿足機器人實時軌跡跟蹤的控制器.考慮機器人速度不可測量的情形,Shojaei等[11]利用動態(tài)表面控制方法減少了設(shè)計的復(fù)雜性,同時結(jié)合狀態(tài)觀測器,針對存在建模不確定性的機器人系統(tǒng)提出了新的控制規(guī)律.針對包含參數(shù)和非參數(shù)不確定性下的非完整機器人系統(tǒng),一種魯棒自適應(yīng)時變控制方法被Shojaei等[12]設(shè)計出來.
雖然上述研究取得了不錯的跟蹤效果,但都要求系統(tǒng)的慣性矩陣、重力矩陣以及哥氏力矩陣的精確模型全部已知,或者至少知道其中兩個.而筆者所提的混合控制策略僅僅需要知道系統(tǒng)的精確慣性矩陣.當(dāng)考慮外界干擾存在的情況下,Hwang等[13]提出了一種最優(yōu)H∞控制并取得較好的效果.考慮外擾是有上界的情形,Khalaji等[14]結(jié)合了魯棒控制與自適應(yīng)控制設(shè)計了新的控制器,與反饋線性化動態(tài)控制器對比,取得了更好的效果.
彭金柱等[15]設(shè)計了一種結(jié)合遞歸模糊神經(jīng)網(wǎng)絡(luò)和魯棒H∞控制的方法,并將其用于完整約束的機械臂跟蹤控制.借鑒該設(shè)計思想,筆者提出了一種將對角遞歸神經(jīng)網(wǎng)絡(luò)(DRNN)和魯棒H∞控制相結(jié)合的方法,并將其應(yīng)用于非完整約束的輪式移動機器人軌跡跟蹤控制.在系統(tǒng)僅僅滿足慣性矩陣是標(biāo)稱的而其他標(biāo)稱矩陣未知的情形下,利用DRNN神經(jīng)網(wǎng)絡(luò)逼近系統(tǒng)的非線性項.而且,魯棒H∞控制方法能夠保證系統(tǒng)在外界擾動僅僅積分有界的情形下仍能滿足特定的跟蹤性能.基于Lyapunov穩(wěn)定性理論證明了所設(shè)計的控制系統(tǒng)閉環(huán)穩(wěn)定.此外,與上述文獻中基于小車的動力學(xué)研究不同,筆者從小車的左右輪轉(zhuǎn)角度考慮.
遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的最大特點是網(wǎng)絡(luò)中有一個或多個反饋回路,這使得網(wǎng)絡(luò)具有良好的動態(tài)性能.筆者采用的對角遞歸神經(jīng)網(wǎng)絡(luò)(DRNN)是將ELMAN網(wǎng)絡(luò)的反饋層和隱含層簡化為對角陣形式,因而網(wǎng)絡(luò)結(jié)構(gòu)得到極大簡化,同時提高了網(wǎng)絡(luò)實時性,加快了學(xué)習(xí)速度,更有利于系統(tǒng)在線學(xué)習(xí),它的基本結(jié)構(gòu)如圖1所示.由圖1可知,這是一個m維輸入n維輸出的DRNN網(wǎng)絡(luò),它的輸入/輸出向量的動態(tài)映射關(guān)系為:
(1)
式中:xm(t)是網(wǎng)絡(luò)的第m個輸入;sj(t)是隱含層第j個神經(jīng)元的輸入;hj(t)是輸出層第j個神經(jīng)元的輸出;yn(t)是輸出層第n個神經(jīng)元的輸出.令W1、Wh及W分別代表輸入層、隱含層及輸出層的連接權(quán)值矩陣.并將W1、Wh矩陣元素全部設(shè)為1,即輸入層與隱含層的連接權(quán)重全部取為1,反饋層的權(quán)重也全部取為1.網(wǎng)絡(luò)隱含層的激活函數(shù)取Sigmoid函數(shù)以及平移后的Sigmoid函數(shù),輸出層函數(shù)為線性函數(shù).設(shè)H(·)=[h1(t),h2(t),…,hm(t)]T,Y=[y1,y2,…,yn]T,則DRNN神經(jīng)網(wǎng)絡(luò)的輸出可以表示為:
Y=WTH(·),
(2)
圖1 DRNN神經(jīng)網(wǎng)絡(luò)Fig.1 DRNN neural network
對于一個兩輪非完整約束移動機器人系統(tǒng),考慮外擾的情況下,它的動力學(xué)方程:
(3)
(4)
(5)
(6)
如果不考慮系統(tǒng)建模誤差及外擾的存在,根據(jù)控制力矩法(CTC方法),可以設(shè)計如下控制律:
(7)
(8)
選擇合適的Kv、Kp即可保證系統(tǒng)閉環(huán)穩(wěn)定,然而實際系統(tǒng)不可能精確建模和忽視外擾的存在,因此有,
(9)
假設(shè)移動機器人系統(tǒng)中,只有慣性矩陣的標(biāo)稱模型已知,而其他部分則未知.然后,利用DRNN神經(jīng)網(wǎng)絡(luò)快速逼近能力來逼近Τ(xe),即
Τ(xe)=W*TH(·)+ε,
(10)
式中:W*表示最優(yōu)值矩陣;H(·)表示DRNN神經(jīng)網(wǎng)絡(luò)的隱層輸出;ε表示網(wǎng)絡(luò)的逼近誤差項.假設(shè)存在ΩW并滿足ΩW={W∈Rm×n:‖W‖≤MW},且最優(yōu)網(wǎng)絡(luò)權(quán)值W*能落在緊集ΩW中,可表示為W*=argmin{sup|Τ(xe)-WTH(·)|}.針對移動機器人系統(tǒng),現(xiàn)設(shè)計如下控制器:
(11)
其中,u為魯棒控制項,用來補償系統(tǒng)的外部擾動及神經(jīng)網(wǎng)絡(luò)逼近存在的誤差.將式(10)、(11)代入式(5),化簡后得,
(12)
(13)
系統(tǒng)的狀態(tài)空間方程為:
(14)
定理1對于機器人系統(tǒng)式(5),若滿足假設(shè)1,且存在正定對稱矩陣P=PT>0,滿足如下Riccati方程
(15)
式中:R=RT>0為H∞控制增益;Q=QT>0為正定對稱矩陣;In×n為單位矩陣;γ>0為干擾抑制指標(biāo).對于式(12),令
(16)
DRNN神經(jīng)網(wǎng)絡(luò)參數(shù)的自適應(yīng)學(xué)習(xí)算法為:
(17)
其中,Γ為正定對角增益矩陣.那么系統(tǒng)可以滿足如下兩個目標(biāo):①所設(shè)計的魯棒混合控制系統(tǒng)中的狀態(tài)變量一致有界.②系統(tǒng)能夠滿足如下H∞跟蹤性能:
(18)
證明選取如下Lyapunov函數(shù),
(19)
對上式兩邊進行微分,并將式(14)代入后得
(20)
(21)
對上式兩邊從t=0到t=T積分得
(22)
(23)
因此,式(18)所提的H∞跟蹤性能得以滿足.根據(jù)假設(shè)1,存在σd>0使得‖δ‖≤σd,則有
(24)
(25)
因此,閉環(huán)系統(tǒng)的所有狀態(tài)變量一致有界.
結(jié)論2在大多數(shù)已有的文獻[13-15]中,干擾是假設(shè)有確切上界的,此時可以通過選擇合適的增益矩陣,利用變結(jié)構(gòu)控制、自適應(yīng)控制等魯棒控制算法即可保證系統(tǒng)穩(wěn)定.然而,實際情況中干擾的上界確切值可能無法精確獲知.因此,筆者假設(shè)干擾是滿足能量有界的,通過文中所提的算法可以在干擾上界未知的情況下使得系統(tǒng)能滿足特定的跟蹤性能.
(26)
仿真結(jié)果如圖2、3、4所示.
由圖2、3可知,設(shè)計的新方法在從t=0s到t=30 s的整個跟蹤過程中,左輪右輪的轉(zhuǎn)角跟蹤誤差是小于CTC方法的.尤為突出的是,從圖2、3可以明顯看出期望軌跡在t=10 s和t=20 s左右處發(fā)生變化時,所設(shè)計的方法與CTC方法的跟蹤誤差發(fā)生了變化,但設(shè)計的新方法誤差抖動明顯小于CTC方法,具有更好的魯棒適應(yīng)性.同時,從圖4可知,DRNN神經(jīng)網(wǎng)絡(luò)的權(quán)值最終能穩(wěn)定在最優(yōu)值.而且在面對同樣的外擾下,所設(shè)計的方法能滿足特定的跟蹤性能.
圖2 小車兩輪的轉(zhuǎn)角跟蹤曲線Fig.2 Tracking curve of two wheels
圖3 小車兩輪的轉(zhuǎn)角跟蹤誤差曲線Fig.3 The tracking errors of two wheels
圖4 DRNN網(wǎng)絡(luò)權(quán)重的變化曲線Fig.4 The curve of weight in DRNN network
針對非完整約束的輪式移動機器人,筆者提出了一種具有全局穩(wěn)定性能的魯棒跟蹤控制結(jié)構(gòu).它結(jié)合了DRNN神經(jīng)網(wǎng)絡(luò)和H∞控制方法.理論分析表明它對逼近誤差的強魯棒性以及對能量有界但不可測量的外擾具有抑制作用.此外,閉環(huán)系統(tǒng)所有的狀態(tài)變量能夠保證有界.仿真結(jié)果表明,所提算法比控制力矩法具有更好的跟蹤性能.而如何提高實際的硬件仿真效果是下一步研究的內(nèi)容.