稅 懿,楊永峰,向國菲,佃松宜*
(1. 四川大學(xué)電氣工程學(xué)院,四川 成都 610065;2. 國網(wǎng)浙江電力有限公司衢州供電公司,浙江 衢州324000)
隨著現(xiàn)代控制技術(shù)和計(jì)算機(jī)技術(shù)的發(fā)展,移動機(jī)器人開始在越來越多的領(lǐng)域發(fā)揮重要作用,如物流、化工、商場購物等領(lǐng)域。與車式移動機(jī)器人、差速移動機(jī)器人相比,四個麥克納姆輪全向移動機(jī)器人(four mecanum omnidirectional mobile robot,F(xiàn)MOMR)具有較高的移動性,在有限空間中移動方便,因此在足球機(jī)器人、倉庫搬運(yùn)機(jī)器人、移動機(jī)械手等領(lǐng)域得到了廣泛應(yīng)用[1,2]。然而,在實(shí)際應(yīng)用中,F(xiàn)MOMR必然會收到自身輪子磨損,非線性摩擦和外部干擾的影響,導(dǎo)致FMOMR無法實(shí)現(xiàn)精確跟蹤。因此,基于FMOMR設(shè)計(jì)的軌跡跟蹤控制器,必須要滿足較強(qiáng)的抗干擾能力。
近幾年,許多研究人員針對存在未知干擾的全向移動機(jī)器人設(shè)計(jì)滑??刂破?,其研究結(jié)果表明滑??刂破髂苡行б种仆獠繑_動[3]。為了減少滑??刂浦械竭_(dá)滑動面時間、降低抖振,將模糊控制與滑??刂葡嘟Y(jié)合,使設(shè)計(jì)的軌跡跟蹤控制器不依賴系統(tǒng)的模型且對干擾具有完全魯棒性[4],但是模糊滑??刂菩枰{(diào)試大量參數(shù)。另一方面,可以利用模糊能夠處理不確信息的能力設(shè)計(jì)模糊神經(jīng)網(wǎng)絡(luò)控制實(shí)現(xiàn)軌跡跟蹤[5],但是模糊神經(jīng)網(wǎng)絡(luò)控制器需要大量學(xué)習(xí),計(jì)算量大,不便于具體實(shí)現(xiàn)。
文獻(xiàn)[6]、[7]將模型預(yù)測控制與自適應(yīng)控制相結(jié)合,設(shè)計(jì)出廣義預(yù)測控制(generalized predictive control,GPC)算法,具有預(yù)測模型、滾動優(yōu)化和反饋校正等特點(diǎn),對開環(huán)不穩(wěn)定、非最小相位以及大時滯系統(tǒng)有很好控制效果[6,7]。但值得注意的是廣義預(yù)測控制只能有效抑制確定性的干擾,當(dāng)系統(tǒng)存在模型嚴(yán)重失配或未知干擾,如參數(shù)擾動、未建模動態(tài)等,控制精度會顯著降低。
為了解決這個問題,本文針對FMOMR提出基于擴(kuò)張狀態(tài)觀測器(extended state observer,ESO)的廣義預(yù)測控制算法,相較于文獻(xiàn)[6]、[7],所提出的方法能有效抑制未知干擾和參數(shù)攝動。
本文的貢獻(xiàn)主要有:1)設(shè)計(jì)基于ESO的廣義預(yù)測控制器,分別實(shí)現(xiàn)FMOMR在混合線性干擾和非線性干擾等未知干擾下的軌跡跟蹤控制。2)設(shè)計(jì)的軌跡跟蹤控制器與基于Kalman的廣義預(yù)測控制算法[8]比較,收斂速度更快,跟蹤效果更好。
利用TS模糊神經(jīng)網(wǎng)絡(luò)辨識得到一組TS模糊模型,然后通過加權(quán)求和的方式得到受控差分整合滑動平均自回歸(controlled autoregressive integrated moving average,CARIMA)模型[9]
A(z-1)y(k)=B(z-1)u(k-1)
(1)
其中y(k)、u(k-1)分別表示被控對象輸出輸入量,ξ(k)是均值為白噪聲,A(z-1)和B(z-1)是后移算子z-1的多項(xiàng)式,它們分別可以表示如下:
(2)
針對得到的多輸入多輸出系統(tǒng)的CARIMA模型(1),可以將其目標(biāo)函數(shù)表示為
(3)
其中N為預(yù)測時域,Nu為控制時域,λ為控制增量加權(quán)系數(shù),w(k+j)為參考軌跡。然后從當(dāng)前時刻尋找Nu步控制變量Δu(k+j-1),使系統(tǒng)在未來N步的預(yù)測輸出與給定參考軌跡的誤差最小。
為了使系統(tǒng)的輸出平滑的到達(dá)設(shè)定值,以減少過量的控制作用而引起振蕩,使當(dāng)前時刻的輸出可以平穩(wěn)收斂,通常選用如下一階滯后模型
w(k+j)=δy(k)+(1-δ)yr
(4)
其中0≤δ<1為柔化因子。
引入Diophantine矩陣的多項(xiàng)式方程得
I=Ej(z-1)A(z-1)Δ(z-1)+z-jFj(z-1)
(5)
Ej(z-1)B(z-1)=Gj(z-1)+z-jHj(z-1)
(6)
其中j=1,…,N,
式(1)兩邊同時乘以Ej(z-1),求解上式可得
(7)
將其寫成向量形式
(8)
其中
uT=[Δu(k)T,…,Δu(k+Nu-1)T]
然后,利用內(nèi)點(diǎn)法對目標(biāo)函數(shù)(3)求最優(yōu)解。
首先假定函數(shù)滿足
limτ→0+h(τ)=+∞
h(τ)>0,?τ>0
h(τ1)≥h(τ2),?τ1≤τ2
其中τi(u)≥0,i=1,…,m,τi(u)是目標(biāo)函數(shù)J(u)的不等式約束函數(shù)。
將h(τ)作為懲罰項(xiàng),取懲罰項(xiàng)函數(shù)為h(τ1)=ln[τi(u)],構(gòu)造內(nèi)點(diǎn)罰函數(shù)如下
(9)
則求解目標(biāo)函數(shù)(3)的問題變?yōu)榍蠼馊缦履繕?biāo)函數(shù)
(10)
假設(shè)J(u),ln[τi(u)]和Pζk(u)為凸函數(shù),則問題(10)的牛頓步長如下
dk=-[?2Pζk(uk)]-1?Pζk(uk)
(11)
如果uk+dk在可行域內(nèi),那么令uk+1=uk+dk,否則存在αk>0使得uk+αkdk正好處在可行域邊界上,這時令uk+1=uk+0.9αkdk,這樣uk+1總是內(nèi)點(diǎn)。
具體算法步驟如下:
1) 給定u1滿足τi(u)≥0,i=1,…,m;
使用內(nèi)點(diǎn)法求解后可以得到
(12)
其中f=HΔu(k-1)+Fy,令?P/?u=0,求得控制量u
u=(GTG+Iλ)-1(D+wGT-fGT)
(13)
取(GTG+Iλ)-1的第一行,并且將其第一行表示為PT=[P1,…,PN]。根據(jù)滾動優(yōu)化和反饋校正原理,廣義預(yù)測控制律可以寫成
Δu(k)=PT(D+wGT-fGT)
(14)
u(k+1)=u(k)+Δu(k)
(15)
圖1 控制系統(tǒng)框圖
提高FMOMR軌跡跟蹤控制抗擾性能的關(guān)鍵是增強(qiáng)廣義預(yù)測控制的魯棒性,由此采用擴(kuò)張狀態(tài)觀測器估計(jì)擾動[10]?;舅悸肥菍⑾到y(tǒng)中的未建模動態(tài)和外部擾動統(tǒng)一看作一個狀態(tài)量g(k),結(jié)合原有的狀態(tài)變量,將系統(tǒng)(1)擴(kuò)張成新的1階控制系統(tǒng)。對這個擴(kuò)張的系統(tǒng)構(gòu)造2階擴(kuò)張狀態(tài)觀測器(20),實(shí)時估計(jì)狀態(tài)量g(k),補(bǔ)償系統(tǒng)模型,從而提高系統(tǒng)的抗干擾性能。具體的設(shè)計(jì)過程如下:
考慮FMOMR參數(shù)攝動和外部擾動,F(xiàn)MOMR的CARIMA模型可以表示為
(A(z-1)+ΔA(z-1))y(k)
=(B(z-1)+ΔB(z-1))u(k-1)+xi(k)
(16)
式中,ΔA和ΔB表示FMOMR的參數(shù)攝動量,xi是外部擾動。令
g(k)=-ΔA(z-1)y(k)+ΔB(z-1)u(k-1)+xi(k)
(17)
其中g(shù)(k)代表總擾動向量,繼而式(16)可以表示為
A(z-1)y(k)=B(z-1)u(k-1)+g(k)
(18)
令x2=g(k)為擴(kuò)張的狀態(tài)量,g′(k)為擾動向量g(k)的變化率,則式(18)可以擴(kuò)張為
(19)
由此構(gòu)建擴(kuò)張狀態(tài)觀測器如下
(20)
其中β01、β02和h為ESO的設(shè)計(jì)參數(shù),z1為位姿坐標(biāo)y的估計(jì)值,z2為擾動向量g(k)的估計(jì)值。選擇適合的ESO參數(shù),可使z2≈g(k)。
(21)
將由擴(kuò)張狀態(tài)觀測器估計(jì)的擾動向量作為前饋補(bǔ)償控制,因此得到控制量為
(22)
顯而易見,新控制器與常規(guī)廣義預(yù)測控制器[6,7]式(15)相比,新增了擾動補(bǔ)償項(xiàng)z2/b0。該擾動補(bǔ)償項(xiàng)只需要原對象實(shí)時的輸入-輸出信息就可以通過構(gòu)建擴(kuò)張狀態(tài)觀測器得到,從而有效抑制參數(shù)攝動和外部未知擾動對系統(tǒng)的影響。
新控制器增強(qiáng)了傳統(tǒng)廣義預(yù)測控制器[6,7]的抗干擾性能,彌補(bǔ)了傳統(tǒng)廣義預(yù)測控制器缺乏抑制未知干擾能力的不足,又保留了GPC具有的預(yù)測模型、滾動優(yōu)化和反饋校正等優(yōu)點(diǎn),具體控制系統(tǒng)結(jié)構(gòu)框圖如圖1所示。
廣義預(yù)測控制和擴(kuò)張狀態(tài)觀測器的具體參數(shù)設(shè)計(jì)如表1所示:
表1 廣義預(yù)測控制和擴(kuò)張觀測器具體參數(shù)
為了更好的驗(yàn)證本文設(shè)計(jì)的GPC-ESO軌跡跟蹤控制器的跟蹤性能和抗擾性能,將其與GPC-Kalman[8]相比較,F(xiàn)MOMR參考軌跡是8字形軌跡。
圖2,圖3和圖4是GPC-ESO和GPC-Kalman在混合干擾下的軌跡跟蹤效果,混合干擾如下式
(23)
圖2 混合干擾情況下的跟蹤效果
圖3 混合干擾情況下的跟蹤效果
圖4 混合干擾情況下的誤差
可以看到,在混合干擾的情況下,GPC-ESO較GPC-Kalman都有比較好的跟蹤效果,在干擾類型轉(zhuǎn)換的節(jié)點(diǎn),GPC-ESO較GPC-Kalman抑制干擾的效果更好,收斂速度更快。
圖5,圖6和圖7是GPC-ESO和GPC-Kalman在非線性干擾xi=5*sin(t/150)*cos(t/300)情況下的軌跡跟蹤控制效果。
圖5 非線性干擾情況下的跟蹤效果
圖6 非線性干擾情況下的跟蹤效果
圖7 非線性干擾情況下的誤差
可以看到在非線性干擾情況下,GPC-ESO較GPC-Kalman算法的抑制干擾的效果更好,且收斂速度更快。
表2顯示了在不同干擾情況下兩種控制方法的軌跡跟蹤結(jié)果??梢钥吹綗o論是RMSE,SMPAE,還是NRMSE的誤差評價(jià)指標(biāo)下,本文提出的GPC-ESO的軌跡跟蹤誤差都小于GPC-Kalman的軌跡跟蹤誤差,所以GPC-ESO的抗干擾性能更好。
表2 GPC-ESO和GPC-Kalman分別在混合干擾和非線性干情況下跟蹤8字形曲線的RMSE、SMAPE、NRMSE
本文針對FMOMR在參數(shù)攝動和外部未知干擾情況下的軌跡跟蹤問題,提出基于擴(kuò)張狀態(tài)觀測器的廣義預(yù)測控制策略,通過仿真研究分析,主要有以下結(jié)論:
1)設(shè)計(jì)的擴(kuò)張狀態(tài)觀測器,能實(shí)時補(bǔ)償各種未知干擾,包括混合線性干擾和非線性干擾。
2)設(shè)計(jì)的GPC-ESO控制律,能有效抑制參數(shù)攝動和外部干擾,當(dāng)軌跡跟蹤過程中擾動發(fā)生突變時,該控制律能使系統(tǒng)快速收斂,實(shí)現(xiàn)軌跡跟蹤。
3)在對比仿真研究中,通過誤差性能指標(biāo)定量分析2種不同控制策略的跟蹤控制性能,可以得出,所提出的控制策略具有更好的抗干擾能力。