李小華,王傲翔,劉曉平
(1.遼寧科技大學(xué)電子與信息工程學(xué)院,遼寧鞍山 114051;2.湖首大學(xué)工程學(xué)院,加拿大安大略桑德貝P7B 5E1)
板球系統(tǒng)作為一個(gè)典型的欠驅(qū)動(dòng)非線性系統(tǒng),其復(fù)雜的非線性特性與強(qiáng)耦合特性引起了廣大學(xué)者的研究興趣.它不僅可以用來(lái)檢驗(yàn)控制算法的有效性,而且對(duì)它的研究成果可以推廣到諸如工業(yè)機(jī)器人與衛(wèi)星定位等實(shí)際非線性系統(tǒng)中,具有重要的理論與實(shí)際意義.
為了對(duì)板球系統(tǒng)進(jìn)行精確控制,就要對(duì)其進(jìn)行精確地建模.關(guān)于板球系統(tǒng)的建模,目前已有大量研究,如文獻(xiàn)[1–4].這些研究主要可以分為兩類(lèi):一類(lèi)是運(yùn)用機(jī)理建模法進(jìn)行建模,如文獻(xiàn)[1–3];另一類(lèi)是采用模糊推理建模法建立板球系統(tǒng)的數(shù)學(xué)模型,見(jiàn)文獻(xiàn)[4].但是在以往的板球系統(tǒng)建模研究中,均未考慮系統(tǒng)受到的隨機(jī)因素影響.并且目前對(duì)板球系統(tǒng)的控制研究,都是在上述兩類(lèi)建模結(jié)果的基礎(chǔ)上進(jìn)行的.
對(duì)板球系統(tǒng)的控制研究主要可以分為以下幾類(lèi):1)在不考慮精確數(shù)學(xué)模型的情況下,采用PID方法或模糊控制進(jìn)行鎮(zhèn)定或跟蹤控制,但存在控制精度低的問(wèn)題[5–7].2)針對(duì)簡(jiǎn)化的線性化數(shù)學(xué)模型,設(shè)計(jì)系統(tǒng)的跟蹤控制器與鎮(zhèn)定控制器,見(jiàn)文獻(xiàn)[8–9].其中,文獻(xiàn)[9]針對(duì)系統(tǒng)受到外部干擾的情況設(shè)計(jì)了H∞干擾抑制鎮(zhèn)定控制器,提高了系統(tǒng)的魯棒性.3)針對(duì)忽略了系統(tǒng)耦合與球板之間摩擦力而得到的非線性系統(tǒng)模型,設(shè)計(jì)了板球系統(tǒng)的軌跡跟蹤控制器[10–11].4)在忽略系統(tǒng)摩擦力的情況下,考慮了耦合因素對(duì)系統(tǒng)的影響設(shè)計(jì)了系統(tǒng)的軌跡跟蹤控制器[12–13].5)同時(shí)考慮摩擦力與耦合對(duì)系統(tǒng)的影響[3,14–17].其中,文獻(xiàn)[13–14]設(shè)計(jì)了摩擦力觀測(cè)器,并通過(guò)假設(shè)平板的角速度已知將耦合項(xiàng)作為已知項(xiàng)進(jìn)行處理,并將平板角度作為被控制量,忽視了系統(tǒng)的欠驅(qū)動(dòng)特性.在文獻(xiàn)[15]中,假設(shè)系統(tǒng)的耦合、摩擦與不確定性項(xiàng)小于一個(gè)正常數(shù),將其視為綜合干擾來(lái)設(shè)計(jì)系統(tǒng)的滑模控制器,實(shí)現(xiàn)了系統(tǒng)的鎮(zhèn)定與跟蹤控制.文獻(xiàn)[16–17]將包含摩擦力和耦合項(xiàng)等不確定項(xiàng)的系統(tǒng)綜合函數(shù)使用擴(kuò)張狀態(tài)觀測(cè)器進(jìn)行估計(jì),設(shè)計(jì)了系統(tǒng)的跟蹤控制器.上述研究均未考慮板球系統(tǒng)受到的隨機(jī)激勵(lì)影響,難以達(dá)到高精度的控制要求.因?yàn)樵趯?shí)際中,機(jī)械系統(tǒng)都會(huì)受隨機(jī)激勵(lì)的影響[18],為了更貼合實(shí)際情況,進(jìn)一步提高控制精度,研究系統(tǒng)在隨機(jī)激勵(lì)下的控制方法有著重要的實(shí)際意義.
針對(duì)一類(lèi)含隨機(jī)激勵(lì)的機(jī)械系統(tǒng),文獻(xiàn)[19–20]運(yùn)用拉格朗日方法建立了系統(tǒng)的隨機(jī)數(shù)學(xué)模型.在隨機(jī)建模的基礎(chǔ)上,一類(lèi)文獻(xiàn)采用backstepping方法設(shè)計(jì)了系統(tǒng)的自適應(yīng)跟蹤控制器[20–21].近幾年,憑借著快速的收斂性和較強(qiáng)的魯棒性,有限時(shí)間控制受到了廣大學(xué)者的關(guān)注.文獻(xiàn)[22]首次提出了隨機(jī)系統(tǒng)有限時(shí)間穩(wěn)定性理論,解決了當(dāng)系統(tǒng)函數(shù)滿足線性增長(zhǎng)條件時(shí)的有限時(shí)間控制問(wèn)題.而對(duì)于系統(tǒng)難以滿足線性增長(zhǎng)條件時(shí),文獻(xiàn)[23]首次提出了隨機(jī)系統(tǒng)實(shí)際有限時(shí)間穩(wěn)定性理論,使得系統(tǒng)能夠達(dá)到有限時(shí)間有界穩(wěn)定.但據(jù)作者所知,目前對(duì)板球系統(tǒng)的研究尚未有考慮有限時(shí)間控制的問(wèn)題.
為了保證系統(tǒng)在穩(wěn)定前提下還能兼顧暫態(tài)性能,預(yù)設(shè)性能方法被廣泛應(yīng)用于非線性系統(tǒng)的控制中[24–27].通過(guò)選取合適的誤差轉(zhuǎn)換與預(yù)設(shè)性能函數(shù)可以使得系統(tǒng)的跟蹤誤差被限制在給定的界內(nèi),來(lái)很好地提升系統(tǒng)的瞬態(tài)控制效果.但傳統(tǒng)預(yù)設(shè)性能方法一般都是在控制器設(shè)計(jì)前進(jìn)行誤差轉(zhuǎn)換時(shí)已經(jīng)默認(rèn)系統(tǒng)的誤差是有界的[24–25],這是不合理的.這一問(wèn)題在文獻(xiàn)[26]中通過(guò)新的設(shè)計(jì)思路得以解決,不需要預(yù)先使用誤差轉(zhuǎn)換.更進(jìn)一步,文獻(xiàn)[27]將有限時(shí)間和預(yù)設(shè)性能相結(jié)合,提出了一種新的有限時(shí)間預(yù)設(shè)性能函數(shù),通過(guò)給出的性能函數(shù)進(jìn)行控制器設(shè)計(jì)可以使得系統(tǒng)的跟蹤誤差在任意設(shè)定的停息時(shí)間內(nèi)收斂到給定的界內(nèi),并且停息時(shí)間與初始狀態(tài)無(wú)關(guān).但是,它也存在傳統(tǒng)預(yù)設(shè)性能的共性問(wèn)題.
基于以上分析,本文致力于研究板球系統(tǒng)在隨機(jī)激勵(lì)下的系統(tǒng)建模與有限時(shí)間預(yù)設(shè)性能跟蹤控制問(wèn)題.考慮到板球系統(tǒng)會(huì)受到某種隨機(jī)激勵(lì)力的影響,本文首次建立了板球系統(tǒng)的隨機(jī)數(shù)學(xué)模型,并借鑒了文獻(xiàn)[26]的設(shè)計(jì)思想及文獻(xiàn)[27]提出的有限時(shí)間預(yù)設(shè)性能函數(shù),采用一種新的預(yù)設(shè)性能推導(dǎo)方法,實(shí)現(xiàn)了板球系統(tǒng)運(yùn)動(dòng)軌跡的有限時(shí)間預(yù)設(shè)性能跟蹤控制.文中采用了全狀態(tài)預(yù)設(shè)性能約束設(shè)計(jì),不僅保證了系統(tǒng)跟蹤誤差被給定的有限時(shí)間預(yù)設(shè)性能函數(shù)限定,同時(shí)能夠保證系統(tǒng)其他誤差變量也能被給定的有限時(shí)間預(yù)設(shè)性能函數(shù)限定,并且能夠在一定程度上減小控制信號(hào)的大小.值得注意的是,由于實(shí)際系統(tǒng)不可避免的都會(huì)存在控制器飽和現(xiàn)象[28–29].本文在系統(tǒng)控制器設(shè)計(jì)過(guò)程中,同時(shí)考慮了控制器的飽和,并考慮了外部干擾對(duì)系統(tǒng)的影響.所設(shè)計(jì)控制器能夠保證具有輸入飽和的板球系統(tǒng)是實(shí)際有限時(shí)間穩(wěn)定的,并且跟蹤誤差能夠在給定的停息時(shí)間內(nèi)收斂到事先給定的界內(nèi).
本文主要?jiǎng)?chuàng)新點(diǎn):1)考慮隨機(jī)激勵(lì)對(duì)板球系統(tǒng)的影響,首次建立了板球系統(tǒng)的隨機(jī)數(shù)學(xué)模型;2)首次采用一種新的預(yù)設(shè)性能推導(dǎo)方法,避免了傳統(tǒng)預(yù)設(shè)性能的共性問(wèn)題,將有限時(shí)間預(yù)設(shè)性能控制方案運(yùn)用于板球系統(tǒng)的跟蹤控制中,且系統(tǒng)的停息時(shí)間與初始狀態(tài)無(wú)關(guān);3)不同于文獻(xiàn)[15,17]將耦合作為有界干擾處理,本文對(duì)系統(tǒng)中的耦合項(xiàng)等采用了神經(jīng)網(wǎng)絡(luò)進(jìn)行近似逼近,實(shí)時(shí)考慮了耦合變化的影響,減少了控制設(shè)計(jì)的保守性;4)本文采用了全狀態(tài)預(yù)設(shè)性能設(shè)計(jì),使得系統(tǒng)中所有狀態(tài)都能被約束,它可在一定程度上避免控制信號(hào)過(guò)大的問(wèn)題;5)本文有限時(shí)間控制律的設(shè)計(jì)不需要滿足文獻(xiàn)[23]中給出的隨機(jī)系統(tǒng)有限時(shí)間控制的Lyapunov性能指標(biāo)LV?aV α+b,而只要達(dá)到LV?aV+b即可.
板球系統(tǒng)是通過(guò)兩個(gè)垂直方向上的電機(jī)帶動(dòng)平板轉(zhuǎn)動(dòng),從而改變小球在平板上的位置的機(jī)械系統(tǒng).板球系統(tǒng)有4個(gè)自由度,兩個(gè)為小球的X方向與Y方向的運(yùn)動(dòng),另外兩個(gè)為板的傾斜角度.小球的位置的廣義坐標(biāo)為x和y,原點(diǎn)取在板的中心位置,平板的傾斜角度的廣義坐標(biāo)為α和β.平板在X或Y方向的轉(zhuǎn)動(dòng)示意圖如圖1,小球在平板上的受力分析可見(jiàn)圖2.
圖1 平板在X(Y)方向旋轉(zhuǎn)的示意圖Fig.1 The sketch map of plate rotation on X(Y)direction
圖2 小球在X(Y)方向上的受力分析Fig.2 The force analysis of ball on X(Y)direction
運(yùn)用拉格朗日方程式(1)建立板球系統(tǒng)的數(shù)學(xué)模型:
其中:j代表板球系統(tǒng)4個(gè)自由度方向,T為板球系統(tǒng)小球與平板的動(dòng)能,qj為j方向坐標(biāo),Qj為j方向廣義力或廣義力矩.其中,Qj在未考慮隨機(jī)激勵(lì)力時(shí)如式(2)–(5),得到系統(tǒng)數(shù)學(xué)模型如式(6)[14]:
其中:x,y分別表示小球在X方向與Y方向上的位移(m);α,β分別表示平板X(qián)軸、Y軸與水平面的夾角(rad);g表示重力加速度;Ib,m,r分別表示小球的轉(zhuǎn)動(dòng)慣量、小球的質(zhì)量、小球的半徑;fx,fy分別是小球在平板X(qián)與Y方向上受到的摩擦力,均為未知函數(shù);Ipx,Ipy分別表示平板繞X軸、Y軸的轉(zhuǎn)動(dòng)慣量;τx,τy分別為作用于平板X(qián)方向、Y方向的力矩.接下來(lái)將在模型(6)的基礎(chǔ)上建立隨機(jī)板球系統(tǒng)數(shù)學(xué)模型.
在文獻(xiàn)[30]中,闡明了廣義力是由耗散力、控制力與隨機(jī)激勵(lì)力組成.因此,這里在式(2)–(5)中加入隨機(jī)激勵(lì)力部分.記由隨機(jī)信號(hào)白噪聲ξ引起的隨機(jī)激勵(lì)力在4個(gè)方向上分別為=φj(qj,)ξ.文獻(xiàn)[30]中指出了當(dāng)φj為常數(shù)時(shí),相應(yīng)的激勵(lì)力φjξ稱(chēng)為外激或加性激勵(lì),當(dāng)φj是關(guān)于qj與的函數(shù)時(shí),相應(yīng)的激勵(lì)稱(chēng)為參激或乘性激勵(lì).在本文中,將φj作為未知函數(shù)進(jìn)行處理,適用于以上兩種情況.在式(2)–(5)基礎(chǔ)上加上隨機(jī)激勵(lì)力后可得
因此,考慮隨機(jī)激勵(lì)力之后,拉格朗日方程可改寫(xiě)為式(11):
這里參考式(6)的建模結(jié)果,將式(7)–(10)代入式(11)中,得到含有隨機(jī)激勵(lì)力的板球系統(tǒng)數(shù)學(xué)模型如式(12):
為了方便控制器設(shè)計(jì),按X和Y方向建立兩個(gè)子系統(tǒng),選取如下?tīng)顟B(tài)變量:
且考慮到板球系統(tǒng)還易受到外部干擾的影響,并將ξ改寫(xiě)為[19],則由式(12)可得到板球系統(tǒng)的Stratonovich 隨機(jī)狀態(tài)方程模型如式(13):
將式(18)(21)–(22)代入式(15),可得具有輸入飽和的隨機(jī)板球系統(tǒng)數(shù)學(xué)模型如式(26).本文中將其視為X和Y方向的兩個(gè)子系統(tǒng)來(lái)進(jìn)行設(shè)計(jì):
本文控制目標(biāo)是:設(shè)計(jì)控制器vx,vy,使得系統(tǒng)輸出yx,yy跟蹤給定的參考信號(hào)yxd,yyd,即使小球按照給定軌跡運(yùn)動(dòng),其跟蹤誤差可在預(yù)先設(shè)定的停息時(shí)間內(nèi)收斂到一個(gè)給定的界內(nèi),并同時(shí)保證閉環(huán)系統(tǒng)內(nèi)其他信號(hào)有界.
為了后續(xù)控制器設(shè)計(jì),先給出如下定義、假設(shè)與引理.
考慮如下隨機(jī)系統(tǒng):
則系統(tǒng)(27)是依概率有界的,并存在唯一解.
本節(jié)將針對(duì)系統(tǒng)(26)中的兩個(gè)子系統(tǒng)進(jìn)行控制器設(shè)計(jì),根據(jù)文獻(xiàn)[26]的思想定義如下的誤差轉(zhuǎn)換函數(shù)(與以往預(yù)設(shè)性能方法不同,該函數(shù)只用于推導(dǎo)過(guò)程中的變量代換):
式中l(wèi)2為任意正常數(shù).通過(guò)上述設(shè)計(jì)過(guò)程,可以得到如下定理:
定理1對(duì)于隨機(jī)板球系統(tǒng)(26),在滿足假設(shè)1與|ei,j(0)|ηi,j(0)的前提下,如果按照式(43)(56)(66)(80)(84)(87)–(91)選取系統(tǒng)的控制律與自適應(yīng)律,則可以保證閉環(huán)系統(tǒng)的跟蹤誤差被預(yù)先給定的有限時(shí)間預(yù)設(shè)性能函數(shù)所限定,并在任意給定的有限時(shí)間內(nèi)收斂到給定的界內(nèi),并且閉環(huán)系統(tǒng)內(nèi)所有其他信號(hào)都是有界的.
由定義3可知ei,j是均方意義下的實(shí)際有限時(shí)間穩(wěn)定的,進(jìn)而可以得到閉環(huán)系統(tǒng)內(nèi)的所有信號(hào)都是實(shí)際有限時(shí)間穩(wěn)定的.證畢.
圖3 X方向跟蹤曲線Fig.3 Tracking curve on X direction
圖4 Y 方向跟蹤曲線Fig.4 Tracking curve on Y direction
圖5 X方向跟蹤誤差Fig.5 Tracking error on X direction
6 Y 方向跟蹤誤差Fig.6 Tracking error on Y direction
圖7 系統(tǒng)狀態(tài)x1,2,x1,3和x1,4Fig.7 System states x1,2,x1,3 and x1,4
按照文中定理1計(jì)算可得到的兩個(gè)子系統(tǒng)的控制器,利用MATLAB軟件對(duì)板球系統(tǒng)進(jìn)行仿真實(shí)驗(yàn),得到的仿真結(jié)果如圖3至圖14所示.
圖8 系統(tǒng)狀態(tài)x2,2,x2,3和x2,4Fig.8 System states x2,2,x2,3 and x2,4
圖9 自適應(yīng)參數(shù)和Fig.9 Adaptive parameters and
圖10 控制輸入信號(hào)vxFig.10 Control input signal vx
圖12 控制輸入信號(hào)vyFig.12 Control input signal vy
圖13 飽和輸入uyFig.13 Saturation input uy
圖3–14分別為系統(tǒng)在X方向與Y方向的跟蹤軌跡、跟蹤誤差、系統(tǒng)狀態(tài)、自適應(yīng)參數(shù)、控制信號(hào)以及平板中小球的實(shí)際跟蹤軌跡.通過(guò)圖3–6可以看出系統(tǒng)輸出可以很好地跟蹤期望軌跡,并且跟蹤誤差被嚴(yán)格限制在預(yù)定的界內(nèi).從圖7與圖8中的實(shí)線可以看出平板的傾斜角度一直較小且沒(méi)有超過(guò),因此不會(huì)因傾角過(guò)大造成小球滑落的現(xiàn)象.圖10–13表明了對(duì)于具有輸入飽和的板球系統(tǒng)本文的控制方案可以很好地實(shí)現(xiàn)系統(tǒng)的跟蹤控制.圖14給出了小球在平板中的圓形軌跡跟蹤曲線,清楚地顯示了小球在平板中的精確跟蹤過(guò)程.
圖14 平板中小球?qū)嶋H跟蹤曲線Fig.14 Tracking curve of the ball on the plate
為了進(jìn)一步體現(xiàn)本文建立的系統(tǒng)模型的完善性與方法的有效性,這里給出與文獻(xiàn)[11]中控制方法的仿真比較.之所以選擇與文獻(xiàn)[11]比較,是因?yàn)樗彩且黄赽ackstepping方法對(duì)板球系統(tǒng)進(jìn)行控制器設(shè)計(jì)的文章,并且未考慮系統(tǒng)間耦合、摩擦力、外部干擾與隨機(jī)噪聲.這樣可以同時(shí)從控制方法上和系統(tǒng)模型上給出比較.在這個(gè)比較仿真中,采用了本文考慮的具有耦合、摩擦力、外部干擾與隨機(jī)噪聲的模型,并選擇了相同的跟蹤信號(hào).當(dāng)采用文獻(xiàn)[11]方法及其文中的控制參數(shù)時(shí),系統(tǒng)則不能穩(wěn)定.為此筆者對(duì)文獻(xiàn)[11]方法中的參數(shù)進(jìn)行了調(diào)整,并通過(guò)多次實(shí)驗(yàn)保留了其控制效果最好的結(jié)果與本文結(jié)果進(jìn)行比較.得到的對(duì)比結(jié)果如圖15–17所示.從圖15–17可以看出文獻(xiàn)[11]中的控制方法未能較好地跟蹤上期望的軌跡,跟蹤誤差較大,其方法的控制效果與本文方法相差太多.顯出了本文控制方法的優(yōu)越性及本文提出的完善的系統(tǒng)模型的必要性.
圖15 X方向跟蹤曲線對(duì)比Fig.15 The comparison of tracking curve on X direction
圖16 Y 方向跟蹤曲線對(duì)比Fig.16 The comparison of tracking curve on Y direction
圖17 平板中小球?qū)嶋H跟蹤曲線對(duì)比Fig.17 The comparison of tracking curve of the ball on the plate
注3為了保證系統(tǒng)的跟蹤效果,本文中只需要將參數(shù)η01,1,η02,1,ηT f1,1,ηT f2,1,Tf1,1,Tf2,1設(shè)置較小,其他狀態(tài)的有限時(shí)間預(yù)設(shè)性能約束的參數(shù)選擇可以相對(duì)較大.因?yàn)樵趯?shí)驗(yàn)中發(fā)現(xiàn)其他狀態(tài)的約束參數(shù)選擇過(guò)小時(shí),控制效果較難調(diào)整.
本文研究了板球系統(tǒng)在隨機(jī)激勵(lì)下的數(shù)學(xué)建模與軌跡跟蹤控制問(wèn)題.通過(guò)合理地引入隨機(jī)激勵(lì)力建立了板球系統(tǒng)的隨機(jī)數(shù)學(xué)模型.綜合考慮了系統(tǒng)的耦合、摩擦力、外部干擾、隨機(jī)激勵(lì)因素與控制器飽和現(xiàn)象,結(jié)合了預(yù)設(shè)性能思想、有限時(shí)間預(yù)設(shè)性能函數(shù)、神經(jīng)網(wǎng)絡(luò)、自適應(yīng)技術(shù)以及全狀態(tài)約束方法設(shè)計(jì)了隨機(jī)板球系統(tǒng)的有限時(shí)間全狀態(tài)預(yù)設(shè)性能軌跡跟蹤控制器.該控制器能夠保證系統(tǒng)跟蹤誤差在任意給定的有限時(shí)間內(nèi)收斂到預(yù)先指定的界內(nèi),并且閉環(huán)系統(tǒng)內(nèi)的其他所有信號(hào)都是有界的.還應(yīng)該指出的是,在實(shí)驗(yàn)中發(fā)現(xiàn)加上全狀態(tài)約束可減小控制信號(hào)的大小,使得該系統(tǒng)的控制更易調(diào)整和實(shí)現(xiàn).