劉德玉 鄒坤霖 賀力克
1(湖南工業(yè)職業(yè)技術(shù)學(xué)院 湖南 長沙 410208)2(湖南大學(xué)機(jī)器人視覺感知與控制技術(shù)國家工程實(shí)訓(xùn)室 湖南 長沙 410082)
自適應(yīng)魯棒控制在控制領(lǐng)域的非線性系統(tǒng)中得到了廣泛的關(guān)注。為了獲得自適應(yīng)和/或魯棒性能,將許多先進(jìn)的控制方法相融合來設(shè)計非線性系統(tǒng)的控制器。
由于具有非線性函數(shù)逼近、學(xué)習(xí)和容錯能力,神經(jīng)網(wǎng)絡(luò)方法在非線性系統(tǒng)的建模和控制中得到了廣泛的應(yīng)用[1]。已經(jīng)證明,多層神經(jīng)網(wǎng)絡(luò)可以盡可能精確地逼近任何連續(xù)函數(shù)[2-3]?;谄浔平再|(zhì),文獻(xiàn)[4-9]提出了基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)的非線性控制方案,其中神經(jīng)網(wǎng)絡(luò)用于逼近單輸入單輸出(SISO)系統(tǒng)中的未知函數(shù)。隨后,文獻(xiàn)[10-12]擴(kuò)展了自適應(yīng)控制方案以控制多輸入多輸出(MIMO)非線性系統(tǒng)。在這些方案中,神經(jīng)網(wǎng)絡(luò)通常用于逼近系統(tǒng)的不確定非線性,從而為非線性系統(tǒng)設(shè)計補(bǔ)償型自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器;然后設(shè)計一個魯棒補(bǔ)償器消除逼近誤差和外部干擾的影響,該補(bǔ)償器可以是監(jiān)督控制[13]、變結(jié)構(gòu)控制[14]和/或H∞控制[15]。文獻(xiàn)[11,14-15]利用神經(jīng)網(wǎng)絡(luò)完全逼近變結(jié)構(gòu)的等效控制,然后應(yīng)用H∞控制方法使閉環(huán)系統(tǒng)具有給定的跟蹤性能。
本文針對一類不確定非線性MIMO系統(tǒng),提出一種基于徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)的自適應(yīng)魯棒反饋控制方案??刂品桨赴≧BF神經(jīng)網(wǎng)絡(luò)、滑??刂破骱虷∞最優(yōu)控制器。利用RBF神經(jīng)網(wǎng)絡(luò)逼近非線性系統(tǒng)未知的理想反饋控制律,通過滑??刂破飨齊BF神經(jīng)網(wǎng)絡(luò)重構(gòu)誤差和逼近誤差。針對外部干擾,進(jìn)行了H∞最優(yōu)控制器的設(shè)計。采用二次穩(wěn)定性方法,對參數(shù)不確定性進(jìn)行獨(dú)立處理,降低了傳統(tǒng)魯棒控制算法的保守性。基于李雅普諾夫穩(wěn)定性定理,提出的智能魯棒控制器能夠保證閉環(huán)系統(tǒng)的穩(wěn)定性和一定的跟蹤性能。最后,通過質(zhì)量-彈簧-阻尼系統(tǒng)的仿真實(shí)例驗(yàn)證了所提出控制方案的有效性。
考慮由下面的微分方程表示的n階非線性多輸入多輸出(MIMO)系統(tǒng)的廣義形式:
x(n)=f(X)+g(X)u+d(t)
(1)
假設(shè)1未知非線性矩陣g(X)是有界的且非奇異的,即g-1(X)存在。
如果系統(tǒng)動力學(xué)是精確已知的,并且假設(shè)外部干擾被忽略,即函數(shù)f(X)和g(X)是完全已知的且d(t)=0,則理想反饋控制律可以設(shè)計為:
式中:xd是具有n階可導(dǎo)的期望軌跡;e=xd-x是跟蹤誤差;系數(shù)k1,k2,…,kn應(yīng)適當(dāng)選擇使得多項式h(s)=sn+knsn-1+k2s+k1的所有根都在s平面的左半平面內(nèi)。
將式(2)代入式(1)可得到誤差動態(tài)方程:
e(n)+kne(n-1)+…+k1e=0
(3)
f(X)=f0(X)+Δf(X)
g(X)=g0(X)+Δg(X)
假設(shè)3假設(shè)標(biāo)稱函數(shù)g0(X)已知,其他函數(shù)和參數(shù)均未知。
假設(shè)3是合理的,因?yàn)橐话闱闆r下,非線性系統(tǒng)如機(jī)械系統(tǒng)或化學(xué)系統(tǒng)的控制矩陣g(X)相對容易獲得可接受的精度;此外,g(X)的參數(shù)不確定性也已考慮。
本文提出一種基于RBF神經(jīng)網(wǎng)絡(luò)的自適應(yīng)魯棒反饋控制方法,該方法由一個自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)控制器和一個魯棒混合補(bǔ)償器組成,可以表示為:
u=un+uc
(4)
式中:un是RBF神經(jīng)網(wǎng)絡(luò)控制器;uc是混合補(bǔ)償器。
由于f(X)和g(X)中包含的不確定性,式(2)是未知的,并且不能直接應(yīng)用于式(1)。本文設(shè)計RBF神經(jīng)網(wǎng)絡(luò)來估計式(2)中的未知控制律u*,即:
un=ΘTΦ(xe)
(5)
定義RBF神經(jīng)網(wǎng)絡(luò)的逼近誤差為:
ε(xe)=u*-Θ*TΦ(xe)
(7)
假設(shè)4假設(shè)存在一個函數(shù)κ(xe)>0,使得對于所有的1≤i≤m,有|εi(xe)|≤κ(xe)。
將式(4)和式(5)代入到式(1)中,可得:
g-1(X)[e(n)+kne(n-1)+…+k1e]=
定義跟蹤誤差的導(dǎo)數(shù)為:
式(9)對于時間的導(dǎo)數(shù)可以寫成狀態(tài)空間方程,其形式如下:
(10)
其中
且B=B0+ΔB。其中
假設(shè)5ΔB表示參數(shù)的不確定性,并具有以下結(jié)構(gòu):
ΔB=MFN
式中:M和N是具有適當(dāng)維數(shù)的已知常數(shù)矩陣;F∈R2n×2n是未知Lebesgue可測矩陣。F邊界為:
FTF≤I2n×2n
引理1設(shè)X、Y和F是具有適當(dāng)維數(shù)的實(shí)矩陣且FTF≤I2n×2n。此外,對于任意標(biāo)量α>0,
XFY+YTFTXT≤αXXT+α-1YTY
為達(dá)到一定的跟蹤性能,式(4)中的補(bǔ)償器uc可以設(shè)計為:
uc=uw+uh
(11)
式中:uw是消除RBFNN重構(gòu)誤差和逼近誤差的滑??刂破鳎籾h是H∞控制器,其任務(wù)是消除未知外部干擾的影響,同時實(shí)現(xiàn)特定的H∞跟蹤性能。
對于基于RBF神經(jīng)網(wǎng)絡(luò)的自適應(yīng)魯棒反饋控制的設(shè)計,考慮采用式(4)所示的RBFNN控制器和魯棒補(bǔ)償器。假設(shè)存在一個矩陣P=PT>0,使得下面的不等式成立:
利用式(12)的矩陣P,選取自適應(yīng)訓(xùn)練律為平滑投影[2]??紤]到當(dāng)DΘ>0,δ>0時,有Ω0={Θ:ΘTΘ≤DΘ},ΩΘ={Θ:ΘTΘ≤DΘ+δ}。定義平滑投影映射:
因此,RBF神經(jīng)網(wǎng)絡(luò)控制器的訓(xùn)練規(guī)律可以定義為:
式中:Γ是學(xué)習(xí)率。
uw=uwr+uwa
(15)
式中:uwr和uwa分別是消除RBFNN重構(gòu)誤差ε(xe)和逼近誤差的滑??刂破?。uwr和uwa定義為:
然后,混合控制器式(4)、式(5)、式(11)、式(15)-式(18)可以保證閉環(huán)系統(tǒng)的所有變量有界,并且可實(shí)現(xiàn)如下的H∞跟蹤性能:
證明:定義Lyapunov函數(shù)為:
取Lyapunov函數(shù)對時間的導(dǎo)數(shù),并代入式(10)和式(12),得:
(uwr-ε(xe))TBTPz+
考慮式(16)中的重構(gòu)誤差補(bǔ)償器uwr和假設(shè)2,可以得到:
(uwr-ε(xe))TBTPz≤
-κ(xe)|BTPz|+|ε(xe)||BTPz|≤0
(22)
根據(jù)式(18)中的H∞控制器uh,將式(22)和式(23)代入式(21)中,可得:
根據(jù)假設(shè)5,有:
對式(25)從t=0到t=T進(jìn)行積分,可以得到:
(26)
由于V(T)≥0,上述不等式導(dǎo)致了如下的L2準(zhǔn)則:
由于Q是正定矩陣,考慮λmin(Q)zTz≤zTQz可得:
(28)
(29)
本文將所提出的方法應(yīng)用于控制質(zhì)量-彈簧-阻尼器機(jī)械系統(tǒng)中,以驗(yàn)證所提出的智能魯棒控制方法的有效性,如圖1所示是一個質(zhì)量-彈簧-阻尼器機(jī)械系統(tǒng)。質(zhì)量-彈簧-阻尼器-機(jī)械系統(tǒng)的動力學(xué)方程可以表示為[11]:
定義:
圖1 質(zhì)量-彈簧-阻尼器系統(tǒng)
為了進(jìn)行比較,將提出的自適應(yīng)神經(jīng)網(wǎng)絡(luò)魯棒二次鎮(zhèn)定反饋控制(ANNRQSFC)方法與基于計算力矩方法(CTC)和文獻(xiàn)[11]提出的神經(jīng)網(wǎng)絡(luò)魯棒控制(NNRC)方法進(jìn)行比較。文獻(xiàn)[11]中所用的神經(jīng)網(wǎng)絡(luò)與本文所描述的結(jié)構(gòu)相同。圖2(a)和圖2(b)分別給出了質(zhì)量塊1和質(zhì)量塊2的位置跟蹤結(jié)果;圖3(a)和圖3(b)給出了位置跟蹤誤差;圖4(a)和圖4(b)分別給出了質(zhì)量塊1和質(zhì)量塊2的速度跟蹤結(jié)果;圖5(a)和圖5(b)給出了速度跟蹤誤差。跟蹤誤差的均方誤差(MSE)如表1所示。
(a) 質(zhì)量塊1的位置跟蹤
(b) 質(zhì)量塊2的位置跟蹤圖2 位置跟蹤結(jié)果
(a) 質(zhì)量塊1的位置跟蹤誤差
(b) 質(zhì)量塊2的位置跟蹤誤差圖3 位置跟蹤誤差
(a) 質(zhì)量塊1的速度跟蹤
(b) 質(zhì)量塊2的速度跟蹤圖4 速度跟蹤結(jié)果
(a) 質(zhì)量塊1的速度跟蹤誤差
(b) 質(zhì)量塊2的速度跟蹤誤差圖5 速度跟蹤誤差
表1 跟蹤誤差的均方誤差 單位:m/s
根據(jù)圖3(a)-圖3(b)、圖5(a)-圖5(b)和表1,通過將所提出的控制方法與CTC和NNRC進(jìn)行比較,可以看出由于CTC方法僅利用系統(tǒng)的標(biāo)稱值進(jìn)行控制器設(shè)計,受系統(tǒng)中的不確定性和外界干擾的影響較大,跟蹤效果也較差。NNRC和本文所提出的ANNRQSFC方法均采用神經(jīng)網(wǎng)絡(luò)對系統(tǒng)中的不確定性進(jìn)行逼近,然后用魯棒補(bǔ)償項來消除神經(jīng)網(wǎng)絡(luò)逼近誤差和外界干擾的影響,跟蹤誤差顯著減小。而本文所提出的ANNRQSFC方法采用二次鎮(zhèn)定方法,減小了魯棒項設(shè)計時對于逼近誤差和外界干擾上界的依賴,從而得到比NNRC方法更好的跟蹤效果。圖2-圖5和表1也可以驗(yàn)證在存在不確定性和外界干擾的情況下,本文方法可以獲得更好的性能。
針對具有不確定性和干擾的非線性MIMO系統(tǒng),提出一種基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)的魯棒反饋控制方案。該控制方法將神經(jīng)網(wǎng)絡(luò)與自適應(yīng)魯棒補(bǔ)償器相結(jié)合,其中神經(jīng)網(wǎng)絡(luò)控制器作為主控制器,自適應(yīng)魯棒補(bǔ)償器用于補(bǔ)償神經(jīng)網(wǎng)絡(luò)的逼近誤差和外部干擾。此外,采用二次鎮(zhèn)定方法減小了傳統(tǒng)魯棒控制算法的保守性,實(shí)現(xiàn)閉環(huán)系統(tǒng)的穩(wěn)定性和給定的跟蹤性能。仿真結(jié)果表明,本文方法在具有不確定性的非線性系統(tǒng)的控制上表現(xiàn)出很好的魯棒性和有效的控制性能,并具有良好的抗干擾能力。