王桐 邱劍彬 高會(huì)軍
在過(guò)去的20多年中,針對(duì)具有嚴(yán)格反饋結(jié)構(gòu)的非線性系統(tǒng)的自適應(yīng)反步控制設(shè)計(jì)問(wèn)題得到了廣泛的研究[1-4].反步法(Backstepping)由Kanellakopoulos等于1991年在文獻(xiàn)[3]中首先提出,是針對(duì)不確定性系統(tǒng),將Lyapunov函數(shù)的選取與控制器的設(shè)計(jì)相結(jié)合的一種回歸設(shè)計(jì)方法,通過(guò)從系統(tǒng)的最低階次微分方程開(kāi)始,引入虛擬控制的概念,一步一步設(shè)計(jì)滿足要求的虛擬控制.上述文獻(xiàn)[1-4]主要研究了具有嚴(yán)格反饋結(jié)構(gòu)非線性系統(tǒng)的自適應(yīng)控制設(shè)計(jì)問(wèn)題,降低了自適應(yīng)參數(shù)的數(shù)量.然而,上述方法并不能解決系統(tǒng)中存在未知的非線性項(xiàng)的情況.通過(guò)引入模糊邏輯系統(tǒng)或神經(jīng)網(wǎng)絡(luò),文獻(xiàn)[5-8]研究了一類含有未知非線性函數(shù)系統(tǒng)的自適應(yīng)模糊/神經(jīng)網(wǎng)絡(luò)控制設(shè)計(jì)方法.針對(duì)一類最小相位非線性系統(tǒng),文獻(xiàn)[5]基于可線性化的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)提出了自適應(yīng)神經(jīng)網(wǎng)絡(luò)(Adaptive neural network,ANN)反步設(shè)計(jì)方法.文獻(xiàn)[6]通過(guò)結(jié)合二次Lyapunov-Krasovskii函數(shù),解決了多輸入多輸出非線性時(shí)滯系統(tǒng)的跟蹤控制問(wèn)題.而針對(duì)具有嚴(yán)格反饋結(jié)構(gòu)的單輸入單輸出非線性系統(tǒng),文獻(xiàn)[7]提出了基于動(dòng)態(tài)面控制技術(shù)的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制方法,解決了反步法帶來(lái)的“維數(shù)爆炸”問(wèn)題,降低了算法的計(jì)算復(fù)雜度.在此基礎(chǔ)上,文獻(xiàn)[8]將上述控制方法擴(kuò)展到了一類具有純反饋結(jié)構(gòu)的非線性時(shí)滯系統(tǒng).同時(shí),自適應(yīng)反步法控制設(shè)計(jì)也被應(yīng)用到了懸架控制[9]等實(shí)際例子當(dāng)中.
考慮到各種隨機(jī)干擾和隨機(jī)擾動(dòng)對(duì)非線性系統(tǒng)的影響,隨機(jī)非線性系統(tǒng)的控制問(wèn)題也得到了深入的研究[10-12].文獻(xiàn)[10]解決了隨機(jī)非線性系統(tǒng)的穩(wěn)定性問(wèn)題,文獻(xiàn)[11]將該結(jié)果擴(kuò)展到了一類互聯(lián)的隨機(jī)非線性大系統(tǒng),文獻(xiàn)[12]通過(guò)結(jié)合隨機(jī)小增益定理和輸入到狀態(tài)實(shí)際穩(wěn)定概念解決了一類含有未建模動(dòng)態(tài)的隨機(jī)非線性系統(tǒng)的自適應(yīng)反步控制設(shè)計(jì)問(wèn)題.通過(guò)結(jié)合神經(jīng)網(wǎng)絡(luò)文獻(xiàn)[13-14]分別研究了隨機(jī)嚴(yán)格反饋非線性時(shí)滯系統(tǒng)和隨機(jī)非線性互聯(lián)大系統(tǒng)的輸出反饋控制問(wèn)題,得到了系統(tǒng)依概率穩(wěn)定的結(jié)果.
另一方面,由于基于事件觸發(fā)機(jī)制的控制策略不僅帶來(lái)了諸如資源共享等優(yōu)點(diǎn),同時(shí)也可以充分利用有限的帶寬資源實(shí)現(xiàn)可靠性較高的控制需求.文獻(xiàn)[15]針對(duì)一般結(jié)構(gòu)非線性系統(tǒng)的跟蹤問(wèn)題研究了其在事件觸發(fā)機(jī)制條件下的穩(wěn)定性,文獻(xiàn)[16]則結(jié)合小增益定理將該結(jié)果擴(kuò)展到了含有未建模動(dòng)態(tài)的非線性系統(tǒng).文獻(xiàn)[17]提出了基于事件觸發(fā)機(jī)制的輸出反饋控制策略,解決了一類非線性系統(tǒng)的鎮(zhèn)定問(wèn)題.在系統(tǒng)中存在未知非線性函數(shù)的情形下,文獻(xiàn)[18]結(jié)合模糊邏輯系統(tǒng),針對(duì)離散非線性網(wǎng)絡(luò)化系統(tǒng),研究了其基于事件觸發(fā)機(jī)制的H∞控制方法.文獻(xiàn)[19-20]則研究了一類具有隨機(jī)干擾的多智能體系統(tǒng)的一致性控制問(wèn)題,文獻(xiàn)[21-22]則基于事件觸發(fā)機(jī)制分別研究了隨機(jī)系統(tǒng)的滑??刂茊?wèn)題和H∞控制問(wèn)題.上述的結(jié)果均是針對(duì)非線性系統(tǒng)或者隨機(jī)線性系統(tǒng),而非本文所研究的隨機(jī)非線性系統(tǒng),且在事件觸發(fā)機(jī)制框架下針對(duì)控制方向未知的隨機(jī)非線性系統(tǒng)的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制問(wèn)題的結(jié)果還未見(jiàn)報(bào)道.本文針對(duì)該類系統(tǒng),提出了基于事件觸發(fā)機(jī)制的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制策略,通過(guò)引入Nussbaum增益函數(shù)克服了未知控制方向?qū)ο到y(tǒng)性能的影響,保證了閉環(huán)系統(tǒng)的隨機(jī)穩(wěn)定性,使得系統(tǒng)所有的信號(hào)半全局一致有界,在事件觸發(fā)設(shè)計(jì)框架下解決了隨機(jī)非線性系統(tǒng)中同時(shí)存在未知非線性項(xiàng)和未知控制方向的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制問(wèn)題.
本文所考慮的為如下結(jié)構(gòu)的隨機(jī)非線性系統(tǒng)
其中,為系統(tǒng)的狀態(tài)向量,y∈R和u∈R分別為系統(tǒng)的輸出和輸入,b為未知的常數(shù),且存在已知正常數(shù)使得bmin≤|b|≤bmax,fi為未知的非線性光滑函數(shù),gi(x)為不確定函數(shù),記增量dω的協(xié)方差為σσTdt,即均值E{dωdωT}=σσTdt,其中函數(shù)矩陣σ是有界但不確定的.
針對(duì)隨機(jī)非線性系統(tǒng)(1),首先給出如下的假設(shè).
假設(shè)1.非線性函數(shù)fi滿足局部Lipschitz條件,即|fi(X1)-fi(X2)|≤Li||X1-X2||,其中Li為正的常數(shù),這里的|·|表示函數(shù)的絕對(duì)值,‖·‖表示向量的1-范數(shù).
假設(shè)2.系統(tǒng)的隨機(jī)擾動(dòng)協(xié)方差是有界的,且滿足如下等式.
引理1[23].給出定義在時(shí)間段[0,tf)上的光滑函數(shù)?(t)(詳細(xì)表達(dá)式為式(42)).并考慮特定的Nussbaum 增益函數(shù)N(?)=?2cos(?),針對(duì)隨機(jī)非線性系統(tǒng)(1),若存在正定的函數(shù)V(t,x)和正定常數(shù)C,D使得如下不等式成立
則E(V(t,x))和?(t)均在[0,tf)上保持有界,其中?為隨機(jī)非線性系統(tǒng)的無(wú)窮小算子,其定義如下:考慮隨機(jī)非線性系統(tǒng)dx=f(t,x)+hT(t,x)dω,針對(duì)V(t,x)的無(wú)窮小算子表達(dá)式為
證明.首先,設(shè)計(jì)函數(shù)W(t,x)為
可得
利用式(2)可得
由式(5)可得
結(jié)合W(t,x)的定義可知
值得注意的是,式 (8)中,對(duì)于s∈[0,t],e-C(t-s)滿足0<e-C(t-s)≤1.假設(shè)e-C(t-s)(N(?)+1)為 Nussbaum 型函數(shù),則由Nussbaum 函數(shù)的性質(zhì)可知,對(duì)于函數(shù)變量ξ,如下兩個(gè)不等式成立
可得EV(t,x)<0.然而,這與EV(t,x)≥0的事實(shí)相矛盾.因此,變量?和EV(t,x)<0在時(shí)間段[0,tf)上是有界的,EV(t,x)也因此是有界的.□
針對(duì)隨機(jī)非線性系統(tǒng)(1),將采用如下結(jié)構(gòu)的徑向基神經(jīng)網(wǎng)絡(luò)逼近系統(tǒng)中存在的未知非線性函數(shù)
其中,為輸入向量,θ=[θ1,θ2,···,θM]T為權(quán)重向量,M>1為網(wǎng)絡(luò)的節(jié)點(diǎn)個(gè)數(shù),激活函數(shù)選取為如下結(jié)構(gòu)
其中,μi為對(duì)應(yīng)的神經(jīng)元中心參數(shù),η為寬度向量.由于徑向基神經(jīng)網(wǎng)絡(luò)的逼近特性,上述神經(jīng)網(wǎng)絡(luò)函數(shù)可以在一個(gè)緊集上以任意精度逼近任意的連續(xù)函數(shù).
其中,ε為逼近誤差.
首先,利用假設(shè)1和徑向基神經(jīng)網(wǎng)絡(luò)逼近針隨機(jī)非線性系統(tǒng)(1)中存在的未知非線性函數(shù),即
設(shè)計(jì)濾波器為
設(shè)計(jì)濾波器結(jié)構(gòu)為
結(jié)合式(16)和(17),可得:
需要注意的是,由于濾波器中存在未知參數(shù)變量?,因此在接下來(lái)的控制設(shè)計(jì)中利用如下的狀態(tài)觀測(cè)值.
選取向量K使得矩陣A為正定的赫爾維茨矩陣,即對(duì)于給定的正定對(duì)稱矩陣Q,存在正定對(duì)稱矩陣P使得如下等式成立
定義系統(tǒng)的濾波誤差變量
可得
針對(duì)濾波誤差系統(tǒng)(22),選取Lyapunov函數(shù)為
利用伊藤微分定理,可得如下不等式
利用Young's不等式,可得:
將上述不等式(25)~(27)代入式(24),可得:
由濾波器結(jié)構(gòu)可得
本節(jié)主要利用自適應(yīng)反步法設(shè)計(jì)隨機(jī)非線性系統(tǒng)(1)的控制器,首先給出如下的坐標(biāo)變換
步驟1.由系統(tǒng)模型(1)可得
由式(16)可得
式(32)等價(jià)于
選取第一步的Lyapunov函數(shù)為
利用伊藤微分定理,可得
利用Young's不等式,可得
將不等式(37)~(40)代入式(36)可得
設(shè)計(jì)虛擬控制器α1和自適應(yīng)律為
其中,c1>0,q>0為設(shè)計(jì)參數(shù).
將虛擬控制器α1和自適應(yīng)律代入式(41)可得
步驟2.由系統(tǒng)模型(1)可得
選取步驟2的Lyapunov函數(shù)為
利用伊藤微分定理,可得
利用Young's不等式,可得
將上述不等式代入式(52),可得
設(shè)計(jì)虛擬控制器α2和自適應(yīng)律為
其中,c2>0為設(shè)計(jì)參數(shù).
將虛擬控制器α2和自適應(yīng)律代入式(52),可得
步驟 i.(i=3,···,n)同第一步和第二步所采用的技術(shù)方法類似,可設(shè)計(jì)虛擬控制器αi為
其中,ci>0為設(shè)計(jì)參數(shù).
同時(shí)可得
在步驟n需要設(shè)計(jì)最終的控制器u,因此考慮如下不等式
接下來(lái)設(shè)計(jì)最終的基于事件觸發(fā)機(jī)制的自適應(yīng)神經(jīng)網(wǎng)絡(luò)輸出反饋控制器
由式(59)可得
其中,κ1(t)和κ2(t)為滿足如下條件的時(shí)變參數(shù)|κ1(t)|≤1,|κ2(t)|≤1.則控制器u(t)可以改寫為
將u(t)代入式(58)可得
由v(t)的定義可得
根據(jù) tanh(·)函數(shù)如下的特性 0≤|x|-xtanh,可得如下不等式
最終可得
對(duì)于任意的t∈[tk,tk+1),由ρ(t)=v(t)-u(t)可得,
本文給出如下的數(shù)值仿真實(shí)例
其中,f1(x1)=0.5sin(x1),g1(x)=0.3sin(x1),f2(x)=0.5cos(x1)sin(x2),g2(x)=0.3cos(x1),b=-1.選取仿真運(yùn)行時(shí)間為40秒,采樣周期為0.01秒,選取初始值為,選取設(shè)計(jì)參數(shù)為.仿真結(jié)果見(jiàn)圖1和圖2,圖1給出了系統(tǒng)和觀測(cè)器的輸出信號(hào)x1和,以及系統(tǒng)的跟蹤信號(hào)yr.圖2給出了傳統(tǒng)基于時(shí)間驅(qū)動(dòng)的控制信號(hào)和本文所提出的基于事件觸發(fā)機(jī)制的控制信號(hào).
圖1 系統(tǒng)的跟蹤和觀測(cè)性能Fig.1 Output tracking and observation performance
圖2 控制信號(hào)Fig.2 Control signals
本文研究了一類具有未知控制方向的隨機(jī)非線性系統(tǒng)的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制設(shè)計(jì)方法.利用神經(jīng)網(wǎng)絡(luò)的逼近特性和Nussbaum增益函數(shù)解決了系統(tǒng)存在未知非線性函數(shù)和未知控制方向的問(wèn)題,最后結(jié)合事件觸發(fā)機(jī)制算法,提出了基于事件觸發(fā)機(jī)制的自適應(yīng)神經(jīng)網(wǎng)絡(luò)反步控制算法.仿真結(jié)果表明閉環(huán)系統(tǒng)的信號(hào)均是半全局有界的.