胡劍波,王應(yīng)洋,劉炳琪,宋仕元
(空軍工程大學(xué)裝備管理與無人機(jī)工程學(xué)院,陜西西安 710051)
非仿射特性廣泛存在于機(jī)械、生化和飛行控制等實(shí)際系統(tǒng)中,有關(guān)非仿射系統(tǒng)的控制問題是近幾年的研究熱點(diǎn)[1-11].一些在嚴(yán)反饋系統(tǒng)中應(yīng)用的成果開始逐步拓展到非仿射系統(tǒng)中,但非仿射函數(shù)不顯含控制輸入,無法直接針對非仿射系統(tǒng)設(shè)計(jì)控制器.采用不同方法設(shè)計(jì)控制器時,通常需要對非仿射系統(tǒng)做一些相應(yīng)的假設(shè)以變換為面向控制器設(shè)計(jì)的偽仿射系統(tǒng).
拉格朗日中值定理[1-3]和泰勒公式[4-6]是將非仿射系統(tǒng)變換為偽仿射系統(tǒng)的有效手段.針對變換后的偽仿射系統(tǒng),有兩種典型的控制器設(shè)計(jì)方案:基于反推法逐步設(shè)計(jì)控制器和基于誤差面設(shè)計(jì)控制器.在基于反推法設(shè)計(jì)控制器方面:文獻(xiàn)[1]針對變換后的偽仿射模型,設(shè)計(jì)了自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器,通過引入一階低通濾波器避免了對虛擬控制律的反復(fù)求導(dǎo);文獻(xiàn)[2]借助于自適應(yīng)神經(jīng)網(wǎng)絡(luò)和Nussbaum函數(shù),解決了一類含未建模動態(tài)與控制增益符號未知的非仿射純反饋系統(tǒng)的控制問題.在基于誤差面設(shè)計(jì)控制器方面:文獻(xiàn)[3]通過假設(shè)非仿射函數(shù)光滑可導(dǎo)將非仿射純反饋系統(tǒng)變換為積分鏈?zhǔn)较到y(tǒng),采用高階滑模微分器觀測變換模型的狀態(tài)并針對變換模型設(shè)計(jì)了自適應(yīng)神經(jīng)網(wǎng)絡(luò)估計(jì)器,避免了反推法的繁瑣過程,減少了估計(jì)器的數(shù)量.基于反推技術(shù)的控制方法可處理非匹配不確定性問題,但需要逐級設(shè)計(jì)虛擬控制律;基于誤差面的控制方法通過數(shù)學(xué)變換把系統(tǒng)所有的不確定性集中到一項(xiàng),然后采用估計(jì)器進(jìn)行統(tǒng)一估計(jì),大大降低了計(jì)算復(fù)雜度且無需虛擬控制律.
針對未知非仿射系統(tǒng),控制器設(shè)計(jì)往往依賴于寬松的可控性假設(shè)與復(fù)雜的估計(jì)器.文獻(xiàn)[7-11]采用模糊系統(tǒng)與神經(jīng)網(wǎng)絡(luò)等估計(jì)器對偽仿射系統(tǒng)中的未知非線性項(xiàng)進(jìn)行估計(jì)并設(shè)計(jì)滿足Lyapunov穩(wěn)定性的控制律.然而,通過有限的模型信息無法實(shí)現(xiàn)準(zhǔn)確的反饋補(bǔ)償,控制精度難以保證.因此,有必要在控制器設(shè)計(jì)過程中對跟蹤誤差施加約束,以實(shí)現(xiàn)高精度跟蹤控制.
對于含輸出約束的控制問題,Ilchmann,Tee 與Bechlious等人相繼提出了漏斗控制[12-14]、界限Lyapunov函數(shù)[15-17]與預(yù)設(shè)性能控制[18-22]等方法.上述方案將性能約束考慮到控制器設(shè)計(jì)過程中,以保證閉環(huán)系統(tǒng)實(shí)現(xiàn)理想的控制性能.預(yù)設(shè)性能控制可以更為靈活地和其他控制方法結(jié)合并應(yīng)用到高階系統(tǒng),因而得到了廣泛的研究:文獻(xiàn)[18]將預(yù)設(shè)性能控制與反推技術(shù)結(jié)合,解決了嚴(yán)反饋系統(tǒng)的控制問題;文獻(xiàn)[19]針對非仿射純反饋系統(tǒng),基于反推法設(shè)計(jì)了一種低復(fù)雜度的預(yù)設(shè)性能控制器,該方案無需任何估計(jì)器,但在反推過程中的每一步都需要單獨(dú)設(shè)計(jì)性能函數(shù),增大了產(chǎn)生控制器奇異問題的風(fēng)險.
為避免文獻(xiàn)[18-22]中復(fù)雜的反推設(shè)計(jì)過程同時保證跟蹤誤差滿足預(yù)先設(shè)定的性能約束,本文將針對一類未知非仿射純反饋系統(tǒng)基于有限時間收斂的微分器設(shè)計(jì)一種自適應(yīng)神經(jīng)網(wǎng)絡(luò)預(yù)設(shè)性能控制器.
考慮如下所示的一類非仿射純反饋系統(tǒng):
控制目標(biāo)為:設(shè)計(jì)自適應(yīng)預(yù)設(shè)性能控制器,使得閉環(huán)系統(tǒng)能夠穩(wěn)定地跟蹤參考輸入信號yd,閉環(huán)系統(tǒng)所有信號半全局一致有界且跟蹤誤差滿足預(yù)先規(guī)定的動態(tài)性能.為避免反推設(shè)計(jì)的繁瑣過程,本節(jié)參照文獻(xiàn)[3]將系統(tǒng)(1)變換為便于控制器設(shè)計(jì)的積分鏈?zhǔn)较到y(tǒng).首先,定義如下新的狀態(tài)變量:
結(jié)合新定義的狀態(tài)變量(2)和坐標(biāo)變換(3)-(18),非仿射純反饋系統(tǒng)(1)被改寫成了積分鏈?zhǔn)较到y(tǒng)(19).由于y1=x1=χ1,針對系統(tǒng)系(1)所設(shè)置的控制目標(biāo)可以通過控制變換后的系統(tǒng)(19)得以實(shí)現(xiàn).然而,在系統(tǒng)(19)中,狀態(tài)χi(i=2,3,···,n)不能直接測得,且均為未知函數(shù).下文將借助于必要的假設(shè)以保證系統(tǒng)(19)的可控性;然后,采用高階微分器對狀態(tài)χi進(jìn)行估計(jì);最后,針對系統(tǒng)(19)設(shè)計(jì)自適應(yīng)神經(jīng)網(wǎng)絡(luò)預(yù)設(shè)性能輸出反饋控制器.
式中bj與cj=[cj,1cj,2··· cj,n]T分別是高斯基函數(shù)的寬度和中心點(diǎn)坐標(biāo)向量.
變換系統(tǒng)(19)的狀態(tài)χi(i=2,3,···,n)可視為系統(tǒng)輸出y=χ1的i-1階微分.為估計(jì)無數(shù)學(xué)解析表達(dá)式的信號的各階導(dǎo)數(shù),文獻(xiàn)[24-26]構(gòu)造了一種有限時間收斂的新型高階微分器,其具體結(jié)構(gòu)如下:
注2引理2闡述了微分器(22)的特點(diǎn),具體證明過程參見文獻(xiàn)[24-26],本文不再贅述.?i是χ(i-1)的估計(jì)值,估計(jì)誤差是(1/h)Υ1Υ2-i+1的高階無窮小.當(dāng)選取足夠大的參數(shù)h ?1時,估計(jì)誤差可以任意小.因此,可假設(shè)存在未知正數(shù)?i滿足|?i-χi|≤?i.文獻(xiàn)[24]指出:h越大,微分器響應(yīng)速度越快,估計(jì)精度越高,但可能引起超調(diào)并削弱噪聲抑制能力.κi越大,對應(yīng)的第i個狀態(tài)的估計(jì)誤差越小,但同樣可能引起超調(diào)并削弱噪聲抑制能力.因此,在參數(shù)選取過程中應(yīng)綜合考慮微分器的估計(jì)精度、超調(diào)與噪聲抑制能力.
圖1 由誤差面s(t)/p驅(qū)動的n-1個串聯(lián)低通濾波器Fig.1 A series of first order linear low pass filters driven by error manifolds(t)/p
為保證誤差面s(t)實(shí)現(xiàn)預(yù)設(shè)性能,假設(shè)s(t)滿足以下不等式約束:
其中性能函數(shù)ρ(t)定義為
式中:ρ0=ρ(0)是性能函數(shù)的初始值,ρ∞=ρ(∞)是性能函數(shù)的穩(wěn)態(tài)值,l≥0是指數(shù)函數(shù)的收斂速率.通過選擇合適的參數(shù)ρ0,l與ρ∞可使得q >l,ρo >ρ∞>0且|s(0)|<ρ(0)成立.因此,有界且保持非正;ρ0限制了跟蹤誤差s(t)在瞬態(tài)的超調(diào)量;ρ∞約束了跟蹤誤差s(t)在穩(wěn)態(tài)時的變化范圍.在具體應(yīng)用中,ρ(t)的參數(shù)需根據(jù)實(shí)際對象的初始誤差、物理系統(tǒng)響應(yīng)帶寬及跟蹤精度需求進(jìn)行選擇.
定理1若不等式(26)成立,則可用誤差有界并且滿足以下預(yù)設(shè)的指數(shù)收斂約束
圖2 自適應(yīng)神經(jīng)網(wǎng)絡(luò)快速預(yù)設(shè)性能控制方案示意圖Fig.2 The illustration of the adaptive neural network fast prescribed performance control
定理3若變換系統(tǒng)(19)滿足假設(shè)1 和假設(shè)2 且|s(0)|<ρ(0)成立,則對于?P >0與緊集
自適應(yīng)神經(jīng)網(wǎng)絡(luò)預(yù)設(shè)性能控制器(22)(59)-(61)能夠使閉環(huán)系統(tǒng)具有以下特性:所有信號半全局最終一致有界;跟蹤誤差滿足預(yù)先設(shè)定的瞬態(tài)和穩(wěn)態(tài)性能.
證定義如下Lyapunov候選函數(shù):
注3|s(0)|<ρ(0)保證了當(dāng)t∈[0,tm)時,式(49)有定義,即控制律有效,其中tm為大于0的極小值.由定理3可知,控制器可使得轉(zhuǎn)換誤差z(t)有界.根據(jù)定理2,z(t)有界,則預(yù)設(shè)性能(26)可以實(shí)現(xiàn).若在某一時刻誤差面將突破性能包絡(luò),z(t)將趨向于無窮大,由式(68)可知將趨向負(fù)無窮,即性能約束不會被違背.因此,t ∈[0,tm)可推廣到t∈[0,+∞),本文的控制器設(shè)計(jì)思路是合理的.
為初步驗(yàn)證上述控制方案的適用性,本小節(jié)以平衡車縱向傾角跟蹤控制為例進(jìn)行仿真研究.平衡車縱向旋轉(zhuǎn)動力學(xué)方程如下[27]:
其中:φ為平衡車縱向傾角;m=85 kg為乘客質(zhì)量;g=9.8 m/s為重力加速度;ˉl=0.85 m為乘客重心高度;M=10 kg為平衡車質(zhì)量;I=68.98 kg·m2為慣性矩;F=2ktnr(Γ -eb)/(?r0)是電機(jī)作用在平衡車上的力,其中:kt=0.869 N/A為電動機(jī)轉(zhuǎn)矩常數(shù);nr為傳動系數(shù);Γ為電動機(jī)輸入電壓;eb為反電動勢電壓;r0=0.2 m為車輪半徑;?=1 ?為電動機(jī)電阻值;具體參數(shù)定義與取值見文獻(xiàn)[27].令x1=φ,x2=,u=-Γ,則系統(tǒng)(72)可改寫為以下形式:
上述非仿射模型呈積分鏈?zhǔn)浇Y(jié)構(gòu),為系統(tǒng)(1)的特殊形式.因此不需要采用微分器對變換系統(tǒng)進(jìn)行狀態(tài)估計(jì).由f(x1,x2,u)與?(t)的具體形式易知系統(tǒng)(73)滿足假設(shè)1與假設(shè)2,因此可設(shè)計(jì)如下自適應(yīng)神經(jīng)網(wǎng)絡(luò)預(yù)設(shè)性能控制器:
其中:轉(zhuǎn)化誤差z=ln[(ζ(t)+1)/(1-ζ(t))]/2,標(biāo)準(zhǔn)化誤差ζ(t)=s(t)/ρ(t),誤差面s(t)=3e1(t)+0.4·e2(t),自適應(yīng)更新律
神經(jīng)網(wǎng)絡(luò)W?Tψ()包含5個單元,均勻分布在區(qū)間[-0.5,0.5]上,每個單元寬度為0.5.設(shè)置(0)=0,(0)=0.預(yù)設(shè)性能函數(shù)取為
為體現(xiàn)所設(shè)計(jì)的預(yù)設(shè)性能控制器(prescribed performance control,PPC)的性能,本節(jié)以文獻(xiàn)[3]所設(shè)計(jì)的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器(adaptive neural control,ANC)作為對照算例.在仿真中,初始條件φ(0)=40?,(0)=0,指令信號φd=0,=0.
圖3-5為具體的仿真結(jié)果.圖3(a)顯示PPC算例的誤差面s滿足瞬態(tài)和穩(wěn)態(tài)性能約束.由于未考慮性能約束,ANC算例的誤差面s超出了性能包絡(luò).從圖4(a)可以看出,與ANC相比,PPC的實(shí)際跟蹤軌跡具有更小的超調(diào).圖4(b)和圖5(a)表明系統(tǒng)狀態(tài)和自適應(yīng)參數(shù)均有界.與PPC相比,由于ANC誤差面未進(jìn)行性能約束,其狀態(tài)x2的峰值更大,對于平衡車使用者而言,體驗(yàn)感會更差.從圖4(b)可以看出兩種控制器所需的控制輸入相當(dāng),且不存在高頻抖振.
圖3 誤差面與轉(zhuǎn)化誤差Fig.3 The error manifolds and transformed error
圖4 參考指令、系統(tǒng)輸出與狀態(tài)Fig.4 The reference trajectory,system outputs and states
圖5 自適應(yīng)參數(shù)與控制輸入Fig.5 The adaptive parameters and control inputs
為了進(jìn)一步驗(yàn)證本章所提出控制方案的適用性,本小節(jié)以含模型不確定性的單連桿機(jī)械臂系統(tǒng)為控制對象,對比了文獻(xiàn)[3]的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制方法(ANC)和本節(jié)提出的預(yù)設(shè)性能控制方法(PPC).仿真采用的機(jī)械臂系統(tǒng)動力學(xué)模型表述如下[28]:
其中:φ是機(jī)械臂角度;τ是電動機(jī)電樞電流;u表示控制輸入;?=0.2 sint代表外部干擾.詳細(xì)的參數(shù)定義與取值參見文獻(xiàn)[28],其中:D=1,B=1,N=10,M=0.05,H=0.5,Km=10.指令信號由以下Van der Pol 振蕩器產(chǎn)生:
由此可知系統(tǒng)(79)滿足假設(shè)1與假設(shè)2.在控制器設(shè)計(jì)過程中,需要獲取變換模型(79)的狀態(tài)估計(jì)值.根據(jù)引理2可采用如下有限時間收斂的三階微分器:
圖6-8為具體的仿真結(jié)果.圖6(a)表明微分器能精確地估計(jì)變換系統(tǒng)的狀態(tài)χ1,圖6(b)顯示PPC的誤差面s滿足瞬態(tài)和穩(wěn)態(tài)性能約束.從圖7 可以看出,與ANC相比,PPC的實(shí)際跟蹤軌跡具有更小的超調(diào)與穩(wěn)態(tài)誤差.圖8和圖9(a)表明系統(tǒng)狀態(tài)和自適應(yīng)參數(shù)均有界.從圖9(b)可以看出,在控制初始階段,ANC控制輸入的峰值較PPC大.由圖10可知,新型微分器能有效地估計(jì)狀態(tài)χ1的二階和三階導(dǎo)數(shù).綜上所述,本章所設(shè)計(jì)自適應(yīng)神經(jīng)網(wǎng)絡(luò)預(yù)設(shè)性能控制器能使閉環(huán)系統(tǒng)所有信號半全局一致有界且跟蹤誤差滿足預(yù)設(shè)性能.
圖6 微分器估計(jì)值與誤差面Fig.6 The differentiator estimates and error manifolds
圖7 參考指令、系統(tǒng)輸出與實(shí)際跟蹤誤差Fig.7 The reference signal,outputs and actual tracking errors
圖8 系統(tǒng)狀態(tài)Fig.8 The system states
圖9 自適應(yīng)參數(shù)與控制輸入Fig.9 The adaptive parameters and control inputs
針對一類非仿射純反饋系統(tǒng),本文設(shè)計(jì)了一種自適應(yīng)神經(jīng)網(wǎng)絡(luò)預(yù)設(shè)性能控制器.首先,基于非仿射函數(shù)光滑的條件,將非仿射純反饋系統(tǒng)變換為具有積分鏈?zhǔn)浇Y(jié)構(gòu)的偽仿射系統(tǒng).其次,利用有限時間收斂的微分器對變換系統(tǒng)的狀態(tài)進(jìn)行估計(jì).為便于設(shè)計(jì)控制器,基于帶性能約束的誤差面構(gòu)造了轉(zhuǎn)化誤差.最后,采用自適應(yīng)神經(jīng)網(wǎng)絡(luò)技術(shù)對連續(xù)未知函數(shù)進(jìn)行估計(jì)并設(shè)計(jì)控制律.與純反饋系統(tǒng)控制器設(shè)計(jì)中常采用的反推技術(shù)相比,本章提出的控制器避免了復(fù)雜的反推過程,控制器只需要一個神經(jīng)網(wǎng)絡(luò)估計(jì)器,降低了計(jì)算復(fù)雜度.在控制器設(shè)計(jì)過程中考慮性能約束,使得閉環(huán)系統(tǒng)的瞬態(tài)和穩(wěn)態(tài)性能得到了保證.快速的瞬態(tài)收斂過程可能要求較大的控制輸入響應(yīng)速度,因此,下一步將對考慮控制輸入頻率受限的預(yù)設(shè)性能控制器進(jìn)行研究.