徐海祥, 胡 聰, 余文曌,*, 姚國(guó)全
(1. 武漢理工大學(xué)高性能艦船技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室, 湖北 武漢 430063;2. 武漢理工大學(xué)船海與能源動(dòng)力工程學(xué)院, 湖北 武漢 430063)
無(wú)人水下航行器(unmanned underwater vehicle, UUV)廣泛應(yīng)用于水下勘探、地圖構(gòu)建及各種水下軍事任務(wù)[1]。出于安全考慮,UUV一般設(shè)置為正浮力狀態(tài)。但其自備動(dòng)力,能源有限,欠驅(qū)動(dòng)配置的UUV必須在航行時(shí)保持一定的攻角以平衡剩余浮力。在該運(yùn)動(dòng)狀態(tài)下,UUV航行阻力將會(huì)增加,同時(shí)低速航行時(shí)的水動(dòng)力性能下降,將導(dǎo)致自身的剩余浮力難以平衡[2]。對(duì)于配置垂向推進(jìn)器的UUV,雖然具有良好的機(jī)動(dòng)能力,但難以保證較低的能源消耗[3]。而浮力調(diào)節(jié)式UUV通過(guò)改變自身重量或者排水體積的方式實(shí)現(xiàn)深度、縱搖角的控制,且能耗需求低,因此相較于其他類型的UUV在長(zhǎng)期大范圍任務(wù)場(chǎng)景下更具優(yōu)勢(shì)。但浮力調(diào)節(jié)機(jī)構(gòu)不同于螺旋槳等執(zhí)行機(jī)構(gòu),對(duì)控制輸入的約束更加嚴(yán)格。如果在設(shè)計(jì)控制系統(tǒng)的同時(shí)不考慮浮力調(diào)節(jié)機(jī)構(gòu)的限制,將會(huì)影響系統(tǒng)動(dòng)態(tài)性能、穩(wěn)態(tài)精度,甚至導(dǎo)致系統(tǒng)失穩(wěn)[4]。因此,研究輸入約束下的浮力調(diào)節(jié)式UUV變深控制對(duì)其長(zhǎng)期大范圍場(chǎng)景下的應(yīng)用具有重要的意義。
針對(duì)浮力調(diào)節(jié)式UUV的變深控制問(wèn)題,國(guó)內(nèi)外學(xué)者進(jìn)行了大量的研究。張勛等人[5]基于簡(jiǎn)化的UUV 垂直面運(yùn)動(dòng)模型,設(shè)計(jì)了基于比例-積分-微分(proportional, integral, differential, PID) 和均衡系統(tǒng)的深度、縱傾和浮態(tài)的控制方法,該方法能有效控制UUV的垂向運(yùn)動(dòng)。Sylvester等人[6]基于Bang-Bang控制方法設(shè)計(jì)了兩種反饋控制器,并通過(guò)仿真證明了基于模型的Bang-Bang控制能實(shí)現(xiàn)更精準(zhǔn)的浮力調(diào)節(jié)。王雨等人[7]在UUV的運(yùn)動(dòng)模型中,考慮深度變化對(duì)浮力的影響,采用模糊自適應(yīng)PID控制方法對(duì)UUV深沉運(yùn)動(dòng)進(jìn)行研究,該方法在超調(diào)量、調(diào)節(jié)時(shí)間及抗干擾方面都有較好的控制效果。孫慶剛等人[8]考慮能源以及溫度對(duì)浮力調(diào)節(jié)系統(tǒng)的影響,基于無(wú)模型自適應(yīng)控制方法,解決了UUV 定深懸浮控制問(wèn)題,且該方法能滿足工程實(shí)際需要。Zavislak等人[9]設(shè)計(jì)了一種比例微分加速度反饋控制器,實(shí)現(xiàn)了浮力調(diào)節(jié)式UUV的垂直面控制,對(duì)小擾動(dòng)的抑制有較好的效果。Tiwari等人[10]采用線性二次調(diào)節(jié)狀態(tài)反饋控制器,研究了不同浮力狀態(tài)下UUV的控制性能, 結(jié)果表明該方法在調(diào)節(jié)浮力、控制和保持深度、控制升沉速度等方面具有良好的效果。
此外,執(zhí)行機(jī)構(gòu)動(dòng)態(tài)特性及物理約束對(duì)控制系統(tǒng)設(shè)計(jì)的影響不容忽視[11]。近年來(lái)形成了兩種方法來(lái)解決這一問(wèn)題,即一步法和兩步法[12]。一步法是在控制器設(shè)計(jì)的同時(shí)滿足標(biāo)稱控制性能與執(zhí)行機(jī)構(gòu)飽和約束,使系統(tǒng)達(dá)到閉環(huán)穩(wěn)定的效果。具體的做法是:輸入飽和問(wèn)題視為扇區(qū)非線性問(wèn)題,采用不變集[13-14]、模型預(yù)測(cè)控制[15-16]、有界反推法[17]等理論進(jìn)行設(shè)計(jì),保證控制輸入一直處于執(zhí)行機(jī)構(gòu)的可行域內(nèi)。而兩步法在控制器設(shè)計(jì)的時(shí)候,一部分功能滿足標(biāo)稱的控制性能,一部分處理執(zhí)行機(jī)構(gòu)的約束。其具體做法是:基于不考慮飽和約束的標(biāo)稱控制器,設(shè)計(jì)抗飽和補(bǔ)償器來(lái)處理飽和約束。通過(guò)在標(biāo)稱控制器中引入抗飽和補(bǔ)償器確保(發(fā)生飽和時(shí))控制系統(tǒng)的穩(wěn)定,并且在執(zhí)行機(jī)構(gòu)未達(dá)到飽和時(shí),不影響標(biāo)稱控制器的性能[18-20]。 由于一步法的保守性和計(jì)算復(fù)雜性[21-22],實(shí)際工程應(yīng)用仍以兩步法為主,實(shí)現(xiàn)UUV控制系統(tǒng)穩(wěn)定的同時(shí)降低系統(tǒng)在輸入飽和狀態(tài)下的性能損失。
因此,本文將基于浮力調(diào)節(jié)系統(tǒng)的UUV垂直面變深控制視為輸入約束下的控制問(wèn)題,建立考慮浮力調(diào)節(jié)機(jī)構(gòu)動(dòng)態(tài)特性的UUV數(shù)學(xué)模型,引入線性擴(kuò)張狀態(tài)觀測(cè)器(linear extended state observer, LESO)對(duì)UUV狀態(tài)進(jìn)行估計(jì),并采用非線性跟蹤微分器處理反步法虛擬控制量求導(dǎo)問(wèn)題,執(zhí)行機(jī)構(gòu)的未知?jiǎng)討B(tài)參數(shù)由自適應(yīng)律獲取。在此基礎(chǔ)上,設(shè)計(jì)正交神經(jīng)網(wǎng)絡(luò)飽和補(bǔ)償器,并基于李雅普諾夫穩(wěn)定性理論設(shè)計(jì)了權(quán)值自適應(yīng)律,最后分析閉環(huán)系統(tǒng)的穩(wěn)定性。仿真結(jié)果驗(yàn)證了本文所提方法的有效性。
為了描述UUV的運(yùn)動(dòng)狀態(tài),建立如圖1所示的固定坐標(biāo)系({N}坐標(biāo)系)和體坐標(biāo)系({B}坐標(biāo)系),詳細(xì)說(shuō)明見(jiàn)文獻(xiàn)[23]。
圖1 UUV固定坐標(biāo)系與體坐標(biāo)系Fig.1 UUV fixed corrdinate system and body coordinate system
本文研究UUV浮力調(diào)節(jié)機(jī)構(gòu)對(duì)控制輸入的約束問(wèn)題,因此忽略水平運(yùn)動(dòng)的影響,建立如下UUV垂直面三自由度數(shù)學(xué)模型:
(1)
式中:η=[x,z,θ]T為{N}坐標(biāo)系下的北向位置、深度、縱搖角;v=[u,w,q]T為{B}坐標(biāo)系下的縱向、垂向、縱搖角速度;τ=[τx,τz,τq]T表示{B}坐標(biāo)系下飽和約束下的控制輸入;b表示{N}坐標(biāo)系下的環(huán)境干擾;M為系統(tǒng)慣性矩陣;C(v)為科里奧利矩陣;D表示系統(tǒng)阻尼矩陣;各模型參數(shù)矩陣[23]具體為
J(η)為坐標(biāo)轉(zhuǎn)換矩陣,具體為
g(η)為重力與浮力產(chǎn)生的力與力矩,由于垂向及縱搖方向的分量為被控對(duì)象的控制輸入,因此具體表示如下:
式中:G為UUV的重量;B為UUV受到的浮力。
浮力調(diào)節(jié)機(jī)構(gòu)的動(dòng)態(tài)特性可以近似為一階慣性環(huán)節(jié)[5],同時(shí)可以采用非線性飽和函數(shù)描述控制輸入的幅值約束[4]。因此,浮力調(diào)節(jié)機(jī)構(gòu)的模型可以描述為
(2)
其中,l1為艏部油囊與浮心的距離;l2為艉部油囊與浮心的距離。sat(uc)表示控制輸入的飽和約束,具體為
(3)
因此,控制輸入的飽和特性可以描述為
δ=sat(uc)-uc
(4)
此外,理想的控制律應(yīng)該為τ=sat(uc),處于飽和約束界內(nèi)。
對(duì)考慮垂直面三自由度運(yùn)動(dòng)的UUV模型,在輸入飽和約束下,設(shè)計(jì)合適的控制輸入τ,垂直面輸出狀態(tài)能收斂到指定的縱向速度ud、深度zd、縱搖角θd,并保證閉環(huán)系統(tǒng)的所有誤差信號(hào)一致最終有界。
如圖2所示,所設(shè)計(jì)的控制系統(tǒng)由以下4個(gè)部分組成:LESO、指令濾波器、自適應(yīng)動(dòng)態(tài)面控制器、正交神經(jīng)網(wǎng)絡(luò)飽和補(bǔ)償器。首先設(shè)計(jì)LESO對(duì)UUV的運(yùn)動(dòng)狀態(tài)進(jìn)行在線估計(jì);其次設(shè)計(jì)指令濾波器對(duì)反步法設(shè)計(jì)的虛擬控制律進(jìn)行平滑、求導(dǎo);然后設(shè)計(jì)自適應(yīng)動(dòng)態(tài)面控制器,實(shí)現(xiàn)控制目標(biāo)的同時(shí)處理執(zhí)行機(jī)構(gòu)的未知?jiǎng)討B(tài)特性,而模型動(dòng)態(tài)不確定性和浮力變化產(chǎn)生的干擾,采用LESO進(jìn)行估計(jì)補(bǔ)償;最后,設(shè)計(jì)正交神經(jīng)網(wǎng)絡(luò)飽和補(bǔ)償器處理輸入飽和問(wèn)題??刂葡到y(tǒng)的詳細(xì)設(shè)計(jì)以及圖中各符號(hào)含義將在以下4個(gè)小節(jié)中分別進(jìn)行介紹。
圖2 控制系統(tǒng)結(jié)構(gòu)Fig.2 Structure of control system
由于UUV為時(shí)變非線性系統(tǒng),系統(tǒng)的模型參數(shù)與外部干擾難以實(shí)時(shí)精確地獲得,因此本節(jié)設(shè)計(jì)LESO,將包括模型不確定性、浮力變化干擾在內(nèi)的“總擾動(dòng)”估計(jì)出來(lái),以實(shí)現(xiàn)控制系統(tǒng)良好的抗干擾性能[24]。
因此,定義系統(tǒng)的干擾狀態(tài):
(5)
結(jié)合和,UUV垂向三自由度模型可重新寫(xiě)為[25]
(6)
根據(jù)式(6),所設(shè)計(jì)的LESO為
(7)
為了解決反步法設(shè)計(jì)控制器帶來(lái)的“微分爆炸”問(wèn)題,同時(shí)平衡系統(tǒng)快速性與控制超調(diào)間的矛盾,避免控制器輸出量的突變,引入非線性跟蹤微分器進(jìn)行指令濾波器設(shè)計(jì)。
采用文獻(xiàn)[26]提出的正切sigmoid函數(shù)作為加速度函數(shù),以單輸入單輸出系統(tǒng)為例,建立如下非線性跟蹤微分器:
(8)
其中,x表示任意變量。
(9)
式中:ζ1為微分跟蹤器給出的位置指令;H為投影矩陣,具體為
因此,設(shè)計(jì)速度的虛擬控制律:
α1=-RT(η)(C1z1+D1z1)+RT(η)ζ2
(10)
式中:C1、D1為正定對(duì)稱矩陣,D1為引入鎮(zhèn)定觀測(cè)誤差的參數(shù)矩陣[27];ζ2為速度指令。由于本文縱向采用速度控制,令α1(1)=ud。
對(duì)z2求導(dǎo),等式兩邊同乘M0,得
(11)
考慮到浮力機(jī)構(gòu)的動(dòng)態(tài)特性,執(zhí)行機(jī)構(gòu)的虛擬控制律可以表示為
(12)
對(duì)z3求導(dǎo),等式兩邊同乘時(shí)間矩陣Tn,得
(13)
因此,最終的控制律為
(14)
(15)
式中:γ2為正常數(shù)。
由于執(zhí)行機(jī)構(gòu)的輸出信號(hào)很難直接獲取,本文利用神經(jīng)網(wǎng)絡(luò)良好的非線性逼近能力,估計(jì)出δ[4,28]。而正交神經(jīng)網(wǎng)絡(luò)具有良好收斂能力和較低計(jì)算復(fù)雜度,適合用于執(zhí)行機(jī)構(gòu)飽和函數(shù)δ的近似:
δ=WTP(ξ)+εδ
(16)
式中:m為神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù);激活函數(shù)g(ξ)=1/[1+exp(-σ∑ξ)]。
實(shí)際應(yīng)用中,理想的神經(jīng)網(wǎng)絡(luò)模型通過(guò)在線學(xué)習(xí)或者離線學(xué)習(xí)等方式獲取。因此,理想的神經(jīng)網(wǎng)絡(luò)模型的近似為
(17)
(18)
式中:
其中,06×6為零矩陣,I6×6為單位矩陣。
假設(shè) 1系統(tǒng)的擾動(dòng)狀態(tài)χ對(duì)其所有自變量是連續(xù)可微的;
證明對(duì)于給定正定矩陣QT=Q,存在正定矩陣P,滿足如下李雅普諾夫方程[25]:
(19)
因此,構(gòu)造觀測(cè)誤差相關(guān)的李雅普諾夫函數(shù):
(20)
可知V1≥0恒成立,當(dāng)且僅當(dāng)e1=0時(shí)等號(hào)成立。
由式(19)、式(20)和Young不等式[15],式(20)關(guān)于時(shí)間的導(dǎo)數(shù)為
(21)
即
(22)
對(duì)式(22)求解,并化簡(jiǎn)為
(23)
證畢
假設(shè) 3ζ1、ζ2、ζd對(duì)于變量t均有界可積。
假設(shè) 4輸入信號(hào)ζd的一階導(dǎo)及二階導(dǎo)有界。
引理 1[26]對(duì)于如下系統(tǒng):
(24)
在變量z1=0和z2=0處漸進(jìn)收斂,其中b1、b2為正常數(shù)。
定理 2對(duì)于系統(tǒng),如果滿足k1、a1、a2均為正數(shù),則對(duì)于任意的可積函數(shù)ζd,T>0,該系統(tǒng)的解滿足:
(25)
即系統(tǒng)漸進(jìn)收斂至ζd。
(26)
即
(27)
證畢
(28)
假設(shè) 5(逼近誤差有界)理想神經(jīng)網(wǎng)絡(luò)的逼近誤差εδ滿足
假設(shè) 6(理想神經(jīng)網(wǎng)絡(luò)權(quán)值有界)理想神經(jīng)網(wǎng)絡(luò)的最優(yōu)權(quán)值W滿足
在一些實(shí)際系統(tǒng)中,如果知道其變量的上界,上述假設(shè)的界限是可以計(jì)算出的[4,28]。
(29)
式中:κ(·)表示κ類函數(shù)。
定理 3正交神經(jīng)網(wǎng)絡(luò)的權(quán)值滿足如下自適應(yīng)律:
(30)
控制律滿足:
證明構(gòu)造LESO輸入下的控制系統(tǒng)的李雅普諾夫函數(shù):
(31)
根據(jù)式(9)、式(11)及式(13),式(31)關(guān)于時(shí)間的導(dǎo)數(shù)為
(32)
(33)
(34)
(35)
根據(jù)文獻(xiàn)[30]和文獻(xiàn)[27],選取合適的正定矩陣Λ1、Λ2,有如下不等式關(guān)系成立:
(36)
(37)
因此,綜上式(17)、式(28)、式(33)~式(35),并在式(32)中代入:
(38)
(39)
則式(32)可簡(jiǎn)化為
(40)
根據(jù)定理1、定理2、引理2及式(15)、式(30),有
其中,Qi(i=1,2,3)為Q=diag(Q1,Q2,Q3)的子矩陣。
進(jìn)一步,定義參數(shù):
證畢
本文采用南安普頓大學(xué)的Delphin2號(hào)作為仿真試驗(yàn)的UUV模型[23],采用文獻(xiàn)[3]的油囊模型作為真實(shí)浮力調(diào)節(jié)系統(tǒng)模型,具體布局如圖3所示,浮力調(diào)節(jié)機(jī)構(gòu)參數(shù)l1=l2=0.4 m。
圖3 浮力調(diào)節(jié)機(jī)構(gòu)布局圖Fig.3 Layout of buoyancy regulating mechanism
UUV初始深度為0 m,縱搖角0°,采樣周期為0.5 s,仿真時(shí)長(zhǎng)為2 000 s。速度指令為0.2 m/s,深度指令為8 m(0~600 s)、16 m(600~1 300 s)、24 m(1 300~2 000 s),并在深度下降過(guò)程保持初始縱搖角不變。
為了充分驗(yàn)證本文所提方法的有效性,本節(jié)設(shè)計(jì)了相應(yīng)的仿真試驗(yàn)。首先將每個(gè)浮力調(diào)節(jié)機(jī)構(gòu)的上限設(shè)為±3 N,凈浮力為-5 N(向下為正),然后采用文獻(xiàn)[31]中基于LESO的動(dòng)態(tài)面控制(后面用傳統(tǒng)動(dòng)態(tài)面控制代指),和本文所提方法進(jìn)行仿真對(duì)比驗(yàn)證。
LESO和動(dòng)態(tài)面控制器參數(shù)為
正交神經(jīng)網(wǎng)絡(luò)參數(shù)為γ1=0.01diag(2,2,2,10,10);KW=0.000 2;初始權(quán)值矩陣為
跟蹤微分器參數(shù)a1=0.015,a2=0.25,k1=8;自適應(yīng)律參數(shù)γ2=5。
圖4~圖8為UUV在浮力調(diào)節(jié)機(jī)構(gòu)約束條件下的仿真結(jié)果。圖4表明,在輸入幅值飽和約束場(chǎng)景下,執(zhí)行機(jī)構(gòu)的物理限制會(huì)明顯影響UUV的垂直面控制效果,UUV的速度及縱搖角均存在小幅震蕩,而垂向由于存在較大浮力與阻力,震蕩不明顯,但動(dòng)態(tài)調(diào)整過(guò)程較長(zhǎng)。同時(shí)可以看出,加入正交神經(jīng)網(wǎng)絡(luò)抗飽和補(bǔ)償器的方法,無(wú)論是穩(wěn)態(tài)精度還是動(dòng)態(tài)調(diào)整速度均要優(yōu)于傳統(tǒng)動(dòng)態(tài)面控制。這是因?yàn)閳?zhí)行機(jī)構(gòu)的飽和將降低系統(tǒng)的動(dòng)態(tài)性能,如果不能及時(shí)退出飽和狀態(tài),將導(dǎo)致閉環(huán)系統(tǒng)的失穩(wěn)。
圖4 兩種情況下的期望縱向速度、深度、姿態(tài)響應(yīng)結(jié)果Fig.4 Response results of expected surge velocity, depth and attitude in two cases
圖5為執(zhí)行機(jī)構(gòu)的控制輸入變化曲線。由圖5可知,由于沒(méi)有抗飽和補(bǔ)償器的作用,傳統(tǒng)動(dòng)態(tài)面控制輸入變化幅度更大。進(jìn)一步地,由圖6和圖7的浮力調(diào)節(jié)機(jī)構(gòu)的響應(yīng)情況可以發(fā)現(xiàn),兩種方法均會(huì)導(dǎo)致執(zhí)行機(jī)構(gòu)飽和,但在抗飽和補(bǔ)償器的作用下,會(huì)使控制輸入較快地退出過(guò)飽和狀態(tài),從而避免控制效果的進(jìn)一步下降,甚至導(dǎo)致系統(tǒng)的失穩(wěn)。
圖5 控制輸入變化曲線Fig.5 Changing curve of control input
圖6 考慮抗飽和補(bǔ)償?shù)膱?zhí)行機(jī)構(gòu)響應(yīng)Fig.6 Actuator response considering anti saturation compensation
圖7 未考慮抗飽和補(bǔ)償?shù)膱?zhí)行機(jī)構(gòu)響應(yīng)Fig.7 Actuator response without considering anti saturation compensation
圖8為L(zhǎng)ESO對(duì)干擾的估計(jì)情況,圖中藍(lán)色實(shí)線表示UUV受到的實(shí)際干擾,紅色實(shí)線表示所設(shè)計(jì)的LESO對(duì)干擾的估計(jì)值,結(jié)果表明,除初始狀態(tài)和執(zhí)行機(jī)構(gòu)飽和情況外,LESO實(shí)現(xiàn)了對(duì)干擾的良好估計(jì),在執(zhí)行機(jī)構(gòu)飽和時(shí),存在較小的估計(jì)偏差,這是因?yàn)檩斎爰s束限制了LESO的帶寬。
圖8 LESO對(duì)干擾的估計(jì)情況Fig.8 Estimation of interference by LESO
針對(duì)UUV垂直面運(yùn)動(dòng)模型存在非線性、不確定性等特點(diǎn),并考慮到浮力調(diào)節(jié)機(jī)構(gòu)的物理限制,提出了基于正交神經(jīng)網(wǎng)絡(luò)飽和補(bǔ)償和LESO干擾補(bǔ)償?shù)淖赃m應(yīng)動(dòng)態(tài)面控制方法。該方法結(jié)構(gòu)簡(jiǎn)單,易于工程實(shí)現(xiàn):
(1) 所設(shè)計(jì)的正交神經(jīng)網(wǎng)絡(luò)抗飽和補(bǔ)償器,有效降低了輸入飽和狀態(tài)下浮力調(diào)節(jié)式UUV控制性能的損失;
(2) 考慮浮力調(diào)節(jié)機(jī)構(gòu)動(dòng)態(tài)特性并采用自適應(yīng)律對(duì)未知參數(shù)進(jìn)行估計(jì),有效避免了建模誤差導(dǎo)致的參數(shù)不確定性問(wèn)題;
(3) 設(shè)計(jì)合適的仿真對(duì)比試驗(yàn),結(jié)果表明,輸入飽和約束下,該方法在快速性、穩(wěn)定性方面均優(yōu)于傳統(tǒng)動(dòng)態(tài)面方法。