侯 捷,陳 謀,劉 楠
(南京航空航天大學自動化學院,江蘇南京 211106)
無人直升機具有輕便,能夠垂直起降、空中懸停、靈活飛行等特點,并可根據(jù)任務需求搭載各種載荷,具有廣闊的應用前景,是目前國內(nèi)外研究的熱點.由于無人直升機的運動學和空氣動力學問題較為復雜,因而高性能飛行控制是無人直升機研究的重要內(nèi)容之一.無人直升機具有高度的非線性和復雜的動力學特性,并且其操縱通道多、耦合較強,是一種穩(wěn)定性較差、控制較難的欠驅(qū)動飛行器,其飛行控制相比固定翼無人機與多旋翼無人機更為困難[1].由于無人直升機難以進行精確建模,且通常在無人直升機懸停狀態(tài)下完成建模,所得到的模型較難涵蓋機動中直升機的特性,并且模型中的各項參數(shù)在測量時也不可避免地出現(xiàn)各種偏差或難以獲取.由此可以看出無人直升機的數(shù)學模型存在不確定性,若使用需要精確數(shù)學模型的控制方法,如動態(tài)逆等,勢必會造成控制精度不高、存在穩(wěn)態(tài)誤差等問題.因而為獲得更好的控制效果,需要對系統(tǒng)不確定性進行有效處理.
針對系統(tǒng)不確定性問題,文獻[2]提出使用一種基于強化學習與超螺旋相結(jié)合的非線性控制算法提高無人直升機系統(tǒng)的魯棒性.文獻[3]采用神經(jīng)網(wǎng)絡增強無人直升機姿態(tài)控制回路魯棒性能,并采用二型非劣排序遺傳算法(non-dominated sorting genetic algorithm II,NSGA–II)對神經(jīng)網(wǎng)絡調(diào)參進行優(yōu)化,取得了較好的控制效果.文獻[4]針對無人機狀態(tài)觀測以及輸出反饋控制等多個問題使用神經(jīng)網(wǎng)絡進行飛行控制器設計,以降低外部干擾和內(nèi)部建模誤差對飛行控制的影響.針對現(xiàn)有方法對直升機動力學模型的先驗信息依賴較大的問題,文獻[5]基于增強學習提出了一種無人直升機姿態(tài)控制方法.文獻[6]基于類腦發(fā)育技術提出了一種無人機的防碰撞控制方法,并進行了算法驗證.為處理建模不精確問題,文獻[7]使用基于神經(jīng)網(wǎng)絡的增量非線性動態(tài)逆方法對無人機姿態(tài)進行控制.文獻[8]研究了基于神經(jīng)網(wǎng)絡的有限時間反步控制以解決在未知輸入飽和下的四旋翼無人機軌跡跟蹤和姿態(tài)控制問題.文獻[9]將遞歸小波神經(jīng)網(wǎng)絡與反步滑??刂品椒ㄏ嘟Y(jié)合,降低了六旋翼無人機模型不確定性對飛行控制的影響.文獻[10]使用了自適應神經(jīng)網(wǎng)絡配合周期性事件觸發(fā)控制律對一類非線性切換系統(tǒng)進行控制,通過神經(jīng)網(wǎng)絡避免了控制器對系統(tǒng)切換信號的依賴.此外神經(jīng)網(wǎng)絡在無人機受損后控制[11]和編隊飛行控制[12]等方面也有具體應用.以上成果表明神經(jīng)網(wǎng)絡在無人飛行器控制中得到了深入研究,但神經(jīng)網(wǎng)絡在逼近過程中存在逼近誤差,并且在無人直升機的飛行過程中,會受到陣風等外部干擾因素影響,導致控制器控制精度下降,甚至失穩(wěn)等問題,所以抗干擾性能是控制器設計時的一個重要考量.為了提升系統(tǒng)的抗干擾能力,需要在控制器設計時引入專門的方法以補償干擾對系統(tǒng)的影響.
為解決上述兩個問題,對系統(tǒng)干擾進行估計并補償?shù)娇刂破髦惺且环N應用較多的策略,常見的干擾觀測器設計方法包括基于名義逆模型的干擾觀測器、非線性干擾觀測器和擴張狀態(tài)觀測器(extended state observer,ESO)等.ESO相較于前兩者對原系統(tǒng)模型精確性要求更低且不會向系統(tǒng)中引入高頻噪聲[13].ESO是自抗擾控制技術的核心之一,其借用狀態(tài)觀測器的思想,將系統(tǒng)所受擾動等擴張成新的狀態(tài)變量,并對該狀態(tài)變量進行觀測.文獻[14]采用ESO觀測六自由度無人直升機所受外部干擾,以增強滑??刂破鞯目箶_能力.文獻[15]使用基于ESO的反步法控制器以補償無人直升機所受的陣風影響.在文獻[16–17]中也使用了ESO結(jié)合其他控制方法,以提高無人直升機的抗擾能力與魯棒性.
本文對上述方法進行了控制仿真,并與傳統(tǒng)動態(tài)逆控制方法進行了對比,仿真結(jié)果表明所設計的基于徑向基函數(shù)神經(jīng)網(wǎng)絡(radial basis function neural network,RBFNN)和ESO 的控制方法有效性.
本文根據(jù)無人直升機的特點,在文獻[18]基礎上,忽略機體產(chǎn)生彈性振動與形變,假設無人直升機是一個對稱的六自由度剛體,則機體慣性積IxyIyz0.根據(jù)牛頓―歐拉方程,無人直升機的仿射非線性模型描述如式(1)所示:
式中:C表示余弦函數(shù),S表示正弦函數(shù),T表示正切函數(shù);P[x y z]T為無人直升機在地面坐標系下的位置;V[u v w]T為無人直升機在地面坐標系下的速度;Θ[? θ ψ]T為機體坐標系中的直升機滾轉(zhuǎn)角、俯仰角、偏航角;?[p q r]T為機體坐標系中直升機三軸角速度;Υ[a b]T為主旋翼揮舞角,a為后倒角,b為側(cè)傾角;F[FxFyFz]T為無人直升機機體坐標系下3個方向的合力,懸停狀態(tài)下F[0 0Tmr]T,Tmr為無人直升機主旋翼拉力;u[a b Ttr]T為無人直升機姿態(tài)角速率回路控制輸入,Ttr為無人直升機尾旋翼拉力;T[TaTb]T為無人直升機揮舞運動控制輸入;fi為系統(tǒng)函數(shù)向量,gi為系統(tǒng)函數(shù)控制增益矩陣,i1,2,3,4,5;g為當?shù)刂亓铀俣?Ixx,Iyy,Izz為無人直升機繞機體坐標軸的3個慣性矩;Cm為主旋翼剛度系數(shù);Qmr為主旋翼反扭距;L[LxLyLz]T為主旋翼中心到無人直升機重心的三軸距離;H[HxHyHz]T為尾旋翼中心到無人直升機重心的三軸距離;τs是旋翼有效時間常數(shù);Alon和Blat分別為縱向和橫向有效穩(wěn)定增益.
在式(1)的基礎上,進一步考慮V,Θ和?子系統(tǒng)中存在不確定性,即
對式(1)中gP,gV,gΘ,gΩ和gΥ進行分析,易得4個矩陣的行列式分別為
由式(3)可知,在使用實際無人直升機參數(shù)時,gP,gV,gΘ,gΩ和gΥ均存在逆矩陣.
本文的目標為設計基于RBFNN與ESO的無人直升機魯棒飛行控制律,使得式(1)描述的無人直升機在受到系統(tǒng)不確定性和外界干擾綜合影響下能跟蹤給定的期望信號.為便于控制律設計,給出以下引理與假設.
引理1在有界的初始條件下,如果存在一個C1連續(xù)且正定的Lyapunov函數(shù)V(x)滿足π1(‖x‖)≤V(x)≤π2(‖x‖),使得≤?κV(x)+c,其中:π1,π2:Rn →R 為一類K∞函數(shù);κ,c為正常數(shù),則函數(shù)V(x)的解x(t)一致有界[19].
引理2RBFNN可用于逼近連續(xù)函數(shù)f(Z):Rq→R,其表達式如下:
式中:Z[z1z2··· zq]T∈Rq為RBFNN的輸入向量;?(Z)[?1(Z)ΦV(Z)··· ?p(Z)]T∈Rp為基函數(shù);∈Rp為權值向量;ε為RBFNN的逼近誤差.存在一個最優(yōu)權值向量W?,使得
式中:ε?為最優(yōu)逼近誤差;0為RBFNN逼近誤差的上界[19].
假設1時變未知外部干擾d1(t)與d2(t)及其導數(shù)有界.
假設2對于t>0,存在已知正常值M0,使得無人直升機位置回路期望跟蹤信號Pc滿足如下集合[20]:
假設3無人直升機的滾轉(zhuǎn)角?與俯仰角θ位于區(qū)間(?)[20].
針對無人直升機數(shù)學模型的不確定性,采用RBFNN對其進行逼近,同時對神經(jīng)網(wǎng)絡估計誤差和系統(tǒng)外部干擾使用ESO進行估計,具體設計過程如下.
考慮式(1)中無人直升機的位置系統(tǒng):
則可定義跟蹤誤差:
式中:Pc[xcyczc]T為無人直升機期望軌跡輸入;Vc[ucvcwc]T為位置子系統(tǒng)的虛擬控制律.
對eP求導可得
由式(9)可設計虛擬控制律Vc為
式中KP為設計的正定矩陣.將式(10)代入式(9)可得
對eV求導:
針對Vc求導,使用動態(tài)面控制方法以避免直接求導計算量過大等問題.引入一階濾波器λV,使Vc通過如下濾波器[21]:
式中tV>0為濾波器設計參數(shù).由式(13)可得濾波誤差
對eλV求導可得
式中MV(,eP)為ΠV(,eP)上的光滑函數(shù)向量,則由文獻[22]可知,MV(,eP)存在一個上界
針對ΔfV,設計使用RBFNN進行逼近,并由ESO跟蹤RBFNN的逼近誤差和系統(tǒng)外部干擾,如式(16)所示:
參考文獻[23],定義
則式(17)可改寫為
ηVi >0,i1,2,3為設計常數(shù).若選取
則易得AVi為Hurwitz矩陣,因此可知,存在一個對稱正定矩陣PVi,i1,2,3滿足如下方程:
式中:Q為正定矩陣,設計為2I.
定義GV?gV·m·[0 0 1]T,則根據(jù)式(1)中F[0 0?Tmr]T,速度子系統(tǒng)模型可修改為
由上式可以設計速度控制律為
式中KV>0為待設計控制器增益矩陣,控制器設計的主要目標是為了使eV收斂,從而保證速度子系統(tǒng)能夠跟蹤上期望信號.由式(21)可得
神經(jīng)網(wǎng)絡自適應律設計如下:
式中:ΛV>0,σV>0為設計常數(shù).
取GVTmr[F1F2F3]T,給定偏航角期望信號ψc,定義θc,?c為無人直升機姿態(tài)回路的參考信號,則按θc,?c和Tmr的順序求解可以得到[24]
定義γi[γ1i γ2i]T,對位置子系統(tǒng),選擇如下Lyapunov函數(shù):
則V1關于時間求導可得
通過前文對位置子系統(tǒng)跟蹤誤差、濾波器誤差和神經(jīng)網(wǎng)絡的分析,可以得到如下不等式:
上式中第2項和第3項有如下不等式:
式中MVPB≥‖PViBVi‖‖ΦVi‖.
由假設1可知,存在δVi≥‖li‖,MVPC‖PViCVi‖,τV1>0和τV2>0為設計參數(shù).
將式(33)–(34)代入式(32)可得
綜合式(27)–(37),則式(26)可改寫為
考慮式(1)中無人直升機的姿態(tài)系統(tǒng):
定義跟蹤誤差:
式中:Θc[?cθcψc]T為無人直升機期望姿態(tài)角信號;?c[pcqcrc]T為姿態(tài)角系統(tǒng)的虛擬控制律.
針對姿態(tài)回路中的不確定性ΔfΘ和ΔfΩ,分別設計使用RBFNN進行逼近,并由ESO觀測RBFNN的逼近誤差.同時,姿態(tài)角速率回路中的外界干擾d2(t)也由角速率系統(tǒng)ESO一并觀測.如式(39)–(40)所示:
式中:
同樣的,為避免直接求導,引入一階濾波器λΘ與λΩ:
式中tΘ>0和tΩ>0為設計參數(shù).
定義eλΘλΘ?Θc,eλΩλΩ??c.分別對eλΘ,eλΩ求導:
式中MΘ,MΩ分別存在上界
由式(39)和式(47)設計姿態(tài)角虛擬控制律:
式中KΘ為待設計正定矩陣.
設計姿態(tài)角速率控制律:
式中KΩ>0為待設計控制器增益矩陣.對式(50)和式(51)分別選取神經(jīng)網(wǎng)絡自適應律為
將V2關于時間求導可得
對eΘ和eΩ求導,考慮:
式中:MΘP1,i,MΩP1,i,MΘP2,i和MΩP2,i的形式與式(35)中類似,包含設計參數(shù)τΘ1>0,τΘ2>0,τΩ1>0和τΩ2>0.
綜合上述分析可以得到如下不等式:
取gΩu[U1U2U3]T,由式(1)和式(51)可得
式中ac和bc為無人直升機主旋翼揮舞運動的參考信號.則考慮式(1)中主旋翼揮舞運動系統(tǒng):
定義揮舞角期望信號Υc[acbc]T,則揮舞角運動的跟蹤誤差為
在控制器的設計過程中,為避免對主旋翼揮舞運動的參考信號直接求導,引入一階濾波器:
式中tab>0為設計參數(shù).定義eλabλab?Υc,對eλab求導可得
式中Mab存在上界
設計揮舞運動控制律:
式中KΥ>0為待設計控制器增益矩陣.
對無人直升機揮舞運動系統(tǒng)設計如下Lyapunov函數(shù):
將V3關于時間求導可得
綜合上述基于RBFNN與ESO的無人直升機飛行控制設計,可以得到如下定理.
定理1考慮由式(1)–(2)表達的具有系統(tǒng)不確定性和外部有界干擾的無人直升機非線性模型,神經(jīng)網(wǎng)絡自適應律按式(23)(52)設計,ESO設計為式(16)(39)的形式.通過適當選取設計參數(shù),則所設計的基于RBFNN與ESO的控制器(10)(21)(50)–(51)和式(65),可以使無人直升機的閉環(huán)系統(tǒng)誤差信號最終均一致有界,實現(xiàn)對給定期望信號的跟蹤.
證對于無人直升機位置和姿態(tài)回路組成的閉環(huán)控制系統(tǒng),選取Lyapunov函數(shù):
結(jié)合式(36)(59)和式(67),對V4求導:
則由式(69)與引理1可得,當參數(shù)選取合理時,有
證畢.
綜合第3節(jié)的論述,本文所提出的基于RBFNN與ESO的無人直升機非線性控制律的設計算法如下:
步驟1確定系統(tǒng)期望信號Pc,系統(tǒng)存在的不確定性ΔfV,ΔfΘ,ΔfΩ與外部干擾d1(t),d2(t);
步驟2根據(jù)位置系統(tǒng)的跟蹤誤差eP,eV設計位置虛擬控制器如式(10)所示,KP取值為KP>
步驟3通過對eV進行分析,根據(jù)式(12),引入一階濾波器tV避免對Vc直接求導,濾波器參數(shù)tV為三階對角矩陣,矩陣元素取值范圍為(0,1);
步驟4針對ΔfV,使用RBFNN逼近.RBFNN參數(shù)σV>0的選取根據(jù)神經(jīng)網(wǎng)絡的學習率取值經(jīng)驗選定取值范圍為(0,1),ΛV>0則根據(jù)仿真效果調(diào)整;
步驟5設計ESO估計D1.ESO的參數(shù)設計使用極點配置思想,由式(18)選定參數(shù)k2i >0和ηVi >0,以保證式(18)中AVi是Hurwitz的;
步驟6綜合步驟3–5可以設計速度控制器如式(21)所示,控制器參數(shù)
并通過式(21)可以求解姿態(tài)角和Tmr的期望信號如式(24);
步驟7根據(jù)式(24)的期望信號,形同步驟3–6設計姿態(tài)角虛擬控制器式(50)以及濾波器參數(shù)tΘ,ESO參數(shù)k3i與ηΘi和RBFNN的參數(shù)σΘ與ΛΘ.KΘ取值為
步驟8姿態(tài)角速率控制器式(51)和濾波器參數(shù)tΩ、ESO 參數(shù)k4i與ηΩi和RBFNN的參 數(shù)σΩ與ΛΩ也根據(jù)步驟3–6進行類似設計.KΩ取值為
步驟9通過姿態(tài)角速率控制器可以求解揮舞角與尾旋翼拉力的期望信號如式(60),由此設計揮舞角控制器式(65).濾波器參數(shù)tab設計與前述類似,
為驗證本文提出的控制方法有效性,以文獻[25]中無人直升機數(shù)據(jù)為依據(jù)進行仿真驗證.直升機的初始狀態(tài)為懸停,設直升機姿態(tài)角速率系統(tǒng)的不確定性為ΔfΩ,姿態(tài)角系統(tǒng)的不確定性為ΔfΘ0.3 sin(0.2πΘ),速度系統(tǒng)的不確定性為ΔfV0.25×sin(0.3πV),系統(tǒng)外部干擾為
選取控制器參數(shù)
ESO的參數(shù)設計參考了文獻[26]的思想,將姿態(tài)角速率、姿態(tài)角以及速度控制回路ESO的極點均配置在?10.ESO的參數(shù)選取為
RBFNN的參數(shù)設計為
動態(tài)面控制的濾波器時間常數(shù)設計tVtΘtΩ0.2I3×3,tab0.2I2×2.
無人直升機系統(tǒng)跟蹤“8”字形軌跡的能力是檢驗無人直升機飛行控制器跟蹤能力的一種常用的手段.定義偏航角期望ψd0,選取帶爬升速率的“8”字型飛行軌跡,則其表達式為
使用上述期望信號進行仿真,無人機初始位置設為(10,0,0),由于本文的控制方法主要基于動態(tài)逆控制,因此仿真時將其引入作為對比,仿真時兩種控制律受到的外部干擾與內(nèi)部系統(tǒng)不確定性均相同,動態(tài)逆控制器的增益也與本文中選取的控制器參數(shù)KP–KΥ相同,仿真結(jié)果如圖1–2.
圖1 三維軌跡跟蹤曲線Fig.1 3-D trajectory tracking result
從三維曲線仿真結(jié)果可看出,相較于動態(tài)逆控制,本文提出的控制器能有效控制無人直升機跟蹤期望軌跡,且受系統(tǒng)不確定性與外界干擾影響較小.
為更細致地說明本文提出的控制器效果,下面以滾轉(zhuǎn)角控制為例,固定俯仰角和偏航角輸入為0,對滾轉(zhuǎn)角輸入幅值為0.5,頻率為0.15 Hz,經(jīng)過一階濾波器平滑的方波信號指令進行仿真.無人直升機滾轉(zhuǎn)角起始值為?0.5 rad.仿真結(jié)果如圖3–7所示.其中,圖3為無人直升機滾轉(zhuǎn)角對上述方波信號的跟蹤輸出曲線,并加入了動態(tài)逆方法的跟蹤輸出曲線進行對比.由圖3可見,在跟蹤方波指令時,動態(tài)逆控制方法受系統(tǒng)不確定性與外界干擾影響較大,響應結(jié)果產(chǎn)生了較大誤差,而在引入RBFNN與ESO 后,系統(tǒng)魯棒性與抗干擾能力明顯增強.
圖2 三維軌跡跟蹤曲線頂視圖Fig.2 3-D trajectory tracking result in top view
圖3 滾轉(zhuǎn)角?的跟蹤曲線Fig.3 Roll angle(?)tracking result
圖4–5給出了滾轉(zhuǎn)角與滾轉(zhuǎn)角速率系統(tǒng)的RBFNN對系統(tǒng)不確定性的逼近輸出曲線,由圖可知,在本文給出的設計下,RBFNN可以有效逼近系統(tǒng)不確定性.
圖4 滾轉(zhuǎn)角速率系統(tǒng)不確定性RBFNN逼近曲線Fig.4 RBFNN response of roll angle angular velocity system uncertainty
圖5 滾轉(zhuǎn)角系統(tǒng)不確定性RBFNN逼近曲線Fig.5 RBFNN response of Roll angle system uncertainty
圖6–7給出了無人直升機滾轉(zhuǎn)通道的ESO對系統(tǒng)所受干擾的跟蹤曲線,可以看出本文設計的ESO能有效估計外部干擾與神經(jīng)網(wǎng)絡的逼近誤差.受方波信號上升和下降沿影響,圖7中出現(xiàn)的多個振蕩.
圖6 滾轉(zhuǎn)角速率系統(tǒng)干擾ESO跟蹤結(jié)果Fig.6 ESO tracking result of the disturbance of roll angle angular velocity system
圖7 滾轉(zhuǎn)角系統(tǒng)干擾ESO跟蹤結(jié)果Fig.7 ESO tracking result of the disturbance of roll angle system
從仿真結(jié)果可以看出,本文使用神經(jīng)網(wǎng)絡與擴張狀態(tài)觀測器增強無人直升機閉環(huán)系統(tǒng)控制性能是可行的,可以有效提高系統(tǒng)魯棒性與抗干擾能力.
針對無人直升機非線性系統(tǒng)存在不確定與外界干擾的問題,本文引入徑向基神經(jīng)網(wǎng)絡逼近系統(tǒng)不確定性,再由擴張狀態(tài)觀測器估計神經(jīng)網(wǎng)絡的逼近誤差與系統(tǒng)所受外部干擾.利用神經(jīng)網(wǎng)絡和擴張狀態(tài)觀測器的輸出,提出了一種魯棒自適應飛行控制方法.仿真結(jié)果表明,本文設計的控制律相比傳統(tǒng)動態(tài)逆控制有效提高了系統(tǒng)抗干擾能力與魯棒性,并弱化了對系統(tǒng)精確建模的需求.