陳弈煿,張潤鋒,楊紹瓊,2,3,張連洪,2,3,魏 鵬
(1.天津大學 機械工程學院 機構理論與裝備設計教育部重點實驗室,天津 300350;2.天津大學 青島海洋技術研究院,山東 青島 266237;3.青島海洋科學與技術試點國家實驗室 海洋觀測與探測聯合實驗室,山東 青島 266237)
水下滑翔機作為一種新型的水下移動觀測平臺,其具有功耗低、航程長、續(xù)航時間長及隱蔽性高的特點,可進行長時序、大范圍的海洋觀探測,是建設“透明海洋”工程的有效工具之一[1-4]。在無人值守的情況下提高水下滑翔機長時序觀探測任務的能力是研究人員現階段面臨的主要挑戰(zhàn)之一[5]。水下滑翔機動力學模型的非線性特點與海洋環(huán)境的復雜多變,導致其較難按照預設航向進行運動。因此,設計一種魯棒的航向控制策略對于水下滑翔機的軌跡精準控制具有重要意義。
在水下滑翔機航向控制研究方面,PID(proportional-integral-derivative)控制器是現階段水下滑翔機航向控制中應用最廣泛的方法[6]。PID是基于線性控制的控制器,而水下滑翔機的運動具有非線性、時變等特點,PID控制有時無法滿足快速準確的要求。Elmokadem等[7]采用滑模控制(sliding-mode control, SMC)進行了水下軌跡跟蹤控制研究,并進行了仿真實驗?;?刂凭哂休^好的魯棒性,具有快速響應、對參數和擾動不敏感等特點,適合水下滑翔機控制,然而抖振現象為其顯著缺點。Tchilian等[8]將水下滑翔機的非線性模型線性化后,實現了基于線性二次型調節(jié)器(linear quadratic regulator, LQR)的控制,并將該控制策略應用于水下滑翔機路徑跟蹤控制上,但該方法在非定常運動控制上難以實現;Lyu等[9]提出了一種基于神經網絡的水下滑翔機的平衡參數的計算方法,并將其應用于水下滑翔機航向控制上,研究結果表明其具有良好的非線性處理和強大的自學習能力,但反向誤差傳播神經網絡收斂時間過長,實際應用效果不理想。
為了解決控制器參數設定過程中可能存在反復調整以及參數非最優(yōu)的情況,筆者利用徑向基函數(radial basis function, RBF)神經網絡可以快速逼近任意非線性函數的性質[10],首先設計了神經網絡的識別函數,然后利用梯度下降法對PID控制器參數進行自整定,使控制器參數能夠快速調整,同時保證了控制器的性能,確保了水下滑翔機可在較短時間內調整到預定航向。
水下滑翔機由自身的浮力變化提供驅動力,通過內部的姿態(tài)調節(jié)單元來改變自身姿態(tài),并通過機翼實現滑翔運動[11]。天津大學“海燕-Ⅱ”水下滑翔機由殼體單元、浮力調節(jié)單元、姿態(tài)調節(jié)單元、通訊單元和傳感器單元等組成。為了方便分析,將整個水下滑翔機系統(tǒng)簡化為航行器主體、俯仰調節(jié)重塊、橫滾調節(jié)重塊和浮力調節(jié)重塊構成的模型。根據動量和動量矩定理,可推導出其六自由度動力學模型[12],利用動力學模型分析其在水平面內的運動。
建立圖1所示的水下滑翔機的大地坐標系E-xyz,體坐標系B-xyz。在體坐標系下,定義水下滑翔機速度v=(u,v,w)T,角速度坐標w=(p,q,r)T;在大地坐標系下,定義水下滑翔機位置為O=(x,y,z)T,姿態(tài)坐標為Ω=(φ,θ,ψ)T。由于只研究水下滑翔機的航向控制相關問題,下面僅列出水下滑翔機水平面內橫向運動的數學模型。運動模型各參數賦值如表1所示。
續(xù)表1
圖1 水下滑翔機坐標系示意圖Fig. 1 Underwater glider coordinate system
水下滑翔機水平面內動力學方程為
(1)
運動學方程為
(2)
RBF神經網絡于1988年提出[13]。相比其他類型神經網絡,RBF網絡由于具有良好的泛化能力,網絡結構簡單和能夠避免不必要的計算而備受關注。由于RBF神經網絡具有逼近任意非線性函數的能力,所以被廣泛應用于非線性控制領域[14]。RBF神經網絡是一個包含輸入層、隱含層和輸出層的前饋網絡。采用多輸入單輸出的神經網絡,其網格結構如圖2所示。從系統(tǒng)的動力學模型可知,水下滑翔機具有非線性特性,因此,將RBF神經網絡和PID控制器相結合,設計了水下滑翔機RBF-PID航向控制器。
圖2 徑向基函數神經網絡結構圖Fig. 2 Radial basis function neural network structure diagram
RBF神經網絡結構模型的第1層為輸入層,x=[x1,x2,…,xn]T為輸入向量。第2層為隱含層,是由徑向基函數構成的神經元激活函數,具有m個節(jié)點隱含層向量為s=[s1,s2,…,sm]T,其中
(3)
式中:cj為第j個節(jié)點的中心矢量,cj=[cj1,cj2,…,cji,…,cjn]T,(i=1,2,…,n);bj為隱含層第j個神經元高斯基函數的寬度。
RBF網絡權值為
w=[w1,w2,…,wm]T。
(4)
RBF網絡輸出為
y(k)=wTh=w1h1+w2h2+…+wmhm。
(5)
網絡逼近性能指標為
(6)
利用梯度下降法迭代輸出權值、節(jié)點中心值和節(jié)點基寬參數:
wj(k)=η[y(k)-y0(k)]sj+α[wj(k-1)-wj(k-2)]+wj(k-1),
(7)
(8)
(9)
式中:η為學習效率;α為動量因子。
水下滑翔機航向控制的目的是使其跟蹤期望軌跡,即航向跟蹤誤差在有限時間內收斂。采用的控制系統(tǒng)結構如圖3所示。
圖3 控制系統(tǒng)結構圖Fig. 3 Structure diagram of control system
令航向角誤差為
e(k)=ψ(k)-y0(k),
(10)
式中:ψ(k)為期望航向角;y0(k)為實際航向角。
為保證水下滑翔機按預期路徑運動,要盡量保證航向角誤差為0。選取神經網絡整定目標為
(11)
PID控制器的輸出u(k)為
u(k)=u(k-1)+kP(k)(e(k)-e(k-1))+kI(k)e(k)+kD(k)(e(k)-2e(k-1)+e(k-2)),
(12)
式中kP,kI,kD的值采用梯度下降法求取,即
(13)
(14)
(15)
(16)
對于給定的期望航向角ψ(k),被控對象(即水下滑翔機動力學模型)的輸出為y0(k),RBF神經網絡的輸出為y(k),根據兩者的差值利用公式(7)(8)(9)更新wj(k),bj(k),cji(k),將它們帶入公式(16)可得到被控對象Jacobian信息陣,再將所得結果代入公式(13)(14)和(15)中更新kP,kI,kD,從而使PID控制器產生新的控制量u,該控制量對應的水下滑翔機內部電池包的滾轉角度使其產生新的實際航向角。
為驗證所提出的基于RBF神經網絡參數自整定的控制算法的有效性,在MATLAB中進行仿真,并引入PID算法進行對比。仿真開始設置期望航向角為30°。對比試驗中PID控制器參數由仿真試驗得到,參數設置為:kP=0.7,kI=1.3,kD=0.7;RBF-PID參數初值kP0=0.1,kI0=0.1,kD0=0.1。海浪干擾D(t)=sin(0.01t)。學習效率η= 0.5,動量因子α= 0.05。輸入權值、節(jié)點中心值和節(jié)點基寬初值均設置為0。
圖4為方波信號時航向RBF-PID控制器參數自整定曲線,可以看出,在航向變化時,RBF-PID控制器能快速完成對參數的調整,達到期望的控制效果。對于方波信號航向控制曲線(圖5),當航向劇烈變化時,PID控制會出現較大的超調量,而RBF-PID控制航向變化較為平緩,且收斂速度較快;圖6為兩種控制方法的誤差曲線,可以看出,采用RBF-PID算法仿真的航向角誤差相對較小,且收斂時間較短。表2為仿真實驗中兩種控制方法的指標對比。可以看出,所提算法在方波信號輸入下,均方誤差下降了1.67%。
圖4 方波信號時控制器參數自整定曲線Fig. 4 Self-tuning curves of controller parameters at square signal
圖5 方波信號航向控制曲線Fig. 5 Heading control curves of square signal
圖6 方波信號航向控制誤差曲線Fig. 6 Heading control error curves of square signal
表2 方波信號航向控制中PID與RBF-PID指標對比
為驗證所提RBF-PID算法對時變航向的跟蹤性能,在仿真中控制器的輸入采用正弦信號。圖7為正弦信號輸入時RBF-PID航向控制器參數自整定曲線,可以看出,控制器的參數同樣可以實現快速整定。圖8為正弦信號輸入時RBF-PID航向控制器控制曲線,控制器誤差曲線如圖9所示。從圖中可以看出,隨著時間的增加,兩種方法皆可實現航向跟蹤,但開始時PID控制出現較大超調量,收斂時間約為13 s,而RBF-PID控制超調量較小且收斂時間約為8 s,同時航向跟蹤效果好,曲線較為平滑。表3為仿真實驗中兩種控制方法的指標對比。可以看出,所提算法在正弦信號輸入下,最大超調量下降了5.28°,穩(wěn)態(tài)誤差下降了10%,收斂時間縮短了38%。
圖7 正弦信號時控制器參數自整定曲線Fig. 7 Self-tuning curves of controller parameters at sinusoidal signal
圖8 正弦信號航向控制曲線Fig. 8 Heading control curves of sinusoidal signal
圖9 方波信號航向控制誤差曲線Fig. 9 Heading control error curves of sinusoidal signal
表3 方波信號航向控制中PID與RBF-PID指標對比
針對水下滑翔機傳統(tǒng)PID控制方法無法實現快速精確調整航向的問題,提出了一種RBF-PID的航向控制方法。由仿真實驗結果可知,所提方法與傳統(tǒng)PID控制相比具有更好的動態(tài)性能,即能夠更快地實現航向跟蹤,而且可實現參數快速自整定,減少了工作量。具體地,與PID控制方法相比較,設計的RBF-PID航向控制在方波信號輸入下,均方誤差下降了1.67%;正弦信號輸入下,穩(wěn)態(tài)誤差下降了10%,收斂時間縮短了38%。筆者主要工作是針對水下滑翔機二維平面內運動進行了航向控制器設計及仿真,研究結果表明RBF-PID控制器魯棒性強,控制精度較高,在水下滑翔機航向控制中具有很好的應用前景。同時由于實際海洋環(huán)境的不確定性較多,仿真實驗很難完全地模擬真實海洋環(huán)境,為了進一步驗證所設計控制器的性能,未來會進行海上試驗驗證。