孫創(chuàng), 覃月明, 夏天, 夏國清
(1.宜昌測試技術(shù)研究所,湖北 宜昌 443003; 2.上海船舶工藝研究所, 上海 200032; 3.哈爾濱工程大學 智能科學與工程學院,黑龍江 哈爾濱 150001)
動力定位(dynamic positioning,DP)技術(shù)是指在環(huán)境干擾的影響下僅依靠自身推進系統(tǒng)使船舶保持在期望位置或是沿期望的軌跡航行[1]。隨著對海洋資源的不斷勘探和開發(fā),DP系統(tǒng)被廣泛應(yīng)用在各種海洋工程作業(yè)中,如:海上工程船、供應(yīng)船、救援船、浮式酒店和浮式生產(chǎn)船等[2]。DP系統(tǒng)的控制設(shè)計在理論和實踐中都引起了廣泛關(guān)注。
由于船舶作業(yè)條件和海洋環(huán)境的持續(xù)變化,船舶模型參數(shù)和環(huán)境干擾難以精確測量,在進行控制設(shè)計時需要加以考慮。隨著神經(jīng)網(wǎng)絡(luò)逼近技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)逼近技術(shù)被用于處理船舶不確定性控制問題。文獻[3]針對模型不確定下的全驅(qū)水面船設(shè)計了一種神經(jīng)自適應(yīng)積分滑模控制策略,實現(xiàn)船舶的高精度跟蹤控制。文獻[4]在未知非線性動力學條件下,結(jié)合神經(jīng)網(wǎng)絡(luò)自適應(yīng)方法實現(xiàn)了水面艦艇有限工作空間的高精度跟蹤控制。文獻[5]針對模型參數(shù)不確定和時變干擾下的DP控制,結(jié)合自適應(yīng)技術(shù)設(shè)計了控制律。然而,上述方法中神經(jīng)網(wǎng)絡(luò)權(quán)值矩陣的大量參數(shù)需要在線調(diào)整。這將會導(dǎo)致學習時間變得很長,以至于基于神經(jīng)網(wǎng)絡(luò)自適應(yīng)的技術(shù)難以在實際工程中應(yīng)用。
此外,執(zhí)行機構(gòu)的高頻響應(yīng)會導(dǎo)致機械磨損,減少執(zhí)行機構(gòu)的使用壽命[7]。事件觸發(fā)控制(event-triggered control, ETC)能夠減少傳輸和計算的負擔[8],近些年受到學者的關(guān)注[7-11]。ETC提供了一種有效的執(zhí)行任務(wù)的機制。在這種控制機制下,只有當某個事件被觸發(fā)時,控制信號才會被傳輸。在ETC中任務(wù)的執(zhí)行依賴于設(shè)計的觸發(fā)機制而不是按時間周期,這將會降低控制器到執(zhí)行機構(gòu)的信息傳輸負擔,減少了執(zhí)行器的動作次數(shù)。ETC控制策略已經(jīng)成功的應(yīng)用線性系統(tǒng)[8]、非線性系統(tǒng)[9]、機器人的跟蹤控制[10]、水面船的自動舵控制[7]和目標環(huán)繞控制[11]。因此,研究ETC在DP系統(tǒng)中的應(yīng)用具有實際工程意義。
基于上述分析,本文研究含有模型參數(shù)不確定和環(huán)境干擾的水面船DP控制問題,提出了一種基于事件觸發(fā)機制的神經(jīng)自適應(yīng)控制方法。結(jié)合徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和最小學習參數(shù)算法設(shè)計自適應(yīng)項補償環(huán)境干擾和不確定性。設(shè)計的自適應(yīng)項僅有3個在線學習參數(shù),減少了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)自適應(yīng)技術(shù)的參數(shù)學習個數(shù)。再結(jié)合動態(tài)面控制技術(shù)和事件觸發(fā)機制設(shè)計動力定位控制器,其中引入一種事件觸發(fā)機制降低控制器到執(zhí)行機構(gòu)的信息傳輸負擔,同時降低執(zhí)行機構(gòu)的動作次數(shù)。然后使用Lyapunov穩(wěn)定性理論證明了閉環(huán)系統(tǒng)的穩(wěn)定性。最后,通過仿真試驗和對比分析驗證了提出控制律的有效性。
RBFNN對不確定函數(shù)具有良好的逼近特性,被廣泛應(yīng)用在非線性控制系統(tǒng)中。對于RBFNN,有如下引理成立。
f()=WTh()+ε,?∈Ω
(1)
本文選擇高斯函數(shù)作為徑向基函數(shù):
hj()
(2)
式中cj∈Rn和bj∈R分別表示第j個高斯函數(shù)的中心向量和第j個節(jié)點的寬度。
在實際應(yīng)用中, RBFNN的最優(yōu)權(quán)值矩陣是未知的。因此,在設(shè)計控制器的過程中,需要對最優(yōu)權(quán)值矩陣進行估計。
考慮三自由度水面船數(shù)學模型為[14]:
(3)
(4)
圖1 大地坐標系和船體坐標系Fig.1 The earth-fixed frame and the body-fixed frame
(5)
假設(shè)1船舶的模型參數(shù)M和D均是未知的。
注1:在實際工程應(yīng)用中,由于辨識技術(shù)或成本原因,動力定位船的模型參數(shù)M和D難以精確獲得,因而假設(shè)1是合理的。
假設(shè)2環(huán)境干擾向量τd是有界的,即‖τd‖≤d,d>0是一個常數(shù)。
注2:船舶受到的環(huán)境干擾是慢變的,且能量有限。因此,環(huán)境干擾作用在船舶上的力可以被當作具有有限變化率的有界信號,假設(shè)2是合理的。
注3:動力定位船在作業(yè)時,有時候需要改變參考點。為使船舶更加平滑的運動到新的參考點,通常將參考點通過二階導(dǎo)引系統(tǒng),得到光滑的參考軌跡以及有界的一階和二階導(dǎo)數(shù),因此假設(shè)3是合理的。
控制目標:針對含模型參數(shù)不確定和環(huán)境干擾的水面船,設(shè)計DP控制律,使得船舶從初始點沿著參考軌跡移動到目標點,且滿足:
(6)
式中ο>0是一個常數(shù)。
本節(jié)將使用動態(tài)面控制技術(shù)和ETC技術(shù)設(shè)計控制律,設(shè)計過程分為如下3步:
1)定義第1個跟蹤誤差面為:
z1=η-ηd
(7)
對式(7)求導(dǎo),并使用式(3)可得:
(8)
設(shè)計運動學控制律為:
(9)
式中K1∈R3×3是設(shè)計的控制增益矩陣。將α通過一階濾波器:
(10)
2)定義第2個跟蹤誤差面為:
(11)
根據(jù)式(11)和(4)可得:
(12)
τ=-K2z2-f1
(13)
式中K2=diag{k2,1,k2,2,k2,3}∈R3×3是設(shè)計的控制增益矩陣。由于模型參數(shù)M和D均未知,因此這里采用RBFNN對f1進行估計:
f1=WTh()+ε
(14)
(15)
(16)
(17)
3)定義τ(t)=[τ1(t)τ2(t)τ3(t)]T,根據(jù)事件觸發(fā)控制,最終設(shè)計動力學控制律為:
(18)
式中:
(19)
注4:當ai選擇較大時,執(zhí)行機構(gòu)動作次數(shù)會減少,動力定位船的定位誤差會變大,系統(tǒng)穩(wěn)態(tài)性能變差,動態(tài)性能無影響;反之當ai選擇較小(或接近于零)時,事件觸發(fā)控制逐漸變?yōu)闀r間觸發(fā)控制,系統(tǒng)穩(wěn)態(tài)性能較好(等于零穩(wěn)態(tài)性能最優(yōu)),動態(tài)性能無影響。實際應(yīng)用時,ai可以根據(jù)需要選擇,即在保證定位誤差要求的范圍內(nèi)選擇足夠大的ai,達到減少執(zhí)行機構(gòu)動作頻率的目的。
本文的觸發(fā)條件建立在控制器和執(zhí)行機構(gòu)部分。對于輸入信號觸發(fā)機制而言,相對閾值觸發(fā)條件[10]和動態(tài)觸發(fā)條件[14]可能存在不能保證最小正時間間隔,這意味著可能存在Zeno行為,即在有限時間內(nèi),事件觸發(fā)的次數(shù)為無窮。由于觸發(fā)條件不斷被滿足,控制器無法有效地調(diào)整觸發(fā)時間間隔。Zeno行為不僅在物理上無法實現(xiàn),還會造成系統(tǒng)信號無法收斂甚至系統(tǒng)不穩(wěn)定,違背了設(shè)計事件觸發(fā)控制器來減小觸發(fā)次數(shù)的初衷。而對控制信號采用固定閾值觸發(fā)條件能夠避免Zeno行為。因此,本文采用固定閾值觸發(fā)條件設(shè)計控制律。
(20)
定理1對于水面船數(shù)學模型(3)和(4),在滿足假設(shè)1~3的條件下,由設(shè)計的運動學控制律(9),動力學控制律(16)和更新律(17)組成控制器能夠?qū)崿F(xiàn)本文控制目標,且閉環(huán)系統(tǒng)內(nèi)的所有信號一致最終有界。
證明:選擇Lyapunov函數(shù):
(21)
對式(21)求導(dǎo),并使用式(20)可得:
(22)
(23)
σ1>0是一個常數(shù)。根據(jù)式(15),可得:
(24)
同時:
(25)
將式(23)、(24)代入式(25)中,可得:
(26)
式中:
(27)
(28)
式中:λmin和λmax分別表示矩陣的最小和最大特征值。顯然c2>0,且通過選擇參數(shù)使c1>0。根據(jù)定義的Lyapunov函數(shù)(21),可得閉環(huán)系統(tǒng)內(nèi)的所有信號均一致最終有界。定理1證明結(jié)束。
證明:根據(jù)(19),可得:
(29)
根據(jù)式(16),ωi關(guān)于時間的導(dǎo)數(shù)為:
(30)
(31)
本節(jié)采用供應(yīng)船Northern Clipper[16]驗證提出控制方法的有效性。仿真中環(huán)境干擾選擇為[17]:
τd=RTb
(32)
式中b∈R3為一階馬爾可夫過程,具體形式為:
(33)
式中:T∈R3×3為時間常數(shù)矩陣;Υ∈R3×3為白噪聲驅(qū)動矩陣;wb∈R3為零均值白噪聲向量。仿真中參數(shù)選擇為T=103I3;b(0)=[105105106]T;白噪聲的標準差選擇為0.1;Υ選擇為Υ=diag(104,104,105);100 s后變?yōu)棣?diag(105,105,106)。
為了使動力定位船平滑的移動到設(shè)定點,將設(shè)定點通過二階導(dǎo)引系統(tǒng)[13]:
(34)
式中:ζ為導(dǎo)引系統(tǒng)的相對阻尼比;ωn為導(dǎo)引系統(tǒng)的固有頻率。仿真中,設(shè)定點為ηd=[20°20°30°]T,二階導(dǎo)引系統(tǒng)的參數(shù)選擇為ζ=0.9和ωn=0.08。船舶狀態(tài)和其他初始條件均設(shè)為零。
圖2 本文方法下的船舶運動軌跡Fig.2 The trajectory of the vessel under the proposed method
圖3 2種方法下的跟蹤誤差Fig.3 Tracking errors using two control methods
圖4 自適應(yīng)學習參數(shù)Fig.4 Adaptive learning parameters
圖5 f1和它的估計值Fig.5 f1 and its estimate
圖6 2種方法下的控制輸入Fig.6 Control inputs using two control methods
接下來,與文獻[5]和文獻[18]采用神經(jīng)網(wǎng)絡(luò)逼近下的自適應(yīng)參數(shù)個數(shù)進行比較(如表1所示)。通過表格可以得出,本文設(shè)計的自適應(yīng)控制律能夠減少自適應(yīng)參數(shù)的學習個數(shù),且不會隨著神經(jīng)網(wǎng)絡(luò)節(jié)點的增加而增加。因此,本文方法可以有效地減少算法的計算量,縮短學習時間。
表1 使用神經(jīng)網(wǎng)絡(luò)逼近時自適應(yīng)參數(shù)個數(shù)Table 1 The number of adaptive parameters using neural network
1)設(shè)計的自適應(yīng)項能夠極大地減少神經(jīng)網(wǎng)絡(luò)的在線學習參數(shù)個數(shù);
2)設(shè)計的控制律能夠在保證跟蹤誤差收斂到一個較小的范圍的前提下,降低輸入信號的變化頻率,實現(xiàn)減少執(zhí)行機構(gòu)動作的目的。
后續(xù)可將文中提出的控制算法應(yīng)用船模試驗或?qū)嵈M行性能驗證。