黃 兵,肖云飛,馮 元,于秀萍
(1.哈爾濱工程大學水下機器人技術國防科技重點實驗室,黑龍江哈爾濱 150001;2.哈爾濱工程大學智能科學與工程學院,黑龍江哈爾濱 150001)
近年來,隨著陸地資源的日益匱乏,海洋資源的開發(fā)和利用逐漸進入人們的視野,多艘無人艇(unmanned surface vehicles,USV)協(xié)同作業(yè)作為未來海上裝備發(fā)展的重要方向,受到越來越多國家的高度關注,成為各國爭相研制的“熱點兵器”[1].在復雜的海洋環(huán)境下,多USV協(xié)同作業(yè)在石油和天然氣探測、環(huán)境監(jiān)測和遠洋在航補給等海上任務中,具有廣泛的應用前景和潛在的應用優(yōu)勢[2].控制器設計作為集群系統(tǒng)的核心技術,保證了上述水面任務的成功率.然而,艇體的高度自動化和海洋環(huán)境的復雜性給協(xié)同控制器設計帶來了嚴峻的挑戰(zhàn).在此背景下,國內外學者提出了多種USV編隊控制研究方法,包括領航者-跟隨者策略[3]、基于行為方法[4]、虛擬結構法[5-6].其中,虛擬結構法具有控制精度高、穩(wěn)定性好的優(yōu)勢,使之成為當下USV協(xié)同跟蹤方向的研究熱點.
在虛擬結構法中,所有編隊成員被視為一個整體,通過共享的通信網絡進行信息交換.傳統(tǒng)的通信方案以周期的方式對數據進行采樣、處理和執(zhí)行,即所謂的時間觸發(fā)控制[7].從資源利用的角度看,這種控制方案在實際應用中可能會造成不必要的通信資源浪費.為了解決這一問題,一種非周期性控制策略,即事件觸發(fā)控制引起了國內外學者的關注.所謂事件觸發(fā)控制,是指只有當實際測量誤差范數大于一個允許界限閾值或系統(tǒng)狀態(tài)范數時才更新控制協(xié)議.因此,基于事件觸發(fā)的控制方法(包括靜態(tài)和動態(tài)),在減少通信頻率和節(jié)約能源方面具有很大的優(yōu)勢.特別地,無論是靜態(tài)還是動態(tài)事件觸發(fā)都要避免出現Zeno現象,即控制行為在有限的時間內被無限次觸發(fā).這種現象會使相應的控制行為無法執(zhí)行,甚至導致系統(tǒng)不穩(wěn)定.鑒于此,在設計觸發(fā)機制時應排除Zeno行為.
文獻[8-10]深入研究靜態(tài)事件觸發(fā)通信方案,在保證一致性協(xié)同控制的同時降低通信頻率.其中文獻[9]設計了一種多水面無人分布式事件觸發(fā)軌跡跟蹤控制器,利用狀態(tài)誤差條件控制領導者與跟隨者之間的通信.作為該方案的技術擴展,文獻[10]引入了固定時間控制方法,使得設計的分布式事件觸發(fā)編隊控制器能夠在預設的時間內收斂.雖然上述靜態(tài)事件觸發(fā)通信方案降低了通信負擔,但是信息更新的次數和事件觸發(fā)間隔仍有提升空間.與靜態(tài)事件觸發(fā)相比,包含內部動態(tài)變量的動態(tài)事件觸發(fā)控制策略不僅能夠增加兩個執(zhí)行時刻的間隔時間,而且可保證最小時間間隔至少為一個采樣周期.基于多智能體系統(tǒng),文獻[11-12]分別提出了涉及內部動態(tài)變量的分布式和全分布式動態(tài)事件觸發(fā)控制策略,以降低每個智能體向其鄰居傳輸信息的頻率;不同于分布式控制策略,文獻[13]首次提出集中式動態(tài)事件觸發(fā)機制來解決領導者-跟隨者的一致性問題.結果表明,動態(tài)事件觸發(fā)機制能夠增加任意兩個連續(xù)觸發(fā)時刻之間的最小時間間隔.然而,由于USV動力學模型的高度非線性和海洋環(huán)境的復雜性,上述方法無法直接應用于多無人艇協(xié)同系統(tǒng).
鑒于以上分析,本文致力于解決基于動態(tài)事件觸發(fā)機制的USV編隊控制問題.主要貢獻如下: 首先,針對通信資源受限問題,提出一種動態(tài)事件觸發(fā)通信方案以降低USV之間的數據傳輸頻率;然后,在事件觸發(fā)機制的基礎上將滑??刂撇呗耘c自適應算法相結合,設計了一種可實現USV協(xié)同軌跡跟蹤的全分布式編隊控制器.本文設計的算法不需要每個跟隨者獲取領導者的相對速度信息和通信網絡的全局信息.
本文研究多USV協(xié)同軌跡跟蹤控制問題.首先給出地面坐標系OXEYE和船體坐標系OXBYB以描述USV的二維運動.在地面坐標系中,O表示坐標原點,OXE為正東方向,OYE為正北方向.在船體坐標系中,O表示USV的質心,OXB沿USV中線指向船艏,OYB指向USV的左舷.USV模型的運動學方程和動力學方程為[14]
其中:ηi=[xi yi ψi]T指USV在地面坐標系下的位置向量,由位置(xi,yi)和艏搖角ψi組成;vi=[ui vi ri]T指USV在船體坐標系下的速度向量,由前進速度,橫漂速度(ui,vi)和艏搖角速度ri組成;R(ψi)表示從船體坐標系到地面坐標系的旋轉矩陣,其形式為
此外,在式(1)中:di=[dui dvi dri]T表示外部擾動(風、浪、流等)作用在USV上的力或力矩;τi=[τui τvi τri]T表示USV執(zhí)行機構輸出的控制信號;gi=[gui gvi gri]T表示USV的未建模動力學;慣性矩陣Mi∈R3×3,科里奧利矩陣Ci(vi)∈R3×3和水動力阻尼矩陣Di(vi)∈R3×3的具體表達式見文獻[14].
為了使所有編隊成員在保持預設隊形的同時能夠跟蹤期望軌跡ηd(t)∈R3,本文引入隊形變量?i∈R3以推導出跟蹤誤差e1i和e2i,即
其中:e1i為位置跟蹤誤差;e2i為速度跟蹤誤差.
控制目標:在考慮外界干擾的情況下,為跟隨者USV設計控制器τi,使得: 1)編隊成員能夠跟蹤期望的軌跡;2)編隊成員能夠保持預設的隊形.因此,本文的控制目標可概括為其中Ξ1,Ξ2為正常數.
本文采用無向連通圖描述編隊成員的通信拓撲網絡.該連通圖用符號G=(N,E,A)表示,其中:N={n1,n2,···,nn}為節(jié)點集;E ?N×N為邊集.在無向圖中,對于任意的節(jié)點i和節(jié)點j,有(i,j)=(j,i);A=[aij]∈Rn×n為鄰接矩陣.其中aij為鄰接矩陣第i行、第j列的元素.如果(ni,nj)∈E,則aij>0;否則,aij=0.值得注意的是,每一個節(jié)點不與自身進行信息交換,即aij=0,(=j).對于無向圖,A是對稱矩陣,即aij=aji.圖G的拉普拉斯矩陣定義為L=D-A,其中:···,n,對于Leader-follower編隊,fi=1表示無人艇可以接受Leader的狀態(tài)信息.=L+F是正定矩陣,其中F=diag{f1,···,fn}.
引理1參考文獻[15],如果無向圖Gu是連通的,那么它的拉普拉斯矩陣L是半正定的.
假設1假設虛擬領導者的參考軌跡ηd(t)二階可導,并且ηd,,都是有界的.
假設2外界環(huán)境擾動di是有界的,滿足‖Midi‖≤Di,其中Di是未知的正常數.
假設3假設存在正常數和,使得Mi滿足≤‖Mi‖≤.
假設4本文采用無向連通圖描述USV編隊成員之間的通信拓撲網絡.
本節(jié)提出了一種基于滑??刂坪妥赃m應策略的全分布式動態(tài)事件觸發(fā)編隊控制方案以實現控制目標.首先,設計動態(tài)事件觸發(fā)機制,降低USV之間的通信頻率.然后,通過Lyapunov穩(wěn)定性分析證明跟蹤誤差的收斂性.最后,證明閉環(huán)系統(tǒng)在所提出控制器的作用下不存在Zeno行為.為了更直觀地展示控制算法,圖1給出了動態(tài)事件觸發(fā)通信框架下的閉環(huán)系統(tǒng)框圖.
圖1 動態(tài)事件觸發(fā)框架下的USV編隊控制系統(tǒng)框圖Fig.1 Dynamic event-triggered communication framework for formation control of USV
為了便于控制器的設計和閉環(huán)系統(tǒng)的穩(wěn)定性分析,根據性質RTR=I,將編隊成員的數學模型進一步描述為
基于本文定義的協(xié)同跟蹤誤差(3),可設計輔助變量qri和Si,即
式中:k1∈R3×3為正定矩陣,fi為比例參數.如果跟隨者可以接收到虛擬領導者的狀態(tài)信息,則fi=1;否則,fi=0.
對式(6)中的Si求導,并將式(3)-(5)代入,可得
其中Yi(vi)滿足‖Yi(vi)‖≤Yi,i=1,2,···,n,Yi是未建模動態(tài)Yi(vi)的未知上界,且Yi>0.復雜海況下,模型信息Ci(vi),Di(vi)和gi難以精確獲悉,導致設計者無法對Yi(vi)進行描述.因此,本文采用自適應算法對未知上界參數Yi進行在線估計和補償以抵消未建模動態(tài)對系統(tǒng)的影響.
控制律以及自適應律設計如下:
事件觸發(fā)誤差函數定義為
本文采用基于誤差信息的動態(tài)事件觸發(fā)機制(12)以減少USV之間信息傳輸次數,從而降低控制器的更新頻率.通過引入一個動態(tài)變量ξi,設計觸發(fā)條件為
式中:αi,βi均為正常數,動態(tài)變量ξi滿足以下等式:
其中ρi+1>0.根據比較引理,可得
由式(17)可知,動態(tài)事件觸發(fā)方案的觸發(fā)條件(14)更嚴格.因為動態(tài)變量ξi(t)>0,所以,在保證系統(tǒng)控制性能前提下,動態(tài)事件觸發(fā)策略產生觸發(fā)時間間隔會更長.
注2參考文獻[16],在本文設計的事件觸發(fā)控制框架下,每個USV只需要與它的鄰居間歇通信.事實上,當時,第i個USV達到觸發(fā)條件.此時,第i個USV的狀態(tài)信息被允許傳輸給他的鄰居并且基于狀態(tài)的測量誤差γi(t)將立即重置為零.換而言之,當t∈時,第i個USV不向其鄰居發(fā)送自身信息狀態(tài),此時不更新控制協(xié)議.此外,每個USV的測量誤差只取決于其自身的采樣狀態(tài)和實際狀態(tài).因此,所有編隊無人艇的事件觸發(fā)序列都是異步的,更有效的利用了通信網絡帶寬.
注3本文所提出的動態(tài)事件觸發(fā)機制(14)包含一個動態(tài)變量ξi(t).由于該動態(tài)變量總是非負的,因此在選擇相同參數前提下,動態(tài)事件觸發(fā)機制的測量誤差‖γi(t)‖會更晚達到預設閾值,這意味著動態(tài)事件觸發(fā)方案具有更大的觸發(fā)時間間隔.更重要的是,基于式(16)-(17),包含動態(tài)變量ξi(t)的動態(tài)事件觸發(fā)方案在排除Zeno行為方面起著重要作用.
定理1對于由多USV組成的編隊系統(tǒng)(1),在假設1-4成立的條件下,則本文設計的控制律(9)-(11)和事件觸發(fā)機制(12)-(13)能夠完成對USV編隊期望軌跡的跟蹤和預設隊形的保持.同時,輔助變量Si、自適應估計誤差和將收斂到原點附近的微小鄰域.
證選擇Lyapunov候選函數VL,即
證明步驟如下.
步驟1將V1對時間求導并代入式(7),可得
根據控制律式(9)和自適應律式(10)-(11),式(22)可化簡為
步驟2將V2對時間求導得
步驟3將V3對時間求導得
步驟4由式(18)(27)-(29)可知,VL對時間的導數滿足
將式(30)中的事件觸發(fā)誤差項γi(t)合并整理可得
代入事件觸發(fā)誤差條件式(14)到式(31)中,合并同類項整理得
根據式(18)-(21)可知,式(33)中:
根據式(6),可直接得到e1i有界且滿足
因為在有限的時間內USV之間的信息交互頻率是有限的,所以論述上述控制算法不會發(fā)生Zeno行為.對于第i個USV,定義為任意兩個連續(xù)觸發(fā)事件之間的時間間隔.隨后,通過證明T>0來說明系統(tǒng)不會產生Zeno現象.
Zeno現象是指控制行為在有限時間內被無限次觸發(fā)的現象.Zeno現象的發(fā)生會使對應的控制行為無法執(zhí)行,甚至會引起系統(tǒng)不穩(wěn)定.要證明不存在Zeno現象,只需要證明觸發(fā)時間間隔存在某個大于零的下界,即存在一個正常數Γ1使得對于?k=0,1,2,···,n成立.
定理2在本文設計控制算法的作用下,USV協(xié)同系統(tǒng)無Zeno現象且事件觸發(fā)時間間隔下界為正常數.
證根據式(35)可知,滑模變量Si可以收斂至以下區(qū)域C??,其中
根據事件觸發(fā)條件式(14)和式(38)-(39)可知
因此,事件觸發(fā)時間間隔嚴格大于零.在所提出的事件觸發(fā)編隊控制器的作用下,閉環(huán)系統(tǒng)不表現出Zeno行為.
證畢.
本節(jié)給出了多USV協(xié)同系統(tǒng)所設計控制算法作用下的仿真結果,說明了控制算法的有效性.編隊系統(tǒng)中有3個跟隨者和1個虛擬領導者,相應的通信鄰接矩陣為
USV模型的質量為23.8 kg,長度為1.255 m,寬度為0.29 m.USV模型參數如表1所示[15].虛擬領導者的期望軌跡、初始狀態(tài)向量和期望隊形如表2所示.根據定理1,所有的跟隨者都將跟蹤虛擬領導者且構成預設隊形.為了達到滿意的控制性能,控制器和事件觸發(fā)函數的參數選擇如表3所示.
表1 USV模型參數Table 1 The model parameters of USV
表2 初始值和期望編隊配置Table 2 The initial and desired formation configuration
表3 控制器和事件觸發(fā)函數參數配置Table 3 The parameters in controller and event-triggered function
此外,為了更好地說明所提控制器的魯棒性.風、浪和洋流等引起的外部干擾設置如下:
詳細的數值仿真結果如圖2-7所示.
圖2 編隊系統(tǒng)二維軌跡圖Fig.2 Formation trajectories of USV
圖2為編隊系統(tǒng)在二維平面上的跟蹤軌跡圖.其中,3個跟隨者能夠在保持等腰三角形隊形的情況下準確跟蹤虛擬領導者.圖3給出了每個USV位置跟蹤誤差的時間響應曲線.從圖中可知,即使在80 s時加入時變外部干擾,位置跟蹤誤差依然可以收斂至原點附近.控制輸入信號如圖4所示.觀察圖4可知,跟隨者的控制輸入信號在系統(tǒng)穩(wěn)定后穩(wěn)定于常值.圖5描述了動態(tài)變量ξi(t)的時間響應曲線.從圖中可知,ξi(t)總是非負的,并最終收斂于零.
圖3 編隊系統(tǒng)位置跟蹤誤差Fig.3 Trajectory tracking errors of USV
圖4 編隊系統(tǒng)執(zhí)行器控制輸入Fig.4 Control input of USV
圖5 動態(tài)變量ξi(t)Fig.5 The dynamic variable of ξi(t)
圖6為3個USV的觸發(fā)時間間隔統(tǒng)計圖.通過計算可得,動態(tài)事件觸發(fā)平均時間間隔為0.8 s,由圖6可知,最大觸發(fā)時間間隔為控制系統(tǒng)穩(wěn)定到加入外部干擾之間的仿真時間,在最大觸發(fā)時間間隔前由于需要不斷更新控制協(xié)議使編隊系統(tǒng)穩(wěn)定,加入干擾后需要更新控制協(xié)議克服擾動,因此在這兩個時間段的觸發(fā)頻率比較頻繁.
圖6 動態(tài)事件觸發(fā)條件下3個跟隨USV的觸發(fā)次數和觸發(fā)時間間隔Fig.6 Trigger numbers and Trigger interval of three USV under dynamic event-triggering condition
圖7 為USV 之間通信傳輸數據大小統(tǒng)計圖.在數值模擬中,模擬時間選擇為150 s,采樣時間為0.125 s.假設每個數據的存儲大小為4字節(jié),那么在現有的連續(xù)時間觸發(fā)控制方案中[18],每個USV 在仿真時間內通過通信信道發(fā)送的數據大小高達38400 字節(jié),而采用本文提出的動態(tài)事件觸發(fā)控制方案,USV 之間發(fā)送的數據大小僅為5920,5890,6020 字節(jié).與時間觸發(fā)控制方案相比,通信數據分別減少84.6%,84.7%和84.3%.
圖7 USV之間通信傳輸數據大小Fig.7 Date size of communication transmission among USV
本文針對通信受限的無人艇協(xié)同跟蹤控制問題,提出了一種非周期性的動態(tài)事件觸發(fā)信息傳輸策略,使每個USV可以間歇性向其鄰居發(fā)送信息,從而避免了USV之間頻繁的信息通訊,在保證系統(tǒng)收斂時間以及控制性能的前提下,動態(tài)事件觸發(fā)策略能夠更大的增加觸發(fā)時間間隔,從而更有效的降低了通信資源消耗.在此基礎上,結合滑模控制策略與自適應控制方法,本文提出了一種不需要通信網絡全局信息的控制方案.最后,仿真結果驗證了編隊控制器的有效性.未來,筆者將重點研究最小時間間隔的事件觸發(fā)控制問題,使得控制系統(tǒng)能夠在保證瞬態(tài)以及穩(wěn)態(tài)性能的同時,更有效的節(jié)省通信資源.