李冀永,鐘榮興,徐雪峰,鄧福建,于雙寧,王益民
(天津航海儀器研究所, 天津 300131)
智能水下機器人(autonomous underwater vehicle,AUV)是一種無臍帶纜、依賴自身能源以預(yù)編程或完全自主方式完成作業(yè)任務(wù)的無人水下潛器[1-2]。較之遙控水下機器人(remotely operated vehicle,ROV)或載人潛水器,AUV 具備脫離操縱人員自主航行實現(xiàn)自主作業(yè)的能力,無需母船支持,具有更好的安全性和經(jīng)濟性[3-4]。AUV 一般用于海洋科考任務(wù)、工程設(shè)備檢修維護以及軍事任務(wù),如海底石油管線巡檢、地形地貌精細(xì)探測、水文參數(shù)測量、礦產(chǎn)資源探測、水下目標(biāo)搜索、自主排雷、反潛警戒以及中繼通信等,近年來,受到各國科研機構(gòu)及研究人員的廣泛重視[5]。
AUV 自主航行是實現(xiàn)作業(yè)任務(wù)重要基礎(chǔ),品質(zhì)良好的自主航行需要幾點要素:1)導(dǎo)航系統(tǒng)提供穩(wěn)定精確的實時位姿信息。AUV 作為一類自主機器人系統(tǒng),完成既定航行任務(wù)的前提是明確自身位姿狀態(tài),而水下環(huán)境中電磁波傳輸距離極短,AUV 水下航行時無法使用衛(wèi)星導(dǎo)航設(shè)備定位,需依靠慣性導(dǎo)航元件、多普勒測速儀(Doppler velocity logger,DVL)等設(shè)備實現(xiàn)導(dǎo)航[6-7],導(dǎo)航精度不僅影響航行任務(wù)完成效果,還決定了AUV 上浮校正位置的次數(shù),影響AUV 隱蔽性。2)規(guī)劃系統(tǒng)提供安全可行的航行路徑。AUV 在廣闊水域航行,需充分利用環(huán)境信息進行實時決策,結(jié)合自身傳感器規(guī)避環(huán)境中的未知障礙,以高效安全的方式規(guī)劃安全經(jīng)濟的路徑[8-9]。3)控制系統(tǒng)實現(xiàn)品質(zhì)良好的運動控制。AUV 需要充分考慮自身特性,根據(jù)配置的執(zhí)行機構(gòu),在具有環(huán)境擾動、模型參數(shù)不確定等影響下穩(wěn)定完成期望運動,從而實現(xiàn)預(yù)定的具體任務(wù)[10-11]。
本文分析近年來AUV 自主航行過程中導(dǎo)航、規(guī)劃以及控制技術(shù)的發(fā)展,最后對AUV 未來發(fā)展趨勢和挑戰(zhàn)進行了展望。
AUV 作為一種無纜自治的水下機器人,由自主導(dǎo)航、規(guī)劃、控制構(gòu)成的自主航行能力是AUV 完成任務(wù)的核心,如圖1 所示。尤其隨著AUV 面向智能化、集群化發(fā)展過程中,自主航行技術(shù)對保障AUV 作業(yè)能力起到愈發(fā)重要的作用。
圖1 AUV 自主航行框架Fig. 1 The architecture of AUV autonomous voyage
水下導(dǎo)航系統(tǒng)需要提供AUV 的準(zhǔn)確位置、姿態(tài)信息,引導(dǎo)AUV 從起始點按照要求精度到達目的地。由于水下環(huán)境中電磁波傳輸距離極短,衛(wèi)星導(dǎo)航技術(shù)無法在AUV 處于水下時應(yīng)用,因此水下導(dǎo)航與陸空導(dǎo)航具有較大差別。依據(jù)AUV 任務(wù)需求合理使用各類導(dǎo)航手段是AUV 完成既定任務(wù)的基礎(chǔ),常見的AUV 導(dǎo)航技術(shù)包括慣性導(dǎo)航技術(shù)、水下聲學(xué)定位與導(dǎo)航技術(shù)、地球物理場導(dǎo)航技術(shù)等。
慣性導(dǎo)航設(shè)備因具有自主性好、信息輸出頻率高而成為了組合導(dǎo)航系統(tǒng)的核心部件之一,借助其他高精度的導(dǎo)航設(shè)備輔助慣性導(dǎo)航設(shè)備抑制誤差隨時間的積累或修正誤差,以提高導(dǎo)航系統(tǒng)的性能指標(biāo)[12]。水下聲學(xué)定位與導(dǎo)航包括利用多普勒測速儀(Doppler velocity logger,DVL)和聲學(xué)基線系統(tǒng)兩類:DVL 能夠獲取AUV 相對水底或水層的速度,在AUV 導(dǎo)航系統(tǒng)中往往與慣導(dǎo)進行信息融合提升慣導(dǎo)精度;聲學(xué)基線系統(tǒng)分為長基線、短基線和超短基線系統(tǒng)等,能夠依據(jù)聲學(xué)信息提供AUV 位置,但長基線系統(tǒng)需要在海底預(yù)先鋪設(shè),短基線和超短基線系統(tǒng)作用距離均相對有限,對環(huán)境有一定需求。地球物理場導(dǎo)航主要包括重力匹配導(dǎo)航、地磁導(dǎo)航等,能夠直接獲取位置信息,但需要事先在AUV 上建立用于信息匹配的數(shù)據(jù)庫,在AUV 上應(yīng)用尚不成熟。目前,以慣性導(dǎo)航系統(tǒng)、DVL 等傳感器為基礎(chǔ)的組合導(dǎo)航技術(shù)在AUV 上得到了廣泛的應(yīng)用[7]。
RDI 與Kearfott 公司聯(lián)合研制的SeaDevil 號AUV 使用慣導(dǎo)/DVL 組合導(dǎo)航系統(tǒng),其慣導(dǎo)設(shè)備使用Kearfott 公司開發(fā)的慣性產(chǎn)品,包括MOD VIIA 型加速度計和T24、T16-B 羅經(jīng)等設(shè)備,SeaDevil 號AUV 數(shù)據(jù)通過卡爾曼濾波器進行慣導(dǎo)/DVL 數(shù)據(jù)融合,定位精度可達到航程0.5%[13]。美國海軍研究生院研制的ARIES 型AUV 采用慣導(dǎo)/DVL/GPS 組合導(dǎo)航系統(tǒng),其中,選擇頻率為1 200 kHz 的DVL 以及慣導(dǎo)單元,并配置了一個水面載波相位差分GPS,以AUV 定期上浮方式修正導(dǎo)航偏差[14]。美國伍茲霍爾海洋研究所、藍(lán)鰭機器人公司、英國國家海洋中心也均將基于慣性導(dǎo)航系統(tǒng)和DVL 的組合導(dǎo)航技術(shù)應(yīng)用于AUV[15]。
AUV 需要選擇一種有效信息整合策略將各傳感器輸出的導(dǎo)航信息進行有效融合,信息融合方法在組合導(dǎo)航系統(tǒng)中起著至關(guān)重要的作用,常用方法包括卡爾曼濾波(KF)、擴展卡爾曼濾波(EKF)、無跡卡爾曼濾波(UKF)、粒子濾波(PF)等。KF 是最基礎(chǔ)的數(shù)據(jù)融合方法,挪威Hugin 1 000 型AUV[16]以及丹麥的Maridan 150 型AUV[17]均采用了該方法進行數(shù)據(jù)融合。由于水下環(huán)境復(fù)雜,模型難以精確建立,因而EKF,UKF,PF 等非線性數(shù)據(jù)融合算法被進一步應(yīng)用于AUV 組合導(dǎo)航領(lǐng)域。D.Loebis 等[18]將模糊邏輯技術(shù)引入到PF 和EKF,對基于GPS/慣導(dǎo)的AUV 組合導(dǎo)航系統(tǒng)進行了數(shù)據(jù)融合研究,仿真結(jié)果表明該技術(shù)能提高組合導(dǎo)航系統(tǒng)的性能。張曉娟等[19]將EKF 應(yīng)用于AUV 組合導(dǎo)航,AUV 導(dǎo)航系統(tǒng)包含羅經(jīng)/DVL/GPS,仿真結(jié)果表明EKF 能很好的融合觀測數(shù)據(jù),誤差相對于GPS 和船位推算單獨定位時明顯減小。張濤等[20]將UKF 應(yīng)用到慣導(dǎo)/LBL 組成的AUV 組合導(dǎo)航系統(tǒng)中,提升了系統(tǒng)的定位精度。Karimi 等[21]面向基于慣導(dǎo)/DVL的組合導(dǎo)航系統(tǒng),分別采用UKF 和EKF 進行了數(shù)據(jù)融合驗證,結(jié)果表明EKF 精度更好。
當(dāng)前,以慣導(dǎo)、DVL 為核心傳感器,以EKF,UKF 等算法進行多傳感器數(shù)據(jù)融合是AUV 實現(xiàn)自主導(dǎo)航的主流做法,但其也具有以下缺陷:1) DVL 直接測量速度信息而非位置信息,雖然能校正慣導(dǎo)的位置信息,但組合后得到的位置信息依然會隨時間發(fā)散;2)海洋環(huán)境中存在的溫、鹽、密變化、風(fēng)、浪、流干擾均會影響導(dǎo)航效果,因此,AUV 需要定期上浮通過衛(wèi)星導(dǎo)航校正,不僅降低了AUV 作業(yè)效率,還影響了其隱蔽性;3)由于DVL 是一種主動聲源,會進一步削弱AUV 隱蔽性。因此,各研究機構(gòu)也在研究多種輔助導(dǎo)航手段提升水下自主導(dǎo)航效果,隨著水下聲學(xué)定位與導(dǎo)航、水下地形匹配、水下重力匹配等輔助導(dǎo)航技術(shù)的發(fā)展,AUV 長航程導(dǎo)航效果有望得到進一步提升。
AUV 的路徑規(guī)劃指在包含障礙物等約束條件的水下環(huán)境內(nèi),AUV 對預(yù)期航線、航向等不斷迭代、優(yōu)化,形成符合某類目標(biāo)函數(shù)最優(yōu)的路徑的技術(shù)[22]。由于AUV 決策自主能源自持的特性,良好的規(guī)劃技術(shù)不僅能夠確保AUV 及時規(guī)避障礙物,實現(xiàn)安全航行,還能提供最優(yōu)路徑,節(jié)約能源。AUV 路徑規(guī)劃可分為全局路徑規(guī)劃和局部路徑規(guī)劃,全局路徑規(guī)劃指AUV 根據(jù)電子海圖等手段獲取已知全局環(huán)境信息從而規(guī)劃出的路徑,可以在AUV 執(zhí)行任務(wù)前離線獲取,因此對算法實時性要求不高。局部路徑規(guī)劃指AUV 在航行過程中根據(jù)配備的聲吶、攝像機、DVL 等傳感器感知到環(huán)境中事先未知的障礙物、實時海流情況下,快速調(diào)整現(xiàn)有規(guī)劃路徑,對于算法實時性、魯棒性要求較高[23]。在具體規(guī)劃方法上,可以分為以人工勢場法、視覺錐法、A*和D*等算法為代表的傳統(tǒng)算法以及以粒子群算法、蟻群算法、深度學(xué)習(xí)算法、強化學(xué)習(xí)算法為代表的智能算法。
人工勢場法由Khatib 發(fā)明[24],這種方法利用環(huán)境中障礙物產(chǎn)生的虛擬斥力和目標(biāo)點產(chǎn)生的虛擬引力引導(dǎo)機器人達到目標(biāo),具有結(jié)構(gòu)簡單,容易實現(xiàn)的優(yōu)點,但存在容易陷入局部極值、機器人在障礙物前方難以搜索可行解等缺陷。Yun 等[25]提出一種改進人工勢場法,避免了局部極小值,并降低了水下機器人首向改變量;Cheng 等[26]利用在人工勢場法中利用速度矢量合成技術(shù)降低了AUV 航行中的能耗。A*是一種啟發(fā)式規(guī)劃算法,常用于靜態(tài)環(huán)境中AUV 的規(guī)劃避障。Chen 等[27]提出了一種基于A*算法的AUV 全局規(guī)劃方法,Garau[28]進一步在A*算法中考慮了海流對AUV 的影響。但A*算法基于網(wǎng)格搜索策略,限制了AUV 搜索空間,有一定局限性。D*算法對A*算法進行了改進,進一步適用于動態(tài)路徑路軌問題。視錐法基于AUV 前視聲吶對障礙物的感知,通過構(gòu)造一個避障速度錐實現(xiàn)障礙物規(guī)避。Wiig 等[29]對該方法進行了了大量研究與改進,目前完成了縱傾速率、縱傾和關(guān)鍵距離約束條件下復(fù)雜海底地形規(guī)避、冰蓋避碰航行、多組動態(tài)障礙物共同規(guī)避等復(fù)雜場景的避碰算法的仿真與試驗驗證,為Hugin AUV 提供了避碰系統(tǒng)。
智能算法可以進一步分為基于群體智能與基于機器學(xué)習(xí)兩類算法?;谌后w智能一類包括蟻群算法、粒子群算法、遺傳算法等,這類算法將AUV 路徑規(guī)劃轉(zhuǎn)換為目標(biāo)函數(shù)尋優(yōu)問題,能夠在高維空間有效使用,較好解決作業(yè)調(diào)度和旅行商問題,但也存在需要精確環(huán)境模型、不易得到全局最優(yōu)解的缺點。占銀[30]提出了一種改進蟻群與人工勢場結(jié)合的AUV 規(guī)劃算法,實現(xiàn)全局規(guī)劃與局部避障的有效結(jié)合,改善了傳統(tǒng)蟻群算法中收斂慢、不易得到全局最優(yōu)的缺陷。祖?zhèn)31]在粒子群算法中引入了遺傳算法中交叉、變異策略,提升了算法搜索能力,實現(xiàn)了AUV 在實際海底的三維路徑規(guī)劃,對突發(fā)的障礙也具備一定適應(yīng)性。Tanakitkorn 等[32]研究了一種針對AUV 的遺傳算法,通過在代價函數(shù)中增加A U V 能量損耗項,實現(xiàn)了AUV 節(jié)能路徑規(guī)劃?;谌后w智能的規(guī)劃方法還包括螢火蟲算法、人工魚群算法等,這一類算法均較適用于AUV 全局路徑規(guī)劃。
基于機器學(xué)習(xí)方法主要包括人工神經(jīng)網(wǎng)絡(luò)算法、強化學(xué)習(xí)算法等,需要通過數(shù)據(jù)訓(xùn)練進行學(xué)習(xí),具有對環(huán)境模型依賴性低,能夠解決實時規(guī)劃的優(yōu)勢。但部分算法學(xué)習(xí)成本較大,需要大量數(shù)據(jù)、時間,且泛化性依賴于學(xué)習(xí)效果。AUV 規(guī)劃時一般將傳感器采集的環(huán)境信息作為網(wǎng)絡(luò)輸入,將規(guī)劃路徑作為輸出,通過大量數(shù)據(jù)對網(wǎng)絡(luò)進行訓(xùn)練得到誤差收斂的網(wǎng)絡(luò)模型。朱大奇等[33]重點研究了障礙物對神經(jīng)網(wǎng)絡(luò)中神經(jīng)元激勵和輸出的影響,AUV 能夠利用人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)避障規(guī)劃,其團隊還將自組織神經(jīng)網(wǎng)絡(luò)與生物啟發(fā)神經(jīng)網(wǎng)絡(luò)結(jié)合,繼續(xù)研究了多AUV 路徑規(guī)劃算法。強化學(xué)習(xí)是一類無監(jiān)督學(xué)習(xí)方法,將規(guī)劃作為馬爾科夫決策過程處理,環(huán)境根據(jù)AUV 動作給出獎勵或懲罰強化信號,AUV 根據(jù)強化信號和自身狀態(tài)選擇動作。強化學(xué)習(xí)是一個不斷試探、評價從而改善動作策略的過程,目的是使累積獎勵最大,可以在無先驗環(huán)境下實現(xiàn)AUV 避障。冉祥瑞[34]設(shè)計了一種基于MaxQ 學(xué)習(xí)算法的AUV 路徑規(guī)劃分層框架,通過分層強化學(xué)習(xí)方式獲得避障策略,并在仿真中驗證了算法的有效性。徐楊[35]結(jié)合使用了粒子群算法與值迭代網(wǎng)絡(luò)的強化學(xué)習(xí)方法實現(xiàn)了海生物捕撈機器人的避障規(guī)劃。Yoo[36]利用強化學(xué)習(xí)算法實現(xiàn)了船舶在海流中的路徑規(guī)劃,并在仿真中與A*算法進行了對比。Cheng 等[37]將深度強化學(xué)習(xí)算法引入到水下機器人避障中。
AUV 通過導(dǎo)航系統(tǒng)獲得自身運動狀態(tài),通過路徑規(guī)劃算法得到期望路徑或軌跡后,需要依靠控制算法計算AUV 執(zhí)行機構(gòu)輸出,實現(xiàn)路徑或軌跡誤差的收斂。設(shè)計品質(zhì)優(yōu)良的AUV 控制器需考慮如下難點:1)大部分AUV 是一類欠驅(qū)動系統(tǒng),部分自由度不能直接由執(zhí)行機構(gòu)控制,需要依靠動力學(xué)耦合關(guān)系間接控制;2)AUV 運動學(xué)模型和動力學(xué)模型具有強非線性,其水動力系數(shù)還會隨著航態(tài)而變化;3)AUV 動力學(xué)模型包含大量水動力系數(shù),模型難以精確獲得,且易遭受外部環(huán)境干擾影響。
PID 控制器結(jié)構(gòu)簡單,魯棒性強,廣泛應(yīng)用于AUV 運動控制中。文獻[38] 提出了一種模糊自適應(yīng)PID 算法,自主調(diào)整控制器參數(shù),實現(xiàn)AUV 首向和深度控制。閆敬等[39]提出了一種融合Q 學(xué)習(xí)與PID 控制器的AUV 跟蹤方法,利用Q 學(xué)習(xí)策略調(diào)節(jié)控制器參數(shù),改善控制品質(zhì)。在IAUV 方面,文獻[40] 利用PID 控制器實時跟蹤逆運動學(xué)規(guī)劃器規(guī)劃的期望軌跡,實現(xiàn)了Girona-500 型IAUV 在機械臂作業(yè)時的穩(wěn)定姿態(tài)控制,完成了水下目標(biāo)平穩(wěn)抓取。PID 控制器本質(zhì)是一類線性控制器,但AUV 是一類強非線性系統(tǒng),易受外界擾動影響,因此這類控制方法具有一定局限性。
S 面控制是劉學(xué)敏等[41]提出的一種用于AUV 運動控制的方法,借鑒了模糊理論思想并與PID 控制相融合。S 面控制利用Sigmoid 函數(shù)構(gòu)造關(guān)于誤差的非線性控制器,因此相較于傳統(tǒng)PID 控制器更適用于具有強非線性特征的AUV。李岳明[42]進一步對S 面控制器的位置階和速度階的穩(wěn)定性做出了全面論證,并提出了一種新的積分調(diào)整項,構(gòu)造了品質(zhì)更好的自適應(yīng)S 面控制器。Li 等[43]面向攜帶機械臂的IAUV,提出了一種基于模型的S 面控制器,結(jié)合干擾觀測器以及機械臂耦合干擾前饋補償項,實現(xiàn)了IAUV 精確運動控制。目前,S 面控制及其改進方法廣泛用于AUV,ROV 以及USV 的運動控制中。
滑??刂剖且活愄厥獾淖兘Y(jié)構(gòu)非線性控制方法,由切換函數(shù)和趨近律構(gòu)成,切換函數(shù)評估當(dāng)前系統(tǒng)狀態(tài),根據(jù)狀態(tài)選擇對應(yīng)趨近律形成反饋控制律趨近滑模面,因此具備變結(jié)構(gòu)特性。孫俊松[44]提出了一種基于干擾觀測器的終端滑??刂品椒?,提高了海流干擾和參數(shù)攝動情況下AUV 的控制品質(zhì)??紤]執(zhí)行機構(gòu)飽和及曲線路徑跟蹤問題,韓亞楠[45]提出了一種降階擴張狀態(tài)觀測器和反步積分滑模相結(jié)合的控制方法,在模型參數(shù)不確定、具有外界干擾的條件下進行了仿真驗證?;?刂撇恍枰P途_參數(shù),對外界干擾具有魯棒性,能較好結(jié)合其他控制方法?;?刂频娜毕菔窍到y(tǒng)在趨近律引導(dǎo)下可能會頻繁穿越滑模面,引起抖振現(xiàn)象,導(dǎo)致執(zhí)行機構(gòu)震顫,影響控制品質(zhì)。
反步控制是一種常用于欠驅(qū)動AUV 的控制方法,其設(shè)計過程通過遞歸迭代李雅普諾夫函數(shù),求取控制器的解析解。賈鶴鳴[46]提出了一種濾波反步法,通過濾波器獲得信號微分值,避免了系統(tǒng)對虛擬控制輸入信號反復(fù)求導(dǎo)過程,對信號具有一定魯棒性,實現(xiàn)了欠驅(qū)動AUV 三維路徑跟蹤控制。徐昊[47]考慮AUV 受高頻海浪影響,基于海浪濾波器與滑模反步法設(shè)計了控制器,實現(xiàn)AUV 節(jié)能三維路徑跟蹤控制。Liang 等[48]針對欠驅(qū)動AUV 三維路徑跟蹤問題,設(shè)計了基于滑??刂坪头床椒ㄏ嘟Y(jié)合的控制器,并通過模糊理論近似外界干擾和模型不確定項,提升控制器的魯棒性。反步法主要問題是計算較復(fù)雜,可能需要面對虛擬控制輸入微分爆炸或積分飽和等問題。
除上述方法之外,自適應(yīng)控制、模糊控制、神經(jīng)網(wǎng)絡(luò)控制均在AUV 自主航行中有一定應(yīng)用。
大部分AUV 配備了具有鮮明物理意義的十字舵配合主推進器構(gòu)成執(zhí)行機構(gòu),控制器解算后直接輸出期望舵角和主推進器轉(zhuǎn)速并由對應(yīng)執(zhí)行機構(gòu)響應(yīng)。但傳統(tǒng)十字舵出現(xiàn)舵面卡死、失效等故障,會對AUV 航態(tài)造成嚴(yán)重影響。采用X 型布置的AUV 尾舵,每個舵面均能產(chǎn)生橫搖、縱搖、首搖力矩,具有更強的容錯控制能力,文獻[49]還論證了X 舵有相比十字舵更好的舵效,因此,X 舵在AUV 上得到了越來越多的應(yīng)用。但X 舵物理意義不如十字舵明確,X 舵AUV 控制器輸出不再是舵角而是力/力矩形式,還應(yīng)考慮控制分配策略。
控制分配策略可分為直接分配法、偽逆法及其改進方法、最優(yōu)分配法等。直接分配法利用幾何優(yōu)化法直接進行控制分配,易于理解但計算量大。偽逆法原理是通過對執(zhí)行機構(gòu)的配置矩陣直接求取偽逆,計算執(zhí)行機構(gòu)輸出。Fosson[50]將偽逆法引入AUV 控制分配,該方法及其改進方法在AUV 領(lǐng)域應(yīng)用較為廣泛。文獻[51]利用加權(quán)偽逆法為各執(zhí)行機構(gòu)分配了權(quán)重,一定程度上避免了執(zhí)行機構(gòu)飽和問題。偽逆法計算量小,易于理解,但沒有考慮執(zhí)行機構(gòu)的飽和特性,也未考慮控制輸入的飽和特性,可能會影響控制精確性,此外僅能對單一目標(biāo)進行優(yōu)化。最優(yōu)分配法采用最優(yōu)化理論,通過約束條件下對目標(biāo)函數(shù)尋優(yōu)的方式實現(xiàn)控制分配策略,王小平[52]提出了一種改進序列二次規(guī)劃算法,提高了X 舵的控制分配精度和計算速度。張英浩[53]提出了基于Levy 飛行特征的X 舵優(yōu)化分配方法,避免目標(biāo)函數(shù)陷入局部最優(yōu)的情況,并討論了卡舵、舵損模式下AUV 容錯控制及控制分配的策略。
AUV 自誕生以來就不斷向智能化方向發(fā)展,但當(dāng)前AUV 仍處于較低智能化水平[54],自主學(xué)習(xí)能力和與環(huán)境交互能力有望通過引入人工智能技術(shù)進一步提高;相較于UAV、陸地機器人等機器人系統(tǒng),AUV 仍以個體作業(yè)為主,集群編隊能夠大大加強AUV 環(huán)境搜索、海域偵察等任務(wù)的作業(yè)效率,是AUV 未來發(fā)展的另一大趨勢;深遠(yuǎn)海航行具有重要的科學(xué)和軍事意義,AUV 無需駕駛員,深遠(yuǎn)海航行安全性更好,隨著新材料、新能源技術(shù)的進一步發(fā)展,朝著更深、更遠(yuǎn)的大洋進行探索具有更強的可行性。AUV 向智能化、集群化、深海遠(yuǎn)洋化發(fā)展的需求,也為由導(dǎo)航、規(guī)劃和控制構(gòu)成的自主航行技術(shù)提出了新的挑戰(zhàn)。
當(dāng)前AUV 導(dǎo)航系統(tǒng)多以由慣導(dǎo)、DVL 為核心構(gòu)成。如何進一步提高慣導(dǎo)、DVL 等傳感器的測量精度、如何構(gòu)造更適于AUV 運動特性的數(shù)據(jù)融合方法、如何在個別傳感器失效時有效保證導(dǎo)航精度等問題均需進一步研究。在多平臺組隊集群時,如何根據(jù)多AUV 甚至多跨域平臺配置的異構(gòu)傳感器實現(xiàn)高精度導(dǎo)航,發(fā)揮“1+1>2”的作用也需進一步研究[54]。軍事任務(wù)中,還需要考慮DVL 測量帶來的隱蔽性問題。最后,將地磁導(dǎo)航、重力匹配、地形匹配、SLAM 等技術(shù)融入到AUV 導(dǎo)航系統(tǒng)中,有望解決傳統(tǒng)AUV 導(dǎo)航系統(tǒng)需上浮校正的問題,大大增強AUV 航行隱蔽性。
當(dāng)前AUV 路徑規(guī)劃技術(shù)以A*、D*、人工勢場等方法為主,面向未知動態(tài)環(huán)境適應(yīng)性較差,利用強化學(xué)習(xí)方法使AUV 具備面向環(huán)境自主學(xué)習(xí)能力有望解決這一問題[23]。但如何合理確定強化學(xué)習(xí)中的獎勵函數(shù)、如何提升強化學(xué)習(xí)泛化性、如何解決強化學(xué)習(xí)訓(xùn)練需要大量數(shù)據(jù)等問題需要進一步研究。此外,在組隊集群任務(wù)中,借助編隊中其他AUV 實現(xiàn)品質(zhì)優(yōu)良的規(guī)劃效果也需要進一步研究。
當(dāng)前AUV 實際航行中的控制算法仍以PID 控制、S 面控制等結(jié)構(gòu)簡單、無需模型參數(shù)的控制方法為主。但面對波、浪、流干擾的復(fù)雜海洋環(huán)境以及不同工作模式(如AUV 目標(biāo)搜索、回收、IAUV 帶臂作業(yè)等)仍缺乏足夠適應(yīng)性。進一步通過人工智能方法提升AUV 面向不同環(huán)境的控制能力,強化AUV 深遠(yuǎn)海作業(yè)時故障診斷以及容錯控制能力,研究AUV 長距離航行能量最優(yōu)控制方法,從AUV 控制精度、控制魯棒性以及節(jié)能角度提高控制效果,是AUV 控制技術(shù)面臨的重要挑戰(zhàn)。
本文從多角度分析歸納了AUV 自主航行中導(dǎo)航技術(shù)、規(guī)劃技術(shù)以及控制技術(shù)的發(fā)展,對AUV 自主航行技術(shù)未來發(fā)展趨勢和挑戰(zhàn)進行了展望。