王余寬 謝新連 馬昊 潘偉 許小衛(wèi)










摘要:為準(zhǔn)確預(yù)測(cè)復(fù)雜水域船舶航跡,提高航行安全水平,提出一種基于滑動(dòng)窗口長(zhǎng)短期記憶(long short-term memory, LSTM)網(wǎng)絡(luò)的船舶航跡預(yù)測(cè)方法。根據(jù)相鄰航跡點(diǎn)的船位特征變化趨勢(shì),剔除異常數(shù)據(jù),并利用插值方式填補(bǔ)缺失點(diǎn)船位數(shù)據(jù),建立船舶航行狀態(tài)數(shù)據(jù)庫(kù)。根據(jù)船舶航向變化態(tài)勢(shì)建立航行狀態(tài)判別準(zhǔn)則,識(shí)別船舶航行場(chǎng)景??紤]船位信息特征維度高的特點(diǎn),應(yīng)用LSTM網(wǎng)絡(luò)理論構(gòu)建基于滑動(dòng)窗口LSTM網(wǎng)絡(luò)的船舶航跡預(yù)測(cè)模型。應(yīng)用大連港水域和黃渤海水域的AIS數(shù)據(jù),分別在不同航行場(chǎng)景下進(jìn)行驗(yàn)證。結(jié)果表明:直航型、轉(zhuǎn)向型和‘S’型場(chǎng)景下,滑動(dòng)窗口LSTM網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的平均絕對(duì)百分比誤差、均方誤差和均方根誤差均比基礎(chǔ)LSTM網(wǎng)絡(luò)、反向傳播神經(jīng)網(wǎng)絡(luò)和灰色模型的小,這表明滑動(dòng)窗口LSTM網(wǎng)絡(luò)對(duì)非線性航跡預(yù)測(cè)的泛化能力強(qiáng)于其他3種模型。
關(guān)鍵詞:
船舶航跡預(yù)測(cè); 長(zhǎng)短期記憶( LSTM)網(wǎng)絡(luò); 滑動(dòng)窗口
中圖分類號(hào): U675.7
文獻(xiàn)標(biāo)志碼: A
Ship trajectory prediction based on sliding window LSTM network
WANG Yukuan1,2, XIE Xinlian1, MA Hao1, PAN Wei1, XU Xiaowei1
(1. Integrated Transport Institute, Dalian Maritime University, Dalian 116026, Liaoning, China;
2. School of Navigation, Wuhan University of Technology, Wuhan 430070, China)
Abstract:
In order to accurately predict ship trajectory in complex waters and improve the level of navigation safety, a method of ship trajectory prediction is proposed based on the sliding window long short-term memory (LSTM) network. According to the change trend of ship position characteristics of the neighboring trajectory points, the abnormal data are eliminated, the missing ship position data are filled by interpolation, and then a ship navigation state database is established. The navigation state discriminating criteria are established to identify the ship navigation scenarios based on the ship heading change situation. Considering the high dimensionality of ship position information, a ship trajectory prediction model based on the sliding window LSTM network is built by LSTM network theory. The AIS data of Dalian Port, Huanghai Sea and the Bohai Sea waters are used to carry out the verification in different navigation scenarios. The results show that the mean absolute percentage error, mean square error and root mean square error of the sliding window LSTM network prediction results are smaller than those of the basic LSTM network, the back propagation neural network and the grey model in straight, steering and S-type scenarios, indicating that the generalization ability of the sliding window LSTM network for nonlinear trajectory prediction is stronger than the other three models.
Key words:
ship trajectory prediction; long short-term memory (LSTM) network; sliding window
0 引 言
隨著現(xiàn)代水上航行環(huán)境復(fù)雜程度的提高,船舶航行風(fēng)險(xiǎn)增加,特別是在船舶密集水域、施工水域,干擾船舶安全航行的因素更多。準(zhǔn)確預(yù)測(cè)船舶航跡可以幫助操船人員提前識(shí)別航行風(fēng)險(xiǎn),提高船舶航行安全水平。因此,研究如何有效利用船舶航行歷史數(shù)據(jù),提高航跡預(yù)測(cè)精度,對(duì)于保障船舶航行安全具有重要意義。
船舶航跡預(yù)測(cè)方法主要包括兩類:基于航跡相似度測(cè)量的方法和基于神經(jīng)網(wǎng)絡(luò)理論的方法。從航跡相似度測(cè)量的角度開(kāi)展的航跡預(yù)測(cè)研究主要有:ZHANG等[1]建立了一個(gè)港口間歷史軌跡數(shù)據(jù)庫(kù),利用隨機(jī)森林模型測(cè)量船舶航跡與數(shù)據(jù)庫(kù)航跡的相似性來(lái)預(yù)測(cè)船舶航行行為;MURRAY等[2] 和GAO等[3]應(yīng)用無(wú)監(jiān)督學(xué)習(xí)方法對(duì)船舶歷史航跡進(jìn)行聚類,然后對(duì)船舶未來(lái)航跡或操縱行為模式進(jìn)行預(yù)測(cè);HAO等[4] 、ZHANG等[5]和PALLOTTA等[6]測(cè)量了航跡間相似度,然后獲取了船舶在各水域出現(xiàn)概率的分布特征;DE VRIES等[7]對(duì)船舶航跡數(shù)據(jù)進(jìn)行了聚類、分類以及離群檢測(cè)等;ZHANG等[8]利用具有噪聲的基于密度的空間聚類方法 (density-based spatial clustering of applications with noise,DBSCAN)確定了船舶轉(zhuǎn)彎節(jié)點(diǎn)并加以連通,從而推導(dǎo)出船舶航行模式;ZHOU等[9] 和周世波等[10]研究了港口水域內(nèi)船舶航速等特征的變化態(tài)勢(shì),揭示了一些船舶行為模式的整體性特征?;谏窠?jīng)網(wǎng)絡(luò)理論開(kāi)展的航跡預(yù)測(cè)研究主要有:LIU等[11] 和任宇翔等[12]基于長(zhǎng)短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)模型對(duì)非線性船舶航行行為進(jìn)行預(yù)測(cè),并強(qiáng)調(diào)模型輸入向量維度選取的重要性;胡玉可等[13]用基于對(duì)稱分段路徑距離的方法對(duì)船舶自動(dòng)識(shí)別系統(tǒng)(automatic identification system,AIS)數(shù)據(jù)進(jìn)行預(yù)處理,應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)航跡;SUO等[14]提出一種引入門循環(huán)單元模型的深度學(xué)習(xí)框架來(lái)預(yù)測(cè)航跡,并強(qiáng)調(diào)消除冗余數(shù)據(jù)影響的重要性;ZHOU等[15]、徐婷婷等[16]和游蘭等[17]采用船舶航行狀態(tài)區(qū)間差值思想,應(yīng)用神經(jīng)網(wǎng)絡(luò)模型建立船舶航跡預(yù)測(cè)模型;KIM等[18]考慮船舶交通服務(wù)中的情境規(guī)則,基于深度學(xué)習(xí)技術(shù)對(duì)船舶航行行為進(jìn)行預(yù)測(cè)。一些學(xué)者采用支持向量機(jī)等技術(shù)開(kāi)展了航跡預(yù)測(cè)研究,比如:NIE等[19]結(jié)合支持向量回歸和經(jīng)驗(yàn)?zāi)B(tài)分解方法,建立航跡短期預(yù)測(cè)模型;劉嬌等[20]用差分進(jìn)化算法改進(jìn)支持向量機(jī)構(gòu)建航跡預(yù)測(cè)模型;謝新連等[21]考慮船舶轉(zhuǎn)向或變速行為,建立了極限學(xué)習(xí)機(jī)航行行為預(yù)測(cè)模型;ZHANG等[22]利用拉格朗日模型研究了海洋氣象環(huán)境數(shù)據(jù)對(duì)虛擬漂移器軌跡預(yù)測(cè)的影響;PERERA[23]基于矢量乘積的算法預(yù)測(cè)未來(lái)短時(shí)間內(nèi)船舶的位置和航向。
上述文獻(xiàn)為預(yù)測(cè)船舶航跡提供了較多思路,但是對(duì)以下兩個(gè)方面考慮較少:一是原始AIS數(shù)據(jù)存在大量的噪聲和冗余,對(duì)AIS數(shù)據(jù)的預(yù)處理是航跡預(yù)測(cè)的關(guān)鍵;二是航跡預(yù)測(cè)有效步長(zhǎng)較短,在保證航跡預(yù)測(cè)精度的同時(shí)提高預(yù)測(cè)步長(zhǎng),對(duì)提高船舶跟蹤精度和監(jiān)管效率有重要作用。
本文構(gòu)建一種基于AIS數(shù)據(jù)和LSTM網(wǎng)絡(luò)的航跡預(yù)測(cè)方法。在AIS數(shù)據(jù)處理部分,根據(jù)相鄰航跡點(diǎn)的船位特征變化剔除船舶異常數(shù)據(jù),并利用插值方式補(bǔ)齊缺失的船位信息,然后基于對(duì)航向變化態(tài)勢(shì)的分析對(duì)船舶航行場(chǎng)景進(jìn)行識(shí)別。在航跡預(yù)測(cè)部分,應(yīng)用LSTM網(wǎng)絡(luò)理論提出基于滑動(dòng)窗口LSTM網(wǎng)絡(luò)的預(yù)測(cè)模型,然后給出航跡預(yù)測(cè)質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)。最后,對(duì)直航型、轉(zhuǎn)向型和‘S’型等3種典型的航行場(chǎng)景進(jìn)行航跡預(yù)測(cè)實(shí)例分析。
1 AIS數(shù)據(jù)處理
1.1 數(shù)據(jù)清洗
航跡預(yù)測(cè)需要足夠多的AIS數(shù)據(jù),數(shù)據(jù)質(zhì)量對(duì)模型預(yù)測(cè)精度也會(huì)有很大影響。然而,受信號(hào)干擾、AIS設(shè)備使用錯(cuò)誤等因素影響,接收到的AIS數(shù)據(jù)中存在著大量的噪聲數(shù)據(jù),如船舶位置(經(jīng)緯度)異常、速度異常和航向異常等。在使用AIS數(shù)據(jù)之前,需要辨識(shí)數(shù)據(jù)中的異常值,然后剔除異常數(shù)據(jù)并對(duì)缺失數(shù)據(jù)進(jìn)行補(bǔ)全。
通常情況下,船舶狀態(tài)在短時(shí)間內(nèi)不會(huì)發(fā)生較大變化,因此可根據(jù)相鄰航跡點(diǎn)的船位特征識(shí)別異常值。選取經(jīng)度、緯度、航速和航向?yàn)榇惶卣鳎O(shè)定該航段發(fā)生時(shí)間內(nèi)相鄰船位特征差值的最大值為空間變化閾值。
用llon,j、llat,j、υj和χj分別表示第j個(gè)航跡點(diǎn)的經(jīng)度、緯度、航速和航向,用δlon、δlat、δυ和δχ分別表示經(jīng)度、緯度、航速和航向的空間變化閾值,用
[WTHX]Φ[WTBX]j表示第j個(gè)航跡點(diǎn)的船位特征向量,
[WTHX]Φ[WTBX]j=(llon,j,llat,j,υj,χj)。計(jì)算第j個(gè)航跡點(diǎn)與第j+1個(gè)航跡點(diǎn)的船位特征差值,當(dāng)這兩點(diǎn)的任一船位特征差值的絕對(duì)值大于相應(yīng)船位特征的空間變化閾值時(shí),判定第j個(gè)航跡點(diǎn)為異常點(diǎn),并剔除該點(diǎn)數(shù)據(jù)。
如果被剔除的航跡點(diǎn)不是邊界點(diǎn),則采用插值方式[24]對(duì)該點(diǎn)動(dòng)態(tài)信息進(jìn)行補(bǔ)全。如果被剔除的航跡點(diǎn)是邊界點(diǎn),則不再補(bǔ)全(因?yàn)閷?duì)其進(jìn)行插值缺少足夠的條件)。根據(jù)被剔除航跡點(diǎn)前后船位點(diǎn)的經(jīng)度、緯度、航速和航向等船位特征補(bǔ)全航跡點(diǎn)信息,公式如下:
Φj=Φj-k+(Φj+m-Φj-k)(tj-tj-k)tj+m-tj-k
式中:tj表示缺失點(diǎn)對(duì)應(yīng)的時(shí)刻;Φj、Φj+m和Φj-k分別表示缺失點(diǎn)、缺失點(diǎn)前第m點(diǎn)和缺失點(diǎn)后第k點(diǎn)的船位特征信息。
將處理過(guò)的AIS數(shù)據(jù)依據(jù)船舶海上移動(dòng)業(yè)務(wù)識(shí)別碼(maritime mobile service identity, MMSI)建立水域內(nèi)各船舶航跡信息數(shù)據(jù)庫(kù)。船舶航跡信息示例見(jiàn)表1。
許偏移值;μ為變向加速度發(fā)生突變的閾值。當(dāng)χ′j≤ε時(shí)ψ=1,即將船舶航向單位時(shí)間內(nèi)改變非常小的情況視作船舶未進(jìn)行轉(zhuǎn)向(處于直航型航行場(chǎng)景)。而當(dāng)χ′j>ε時(shí),若始終有χ″j≤μ,則視船舶保持一定的變向速率(處于轉(zhuǎn)向型航行場(chǎng)景)。對(duì)于‘S’型航行場(chǎng)景的判別,則需滿足χ′j>ε,且存在n∈{1,2,…,J}使得χ″n>μ。
ε的確定方法為:統(tǒng)計(jì)所有直航型航跡上各航跡點(diǎn)處變向速率的絕對(duì)值,取其最大值并向上取整即得ε值。根據(jù)實(shí)驗(yàn)統(tǒng)計(jì),若船舶為速度較快的引航艇或海巡船等類型船舶,則設(shè)置ε=3;若船舶為客船或貨船,相鄰AIS數(shù)據(jù)傳回時(shí)間間隔內(nèi)船舶航跡不會(huì)發(fā)生較大偏移,則設(shè)置ε=2。μ的確定方法為:統(tǒng)計(jì)所有轉(zhuǎn)向型航跡上各航跡點(diǎn)處變向加速度的絕對(duì)值,取其最大值并向上取整即得μ值。根據(jù)仿真實(shí)驗(yàn)設(shè)置μ=2。
2 基于滑動(dòng)窗口LSTM網(wǎng)絡(luò)的船舶航跡預(yù)測(cè)模型
2.1 滑動(dòng)窗口LSTM網(wǎng)絡(luò)
LSTM網(wǎng)絡(luò)可以存儲(chǔ)遠(yuǎn)程時(shí)間依賴性信息,并且可以在輸入數(shù)據(jù)與輸出數(shù)據(jù)之間進(jìn)行適當(dāng)映射,在時(shí)間序列數(shù)據(jù)預(yù)測(cè)方面功能強(qiáng)大[25]。LSTM網(wǎng)絡(luò)結(jié)構(gòu)不同于傳統(tǒng)的感知器體系結(jié)構(gòu),它包含1個(gè)內(nèi)部狀態(tài)存儲(chǔ)單元和3個(gè)控制信息流的門(輸入門、遺忘門和輸出門)[25]。
本文應(yīng)用LSTM網(wǎng)絡(luò)理論提出一種基于滑動(dòng)窗口LSTM網(wǎng)絡(luò)的預(yù)測(cè)模型??紤]到船位差更能體現(xiàn)船位變化趨勢(shì),用船位差作為預(yù)測(cè)模型的輸入變量進(jìn)行航跡預(yù)測(cè)。為便于計(jì)算,以船舶初始航跡點(diǎn)為基準(zhǔn)坐標(biāo),采用墨卡托投影坐標(biāo)轉(zhuǎn)換將船位坐標(biāo)從大地坐標(biāo)系轉(zhuǎn)換到平面直角坐標(biāo)系,
第j個(gè)航跡點(diǎn)在平面直角坐標(biāo)系中的坐標(biāo)表示為(xj,yj),某航段航跡點(diǎn)在平面直角坐標(biāo)系中的坐標(biāo)集合表示為P={(xj,yj)j=1,2,…,J}。船位差序列包含航跡點(diǎn)之間的時(shí)間差序列以及船舶沿X方向和Y方向的坐標(biāo)值差序列,分別用ΔT和ΔP表示:式中:t1和tj+1為分別第1和j+1個(gè)航跡點(diǎn)對(duì)應(yīng)的時(shí)刻;ΔTj為第j個(gè)航跡點(diǎn)與第1個(gè)航跡點(diǎn)之間間隔的時(shí)間;ΔPj為第j個(gè)航跡段的船位差序列;ΔXj和ΔYj分別為第j個(gè)航跡段的船位差在X軸和Y軸上的投影。
假設(shè)可獲得的船位數(shù)據(jù)的數(shù)量為Q,設(shè)定滑動(dòng)窗口長(zhǎng)度為N,滑動(dòng)窗口長(zhǎng)度即為每次訓(xùn)練輸入船位數(shù)據(jù)
的長(zhǎng)度。LSTM網(wǎng)絡(luò)每次訓(xùn)練輸出一個(gè)預(yù)測(cè)船位數(shù)據(jù),并采用“去舊補(bǔ)新”模式迭代更新滑動(dòng)窗口中的船位數(shù)據(jù),即用訓(xùn)練輸出值作為最新數(shù)據(jù)替換滑動(dòng)窗口中的最舊數(shù)據(jù)?;瑒?dòng)窗口LSTM網(wǎng)絡(luò)迭代進(jìn)行Q-N次訓(xùn)練,不斷優(yōu)化參數(shù)獲得航跡預(yù)測(cè)模型。滑動(dòng)窗口LSTM網(wǎng)絡(luò)訓(xùn)練結(jié)構(gòu)見(jiàn)圖2。
在進(jìn)行模型訓(xùn)練時(shí),將船位差序列分組,每
組包含從S1到SN+1共N+1個(gè)船位差數(shù)據(jù);以前N個(gè)船位差數(shù)據(jù)(S1~SN)作為輸入,經(jīng)LSTM網(wǎng)絡(luò)訓(xùn)練輸出第N+1個(gè)船位差數(shù)據(jù)S′N+1,并與第N+1個(gè)船位差數(shù)據(jù)真實(shí)值SN+1進(jìn)行對(duì)比;通過(guò)輸出數(shù)據(jù)的誤差分析迭代調(diào)整LSTM網(wǎng)絡(luò)參數(shù),最終獲得LSTM預(yù)測(cè)模型。在進(jìn)行LSTM網(wǎng)絡(luò)訓(xùn)練時(shí),遺忘門f(ti)將ΔTi和ΔPi-1作為輸入,計(jì)算得到sigmoid激活信息;輸入門a(ti)取ΔTi和ΔPi-1來(lái)計(jì)算c(ti)的值;輸出門o(ti)通過(guò)sigmoid和tanh函數(shù)來(lái)調(diào)節(jié)LSTM單元的輸出。
2.2 滑動(dòng)窗口LSTM網(wǎng)絡(luò)預(yù)測(cè)模型
在進(jìn)行航跡
預(yù)測(cè)時(shí),利用第Q-N至Q個(gè)船位數(shù)據(jù)預(yù)測(cè)未來(lái)第Q+1個(gè)船位數(shù)據(jù),再由第Q-N+1至Q+1個(gè)船位數(shù)據(jù)預(yù)測(cè)第Q+2個(gè)船位數(shù)據(jù),直至預(yù)測(cè)到未來(lái)第Q+M個(gè)船位數(shù)據(jù);而在滑動(dòng)預(yù)測(cè)過(guò)程中,如果真實(shí)的船舶數(shù)據(jù)繼續(xù)被接收且在時(shí)間上覆蓋了已預(yù)測(cè)數(shù)據(jù),則使用最新的真實(shí)數(shù)據(jù)替換預(yù)測(cè)值作為模型輸入數(shù)據(jù)?;瑒?dòng)窗口LSTM網(wǎng)絡(luò)預(yù)測(cè)模型見(jiàn)圖3。
由船位差序列方程預(yù)測(cè)未來(lái)M個(gè)時(shí)刻的船舶位置時(shí),用ΔTh,j和ΔPh,j分別表示歷史第j個(gè)航跡段兩端航跡點(diǎn)的時(shí)間差和船位差,將所求歷史時(shí)間差序列ΔTh、船位差序列ΔPh和未來(lái)M個(gè)時(shí)刻對(duì)應(yīng)的時(shí)間差序列ΔTp作為輸入數(shù)據(jù),數(shù)據(jù)方程如下:
2.3 模型評(píng)價(jià)標(biāo)準(zhǔn)
為評(píng)價(jià)滑動(dòng)窗口LSTM網(wǎng)絡(luò)模型的航跡預(yù)測(cè)性能,定義“船位相對(duì)誤差”(relative error of ship position,ERSP)為船位誤差與各船位到基準(zhǔn)點(diǎn)距離平均值的比值,用百分比形式表示,其值越小表示預(yù)測(cè)航跡點(diǎn)偏離實(shí)際航跡的程度越小。船位相對(duì)誤差用于評(píng)價(jià)模型對(duì)單個(gè)航跡點(diǎn)預(yù)測(cè)的準(zhǔn)確性。另外,采用基于船位信息的平均絕對(duì)百分比誤差(mean absolute percentage error,EMAP)、均方誤差(mean square error,EMS)和均方根誤差(root mean square error,ERMS)等多個(gè)指標(biāo)評(píng)估模型對(duì)趨勢(shì)預(yù)測(cè)的穩(wěn)定性。EMAP將航跡預(yù)測(cè)結(jié)果偏離程度表示為百分比形式;EMS表示航跡點(diǎn)坐標(biāo)預(yù)測(cè)的平均誤差;ERMS表示模型預(yù)測(cè)結(jié)果的標(biāo)準(zhǔn)偏差。4個(gè)評(píng)價(jià)指標(biāo)值越小表明模型預(yù)測(cè)準(zhǔn)確性越高,計(jì)算式分別如下
式中:xr,j和yr,j分別為未來(lái)第j時(shí)刻船舶航跡點(diǎn)沿X方向和Y方向的實(shí)際坐標(biāo)值;xr,1和yr,1分別為未來(lái)第1時(shí)刻航跡點(diǎn)沿X方向和Y方向的實(shí)際坐標(biāo)值。
3 實(shí)例分析
利用AIS設(shè)備在遼寧省大連市周邊多個(gè)海域接收船舶航行數(shù)據(jù),編碼識(shí)別1 000艘次以上船舶的AIS信息。對(duì)AIS數(shù)據(jù)進(jìn)行清洗,然后利用第1.2節(jié)的方法識(shí)別并選出處于直航型、轉(zhuǎn)向型和‘S’型航行場(chǎng)景下的船舶各1艘進(jìn)行航跡預(yù)測(cè)。選出的3種典型航行場(chǎng)景下的船舶信息見(jiàn)表2。
對(duì)3種典型航行場(chǎng)景下的船舶進(jìn)行航跡預(yù)測(cè)時(shí),所構(gòu)建的訓(xùn)練集和測(cè)試集數(shù)據(jù)比例約為4∶1。關(guān)于訓(xùn)練和測(cè)試過(guò)程中的樣本分配,以直航型航行場(chǎng)景為例加以說(shuō)明。訓(xùn)練部分:樣本總量Q1為80,以77個(gè)時(shí)刻的航跡數(shù)據(jù)(SQ-79,SQ-78,…,SQ-3)為滑動(dòng)窗口LSTM網(wǎng)絡(luò)的輸入數(shù)據(jù),以對(duì)應(yīng)延后3個(gè)時(shí)段的航跡數(shù)據(jù)(SQ-76,SQ-75,…,SQ)為滑動(dòng)窗口LSTM網(wǎng)絡(luò)的輸出數(shù)據(jù),訓(xùn)練后保存模型參數(shù)。測(cè)試部分:樣本總量Q2為23,以連續(xù)20個(gè)時(shí)刻的船舶航行動(dòng)態(tài)序列數(shù)據(jù)(SQ-22,SQ-21,…,SQ-3)為測(cè)試
滑動(dòng)窗口LSTM網(wǎng)絡(luò)的輸入數(shù)據(jù),來(lái)預(yù)測(cè)船舶航跡數(shù)據(jù)(SQ-19,SQ-18,…,SQ)。另外,窗口長(zhǎng)度值代表訓(xùn)練序列的輸入長(zhǎng)度,其值會(huì)影響訓(xùn)練迭代時(shí)間和預(yù)測(cè)精度。為避免迭代過(guò)程中模型學(xué)習(xí)時(shí)間過(guò)長(zhǎng),設(shè)置窗口長(zhǎng)度閾值上界為15,根據(jù)樣本量大小設(shè)置閾值下界為4。分別對(duì)3種典型航行場(chǎng)景,在窗口長(zhǎng)度閾值范圍[4,15]內(nèi)搜索最優(yōu)窗口長(zhǎng)度值。根據(jù)重復(fù)實(shí)驗(yàn)結(jié)果,當(dāng)直航型、轉(zhuǎn)向型和‘S’型航行場(chǎng)景下的窗口長(zhǎng)度分別為5、10和10時(shí)模型達(dá)到訓(xùn)練目標(biāo)誤差時(shí)的訓(xùn)練時(shí)長(zhǎng)最短。3種典型航行場(chǎng)景下預(yù)測(cè)模型關(guān)鍵參數(shù)見(jiàn)表3。
表3
模型的損失值會(huì)隨訓(xùn)練過(guò)程變化,因此模型訓(xùn)練的次數(shù)會(huì)影響具有固定架構(gòu)的LSTM網(wǎng)絡(luò)模型的性能。由圖4可知:隨著訓(xùn)練次數(shù)的增加,模型的均方根誤差先增大后減小;在訓(xùn)練達(dá)到30次后,均方根誤差基本趨于穩(wěn)定,訓(xùn)練效果較好。在轉(zhuǎn)向型和‘S’型兩種航行場(chǎng)景下,在表3所示的訓(xùn)練次數(shù)范圍內(nèi)模型的均方根誤差亦能達(dá)到穩(wěn)定。
用同樣的訓(xùn)練集和測(cè)試集對(duì)基礎(chǔ)LSTM網(wǎng)絡(luò)、一階灰色模型GM(1,1)和反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network, BPNN)進(jìn)行實(shí)驗(yàn),并將各種模型的預(yù)測(cè)效果進(jìn)行對(duì)比。基礎(chǔ)LSTM網(wǎng)絡(luò)的參數(shù)設(shè)置同滑動(dòng)窗口LSTM網(wǎng)絡(luò)。一階灰色模型的發(fā)展系數(shù)取值為0.5。基于文獻(xiàn)[16]對(duì)BPNN進(jìn)行參數(shù)選優(yōu),輸入層和輸出層神經(jīng)元個(gè)數(shù)均取2,隱含層神經(jīng)元個(gè)數(shù)取10。3種典型航行場(chǎng)景下不同模型對(duì)測(cè)試航跡點(diǎn)的預(yù)測(cè)結(jié)果見(jiàn)圖5,其中用“SL-LSTM”代表滑動(dòng)窗口LSTM網(wǎng)絡(luò),用“LSTM”代表基礎(chǔ)LSTM網(wǎng)絡(luò)。由圖5可知:在直航型航行場(chǎng)景下,各種模型預(yù)測(cè)的航跡偏離程度均較低;在轉(zhuǎn)向型和‘S’型航行場(chǎng)景下,隨著預(yù)測(cè)航跡點(diǎn)數(shù)量的增加,滑動(dòng)窗口LSTM網(wǎng)絡(luò)預(yù)測(cè)結(jié)果仍較為接近實(shí)際航跡,基礎(chǔ)LSTM網(wǎng)絡(luò)預(yù)測(cè)結(jié)果逐漸偏離實(shí)際航跡,而GM(1,1)和BPNN預(yù)測(cè)結(jié)果出現(xiàn)較大偏差。
分析對(duì)單個(gè)航跡點(diǎn)預(yù)測(cè)的準(zhǔn)確性,圖6給出了3種典型航行場(chǎng)景下4種模型預(yù)測(cè)的各個(gè)航跡點(diǎn)的船位相對(duì)誤差(ERSP)。由6可以看出:在直航型航行場(chǎng)景下,4種模型預(yù)測(cè)的ERSP均在10%以內(nèi),滑動(dòng)窗口LSTM網(wǎng)絡(luò)預(yù)測(cè)的ERSP始終保持在1%以下,基礎(chǔ)LSTM網(wǎng)絡(luò)和BPNN預(yù)測(cè)的ERSP隨著航跡點(diǎn)數(shù)量
的增加而逐漸增大,GM(1,1)預(yù)測(cè)的ERSP波動(dòng)最大;在轉(zhuǎn)向型航行場(chǎng)景下,滑動(dòng)窗口LSTM網(wǎng)絡(luò)預(yù)測(cè)的ERSP在5%以內(nèi),GM(1,1)和BPNN預(yù)測(cè)的ERSP則在3%~10%范圍內(nèi),基礎(chǔ)LSTM網(wǎng)絡(luò)預(yù)測(cè)的絕大多數(shù)航跡點(diǎn)的ERSP均在10%以內(nèi),僅兩個(gè)航跡點(diǎn)的ERSP超過(guò)10%;在‘S’型航行場(chǎng)景下,基礎(chǔ)LSTM網(wǎng)絡(luò)預(yù)測(cè)的ERSP在10%左右,BPNN和GM(1,1)預(yù)測(cè)的ERSP已經(jīng)出現(xiàn)極大波動(dòng),對(duì)部分航跡點(diǎn)預(yù)測(cè)的ERSP超過(guò)50%,滑動(dòng)窗口LSTM網(wǎng)絡(luò)對(duì)大部分航跡點(diǎn)預(yù)
測(cè)的ERSP在0~5%范圍內(nèi),僅對(duì)3個(gè)航跡點(diǎn)預(yù)測(cè)的ERSP超過(guò)5%(且低于10%)。
圖7展示了3種典型航行場(chǎng)景下4種模型預(yù)測(cè)的ERSP總體分布。在直航型和‘S’型航行場(chǎng)景下,滑動(dòng)窗口LSTM網(wǎng)絡(luò)和基礎(chǔ)LSTM網(wǎng)絡(luò)的預(yù)測(cè)表現(xiàn)明顯優(yōu)于BPNN和GM(1,1)的;在轉(zhuǎn)向型航行場(chǎng)景下,基礎(chǔ)LSTM網(wǎng)絡(luò)的預(yù)測(cè)表現(xiàn)同BPNN的,但劣于GM(1,1)的。由圖6和7可知,在3種典型航行場(chǎng)景下,滑動(dòng)窗口LSTM網(wǎng)絡(luò)均可提供較為準(zhǔn)確的單點(diǎn)預(yù)測(cè),預(yù)測(cè)效果均優(yōu)于其他3種模型的,BPNN和GM(1,1)在直航型和轉(zhuǎn)向型航行場(chǎng)景下的表現(xiàn)尚可,基礎(chǔ)LSTM網(wǎng)絡(luò)在直航型和‘S’型航行場(chǎng)景下的預(yù)測(cè)表現(xiàn)良好。
為進(jìn)一步量化模型的預(yù)測(cè)性能,計(jì)算出4種模型對(duì)相同測(cè)試集進(jìn)行實(shí)驗(yàn)的平均絕對(duì)百分比誤差(EMAP)、均方誤差(EMS)和均方根誤差(ERMS),見(jiàn)表4。由表4可知:直航型、轉(zhuǎn)向型和‘S’型航行場(chǎng)景下滑動(dòng)窗口LSTM網(wǎng)絡(luò)預(yù)測(cè)的EMAP分別為0.176%、2.386%和2.927%,均遠(yuǎn)比其他模型的小,表明該模型預(yù)測(cè)準(zhǔn)確性較高;滑動(dòng)窗口LSTM網(wǎng)絡(luò)預(yù)測(cè)的EMS和ERMS較小,表明該模型比其他3種模型穩(wěn)定;在直航型和轉(zhuǎn)向型航行場(chǎng)景下,基礎(chǔ)LSTM網(wǎng)絡(luò)與BPNN預(yù)測(cè)結(jié)果的EMAP、EMS和ERMS均較為接近;在‘S’型航行場(chǎng)景下,GM(1,1)和BPNN在各項(xiàng)評(píng)價(jià)指標(biāo)上表現(xiàn)都很差。
綜上可知,不同航行場(chǎng)景下滑動(dòng)窗口LSTM網(wǎng)絡(luò)的各類預(yù)測(cè)誤差值均比其他3種模型的小,這表明本文提出的滑動(dòng)窗口LSTM網(wǎng)絡(luò)不僅可以更好地預(yù)測(cè)船位整體變化趨勢(shì),而且在較長(zhǎng)時(shí)間內(nèi)對(duì)單個(gè)航跡點(diǎn)的預(yù)測(cè)結(jié)果偏離實(shí)際的程度較低,提高了航跡預(yù)測(cè)的準(zhǔn)確性。而基礎(chǔ)LSTM網(wǎng)絡(luò),盡管在整體變化趨勢(shì)的預(yù)測(cè)上表現(xiàn)尚可,但隨著航跡點(diǎn)數(shù)量的增加該模型對(duì)單個(gè)航跡點(diǎn)的預(yù)測(cè)誤差逐漸增大。
4 結(jié)束語(yǔ)
為提升目標(biāo)水域船舶通航情況的監(jiān)管效率,降低船舶航行風(fēng)險(xiǎn),提出基于滑動(dòng)窗口LSTM網(wǎng)絡(luò)的航跡預(yù)測(cè)方法。結(jié)論如下:(1)針對(duì)船舶AIS數(shù)據(jù)存在異常的問(wèn)題,基于對(duì)船位特征的空間變化閾值分析對(duì)離群點(diǎn)進(jìn)行識(shí)別,剔除并補(bǔ)全相應(yīng)航跡點(diǎn)數(shù)據(jù),進(jìn)而建立船舶航行狀態(tài)數(shù)據(jù)庫(kù)?;诖昂较蜃兓厔?shì)建立的航行場(chǎng)景識(shí)別方法,可以作為表達(dá)船舶航跡特征的有效方法。(2)利用LSTM網(wǎng)絡(luò)對(duì)時(shí)間序列數(shù)據(jù)預(yù)測(cè)性能良好的優(yōu)勢(shì),建立基于滑動(dòng)窗口LSTM網(wǎng)絡(luò)的航跡預(yù)測(cè)模型。
滑動(dòng)窗口LSTM
網(wǎng)絡(luò)對(duì)直航型、轉(zhuǎn)向型和‘S’型航跡預(yù)測(cè)的平均絕對(duì)百分比誤差分別為0.176%、2.386%和2.927%,均遠(yuǎn)小于基礎(chǔ)LSTM網(wǎng)絡(luò)、BPNN和GM(1,1)的預(yù)測(cè)誤差。另外,滑動(dòng)窗口LSTM網(wǎng)絡(luò)預(yù)測(cè)的均方誤差和均方根誤差均較小,表明滑動(dòng)窗口LSTM網(wǎng)絡(luò)比其他3種模型穩(wěn)定。在直航型、轉(zhuǎn)向型和‘S’型3種典型航行場(chǎng)景下,滑動(dòng)窗口LSTM網(wǎng)絡(luò)不僅可以準(zhǔn)確預(yù)測(cè)航跡變化趨勢(shì),而且對(duì)單個(gè)航跡點(diǎn)預(yù)測(cè)的偏離程度也很低,其表現(xiàn)明顯優(yōu)于基礎(chǔ)LSTM網(wǎng)絡(luò)、BPNN和GM(1,1)。
由于滑動(dòng)窗口LSTM網(wǎng)絡(luò)的航跡預(yù)測(cè)對(duì)數(shù)據(jù)量有一定的要求,未來(lái)研究中對(duì)于數(shù)據(jù)量較少的情況需要采用插值等方法增大數(shù)據(jù)量。本文提出的方法僅能對(duì)已經(jīng)安裝了AIS設(shè)備的船舶進(jìn)行航跡預(yù)測(cè),未來(lái)可考慮融合雷達(dá)等多源信息,以實(shí)現(xiàn)對(duì)水域內(nèi)所有船舶的監(jiān)管。
參考文獻(xiàn):
[1]ZHANG C K, BIN J C, WANG W, et al. AIS data driven general vessel destination prediction: a random forest based approach[J]. Transportation Research Part C, 2020, 118: 102729. DOI: 10.1016/j.trc.2020.102729.
[2]MURRAY B, PERERA L P. A dual linear autoencoder approach for vessel trajectory prediction using historical AIS data[J]. Ocean Engineering, 2020, 209: 107478. DOI: 10.1016/j.oceaneng.2020.107478.
[3]GAO M, SHI G Y. Ship-handling behavior pattern recognition using AIS sub-trajectory clustering analysis based on the T-SNE and spectral clustering algorithms[J]. Ocean Engineering, 2020, 205: 106919. DOI: 10.1016/j.oceaneng.2020.106919.
[4]HAO R, TEIXEIRA A P, SOARES C G. Ship trajectory uncertainty prediction based on a Gaussian process model[J]. Ocean Engineering, 2019, 182: 499-511. DOI: 10.1016/j.oceaneng.2019.04.024.
[5]ZHANG L Y, MENG Q. Probabilistic ship domain with applications to ship collision risk assessment[J]. Ocean Engineering, 2019, 186: 106130. DOI: 10.1016/j.oceaneng.2019.106130.
[6]PALLOTTA G, VESPE M, BRYAN K. Vessel pattern knowledge discovery from AIS data: a framework for anomaly detection and route prediction[J]. Entropy, 2013, 15: 2218-2245. DOI: 10.3390/e15062218.
[7]DE VRIES G K D, VAN SOMEREN M. Machine learning for vessel trajectories using compression, alignments and domain knowledge[J]. Expert Systems with Applications, 2012, 39: 13426-13439. DOI: 10.1016/j.eswa.2012.05.060.
[8]ZHANG S K, SHI G Y, LIU Z J, et al. Data-driven based automatic maritime routing from massive AIS trajectories in the face of disparity[J]. Ocean Engineering, 2018, 155: 240-250. DOI: 10.1016/j.oceaneng.2018.02.060.
[9]ZHOU Y, DAAMEN W, VELLINGA T, et al. Ship classification based on ship behavior clustering from AIS data[J]. Ocean Engineering, 2019, 175: 176-187. DOI: 10.1016/j.oceaneng.2019.02.005.
[10]周世波, 唐基宏, 熊振南. 基于優(yōu)化模糊C均值算法的錨泊船聚集特性[J]. 交通運(yùn)輸工程學(xué)報(bào), 2019, 19(6): 137-148. DOI: 10.19818/j.cnki.1671-1637.2019.06.013.
[11]LIU Y C, DUAN W Y, HUANG L M, et al. The input vector space optimization for LSTM deep learning model in real-time prediction of ship motions[J]. Ocean Engineering, 2020, 213: 107681. DOI: 10.1016/j.oceaneng.2020.107681.
[12]任宇翔, 趙建森, 劉衛(wèi), 等. 基于AIS數(shù)據(jù)和LSTM網(wǎng)絡(luò)的船舶航行動(dòng)態(tài)預(yù)測(cè)[J]. 上海海事大學(xué)學(xué)報(bào), 2019, 40(3): 32-37. DOI: 10.13340/j.jsmu.2019.03.006.
[13]胡玉可, 夏維, 胡笑旋, 等. 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的船舶航跡預(yù)測(cè)[J]. 系統(tǒng)工程與電子技術(shù), 2020, 42(4): 871-877. DOI: 10.3969/j.issn.1001-506X.2020.04.18.
[14]SUO Y F, CHEN W K, CLARAMUNT C, et al. A ship trajectory prediction framework based on a recurrent neural network[J]. Sensors, 2020, 20: 5133. DOI: 10.3390/s20185133.
[15]ZHOU H, CHEN Y J, ZHANG S M. Ship trajectory prediction based on BP neural network[J]. Journal on Artificial Intelligence, 2019, 1(1): 29-36. DOI: 10.32604/jai.2019.05939.
[16]徐婷婷, 柳曉鳴, 楊鑫. 基于BP神經(jīng)網(wǎng)絡(luò)的船舶航跡實(shí)時(shí)預(yù)測(cè)[J]. 大連海事大學(xué)學(xué)報(bào), 2012, 38(1): 9-11. DOI: 10.16411/j.cnki.issn1006-7736.2012.01.028.
[17]游蘭, 韓雪薇, 何正偉, 等. 基于改進(jìn)Seq2Seq的短時(shí)AIS軌跡序列預(yù)測(cè)模型[J]. 計(jì)算機(jī)科學(xué), 2020, 47(9): 169-174. DOI: 10.11896/jsjkx.190800060.
[18]KIM K I, LEE K M. Context-aware information provisioning for vessel traffic service using rule-based and deep learning techniques[J]. International Journal of Fuzzy Logic and Intelligent Systems, 2018, 18(1): 13-19. DOI: 10.5391/IJFIS.2018.18.1.13.
[19]NIE Z H, SHEN F, XU D J,et al. An EMD-SVR model for short-term prediction of ship motion using mirror symmetry and SVR algorithms to eliminate EMD boundary effect[J]. Ocean Engineering, 2020, 217: 107927. DOI: 10.1016/j.oceaneng.2020.107927.
[20]劉嬌, 史國(guó)友, 楊學(xué)錢, 等. 基于DE-SVM的船舶航跡預(yù)測(cè)模型[J]. 上海海事大學(xué)學(xué)報(bào), 2020, 41(1): 34-39, 115. DOI: 10.13340/j.jsmu.2020.01.006.
[21]謝新連, 陳紫薇, 魏照坤, 等. 基于極限學(xué)習(xí)機(jī)的船舶航行行為預(yù)測(cè)[J]. 重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版), 2019, 38(8): 7-12, 123. DOI: 10.3969/j.issn.1674-0696.2019.08.02.
[22]ZHANG X D, CHENG L, ZHANG F L, et al. Evaluation of multi-source forcing datasets for drift trajectory prediction using Lagrangian models in the South China Sea[J]. Applied Ocean Research, 2020, 104: 102395. DOI: 10.1016/j.apor.2020.102395.
[23]PERERA L P. Navigation vector based ship maneuvering prediction[J]. Ocean Engineering, 2017, 138: 151-160. DOI: 10.1016/j.oceaneng.2017.04.017.
[24]王小凱, 朱小文. 計(jì)量檢定中3種判別和剔除異常值的統(tǒng)計(jì)方法[J]. 中國(guó)測(cè)試, 2018, 44(增刊1): 47-50.
[25]CAI J X, HU J L, TANG X, et al. Deep historical long short-term memory network for action recognition[J]. Neurocomputing, 2020, 407: 428-438. DOI: 10.1016/j.neucom.2020.03.111.
(編輯 賈裙平)
收稿日期: 2020-12-05
修回日期: 2021-10-14
基金項(xiàng)目:
國(guó)家重點(diǎn)研發(fā)計(jì)劃(2017YFC0805309);中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(3132019303)
作者簡(jiǎn)介:
王余寬(1995—),男,河南周口人,博士研究生,研究方向?yàn)榻煌ㄐ畔⒐こ碳翱刂?,(E-mail)wangyk_321@163.com;
謝新連(1956—),男,遼寧大連人,教授,博導(dǎo),博士,研究方向?yàn)榻煌ㄟ\(yùn)輸規(guī)劃與管理、船舶工程與經(jīng)濟(jì),
(E-mail)xxlian@dlmu.edu.cn