劉文,汪文博
(武漢理工大學(xué),a.航運(yùn)學(xué)院;b.內(nèi)河航運(yùn)技術(shù)湖北省重點(diǎn)實(shí)驗(yàn)室,武漢430063)
船舶自動(dòng)識(shí)別系統(tǒng)(AIS)是一種用于保障海上運(yùn)輸安全的船舶自動(dòng)報(bào)告系統(tǒng),可提供各種靜態(tài)和動(dòng)態(tài)信息,包括船舶位置、航速、吃水深度、裝載狀態(tài)等。這些數(shù)據(jù)可以被其他船舶及船舶交通服務(wù)中心(Vessel Traffic Service Center,VTS)接收,廣泛用于船舶之間的避碰、風(fēng)險(xiǎn)評(píng)估、軌跡追蹤等研究。根據(jù)國(guó)際海上人命安全公約(International Convention for Safety of Life at Sea,SOLAS)規(guī)定,客船及總噸位超過(guò)300的國(guó)際航船必須安裝AIS系統(tǒng)。此外,中華人民共和國(guó)海事局(MSA)等相關(guān)部門(mén)也非常重視安全,為內(nèi)河船舶配備AIS系統(tǒng)。隨著在國(guó)際船舶和內(nèi)河船舶的廣泛應(yīng)用,AIS數(shù)據(jù)在海上數(shù)據(jù)分析、航行安全和海上風(fēng)險(xiǎn)評(píng)估等方面發(fā)揮著不可或缺的作用[1]。
由AIS 數(shù)據(jù)顯示的船舶軌跡數(shù)據(jù)是避碰研究的重要數(shù)據(jù)來(lái)源之一。SU 等[2]提出一種基于模糊邏輯理論的系統(tǒng),利用AIS數(shù)據(jù)對(duì)被讓路船進(jìn)行最優(yōu)舵轉(zhuǎn)向決策。同時(shí),通過(guò)與其他AIS 數(shù)據(jù)的比較,可提供用于船舶異常行為識(shí)別的實(shí)時(shí)數(shù)據(jù)[3]。此外,歷史AIS數(shù)據(jù)對(duì)于船舶航行風(fēng)險(xiǎn)評(píng)估具有重要價(jià)值。例如,在新加坡海峽,通過(guò)AIS 數(shù)據(jù)可識(shí)別危險(xiǎn)水域和船舶類(lèi)型[4]。近年來(lái),AIS 數(shù)據(jù)被廣泛用于船舶軌跡預(yù)測(cè),通過(guò)機(jī)器學(xué)習(xí)方法進(jìn)行海上交通調(diào)查和安全管理。LI等[5]基于AIS數(shù)據(jù)開(kāi)發(fā)了一種相似性分組引導(dǎo)的機(jī)器學(xué)習(xí)模型,用于海上時(shí)間序列預(yù)測(cè)。這些應(yīng)用都依賴(lài)于準(zhǔn)確的船舶軌跡。
然而,此前的研究表明,AIS 提供的軌跡數(shù)據(jù)在多數(shù)情況下是不準(zhǔn)確和不可靠的,根據(jù)HARATI M.等[6]對(duì)AIS 誤差的調(diào)查顯示,大約30%的船舶曾有過(guò)AIS信息不準(zhǔn)確的情況。AIS誤差的產(chǎn)生受多種因素的影響:第一,由于海況復(fù)雜以及定位設(shè)備的限制,使得船舶軌跡會(huì)出現(xiàn)噪聲數(shù)據(jù);第二,當(dāng)處于無(wú)定位信號(hào)的區(qū)域時(shí),船舶軌跡會(huì)包含缺失數(shù)據(jù);第三,由于AIS 傳輸時(shí)間間隔遠(yuǎn)低于IMO(International Maritime Organization)標(biāo)準(zhǔn)[6],船舶軌跡采樣率較低,導(dǎo)致軌跡稀疏。若此類(lèi)數(shù)據(jù)用于需要依賴(lài)于高精度軌跡數(shù)據(jù)的海上風(fēng)險(xiǎn)評(píng)估或數(shù)據(jù)分析等問(wèn)題,將影響海員的判斷,極大地增加航行風(fēng)險(xiǎn)。因此,量化和重構(gòu)實(shí)際船舶軌跡對(duì)于提高AIS的可用性,提高航行安全具有重要意義。
針對(duì)基于AIS的船舶軌跡重構(gòu)問(wèn)題,QU等[4]提出一種基于牛頓運(yùn)動(dòng)定律的數(shù)據(jù)清洗方法,可有效消除AIS 數(shù)據(jù)噪聲。NGUYEN 等[7]提出一種基于時(shí)間序列的分析和校正AIS數(shù)據(jù)的方法,該方法結(jié)合時(shí)間序列特征識(shí)別和插值修復(fù)方法,對(duì)直線航行軌跡具有較好的自適應(yīng)重構(gòu)能力,但不適用于非線性航行軌跡。SANG等[8]提出一種用于內(nèi)河船舶軌跡重構(gòu)的曲線擬合方法。WANG 等[9]提出一種基于最小二乘支持向量機(jī)(LS-SVM)的AIS 數(shù)據(jù)修復(fù)方法。然而,上述方法無(wú)法在缺失點(diǎn)較多的軌跡上很好地完成軌跡重構(gòu)。
為填補(bǔ)上述研究空白,本文提出了一種基于秩最小化矩陣去噪的船舶軌跡重構(gòu)方法。由于內(nèi)河船舶一般都有固定的航道,軌跡之間具有較強(qiáng)的自相似性,充分利用軌跡的自相似性,可實(shí)現(xiàn)高缺失率下更好的軌跡重構(gòu)效果。研究的貢獻(xiàn)在于以下兩點(diǎn):第一,構(gòu)建了秩最小化矩陣去噪模型,利用軌跡的自相似性重構(gòu)船舶軌跡,通過(guò)1個(gè)模型同時(shí)實(shí)現(xiàn)軌跡缺失補(bǔ)全與去噪;第二,提出的方法在不同缺失比例以及隨機(jī)缺失和連續(xù)缺失兩種缺失情境下具有魯棒性和較強(qiáng)的穩(wěn)定性。此外,該方法的性能明顯優(yōu)于HALRTC 等軌跡重構(gòu)方法,并在高缺失率下表現(xiàn)較好的重構(gòu)效果。
二維變分模態(tài)分解(2D-VMD)是在VMD 算法的基礎(chǔ)上發(fā)展而來(lái)的一種非遞歸自適應(yīng)分解算法[10],常用于矩陣分解,可將不同形狀或不同方向的多分量矩陣分解為中心頻率附近的幾個(gè)有限帶寬,得到多個(gè)子模態(tài)函數(shù)分量(IMF)。其約束變分方程為
為解決上述約束性變分問(wèn)題,引入二次懲罰因子α和拉格朗日乘子將約束變分問(wèn)題轉(zhuǎn)變?yōu)榉羌s束變分問(wèn)題,其增廣拉格朗日表達(dá)式為
式中:λ為拉格朗日乘子;為模態(tài)集合;為中心頻率集合。則問(wèn)題轉(zhuǎn)化為
引入交替方向乘子算法(Alternate Direction Method of Multipliers,ADMM)解決上述變分問(wèn)題,通過(guò)迭代更新優(yōu)化uk,wk及λ求得擴(kuò)展拉格朗日表達(dá)式的“鞍點(diǎn)”。
基于數(shù)據(jù)塊的秩最小化算法PLR 是一種常用的數(shù)據(jù)去噪算法,該算法相比于K-SVD[11]、PLOW[12]以及BM3D[13]等具有更好的去噪效果與更快的運(yùn)行速度[14]。對(duì)于矩陣X∈RM×N,本文假設(shè)M=N,矩陣可被劃分為多個(gè)d×d的重疊塊。重疊塊集合,xi為第i塊重疊塊。對(duì)于每個(gè)重疊塊xi∈D,稱(chēng)為參照塊,其周?chē)鷑×n范圍內(nèi)均包含個(gè)重疊塊,選擇其中個(gè)最相似的塊(包含參照塊本身)轉(zhuǎn)化為向量。各個(gè)參照塊的相似塊向量堆疊在一起可組成d2×m的相似矩陣。該相似矩陣表示為,其中,S中的列sj,j=1,2,…,m,j為列索引,即由相似塊轉(zhuǎn)化的向量。
然后,對(duì)相似矩陣S進(jìn)行去噪。首先,基于主成分分析法得到自適應(yīng)基,其主成分基為SST的特征向量集合。特征值分解過(guò)程為
相似矩陣S中的列向量si近似計(jì)算為
式中:t為閾值。則相似塊組成的矩陣為
定義秩最小化問(wèn)題為
式中:μ為正標(biāo)量;Rank(?)為X的秩函數(shù)。其解為
式中:Y=UAVT為Y的SVD 分解過(guò)程,U和V分別為左奇異矩陣和右奇異矩陣;A為奇異值對(duì)角矩陣;為Frobenius 范數(shù);為一個(gè)對(duì)角矩陣,其對(duì)角值可通過(guò)硬閾值操作得到,即
式中,Akk為k行k列的對(duì)角值。則去噪后矩陣為
其解為
式中:Q為正交矩陣,滿足QTQ=I,I為單位矩陣。
通常,由于船舶航行非勻速以及AIS信號(hào)的非等間隔發(fā)送,導(dǎo)致船舶軌跡經(jīng)緯度非等間隔分布,無(wú)法針對(duì)非均勻分布的軌跡點(diǎn)進(jìn)行修復(fù)。本文將AIS 經(jīng)緯度數(shù)據(jù)轉(zhuǎn)化為1 個(gè)二維軌跡矩陣,,m1為軌跡數(shù)量,m2為每條軌跡的軌跡點(diǎn)數(shù)量。對(duì)于每條軌跡,設(shè)定固定經(jīng)度范圍到,以及等經(jīng)度間隔τ,將軌跡劃分為固定數(shù)量軌跡點(diǎn),其中每個(gè)軌跡點(diǎn)的經(jīng)度均為等間隔劃分的固定值,并將其對(duì)應(yīng)的緯度存入矩陣作為各軌跡點(diǎn)數(shù)據(jù)。假設(shè)xi為軌跡矩陣X的第i行數(shù)據(jù),為第i行的第j個(gè)緯度數(shù)據(jù),則。
由于大部分AIS 數(shù)據(jù)經(jīng)度并不與軌跡矩陣劃分的等間隔軌跡點(diǎn)的經(jīng)度對(duì)應(yīng),因此,被劃分的各軌跡點(diǎn)對(duì)應(yīng)的緯度數(shù)據(jù)存在缺失的情況。大量缺失值的存在對(duì)于軌跡重構(gòu)的最終結(jié)果具有重要影響,因此,在矩陣分解并進(jìn)行去噪前需要進(jìn)行預(yù)處理。為補(bǔ)全軌跡矩陣中的缺失值,采用線性插值的方法。假設(shè)Ar,k為軌跡矩陣中第r條軌跡k位置的緯度值,Br,k為Ar,k對(duì)應(yīng)的經(jīng)度值,Ω r為第r條軌跡各軌跡點(diǎn)緯度值集合,線性插值式為
線性插值可以根據(jù)插值點(diǎn)的臨近數(shù)據(jù)估計(jì)數(shù)值,本文希望在保持軌跡主要走向不變的基礎(chǔ)上,盡可能精確補(bǔ)全數(shù)據(jù),實(shí)現(xiàn)缺失值預(yù)修復(fù)。完成預(yù)修復(fù)之后,即可得到完整的軌跡矩陣。
為進(jìn)一步提升船舶軌跡重構(gòu)的精度,將構(gòu)建的軌跡矩陣使用2D-VMD 分解為多個(gè)IMF 分量。預(yù)修復(fù)和2D-VMD 分解過(guò)程在保證軌跡主要走向不變的前提下均會(huì)產(chǎn)生一定誤差,這些誤差可被認(rèn)為軌跡噪聲。同時(shí),原始軌跡中也包含部分噪聲數(shù)據(jù)。因此,基于矩陣的非局部自相似性,本文使用PLR 算法對(duì)各IMF 分量進(jìn)行矩陣去噪,最后,再對(duì)各分量的去噪結(jié)果求和,得到最終的去噪結(jié)果,在消除預(yù)修復(fù)與2D-VMD 分解過(guò)程帶來(lái)的誤差的同時(shí)消除軌跡原始噪聲,實(shí)現(xiàn)軌跡重構(gòu)。
本文提出的船舶軌跡重構(gòu)方法流程如圖1所示。
圖1 船舶軌跡重構(gòu)方法流程Fig.1 Process of vessel trajectory reconstruction method
算法基于秩最小化矩陣去噪的船舶軌跡重構(gòu)方法輸入:目標(biāo)水域AIS數(shù)據(jù)集S,IMF數(shù)量k,重疊塊大小d,相似塊選取范圍n,相似塊選取數(shù)量m輸出:重構(gòu)后的船舶軌跡集合F1(1)S 各條軌跡通過(guò)線性插值實(shí)現(xiàn)經(jīng)度對(duì)齊(2)各條軌跡的所屬軌跡點(diǎn)對(duì)應(yīng)的緯度值構(gòu)建軌跡矩陣X(3)通過(guò)2D-VMD算法分解軌跡矩陣X 為k 個(gè)IMF分量,得到SE=IMF1,IMF2,…,IMFk(4)or j in[1∶k](5)對(duì)IMFj 進(jìn)行PLR去噪,得到去噪結(jié)果矩陣Mj(6)End(7)F1 ←合并M1,M2,…,Mk
為校驗(yàn)本文提出的方法在實(shí)際水域中的軌跡重構(gòu)效果,選取長(zhǎng)江武漢段部分水域作為研究區(qū)域。該區(qū)域起止點(diǎn)經(jīng)緯度分別為(114.30000,30.57530),(114.63966,30.56490),分上行和下行3條航路。本文按上行和下行從AIS 中各選取1000條軌跡數(shù)據(jù),并設(shè)定經(jīng)度間隔τ為0.00034,將研究區(qū)域的每條軌跡劃分為1000 個(gè)軌跡點(diǎn),通過(guò)線性插值,構(gòu)建1000×1000 的軌跡矩陣。
本文實(shí)驗(yàn)分為真實(shí)實(shí)驗(yàn)和模擬實(shí)驗(yàn)。真實(shí)實(shí)驗(yàn)通過(guò)使用本文提出的方法對(duì)研究水域軌跡進(jìn)行重構(gòu),并與原始軌跡對(duì)比,驗(yàn)證重構(gòu)效果。模擬實(shí)驗(yàn)通過(guò)按上行和下行各選取1000 條噪聲較小、數(shù)據(jù)較完整的軌跡作為研究對(duì)象,按一定比例模擬缺失,分別使用本文提出的方法與其他幾種經(jīng)典軌跡重構(gòu)方法對(duì)研究軌跡進(jìn)行重構(gòu),并將結(jié)果進(jìn)行對(duì)比分析,比較各方法重構(gòu)效果的優(yōu)劣。
模擬缺失的情境分為隨機(jī)缺失和連續(xù)缺失,分別按10%~80%的缺失比例進(jìn)行模擬。設(shè)定2DVMD 分解得到IMF 數(shù)量k=2,PLR 算法d=7,n=35,m=5d2。使用平均絕對(duì)百分比誤差MAPE和均方根誤差RMSE作為結(jié)果評(píng)價(jià)指標(biāo)。
本文選取的對(duì)比軌跡重構(gòu)方法包括:
(1)高精度低秩張量補(bǔ)全(High-Accuracy Low-Rank Tensor Completion,HALRTC),通過(guò)最小化核范數(shù)實(shí)現(xiàn)補(bǔ)全。
(2)時(shí)間正則化矩陣分解(Temporal Regularized Matrix Factorization,TRMF),一種自回歸正則化時(shí)間矩陣分解方法。
(3)廣義高階正交迭代的張量分解與補(bǔ)全(Generalized Higher-Order Orthogonal Iteration for Tensor Decomposition and Completion,GHOI),一種可擴(kuò)展的核心張量Schatten 1范數(shù)最小化方法同時(shí)進(jìn)行張量分解和補(bǔ)全。
(4)基于核范數(shù)的低秩矩陣補(bǔ)全(Low-Rank Matrix Completion Based on Nuclear Norm,LRMC),可從矩陣的輸入采樣中恢復(fù)數(shù)據(jù)矩陣。
(5)基于離散余弦變換的張量核范數(shù)最小化(Tensor Nuclear Norm minimization with Discrete Cosine Transform,TNN-DCT),通過(guò)推導(dǎo)出新的張量管秩、張量譜范數(shù)和張量核范數(shù),求解凸規(guī)劃來(lái)完成張量補(bǔ)全。
使用Python 3.9.2 構(gòu)建模型,完成對(duì)研究水域的軌跡重構(gòu)。為驗(yàn)證本文方法在實(shí)際水域中的重構(gòu)效果,將重構(gòu)結(jié)果與原始軌跡對(duì)比,結(jié)果如圖2所示。
圖2 船舶軌跡重構(gòu)效果對(duì)比圖Fig.2 Comparisons of vessel trajectory reconstruction
由圖2可知,本文提出的方法基本修復(fù)了上行及下行原始軌跡中存在的缺失及噪聲點(diǎn),使軌跡重構(gòu)到正常航道。為了驗(yàn)證本方法的精度與穩(wěn)定性,上行及下行軌跡在10%~80%比例隨機(jī)缺失的情境下,本方法及其他5 種對(duì)比方法的MAPE 和RMSE評(píng)價(jià)指標(biāo)值如表1 和表2所示。根據(jù)表1 和表2 的各評(píng)價(jià)指標(biāo)值繪制的對(duì)比情況如圖3所示。為完成張量補(bǔ)全的對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)將從研究水域軌跡構(gòu)建的1000×1000 的軌跡矩陣按每50 條軌跡為1 組作為切片轉(zhuǎn)化為50×1000×20 的軌跡張量,在保證軌跡自相似性不被破壞的前提下,實(shí)現(xiàn)從軌跡矩陣到張量的轉(zhuǎn)化。
圖3 隨機(jī)缺失軌跡重構(gòu)效果對(duì)比Fig.3 Comparisons of trajectory reconstruction with random missing
表1 上行軌跡隨機(jī)缺失評(píng)價(jià)指標(biāo)(MAPE/RMSE)Table 1 Evaluation criteria in case of random missing in upward trajectory(MAPE/RMSE)
表2 下行軌跡隨機(jī)缺失評(píng)價(jià)指標(biāo)(MAPE/RMSE)Table 2 Evaluation criteria in case of random missing in downward trajectory(MAPE/RMSE)
本文方法在不同比例隨機(jī)缺失下的MAPE 及RMSE值均小于其他對(duì)比方法,且隨著缺失比例的提升,變化較小。
上行及下行軌跡在10%~80%比例連續(xù)缺失的情境下本方法及其他5 種對(duì)比方法的MAPE和RMSE 評(píng)價(jià)指標(biāo)值如表3 和表4所示。根據(jù)表3 和表4 的各評(píng)價(jià)指標(biāo)值繪制的對(duì)比情況如圖4所示。
圖4 連續(xù)缺失軌跡重構(gòu)效果對(duì)比Fig.4 Comparisons of trajectory reconstruction with continuous missing
表3 上行軌跡連續(xù)缺失評(píng)價(jià)指標(biāo)(MAPE/RMSE)Table 3 Evaluation criteria in case of continuous missing in upward trajectory(MAPE/RMSE)
表4 下行軌跡連續(xù)缺失評(píng)價(jià)指標(biāo)(MAPE/RMSE)Table 4 Evaluation criteria in case of continuous missing in downward trajectory(MAPE/RMSE)
本文方法在不同比例連續(xù)缺失下的MAPE 及RMSE值均小于其他對(duì)比方法,且隨著缺失比例的提升,變化較小。
綜上所述,本文方法重構(gòu)結(jié)果相較于其他船舶軌跡重構(gòu)方法具有更高的精度,更接近于真實(shí)值且在不同缺失比例下更加穩(wěn)定,在高缺失率下?lián)碛懈玫闹貥?gòu)效果。
針對(duì)AIS 數(shù)據(jù)在實(shí)際應(yīng)用中存在的錯(cuò)誤數(shù)據(jù)頻發(fā)、數(shù)據(jù)丟包等問(wèn)題,本文提出基于秩最小化矩陣去噪的船舶軌跡重構(gòu)方法,該方法可以利用軌跡的自相似性,對(duì)研究水域軌跡進(jìn)行統(tǒng)籌考慮。一方面能夠消除原始軌跡中存在的噪聲,同時(shí),能夠補(bǔ)全軌跡中的缺失值。該方法相較于傳統(tǒng)方法對(duì)于低質(zhì)量軌跡的重構(gòu)具有較強(qiáng)的魯棒性和更好的重構(gòu)效果。在上行和下行的軌跡中均能夠很好地去除噪聲,補(bǔ)全缺失,并且在不同缺失比例以及隨機(jī)缺失和連續(xù)缺失兩種情境下穩(wěn)定性更強(qiáng),尤其在高缺失率的軌跡重構(gòu)中表現(xiàn)出較強(qiáng)的魯棒性和穩(wěn)定性。重構(gòu)后的軌跡相比于真實(shí)軌跡偏差較小,且軌跡位置固定在航道內(nèi),符合研究水域航道走向。