王楚揚(yáng),王長永,陳尚登,楊振林,顏惠慶
(中交上海航道勘察設(shè)計(jì)研究院有限公司,上海 200120)
海圖是商船從事海上航行的必備資料,其中海圖水深的準(zhǔn)確程度、更新周期,覆蓋區(qū)域等對航海作業(yè)的安全具有重要影響[1]。目前,全球僅有約 15 %的海洋有較為準(zhǔn)確的水深數(shù)據(jù),且公開發(fā)布的海圖約40~50 %的水深資料來源于1950 年以前,海圖水深覆蓋面及更新時(shí)效性遠(yuǎn)不能滿足各類商船航行的安全需求。而客船、貨船等商船每天產(chǎn)生大量的航海數(shù)據(jù)(包括定位及水深數(shù)據(jù)等),若能對這些數(shù)據(jù)加以合理利用,對于海圖傳統(tǒng)的專業(yè)測量數(shù)據(jù)將是極大的補(bǔ)充。
由于商船測深數(shù)據(jù)的采集、處理過程缺少專業(yè)人員的指導(dǎo),且通常未嚴(yán)格執(zhí)行相關(guān)的行業(yè)規(guī)范和標(biāo)準(zhǔn),測量數(shù)據(jù)的質(zhì)量遠(yuǎn)不如專業(yè)測量數(shù)據(jù),需要分析和改正水深數(shù)據(jù)中包含的各種誤差項(xiàng),提高數(shù)據(jù)精度以滿足使用要求。如袁浩等[2]定量分析了風(fēng)浪對商船測深數(shù)據(jù)精度的影響程度,國際海道測量組織數(shù)字測深數(shù)據(jù)中心、英國TeamSurv 等采用不同的潮位改正軟件進(jìn)行潮位改正[3]。在航道或航路等公共水域每天通航的船舶艘次眾多,單個位置或區(qū)域的測深數(shù)據(jù)有多個,由于每艘船舶改正后的測深數(shù)據(jù)精度也參差不齊,如何由眾多測深數(shù)據(jù)得到盡量接近真實(shí)水深的數(shù)據(jù)顯得更為重要,但目前相關(guān)研究還較為少見。
本文提出了一套基于可信度理論的商船測深數(shù)據(jù)質(zhì)量評價(jià)體系,通過商船自身測深設(shè)備等固有屬性、商船測深數(shù)據(jù)自身對比、商船測深數(shù)據(jù)與測量精度較高的專業(yè)測深數(shù)據(jù)對比等多個方面,綜合評價(jià)商船測深數(shù)據(jù)的可信度,為商船水深利用提供一種新方法。
“可信度”概念源自自發(fā)地理信息[4-6],是一種表示準(zhǔn)確性、權(quán)威性、可依賴性等概念的綜合體,是依據(jù)一定經(jīng)驗(yàn)對人或物的相信程度。信息可信度由信息自身數(shù)據(jù)特征的可信度和信息來源的可信度構(gòu)成[7]。在沒有任何參考數(shù)據(jù)的情況下,很難通過商船測深數(shù)據(jù)本身獲取數(shù)據(jù)質(zhì)量的定量評價(jià)。
對于商船測深而言,如果用戶對測深數(shù)據(jù)的質(zhì)量有充分的了解,那么該數(shù)據(jù)就是“可用的”。根據(jù)標(biāo)準(zhǔn),一個領(lǐng)域的最佳可用數(shù)據(jù)可能不是最好的質(zhì)量數(shù)據(jù),但只要這些數(shù)據(jù)的質(zhì)量是量化的或合格的,它就提供了最好的可用數(shù)據(jù)??尚哦仁且环N評價(jià)數(shù)據(jù)質(zhì)量高低的概率,故可信度和數(shù)據(jù)質(zhì)量是兩種不同的概念:可信度高的數(shù)據(jù),其質(zhì)量并不一定高,而是具有高質(zhì)量的概率更高[8-10]。
商船測深數(shù)據(jù)可信度具有以下基本特征:
1)穩(wěn)定性。根據(jù)IHO B-12 指南給出的27 種元數(shù)據(jù)可以看出,每個元數(shù)據(jù)都是商船自身的一種固有屬性,除非參與商船測深的船舶發(fā)生明顯的事故或者經(jīng)過改裝,則各項(xiàng)元數(shù)據(jù)保持不變,具有一定的時(shí)域穩(wěn)定性;
2)概率性。商船測深數(shù)據(jù)的可信度是一種數(shù)據(jù)質(zhì)量的概率,可信度越高,數(shù)據(jù)質(zhì)量高的概率越大;
3)唯一性。與自發(fā)地理信息平臺(VGI)的 可信度特征不同的是,后者是指針對一定區(qū)域內(nèi)的數(shù)據(jù)可信度,不是指單個目標(biāo)的可信度。而對于商船測深來說,是針對某一艘商業(yè)船舶進(jìn)行的可信度評價(jià),具有唯一的特性。
由于商船測深數(shù)據(jù)的可信度與數(shù)據(jù)質(zhì)量密切相關(guān),因此和數(shù)據(jù)質(zhì)量相關(guān)的因素都會影響測深數(shù)據(jù)的可信度。參與商船測深的用戶數(shù)量以及數(shù)據(jù)上傳的專業(yè)程度會影響可信度。
在計(jì)算機(jī)領(lǐng)域中,Linus Law 提出了“多眼原則”,即參與創(chuàng)建功能的用戶數(shù)量越多,可信度越高。對于商船測深來說,參與上傳數(shù)據(jù)的可用船舶(用戶)越多,可信度評價(jià)數(shù)據(jù)越多,最終可用于測深數(shù)據(jù)的修改、完善以及優(yōu)化的機(jī)會就越多,數(shù)據(jù)質(zhì)量就會隨之提高。
另外,商船測深的數(shù)據(jù)質(zhì)量還和數(shù)據(jù)的直接上傳者相關(guān)。經(jīng)驗(yàn)豐富的專業(yè)人員可將各項(xiàng)元數(shù)據(jù)信息準(zhǔn)確的上傳,用于最終的可信度評價(jià)和處理的數(shù)據(jù)源。若元數(shù)據(jù)不準(zhǔn)確,將在很大程度上影響后續(xù)的可信度評價(jià)。
商船測深的水深數(shù)據(jù)來源廣泛,數(shù)據(jù)量大,數(shù)據(jù)質(zhì)量參差不齊。為了節(jié)約系統(tǒng)資源,提高后期數(shù)據(jù)處理效率,與數(shù)據(jù)集相關(guān)的元數(shù)據(jù)提供了與數(shù)據(jù)收集方式相關(guān)的有價(jià)值的信息,有助于對數(shù)據(jù)質(zhì)量進(jìn)行適當(dāng)?shù)奶幚怼⒏椭樵u估,所以在進(jìn)入后期數(shù)據(jù)處理之前,需先進(jìn)行必要的數(shù)據(jù)預(yù)處理,對數(shù)據(jù)集信息的可信度分級與評價(jià)是一項(xiàng)重要工作。這也凸顯了商船測深數(shù)據(jù)貢獻(xiàn)者提供盡可能多的數(shù)據(jù)集信息的重要性??尚哦柔槍Φ氖敲恳凰疑檀捌渌杉乃顢?shù)據(jù),即每艘目標(biāo)商船及其數(shù)據(jù)在數(shù)據(jù)庫中對應(yīng)一個數(shù)據(jù)可信度評價(jià)的標(biāo)簽。每次搜集數(shù)據(jù)時(shí),當(dāng)前數(shù)據(jù)集的可信度標(biāo)簽與該商船的可信度標(biāo)簽一致,且不再改變,而該商船自身的可信度評價(jià)可能會隨著每次提交數(shù)據(jù)的過程而動態(tài)變化。理論來說,在數(shù)據(jù)穩(wěn)定提交一段時(shí)間后可信度評價(jià)也隨之穩(wěn)定,除非遇到諸如硬件變化、設(shè)備改裝等可能影響數(shù)據(jù)質(zhì)量的事件,此時(shí)則需要在數(shù)據(jù)庫中及時(shí)更新相關(guān)信息,該商船及其以后采集的水深數(shù)據(jù)的可信度評價(jià)也應(yīng)重新評估。測深可信度評價(jià)的目的主要是在后續(xù)數(shù)據(jù)成果生成時(shí),若需對商船水深數(shù)據(jù)進(jìn)行取舍或過濾,則可以根據(jù)不同商船的可信度分別定權(quán),或直接設(shè)定可信度閾值,降低或消除可信度低的水深數(shù)據(jù)對最終成果的影響。
每艘目標(biāo)商船在接入數(shù)據(jù)采集網(wǎng)絡(luò)之前均需經(jīng)過相關(guān)技術(shù)人員的調(diào)查,主要目標(biāo)是確定船只硬件情況(如船只類型、尺寸等)、主要測深設(shè)備性能(如測深儀定位儀型號、標(biāo)稱精度等)和設(shè)備安裝情況(如測深儀定位儀偏心、吃水、默認(rèn)聲速等),這些數(shù)據(jù)通常統(tǒng)稱為“元數(shù)據(jù)”。元數(shù)據(jù)是一種商船自身的固有屬性,即描述數(shù)據(jù)的數(shù)據(jù)。在2020 版IHO《眾包測深指南》給出的元數(shù)據(jù)中,本文結(jié)合商船測深的現(xiàn)實(shí)應(yīng)用場景,提出可以作為可信度評價(jià)依據(jù)的元數(shù)據(jù)及對應(yīng)的評價(jià)規(guī)則,如表1 所示。
表1 可作為可信度評價(jià)依據(jù)的元數(shù)據(jù)Tab.1 Metadata that can be used as a basis for credibility evaluation
表1 中,5 個客觀維度與商船屬性相關(guān),且除非商船經(jīng)過改裝,否則這些元數(shù)據(jù)保持不變;3 個主觀維度則依賴技術(shù)人員根據(jù)商船情況進(jìn)行主觀評價(jià)。其中,“技術(shù)人員評論”為負(fù)責(zé)某艘商船設(shè)備維護(hù)和數(shù)據(jù)收集等工作的技術(shù)人員對該商船某一批次數(shù)據(jù)的質(zhì)量及可靠性進(jìn)行整體的評價(jià),評價(jià)需考慮該批次數(shù)據(jù)記錄期間發(fā)生的可能影響數(shù)據(jù)質(zhì)量的各類事件,如風(fēng)浪大小、意外事故等。
將各個維度的評價(jià)值進(jìn)行分別評價(jià)后,需匯總為一個總的元數(shù)據(jù)可信度T。可將表1 中所列各個維度分別按相應(yīng)規(guī)則進(jìn)行評分。對于三個主觀維度來說,理論上其評價(jià)得分會隨不同技術(shù)人員的主觀因素產(chǎn)生一定的波動,從而導(dǎo)致數(shù)據(jù)離散程度相較于客觀維度較大。根據(jù)熵權(quán)法理論,數(shù)據(jù)越分散,計(jì)算熵值越小,數(shù)據(jù)中的信息越不可靠。因此,采用經(jīng)驗(yàn)權(quán)數(shù)的方法,人為降低主觀維度的權(quán)重,并認(rèn)為同類維度的各項(xiàng)元數(shù)據(jù)可信度等權(quán),最終得到匯總后的船只元數(shù)據(jù)可信度T元,如下式所列:
將商船數(shù)據(jù)收集后進(jìn)行進(jìn)一步處理之前,先將該商船與上述可信度評價(jià)相關(guān)的元數(shù)據(jù)進(jìn)行匯總評價(jià),得到該商船的元數(shù)據(jù)可信度。將計(jì)算得到的可信度與平臺設(shè)定的硬件可信度閾值對比,若低于該閾值,則數(shù)據(jù)直接舍棄,避免浪費(fèi)計(jì)算資源;若高于該閾值,則進(jìn)行下一步工作。
商船測深的自一致性可信度評價(jià)方法,是在有多余的測深數(shù)據(jù)可用的情況下進(jìn)行的,通常是利用比較彼此交叉的測深數(shù)據(jù)來完成。這也是在專業(yè)水深測量布設(shè)測線時(shí),必須同時(shí)布設(shè)一定數(shù)量的檢查線,這一措施作為數(shù)據(jù)處理階段精度評定的方法之一,在專業(yè)水深測量時(shí)極為重要。精度評定時(shí),需統(tǒng)計(jì)主測線與檢查線相交處一定范圍內(nèi)的重合點(diǎn)水深值,將兩者水深值進(jìn)行比對,若兩者之間差值超限的點(diǎn)數(shù)超過一定比例,則需要進(jìn)行重新測 量。商船測深中無法事先規(guī)劃測線。但一般來說,大部分商船如遠(yuǎn)洋貨輪或近海漁船等,在服役期間都有較為固定的航線,或者有較為固定的停泊港口,因此有較大的可能性存在航線交叉的情況。某一艘商船在同一次出航或不同次出航時(shí)存在測深點(diǎn)重合時(shí),即可參照上述專業(yè)水深測量時(shí)的精度評定方法,對重合點(diǎn)水深進(jìn)行統(tǒng)計(jì)比對,分析該商船測深的內(nèi)符合精度。該方法計(jì)算得到的內(nèi)符合精度可以在一定程度上衡量商船測深的軟硬件精度水平和測量穩(wěn)定性,因此可以將內(nèi)符合精度水平作為商船測深可信度評價(jià)的一個指標(biāo),即基于重復(fù)測量的商船測深可信度評價(jià)。
具體實(shí)施時(shí)有幾個問題需要考慮,其一是水深重合點(diǎn)的定義。根據(jù)《水運(yùn)工程測量規(guī)范》規(guī)定,水深重合點(diǎn)的定義與水深測量比例尺相關(guān),即為圖上1 mm 范圍內(nèi)的水深點(diǎn)。然而這一規(guī)定難以直接應(yīng)用于商船測深的水深重合點(diǎn)定義中,因?yàn)樯檀瑴y深無法確定成果比例尺。理論上來說,水深重合點(diǎn)定義距離越小,水深比對越能真實(shí)反映出測量設(shè)備的誤差,減少了實(shí)際地形帶來的影響。但由于商船測深數(shù)據(jù)記錄的形式多為定時(shí)記錄,即每隔固定幾秒記錄一個水深值,得到的水深軌跡線上測點(diǎn)間距受船速影響可能較稀,若測線存在交叉則可能最近的交叉點(diǎn)距離也較遠(yuǎn)。因此重合點(diǎn)距離的定義可以在可信度評價(jià)時(shí)根據(jù)大多數(shù)商船的平均船速和數(shù)據(jù)記錄的采樣間隔綜合考慮選定。需要注意的是,水深重合點(diǎn)與可信度評價(jià)相關(guān),為了使可信度評價(jià)的標(biāo)準(zhǔn)統(tǒng)一,水深重合點(diǎn)的定義也應(yīng)統(tǒng)一。
另外一個需要考慮的問題是歷史數(shù)據(jù)的時(shí)效性??紤]到真實(shí)水下地形隨著時(shí)間的推移也會發(fā)生變化,因此商船水深重合點(diǎn)比對應(yīng)自動忽略超過一定時(shí)間間隔之前的數(shù)據(jù),如3 個月或6 個月。另外如果在該時(shí)間間隔之內(nèi)了解到重合點(diǎn)區(qū)域內(nèi)有施工活動等可能影響水下地形情況的,應(yīng)在比對前掌握并記錄,避免降低可信度評價(jià)的參考意義。
有研究人員認(rèn)為,權(quán)威數(shù)據(jù)可以作為可信度評價(jià)的指標(biāo)之一。且在以上可信度指標(biāo)中,權(quán)威數(shù)據(jù)是更重要的一個。對于水深測量而言,近期航道測量數(shù)據(jù)通常可以作為來源可靠、準(zhǔn)確度高的權(quán)威數(shù)據(jù)。這些水深測量數(shù)據(jù)均通過專業(yè)設(shè)備采集,經(jīng)過各項(xiàng)精確的改正措施,水深精度滿足現(xiàn)行測量規(guī)范要求。當(dāng)商船航行經(jīng)過該區(qū)域時(shí),可以這些專業(yè)水深數(shù)據(jù)作為標(biāo)準(zhǔn),將商船水深數(shù)據(jù)與該區(qū)域內(nèi)的專業(yè)水深數(shù)據(jù)進(jìn)行比對,即可分析得到各艘商船測深數(shù)據(jù)的外符合精度水平,將其作為評價(jià)商船可信度的另一個指標(biāo),即基于權(quán)威數(shù)據(jù)的商船測深可信度評價(jià)。在實(shí)際情況下,由于部分專業(yè)測量數(shù)據(jù)為定期監(jiān)測,因此比對時(shí)應(yīng)盡量選擇測量時(shí)間相近的專業(yè)數(shù)據(jù)作為權(quán)威數(shù)據(jù)。另外同樣需要注意可能的施工活動帶來的影響。與重復(fù)測量數(shù)據(jù)一樣,一些商船同樣可能長期未航行到有權(quán)威水深數(shù)據(jù)覆蓋的區(qū)域內(nèi),此時(shí)也采取同上節(jié)重復(fù)測量可信度評價(jià)一樣的方法,即將該商船的權(quán)威數(shù)據(jù)可信度值設(shè)為空值,后續(xù)使用時(shí)再將其設(shè)為所有商船的平均值參與計(jì)算。
經(jīng)過以上3 方面的可信度評價(jià),每艘商船及其提供的測深數(shù)據(jù)都有對應(yīng)的可信度標(biāo)簽,但同時(shí)存在3 個可信度標(biāo)簽不利于后續(xù)使用,需要將3 方面的可信度合并為一個總體可信度指標(biāo)。考慮到上述3 個可信度指標(biāo)可能對總體指標(biāo)的影響大小,可采用加權(quán)平均法計(jì)算總體可信度,根據(jù)經(jīng)驗(yàn)權(quán)系數(shù)給出3 個可信度指標(biāo)對總體可信度的影響權(quán)重,分別為0.3、0.3、0.4。則總體可信度計(jì)算公式如下:
可信度作為測深數(shù)據(jù)的隱含屬性,可以在數(shù)據(jù)利用階段起到作用。一般來說,商船測深數(shù)據(jù)利用的最終成果是數(shù)據(jù)覆蓋區(qū)域的水深格網(wǎng)圖,每個網(wǎng)格點(diǎn)根據(jù)處理后的商船水深建模得到水深值。當(dāng)同一個網(wǎng)格點(diǎn)有多艘商船的水深覆蓋時(shí),便涉及到數(shù)據(jù)取舍或融合的問題。此時(shí),假設(shè)A 船在該點(diǎn)的水深為hA,B 船的水深為hB,兩船數(shù)據(jù)的可信度分別為TA和TB,則該點(diǎn)的水深值h可依下式計(jì)算。多艘商船數(shù)據(jù)計(jì)算方法相同。
綜上,商船測深可信度分級及應(yīng)用技術(shù)路線如圖1 所示。
圖1 商船測深可信度分級應(yīng)用示意圖Fig.1 Schematic diagram of the application of bathymetric confidence classification for merchant ships
商船測深模式的出現(xiàn),對水深測量領(lǐng)域的發(fā)展具有重大意義。在采集商船測深數(shù)據(jù)后,如何針對不同測深精度的數(shù)據(jù)源進(jìn)行有效的數(shù)據(jù)預(yù)處理,也是最終獲得較為準(zhǔn)確的水深數(shù)據(jù)的關(guān)鍵。本文從三個方面進(jìn)行了可信度評價(jià)問題的研究:首先給出了8 種可利用的可信度分級評價(jià)元數(shù)據(jù),研究了基于固有屬性的可信度評價(jià)模型;其次提出可利用重復(fù)的水深數(shù)據(jù)進(jìn)行自一致性的可信度評價(jià)的研究;然后將商船測深數(shù)據(jù)與權(quán)威的水深測量數(shù)據(jù)進(jìn)行比對后得出的外符合精度作為一項(xiàng)評價(jià)指標(biāo),進(jìn)行對等一致性的可信度評價(jià)。最終將這三種可信度評價(jià)指標(biāo)進(jìn)行加權(quán)平均,獲得商船測深的最終水深數(shù)據(jù)值。通過可信度評價(jià),降低不可靠船舶在數(shù)據(jù)處理中所占比重,從而在源頭上改善數(shù)據(jù)質(zhì)量,減少惡意數(shù)據(jù)對最終測深結(jié)果的影響。