陳 朋,昝 昊,趙冬冬*,郭新新
(1.浙江工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,浙江 杭州 310000;2.浙江工業(yè)大學(xué)信息工程學(xué)院,浙江 杭州 310000;3.中國(guó)科學(xué)院深??茖W(xué)與工程研究所,海南 三亞 572000)
側(cè)掃聲吶有著探測(cè)范圍大、成圖分辨率高、經(jīng)濟(jì)實(shí)惠、操作簡(jiǎn)便等優(yōu)點(diǎn),在海洋研究、海洋定位[1]、海下科考、海底測(cè)繪[2]等諸多領(lǐng)域被廣泛應(yīng)用。 拖曳式側(cè)掃聲吶在工作時(shí),由一艘船拖曳著托魚(yú),托魚(yú)左右兩側(cè)的換能器向垂直于前進(jìn)方向發(fā)出聲波,掃描的海域呈狹長(zhǎng)的扇形,聲波到達(dá)海底被反射后,換能器按照時(shí)間先后接收經(jīng)過(guò)海底反射的回波,形成一幀的回波數(shù)據(jù),回波數(shù)據(jù)按照時(shí)間推移,沿著垂直于掃描方向拼接進(jìn)而形成側(cè)掃聲吶瀑布圖[3],如圖1(a)所示。
圖1 側(cè)掃聲吶工作原理
側(cè)掃聲吶主要是為了獲取海底的地形地貌,側(cè)掃聲吶圖像的質(zhì)量對(duì)于海洋研究至關(guān)重要,然而根據(jù)側(cè)掃聲吶的成像原理,在聲波到達(dá)海底前,由于在水中的傳播延遲,會(huì)在側(cè)掃聲吶瀑布圖中間形成一塊水柱區(qū);在到達(dá)海底后,反射回來(lái)的回波隨時(shí)間序列形成圖像區(qū)。 其中分割水柱區(qū)和圖像區(qū)的分界線即為海底線,海底線位置同時(shí)也表征了聲吶距離海底的高度,如圖1(b)所示。 斜距校正[4]就是利用海底線的位置,去除側(cè)掃聲吶圖像的水柱區(qū),在橫向上得到連續(xù)的聲吶圖像。 海底線檢測(cè)的精度,是斜距校正的關(guān)鍵。 雖然深度傳感器會(huì)記錄托魚(yú)到海底的距離,但是在實(shí)際應(yīng)用中,托魚(yú)的姿態(tài)會(huì)影響到深度傳感器的測(cè)量精度,導(dǎo)致記錄數(shù)據(jù)并不精確,從而影響斜距校正的效果。
國(guó)際著名的SSS 圖像處理軟件Triton 和Discovery主要采用了需要手動(dòng)調(diào)整的閾值控制法[5],在測(cè)量復(fù)雜環(huán)境時(shí),需要分段手動(dòng)調(diào)整閾值,效率低下且精度不高。 張濟(jì)博等[6]提出了LOG 算子,提取圖像邊緣來(lái)獲取海底線,在水柱區(qū)噪聲或者水體中懸浮物較少的時(shí)候很好地完成了海底線的檢測(cè),當(dāng)水柱區(qū)干擾較大時(shí),該方法無(wú)法正確提取邊緣。 趙建虎等[7]提出了海底線綜合檢測(cè)和提取方法,該方法基于最后峰值法、對(duì)稱原則和海底連續(xù)變化原則在水柱區(qū)噪聲較大時(shí)對(duì)海底線進(jìn)行精準(zhǔn)提取,但是其檢測(cè)方法需設(shè)置灰度差變化閾值,需借助人工調(diào)參,并不能實(shí)時(shí)地提取海底線。 Ruiz 等[8]提出了基于卡爾曼濾波器的方法來(lái)提取海底線,其復(fù)雜的后處理操作十分耗時(shí),導(dǎo)致無(wú)法實(shí)時(shí)提取海底線。 Shih等[9]提出了一種基于Canny 邊緣檢測(cè)方法的自適應(yīng)海底跟蹤算法,根據(jù)水柱區(qū)干擾程度不同,單張圖片處理時(shí)間約在0.2 s~1.2 s 范圍內(nèi),其實(shí)時(shí)性能差。
深度學(xué)習(xí)算法已經(jīng)被廣泛應(yīng)用于圖像領(lǐng)域,在目標(biāo)檢測(cè)、目標(biāo)識(shí)別[10]、圖像分割和圖像去噪等領(lǐng)域都取得很好的效果。 Yan 等[11]提出了1D-CNN網(wǎng)絡(luò)用于提取海底線,該方法使用1D-CNN 網(wǎng)絡(luò)對(duì)海底線區(qū)域和其他區(qū)域進(jìn)行分類,用訓(xùn)練好的網(wǎng)絡(luò)模型對(duì)單幀(Ping)側(cè)掃聲吶回波數(shù)據(jù)采用滑動(dòng)窗口遍歷,提取輸出概率最大的位置為海底線,該方法取得很好的提取精度,大部分Ping 的提取時(shí)間在150 ms左右,部分Ping 的提取時(shí)間較長(zhǎng),實(shí)時(shí)性能較差。 Yan 等[12]為解決1D-CNN 海底線提取算法實(shí)時(shí)性差的問(wèn)題,進(jìn)一步提出了1D-UNet 網(wǎng)絡(luò)對(duì)海底線位置進(jìn)行分割,該方法對(duì)原始側(cè)掃聲吶回波數(shù)據(jù)預(yù)處理后送入1D-UNet 網(wǎng)絡(luò),并借助1D-UNet 網(wǎng)絡(luò)對(duì)每個(gè)位置進(jìn)行預(yù)測(cè),其中輸出概率最大值對(duì)應(yīng)的位置就是網(wǎng)絡(luò)給出的海底線位置。 該方法不需要滑動(dòng)窗口操作去遍歷整個(gè)數(shù)據(jù),在實(shí)時(shí)性上顯著優(yōu)于1D-CNN 方法,但該方法魯棒性較差,在回波信號(hào)信噪比較差時(shí)無(wú)法正確提取海底線。 Qin 等[13]結(jié)合殘差塊和1D-UNet 網(wǎng)絡(luò),將1D-UNet 網(wǎng)絡(luò)中的雙卷積操作替換為ResNet 中的瓶頸塊,該方法加深了網(wǎng)絡(luò)結(jié)構(gòu),提高了海底線的檢測(cè)精度,但實(shí)時(shí)性相對(duì)較差。
綜上所述,當(dāng)側(cè)掃聲吶回波信號(hào)信噪比差時(shí),現(xiàn)有的神經(jīng)網(wǎng)絡(luò)方法和傳統(tǒng)方法不能實(shí)時(shí)正確提取海底線。 本文提出了一種基于海底信息對(duì)稱模塊和多尺度特征融合模塊的快速分割卷積神經(jīng)網(wǎng)絡(luò)(Bottom Information Symmetry Module and Multi-scale Feature Fusion Module Fast-SCNN,BMM-Fast-SCNN)用于實(shí)時(shí)正確提取海底線。 該方法在Fast-SCNN-1D 基礎(chǔ)上,采用多尺度特征融合提取海底線細(xì)小特征,并結(jié)合海底信息對(duì)稱模塊增強(qiáng)網(wǎng)絡(luò)提取海底線的魯棒性。 最終在側(cè)掃聲吶數(shù)據(jù)集上表現(xiàn)良好的提取精度和實(shí)時(shí)性能。
理想條件下,水柱區(qū)第一個(gè)強(qiáng)回波是聲波第一次到達(dá)海底時(shí)的回波,如圖2(a)所示,方框處即為海底線位置,該方框往左為水柱區(qū),往右為圖像區(qū)。在水柱區(qū)沒(méi)有噪聲干擾,回波信號(hào)到達(dá)圖像區(qū)回波強(qiáng)度突然上升,其強(qiáng)度數(shù)倍于水柱區(qū),這種條件下海底線位置容易提取;然而在實(shí)際采樣過(guò)程中,諸多因素的影響,為海底線的提取帶來(lái)困難。 如圖2(b)所示,影響海底線提取的因素包括:
圖2 側(cè)掃聲吶回波信號(hào)
①聲吶自噪聲:在側(cè)掃聲吶工作時(shí),換能器會(huì)最先記錄來(lái)自聲吶的自噪聲,在水柱區(qū)形成強(qiáng)回波。
②懸浮物:實(shí)際作業(yè)時(shí),水體中會(huì)伴隨大量的懸浮物和一些水中生物,換能器發(fā)射出的聲波在到達(dá)海底前,遇到懸浮物會(huì)反射較強(qiáng)的回波,當(dāng)水柱區(qū)被大量懸浮物覆蓋時(shí),將會(huì)影響海底線的檢測(cè)。
③海底目標(biāo):在聲波到達(dá)圖像區(qū)以后,遇到海底目標(biāo)時(shí)反射的回波強(qiáng)度數(shù)倍于海底線處的強(qiáng)度,會(huì)削弱海底線處的特征,影響海底線的檢測(cè)。
針對(duì)上述海底線提取中的干擾問(wèn)題,本文提出了基于BMM-Fast-SCNN 的海底線實(shí)時(shí)提取算法,圖3給出了本文的算法框架,該算法主要分為三個(gè)部分:①數(shù)據(jù)預(yù)處理部分,包括原始側(cè)掃聲吶數(shù)據(jù)的解析、一維采樣序列的生成以及標(biāo)注序列的獲取。②利用BMM-Fast-SCNN 分割網(wǎng)絡(luò)預(yù)測(cè)側(cè)掃聲吶一維采樣序列海底線的分割結(jié)果部分。 ③海底線提取精度計(jì)算部分,包括遍歷分割序列、提取分割位置和計(jì)算分割精度。
圖3 算法總體流程
本文的原始側(cè)掃聲吶數(shù)據(jù)是以XTF(Extended Triton Format)格式記錄在文件中[14],本文按照其協(xié)議編寫了解析軟件并得到側(cè)掃聲吶回波數(shù)據(jù)。 由于整個(gè)Ping 數(shù)據(jù)很長(zhǎng),為了方便網(wǎng)絡(luò)訓(xùn)練,輸入尺寸需降采樣成1 024 的倍數(shù),同時(shí)回波數(shù)據(jù)需進(jìn)行歸一化處理。 其計(jì)算公式如式(1)所示:
式中:Bmax代表當(dāng)前回波強(qiáng)度最大值,Bmin代表當(dāng)前回波強(qiáng)度最小值,B代表當(dāng)前采樣點(diǎn)的回波強(qiáng)度,BN代表歸一化后的強(qiáng)度值。
經(jīng)過(guò)降采樣、歸一化處理后得到一維采樣序列,同時(shí)采用人工監(jiān)督的方法,標(biāo)記海底線位置,最終生成一維標(biāo)注序列,如圖4 所示。
圖4 側(cè)掃聲吶數(shù)據(jù)預(yù)處理
語(yǔ)義分割網(wǎng)絡(luò)在圖像分割領(lǐng)域取得很好的效果,其中輕量級(jí)的語(yǔ)義分割網(wǎng)絡(luò)Fast-SCNN 具有優(yōu)異的實(shí)時(shí)性和較好的分割精度。 文獻(xiàn)[15]提出的Fast-SCNN 網(wǎng)絡(luò)模型是結(jié)合了當(dāng)前語(yǔ)義分割領(lǐng)域多分支結(jié)構(gòu)[16]和編碼-解碼結(jié)構(gòu)[17]的網(wǎng)絡(luò),其一維模型如圖5 所示。 其主要結(jié)構(gòu)如下:在學(xué)習(xí)下采樣部分(Learning to Down-sample),采用標(biāo)準(zhǔn)卷積和兩次深度可分離卷積(Depthwise Separable Convolution,DSConv)對(duì)輸入序列進(jìn)行下采樣,分別得到1/2、1/4、1/8 尺寸的特征圖;全局特征提取部分(Global Feature Extrator),在深層特征的分支上經(jīng)過(guò)瓶頸塊(Bottleneck Block)和金字塔池化模塊[18](Pyramid Pooling Module,PPM),學(xué)習(xí)到深層特征信息,淺層特征分支的特征圖直接送入特征融合部分;在特征融合部分(Feature Fusion),將深層特征分支的特征圖經(jīng)過(guò)上采樣、深度卷積(Depthwise Convolution,DWConv)和標(biāo)準(zhǔn)卷積后的特征和淺層特征分支經(jīng)過(guò)標(biāo)準(zhǔn)卷積后的特征進(jìn)行融合;最后,在分類器部分(Classifier),采用兩次深度可分離卷和一次卷積操作提高模型的準(zhǔn)確率,并上采樣恢復(fù)到輸入序列尺寸,最終經(jīng)過(guò)Softmax 層最終獲得分割結(jié)果。
圖5 Fast-SCNN-1D 網(wǎng)絡(luò)結(jié)構(gòu)
Fast-SCNN-1D 具備優(yōu)異的實(shí)時(shí)性,但其追求實(shí)時(shí)性的同時(shí)不可避免地?fù)p失了一些精度,F(xiàn)ast-SCNN-1D 中多次卷積下采樣和金字塔池化操作獲得的特征缺失了海底線的細(xì)小特征,并不滿足海底線提取的精度要求,同時(shí),在一維采樣序列一側(cè)的海底線特征被噪聲淹沒(méi)時(shí),F(xiàn)ast-SCNN-1D 不能正確提取海底線位置。 針對(duì)這些不足,本文提出了BMMFast-SCNN 網(wǎng)絡(luò)模型。 該網(wǎng)絡(luò)的改進(jìn)如下:
①在金字塔池化后,為了減少四倍上采樣帶來(lái)的誤差,深層特征經(jīng)過(guò)兩倍上采樣后再和淺層特征進(jìn)行特征融合。
②在特征融合階段,采用多尺度的特征融合,減少網(wǎng)絡(luò)對(duì)淺層特征的丟失。
③在網(wǎng)絡(luò)輸入階段,設(shè)計(jì)了海底信息對(duì)稱模塊,解決在單側(cè)噪聲較大時(shí),海底線無(wú)法正確提取的問(wèn)題。 下文將對(duì)圖6 所示的BMM-Fast-SCNN 網(wǎng)絡(luò)進(jìn)行詳細(xì)介紹。
圖6 BMM-Fast-SCNN 網(wǎng)絡(luò)結(jié)構(gòu)
2.3.1 海底信息對(duì)稱模塊(BISM)
如圖7 所示,當(dāng)海底線一側(cè)的水柱區(qū)被噪聲充滿或者水體中的懸浮物帶來(lái)噪聲距離海底線位置很近時(shí),這種情況下海底線特征被水柱區(qū)的噪聲給淹沒(méi)。在人工判斷時(shí),且需要參考另一側(cè)的海底線位置信息來(lái)提取海底線,然而現(xiàn)有的語(yǔ)義分割網(wǎng)絡(luò)在缺少先驗(yàn)知識(shí)基礎(chǔ)上不能正確地識(shí)別海底線位置。
圖7 懸浮物噪聲示意圖
為了解決上述問(wèn)題,借助海底線位置左右對(duì)稱的先驗(yàn)知識(shí),本文提出了海底信息對(duì)稱模塊(BISM)來(lái)提高分割網(wǎng)絡(luò)的魯棒性。
如圖8 所示,首先對(duì)輸入的一維采樣序列進(jìn)行左右翻轉(zhuǎn),得到翻轉(zhuǎn)后的一維序列,然后對(duì)已有的兩條序列進(jìn)行求和取平均,最終將三條回波信號(hào)序列進(jìn)行拼接,向分割網(wǎng)絡(luò)輸入三通道的回波信號(hào)數(shù)據(jù)。
圖8 BISM 結(jié)構(gòu)圖
由卷積神經(jīng)網(wǎng)絡(luò)[19]的計(jì)算原理可知,通過(guò)卷積核可以將不同輸入通道的信息提取成相應(yīng)的特征信息。 在BISM 中,左右翻轉(zhuǎn)后的通道及第一通道為神經(jīng)網(wǎng)絡(luò)帶來(lái)海底線的對(duì)稱信息;由于僅在水柱區(qū)的一側(cè)出現(xiàn)大量噪聲,通過(guò)求和取均值后的通道在水柱區(qū)的噪聲得到削弱,且兩側(cè)圖片區(qū)的取值變化較小,該通道在兩側(cè)均有較好的信噪比,該通道為網(wǎng)絡(luò)提供較好的海底線位置特征。 結(jié)合三通道特征,網(wǎng)絡(luò)的泛化能力得到增強(qiáng),在單側(cè)信噪比較差時(shí),仍能提取海底線特征,提高海底線提取精度。
2.3.2 多尺度特征融合模塊(MFFM)
在實(shí)際的側(cè)掃聲吶回波信號(hào)中,當(dāng)遇到地形復(fù)雜時(shí),回波信號(hào)中海底線的細(xì)節(jié)信息不易提取,從而造成海底線位置提取精度較差的問(wèn)題。
本文借鑒U-Net 在不同特征尺寸下,對(duì)淺層特征和深層特征進(jìn)行拼接的思想,在特征融合階段,采用不同尺寸的特征融合增強(qiáng)網(wǎng)絡(luò)對(duì)海底線細(xì)節(jié)信息的提取。 首先,在金字塔池化后,將上采樣倍數(shù)設(shè)置為2,減少4 倍上采樣丟失海底線的細(xì)節(jié)信息;然后,在學(xué)習(xí)下采樣階段分別向淺層分支輸出1/4、1/8、1/16 尺寸的特征圖,其深層分支分別和淺層特征進(jìn)行融合。 最終經(jīng)過(guò)多尺度的特征融合,網(wǎng)絡(luò)具有更好地提取海底線細(xì)節(jié)的能力。
如圖9 所示的回波數(shù)據(jù),使用BMM-Fast-SCNN得到了海底線的分割結(jié)果。 為了評(píng)估海底線提取精度,本文對(duì)模型分割結(jié)果進(jìn)行遍歷,分別從預(yù)測(cè)序列中間往左右兩側(cè)搜索第一個(gè)為0 的點(diǎn),記錄為每個(gè)回波數(shù)據(jù)左右海底線的預(yù)測(cè)值。
圖9 回波數(shù)據(jù)及預(yù)測(cè)值
選取一個(gè)像素精度和兩個(gè)像素精度作為可接受誤差,計(jì)算預(yù)測(cè)值和真實(shí)值的差值是否在可接受范圍內(nèi),最終確定每個(gè)預(yù)測(cè)值的正確性,如式(2)所示:
式中:yi是預(yù)測(cè)值,yˉi是真實(shí)值,error 表示可接受誤差,其取值為1 或者2。 那么海底線提取精度就可以表示為式(3):
式中:acc 表示海底線提取精度,Nc表示正確預(yù)測(cè)個(gè)數(shù),Na表示預(yù)測(cè)的總個(gè)數(shù)。
為了驗(yàn)證BMM-Fast-SCNN 網(wǎng)絡(luò)在實(shí)時(shí)提取海底線這項(xiàng)工作中的有效性和優(yōu)越性,本文使用在杭州千島湖實(shí)地采集的側(cè)掃聲吶回波數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。
在千島湖,我們使用HMS-6x4 側(cè)掃聲吶進(jìn)行測(cè)量,如圖10 所示,一共四個(gè)通道,分別記錄高、低頻下左右舷的側(cè)掃聲吶回波數(shù)據(jù),其工作頻率為高頻400 kHz,低頻100 kHz,最大采樣斜距為200 m,采樣間隔為1 s,側(cè)掃聲吶回波數(shù)據(jù)及輔助信息以XTF 格式記錄下來(lái)。
圖10 千島湖湖試實(shí)驗(yàn)
原始的側(cè)掃聲吶數(shù)據(jù)以XTF 的格式記錄在文件中,使用C#語(yǔ)言,在Visual Studio 2017 平臺(tái)上對(duì)原始數(shù)據(jù)進(jìn)行解析。 在64 位的Linux18.04 系統(tǒng)下,使用python3.6、cuda10.1 的編譯環(huán)境,GPU 型號(hào)是RTX 2080,并基于pytorch1.8 版本庫(kù)進(jìn)行本次實(shí)驗(yàn)。
BMM-Fast-SCNN 網(wǎng)絡(luò)訓(xùn)練需要大量的數(shù)據(jù),才能學(xué)習(xí)到海底線的特征并具有很好的魯棒性。 由于側(cè)掃聲吶數(shù)據(jù)沒(méi)有公開(kāi)數(shù)據(jù)集,需要選取一條具有豐富特征的側(cè)掃聲吶測(cè)線,進(jìn)行側(cè)掃聲吶數(shù)據(jù)集的制作。 本文選取采樣于千島湖地區(qū)的側(cè)掃聲吶測(cè)線數(shù)據(jù),該測(cè)線數(shù)據(jù)共17 920 個(gè)Ping,按照本文1.3 節(jié)的數(shù)據(jù)預(yù)處理的方法得到17 920 個(gè)樣本數(shù)據(jù)和對(duì)應(yīng)的標(biāo)簽數(shù)據(jù)。 樣本數(shù)據(jù)按照6 ∶2 ∶2 比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。
為了檢驗(yàn)不同方法分割海底線的效果,選取圖像分割領(lǐng)域中主流檢測(cè)指標(biāo)對(duì)模型進(jìn)行性能評(píng)估。本文采用Dice 系數(shù)(Dice Similariy Coefficient,Dice)以及交并比(Intersection over Union,IoU)作為分割精度的指標(biāo),另外選取模型執(zhí)行時(shí)間作為分割速度的指標(biāo)。 其中Dice 系數(shù)表示兩個(gè)集合間相似度的度量,其取值范圍為[0,1],取值越大表示兩個(gè)集合樣本相似度越高,其計(jì)算式如式(4)所示;交并比為真實(shí)值集合與預(yù)測(cè)值集合的交集及其并集的比值,其取值范圍為[0,1],計(jì)算式如式(5)所示。
式中:TP 表示預(yù)測(cè)正確的水柱區(qū)采樣點(diǎn)的樣本個(gè)數(shù),F(xiàn)P 表示圖片區(qū)采樣點(diǎn)被誤檢為水柱區(qū)采樣點(diǎn)的樣本個(gè)數(shù),F(xiàn)N 表示水柱區(qū)采樣點(diǎn)被誤檢為圖片區(qū)采樣點(diǎn)的樣本個(gè)數(shù)。
實(shí)驗(yàn)基于pytorch 的深度學(xué)習(xí)框架,本文研究的是海底線提取,屬于二分類問(wèn)題,輸出層經(jīng)過(guò)Softmax 后,選擇交叉熵函數(shù)作為訓(xùn)練時(shí)的損失函數(shù),其公式如式(6)所示:
式中:N表示預(yù)測(cè)序列和目標(biāo)序列的長(zhǎng)度,pi表示目標(biāo)序列中第i個(gè)采樣點(diǎn)概率,yi表示第i個(gè)采樣點(diǎn)處標(biāo)簽值的類別,正類為1,負(fù)類為0。 本文選用Adam優(yōu)化器方法[20]作為參數(shù)優(yōu)化器,學(xué)習(xí)率設(shè)置為0.001,batch size 設(shè)置為64,訓(xùn)練一共迭代40 輪。
3.4.1 模型的消融實(shí)驗(yàn)
為了驗(yàn)證本文算法的有效性及各個(gè)模塊對(duì)Fast-SCNN-1D 網(wǎng)絡(luò)的性能提升,本文在4 種不同F(xiàn)ast-SCNN-1D 網(wǎng)絡(luò)上進(jìn)行了消融實(shí)驗(yàn)。 選用本文3.1 節(jié)獲得的側(cè)掃聲吶數(shù)據(jù)集進(jìn)行訓(xùn)練,得到測(cè)試結(jié)果如表1 所示。
表1 各模型的分割性能指標(biāo)表
Fast-SCNN-1D 的Dice 系數(shù)和IoU 分別為99.78%和99.57%,在分別添加BISM 和MFFM 模塊后,模型的Dice 系數(shù)和IoU 都得到了一定的提升。 使用全部模塊搭建的BMM-Fast-SCNN 模型在分割精度指標(biāo)上表現(xiàn)最好,其Dice 系數(shù)和IoU 指標(biāo)分別為99.90%和99.84%,相較于Fast-SCNN-1D 網(wǎng)絡(luò)分別提升了0.12%和0.27%,同時(shí)在模型執(zhí)行時(shí)間上保持著良好的性能,這充分體現(xiàn)本文提出的模塊能有效提高海底線的分割精度,并保持良好的執(zhí)行時(shí)間。
3.4.2 與其他方法對(duì)比
為了驗(yàn)證本文提出方法在實(shí)時(shí)正確提取海底線時(shí)的優(yōu)越性,本文選取了Yan 等[12]的1D-UNet 網(wǎng)絡(luò)、Qin 等[13]的U-Net-1D6網(wǎng)絡(luò)和本文算法進(jìn)行分割精度和實(shí)時(shí)性的比較。 表2 為各算法分割性能指標(biāo)表。由實(shí)驗(yàn)結(jié)果可知Yan 等[12]提出的方法在實(shí)時(shí)性上表現(xiàn)更好,但分割精度指標(biāo)較本文算法偏低。 本文算法經(jīng)過(guò)加入BISM 和MFFM 模塊,網(wǎng)絡(luò)層數(shù)進(jìn)一步加深,分割精度較之其他方法有明顯的提升,其中在Dice 系數(shù)和IoU 指標(biāo)上分別至少提高了0.26%和0.49%。
表2 各算法的分割性能指標(biāo)表
為了驗(yàn)證本文算法在水柱區(qū)存在大量噪聲時(shí)提取海底線的能力,選取由HMS-6x4 側(cè)掃聲吶在千島湖地區(qū)采取的兩條測(cè)線進(jìn)行海底線提取實(shí)驗(yàn),并選取Yan 等[12]的1D-UNet 網(wǎng)絡(luò)、Fast-SCNN-1D 網(wǎng)絡(luò)、Yan 等[11]的1D-CNN 網(wǎng)絡(luò)、Qin 等[13]的U-Net-1D6網(wǎng)絡(luò)以及本文算法進(jìn)行海底線提取精度對(duì)比實(shí)驗(yàn)。 五種算法的海底線提取效果如圖11 所示,其中a 是側(cè)掃聲吶瀑布圖,b 是海底線標(biāo)注圖,c 是Yan等[12]1D-UNet 網(wǎng)絡(luò)提取結(jié)果圖,d 是Fast-SCNN-1D網(wǎng)絡(luò)提取結(jié)果圖,e 是Yan 等[11]1D-CNN 網(wǎng)絡(luò)提取結(jié)果圖,f 是Qin 等[13]U-Net-1D6網(wǎng)絡(luò)提取圖,g 是本文算法提取結(jié)果圖。 如圖11(a1)所示,測(cè)線1 的瀑布圖在水柱區(qū)具有較強(qiáng)的干擾,水柱區(qū)的懸浮物距離海底線較近,且在一部分探測(cè)區(qū)域,左側(cè)海底線的特征完全被噪聲淹沒(méi)。 從圖中得知,在水柱區(qū)干擾較大時(shí),1D-UNet、Fast-SCNN-1D 和1D-CNN 網(wǎng)絡(luò)均不能很好地跟蹤海底線,預(yù)測(cè)的海底線會(huì)出現(xiàn)大量的突變點(diǎn),海底線提取并不連續(xù),U-Net-1D6網(wǎng)絡(luò)相較于前三種網(wǎng)絡(luò),能較好地提取海底線,提取精度表現(xiàn)較好;而本文算法在加入BISM 和MFFM 模塊后,學(xué)習(xí)到海底線的對(duì)稱特征,并能很好地提取海底線的細(xì)小特征,其提取結(jié)果和標(biāo)注的海底線位置最接近,魯棒性更好。 如圖11(a2)所示,測(cè)線2 的瀑布圖在水柱區(qū)的噪聲相對(duì)較少,但在方框處出現(xiàn)未知增益突變,且采樣中心具有較強(qiáng)的聲吶自噪聲。 從圖中可知,1D-UNet、Fast-SCNN-1D、四種網(wǎng)絡(luò)均保持較好的提取效果,僅存在少量突變點(diǎn),提取效果較好,本文算法在整個(gè)測(cè)線區(qū)間保持很好的提取效果,未出現(xiàn)突變點(diǎn),海底線提取精度最好。
圖11 海底線提取效果圖
表3 給出了Yan 等[12]的1D-UNet、Fast-SCNN-1D、Yan 等[11]的1D-CNN、Qin 等的U-Net-1D6和本文算法在上述兩條測(cè)線下的海底線跟蹤精度。
表3 海底線提取精度對(duì)比表
在測(cè)線1 中,Yan 等[12]的1D-UNet、Fast-SCNN-1D 和Yan 等[11]的1D-CNN 跟蹤精度表現(xiàn)較差。Qin 等[13]的U-Net-1D6跟蹤精度表現(xiàn)較好。 本文算法表現(xiàn)最優(yōu)異,在兩種跟蹤精度上,相較于Yan等[12]的1D-UNet 分別提高了28.1%和39.26%,相較于Fast-SCNN-1D 分別提高了10.23%和19.09%,相較于Yan 等[11]的1D-CNN 分別提高了31.17%和28.54%,相較于Qin 等[13]的U-Net-1D6分別提高了1.41%和9.07%。 在測(cè)線2 中,五種算法的海底線提取精度均表現(xiàn)優(yōu)異,在兩種跟蹤精度上,本文算法相較于Yan 等[12]的1D-UNet 分別提高了3.62%和1.07%,相較于Fast-SCNN-1D 分別提高了1.56%和0.48%,相較于Yan 等[11]的1D-CNN 分別提高了0.74%和2.81%,相較于Qin 等[13]的U-Net-1D6分別提高了4.95%和1.92%。 在不同測(cè)線環(huán)境下,本文算法相較于其他方法均取得較好跟蹤精度。
通過(guò)使用從杭州千島湖采集的數(shù)據(jù)進(jìn)行實(shí)驗(yàn),驗(yàn)證了本文方法的有效性,本文算法借助海底線對(duì)稱性的先驗(yàn)知識(shí),增強(qiáng)了網(wǎng)絡(luò)的魯棒性,能夠在單側(cè)噪聲較強(qiáng)時(shí)有效提取海底線。 然而本文方法在水柱區(qū)左右兩側(cè)均存在噪聲干擾時(shí),無(wú)法正確分割海底線位置。 如圖12 所示,噪聲幾乎充滿了整個(gè)水柱區(qū)域,兩側(cè)海底線的位置均不明顯,這種情況下,本文提出的BISM 模塊不能有效降低水柱區(qū)噪聲的干擾,無(wú)法向網(wǎng)絡(luò)提供有效的特征信息,導(dǎo)致算法無(wú)法提取到海底線位置。
圖12 水柱區(qū)充滿噪聲的回波信號(hào)
本文提出了BMM-Fast-SCNN 網(wǎng)絡(luò)用于提取海底線位置。 采用BISM 使得網(wǎng)絡(luò)學(xué)習(xí)到海底線的對(duì)稱特征,通過(guò)MFFM 模塊提高網(wǎng)絡(luò)提取海底線細(xì)小特征的能力。 經(jīng)實(shí)驗(yàn)證明,本文算法相較于現(xiàn)有的實(shí)時(shí)提取海底線的算法,在噪聲干擾較大時(shí),可以有效提高提取海底線的精度,并保持良好的實(shí)時(shí)性能。
本文算法也存在一定的局限性:本文算法在噪聲較大時(shí)提取精度仍然有限,且當(dāng)水柱區(qū)左右兩側(cè)均存在較多的噪聲干擾時(shí),本文算法將失效,海底線無(wú)法正確提取。 下一步工作是進(jìn)一步提高網(wǎng)絡(luò)在噪聲干擾下的海底線提取精度。