摘要:探地雷達(dá)(GPR)檢測技術(shù)是目前城市道路脫空檢測中常用的無損檢測技術(shù)。傳統(tǒng)的探地雷達(dá)檢測方法需要人工對雷達(dá)圖像進(jìn)行識別,但這種方式容易出現(xiàn)漏檢、誤檢和效率低下等問題,嚴(yán)重影響檢測結(jié)果的準(zhǔn)確性。通過基于深度學(xué)習(xí)的目標(biāo)檢測網(wǎng)絡(luò)對雷達(dá)圖像進(jìn)行識別可以避免這些問題,目標(biāo)檢測算法已經(jīng)在圖像和視頻中證明了識別各種類型物體的能力。雖然目前關(guān)于探地雷達(dá)圖像檢測的研究還不夠充分,但本文總結(jié)了探地雷達(dá)技術(shù)與常用的目標(biāo)檢測網(wǎng)絡(luò)模型在路基病害檢測方面的研究成果。
關(guān)鍵詞:圖像檢測;目標(biāo)檢測網(wǎng)絡(luò);探地雷達(dá);路基病害
一、引言
城市道路是城市交通安全平穩(wěn)運行的關(guān)鍵,道路情況直接影響人們出行的舒適與安全。在城市道路的長期服役中,路基h會不可避免地產(chǎn)生缺陷(如空洞和疏松等病害)。定期對路基進(jìn)行檢測、判斷病害類型,并及時修復(fù)對維護(hù)道路安全具有十分重要的意義。
探地雷達(dá)(GPR)檢測技術(shù)是目前城市道路脫空檢測中常用的無損檢測技術(shù)。傳統(tǒng)方法中常用人工判讀分析,通過識別雷達(dá)圖像中的雙曲線特征來判斷病害。然而,人工判讀存在效率低、主觀性強、耗時耗力等問題,影響了技術(shù)的推廣應(yīng)用。近年來,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于目標(biāo)檢測網(wǎng)絡(luò)的研究對探地雷達(dá)圖像識別取得了進(jìn)展,解決了傳統(tǒng)方法依賴操作人員經(jīng)驗和耗費人力物力的問題。
病害檢測評估模型,基于深度學(xué)習(xí)的目標(biāo)檢測網(wǎng)絡(luò)識別結(jié)果最終與現(xiàn)行城市道路病害規(guī)范城市地下病害體綜合探測與風(fēng)險評估技術(shù)標(biāo)準(zhǔn)綜合考慮,做出對病害治理最準(zhǔn)確的判斷。將目標(biāo)檢測模型應(yīng)用于探地雷達(dá)圖像識別具有重要的現(xiàn)實意義和應(yīng)用價值。通過訓(xùn)練和優(yōu)化目標(biāo)檢測模型,可以實現(xiàn)地下目標(biāo)的自動識別和定位,提高探測的準(zhǔn)確性和效率。這不僅支持地質(zhì)勘探和考古挖掘,還幫助工程師和研究人員更好地了解地下結(jié)構(gòu),為城市規(guī)劃和土木工程設(shè)計提供決策依據(jù)。
二、深度學(xué)習(xí)網(wǎng)絡(luò)模型簡介
深度學(xué)習(xí)模型是一種利用人工神經(jīng)網(wǎng)絡(luò)模擬和學(xué)習(xí)人類大腦神經(jīng)網(wǎng)絡(luò),從數(shù)據(jù)中獲取知識和經(jīng)驗的機器學(xué)習(xí)算法。它基于神經(jīng)網(wǎng)絡(luò)原理,模擬人腦工作方式進(jìn)行學(xué)習(xí)和決策。深度學(xué)習(xí)模型由多個神經(jīng)網(wǎng)絡(luò)層組成,每個層包含多個神經(jīng)元,通過不斷堆疊多個層次形成深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。深度學(xué)習(xí)概念最早于2006年由Hinton[1]等人提出,通過學(xué)習(xí)深層非線性網(wǎng)絡(luò)結(jié)構(gòu),實現(xiàn)復(fù)雜函數(shù)逼近和數(shù)據(jù)特征提取。深度學(xué)習(xí)模型自適應(yīng)性強,可以在大規(guī)模、復(fù)雜數(shù)據(jù)中發(fā)現(xiàn)更多規(guī)律和模式,具有強泛化和特征學(xué)習(xí)能力。它能自動學(xué)習(xí)數(shù)據(jù)特征表示,使其靈活、通用。深度學(xué)習(xí)模型有多種類型,其中前饋神經(jīng)網(wǎng)絡(luò)是最簡單的,適用于分類和回歸任務(wù)。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNNs)則
專門處理具有時序關(guān)系的數(shù)據(jù),常用于語音識別和自然語言處理等任務(wù)。與此不同,淺層網(wǎng)絡(luò)模型依賴人為設(shè)計的特征提取算法,盡管這些算法清晰易懂,但總會留下一些盲區(qū)[2]。而深層神經(jīng)網(wǎng)絡(luò)并不依賴特征工程,盡管每一層的計算方式可能難以理解,但只要訓(xùn)練充分,就能很好地反應(yīng)數(shù)據(jù)。深度學(xué)習(xí)根據(jù)監(jiān)督情況分為監(jiān)督學(xué)習(xí)方法、無監(jiān)督學(xué)習(xí)方法和半監(jiān)督學(xué)習(xí)方法三類。監(jiān)督學(xué)習(xí)方法指訓(xùn)練集數(shù)據(jù)均帶有標(biāo)記,通過訓(xùn)練得到一個模型(分類器),再用得到的分類器對新樣數(shù)據(jù)進(jìn)行分類。
卷積神經(jīng)網(wǎng)絡(luò)在多層感知器的基礎(chǔ)上發(fā)展而來,最早的卷積神經(jīng)網(wǎng)絡(luò)模型由日本學(xué)者福島根據(jù)腦部神經(jīng)元感受區(qū)域原理提出了神經(jīng)認(rèn)知機[3]。神經(jīng)認(rèn)知機模擬人腦識別模式,能夠提取圖像關(guān)鍵的特征,卷積神經(jīng)網(wǎng)絡(luò)通常由輸入層、卷積層、池化層、全連接層以及輸出層構(gòu)成。卷積層與池化層又合稱為隱藏層,一般取若干個并交替設(shè)置。在卷積層中,輸出特征面的每個神經(jīng)元與其輸入進(jìn)行局部連接,并通過對應(yīng)的連接權(quán)值與局部輸入進(jìn)行加權(quán)求和再加上偏置值,得到該神經(jīng)元輸入值,該過程等同于卷積過程。卷積神經(jīng)網(wǎng)絡(luò)通過局部連接和權(quán)值共享減少參數(shù)數(shù)量,提高計算效率和模型泛化能力,且具有平移和空間變換的不變性,適用于圖像識別任務(wù),還能夠多層次提取特征,從淺層到深層逐步抽象化,高效處理大規(guī)模數(shù)據(jù)。卷積神經(jīng)網(wǎng)絡(luò)同樣適用于處理圖像、語音和文本等多種類型數(shù)據(jù),使之成為現(xiàn)階段深度學(xué)習(xí)領(lǐng)域的重要工具之一。
三、基于目標(biāo)檢測網(wǎng)絡(luò)模型的雷達(dá)圖像識別
(一)基于單階段目標(biāo)檢測網(wǎng)絡(luò)模型的雷達(dá)圖像識別
傳統(tǒng)的圖像識別算法錯檢率和運行時間上難以滿足工程需要。早期學(xué)者利用深度置信網(wǎng)絡(luò)(Deep Belief Networks)和受限玻爾茲曼機(Restricted Boltzmann Machine)的深度學(xué)習(xí)模型對探地雷達(dá)數(shù)據(jù)進(jìn)行特征提取,證明了深度學(xué)習(xí)算法能夠較好地識別雷達(dá)圖像[4]。隨后,圖像識別算法融合了卷積神經(jīng)網(wǎng)絡(luò),使得算法能夠有效減少干擾物的影響,在克服障礙物遮擋方面具有較好的魯棒性。
單階段目標(biāo)檢測模型能夠直接預(yù)測目標(biāo)的類別和位置,不需要額外的候選框生成過程,因此具有較快的檢測速度,對于實時性要求高的應(yīng)用場景非常適用。在研究探地雷達(dá)檢測水泥道路病害時,周廷楠[5]利用YOLO v3對病害圖像自動識別,研究對水泥道路病害圖像自動識別的方法。該方法通過對神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行分析,利用其可以進(jìn)行自學(xué)習(xí),尋找發(fā)現(xiàn)實際樣本中的特征和規(guī)律,可以根據(jù)訓(xùn)練習(xí)得的特點,正確預(yù)測新樣本的分類,多運算可獨立并行,提高運行訓(xùn)練速度等優(yōu)越性和識別準(zhǔn)確率。馬王鵬等[6]利用Yolov1模型在基于TensorFlow深度學(xué)習(xí)框架下對探地雷達(dá)圖像進(jìn)行目標(biāo)檢測,雖結(jié)果準(zhǔn)確率與置信度較低,但為使用Yolo系列模型對探地雷達(dá)B-scan圖像的目標(biāo)檢測方面提供了寶貴經(jīng)驗。單階段模型通常采用端到端的訓(xùn)練方式,這有助于模型更好地學(xué)習(xí)和捕捉探地雷達(dá)圖像中的特征,從而提高識別精度,注意力Cbam模塊的處理機制類似于人類視覺系統(tǒng),看待視野將注意力側(cè)重于重要的有用信息,提高分類準(zhǔn)確率。改進(jìn)SF-Camb-SSD算法在實際工程測試集上驗證了算法的有效性,對比SF-SSD算法模型,將兩個模型在西部某機場上的檢測脫空病害結(jié)果進(jìn)行量化和可視化。
單階段模型簡化了檢測流程,減少了計算復(fù)雜度,使得在處理大量探地雷達(dá)圖像數(shù)據(jù)時更為高效。對于地下管線的識別問題[7],有學(xué)者提出一種基于YOLOv7的地下管線的GPR圖像識別方法。其方法首先對GPR圖像進(jìn)行去噪,然后進(jìn)行智能識別。為了提升YOLOv7對小目標(biāo)的識別性能,引入了SimAM注意力機制。該機制無需額外參數(shù),直接為特征圖推導(dǎo)出3D注意力權(quán)值,增強了重要特征的提取能力,有效抑制了非重要特征的干擾。同時,將YOLOv7損失函數(shù)中的坐標(biāo)損失函數(shù)CIoU改為EIoU,解決了寬高縱橫比定義不明確的問題。實驗證明該方法在檢測速度和精度上都有提升,完美解決了地下管線探測工程中數(shù)據(jù)無法實時高效解譯的問題。
雖然單階段模型在速度上有所優(yōu)勢,但在目標(biāo)定位精度方面可能略遜于兩階段模型。對于探地雷達(dá)圖像識別,特別是需要精確識別地下目標(biāo)的位置和形狀時,這成為一個不可避免的缺點。探地雷達(dá)圖像中可能包含各種大小的地下目標(biāo),而單階段模型在處理小目標(biāo)時可能會遇到一些困難,因為小目標(biāo)在圖像中的特征信息較少,模型可能難以準(zhǔn)確識別和定位這些小目標(biāo)。
(二)基于兩階段目標(biāo)檢測網(wǎng)絡(luò)模型的雷達(dá)圖像識別
在探地雷達(dá)圖像識別中,地下環(huán)境復(fù)雜多變,目標(biāo)可能受到多種因素的影響(如噪聲、干擾等)。兩階段模型通過精細(xì)的候選框生成和目標(biāo)分類機制,能夠更好地應(yīng)對這些復(fù)雜場景,提高識別的準(zhǔn)確性。同時兩階段目標(biāo)檢測模型通常具有更高的定位精度。在第一階段,模型生成一系列候選目標(biāo)框,然后在第二階段對這些框進(jìn)行精細(xì)地分類和位置回歸。這種機制使得模型能夠更準(zhǔn)確地識別并定位探地雷達(dá)圖像中的目標(biāo),特別是在需要精確識別地下目標(biāo)的位置和形狀時表現(xiàn)優(yōu)異。與單階段模型相比,兩階段模型在小目標(biāo)檢測方面通常更具優(yōu)勢,因為它在生成候選框時考慮更多可能性,從而對圖像中較小的目標(biāo)也能保持較好的檢測性能??晒﹥呻A段網(wǎng)絡(luò)特征提取骨架選擇的有AlexNet、GoogLeNet、MobileNetv2、Inceptionv3、SqueezeNet、ResNet-18、ResNet-50、ResNet-101、VGG-16、VGG-19等10種經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)模型。然而,VGG-19的測試準(zhǔn)確率低于驗證準(zhǔn)確率,可能出現(xiàn)了過擬合現(xiàn)象。相比之下,ResNet-50、VGG-16和ResNet-50這三個網(wǎng)絡(luò)的驗證準(zhǔn)確率超過了90%,模型遷移學(xué)習(xí)的方法可適用于雷達(dá)圖像數(shù)據(jù)集。
在研究中,方振華[8]提出了一種基于Faster-RCNN架構(gòu)的探地雷達(dá)病害圖像檢測模型,利用深度學(xué)習(xí)算法根據(jù)病害圖像特征進(jìn)行檢測,實現(xiàn)了探地雷達(dá)圖像的精確識別。大多數(shù)Faster-RCNN目標(biāo)檢測運用VGG16作為特征提取網(wǎng)絡(luò),但研究者采用ResNet50殘差網(wǎng)絡(luò)代替常見的VGG16網(wǎng)絡(luò),調(diào)整了區(qū)域建議生成器的大小,讓其更適合病害圖像。結(jié)果表明,F(xiàn)aster-RCNN目標(biāo)檢測模型能以較高準(zhǔn)確率識別病害圖像,可代替人工應(yīng)用于公路病害檢測,提高路面病害檢測準(zhǔn)確率。
對比單階段目標(biāo)檢測網(wǎng)絡(luò)模型,兩階段目標(biāo)檢測模型由于需要進(jìn)行兩次計算(候選框生成和目標(biāo)分類),其處理速度通常較慢,這使得它在實時性要求較高的應(yīng)用場景中可能受到限制。其結(jié)構(gòu)也更為復(fù)雜,需要更多的計算資源來支持其運行,這可能導(dǎo)致在資源有限的環(huán)境中,模型的部署和運行變得困難。因此,在選擇是否使用兩階段模型時,需要根據(jù)具體的應(yīng)用場景和需求進(jìn)行權(quán)衡。
四、結(jié)束語
近年來,隨著目標(biāo)檢測技術(shù)的發(fā)展,從機器學(xué)習(xí)到SSD、RCNN、Yolo等深度學(xué)習(xí)目標(biāo)檢測模型被越來越廣泛地應(yīng)用于探地雷達(dá)圖像的目標(biāo)檢測中。這些模型在探地雷達(dá)圖像識別應(yīng)用中發(fā)揮著重要作用,為地下目標(biāo)的識別與定位提供了有效的技術(shù)手段。無論是單階段還是兩階段目標(biāo)檢測模型,它們都在不同程度上展現(xiàn)了各自的優(yōu)點和適用性。復(fù)雜的路基土壤環(huán)境、路面濕滑影響,以及雜亂的雷達(dá)回波噪聲干擾等因素,都是影響雷達(dá)圖像識別精度的重要因素,為了更好地解決此類干擾,研究人員利用采用中值濾波法、均值濾波法、雙邊濾波法對探地雷達(dá)所采集的回波進(jìn)行降噪處理,以過濾掉雷達(dá)圖像中過多的椒鹽噪聲干擾。經(jīng)過預(yù)處理的圖像能夠最大程度減少神經(jīng)網(wǎng)絡(luò)在目標(biāo)檢測過程中對于噪聲特征的干擾。
早期的yolov2、yolov3、yolov4檢測模型中,為了提高目標(biāo)檢測的訓(xùn)練精度,研究人員習(xí)慣于改進(jìn)模型的預(yù)訓(xùn)練階段,將殘差網(wǎng)絡(luò)代替為backbone部分,或者將特征提取部分直接遷移學(xué)習(xí)至雷達(dá)圖像的目標(biāo)檢測模型中。對于Yolov7模型,研究人員則習(xí)慣于添加SimAM注意力機制。SimAM注意力機制能夠高效評估雷達(dá)圖像中目標(biāo)的雙曲線特征權(quán)重,并為路基病害的雙曲線特征圖推導(dǎo)出3D注意力權(quán)值,從而增強探地雷達(dá)圖像中管線的雙曲線特征,提高目標(biāo)檢測網(wǎng)絡(luò)對探地雷達(dá)圖像中路基病害目標(biāo)的檢測精度。
探地雷達(dá)圖像中的目標(biāo)往往與周圍環(huán)境存在關(guān)聯(lián)。因此,充分利用上下文信息有助于提高目標(biāo)檢測的準(zhǔn)確性。引入多尺度特征融合、上下文建模等技術(shù)可以增強模型對上下文信息的捕捉和利用能力。兩階段目標(biāo)檢測模型通常依賴于卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行特征提取。針對探地雷達(dá)圖像的特點,可以設(shè)計更為專業(yè)的特征提取網(wǎng)絡(luò),以更好地捕捉圖像中的關(guān)鍵信息,利用深度可分離卷積、空洞卷積等技術(shù)來增強特征提取能力,同時減少計算量。此外,還可以采用模型壓縮技術(shù)(如剪枝、量化等)和加速技術(shù)(如硬件加速、模型并行化等)來減小模型的規(guī)模和計算量,提高其實時性能。
作者單位:茹曉儉 汪光旺 杭州上城區(qū)市政工程集團(tuán)有限公司
陳斌 浙江省長三角城市基礎(chǔ)設(shè)施科學(xué)研究院 "浙大城市學(xué)院工程學(xué)院
張崢崢 浙大城市學(xué)院工程學(xué)院
參考文獻(xiàn)
[1]Joachims T. Making large-scale SVM learning practical[R]. Technical report, 1998. JOACHIMS T.Making Large-scale SVM Learning Practical[G]//Advances in Kernel Methods-Support Vector Learning. [S.l]: MIT, Press: 169-184.
[2]徐活耀. 基于深度學(xué)習(xí)的路面病害識別方法研究[D]. 重慶: 重慶交通大學(xué), 2020.
[3]Fukushima K. A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J]. Biol, Cybern, 1980, 36: 193/202.
[4]張彥航, 蘇小紅, 馬培軍. 基于最大置信度的多目標(biāo)檢測算法[J]. 信號處理, 2012, 28(1): 39-46.
[5]周廷楠. 基于神經(jīng)網(wǎng)絡(luò)的水泥路面探地雷達(dá)病害圖像識別研究[D]. 桂林: 桂林電子科技大學(xué), 2021.
[6]馬王鵬, 王曉東, 劉冬. 探地雷達(dá)圖像異常識別中YOLO目標(biāo)檢測算法的研究[J]. 測繪通報, 2019(S1): 72-76.
[7]高大慶. 城市地下管線的探地雷達(dá)圖像智能解譯[D]. 蘭州: 蘭州理工大學(xué), 2023.
[8]房振華, 譚治海, 朱哲等. 基于Faster-RCNN的探地雷達(dá)公路病害圖像檢測[J]. 施工技術(shù), 2023, 52(24): 76-82.