李海豐,趙碧帆,侯謹(jǐn)毅,王懷超,桂仲成
(中國(guó)民航大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,天津 300300)
地下目標(biāo)是指存在于地下的空洞、疏松體、富水體等病害,以及鋼筋、管線等物體。這些地下目標(biāo)的存在會(huì)導(dǎo)致路面塌陷、施工失敗等事故,從而造成人力物力損失,甚至危及人們的生命安全。提前檢測(cè)地下目標(biāo)的存在以及識(shí)別目標(biāo)的類別,可以有效減少以上事故的發(fā)生。
目前被廣泛應(yīng)用于檢測(cè)地下目標(biāo)的工具為探地雷達(dá)(Ground Penetrating Radar,GPR),它具有快速無(wú)損且高效的特點(diǎn)。但是由于地下目標(biāo)的復(fù)雜性、多樣性和空間分布的未知性,在實(shí)際業(yè)務(wù)應(yīng)用中多采用人工交互異地分析GPR圖像數(shù)據(jù)的方式進(jìn)行地下目標(biāo)檢測(cè),而這種方式無(wú)法滿足工程應(yīng)用中實(shí)時(shí)高效地探測(cè)和反饋多種地下目標(biāo)的需求。
隨著信息處理技術(shù)的發(fā)展,科研人員開(kāi)發(fā)了一些利用GPR 圖像數(shù)據(jù)自動(dòng)探測(cè)地下目標(biāo)的方法。這些方法可以分為兩類:傳統(tǒng)方法與深度學(xué)習(xí)方法。
傳統(tǒng)方法的特點(diǎn)是需要經(jīng)過(guò)大量的人工設(shè)計(jì)和數(shù)學(xué)運(yùn)算。人們通常通過(guò)信號(hào)處理或圖像處理的方式提取出地下目標(biāo)的特征,如梯度特征、點(diǎn)特征、曲率特征、頻域特征、雙曲線擬合參數(shù)等,通過(guò)模板匹配或參數(shù)估計(jì)的方法,達(dá)到目標(biāo)檢測(cè)的目的。一些機(jī)器學(xué)習(xí)的算法,如支持向量機(jī)(Support Vector Machine,SVM)等,也被用于特征的分類。傳統(tǒng)方法具有準(zhǔn)確率低、計(jì)算復(fù)雜、只能針對(duì)性地檢測(cè)某一類目標(biāo)等缺點(diǎn)。
近年來(lái),基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法在目標(biāo)檢測(cè)領(lǐng)域取得了巨大的成就。一些成熟的目標(biāo)檢測(cè)模型,如Faster-RCNN(Faster-Region-based Convolutional Neural Networks)、YOLO(You Only Look Once)、Mask-RCNN(Mask-Region-based Convolutional Neural Networks)等,也被應(yīng)用于GPR 圖像中的目標(biāo)檢測(cè)。這些深度學(xué)習(xí)方法的檢測(cè)效果比傳統(tǒng)方法的準(zhǔn)確率更高,但是具有樣本需求量較大、處理時(shí)間長(zhǎng)、檢測(cè)結(jié)果難以解釋等缺點(diǎn)。
另外還存在一些傳統(tǒng)方法與深度學(xué)習(xí)相結(jié)合的地下目標(biāo)檢測(cè)算法。比如:Al-Nuaimy 等首先使用神經(jīng)網(wǎng)絡(luò)提取出目標(biāo)特征區(qū)域,然后提取邊緣信息,再通過(guò)霍夫變換檢測(cè)地下目標(biāo)的雙曲線結(jié)構(gòu)特征;Dou 等和Zhou 等分別在此基礎(chǔ)上添加了列連接聚類和OSCA(Open-Scan Clustering Algorithm)來(lái)提高檢測(cè)的準(zhǔn)確效率;Shaw 等先使用邊緣檢測(cè)簡(jiǎn)化數(shù)據(jù)集,再使用MLP(Multi-Layer Perceptron)網(wǎng)絡(luò)識(shí)別簡(jiǎn)化后的雙曲線形狀,由于這種方法的神經(jīng)網(wǎng)絡(luò)輸入為整個(gè)圖像中的所有曲線,且不考慮目標(biāo)鄰近區(qū)域信息,使得該方法受環(huán)境噪聲影響較大,識(shí)別率較低。
本文提出了一種結(jié)合了傳統(tǒng)方法和深度學(xué)習(xí)方法的地下目標(biāo)自動(dòng)檢測(cè)算法。針對(duì)現(xiàn)有算法實(shí)時(shí)性較差、樣本要求高、檢測(cè)結(jié)果解釋性差等特點(diǎn),提出了一種基于圖像直方圖分析的自適應(yīng)雙閾值目標(biāo)分割算法,同時(shí)使用SVM 分類器與LeNet 神經(jīng)網(wǎng)絡(luò)對(duì)分割結(jié)果進(jìn)行分類篩選,最后得到當(dāng)前圖像區(qū)域內(nèi)的所有地下目標(biāo)的位置及類別。與以往算法相比,本文算法具有實(shí)時(shí)性強(qiáng)、樣本需求量小、多類別目標(biāo)并行檢測(cè)等特點(diǎn)。
地下目標(biāo)檢測(cè)包括兩個(gè)方面:1)雷達(dá)圖像中的地下目標(biāo)區(qū)域分割;2)地下目標(biāo)區(qū)域分割結(jié)果的分類識(shí)別。從分類的角度看,前者是一個(gè)二分類問(wèn)題,而后者為一個(gè)多分類問(wèn)題?;谝陨纤悸?,本文提出的地下目標(biāo)自動(dòng)檢測(cè)算法包含兩個(gè)部分:目標(biāo)分割和目標(biāo)分類。
圖1 展示了本文算法的整體流程。算法輸入為經(jīng)過(guò)預(yù)處理的探地雷達(dá)圖片。算法首先通過(guò)目標(biāo)分割算法找出圖片中的顯著和非顯著目標(biāo)區(qū)域,然后通過(guò)一個(gè)綜合分類器識(shí)別目標(biāo)類別,作為算法輸出。
圖1 本文算法處理流程Fig.1 Proposed algorithm processing flow
為了能夠同時(shí)檢測(cè)雷達(dá)圖片中的顯著和非顯著目標(biāo),在算法的目標(biāo)分割部分設(shè)計(jì)了兩步分割算法:第一步分割圖像中的顯著目標(biāo),通過(guò)對(duì)分割結(jié)果進(jìn)行分析,判斷圖片中是否存在顯著目標(biāo);第二步當(dāng)不存在顯著目標(biāo)時(shí),分割圖片中的非顯著目標(biāo)。兩步分割算法都采用了自適應(yīng)雙閾值分割算法。區(qū)別在于第二步分割算法加入了直方圖壓縮操作。
為了能夠同時(shí)獲得不同類別目標(biāo)的分類識(shí)別結(jié)果,在算法的目標(biāo)分類部分結(jié)合了兩種分類器:LeNet 分類器和SVM分類器,前者用于識(shí)別地下目標(biāo)的紋理特征,而后者用于識(shí)別地下目標(biāo)的幾何結(jié)構(gòu)特征。兩種分類器的目標(biāo)識(shí)別結(jié)果通過(guò)設(shè)計(jì)數(shù)學(xué)形態(tài)學(xué)方法進(jìn)行連接合并,最終得到地下目標(biāo)的整體識(shí)別結(jié)果作為輸出。
探地雷達(dá)通過(guò)發(fā)射和接收電磁波以探測(cè)地面目標(biāo),當(dāng)?shù)叵麓嬖诋愇飼r(shí),由于介電常數(shù)的改變,探地雷達(dá)接收到的雷達(dá)回波就會(huì)產(chǎn)生較大的波動(dòng)。通過(guò)分析回波信號(hào)中的波動(dòng)情況,可以識(shí)別各類地下目標(biāo)。常見(jiàn)的地下目標(biāo)包括各類地下異物,如塌陷、空洞、積水等病害,以及鋼筋、管線、地?zé)舻任矬w。在探地雷達(dá)在探測(cè)地下目標(biāo)時(shí),會(huì)受到測(cè)量噪聲、地下小目標(biāo)、未知異物等造成的干擾,形成噪聲域。
對(duì)于探地雷達(dá)獲得的雷達(dá)回波數(shù)據(jù),通常需要經(jīng)過(guò)數(shù)據(jù)預(yù)處理操作,然后再經(jīng)過(guò)插值、線性拉伸等操作轉(zhuǎn)換為能夠可視化的雷達(dá)圖像數(shù)據(jù)。通用的數(shù)據(jù)預(yù)處理操作包括:地平線調(diào)節(jié)、濾波器去噪、細(xì)節(jié)增益放大等。探地雷達(dá)的數(shù)據(jù)預(yù)處理操作可以自動(dòng)篩選有用的數(shù)據(jù),并且通過(guò)不同程度地增強(qiáng)數(shù)據(jù)的波動(dòng)幅值,使得地下目標(biāo)在視覺(jué)上更加清晰和突出。
本文算法以探地雷達(dá)預(yù)處理之后的雷達(dá)圖片數(shù)據(jù)作為輸入。圖2 給出了一個(gè)探地雷達(dá)圖片數(shù)據(jù)的示例。在探地雷達(dá)圖片數(shù)據(jù)上,地下目標(biāo)表現(xiàn)為一片突出的緊密相鄰的黑白像素區(qū)域,并且呈現(xiàn)出一定的幾何及紋理特征,而背景區(qū)域則為一片灰色區(qū)域。如圖2(b)中上部的連續(xù)雙曲線狀凸起結(jié)構(gòu)對(duì)應(yīng)于一組平行的地下鋼筋目標(biāo)。
圖2 探地雷達(dá)原始數(shù)據(jù)預(yù)處理效果Fig.2 Preprocessing effect of ground penetrating radar raw data
圖2 中同時(shí)給出了探地雷達(dá)圖片的直方圖分布(見(jiàn)圖2(b)),其中包含三個(gè)明顯的峰值分布。直方圖兩側(cè)的峰值分別對(duì)應(yīng)于地下目標(biāo)的黑白像素連通區(qū)域,而直方圖中部的峰值對(duì)應(yīng)目標(biāo)背景區(qū)域。另外,探地雷達(dá)圖片的直方圖整體呈現(xiàn)出近似對(duì)稱的結(jié)構(gòu)。直方圖的對(duì)稱中心點(diǎn)在灰度級(jí)128 左右浮動(dòng),象征“正波”的白色區(qū)域和象征“負(fù)波”的黑色區(qū)域同樣表現(xiàn)出近似對(duì)稱。
本文算法的目標(biāo)是能夠同時(shí)檢測(cè)出顯著和非顯著的地下目標(biāo)。圖2(c)和圖2(d)給出了顯著和非顯著目標(biāo)的示例。兩者的區(qū)別在于,顯著性目標(biāo)與背景區(qū)域具有較大的對(duì)比度,而非顯著目標(biāo)由于介電常數(shù)不同、增益調(diào)節(jié)不明顯、病害嚴(yán)重程度較低等原因,與背景區(qū)域的對(duì)比度較小。圖2(d)所示為增益調(diào)節(jié)相對(duì)不足條件下的Bscan 圖像。
根據(jù)地下目標(biāo)雷達(dá)圖片直方圖的特性,可以通過(guò)設(shè)置雙閾值自動(dòng)分割地下目標(biāo),其中低閾值用于分割目標(biāo)的暗區(qū)部分,而高閾值用于分割目標(biāo)的亮區(qū)部分,綜合兩部分分割結(jié)果,可以得到地下目標(biāo)的整體分割結(jié)果。
1.3.1 顯著性目標(biāo)分割
顯著性地下目標(biāo)的雙閾值分割算法步驟如下:
P
代表像素點(diǎn)強(qiáng)度為h
的概率,t
代表背景區(qū)域的平均亮度。P
和t
的計(jì)算公式如下:圖3 給出了一個(gè)案例說(shuō)明以上算法對(duì)顯著和非顯著性目標(biāo)的檢測(cè)效果。
圖3 不同顯著程度下的Bscan圖像和其直方圖統(tǒng)計(jì)后分割結(jié)果Fig.3 Bscan images with different saliency and segmentation results after histogram statistics
1.3.2 非顯著性目標(biāo)分割
當(dāng)判斷雷達(dá)圖片上不含顯著性目標(biāo)時(shí),針對(duì)非顯著性目標(biāo)應(yīng)用單獨(dú)的檢測(cè)算法。圖4 展示了一個(gè)包含非顯著性目標(biāo)的雷達(dá)圖片的直方圖及其局部放大圖。可見(jiàn),非顯著性目標(biāo)的直方圖兩側(cè)同樣存在一些目標(biāo)分布造成的局部極值,但是這些局部極值的強(qiáng)度非常低。
圖4 非顯著性目標(biāo)直方圖及其局部放大圖Fig.4 Histogram of nonsignificant objects and its local enlargement
對(duì)于此類非顯著目標(biāo),本文同樣采用以上的雙閾值分割算法進(jìn)行分割,但是在計(jì)算閾值之前,需要對(duì)直方圖進(jìn)行壓縮,針對(duì)非顯著性目標(biāo)檢測(cè)的具體步驟為:
1)引入一個(gè)直方圖壓縮參數(shù)K
。根據(jù)參數(shù)K
確定直方圖的一對(duì)壓縮空間:[0,n
) 和(m
,255],其中n
=K
× 128,m
=255 -n
。在算法中,壓縮參數(shù)K
的取值設(shè)為0.6,確定K
的步驟詳見(jiàn)實(shí)驗(yàn)部分。2)在直方圖[n
,m
]中尋找直方圖的對(duì)稱中心軸i
=i
。非顯著性目標(biāo)分割算法與顯著性目標(biāo)分割算法的步驟幾乎相同,主要區(qū)別在于加入了直方圖的壓縮步驟,并且縮小了閾值的搜索區(qū)間。
圖5 展示了加入直方圖壓縮之后的非顯著性目標(biāo)檢測(cè)效果。經(jīng)過(guò)壓縮后的直方圖在兩側(cè)出現(xiàn)了兩個(gè)明顯的峰值,根據(jù)壓縮直方圖獲得的雙閾值能夠較好地分割非顯著性目標(biāo)區(qū)域,見(jiàn)圖5(c)。
1.3.3 分割結(jié)果篩選。
由于信號(hào)干擾會(huì)在圖像中顯示出一定的噪聲區(qū)域,這些區(qū)域的特點(diǎn)是面積小、存在孤立;尤其在顯著性較差的圖片中,噪聲區(qū)域?qū)?shí)驗(yàn)的干擾更加突出。因此,可以通過(guò)區(qū)域面積的大小和獨(dú)立性對(duì)分割結(jié)果進(jìn)行篩選。區(qū)域面積小于30 或者周圍3×3 個(gè)像素區(qū)域內(nèi)沒(méi)有其他目標(biāo)存在時(shí),認(rèn)為是噪聲,從分割結(jié)果中剔除。圖5(d)中展示了針對(duì)圖5(c)分割結(jié)果的篩選效果。
圖5 非顯著目標(biāo)檢測(cè)效果示例Fig.5 Example of non-salient target detection effect
對(duì)于1.3 節(jié)的分割結(jié)果,進(jìn)一步設(shè)計(jì)分類器對(duì)其進(jìn)行分類識(shí)別。由于每一個(gè)地下目標(biāo)在圖像信息中表示為多次明暗交替的區(qū)域,1.3 節(jié)的目標(biāo)分割結(jié)果往往不能對(duì)應(yīng)地下目標(biāo)的整體區(qū)域,因此在進(jìn)行分類識(shí)別之前,需要對(duì)目標(biāo)分割結(jié)果先進(jìn)行形態(tài)外擴(kuò),引入部分周圍環(huán)境信息。具體的外擴(kuò)方式采用向上下兩個(gè)方向共擴(kuò)增兩個(gè)信號(hào)變換周期的范圍,之后以外擴(kuò)的區(qū)域作為判別區(qū)域,對(duì)分割結(jié)果進(jìn)行目標(biāo)分類識(shí)別。
本文主要設(shè)計(jì)分類器識(shí)別三類常見(jiàn)的目標(biāo),分別是脫空、鋼筋、平行鋼筋。圖6 給出了以上三類目標(biāo)的典型結(jié)構(gòu)示意圖。
圖6 地下目標(biāo)的外觀特征Fig.6 Appearance characteristics of underground targets
從圖6 可見(jiàn),不同類型的目標(biāo)具有自己獨(dú)特的特征:
1)脫空:脫空在探地雷達(dá)圖片上表現(xiàn)為一個(gè)具有多個(gè)不規(guī)則起伏的長(zhǎng)條狀目標(biāo)。由于脫空常分布于較深的地層中,所以脫空通常位于圖片下方。
2)鋼筋:鋼筋表現(xiàn)為一排具有明顯雙曲線結(jié)構(gòu)的區(qū)域。通常多個(gè)鋼筋在同一高度集體出現(xiàn),且位于較淺的地層中,鋼筋常位于圖片中上方。
3)平行鋼筋:平行鋼筋是指探地雷達(dá)采集到的鋼筋側(cè)剖面圖。在雷達(dá)圖片上,平行鋼筋表現(xiàn)為一個(gè)塊狀區(qū)域,且具有無(wú)明顯起伏的規(guī)則外形。
針對(duì)以上目標(biāo)的典型特征,可以利用目標(biāo)的形狀描述特征和紋理特征對(duì)目標(biāo)進(jìn)行分類識(shí)別。本文使用了兩種分類器(SVM和LeNet神經(jīng)網(wǎng)絡(luò))用于識(shí)別以上三類典型的地下目標(biāo)。
在分類器的訓(xùn)練過(guò)程中,需要采集噪聲數(shù)據(jù)作為負(fù)樣本。噪聲在圖像中隨機(jī)分布,面積較小,紋理混亂,呈現(xiàn)為顯著性不強(qiáng)的不規(guī)則區(qū)域。另外,在分類器的訓(xùn)練過(guò)程中,還將其他類別的地下目標(biāo)樣本也作為負(fù)樣本。
算法使用SVM 模型識(shí)別具有典型形狀特征的目標(biāo)。SVM 是一種非常經(jīng)典的監(jiān)督學(xué)習(xí)方法,其旨在找到一個(gè)最優(yōu)超平面,可以把所有訓(xùn)練樣本分離為最優(yōu)的兩類。本文算法中,SVM 使用高斯徑向基函數(shù)核進(jìn)行數(shù)據(jù)映射,輸入特征為目標(biāo)的幾何中心點(diǎn)坐標(biāo)(c
,c
)與長(zhǎng)寬信息(w
,h
)的組合,通過(guò)將多個(gè)SVM 分類器組合,實(shí)現(xiàn)地下目標(biāo)的多分類識(shí)別。算法采用LeNet 模型識(shí)別具有典型紋理特征的目標(biāo)。LeNet 分類器是一種經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò),它的提出是為了解決手寫(xiě)體的文字識(shí)別問(wèn)題,手寫(xiě)文字與地下目標(biāo)的圖像特征有極高的相似度,且具有參數(shù)少、層數(shù)小、訓(xùn)練簡(jiǎn)便等特征,在小樣本數(shù)據(jù)集中仍舊可用,所以本文選擇LeNet 分類器對(duì)地下目標(biāo)的紋理信息進(jìn)行分類。
算法最后將SVM 和LeNet 分類器相結(jié)合,得到最終的識(shí)別結(jié)果。SVM 分類器和LeNet 分類器分別從不同的角度對(duì)每個(gè)分割區(qū)域進(jìn)行分類,輸出每個(gè)分割結(jié)果的類別概率,通過(guò)把兩個(gè)分類器分別得到的概率值相加,即可得到兩個(gè)分類器融合后的總體概率。
圖7 中給出了一個(gè)算法分類器識(shí)別的輸出結(jié)果實(shí)例。從圖7(b)可以看出,由于地下目標(biāo)的明暗區(qū)域之間存在一些高頻信號(hào)區(qū)域,導(dǎo)致最終的目標(biāo)分類識(shí)別結(jié)果在縱向斷裂,為了能夠獲得完整的目標(biāo)識(shí)別結(jié)果,需要對(duì)對(duì)類型的目標(biāo)進(jìn)行整合。
圖7 同類別融合處理步驟Fig.7 Processing steps of same class fusion
算法中采用數(shù)字形態(tài)學(xué)膨脹算法對(duì)同類型目標(biāo)識(shí)別結(jié)果進(jìn)行融合。膨脹核H
選取9×9的自定義核矩陣,其具體形式如下:該膨脹核只對(duì)目標(biāo)區(qū)域進(jìn)行縱向膨脹。
經(jīng)過(guò)數(shù)學(xué)形態(tài)學(xué)融合之后,同類型的目標(biāo)識(shí)別結(jié)果合并為一個(gè)完整目標(biāo),同時(shí)輸出每個(gè)識(shí)別結(jié)果的外包矩形框,見(jiàn)圖7(c)和圖7(d)。圖7(c)為分類結(jié)果為脫空的目標(biāo)區(qū)域的融合,圖7(d)為分類結(jié)果為平行鋼筋的目標(biāo)區(qū)域的融合。圖中使用白色虛線表示了識(shí)別后的外包矩形框,白色實(shí)線表示了人工標(biāo)記的目標(biāo)區(qū)域外接框。由圖7 可見(jiàn),檢測(cè)結(jié)果與人工標(biāo)記的正確結(jié)果非常接近。
首先測(cè)試了算法參數(shù)對(duì)本文算法檢測(cè)效果的影響,然后從定性分析和定量分析兩個(gè)方面在算法的不同階段對(duì)本文提出的算法與傳統(tǒng)的算法進(jìn)行了對(duì)比評(píng)估。在目標(biāo)分割階段,與傳統(tǒng)的一些自適應(yīng)閾值如大津法、雙峰法、迭代法等進(jìn)行了對(duì)比;在目標(biāo)識(shí)別階段,與一些基于深度神經(jīng)網(wǎng)絡(luò)的自動(dòng)分割網(wǎng)絡(luò)模型算法進(jìn)行了對(duì)比。實(shí)驗(yàn)程序的運(yùn)行環(huán)境是1.60 GHz 的i5-10210U CPU 處理器,16 GB 內(nèi)存,操作系統(tǒng)為64 位Windows10,實(shí)驗(yàn)過(guò)程采用Python 編程語(yǔ)言實(shí)現(xiàn)。
為了檢測(cè)算法的通用性和普適性,實(shí)驗(yàn)中所用的數(shù)據(jù)集來(lái)自蘇南碩放國(guó)際機(jī)場(chǎng)、寶雞太白山機(jī)場(chǎng)和廈門(mén)高崎機(jī)場(chǎng)等機(jī)場(chǎng)采集到的探地雷達(dá)數(shù)據(jù)。這些數(shù)據(jù)經(jīng)過(guò)統(tǒng)一的預(yù)處理后,被分割成448×448 像素的雷達(dá)圖片,雷達(dá)圖片被打亂后,隨機(jī)選取三個(gè)不同大小的數(shù)據(jù)集,分別為50、100 和200 張圖片,標(biāo)記為訓(xùn)練集A、B、C,另隨機(jī)抽取36 張圖片作為測(cè)試集。數(shù)據(jù)集中包含的地下目標(biāo)包括脫空、鋼筋、平行鋼筋、地?zé)簟⒊两?、斷裂、鋼筋網(wǎng)等。實(shí)驗(yàn)針對(duì)數(shù)量較多的脫空、鋼筋、平行鋼筋三類目標(biāo)進(jìn)行了標(biāo)注,以上的三類目標(biāo)均采用外接矩形框進(jìn)行標(biāo)注,作為訓(xùn)練數(shù)據(jù)集中的正樣本,其余數(shù)量較少的目標(biāo)與隨機(jī)提取的噪聲合并為訓(xùn)練數(shù)據(jù)集中的負(fù)樣本。數(shù)據(jù)集的具體信息見(jiàn)表1。
表1 實(shí)驗(yàn)數(shù)據(jù)集Tab 1 Experimental dataset
K
,當(dāng)K
取值過(guò)小時(shí),表示對(duì)原始的雷達(dá)圖片幾乎沒(méi)有壓縮,會(huì)將雷達(dá)圖片中的非顯著目標(biāo)與背景圖片混成一片,造成地面目標(biāo)的漏檢;當(dāng)K
取值過(guò)大時(shí),表示直方圖的壓縮率過(guò)高,會(huì)造成目標(biāo)分割結(jié)果中存在大量噪聲。為了確定合適的參數(shù)K
的取值,實(shí)驗(yàn)測(cè)試了不同的參數(shù)K
取值對(duì)目標(biāo)檢測(cè)結(jié)果的影響,具體如圖8 所示。圖8(a)所示的探地雷達(dá)圖片中包含了不同顯著性的地下鋼筋目標(biāo);在實(shí)驗(yàn)中將參數(shù)K
的取值分別設(shè)為0、0.6 和0.8 時(shí),對(duì)應(yīng)的地下目標(biāo)檢測(cè)結(jié)果見(jiàn)圖8(b)~(d)。從圖8 可見(jiàn),在不進(jìn)行直方圖壓縮的環(huán)境下(K
=0),算法只能分割出少量顯著的鋼筋目標(biāo),當(dāng)加入直方圖壓縮后(K
>0),本文算法不僅能夠?qū)D片內(nèi)顯著的鋼筋目標(biāo)分割出來(lái),同時(shí)也能夠成功分割出圖片下部非顯著性的脫空目標(biāo)。但是當(dāng)K
的取值過(guò)大時(shí),同時(shí)算法會(huì)同時(shí)分割出較多的噪聲,見(jiàn)圖8(d)。最終通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)參數(shù)K
取值為0.6 的時(shí)候,既能夠有效分割出顯著目標(biāo)和非顯著性目標(biāo),同時(shí)還能夠避免在分割結(jié)果中產(chǎn)生過(guò)多的噪聲點(diǎn)。因此,在后期的實(shí)驗(yàn)中,K
值設(shè)定為0.6。圖8 K取值對(duì)地下目標(biāo)分割效果的影響Fig.8 Effect of K on underground target segmentation
本文針對(duì)GPR 圖片中的地下目標(biāo)檢測(cè)問(wèn)題設(shè)計(jì)了一種自適應(yīng)雙閾值分割算法。在實(shí)驗(yàn)中,本文算法與其他的自適應(yīng)閾值分割算法進(jìn)行了對(duì)比評(píng)估。對(duì)比算法包括:Ostu 雙閾值算法、自適應(yīng)閾值分割算法、最大熵值分割算法、迭代閾值分割算法、Ostu 閾值分割算法、雙峰分割法。以上各類分割算法的具體描述見(jiàn)文獻(xiàn)[21]。
由于GPR 圖片中目標(biāo)同時(shí)包含明區(qū)和暗區(qū),中間的灰度區(qū)間為背景區(qū)域,所以傳統(tǒng)的單閾值算法無(wú)法實(shí)現(xiàn)三個(gè)區(qū)域的分割。因此,在使用單閾值算法分割地下目標(biāo)之前,需要對(duì)雷達(dá)圖片進(jìn)行變換,將亮區(qū)的像素值轉(zhuǎn)換為關(guān)于中間值128 對(duì)稱的暗區(qū)值,再把圖片從[0,128]的值域線性拉伸到[0,255],以用于對(duì)比算法中的單閾值分割,轉(zhuǎn)換公式如下:
s
為圖片中每一個(gè)像素點(diǎn)的像素值,s
′為該像素點(diǎn)經(jīng)過(guò)轉(zhuǎn)換之后的像素值。各種不同分割算法的分割效果對(duì)比如圖9 所示。圖9(a)為一張包含一個(gè)顯著目標(biāo)的448 像素×448 像素的Bscan 圖像。圖9(b)~(h)分別為以上各種不同分割算法的檢測(cè)效果。
從圖9 可見(jiàn),本文算法獲得了針對(duì)地下目標(biāo)的最佳的分割效果,分割結(jié)果中包含地下目標(biāo)的完整結(jié)構(gòu),同時(shí)幾乎沒(méi)有受到任何噪聲的影響,非常有利于后續(xù)的目標(biāo)分類。相比之下,Ostu 雙閾值算法和自適應(yīng)閾值算法幾乎完全不能用來(lái)分割地下目標(biāo)(圖9(b)和圖9(c)),Ostu 雙閾值算法的核心在于分割結(jié)果的類間方差最大,而自適應(yīng)閾值分割算法的核心在于鄰域內(nèi)相似點(diǎn)擴(kuò)充;兩者的算法思想均完全不適用于探地雷達(dá)圖像的目標(biāo)分割,所以分割效果雜亂,分割結(jié)果中包含了大量噪聲。
最大熵閾值分割和迭代閾值分割得到了地下目標(biāo)的過(guò)分割結(jié)果(圖9(d)和圖9(e))。最大熵閾值分割算法的目的是計(jì)算最佳閾值從而使背景與前景的熵之和最大;迭代閾值分割算法的目的是使分割出的前景和背景的平均值相等。這類算法的灰度區(qū)域都會(huì)大量被兩端平均,所以算法不僅分割出了目標(biāo)區(qū)域,而且還分割出了過(guò)多的噪聲,模糊了明暗區(qū)域的界限,丟失了完整的空間信息和紋理信息。
Ostu 閾值分割算法(圖9(f))可以分割出目標(biāo)位置,同時(shí)保留了空間信息和紋理信息,但是該算法同時(shí)得到了大量噪聲區(qū)域,分割結(jié)果較差。其原因與最大熵分割法相似,雷達(dá)圖像中兩個(gè)峰的大小不一,會(huì)促使閾值向大峰偏移。
圖9 不同分割算法的效果對(duì)比Fig.9 Effect comparison of different segmentation algorithms
雙峰分割算法(圖9(g))被設(shè)計(jì)用于分割直方圖表現(xiàn)為兩個(gè)峰值的圖像。由于本樣例中直方圖也表現(xiàn)為雙峰結(jié)構(gòu),所以雙峰分割算法表現(xiàn)良好。但由于該算法只是簡(jiǎn)單取直方圖最小值位置,算法會(huì)過(guò)早停止迭代,導(dǎo)致分割結(jié)果結(jié)構(gòu)不完整。
本文算法獲得了比Ostu 閾值分割算法更佳的表現(xiàn),其原因在于,本文算法是針對(duì)探地雷達(dá)圖像而專門(mén)設(shè)計(jì)的閾值分割算法,其差異度函數(shù)考慮到了前景區(qū)域和背景區(qū)域的強(qiáng)度分布,弱化了背景區(qū)域的存在系數(shù),將算法的分割權(quán)重集中在明暗兩區(qū)與背景區(qū)域的綜合差異上,而不是計(jì)算類間或類內(nèi)的所有差異,從而既避免了噪聲的干擾,又保證了分割結(jié)果的完整性。
地下目標(biāo)的分類識(shí)別結(jié)果采用表1 中給出的樣本數(shù)據(jù)進(jìn)行對(duì)比測(cè)試。實(shí)驗(yàn)中測(cè)試了三種分類方案的多目標(biāo)分類結(jié)果:1)基于紋理特征的LeNet 神經(jīng)網(wǎng)絡(luò);2)基于形態(tài)特征的SVM 分類器;3)LeNet 和SVM 相結(jié)合。
在實(shí)驗(yàn)過(guò)程中采用準(zhǔn)確率(Precision)、召回率(Recall)和F1 分值(F1-Score)三個(gè)指標(biāo)對(duì)以上三類識(shí)別方案進(jìn)行定量評(píng)估。當(dāng)算法目標(biāo)預(yù)測(cè)區(qū)域的外接框(即檢測(cè)框)與標(biāo)注區(qū)域的圈注框(標(biāo)記框)之間的交集與并集的比例(Intersection over Union,IoU)大于0.5 時(shí),代表算法正確檢測(cè)出了一個(gè)目標(biāo);Precision 表示被檢測(cè)框中被正確檢測(cè)出的數(shù)量占總檢測(cè)框的比例。Recall 表示在標(biāo)記中被檢測(cè)出的數(shù)量占總標(biāo)記框的比例。
F1-Score 為Precision 和Recall 的綜合評(píng)價(jià)指標(biāo),其計(jì)算公式為:
較高的F1-Score 表示在Precision 和Recall 上的評(píng)價(jià)結(jié)果都很高,即算法不僅檢測(cè)出了標(biāo)記目標(biāo),且沒(méi)有誤檢。在本文實(shí)驗(yàn)中以F1-Score 為目標(biāo)分類算法的檢測(cè)指標(biāo)。
表2 給出了在訓(xùn)練集A 上的三種檢測(cè)方案量化對(duì)比評(píng)估結(jié)果。從表2 中可以看出:
表2 每類目標(biāo)最終檢測(cè)結(jié)果評(píng)分值Tab 2 Final test result score of each type of targets
1)SVM 和LeNet 的結(jié)合識(shí)別方案獲得了最好的識(shí)別效果,在所有類別上的平均F1-Score 最高。
2)結(jié)合表2 和1.4 節(jié),當(dāng)僅使用SVM 分類器時(shí),由于不考慮紋理特征,鋼筋與平行鋼筋的位置和大小相似,所以較難識(shí)別,鋼筋和平行鋼筋的準(zhǔn)確率較低;當(dāng)僅使用LeNet 分類器時(shí),由于不考慮位置和大小特征,某些較小脫空與平行鋼筋的紋理相似,所以較難識(shí)別,導(dǎo)致脫空和平行鋼筋的準(zhǔn)確率較低。
3)兩者結(jié)合的方案能夠在所有類別上獲得更為均衡的識(shí)別效果。這是由于不同的目標(biāo)需要通過(guò)不同的特征進(jìn)行檢測(cè),而結(jié)合兩個(gè)分類器,可以綜合兩個(gè)分類器的優(yōu)點(diǎn),使得在各個(gè)類別上都達(dá)到較好的識(shí)別效果。
本文進(jìn)一步分別使用A、B、C 三個(gè)不同大小的數(shù)據(jù)集對(duì)分類器進(jìn)行訓(xùn)練,用于檢測(cè)訓(xùn)練樣本規(guī)模對(duì)算法的影響,訓(xùn)練結(jié)果如表3 所示。由表3 可知:
表3 不同訓(xùn)練集檢測(cè)結(jié)果F1-Score值Tab 3 F1-Score values of different training set test results
1)三個(gè)訓(xùn)練集最終在測(cè)試集上得到的平均F1-Score 的值均在90%以上,本文算法對(duì)地下目標(biāo)的檢測(cè)效果突出。
2)增加訓(xùn)練樣本數(shù)量后,某些類別目標(biāo)的準(zhǔn)確率有略微的增加,這是因?yàn)閿U(kuò)大樣本數(shù)量可以使模型學(xué)習(xí)到更多的特征信息。
3)增加訓(xùn)練樣本數(shù)量后,總體的準(zhǔn)確率不會(huì)有大幅度的提升,主要因?yàn)殡p閾值分割后目標(biāo)的特征明顯,所以使用簡(jiǎn)單的分類器相結(jié)合,在較小的數(shù)據(jù)集上就能發(fā)揮良好的作用。
通過(guò)對(duì)誤檢樣本進(jìn)行綜合分析,可以對(duì)算法的穩(wěn)定性、局限性和可適用性進(jìn)行評(píng)估。圖10 為本文算法測(cè)試實(shí)驗(yàn)出現(xiàn)的典型錯(cuò)分樣例。
圖10 典型的漏檢與誤檢樣例Fig.10 Examples of missed detection and false detection
由圖10 可知:
1)當(dāng)目標(biāo)的顯著性過(guò)低時(shí),如圖10(a),會(huì)被算法漏分割或被檢驗(yàn)為噪聲。當(dāng)目標(biāo)與噪聲特征相似時(shí),如圖10(b),會(huì)被算法檢驗(yàn)為噪聲。以上兩種情況都會(huì)造成算法漏檢,降低算法的Recall 值。
2)與目標(biāo)存在相似結(jié)構(gòu)特征的噪聲會(huì)導(dǎo)致算法的誤檢。如圖10(c)所示,噪聲區(qū)域的部分紋理特征與鋼筋相類似,導(dǎo)致該區(qū)域被誤檢為鋼筋;在圖10(d)中,一個(gè)較小的脫空由于和平行鋼筋類似,被誤檢為平行鋼筋。以上這些情況會(huì)被算法誤檢,降低算法的Precision。
通過(guò)以上分析可知,Bscan 圖像中的噪聲結(jié)構(gòu)存在很大的不確定性,這些不確定性造成的算法局限性是不可避免的。為了減少噪聲給檢測(cè)算法帶來(lái)的影響,需要進(jìn)一步研究噪聲的結(jié)構(gòu)規(guī)律,設(shè)計(jì)針對(duì)性算法。對(duì)于無(wú)法僅依靠大小、位置、紋理特征進(jìn)行檢測(cè)的目標(biāo),需要設(shè)計(jì)利用更高維度特征(如目標(biāo)上下文特征、環(huán)境特征等)的算法進(jìn)行檢測(cè)。
在定量評(píng)估實(shí)驗(yàn)中,本文提出的地下目標(biāo)自動(dòng)分類識(shí)別算法還與目前主流的基于深度學(xué)習(xí)的目標(biāo)識(shí)別算法進(jìn)行了對(duì)比,包括Faster-RCNN、RetinaNet、SSD(Single Shot multibox Detector)等目標(biāo)檢測(cè)模型,由于深度學(xué)習(xí)的模型算法不適用于小樣本,所以以上模型的準(zhǔn)確率極低,甚至根本無(wú)法實(shí)現(xiàn)檢測(cè)。
針對(duì)當(dāng)前探地雷達(dá)地下目標(biāo)自動(dòng)檢測(cè)算法數(shù)據(jù)量需求大、硬件環(huán)境要求高、實(shí)時(shí)性低、準(zhǔn)確率低等缺點(diǎn),本文提出了一種基于直方圖的自適應(yīng)雙閾值分割算法,并且對(duì)目標(biāo)分割結(jié)果從紋理和形狀特征兩個(gè)方面,利用組合分類器進(jìn)行分類識(shí)別。實(shí)驗(yàn)結(jié)果表明:1)本文算法可以快速識(shí)別探地雷達(dá)圖片中的顯著和非顯著目標(biāo);2)本文算法能夠獲得比傳統(tǒng)閾值分割算法更好的分割效果;3)本文算法在不同量級(jí)的數(shù)據(jù)集上對(duì)各類目標(biāo)均能夠獲得高識(shí)別率,平均達(dá)90%以上。本文算法在小樣本數(shù)據(jù)集中獲得了較好的識(shí)別效果,為探地雷達(dá)目標(biāo)檢測(cè)問(wèn)題提供了全新的解決方案。但是對(duì)于更大的數(shù)據(jù)集或者較為復(fù)雜環(huán)境下的目標(biāo)檢測(cè)任務(wù),本文算法的最終準(zhǔn)確率距離傳統(tǒng)深度學(xué)習(xí)檢測(cè)算法還有一定的差距,需要進(jìn)一步研究。