耿 磊,史瑞資,劉彥北,3,肖志濤,吳 駿,張 芳
(1.天津工業(yè)大學(xué) 生命科學(xué)學(xué)院,天津 300387;2.天津工業(yè)大學(xué) 電子與信息工程學(xué)院, 天津 300387;3.天津工業(yè)大學(xué) 天津光電檢測技術(shù)與系統(tǒng)重點(diǎn)實(shí)驗(yàn)室,天津 300387)
相較于數(shù)顯式儀表,指針式儀表能夠在多粉塵、強(qiáng)磁場和極寒環(huán)境下工作,具有穩(wěn)定耐用的優(yōu)點(diǎn)。因此,在未來很長一段時(shí)間內(nèi),指針式儀表在工業(yè)生產(chǎn)和監(jiān)測中仍將處于不可替代的地位。在粉塵車間、藥廠等易燃易爆的場所,出于安全考慮,指針式儀表的讀數(shù)不適合由人工完成。而自動(dòng)化讀數(shù)的方法能夠避免操作人員進(jìn)入危險(xiǎn)環(huán)境,并且具有高效和實(shí)時(shí)的優(yōu)點(diǎn),因此擁有廣闊的工業(yè)應(yīng)用前景。
儀表自動(dòng)化讀數(shù)分為儀表檢測、圖像分割、儀表讀數(shù)3部分。其中,儀表檢測和儀表讀數(shù)的方法相對成熟,但圖像分割面臨諸多困難,如:細(xì)小且密集的刻度線不易分割、分割效果易受環(huán)境光照強(qiáng)度變化影響等。特別是當(dāng)光照強(qiáng)度不同時(shí),傳統(tǒng)的圖像分割算法需要不斷調(diào)節(jié)分割閾值才能實(shí)現(xiàn)有效分割,十分不利于自動(dòng)讀數(shù)[1]。
卷積神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的泛化能力,能夠自適應(yīng)分割不同亮度的儀表,解決了人為調(diào)節(jié)分割閾值的問題,但現(xiàn)有語義分割算法不能良好分割具有細(xì)小且密集刻度線的指針式儀表圖像。
為了解決上述問題,本文提出了基于多重感受野UNet的儀表圖像分割方法,由于多尺度感受野是通過多尺度空洞卷積實(shí)現(xiàn)的,因此模型被稱為MacuNet(multi-scale atrous convolutional neural network based on UNet)。實(shí)驗(yàn)結(jié)果表明,該模型有效泛化于不同光照強(qiáng)度下拍攝的儀表圖像,并增強(qiáng)了網(wǎng)絡(luò)對密集刻度線的逐像素點(diǎn)分類能力。
本文的貢獻(xiàn)可總結(jié)為:
(1)本文針對指針式儀表圖像,對細(xì)小且密集目標(biāo)的分割問題進(jìn)行了研究,提出了MacuNet,該模型能夠有效融合高級和低級特征;
(2)本文提出的MacuNet在編碼器和解碼器之間串聯(lián)空洞融合模塊,使得模型更適合編碼和解構(gòu)低級語義特征。本文將編碼器各層級的特征與對應(yīng)的解碼器解構(gòu)的特征相融合,提高了網(wǎng)絡(luò)對多尺度特征的融合能力,從而強(qiáng)化了模型逐像素點(diǎn)預(yù)測的準(zhǔn)確率;
(3)本文通過廣泛的實(shí)驗(yàn)驗(yàn)證了提出模型的有效性。該模型提升了語義分割方法對細(xì)小且密集目標(biāo)分割的效果,同時(shí)解決了對于不同光照強(qiáng)度下拍攝的指針式儀表圖像分割需要調(diào)整閾值的問題。
近年來,基于深度學(xué)習(xí)的圖像語義分割算法被廣泛應(yīng)用在工業(yè)生產(chǎn)中[2]。FCN[3]、PixelNet[4]、UNet[5]、Deeplab[6]等經(jīng)典的圖像語義分割算法相繼被提出,它們都具有泛化能力強(qiáng)、分割效果好的特點(diǎn)。本文提出了基于UNet的強(qiáng)化淺層特征并融合深層特征的方法,旨在提高模型對密集細(xì)小刻度線的逐像素點(diǎn)分類準(zhǔn)確率。
對于不同數(shù)據(jù),采用不同的編碼器能夠取得良好的分割效果。編碼-解碼結(jié)構(gòu)[7]是常見的基于端到端的深度學(xué)習(xí)模型框架。編碼器主要采用卷積、Max Pooling和Batch Normalization[8]等操作對輸入圖像編碼,編碼操作有利于提取圖像深層特征,它的特征提取能力決定了后續(xù)解碼的效果。解碼器采用卷積、ReLU[9]和上采樣等操作對來自于編碼器的特征圖解碼。UNet采用自編碼結(jié)構(gòu),對圖像進(jìn)行編碼-解碼操作。其中,編碼器通常采用ResNet[10]以及Vanilla編碼器[11],由ResNet構(gòu)建的編碼器對于深層特征提取效果明顯,但隨著網(wǎng)絡(luò)加深,網(wǎng)絡(luò)感受野愈發(fā)變大,導(dǎo)致ResNet不能更好地提取小且密集目標(biāo)的特征,進(jìn)而影響逐像素點(diǎn)分類的準(zhǔn)確性。同時(shí),過深的網(wǎng)絡(luò)意味著計(jì)算量的增加,不利于訓(xùn)練。Vanilla自編碼器的編碼部分由三層網(wǎng)絡(luò)結(jié)構(gòu)組成,它是一種有損編碼器,通過Adam優(yōu)化器[12]和均方誤差損失函數(shù)使得模型學(xué)習(xí)壓縮表征。這種編碼器網(wǎng)絡(luò)層次少,能很好地對圖像的淺層信息編碼,但不利于采集更深層的高級語義信息。
現(xiàn)有的經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)模型不能有效分割具有細(xì)小密集刻度線的指針儀表。使用ResNet這類深層網(wǎng)絡(luò),會(huì)使得網(wǎng)絡(luò)感受野過大,導(dǎo)致特征圖中的邊緣信息損失嚴(yán)重,甚至引起目標(biāo)的完全丟失[13];使用Vanilla模塊作為編碼器又會(huì)使得網(wǎng)絡(luò)過淺,導(dǎo)致深層特征不能良好提取深層特征,不利于解碼。因此本文不能單純使用ResNet或Vanilla模塊作為編碼器。同時(shí),考慮到空洞卷積能夠在不增加計(jì)算量的前提下提高網(wǎng)絡(luò)感受野,這種特性有助于改善深層網(wǎng)絡(luò)對細(xì)小且密集目標(biāo)信息丟失的問題,本文提出了MacuNet。
對于像素級分割任務(wù)來說,降采樣操作會(huì)丟失細(xì)節(jié)信息,使得網(wǎng)絡(luò)對于細(xì)小目標(biāo)的邊緣信息獲取能力降低。高階語義特征有助于提升逐像素點(diǎn)分類準(zhǔn)確性,但這意味著模型需要建立在較深的網(wǎng)絡(luò)結(jié)構(gòu)上。深層網(wǎng)絡(luò)結(jié)構(gòu)導(dǎo)致了模型感受野的提高,不利于分割細(xì)小密集的刻度線,這是由于小目標(biāo)與淺層特征聯(lián)系緊密,因此獲取豐富的低級特征信息對于小目標(biāo)圖像分割具有重要意義[14]。為此,本文考慮有針對地改進(jìn)網(wǎng)絡(luò)模塊,提高模型對于細(xì)小密集目標(biāo)的逐像素點(diǎn)分類能力,進(jìn)而設(shè)計(jì)了MacuNet網(wǎng)絡(luò)模型,模型結(jié)構(gòu)如圖1所示。
圖1 MacuNet網(wǎng)絡(luò)模型
本文要解決的問題是提升網(wǎng)絡(luò)對于細(xì)小且密集刻度線特征的提取能力,從而實(shí)現(xiàn)有效分割。由于自編碼器結(jié)構(gòu)有利于建模和解構(gòu)多尺度特征,通過對編解碼器的改造容易實(shí)現(xiàn)不同尺度特征的有效融合從而提升分割效果,因此本文采用自編碼器作為網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu)。有效的邊緣信息往往保留在淺層特征中[15],因此編碼器不能采用過深的網(wǎng)絡(luò),以防止隨著網(wǎng)絡(luò)加深模型感受野變大,導(dǎo)致其對于淺層特征的采樣丟失嚴(yán)重。矛盾的是,使用較淺的網(wǎng)絡(luò)模型又不能獲取豐富的高層語義信息,進(jìn)而影響逐像素點(diǎn)分類性能。因此,為了在更好地保留低級特征的同時(shí)又不犧牲豐富的高層語義信息,本文將Vanilla編碼器改造為只有4次下采樣過程的編碼器,通過這種方式,淺層特征被更好地保留。具體地,改進(jìn)后的Vanilla包括4個(gè)卷積網(wǎng)絡(luò)模塊。每個(gè)卷積模塊由3×3卷積核構(gòu)成,在每個(gè)卷積核后都進(jìn)行Batch-Normalization和ReLU操作,從而更好地建模低層特征,最后進(jìn)行2×2 Max Pooling操作。Max Pooling操作將特征圖中的邊緣和細(xì)節(jié)填充,增大了目標(biāo)在整張?zhí)卣鲌D中的占比,有助于提升模型的最終分割效果。為了解決淺層網(wǎng)絡(luò)不能很好挖掘高階特征的問題,本文設(shè)計(jì)在改造的Vanilla編碼器輸出端插入空洞融合[16]模塊,該模塊采用將3個(gè)空洞卷積級聯(lián)的方式,使得模型在獲取豐富感受野的同時(shí)捕獲更深層的高階語義信息,這彌補(bǔ)了模型在編碼階段的采樣不足,同時(shí)又避免了由于感受野過大導(dǎo)致的模型對于特征圖中細(xì)節(jié)信息遺漏的問題。具體地,二維信號中,對于每一個(gè)位置i, 有一個(gè)輸出y和一個(gè)濾波器ω, 給定特征圖x, 空洞卷積的采樣過程可用式(1)表示為
(1)
式中:r表示對輸入信號進(jìn)行采樣的步長,ω[k] 為濾波器上第k個(gè)位置的權(quán)重。
當(dāng)使用空洞卷積時(shí),膨脹率越大卷積核中的有效權(quán)重越少。當(dāng)膨脹率足夠大時(shí),只有卷積核最中間的權(quán)重有效,此時(shí)的卷積核即退化成了1×1的卷積核,并不能獲取到全局的上下文信息,因而影響模型的分割能力。為了解決這一問題,本文設(shè)計(jì)了空洞融合模塊,該模塊的存在避免了膨脹率的影響,使得網(wǎng)絡(luò)能夠?qū)⒍喑叨壬舷挛男畔⒊浞志酆?,從而有效提升模型對于?xì)小且密集刻度線的分割效果??斩慈诤夏K的詳細(xì)結(jié)構(gòu)如圖2所示。
圖2 空洞融合模塊詳細(xì)結(jié)構(gòu)
具體地,該模塊采用將不同空洞率(空洞率指在常規(guī)卷積核中的相鄰兩權(quán)重之間插入零的個(gè)數(shù)。通常,空洞率=
e
時(shí),相鄰兩個(gè)權(quán)重間插入0的個(gè)數(shù)為
e
-1, 當(dāng)
e
=1時(shí),空洞卷積核為常規(guī)卷積)的空洞卷積核串聯(lián)的方法增大密集運(yùn)算,在減小因稀疏性造成的特征丟失的同時(shí)做到特征互補(bǔ)并融合。在空洞融合模塊的計(jì)算過程中,
表示經(jīng)
n
級空洞卷積核串聯(lián)后,
i
位置的輸出結(jié)果,其表達(dá)式為
(2)
該公式中的變量同式(1),其中,ωn[k] 表示第n個(gè)卷積核中k位置的權(quán)重。
這3個(gè)卷積核的空洞率按照先增后減的方式組合,使得第二個(gè)卷積核彌補(bǔ)了第一個(gè)卷積核由于空洞引起的特征稀疏。同樣,第三個(gè)卷積核彌補(bǔ)了第一、第二個(gè)卷積核的特征丟失,而三者串聯(lián)又可以補(bǔ)全第三個(gè)卷積核的采樣稀疏。空洞融合模塊整體上加大了網(wǎng)絡(luò)深度,同時(shí)又豐富了感受野,使得模型能更好地編碼高級和低級語義特征。由此,模型完成了對輸入圖像的有效編碼。
特征圖的解碼是模型將編碼器生成的特征圖通過上采樣等操作恢復(fù)至原始圖像尺寸,并最終實(shí)現(xiàn)圖像分割的過程。具體地,將編碼器生成的特征圖通過雙線性內(nèi)插的方法,使得生成的特征圖尺寸與對應(yīng)位置編碼器生成的特征圖尺寸相同,并使用3×3的卷積將新生成的特征圖融合,這個(gè)過程即完成了一次解碼。重復(fù)這一解碼過程,直至特征圖尺寸恢復(fù)至原圖像大小,模型即表達(dá)出最終的分割結(jié)果。
(3)
本章,基于指針式儀表數(shù)據(jù)集,將MacuNet與其它方法進(jìn)行了廣泛對比,分析了實(shí)驗(yàn)結(jié)果并展示了最終的測試結(jié)果。
本文對分割出的圖像采用目測評估法和定量指標(biāo)進(jìn)行評定,進(jìn)而對訓(xùn)練出的模型進(jìn)行評估。目測評估法主要是通過觀察測試結(jié)果中細(xì)密刻度線、背景、指針的分割效果來實(shí)現(xiàn)。定量指標(biāo)評定法是以平均交并比mIOU(mean intersection over union)和像素準(zhǔn)確率PA(pixel accuracy)為評估指標(biāo)。設(shè)網(wǎng)絡(luò)輸出包含n+1類(其中包含背景類別),pij表示本屬于第i類卻被分到第j類的像素?cái)?shù)量,若i=j, 則pij表示分類正確的正例數(shù)量。
(1)mIOU按類計(jì)算數(shù)據(jù)標(biāo)注與網(wǎng)絡(luò)分割結(jié)果之間的交并比的平均值,其表達(dá)式如下所示
(4)
(2)PA計(jì)算正確分類的像素與所有像素?cái)?shù)的比值,其表達(dá)式如下所示
(5)
本文按照相同的訓(xùn)練策略,在同一硬件環(huán)境下進(jìn)行如下實(shí)驗(yàn):①與現(xiàn)有的經(jīng)典網(wǎng)絡(luò)進(jìn)行對比;②對比不同空洞率的空洞卷積對分割效果的影響。
本文采集最常見的指針式溫濕度計(jì)圖像作為原始數(shù)據(jù)集,將原始數(shù)據(jù)經(jīng)過旋轉(zhuǎn)、裁剪等操作進(jìn)行數(shù)據(jù)擴(kuò)充,得到由2826張圖像組成的數(shù)據(jù)集。其中,訓(xùn)練集共2253張,測試集共573張,這些圖片的分辨率均為400×400像素。數(shù)據(jù)集中分布的具有不同亮度且包含明暗分界線的圖像有助于提升模型對同種圖像的泛化能力。本文選取了光照強(qiáng)度不同、具有明暗分界線的圖像作為示例,這些示例如圖3所示。
圖3 數(shù)據(jù)集中包含的圖像示例
獲取到上述數(shù)據(jù)后,本文使用標(biāo)注工具對數(shù)據(jù)進(jìn)行標(biāo)注。標(biāo)注的原理是將原始圖像中的刻度線和指針使用外接矩形框出,將這些外接矩形的坐標(biāo)保存到文本文檔中。之后,通過將外接矩形進(jìn)行填充并與400×400像素的純黑色圖像融合得到初始標(biāo)注圖。最后,將標(biāo)注圖轉(zhuǎn)換為單通道的灰度圖,并剔除掉colormap得到最終使用的標(biāo)注圖。
本文按照相同的訓(xùn)練策略,在同一硬件環(huán)境下進(jìn)行如下實(shí)驗(yàn):與現(xiàn)有的經(jīng)典網(wǎng)絡(luò)進(jìn)行對比;對比不同空洞率的空洞卷積對分割效果的影響。通過對比實(shí)驗(yàn)結(jié)果可知,本文的MacuNet在mIOU和PA指標(biāo)上實(shí)現(xiàn)了明顯的提升。本文模型預(yù)測結(jié)果的mIOU和PA分別為0.8088和0.9902,相比較改進(jìn)前的UNet,分別提升了0.149和0.019。此外,本文還與現(xiàn)有的經(jīng)典分割網(wǎng)絡(luò):Deeplabv3+、RefineNet[17]以及ResNet50-PSPNet[18]做了對比實(shí)驗(yàn)。本文的模型通過自編碼機(jī)制實(shí)現(xiàn)高階和低階語義信息編碼,并通過空洞卷積實(shí)現(xiàn)模型的多重感受野互補(bǔ),有效融合了淺層和深層的特征。
由于Deeplabv3+模型自編碼系統(tǒng)存在過度編碼高層語義信息的缺陷,模型缺乏對淺層信息的有效提取,導(dǎo)致其不能對細(xì)密刻度線等特征有效編碼,因此逐像素點(diǎn)分類能力較差;UNet在對圖像編解碼的過程中,不能有效融合淺層特征和高級語義信息,導(dǎo)致模型的預(yù)測結(jié)果出現(xiàn)較為明顯的錯(cuò)分類現(xiàn)象。PSPNet采用池化和卷積操作,使得模型更傾向于表達(dá)深層語義信息,這導(dǎo)致模型對表層信息提取不足,不能有效表征包含密集細(xì)小刻度線的低級特征,因此不適于分割指針式儀表。通過對比預(yù)測結(jié)果,可以很明顯地發(fā)現(xiàn),本文模型對于指針式溫濕度儀表圖像擁有良好的預(yù)測效果。其中,MacuNet相對于UNet在本文數(shù)據(jù)集測試結(jié)果的mIOU提升了0.1518;相對于Deeplabv3+、ResNet50-PSPNet、RefineNet等經(jīng)典網(wǎng)絡(luò)模型,MacuNet在mIOU上分別取得了0.137、0.1794、0.1258的提升。本文提出的模型與現(xiàn)有模型在測試集上預(yù)測結(jié)果的mIOU見表1。
表1 本文提出的模型與現(xiàn)有模型的對比實(shí)驗(yàn)結(jié)果
本文提出的模型與現(xiàn)有經(jīng)典模型分割結(jié)果如圖4所示。從預(yù)測結(jié)果可知,由于本文的模型充分融合了多尺度低級特征,有效學(xué)習(xí)了細(xì)密刻度線之間的特征關(guān)聯(lián),因而有效解決了原始UNet存在的錯(cuò)分類問題,對于細(xì)小刻度線表現(xiàn)出了較好的分割效果。
圖4 提出的模型與現(xiàn)有經(jīng)典模型分割結(jié)果
空洞融合模塊包含兩個(gè)參數(shù):卷積核尺寸和卷積核空洞率。為了探討空洞融合模塊兩個(gè)參數(shù)對模型分割效果的影響,本文進(jìn)行了多組對比實(shí)驗(yàn)??斩慈诤夏K在不同空洞率和不同卷積核尺寸下對模型分割效果的影響結(jié)果見表2。其中,第一列為空洞融合模塊中3個(gè)卷積單元的空洞率。需要說明的是,第一欄的3個(gè)1分別表示空洞融合模塊中的3個(gè)空洞卷積分別是空洞率為1、1、1的卷積核,即該模塊使用的是普通卷積核。第一列第二行的3個(gè)參數(shù)分別表示空洞融合模塊中3個(gè)卷積單元的空洞率分別為2、3、2,以下兩個(gè)欄的中括號的3個(gè)元素意義同此。
表2 空洞融合模塊在不同空洞率和不同卷積核尺寸下對模型分割效果的影響結(jié)果
表2第一行的“尺寸”表示空洞融合模塊中各卷積單元中卷積核的尺寸,如第二列第三行中[5,7,3]表示3個(gè)卷積核單元分別采用空洞率為5、7、3的3種空洞卷積核。第一行的三、四、五列分別表示背景、刻度線和指針的IOU值。對比表格2的結(jié)果發(fā)現(xiàn),使用普通卷積的各項(xiàng)IOU數(shù)值更高,但通過對比預(yù)測圖可知,指標(biāo)的數(shù)值高并不意味著分割效果好。這一現(xiàn)象表明:當(dāng)卷積核的尺寸相同時(shí),相對于單一尺度的常規(guī)卷積核,空洞卷積能夠捕獲多尺度感受野,從而更進(jìn)一步提升網(wǎng)絡(luò)的分割能力。
不同空洞率的MacuNet分割結(jié)果如圖5所示,其中,圖5(a)為卷積單元的空洞率r=1時(shí)模型的預(yù)測結(jié)果,圖5(b)為卷積單元的空洞率r=[5,7,3] 時(shí)模型的預(yù)測結(jié)果。
圖5 不同空洞率的MacuNet分割結(jié)果
實(shí)驗(yàn)結(jié)果表明,當(dāng)r=1時(shí),模型預(yù)測的圖像中仍存在部分像素點(diǎn)錯(cuò)分類的現(xiàn)象。因此,采用不同空洞率的空洞卷積有助于提升模型逐像素點(diǎn)分類準(zhǔn)確率,整體圖像的分割結(jié)果如圖6所示。
圖6 整體圖像的分割結(jié)果
同時(shí),本文還統(tǒng)計(jì)了不同空洞率的卷積單元和原始UNet網(wǎng)絡(luò)在測試集的PA, 對比結(jié)果如圖7所示。
圖7 不同空洞率的卷積單元和原始UNet網(wǎng)絡(luò) 對于測試數(shù)據(jù)預(yù)測的PA
由實(shí)驗(yàn)結(jié)果可知,相較于UNet網(wǎng)絡(luò),本文提出的模型更好地提取了細(xì)密刻度線的信息,將包含豐富細(xì)節(jié)和邊緣信息的低級特征和有助于提升逐像素點(diǎn)分類性能的高級語義特征有效融合,因而本文提出的模型在PA收斂后的像素點(diǎn)預(yù)測準(zhǔn)確率明顯高出原始的UNet網(wǎng)絡(luò)。
之后,本文的模型預(yù)測了在不同光照強(qiáng)度下采集的同種指針儀表數(shù)據(jù)。實(shí)驗(yàn)結(jié)果表明該模型能夠有效分割不同亮度的同種指針儀表,驗(yàn)證了模型的泛化能力。在不同光照強(qiáng)度下采集的圖像及其預(yù)測結(jié)果如圖8所示。其中,圖8(a)中的3張圖像是3種光照強(qiáng)度下采集的原始圖像,圖8(b)中的3張圖像分別是與圖8(a)對應(yīng)的模型預(yù)測結(jié)果,圖8(c)中的3張圖像分別是與之對應(yīng)的傳統(tǒng)(閾值分割)方法分割結(jié)果??梢钥吹?,當(dāng)圖像的亮度相差不大時(shí),閾值分割方法對于小刻度線的分割會(huì)出現(xiàn)鋸齒,這不利于后期對指針和刻度線的擬合,從而影響讀數(shù);當(dāng)圖像的亮度相差較大(如圖8(a)中的1、3兩張圖像)時(shí),傳統(tǒng)算法在不調(diào)節(jié)閾值時(shí),分割效果較差。而本文提出的模型不但可以良好地解決這些問題,還能夠有效抑制并不需要的字符等背景信息的表達(dá)。
圖8 在不同光照強(qiáng)度下采集的圖像及其預(yù)測結(jié)果
最后,為了進(jìn)一步驗(yàn)證該模型對密集小目標(biāo)的分割能力,本文嘗試在另一種指針式儀表數(shù)據(jù)集(后文稱為“復(fù)雜型指針式儀表數(shù)據(jù)集”)進(jìn)行訓(xùn)練并測試。該數(shù)據(jù)集中的儀表圖像具有更為復(fù)雜的背景圖案,這些圖案易對分割產(chǎn)生較大干擾。復(fù)雜型指針儀表數(shù)據(jù)集的示例如圖9所示。從示例圖中可以看到,該數(shù)據(jù)集中的刻度線具有更為復(fù)雜的綠色背景,且指針的寬度接近于刻度線。
圖9 復(fù)雜型指針儀表數(shù)據(jù)集的示例
接下來,本文分別使用傳統(tǒng)算法(基于閾值分割的算法)和MacuNet對測試集中的圖像進(jìn)行預(yù)測。預(yù)測結(jié)果如圖10所示,其中每一行從左至右依次是:原圖、對應(yīng)MacuNet分割結(jié)果以及基于閾值分割的傳統(tǒng)算法分割結(jié)果。
圖10 基于閾值分割的算法和MacuNet預(yù)測結(jié)果
圖10中的第一、二、三行實(shí)驗(yàn)結(jié)果分別表明:當(dāng)使用傳統(tǒng)閾值分割方法對該儀表圖像分割時(shí),在不調(diào)節(jié)分割閾值的情況下,算法錯(cuò)誤分割表盤上的字符,而沒有分割出刻度線和指針等有用信息;算法將表盤上明暗交界線錯(cuò)誤分割,嚴(yán)重影響分割效果;對于背景復(fù)雜的刻度線,算法存在對背景錯(cuò)誤分割而不能正確分割有效目標(biāo),即不能有效分割刻度線和指針的問題,并且算法將表盤中細(xì)長條形背景圖案分割,該圖案易與該數(shù)據(jù)集中同樣具有細(xì)長特征的指針混淆,嚴(yán)重干擾后續(xù)的圖像處理及讀數(shù)等操作。而本文提出的MacuNet模型能夠有效解決上述問題,且分割效果較好。上述實(shí)驗(yàn)結(jié)果表明,MacuNet同樣能夠泛化同類別的復(fù)雜型指針式儀表數(shù)據(jù)集,并取得良好的分割效果。
本文提出了一種基于UNet的針對細(xì)小且密集目標(biāo)的圖像分割方法。本文引入了空洞融合模塊,改進(jìn)了單純過深或過淺的網(wǎng)絡(luò)對圖像特征提取的過度或不足,提升了網(wǎng)絡(luò)對全局信息和高階語義信息的融合能力,從而提升了網(wǎng)絡(luò)對密集細(xì)小目標(biāo)的逐像素點(diǎn)分類準(zhǔn)確率,實(shí)現(xiàn)了對指針式儀表圖像分割效果的提升,并且模型能夠有效泛化于在不同光照強(qiáng)度下采集的同種指針式儀表圖像。本文針對兩種指針式儀表數(shù)據(jù)集進(jìn)行了一系列的對比實(shí)驗(yàn),借此驗(yàn)證本文提出模型的實(shí)際分割能力和對于同類別指針式儀表圖像的泛化能力。盡管本文提出的方法在分割包含密集細(xì)小刻度線的指針式儀表圖像上具有較好的性能,但模型對于亮度相差較大的圖像泛化能力不夠強(qiáng),因此,如何改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)使得模型的泛化能力進(jìn)一步增強(qiáng),對于未來將模型部署在嵌入式設(shè)備上具有重要意義。