王竹筠,楊理踐,高松巍,劉 斌
(沈陽工業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,沈陽 110870)
管道漏磁(magnetic flux leakage,MFL)檢測技術(shù)在長輸油氣管道中發(fā)揮著重要作用.管道漏磁信號的智能化識別一直是當(dāng)今研究的重點(diǎn),其中,對管道漏磁信號成像后的圖像進(jìn)行特征提取是當(dāng)今研究的熱點(diǎn).由于管道漏磁信號比較復(fù)雜,因此漏磁圖像的特征類型也較多,結(jié)構(gòu)也比較復(fù)雜.為了更好地對漏磁圖像進(jìn)行識別,提取特征的有效性可提高分類網(wǎng)絡(luò)準(zhǔn)確率.
陳超[1]利用最大類間方差模糊約束法獲取隸屬度函數(shù)計(jì)算目標(biāo)輪廓特征;桑海峰等[2]將通過相鄰層的特征連接增強(qiáng)信息流動性;姜慧明等[3]將梯度圖多尺度融合至U-Net編碼器;鄭婷月等[4]利用殘差塊學(xué)習(xí)細(xì)節(jié)紋理特征;文獻(xiàn)[5-7]直接將圖像輸入到卷積神經(jīng)網(wǎng)絡(luò)中,其算法能夠自動學(xué)習(xí)圖像特征,減少人工特征提取過程;文獻(xiàn)[8-9]利用變形卷積網(wǎng)絡(luò)有效針對圖像目標(biāo)特征進(jìn)行提??;張軍陽等[10]通過混洗操作改變矩陣卷積方式;文獻(xiàn)[11-12]將低分辨率圖像特征映射成高分辨率特征,實(shí)現(xiàn)圖像的高精度化;Bayar等[13]通過約束卷積層增強(qiáng)圖像特征.在卷積神經(jīng)網(wǎng)絡(luò)中,卷積核的特征提取能力才是決定網(wǎng)絡(luò)分類準(zhǔn)確度的關(guān)鍵.上述文獻(xiàn)主要是從卷積層的結(jié)構(gòu)和計(jì)算方式進(jìn)行改進(jìn),沒有針對卷積核的優(yōu)化方法進(jìn)行深入研究.
本文建立一種稀疏自編碼網(wǎng)絡(luò),對卷積核進(jìn)行優(yōu)化訓(xùn)練,去除冗余的卷積核并提高卷積核對漏磁圖像特征的提取能力,通過加入信息熵相似度約束規(guī)則進(jìn)一步提升卷積核對目標(biāo)和背景信息的區(qū)分能力.
卷積神經(jīng)網(wǎng)絡(luò)(CNN)通過卷積層中的卷積核可自動學(xué)習(xí)特征并直接提取圖像特征.
管道漏磁內(nèi)檢測技術(shù)是通過漏磁檢測器檢測到的漏磁通來判斷管道是否有缺陷存在[14],經(jīng)過圖像處理可得到完整的漏磁偽彩色圖像,如圖1所示.
圖1 管道漏磁偽彩色圖像
從圖1可看出,管道漏磁信號大致有環(huán)焊縫、螺旋焊縫、缺陷等類型.由于管道漏磁信號特征較多,因此同一類型之間的特征也會有區(qū)別,為卷積核的特征提取帶來一定困難.
在卷積神經(jīng)網(wǎng)絡(luò)中,一個(gè)卷積層可以包含很多卷積面.卷積面又稱為卷積特征圖,每個(gè)卷積面都是根據(jù)輸入、卷積核和激活函數(shù)來計(jì)算的.卷積面的輸入通常是一幅或者多幅圖像.卷積核是一個(gè)矩陣,又稱為卷積濾波器,用來提取卷積神經(jīng)網(wǎng)絡(luò)中輸入圖像特征.如果輸入是一幅大小為M×N的圖像,用矩陣X表示,卷積核是大小為m×n的矩陣w,偏置為b,則卷積核的計(jì)算過程如圖2所示.
圖2 卷積核工作原理
卷積層通過卷積核得到輸入圖像從低級到高級的特征.卷積核是一個(gè)權(quán)值矩陣,一般通過隨機(jī)產(chǎn)生一些接近于0的小數(shù)作為初始值.卷積核通過與圖像的卷積運(yùn)算來提取圖像中的不同特征.
卷積層由多張?zhí)卣鲌D組成,每個(gè)特征圖中的神經(jīng)元通過卷積核與上一層特征圖的局部區(qū)域相連.特征圖計(jì)算表達(dá)式為
(1)
卷積神經(jīng)網(wǎng)絡(luò)分類能力的高低主要取決于網(wǎng)絡(luò)對圖像的學(xué)習(xí)能力,即卷積核對圖像的特征提取能力.卷積核的好壞由其內(nèi)部的權(quán)值決定,因此,權(quán)值的選取十分重要.
卷積核的權(quán)值影響網(wǎng)絡(luò)的特征提取能力,通過信息熵相似度約束規(guī)則優(yōu)化卷積核的權(quán)值.
信息熵是一種特征的統(tǒng)計(jì)形式,反映圖像攜帶平均信息量的多少,即表示圖像中灰度分布的目標(biāo)特征所包含的信息量,其表達(dá)式為
(2)
式中,Pij為圖像中顏色值為i像素所占的比例.
在得到圖像信息熵后,利用L1-norm距離進(jìn)行圖像間的相似性度量,圖像間的距離描述為
DL1-norm(p,q)=|H(p)-H(q)|
(3)
式中:p、q為任意兩幅圖像;H(p)、H(q)為圖像對應(yīng)的信息熵.
兩幅圖像空間聯(lián)合信息熵間的距離為
D(p,q)=w1|μp-μq|+w2|σp-σq|
(4)
式中:w1、w2為[0,1]區(qū)間權(quán)重,且二者和為1;μ、σ為距離參數(shù).
卷積核整體能夠包含的特征信息是恒定的,因此在預(yù)訓(xùn)練過程中會出現(xiàn)卷積核之間包含信息不均衡的情況,導(dǎo)致網(wǎng)絡(luò)的分類準(zhǔn)確率低.而信息熵能有效地反映卷積核包含的圖像結(jié)構(gòu)信息,卷積核的信息熵越大,包含結(jié)構(gòu)信息越豐富;反之則結(jié)構(gòu)信息越少.卷積核中存在部分卷積核權(quán)值相同或相似的情況,說明此類卷積核都在學(xué)習(xí)相同的特征,導(dǎo)致卷積核的區(qū)分表達(dá)能力降低,出現(xiàn)冗余信息.
為防止卷積核出現(xiàn)冗余情況,在卷積核訓(xùn)練網(wǎng)絡(luò)中加入信息熵相似度約束限制.約束規(guī)則防止了過擬合的同時(shí)又提高了卷積核的區(qū)分性表達(dá)能力.通過計(jì)算E的大小來判斷卷積核權(quán)值的相似程度,E越大表明相似度越低,反之相似度越高,其計(jì)算表達(dá)式為
(5)
式中,Ki,j和K′i,j分別為任意兩個(gè)卷積卷積核對應(yīng)的權(quán)值.
信息相似度約束規(guī)則可篩選出網(wǎng)絡(luò)的最優(yōu)卷積核.計(jì)算卷積神經(jīng)網(wǎng)絡(luò)中卷積核的信息熵,通過相似度判定條件對卷積核進(jìn)行約束,對不符合條件的卷積核進(jìn)行更新,最終得到符合約束條件的新卷積核.卷積核信息熵約束規(guī)則流程如圖3所示.
圖3 卷積核信息熵相似度約束流程圖
定義單幅圖像中的背景信息熵與目標(biāo)信息熵的比值為φ,通過φ值判斷卷積核提取的目標(biāo)信息與背景信息的差異性,其計(jì)算表達(dá)式為
(6)
式中:A、B分別為背景像素和目標(biāo)像素的數(shù)量;ga(i,j)和gb(i,j)分別為背景和目標(biāo)的像素;Ra、Rb分別為背景和目標(biāo)信息的區(qū)域.
特征圖通過輸入圖像和卷積核相乘得到一個(gè)M×N的矩陣,其中每行表示一個(gè)輸出圖像,共有M個(gè)輸出圖像.輸入圖像矩陣在網(wǎng)絡(luò)中變換為
F=((Ih+2ph-kh)/th+1)·
((Is+2ps-ks)/ts+1)
(7)
式中:I為輸入圖像尺寸;p為擴(kuò)充量;k為減少量;t為步長;下標(biāo)h和s分別為高度和寬度.
從漏磁信號圖像中隨機(jī)采集像素大小為5×5的小圖像色塊作為訓(xùn)練樣本輸入網(wǎng)絡(luò)中進(jìn)行訓(xùn)練.網(wǎng)絡(luò)訓(xùn)練過程如下:
1)對每個(gè)樣本色塊進(jìn)行前向傳播計(jì)算.當(dāng)輸入樣本為xi時(shí),隱含層的輸入和輸出計(jì)算表達(dá)式為
(8)
(9)
式中:α為學(xué)習(xí)速率;δi為殘差.
在訓(xùn)練過程中不斷計(jì)算殘差的數(shù)值,當(dāng)殘差值小于設(shè)定的閾值0.8時(shí)則判定參數(shù)收斂,得到更新后新卷積核K′i,j.
本實(shí)驗(yàn)選擇Caffe環(huán)境作為實(shí)驗(yàn)平臺,處理器為Inter(R)Core(TM)i7-7700k CPU@4.20 GHz,GPU采用的是NVIDIA GTX 1070,RAM空間大小為16.0 GB,開發(fā)工具為Visual2013和Matlab.
實(shí)驗(yàn)數(shù)據(jù)集包括600張管道漏磁偽彩色圖像,每張圖像大小為140×320,樣本圖像如圖4所示.將600張管道漏磁圖像Ii,j的樣本庫直接輸入到改進(jìn)后的網(wǎng)絡(luò)模型中,其中450張作為訓(xùn)練集,150張作為測試集.設(shè)置單次處理批數(shù)為40,步長為2,學(xué)習(xí)率為0.000 1,迭代次數(shù)為5 000次.將優(yōu)化后得到的卷積核賦予給CNN網(wǎng)絡(luò),卷積核按照從左到右,從上到下原則進(jìn)行遍歷.
圖4 實(shí)驗(yàn)樣本圖像
將200張小色塊圖像作為樣本分別輸入到有信息熵約束和無信息熵約束的網(wǎng)絡(luò)中進(jìn)行實(shí)驗(yàn),設(shè)置迭代次數(shù)為1 200,卷積核數(shù)目為40,卷積核大小為5×5.卷積核優(yōu)化前后信息熵對比結(jié)果如圖5所示.
圖5 卷積核優(yōu)化前后信息熵對比
從圖5中可看出,優(yōu)化后卷積核信息熵差值越來越小,控制了網(wǎng)絡(luò)的過擬合,而優(yōu)化前的卷積核信息熵則幾乎保持不變,保持在約35%,說明此時(shí)各卷積核攜帶的圖像特征信息變得更加均衡.多次實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果表明,當(dāng)卷積核信息熵之間差距為15%時(shí),卷積核提取到的目標(biāo)像素和背景像素的平均比值相差最大,且卷積核會提取到較為完整的目標(biāo)特征.
為進(jìn)一步確認(rèn)卷積核的優(yōu)化情況,需通過相似度判定來確定卷積核是否有冗余現(xiàn)象.本實(shí)驗(yàn)在預(yù)訓(xùn)練網(wǎng)絡(luò)中加入相似度約束條件,根據(jù)卷積核提取到的特征信息量來設(shè)定相似性判斷的閾值ε,統(tǒng)計(jì)分析表明,當(dāng)卷積核之間的相似性參數(shù)小于0.5時(shí),它們提取的圖像特征幾乎相同,因此本實(shí)驗(yàn)設(shè)置ε=0.5.計(jì)算圖4中卷積核兩兩之間的相似度參數(shù)E,以前4個(gè)卷積核(K1~K4)為例,結(jié)果如表1所示.
表1 卷積核優(yōu)化前后權(quán)值相似度對比
由表1可以看出,優(yōu)化前K1,4、K3,4之間的相似度參數(shù)小于設(shè)定閾值,說明K1、K3、K4差異性小,三個(gè)卷積核的權(quán)值相近,存在冗余現(xiàn)象.故將K3、K4卷積核進(jìn)行初始化,通過迭代更新權(quán)值,再次計(jì)算K1、K4、K5卷積核之間的相似度參數(shù)E.
將圖4中的6幅圖像輸入到卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行驗(yàn)證,計(jì)算目標(biāo)與背景的像素值,從而得到圖6所示的優(yōu)化前后目標(biāo)與背景像素的對比度.
從圖6a中可看出,未經(jīng)預(yù)訓(xùn)練的卷積核在提取圖4e的目標(biāo)特征時(shí),特征圖中目標(biāo)像素和背景像素的對比度最大值為2.01;在圖6b中,利用預(yù)訓(xùn)練卷積核對圖4e進(jìn)行特征提取后生成的特征圖像素對比度可達(dá)2.62,大于未經(jīng)預(yù)訓(xùn)練的卷積核,說明優(yōu)化網(wǎng)絡(luò)提高了卷積核對圖像目標(biāo)特征的學(xué)習(xí)能力,可以有效區(qū)分目標(biāo)與背景.
為了驗(yàn)證優(yōu)化后卷積核的有效性,將優(yōu)化卷積核應(yīng)用到卷積神經(jīng)網(wǎng)絡(luò)中,并與原始卷積神經(jīng)網(wǎng)絡(luò)分類結(jié)果進(jìn)行對比,對比結(jié)果如表2所示.
從表2中可看出,卷積核數(shù)量為40,大小為5×5時(shí)網(wǎng)絡(luò)分類效果最優(yōu)、工作效率最高.實(shí)驗(yàn)結(jié)果表明,優(yōu)化卷積核后的網(wǎng)絡(luò)相較于原始網(wǎng)絡(luò),其提取特征能力更佳,網(wǎng)絡(luò)分類準(zhǔn)確率更高,分類效果更好.
將圖4d、f進(jìn)行可視化,優(yōu)化卷積核提取特征效果如圖7所示.由圖7可知,優(yōu)化后的卷積核能較好地提取出管道漏磁圖像的焊縫、缺陷等特征,特征的邊緣信息完整,為之后網(wǎng)絡(luò)的分類提供重要依據(jù).
圖6 優(yōu)化前后目標(biāo)與背景像素對比度
表2 卷積核優(yōu)化前后網(wǎng)絡(luò)分類準(zhǔn)確率對比
圖7 優(yōu)化卷積核特征提取效果圖
本文提出了一種通過信息熵相似度約束規(guī)則對卷積核優(yōu)化算法,實(shí)現(xiàn)了對管道漏磁偽彩色圖像特征的提取.通過實(shí)驗(yàn)對比分析可知:利用相似度判定法則對各卷積核進(jìn)行信息熵相似度約束判定,通過判定結(jié)果剔除相同或者相似的卷積核,更新卷積核權(quán)值,從而優(yōu)化網(wǎng)絡(luò)中的卷積核,減少冗余信息的存在,提高了卷積核對特征的區(qū)分表達(dá)能力,同時(shí)防止網(wǎng)絡(luò)過擬合.