袁曉濤,馬旭成,肖仕軍,鄧兆元,穆拉帝力·穆塔力夫,金海峰
(中國石油集團(tuán)測(cè)井有限公司新疆分公司,新疆克拉瑪依 834000)
電成像圖像的空白條帶填充在信息處理領(lǐng)域?qū)儆趫D像修復(fù)的范疇,主要方法包括基于偏微分方程/變分方法[1]、基于樣本塊匹配方法[2]和基于稀疏表示方法[3]。與傳統(tǒng)的圖像修復(fù)方法不同,目前測(cè)井領(lǐng)域國內(nèi)外主流的空白條帶填充方法是基于HURLEY等[4]提出的多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)Filtersim算法。孫健孟等[5]比較了反距離加權(quán)插值法和Filtersim算法。YAMADA等[6]采用Filtersim算法進(jìn)行電成像孔隙度分析。傅少慶等[7]和王俊華[8]分別應(yīng)用Filtersim算法,填充電成像圖像紋理部分和非均質(zhì)性強(qiáng)的空白條帶區(qū)域。但Filtersim算法填充后的層理連續(xù)性不強(qiáng)[9]。目前,深度神經(jīng)網(wǎng)絡(luò)模型已經(jīng)在計(jì)算機(jī)視覺、自然語言理解等人工智能領(lǐng)域表現(xiàn)出優(yōu)異的性能,特別是卷積神經(jīng)網(wǎng)絡(luò)在圖像分類、圖像語義分割、圖像檢索、目標(biāo)檢測(cè)等圖像相關(guān)領(lǐng)域發(fā)揮出重要作用。在電成像圖像的空白條帶填充方面,也表現(xiàn)出這一趨勢(shì)。首先,王哲峰等基于深度圖像先驗(yàn)原理[10],通過改進(jìn)用于分類的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),形成Encoder-Decoder網(wǎng)絡(luò)模型,在無法取得大量井周全井眼真實(shí)圖像數(shù)據(jù)的情況下,實(shí)現(xiàn)單幅圖像的結(jié)構(gòu)和紋理特征信息推理,對(duì)簡(jiǎn)單結(jié)構(gòu)的砂泥巖剖面圖像的填充效果較Filtersim算法更好[11]。陳建華等[12]在其基礎(chǔ)上進(jìn)行了改進(jìn),提出采用UNet網(wǎng)絡(luò)模型,并結(jié)合skip模式和空洞卷積,進(jìn)行圖像的空白條帶填充。但Encoder-Decoder模型沒有利用編碼器網(wǎng)絡(luò)的低層語義特征,只將高層語義特征進(jìn)行多級(jí)解碼,導(dǎo)致圖像細(xì)節(jié)信息漏失。因此對(duì)于結(jié)構(gòu)復(fù)雜的砂礫巖圖像,填充效果不佳。而UNet模型采用的skip模式將U型結(jié)構(gòu)中相同深度的編碼層和解碼層連接起來,雖然利用了低層語義特征,但其應(yīng)用尺度與解碼層的層級(jí)對(duì)應(yīng),即低層級(jí)的解碼對(duì)應(yīng)低層語義特征,高層語義特征的解碼還是沒有考慮低層語義特征,因此,對(duì)砂礫巖圖像的填充效果雖然較Encoder-Decoder模型有所提升,但效果并不突出。
本文針對(duì)砂礫巖圖像開展了深度神經(jīng)網(wǎng)絡(luò)模型填充方法研究,提出一種融合多層語義特征的編碼網(wǎng)絡(luò)結(jié)構(gòu),在此基礎(chǔ)上構(gòu)建解碼網(wǎng)絡(luò),實(shí)現(xiàn)圖像的同尺度輸出。實(shí)例應(yīng)用表明,本文模型的填充效果較其他兩個(gè)模型更好。
對(duì)電成像測(cè)井來說,獲取井周全井眼圖像數(shù)據(jù),需要測(cè)井儀器多次下井測(cè)量,因而在實(shí)際工程中實(shí)現(xiàn)難度很大。深度圖像先驗(yàn)原理認(rèn)為人為設(shè)計(jì)的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)本身就能夠抓取大量低層級(jí)的圖像統(tǒng)計(jì)先驗(yàn)信息,因此不需要使用大量的樣本對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,僅使用退化圖像就能夠復(fù)原出原圖像。具體地,一般圖像修復(fù)的目標(biāo)為從損壞(退化)圖像中恢復(fù)原始圖像,則修復(fù)圖像可表示為
其中x*為修復(fù)圖像,x0為損壞圖像,R(x)為圖像先驗(yàn)。
構(gòu)造映射函數(shù)g:θ→x,則上述圖像空間中的優(yōu)化問題可等價(jià)為參數(shù)θ空間的優(yōu)化問題,有
可以看出,可通過選擇一個(gè)好的映射g,用隱式先驗(yàn)來替代顯式正則化項(xiàng) R(g(θ)),直接優(yōu)化(2)式的第一項(xiàng)即可。這里的隱式先驗(yàn),具體到深度神經(jīng)網(wǎng)絡(luò)來說,即為網(wǎng)絡(luò)模型的結(jié)構(gòu),Encoder-Decoder模型和U-Net模型為映射函數(shù)g的不同表象,因此網(wǎng)絡(luò)模型結(jié)構(gòu)對(duì)圖像修復(fù)結(jié)果影響很大,這也是本文構(gòu)建新的網(wǎng)絡(luò)模型的目的。
定義 g(θ)≡ fθ(z),則得到:
其中,固定的網(wǎng)絡(luò)輸入z為2通道的網(wǎng)格灰度圖像(MeshGrid),其大小與損壞圖像相同。目標(biāo)函數(shù)模型權(quán)重參數(shù)θ下的網(wǎng)絡(luò)輸出與損壞圖像在掩膜模板m上的均方誤差。這樣,圖像修復(fù)問題可通過網(wǎng)絡(luò)模型參數(shù)θ的優(yōu)化求解。
在網(wǎng)絡(luò)編碼區(qū)的有效特征提取是實(shí)現(xiàn)圖像精準(zhǔn)修復(fù)的關(guān)鍵,而Encoder-Decoder模型和U-Net模型提取的高層語義特征圖比原始圖像的尺寸小,即分辨率比較低,造成部分細(xì)節(jié)信息的損失。因此,本文采用低層語義特征與高層語義特征融合的方式彌補(bǔ)損失的細(xì)節(jié)信息,降低圖像修復(fù)誤差。具體的網(wǎng)絡(luò)模型如圖1所示。
圖1 融合多層語義特征的深度神經(jīng)網(wǎng)絡(luò)模型架構(gòu)Fig.1 Architecture of deep neural network model fusing multi-level semantic features
首先,使用深度卷積神經(jīng)網(wǎng)絡(luò)DCNN的骨干網(wǎng)絡(luò)對(duì)輸入進(jìn)行特征提取。其中骨干網(wǎng)絡(luò)最高層的輸出,進(jìn)入帶有空洞卷積的空間特征提取模塊,其作用是對(duì)骨干網(wǎng)絡(luò)輸出的特征圖進(jìn)行多尺度的信息提取。該模塊的輸出作為高層語義特征,經(jīng)過尺度系數(shù)為4的上采樣層,使高層語義特征張量的高度維和寬度維與骨干網(wǎng)絡(luò)提取的低層語義特征張量一致,這樣低層語義特征張量和高層語義特征張量在張量拼接層實(shí)現(xiàn)了特征的融合。經(jīng)過卷積核為3×3的二維卷積層,規(guī)范輸出特征張量通道數(shù)為256。再由多層解碼網(wǎng)絡(luò)模塊,實(shí)現(xiàn)逐層上采樣。最終輸出通道數(shù)為1的灰度圖像,其高度和寬度與原始輸入張量的高度維和寬度維一致。其中,對(duì)應(yīng)低層語義特征,加入卷積核為1×1的二維卷積層,其作用是降低低層語義特征張量的通道數(shù),減少其特征權(quán)重,再進(jìn)行特征融合。這樣,高層特征有較大的權(quán)重,低層特征也有一定的權(quán)重,能夠避免因低層特征權(quán)重過大造成的網(wǎng)絡(luò)訓(xùn)練難度增大的現(xiàn)象。
DCNN骨干網(wǎng)絡(luò)擔(dān)負(fù)圖像特征提取的重要任務(wù),本文采用帶空洞卷積的深度殘差神經(jīng)網(wǎng)絡(luò)Res-Net101網(wǎng)絡(luò)模型[13],在深度卷積神經(jīng)網(wǎng)絡(luò)中增加殘差網(wǎng)絡(luò),通過學(xué)習(xí)多個(gè)網(wǎng)絡(luò)層輸入、輸出之間的殘差,簡(jiǎn)化學(xué)習(xí)目標(biāo)同時(shí)保護(hù)信息的完整性,解決了網(wǎng)絡(luò)層數(shù)增多時(shí)由于誤差增高、梯度消失而導(dǎo)致訓(xùn)練結(jié)果變差的問題。ResNet101基礎(chǔ)網(wǎng)絡(luò)模型為兩種類型的瓶頸模塊,分別如圖2(a)和(b)所示。
由圖2可以看到,類型1的瓶頸模塊在前饋連接中加入一個(gè)卷積層和批規(guī)范化層,而類型2的瓶頸模塊直接進(jìn)行前饋連接。ResNet101即為分別包含多個(gè)瓶頸模塊的4個(gè)組合層級(jí)聯(lián)網(wǎng)絡(luò)結(jié)構(gòu),其中,第1層的輸出為低層語義特征,而第4層的輸出進(jìn)入帶有空洞卷積的空間特征提取模塊。該模塊利用不同膨脹率的空洞卷積對(duì)輸入張量進(jìn)行特征提取,形成多尺度的特征張量。將這些特征張量沿通道方向進(jìn)行合并,得到規(guī)范化的高層語義特征,避免單一空洞率產(chǎn)生的網(wǎng)格效應(yīng),有利于圖像修復(fù)中局部細(xì)節(jié)信息和整體信息的平衡。多層解碼網(wǎng)絡(luò)模塊設(shè)置2個(gè)尺度為2的上采樣層,實(shí)現(xiàn)逐層上采樣。其中,先進(jìn)行雙線性上采樣,再進(jìn)行最近鄰上采樣。同時(shí),輸入張量的通道數(shù)在該網(wǎng)絡(luò)模塊中逐漸減小,可避免通道數(shù)的突然變化帶來的圖像信息丟失問題。該模塊在有效保持整體信息的基礎(chǔ)上,恢復(fù)圖像的局部細(xì)節(jié)信息。最終輸出通道數(shù)為1的灰度圖像,其高度和寬度與原始輸入張量的高度維和寬度維一致,并且在網(wǎng)絡(luò)輸出端加入Sigmoid層,滿足修復(fù)圖像與損壞圖像在掩膜模板上均方誤差計(jì)算的需求。
如同文獻(xiàn)[12],本文首先選擇 Places365-Standard圖像數(shù)據(jù)集中10張大小為256*256的灰度圖像,疊加文獻(xiàn)[12]中圖5(3)的掩膜模板圖像,作為損壞圖像。圖3給出了文獻(xiàn)[12]中圖7(1)的原始灰度圖像在分別迭代0、1 000、3 000、5 000次時(shí)的網(wǎng)絡(luò)輸出圖像。
圖3中可以看到,當(dāng)?shù)螖?shù)為0時(shí),由于深度神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù)是隨機(jī)的,網(wǎng)絡(luò)輸出類似于噪聲圖像。當(dāng)?shù)螖?shù)為1 000時(shí),圖像的整體信息已經(jīng)呈現(xiàn)出來了,但分辨率較低,說明局部細(xì)節(jié)信息還沒有恢復(fù)。隨著迭代次數(shù)的不斷增加,圖像中樹木的枝條和大樓上的字跡逐漸清晰,說明圖像的細(xì)節(jié)信息得到了有效恢復(fù)。這證明基于深度圖像先驗(yàn)的空白條帶填充方法是可行的。
圖3 多輪迭代輸出圖像Fig.3 Outputed images by different iteration times
圖4 給出了Encoder-Decoder模型、U-Net模型和本文模型對(duì)圖3中原始圖像的空白條帶填充結(jié)果(迭代5 000次)??梢园l(fā)現(xiàn),總體結(jié)構(gòu)上3種模型的結(jié)果大致相同,但Encoder-Decoder模型和U-Net模型圖像上,局部細(xì)節(jié)信息恢復(fù)得不好,如左側(cè)大樓上的字跡和右側(cè)大樓上的多個(gè)黑色矩形窗口,還存在明顯的填充痕跡。而本文模型的填充效果較好,不僅左側(cè)大樓上的字跡更加清晰,且黑色矩形窗口更加連續(xù),沒有明顯的填充痕跡。
圖4 自然場(chǎng)景圖像填充結(jié)果對(duì)比Fig.4 Com parison of filling results of natural scene image
圖5給出了3種模型在多輪迭代下的均方誤差曲線。可以看到3種模型隨著迭代次數(shù)的增加,均方誤差均出現(xiàn)逐步下降的趨勢(shì)。但Encoder-Decoder模型和U-Net模型在迭代2 000次后,均方誤差趨于平緩,其下降趨勢(shì)明顯低于本文模型。本文模型的均方誤差在迭代2 000次后,是3種模型中最小的,且下降趨勢(shì)異常明顯,說明在網(wǎng)絡(luò)模型訓(xùn)練過程中,本文模型較Encoder-Decoder模型和U-Net模型更加迅速地捕捉到了損壞圖像中的結(jié)構(gòu)和紋理特征信息。
圖5 自然場(chǎng)景圖像迭代均方誤差Fig.5 MSE of iteration to natural scene image
為比較3種模型的填充性能,本文根據(jù)選擇的10張自然場(chǎng)景圖像的填充結(jié)果與原始灰度圖像計(jì)算平均像素灰度誤差和SSIM(structural similarity index)兩種定量指標(biāo),進(jìn)行性能比對(duì),結(jié)果見表1。
表1 自然圖像的不同模型性能對(duì)比Tab.1 Filling performance comparison of differentmodels to natural scene image
可以看到,本文模型在平均像素灰度誤差和SSIM兩種定量指標(biāo)的比對(duì)中是最優(yōu)的。較U-Net模型,本文模型的平均像素灰度誤差減小約26%,SSIM指標(biāo)提升約5.1%,驗(yàn)證了本文模型對(duì)自然場(chǎng)景圖像填充的有效性。
實(shí)驗(yàn)數(shù)據(jù)集為YJ油區(qū)Y920井的實(shí)際砂礫巖靜態(tài)測(cè)井電成像圖像,包含粗礫巖、中砂巖、細(xì)礫巖和泥巖等巖性類別。圖6給出了某井段的原始電成像圖像以及3種模型得到的空白條帶填充結(jié)果。圖7為本文模型對(duì)該原始圖像進(jìn)行填充時(shí)多輪迭代的中間結(jié)果。
圖6 砂礫巖電成像圖像填充結(jié)果對(duì)比Fig.6 Comparison of filling results of differentmodels to electrical logging image of glutenite
在實(shí)際處理過程中,網(wǎng)絡(luò)模型的輸出為灰度圖像,本文根據(jù)電成像一維彩色色標(biāo)的灰度索引,將灰度圖像的灰度值映射為一維彩色色標(biāo)中的RGB值,生成二維彩色的填充圖像。從圖7可以看出,迭代0次的網(wǎng)絡(luò)輸出為隨機(jī)噪聲圖像。迭代500次時(shí),網(wǎng)絡(luò)捕獲了圖像的大致輪廓,分辨率較低。隨著迭代次數(shù)的增加,越來越多的圖像細(xì)節(jié)信息被學(xué)習(xí)到,生成的圖像也越來越清晰。比較圖6中3種模型的填充結(jié)果,可以發(fā)現(xiàn)Encoder-Decoder模型和U-Net模型的結(jié)果圖像中填充痕跡很明顯,表現(xiàn)出較強(qiáng)的圖像噪聲,造成礫巖顆粒的邊緣輪廓不清晰、不連續(xù),受到噪聲影響較大,總體視覺效果不佳。而本文模型的結(jié)果圖像中,填充痕跡已基本消除,礫巖顆粒的邊緣輪廓基本完整,總體視覺效果得到較大提升。
圖7 多輪迭代中間結(jié)果圖像Fig.7 Filling images obtained by different iteration times
通過多幅砂礫巖電成像圖像的實(shí)際處理對(duì)比,發(fā)現(xiàn)本文模型較Encoder-Decoder模型和U-Net模型,不僅較合理地填充了圖像內(nèi)容,空白條帶的填充痕跡基本消除,而且填充后的礫巖顆粒邊緣輪廓更為清晰,得到較精確完整的擬合。整體來看,圖像的連續(xù)性更好,砂礫巖圖像的細(xì)節(jié)信息得到準(zhǔn)確恢復(fù),有利于圖像的后續(xù)處理。
針對(duì)復(fù)雜巖性電成像圖像空白條帶填充問題,基于深度圖像先驗(yàn)原理,提出了一種融合多層語義特征的深度神經(jīng)網(wǎng)絡(luò)模型,并利用YJ油區(qū)實(shí)測(cè)的電成像測(cè)井資料進(jìn)行了實(shí)際應(yīng)用,結(jié)論如下:
(1)引入空洞卷積和多尺度特征提取,能夠有效捕獲圖像多尺度信息,同時(shí)融合包含全局內(nèi)容信息的圖像低層語義特征,可有效提升空白條帶填充效果。
(2)在YJ油區(qū)的應(yīng)用結(jié)果表明,本文模型的填充效果更符合人類視覺推理結(jié)果,填充后的礫巖顆粒邊緣更加精確和完整,為圖像后續(xù)處理中礫巖顆粒的提取提供了準(zhǔn)確信息。