尚佳童,雷濤,張棟,杜曉剛,翟鈺杰
(1.陜西科技大學陜西省人工智能聯(lián)合實驗室,西安 710021;2.陜西科技大學電子信息與人工智能學院西安 710021)
隨著國民經(jīng)濟的飛速發(fā)展,國內生產(chǎn)生活對能源的需求與日俱增,石油已成為我國需求量最大的能源之一。但目前我國油田逐漸進入中高含水期,開采十分困難。通過去離子水來驅使剩余油是目前最為有效且環(huán)保的油藏驅替方法之一[1]。近年來,為提高能源利用效率,明確研究水驅剩余油的開采現(xiàn)狀,提升我國石油資源在國際上的競爭力,國內外學者不斷探索新方法來研究水驅剩余油的形成與分布機理,其中應用最廣泛的技術是電腦斷層(Computed Tomography,CT)掃描實驗法[2]和微觀仿真模型法[3]。
CT 掃描實驗法是利用X 射線對巖石樣本與孔隙不同的吸收率層析構建三維形狀,在不改變巖心狀態(tài)的條件下完成驅替實驗。然而,CT 掃描實驗法通常面臨掃描分辨率較低且實驗數(shù)據(jù)獲取困難的問題,導致實驗數(shù)據(jù)誤差較大。微觀仿真模型法是研究人員使用最廣泛的方法之一,該方法將玻璃刻蝕仿真模型與微觀圖像采集系統(tǒng)相結合,利用數(shù)值模擬測試將巖石還原在以聚二甲基硅氧烷[4]為主材料的120 mm×120 mm 刻蝕板上,用于模擬不同巖層的驅替情況。該方法通過使用去離子水和礦物油模擬水驅油過程,實現(xiàn)微觀驅替動態(tài)可視化[5]。對采集到的圖像進行分析,可計算出不同流體黏度、不同注入速度、不同原始含水飽和度多方面因素對水驅油效果的影響,分析水驅前后的油水分布規(guī)律,對油藏水驅油機理具有重要的研究意義。
研究人員通常使用人工標記的方法分離油水像素,通過標記含油區(qū)域和含水區(qū)域來計算驅油率,主觀性強且耗時耗力,對后續(xù)的研究造成了極大的困擾[6]。受拍攝環(huán)境和芯片材質的影響,所采集到的驅替刻蝕圖像往往存在圖像模糊、色彩對比度低、噪聲大等問題。此外,由于在驅替過程中往往存在水油交融的狀態(tài),導致水油界限不明確,呈現(xiàn)出非剛性的狀態(tài)[7]。
本文提出一種輕量可變形編解碼網(wǎng)絡(Lightweight Deformable Encoder-Decoder Network,LDNet),在特征編碼階段,通過設計輕量可變形特征編碼(Lightweight Deformable Feature Encoder,LDFE)模塊,實現(xiàn)對刻蝕圖像的特征提取。將通道和空間充分解耦,以有效降低網(wǎng)絡特征信息的冗余,加快網(wǎng)絡的推理速度,進一步減少內存資源的消耗。在特征融合階段,引入?yún)f(xié)同耦合注意力模塊(Co-Coupling Attention Module,CCAM),通過將空間信息與通道信息融合,增強模型的魯棒性。
目前常用的圖像分割方法主要分為傳統(tǒng)方法和深度學習方法兩類。傳統(tǒng)的圖像分割方法主要分為閾值分割法[8-10]、區(qū)域生長法[11]和聚類法[12-13]。這些方法均依賴于嚴格的計算方法,且需要人工干預,針對簡單場景下的分割任務效果較好。但由于其通常為人工設計的淺層特征,對復雜場景的分割效果較差。此外,傳統(tǒng)方法對超參數(shù)較敏感,容易忽略圖像像素屬性間的相關性,導致對油藏驅替刻蝕圖像分割效果較差。
隨著深度學習的發(fā)展,卷積神經(jīng)網(wǎng)絡由于其強大的特征表達能力,目前已被廣泛應用于圖像分割領域。LONG等[14]提出端到端的全卷積神經(jīng)網(wǎng)絡(Fully Convolutional Network,F(xiàn)CN),實現(xiàn)了像素級的圖像分割。由于FCN 網(wǎng)絡對高低層特征融合較差,因此針對邊緣分割結果較粗糙。為解決上述問題,RONNEBERGER等[15]提出U-Net 網(wǎng)絡。因其采用完全對稱的編解碼結構,并使用跳躍連接實現(xiàn)了較好的高低層特征融合,因此U-Net 成為圖像分割任務的骨干網(wǎng)絡。然而U-Net 中卷積層和池化層的大量堆疊會造成全局信息的丟失和計算量的增加,且使用標準的方形卷積提取特征,限制了網(wǎng)絡對幾何形變較大目標的精準分割。雖然使用跳躍連接有助于獲取不同層級的語義信息,但對圖像細節(jié)的感知能力較差,導致分割精度較低。目前研究人員基于U-Net 的改進主要分為特征編碼結構設計和特征融合策略優(yōu)化。
設計特征編碼結構是為了更好地進行特征提取,解決下采樣過程中不斷堆疊卷積層和池化層帶來的語義上下文信息丟失問題,其主要分為卷積層之間的連接方式以及卷積操作的改進。在卷積層之間的連接方式上,研究人員通常為了獲取更多的上下文信息而構建更深層次的連接。例如H-DenseUNet[16]和Res-UNet[17]通過使用殘差連接和密集連接策略,將淺層的輸出和深層的輸出求和或拼接作為下一階段的輸入,增加特征復用,從而緩解梯度消失問題,但其在檢測細微的組織結構時性能較差。針對卷積操作的改進,常用方法是通過設計不同的卷積算子來擴大感受野,以獲取更豐富的上下文信息。其中CE-Net[18]利用不同尺度的空洞卷積構成4 個級聯(lián)分支來捕獲更廣泛的多尺度語義信息。但該網(wǎng)絡使用空洞卷積容易丟失相鄰像素的信息,進而造成網(wǎng)格效應,導致分割結果粗糙。為解決該問題,LI等[19]提出Rednet 網(wǎng)絡,通過使用與卷積性質相反的內卷算子使其根據(jù)圖像不同的空間位置自適應調整卷積核參數(shù)。另外,DefED-Net[20]在編碼階段使用了可變形卷積,雖然解決了固定卷積核與分割目標形狀不匹配的問題,但同時也引入了巨大計算量,導致內存需求變高。
為補充編碼器和解碼器路徑之間的語義差距,U-Net++[21]通過連接不同層級的特征,將編碼器的細粒度特征與解碼器的語義特征通過跳躍連接進行融合,從而獲取網(wǎng)絡的細節(jié)特征。另外,注意力機制可以自適應計算通道或空間域中的特征重要性,提取圖像的關鍵信息,有效改善特征圖融合效果。例如,Attention U-Net[22]通過生成一個門控信號控制不同空間位置的重要性,提高模型的特征表達能力。SmaAt-UNet[23]和CBAM[24]通過在通道注意力后進行全局池化來引入空間注意力機制,從而增強特征的提取能力。但其對空間信息丟失嚴重且忽略了特征之間的關系,并且全局池化只能捕獲局部信息,無法獲得全局的上下文信息。
盡管以上研究解決了圖像分割面臨的部分難題,但將其應用于油藏刻蝕圖像分割時仍然面臨2 個問題:
1)常規(guī)分割網(wǎng)絡中使用幾何形狀固定的卷積核與刻蝕圖像形狀、結構復雜的特性無法匹配。標準卷積固定大小的感受野使網(wǎng)絡對幾何變換的建模能力大幅縮減,對細小目標如水油交融的邊界區(qū)域分割較差。雖然已經(jīng)有可變形卷積在圖像分割領域的應用,但龐大的計算量與參數(shù)量導致網(wǎng)絡優(yōu)化困難。
2)目前的注意力網(wǎng)絡雖然使用通道和空間注意力來增強特征,但沒有考慮通道和空間之間的聯(lián)系,導致分割結果較為粗糙。另外,現(xiàn)有的混合注意力模型大多使用全局平均池化,特征圖在經(jīng)過卷積后每個位置都包含了局部區(qū)域的信息,這些方法只考慮了局部特征,無法對視覺任務所必需的長距離依賴進行建模。但對于油藏刻蝕圖像分割來說,全局的上下文信息對細小目標的分割至關重要。
本文提出LDNet 網(wǎng)絡,通過設計LDFE 模塊和引入CCAM 模塊,使用殘差瓶頸模塊及融合高層次語義信息,提高模型的分割精度和推理速度。
針對油藏驅替刻蝕圖像的特點,本文提出輕量可變形編解碼網(wǎng)絡(LDNet),并將其應用于刻蝕圖像分割以便于快捷有效地計算后續(xù)驅油率。如圖1所示(彩色效果見《計算機工程》官網(wǎng)HTML 版),LDNet 主要由LDFE 模塊、協(xié)同耦合注意力特征融合模塊以及特征解碼模塊組成。在編碼階段,將U-Net的常規(guī)卷積替換為LDFE 模塊,使其根據(jù)油藏驅替圖像的油相和水相的形狀改變采樣點的偏移量,獲取更豐富的特征信息并減少固定大小感受野帶來的全局信息損失,從而提高模型的特征表達能力。在特征融合階段,使用本文提出的協(xié)同耦合注意力模塊將空間信息與通道信息融合,以減少噪聲的影響并得到更精細的特征。同時,為了解決可變形卷積訓練困難的問題,本文引入殘差連接加快網(wǎng)絡擬合速度。解碼階段使用常規(guī)的U-Net 上采樣模塊使特征圖恢復至原圖大小。
圖1 輕量可變形編解碼網(wǎng)絡結構Fig.1 Structure lightweight deformable encoder-decoder network
刻蝕圖像背景復雜,油相與水相呈現(xiàn)出非剛性結構。常規(guī)的分割網(wǎng)絡大多使用固定形狀的方形卷積核進行特征學習,如CE-Net[18]、mU-Net[25]等。由于常規(guī)卷積單元在輸入的特征圖固定位置進行采樣,對刻蝕圖像上下文信息的提取能力較弱,因此大幅限制了其對形狀豐富且復雜的油藏刻蝕圖像的多尺度信息提取能力。
為此,本文提出LDFE 模塊,通過在卷積操作中增加一個偏移量,使卷積形變?yōu)椴灰?guī)則形狀,以達到適應多變的水油形狀的目的。為解決增加偏移量帶來的參數(shù)冗余和訓練困難的問題,如圖2 所示,使用深度卷積和逐點卷積對卷積的空間和通道相關性進行解耦,在保證卷積層特征提取能力的同時降低參數(shù)量和計算量,提高模型的推理速度。為適應非剛性的水相與油相的特征,LDFE 模塊可實現(xiàn)卷積核在不同位置、不同尺度與形狀的偏移。通過學習偏移位置,提供任意形狀的卷積核,從而自適應地確定感受野的尺度并獲得更好的定位能力。其中,一個LDFE 模塊包含卷積層、偏移量計算層、歸一化層和激活層。輸入特征圖x經(jīng)過常規(guī)的卷積操作后,輸出特征圖y(·)通??杀槐硎緸槭剑?)所示:
圖2 輕量可變形特征編碼模塊Fig.2 Lightweight deformable feature encoder module
其中:D表示在模型訓練期間卷積核的感受野;m0代表目標像素點;mn表示目標像素點落入感受野中的位置;w(·)代表卷積學習到的權重。
不同于常規(guī)卷積,特征圖x通過LDFE 模塊后,輸出的特征圖可被定義為式(2)所示:
其中:可學習偏移量{△mn|mn∈D}使采樣的位置變的不規(guī)則,mn通常為浮點型數(shù)據(jù)。為了確保獲取到的偏置值均為整數(shù),使用雙線性插值確定采樣位置的像素值,最終采樣位置的像素值yp(m0)定義為式(3)所示:
其中:ei表示學習到的權重;pj表示卷積的鄰域像素;H(·)代表雙線性插值操作。對于輕量可變形卷積的每一層,當卷積層的輸入是N個通道的特征圖時,相應的偏置為2N個通道,這是因為每個通道分別包括x和y方向上的2 個偏移映射。在獲得所有采樣位置的像素值后,將生成新的特征映射。在訓練期間,網(wǎng)絡同時學習生成輸出特征圖的輕量可變形卷積的權重和用于計算偏移量的卷積核權重。
為減少可變形卷積的計算復雜度,本文引入深度卷積與逐點卷積替代可變形卷積中每一層的常規(guī)卷積。在常規(guī)卷積中,通過跨通道維的卷積核實現(xiàn)空間與通道間相關性的聯(lián)合映射,容易造成特征信息的冗余。而通過深度卷積與逐點卷積解耦空間與通道間相關性,能夠在提高網(wǎng)絡特征表達能力的同時減少計算復雜度,實現(xiàn)網(wǎng)絡輕量化。
具體地,輸出特征圖x的尺寸為H×W×N,常規(guī)卷積核計算量為K2×M×N×H×W,可變形卷積的計算量為K2×M×H×W×2+K2×M×N×H×W,輕量可變形卷積的計算量為K2×M×H×W×2+H×W×M×N。與可變形卷積相比,本文提出的LDFE模塊的計算量可縮減為可變形卷積的0.6 倍,其中M為輸入特征的通道數(shù),N為輸出特征的通道數(shù),卷積核大小為K×K,H、W分別為輸入特征的高度與寬度。此外,為獲取到更精細的油水相分割結果,在每一LDFE 模塊后使用殘差設計,從而避免網(wǎng)絡層數(shù)過深帶來的梯度消失現(xiàn)象,加速網(wǎng)絡的收斂。
LDFE 模塊主要解決了油藏刻蝕圖像中水相與油相的非剛性邊界分割困難的問題,其感受野可以隨著水油相的尺寸、大小和形狀進行自適應調整,在提高分割精度的同時降低了網(wǎng)絡的計算和內存開銷。
由于油藏刻蝕圖像存在噪聲大、水油交融邊界模糊、區(qū)域幾何形狀復雜等問題,導致圖像分割邊緣粗糙,因此本文使用注意力機制增強模型的表征能力,通過聚焦于重要區(qū)域和通道,抑制噪聲的影響,提高模型對輸入噪聲的魯棒性[26],從而提高模型在圖像邊緣處的分割精度。當前主流的注意力機制可以分為空間注意力[27]、通道注意力[28]和混合注意力機制[29]。通道注意力機制主要通過捕獲任意2 個特征圖之間的通道依賴關系獲得權重信息,通過對所有通道進行加權,從而提升網(wǎng)絡的分割精度,但其忽略了空間位置信息。針對該問題,BAM 和CBAM 模塊試圖通過減少輸入的通道維數(shù),使用全局池化來對空間信息進行全局編碼,以獲取位置信息。但這些方法忽略了空間和通道維度的全局特征依賴關系,對于細小目標的特征提取能力有限。
對于形狀與位置復雜的刻蝕圖像分割任務,空間信息與通道信息的關系對精細目標的分割至關重要。為解決該問題,本文提出CCAM 模塊,其具體結構如圖3 所示。由圖3 可知,CCAM 模塊通過在通道注意力中耦合不同方向的空間位置信息,捕獲位置信息和通道之間的關系,實現(xiàn)跨通道和空間的交互和信息整合,從而獲取全局依賴關系和長程上下文信息,建立并提升模型的全局信息提取能力。
圖3 協(xié)同耦合注意力模塊Fig.3 Co-coupling attention module
具體地,協(xié)同耦合注意力機制通過將通道注意力分解為2 個并行的一維特征編碼,利用2 個一維的特征編碼分別沿垂直和水平方向將輸入特征聚合為2 個獨立的位置映射。將這2 個具有嵌入方向信息的特征圖分別編碼為兩個注意圖,每個注意圖捕獲輸入特征中沿一個空間方向的長程依賴關系。最終,將得到的2 個注意力權重與輸入特征圖相乘,以提高模型的定位能力,從而精準地識別水油區(qū)域。
在通道注意力中,通常使用全局池化對空間信息進行全局編碼,然而該操作將全局空間信息壓縮到通道信息中,難以保留位置信息。為了使注意力模塊獲得空間位置信息,首先使用尺寸為(h,1)或(w,1)的卷積核對輸入特征圖x進行平均池化,使其沿水平坐標和垂直坐標對通道進行編碼,水平方向的輸出表達式如式(4)所示:
其中:x為給定的輸入;h為給定特征圖的高度;c為給定特征圖的通道數(shù)。
同理可得,寬度為w的第c個通道的輸出表達式如式(5)所示:
將上述2 個方向的變換分別沿空間方向聚合特征,得到一對方向感知的特征圖,這與在通道注意力方法中產(chǎn)生單一特征向量的SE 模塊[28]不同,其可通過注意力模塊捕捉到沿著一個空間方向的長距離依賴關系,并保存沿著另一個空間方向的精確位置信息,有助于網(wǎng)絡更準確地定位感興趣的目標。
為更好地利用上述模塊生成的注意力圖,本文充分利用捕獲到的位置信息,使通道與位置信息進行更充分的融合,使用2 層共享的1×1 卷積進行變換,得到卷積變化函數(shù)S1水平方向和垂直方向空間信息的特征圖f,其表達式如式(6)所示:
其中:[·]表示沿空間維度的拼接運算;σ(·)為非線性函數(shù)。為降低模型的復雜度,常以適當?shù)耐ǖ缐嚎s率r來減少特征圖的通道數(shù)。將特征圖沿著空間維度切分為2 個單獨的張量th∈和tw∈,進而得到:
其中:δ為sigmoid 激活函數(shù);Sh為h方向1×1 卷積變換;Sw為w方向1×1 卷積變換。最后將其作為權重疊加在原圖上,得到協(xié)同耦合注意力,其表達式如式(9)所示:
與只關注通道或空間重要性的注意力不同,本文提出的CCAM 模塊將位置信息嵌入到通道注意力中,并進行了充分融合。水平和垂直方向的注意力同時被施加到輸入特征中,使協(xié)同耦合注意力更準確地定位感興趣對象的確切位置,從而幫助模型實現(xiàn)更準確的目標定位。
為充分證明本文LDNet 網(wǎng)絡的有效性和泛化性,在刻蝕圖像數(shù)據(jù)集上進行了消融實驗和對比實驗。設計的消融實驗詳細驗證了LDFE 模塊和CCAM 模塊的優(yōu)越性。通過與不同分割算法在油藏驅替刻蝕圖像數(shù)據(jù)集上的對比分析,充分證明LDNet 網(wǎng)絡的有效性。
本文用于實驗的數(shù)據(jù)集共包含1 014 張不同時刻、不同孔隙度與孔喉比大小的油藏驅替刻蝕圖像,圖像分辨率為5 120×5 120 像素,每張圖像對應一張人工標注結果,其中人工標注結果均來自于2 名該領域的專家。根據(jù)3∶1∶2 的比例,隨機選取了507 個圖像作為訓練集,169 個圖像作為驗證集,剩余的338 個圖像作為測試集,部分測試圖如圖4 所示(彩色效果見《計算機工程》官網(wǎng)HTML 版本)。為提高訓練的效率和泛化能力,將所有圖像尺寸裁剪為256×256 像素,并進行隨機水平翻轉、旋轉、添加噪聲等操作,以增強數(shù)據(jù)。
圖4 刻蝕圖像數(shù)據(jù)集示例Fig.4 Examples of etched image dataset
為評價刻蝕圖像的分割結果,使用主流的圖像分割算法指標來衡量模型的性能,主要包含分割精度(Dice)、交并比(mean Intersection over Union,mIOU)和召回率(Recall),這些評價指標定義如下:
其中:n表示預測結果的類別數(shù);TTP表示分割正確的正類數(shù)目;TTN是分割正確的負類數(shù)目;FFP是指分割錯誤的正類數(shù)目;FFN表示分割錯誤的負類數(shù)目。
分割精度是一種集合相似度度量指標,通常用于計算水油相2 個樣本的相似度。平均交并比是每一類分割結果和真實值的交集與并集的比值進行求和再平均的結果。召回率是分割正確的正例占總的正例的比重。以上3 個指標值越大,代表分割效果越好。
基于輕量可變形編碼網(wǎng)絡的框架是一個端到端的深度學習模型,為了量化特征圖與標簽數(shù)據(jù)之間的差異,采用交叉熵損失函數(shù)[30]作為優(yōu)化目標函數(shù),表示如下:
其中;θ表示分割網(wǎng)絡中所有可學習參數(shù);ti表示油藏圖像;xi∈X對應真實標簽。
實驗所使用的硬件配置如下:處理器Intel Core i9 9900X @ 3.5 GHz;內 存128 GB;GPU 為NVIDIA Geforce RTX 2080Ti 11 GB。在網(wǎng)絡模型的訓練中,使用Adam 優(yōu)化器來優(yōu)化模型,將初始學習率(lr)設置為0.001,并將訓練期間學習率的衰減策略定義如下:
其中;i表示訓練的迭代次數(shù);ti表示迭代總數(shù)。與普通卷積相比,LDFE 模塊需要2 個學習速率。設置lr2=lr×0.01,作為LDFE 模塊偏移卷積層的學習率。
本文主要貢獻是針對油藏驅替刻蝕圖像數(shù)據(jù)集的特點提出LDNet網(wǎng)絡,以提高圖像的分割精度。LDNet網(wǎng)絡主要包含LDFE 模塊和CCAM 模塊。LDFE 模塊可以實現(xiàn)自適應大小的感受野,從而解決水油相的大小、形狀與尺度復雜的問題。CCAM 模塊同時考慮空間注意力和通道注意力之間的聯(lián)系,增加模型的融合效率,降低信息的損失,從而提升分割效果。為證明這2 個模塊貢獻的有效性,在刻蝕圖像數(shù)據(jù)集上進行了一系列實驗,結果如表1 所示。
表1 消融實驗結果Table 1 Ablation experiment results
分析表1 可知:
1)LDFE 模塊的有效性驗證。為驗證LDFE 模塊的有效性,以U-Net 作為骨干網(wǎng)絡,將U-Net 中的編碼模塊分別替換為標準可變形卷積(Deformable Convolution,DC)以及LDFE 模塊。如表1 所示,與U-Net 網(wǎng)絡相比,基于常規(guī)可變形卷積的U-Net 網(wǎng)絡(U-Net+DC)的分割精度提高了1.58 個百分點。U-Net+LDFE 網(wǎng)絡的精度為86.68%,但該網(wǎng)絡的參數(shù)量僅為16.16M,相比U-Net 網(wǎng)絡模型參數(shù)減少了53.18%。由此可以證明LDFE 模塊在減少參數(shù)量的前提下比傳統(tǒng)卷積具有更強的自適應能力。圖5 顯示了U-Net、U-Net+DC 和U-Net+LDFE 在低滲透油藏刻蝕圖庫上的分割結果差異(彩色效果見《計算機工程》官網(wǎng)HTML 版本)。其中紅色與藍色的前景為差異,黑色背景為相同的像素點。如圖5 所示,可變形卷積和LDFE 模塊都可以幫助U-Net 網(wǎng)絡獲取更多邊緣信息,但LDFE 模塊通過深度卷積與逐點卷積可捕捉更大的感受野,并使用殘差結構獲得了更準確的輪廓預測。在圖5 中U-Net+LDFE 提供的特征圖包含更多的細節(jié)信息,其結果最接近標簽數(shù)據(jù)。
圖5 不同網(wǎng)絡在低滲透油藏刻蝕圖庫上的分割結果對比Fig.5 Comparison of segmentation results of different methods on the etched map library of low permeability reservoirs
2)CCAM 模塊的有效性驗證。為驗證CCAM模塊和其他注意力模塊的不同,本文以U-Net 為骨干網(wǎng)絡,分別添加CCAM 模塊、SENet 網(wǎng)絡中的通道注意力(Squeeze and Excitation,SE)模塊、卷積注意力機制模塊(Convolutional Block Attention Module,CBAM)及CCNet 網(wǎng)絡[31]中的重復十字交叉注意力模塊(Recurrent Criss Cross Attention Moudle,RCCA)。由表1 可知,相比于U-Net 網(wǎng)絡,增加CCAM 模塊可將準確率83.74%提高到86.77%,準確率提高了3.03個百分點。因此,CCAM 模塊在刻蝕圖像中能更準確地定位水油交融狀態(tài)下的確切位置,且能幫助網(wǎng)絡分割更精細的水油目標。
圖6 為添加不同注意力模塊的可視化結果(彩色效果見《計算機工程》官網(wǎng)HTML 版本),其中紅色和藍色分別表示關注度較高和較低的區(qū)域??梢钥闯?,引入CBAM 和RCCA 模塊較SE 模塊可以更好地幫助網(wǎng)絡實現(xiàn)水油相提取。與CBAM 模塊相比,CCAM 模塊將通道信息與空間信息進行了充分耦合,對目標區(qū)域的感知能力更強,受噪聲干擾小且對細小目標提取更精準,對于邊緣信息的定位更準確。
圖6 不同注意力模塊的可視化結果對比Fig.6 Comparison of visual results of different attention modules
為進一步證明本文LDNet 網(wǎng)絡的優(yōu)越性,實驗選用主流的分割網(wǎng)絡作為對比,包括U-Net[15]、UNet++[21]、CE-Net[18]、DefED-Net[20]、Attention U-Net[22]、H-DenseUNet[16]和Rednet[19],結果如表2 所示。
表2 不同網(wǎng)絡在刻蝕圖像上的實驗結果Table 2 Experimental results of different networks on etched image
由表2 可知,本文LDNet 網(wǎng)絡的模型大小為16.63M,分割精度為89.94%,與其他對比網(wǎng)絡相比表現(xiàn)最好。U-Net 網(wǎng)絡采用標準卷積,不能有效提取圖像中的邊緣細節(jié)信息,因此分割精度最低。UNet++網(wǎng)絡相較于U-Net 網(wǎng)絡重新設計了跳躍連接方式,從而將分割精度提升至85.32%。CE-Net 和Rednet 網(wǎng)絡均通過設計新的卷積算子分別將分割精度提升到86.82%和84.54%,但都帶來了巨大參數(shù)量。DefED-Net、LDNet 網(wǎng)絡使用可變形卷積,對刻蝕圖像的邊緣提取效果更好。LDNet 網(wǎng)絡在可變形卷積中分別使用逐點卷積與深度卷積來減少計算量,并加入殘差網(wǎng)絡提取圖像多尺度信息,采用CCAM 模塊融合上下文信息并建立長距離依賴關系,因此模型的分割精度更高。另外,由于可變形卷積對計算量有較大消耗,通過結合深度卷積與逐點卷積可大幅降低卷積的計算量與模型大小,提高計算效率。相較于DefED-Net 網(wǎng)絡,LDNet 網(wǎng)絡將模型計算量降低了56.27%,模型大小減少了72.72%。
圖7 所示為不同網(wǎng)絡分割刻蝕圖像的可視化結果(彩色效果見《計算機工程》官網(wǎng)HTML 版本)??梢钥闯?,U-Net 網(wǎng)絡對刻蝕圖像的分割效果較差。UNet++網(wǎng)絡相比于U-Net 網(wǎng)絡能捕獲更多細節(jié)信息,但難以分割邊界模糊區(qū)域。H-DenseUNet 網(wǎng)絡使用了密集連接策略,相比于UNet++網(wǎng)絡能夠捕捉到更多細節(jié)信息,但其針對水油的邊緣信息分割較差。CE-Net、Rednet 網(wǎng)絡在編碼階段改進了傳統(tǒng)的卷積算子,對于模糊邊界分割較為理想,但難以捕捉細小的水油信息。Attention U-Net 網(wǎng)絡通過添加注意力門控信息增強小目標的分割效果,但針對水油的邊界位置分割較差。DefED-Net 網(wǎng)絡通過使用可變形卷積增強邊緣細節(jié)信息,但該網(wǎng)絡針對水油中的細小目標分割較差,且計算量與參數(shù)量龐大。與上述網(wǎng)絡相比,本文LDNet 網(wǎng)絡能夠更精準地分割邊界及提取精細目標,實現(xiàn)了更好的特征編碼和特征融合,以及刻蝕圖像的高精度分割。
圖7 不同分割網(wǎng)絡對刻蝕圖像的分割結果對比Fig.7 Comparison of etched images segmentation results by different segmentation networks
針對油藏刻蝕圖像對比度低、邊緣模糊、形狀復雜等問題,本文提出一種面向刻蝕圖像分割的輕量可變形編解碼網(wǎng)絡LDNet。通過使用LDFE 模塊實現(xiàn)自適應感受野,以適應刻蝕圖像中目標形狀多樣、尺度復雜等問題。引入?yún)f(xié)同耦合注意力模塊,并將位置信息耦合進通道注意力中,提升網(wǎng)絡的魯棒性,實現(xiàn)刻蝕圖像的細小目標分割。實驗結果表明,本文LDNet 網(wǎng)絡能在大幅減少參數(shù)量與計算量的前提下準確分割油藏刻蝕圖像。下一步將深入研究自編碼器在分割刻蝕圖像上的應用,以解決樣本標注獲取難的問題。