陳曉楠 蔣 輝 劉曉凱 王凱欣
(大連海事大學(xué)信息科學(xué)技術(shù)學(xué)院 遼寧 大連 116026)
肺癌是世界上發(fā)病率和死亡率最高的癌癥之一[1],據(jù)國家癌癥中心統(tǒng)計的數(shù)據(jù),2019年全國肺癌的死亡率達(dá)到26.99%,占據(jù)我國十大癌癥死亡率的首位,而且發(fā)病率和致死率仍在持續(xù)增長。當(dāng)前,計算機(jī)斷層掃描(Computed Tomography, CT)技術(shù)是檢測肺癌最常用的手段之一,肺結(jié)節(jié)是肺癌在CT上的前期表現(xiàn)形式[2],根據(jù)密度可以將肺結(jié)節(jié)劃分為實質(zhì)性肺結(jié)節(jié)(Solid Pulmonary Nodule, SPN)和亞實性肺結(jié)節(jié)(Sub-Solid Nodule, SSN)[3]。同SPN相比,SSN中既有實性成分也有周圍磨玻璃影(Ground Glass Opacity, GGO),其結(jié)構(gòu)復(fù)雜,惡化程度也表現(xiàn)得比實質(zhì)性肺結(jié)節(jié)高。因此,準(zhǔn)確分割SSN對于前期的肺癌病變診斷有重要的臨床價值。
關(guān)于提高肺結(jié)節(jié)的分割精度的研究,國內(nèi)外有很多的文獻(xiàn)記載,但是大多數(shù)都是基于SPN的分割。在SSN的分割中,大多數(shù)單一方法都不能準(zhǔn)確而高效地分割出完整的肺結(jié)節(jié)。在近30年的醫(yī)學(xué)圖像分割的研究中,活動輪廓模型(Active Contour Model, ACM)作為一種水平集的能量泛型,因能量泛函廣泛結(jié)合的理論性被作為醫(yī)學(xué)圖像分割方面的一個重要方法。Manickavasagam等[4]提出了一種基于梯度的活動輪廓模型(GACM),通過構(gòu)建梯度能量作為活動輪廓模型的邊界檢測函數(shù),然而采用梯度信息容易丟失邊界。文獻(xiàn)[5-7]提出了小波能量和ACM結(jié)合的方法對肺結(jié)節(jié)進(jìn)行分割,小波可以增強圖像亮度,由小波能量構(gòu)建ACM區(qū)域項,加強了肺結(jié)節(jié)與周圍毛玻璃影的區(qū)分。Heewon等[8]提出CV活動輪廓模型結(jié)合貝葉斯方法來分割胸膜旁肺結(jié)節(jié),在相似率上高于其他算法,但是該方法復(fù)雜、處理時間較長。Ding等[9]用高斯拉普拉斯(Laplacian of Gaussian, LoG)結(jié)合RSF模型的方法解決了弱邊緣、區(qū)域亮度不均的圖像分割問題。
為了解決SSN中區(qū)域亮度不均或區(qū)域不平滑、模糊邊界等問題,本文提出基于LoG和因子分解的集成活動輪廓模型。首先,要得到肺實質(zhì)的分割圖像,這是肺結(jié)節(jié)分割的關(guān)鍵步驟;其次,用本文提供的方法來分割肺結(jié)節(jié),LGIF模型[10]是一種全局區(qū)域和局部區(qū)域融合的能量框架模型,在此基礎(chǔ)上,引入優(yōu)化的LoG作為LGIF模型的一個能量項,解決亮度不均、邊緣模糊的問題;然后,利用因子分解模型來構(gòu)造能量函數(shù),驅(qū)動邊界輪廓曲線的演變,并平滑圖像;最后,通過實驗數(shù)據(jù)來驗證本文算法對SSN分割的高精度性。
如圖1所示,本文對SSN的分割包含4個步驟:1) 分割原始CT圖像,獲取完整的肺實質(zhì)圖像;2) 構(gòu)建優(yōu)化的LoG作為一種能量項,增強較暗的灰度區(qū)域;3) 構(gòu)建因子分解模型作為一種能量項來驅(qū)動輪廓曲線演變;4) 將優(yōu)化的LoG能量項和因子分解能量項融入到LGIF模型中,對SSN進(jìn)行分割。
圖1 集成ACM模型的SSN分割流程
由于肺部組織結(jié)構(gòu)的復(fù)雜性,同時肺部CT圖像可能受儀器設(shè)備等噪聲影響,因此,為了SSN分割的高效性,需要對肺部CT圖像進(jìn)行肺實質(zhì)分割。要將肺實質(zhì)區(qū)域完整提取出來,需要去除肺氣管、軀干、肺床、弧影等無關(guān)組織信息。
首先,需要對肺部CT圖像粗分割,利用拉普拉斯算子獲取輪廓邊緣信息,并設(shè)定邊界像素的閾值,通過輪廓像素的方法得到初始的肺部輪廓區(qū)域,如圖2(b)所示;其次,需要對左右肺進(jìn)行分割,通過設(shè)定一個圓形結(jié)構(gòu)模板,以該模板進(jìn)行閉運算和取反操作,獲取左右肺的最大連通區(qū)域,圖2(c)表示為帶肺氣管的左右肺;接著,需要填充孔洞和去除肺氣管,用二值圖像連通域標(biāo)記來填充孔洞,并設(shè)定連通域的面積閾值獲取完整的左右肺實質(zhì)掩模圖像,如圖2(d)所示;最后,把原CT圖像和掩模圖像相乘,獲取到完整的肺實質(zhì),如圖2(e)所示。肺實質(zhì)分割結(jié)果如圖2所示。
(a) 原始CT圖像(b) 初始輪廓圖
(c) 左右肺分割(d) 肺實質(zhì)掩模
(e) 提取的肺實質(zhì)圖2 肺實質(zhì)整體分割過程
由于SSN邊緣的灰度值不連續(xù),且結(jié)節(jié)亮度不均勻的特點,本文提出一種優(yōu)化的高斯拉普拉斯能量項,來加強肺結(jié)節(jié)實性成分與周圍背景的區(qū)分。首先,用高斯濾波器平滑處理肺實質(zhì)圖像I(x,y)。然后,用拉普拉斯算子處理肺結(jié)節(jié)的邊緣,得到LoG算子與圖像的卷積數(shù)學(xué)式為:
式中:Gσ(x,y)是標(biāo)準(zhǔn)差為σ的高斯核函數(shù)。經(jīng)過LoG處理后的圖像如圖3所示,若區(qū)域的灰度值是固定值的時候,其LoG變換的響應(yīng)值為0。在I(x,y)的灰度發(fā)生變化的區(qū)域,在較暗的一側(cè),響應(yīng)值為負(fù)值;而在較亮的一側(cè),響應(yīng)值則為正值。因此,肺結(jié)節(jié)邊緣可以通過過零點的跳躍狀態(tài)來檢測。
圖3 LoG處理的圖像
如果圖像受到噪聲影響或者強度不均勻,則容易產(chǎn)生假的過零點邊緣信息,因此,需要增強肺結(jié)節(jié)邊緣和對區(qū)域平滑處理,提出優(yōu)化的LoG能量泛函如下:
(L-β×Δ(Gσ×I))2dxdy
(2)
(a) 肺結(jié)節(jié)圖(b) 原始的LoG圖
(c) 優(yōu)化的LoG圖
(d) LoG響應(yīng)對比圖圖4 原始LoG和優(yōu)化LoG的圖像對比
通過水平集的變分法,用水平集函數(shù)φ,簡化式(2),將優(yōu)化的LoG構(gòu)建為ACM的一個能量項EOL(φ),表示如下:
EOL(φ)=mLΔ(φ)=m?ΩH(φ)L(x,y)dxdy
(3)
式中:LΔ(φ)是優(yōu)化的LoG算子項;m是權(quán)重項。本文用優(yōu)化的高斯拉普拉斯處理后的圖像是L(x,y),而傳統(tǒng)的拉普拉斯處理后的是圖像是ΔI(x,y),相關(guān)的公式為:
H(φ)是Heaviside函數(shù),其公式為:
式中:ε>0是一個很小的數(shù)。
傳統(tǒng)的區(qū)域模型都是以灰度特征來作為描述因子,對于SSN模糊的邊界信息可能分割不準(zhǔn)確,而本文提出的因子分解模型是基于像素來分割的,引入該模型可以獲得更平滑、更精確的目標(biāo)邊界。
因子分解模型是基于圖像的紋理特征[11],將圖像區(qū)域以M×N矩陣表示,該矩陣是由每個以像素為中心的局部窗口組成,因此該區(qū)域可以表示成具有代表性特征的局部窗口的線性組合,以Y表示:
Y=R1QQ-1β1
(6)
式中:R1是M×L矩陣,R1的列表示待分割SSN區(qū)域的特征;β1是L×N矩陣,β1的列表示每個像素區(qū)域的權(quán)重向量;通過區(qū)域代表性特征歸類和像素的聚類,可以得到R1的線性變換矩陣Q,用Q來表示某區(qū)域的像素特征。
該因子分解模型是將圖像I(x,y)分為目標(biāo)和背景兩個區(qū)域,它們都是以像素為中心的局部窗口組成。設(shè)Ω是二維圖像域(x,y),Ωo和Ωb分別表示目標(biāo)區(qū)域和背景區(qū)域,則像素特征模型Hw(x,y)為:
Hw(x,y)=wo(x,y)Ro+wb(x,y)Rb
(7)
式中:Rb、Rb是M維向量,它們分別是目標(biāo)區(qū)域、背景區(qū)域的代表性特征矩陣;wo和wb是相應(yīng)的權(quán)重向量矩陣,在(0,1)范圍內(nèi)。
R1的代表性特征是其線性變換的解,其特征向量在R1的L維子空間上,Q是L×L矩陣,它的列表示R1子空間上的每個代表特征的笛卡爾坐標(biāo),而本文提出目標(biāo)和背景區(qū)域,即L=2,假設(shè)同一區(qū)域的像素特征是同類的,對于給定的輸入圖像I(x,y):
H(φ)在式(5)中已被定義?;谔卣骶仃嘠可定義特征矩陣R如下:
R=[Ro,Rb]=R1×Q
(9)
wo和wo權(quán)重向量矩陣的計算方式如下:
w=[wo,wb]=(RRT)-1RTY
(10)
當(dāng)wo(或wb)中某一個權(quán)重接近1時,另一個wb(wo)就接近0,通過上述的公式,創(chuàng)建關(guān)于因子分解的ACM模型的一個能量項Ed(φ):
Ed(φ)=-?Ω[H(φ)wo(x,y,R)+
(1-H(φ))wb(x,y,R)]dxdy
(11)
從式(11)得出,當(dāng)能量曲線被吸引到目標(biāo)與背景之間的邊緣時,得到最小的能量項值。
圖5是磨玻璃影SSN的灰度和像素的分布圖。圖5(a)是SSN的原始CT圖像,而圖5(b)顯示的是磨玻璃影SSN的放大圖像。從圖5(c)和圖5(d)的對比發(fā)現(xiàn),肺結(jié)節(jié)的灰度差異并不明顯,僅僅使用灰度特征描述不能達(dá)到很好的分割效果,而圖5(d)的肺結(jié)節(jié)像素值可以直觀顯示像素的差異對比,以像素作為描述特征可以更好地保留肺結(jié)節(jié)的模糊成分。
(a) SSN原始CT圖 (b) 磨玻璃影SSN放大圖
(c) 灰度分布圖
(d) 像素分布圖圖5 SSN的灰度分布和像素分布
1) 構(gòu)建ACM能量函數(shù)。本文的集成活動輪廓模型是在LGIF的能量泛型下結(jié)合高斯拉普拉斯能量項和因子分解特征矩陣能量項構(gòu)建的,該集成ACM模型可以定義為:
E(φ)=μEOL(φ)+λEd(φ)+γELGIF(φ)
(12)
式中:μ、λ、γ為各項的權(quán)重參數(shù),在本文的取值都為1;ELGIF是CV模型和LBF模型的結(jié)合[12]。ELGIF是融合了全局和局部信息的模型[13],綜合了二者的優(yōu)點,該LGIF模型對邊界模糊、灰度不均勻的圖像分割能夠達(dá)到較好的效果,公式如下:
ELGIF(φ)=θECV(φ)+(1-θ)ELBF(φ)
(13)
式中:θ是常量,0≤θ≤1。ECV(φ)和ELBF(φ)的計算公式為:
(14)
(15)
2) ACM的求解。在CV模型中,c1、c2的求法:
在LBF模型中,f1、f2的求法:
根據(jù)水平集函數(shù)φ和Euler-Lagrange方程理論:
最后,通過E(φ)對φ的變分法原理可得到φ的梯度下降流方程,即優(yōu)化的LoG和因子分解結(jié)合的集成ACM的方程:
其中:
本文采用的亞實性肺結(jié)節(jié)的數(shù)據(jù)集都是來源于大連醫(yī)科大學(xué)第二附屬醫(yī)院,該數(shù)據(jù)集共有19個序列,每個序列平均有300幅肺部CT圖像,其中,包含亞實性肺結(jié)節(jié)的序列都是由專業(yè)醫(yī)生標(biāo)注。實驗環(huán)境采用MATLAB R2018b,64位Windows10操作系統(tǒng),3.8 GHz處理器。
為了驗證本文算法對SSN分割的有效性,從19個序列中挑選了6個典型樣本,其中共包括90幅含肺結(jié)節(jié)的CT影像,大小均為512×512像素,對這些影像數(shù)據(jù)進(jìn)行肺結(jié)節(jié)分割,隨機(jī)選擇6個樣本中的單例進(jìn)行展示,結(jié)果如圖6所示。可以看出,第一、第二行的SSN整體都是磨玻璃狀;第三行的SSN內(nèi)部是實性成分,而周圍是形態(tài)各異的磨玻璃影;第六行的SSN形態(tài)是邊界磨玻璃影與血管黏連的情況。
(a) 原始肺部CT圖像(b) 醫(yī)生手動分割結(jié)果(c) 基于邊界的ACM方法(d) 基于LGIF模型的方法(e) LGIF+因子分解模型(f) 本文分割算法圖6 各種方法對SSN的分割結(jié)果對比
從圖6(c)可以發(fā)現(xiàn),基于邊界的ACM方法對SSN分割時,容易丟失邊界信息。從圖6(d)和圖6(e)對比發(fā)現(xiàn),加了因子分解的LGIF模型分割SSN獲得的邊緣更完整,但是也存在復(fù)雜SSN過多分割背景的情況。從圖6(e)和圖6(f)對比看,在圖6(e)的方法上加了優(yōu)化的LoG能量項,可以增強SSN的邊緣和區(qū)域的亮度,本文算法獲得了更為完整的SSN輪廓。從圖6(e)和(f)的第六行對比可以發(fā)現(xiàn),本文算法可以濾除黏連的血管,直接對肺結(jié)節(jié)分割。從圖6第二行的磨玻璃肺結(jié)節(jié)分割結(jié)果看,因肺結(jié)節(jié)與周圍背景對比度低且內(nèi)部亮度不均勻,其余三種模型都會產(chǎn)生欠分割與過分割的情況,只有本文方法對SSN的分割結(jié)果與醫(yī)生手動標(biāo)注結(jié)果接近。由圖6(b)和圖6(f)對比來看,本文算法對SSN的分割更接近于專業(yè)醫(yī)生的手動分割結(jié)果。
對基于邊界的ACM方法、基于LGIF模型的方法和LGIF與因子分解融合的方法,不能精確分割SSN的主要原因如下:1) 基于邊界的ACM方法和基于LGIF模型的方法在輪廓曲線演變時是基于灰度信息來分割,并沒有考慮周圍模糊的磨玻璃影信息,因此,導(dǎo)致邊界信息泄露。2) 優(yōu)化的LoG能量可以加強結(jié)節(jié)亮度與邊緣信息,提高SSN與其周圍背景的對比度,而上述3種方法不能很好地解決亮度不均勻、假邊緣等SSN的分割問題。
為了進(jìn)一步驗證本文算法的分割精度,分別采用相似度系數(shù)(Dice coefficient,DICE)、靈敏度(Sensitivity)和差異度(Relative Volume Difference,RVD)這3個指標(biāo)進(jìn)行評價。通常將醫(yī)生的手工標(biāo)注結(jié)果作為真值結(jié)果,即“金標(biāo)準(zhǔn)”[14],用“金標(biāo)準(zhǔn)”分別與文中所用算法進(jìn)行比較。下列指標(biāo)公式為:
式中:Seg為文中各種分割算法的結(jié)果;Sgt為醫(yī)生手動分割結(jié)果;ρDICE表示各種方法和醫(yī)生手動方法的分割結(jié)果的相似度,當(dāng)相似度接近1時,表示分割效果越好;ρSensitivity表示實際分割SSN區(qū)域的像素點正確判斷為“金標(biāo)準(zhǔn)”區(qū)域像素的比例,當(dāng)比例值近似等于1時,效果越好;ρRVD反映的是分割區(qū)域差異度,當(dāng)實際分割輪廓與醫(yī)生標(biāo)注輪廓接近時,差異度越小。
本文選擇對90幅SSN的分割情況進(jìn)行比較,結(jié)果如表1所示。其中,基于邊界的ACM方法的各項指標(biāo)性能都低于其他方法,其RVD值達(dá)到了70.60%;基于LGIF模型方法和LGIF模型與因子分解的模型方法雖然DICE值都能高達(dá)70%以上,但是Sensitivity指標(biāo)都偏低,說明實際區(qū)域的像素點在真實區(qū)域中占比少;雖然,本文算法的RVD指標(biāo)比LGIF模型方法和LGIF模型與因子分解的模型方法要高,但是,DICE指標(biāo)達(dá)到了90.23%,比其他算法提高了近20%,其像素占比值也高(83.99%)。
表1 本文算法與其他算法的SSN分割結(jié)果評價(%)
本文提出一種基于LoG和因子分解的集成ACM算法對SSN進(jìn)行分割。為了解決肺結(jié)節(jié)亮度不均、邊界模糊的問題,本文引入了LoG算子并對其優(yōu)化,構(gòu)建了LoG能量項用來檢測模糊的邊界;其后,通過因子分解以像素值作為描述特征,構(gòu)建一個特征向量的矩陣,提出因子分解的活動輪廓能量項,使分割曲線更接近于完整的肺結(jié)節(jié)。實驗結(jié)果表明,本文算法對SSN的分割與專業(yè)醫(yī)生的手動分割結(jié)果更為接近,比其他三種模型方法分割效果要好。