張 琦,安建成,劉奕麟
(太原理工大學(xué) 軟件學(xué)院,山西 太原 030024)
乳腺鉬靶X光檢查目前已成為檢測早期乳腺癌癥狀如微小鈣化點(diǎn)以及腫塊存在的最有效以及最常用的工具。然而,由放射科醫(yī)師進(jìn)行視覺分析易受視覺等主觀因素的影響而導(dǎo)致漏診等現(xiàn)象,因此,許多計(jì)算機(jī)輔助診斷(CAD)系統(tǒng)[1]應(yīng)運(yùn)而生以支持醫(yī)師的診斷工作。所謂乳腺腫塊分割,是指將乳腺腫塊與背景分割開,分割乳腺腫塊作為腫塊分類及檢測的先前步驟,分割的精度的高低對腫塊分類及檢測有直接影響,乳腺腫塊分割是乳腺癌CAD系統(tǒng)的關(guān)鍵。
目前,用于乳腺鉬靶X圖像的分割方法有很多。閾值分割方法[2]只考慮圖像的灰度信息,沒有考慮圖像的空間信息,此外,閾值分割方法對噪聲較敏感,因此較難得到準(zhǔn)確的分割結(jié)果;基于邊緣分割算法[3]對噪聲也十分敏感,對分割效果產(chǎn)生很大的影響;此外,基于區(qū)域的分割算法[4]也是一種常用的分割算法,但由于分割算法以及種子點(diǎn)的選擇對分割效果有很大的影響,所以使用區(qū)域分割算法得到的分割效果不很理想。
基于圖的分割算法[5,6],如馬爾科夫隨機(jī)場分割算法,引入圖像不確定性描述與先驗(yàn)知識的聯(lián)系,將圖像的空間信息考慮其中,將圖像分割問題轉(zhuǎn)化為最優(yōu)化問題,具有良好的分割性能。通常點(diǎn)對MRF模型引入簡單的先驗(yàn)?zāi)P鸵子趯?shí)現(xiàn),但是,這種模型由于難以估計(jì)模型參數(shù),先驗(yàn)信息不足,常造成過分割現(xiàn)象。
為了解決MRF分割算法的過分割問題,本文提出一種基于SLIC改進(jìn)的MRF分割算法。采用SLIC算法對圖像進(jìn)行預(yù)分割處理,得到大小均勻、形狀規(guī)則、邊緣保持良好且內(nèi)部具有較高一致性的超像素塊,然后使用超像素區(qū)域替代待分割圖像像素,建立一個(gè)基于區(qū)域的MRF模型,進(jìn)行圖像分割操作。通過引入SLIC算法對待分割圖像的局部區(qū)域建模,解決MRF分割算法的過分割問題。
SLIC分割算法是由Achanta等[7]提出的基于梯度下降的超像素生成算法。SLIC算法通過對比灰度值與距離,將相似度較高的像素通過迭代聚類,把圖像分割為大小不一但均勻、形狀不同但比較規(guī)則的超像素。本文使用SLIC算法,將乳腺區(qū)域分割為均勻的類正六邊形超像素塊,分割得到的超像素很好地保持了原圖像的邊緣細(xì)節(jié)等信息,每個(gè)超像素塊均具有局部區(qū)域代表性。
為避免后續(xù)聚類過程中,由于初始化得到的聚類中心處于圖像邊緣導(dǎo)致較大誤差,在原聚類中心3*3鄰域中最小梯度位置作為新的聚類中心替代原聚類中心。由于乳腺鉬靶X圖像為灰度圖像,SLIC算法使用像素灰度G與位置X、Y坐標(biāo)構(gòu)成的3維特征向量V=[g,x,y]對每一個(gè)像素點(diǎn)進(jìn)行描述。
本文根據(jù)乳腺鉬靶X圖像的特殊性,采用了一種較為完善的相似性衡量標(biāo)準(zhǔn),公式如下
(1)
(2)
(3)
其中,dg為像素i與像素j的灰度值差異,dxy為兩像素間的空間距離,m作為平衡因子對灰度值差異以及空間距離在相似度計(jì)算中所占的比例起到平衡作用,Ds為兩像素的相似度。
在以聚類中心為中心的2S*2S鄰域范圍內(nèi),高效搜索與其匹配的像素點(diǎn),對每個(gè)聚類中心進(jìn)行聚類,由于搜索范圍沒有在整幅圖像展開,使像素聚類速度較快。完成圖像預(yù)分割的同時(shí),對每個(gè)超像素塊分配一個(gè)標(biāo)號,并生成對應(yīng)的鄰接矩陣。
由于乳腺本身即乳腺組織與胸肌、腫塊等其它組織具有相似的密度,在乳腺鉬靶X圖像中表現(xiàn)為這些組織的亮度比較大,成像過程中不可避免造成噪聲干擾[8],因此在進(jìn)行圖像分割之前對圖像預(yù)處理去除這些干擾項(xiàng)有利于得到更好的分割效果。本文采用形態(tài)學(xué)濾波方法濾去圖像中存在的軟組織、背景噪聲以及標(biāo)簽等干擾,增強(qiáng)感興趣區(qū)域的紋理特征,增強(qiáng)圖像的清晰程度,為接下來圖像分割奠定了良好的基礎(chǔ)。
使用SLIC算法對乳腺鉬靶X圖像預(yù)分割處理的步驟為:
(1)對原圖像進(jìn)行預(yù)處理;
(3)在初始聚類中心3*3鄰域范圍內(nèi)搜索最小梯度位置作為新聚類中心;
(4)在聚類中心2S*2S范圍內(nèi)進(jìn)行相似度匹配,進(jìn)行聚類;
(5)不斷迭代(3)、(4)直至聚類中心不變,將乳腺鉬靶X圖像預(yù)分割為大小均勻的類正六邊形超像素塊,并標(biāo)號,生成相應(yīng)的鄰接矩陣。
根據(jù)醫(yī)學(xué)圖像的特殊性,一般對圖像進(jìn)行處理時(shí),需要對整幅圖像提取超像素,但在乳腺鉬靶X光圖像中乳腺腫塊分割只對乳腺部分進(jìn)行分析,乳腺以外區(qū)域可以忽略不進(jìn)行處理。針對乳腺鉬靶X圖像的這一特性,本文通過灰度判斷,選擇性的提取超像素,減少像素點(diǎn)的計(jì)算有效提高了算法效率。圖1為預(yù)分割的效果。
圖1 預(yù)分割結(jié)果
MRF分割算法[9]是一種基于圖的分割算法。首先需要建立起馬爾科夫隨機(jī)場模型,該模型的建立將概率論與圖論有機(jī)的結(jié)合在一起。根據(jù)Gibbs分布與MRF的等價(jià)性,通過計(jì)算MRF的最大后驗(yàn)概率對圖像的像素點(diǎn)進(jìn)行標(biāo)簽,生成原乳腺圖像對應(yīng)的標(biāo)記場,實(shí)現(xiàn)圖像分割?;贛RF的圖像分割算法將圖像分割過程轉(zhuǎn)化為根據(jù)某概率對圖像中的像素點(diǎn)進(jìn)行標(biāo)記的過程。
結(jié)合實(shí)際應(yīng)用需求,通常采用低階的MRF實(shí)現(xiàn)圖像分割過程。但常用的MRF模型先驗(yàn)信息不充分,導(dǎo)致模型參數(shù)估計(jì)不準(zhǔn)確,常導(dǎo)致過分割現(xiàn)象。
本文采用基于SLIC算法改進(jìn)的MRF分割算法,很好地保留了圖像的邊緣信息,彌補(bǔ)了MRF分割算法過分割缺點(diǎn)的同時(shí),有效提高圖像分割效率。針對使用的SLIC算法得到的分割結(jié)果,本文定義了一個(gè)較傳統(tǒng)鄰域系統(tǒng)更加適用于預(yù)分割結(jié)果的鄰域系統(tǒng)構(gòu)建MRF模型。
針對馬爾科夫隨機(jī)場中相鄰像素之間的概率的依賴關(guān)系,MRF模型引入“鄰域系統(tǒng)”這一概念,圖2為像素點(diǎn)x的一階鄰域系統(tǒng)。
圖2 一階鄰域系統(tǒng)及子團(tuán)
由于通過SLIC算法預(yù)分割將原乳腺鉬靶X線圖像分割為類正六邊形的超像素,針對得到的超像素形狀特征,本文提出一種基于類正六邊形的一階領(lǐng)域系統(tǒng),根據(jù)SLIC分割算法得到的鄰接矩陣得出超像素塊之間的相鄰關(guān)系,構(gòu)建MRF鄰域系統(tǒng)。圖3為本文使用的基于正六邊形超像素x的鄰域系統(tǒng)模型及其子團(tuán)。
圖3 本文鄰域系統(tǒng)及子團(tuán)
鄰域系統(tǒng)定義了圖像中每個(gè)超像素受哪些超像素影響。假設(shè)Nx為超像素x的鄰域系統(tǒng),則滿足如下性質(zhì):
(1)x?Nx,即超像素x不屬于自身鄰域系統(tǒng);
(2)y∈Nx?x∈Ny,即超像素間鄰域關(guān)系是相互存在的。
根據(jù)執(zhí)行SLIC分割算法后得到的鄰接矩陣可得到超像素的索引集合X,可將超像素x的鄰域定義為與x的距離小于整數(shù)值為k的超像素組成的集合,定義公式如下
(4)
其中,dist(x,y)表示超像素x與y之間的歐式距離。
本文構(gòu)建如圖3所示的一階領(lǐng)域系統(tǒng),即六鄰域系統(tǒng)。
同時(shí),在MRF中,中心超像素x與其鄰域系統(tǒng)Nx中的若干像素構(gòu)成子團(tuán)(Clique),是Nx的一個(gè)子集,同時(shí),子團(tuán)中的超像素滿足上述鄰域系統(tǒng)的性質(zhì)(2),互為對方超像素的鄰域系統(tǒng)中的一部分。
令Y=yxx∈X,yx∈L為定義在集合X上的一組隨機(jī)變量,yx是標(biāo)簽集合L=l1,l2,…,lm的一個(gè)取值,其中m定義標(biāo)簽的類別數(shù),則稱Y為隨機(jī)場。y1=l1,y2=l2,…,ym=lm為隨機(jī)事件,簡化為y=l,則稱Py=l=y1=l1,y2=l2,…,ym=lm為隨機(jī)場Y的聯(lián)合分布概率。對于隨機(jī)場Y若滿足以下兩條性質(zhì):
(1)Pyi=li>0,即非負(fù)性;
(2)Pyi=liyj=lj,i≠j=P(yi=li|yj=lj,j∈Ni)即馬爾科夫性。
那么,稱Y是以Nx為鄰域系統(tǒng)的馬爾科夫隨機(jī)場。
采用MRF分割算法實(shí)現(xiàn)圖像分割可以看作求解馬爾科夫隨機(jī)場最大后驗(yàn)概率的過程,即將給定原圖像X對應(yīng)為標(biāo)記圖Y的過程,圖4為X與Y的對應(yīng)關(guān)系。
圖4 聯(lián)合場分布(上面為觀察場X,下面為標(biāo)簽場Y)
根據(jù)Bayes規(guī)則,圖像的后驗(yàn)概率分布模型P(Y|X)表示為
(5)
其中,P(X|Y)是特征場分布模型,P(Y)是先驗(yàn)分布模型。
基于最大后驗(yàn)估計(jì)算法(MAP)準(zhǔn)則,全局最優(yōu)標(biāo)記結(jié)果
(6)
由于直接利用MRF完成圖像分割,要求得聯(lián)合分布概率P(Y),但是直接得到P(Y)很困難,因此求解聯(lián)合分布概率成為直接使用MRF的難點(diǎn)。Hammersley等提出了MRF的局部特性與Gibbs分布的全局性存在等價(jià)性[10],解決了這一難題。
根據(jù)Hammersley-Clifford定理可知,當(dāng)且僅當(dāng)馬爾科夫隨機(jī)場在鄰域系統(tǒng)上滿足Gibbs分布時(shí),MRF的馬爾科夫性與Gibbs隨機(jī)場的全局性等效。由此得到先驗(yàn)概率如下
(7)
其中,Z為配分常數(shù);T為溫度系數(shù),是一個(gè)常數(shù);c為子團(tuán),C為鄰域系統(tǒng)中所有子團(tuán)的集合;Vc(Y)為能量函數(shù),是子團(tuán)c的勢。
那么,先驗(yàn)概率可寫為
(8)
為了描述超像素鄰域間的相互關(guān)系,本文使用的多級邏輯模型(multilevel logistic,MLL),MLL模型的勢能函數(shù)Vc(Y)表示為
(9)
其中,yi與yj分別為超像素塊i,j的標(biāo)簽,i,j互存在于對方的鄰域系統(tǒng),即子團(tuán)中各點(diǎn)標(biāo)簽均相同時(shí),取值θ,否則取值為-θ。
對于單超像素子團(tuán)的勢能,勢能的值與超像素的標(biāo)簽有關(guān)
Vcyi=βi
(10)
βi為標(biāo)簽為yi的超像素具有的勢能。
通常認(rèn)為每個(gè)超像素i服從參數(shù)為θi=μyi,σyi的高斯分布,則
(11)
則P(X|Y)可記為
PXY∞explnPXY
(12)
則后驗(yàn)概率P(Y|X)可寫作
(13)
綜上所述,MRF分割算法將圖像分割問題轉(zhuǎn)化為求解式(6)最大后驗(yàn)概率問題。根據(jù)統(tǒng)計(jì)物理學(xué)可知,可以進(jìn)一步將分割問題轉(zhuǎn)化為能量優(yōu)化問題,即求解最小后驗(yàn)?zāi)芰康倪^程
(14)
其中,U(X|Y)為圖像的似然能量;U(Y)為平滑能量。
后驗(yàn)?zāi)芰靠蓪憺?/p>
(15)
考慮到計(jì)算效率的問題,本文使用條件迭代法逐元求解使得后驗(yàn)?zāi)芰亢瘮?shù)最小的標(biāo)簽,更新原超像素標(biāo)簽,直到收斂。
MRF分割算法首先對圖像中每個(gè)超像素隨機(jī)初始化標(biāo)簽操作。為了得到更好的分割效果,本文采用K-means聚類算法對超像素塊進(jìn)行預(yù)標(biāo)簽,相比傳統(tǒng)MRF分割算法中通過隨機(jī)初始化標(biāo)簽超像素,進(jìn)而不斷迭代得到分割的最優(yōu)解,采用K-means預(yù)標(biāo)簽后所得到的分割效果更精確,效率更高。
綜上所述,本文所提出乳腺鉬靶X圖像分割算法步驟如下:
(1)對圖像進(jìn)行預(yù)處理;
(2)采用SLIC算法對圖像進(jìn)行預(yù)分割處理,將圖像分割為內(nèi)部一致性較高的類正六邊形超像素;
(3)取每個(gè)超像素區(qū)域中所有像素的像素值求得平均像素值,描述超像素區(qū)域;
(4)使用K-means聚類算法實(shí)現(xiàn)圖像中超像素標(biāo)簽初始化;
(5)求解不同標(biāo)簽下超像素的后驗(yàn)?zāi)芰亢瘮?shù)U(Y|X)的值;
(6)比對每個(gè)超像素求得的各個(gè)后驗(yàn)?zāi)芰亢瘮?shù)值,取其中最小值,將其對應(yīng)的標(biāo)簽值作為新的標(biāo)簽值更新該超像素標(biāo)簽;
(7)重復(fù)步驟(5)、步驟(6),不斷迭代直至超像素標(biāo)簽值不再改變,迭代終止,完成圖像分割。
本文使用的實(shí)驗(yàn)環(huán)境是Intel Core i7-3770處理器,主頻3.40 GHz,內(nèi)存8 GB,實(shí)驗(yàn)平臺MATLAB 2015b。
將本文提出的分割方法應(yīng)用于DDSM圖像庫中的150例含有腫塊的乳腺鉬靶X圖像中進(jìn)行分割實(shí)驗(yàn)。為得到分割效果的定量評價(jià),本文的乳腺癌腫塊均經(jīng)過醫(yī)師標(biāo)注,作為實(shí)驗(yàn)圖像中腫塊分割的標(biāo)準(zhǔn),并將本文的分割算法以及區(qū)域增長、分水嶺、Snake分割算法得到的分割結(jié)果與手動(dòng)標(biāo)注結(jié)果進(jìn)行比較。
使用本文提出的算法對含有乳腺腫塊的乳腺鉬靶X圖像進(jìn)行腫塊分割,分割結(jié)果如圖5所示。
圖5 乳腺鉬靶X圖像腫塊分割結(jié)果對比
圖5中的圖像從上到下依次為:圖5(a)行為3例原始乳腺鉬靶X圖像并將ROI區(qū)域標(biāo)注出來,圖5(b)行為手動(dòng)標(biāo)注結(jié)果,圖5(c)~圖5(e)行分別為使用區(qū)域增長、分水嶺、Snake分割算法得到的實(shí)驗(yàn)結(jié)果,圖5(f)行為使用本文分割方法的實(shí)驗(yàn)結(jié)果。
圖5表明,本文分割結(jié)果優(yōu)于另外3種分割結(jié)果。區(qū)域增長、分水嶺、Snake分割算法由于受周圍其它組織的干擾,分割得到的腫塊邊緣較專家手動(dòng)分割結(jié)果存在較明顯的誤分割,相比較,本文算法得到的分割結(jié)果與專家手動(dòng)分割結(jié)果更相近,分割結(jié)果更精確,由此得出,本文分割算法在乳腺腫塊分割方面取得較好的效果。
為了更加客觀地反映本文分割算法的分割效果及效率,本文采用量化指數(shù)Jaccard相似系數(shù)[11]和方差作為評價(jià)準(zhǔn)則對分割結(jié)果進(jìn)行定量分析。
通過式(16)求得Jaccard相似系數(shù)對分割結(jié)果的分析評價(jià)
(16)
其中,SL與ST分別表示實(shí)際分割得到的乳腺腫塊區(qū)域與手動(dòng)分割得到的乳腺腫塊區(qū)域,N(S)表示腫塊區(qū)域S中所包含的像素?cái)?shù)量。由上式可知,Jaccard相似系數(shù)即腫塊面積重復(fù)率,J值越大,實(shí)際分割與手動(dòng)分割結(jié)果重復(fù)率越高,分割算法在乳腺腫塊分割的應(yīng)用越好。
如表1所示,給出了區(qū)域增長、分水嶺、Snake以及本文所提算法的平均Jaccard 相似系數(shù)及方差。
由表1可知,與其它3種傳統(tǒng)分割算法相比,本文的方法得到的分割結(jié)果重復(fù)率較高,方差較小,由此可知,本文方法在乳腺鉬靶X圖像中的應(yīng)用取得了較好的分割效果。
表1 不同分割算法的定量分析
本文提出一種基于SLIC算法改進(jìn)的MRF分割算法,并應(yīng)用于乳腺鉬靶X圖像腫塊分割。本文方法首先采用適用于乳腺圖像的SLIC算法對圖像預(yù)分割,將圖像分割為邊緣保持良好的超像素區(qū)域,然后將圖像像素替換為包含局部特征的超像素執(zhí)行MRF分割算法,通過這一改進(jìn),有效解決了低階MRF隨機(jī)場引入簡單的先驗(yàn)?zāi)P蜁r(shí)導(dǎo)致的過分割問題。實(shí)驗(yàn)結(jié)果表明,本文方法可以高效地實(shí)現(xiàn)較準(zhǔn)確的乳腺腫塊分割,在乳腺鉬靶X圖像應(yīng)用中,滿足實(shí)時(shí)應(yīng)用需求。