中南林業(yè)科技大學(xué)計(jì)算機(jī)與信息工程學(xué)院 陳愛斌 江 霞
圖像分割是根據(jù)圖像的某些特征或特征相似的集合,對(duì)圖像進(jìn)行分組聚類,把圖像分成若干個(gè)特定的,有意義的區(qū)域并提取出感興趣的目標(biāo)技術(shù)和過程。它使圖像高級(jí)處理階段的圖像分析和圖像識(shí)別等處理過程的數(shù)據(jù)量大大減少,并保留圖像結(jié)構(gòu)的重要信息。細(xì)胞分割的精度對(duì)細(xì)胞分割有重要作用,它的好壞直接影響細(xì)胞分析。細(xì)胞分割到今天仍沒有取得圓滿成功的幾個(gè)重要原因是:(1)細(xì)胞圖像很復(fù)雜,不僅有白血細(xì)胞、紅細(xì)胞和血小板還有其它東西,而且根據(jù)白細(xì)胞的成熟程度不同可以分為20多種不同的類別。(2)細(xì)胞圖像經(jīng)常受染色不均勻,光照不一致的影響,導(dǎo)致灰度值發(fā)生變化。(3)細(xì)胞圖像經(jīng)常重疊,沒有明顯的邊界。(4)細(xì)胞的大小變化很大,細(xì)胞核的形狀各種各樣。這些使得細(xì)胞分割是一個(gè)困難和富有挑戰(zhàn)的任務(wù)。所以,我們有必要針對(duì)醫(yī)學(xué)圖像這個(gè)領(lǐng)域?qū)?xì)胞圖像分割方法進(jìn)行研究。本文對(duì)細(xì)胞分割的各種方法進(jìn)行系統(tǒng)分析。
為了解決醫(yī)學(xué)圖像細(xì)胞分割的難題,多年來許多研究人員做了大量的工作,研究出了很多有用的分割方法。隨著閾值分割,活動(dòng)輪廓,邊緣檢測(cè)和形態(tài)學(xué)等方法在圖像分割中廣泛應(yīng)用,活動(dòng)輪廓,多光譜等新出現(xiàn)的算法也不斷的用于解決細(xì)胞分割的問題,國(guó)內(nèi)外學(xué)者針對(duì)一些具體應(yīng)用的醫(yī)學(xué)圖像分割提出了不少好的分割方法。
閾值分割法是一種基于區(qū)域的圖像分割技術(shù),其基本原理是:通過設(shè)定不同的特征閾值,把圖像象素點(diǎn)分為若干類。常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。閾值選取方法有多種,如Mode法、Otsu法、熵方法、P-tile法和最小誤差法等。由于閾值分割算法原理簡(jiǎn)單,計(jì)算量比較小,但它依賴閾值的選擇,廣泛的應(yīng)用于早期的細(xì)胞分割。在目標(biāo)和背景差異比較大的圖像可以用全局閾值,柯行斌,王汝傳[1]在已經(jīng)經(jīng)過預(yù)處理的圖像上用全局閾值分割白血細(xì)胞,發(fā)現(xiàn)比匹配法分割的效果好一些。而細(xì)胞的胞漿和背景相差不大,因此用單一的閾值分割很難取得很好的效果。王任揮[2]提出用最大信息熵原理來確定多閾值分割彩色細(xì)胞,能基本區(qū)分細(xì)胞的細(xì)胞核、細(xì)胞漿及背景區(qū)域,但不能得到清晰的細(xì)胞輪廓。由于多閾值一般是設(shè)置兩個(gè)值,而細(xì)胞圖像一般比較復(fù)雜,很難得到明顯的雙峰的直方圖,這就需要設(shè)置局部閾值。局部閾值分割法是將原始圖像劃分成較小的圖像,并對(duì)每個(gè)子圖像選取相應(yīng)的閾值。自適應(yīng)閾值可以根據(jù)特征不同產(chǎn)生不同的合適的閾值,因此適合分割處理大多數(shù)圖像。馬保國(guó),喬玲玲[3]提出的自適應(yīng)閾值分割,先對(duì)圖像各像素進(jìn)行梯度計(jì)算,然后局部用最大類間方差法分割。這種算法對(duì)有噪聲的白血細(xì)胞圖像也能取得一定的效果。下列圖1對(duì)四個(gè)圖的細(xì)胞對(duì)比閾值分割的效果。總的來說,閾值分割只考慮灰度信息沒有考慮空間信息,不適用于多通道圖像,也不適用于特征值相差不大的圖像,并且對(duì)噪聲和灰度不均勻敏感。
圖1 閾值分割的細(xì)胞比較
圖2 分水嶺分割過程及結(jié)果
圖3 幾種類型細(xì)胞的手動(dòng)分割和自動(dòng)分割的比較
分水嶺分割方法,是一種基于拓?fù)淅碚摰臄?shù)學(xué)形態(tài)學(xué)的分割方法,其基本思想是把圖像看作是測(cè)地學(xué)上的拓?fù)涞孛?,圖像中每一點(diǎn)像素的灰度值表示該點(diǎn)的海拔高度,每一個(gè)局部極小值及其影響區(qū)域稱為集水盆,而集水盆的邊界則形成分水嶺。分水嶺的概念和形成可以通過模擬浸入過程來說明。在每一個(gè)局部極小值表面,刺穿一個(gè)小孔,然后把整個(gè)模型慢慢浸入水中,隨著浸入的加深,每一個(gè)局部極小值的影響域慢慢向外擴(kuò)展,在兩個(gè)集水盆匯合處構(gòu)筑大壩,即形成分水嶺。在細(xì)胞處理過程中,由于設(shè)備或人為原因,有時(shí)候會(huì)出現(xiàn)細(xì)胞粘連程度分布不均勻的情況,這樣分割起來很困難,分水嶺算法經(jīng)常用于處理這類問題。丁宏和王澤提出用先對(duì)細(xì)胞圖像用距離變換和對(duì)種子點(diǎn)改進(jìn),再用分水嶺算法分割,如果種子定位精確的情況下,粘連的細(xì)胞分割能取得很好的效果。分水嶺算法直觀,快速,可以并行處理并具有分割精度高的優(yōu)點(diǎn)。但用分水嶺方法進(jìn)行圖像分割時(shí),容易造成圖像的過度分割而且對(duì)噪聲特別敏感。一般都通過對(duì)圖像進(jìn)行預(yù)處理和區(qū)域合并的改進(jìn)來抑制圖像過分分割。謝文娟[4]等提出采用形態(tài)學(xué)基本運(yùn)算,運(yùn)用交替序貫濾波對(duì)白血細(xì)胞圖像進(jìn)行濾波處理,然后采用多尺度形態(tài)梯度代替形態(tài)學(xué)梯度。利用開重建細(xì)胞圖像,減少極小值標(biāo)記點(diǎn),減少過分割產(chǎn)生的區(qū)域。通過對(duì)白血細(xì)胞預(yù)處理的改進(jìn),有效的解決噪音引起的白血細(xì)胞過分分割。包振健,邸書靈[5]提出一種混合的分水嶺策略來分割骨髓細(xì)胞圖像,它是用標(biāo)記的形態(tài)學(xué)重建和基于區(qū)域相似度的區(qū)域合并算法來克服分水嶺對(duì)標(biāo)記點(diǎn)敏感的缺點(diǎn)。針對(duì)分水嶺算法的缺點(diǎn)并結(jié)合自身的研究需求,許多學(xué)者提出4種方法對(duì)其進(jìn)行改進(jìn),預(yù)處理濾波,這個(gè)主要是在預(yù)處理消除圖像噪聲,標(biāo)記、區(qū)域合并和其它方法,后面這三種方法主要是針對(duì)過分分割這一優(yōu)點(diǎn)進(jìn)行改進(jìn)。圖2為標(biāo)記分水嶺算法實(shí)驗(yàn)效果。
圖4 細(xì)胞核的分割過程
有些分割方法很容易產(chǎn)生過分分割,如上面提到的分水嶺算法,而模糊聚類分割算法就很好彌補(bǔ)了這一方面的缺失。模糊聚類是根據(jù)事物間的相似性進(jìn)行區(qū)分和分類的過程,它將數(shù)據(jù)劃分為不同組或類的過程,并使同一個(gè)組內(nèi)的數(shù)據(jù)對(duì)象具有較高的相似程度,而且不同組中的數(shù)據(jù)對(duì)象則是不相似。模糊理論算法中最常用的是模糊C-均值聚類算法,模糊C均值聚類(FCM),是用隸屬度確定每個(gè)數(shù)據(jù)點(diǎn)屬于某個(gè)聚類的程度的一種聚類算法。模糊C均值聚類算法的優(yōu)點(diǎn)是運(yùn)算簡(jiǎn)單,收斂比較快,適合處理數(shù)據(jù)量大的圖像,它的缺點(diǎn)是對(duì)初始中心很敏感,易陷入局部極小值而難收斂到聚類中心。用模糊C均值處理圖像一般采用改進(jìn)的C均值聚類算法,或者用C均值聚類算法和別的算法結(jié)合使用,這樣可以揚(yáng)長(zhǎng)避短。S.Chinwaraphat[6]提出改進(jìn)FCM算法消除由于散射或假的聚類造成不明顏色或像素之間的相似性和等離子體胞質(zhì)背景。Nipon Theera-Umpon[7]用模糊C均值聚類方法對(duì)細(xì)胞過份分割,然后再結(jié)合形態(tài)學(xué)對(duì)細(xì)胞進(jìn)行開與閉運(yùn)算去除小孔和平滑邊緣。下面圖3為此方法自動(dòng)分割和用手動(dòng)分割圖的比較。聚類算法中還有一個(gè)常用的是K均值聚類。EunSang Bak,KayvanNajarian[8]提出K均值聚類算法和自適應(yīng)閾值分割方法結(jié)合使用分割細(xì)胞,由實(shí)驗(yàn)結(jié)果得出分割效果比較好。現(xiàn)在研究人員主要研究是模糊聚類算法如何優(yōu)化初始中心和如何不陷入局部最小值。
Myeloblast Promylocyte Myelocyte Mctamyclocyte Band PMN
可形變模型最初用來解決計(jì)算機(jī)視覺和計(jì)算機(jī)圖像的一種方法,但很快就被應(yīng)用到醫(yī)學(xué)圖像細(xì)胞處理技術(shù)中,如邊緣檢測(cè),匹配等等??尚巫兡P涂梢苑譃閰?shù)可形變模型和幾何可形變模型。參數(shù)可形變模型就是把研究的曲線或曲面直接表示出來,它可以對(duì)模型直接干預(yù),并且可以為快速實(shí)時(shí)應(yīng)用提供緊湊的表達(dá)形式,但不可以改變模型的拓?fù)浣Y(jié)構(gòu)。而幾何可形變模型容易實(shí)現(xiàn)拓?fù)鋵W(xué)的變化,容易空間維數(shù)擴(kuò)展。細(xì)胞分割常用的可形變模型有參數(shù)型的Snake算法和幾何型的水平集算法。傳統(tǒng)的可形變模型的缺陷是運(yùn)算量大,難收斂于凹形區(qū)域。Snake模型是通過尋找自身能量函數(shù)的極小值,這個(gè)值是由內(nèi)部和外部函數(shù)獲得,使曲線由初始區(qū)域向目標(biāo)真實(shí)輪廓靠近并調(diào)整形狀以逼近目標(biāo)輪廓的算法。所以基于參數(shù)的活動(dòng)輪廓算法的缺點(diǎn)是對(duì)初始輪廓的要求很高,優(yōu)點(diǎn)是整個(gè)算法就是一個(gè)特征提取的過程。一般對(duì)參數(shù)形輪廓進(jìn)行改進(jìn),一方面會(huì)針對(duì)獲得高質(zhì)量的初始輪廓進(jìn)行改進(jìn),另一方面對(duì)外部能量算法進(jìn)行改進(jìn)以便有效指引關(guān)鍵點(diǎn)朝著正確的目標(biāo)方向運(yùn)動(dòng)。楊誼[9]提出基于Snake模型的細(xì)胞圖像分割新方法研究就是從這兩方面分別進(jìn)行改進(jìn)的。Farnoosh Sadeghian,Zainina Seman[10]也是先對(duì)細(xì)胞圖像先預(yù)處理再用canny算子進(jìn)行邊緣檢測(cè),然后才用改進(jìn)的GVF Snake獲取清晰的邊緣,如圖4。水平集活動(dòng)輪廓對(duì)初始輪廓并不很敏感但它的收斂速度比較慢。傳統(tǒng)的水平集分割比較適合分割不粘在一起的細(xì)胞,而YayunZhou[11]提出的多相水平集能較好的分割粘連細(xì)胞,并提出改進(jìn)水平集收斂于Mumford-Shah函數(shù)以提高收斂速度。
除了上面提到的細(xì)胞分割算法,還有遺傳算法,形態(tài)學(xué),區(qū)域增長(zhǎng),光譜算法等。
遺傳算法是模擬達(dá)爾文生物進(jìn)化論的自然選擇和遺傳學(xué)機(jī)理的生物進(jìn)化過程的計(jì)算模型,是一種通過模擬自然進(jìn)化過程搜索最優(yōu)解的方法。它的優(yōu)點(diǎn)是有很好的收斂性,計(jì)算時(shí)間少,魯棒性。缺點(diǎn)是不可以很好的處理大規(guī)模計(jì)算量的問題。候振杰,潘新[12]提出一種基于熵的遺傳聚類算法。用遺傳算法和聚類分析及熵結(jié)合分割骨髓細(xì)胞。
數(shù)學(xué)形態(tài)學(xué)是由一組形態(tài)學(xué)的代數(shù)運(yùn)算子組成的,它的基本運(yùn)算有4個(gè):膨脹、腐蝕、開啟和閉合,它們?cè)诙祱D像和灰度圖像中各有特點(diǎn)?;谶@些基本運(yùn)算還可推導(dǎo)和組合成各種數(shù)學(xué)形態(tài)學(xué)實(shí)用算法,用它們可以進(jìn)行圖像形狀和結(jié)構(gòu)的分析及處理。孫萬蓉,俞卞章[13]提出用形態(tài)金字塔分割細(xì)胞圖像,再用流域算法對(duì)低分辨率圖像進(jìn)行分割,然后再?gòu)?fù)合得到原始圖像。
區(qū)域增長(zhǎng)算法一般和別的算法結(jié)合一起使用,單獨(dú)分割效果很差。王瑞胡[14]提出用自適應(yīng)曲面多尺度曲面擬合的方法,對(duì)腐蝕圖像得到的種子區(qū)域進(jìn)行擬合和區(qū)域生長(zhǎng)。在分水嶺算法中有時(shí)也用到區(qū)域增長(zhǎng)算法。由于遺傳算法計(jì)算量很大而且分割效果不是很好,一般和其它的算法結(jié)合使用。
多光譜算法郭寧寧[15][16]提出的多光譜算法和其它算法不同,它更依賴于硬件設(shè)備,是一種新穎的分割方法。它把光譜圖像看成一個(gè)三維的圖像表示光譜信息和空間信息,不同的灰度對(duì)應(yīng)不同的波長(zhǎng),得到唯一的光譜曲線。再用支持向量機(jī)分割圖像。Xuqing Wu,Shishir K.Shah[17]提出自下而上和自上而下的條件隨機(jī)域模型,它不僅從光譜域來考慮還從空間域考慮分割。
細(xì)胞分割的算法有很多,但每種算法都有各自的優(yōu)缺點(diǎn),單獨(dú)用于分割的時(shí)候算法均不是很理想。所以現(xiàn)在很多的學(xué)者把多種算法結(jié)合利用,取其所長(zhǎng),避其所短,這樣得到的分割效果就大大的提高,但它的缺點(diǎn)是運(yùn)算量特別的大。蔡雋[17]提出先用HIS空間中的S飽和度分割細(xì)胞核,然后利用連通域標(biāo)記法得到白細(xì)胞個(gè)數(shù)確定細(xì)胞窗再用改進(jìn)的流域算法得到細(xì)胞漿的粗分割并用它作為細(xì)胞的初始輪廓,再用改進(jìn)的GVF算法得到細(xì)胞的精確分割。這樣子分割出來的細(xì)胞準(zhǔn)確率高,魯棒性好但運(yùn)算時(shí)間特別長(zhǎng)。Farnoosh Sadeghian,Zainina Seman[9]用canny算子進(jìn)行邊緣檢測(cè),然后用GVF Snake獲取清晰的邊緣,分割細(xì)胞質(zhì)是用zack閾值分割,并且在這算法中還用到形態(tài)學(xué)里的開與閉運(yùn)算。J.Cheewatanon,T.Leauhatong[19]提出用mean shift濾波方法去除噪音,保持很好的細(xì)胞結(jié)構(gòu)邊緣,再用CIE LAB彩色空間用區(qū)域增長(zhǎng)的方法進(jìn)行分割,再用活動(dòng)輪廓提出提取白血細(xì)胞的邊界。
細(xì)胞分割的算法有很多,但每種算法都有各自的優(yōu)缺點(diǎn),單獨(dú)用于分割的時(shí)候算法均不是很理想。所以現(xiàn)在很多的學(xué)者把多種算法結(jié)合利用,取其所長(zhǎng),避其所短,這樣得到的分割效果就大大的提高,但它的缺點(diǎn)是運(yùn)算量特別的大。蔡雋[17]提出先用HIS空間中的S飽和度分割細(xì)胞核,然后利用連通域標(biāo)記法得到白細(xì)胞個(gè)數(shù)確定細(xì)胞窗再用改進(jìn)的流域算法得到細(xì)胞漿的粗分割并用它作為細(xì)胞的初始輪廓,再用改進(jìn)的GVF算法得到細(xì)胞的精確分割。這樣子分割出來的細(xì)胞準(zhǔn)確率高,魯棒性好但運(yùn)算時(shí)間特別長(zhǎng)。Farnoosh Sadeghian,Zainina Seman[8]用canny算子進(jìn)行邊緣檢測(cè),然后用GVF Snake獲取清晰的邊緣,分割細(xì)胞質(zhì)是用zack閾值分割,并且在這算法中還用到形態(tài)學(xué)里的開與閉運(yùn)算。J.Cheewatanon,T.Leauhatong[18]提出用mean shift濾波方法去除噪音,保持很好的細(xì)胞結(jié)構(gòu)邊緣,再用CIE LAB彩色空間用區(qū)域增長(zhǎng)的方法進(jìn)行分割,再用活動(dòng)輪廓提出提取白血細(xì)胞的邊界。
通過對(duì)醫(yī)學(xué)領(lǐng)域白血細(xì)胞中常用的圖像分割算法比較,系統(tǒng)分析各種算法的優(yōu)缺點(diǎn)。近年來,許多研究人員致力于研究白血細(xì)胞分割算法,并出了很多的研究成果。但由于白血細(xì)胞分割本身的困難,至今還沒有一種通用算法分割細(xì)胞圖像。除了細(xì)胞結(jié)構(gòu)的復(fù)雜性,準(zhǔn)確率要求必須很高。雖然細(xì)胞分割取得一定的成就,但面對(duì)臨床應(yīng)用的準(zhǔn)確率還是遠(yuǎn)遠(yuǎn)不夠的。人們逐漸認(rèn)識(shí)到任何一種算法單獨(dú)分割都難達(dá)到很好的效果,在不斷的研究和改進(jìn)某種算法和創(chuàng)新算法的同時(shí)也注重多種算法結(jié)合使用,并研究怎么樣結(jié)合才能突出各自的優(yōu)點(diǎn)。同時(shí)三維甚至多維的彩色圖像分割技術(shù)也一直受到人們的關(guān)注。在彩色圖像中能夠提取到的信息量比灰度圖像更為豐富,有利于后續(xù)的研究。近年來由用戶參與控制、引導(dǎo)的交互式分割方法技術(shù)在醫(yī)學(xué)圖像分割中正受到越來越多的人關(guān)注。目前人們?nèi)栽诶^續(xù)研究更先進(jìn)的成像技術(shù)和更復(fù)雜的圖像處理算法。
[1]柯行斌,王汝傳.白細(xì)胞圖像分割的研究與實(shí)現(xiàn)[J].南京郵電學(xué)院學(xué)報(bào),2003,23(3):53-57.
[2]王任揮.基于最大信息熵原理的顯微細(xì)胞圖像多閾值分割算法[J].內(nèi)蒙古科技與經(jīng)濟(jì),2010,18(220):58-61.
[3]馬保國(guó),喬玲玲.基于局部自適應(yīng)閾值的細(xì)胞圖像分割方法[J].計(jì)算機(jī)應(yīng)用研究,2009,26(2):755-756.
[4]謝文娟,段汕.基于改進(jìn)分水嶺算法的細(xì)胞圖像分割[D].武昌:中南民族大學(xué),2010,5.
[5]包振健,邸書靈.一種基于分水嶺變換的細(xì)胞圖像分割方法[J].計(jì)算機(jī)工程與應(yīng)用,2008,7(4):230-232.
[6]S.Chinwaraphat,A.Sanpanich.A Modifed Fuzzy Clustering For White Blood Cell Segmentation[C].The 3rd International Symposium on Biomedical Engineering,2008,356-359.
[7]Nipon Theera-Umpon.Patch-Based White Blood Cell Nucleus Segmentation Using Fuzzy Clustering[J].Electrical Eng,Electronics,And Comm unications,2005,3(1):15-19.
[8]EunSang Bak,KayvanNajarian.Effcient Segmentation Frame work of cell Images In Noise Environments[J].IEEE,2005,1802-1805.
[9]楊誼.基于Snake模型的細(xì)胞圖像分割新方法研究[D].廣州同和:第一軍醫(yī)大學(xué),2005,4.
[10]Farnoosh Sadeghian,Zainina Seman.A Framework for White Blood Cell Segmentation in Microscopic Blood Images Using Digital Image Proc[J].Biology and Life Sciences,2009,11(2):196-206.
[11]YayunZhou,YuanxinXu等.Cell Segmentation Using Level Set Method[J].Video Engineering,2005(6):36-38.
[12]候振杰,潘新等.一種基于遺傳算法的骨髓細(xì)胞圖像分割方法[J].計(jì)算機(jī)工程與科學(xué),2006,28(10):63-66.
[13]孫萬蓉,俞卞章.基于數(shù)學(xué)形態(tài)金字塔分解和流域分割的骨髓細(xì)胞圖像分割[J].西北工業(yè)大學(xué)學(xué)報(bào),2006,24(5):600-605.
[14]王瑞胡.基于多尺度曲面擬合的細(xì)胞圖像表面分割算法[J].2009,30(17):4041-4044.
[15]NingningGuo,LiboZeng.A method based on multispectral imaging technique for White Blood Cell segmentation.Computers in Biology and Medicine,2006(37):70-76.
[16]寧寧,吳瓊水等.一種細(xì)胞分割新方法[J].計(jì)算機(jī)應(yīng)用研究,2006(3):141-144.
[17]Xuqing Wu,Shishir K.Shah.A bottom-up and top-down model for cell segmentation using multispectral data[J].IEEE,2010,592-595.
[18]蔡雋.彩色白細(xì)胞圖像自動(dòng)分割方案研究[D].南京:東南大學(xué),2006,3.
[19]J.Cheewatanon,T.Leauhatong.A New White Blood Cell Segmentation Using Mean Shif Filter And Region Growing Algorithm [J].International Journal Of Applied Biomedical Engineering,2011,4(1):30-35.