于 躍,李東明
(吉林農(nóng)業(yè)大學(xué) 信息技術(shù)學(xué)院,吉林 長春 130118)
隨著計(jì)算機(jī)視覺的發(fā)展,醫(yī)學(xué)圖像技術(shù)取得長足進(jìn)步,其中顯微細(xì)胞圖像的識(shí)別在醫(yī)學(xué)圖像處理中得到長足發(fā)展,圖像分割逐漸成為醫(yī)學(xué)圖像分析和處理的關(guān)鍵技術(shù)其中圖像分割是計(jì)算機(jī)視覺的重要環(huán)節(jié),而對(duì)于細(xì)胞圖像分割更是醫(yī)學(xué)細(xì)胞圖像分析的難點(diǎn)。圖像分割基本上可分為兩類,一類為基于邊緣圖像分割另一類為基于區(qū)域圖像分割,醫(yī)學(xué)圖像技術(shù)上有基于細(xì)胞圖像的邊緣、區(qū)域等特征進(jìn)行分割,諸學(xué)者提出了如邊緣檢測(cè)[1]、分水嶺[2]、閾值[3]、水平集[4]、聚類分割等算法進(jìn)行圖像分割。在細(xì)胞圖像分割中K-means聚類細(xì)胞圖像分割是基于距離相似性的聚類算法,以空間中k個(gè)點(diǎn)為中心進(jìn)行聚類,對(duì)最靠近他們的像素歸類,通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結(jié)果,其缺點(diǎn)是需要自定義聚類數(shù)目,產(chǎn)生類的大小相差不會(huì)很大,人為主觀因素較大,對(duì)于噪聲很敏感[5]。FCM算法是一種無監(jiān)督的聚類算法,它利用隸屬度來確定每個(gè)像素點(diǎn)最后劃分到某個(gè)聚類的一種聚類[6],但FCM對(duì)初始聚類中心和隸屬度將矩陣以及噪聲比較敏感,其次是當(dāng)數(shù)據(jù)樣本集合較大并且特征數(shù)目較多時(shí),算法的實(shí)時(shí)性差。近幾年閾值分割在處理醫(yī)學(xué)圖像上得到廣泛應(yīng)用,其主要是按照灰度級(jí),對(duì)像素集合進(jìn)行劃分得到多個(gè)子區(qū)域,各個(gè)子區(qū)域內(nèi)部具有一致的屬性,而相鄰區(qū)域不具有這種一致屬性,這種劃分可以通過從灰度級(jí)中選取一個(gè)或多個(gè)閾值來完成,近年基于閾值分割法的研究在處理細(xì)胞圖像上得到廣泛應(yīng)用[7]。
目前結(jié)合統(tǒng)計(jì)學(xué)的模型區(qū)域劃分的細(xì)胞圖像分割方法比較流行,利用傳統(tǒng)的馬爾科夫隨機(jī)場(chǎng)(MRF)描述分割圖像的先驗(yàn)分布恰當(dāng)好處,MRF圖像分割方法利用圖像某一點(diǎn)的特征關(guān)系只與其相鄰領(lǐng)域有關(guān),但MRF需要事先設(shè)定初始分類數(shù),受到人為主觀因素影響較大,費(fèi)時(shí)費(fèi)力,針對(duì)上述出現(xiàn)的普遍問題本文提出結(jié)合基于中國餐館過程的馬爾可夫隨機(jī)場(chǎng)的細(xì)胞圖像分割方法,利用中國餐館模型找到聚類個(gè)數(shù)作為MRF的分類參數(shù),結(jié)合最大后驗(yàn)概率進(jìn)行細(xì)胞圖像分割。傳統(tǒng)的MRF圖像分割方法需要事先定義分割區(qū)域個(gè)數(shù)的參數(shù),本文提出的改進(jìn)方法無需事先估計(jì)個(gè)數(shù),有效的解決了分割速度慢和精度差的問題,能夠準(zhǔn)確找到要分割的雙核和微核細(xì)胞,為后期細(xì)胞圖像識(shí)別打基礎(chǔ)。
(1)
δ(s)是定義在像素位置S={(i,j)|1≤i≤N,1≤j≤M}二維隨機(jī)場(chǎng)上的領(lǐng)域系統(tǒng)的集合;xs表示在隨機(jī)場(chǎng)空間區(qū)域的隨機(jī)變量,r∈δ(s)為S的鄰點(diǎn);c?S的一個(gè)勢(shì)團(tuán),C表示勢(shì)團(tuán)c的集合;L為狀態(tài)空間,即隨機(jī)場(chǎng)的相空間,表示將圖像分割為不同區(qū)域的數(shù)目,相空間也直接關(guān)系到能否準(zhǔn)確劃分圖像區(qū)域的關(guān)鍵;-(∑Vc(xs|xr))為能量函數(shù)。
在圖像處理中基于統(tǒng)計(jì)學(xué)概率模型的圖像分割問題可以轉(zhuǎn)化為圖像的標(biāo)記問題,從而圖像分割要解決的問題就是求出滿足最大后概率準(zhǔn)則對(duì)每個(gè)像素的分類標(biāo)號(hào),稱為標(biāo)號(hào)場(chǎng),記為X。對(duì)于圖像,可知標(biāo)號(hào)場(chǎng)是用來對(duì)圖像的像素進(jìn)行跟蹤標(biāo)記,特征場(chǎng)是擬合原始的觀測(cè)數(shù)據(jù),圖像數(shù)據(jù)的像素值就是觀測(cè)數(shù)據(jù),使圖像分割的結(jié)果中能夠保留更多的細(xì)節(jié)信息,盡可能準(zhǔn)確地反映每一個(gè)像素位置的特征信息。根據(jù)貝葉斯估計(jì)準(zhǔn)則和最大后驗(yàn)概率準(zhǔn)則,將后驗(yàn)概率轉(zhuǎn)換為先驗(yàn)概率與似然函數(shù)的乘積,似然函數(shù)是一個(gè)高斯分布,而先驗(yàn)概率通過MRF轉(zhuǎn)換為Gibbs分布得到,最后更新標(biāo)號(hào)場(chǎng)使得成績最大,得到最佳分割[10]。根據(jù)貝葉斯準(zhǔn)則,最佳分割準(zhǔn)則為:
(2)
其中:Y為圖像的灰度值;因此p(Y)為常數(shù);X由MRF通過能量函數(shù)確定的條件概率,從而使其在全局上具有一致性,通過單個(gè)像素及其領(lǐng)域的簡(jiǎn)單的局部交互,通過計(jì)算局部的Gibbs分布得到全局的統(tǒng)計(jì)結(jié)果,可以獲得MRF模型復(fù)雜的全局行為??紤]到計(jì)算效率,采用條件迭代模式(ICM)方法來實(shí)現(xiàn)MRF在圖像分割上的應(yīng)用。
中國餐廳過程是Dirichlet過程的一種無限混合模型表示方法,這種方法是一種無監(jiān)督分類,可以提前估計(jì)聚類個(gè)數(shù),根據(jù)數(shù)據(jù)的大小自動(dòng)調(diào)整聚類數(shù)目,最終會(huì)趨向一個(gè)有限的固定值[11]。在進(jìn)行數(shù)據(jù)分析分類時(shí),能夠快速找到潛在聚類數(shù)目。中國餐廳過程是關(guān)于n個(gè)顧客在同一個(gè)餐廳座位問題的一個(gè)隨機(jī)過程。假設(shè)一家中國餐館的餐桌數(shù)量不限,第一位顧客抵達(dá)后坐在第一張桌子上,第二位顧客可以選擇以一定概率坐在第一張桌子上或者選擇坐在一張新的桌子上,第三位顧客以一定概率可以選擇坐在第一、二張桌子,也可以選擇新開一張桌子,具體的概率分布[12]如下:
(3)
其中:Zn表示第n個(gè)顧客所選的桌子,nk表示k個(gè)桌子上已有顧客數(shù),α為先驗(yàn)參數(shù)是一個(gè)正常數(shù),中國餐廳過程好處是“客人就坐越多的桌子,新客人就會(huì)更有可能就坐”所以桌子的最終數(shù)量會(huì)趨向一個(gè)有限的固定值。根據(jù)圖像中的像素信息,顧客代表像素,把桌子數(shù)看成被劃分的分割數(shù)目,因此桌子的個(gè)數(shù)等于被分割像素的區(qū)域數(shù),當(dāng)圖像中相似或者相同的像素點(diǎn)就會(huì)被分到同一個(gè)桌子,直到像素被分完,最后統(tǒng)計(jì)桌子數(shù)對(duì)應(yīng)就是聚類數(shù)目。
中國餐廳過程是一個(gè)狄利克雷過程的一種描述性形式,整個(gè)過程運(yùn)用的是狄利克雷過程混合模型,中國餐廳過程在狄利克雷混合過程模型中扮演數(shù)據(jù)的先驗(yàn)分布,假設(shè)存在觀察數(shù)據(jù){y1,...,yn},建立如下分布:
yi|θi~F(θi),
(4)
那么每張桌子也有一個(gè)分布來描述,記為F(θ),這里說的分布即為用中國餐館過程構(gòu)造參數(shù)θ的分布,因此圖像數(shù)據(jù)集服從參數(shù)為θ~F(θ)分布,求解這種非解析表達(dá)式的概率問題,一般沒有具體的解析式來計(jì)算,都是一個(gè)迭代收斂或者極限過程,所以運(yùn)用MCMC方法的吉布斯算法把圖像的像素值聚類到不同的分量分布上,實(shí)現(xiàn)數(shù)據(jù)的聚類,聚類數(shù)目的最大值就是分割區(qū)域w的數(shù)目,當(dāng)圖像中相似或者相同的像素點(diǎn)就會(huì)被分到同一個(gè)桌子,直到像素被分完,最后統(tǒng)計(jì)桌子號(hào)的W就是聚類數(shù)目。
從上面描述可知要進(jìn)行圖像分割首先要對(duì)位置、相空間以及有多少個(gè)位置和相空間進(jìn)行描述,通過公式(1)我們可以知參數(shù)L表示圖像分割為不同區(qū)域的數(shù)目,這個(gè)分割區(qū)域的數(shù)目如何給定,在給定初始參數(shù)L的準(zhǔn)確性直接影響分割圖像效果,MRF圖像分割中采用人工設(shè)置初始參數(shù)L,通過上文2.2了解到中國餐館模型是一種無監(jiān)督分類,可以提前估計(jì)聚類個(gè)數(shù),根據(jù)細(xì)胞圖像染色不均勻,圖像中細(xì)胞的大小不均,以及處理大量圖像等問題[13],本文通過中國餐廳過程可對(duì)數(shù)據(jù)的大小自動(dòng)調(diào)整聚類數(shù)目解決以上問題,因此通過2.2中得到的W參數(shù)數(shù)目代入公式(1)中得到:
(5)
此方法無需人為給定初始分割區(qū)域,可自動(dòng)生成區(qū)域數(shù)目,有效的解決人為誤分割問題,節(jié)省時(shí)間,根據(jù)傳統(tǒng)MRF細(xì)胞圖像分割需設(shè)定區(qū)域數(shù)目相比效果明顯。
本文以人類口腔粘膜細(xì)胞為研究對(duì)象,通過對(duì)細(xì)胞進(jìn)行提取染色得到的細(xì)胞圖像,分辨率為1 600×1 200像素,對(duì)其200個(gè)細(xì)胞圖像進(jìn)行實(shí)驗(yàn)。算法用Matlab 7.0實(shí)現(xiàn),實(shí)驗(yàn)平臺(tái)為8內(nèi)存,處理器為Intel(R)Core(TM) i5-3317U,Windows7操作系統(tǒng)。本次實(shí)驗(yàn)的算法基本流程如圖1所示。
圖1 算法流程圖Fig.1 Flowchart of algorithm
針對(duì)細(xì)胞圖像分割的區(qū)域分割方法進(jìn)行主觀評(píng)價(jià)[14],通過傳統(tǒng)的MRF算法與本文算法效果對(duì)比圖2、圖3中可以看到本文算法自動(dòng)生成的聚類數(shù)后分割的效果明顯高于其他聚類數(shù),通過本文算法與傳統(tǒng)的MRF做比較,結(jié)果發(fā)現(xiàn)本文算法自動(dòng)生成的聚類數(shù)通過MRF圖像分割效果明顯比傳統(tǒng)的需要手動(dòng)輸入其它聚類數(shù)更加準(zhǔn)確。傳統(tǒng)的MRF算法的圖像分割存在人為主觀因素,相比較本文算法自動(dòng)生成的聚類數(shù)的MRF細(xì)胞圖像分割降低了人為主觀因素,效果顯著,在進(jìn)行大量圖片處理時(shí)的優(yōu)勢(shì)也較為明顯。
對(duì)FCM算法、K-means算法分割、文獻(xiàn)[15]與本文算法作對(duì)比實(shí)驗(yàn),部分細(xì)胞圖像分割實(shí)驗(yàn)結(jié)果如圖4、5、6所示,對(duì)同一幅細(xì)胞圖像進(jìn)行定量分析,通過3種基于區(qū)域分割方法與本文分割方法進(jìn)行對(duì)比。(a1)、(b1)、(c1)為原始的口腔粘膜細(xì)胞灰度圖像,(a2)、(b2)、(c2)為無監(jiān)督式聚類分割FCM。FCM聚類分割算法是基于模糊目標(biāo)函數(shù)優(yōu)化的數(shù)據(jù)聚類方法,主要目的在于將向量空間的樣本點(diǎn)按照某種距離度量劃分成幾個(gè)子空間,聚類的結(jié)果特征是一個(gè)數(shù)據(jù)對(duì)聚類中心的隸屬程度。本次實(shí)驗(yàn)中,能夠準(zhǔn)確找到細(xì)胞進(jìn)而分割,但是難以確認(rèn)細(xì)胞中的細(xì)胞核。(a3)、(b3)、(c3)為k-means聚類分割法,這里我們選取k=3為聚類中心個(gè)數(shù)(通過實(shí)驗(yàn)證明在k=3時(shí)會(huì)比同等K-means聚類其它聚類中心個(gè)數(shù)效果明顯),精確度較差一些。(a4)、(b4)、(c4)為文獻(xiàn)[15]分割方法,通過對(duì)遺傳算子的改進(jìn)優(yōu)化二維最大熵的閾值分割,能夠找到細(xì)胞和細(xì)胞中的細(xì)胞核部分,但是穩(wěn)定性較差一些。(a5)、(b5)、(c5)為本文算法,利用中國餐廳餐館過程聚類自動(dòng)劃分得到聚類數(shù)作為MRF分割算法的區(qū)域參數(shù),使用 ICM迭代通過每個(gè)元素的最大條件概率來更新像素值得到本文算法。
圖2 不同聚類數(shù)效果對(duì)比圖。(a)原圖;(b) 傳統(tǒng)算法聚類數(shù)=2;(c)本文得到聚類數(shù)=3; (d)傳統(tǒng)算法聚類數(shù)=4。Fig.2 Comparison of different clustering number renderings of original. (a) Original picture; (b) Number of traditional algorithm clusters = 2; (c) Number of clusters obtained by this thesis= 3; (d) Number of traditional algorithm clusters =4.
圖3 不同聚類數(shù)效果對(duì)比圖。(a)原圖;(b)傳統(tǒng)算法聚類數(shù)=3; (c)傳統(tǒng)算法聚類數(shù)=5; (d)本文得到聚類數(shù)=4。Fig.3 Comparison of different clustering number renderings of original. (a) Original picture; (b) Number of traditional algorithm clusters = 3; (c) Number of traditional algorithm clusters = 5; (d) Number of clusters obtained by this thesis = 4.
圖4 對(duì)原圖a1的4種算法比較。(a1) 原圖;(a2)FCM;(a3)K-means; (a4)文獻(xiàn)[15];(a5)本文算法Fig.4 Comparing the four algorithms of the original image a1. (a1) Original picture; (a2)FCM; (a3)K-means; (a4) Literature [15]; (a5) Algorithm of this thesis.
圖5 對(duì)原圖b1 4種算法的比較。(b1) 原圖; (b2)FCM;(b3)K-means;(b4) 文獻(xiàn)[15];(b5)本文算法。Fig.5 Comparing the four algorithms of the original image b1.(b1) Original picture; (b2)FCM; (b3)K-means; (b4) Literature [15]; (b5) Algorithm of this thesis.
圖6 對(duì)原圖c1 4種算法的比較。(c1) 原圖;(c2)FCM;(c3)K-means;(c4) 文獻(xiàn)[15];(c5)本文算法。Fig.6 Comparing the four algorithms of the original image c1.(c1) Original picture; (c2)FCM; (c3)K-means; (c4) Literature [15]; (c5) Algorithm of this thesis.
為了進(jìn)一步說明本文的算法對(duì)處理細(xì)胞圖像的效果,使用Precision、Dice、MSE 3個(gè)指標(biāo)進(jìn)行評(píng)估,表1給出了對(duì)上面3組口腔黏膜細(xì)胞圖像分割評(píng)價(jià)結(jié)果,圖7給出3種算法在不同定量評(píng)價(jià)中的效果圖。
表1 各算法對(duì)比結(jié)果Tab.1 Comparison results of algorithms
續(xù) 表
先手動(dòng)標(biāo)記被分割口腔黏膜細(xì)胞圖像作為金標(biāo)準(zhǔn),通過本文算法、K-means算法、FCM算法與金標(biāo)準(zhǔn)對(duì)比,其中Precision表示為:
(6)
式(6)中Precision表示正確結(jié)果的像素值除以所有返回結(jié)果的像素值,Precision越大證明精確度越高,分割效果越好。
Dice[16]表示為:
(7)
金標(biāo)準(zhǔn)手動(dòng)分割結(jié)果重合像素的個(gè)數(shù)與利用算法分割結(jié)果與手動(dòng)分割結(jié)果相比,式(7)中M值越大表示分割精度越好。
MSE表示為:
(8)
圖7 算法對(duì)比結(jié)果圖。(a) 對(duì)(a2)、(a3)、(a4)、(a5)的比較;(b) 對(duì)(b2)、(b3)、(b4)、(b5)的比較;(c) 對(duì)(c2)、(c3)、(c4)、(c5)的比較。Fig.7 Algorithm comparison results. (a) Comparison of (a2), (a3), (a4), (a5); (b) Comparison of (b2), (b3), (b4), (b5); (c) Comparison of (c2), (c3), (c4), (c5).
式(8)中,MSE是參數(shù)估計(jì)值(abserved)與參數(shù)真值(predicted)之差的平方期望差,MSE值越小,證明分割效果越好[17]。
本文算法基本上接近金標(biāo)準(zhǔn),通多對(duì)200張不同的細(xì)胞圖像做對(duì)比,結(jié)果顯示本文的算法能夠找到細(xì)胞中的細(xì)胞核、雙核細(xì)胞、微核細(xì)胞并準(zhǔn)確分割,高于FCM和K-means聚類算法和文獻(xiàn)[15]的方法。
針對(duì)細(xì)胞圖像分割的分割不精確等問題提出一種結(jié)合中國餐廳過程的MRF細(xì)胞圖像分割的方法,自動(dòng)獲取初始分割區(qū)域,有效的解決人工設(shè)定初始參數(shù)的不確定性和錯(cuò)分的區(qū)域誤差,減少了認(rèn)為主觀因素影響,可以清晰的分割出細(xì)胞核以及細(xì)胞核中的雙核細(xì)胞、微核細(xì)胞,能夠準(zhǔn)確完成初始參數(shù)估計(jì),降低了誤分割,提高了效率,可準(zhǔn)確鎖定目標(biāo)區(qū)域,較傳統(tǒng)的區(qū)域分割方法具有更光滑的分割圖像。通過對(duì)實(shí)驗(yàn)的定性和定量分析,本文的圖像分割方法的準(zhǔn)確率可以達(dá)96%以上。