王 偉,司淼淼,陳芙蕖,劉 慧,姜小明,李章勇
(重慶郵電大學(xué) 生物醫(yī)學(xué)工程研究中心,重慶 400065)
計(jì)算機(jī)輔助的細(xì)胞自動(dòng)分析,可以減輕醫(yī)生的負(fù)擔(dān),提高結(jié)果的客觀性和一致性,為自動(dòng)鏡檢提供新的機(jī)遇[1]。糞便鏡檢圖像與尿液鏡檢圖像存在較大區(qū)別,有形成分和背景環(huán)境更加復(fù)雜,同類細(xì)胞差異較大,單個(gè)細(xì)胞存在破損和粘連現(xiàn)象。目前在顯微鏡檢領(lǐng)域,自動(dòng)分析技術(shù)研究偏重于尿液有形成分分析[2-3],臨床已實(shí)現(xiàn)尿液鏡檢的自動(dòng)識(shí)別,但對(duì)糞便鏡檢的自動(dòng)識(shí)別研究還比較少,大多數(shù)糞便鏡檢過(guò)程還由人工完成。
紅白細(xì)胞是顯微鏡檢圖像中最具有臨床價(jià)值的必要檢查參數(shù)[4]。本文研究對(duì)象為20倍目鏡系統(tǒng)采集的鏡檢圖像,與傳統(tǒng)40倍目鏡系統(tǒng)相比,20倍目鏡系統(tǒng)圖像視野擴(kuò)大,檢測(cè)效率提高,但存在細(xì)胞邊緣更模糊,結(jié)構(gòu)更不清晰、特征更不明顯等缺點(diǎn),給圖像識(shí)別過(guò)程中的關(guān)鍵的分割以及特征提取部分帶來(lái)困難。另外,為使細(xì)胞特征更明顯,臨床通常對(duì)鏡檢圖像使用諸如熒光、染色或DNA標(biāo)簽之類的參考標(biāo)記方式,但是這樣會(huì)提高成本而且影響細(xì)胞活性,一般只在實(shí)驗(yàn)中使用,因此,本文主要研究無(wú)染色/標(biāo)記紅白細(xì)胞鏡檢圖像。目前在顯微細(xì)胞圖像識(shí)別領(lǐng)域已經(jīng)出現(xiàn)很多種圖像分割以及特征提取方法[5-6]。常用的圖像分割方法有邊緣檢測(cè)、閾值處理、形態(tài)學(xué)以及分水嶺方法等,但是由于低倍率糞便鏡檢圖像本身的復(fù)雜性以及細(xì)胞存在弱邊緣問(wèn)題,采用單一的圖像分割方法并不能準(zhǔn)確無(wú)誤的分割出細(xì)胞。常用的顯微細(xì)胞圖像特征組合主要包含形狀、統(tǒng)計(jì)和紋理特征,其中,形狀特征是在分割后的二值圖像上計(jì)算的,選取的參數(shù)主要有面積、周長(zhǎng)、圓形度和矩形度等;統(tǒng)計(jì)特征是基于細(xì)胞圖像灰度直方圖計(jì)算的,選取的參數(shù)主要有、平均值、方差、三階矩、一致性;圖像的紋理是指圖像像素顏色的或灰度的變化規(guī)律,與空間統(tǒng)計(jì)密切相關(guān),描述紋理特征一般以灰度-梯度空間來(lái)表示,灰度-梯度空間矩陣體現(xiàn)了各像素點(diǎn)梯度和灰度的空間關(guān)系和分布規(guī)律,選取的參數(shù)主要有能量、灰度平均、梯度平均、慣性、小梯度優(yōu)勢(shì)、大梯度優(yōu)勢(shì)、灰度熵、梯度熵和混合熵[7]。在實(shí)際的應(yīng)用中,圖像識(shí)別軟件不僅要求有較高的識(shí)別率確保準(zhǔn)確性,同時(shí)要求一定的實(shí)時(shí)性,保證識(shí)別的速度和效率。常用的顯微細(xì)胞圖像特征組合特征數(shù)比較多,計(jì)算較為困難,耗時(shí)長(zhǎng),并且低倍鏡下的糞便鏡檢圖像紅白細(xì)胞存在結(jié)構(gòu)不清晰、內(nèi)部紋理特征不明顯等特點(diǎn),所以在低倍率情況下不適用。近年來(lái),也出現(xiàn)很多基于機(jī)器視覺(jué)的細(xì)胞自動(dòng)識(shí)別方法,例如:k近鄰法、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等機(jī)器學(xué)習(xí)方法。k近鄰法適用于大樣本容量類的自動(dòng)分類,而小樣本容量的類采用這種方法比較容易產(chǎn)生誤分[8]。神經(jīng)網(wǎng)絡(luò)方法具有較強(qiáng)的學(xué)習(xí)能力和并行處理的功,但是也存在過(guò)學(xué)習(xí)、維數(shù)災(zāi)難以及局部極小解等問(wèn)題。相比之下,支持向量機(jī)(support vector machine,SVM)采用核函數(shù),很好地解決了維數(shù)問(wèn)題;采用二次規(guī)劃尋優(yōu),可以得到全局最優(yōu)解;應(yīng)用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,充分考慮了經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信風(fēng)險(xiǎn),有良好的泛化性能[9]。
綜上所述,本文主要研究目的是提供一種基于低維特征條件的低倍率鏡檢圖像紅白細(xì)胞識(shí)別算法,不僅能保證識(shí)別準(zhǔn)確率,還能為提高識(shí)別速度提供了可能,如圖1所示。首先針對(duì)紅白細(xì)胞對(duì)比度低、邊緣模糊等弱邊緣問(wèn)題,采用彩色圖像空間分離、邏輯或運(yùn)算和形態(tài)學(xué)方法完成初步分割,之后采用面積等特征單獨(dú)提取粘連細(xì)胞,采用基于迭代腐蝕的標(biāo)記分水嶺方法分割。再針對(duì)低倍率鏡檢圖像紅白細(xì)胞結(jié)構(gòu)不清晰、內(nèi)部紋理特征不明顯等特點(diǎn),提出一種基于形態(tài)和Canny算子方法的細(xì)胞低特征提取方法,提取出6個(gè)相關(guān)特征組成特征向量用于訓(xùn)練SVM分類器。
圖1 低倍率顯微鏡檢圖像Fig.1 Low-rate microscopic image
識(shí)別分類之前,需要先定位紅白細(xì)胞,并從圖像背景中分離它們[10]。由于低倍率糞便鏡檢圖像背景復(fù)雜,并且存在細(xì)胞灰度分布不均勻、對(duì)比度低、邊緣模糊等弱邊緣問(wèn)題,采用單一的圖像分割方法不能準(zhǔn)確無(wú)誤分割出紅白細(xì)胞。本文將原圖像進(jìn)行彩色空間分離,將R,G和B分量圖像邊緣檢測(cè)結(jié)果進(jìn)行邏輯或運(yùn)算,并通過(guò)形態(tài)學(xué)方法處理完成初步分割,得到單個(gè)細(xì)胞分割圖像和粘連細(xì)胞分割圖像;然后針對(duì)粘連細(xì)胞,采用基于迭代腐蝕的標(biāo)記分水嶺方法再次分割,通過(guò)多種方法互補(bǔ)得到最后完整分割結(jié)果,提高分割的精確度。分割算法的流程圖如圖2所示。
圖2 分割算法流程圖Fig.2 Flow of the segmentation algorithm
在鏡檢圖像分割時(shí),通常都是單獨(dú)對(duì)灰度圖像進(jìn)行邊緣檢測(cè),不能形成封閉曲線,影響細(xì)胞邊緣的完整提取。本文方法將原彩色圖像的R,G和B分量圖像的Canny邊緣檢測(cè)結(jié)果進(jìn)行邏輯或運(yùn)算,能夠彌補(bǔ)單張灰度圖像邊緣檢測(cè)斷裂情況,達(dá)到很好的信息互補(bǔ)作用,如圖3b所示,可以使很多細(xì)胞斷開(kāi)的邊緣形成閉合。在完成邊緣檢測(cè)后,采用開(kāi)、閉運(yùn)算以及填充等形態(tài)學(xué)方法對(duì)或運(yùn)算結(jié)果圖像完成毛刺的清理、以及刪除小面積對(duì)象和填充等操作以達(dá)到更好的分割效果,如圖3c所示;之后在圖像初步分割基礎(chǔ)上,利用面積等特征單獨(dú)提取粘連細(xì)胞,使用4鄰域和8鄰域結(jié)構(gòu)元素交替對(duì)粘連細(xì)胞圖像進(jìn)行迭代腐蝕求得細(xì)胞種子點(diǎn)圖像,然后用標(biāo)記分水嶺進(jìn)行分割[11]。最后融合單個(gè)細(xì)胞分割圖像和粘連細(xì)胞分割圖像,得到最終分割二值圖像,如圖3d所示,可以看出整體細(xì)胞分割效果良好,粘連細(xì)胞也很好的被分開(kāi),有助于之后對(duì)紅白細(xì)胞進(jìn)行特征提取。
識(shí)別出紅白細(xì)胞種類是整個(gè)方法流程的核心部分,而細(xì)胞的特征選擇和提取是進(jìn)行識(shí)別的關(guān)鍵環(huán)節(jié)[12]。為了提高識(shí)別的準(zhǔn)確度和效率,必須選擇適當(dāng)?shù)奶卣鹘M合,選擇的特征一般需要具有可區(qū)分性強(qiáng)、可靠性高以及獨(dú)立性好的特點(diǎn),盡可能地減少整個(gè)識(shí)別系統(tǒng)的運(yùn)行時(shí)間和錯(cuò)誤識(shí)別率[13]。本文方法根據(jù)紅白細(xì)胞在形態(tài)、FFT變換以及Canny邊緣檢測(cè)圖像的差別,提出6個(gè)相關(guān)特征組成特征向量,在保證識(shí)別效果的情況下,同時(shí)以較少的特征簡(jiǎn)化算法運(yùn)算,提高識(shí)別速度。
圖3 糞便圖像分割效果圖Fig.3 Fecal image segmentation
分割后紅白細(xì)胞子圖像的典型樣本如圖4a和圖4d所示,其中,紅細(xì)胞細(xì)胞質(zhì)比較均勻,一般呈雙凹圓盤形,正常成熟的紅細(xì)胞沒(méi)有細(xì)胞核;白細(xì)胞細(xì)胞質(zhì)清晰,呈顆粒狀,有細(xì)胞核,體積比紅細(xì)胞大。圖4b和圖4e是紅白細(xì)胞進(jìn)行FFT變換后頻域圖像二值化之后的圖像,可以看出,紅白細(xì)胞都近似圓形,但白細(xì)胞相對(duì)有點(diǎn)分散,圓形度表現(xiàn)沒(méi)有紅細(xì)胞好;圖4c和圖4f是對(duì)紅白細(xì)胞進(jìn)行Canny邊緣檢測(cè)得到的圖像,研究發(fā)現(xiàn)紅細(xì)胞的邊緣檢測(cè)出多個(gè)半徑不同的圓環(huán)且呈現(xiàn)包含關(guān)系,而白細(xì)胞邊緣檢測(cè)成不規(guī)則曲線。
圖4 紅白細(xì)胞以及相關(guān)處理圖Fig.4 Related processing of red and white cell
常用的顯微細(xì)胞圖像特征值包含形狀、統(tǒng)計(jì)和紋理特征等3類,低倍鏡下的鏡檢圖像中紅白細(xì)胞的內(nèi)部紋理信息比較粗糙和模糊,本文經(jīng)過(guò)實(shí)驗(yàn)測(cè)試沒(méi)有選擇相關(guān)描述統(tǒng)計(jì)和紋理特征的參數(shù)。本文在形狀特征描述中主要選取了周長(zhǎng)L、面積A和圓形度C這3個(gè)參數(shù)[14],其中,圓形度是基于紅白細(xì)胞進(jìn)行FFT變換后頻域圖像二值化之后的圖像計(jì)算的[15];根據(jù)紅白細(xì)胞在其Canny邊緣檢測(cè)圖像表現(xiàn)的不同,提出3個(gè)新的Canny算子特征參數(shù),連通域數(shù)M是描述細(xì)胞Canny邊緣檢測(cè)后二值圖像的8連通域數(shù),像素和S是描述細(xì)胞Canny邊緣檢測(cè)后二值圖像的像素和,另外考慮排除細(xì)胞大小的影響,對(duì)2個(gè)特征做歸一化處理得出閉合比值H是連通域數(shù)M和像素和S的乘積與分割后二值化圖像面積A的比值,數(shù)學(xué)公式表達(dá)式為
(1)
本文選擇的描述紅白細(xì)胞特征參數(shù)組合總結(jié)如表1所示。
以FFT后二值圖像的圓形度和閉合比值2個(gè)不相關(guān)的特征參數(shù)為例,分別隨機(jī)選擇100個(gè)紅細(xì)胞和白細(xì)胞構(gòu)造參數(shù)坐標(biāo)圖,結(jié)果如圖5所示。圖5a和圖5b展示了單個(gè)特征參數(shù)在細(xì)胞分類中的作用,其中,橫坐標(biāo)表示細(xì)胞編號(hào),數(shù)值從1-100,縱坐標(biāo)分別為FFT后二值圖像的圓形度C和閉合比值H,從圖5中看出,2個(gè)特征參數(shù)分別對(duì)紅白細(xì)胞有一定程度的區(qū)分度。圖5c是對(duì)2個(gè)特征參數(shù)的立體化顯示,其中,z軸表示細(xì)胞編號(hào),可以看出紅白細(xì)胞交集很少,表示FFT后的圓形度C和閉合比值H組成的二維特征向量對(duì)紅白細(xì)胞分類有著重要的作用。
表1 特征類別與描述
圖5 紅白細(xì)胞參數(shù)坐標(biāo)圖Fig.5 Parametric coordinate map of red and white cells
紅白細(xì)胞特征提取之后,需要將特征向量輸入到分類器進(jìn)行分類和識(shí)別,本文選擇支持向量機(jī)作為紅白細(xì)胞分類器。SVM是由Vapnik首先提出的一種專門適用于小樣本學(xué)習(xí)問(wèn)題的有監(jiān)督的通用學(xué)習(xí)算法[16]。它不基于傳統(tǒng)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,而是結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,既能減小訓(xùn)練誤差還能提高泛化能力,為機(jī)器學(xué)習(xí)問(wèn)題提供了新的思路和方法[17]。它的原理是通過(guò)構(gòu)造一個(gè)最優(yōu)分類超平面,使分開(kāi)的2個(gè)類別有最大間隔,使得分隔具有更高的可信度,而且對(duì)于未知的新樣本有很好的分類預(yù)測(cè)能力。當(dāng)樣本非線性可分時(shí),將數(shù)據(jù)樣本映射到高維空間,采用核函數(shù),把非線性問(wèn)題轉(zhuǎn)化成線性問(wèn)題求解。對(duì)于核函數(shù)的選擇一般與分類問(wèn)題本身相關(guān),本文通過(guò)預(yù)實(shí)驗(yàn)發(fā)現(xiàn)線性核函數(shù)分類效果最好,因此,在分類階段選擇的核函數(shù)是線性核函數(shù)。線性核函數(shù)的數(shù)學(xué)公式表達(dá)為
(2)
紅白細(xì)胞識(shí)別實(shí)驗(yàn)基于LIBSVM識(shí)別函數(shù)庫(kù)實(shí)現(xiàn),實(shí)驗(yàn)圖像為未染色的低倍率糞便鏡檢原圖,分辨率2 048×1 056,放大倍數(shù)20倍。實(shí)驗(yàn)中選取原始圖像60幅,分割得到紅細(xì)胞和白細(xì)胞子圖像,從紅白細(xì)胞子圖像中各選擇100個(gè)作為訓(xùn)練集,各300個(gè)作為測(cè)試集。當(dāng)SVM分類器通過(guò)紅白細(xì)胞樣本訓(xùn)練完成之后,將已經(jīng)提取的紅白細(xì)胞測(cè)試樣本特征向量輸入SVM分類器進(jìn)行分類并識(shí)別。
為了進(jìn)行比較,實(shí)驗(yàn)對(duì)SVM分類器選擇輸入2組不同的特征向量分別對(duì)紅白細(xì)胞進(jìn)行分類并識(shí)別,其中一組采用顯微細(xì)胞圖像識(shí)別常用的形狀、統(tǒng)計(jì)和紋理特征,分別為面積、周長(zhǎng)、圓形度、矩形度、平均值、方差、三階矩、一致性、能量、灰度平均、梯度平均、慣性、小梯度優(yōu)勢(shì)、大梯度優(yōu)勢(shì)、灰度熵、梯度熵和混合熵共17維[7];另一組采用本文特征選擇部分提取的特征,分別為周長(zhǎng)、面積、FFT后的圓形度、連通域數(shù)、像素和以及閉合比值共6維。表2是紅白細(xì)胞識(shí)別測(cè)試比較結(jié)果,其中采用常用特征紅細(xì)胞的識(shí)別率為53.0%,采用本文選擇的特征組合紅細(xì)胞的識(shí)別率為91.7%;采用常用特征白細(xì)胞的識(shí)別率為71.0%,采用本文選擇的特征組合白細(xì)胞的識(shí)別率為92.7%,可以看出,在低倍率情況下采用本文選擇的紅白細(xì)胞特征組合識(shí)別效果良好,并且明顯優(yōu)于顯微圖像識(shí)別常用的形狀、統(tǒng)計(jì)和紋理特征組合,以較少的特征組合完成更優(yōu)的識(shí)別效果;另外,在MATLAB環(huán)境下測(cè)試不同算法的紅白細(xì)胞識(shí)別時(shí)間,發(fā)現(xiàn)本文選擇的紅白細(xì)胞特征組合在識(shí)別時(shí)間上也有較大優(yōu)勢(shì),識(shí)別時(shí)間明顯降低,識(shí)別速度有了進(jìn)一步提高。低倍鏡下的糞便鏡檢圖像紅白細(xì)胞存在結(jié)構(gòu)不清晰、內(nèi)部紋理特征不明顯等特點(diǎn),因此,采用常規(guī)的顯微圖像識(shí)別常用的形狀、統(tǒng)計(jì)和紋理特征識(shí)別效果不是特別好,識(shí)別率低于本文選擇的特征組合識(shí)別結(jié)果,因?yàn)槠涑浞掷昧思t白細(xì)胞在形態(tài)、FFT變換以及Canny邊緣檢測(cè)圖像的差別,很好的選取了6個(gè)特征組成特征向量,降低了特征維數(shù),減少了算法計(jì)算的運(yùn)算量,提高了識(shí)別的準(zhǔn)確度和效率。
表2 低倍率紅白細(xì)胞識(shí)別測(cè)試結(jié)果比較
國(guó)內(nèi)外對(duì)糞便鏡檢圖像細(xì)胞識(shí)別分析的研究相對(duì)來(lái)說(shuō)比較少,而且現(xiàn)有的研究都是基于40倍目鏡的,文獻(xiàn)[18]研究了基于模糊聚類的糞便鏡檢圖像識(shí)別研究,實(shí)驗(yàn)采用40倍顯微鏡檢圖像,結(jié)果顯示,聚類準(zhǔn)確率并不是很高,其中紅細(xì)胞的識(shí)別率是86.9%;白細(xì)胞的識(shí)別率是85.6%。本文主要研究的是基于20倍目鏡的低倍率鏡檢圖像,識(shí)別算法設(shè)計(jì)簡(jiǎn)單,在保證識(shí)別效果的情況下,同時(shí)以較少的特征簡(jiǎn)化運(yùn)算,提高識(shí)別速度,兼顧識(shí)別速度和效率,能夠滿足實(shí)際的顯微檢測(cè)的要求。
實(shí)驗(yàn)將樣本數(shù)分別為300的紅白細(xì)胞子圖像分成3組,每組各100個(gè)紅細(xì)胞和白細(xì)胞,分別進(jìn)行了測(cè)試,求得識(shí)別準(zhǔn)確率的均值與標(biāo)準(zhǔn)差,如圖6所示。在識(shí)別部分,訓(xùn)練和測(cè)試集樣本數(shù)目和比例會(huì)對(duì)識(shí)別產(chǎn)生一定的影響,而且由于鏡檢圖像中紅白細(xì)胞存在異型的情況,例如紅細(xì)胞有小紅細(xì)胞和大紅細(xì)胞情況,白細(xì)胞存在亞型情況,也會(huì)對(duì)識(shí)別產(chǎn)生一定的影響,所以隨著樣本數(shù)目的變化識(shí)別率也會(huì)有所改變,但是從圖6可以看出,隨著樣本數(shù)目的改變,采用本文特征組合紅白細(xì)胞的識(shí)別率變化不大,相對(duì)比較穩(wěn)定。
圖6 紅白細(xì)胞分組識(shí)別結(jié)果比較Fig.6 Comparison of results of red and white cells grouping
本文基于圖像處理和SVM識(shí)別技術(shù)研究了低倍率鏡檢圖像中紅白細(xì)胞自動(dòng)識(shí)別方法,首先通過(guò)對(duì)圖像分割方法研究比較提出一種基于邏輯或運(yùn)算和形態(tài)學(xué)的綜合分割方法,有效地實(shí)現(xiàn)了鏡檢圖像紅白細(xì)胞的分割和定位;再比較和研究紅白細(xì)胞的差別,很好地選取了6個(gè)特征,最后采用SVM分類器識(shí)別。實(shí)驗(yàn)以背景和成分最為復(fù)雜的糞便鏡檢圖像為例進(jìn)行了測(cè)試,紅細(xì)胞的識(shí)別率為91.7%,白細(xì)胞的識(shí)別率為92.7%,以較少的特征組合完成更優(yōu)的識(shí)別效果,兼顧識(shí)別準(zhǔn)確度和速度;而且識(shí)別效果相對(duì)穩(wěn)定,受紅白細(xì)胞異型情況的影響較小,在客觀量化分析的基礎(chǔ)上實(shí)現(xiàn)了紅白細(xì)胞的自動(dòng)識(shí)別,從而減少了人工識(shí)別的工作量,有希望進(jìn)一步應(yīng)用于臨床鏡檢。