張學典+蔡雨杏+汪泓
摘要:肝癌已經(jīng)成為常見的惡性腫瘤,組織切片顯微圖像的病理分析是診斷的主要手段,細胞的準確分割是病理分析的重要環(huán)節(jié)。提出了一種新的基于H&E染色組織病理學圖像的肝癌細胞分割算法,首先用彩色卷積方法進行主成分提取得到灰度圖像,在此灰度圖像的基礎(chǔ)上,進行形態(tài)學處理;然后運用快速徑向?qū)ΨQ變換提取種子點作為前景標記,進行分水嶺分割;最后將分水嶺分割得到的輪廓線作為初始輪廓進行GVF主動輪廓分割,得到更為精確的輪廓線。分割結(jié)果的陽性預(yù)測平均值達到0.89,召回率平均值達到0.9,證明了該算法細胞定位的準確性。Dice系數(shù)平均值為0.84,證明了本算法細胞分割區(qū)域的準確性。
關(guān)鍵詞:H&E;細胞分割;徑向?qū)ΨQ變換;分水嶺分割;主動輪廓模型
DOIDOI:10.11907/rjdk.172017
中圖分類號:TP312
文獻標識碼:A 文章編號:1672-7800(2017)012-0081-05
Abstract:Liver cancer has become a common malignant tumor in the world. Analysis of histopathology images is one of the main methods for diagnosis and precise segmentation of cell and nuclei is the first step towards automatic analysis of histopathology images. A new nuclei segmentation method that works with H&E stained liver cancer histopathology images was proposed. The procedure can be concluded as the following steps: getting the grayscale image by color convolution, selecting seed points utilizing fast radial symmetry transform, marker-controlled watershed segmentation, getting final contour via active contour model. The evaluation was done in terms of positive predictive value, recall and Dice coefficient. The mean predictive value was 0.89 and the mean recall was 0.9 which indicates the accuracy of cell detection. The mean Dice coefficient was 0.84 which indicates the accuracy of segmentation.
Key Words:H&E; cell segmentation; fast radial symmetry transform; watershed; ACM
0 引言
近年來,圖像處理與計算機視覺技術(shù)在生物醫(yī)學工程領(lǐng)域的廣泛應(yīng)用加快了生物醫(yī)學的發(fā)展。利用計算機技術(shù)對光學顯微鏡細胞圖像進行細胞參數(shù)的定量分析,可以輔助醫(yī)師判別細胞病變狀態(tài),從而在一定程度上減輕醫(yī)務(wù)人員的工作負擔,具有很大的應(yīng)用潛力。因此,細胞圖像處理逐漸成為醫(yī)學圖像處理領(lǐng)域的一個研究熱點[1]。實現(xiàn)細胞圖像的病理學識別,重點在于細胞圖像分割,即從顯微鏡細胞圖像中提取出所需的細胞區(qū)域,從而為后續(xù)定量分析作必要的準備。
截至目前,國內(nèi)外學者已經(jīng)對細胞圖像的分割技術(shù)進行了大量研究。其中主要有兩類研究,一類是針對顯微鏡低倍物鏡采集的低分辨率大圖像分割,這類分割主要是實現(xiàn)細胞核、實質(zhì)細胞區(qū)域的定位;另一類是針對顯微鏡高倍物鏡采集的高分辨率細胞圖像,這類分割主要是實現(xiàn)單細胞、重疊細胞圖像的分割。醫(yī)生能夠通過快速數(shù)碼掃描獲得整張圖片,從而進行病理學分析。H&E染色是組織學、胚胎學、病理學教學與科研中最基本、使用最廣泛的技術(shù),但由于組織的多樣性和復(fù)雜性,H&E染色圖像的自動化分析仍然是個挑戰(zhàn)。自動化分析數(shù)字顯微圖像的第一步是細胞和細胞核的分割。Cosatt等[2]采用霍夫變換確定種子點,并對每個種子點運用主動輪廓模型進行演化得到細胞輪廓;Kong等[3]采用基于GVF的主動輪廓模型提取細胞核;Vink等[4]將聚類算法與主動輪廓模型相結(jié)合,提取乳腺細胞的細胞核;Wahlby等[5]采用H最小值變換提取種子點,并在此基礎(chǔ)上進行分水嶺分割;Hafiane等[6]采用模糊聚類方法和多相水平集相結(jié)合提取細胞核;Al-Kofahi等[7]提出一種多尺度LoG濾波方法提取細胞核的中心作為種子點進行分水嶺分割;Yang等[8]運用基于梯度的彩色Snake算法分割血細胞。
本算法研究的是針對高分辨率H&E染色細胞圖像與重疊細胞圖像的分割。無論是哪類細胞圖像的分割,目前的分割算法大多是圍繞主動輪廓模型、分水嶺算法、像素聚類或者上述方法的結(jié)合,再加上一些預(yù)處理和后處理以及探測和定位過程。上述算法大多需要通過后處理剔除錯誤細胞,且大部分針對的不是H&E染色圖像,故本文提出一種將前景標記分水嶺和主動輪廓模型相結(jié)合的算法,對H&E染色的組織病理學圖像中的細胞核進行分割。本算法結(jié)合了多種處理算法,在預(yù)處理方面采用形態(tài)學重建方法,前景標記方法采用快速徑向?qū)ΨQ變換,相比于傳統(tǒng)算法能產(chǎn)生更好的分割效果,在分水嶺分割結(jié)果的基礎(chǔ)上進行主動輪廓模型分割能夠提高準確性。本算法的評價性能指標主要有3項:陽性預(yù)測值、召回率、Dice系數(shù)。其中陽性預(yù)測值和召回率評價的是細胞定位的準確性,Dice系數(shù)評價的是細胞分割區(qū)域的準確性。
1 前景標記分水嶺與主動輪廓模型結(jié)合算法
本文采用的算法流程如圖1所示。首先對彩色圖像進行主成分分析,得到含有蘇木精顏色信息的灰度圖像,然后用形態(tài)學操作進行預(yù)處理,去除干擾成分,得到較好的細胞核輪廓,再運用快速徑向?qū)ΨQ變換提取種子點,將種子點標記在原圖中,在進行后景標記后運用分水嶺變換完成預(yù)分割,將預(yù)分割得到的輪廓線作為主動輪廓模型的初始輪廓,進行曲線演化得到最終輪廓。下文將詳細介紹本文算法中用到的關(guān)鍵算法。
1.1 前景標記分水嶺
1.1.1 主成分分析
H&E染色圖像細胞分割的第一步是主成分提取,本文采用了Ruifrok[9]提出的彩色分離技術(shù),該技術(shù)主要利用亮場條件下的顯微圖像信息能運用朗伯定律進行模擬分析這一事實,相機獲取圖像時探測到R、G、B三個信道的光強,而從單色染色的圖像中獲取特定染料的吸收系數(shù)。由于細胞核被蘇木精染成了紫色,提取蘇木精染色部分并轉(zhuǎn)化成灰度圖,本算法的后續(xù)步驟都是基于該灰度圖。
利用該矩陣進行彩色卷積即可將圖像中三種染料的染色圖像分離出來,達到主成分提取的效果。
1.1.2 形態(tài)學處理
經(jīng)過分離得到的蘇木精染色圖像仍有比較雜亂的結(jié)構(gòu),這會阻礙種子點的選取和最后的分割。本算法通過一系列形態(tài)學灰度重建操作將這些結(jié)構(gòu)濾除[10]。使用形態(tài)學開重建可以將小于結(jié)構(gòu)元素的亮目標去除,類似地,使用形態(tài)學閉重建可以將小于結(jié)構(gòu)元素的暗目標去除,交替進行這兩個操作可以產(chǎn)生較為平滑的圖像。另外,可以通過調(diào)節(jié)結(jié)構(gòu)元素的大小獲得想要的圖像細節(jié)。在蘇木精圖像中,先進行形態(tài)學開重建,再進行形態(tài)學閉重建。結(jié)構(gòu)元素大小要根據(jù)所需細胞核大小、圖像分辨率和濾除結(jié)構(gòu)的大小進行選擇。
在完成了以上兩個操作之后,細胞核的主輪廓往往不規(guī)則且?guī)в忻?,為解決該問題,本算法提出用一個比較小的結(jié)構(gòu)元素進行閉操作,可以在不影響主輪廓位置的情況下,簡化目標形狀,消除毛刺,去除不必要的粘連。結(jié)構(gòu)元素尺寸為之前開操作和閉操作結(jié)構(gòu)元素大小的一半。
當然,選取能適用于所有圖像的結(jié)構(gòu)元素是不可能的,結(jié)構(gòu)元素大小應(yīng)根據(jù)想要移除的結(jié)構(gòu)大小進行選擇。若結(jié)構(gòu)元素過大,會失去圖像細節(jié),若結(jié)構(gòu)元素過小,會導(dǎo)致某些子結(jié)構(gòu)無法去除,都會影響分割效果。故對于不同尺度的圖像,選用的結(jié)構(gòu)元素也不同。
1.1.3 快速徑向?qū)ΨQ變換
快速徑向?qū)ΨQ變換是一種提取徑向?qū)ΨQ中心的變換,在某種程度上類似于霍夫圓變換,二者的主要區(qū)別在于:前者主要考察一幅圖像中每個像素點對它周圍鄰域內(nèi)像素點的作用(貢獻),而后者則主要考察一個像素點的鄰域?qū)Ξ斍跋袼攸c的作用(貢獻)[11]。該算法的算法復(fù)雜度為O(KN),其中K為原圖像總像素點數(shù),N為考察的N*N的鄰域范圍。該算法原本用于人臉識別,后來被用于淋巴瘤細胞的自動分析,Chekkoury[12]將該變換用于乳腺癌切片細胞的分割。
大部分細胞核的輪廓具有高度徑向?qū)ΨQ性,故本算法運用該變換進行細胞核定位。為定位細胞核,可以忽略梯度最大值信息,僅需要利用該算法計算圖像的方向投影圖。該算法尤其適用于細胞核和背景區(qū)域?qū)Ρ榷容^低的情況。
1.1.4 前景后景標記與分水嶺分割
普通的分水嶺算法容易導(dǎo)致過分割,故在經(jīng)過形態(tài)學處理之后,本算法運用標記控制的分水嶺算法進行圖像分割[13]。針對本實驗選擇圖像的放大倍數(shù),設(shè)定半徑的集合為N,得到的快速徑向變換結(jié)果S,再利用h最小值變換,得到S的局部最小值,得到的局部最小值點即為用作前景標記的種子點。h最小值變換公式如下:
其中,ρ為形態(tài)學灰度重建的腐蝕算子,h為深度參數(shù),該變換會壓縮所有深度小于h的點。
運用分水嶺算法還需標記出背景,本算法采用背景圖的形態(tài)學骨架作為背景標記,得到圖像的前景后景標記之后,通過在標記處添加局部最小值改變Sobel梯度最大值圖像,該圖像是分水嶺分割的關(guān)鍵分割函數(shù)。
1.2 GVF Snake
分水嶺算法得出的細胞輪廓不一定準確,故本文將改進的分水嶺算法得出的細胞輪廓作為初始輪廓,通過基于梯度矢量流的主動輪廓模型得到更為精確、平滑的細胞輪廓。
1.2.1 GVF Snake基本思想
Snake模型是圖像中一條表示突出形狀的曲線,可以用v(s)=(x(s),y(s) ),s∈(0,1)表示,該曲線在內(nèi)力和外力的共同作用下,朝著物體的邊界或感興趣的圖像特征移動。內(nèi)力體現(xiàn)的是曲線本身具有的特性,如光滑性、連續(xù)性等,并根據(jù)所需特征計算外力,如邊緣等。
Snake的數(shù)學模型是個能量公式,此能量公式是根據(jù)Snake曲線上的點在物體邊界時該公式取得最小值而建立的。因此, 定位物體的邊界問題則轉(zhuǎn)化為對能量公式求最小值的問題,即一個內(nèi)力和外力平衡方程:
其中,f為邊緣圖f的梯度場;μ是控制GVF場光滑性的參數(shù),可以根據(jù)圖片的噪聲確定,噪聲越大,μ越大。
利用歐拉方程解出GVF場,同樣通過最小化能量函數(shù)實現(xiàn)曲線的演化。
本文運用梯度矢量流迭代計算每個細胞的終止輪廓,步驟如下:①由圖像梯度求出邊緣圖;②迭代計算得到GVF全局變量u、v;③由每個細胞核初始輪廓上的點(x,y)迭代計算出終止輪廓上點的坐標值(xsnake,ysnake );④在原圖上標記最終輪廓。
2 實驗與結(jié)果分析
本文選擇顯微鏡放大40倍的H&E染色的肝癌組織病理學細胞圖像進行分割,圖片大小為572×567像素。
在進行形態(tài)學處理時,為達到消除毛刺且同時保留細胞核結(jié)構(gòu)的目的,通過反復(fù)試驗,最終形態(tài)學處理灰度重建的結(jié)構(gòu)元素大小選擇為8,則閉操作的結(jié)構(gòu)元素大小設(shè)為一半,即為4。由于圖像中每個細胞核的半徑都在10個像素左右,故快速徑向?qū)ΨQ變換的半徑參數(shù)R設(shè)為10。在GVF主動輪廓模型中,為了得到精確的輪廓,迭代次數(shù)設(shè)為150;GVF光滑性參數(shù)μ越小,最終的圖案圓形度越好,但是光滑性會變差。鑒于細胞具有良好的圓形度,同時也需要得到較為光滑的輪廓,故設(shè)定μ為0.2;彈性參數(shù)α控制Snake曲線的張力,由于細胞的輪廓比較精細,故α取一個較小的值0.05;剛性參數(shù)β影響曲線硬度,一般設(shè)置為0;黏性參數(shù)設(shè)置為0.1,外部力權(quán)重k影響外部力的大小,設(shè)置為0.5。其中一幅肝癌細胞分割過程及結(jié)果如圖4所示。本文還對另10幅相同放大倍數(shù)的肝癌細胞組織病理學圖像進行了分割,從分割結(jié)果可以看出,除個別細胞分割不準確,以及個別粘連細胞沒有分割出來外,其它細胞的分割較為準確,達到了較好效果。分析分割不準確的區(qū)域,可以發(fā)現(xiàn)該細胞分割錯誤是細胞核周圍組織染色較深導(dǎo)致的。
其中,TP為分割正確的細胞個數(shù),F(xiàn)P為分割出的錯誤細胞個數(shù),F(xiàn)N為未被分割出的細胞個數(shù),X為人工分割的基準圖像,Y為算法分割出的圖像。
統(tǒng)計結(jié)果如表1所示,可以發(fā)現(xiàn)本算法的陽性預(yù)測值和召回率都很高,在0.9左右,證明本算法的定位精確性較高;Dice系數(shù)也在0.8左右,分割出的輪廓接近真實的細胞核輪廓。
3 結(jié)語
本文主要處理的是H&E染色的肝癌組織細胞圖像,提出了一種將分水嶺算法與主動輪廓模型相結(jié)合的算法,并采用快速徑向變換這種新方法進行種子點提取。實驗結(jié)果表明,本算法在細胞的定位和分割方面具有較好的準確性,克服了傳統(tǒng)分水嶺算法過分割的問題,可以用于細胞核的輪廓提取與定位。但是本算法采集的圖像屬于輕度肝癌圖像,細胞分布密度較為稀疏,還需要采集細胞密度較高的圖像驗證其準確性。
參考文獻:
[1] 范金坪.宮頸細胞圖像分割和識別方法研究[D].廣州:暨南大學,2010.
[2] E COSATTO, M MILLER, HP GRAF, et al. Grading nuclear plemorphism on histological micrographs[C].19th International Conference on Pattern Recognition,USA:IEEE,2009:1-4.
[3] J KONG, L COOPER, T KURC, et al. Towards building computerized image analysis framework for nucleus discrimination in microscopy images of diffuse glioma[C]. International Conference of the IEEE Engineering in Medicine and Biology Society,USA:IEEE,2011:6605-6608.
[4] J VINK, M V LEEUWEN, C V DEURZEN, et al. Efficient nucleus detector in histopathology images[J]. Journal of Microscopy,2013,249(2):124-135.
[5] C WAHLBY, I M SINTORN, F ERLANDSSON, et al.Combining intensity, edge and shape information for 2D and 3D segmentationof cell nuclei in tissue sections[J]. Journal of Microscopy,2004,215(1):67-76.
[6] A HAFIANE, F BUNYAK, K PALANIAPPAN. Clustering initiated multiphase active contours and robust separation of nuclei groups for tissue segmentation[C]. 19th International Conference on Pattern Recognition,USA:IEEE,2008:1-4.
[7] Y AL-KOFAHI, W LASSOUED, W LEE, et al. Improved automatic detection and segmentation of cell nuclei in histopathology images[J]. IEEE Transactions on Biomedical Engineering,2010,57(4):841-852.
[8] L YANG, O TUZEL, P MEER, et al. Automatic image analysis of histopathology specimens using concave vertex graph[C]. International Conference on Medical Image Computing &Computer-assisted Intervention, USA:Medical Image Computing and Computer-Assisted Intervention,2008:833-841.
[9] AC RUIFROK,DA JOHNSTON. Quantification of histochemical staining by color deconvolution[J]. Analytical & Quantitative Cytology & Histology, 2001,23(4):291-299.
[10] VINCENT L. Morphological grayscale reconstruction in image analysis: applications and efficient algorithms[J]. IEEE Transactions on Image Processing,1993,2(2):176-201.
[11] G LOY, A ZELINSKY. Fast radial symmetry for detecting points of interest[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence,2003,25(8):959-973.
[12] A CHEKKOURY, P KHURD, JIE NI, et al. Automated malignancy detection in breast histopathological images[J]. Proceedings of SPIE,2012,8315(2):831515-831515-13.
[13] 刁智華,趙春江,郭新宇.分水嶺算法的改進[J].計算機工程,2010,36(17):4-6.
[14] 祝世平,高瑞東.基于自適應(yīng)擴散梯度矢量流的圖像分割算法[J].光電子·激光,2015,26(12):2409-2416.
[15] C XU,J L PRINCE.Gradient vector flow: a new external force for snakes[C].IEEE Computer Society Conference on Computer Vision & Pattern Recognition, 2002:66-71.
(責任編輯:黃 健)