胡洋洋, 王 鑫
(江南大學(xué) 教育部輕工過程先進(jìn)控制重點實驗室,江蘇 無錫214122)
環(huán)境問題是我國可持續(xù)發(fā)展面臨的重大問題,水污染是環(huán)境問題中的重點之一。太湖水污染導(dǎo)致藍(lán)藻水華爆發(fā),造成嚴(yán)重的后果。因此,淡水水體中的藍(lán)藻細(xì)胞濃度的測量十分重要。目前,測量細(xì)胞濃度的方法主要有:細(xì)胞計數(shù)儀法、菌落計數(shù)器法、庫爾特計數(shù)器法、分光光度測定法[1]和熒光法、流式細(xì)胞儀法、細(xì)胞計數(shù)傳感器法[2]與圖像處理法[3]。
調(diào)研與實驗表明,在基于圖像處理的細(xì)胞計數(shù)[4]中,主流方法是先圖像分割,再進(jìn)行隔離標(biāo)記計數(shù),該方法對細(xì)胞圖像的前期分割處理要求很高,而且對細(xì)胞較多或細(xì)胞粘連程度較大的圖片進(jìn)行計數(shù)的結(jié)果誤差很大;而常用的基于細(xì)胞核定位的計數(shù)方法對原核細(xì)胞的藍(lán)藻細(xì)胞而言也是不適用的;已有的基于面積的紅細(xì)胞計數(shù)方法[5]則沒有經(jīng)過細(xì)胞預(yù)分割環(huán)節(jié),直接根據(jù)每個不連通區(qū)域的大小判斷該區(qū)域代表的細(xì)胞數(shù)目,再進(jìn)行統(tǒng)計計數(shù),該方法對于平均細(xì)胞面積獲取的先驗性很差,而且最終計數(shù)結(jié)果誤差較大。
針對以上問題,文中提出了基于細(xì)胞面積估計的細(xì)胞計數(shù)法(簡稱“面積法”)。特別地,為了改善細(xì)胞面積估計的精度,將二值化后的細(xì)胞圖像中的細(xì)胞面積作為一個隨機變量,并借助基于核平滑的概率密度估計找到了單個細(xì)胞面積最可能的值。
細(xì)胞計數(shù)的圖像處理法,是將原始顯微細(xì)胞圖像進(jìn)行二值化,預(yù)分割以后再進(jìn)行細(xì)胞計數(shù)。
在用顯微鏡獲取細(xì)胞溶液的圖片后,首先要進(jìn)行圖像預(yù)處理。圖像預(yù)處理包括對輸入圖像進(jìn)行特征提取、分割以及匹配前所進(jìn)行的處理。圖像預(yù)處理的主要目的是消除圖像中無關(guān)的信息,恢復(fù)有用的真實信息,增強有關(guān)信息的可檢測性,最大限度地簡化數(shù)據(jù),從而改進(jìn)特征抽取、圖像分割、匹配和識別的可靠性。預(yù)處理的方法有很多,在細(xì)胞計數(shù)中主要應(yīng)用到的是二值化[6]和形態(tài)學(xué)運算[7-8]。
二值化是圖像分割的一種方法。在二值化圖像時把大于某個臨界灰度值的像素灰度設(shè)為灰度極大值,把小于這個值的像素灰度設(shè)為灰度極小值,從而實現(xiàn)二值化。臨界灰度值也稱閾值。根據(jù)閾值的選取準(zhǔn)則不同,二值化的算法分為固定閾值和自適應(yīng)閾值。比較常用的二值化閾值選取算法有:雙峰法、P 參數(shù)法、迭代法與OTSU 法[9]等。文中二值化域值選取的是OTSU 法。它是一種基于灰度直方圖的閾值選取方法。它選取使類間方差最大的灰度級作為分割閾值。
距離變換是對二值圖像的一種操作運算,它將一幅二值圖像轉(zhuǎn)化為一幅灰度圖像,在這幅灰度圖像中,每個像素的灰度級是該像素與距其最近的背景間的距離。從理論上講,要計算一個像素點到背景像素點的最短距離,需要對圖像進(jìn)行全局操作運算,即計算此像素點與所有背景像素點的距離,再取最小值。除非這幅數(shù)字圖像的尺寸非常小,否則這種全局操作的計算量是非常大的。實際運用中的距離變換實現(xiàn)算法是從鄰近像素點入手,每次只計算其與局部相鄰的幾個像素點距離的最小值,根據(jù)全局距離是局部距離按比例疊加而成的原理,對圖像進(jìn)行前后兩次掃描,最終得到近似的距離。圖像基于上述原理,實踐中用倒角算法進(jìn)行距離變換,簡單快速,其計算出的距離合理逼近于真實的歐氏幾何距離。
分水嶺算法[10]最早是由Vincent L 和Soille P提出來的。分水嶺算法是模擬一個水面浸沒地形的過程。在分水嶺算法中,圖像中每一點像素的灰度值表示該點的海拔高度,每一個局部極小值及其影響區(qū)域稱為集水盆,而集水盆的邊界則形成分水嶺。最后得到的分水嶺邊界將原圖像粘連細(xì)胞切割開。
在完成以上的圖像預(yù)處理后,即可進(jìn)行細(xì)胞計數(shù)。通?;诟綦x標(biāo)記計數(shù)法的細(xì)胞計數(shù)是對二值化后的圖像各個分離區(qū)域進(jìn)行標(biāo)記并累加計數(shù),從而得到圖片中細(xì)胞的數(shù)目。這種方法的一個基本假定是一個隔離區(qū)域代表一個細(xì)胞,但在高度粘連(部分區(qū)域粘連呈塊狀)的細(xì)胞圖像中,經(jīng)過預(yù)分割后仍然會出現(xiàn)多個細(xì)胞粘連的單個分離區(qū)域,隔離標(biāo)記計數(shù)法對于這種情況的計數(shù)仍然為1,并沒有反映真實情況。
文中假定經(jīng)過預(yù)分割的細(xì)胞圖像中還存在重疊細(xì)胞,且重疊細(xì)胞是少數(shù)。在此前提下,將圖片中分離的細(xì)胞區(qū)域的面積作為一個隨機變量,通過核平滑對其進(jìn)行概率密度估計,得到它的概率密度函數(shù)曲線。假設(shè)重疊細(xì)胞較少,該曲線的極大值對應(yīng)的細(xì)胞區(qū)域面積即為單個細(xì)胞面積最可能的值,即前述隨機變量的眾數(shù)。用圖像中細(xì)胞區(qū)域的總面積除以前面得到的單個細(xì)胞面積最可能的值,即可算出圖像中的細(xì)胞總數(shù)。
之所以使用眾數(shù)而不是均值作為細(xì)胞面積最可能的值,是因為藻液中的細(xì)胞生長速度不一定一樣,有各個生長階段的細(xì)胞導(dǎo)致細(xì)胞大小參差不齊。
特別地,細(xì)胞面積估計中用到的基于核平滑的概率密度估計[11]是概率論中用以估計隨機變量的概率函數(shù)密度的方法之一。它采用平滑的峰值函數(shù)(“核”)[12]擬合觀察到的數(shù)據(jù)點,從而對真實的概率分布曲線進(jìn)行模擬。在一定程度上其性質(zhì)比直方圖更好,可以替代直方圖精確展示數(shù)據(jù)總體的概率分布。
文中實驗采用的細(xì)胞圖像均來自業(yè)界權(quán)威的細(xì)胞計數(shù)標(biāo)準(zhǔn)樣本圖像網(wǎng)站(www.broad.mit.edu/bbbc)。
首先讀取RGB 格式的原始圖片,將彩色圖像通過加權(quán)平均法轉(zhuǎn)化為灰度圖像,再采用OTSU 方法將圖像二值化,然后采用形態(tài)學(xué)閉運算填充細(xì)胞內(nèi)空隙。該方法處理以后的細(xì)胞圖像,能平滑細(xì)胞區(qū)域邊界并可以最大程度地保持細(xì)胞區(qū)域面積不變,圖像信息完整。
將得到的二值化細(xì)胞圖像進(jìn)行歐氏距離變換并采用分水嶺算法進(jìn)行初步預(yù)分割,將粘連程度不大的細(xì)胞區(qū)域分割開,便于后續(xù)操作。
該算法原理是:首先利用距離變換將細(xì)胞像素點不同的位置信息轉(zhuǎn)化為不同的灰度信息,再利用分水嶺算法區(qū)分不同性質(zhì)的像素點,然后將邊界點標(biāo)出,邊界即可將細(xì)胞群分開為單個的細(xì)胞。
使用高斯核作為概率密度估計[13-14]的平滑核函數(shù),并限定概率密度函數(shù)的取值范圍為非負(fù)實數(shù)集,對分離的細(xì)胞區(qū)域面積進(jìn)行概率密度估計,得到單個細(xì)胞面積最可能的值。最后,圖像中細(xì)胞區(qū)域的總面積除以單個細(xì)胞面積最可能的值,得到圖像中的細(xì)胞總數(shù)。
圖1 為預(yù)分割粘連細(xì)胞區(qū)域圖像。其中,圖1(a)與圖2(b)是兩張實驗用的細(xì)胞圖像經(jīng)過圖像預(yù)處理后的一部分,對它們進(jìn)行距離變換以及分水嶺算法分割后得到圖1(c)和圖1(d)的效果。
由圖1 可以看出,經(jīng)過預(yù)分割后的細(xì)胞圖像,粘連程度低的細(xì)胞區(qū)域被分割開。預(yù)分割后的細(xì)胞圖像中,單個細(xì)胞的數(shù)量占大多數(shù)。再對預(yù)分割后的圖像中細(xì)胞區(qū)域面積進(jìn)行高斯核密度估計,具體結(jié)果如圖2 所示。其中,* 所對應(yīng)X 軸的值就是估計出的細(xì)胞平均面積S。
最后,用整個細(xì)胞圖中的細(xì)胞區(qū)域的總面積Sum除以各自的單個細(xì)胞面積最可能的值S,得到圖像中細(xì)胞的總數(shù)。經(jīng)過計算統(tǒng)計得到最終結(jié)果(見表1)。本實驗選取輕度粘連和高度粘連兩種程度的圖像,每種粘連程度取10 張樣本圖像,計數(shù)結(jié)果是10 個樣本的平均值,并進(jìn)行了四舍五入的處理。所有的樣本圖像均含有300 個細(xì)胞。顯微圖像放大倍數(shù)為1 000 倍。
圖1 預(yù)分割粘連細(xì)胞區(qū)域圖像Fig.1 Area image the pre-segmentation adhesion cell
圖2 核密度估計的細(xì)胞平均面積Fig.2 Cell average area of the kernel density estimation
表1 實驗結(jié)果Tab.1 Experimental results
由表1 可以看出,不連通區(qū)域標(biāo)記法雖然能較好地處理含細(xì)胞較少或粘連度較小的圖片,但是對含細(xì)胞較多特別是粘連程度較大的圖片進(jìn)行計數(shù)所得出的細(xì)胞數(shù)結(jié)論誤差較大。而“面積法”在這兩種不利情況下得出的結(jié)論都有較高的準(zhǔn)確度,不僅能對細(xì)胞數(shù)較少粘連程度低的圖片準(zhǔn)確計數(shù),還能對粘連程度大的細(xì)胞圖片進(jìn)行精確的細(xì)胞計數(shù)。
文中使用圖像處理技術(shù)對藍(lán)藻細(xì)胞的顯微鏡圖像進(jìn)行細(xì)胞計數(shù)。提出的“面積法”克服了不連通區(qū)域標(biāo)記法對分割后的細(xì)胞圖像進(jìn)行細(xì)胞計數(shù)不能有效處理細(xì)胞數(shù)較多或細(xì)胞粘連程度較大情況,有效地解決了復(fù)雜情況下的細(xì)胞計數(shù)問題。實驗結(jié)果顯示,“面積法”對于細(xì)胞高粘度圖像的計數(shù)優(yōu)勢明顯,計數(shù)精度達(dá)97%,而普通不連通區(qū)域計數(shù)法的計數(shù)精度只有72%,表明“面積法”的計數(shù)準(zhǔn)確度與穩(wěn)定性遠(yuǎn)高于隔離標(biāo)記計數(shù)法。此外,由于概率方法的引入,“面積法”本質(zhì)上對圖像中的不確定因素不敏感,故對圖像的質(zhì)量及圖像預(yù)處理的要求較低。
[1]袁方,李鑫,余君萍,等.分光光度法測定葉綠素含量及其比值問題的探討[J].植物生理學(xué)通訊,2009,45(1):63-66.
YUAN Fang,LI Xin,YU Junping,et al.Methodological study on determination of chlorophyll contents and ratio of Chl a/Chl b by spectrophotometry[J].Plant Physiology Communications,2009,45(1):63-66.(in Chinese)
[2]劉青君,胡寧,葉偉偉,等.細(xì)胞計數(shù)分析傳感器芯片的研究[J].傳感技術(shù)學(xué)報,2010,123(6):753-756.
LIU Qingjun,HU Ning,YE Weiwei,et al. Sensor chip for cell counting and analyzing[J]. Chinese Journal of Sensors and Actuators,2010,123(6):753-756.
[3]Phukpattaranont P,Boonyaphiphat P.An automatic cell counting method for a microscopic tissue image from breast cancer[J].IFMBE Proceedings,2007,15:241-244.
[4]郭曉敏.基于顯微圖像的顆粒計數(shù)方法研究[D].杭州:浙江大學(xué),2014.
[5]蔣潔,樊德寧,陳旺,等.血液顯微圖像中紅細(xì)胞計數(shù)系統(tǒng)的研究與實現(xiàn)[J].醫(yī)學(xué)信息,2009(1):8-10.
JIANG Jie,F(xiàn)AN Dening,CHEN Wang,et al.Erythrocyte counting system based on blood micrograph[J]. Medical Information,2009(1):8-10.(in Chinese)
[6]吳辰夏.二值化圖像特征及其應(yīng)用[D].杭州:浙江大學(xué),2013.
[7]趙慧.基于數(shù)學(xué)形態(tài)學(xué)的圖像邊緣檢測方法研究[D].大連:大連理工大學(xué),2010.
[8]毛玲,孫即祥,張國敏.基于形態(tài)學(xué)運算和自適應(yīng)閾值的心電信號消噪[J].信號處理,2009(1):6-10.
MAO Ling,SUN Jixiang,ZHANG Guomin.ECG signal de-noising based on morphological operations and adaptive threshold[J].Signal Processing,2009(1):6-10.(in Chinese)
[9]倪麟.基于OTSU 理論的圖像分割算法的研究[D].重慶:重慶大學(xué),2013.
[10]Vincent L,Soille P.Watersheds in digital spaces:an efficient algorithm based on immersion simulations[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1991,13(6):583-598.
[11]Bowman A W,Azzalini A.Applied Smoothing Techniques for Data Analysis:The Kernel Approach with S-Plus Illustrations:The Kernel Approach with S-Plus Illustrations[M].Bxford:Oxford University Press,1997.
[12]李俊林,符紅光.改進(jìn)的基于核密度估計的數(shù)據(jù)分類算法[J].控制與決策,2010(4):507-514.
LI Junlin,F(xiàn)U Hongguang.Improved KDE-based data classification algorithm[J].Control and Decision,2010(4):507-514. (in Chinese)
[13]胡閩,劉純平,崔志明,等.聚類差分圖像核密度估計前景目標(biāo)檢測[J].中國圖像圖形學(xué)報,2009,14(10):2127-2130.
HU Min,LIU Chunping,CUI Zhiming,et al.Clustering difference image kernel density estimation for foreground object detection[J].Journal of Image and Graphics,2009,14(10):2127-2130.(in Chinese)
[14]徐東彬,黃磊,劉昌平.自適應(yīng)核密度估計運動檢測方法[J].自動化學(xué)報,2009,35(4):379-385.
XU Dongbin,HUANG Lei,LIU Changping.Adaptive kernel density estimation for motion detection[J].Acta Automatica Sinica,2009,35(4):379-385.(in Chinese)