李 悅 嵇啟春
(西安建筑科技大學(xué) 陜西 西安 727000)
基于異常檢測的尿沉渣圖像分割
李 悅*嵇啟春
(西安建筑科技大學(xué) 陜西 西安 727000)
在尿沉渣圖像中,由于其樣本特性,使得在細胞圖像采集時會有大量的雜質(zhì)。這些雜質(zhì)形狀不規(guī)則,顏色不單一,用傳統(tǒng)的圖像分割算法難以去除。針對這個問題,提出一種基于異常檢測的圖像分割算法。該方法用形態(tài)學(xué)的方法對二值圖像進行輪廓提取,根據(jù)其輪廓進行特征提取并且進行標(biāo)記,然后用提取的輪廓特征以及標(biāo)記構(gòu)建異常檢測模型。最終根據(jù)該模型對圖象進行分割,并且定量地對該模型進行評價。實驗結(jié)果表明,基于異常檢測模型的尿沉渣檢測方法能夠以較高精度將雜質(zhì)從細胞圖像中分離。
尿沉渣圖像 形態(tài)學(xué) 異常檢測
在醫(yī)學(xué)細胞圖像處理研究中,細胞的識別和分割是最重要也是最困難的,其中,細胞的分割將圖像分割為前景和背景,是把圖像中感興趣的部分提取出來的過程,它是細胞識別的前提。在尿沉渣圖像中,我們需要將紅白細胞從圖像中分割出來,但是如圖1所示,在尿沉渣的拍攝過程中,由于尿沉渣本身易受污染,使得圖片有很多未知的不規(guī)則雜質(zhì),這些雜質(zhì)干擾了尿沉渣的圖像分割,進而影響到了細胞的準(zhǔn)確識別,所以這是尿沉渣圖像分割需要首要解決的問題。
圖1 尿沉渣圖片
由于尿沉渣圖像中的雜質(zhì)沒有固定的模式,所以尿沉渣的分割比較困難。在細胞圖像分割中常用的幾種方法中,謝鳳英等[1-2]用分水嶺算法分割免疫細胞圖像,該算法雖然分割精度較高,并且比較簡單,但是其需要手動選取種子點,并且對微弱邊緣會產(chǎn)生響應(yīng),以至于對雜質(zhì)也會產(chǎn)生響應(yīng)。印勇等[3]用改進的canny算子分割尿沉渣圖像,該算法能夠自適應(yīng)地選取canny算子中所需要的雙閾值,并且能夠產(chǎn)生連續(xù)性和閉合性更好的邊緣,但是該算法沒有辦法去除面積較大的、形狀不規(guī)則的雜質(zhì),所以當(dāng)圖像中有大面積不規(guī)則雜質(zhì)時,該算法無法達到較好的分割效果。程培英等[4]將OSTU算法用于圖像分割,該算法是基于最大化類間方差法[5],能夠?qū)D像進行快速的分割。當(dāng)圖像的灰度直方圖是雙峰結(jié)構(gòu)時,該算法能夠很好地將目標(biāo)從背景中快速分割出來,但是當(dāng)背景較為復(fù)雜,目標(biāo)和背景的灰度有交叉的時候,該算法則無法很好的工作,會將大量的雜質(zhì)當(dāng)做目標(biāo)分割出來。
針對上述分割算法的不足,本文結(jié)合尿沉渣圖像的特點,提出了一種基于異常檢測的圖像分割算法。該算法使用形態(tài)學(xué)算法提取二值圖像的輪廓,計算樣本的輪廓特征并對樣本進行標(biāo)記,接著對標(biāo)記為紅白細胞的部分樣本進行訓(xùn)練和建模,最后用沒有進行訓(xùn)練的細胞和雜質(zhì)樣本進行檢驗,以檢驗的準(zhǔn)確率評價模型的優(yōu)劣。
1.1 數(shù)學(xué)形態(tài)學(xué)
數(shù)學(xué)形態(tài)學(xué)是建立在嚴格數(shù)學(xué)理論基礎(chǔ)上的學(xué)科,其算法已經(jīng)成為許多圖像處理和計算機視覺技術(shù)中的理論基礎(chǔ),被廣泛應(yīng)用于輪廓的提取中[6]。數(shù)學(xué)形態(tài)學(xué)是一種非線性濾波方法,其中,二值數(shù)學(xué)形態(tài)學(xué)變換是一種針對集合的處理過程, 基本運算包括腐蝕、膨脹、開運算和閉運算,這些運算的實質(zhì)是表達物體或形狀的集合與結(jié)構(gòu)元素間的相互作用,這里結(jié)構(gòu)元素的形狀將決定所提取信號的形狀信息。其中圖像中的每一點x的腐蝕運算定義為:
X=E?B={x:B(x)?E}
(1)
膨脹運算定義為:
X=E⊕B={x:B(x)∩E≠O}
(2)
式中B(x)表示結(jié)構(gòu)元素,E代表二值圖像。腐蝕的結(jié)果是將結(jié)構(gòu)元素B平移后使其完全包含在E中的點的集合。膨脹的結(jié)果是平移B使其與E的交集為非空的集合。除了腐蝕運算和膨脹運算,形態(tài)學(xué)濾波還包含開運算與閉運算。開運算定義為對圖像先使用腐蝕,再進行膨脹,閉運算定義為先對圖像進行膨脹,再進行腐蝕。開運算可以去除圖像中的細小雜質(zhì),閉運算可以填充圖像中的小洞。
1.2 基于形態(tài)學(xué)的輪廓提取
基于形態(tài)學(xué)的輪廓提取是基于形態(tài)學(xué)的方法提取輪廓,提取流程如圖2所示。
圖2 基于形態(tài)學(xué)的輪廓提取流程
首先對圖像進行高斯濾波平滑圖像,然后對平滑后的圖像進行二值化,OSTU算法能夠根據(jù)最大化類間方差的方法找到進行二值化的閾值,但是由于細胞圖像的灰度直方圖并不為雙峰的,所以二值化后會產(chǎn)生雜質(zhì)以及孔洞,需要用形態(tài)學(xué)濾波去除二值圖像中的部分細小雜質(zhì)和孔洞。接下來再使用形態(tài)學(xué)方法對圖像進行輪廓提取,本文先使用3×3的結(jié)構(gòu)元素S對二值圖像A進行腐蝕得到被腐蝕的圖像B,然后用原始邊緣圖像減去被腐蝕后的圖像從而得到輪廓圖像H,公式表示為:
H=A-B=A-A?B
(3)
使用二值圖像腐蝕算法提取的醫(yī)學(xué)細胞圖像的邊緣輪廓有單像素寬的特點,克服了傳統(tǒng)輪廓提取算法邊緣粗壯的特點,而且方便了輪廓跟蹤。在對輪廓進行跟蹤時,我們按照從下到上,從右到左的順序依次掃描圖片,當(dāng)掃描到一個未標(biāo)記的目標(biāo)點時,將其標(biāo)記為起點,然后按照8鄰接的方式依次掃描被標(biāo)記點的右、右上、上、左上、左、左下、下、右下8個順序(如圖3所示),找到下一個屬于輪廓的點并進行標(biāo)記,然后根據(jù)新標(biāo)記的輪廓點繼續(xù)尋找下面的點進行標(biāo)記,直到搜尋到原點或者沒有滿足條件的點為止。其過程如圖4所示,將最下面的一個點當(dāng)做起始點,按照逆時針的方向進行標(biāo)記。
圖3 8鏈碼方式 圖4 輪廓提取過程
1.3 輪廓特征的提取
輪廓特征主要有面積、周長、似圓性以及對比度。根據(jù)這些特征,結(jié)合尿沉渣圖像中紅細胞,白細胞等的特點,我們可以過濾掉大部分的雜質(zhì),以得到一個較好的分割效果。其中面積的定義為輪廓域內(nèi)的像素總和:
(4)
周長定義為輪廓邊界的長度:
(5)
似圓性定義為:
(6)
對比度定義為:
(7)
式中,S表示被度量的輪廓域,f(x,y)表示點(x,y)上的像素值,Ne表示鏈碼為偶數(shù)的數(shù)量,No表示鏈碼為奇數(shù)時的數(shù)量,c(x,y)為點(x,y)的4鄰域。當(dāng)似圓性Bs越接近為1時,表示該輪廓越接近為圓。當(dāng)對比度Cs越大時,說明輪廓內(nèi)像素灰度變化越大,灰度越不均勻。
根據(jù)已經(jīng)采集好的特征,我們首先要對特征進行轉(zhuǎn)換,消除特征之間的相關(guān)性,接下來使用轉(zhuǎn)換后的特征作為異常檢測算法的輸入,通過異常檢測模型,對雜質(zhì)進行篩選,該流程如圖5所示。
圖5 基于輪廓特征的異常檢測算法流程
其中異常檢測方法使用使用基于密度估計構(gòu)建模型的方法,在2.1節(jié)中進行介紹,特征轉(zhuǎn)換使用PCA算法,在2.2節(jié)中進行介紹。
2.1 異常檢測模型算法簡介
在疾病檢測、細胞分割等領(lǐng)域,一般只有目標(biāo)物(如細胞)有相對固定的模式,而對于異常(如噪聲,雜質(zhì)等)往往呈現(xiàn)出很大的隨機性,所以在分類時,我們只能通過對目標(biāo)物特征的學(xué)習(xí)并建立模型來進行異常檢測[7-8]。
因為異常檢測中異常類的數(shù)據(jù)常常缺乏,所以不能直接使用有監(jiān)督的方法來進行學(xué)習(xí)分類,只能夠通過對已有正常類的數(shù)據(jù)進行建模,從而歸為無監(jiān)督學(xué)習(xí)的范疇。無監(jiān)督的學(xué)習(xí)也可以分為基于密度估計、基于重構(gòu)和基于支撐等幾類,本文主要使用基于密度估計構(gòu)建異常檢測模型,所以主要對基于密度估計構(gòu)建異常檢測模型做介紹。
在基于密度估計構(gòu)建的異常檢測模型中,我們假設(shè)目標(biāo)類服從多元高斯模型,即:
(8)
2.2 基于PCA的輪廓特征選擇
PCA(即主成分分析)是一個可以對特征進行降維,用更少的特征代替原有特征的算法,其可以讓數(shù)據(jù)在損失最少信息的情況下使新特征之間互不線性相關(guān)[9-10]。本文對采集好的輪廓特征進行降維,以得到新的線性無關(guān)的特征,其降維過程分為以下幾步:
步驟1 特征中心化,即對每一維的特征都做歸一化,其歸一化方法如式(9)所示:
(9)
步驟2 將歸一化的數(shù)據(jù)組合成一個矩陣A,其每一行為一個樣本,求矩陣A的協(xié)方差矩陣B,由于A矩陣已經(jīng)進行歸一化,所以協(xié)方差矩陣B的計算公式如下:
(10)
矩陣B為對稱矩陣,ai、bi表示不同的特征,m為樣本數(shù)。矩陣B對角線上的元素為對應(yīng)特征的方差,非對角線上的元素為對象兩個特征之間的協(xié)方差,當(dāng)其數(shù)值為正數(shù)時,說明兩個特征之間為正相關(guān),為負值時說明兩個特征之間為負相關(guān),當(dāng)為0時,說明兩個向量之間不相關(guān)。
步驟3 協(xié)方差矩陣對角化,由步驟2可以得出,如果協(xié)方差矩陣的非對角線上的元素為0,則說明兩個特征之間是線性無關(guān)的,并且由于協(xié)方差矩陣B為對稱矩陣,其在線性代數(shù)上,其具有以下非常好的性質(zhì):
定理1 實對稱矩陣不同特征值對應(yīng)的特征向量必然正交。
定理2 若實對稱矩陣的某個特征值是r重的話,則必然存在r個線性無關(guān)的特征向量對應(yīng)于該特征值,并可以將這r個特征向量正交化。
所以,根據(jù)以上性質(zhì),一個n維的實對稱矩陣一定可以找到n個正交的特征向量所組成的矩陣Q,并對應(yīng)著n個特征值,假設(shè)由n個特征值組成的矩陣為Λ,它們具有以下關(guān)系:
(11)
λi越大則說明其所對應(yīng)的特征i越重要,將其對應(yīng)的特征向量與樣本特征做乘積,則可以將樣本特征轉(zhuǎn)換為新的特征,并且我們可以根據(jù)式(12)計算新特征信息量占原特征信息量的比例pi,pi越大則說明該特征包含的信息量與原有特征相差不大。
(12)
其中n為特征數(shù)目,最后我們可以根據(jù)P的大小以及期望降低的維數(shù)對特征進行選擇。
使用MATLAB對該算法進行實現(xiàn)的方法如下。
input=mapminmax(input_train);
%對訓(xùn)練數(shù)據(jù)按照式(9)的方式進行歸一化
[V,D] = eig(input);
%計算歸一化后的數(shù)據(jù)input的特征值和特征向量,V是由特征向量構(gòu)成的矩陣,D是對角線矩陣,其對角線上的每一個值是對應(yīng)特征向量的特征值
最后,我們根據(jù)D中特征值的大小按照式(12)選取特征向量對輸入特征進行轉(zhuǎn)換。
2.3 基于輪廓特征構(gòu)建異常檢測模型
異常檢測是機器學(xué)習(xí)中的一個概念,對于給定的一個數(shù)據(jù)集,對其概率分布建立一個模型并設(shè)立一個閾值,當(dāng)輸入一個新樣本,用建立好的模型對其進行預(yù)測并與閾值進行對比,若其預(yù)測值小于設(shè)定的閾值則認為其是異常。該模型要求輸入特征服從高斯分布,并且特征之間是線性無關(guān)的。異常檢測模型的搭建為以下幾步[11-12]:
步驟1 選擇特征xi作為指示異常的特征,本文選擇對輪廓特征用PCA進行特征提取后的特征;
(13)
(14)
其中m表示樣本總數(shù),x(i)表示第i個特征;
步驟3 給定一個新樣本x,按照式(8),計算p(x),若p(x)<ζ,則該樣本為異常。ζ為常數(shù),可以根據(jù)交叉驗證來選擇,其越大,則錯識別率越高,其越小,則未識別率越高。
步驟4 模型由查準(zhǔn)率P和查全率R來進行評判,查準(zhǔn)率P定義為:
(15)
衡量的是檢測結(jié)果為細胞的樣本中實際輸入也為細胞樣本所占的比例;查全率定義為:
(16)
衡量的是被識別為細胞的樣本占總細胞樣本的比例。
使用MATLAB計算p(x)的方法如下:
P=zeros(1,cell_number);%初始化P值
for i=1:cell_number
for j=1:4
P(i)=1/sqrt(2*pi*sigma(j))*exp(-(x(i,j)-u1)^2)
/(2*sigma(j)^2);
%按照式(8)計算每個樣本的p(x)
end
end
本文使用NIKON顯微鏡在100倍物鏡下拍攝的尿沉渣圖像,圖像大小為640×480,選擇其中的50幅圖片中的細胞進行訓(xùn)練,其中一共有697細胞,用10幅圖像中的細胞進行測試,其中有128個細胞以及120個雜質(zhì)作為測試數(shù)據(jù)。在Matlab2012下搭建軟件開發(fā)環(huán)境,我們將細胞作為正例,雜質(zhì)作為反例,先對特征進行提取,細胞特征的統(tǒng)計結(jié)果如表1所示。接下來對特征進行選擇,按照2.2節(jié)所示的算法計算得細胞的四個特征根分別為:λ1=180.5,λ2=130.1,λ3=91.5,λ4=20.5??梢钥闯銮?個特征根明顯大于第4個,根據(jù)式(12)計算,前三個特征所包含的信息量占原有特征信息量的95.2%,所以我們只使用前3個特征構(gòu)建異常檢測模型,它們所對應(yīng)的特征向量矩陣為:
(17)
將所有樣本進行特征轉(zhuǎn)換,即將QT與特征向量D相乘,可以得到新的特征,接下來,用轉(zhuǎn)換后的特征按照2.3節(jié)的方法構(gòu)建異常檢測模型,結(jié)果如表2所示。
D=[d1d2d3d4]
(18)
其中D代表每個樣本按照式(9)歸一化后的特征向量,d1表示歸一化后的面積特征,d2表示歸一化后的周長特征,d3表示歸一化后的似圓性特征,d4表示歸一化后的對比度特征。
表1 細胞特征分布
表2 實驗結(jié)果
由式(15)和式(16),得到模型查準(zhǔn)率P=93%,查全率R=93.7%,查準(zhǔn)率以及查全率都在90%以上,即可以滿足一般的監(jiān)測需要。
最后本文用其中的一幅測試圖片的分割結(jié)果與其他算法進行對比,得到如下結(jié)果:
從圖6可以看出,在尿沉渣圖片中有大量形狀,顏色不同的雜質(zhì),當(dāng)我們使用分水嶺算法對圖像進行分割時(圖7),其可以將細胞分割出來,但同時也將一些面積比較大,顏色與細胞圖像相近的雜質(zhì)分割出來了。當(dāng)使用OSTU進行細胞圖像分割時(圖8),該算法找到能夠最大化類間方差的閾值,將此閾值作為分割點進行分割,當(dāng)圖片中的雜質(zhì)與細胞顏色接近時,該算法會將雜質(zhì)當(dāng)作細胞分割出來。并且由于細胞內(nèi)部顏色不均勻,在分割時會在細胞內(nèi)部產(chǎn)生孔洞,用OSTU算法做圖像二值化后,需要用形態(tài)學(xué)的方法消除孔洞和一些小的雜質(zhì),但是無法消除面積比較大的雜質(zhì)。從圖9可以看出,當(dāng)使用異常檢測模型去分割圖片時,由于使用了更多的特征,所以可以很好地將不規(guī)則的雜質(zhì)輪廓剔除,并且可以定性地分析分割效果,人為選擇一些參數(shù),從而達到較好的分割效果。
圖6 原始圖片 圖7 分水嶺算法
圖8 OSTU算法 圖9 異常檢測算法
尿沉渣檢測是醫(yī)院常規(guī)的檢測項目,傳統(tǒng)的檢測方法主要依靠醫(yī)務(wù)人員操作顯微鏡去人工識別尿沉渣中所含的成分,這種方法消耗大量的人力,所以需要開發(fā)自動化程度更高的尿沉渣檢測儀,而尿沉渣的自動檢驗中尿沉渣的圖像分割是一個難題,怎樣能夠比較準(zhǔn)確地分割圖像,對尿沉渣自動識別來說是關(guān)鍵的一步。本文通過結(jié)合傳統(tǒng)的OSTU分割算法,用輪廓特征構(gòu)建異常檢測模型,具有以下優(yōu)點:(1)識別精度高,由于結(jié)合了多個特性,異常檢測模型能夠更好地將細胞從圖像中分割出來;(2)可以定量地分析結(jié)果,傳統(tǒng)的算法只能從最后的分割圖像中定性地判斷分割的好壞,但是異常檢測模型可以根據(jù)查準(zhǔn)率和查全率定量分析分割結(jié)果。基于這些特點,該算法比較適合在尿沉渣自動檢測儀上使用,有很大的應(yīng)用前景。
[1] 謝鳳英,姜志國,周付根.基于數(shù)學(xué)形態(tài)學(xué)的免疫細胞圖象分割[J].中國圖象圖形學(xué)報,2002,7(11):1119-1121.
[2]WangD.Unsupervisedvideosegmentationbasedonwatershedsandtemporaltracking[J].IEEETransactionsonCircuits&SystemsforVideoTechnology,1998,8(5):539-546.
[3] 印勇,劉平,劉丹平.采用改進Canny算子分割尿沉渣圖像[J].計算機工程與應(yīng)用,2010,46(14):196-198.
[4] 程培英.一種新穎的OSTU圖像閾值分割方法[J].計算機應(yīng)用與軟件,2009,5(26):228-231.
[5]OTSUN.Athresholdselectionmethodfromgraylevelhistograms[J].IEEETransonSMC,1979,9(1):62-69.
[6] 鄒柏賢,林京壤.圖像輪廓提取方法研究[J].計算機工程與應(yīng)用,2008,44(25):161-163.
[7] 田杰,韓冬,胡秋霞.基于PCA和高斯混合模型的小麥病害彩色圖像分割[J].農(nóng)業(yè)機械學(xué)報,2014,45(7):267-270.
[8] 郭偉,劉鑫焱,肖振久.基于邊緣前景的混合高斯模型目標(biāo)檢測[J].計算機工程與應(yīng)用,2015,51(18):209-213.
[9] 朱志潔,張宏偉,韓軍,等.基于PCA-BP神經(jīng)網(wǎng)絡(luò)的煤與瓦斯突出預(yù)測研究[J].中國安全科學(xué)學(xué)報,2013,23(4):45-50.
[10] 何曉群.多元統(tǒng)計分析[M].北京:中國人民大學(xué)出版社,2012:135.
[11] 陳斌,陳松燦,潘志松,等.異常檢測綜述[J].山東大學(xué)學(xué)報(工學(xué)版),2009,12(39):12-21.
[12] 李百惠,楊庚.混合高斯模型的自適應(yīng)前景提取[J].中國圖象圖形學(xué)報,2013,18(12):1620-1625.
URINARY SEDIMENT IMAGE SEGMENTATION BASED ON ANOMOLY DETECTION
Li Yue*Ji Qichun
(Xi’anUniversityofArchitectureandTechnology,Xi’an727000,Shaanxi,China)
In the urine sediment image, due to its sample characteristics, it makes a lot of impurities in the cell image acquisition. These impurities are irregular in shape, and the color is not single, using traditional image segmentation is difficult to remove. Aiming at this problem, an image segmentation algorithm based on anomaly detection is proposed. The algorithm uses the morphological method to extract the binary image contour, according to its contour feature extraction and marking, and an anomaly detection model is constructed using the extracted contour features and the markers. Finally, the image is segmented according to the model, and the model is evaluated quantitatively. The experimental results show that the urine sediment detection method based on the anomaly detection model can separate the impurity from the cell image with high accuracy.
Urinary sediment image Morphology Anomaly detection
2016-05-30。李悅,碩士生,主研領(lǐng)域:圖像處理,機器學(xué)習(xí)。嵇啟春,教授。
TP3
A
10.3969/j.issn.1000-386x.2017.06.038