凌朝東,陳虎,楊驍,張浩,黃信(華僑大學(xué)信息科學(xué)與工程學(xué)院,福建廈門361021)
?
結(jié)合SLIC超像素和DBSCAN聚類的眼底圖像硬性滲出檢測方法
凌朝東,陳虎,楊驍,張浩,黃信
(華僑大學(xué)信息科學(xué)與工程學(xué)院,福建廈門361021)
摘要:為自動檢測出眼底圖像中的硬性滲出,結(jié)合簡單線性迭代聚類(SLIC)超像素分割算法和基于密度的聚類算法(DBSCAN),提出一種對眼底圖像硬性滲出的檢測方法.首先,采用SLIC超像素分割算法對彩色眼底圖像進(jìn)行過分割;然后,采用DBSCAN對上述分割得到的超像素進(jìn)行聚類,形成簇;最后,分割出目標(biāo)圖像,并選用標(biāo)準(zhǔn)糖尿病視網(wǎng)膜病變數(shù)據(jù)庫(DIARETDB0和DIARETDB1)的眼底圖像驗證上述組合算法的可行性.實驗結(jié)果表明:算法能夠快速、可靠地檢測出眼底圖像中的硬性滲出,具有可直接對彩色圖像進(jìn)行分割、特征提取的特點.
關(guān)鍵詞:圖像分割;超像素;硬性滲出;糖尿病視網(wǎng)膜病變;簡單線性迭代聚類;基于密度的聚類算法
在圖像處理中,涉及圖像目標(biāo)特征的提取和分析的過程都離不開圖像分割方法[1].超像素分割作為圖像分割的一種,它以基本單元的形式將圖像中相似區(qū)域歸為一類,并把這些基本單元作為目標(biāo)對象以減少冗余信息,以便快速地分割出目標(biāo)物體.糖尿病視網(wǎng)膜病變(diabetic retinopathy,DR)是糖尿病的嚴(yán)重并發(fā)癥,是引起人們視力障礙、甚至失明的常見原因之一[2-3].按我國糖尿病視網(wǎng)膜病變分期標(biāo)準(zhǔn),以是否出現(xiàn)新生血管為界,分為非增殖期糖尿病視網(wǎng)膜病變(NPDR)和增殖期糖尿病視網(wǎng)膜病變(PDR)兩大類.硬性滲出(hard exudates,HEs)作為DR的早期臨床癥狀,出現(xiàn)在NPDR的Ⅱ期,是因血管通透性增加,類脂質(zhì)從血管中滲出累積而成[4].早在二十世紀(jì)七八十年代,就有國外學(xué)者提出基于數(shù)字眼底視圖像的DR自動篩查方法,并有學(xué)者在黑白眼底圖像上運用灰度特征提取出硬性滲出區(qū)域.基于灰度圖像的硬性滲出檢測方法主要分為閾值分割方法、區(qū)域生長的方法、數(shù)學(xué)形態(tài)學(xué)的方法以及分類的方法[5]等四類.彩色圖像除了包括亮度信息外,還包含色調(diào)、飽和度等有用信息.隨著實際的需要,對彩色圖像的分割引起了學(xué)者的關(guān)注.目前,相關(guān)的算法存在對單色圖像進(jìn)行處理的信息不充分,以及過多地依靠前期預(yù)處理的信息損失、繁瑣的冗余步驟和檢測結(jié)果在原圖上疊加的過程等不足.鑒于此,本文結(jié)合簡單線性迭代聚類(simple linear iterative clustering,SLIC)超像素分割和基于密度的聚類算法(density-based spatial clustering of applications with noise,DBSCAN),提出一種對彩色眼底圖像的硬性滲出進(jìn)行檢測和標(biāo)記的方法.
1.1 眼底圖像硬性滲出檢測方法
提出一種結(jié)合SLIC超像素和DBSCAN聚類方法對眼底圖像的硬性滲出進(jìn)行檢測.首先,采用SLIC超像素分割算法對經(jīng)預(yù)處理的整幅彩色原圖像進(jìn)行分割,以減輕后續(xù)圖像處理的復(fù)雜度;然后,采用DBSCAN聚類算法,對這些被分割的超像素進(jìn)行聚類,形成像素,產(chǎn)生最終的目標(biāo)分割圖像;最后,對目標(biāo)分割圖像的硬性滲出進(jìn)行檢測和標(biāo)記.
1.2 SLIC超像素分割算法
作為當(dāng)前較為常用的圖像處理方法之一,通常需要超像素分割算法具有快速、便于使用的特性,并且能產(chǎn)生區(qū)分度較佳的塊[6].目前,超像素算法大體分成基于圖論和梯度上升的兩種方法.基于圖論的算法有歸一化割(normalized cuts)算法、基于圖的分割(graph-based segmentation)算法等;而基于梯度上升的分割方法代表算法有快速漂移(quick shift)算法、簡單線性迭代聚類(SLIC)算法等.
圖1 SLIC超像素分割算法處理流程圖Fig.1 SLIC superpixels algorithm flow diagram
SLIC由Achanta等[7]提出的,它克服了以往算法計算量大或超像素形狀及數(shù)量不可控等的不足.將圖像轉(zhuǎn)化為五維特征向量,V=[l,a,b,x,y],其中,[l,a,b]為像素顏色,屬CIELAB顏色空間,[x,y]為像素位置.由此構(gòu)造一個距離度量,它既考慮了像素顏色間的相似性,又考慮了像素間的距離要素,利用該距離度量重新聚類中心點周圍的像素,進(jìn)而得出新的聚類中心.在這個迭代過程中,若前后中心像素的剩余誤差足夠小,則迭代停止,至此整個超像素分割過程結(jié)束.文中采用此算法對原始彩色眼底圖像分割處理,算法示意框圖,如圖1所示.
由于顏色空間和距離空間的度量方法不同,SLIC提出新的距離度量方法(也稱緊湊因子)[8],即式(1)中:k和i分別為兩像素;Ds為CIELAB色彩空間值距離dlab和圖像平面內(nèi)位置距離dxy的加權(quán)和,表示兩個像素間的距離;變量m度量超像素的緊湊性,m值越大,緊湊性就越高.若每幅圖像像素的總數(shù)為N,預(yù)輸出K個超像素,那么就有N/K個像素包含在每個超像素中,超像素的預(yù)期邊長S=且這些超像素在每個邊長為S的網(wǎng)格中應(yīng)有一個中心像素.
超像素的分割有如下4個主要步驟.
步驟1 以網(wǎng)格為基本單位,在每個網(wǎng)格中選擇一點作為超像素中心,計算其3×3鄰域內(nèi)像素的梯度.其中,梯度值的最小像素作為新的梯度中心.
步驟2 在每個區(qū)域中心的2S×2S鄰域內(nèi)對屬于該區(qū)域的像素進(jìn)行搜索,并將所有像素歸為與其臨近的區(qū)域中心.
步驟3 對分割出的中心像素重新計算,并計算新舊兩區(qū)域中心的剩余誤差.
步驟4 重復(fù)步驟2,3,當(dāng)誤差小于一定值時,則超像素分割結(jié)束;否則,返回步驟2.
1.3 DBSCAN聚類算法
聚類是一種非監(jiān)督的學(xué)習(xí)方法,它根據(jù)數(shù)據(jù)對象之間的相似性將數(shù)據(jù)集分割成具有同類內(nèi)相似性最大、類間相似性最小特征的類[9].目前,主要有基于劃分的聚類、基于模型的聚類方法、基于層次的聚類、基于網(wǎng)格的聚類和基于密度的聚類等5大類.基于密度的DBSCAN聚類算法能夠?qū)?shù)據(jù)定義為密度可達(dá)的數(shù)據(jù)對象組成的集合,不但可以分類出任意形狀的類簇,而且具有對噪聲數(shù)據(jù)不敏感的特性.
DBSCAN的相關(guān)定義[10-13]如下.
圖2 DBSCAN聚類算法流程框圖Fig.2 DBSCAN clustering algorithm flow diagram
定義3 (直接密度可達(dá))對于數(shù)據(jù)對象p,q∈D,給定Eps和MinPts,若p滿足p∈NEps(q)且NEps(p)≥MinPts,則稱對象p是從q出發(fā)直接密度可達(dá)的,但直接密度可達(dá)不具有對稱性.
定義6 (簇、噪聲)從任一核心點對象開始,對象密度可達(dá)的所有對象形成一個簇,噪聲即為不屬于任何簇的對象.
DBSCAN聚類算法流程圖[14],如圖2所示.
1.4 算法的評價指標(biāo)選取
1.4.1 算法病變檢測效果的評價指標(biāo) 選取評價視網(wǎng)膜病變硬性滲出檢測算法的評價指標(biāo)[15]為式(2)中:Sensitivity為靈敏度;Specificity為特異性;PPV為陽性預(yù)測值;Accuracy為準(zhǔn)確率;TP(真陽)、TN(真陰)、FP(假陽)、FN(假陰)四個符號分別代表病變特征被算法正確檢測出、非病變區(qū)域被正確的檢測出、非病變區(qū)域被錯誤的判為病變區(qū)域和病變區(qū)域未被正確的檢測出.
對圖像分割算法效果進(jìn)行評價,常采用基于圖像及病灶區(qū)域水平定義的評價指標(biāo),一般選取靈敏度、特異性兩個指標(biāo).這些針對單色圖像算法處理的評價指標(biāo),兩值越大,說明檢測方法越好.
1.4.2 算法性能的評價指標(biāo) 鑒于文中是直接對彩色圖像處理,因此,引用適合超分割算法的評價指標(biāo).目前,超像素分割效果評價指標(biāo)主要有邊界響應(yīng)率(boundary recall,BR)、計算代價(computation cost,CC)、區(qū)域內(nèi)部均勻性、可完成的分割精度(achievable segmentation accuracy,ASA)以及欠分割錯誤率(under-segmentation error,UE)等指標(biāo).其中:邊界響應(yīng)率(BR)的計算式[16]為式(3)中:δS和δT分別表示超像素邊界和真實切割邊界點單位集合;Φ表示p和q相差的閾值范圍,單位是像素.
重疊率(overlap ratio,OR)是為了測量超像素塊的規(guī)則性,其計算公式為式(4)中:Z為圖像中所有像素的個數(shù);si表示第i個超像素塊;S表示超像素塊的集合;Area(si)代表包含si在內(nèi)的最小網(wǎng)格區(qū)域.由式(4)可知:OR值越小,說明矩形與超像素的差越小,超像素越規(guī)則.
對DBSCAN算法進(jìn)行評價,數(shù)據(jù)量為n的樣本集合,其DBSCAN的計算復(fù)雜度為O(n2).文中采用空間索引的方法降低時間復(fù)雜度,時間復(fù)雜度為O(n.log n).
2.1 文中算法的硬性滲出檢測結(jié)果分析
為了驗證文中算法的有效性和通用性,運用文中提出的SLIC超像素分割和DBSCAN聚類算法,分別對DIARETDB0及DIARETDB1數(shù)據(jù)集中含硬性滲出較多的彩色眼底圖像進(jìn)行算法處理,結(jié)果如圖3,4所示.
從圖3和圖4的(d),(e),(f)中經(jīng)SLIC超像素分割后的分割效果圖可知:結(jié)果圖已經(jīng)把圖中相似的區(qū)域分割成具有相似特征的圖像區(qū)域,其他無關(guān)特征基本被分割成近似六邊形的區(qū)域.這樣就有助于接下來采用合適的算法對相似的區(qū)域進(jìn)行提取,甚至分類,最終精確提取出感興趣的區(qū)域.由此可以看出:文中算法的優(yōu)越之處是對彩色圖像直接進(jìn)行處理,規(guī)避了對單色圖像,或者以往對灰度圖像預(yù)處理和后續(xù)候選區(qū)域提取過程中出現(xiàn)的信息損失,更好地保留和利用了圖像的有效信息.
圖3和圖4的(g),(h),(i)分別對應(yīng)圖3和圖4的(d),(e),(f)的DBSCAN聚類結(jié)果,可以看出其準(zhǔn)確地對硬性滲出進(jìn)行了分割和標(biāo)記.
圖3 文中算法對DIARETDB0中眼底圖像硬性滲出檢測方法實驗結(jié)果圖Fig.3 Hard exudates detection result images using proposed methods in DIARETDB0data sets
綜上所述,由圖3,4分割提取結(jié)果可以看出:與傳統(tǒng)的基于單色圖像或者灰度圖像進(jìn)行處理不同,文中組合算法除考慮采用彩色圖像的完整信息及空間距離外,整個處理過程只需要設(shè)定3個主要參數(shù).其中:SLIC超像素分割設(shè)置一個參數(shù),DBSCAN聚類算法需要設(shè)置數(shù)據(jù)對象p的Eps鄰域和MinPts兩個參數(shù).此外,從分割的直觀效果來看,已經(jīng)初步驗證了文中組合算法的可行性和實用性.
圖4 文中算法對DIARETDB1中眼底圖像硬性滲出檢測方法實驗結(jié)果圖Fig.4 Hard exudates detection result images using proposed methods in DIARETDB1data sets
2.2 文中算法病變檢測評價標(biāo)準(zhǔn)結(jié)果分析
對DR病變特征算法檢測性能有兩種評價指標(biāo):基于(病灶)區(qū)域和基于圖像水平.其中:基于(病灶)區(qū)域的評價標(biāo)準(zhǔn)側(cè)重于判斷一個圖像候選區(qū)域是否為DR病變,注重算法能否檢測出DR病變的數(shù)量;而基于圖像圖像水平的評價指標(biāo)側(cè)重判斷圖像是否含有DR病變,不注重DR病變數(shù)量.
用文中算法對DIARETDB0和DIARETDB1數(shù)據(jù)集中眼底圖像逐一進(jìn)行算法驗證,統(tǒng)計出評價指標(biāo),并與Li算法[17]、Walter算法[18]和高瑋瑋算法[19]等硬性滲出檢測算法評價結(jié)果對比,如表1所示.
表1 眼底圖像的硬性滲出檢測方法實驗結(jié)果對比Tab.1 Experimental results comparison of hard exudates detection methods for fundus image
Li算法是運用一種基于區(qū)域的分割方法;Walter算法是運用一種基于形態(tài)學(xué)的分割方法,由于受到結(jié)構(gòu)元素的限制,檢測算法只在結(jié)構(gòu)元素不太大的范圍內(nèi)且相對孤立的硬性滲出區(qū)域的檢測結(jié)果才較為理想;高瑋瑋算法是運用一種基于徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)的方法,這種方法雖然在檢測算法的效率上有了一定提高,但不如Li等提出的基于數(shù)學(xué)形態(tài)學(xué)的檢測算法精度高.文中硬性滲出檢測方法是一種基于聚類的圖像分割算法,由上述分析,文中算法雖計算耗時略長,但檢測精度和算法的適用性和敏感性上較前三者要好.
2.3 文中圖像分割算法評價指標(biāo)分析
對SLIC超像素分割來說,因為超像素分割不同于一般的圖像分割,有著不同的分割目的,它是將一個物體過分割成若干塊,因此它的效果評價指標(biāo)也有很大差別.文中SLIC算法采用OR,BR,CC三個指標(biāo)對超分割結(jié)果進(jìn)行評價,結(jié)果如圖5所示.圖5中:Z表示超像素的個數(shù).
圖5 文中算法的3個主要指標(biāo)性能效果Fig.5 Effect of three main indicators performance of the proposed algorithm
由圖5(a)可知:OR值越小,說明網(wǎng)格與超像素的差越小,即隨著超像素的增加,邊界分的就越精細(xì).由圖5(b)可知:隨著超像素個數(shù)的增加,前期持續(xù)增加,后期漸趨平穩(wěn),BR值越高,說明分割的越精細(xì),就越減輕后期處理負(fù)擔(dān).由圖5(c)可知:計算法處理耗時始終是圖像處理領(lǐng)域處理關(guān)注的重要對象,準(zhǔn)確、高效的算法對實際生活都密切相關(guān).由前所述,文中算法處理相關(guān)指標(biāo)已基本滿足實際要求.
不同于以往基于單色的處理方法,文中對彩色眼底圖像的硬性滲出進(jìn)行檢測,并縱向地與現(xiàn)有該領(lǐng)域的算法在邊界響應(yīng)率、重疊率和計算耗時三個指標(biāo)對算法進(jìn)行了量化比較.實驗結(jié)果表明:兩者結(jié)合達(dá)到了對硬性滲出進(jìn)行快速、可靠地自動檢測,并且檢測結(jié)果直接在原彩色眼底圖像上標(biāo)記,省去了以往算法預(yù)處理以及檢測結(jié)果再在原圖上疊加的過程,滿足了臨床要求.下一步的工作將對文中引用的兩種算法作進(jìn)一步地改進(jìn),如兩者參數(shù)的自適應(yīng)選擇、SLIC超像素算法.
參考文獻(xiàn):
[1]賈冀.基于聚類的圖像分割與配準(zhǔn)研究[D].西安:西安電子科技大學(xué),2013:1-2.
[2]RAM K,SIVASWAMY J.Multi-space clustering for segmentation of exudates in retinal color photographs[C]∥31st Annual International Conference of the IEEE Engineering in Medicine and Biology Society.Minneapolis:IEEE Press,2009:1437-1440.
[3]NAGY B,ANTAL B,HAJDU A.Image database clustering to improve microaneurysm detection in color fundus images[C]∥25th International Symposium on Computer-Based Medical Systems.Rome:IEEE Press,2012:1-6.
[4]RANAMUKA N G,MEEGAMA R G N.Detection of hard exudates from diabetic retinopathy images using fuzzy logic[J].IET Image Processing,2013,7(2):121-130.
[5]GIANCARDO L,MERIAUDEAU F,KARNOWSKI T P,et al.Automatic retina exudates segmentation without a manually labelled training set[C]∥International Symposium on Biomedical Imaging.Chicago:IEEE Press,2011:1396-1400.
[6]劉芳,代欽,石祥濱,等.基于超像素的快速MRF紅外行人圖像分割算法[J].計算機(jī)仿真,2012,29(10):26-29.
[7]ACHANTA R,SHAJI A,SMITH K,et al.SLIC superpixels compared to state-of-the-art superpixel methods[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2012,34(11):2274-2282.
[8]劉進(jìn)立.SAR圖像分割與特征提取方法研究[D].沈陽:遼寧大學(xué),2013:25-26.
[9]楊靜,高嘉偉,梁吉業(yè),等.基于數(shù)據(jù)場的改進(jìn)DBSCAN聚類算法[J].計算機(jī)科學(xué)與探索,2012,6(10):903-911.
[10]陳剛,劉秉權(quán),吳巖.一種基于高斯分布的自適應(yīng)DBSCAN算法[J].微電子學(xué)與計算機(jī),2013,30(3):27-30,34.
[11]于亞飛,周愛武.一種改進(jìn)的DBSCAN密度算法[J].計算機(jī)技術(shù)與發(fā)展,2011,21(2):30-33.
[12]趙文,夏桂書,茍智堅,等.一種改進(jìn)的DBSCAN算法[J].四川師范大學(xué)學(xué)報:自然科學(xué)版,2013,36(2):312-316.
[13]張麗杰.具有穩(wěn)定飽和度的DBSCAN算法[J].計算機(jī)應(yīng)用研究,2014,31(7):1973-1975.
[14]BANDYOPADHYAY S K,PAUL T U.Segmentation of brain tumour from MRI image-analysis of K-means and DBSCAN clustering[J].International Journal of Research in Engineering and Science,2013,1(1):48-57.
[15]SAE-TANG W,CHIRACHARIT W,KUMWILAISAK W.Exudates detection in fundus image using non-uniform illumination background subtraction[C]∥TENCON 2010-2010IEEE Region 10Conference.Fukuoka:IEEE Press,2010:204-209.
[16]張育雄.基于幾何約束和熵率的超像素分割[D].天津:天津大學(xué),2012:30-33.
[17]LI Hui-qi,CHUTATAPE O.Automated feature extraction in color retinal images by a model based approach[J].IEEE Transactions on Biomedical Engineering,2004,51(2):246-254.
[18]WALTER T,KLEIN J C,MASSIN P,et al.A contribution of image processing to the diagnosis of diabetic retinopathy:Detection of exudates in color fundus images of the human retina[J].IEEE Transactions on Medical Imaging,2002,21(10):1236-1243.
[19]高瑋瑋,沈建新,王玉亮.眼底圖像中硬性滲出自動檢測方法的對比[J].南京航空航天大學(xué)學(xué)報,2013,45(1):55-61.
(責(zé)任編輯:黃曉楠 英文審校:吳逢鐵)
Fundus Image Hard Exudates Detection Based on SLIC Superpixels and DBSCAN Clustering
LING Chao-dong,CHEN Hu,YANG Xiao,
ZHANG Hao,HUANG Xin
(College of Information Science and Engineering,Huaqiao University,Xiamen 361021,China)
Abstract:In order to detect the hard exudates in fundus images automatically,this paper presented a hard exudates detection method which combines simple linear iterative clustering(SLIC)superpixels and DBSCAN clustering algorithm to detect the Harde exudates.Firstly,an over-segmentation image was formed by algorithm of the SLIC superpixels.Next the superpixels obtained were processed using the DBSCAN method,so that the final segmentation could be generated from the clusters of superpixels.The fundus image of the standard Diabetic Retinopathy datasets of DIARETDB0and DIARETDB1were chosen to verify the feasibility of the method proposed.The experimental results showed that the algorithms can detect exudates effectively and reliably.Moreover,the method can be directly applied to color image segmentation and feature extraction.
Keywords:image segmentation;superpixels;hard exudates;diabetic retinopathy;simple linear iterative clustering;density-based clustering method
通信作者:凌朝東(1964-),男,教授,主要從事生物醫(yī)學(xué)信號處理等的研究.E-mail:edac@hqu.edu.cn.
中圖分類號:TP 391.41;R 774.1
文獻(xiàn)標(biāo)志碼:A
文章編號:1000-5013(2015)04-0399-07
doi:10.11830/ISSN.1000-5013.2015.04.0399
收稿日期:2014-12-03
基金項目:國家自然科學(xué)基金資助項目(61203369,61204122);福建省自然科學(xué)基金資助項目(2011J01351);福建省科技計劃重點項目(2013H0029);福建省泉州市科技計劃項目(2013Z33)