陳菲 涂春 周琪 蘇秦 王亞乾 唐鴻俊
摘?要:圖像分割是將圖像劃分為若干個(gè)具有獨(dú)特性質(zhì)區(qū)域的過(guò)程,分割結(jié)果直接影響著后續(xù)任務(wù)的有效性。研究分析、信息收集等都需要圖像分割。DICOM是目前醫(yī)學(xué)圖像最常見(jiàn)的圖像格式,對(duì)DICOM圖像的分割與處理是診斷和治療的關(guān)鍵技術(shù),能夠提供準(zhǔn)確可靠的診斷依據(jù)。本文對(duì)GACV人機(jī)交互模型、區(qū)域生長(zhǎng)、基于深度學(xué)習(xí)的U-Net和FCN算法以及模糊C均值的圖像分割方法進(jìn)行綜述。最后進(jìn)行總結(jié)和展望圖像分割技術(shù)在醫(yī)學(xué)圖像處理上的應(yīng)用價(jià)值。
關(guān)鍵詞:圖像分割技術(shù);醫(yī)學(xué)圖像;DICOM
圖像分割是指將圖像中在某種標(biāo)準(zhǔn)下的不同區(qū)域區(qū)分開(kāi)來(lái)。分割所得到的不同區(qū)域是互不交叉的,每個(gè)區(qū)域都滿(mǎn)足特定區(qū)域的一致性[2]。醫(yī)學(xué)圖像分割是醫(yī)學(xué)建模的主要組成部分,由于圖像的復(fù)雜性與多樣性,醫(yī)學(xué)圖像分割較一般的圖像分割有著更大的難度[3]。本文主要介紹目前半自動(dòng)分割和自動(dòng)分割方法在醫(yī)學(xué)圖像上的應(yīng)用。
1 半自動(dòng)分割
半自動(dòng)分割是一種結(jié)合手工和計(jì)算機(jī)的交互方式,允許人工交互式操作提供一些有用的信息,然后由計(jì)算機(jī)進(jìn)行分割處理。
1.1 交互式GACV模型
選擇需要處理圖像的ROI區(qū)域,利用高斯函數(shù)進(jìn)行去噪平滑,采用結(jié)合了CV模型(對(duì)平滑區(qū)域進(jìn)行全局分割)和GAV模型(利用梯度和曲率進(jìn)行邊緣檢測(cè))的GACV模型在ROI區(qū)域上進(jìn)行分割,得到感興趣區(qū)域的粗分割結(jié)果。為精確地得到感興趣區(qū)域的輪廓[4],選取了一種無(wú)損邊緣的膨脹搜索算法,既精確地提取了輪廓信息,又使圖像的其他重要數(shù)據(jù)信息盡可能保留。
算法步驟包括人機(jī)交互、粗分割和利用無(wú)損邊緣的膨脹搜索算法的后處理。
首先在圖像中選取ROI區(qū)域,利用計(jì)算機(jī)人工選取包含了初始曲線中心點(diǎn)、初始曲線半徑、ROI區(qū)域中平均灰度相近的任意數(shù)據(jù)點(diǎn)。該算法分割圖像的計(jì)算量和分割時(shí)間與人工數(shù)據(jù)信息量的選取和待分割圖像的大小有關(guān)。因此所選的曲線中心點(diǎn)、半徑等大小和位置的信息量對(duì)減少計(jì)算量有較大的幫助。人工選取的ROI區(qū)域?qū)⒆鳛橄乱徊骄_分割的初始對(duì)象。
粗分割的結(jié)果圖像顯示輪廓較為粗糙,包括了較多的不相關(guān)組織區(qū)域。對(duì)粗分割的結(jié)果進(jìn)一步后處理,移除不相關(guān)組織區(qū)域并盡可能保留感興趣區(qū)域的輪廓。在教學(xué)過(guò)程中,經(jīng)實(shí)驗(yàn)?zāi)M,這種模型算法能較為精確的分割出不同磁共振圖像序列或CT圖像序列的感興趣區(qū)域輪廓[5],能較好地應(yīng)用在醫(yī)用圖像的分割處理中。
1.2 區(qū)域生長(zhǎng)
區(qū)域生長(zhǎng)是根據(jù)預(yù)先給定的生長(zhǎng)準(zhǔn)則,把像素或子區(qū)域合并成較大區(qū)域的處理方法?;镜奶幚矸椒ㄊ且砸唤M“種子”點(diǎn)開(kāi)始來(lái)形成生長(zhǎng)區(qū)域,按照一定的準(zhǔn)則逐步加入鄰近像素,當(dāng)滿(mǎn)足終止條件時(shí),區(qū)域生長(zhǎng)終止。區(qū)域生長(zhǎng)基本的處理方法是以一組“種子”點(diǎn)開(kāi)始來(lái)形成生長(zhǎng)區(qū)域,按照一定的準(zhǔn)則逐步加入鄰近像素,當(dāng)滿(mǎn)足終止條件時(shí),區(qū)域生長(zhǎng)終止[6]。
在某個(gè)序列層面切片上勾畫(huà)出ROI,依據(jù)病灶與周?chē)=M織圖像灰度值具有對(duì)比度明顯的知識(shí),運(yùn)用大津閾值算法對(duì)整個(gè)層面進(jìn)行分割;對(duì)其相鄰的切片也進(jìn)行同樣的ROI內(nèi)大津閾值分割,依據(jù)閾值判斷本張切片是否存在與正常組織明顯不同的灰度值區(qū)域;依據(jù)已經(jīng)準(zhǔn)確分割的切片和進(jìn)行連通域檢測(cè)的層面切片確定種子點(diǎn),選取閾值在種子的8鄰域內(nèi)進(jìn)行判斷,與種子的差值小于閾值的點(diǎn)劃分為和種子一類(lèi);重復(fù)上面的過(guò)程直到區(qū)域不能再擴(kuò)張為止,利用其區(qū)域生長(zhǎng)算法來(lái)分割相鄰切片,分割完成后重新更改感興趣區(qū)方便下一次分割層面切片[7]。
2 全自動(dòng)分割
全自動(dòng)分割脫離人工交互,完全依靠計(jì)算機(jī)對(duì)圖像進(jìn)行分割。計(jì)算機(jī)可以承擔(dān)大量計(jì)算工作,分割速度快,效率高。實(shí)現(xiàn)全自動(dòng)分割,是未來(lái)重要的研究方向。
2.1 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(CNN)最早用作分類(lèi)器,用于圖像的識(shí)別[8]。基本結(jié)構(gòu)主要由輸入層、卷積層、池化層(下取樣層)、全連接層及輸出層組成,亦可將CNN劃分為兩部分,分別為特征提取器(輸入層、卷積層、池化層)和分類(lèi)器(全連接層和輸出層)[9]。在CNN結(jié)構(gòu)中,輸入層經(jīng)過(guò)多次卷積層和池化層的特征提取后,卷積層輸出高級(jí)特征的神經(jīng)元與其輸入層進(jìn)行局部連接,然后對(duì)相應(yīng)的連接權(quán)值和局部輸入進(jìn)行加權(quán)求,再加上偏置值得到該神經(jīng)元的輸入值,即為卷積過(guò)程[10]。
Stefano Trebeschi等人提出了基于MRI序列圖像通過(guò)CNN來(lái)實(shí)現(xiàn)感興趣區(qū)域的自動(dòng)分割。CNN接受了多參數(shù)核磁共振成像的訓(xùn)練,將每個(gè)單元分類(lèi)為ROI或非ROI。Trebesch等人的研究中采用CNN的架構(gòu):提取固定大小的體素V;通過(guò)CNN訓(xùn)練每個(gè)V并進(jìn)行分類(lèi);收集由此產(chǎn)生的結(jié)果概率;將結(jié)果概率分配給V。對(duì)每個(gè)圖像的每個(gè)體素V重復(fù)以上操作后可以生成一個(gè)概率圖,其中P(v)是體素V所代表感興趣組織的概率,通過(guò)概率圖的閾值劃分(P(v)≥0.5為“ROI組織”否則為“非ROI組織”)。
相較于傳統(tǒng)手動(dòng)分割,CNN分割結(jié)果能與手動(dòng)分割相媲美,能正確分類(lèi)感興趣區(qū)域與非感興趣區(qū)域,分割速度快,耗時(shí)短。
2.2 全卷積神經(jīng)網(wǎng)絡(luò)
近年來(lái)深度學(xué)習(xí)技術(shù)愈來(lái)愈成熟,計(jì)算機(jī)視覺(jué)的應(yīng)用范圍逐漸擴(kuò)大。它在許多領(lǐng)域都取得了較好的成績(jī),并為圖像檢測(cè)技術(shù)的發(fā)展提供了更加多樣化的研究方向計(jì)算機(jī)視覺(jué)的應(yīng)用范圍逐漸擴(kuò)大。它在許多領(lǐng)域都取得了較好的成績(jī),并為圖像檢測(cè)技術(shù)的發(fā)展提供了更加多樣化的研究方向?;谏疃葘W(xué)習(xí)技術(shù)的智能處理大量圖像數(shù)據(jù)的技術(shù),也成為計(jì)算機(jī)視覺(jué)領(lǐng)域的研究熱點(diǎn)之一[13]。全卷積神經(jīng)網(wǎng)絡(luò)(FCN)基本架構(gòu)為:輸入、卷積、池化和輸出[14]。FCN網(wǎng)絡(luò)模型在Faster RCNN網(wǎng)絡(luò)基礎(chǔ)上加入預(yù)測(cè)目標(biāo)掩飾的并行分支,提高了檢測(cè)精度,實(shí)現(xiàn)了實(shí)例分割,具有高速、高準(zhǔn)確率、簡(jiǎn)單易用等特點(diǎn)。但是該算法分割的結(jié)果不夠精確,缺乏有效的空間信息。
2.3 U-Net
最初的U-Net結(jié)構(gòu)由卷積層、最大池化層(下采樣)、反卷積層(上采樣)以及Re LU函數(shù)(線性整流函數(shù))組成。U-Net網(wǎng)絡(luò)框架結(jié)構(gòu)圖如下圖所示。
由左圖看出該U-Net網(wǎng)絡(luò)由28個(gè)卷積層包含4次卷積、4次上采樣和4次下采樣,每個(gè)卷積層后使用修正線性單元確保特征圖的穩(wěn)定輸出。首先,利用卷積使輸出的特征通道數(shù)量增加1倍,經(jīng)最大值運(yùn)算向下采樣。為使特征圖增大,采取了上采樣;為使特征通道數(shù)目減半采取下采樣,最終使特征圖恢復(fù)到輸入圖像的大小。因卷積會(huì)使得特征圖像丟失部分信息,需將卷積過(guò)程中所提取的特征信息傳遞給采樣過(guò)程中提取的圖像部分,盡可能使圖像信息的丟失量減少。
在葉遠(yuǎn)伊等人的研究中,采用U-Net模型在直腸CT檢查的圖像中分割感興趣區(qū)域前,需對(duì)圖像進(jìn)行預(yù)處理,包括將CT值轉(zhuǎn)化為標(biāo)準(zhǔn)的HU值、窗口化操作、直方圖均衡化、圖像歸一化、裁剪CT圖像。構(gòu)建的U-net中,每個(gè)卷積層采用步長(zhǎng)為1的3*3的卷積核,上采樣采用步長(zhǎng)為2的3*3的卷積核,下采樣采用步長(zhǎng)為2的2*2的卷積核。卷積后,輸出圖像尺寸減小到8*8,使用一個(gè)1*1的卷積層將特征數(shù)量縮減為1,經(jīng)sigmoid函數(shù)處理后輸出圖像。采用Dice系數(shù),作相似度分析,使利用該算法結(jié)構(gòu)分割的準(zhǔn)確率達(dá)到93.61%,分割效果較為理想。U-net算法能實(shí)現(xiàn)自動(dòng)化準(zhǔn)確分割出目標(biāo)圖像,相比FCN有所需樣本少、分割速度快的優(yōu)勢(shì)。但在采用U-net時(shí),若目標(biāo)特征圖像占圖像范圍區(qū)域小,提取的特征數(shù)太多易導(dǎo)致過(guò)擬合。
3 模糊C均值聚類(lèi)
聚類(lèi)的圖像分割在日常的分割有兩種區(qū)分:硬聚類(lèi)例如K-means聚類(lèi)圖像分割算法;模糊聚類(lèi)例如模糊C均值聚類(lèi)算法或者均值漂移算法等。
硬聚類(lèi)的圖像分割是指所要處理的數(shù)據(jù)是屬于其中的一個(gè)分組,在硬聚類(lèi)圖像處理中每個(gè)要處理的數(shù)據(jù)的隸屬度是0和1兩個(gè)數(shù)值。而模糊類(lèi)圖像分割的隸屬度是在[0,1]這個(gè)區(qū)間內(nèi)的數(shù),一個(gè)樣本是同時(shí)屬于所有的類(lèi),根據(jù)隸屬度的不同來(lái)區(qū)分它們的差異。
模糊C均值(FCM)聚類(lèi)方法相對(duì)于其他同類(lèi)型算法更加簡(jiǎn)明、靈活,在日常的運(yùn)用中更為廣泛,相對(duì)于其他算法也更加完善。在大多數(shù)的圖像處理中,所需要處理的對(duì)象絕大部分不可以歸類(lèi)于很明顯分離的簇,同理去指派一個(gè)對(duì)象對(duì)應(yīng)到一個(gè)特定的簇也是很容易出現(xiàn)錯(cuò)誤的,對(duì)所有的對(duì)象以及所有的簇賦予一個(gè)權(quán)值,來(lái)指明各個(gè)對(duì)象所對(duì)應(yīng)簇的程度。即便非常便捷的FCM算法,在圖像分割的過(guò)程中依舊存在著一些缺點(diǎn):圖像中相接的像素沒(méi)有涉及;聚類(lèi)的中心是不確定的,會(huì)影響到算法的時(shí)長(zhǎng)以及分割結(jié)果相差比較大;噪聲對(duì)FCM算法的影響特別大。
對(duì)于醫(yī)學(xué)圖像來(lái)說(shuō),運(yùn)用FCM聚類(lèi)算法首先對(duì)圖像進(jìn)行聚類(lèi)的粗分割,分割出感興趣區(qū)以及附近的組織,然后再運(yùn)用形態(tài)學(xué)算法對(duì)分割出來(lái)的組織圖像進(jìn)行邊緣細(xì)化,空洞填充等操作,使需要處理的圖像變得連續(xù),更加平滑。再采用區(qū)域增長(zhǎng)算法對(duì)已分割出來(lái)的圖像組織進(jìn)行提取,使組織周?chē)膮^(qū)域清除,最后根據(jù)對(duì)比法,從提取出來(lái)的組織中獲得感興趣區(qū)域。根據(jù)由大到小,由粗到細(xì)的原則,使得感興趣區(qū)的干擾不斷減小,將目標(biāo)所在的范圍鎖定,在感興趣區(qū)域內(nèi)的圖像同時(shí)也是比較光滑,對(duì)目標(biāo)進(jìn)行精準(zhǔn)的定位。
結(jié)語(yǔ)
本文從半自動(dòng)分割和自動(dòng)分割定義出發(fā),詳細(xì)介紹了GACV人機(jī)交互模型、區(qū)域生長(zhǎng)、基于深度學(xué)習(xí)的U-Net和FCN算法以及模糊C均值。利用圖像分割技術(shù)處理醫(yī)學(xué)圖像病灶或者病變組織提取方面的問(wèn)題已經(jīng)取得了較大進(jìn)步,但在以下方面還有待進(jìn)一步研究。
(1)如何進(jìn)一步簡(jiǎn)化對(duì)圖像的預(yù)處理、提升檢測(cè)精度和速率、降低訓(xùn)練誤差、如何改進(jìn)U-Net網(wǎng)絡(luò)模型使得提取的特征數(shù)量不會(huì)導(dǎo)致過(guò)度擬合。
(2)如何實(shí)現(xiàn)用小樣本完成訓(xùn)練獲得分割精確的圖像、如何將不同算法合并,有便于將特定結(jié)論推廣到不同患者群體上。
(3)對(duì)于圖像分割,目前還沒(méi)有研究出一種通用的并且有效的自動(dòng)分割方法,很多方法只是針對(duì)某種特殊的圖像,具有局部性。
參考文獻(xiàn):
[1]時(shí)賀,趙于前,王小芳.交互式GACV模型的腫瘤圖像分割[J].中國(guó)醫(yī)學(xué)物理學(xué)雜志,2011,28(03):2624-2627+2667.
[2]Gonzalez,R.C.“Image Enhancement and Restoration.”In Handbook of Pattern Recognition and Image Processing,Young,T.Y.,andFu,K.S.(eds.),Academic Press,New York,1979(6):177-248.
[3]李旭冬,葉茂,李濤.基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2017,34(10):2881-2886+2891.
[4]李炳臻,劉克,顧佼佼,姜文志.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)時(shí)代,2021(04):8-12+17.
[5]周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2017,40(06):1229-1251.
[6]王顥.深度學(xué)習(xí)在圖像識(shí)別中的研究與應(yīng)用[J].科技視界,2020(24):37-38.
[7]郭亞男.基于全卷積神經(jīng)網(wǎng)絡(luò)的圖像語(yǔ)義分割技術(shù)的發(fā)展及應(yīng)用綜述[J].數(shù)碼世界,2019(07):10.
[8]曾文獻(xiàn),張淑青,馬月,李偉光.基于卷積神經(jīng)網(wǎng)絡(luò)的圖像檢測(cè)識(shí)別算法綜述[J].河北省科學(xué)院學(xué)報(bào),2020,37(04):1-8+28.
[9]袁兵.基于全卷積神經(jīng)網(wǎng)絡(luò)的圖像分割算法的研究及應(yīng)用[D].電子科技大學(xué),2018.
[10]李亞軍.基于U-Net的結(jié)直腸癌CT圖像分割方法的研究[D].華南理工大學(xué),2020.
[11]程立英,高宣爽,申海,黃丹陽(yáng),覃文軍.基于U-Net網(wǎng)絡(luò)的肺部組織分割[J].沈陽(yáng)師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,38(03):278-282.
[12]葉遠(yuǎn)伊,林仁波,李東,黎柱,許應(yīng)軍,王龍?chǎng)?基于U-net的直腸癌腫瘤的智能分割[J].電子制作,2019(22):45-47.
[13]周魯科,朱信忠.基于U-net網(wǎng)絡(luò)的肺部腫瘤圖像分割算法研究[J].信息與電腦(理論版),2018(05):41-44.
[14]何穎,何曉菊,張鋼.基于小波變換與FCM的甲骨文字圖像分割[J].天津科技大學(xué)學(xué)報(bào),2018,33(06):62-66.
基金項(xiàng)目:中山大學(xué)新華學(xué)院2020年度大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(S202013902022)
*通訊作者:陳菲(1985—?),女,漢族,湖北人,碩士,研究方向:圖像處理、醫(yī)用電子儀器設(shè)計(jì)等。