楊 勇,郭 玲,葉陽(yáng)東,周小佳
?
多類變分模型優(yōu)化的自然圖像分割方法
楊 勇1,2,郭 玲1,葉陽(yáng)東2,周小佳3
(1. 黃河科技學(xué)院信息工程學(xué)院 鄭州 450063;2. 鄭州大學(xué)信息工程學(xué)院 鄭州 450060;3. 電子科技大學(xué)自動(dòng)化工程學(xué)院 成都 610054)
針對(duì)自然圖像中內(nèi)容的多樣性、復(fù)雜性以及隨機(jī)性,若采用區(qū)域內(nèi)部恒定聚類中心假設(shè)的CV(Chan-Vese)模型以及多類水平集模型,則難以有效刻畫具有非線性、連續(xù)性變化的自然圖像內(nèi)容。該文通過(guò)對(duì)區(qū)域內(nèi)部自由度調(diào)控的多變量學(xué)生-概率密度分布描述,提出了多類非線性變分活動(dòng)輪廓模型,它打破了區(qū)域內(nèi)部恒定密度的約束。由于多類非線性變分活動(dòng)輪廓模型缺乏區(qū)域外力,容易分割出離散、零碎的噪聲區(qū)域,通過(guò)引入測(cè)地線區(qū)域外力約束項(xiàng),能有效分割出區(qū)域間的光滑邊界。針對(duì)多類變分模型的最小化問(wèn)題是NP難問(wèn)題,提出對(duì)多類變分活動(dòng)輪廓模型進(jìn)行離散化表達(dá),然后構(gòu)建對(duì)應(yīng)的多層圖割模型,并利用最大流/最小割優(yōu)化方式快速求得全局近似最優(yōu)解。實(shí)驗(yàn)表明,該文提出的分割方法能夠準(zhǔn)確地分割出多類非同質(zhì)目標(biāo)區(qū)域,且區(qū)域之間的邊界光滑,視覺(jué)效果好。
活動(dòng)輪廓; 圖割優(yōu)化; 變分模型; 自然圖像分割
基于變分模型的圖像分割方法[1-2]能夠提供光滑封閉的曲線,并能夠結(jié)合先驗(yàn)信息獲得非同質(zhì)的目標(biāo)[3]區(qū)域,因而被廣泛地應(yīng)用于目標(biāo)檢測(cè)、視覺(jué)跟蹤、場(chǎng)景理解、圖像檢索以及醫(yī)學(xué)圖像分析[4]等領(lǐng)域。
基于變分模型的圖像分割方法一般分為兩大類:基于邊的分割方法以及基于區(qū)域的分割方法?;谶叺姆指罘椒ㄖ饕脠D像的局部梯度吸引活動(dòng)輪廓朝著圖像的邊緣方向進(jìn)化[5-6]。雖然該方法在特定應(yīng)用環(huán)境下能夠獲得較好的分割結(jié)果,但對(duì)初始標(biāo)記點(diǎn)以及初始輪廓的位置比較敏感,且在缺乏全局信息的約束下,容易受噪聲的干擾。基于區(qū)域的分割方法,它假設(shè)每個(gè)區(qū)域內(nèi)部的統(tǒng)計(jì)密度是同質(zhì)的,依靠全局信息來(lái)引導(dǎo)活動(dòng)輪廓的演化。相對(duì)基于邊的分割方法[7-9]而言,它對(duì)初始輪廓的位置不敏感,因此具有較強(qiáng)的抗噪聲能力。但它丟失了圖像的全局刻畫,導(dǎo)致分割的結(jié)果容易出現(xiàn)虛假的目標(biāo)區(qū)域,且捕獲的目標(biāo)邊緣不夠光滑。
文獻(xiàn)[10]提出將邊緣信息(梯度)與區(qū)域信息相結(jié)合的方法,但在進(jìn)行邊緣結(jié)合時(shí),并未引入邊緣檢測(cè)能力更強(qiáng)的測(cè)地線項(xiàng)。且自然圖像通常包含多個(gè)非同質(zhì)目標(biāo)區(qū)域[7,11],各個(gè)區(qū)域內(nèi)部的概率密度變化具有非線性及連續(xù)性,若采用恒定的聚類中心描述,則難以實(shí)現(xiàn)可靠、有效的多類自然圖像分割。
本文通過(guò)自由度調(diào)和的多變量混合學(xué)生-概率密度分布來(lái)提高多類非同質(zhì)目標(biāo)區(qū)域的非線性以及連續(xù)性刻畫[12]。為了提高抗噪能力及光滑邊緣的檢測(cè)能力,本文引入了測(cè)地線邊緣外力項(xiàng)。由于本文提出的多類變分活動(dòng)輪廓模型的最小化問(wèn)題是NP難問(wèn)題,如果采用多類水平集的方法[13]進(jìn)行求解,其收斂較慢,容易陷于局部最小。為了打破此瓶頸,本文提出利用微分幾何與積分幾何的相關(guān)理論,建立最小割與測(cè)地線之間的關(guān)系,將多類變分活動(dòng)輪廓模型的最小化問(wèn)題轉(zhuǎn)化為多層圖割模型[14-16]的最大流/最小割問(wèn)題,這不僅能夠提高自然圖像的分割速度,而且能夠求得全局近似最優(yōu)解。
假設(shè)0是一幅自然圖像,其對(duì)應(yīng)的圖像域。對(duì)應(yīng)的分割區(qū)域邊界子集為,它將自然圖像0分割為若干互不聯(lián)通的子區(qū)域,滿足:,且,其中表示所有不連通的分割區(qū)域數(shù)。圖像0常被假設(shè)為個(gè)類別區(qū)域,如果每個(gè)區(qū)域內(nèi)部用個(gè)恒定聚類中心描述,則它丟失了區(qū)域內(nèi)部存在的非線性與連續(xù)性變化。為了更好地描述特征空間的變化,本文引入了多變量混合學(xué)生-分布進(jìn)行描述,它通過(guò)自由度調(diào)節(jié)參數(shù)來(lái)調(diào)節(jié)概率密度分布的形狀變化。在時(shí),多變量混合學(xué)生-分布退化為多變量高斯分布。則本文提出的多類變分模型可表達(dá)為:
通過(guò)區(qū)域項(xiàng)與邊緣項(xiàng)的結(jié)合,式(4)中所對(duì)應(yīng)的能量函數(shù)不僅能夠有效約束活動(dòng)輪廓的邊界長(zhǎng)度,也可以進(jìn)行區(qū)域邊界的有效檢測(cè),共同提高非同質(zhì)目標(biāo)區(qū)域的整體描述能力。但式(4)所提出的多類變分活動(dòng)輪廓能量函數(shù)是變分形式,計(jì)算復(fù)雜且最小化是NP難問(wèn)題,所以很難直接對(duì)其進(jìn)行優(yōu)化。文獻(xiàn)[7]提出了多類水平集優(yōu)化方式,但它需將目標(biāo)能量函數(shù)嵌入到高維空間,且要求被處理的區(qū)域數(shù)必須是偶數(shù)。因此,很難將其應(yīng)用于優(yōu)化式(4)所對(duì)應(yīng)的能量函數(shù)。而本文提出了利用積分幾何與微分幾何之間的關(guān)系對(duì)所提出的多類變分活動(dòng)輪廓模型進(jìn)行離散化推導(dǎo)與表達(dá),進(jìn)而建立測(cè)地線與最大流/最小割間的聯(lián)系,通過(guò)構(gòu)建多層圖割模型來(lái)進(jìn)行快速優(yōu)化求解。
式(4)中對(duì)應(yīng)的多類活動(dòng)輪廓能量函數(shù)為變分形式,由于變分能量函數(shù)復(fù)雜,難以直接將其運(yùn)用于二維離散圖像,因此首先需要進(jìn)行離散化表達(dá)。
假設(shè)圖像0可表示為二維離散格圖,與分別對(duì)應(yīng)于圖像的寬和高。為了便于離散化描述,首先引入一個(gè)輔助函數(shù),如果,;否則。在二維格圖上,位于位置的類別標(biāo)簽為,則對(duì)應(yīng)的標(biāo)簽圖可定義為,則式(4)中的區(qū)域項(xiàng)可離散化為:
在多類的情況下,可根據(jù)圖對(duì)應(yīng)的多個(gè)分割邊界曲線,以及對(duì)應(yīng)的鄰域標(biāo)簽區(qū)域來(lái)共同離
為方便計(jì)算,式(5)~式(8)中與都未寫成格點(diǎn)形式(實(shí)際執(zhí)行時(shí)需采用格點(diǎn)形式計(jì)算)。為了捕獲光滑的邊界,提高抗噪能力,需要將離散的區(qū)域內(nèi)力與邊緣外力相結(jié)合,即離散化的多類變分活動(dòng)輪廓為:
式(7)中對(duì)應(yīng)的多類離散能量函數(shù)具有凸函數(shù)形式,且邊緣項(xiàng)為多標(biāo)簽的Potts模型,因此很難直接對(duì)其最小化求解。而文獻(xiàn)[18]提出的craph cuts優(yōu)化方法,能夠快速求解凸函數(shù)的最小化問(wèn)題,因此可將其擴(kuò)展于求解式(9)對(duì)應(yīng)的多類能量函數(shù)。對(duì)于能量函數(shù)的最小化問(wèn)題可將其轉(zhuǎn)化為對(duì)應(yīng)多層圖割模型的最大流/最小割問(wèn)題。首先,構(gòu)建一個(gè)多層圖(多層圖的網(wǎng)絡(luò)流從源點(diǎn)(source)流向匯點(diǎn)(sink)),它的每一層對(duì)應(yīng)于一個(gè)二維格圖,其上每個(gè)點(diǎn)對(duì)應(yīng)于自然圖像0中的一個(gè)像素,層與層之間的邊表示像素隸屬于某一類的相似度。對(duì)于點(diǎn),它可能被分配到類中的任意一類,因此多層圖就對(duì)應(yīng)于一個(gè)三維格圖,它可定義為。對(duì)于多層圖上任意一點(diǎn)可表示為,相鄰圖層間的邊表示-link,同層格圖上的邊表示-link。對(duì)應(yīng)于的頂點(diǎn)集可表示為。因此,式(7)中的區(qū)域項(xiàng)能量與邊緣項(xiàng)能量,可利用頂點(diǎn)集中的點(diǎn)分別表示為-link邊集Edge_與-link邊集(邊緣項(xiàng)邊集)Edge_。則區(qū)域項(xiàng)邊集E_可表示為:
b. 對(duì)應(yīng)于4類能量函數(shù)構(gòu)建的3層圖
在多類變分活動(dòng)輪廓演化的過(guò)程中,圖像區(qū)域被活動(dòng)輪廓分割為多個(gè)標(biāo)簽區(qū)域,為了及時(shí)將分割后的標(biāo)簽區(qū)域作用于區(qū)域內(nèi)部,需對(duì)多變量學(xué)生-分布及時(shí)進(jìn)行相關(guān)統(tǒng)計(jì)參數(shù)的更新。由于樣本之間相互獨(dú)立,次迭代時(shí)整個(gè)圖像的類最大期望/最大似然能量為:
由于上面相關(guān)參數(shù)的偏導(dǎo)數(shù)等于0,可得:
1)=0,利用CEM3ST算法[10]初始化活動(dòng)輪廓區(qū)域的總數(shù),以及各個(gè)區(qū)域內(nèi)部對(duì)應(yīng)的初始統(tǒng)計(jì)參數(shù)和。
2) 將式(7)對(duì)應(yīng)的多類變分活動(dòng)輪廓能量轉(zhuǎn)化為對(duì)應(yīng)的多層圖。
3) 利用最大流/最小割算法[19]進(jìn)行多層圖割優(yōu)化,令=+1,并根據(jù)分割后標(biāo)簽區(qū)域更新各個(gè)標(biāo)簽區(qū)域?qū)?yīng)的相關(guān)統(tǒng)計(jì)參數(shù)和,并重新計(jì)算相似度。
為了合理地進(jìn)行實(shí)驗(yàn)評(píng)估與量化分析,將采用改進(jìn)的多段恒定變分能量模型(MMPC-ACM)[6]方法以及多類彩色紋理圖像分割方法(CEM3ST)[10]與本文的方法進(jìn)行實(shí)驗(yàn)對(duì)比分析。在MMPC-ACM方法中,作者假定每個(gè)區(qū)域內(nèi)部采用相同數(shù)量的恒定密度中心描述,即。在CEM3ST方法中,平滑因子與除噪常數(shù)分別為10和5。在本文方法中,邊緣外力項(xiàng)調(diào)節(jié)因子設(shè)置為5。為了對(duì)本文提出的方法進(jìn)行有效地驗(yàn)證,將采用具有非線性密度變化的自然圖像進(jìn)行實(shí)驗(yàn)對(duì)比與量化分析。
圖3a提供了自然圖像,它包含多個(gè)非同質(zhì)目標(biāo)區(qū)域,且不同區(qū)域間具有明顯的邊界差異性。如天空、草地、巖石、山林等。圖3中第1列、第2列、第3列分別表示分割邊界、標(biāo)簽均值圖、分割結(jié)果圖。由圖3c提供的分割區(qū)域與分割邊界可見(jiàn),MMPC- ACM方法雖能將多個(gè)非同質(zhì)目標(biāo)區(qū)域分割出來(lái),但在目標(biāo)區(qū)域的邊界處容易出現(xiàn)邊界模糊及誤分割現(xiàn)象,此外,部分邊界出現(xiàn)重疊。這種分割結(jié)果出現(xiàn)的原因在于MMPC-ACM方法采用恒定聚類中心來(lái)描述每個(gè)區(qū)域內(nèi)部的概率密度,容易出現(xiàn)過(guò)擬合或欠擬合現(xiàn)象。當(dāng)區(qū)域間的邊界具有多樣變化的密度分布時(shí),MMPC-ACM方法容易分割出很多無(wú)意義的邊界,影響最終分割的整體效果。而CEM3ST方法與本文提出的方法能夠準(zhǔn)確的將多個(gè)非同質(zhì)目標(biāo)區(qū)域分割開(kāi)來(lái)。相比而言,本文的方法比CEM3ST方法捕獲的邊緣更加準(zhǔn)確,且最終分割的邊界更加光順。
圖3 自然場(chǎng)景圖像的分割邊界、標(biāo)簽均值圖以及分割結(jié)果對(duì)比
為了進(jìn)一步驗(yàn)證本文方法對(duì)概率密度的非線性及連續(xù)性描述,圖4提供了獼猴圖像,它包含的特征信息在特征空間具有某種非線性變化,圖中第1列、第2列、第3列分別表示分割邊界、標(biāo)簽均值圖、分割結(jié)果圖。圖4b與圖4d提供了利用自由度調(diào)控的多變量混合學(xué)生-分布進(jìn)行密度描述的分割結(jié)果,其能夠更加準(zhǔn)確的將同質(zhì)目標(biāo)區(qū)域分割出來(lái),雖然圖4d具有較好的目標(biāo)區(qū)域整體性,但是對(duì)于陰影區(qū)域與樹葉區(qū)域它難以進(jìn)行有效的區(qū)分,而本文方法能夠很好地將獼猴區(qū)域、樹葉區(qū)域以及陰影區(qū)域分割開(kāi)來(lái)。且分割效果更加接近于地面真實(shí)分割。而MMPC-ACM方法采用5個(gè)恒定聚類中心來(lái)描述每個(gè)區(qū)域,其分割結(jié)果如圖4c所示,出現(xiàn)了很多離散的、零碎的小區(qū)域,且部分目標(biāo)同質(zhì)區(qū)域被細(xì)分,因此它丟失了同質(zhì)目標(biāo)區(qū)域的非線性刻畫。此外,由分割結(jié)果可見(jiàn),利用多段恒定聚類中心難以有效描述具有復(fù)雜性、非線性的獼猴區(qū)域與植物區(qū)域,它容易將植物區(qū)域分割為多個(gè)零碎區(qū)域,且對(duì)獼猴嘴部的小陰影區(qū)域比較敏感。而采用本文提出的自由度調(diào)控多變量混合學(xué)生-分布描述,它不僅具有較好的非線性描述能力,而且能夠有效地刻畫目標(biāo)區(qū)域間的非線性密度變化。因此,對(duì)于大多數(shù)具有非線性密度分布的圖像而言,利用自由度調(diào)控的多變量混合學(xué)生-分布描述更加適合,它具有更強(qiáng)的非線性描述能力。
圖4 具有非線性的自然圖像分割結(jié)果對(duì)比
雖然對(duì)本文方法在自然圖像上進(jìn)行了實(shí)驗(yàn)對(duì)比與結(jié)果分析,但都是基于整體分割性能的描述。而關(guān)于本文所提出的區(qū)域內(nèi)力項(xiàng)與區(qū)域外力項(xiàng)(數(shù)據(jù)項(xiàng)與邊緣)的作用依然不是很清晰。為了合理、有效地分析本文提出的測(cè)地線區(qū)域外力的邊界檢測(cè)能力,圖5采用了區(qū)域間具有復(fù)雜跳變的邊界以及區(qū)域差異性較大的圖像進(jìn)行測(cè)試。由未添加測(cè)地線項(xiàng)的圖5c分割結(jié)果可見(jiàn),玫瑰花與摩天大樓被分割為破碎的區(qū)域,且出現(xiàn)了很多無(wú)意義的目標(biāo)區(qū)域,這將嚴(yán)重影響圖像分割結(jié)果在高層語(yǔ)意場(chǎng)景理解與視覺(jué)分析等方面的應(yīng)用。此外,不同目標(biāo)區(qū)域間出現(xiàn)了不連續(xù)、陡然跳變、尖銳的邊界。這種結(jié)果出現(xiàn)的原因在于未添加邊界檢查項(xiàng)時(shí),即本文提出的模型退化為普通的多類CV模型,它缺乏邊界的檢測(cè)以及物理空間的局部約束。與之相反,它不僅可以吸引活動(dòng)輪廓朝著法線方向移動(dòng),而且可以通過(guò)區(qū)域內(nèi)力的作用,保證同質(zhì)目標(biāo)區(qū)域內(nèi)部的特征進(jìn)行聚集,共同分辨出不同目標(biāo)間的區(qū)域邊界,如圖5b所示,活動(dòng)輪廓朝著法線方向移動(dòng),而且可以通過(guò)區(qū)域內(nèi)力的作用,保證同質(zhì)目標(biāo)區(qū)域內(nèi)部的特征進(jìn)行聚集,共同分辨出不同目標(biāo)間的區(qū)域邊界。
圖5 帶邊緣檢測(cè)項(xiàng)與不帶邊緣檢測(cè)項(xiàng)的分割結(jié)果對(duì)比
為了客觀評(píng)價(jià)3種對(duì)比方法的有效性,本文采用文獻(xiàn)[20]提出的概率隨機(jī)檢索PRI(probabilistic rand index)進(jìn)行準(zhǔn)確率量化計(jì)算,PRI的取值在0~1之間。較大的量化準(zhǔn)確率值反映實(shí)驗(yàn)分割的結(jié)果更加接近于真實(shí)的人工分割結(jié)果。圖6提供了由伯克利自然圖像庫(kù)隨機(jī)選取60張自然圖像的量化結(jié)果。如圖6a所示,本文方法計(jì)算的PRI準(zhǔn)確率值高于CEM3ST方法與MMPC-ACM方法,且準(zhǔn)確率值以58%的比例集中在0.8~1.0之間分布(圖6b所示),而CEM3ST方法與MMPC-ACM方法分別為45%和35%。此外,表1提供了3種對(duì)比方法的PRI平均均值與平均運(yùn)行時(shí)間。本文方法的PRI平均值達(dá)到0.805,而CEM3ST方法與MMPC-ACM方法分別為0.974和0.789,本文方法的平均準(zhǔn)確率值較高。通過(guò)平均分割時(shí)間消耗可見(jiàn),本文方法對(duì)應(yīng)的分割速度更快。這些量化指標(biāo)值可進(jìn)一步說(shuō)明,本文方法的整體性能要優(yōu)于CEM3ST方法與MMPC-ACM方法。
圖6 按升序排列的PRI準(zhǔn)確率值及對(duì)應(yīng)的區(qū)間比例分布
表1 3種方法的PRI均值與運(yùn)行時(shí)間對(duì)比
本文將多類變分活動(dòng)輪廓模型與多層圖割模型相結(jié)合,提出了一種新的自然圖像分割方法。為了提高圖像特征的非線性與連續(xù)性刻畫,將自由度調(diào)節(jié)的多變量學(xué)生-分布引入到多類CV變分模型中,它突破了恒定聚類中心假設(shè)。同時(shí),針對(duì)活動(dòng)輪廓模型缺乏區(qū)域外力的缺陷,引入了測(cè)地線區(qū)域外力約束項(xiàng),它不僅能夠有效分割出區(qū)域間的光滑邊界,而且避免了分割出離散、零碎的噪聲區(qū)域。對(duì)于本文提出的多類變分模型的最小化問(wèn)題是NP難問(wèn)題,通過(guò)離散化多類變分活動(dòng)輪廓模型,可將能量函數(shù)的最小化問(wèn)題轉(zhuǎn)化為多層圖割模型的最大流/最小割優(yōu)化問(wèn)題,并可求得全局近似最優(yōu)解。此外,對(duì)于本文提出的分割方法進(jìn)行了合理的實(shí)驗(yàn)驗(yàn)證,通過(guò)對(duì)比分析表明,本文提出的分割方法不僅具有較高的分割準(zhǔn)確率、光滑的邊界,而且最終分割的區(qū)域視覺(jué)效果較好。
[1]李偉斌, 高二, 宋松和. 一種全局最小化的圖像分割方法[J]. 電子與信息學(xué)報(bào), 2013, 35(4): 791-796.
LI Wei-bin, GAO Er, SONG Song-he. A global minimization method for image segmentation[J]. Journal of Electronics & Information Technology, 2013, 35(4): 791- 796.
[2] 鄭錦, 仙樹, 李波. 基于形狀約束和局部演化的二值水平集運(yùn)動(dòng)目標(biāo)分割[J]. 電子與信息學(xué)報(bào), 2013, 35(5): 1037- 1043.
ZHENG Jin, XIAN Shu, LI Bo. Moving object segment- ation using binary level set based on shape constraint and local evolution[J]. Journal of Electronics & Information Technology, 2013, 35(5): 1037-1043.
[3] LEINER B J, RAMIREZ B E, VALLEJO E. Comparative study of variational and level set approaches for shape extraction in cardiac CT images[C]//International Seminar on Medical Information Processing and Analysis. [S.l.]: SPIE, 2014.
[4] ZHANG T, FREEDMAN D. Tracking objects using density matching and shape priors[C]//IEEE International Conference on Computer V ision. [S.l.]: IEEE, 2004: 1950- 1954.
[5] CASELLES V, CATTE F, COLL T, et al. A geometric model for active contours in image processing[J]. Numerische Mathematik, 1993, 66: 1-31.
[6] VESE L, CHAN T. A multiphase level set framework for image segmentation using the mumford and shah model[J]. International Journal of Computer Vision, 2002, 50(3): 271-293.
[7] CHAN T, VESE L. Active contours without edges[J]. IEEE Transactions on Image Processing, 2001, 10(2): 266-277.
[8] LANKTON S, TANNENBAUM A. Localizing region-based active contours[J]. IEEE Transactions on Image Processing, 2008, 17(11): 2029-2039.
[9] MUMFORD D, SHAH J. Optimal approximations by piecewise smooth functions and associated variational problems[J]. Communications on Pure and Applied Mathematics, 1989, 42: 577-685.
[10] 全剛, 孫即祥. 基于活動(dòng)輪廓的圖像分割方法研究[D].長(zhǎng)沙: 國(guó)防科技大學(xué), 2010.
QUAN gang, SUN Ji-Xiang . Image segmentation method based on active contour[D]. Changsha: National University of Defense Technology, 2010.
[11] TAO W B, CHANG F, LIU L M, et al. Interactively multiphase image segmentation based on variational formulation and graph cuts[J]. Pattern Recognition, 2010, 43(10): 3208-3218.
[12] BYEONG R L, BEN A H, HAMID K. An active contour model for image segmentation: a variational perspective [C]//IEEE International Conference on Acoustics, Speech, & Signal Processing. [S.l.]: IEEE, 2002, 2: 1585-1588.
[13] KASS M, WITKIN A, TERZOPOULOS D. Snakes: Active contour models[J]. International Journal of Computer Vision, 1988, 1: 321-331.
[14] YANG Yong, HAN Shou-dong, WANG Tian-jiang, et al. Multilayer graph cuts based unsupervised color-texture image segmentation using multivariate mixed student’s t-distribution and regional credibility merging[J]. Pattern Recognition, 2013, 46(4): 1101-1124.
[15] ISHIKAWA H. Exact optimization for markov random fields with convex priors[J]. IEEE Transactions on Transactions on Pattern Analysis and Machine Intelligence, 2003, 25(10): 1333-1336.
[16] BAE E, TAI Xue-cheng. Graph cuts for the multiphase Mumford-Shah model using piecewise constant level set methods[EB/OL]. [2014-01-20]. http://www.doc88.com/p- 303734285052.html.
[17] BOYKOV Y, KOLMOGOROV V. Computing geodesics and minimal surfaces via graph cuts[C]//IEEE International Conference on Computer V ision. Nice, France: IEEE, 2003: 1-8.
[18] BOYKOV Y, VEKSLER O. ZABIH R. Fast approximate energy minimization via graph cuts[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001, 23(11): 1222-1239.
[19] FULKERSON D, FOLD L. Flow in networks[R]. [S.l.]: Princeton University Press, 1962.
[20] UNNIKRISHNAN R, PANTOFARU C. HEBRET M. Toward objective evaluation of image segmentation algorithms[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(6): 929-944.
編 輯 葉 芳
Multi-Class Variational Model for Natural Image Segmentation
YANG Yong1,2, GUO Ling1, YE Yang-dong2, and ZHOU Xiao-jia3
(1. School of Information Engineering, Huang He Science and Technology College Zhengzhou 450063; 2.School of Information Engineering, Zheng Zhou University Zhengzhou 450060; 3. School of Automation Engineering, University of Electronic Science and Technology of China Chengdu 610054)
The content of the natural image is diversity, complexity, and randomly, so that the nonlinear and continuity change of natural image cannot be described effectively by using the constant density assumption of regions in CV (Chan-Vese) model or multiphase level sets model. In this paper, we propose a multi-class nonlinear variational model that can break up the bottleneck of constant density through introducing the multivariable mixed student-distribution. We further integrate the geodesic active model into the proposed model for getting some smoothly edges between regions. Additionally, the energy minimization of our proposed model is a NP hard problem, but, we can discretize the variational formulation into discretization form, and then find the approximate optimization solution through maximization flow/minimization cuts theory. Lastly, a large number of natural images are adopted for experiment comparison. The segmentation results demonstrate the superiority of our proposed method, such as the effective discriminate ability of multiple non-homogeneous regions, smooth edges, and good visual effect.
active contour; graphcut optimization; natural image segmentation; variational model
TP391.04
A
10.3969/j.issn.1001-0548.2016.05.020
2014-06-05;
2016-03-17
國(guó)家自然科學(xué)基金(U1204610);國(guó)家青年科學(xué)基金(61502432);河南省教育廳重點(diǎn)基礎(chǔ)研究項(xiàng)目(14A520054, 15B520015);河南省人力資源與社會(huì)保障廳博士后項(xiàng)目(2014022);河南省科技廳重點(diǎn)科技攻關(guān)項(xiàng)目(152102210001)
楊勇(1983-),博士,主要從事圖像分割、模式識(shí)別、視覺(jué)計(jì)算等方面的研究.