谷東格
(中國(guó)飛行試驗(yàn)研究院 陜西 西安 710089)
一種目標(biāo)飛機(jī)分割提取方法
谷東格
(中國(guó)飛行試驗(yàn)研究院 陜西 西安710089)
提出了一種目標(biāo)飛機(jī)分割提取方法,該方法采用改進(jìn)的使用金字塔式分割策略的以彩色高斯混合模型GMM (Gaussian Mixture Model)和迭代能量最小化為基礎(chǔ)的GrabCut算法,達(dá)到將目標(biāo)飛機(jī)快速精確分割提取的目的。實(shí)驗(yàn)結(jié)果表明在多數(shù)情況下,只需圍繞目標(biāo)飛機(jī)畫一個(gè)框無(wú)需額外交互,就可以快速的將目標(biāo)飛機(jī)精確分割提取出來(lái),即便是在某些情況下不能夠?qū)⒛繕?biāo)飛機(jī)精確提取分割也只需額外的少數(shù)交互就可以達(dá)到將目標(biāo)飛機(jī)精確分割提取的目的。
GrabCut算法;金字塔分割策略;目標(biāo)飛機(jī)分割;前景標(biāo)記
對(duì)飛機(jī)目標(biāo)進(jìn)行分割提取是對(duì)飛機(jī)目標(biāo)進(jìn)行識(shí)別和跟蹤等應(yīng)用的前提,分割效果的好壞和分割后所提供的信息量大小往往對(duì)后續(xù)的應(yīng)用產(chǎn)生較大的影響。文獻(xiàn)[1]結(jié)合Canny算子(一種圖像處理中常用的邊緣檢測(cè)算子)和區(qū)域生長(zhǎng)提取機(jī)場(chǎng)圖像中飛機(jī)的閉合輪廓,文獻(xiàn)[2]則利用先驗(yàn)經(jīng)緯度信息將當(dāng)前機(jī)場(chǎng)圖像與某個(gè)時(shí)間節(jié)點(diǎn)的同位置機(jī)場(chǎng)圖像相減提取飛機(jī)目標(biāo),而文獻(xiàn)[3]則通過(guò)其提出的改進(jìn)的Snake模型對(duì)飛機(jī)進(jìn)行邊緣提取分割。文中提出了一種新的目標(biāo)飛機(jī)分割方法,它可以將目標(biāo)飛機(jī)精確的從各種背景精確分割提取出來(lái)且包含目標(biāo)飛機(jī)的幾乎在當(dāng)前可見(jiàn)光圖像上的所有信息,具體算法將在下面部分進(jìn)行介紹。
所謂圖像分割就是將具有相似統(tǒng)計(jì)量(如相同灰度值顏色等)的像素聚集起來(lái),并且使得不同統(tǒng)計(jì)量也就是不同區(qū)域的像素間的邊界過(guò)渡盡量小即邊界清晰。如果約束邊界度量(也就是怎樣找到物體邊界的評(píng)估方式)是在直接鄰居之間且通過(guò)在像素級(jí)求和來(lái)計(jì)算區(qū)域的隸屬統(tǒng)計(jì)量,那么就可以用二值馬爾科夫隨機(jī)場(chǎng)將邊界度量轉(zhuǎn)化為基于像素的能量函數(shù)。文獻(xiàn)[4]就是基于上述所述率先提出了將二值馬爾科夫隨機(jī)場(chǎng)用于圖像分割,并用最小割(min cut)即最大流(max flow)來(lái)達(dá)到能量最小化進(jìn)而完成圖像分割的任務(wù)。通常求取的最小割最大流的方法有標(biāo)號(hào)法,最大推流法和Dinic法等[5]。
GrabCut算法[6]是一種基于彩色高斯混合模型 GMM (Gaussian Mixture Model)和迭代能量最小化的優(yōu)秀的交互式圖像分割算法。它就是對(duì)文獻(xiàn)[4]中提出的另一種經(jīng)典的圖像分割算法-Graph Cut算法的改進(jìn)。主要改進(jìn)首先體現(xiàn)在用高斯混合模型替換原來(lái)算法的灰度直方圖,并把算法適用圖像范圍由灰度圖像擴(kuò)展到彩色圖像,其次簡(jiǎn)化了交互的操作的要求,由原算法的需要用鼠標(biāo)指定前景和圍繞前景附近的背景,并且指定的前景背景像素要盡量反映前景背景的相關(guān)信息簡(jiǎn)化為只需要畫定一個(gè)圍繞前景的矩形框即可,再次它通過(guò)參數(shù)學(xué)習(xí)的迭代過(guò)程替換一次最小估計(jì)來(lái)實(shí)現(xiàn)能量最小化。最后它采用魯棒的邊界優(yōu)化算法評(píng)估前景目標(biāo)和背景相交處的邊界分割效果來(lái)達(dá)到精確分割的目的。
圖1用本文采集自互聯(lián)網(wǎng)的飛機(jī)圖片為例,展示了GrabCut算法提取目標(biāo)的具體實(shí)施過(guò)程,其中每一幅圖片旁邊的文字對(duì)應(yīng)下面將要介紹的GrabCut算法的具體步驟,藍(lán)色的像素為交互編輯時(shí)直接指定的背景像素標(biāo)記,其具體實(shí)施步驟如下所示:
1)畫一個(gè)圍繞所要提取前景目標(biāo)的矩形框,初始化三元圖T,前景TF設(shè)置為空,矩形框及其以外的像素設(shè)定為背景TB,背景的補(bǔ)集也就是矩形框內(nèi)的像素設(shè)定為TM。
2)如果像素屬于TB,其透明度α設(shè)定為0,即不透明。如果像素輸入TM,其透明度α設(shè)定為1,即全透明。
3)用α為0和α為1的兩個(gè)集合初始化背景和前景的高斯混合模型GMM。
4)求得對(duì)應(yīng)前景背景GMM的集合的每個(gè)像素對(duì)應(yīng)的高斯模型參數(shù)。
5)在先前確定的數(shù)據(jù)集合中學(xué)習(xí)更新GMM參數(shù)。
6)利用最大流最小割來(lái)進(jìn)行能量最小化評(píng)估分割,得到初始分割,更新前景背景像素標(biāo)記。
7)重復(fù)步驟4)到步驟6)直到算法收斂。
8)執(zhí)行魯棒的邊界優(yōu)化算法進(jìn)行邊界優(yōu)化。
9)執(zhí)行交互編輯,將一些沒(méi)有成功分類的像素直接指定為相應(yīng)的前景背景像素,更新三元圖T。重復(fù)執(zhí)行步驟4)、5)、6)、7)和8)得到最終的精確的分割結(jié)果。
圖1 GrabCut算法實(shí)施步驟示意圖
由于GrabCut算法需要給每個(gè)像素建立高斯混合模型和不斷更新GMM參數(shù),并且每次迭代都要用最大流來(lái)進(jìn)行能量最小化評(píng)估算法分割效果直到算法收斂為止,整個(gè)過(guò)程需要進(jìn)行密集的計(jì)算,這就影響了算法的執(zhí)行效率,換句話說(shuō)直接影響了算法的實(shí)時(shí)性,進(jìn)而影響算法的應(yīng)用。為了既保證算法的精度又保證算法的執(zhí)行效率,本文提出了如圖2所示的金字塔策略,策略的核心思想是降采樣和粗分割標(biāo)記。所謂將采樣就是將本來(lái)在原圖進(jìn)行的分割操作在其長(zhǎng)寬都在原圖1/2 或1/4圖上進(jìn)行(如圖2(a)所示),這樣可以大大加快分割的效率,同時(shí)將分割后的圖像作為目標(biāo)背景粗標(biāo)記代入原圖再在原圖基礎(chǔ)上進(jìn)行精細(xì)分割,這樣就又保證了分割的精度,這里前景背景標(biāo)記需要進(jìn)行腐蝕操作以便留出模糊的邊界供在原圖上進(jìn)行精細(xì)分割(如圖2(b)所示)。同時(shí)引入前背景標(biāo)記有效地縮短了GrabCut算法在原圖執(zhí)行中第4)、5)、6)、7)步的執(zhí)行時(shí)間,從而達(dá)到精度與效率的結(jié)合。算法流程如圖3所示。
圖2 金字塔分割策略示意圖
圖3 算法操作流程圖
圖4(a)前三行圖像為原始輸入圖像,所有原始圖像都來(lái)源于網(wǎng)絡(luò),圖4(b)后三行圖像分別為前三行圖像對(duì)應(yīng)的采用本文算法得到的分割圖像。
圖4 實(shí)驗(yàn)結(jié)果
圖5 圖像分割時(shí)間對(duì)比圖
圖5為不同尺寸圖像分割時(shí)間對(duì)比圖,其中粗線點(diǎn)為不同尺寸原始圖像分割時(shí)間,細(xì)線為一次降采樣(采樣后圖像長(zhǎng)寬為原始圖像的二分之一)后采用本文的算法的圖像分割時(shí)間。通過(guò)計(jì)算原始圖像分割時(shí)間大約為降采樣后圖像分割時(shí)間的5.032 0倍。
文中提出并實(shí)現(xiàn)了一種目標(biāo)飛機(jī)分割提取方法,實(shí)驗(yàn)結(jié)果表明該方法能夠快速的將目標(biāo)飛機(jī)精確分割提取出來(lái)。相對(duì)于傳統(tǒng)的只提取目標(biāo)飛機(jī)的粗輪廓或者邊緣等信息,本文分割提取的目標(biāo)飛機(jī)包含目標(biāo)飛機(jī)在當(dāng)前可見(jiàn)光條件下成像的全部信息,可以為今后的目標(biāo)分類識(shí)別提更加豐富的信息。同時(shí)由于本文算法的局限性需要少量的交互操作,未來(lái)改進(jìn)可結(jié)合邊緣檢測(cè)輪廓分析或者先驗(yàn)知識(shí)對(duì)目標(biāo)飛機(jī)前景背景進(jìn)行事前建模而后利用已知模型對(duì)圖像進(jìn)行分割等方式達(dá)到圖像分割的完全自動(dòng)化。
[1]張名成,吳秀清,王鵬偉.基于閉合輪廓提取和部分特征匹配的飛機(jī)識(shí)別[J].計(jì)算機(jī)仿真,2006,23(11):193-197.
[2]王威,李元壘,梁方,等.一種基于區(qū)域分割的地面飛機(jī)目標(biāo)識(shí)別方法[J].計(jì)算機(jī)工程,2013,39(6):214-218.
[3]崔兆華.改進(jìn)的 Snake模型及其在多飛機(jī)目標(biāo)提取中的應(yīng)用[D].哈爾濱:東北大學(xué),2008.
[4]YY.Boykov,MP.Jolly.Interactive graph cuts for optimal boundary®ion segmentation of objects in ND images[J]. ICCV,2001(1):105-112.
[5]高隨祥.圖論與網(wǎng)絡(luò)流理論[M].北京:高等教育出版社,2009.
[6]Rother C,Kolmogorov V,Blake A.“GrabCut”-Interactive foreground extraction using iterated graph cuts[J].Acm Transactions on Graphics,2004:309-314.
An algorithm for target airplane segmentation&extraction
GU Dong-ge
(Chinese Flight Test Establishment,Xi'an 710089,China)
In this paper,an algorithm for target airplane segmentation&extraction was proposed.In order to segment& extract the target airplane quickly and accurately,the algorithm adopted GrabCut algorithm which was improved by using pyramid segment tactics and based on color Gaussian Mixture Model and iterative energy minimum.The test results show that in the majority situation,this algorithm can accurately segment&extract the target airplane without using any other interaction while its processing speed is almost five times in comparison to the primary algorithm.
grabcut algorithm;pyramid segment tactics;target airplane segment;foreground marks
TN29
A
1674-6236(2016)09-0076-02
2015-06-01稿件編號(hào):201506017
谷東格(1986—),男,河北石家莊人,碩士,工程師。研究方向:機(jī)載測(cè)試技術(shù)研究、光電測(cè)試技術(shù)研究。