宋佳聲 胡國清 焦亮
(1.華南理工大學(xué) 機(jī)械與汽車工程學(xué)院, 廣東 廣州510640;2.集美大學(xué) 輪機(jī)工程學(xué)院, 福建 廈門361021)
設(shè)計(jì)一種精確有效的圖像分割算法是圖像處理和相關(guān)應(yīng)用中常常會(huì)遇見的一個(gè)問題.已有許多成果[1-5]采用變分法,將圖像分割問題轉(zhuǎn)化為能量泛函極值問題,分割的過程就是最小化能量泛函的過程,它最終被歸結(jié)為求解相應(yīng)的Euler 方程.在所定義的能量泛函中,既包含了曲線函數(shù)自身的內(nèi)部能量以保證其連續(xù)性和光滑性,又包含了外部能量以便驅(qū)使曲線滑動(dòng)到目標(biāo)邊緣或其他所要求的圖像屬性區(qū)域,這樣的曲線模型常被稱為活動(dòng)輪廓模型(ACM).
根據(jù)表達(dá)方式,ACM 可分為曲線被顯示表達(dá)的參數(shù)式ACM[1-3]和曲線被隱式表達(dá)的幾何式ACM[4-5].相對(duì)于參數(shù)式ACM,幾何式ACM 具有兩個(gè)優(yōu)點(diǎn)[6]:它能夠處理輪廓拓?fù)浣Y(jié)構(gòu)的變化,如分裂與融合;水平集函數(shù)始終定義在一個(gè)固定的圖像格柵空間內(nèi),這為有效的數(shù)值化方案提供條件.早期的幾何式ACM 是一種基于曲線演化理論和水平集方法的輪廓模型,它采用水平集表達(dá)曲線并通過變分法得到曲線的演化模型,從而將問題轉(zhuǎn)化為水平集的偏微分方程[5].事實(shí)上,水平集的偏微分方程可直接通過水平集函數(shù)的能量泛函最小化來得到,這種方法被稱為變分水平集方法[7].它使得在初始的能量泛函中增加各種信息變得更為方便、靈活,如加入?yún)^(qū)域特征信息而建立的CV 模型[8].在演化過程中為了保證曲線穩(wěn)定收斂,水平集函數(shù)必須保持近似為符號(hào)距離函數(shù)(SDF)[9],因此,需要定期對(duì)水平集函數(shù)重新初始化以保證SDF 屬性.然而,重新初始化會(huì)增加額外計(jì)算量,也會(huì)造成許多負(fù)面影響,并且初始化的時(shí)間和方法都會(huì)影響結(jié)果[10].為此,Li 等[11]在曲線能量泛函中引入了一個(gè)距離規(guī)則項(xiàng),定義了一個(gè)勢能函數(shù),通過勢能最小化產(chǎn)生一種擴(kuò)散效應(yīng),從而保持水平集函數(shù)的形狀屬性(特別是在零水平集附近保證其SDF 屬性),這樣就將水平集函數(shù)的維護(hù)工作內(nèi)化到曲線的演化模型中.
文中將幾何式ACM 應(yīng)用于序列圖像的目標(biāo)檢測與跟蹤問題,提出了邊緣表征更加顯著的邊緣指示函數(shù)的計(jì)算方法,對(duì)變分水平集演化模型進(jìn)行了分析和改進(jìn),在無跡卡爾曼濾波器(UKF)框架下設(shè)計(jì)了完整的目標(biāo)檢測與跟蹤算法,并通過實(shí)驗(yàn)驗(yàn)證該算法的有效性.
在曲線演化模型中,邊緣指示(EI)函數(shù)將邊緣信息轉(zhuǎn)化為某種標(biāo)量值.文獻(xiàn)[11]中首先計(jì)算當(dāng)前幀感興趣區(qū)域(ROI)灰度圖像的梯度模值r,然后代入式(1)所示的單調(diào)遞減函數(shù)(p=1,K=1),得到相應(yīng)的EI 值:
這種方法采用了固定的映射關(guān)系,且僅使用了單通道顏色值.為此,文中提出了一種新的邊緣指示函數(shù)計(jì)算方法.首先,計(jì)算ROI 矢量圖像的梯度值.設(shè)矢量圖像為I(x,y):R2→R3,其各通道的圖像為I(i)(x,y):R2→R,i=1,2,3,則給定空間中任意一點(diǎn)上的曲線微元的2-范數(shù)為
其中,Ix和Iy分別為圖像對(duì)x 和y 的偏導(dǎo).對(duì)于任意給定的單位向量(cosθ,sinθ),度量θ 方向上圖像數(shù)據(jù)變化的快慢,且在矩陣特征向量所對(duì)應(yīng)的方向上這種變化達(dá)到極值(特征值)[12],該特征值為
因此,在任意點(diǎn)(x,y)處圖像變化率的最大值和最小值分別為和.考慮到這兩者的差值反映了矢量圖像的變化率特征,文中將其作為矢量圖像的梯度模值,即定義
最后,利用Otsu 方法自適應(yīng)地選取ROI 的梯度分布閾值μ,并利用式(4)將梯度模值r 轉(zhuǎn)化為相應(yīng)ROI的邊緣指示函數(shù),即
式中,σ 是反映函數(shù)帶寬的參數(shù).
Caselles 等[5]提出的幾何式ACM,是不含自由參數(shù)的測地線活動(dòng)輪廓(GAC)模型,模型構(gòu)建的能量泛函是定義在弧長上的環(huán)路積分.變分水平集方法常用于求解GAC 的數(shù)值解.為了解決水平集函數(shù)的維護(hù)問題,Li 等[11]在其水平集泛函模型(DRLSE模型)中引入了一個(gè)懲罰項(xiàng),將水平集函數(shù)的維護(hù)納入其梯度下降流的迭代式中,避免了額外的定期初始化工作,形成了一種包含水平集演化及其自身維護(hù)的內(nèi)在機(jī)制,其泛函為
其中,H(x)為Heaviside 函數(shù),δ(x)為Dirac delta 函數(shù),p(x)為雙阱勢能函數(shù),μ、λ、α 為3 個(gè)可調(diào)的模型控制參數(shù).其梯度下降流為
式中,dp(x)=p'(x)/x.
根據(jù)散度的定義對(duì)演化模型(式(5))進(jìn)行調(diào)整并增加控制參數(shù)(β 和γ),則有
根據(jù)前述邊緣特征提取方法得到的指示函數(shù)圖像g 大致可分為兩個(gè)差異明顯的區(qū)域:
(1)特征平緩變化的區(qū)域(g≈1,▽g≈0),此時(shí)曲線朝著曲率減小和面積減?。ó?dāng)α>0 時(shí))的方向演化,通過相應(yīng)的參數(shù)調(diào)整可以改變其演化速度;
(2)特征變化劇烈的區(qū)域(g≈0,▽g 較大),此時(shí)曲線在邊緣外側(cè)時(shí)產(chǎn)生內(nèi)縮的力量,而在邊緣內(nèi)側(cè)時(shí)又會(huì)產(chǎn)生外擴(kuò)的力量,通過調(diào)整參數(shù)γ 可以強(qiáng)化或削弱該力量.因此,調(diào)整后的演化模型(見式(6))有著清晰的物理意義和較好的參數(shù)控制特點(diǎn).為了與原模型(DRLSE)相比較,文中將式(6)稱為幾何輪廓演化的改進(jìn)模型(IEGAC).
圖1 文中跟蹤算法流程圖Fig.1 Flowchart of the proposed tracking algorithm
采用無跡卡爾曼濾波器作為目標(biāo)狀態(tài)的估計(jì)器.將目標(biāo)輪廓圍成的區(qū)域質(zhì)心狀態(tài)(位置與移動(dòng)速度)作為動(dòng)態(tài)狀態(tài)空間的狀態(tài)向量,目標(biāo)的運(yùn)動(dòng)近似為一個(gè)常速度模型.基于目標(biāo)邊緣特征進(jìn)行活動(dòng)輪廓模型的演化,所得的目標(biāo)輪廓確定了一個(gè)新的目標(biāo)位置,此時(shí)的質(zhì)心狀態(tài)即為當(dāng)前幀的狀態(tài)觀測值.最后,將上述動(dòng)態(tài)狀態(tài)空間模型代入U(xiǎn)KF 遞推框架,以實(shí)現(xiàn)對(duì)目標(biāo)狀態(tài)序列的預(yù)測和更新,相應(yīng)的算法流程如圖1所示.輸入為原始序列圖像,輸出為標(biāo)記有前景目標(biāo)的序列圖像及目標(biāo)的有關(guān)數(shù)據(jù)(目標(biāo)狀態(tài)、輪廓和面積).整個(gè)流程分為左右兩部分:左部分的核心是UKF 的“預(yù)測、更新”機(jī)制,其目的是保障在每一幀的曲線演化前所設(shè)置的初始輪廓都足夠接近目標(biāo);右部分的核心是曲線演化模型的迭代過程,其目的是保證最終曲線(零水平集)收斂于目標(biāo)邊緣.左、右兩部分各有一個(gè)“邊緣濾波”進(jìn)程.右側(cè)“邊緣濾波”的目的是平滑曲線,避免曲線異常凸起或區(qū)域分裂,采用的方法是讓演化模型(見式(6))中的α=0,然后完成規(guī)定數(shù)的迭代.左側(cè)“邊緣濾波”的目的是消除曲線中異常凹陷并校驗(yàn)?zāi)繕?biāo)面積.針對(duì)前一個(gè)目的采用形態(tài)學(xué)的膨脹處理,而針對(duì)后一個(gè)目的將該面積與連續(xù)多幀目標(biāo)面積的均值進(jìn)行比較,消除目標(biāo)后部超出的面積部分,防止出現(xiàn)“拖尾”現(xiàn)象.
目標(biāo)初始輪廓在文中有兩種定義:
(1)指跟蹤初始時(shí)刻目標(biāo)的輪廓,用它來初始化水平集函數(shù),進(jìn)而演化出更加準(zhǔn)確的目標(biāo)輪廓;
(2)指跟蹤過程中每一幀演化開始時(shí)的輪廓,即在UKF 預(yù)測位置下的目標(biāo)初始輪廓.
文中采用背景減除法[13]得到跟蹤初始時(shí)刻的目標(biāo)輪廓,并對(duì)其結(jié)果進(jìn)行下采樣、形態(tài)學(xué)濾波(腐蝕和膨脹操作)以得到更加準(zhǔn)確的可區(qū)分背景和前景的二值圖像.最后據(jù)此計(jì)算初始的輪廓及目標(biāo)的質(zhì)心點(diǎn),并將連續(xù)5 幀目標(biāo)質(zhì)心點(diǎn)的平均速度設(shè)定為初始速度.
對(duì)于前述的第2 種初始輪廓,文中主要通過兩個(gè)步驟得到:
(1)對(duì)上一幀按照式(6)演化的輪廓做適當(dāng)濾波處理;
(2)將該輪廓平移到UKF 預(yù)測的目標(biāo)位置.
平移后的輪廓一般不會(huì)是目標(biāo)當(dāng)前幀的準(zhǔn)確輪廓.為了修正這種差別,需要對(duì)當(dāng)前目標(biāo)的輪廓進(jìn)行檢測.這種檢測是否有效很大程度上取決于預(yù)測的位置是不是足夠地接近真實(shí)位置.實(shí)驗(yàn)結(jié)果表明,對(duì)于常規(guī)目標(biāo),這種“預(yù)測”是足夠接近的.這里所謂的“接近”是指此時(shí)在該位置上放置的初始輪廓和目標(biāo)的實(shí)際輪廓存在交集.
當(dāng)目標(biāo)邊緣處于初始輪廓內(nèi)部時(shí),演化過程能夠得到正確的收斂結(jié)果.然而,UKF 預(yù)測位置放置的初始輪廓并不能保證它總處于目標(biāo)邊緣的外圍.為此,文中通過模型參數(shù)的調(diào)整將曲線演化分為兩個(gè)步驟:先將初始輪廓外擴(kuò)演化,再將擴(kuò)展后的曲線進(jìn)行內(nèi)縮演化.外擴(kuò)演化的目的不是為了得到目標(biāo)邊緣,而是為內(nèi)縮演化做準(zhǔn)備,因而可以采用較大的時(shí)間步長和較大的面積控制參數(shù),以獲取較快的演化速度.內(nèi)縮演化的目的是為了得到目標(biāo)邊緣,為避免對(duì)弱邊界的“過沖”,需要精細(xì)化的演化過程,故可以設(shè)置較小的時(shí)間步長和面積控制參數(shù).通過上述演化過程,曲線最終收斂于目標(biāo)邊緣,完成目標(biāo)邊緣的檢測.最后根據(jù)此曲線對(duì)目標(biāo)狀態(tài)進(jìn)行觀測,具體地,按照式(7)計(jì)算該邊緣曲線所圍成區(qū)域的質(zhì)心,以確定目標(biāo)此時(shí)的位置,隨后將該位置坐標(biāo)作為觀測值輸入濾波器并在UKF 更新機(jī)制下實(shí)現(xiàn)目標(biāo)狀態(tài)的估計(jì)更新.
文中比較的演化模型分別為DRLSE 和IEGAC.首先,對(duì)含有兩個(gè)細(xì)胞的顯微圖片[11]進(jìn)行分割,實(shí)驗(yàn)中兩種模型的參數(shù)選擇如表1所示,分割結(jié)果如圖2、3 所示.從圖2(a)可知,在迭代110 次時(shí)可將兩個(gè)細(xì)胞分開,但在此之前曲線已發(fā)生過沖.從圖2(b)可知,雖然分割曲線最終能夠穩(wěn)定收斂于目標(biāo)邊界,但至少需要迭代266 次.進(jìn)一步的實(shí)驗(yàn)表明,在保證正確分割的前提下,≥13 時(shí)通過足夠多次的迭代都能夠收斂于目標(biāo),但至少需要迭代250次.以上兩組實(shí)驗(yàn)結(jié)果表明:當(dāng) 較小時(shí)有較快的收斂速度,但會(huì)在目標(biāo)弱邊界處發(fā)生過沖現(xiàn)象;當(dāng) 較大時(shí)分割曲線能夠正確收斂于目標(biāo)邊緣,但需要較多的迭代次數(shù).
表1 演化模型參數(shù)設(shè)置Table1 Setting parameters in the evolution models
從圖3可知,IEGAC 模型迭代109 次就能夠正確分割出目標(biāo),且繼續(xù)迭代也未發(fā)生過沖現(xiàn)象,這說明此時(shí)模型是穩(wěn)定收斂的.進(jìn)一步的實(shí)驗(yàn)結(jié)果表明,當(dāng)>2β 時(shí),迭代110 次左右分割曲線就能夠收斂于目標(biāo).以上實(shí)驗(yàn)表明:DRLSE 模型存在分割準(zhǔn)確性與迭代次數(shù)的矛盾,這是單一參數(shù)無法克服的問題;而IEGAC 模型通過控制兩種不同性質(zhì)的參數(shù)能夠解決該矛盾,既能準(zhǔn)確、穩(wěn)定地收斂于目標(biāo)邊緣,又能顯著減少了迭代次數(shù).
圖2 DRLSE 模型的迭代結(jié)果Fig.2 Iteration results of DRLSE model
圖3 β=8 和γ=20 時(shí)IEGAC 模型的迭代結(jié)果Fig.3 Iteration results of IEGAC model with β=8 and γ=20
從目標(biāo)面積和位置兩個(gè)方面對(duì)文中提出的算法進(jìn)行跟蹤精度評(píng)價(jià).圖4(a)顯示了3 種算法(文中算法、文獻(xiàn)[11]算法、背景減除法)對(duì)視頻PetsD3TeC1[14]中汽車的跟蹤檢測結(jié)果.文中算法和文獻(xiàn)[11]算法的演化模型的外擴(kuò)演化迭代次數(shù)為10,內(nèi)縮迭代次數(shù)為20.背景減除法所得到的前景區(qū)域面積,大體上反映出目標(biāo)的真實(shí)區(qū)域.文中以背景減除法的檢測結(jié)果為基準(zhǔn),逐幀計(jì)算其質(zhì)心,然后計(jì)算它到文中算法、文獻(xiàn)[11]算法檢測結(jié)果的相應(yīng)目標(biāo)質(zhì)心的歐式距離,得到如圖4(b)所示的目標(biāo)位置誤差統(tǒng)計(jì)結(jié)果.圖4(a)顯示,文中所提算法檢測出的目標(biāo)區(qū)域面積更加接近基準(zhǔn)值.圖4(b)顯示,文中算法的位置誤差控制在10 個(gè)像素內(nèi),平均誤差約5.8 個(gè)像素,遠(yuǎn)優(yōu)于文獻(xiàn)[11]算法,說明文中所提算法能夠正確地檢測和跟蹤目標(biāo)位置.
文中算法(演化模型的迭代次數(shù)為20)對(duì)視頻PetsD2TeC2[14]的跟蹤結(jié)果如圖5所示,幀序范圍是359~379(每4 幀選取1 幀),在這期間汽車要穿過路燈桿(有顯著的干擾邊緣).文中的跟蹤算法能夠收斂到目標(biāo)邊緣,但在汽車通過地面白色標(biāo)記點(diǎn)時(shí)誤將其檢測為目標(biāo)區(qū)域.這是因?yàn)閷?duì)初始輪廓外擴(kuò)演化時(shí)將其納入了目標(biāo)區(qū)域,而在內(nèi)縮演化時(shí)并不能沖過邊緣特征顯著的白色標(biāo)記點(diǎn)的邊緣,但隨著目標(biāo)的前移,最終將其剔除.
圖6是文中算法(演化模型的迭代次數(shù)為20)對(duì)視頻pedestrian_1[15]的跟蹤結(jié)果,視頻范圍為41~62 幀(每3 幀選取1 幀).目標(biāo)要經(jīng)過一個(gè)方格區(qū)域時(shí),文中算法并未出現(xiàn)嚴(yán)重的拖尾現(xiàn)象.這主要得益于算法的UKF 更新后存在的輪廓濾波模塊,使得算法具有一定的抗干擾能力.
圖7是文中算法(演化模型的迭代次數(shù)為20)對(duì)視頻pedestrian_2[15]的跟蹤結(jié)果,視頻范圍為147~257 幀,每10 幀選取1 幀.實(shí)驗(yàn)結(jié)果顯示,文中算法的跟蹤曲線能夠適應(yīng)目標(biāo)(行人)步態(tài)的不斷變化,基本上準(zhǔn)確地收斂在目標(biāo)邊緣.
圖4 目標(biāo)面積和位置誤差的統(tǒng)計(jì)結(jié)果Fig.4 Statistical results of areas and positional errors of object
圖5 遮擋情形下文中算法的跟蹤結(jié)果Fig.5 Tracking results of the proposed algorithm with partial occlusion
圖6 文中算法對(duì)行人1 的跟蹤結(jié)果Fig.6 Tracking results of the proposed algorithm to the first pedestrian
針對(duì)基于邊緣特征信息的目標(biāo)檢測與跟蹤問題,文中在UKF 框架下提出了基于矢量圖像梯度表示的自適應(yīng)邊緣指示函數(shù)計(jì)算方法,從幾何式主動(dòng)輪廓演化問題出發(fā),提出了演化模型的改進(jìn)方法,以提高模型控制的靈活性和收斂速度;在此基礎(chǔ)上,提出了目標(biāo)邊緣檢測與跟蹤算法.多個(gè)室內(nèi)和戶外的監(jiān)控視頻實(shí)驗(yàn)結(jié)果表明,該算法能夠準(zhǔn)確地分割與跟蹤目標(biāo),對(duì)一般的目標(biāo)陰影、遮擋和形變具有較好的適應(yīng)性,能消除因?yàn)楸尘斑吘壐蓴_而形成的“拖尾”現(xiàn)象.該算法相對(duì)于傳統(tǒng)的輪廓模型在演化效率、弱邊界的處理上也有較大的改進(jìn).
[1]Kass M,Witkin A,Terzopoulos D.Snakes:active contour models [J].International Journal of Computer Version,1988,1(4):321-331.
[2]Xu C,Prince J L.Snakes,shapes,and gradient vector flow[J].IEEE Transactions on Image Processing,1998,7(3):359-369.
[3]Li B,Acton S T.Active contour external force using vector field convolution for image segmentation [J].IEEE Transactions on Image Processing,2007,16(8):2096-2106.
[4]Caselles V,Catté F,Coll T,et al.A geometric model for active contours in image processing [J].Numerische Mathematik,1993,66(1):1-31.
[5]Caselles V,Kimmel R,Sapiro G.Geodesic active contours[J].International Journal of Computer Vision,1997,22(1):61-79.
[6]Sethian J A.Level set methods and fast marching methods[J].Journal of Computing and Information Technology,2003,11(1):1-2.
[7]Zhao H-K,Chan T,Merriman B,et al.A variational level set approach to multiphase motion [J].Journal of Computational Physics,1996,127(1):179-195.
[8]Chan T F,Vese L A.Active contours without edges [J].IEEE Transactions on Image Processing,2001,10 (2):266-277.
[9]Peng D,Merriman B,Osher S,et al.A PDE-based fast local level set method [J].Journal of Computational Physics,1999,155(2):410-438.
[10]Gomes J,F(xiàn)augeras O.Reconciling distance functions and level sets[C]//Proceedings of the 5th IEEE EMBS International Summer School on Biomedical Imaging.Berder Island:IEEE,2002:209-223.
[11]Li C,Xu C,Gui C,et al.Distance regularized level set evolution and its application to image segmentation [J].IEEE Transactions on Image Processing,2010,19(12):3243-3254.
[12]Chung D H,Sapiro G.On the level lines and geometry of vector-valued images[J].IEEE Signal Processing Letters,2000,7(9):241-243.
[13]宋佳聲,胡國清.基于時(shí)空熵分析的組合高斯背景建模方法[J].華南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2012,40(9):116-122.Song Jia-sheng,Hu Guo-qing.Combinational Gaussian background modeling method based on analysis of spatio-temporal entropy[J].Journal of South China University of Technology:Natural Science Edition,2012,40(9):116-122.
[14]IBM Research on People Vision.Performance evaluation of surveillance systems[DB/OL].(2001-10-24)[2014-01-24].http://www.research.ibm.com/peoplevision.
[15]Institute of Automation,Chinese Academy of Sciences.CASIAgaitdatabase[DB/OL].(2011-11-20)[2014-01-24].http://www.sinobiometrics.com.