朱虎飛 ,丁子豪 ,楊永亮 ,馮旭祥 ,丁大偉
(1.北京科技大學(xué)自動(dòng)化學(xué)院,北京 100083;2.北京理工大學(xué)自動(dòng)化學(xué)院,北京 100081;3.中國(guó)科學(xué)院空天信息創(chuàng)新研究院,北京 100094)
目標(biāo)跟蹤是計(jì)算機(jī)視覺(jué)研究領(lǐng)域的熱點(diǎn)之一,目標(biāo)跟蹤往往由于復(fù)雜的背景圖像和目標(biāo)的運(yùn)動(dòng)狀態(tài)的隨機(jī)性和不確定性,導(dǎo)致精確的檢測(cè)與目標(biāo)跟蹤成為一項(xiàng)非常困難的工作[1].魯棒的跟蹤算法在出現(xiàn)環(huán)境以及目標(biāo)外觀發(fā)生改變的情況下,算法仍然能保持較好的跟蹤精度[2-3],如何對(duì)目標(biāo)的外觀建模是魯棒跟蹤的關(guān)鍵[4].判別方法和生成方法是當(dāng)前目標(biāo)跟蹤技術(shù)中的使用的兩種主要方法[5].判別方法[6-8]將跟蹤任務(wù)建模為基于二分類器的檢測(cè)問(wèn)題,將目標(biāo)對(duì)象與背景進(jìn)行分離.生成方法[9-11]一般先對(duì)目標(biāo)的外觀進(jìn)行學(xué)習(xí)獲得目標(biāo)表示模型,然后搜索與該模型最相似的圖像區(qū)域作為跟蹤目標(biāo).基于稀疏表示的生成式模型所攜帶的目標(biāo)信息更豐富,相比于其他方法能較好的處理視角變化和部分遮擋等問(wèn)題[11].
近年來(lái),稀疏表示(sparse representation,SR)作為一種高效工具廣泛應(yīng)用于分類[12]、視覺(jué)跟蹤[11]和人臉識(shí)別[13]等領(lǐng)域.Mei和Ling將稀疏表示首次應(yīng)用至目標(biāo)跟蹤領(lǐng)域,提出了L1目標(biāo)跟蹤器[11],在此基礎(chǔ)上研究者們又提出了幾種改進(jìn)的基于稀疏表示的目標(biāo)跟蹤算法.Jia[14]和Wang[15]利用目標(biāo)的局部信息和空間信息,提出了局部稀疏表示模型.Bao等針對(duì)L1跟蹤器,添加了關(guān)于瑣碎模板相關(guān)系數(shù)的L2范數(shù)正則項(xiàng),從而提高了跟蹤精度[16].但是,以上方法都是在數(shù)據(jù)的原始空間上建立線性稀疏表示模型,而沒(méi)有考慮到目標(biāo)形變等其他復(fù)雜特性.核方法作為一種非參數(shù)化方法,在描述特征空間中數(shù)據(jù)的非線性關(guān)系時(shí),可以有效改善參數(shù)化方法的局限[17].因此,Gao等為了捕獲圖像樣本與字典之間的非線性信息,減少特征量化誤差,提出了一種核稀疏表示(kernel sparse representation,KSR)方法,并成功應(yīng)用于圖像分類與人臉識(shí)別[18].在傳統(tǒng)稀疏表示算法中,通常為了檢測(cè)遮擋而引入瑣碎模板.然而瑣碎模板的選擇主要依賴人工經(jīng)驗(yàn),并且會(huì)對(duì)目標(biāo)跟蹤效果產(chǎn)生較大影響.為了避免瑣碎模板的引入,Wang等將核稀疏表示應(yīng)用在了目標(biāo)跟蹤領(lǐng)域[19].
針對(duì)目標(biāo)跟蹤中出現(xiàn)的視覺(jué)漂移問(wèn)題,Wang提出了一種基于局部稀疏表示的兩階段算法,第1階段使用自適應(yīng)觀測(cè)模型來(lái)估計(jì)初始跟蹤結(jié)果[15].第2階段使用靜態(tài)觀測(cè)模型來(lái)確定最終的跟蹤結(jié)果.在此基礎(chǔ)上,Yan[20]又提出了一種基于核稀疏表示的兩階段算法,并根據(jù)在線學(xué)習(xí)得到的分類器來(lái)區(qū)分目標(biāo)和背景.第1階段利用整體信息估計(jì)初始跟蹤位置,第2階段利用局部信息確定最終跟蹤目標(biāo).但由于Wang和Yan采用的都是判別式的跟蹤算法,計(jì)算量大,難以滿足目標(biāo)跟蹤中實(shí)時(shí)性的要求.
針對(duì)稀疏表示模型的求解,Mei使用了瑣碎模板加L1范數(shù)最小化求解跟蹤目標(biāo)[11];Xu[21]等人提出了一種L1/2范數(shù)最小化方法求解稀疏表示模型,該方法通過(guò)迭代的求解L1范數(shù)最小化問(wèn)題實(shí)現(xiàn),另外,使用L1,2也可以得到稀疏表示模型[22-23],而一般情況下單獨(dú)使用L2范數(shù)無(wú)法獲得稀疏模型.對(duì)于核稀疏表示模型,Wang[19]使用了特征空間的L1范數(shù)最小化求解核稀疏模型,并提出了基于核的坐標(biāo)下降法求解最小化問(wèn)題,但計(jì)算量大.
不同于上述工作,本文提出了一種新的基于核的兩階段稀疏表示(two-stage sparse representation,TSSR)目標(biāo)跟蹤算法,基于粒子濾波框架和兩階段稀疏逼近描述,研究了視角變化以及部分遮擋等因素存在下的目標(biāo)跟蹤問(wèn)題.在第1階段利用圖像樣本與字典在原始空間中表示模型估計(jì)初始跟蹤位置,在第2階段使用核方法將原始空間映射到高維特征空間(再生核希爾伯特空間),利用核稀疏表示模型求解圖像樣本與字典之間的非線性關(guān)系來(lái)確定最終的跟蹤目標(biāo).同時(shí)提出了一種基于核方法的加速近端梯度算法求解特征空間中的范數(shù)最小化問(wèn)題,并通過(guò)實(shí)驗(yàn)證明了算法的有效性.
目標(biāo)跟蹤問(wèn)題通常針對(duì)如下系統(tǒng):
其中:xt?1,xt分別表示第t-1和t時(shí)刻跟蹤目標(biāo)的狀態(tài),即目標(biāo)的位置和大小;zt表示從第t時(shí)刻目標(biāo)狀態(tài)的觀測(cè)值;ε和δ分別表示系統(tǒng)中的狀態(tài)轉(zhuǎn)移噪聲和觀測(cè)噪聲.
但在實(shí)際中p(xt|z1:t)可能是未知的,無(wú)法直接采樣得到有效粒子,通常需要借助重要性采樣(sequential importance sampling,SIS)算法.從一個(gè)已知的且容易采樣的分布q(xt|x1:t?1,zt)中抽樣得到粒子,同時(shí)粒子的權(quán)值更新公式為
在傳統(tǒng)的稀疏表示算法中,將視頻圖像序列中前幾幀包含跟蹤目標(biāo)的人工標(biāo)注圖像區(qū)域作為訓(xùn)練集,通過(guò)該訓(xùn)練集可以得到由m個(gè)模板元素組成的字典D=[d1d2··· dm]∈Rl×m,其中l(wèi)為模板元素的維數(shù).一個(gè)經(jīng)過(guò)向量化處理過(guò)的圖像樣本y ∈Rl×1可以通過(guò)字典進(jìn)行稀疏表示
其中:c=[c1c2··· cm]T∈Rm×1是系數(shù)向量,ε表示誤差向量.在粒子濾波框架下,式(6)的稀疏表示系數(shù)通常通過(guò)求解以下L1正則優(yōu)化問(wèn)題來(lái)得到,即
其中λ是一個(gè)平衡參數(shù),用于調(diào)節(jié)正則化的強(qiáng)度.
本文提出了一種兩階段的稀疏表示方法,在第1階段中利用圖像樣本與字典在原始空間中的線性關(guān)系估計(jì)初始目標(biāo)位置,第2階段利用圖像樣本與字典在特征空間中的非線性關(guān)系確定最終的跟蹤位置.該方法的理論框架如圖1所示.
圖1 兩階段的稀疏表示方法Fig.1 Two-stage sparse representation
在第1階段建立圖像樣本與字典在低維原始空間中的線性表示模型,即式(6).并使用批處理最小二乘方法計(jì)算該模型的表示系數(shù)c0,即
同時(shí),本文選擇高斯函數(shù)來(lái)設(shè)計(jì)粒子在原始空間中觀測(cè)似然,即
本文利用兩階段的核稀疏表示,首先將候選目標(biāo)被表示為目標(biāo)模板的線性和非線性組合,然后選取模板重構(gòu)誤差最小的候選目標(biāo)作為跟蹤目標(biāo),主要基于以下兩點(diǎn)考慮:
1) 稀疏表示模型中的瑣碎模板可以有效解決部分遮擋問(wèn)題[11],瑣碎模板的引入給稀疏表示模型的求解帶來(lái)了較大的計(jì)算成本.本文利用核方法建立了高維特征空間中的稀疏表示模型,提出了核稀疏表示,并在模板字典中舍棄了瑣碎模板,通過(guò)特征提取函數(shù),在核稀疏表示模型中引入對(duì)視角變化和部分遮擋不敏感的復(fù)雜特征來(lái)隱式地表示候選目標(biāo),從而避免了在模板字典中引入瑣碎模板帶來(lái)的額外計(jì)算成本.
2) 傳統(tǒng)的表示模型,將圖像樣本分解為模板字典中少數(shù)原始模板線性組合后的特征,并沒(méi)有利用到圖像樣本和模板的復(fù)雜特征.核方法可以捕獲特征的非線性相似性,相比于稀疏表示,核稀疏表示可以學(xué)習(xí)到更多判別性的稀疏編碼[18].核方法將非線性可分離的特征映射到高維特征空間,在高維特征空間中,相同類型的特征更容易組合在一起,并且不同類型的特征變得線性可分離,在這種情況下,可以更容易地找到信號(hào)的稀疏表示,也可以減少重構(gòu)誤差.
3.3.1 核方法
本文在第1階段的原始空間中,利用候選目標(biāo)之間線性可分離的特征,對(duì)粒子進(jìn)行篩選.在本階段使用核方法將候選粒子集與字典集映射到高維特征空間,將候選樣本分解為模板字典中少數(shù)模板非線性組合后的特征.得到基于核的稀疏表示模型
其中:φ(·)表示從低維空間到特征空間的映射,即特征提取函數(shù),φres(y)=εσr為表示殘差,且σr是與前m個(gè)特征向量φ(di)正交的單位向量.
如圖2所示,圖2(a)中的紅框和藍(lán)框分別框出了精準(zhǔn)的和偏差的圖像識(shí)別結(jié)果,圖2(c)為模板集中的10個(gè)目標(biāo)模板,圖2(b)和圖2(d)分別對(duì)應(yīng)精準(zhǔn)的和偏差的表示系數(shù).從圖2可以看出,精準(zhǔn)的圖像識(shí)別結(jié)果對(duì)應(yīng)的表示系數(shù)往往是稀疏的,即表示系數(shù)向量中只有少量的非零元素,而偏差的圖像識(shí)別結(jié)果對(duì)應(yīng)的系數(shù)是非稀疏的.因此,本文通過(guò)在求解表示模型過(guò)程中添加L1范數(shù)懲罰項(xiàng),控制表示系數(shù)的稀疏性.為了防止重構(gòu)誤差過(guò)小,出現(xiàn)表示模型過(guò)擬合的情況,本文在求解核稀疏表示模型的過(guò)程中添加再生核Hilbert空間(reproducing kernel Hilbert space,RKHS)范數(shù)用來(lái)控制模型的復(fù)雜度.在特征空間中,基于核的稀疏表示系數(shù)為
圖2 基于目標(biāo)模板的兩種表示方法對(duì)比Fig.2 Two representation methods comparison
最后,本文將粒子在原始空間和高維特征空間得到的觀測(cè)似然相加
作為圖像樣本與字典之間的相似性度量,確定最終的跟蹤目標(biāo).選擇字典之間的相似性度量最大的候選粒子作為t時(shí)刻的跟蹤結(jié)果,即
對(duì)于式(11)的求解,本文提出了一種新的基于核的加速近端梯度算法,詳細(xì)推導(dǎo)過(guò)程見(jiàn)下一節(jié).
3.3.2 基于核的加速近端梯度算法
對(duì)于式(11)中RKHS范數(shù)的定義如下:成立.
Mercer定理指出存在一個(gè)唯一的再生核Hilbert空間及映射φ(·)與滿足上述條件的函數(shù)k(x,y)對(duì)應(yīng).本文利用核稀疏表示學(xué)習(xí)樣本的判別性編碼,相比于其他核函數(shù),高斯核函數(shù)具有較強(qiáng)的判別能力[24].因此,特征映射之間的內(nèi)積可以由高斯核函數(shù)表示,即
將其帶入式(15)得到
其中K是由核函數(shù)生成的核矩陣.接下來(lái),定義F(c)=g(c)+h(c),其中
特別地,g(·)是可微凸函數(shù),h(·)是不可微凸函數(shù).其中,g(·)的梯度為
根據(jù)文獻(xiàn)[25],不可微凸函數(shù)h(u)帶懲罰因子ρ的鄰近算子形式可表示為
為了簡(jiǎn)化計(jì)算,令ρ=1,定義v=z-η·?g(z),其中η為步長(zhǎng).由此,核稀疏表示系數(shù)的遞推公式如下:
使用軟閾值(soft thresholding)方法進(jìn)行求解可得到
其中ηs(·,·)為軟閾值函數(shù),即
sgn(·)為符號(hào)函數(shù).為了減少KAPG算法的迭代次數(shù),本文使用了c0作為迭代初值.
綜上,本文中使用KAPG算法迭代求解式(11)的偽代碼如表1所示.
表1 KAPG求解核稀疏表示Table 1 Solving kernel sparse representation with KAPG
針對(duì)加權(quán)系數(shù)λ和γ,由于它們的信息無(wú)法被訓(xùn)練數(shù)據(jù)集表示,因此本文依靠經(jīng)驗(yàn)指定加權(quán)系數(shù)的值,人為地限制函數(shù)空間的大小.為此,本文將Car4數(shù)據(jù)集作為驗(yàn)證集,改變加權(quán)系數(shù)并進(jìn)行了多次實(shí)驗(yàn),得到TSSR算法在驗(yàn)證集上的跟蹤精度,結(jié)果如文中的表2所示,每個(gè)表格中的第1行數(shù)據(jù)為平均中心誤差,第2行為平均重疊率.選取λ=0.11和γ=0.11,作為本文算法的超參數(shù).
表2 超參數(shù)選擇Table 2 Hyperparameter selection
在跟蹤過(guò)程中,為了適應(yīng)視角變化導(dǎo)致的目標(biāo)姿態(tài)和形狀變化,本文提出了在高維特征空間中的模板更新策略,防止跟蹤過(guò)程發(fā)生漂移,在跟蹤過(guò)程中將跟蹤結(jié)果作為替代模板加入到字典中.通常認(rèn)為目標(biāo)的姿態(tài)和形狀連續(xù)變化,但連續(xù)更新模板可能會(huì)丟失過(guò)去的表觀信息,引入過(guò)多的噪音,本文通過(guò)設(shè)立更新閾值的方式來(lái)解決這一問(wèn)題.假設(shè)在t時(shí)刻的跟蹤結(jié)果為yt,且yt與模板字典中的第i個(gè)模板di的相似度量為
其中的值越大,表明yt與di的相似度越高.
由于字典集中有m個(gè)模板,若對(duì)每個(gè)模板都計(jì)算相似性度量,則計(jì)算量太大.為此,本文設(shè)計(jì)第i個(gè)模板在t+1時(shí)刻對(duì)應(yīng)的貢獻(xiàn)度為
其中:ci表示第i個(gè)模板對(duì)應(yīng)的稀疏表示系數(shù),且模板的初始貢獻(xiàn)度為=1/m,m為字典中模板的總數(shù).選取在稀疏表示中貢獻(xiàn)度最大的模板計(jì)算其與跟蹤結(jié)果yt的相似度量ξ,同時(shí)定義模板的更新閾值為τ.當(dāng)ξ <τ時(shí),用yt替代掉字典中貢獻(xiàn)度最低的模板,同時(shí)將各模板的貢獻(xiàn)度重新設(shè)為1/m,否則按式(24)進(jìn)行貢獻(xiàn)度更新.
本文所提出的再生核Hilbert空間中的TSSR目標(biāo)跟蹤算法在粒子濾波的框架下,使用兩階段的稀疏表示求解粒子的觀測(cè)似然來(lái)確定跟蹤目標(biāo)在每幀圖像中的位置和大小信息.其中,在第1階段稀疏表示算法是在圖像樣本與字典的低維原始空間求解粒子的觀測(cè)似然,并根據(jù)觀測(cè)似然對(duì)粒子進(jìn)行篩選得到候選粒子集.第2階段將候選粒子通過(guò)核方法映射到高維特征空間求解候選粒子的觀測(cè)似然,對(duì)粒子進(jìn)行二次篩選得到最終的結(jié)果.并根據(jù)當(dāng)前幀圖像的跟蹤結(jié)果對(duì)模板進(jìn)行更新,提高算法的魯棒性.綜上所述,本文設(shè)計(jì)目標(biāo)跟蹤算法結(jié)構(gòu)圖如圖3所示,偽代碼如表3所示.
圖3 算法流程圖Fig.3 Algorithm flow chart
表3 基于核的TSSR目標(biāo)跟蹤算法Table 3 TSSR objective tracking algorithm based on kernel
為了驗(yàn)證本文所提出的TSSR算法的有效性和魯棒性,本節(jié)選取了6個(gè)具有復(fù)雜性背景的圖像序列1數(shù)據(jù)集下載網(wǎng)址:http://cvlab.hanyang.ac.kr/tracker_benchmark/datasets.html.,包括Car4,CarDark,Deer,Freeman1,Subway,Walking2.此外,TSSR算法與其他先進(jìn)的目標(biāo)跟蹤算法進(jìn)行比較,包括L1跟蹤器[16]2L1跟蹤器代碼下載網(wǎng)址:https://www3.cs.stonybrook.edu/~hling/code_data.htm.、SCM跟蹤器[26]3SCM代碼下載網(wǎng)址:https://github.com/huchuanlu/12-1.、MTT跟蹤器[2]4MTT代碼下載網(wǎng)址:https://sites.google.com/site/zhangtianzhu2012/publications.以及基于深度特征的目標(biāo)跟蹤算法Siam-Mask[27]5SiamMask代碼下載網(wǎng)址:https://github.com/foolwood/SiamMask..本節(jié)實(shí)驗(yàn)在Window 10 平臺(tái)上MATLAB R2017b軟件中完成,跟蹤結(jié)果如圖6所示.
在TSSR算法中,設(shè)置粒子數(shù)為600個(gè),高斯核函數(shù)中的常量參數(shù)為σn=0.7和=5.算法1中的λ=0.11,γ=0.11,η=0.05,模板更新閾值τ=0.76.在目標(biāo)與背景具有相似紋理和顏色的情況下,可以適當(dāng)降低模板的更新閾值,來(lái)保證模板中不會(huì)出現(xiàn)非目標(biāo)信息,并且目標(biāo)模板的初始化與L1跟蹤器[11]相同,目標(biāo)模板數(shù)為10個(gè).
本小節(jié)通過(guò)計(jì)算中心定位誤差以及重疊率,對(duì)上述5個(gè)算法在6個(gè)數(shù)據(jù)集上的跟蹤實(shí)時(shí)性以及跟蹤效果進(jìn)行定量分析.其結(jié)果分別如圖4和圖5所示,表4-6分別列出了每種算法在各個(gè)數(shù)據(jù)集上的幀速率、平均中心誤差和平均重疊率,跟蹤實(shí)時(shí)性以及跟蹤效果最好結(jié)果在表4-6中用加粗字體進(jìn)行標(biāo)注.
圖4 中心誤差Fig.4 Center error
表4 幀速率Table 4 Frames persecond
這些數(shù)據(jù)集包含了實(shí)際情況中的諸多復(fù)雜因素,比如視角變化和部分遮擋.視角變化即由于目標(biāo)與相機(jī)之間的相對(duì)運(yùn)動(dòng),從而導(dǎo)致目標(biāo)在不同幀圖片之間的外觀存在較大的差異.如圖6中Car4數(shù)據(jù)集所示,目標(biāo)車(chē)輛從視野的左側(cè)移動(dòng)到了右側(cè),且外觀變小;Deer 中的目標(biāo)發(fā)生了旋轉(zhuǎn);Freeman1中目標(biāo)人臉的外觀在六幀圖片之間都存在著較大的差異;Walking2中的目標(biāo)在視野中由近及遠(yuǎn),外觀大小也出現(xiàn)了較大變化;Subway中的目標(biāo)在視野中在從左往右前進(jìn)的過(guò)程中也出現(xiàn)了外觀變化.從表5和表6可以看出,本文的算法在存在是視角變化的數(shù)據(jù)集上平均中心誤差分別為2.46,5.41,7.38,3.04,2.53,平均重疊率分別為0.85,0.72,0.45,0.77,0.56.說(shuō)明本文算法可以很好應(yīng)對(duì)視角變化帶來(lái)的挑戰(zhàn).
在注重植物選擇多樣性的同時(shí),還要注重植物種植的層次性,在植物景觀中植物的層次結(jié)構(gòu)是非常重要的。大多數(shù)的景觀忽略了這一點(diǎn),導(dǎo)致植物景觀整體看起來(lái)不夠靈活或者給人一種混亂感。景觀營(yíng)造較好的模式應(yīng)是喬木、灌木、草本相結(jié)合的立體結(jié)構(gòu)模式。
表5 平均中心誤差Table 5 Average center error
表6 平均重疊率Table 6 Average overlap rate
遮擋即目標(biāo)的整體或部分被非目標(biāo)物體遮擋.如圖6所示,Freeman1數(shù)據(jù)集中目標(biāo)人臉在第302幀被人手遮擋;Walking2的目標(biāo)在第196,202和218幀圖片中被一名男子遮擋;而Subway數(shù)據(jù)中目標(biāo)也存在被不同人遮擋的情況.從表5和表6可以看出,本文的算法在存在遮擋的數(shù)據(jù)集上平均中心誤差分別為7.38,3.04,4.85,平均重疊率分別為0.45,0.77,0.56.雖然在這3個(gè)數(shù)據(jù)集上,TSSR的結(jié)果稍差于基于深度學(xué)習(xí)的Siam-Mask算法,但從圖6可以看出,SiamMask在Walking2上出現(xiàn)了跟蹤失敗的情況,因此,本文的算法擁有較好的魯棒性.
本文利用圖像的信息熵來(lái)表示圖像的復(fù)雜度,計(jì)算每個(gè)數(shù)據(jù)集中圖像的平均熵來(lái)度量數(shù)據(jù)集中的背景復(fù)雜度.Car4,CarDark,Deer,Freeman1,Subway以及Walking2數(shù)據(jù)集的平均熵分別為6.92,6.70,7.29,7.38,7.25,7.46,其中,Walking2數(shù)據(jù)集的平均熵最高,復(fù)雜度也最高,而本文的算法在Walking2數(shù)據(jù)集上的跟蹤效果也優(yōu)于其他4個(gè)算法.
從表4可以看出,本文所提的TSSR算法以及L1跟蹤算法在6個(gè)數(shù)據(jù)集上都具有較高的幀速率,但TSSR的幀速率較L1更穩(wěn)定,所以本文所提算法擁有更好的實(shí)時(shí)性表現(xiàn).從表5和表6可以看出,本文所提的目標(biāo)算法具有較高的幀速率、較低跟蹤誤差以及較高的重疊率,跟蹤效果優(yōu)于其他4個(gè)算法.
為了驗(yàn)證TSSR算法的魯棒性,利用上述6個(gè)數(shù)據(jù)集,測(cè)試了每個(gè)算法在出現(xiàn)光照變化、目標(biāo)尺度變化、遮擋、形變、運(yùn)動(dòng)模糊、快速移動(dòng)、面內(nèi)旋轉(zhuǎn)、面外旋轉(zhuǎn)、背景雜波等挑戰(zhàn)下的跟蹤效果,結(jié)果如圖6所示.
Car4數(shù)據(jù)集是在一個(gè)開(kāi)放道路上獲取的,主要存在2種復(fù)雜性挑戰(zhàn):光照變化,目標(biāo)尺度變化.在圖6的第1行顯示了4個(gè)算法在第91,175,194,223,290,399幀圖像的跟蹤效果,其中在第175,194,223幀時(shí)出現(xiàn)劇烈的光照變化,MTT和SCM的跟蹤效果變差,而TSSR,L1以及SiamMask算法跟蹤效果沒(méi)有明顯變化,可以較好地抵抗光照變化帶來(lái)的干擾.
圖6 目標(biāo)跟蹤結(jié)果Fig.6 Objective tracking results
在CarDark數(shù)據(jù)集上主要存在2種挑戰(zhàn):光照變化,背景雜波.SiamMask算法在第302幀圖像后便不能正確地跟蹤目標(biāo),而其余4個(gè)算法都可以較好地跟蹤目標(biāo),沒(méi)有出現(xiàn)目標(biāo)跟蹤失敗的情況.此外,從圖4和圖5可以看出,TSSR算法跟蹤效果優(yōu)于其他算法.
圖5 重疊率Fig.5 Overlap rate
Deer數(shù)據(jù)集上主要存在4種復(fù)雜性挑戰(zhàn):運(yùn)動(dòng)模糊,快速運(yùn)動(dòng),面內(nèi)旋轉(zhuǎn),背景雜波,跟蹤難度也比上述Car4和CarDark兩個(gè)數(shù)據(jù)集高.從第16,38,42,56幀圖像可以看出,SCM和L1算法會(huì)出現(xiàn)目標(biāo)跟蹤失敗的情況,但TSSR,MTT和SiamMask算法可以始終跟蹤上目標(biāo),在第38,42幀圖像中MTT算法受到背景雜波的干擾,會(huì)出現(xiàn)目標(biāo)跟蹤失敗的情況,在第56幀時(shí),由于背景雜波的影響,SiamMask算法同樣出現(xiàn)跟蹤失敗的情況.
Walking2數(shù)據(jù)集主要存在3種復(fù)雜性挑戰(zhàn):遮擋,目標(biāo)尺度變化,背景雜波.相比于Car4和Freeman1數(shù)據(jù)集,Walking2數(shù)據(jù)集中目標(biāo)的比例變化更大,跟蹤難度也相應(yīng)的變大.通過(guò)第202幀圖像可以看出目標(biāo)的被遮擋面積超過(guò)了目標(biāo)本身面積的80%,并從第218,235和376幀圖像中看出SCM和SiamMask算法出現(xiàn)了目標(biāo)跟蹤失敗的情況,L1算法并不能很好的應(yīng)對(duì)目標(biāo)比例變化的挑戰(zhàn),MTT算法雖然能跟蹤上目標(biāo),但無(wú)法準(zhǔn)確選擇目標(biāo)區(qū)域,只有TSSR算法表現(xiàn)出了較好的跟蹤效果.
在Subway數(shù)據(jù)上存在2種復(fù)雜性挑戰(zhàn):遮擋,形變.并且存在目標(biāo)被多次遮擋的情況,相比與Walking2,Subway數(shù)據(jù)集上的遮擋挑戰(zhàn)難度更大.從第45幀開(kāi)始之后的所有幀圖像中,MTT算法都未能跟蹤到目標(biāo).對(duì)于其他算法,SiamMask算法在第45幀圖像中出現(xiàn)了跟蹤失敗的情況;L1算法在第166幀圖像中出現(xiàn)了跟蹤失敗的情況,只有TSSR和SCM算法始終可以跟蹤上目標(biāo),從第51,103,166幀圖像可以明顯看出,TSSR算法要優(yōu)于SCM算法.
本文針對(duì)目標(biāo)跟蹤問(wèn)題,基于粒子濾波框架,提出了TSSR目標(biāo)跟蹤模型,將跟蹤問(wèn)題轉(zhuǎn)化為在原始空間和特征空間中的兩階段稀疏逼近問(wèn)題,同時(shí)針對(duì)在特征空間中的稀疏表示模型,提出了一種基于核方法的加速近端梯度算法.針對(duì)目標(biāo)跟蹤中出現(xiàn)的多種干擾,本文通過(guò)在特征空間中利用核函數(shù)計(jì)算當(dāng)前時(shí)刻跟蹤目標(biāo)與模板的相似度量來(lái)決定是否更新模板.最后通過(guò)對(duì)比實(shí)驗(yàn)驗(yàn)證了本文所提出的TSSR方法在針對(duì)視角變化和部分遮擋因素的魯棒性.