韋超現(xiàn)
(南寧師范大學(xué),廣西 南寧 530000)
圖像跟蹤技術(shù)是將物體的邊界信息作為一個(gè)關(guān)鍵特性加入多幀圖像跟蹤標(biāo)簽中[1]。許多問題在計(jì)算機(jī)視覺中發(fā)生,如移動(dòng)目標(biāo)識(shí)別,但是在對(duì)圖像目標(biāo)跟蹤過程時(shí),由于環(huán)境、背景以及目標(biāo)的復(fù)雜不確定性,容易導(dǎo)致物體移動(dòng)時(shí),目標(biāo)圖像模具粘貼和顫抖[2]。在這種情況下,如何有效地實(shí)現(xiàn)運(yùn)動(dòng)圖像在視覺傳達(dá)下的目標(biāo)跟蹤標(biāo)記,是該領(lǐng)域中要解決的問題,已經(jīng)有很多學(xué)者對(duì)此進(jìn)行了廣泛的討論。
文獻(xiàn)[3]利用RGB顏色空間變換HSV空間圖像的亮度V分量,建立RGB圖像的背景掩膜,獲取二進(jìn)制圖像,建立坐標(biāo)系,獲取最小矩形特征向量,加入約束條件,并根據(jù)參數(shù)校準(zhǔn),實(shí)現(xiàn)動(dòng)態(tài)樣例構(gòu)建。該方法能夠快速跟蹤圖像特征目標(biāo),但該方法未考慮前景圖像輪廓權(quán)值問題,圖像特征目標(biāo)跟蹤準(zhǔn)確性較低。文獻(xiàn)[4]根據(jù)多尺度小波變換,得到運(yùn)動(dòng)前景目標(biāo)信息提取的特點(diǎn),采用卡爾曼濾波對(duì)粒子進(jìn)行預(yù)測(cè)和校正,將當(dāng)前觀測(cè)到的信息輸入粒子濾波過程中,通過均值和協(xié)方差估計(jì)對(duì)粒子狀態(tài)進(jìn)行預(yù)測(cè),使動(dòng)態(tài)粒子更接近于概率分布,從而提高運(yùn)動(dòng)目標(biāo)的跟蹤精度。該方法可以有效地跟蹤視頻運(yùn)動(dòng)目標(biāo),但該方法計(jì)算量大,圖像特征目標(biāo)跟蹤效率較低。
針對(duì)上述問題,提出了基于視覺傳達(dá)的多幀圖像特征目標(biāo)跟蹤方法。采用稀疏表示策略采集多幀圖像的特征目標(biāo),利用高斯分布建立圖像運(yùn)動(dòng)模型,再根據(jù)灰度投影法進(jìn)行特征提取,對(duì)圖像各個(gè)幀間的特征點(diǎn)匹配,獲得多幀圖像的輪廓跟蹤目標(biāo)并運(yùn)算出前景輪廓的目標(biāo)函數(shù)權(quán)重,實(shí)現(xiàn)多幀圖像特征目標(biāo)跟蹤。實(shí)驗(yàn)結(jié)果表明,該方法提取的多幀圖像目標(biāo)特征精度較好,跟蹤準(zhǔn)確率較高,能夠有效降低多幀圖像特征目標(biāo)跟蹤時(shí)間。
計(jì)算機(jī)技術(shù)獲取和處理視覺圖像信息的功能越來越廣泛。雖然強(qiáng)大的視覺系統(tǒng)可以處理、分析和理解視覺信息,但是沒有實(shí)現(xiàn)圖像自主視覺[5]。采用稀疏表示方法,從多幅視頻圖像中采集有效的目標(biāo)特征,視頻圖像的特征選擇過程如下式
(1)
式(1)中,A∈K×(m+n)作為多幀圖像轉(zhuǎn)換為32*32像素大小的圖像。字典是通過將其校驗(yàn)為列向量來構(gòu)造的。m與n作為字典對(duì)應(yīng)的正負(fù)模板個(gè)數(shù),K作為多幀圖像的特征維數(shù),s作為稀疏系數(shù)向量,λ1作為權(quán)重因子,p∈m+n作為字典中每個(gè)原子的屬性,+1作為原子中的正模板屬性,-1作為原子中的負(fù)模板屬性,s內(nèi)的非零元素作為多幀圖像特征選擇的依據(jù),多幀圖像投影矩陣S的i行和l列元素的表達(dá)式為
(2)
式(2)中,si1表示為稀疏系數(shù)向量s內(nèi)的第i1個(gè)元素,通過方程(2)將字典A與候選采樣x兩者投影到相同判別空間中,完成多幀圖像目標(biāo)特征的采集,多幀圖像降維后的字典A′和候選狀態(tài)x′的表達(dá)式如下
A′=SA,x′=Sx
(3)
根據(jù)式(3)可以對(duì)K維多幀圖像進(jìn)行高效的特征識(shí)別[6]。通過一系列多幀圖像的目標(biāo)觀測(cè)值O1:t={o1,o2,…,ot}來估計(jì)當(dāng)前多幀圖像的目標(biāo)狀態(tài),并利用方程(4)來運(yùn)算多幀圖像目標(biāo)狀態(tài)xt的后驗(yàn)概率。
(4)
式(4)中,p(xt|xt-1)所描述的是視頻圖像的兩個(gè)相鄰幀之間的目標(biāo)運(yùn)動(dòng)模型。p(xt-1|O1:t-1)所描述的是t-1時(shí)刻多幀圖像目標(biāo)狀態(tài)xt的后驗(yàn)概率。p(ot|xt)所描述的是似然函數(shù)。它闡述了候選狀態(tài)和目標(biāo)模板之間的近似程度。利用高斯分布建立視頻圖像的運(yùn)動(dòng)模型,其表達(dá)式為
p(xt|xt-1)=N(xt,xt-1,ψ)
(5)
在式(5)中,N(· )作為高斯分布,ψ作為對(duì)角協(xié)方差矩陣,xt-1作為t-1時(shí)間段內(nèi)圖像目標(biāo)狀態(tài)多幀圖像第j個(gè)候選目標(biāo)狀態(tài)xj的似然函數(shù)表達(dá)式如下
(6)
為了提取多幀圖像的目標(biāo)特征,首先需要對(duì)多幀圖像的灰度和細(xì)節(jié)特征進(jìn)行小波分析,然后利用灰度投影法提取多幀圖像的目標(biāo)特征,用圖像目標(biāo)前景和圖像目標(biāo)背景的分類問題代替多幀的特征跟蹤問題,分離圖像目標(biāo)前景和圖像目標(biāo)背景范圍的系數(shù),根據(jù)圖像特征分布方差的比值函數(shù)判斷目標(biāo)前景和目標(biāo)背景范圍。
假設(shè)輸入校正后的灰度圖像為hx(a,b),多幀圖像的兩個(gè)特征:灰度細(xì)節(jié)塔Px(u)和細(xì)節(jié)金字塔Qx(u,g)用多尺度描述。為了改善多幀圖像的特點(diǎn),在視覺傳達(dá)下,對(duì)多幀圖像進(jìn)行多幀處理用尺度差分法代替卷積過程,其公式為
(7)
式(7)中,tw所描述的是特征對(duì)比度測(cè)量值,δy所描述的是影響視頻圖像的目標(biāo)范圍大小,δu所描述的是影響視頻圖像的抑制區(qū)域大小[7]。
在提取多幀圖像灰度和細(xì)節(jié)特征的目標(biāo)特征時(shí),需要設(shè)定Px(y)和Px(u)代表H(u)插值和H(y)尺度的目標(biāo)范圍,得出公式為
(8)
設(shè)定Z(l,r)作為第x1幀視頻圖像中(l,r)像素的灰度值,ga作為x2幀視頻圖像之間的平移估計(jì),gb作為k+m幀視頻圖像之間的平移估計(jì),按照平移估計(jì)值合理運(yùn)算出x3幀視頻圖像的特征目標(biāo),其表達(dá)式為
認(rèn)知與計(jì)算的實(shí)踐轉(zhuǎn)向中,圖靈提出了一種客觀的,易于操作的檢驗(yàn)方法。在他看來,如果一臺(tái)經(jīng)過編程的計(jì)算機(jī)能夠與一個(gè)有理性思維能力的人談?wù)撊魏卧掝},而用戶判斷不出他是在與一個(gè)人交談還是在與一臺(tái)機(jī)器交談,那就可以說這臺(tái)計(jì)算機(jī)是具有智能的。這就是“圖靈測(cè)驗(yàn)”。
Nx(,r)=|Z(l,r)-ga-gb|
(9)
(10)
式(10)中:F(x)代表灰度特征顯著圖的歸一化函數(shù)為,F(xiàn)(x)代表細(xì)節(jié)特征顯著圖的歸一化函數(shù),F(xiàn)(x)代表運(yùn)動(dòng)特征顯著圖的歸一化函數(shù),最終提取到多幀圖像特征值為Ux。因此,利用Ux結(jié)果可以提取出具有目標(biāo)特征的多幀圖像,通過上述步驟,完成多幀圖像特征目標(biāo)的提取。
在對(duì)視覺傳達(dá)下多幀圖像特征目標(biāo)跟蹤的過程中,根據(jù)所獲特征目標(biāo)及上述多幀圖像背景高斯分布的參數(shù)模型,實(shí)時(shí)匹配多幀圖像的特征點(diǎn),獲得多幀圖像的輪廓軌跡追蹤目標(biāo)[8]。具體流程如下:
(11)
(12)
(13)
假設(shè)圖像中運(yùn)動(dòng)對(duì)象模型的速度是一個(gè)變量,運(yùn)動(dòng)區(qū)域外矩形框左上角和右下角坐標(biāo)系中運(yùn)動(dòng)模型的速度也是一個(gè)變量,然后在α-β-γ濾波器內(nèi),狀態(tài)方程的公式即
(14)
(K+1)=(K)+α[(K+1+K)]
(15)
(16)
(17)
依據(jù)上述公式可知,目標(biāo)函數(shù)優(yōu)化前景區(qū)域的所有輪廓標(biāo)記公式為
(18)
目標(biāo)函數(shù)權(quán)重ci主要根據(jù)相應(yīng)的前景圖像輪廓線的表面積與所有前視輪廓的總面積之比來確定的。根據(jù)權(quán)值結(jié)果,在視覺傳達(dá)下對(duì)多幀圖像實(shí)施特征目標(biāo)跟蹤,由此實(shí)現(xiàn)多幀圖像特征目標(biāo)跟蹤。
為了驗(yàn)證基于視覺傳達(dá)的多幀圖像特征目標(biāo)跟蹤方法的有效性,進(jìn)行仿真。實(shí)驗(yàn)數(shù)據(jù)選用具有235幀的flying多幀圖像數(shù)據(jù),圖像特征目標(biāo)選定為場(chǎng)景中的翅膀部分。在Matlab環(huán)境下搭建多幀圖像真實(shí)性建模仿真平臺(tái)。在實(shí)驗(yàn)過程中,使用佳能5D相機(jī)拍攝了一系列的多幀模型序列圖像,焦距60mm,圖像分辨率2707×1772ppi。分別采用所提方法與文獻(xiàn)[3]方法、文獻(xiàn)[4]方法對(duì)提取的多幀圖像目標(biāo)特征進(jìn)行對(duì)比。對(duì)比結(jié)果如圖1所示。
圖1 不同方法提取的多幀圖像目標(biāo)特征
從圖1中可以看出,文獻(xiàn)[3]方法提取的多幀圖像目標(biāo)錯(cuò)誤特征較多,其多幀圖像目標(biāo)特征提取精度較差,文獻(xiàn)[4]方法提取的多幀圖像目標(biāo)特征數(shù)量較少,無法準(zhǔn)確地提取到多幀圖像特征目標(biāo),而所提方法能夠準(zhǔn)確地提取多幀圖像目標(biāo)特征。由此可知,所提方法提取的多幀圖像目標(biāo)特征精度較好,因?yàn)楸疚母鶕?jù)多幀圖像背景高斯分布的參數(shù)模型,對(duì)多幀圖像的特征點(diǎn)實(shí)時(shí)匹配,從而能夠準(zhǔn)確地提取多幀圖像目標(biāo)特征,增強(qiáng)多幀圖像目標(biāo)特征提取精度。
為了驗(yàn)證基于視覺傳達(dá)的多幀圖像特征目標(biāo)跟蹤方法的跟蹤時(shí)間,分別采用文獻(xiàn)[3]方法、文獻(xiàn)[4]方法與所提方法對(duì)多幀圖像特征目標(biāo)跟蹤時(shí)間進(jìn)行對(duì)比,結(jié)果如圖2所示。
圖2 不同方法多幀圖像特征目標(biāo)跟蹤時(shí)間
分析圖2可知,文獻(xiàn)[3]方法的平均多幀圖像特征目標(biāo)跟蹤時(shí)間為20s,文獻(xiàn)[4]方法的平均多幀圖像特征目標(biāo)跟蹤時(shí)間為26s,而所提方法的平均多幀圖像特征目標(biāo)跟蹤時(shí)間僅為7s。由此可知,所提方法的跟蹤時(shí)間最短,因?yàn)楸疚闹饕捎没叶韧队胺ǎ軌蚩焖偬崛《鄮瑘D像的目標(biāo)特征,降低多幀圖像特征目標(biāo)跟蹤時(shí)間。
為了驗(yàn)證基于視覺傳達(dá)的多幀圖像特征目標(biāo)跟蹤方法的跟蹤準(zhǔn)確性,利用式(19)計(jì)算不同方法的多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率,其表達(dá)式為:
(19)
式(19)中,PS表示為正確跟蹤匹配的多幀圖像幀數(shù),ZS表示為總多幀圖像幀數(shù)。對(duì)比文獻(xiàn)[3]方法、文獻(xiàn)[4]方法與所提方法多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率,對(duì)比結(jié)果如圖3所示。
圖3 不同方法多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率
通過圖3可知,當(dāng)多幀圖像幀數(shù)為250幀時(shí),文獻(xiàn)[3]方法的平均多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率為62%,文獻(xiàn)[4]方法的平均多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率為70%,而所提方法的平均多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率為90%,由此可知,所提方法的多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率最高,因?yàn)楸疚闹饕鶕?jù)前景圖像輪廓線的表面積與所有前視輪廓的總面積之比,確定權(quán)值結(jié)果,從而提高多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率。
為了解決多幀圖像目標(biāo)特征提取精度差、跟蹤準(zhǔn)確率低、跟蹤時(shí)間長(zhǎng)的問題。提出了基于視覺傳達(dá)的多幀圖像特征目標(biāo)跟蹤方法。采用稀疏表示策略采集多幀圖像的特征目標(biāo),利用高斯分布建立圖像運(yùn)動(dòng)模型,根據(jù)灰度投影法提取目標(biāo)特征,匹配運(yùn)動(dòng)圖像幀間的特征點(diǎn),得到多幀圖像的輪廓跟蹤目標(biāo),求解前景輪廓的目標(biāo)函數(shù)權(quán)重,實(shí)現(xiàn)多幀圖像特征目標(biāo)跟蹤。實(shí)驗(yàn)結(jié)果表明,所提方法提取的多幀圖像目標(biāo)特征精度較好,能夠提高多幀圖像特征目標(biāo)跟蹤準(zhǔn)確率、降低跟蹤時(shí)間。