李 軍, 代 天, 魏 睿
(重慶交通大學(xué) 機(jī)電與車輛工程學(xué)院,重慶 400041)
目標(biāo)跟蹤算法有生成式和判別式兩類,其中判別式算法是目前研究最多的方向。判別式跟蹤算法是通過分類器將目標(biāo)從背景中分離出來,通常將其視為一個(gè)二分類問題。如:Struck[1]算法、TLD[2]算法、MIL[3]算法、CT[4]算法等,該類算法首先在初始幀中的目標(biāo)區(qū)域附近獲得有限的正樣本集和負(fù)樣本集,并通過這些樣本集來訓(xùn)練得到分類器,其次利用訓(xùn)練得到的分類器來估計(jì)候選樣本的概率,將概率最大的視為跟蹤目標(biāo)。雖然上述跟蹤算法已取得較好的跟蹤效果,但現(xiàn)實(shí)環(huán)境中依然存在目標(biāo)遮擋、快速運(yùn)動(dòng)和尺度變化等情況導(dǎo)致的目標(biāo)跟蹤失敗[5]。
文獻(xiàn)[6]提出了MOSSE跟蹤算法,MOSSE算法首先利用目標(biāo)區(qū)域圖像樣本來訓(xùn)練目標(biāo)外觀模型,其次在計(jì)算目標(biāo)與候選區(qū)域之間的相似度時(shí),采用快速傅里葉變換技巧,該方法提高了算法的計(jì)算速度,其速度可達(dá)到600幀/s以上。但MOSSE算法也是利用了候選樣本有限的缺陷來訓(xùn)練分類器模型。
TLD解決了目標(biāo)被遮擋或消失在相機(jī)視野里無法被捕獲的問題[7],在第一幀中選擇感興趣的目標(biāo)后,就能自動(dòng)進(jìn)行魯棒跟蹤[8]。
文獻(xiàn)[9]提出的CSK算法可以對訓(xùn)練樣本進(jìn)行循環(huán)位移操作,獲得大量訓(xùn)練樣本,以便用來訓(xùn)練分類器,候選樣本采用同樣的操作,以此作為檢測對象,通過快速傅里葉變換技巧,提高運(yùn)算速度。Henriques等人對CSK算法進(jìn)行了改進(jìn),提出了KCF算法。通過多通道的HOG[10]特征代替原來的灰度特征,并將HOG特征融入相關(guān)濾波框架,采用脊回歸與循環(huán)矩陣對相關(guān)濾波進(jìn)行核化。
文獻(xiàn)[11]提出了CN目標(biāo)跟蹤算法,使用顏色屬性擴(kuò)展CSK跟蹤器。將原來的RGB3通道圖形轉(zhuǎn)換為11個(gè)通道的CN空間。單獨(dú)處理每個(gè)單通道后,將單通道處理的結(jié)果進(jìn)行融合。然而,由于多通道的計(jì)算量較復(fù)雜,提出了PCA降維方法用于處理。主要是從11個(gè)通道中選擇兩個(gè)重要通道進(jìn)行處理,提高跟蹤精度。
但是,上述方法并不能很好地解決目標(biāo)嚴(yán)重受遮擋的問題。本文在KCF算法的基礎(chǔ)上,提出了改進(jìn)的目標(biāo)跟蹤算法。先進(jìn)行遮擋判斷,其次利用URTS的EM算法對遮擋現(xiàn)象進(jìn)行處理。在OTB100上對視頻序列進(jìn)行跟蹤測試。
KCF算法通過循環(huán)矩陣在目標(biāo)區(qū)域采集大量的正負(fù)樣本,以此用來訓(xùn)練分類器。假設(shè)n×1的向量為正樣本集x,通過置換矩陣對正樣本集x執(zhí)行循環(huán)移位訓(xùn)練操作,將得到操作后的分類器訓(xùn)練樣本集合用{pix|x=0,1,…,n-1}表示,對所有正樣本x執(zhí)行n次循環(huán)訓(xùn)練后,得到n個(gè)樣本:x0=x,x1=[x1,xn,…,x2],…,xn-1=[xn,xn-1,…,x1],對每個(gè)樣本xi,賦予服從高斯分布的標(biāo)簽yi。KCF先對訓(xùn)練樣本xi和被賦予的標(biāo)簽yi使用嶺回歸方法進(jìn)行訓(xùn)練,再從訓(xùn)練的結(jié)果中找到滿足樣本xi和標(biāo)簽yi的最小平方誤差函數(shù)f(z)=ωTz,使得式(1)最小
(1)
式中λ為控制過擬合的正則化參數(shù),ω為分類器參數(shù)。
根據(jù)文獻(xiàn)[12]可知,分類器參數(shù)ω與訓(xùn)練樣本對應(yīng)到高維特征空間的函數(shù)φ(xi)有關(guān),任意兩個(gè)樣本x*和x在高維特征空間的相關(guān)性或相似度可用核函數(shù)φT(x)φ(x*)=k(x,x*)表示
(2)
所有樣本對的點(diǎn)乘kij構(gòu)成了n×n的核矩陣K,且K為酉不變函數(shù),利用核矩陣K的循環(huán)特性和傅里葉變化技巧可得嶺回歸閉式解為
(3)
核矩陣K的第一行元素是kxx。
針對KCF在遮擋因素下存在目標(biāo)出現(xiàn)漂移或跟蹤失敗的問題,本文在KCF算法中添加了遮擋判定,將檢測坐標(biāo)(xdk,ydk)與預(yù)測坐標(biāo)(xfk,yfl)的歐氏距離Δa作為遮擋率,表達(dá)式為
(4)
當(dāng)Δa的值相對較小時(shí),表明預(yù)測結(jié)果和檢測結(jié)果是一致的。取上一幀和當(dāng)前幀峰值旁瓣比的均值作為判定目標(biāo)是否發(fā)生遮擋的閾值δ,當(dāng)Δa<δ時(shí),使用原KCF算法對目標(biāo)進(jìn)行跟蹤;當(dāng)Δa>δ時(shí),表明預(yù)測結(jié)果和檢測結(jié)果相差較大,判定目標(biāo)發(fā)生嚴(yán)重遮擋。在目標(biāo)未發(fā)生遮擋之前,通過循環(huán)矩陣訓(xùn)練構(gòu)造分類器,求出候選區(qū)域成為跟蹤目標(biāo)的響應(yīng)值f(z);在發(fā)生遮擋時(shí),采用改進(jìn)URTS-EM算法對目標(biāo)進(jìn)行跟蹤和預(yù)測。
目標(biāo)直方圖模型可近似為對應(yīng)圖像區(qū)域中的特征分布的概率密度函數(shù)。定義當(dāng)前幀的狀態(tài)序列為XN={x1,x2,…,xN},下一幀的量測序列為YN={y1,y2,…,yN},則完備數(shù)據(jù)的對數(shù)似然函數(shù)在EM的框架中為Lσ(XN,YN)。
給定第r次迭代的估計(jì)參數(shù)值σr,對數(shù)似然函數(shù)的條件期望表示如下
Q(σ,σr)Eσr{Lσ(XN,YN)│YN}=
(5)
URTS平滑器通過確定性采樣來近似后驗(yàn)概率密度。
1)狀態(tài)估計(jì)
對xk和xk+1的聯(lián)合概率密度函數(shù)以及xk平滑后驗(yàn)分布進(jìn)行確定性采樣。根據(jù)貝葉斯定律得到xk及xk+1的聯(lián)合分布
p(xk,xk+1│Yk)=p(xk+1|xk)p(xk|Yk)
(6)
2)目標(biāo)預(yù)測
尋找σr+1,更新上一次迭代的參數(shù),直到收斂到局部最優(yōu)解,即目標(biāo)位置
σr+1=arg maxQ(σ,σr)
(7)
通過核相關(guān)濾波器在預(yù)測得到的目標(biāo)位置中找到最大響應(yīng)值的目標(biāo)圖像區(qū)域,在該目標(biāo)圖像區(qū)域的周圍建立學(xué)習(xí)模型,再提取模型特征并進(jìn)行核技巧處理,則濾波器的訓(xùn)練式為
(8)
(9)
式中β為學(xué)習(xí)因子,根據(jù)式(1)可計(jì)算出脊回歸閉和解為
(10)
ω即為下一幀圖像的目標(biāo)。
將本文改進(jìn)的KCF算法在OTB100上與其他跟蹤算法進(jìn)行性能比較,其對比的跟蹤算法有8種,分別是CT,TLD,CSK,Struck,MTT,OAB,L1APG,KCF。選取OTB100上3組受遮擋的序列視頻進(jìn)行測試,以驗(yàn)證算法的有效性,為了更容易的直觀分析比較跟蹤結(jié)果,本文從測試庫中選取3段視頻序列,分別是Suv,CarScale,David3。圖1~圖3為實(shí)驗(yàn)跟蹤結(jié)果。
圖1 Suv測試結(jié)果
根據(jù)圖1的Suv視頻序列中可以發(fā)現(xiàn),#0528幀出現(xiàn)稍微遮擋時(shí),TLD跟蹤算法出現(xiàn)了漂移現(xiàn)象,其原因是該算法只選取了灰度特征,導(dǎo)致外觀描述不全,然而KCF算法選取了多通道的HOG特征來增強(qiáng)分類器對檢測目標(biāo)的外觀描述能力,并且可以持續(xù)有效地跟蹤。#516幀出現(xiàn)嚴(yán)重遮擋時(shí),KCF跟蹤算法出現(xiàn)了漂移現(xiàn)象,其原因是該算法對目標(biāo)解釋時(shí)未利用上下文的空間信息。然而,本文提出的算法在目標(biāo)開始出現(xiàn)遮擋時(shí)對其進(jìn)行判定,當(dāng)目標(biāo)被嚴(yán)重遮擋時(shí)通過融合的URTS的EM算法進(jìn)行跟蹤,取得了良好的跟蹤效果。圖2,圖3為CarScale,David3視頻序列的測試結(jié)果。實(shí)驗(yàn)結(jié)果驗(yàn)證算法的有效性。
圖2 CarScale測試結(jié)果
圖3 David3測試結(jié)果
最后對OTB100數(shù)據(jù)集的視頻序列進(jìn)行測試。本文采用精確度和成功率2種評估方法對跟蹤算法進(jìn)行分析。從圖4(a)中可以看出,本文算法在精確度上比原KCF算法提高了0.133;從圖4(b)中可以看出,本文在成功率上比原KCF算法提高了0.177。因此本文算法比原KCF算法具有較好的跟蹤效果。
圖4 測試結(jié)果
本文針對KCF存在的缺陷,提出了一種改進(jìn)的算法。首先判定目標(biāo)是否出現(xiàn)了遮擋現(xiàn)象,若判定目標(biāo)被遮擋,則采用基于URTS的EM算法進(jìn)行目標(biāo)位置預(yù)測并利用核相關(guān)濾波器進(jìn)行跟蹤。實(shí)驗(yàn)結(jié)果表明:本文算法在處理嚴(yán)重遮擋時(shí)有良好的跟蹤效果,同時(shí)驗(yàn)證了算法的有效性。