鄭 穎, 周 影
(淮北師范大學 計算機科學與技術學院,安徽 淮北 235000)
基于計算機視覺的運動目標跟蹤算法研究
鄭 穎, 周 影
(淮北師范大學 計算機科學與技術學院,安徽 淮北 235000)
隨著計算機技術的飛速發(fā)展,視頻圖像處理技術得到了顯著的提高.本文提出了一種基于計算機視覺的運動目標跟蹤方法.在Marr的計算理論框架下,我們引入通過自下而上的視覺跟蹤處理方法來進行運動目標跟蹤,本文以車輛視頻為例,選用Robert算子對車輛進行邊緣檢測,針對車輛在運動過程中大小和姿態(tài)變化的情況,提出了基于多關聯(lián)模板匹配方法進行跟蹤.實驗表明本文的算法分離的精度增強,跟蹤效果好,并且能很好地滿足實時性.
機器視覺;分割算法;跟蹤算法;分割的準確性
“智慧城市”是目前國內最前沿、最熱門的研究課題之一,而智能交通是構建智慧城市的關鍵因素.現(xiàn)在各地均遇到了交通擁堵問題,由于不斷增加的車輛和相對不足的公路通行能力,致使我國公路交通事故不斷增加、交通擁堵日益嚴重,因此智能交通系統(tǒng)已引起越來越多的重視.本文以道路交通視頻圖像序列為研究對象,對視頻跟蹤方法中的關鍵技術進行了深入的研究,有利于更好的開發(fā)智能交通系統(tǒng).
文獻[1]中針對運動目標跟蹤算法的應用,改進了LBP算子,經過對LBP的二進制位串的01跳變情況進行統(tǒng)計,合并了出現(xiàn)概率較低的模式,從而大大降低LBP紋理類型,使后續(xù)使用LBP紋理的運動目標檢測與跟蹤算法在特征匹配時速度得到提高.文獻[2]中改進的跟蹤算法是基于傳統(tǒng)的Kalman濾波和Mean-Shift優(yōu)化框架,算法融合了色度直方圖和梯度方向直方圖,以解決運動目標的旋轉和形變,構建了運動目標圖像區(qū)域的綜合直方圖金字塔,以實現(xiàn)多尺度的目標跟蹤,采用Kalman濾波預測耦合Mean-Shift算法,在尺度、位移空間內進行優(yōu)化匹配搜索,確定最佳候選目標區(qū)域的位置信息.文獻[3]提出了改進的Camshift算法,在HSV顏色空間采用背景加權三維直方圖建立目標模型,將輸入圖像轉化為顏色概率分布圖,然后根據目標的運動強弱自適應地結合顏色概率分布特征圖與目標的運動差分圖像,有效地克服了背景中的顏色干擾.文獻 [4]提出了基于Kalman濾波的Camshift跟蹤算法和基于SURF的Camshift跟蹤算法,當目標運動速度快時,在Camshift跟蹤的基礎上加入Kalman濾波,對目標的質心位置進行預測估計,當目標顏色與背景顏色相近時,引入SURF算法對前后兩幀的運動目標進行特征點匹配,重新確定目標位置,從而實現(xiàn)準確持續(xù)的跟蹤.
本文在Marr的計算理論框架下,在采用自底向上的視覺跟蹤的處理方法的基礎上,借鑒前人的一些研究.并以車輛視頻為例,針對車輛目標分割問題,通過Robert邊緣檢測算子得到車輛的邊緣特征.結合灰度車輛圖像的邊緣檢測,獲得最大類間方差,提高分割的準確性和實時性.在相對復雜的背景下,采用模板匹配的方法對車輛進行跟蹤研究,從而有利于更好的提取交通參數.
計算機視覺的理論框架影響著計算機視覺領域的發(fā)展,是計算機視覺領域的一個指導思想.Marr視覺理論是結合物理學、神經生理學和圖像處理總結的一種信息處理領域的觀點.在此理論框架下,視覺圖像的生成被分為三個階段:
(1)二維簡圖:初始簡圖用邊緣段、線、斑點和端點描述圖像中亮度的變化,然后利用虛擬線來完全而明確的表示幾何關系,最后得到描述層次可以覆蓋某一尺度范圍的初始簡圖.
(2)2.5維簡圖:通過對初始簡圖進行一系列處理運算,推導出一個能反映可見表面幾何特征的表象,其中包括表面朝向,觀察者距離,以及朝向和距離的不連續(xù)性,表面的反射情況,以及對主要照明情況的某種粗略的描述.
(3)三維模型:實現(xiàn)對觀察對象的三維結構在以物體為中心的坐標系中的表象和對物體表面性質進行一些描述,從而得到圖像的空間結構.
對于視覺跟蹤問題,主要有兩種思路.一種是自底向上的方法,另一種是自上而下的方法.本文采用自底向上的方法,結合視覺計算理論Marr視覺過程本文的方法可以劃分為三個階段:層視覺、中間層視覺和高層視覺.低層視覺到中間層視覺是圖像特征描述,中間層視覺到高層視覺是2.5維描述,高層視覺往上是3維描述.
自底向上的跟蹤過程顯然是獲得場景的位置,速度和加速度.因此,首先我們需要檢測運動目標,然后確定該目標是否為跟蹤目標.最后獲得目標位置、軌跡等信息.我們現(xiàn)在要以移動車輛作為跟蹤目標,在Marr的理論的幫助下視覺跟蹤框架很容易實現(xiàn).主要有以下三個階段:車輛的檢測屬于早期階段;目標的提取和識別,判斷是否跟蹤處于中間階段;獲取目標位置、軌跡等信息是后期階段.
圖像分割方法是計算機運動目標跟蹤中的重要方法.針對車輛跟蹤問題,利用Robert邊緣檢測算子檢測目標車輛的邊緣,大大提高了分割精度.此外,我們還提出了一種最大類間方差的車輛目標分割策略,實驗結果表明算法具有良好的分割效果.
Otsu方法是基于判別分析和最小二乘法原理提出的最大類間方差法,是一種閾值分割方法.在該方法中,將像素閾值分為兩部分,目標C0和背景C1,然后得到類間方差:
假設某一范圍的圖像灰度值為{0,1,…,l-1},像素ni的灰度級i,整個像素表示為灰度級i出現(xiàn)的概率為
選擇閾值t來區(qū)分目標和背景區(qū)域,C0={0,1,…,t};C1= {t+1,t+2,…,l-1};目標C0and背景C1可能出現(xiàn)的概率為
均值為
圖像的平均灰度級為:
通過公式(2)(3)和(4),計算類間方差為
接著,我們定義類內方差為
總方差定義為:
針對二階統(tǒng)計量OW2(t),并且OT2獨立于t,我們做了簡單的判斷
在這樣的準則下,兩種類型的t值都屬于最優(yōu)閾值,所以η(t)為最大準則.
在許多視覺跟蹤算法中,基本可分為兩類:一類是基于運動的算法,另一類是基于特定模型的算法.本文主要是基于模型的跟蹤方法,通過相互匹配實現(xiàn)跟蹤.模板匹配可以分為基于目標和目標區(qū)域的兩種類型.基于目標的是通過角、顏色等來匹配,在復雜環(huán)境下,其匹配效果優(yōu)于邊界匹配法.實際上,由于目標自身的運動,對于無法長期穩(wěn)定的固定目標模型,需要實時更新目標特征,以適應目標的變化.如果當前一幀的目標模型不能準確地描述當前的目標,這將導致錯誤的模型更新,為了解決這個問題,我們提出了一種基于多關聯(lián)模板的圖像匹配跟蹤算法,算法流程如圖1所示:
圖1 跟蹤算法流程圖
在目標跟蹤問題中,目標跟蹤信息由圖像相對于原始圖像的匹配來確定,實際上參與圖像匹配的模板與潛在匹配因子存在一定程度的差異.因此,在未知的圖像上檢測到的匹配對象是一個復雜的任務.模板T和潛在匹配對象p之間的關系如下所示:
其中,(x,y)∈T,(x',y')∈p,βij,αi是一個常量.結合相似性度量準則、平均絕對差分法和均方誤差法,得到了平均絕對誤差相似性測度:
其中,參考圖像f1(x,y)的大小為m×n,實時圖像f2(x,y)大小也為m×n,均方誤差相似性度量可以表示為
在公式(11)和(12)中,滿足D(x0,y0)的偏移量(x0,y0)稱為匹配點,但是當目標嚴重被照明影響,跟蹤效果將不是非常理想的.圖像的線性變化可以通過歸一化算法來跟蹤.歸一化算法的相似性度量可以表示為
為了驗證本算法的準確性,實驗選用PC機配置為Intel Core I5,2GB內存,并分別在兩段視頻下進行了實驗.跟蹤結果如圖4、5所示.
圖4 跟蹤實驗結果:紅車跟蹤效果
圖5 跟蹤實驗結果:白車跟蹤效果
從實驗對比可以看出Camshift方法對運動目標和背景顏色相差很大的跟蹤效果比較好,如果運動目標和背景顏色相似,其跟蹤就會失敗,甚至會造成目標丟失.本文所提出的車輛跟蹤方法相對于Kalman Filter方法省時,相對于Camshift方法有所費時.但整體來看本文的方法相對于兩種傳統(tǒng)的方法漂移誤差都比較小,跟蹤準確性好,耗時有所減少,跟蹤實時性有所增強.
在Marr的理論的幫助下,我們研究了基于計算機視覺的目標跟蹤算法,這大大有助于圖像處理技術的進步和對車輛的跟蹤問題的一種新的計算方法的建立.針對車輛目標分割問題,通過Robert邊緣檢測算子得到車輛的邊緣特征.結合灰度車輛圖像的邊緣檢測,獲得最大類間方差,提高分割的準確性和實時性.在相對復雜的背景下,采用模板匹配的方法對車輛進行跟蹤研究,從而有利于更好的提取交通參數.
〔1〕袁國武.智能視頻監(jiān)控中的運動目標檢測和跟蹤算法研究[D].云南大學,2012.
〔2〕劉雪.基于圖像序列的運動目標檢測與跟蹤算法研究[D].山東大學,2013.
〔3〕孟祥怡.運動目標的跟蹤與識別算法研究[D].吉林大學, 2014.
〔4〕G.Tian,R.M.Hu,and Z.Y.Wang,A method of shift Mean shift target tracking based on motion vector analysis.[J].Journal of Image and Graphics,2010,01:85-90.
〔5〕H.P.Yin,Y.Liang,J.J.Kuang,and X.Y.Yang,A method of moving object tracking based on multi feature adaptive fusion.[J].Photoelectron,Laser,2010,06:917-923.
〔6〕T.Gao,Z.G.Liu,and J.Liu,A method of multi moving target tracking based on traffic video sequences.[J].Journal of Central South University(natural science edition),2010,03:1028-1036.
〔7〕H.Y.Li,Z.Mao,J.J.Yuan,J.S.Qu,and Z.R.Wu,A method of moving target tracking based on algorithm fusion.[J].Foreign Electronic Measurement Technology,2013,12:36-40.
〔8〕Zampoglou M,Papadimitriou T,DiamantarasK I.Support Vector Machines Content-Based Video Retrieval based solely on Motion Information[A].2012 IEEE Workshop on Machine Learning for Signal Processing[C].2010.1551~2541.
〔9〕Amin M A,Hong Y.Sign Language Finger Alphabet Recognition from Gabor-PCA Representation of Hand Gestures[A].2007 International Conference on Machine Learning and Cybernetics[C].2009.2218~2223.
TP391.4
A
1673-260X(2017)02-0012-03
2016-11-19
安徽省高校自然科學研究一般項目《基于Hadoop大數據平臺的短時交通流預測方法研究》(KJ2017B014);淮北市2015科技攻關計劃項目《交通違章檢測系統(tǒng)的研究與開發(fā)》(2015005)