摘要:合理地處理視頻信息,并從中得到有用的信息,已經(jīng)成為了目前研究的一個熱點。對于視頻信息中運動目標的分析一般從運動目標檢測和運動目標跟蹤兩方面進行。本文分別對這這兩方面的現(xiàn)有的算法和問題進行了深入探討,比較了相關(guān)方法的優(yōu)缺點。在最后的部分,討論了運動目標分析技術(shù)發(fā)展的趨勢。
關(guān)鍵詞:圖像處理;計算機視覺;運動目標檢測;運動目標跟蹤
中圖分類號:TP391 文獻標識碼:A 文章編號:1007-9599 (2012) 24-0036-03
1 引言
近年來,視頻監(jiān)控系統(tǒng)被廣泛地應(yīng)用在日常生活的各個領(lǐng)域。在很多情況下,大量視頻僅在危險發(fā)生后才會被調(diào)用以審查其內(nèi)容,這種做法會導致大量的視頻信息浪費。正是在這種情況下,對視頻信息的進行智能分析成為了一個重要的研究熱點;尤其是在無人操作的情況下,自動通過對所采集到的視頻內(nèi)的運動目標的行為作分析,從而采取預(yù)警、報警等相關(guān)反應(yīng)。對運動目標的行為分析一般都是由運動目標檢測、運動目標跟蹤、目標分類、行為理解與描述、多攝像機數(shù)據(jù)融合等多個方面組成。目前,基于視頻信息的運動目標行為分析中最基礎(chǔ)的兩個問題就是是運動目標檢測和運動目標跟蹤。雖然有關(guān)學者做了較多的研究工作,但由于目標所處場景的復(fù)雜性,以及目標本身可能發(fā)生的姿態(tài)變換、缺損、模糊和遮擋,及視頻受天氣,光照、陰影等自然條件和人為干擾的影響,使得目標檢測和跟蹤技術(shù)仍是一個相當困難、有待深入研究的課題。
2 運動目標檢測方法
對于基于視頻信息的分析技術(shù)來說,準確高效的從大量視頻信息中提取出有效的運動目標,是進行可靠分析的重要基礎(chǔ)。目標檢測就是在序列圖像中將變化的區(qū)域從背景區(qū)域中區(qū)分出來的過程。在這個過程中存在許多干擾因素,例如:背景擾動,光照條件的變化,背景的選取和陰影的影響等等。為了解決這些干擾,不同的學者提出了各自不同的方法。其中最常見的方法有:光流法,背景減除法和幀間差分法。
2.1 光流法
光流法的基本原理是對于圖像中的每個像素點都賦予一個速度矢量,使之形成了一個圖像運動場。在運動的每個特定時刻,圖形上的點與三位物體上的點一一對應(yīng),這種對應(yīng)關(guān)系可由投影關(guān)系得到,根據(jù)各個像素的速度矢量特征,可以對圖像進行動態(tài)分析。
光流法的不僅能夠在不知道場景的條件下檢測出獨立的運動目標,還能適用于動態(tài)背景,但由于其計算量大、易受噪聲影響等缺點,所以學者們對光流法的改進也在不斷進行中。張澤旭等[1]將canny算法和光流法結(jié)合起來,利用圖像分割和canny算法得到目標區(qū)域的邊緣圖,再使用光流場中的流速值完成分割圖和邊緣圖的融合,從而得到完整的運動目標;施家棟等[2]將光流法和膚色融合方法結(jié)合起來用于人體運動檢測,通過對視頻圖像序列進行光流分析,以確定目標的運動區(qū)域,與此同時,基于馬氏距離檢測出膚色區(qū)域,然后將光流分析和膚色區(qū)域所得到的信息進行數(shù)據(jù)融合,從而達到分割出人體的運動區(qū)域的目的。
2.2 背景減除法
背景減除法是目前在運動目標檢測中使用最廣泛的算法,其基本思想是利用背景的參數(shù)模型來近似背景圖像的像素值,將當前幀與背景圖像進行差分比較實現(xiàn)對運動區(qū)域的檢測,區(qū)別較大的像素區(qū)域被認為是運動區(qū)域,反之則被認為是背景區(qū)域。背景減除法的實現(xiàn)必須要有背景圖像,由于背景圖像是隨著光照或外部環(huán)境的變化而實時變化的,因此背景減除法的核心是對背景建模以及實時更新。研究人員已提出了多種背景建模算法,Bohyung Han等[3]提出的一種基于密度的多特征背景減除方法,通過使用支持向量機的方法對每個像素的顏色、梯度、Haar-like特征的特征值進行融合從而實現(xiàn)對它時間空間的處理。通過這種方式和有效的核密度估計來產(chǎn)生背景模型,從而實現(xiàn)對目標物體的檢測。而在國內(nèi),劉丁等人[4]提出用PIC算法對背景進行重構(gòu),從而達到目標檢測的目的。根據(jù)圖像序列中出現(xiàn)頻率最高的像素均值為背景點的思想,對像素灰度歸類算法進行改進,將所選取的用于重構(gòu)背景的序列圖像像素值進行歸一化、量化統(tǒng)計、量化范圍等拓展,從而重構(gòu)背景圖像,從而實現(xiàn)對運動目標的檢測。
2.3 幀間差分法
幀間差分法是一種通過對視頻圖像序列中相鄰兩幀或多幀作差分運算來獲得運動目標輪廓的方法。當監(jiān)控場景中出現(xiàn)物體運動時,連續(xù)幀之間會出現(xiàn)較為明顯的變化,各幀相減,得到圖像亮度差的絕對值,判斷它是否大于閾值來分析視頻或圖像序列的運動特性,以確定是否有物體運動。該方法可以很好地適用于存在多個運動目標和攝像機移動的情況。
此外,由于其算法實現(xiàn)簡單,復(fù)雜度低;對光線等場景變化不太敏感,能夠適應(yīng)各種動態(tài)環(huán)境的優(yōu)點,幀間差分法也被廣泛應(yīng)用于科學研究和實際應(yīng)用中。例如Zhan Chaohui等[5]將邊緣檢測和幀間差分法結(jié)合起來。新算法先對連續(xù)圖像做邊緣檢測,從而得到相鄰兩幀邊緣化后的差,再得到的圖像分成幾個小塊,確定小塊所屬區(qū)域,在根據(jù)塊連接組件的原理,標記得到的包含運動目標最小矩形以完成檢測。而在智能交通系統(tǒng)的實際應(yīng)用中,Li,Qiu-Lin等[6]將三幀差分和二維交叉熵閾值分割法結(jié)合起來,用于移動車輛的檢測。他們通過三幀差分法從序列圖像中檢測到移動目標,再通過二維交叉熵閾值分割的方法進行處理,從而提取出完整的移動車輛的圖像。
在實際生活中,上述三種常用算法經(jīng)常被結(jié)合起來使用。例如孫承志等[7]將背景差分法和光流法結(jié)合起來,用背景差分法對圖像進行預(yù)處理之后使用光流法對預(yù)處理的結(jié)果進行計算。改進后的算法在繼承之前兩者的優(yōu)勢的同時,可以更有效的提高運動目標跟蹤的實時性,同時具有更好的系統(tǒng)穩(wěn)定性。
在上述所說的方法之外,近年來,隨著人工智能算法的快速發(fā)展,我們可以看到在目標檢測領(lǐng)域,出現(xiàn)了更多與智能算法相結(jié)合的新型方法。例如丁瑩等[8]就提出了一種基于Choquet模糊積分的運動目標檢測算法。該方法將模糊測度和模糊積分理論應(yīng)用于運動目標與背景分類中,提出了自適應(yīng)閾值的Choquet積分算法,實現(xiàn)了圖像的顏色特征和紋理特征相融合;選擇YCbCr顏色空間代替?zhèn)鹘y(tǒng)RGB空間,將圖像亮度與色度分離,降低了光照變化對運動檢測的影響;利用局部二元模式紋理特征對亮度級的單調(diào)變化具有不變性的特點,將其融合到檢測算法中,有效抑制了陰影的干擾.而和硬件的結(jié)合也是一種實現(xiàn)運動目標檢測的方法,上海交大的Rongxing Duan等[9]在基于 TMS320DM643(DM643)芯片的基礎(chǔ)上開發(fā)了一個用于目標檢測的嵌入式系統(tǒng)。將一種基于改進的高斯混合模型的檢測算法集成到DSP芯片上。
3 運動目標跟蹤
對得到的目標進行跟蹤觀察是進行行為分析的必要條件。運動目標跟蹤就是利用目標特征與在序列圖像中檢測出的區(qū)域進行匹配,得到目標在每一幀的位置和姿態(tài)。對運動目標跟蹤算法的研究主要為了提高對運動目標的搜索速度和提高目標匹配的準確性。根據(jù)跟蹤方法的不同,大致可分為基于Mean Shift的目標跟蹤方法、基于粒子濾波理論的目標跟蹤方法和基于偏微分方程的目標跟蹤方法。各種跟蹤方法在實時性,魯棒性,目標匹配精度和目標分割準確性方面各有側(cè)重,相互制約。
3.1 基于Mean Shift的目標跟蹤方法
Mean Shift算法是一個迭代的過程,它先算出當前點的偏移均值,移動該點到其偏移均值,然后以此為新的起始點,繼續(xù)移動,直到滿足一定的條件結(jié)束。Jifeng Ning 等[10]為了減少Mean Shift中目標定位的背景干擾,提出了一種改進的背景加權(quán)直方圖算法,這個方法只改變目標權(quán)重而不改變目標補償權(quán)重,從而達到減少MeanShift定位跟蹤是受到的由背景產(chǎn)生的干擾的目的。Gary R.Bradski等[11]為了知道視頻幀中顏色分布的模式,使用修改過的MeanShift算法來處理由視頻幀的顏色分布的動態(tài)變化,這個新算法就是CamShift算法。
與Meanshift主要是用在單幅圖像上不同,CamShift可用于序列圖像的分析。其具體步驟是首先在序列圖像中選擇一個區(qū)域,計算該區(qū)域內(nèi)顏色的2D概率分布,用MeanShift來收斂該區(qū)域,集中并標志此收斂的區(qū)域,一直重復(fù)直到滿足結(jié)束條件。與Mean Shift算法相比,Camshift 關(guān)鍵就在于當目標的大小發(fā)生改變的時候,此算法可以自適應(yīng)調(diào)整目標區(qū)域繼續(xù)跟蹤。
3.2 基于粒子濾波理論的目標跟蹤方法
粒子濾波的思想是基于蒙特卡洛方法產(chǎn)生的,利用粒子集來表示概率,可以用在任何形式的狀態(tài)空間模型上。其核心思想是通過從后驗概率中抽取的隨機狀態(tài)粒子來表達其分布,是一種順序重要性采樣法。為了準確表達后驗概率密度,粒子濾波器需要大量的粒子,對每一個粒子都需要進行觀測計算,這是由它的蒙特卡羅性質(zhì)決定的。在實際應(yīng)用中,因為計算觀測密度耗時多和環(huán)境的不同引發(fā)了許多問題,由此也產(chǎn)生了一些新的改進算法。例如陳龍等[12]為了解決多目標跟蹤中相似目標的發(fā)散問題和跟蹤核函數(shù)窗寬固定的缺陷,提出了一種基于FCM(fuzzy C-means)聚類的粒子濾波算法。該算法在經(jīng)典粒子濾波理論的基礎(chǔ)上,將粒子區(qū)域改變?yōu)榭勺儥E圓,在粒子濾波的重要性重采樣后,通過Mean-Shift算法獲得每個目標的聚類中心,使用FCM聚類算法完成粒子聚類,獲得相應(yīng)目標的粒子子群,最后通過粒子子群估計各目標的最終狀態(tài)并修正核窗口寬度。
而為了在復(fù)雜背景下跟蹤視頻序列中的多自由度的運動目標,王國良等[13]以粒子濾波理論為基礎(chǔ)提出了一種多自由度運動目標的跟蹤算法。他選取了均值漂移算法目標模型與候選模型的相似度作為觀測值的構(gòu)造基礎(chǔ);在核函數(shù)下的顏色直方圖的基礎(chǔ)上,對目標的中心位置和表征目標形狀的協(xié)方差矩陣進行更新,從而達到了自適應(yīng)地調(diào)整核函數(shù)帶寬的大小,修正跟蹤窗口的尺寸,實現(xiàn)對多自由度運動目標的跟蹤的目的。
3.3 基于偏微分方程的目標跟蹤方法
基于偏微分方程的目標跟蹤方法最早是Kass等提出的主動輪廓模型。他們將輪廓線優(yōu)化問題建模為關(guān)于曲線能量的泛函,用變分法推導出描述輪廓曲線進化的偏微分方程,通過求解偏微分方程得到的泛函極值,從而獲得目標的輪廓。
基于偏微分方程的目標跟蹤算法按照目標輪廓曲線的表達方式不同可分為參數(shù)化的輪廓線模型和幾何輪廓線模型,前者的優(yōu)點是收斂速度快,缺點是無法處理目標的分裂和合并及拓撲變化,而后者的優(yōu)缺點剛好相反。
為了解決傳統(tǒng)的基于主動輪廓線的方法存在著方法容易受噪音、部分遮擋、背景干擾等因素影響的缺點,周雪等[14]提出了一個基于水平集的分層的跟蹤框架,通過該框架將顏色信息和形狀先驗有效地結(jié)合起來。而蘇成順等[15]為了滿足多分段輪廓單獨進行或全部區(qū)段同時進行輪廓跟蹤的需求,提出了基于多線程的分段圖像輪廓跟蹤算法。以面向?qū)ο蟮挠^點,將輪廓跟蹤操作封裝成類。一段輪廓的跟蹤對應(yīng)一個線程和—介輪廓跟蹤類的對象?;诙嗑€程的分段圖像輪廓跟蹤算法很好地解決了圖像分段輪廓跟蹤的問題。
和目標檢測方法一樣,隨著環(huán)境的復(fù)雜性不斷增加,多種方法被結(jié)合起來以得到更好的實驗結(jié)果。董春利等[16]為了解決跟蹤中遇到的遮擋問題,將基于粒子濾波和GVF-Snake的結(jié)合起來,提出了一種新的的自適應(yīng)目標跟蹤算法。該算法利用改進的GVF-Snake算法,使Snake收斂至運動目標的真實輪廓;然后根據(jù)控制點的距離增刪控制點,達到自適應(yīng)地跟蹤運動和變形目標的目的;最后結(jié)合粒子濾波和改進的GVF-Snake,得到一種能量粒子濾波(EPF)目標跟蹤算法。而曹潔等[17]針對單一特征的目標跟蹤算法魯棒性較差的情況,使用目標的多種觀測信息通過D-S證據(jù)理論進行融合跟蹤。在粒子濾波的總體框架下,嵌入Mean-Shift算法產(chǎn)生更加逼近真實后驗分布的粒子,同時采用顏色和運動邊緣特征作為觀測模型,有效地避免了單一顏色特征在光照突變、姿態(tài)變化以及背景相似情況下的跟蹤穩(wěn)定性較差的問題。
4 結(jié)論
目前,對基于視頻信息的運動目標的分析研究已取得許多可喜的進展,應(yīng)用范圍也隨之得到擴展,但還是存在許多有待解決的問題,例如光照的改變,陰影的影響,快速運動的目標會導致系統(tǒng)不能準確進行分析;目前還不能提出一種有效的萬能方法以應(yīng)對各種不同的外界環(huán)境。此外很多算法的實現(xiàn)還都只是停留在實驗室階段,離全面的應(yīng)用到實際的生活生產(chǎn)中去還存在一定距離。
盡管如此,我們還是能看到基于視頻信息的運動目標分析技術(shù)正在向著越來越成熟的方向邁進,現(xiàn)代計算機和并行計算技術(shù)的迅速發(fā)展又為許多目標檢測和跟蹤的發(fā)展和應(yīng)用提供了有力保障。
參考文獻:
[1]張澤旭,李金宗,李寧寧.基于光流場分割和Canny邊緣提取融合算法的運動目標檢測[J].電子學報,2003,31(9):1299-1302.
[2]施家棟,王建中.人體運動檢測的光流與膚色融合方法[J].北京理工大學學報,2009,(4):347-350.
[3]Bohyung Han,Larry S. Davis.Density-Based Multi-Feature Background Subtraction with Support Vector Machine[J]. IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGEN CE,2012,34(5):1017-1023.
[4]劉丁,楊延西,趙豆.改進PIC的背景重構(gòu)算法與運動目標檢測新方法[J]. 儀器儀表學報,2010,31(4): 885-891.
[5]Zhan Chaohui, Duan Xiaohui, Xu Shuoyu, Song Zheng, Luo Min.An Improved Moving Object Detection Algorithm Based on Frame Difference and Edge Detection[J]. Image and Graphics, 2007. ICIG 2007. Fourth International Conference on Beijing,2007:519-523.
[6]Li Qiu-Lin,He Jia-Feng.Vehicles Detection Based on Three-frame-difference Method and Cross-entropy Threshold Method[J].Jisuanji Gongcheng / Computer Engineering,2011,3 7(4): 172-174.
[7]孫承志,熊田忠,吉順平,張家海.基于差分的光流法在目標檢測跟蹤中的應(yīng)用[J].機床與液壓 ,2010,3 8(14):59-62.
[8]丁瑩, 李文輝,范靜濤,楊華民.基于Choquet模糊積分的運動目標檢測算法[J].電子學報,2010,38(2):263-268
[9]Rongxing Duan, Guochun Wan,Decun Dong, Huilin Zhou.Design and Implementation of Embedded Moving Objects Detection System[J].2009 Second International Conference on Intelligent Networks and Intelligent Systems,2009,12:405-408.
[10]Jifeng Ning,Lei Zhang1,David Zhang,Chengke Wu. Robust Mean Shift Tracking with Corrected Background-Weighted Histogram[J]. IET computer vision,2012,6(1):62-69.
[11]Gary R. Bradski. Vision Face Tracking For Use in a Perceptual User Interface[J]. Citeseer, 1998,2(2): Publisher: 12–21.
[12]陳龍,郭寶龍,孫偉.基于FCM聚類的粒子濾波多目標跟蹤算法[J].儀器儀表學報,2011,32(11): 2536-2542.
[13]王國良,劉金國.基于粒子濾波的多自由度運動目標跟蹤[J].光學精密工程,2011,19(4):864-869.
[14]周雪,胡衛(wèi)明.融合顏色和增量形狀先驗的目標輪廓跟蹤[J].自動化學報,2009,35(11):1394-1402.
[15]蘇成順,李貞培.基于多線程的分段圖像輪廓跟蹤算法[J].計算機技術(shù)與發(fā)展,2009,19(10):99-101.
[16]董春利,董育寧,劉杰.基于粒子濾波和GVF-Snake的目標跟蹤算法[J].儀器儀表學報,2009,30(4):828-833.
[17]曹潔,李偉.基于多特征融合的目標跟蹤算法[J].蘭