房正華 楊新艷 李 蒙
(青島工學院信息工程學院 山東 266300)
運動物體實時識別跟蹤技術的研究一直是電子信息領域的一大熱點,并在各種工程應用領域發(fā)揮了及其重要的作用,涉及圖像識別、模式匹配、實時跟蹤算法等多種技術領域。目前,該技術在識別精度、跟蹤效率、復雜環(huán)境適應性等多方面都有了長足的進步,這也為其在各個領域的行業(yè)應用打下了良好的基礎,包括區(qū)域智能監(jiān)控,日常生活中基于身份識別的個性化服務,視頻圖像處理中的視頻去模糊、視頻去抖等。
當前的運動物體識別跟蹤技術主要有以下幾種類型。
(1)基于對目標物體特征識別,諸如人臉識別中人臉的對稱性,雙目的對稱性,外圍輪廓等都是人臉這個物體的特征,以這些特征作為在視頻、圖像中抓取人員圖像的基礎。人員監(jiān)控、基于視頻的公交車人數(shù)統(tǒng)計等應用主要就是采用這種方式。其可以實現(xiàn)對一類物體(比如人員,車牌)的識別,而并不關注與其特定的身份。
(2)基于模型匹配,對于被識別或被監(jiān)控人員或物體,預先在系統(tǒng)之上生成對應的模型,形成模型庫。在該人員(物體)進入監(jiān)控區(qū)域后,系統(tǒng)通過將圖像實時與模型庫中的模型對照,從而實現(xiàn)對某一個人員準確識別。
以上兩種傳統(tǒng)的物體識別算法,面對實際應用中的復雜情景,會面臨諸多挑戰(zhàn)。
①目標特性描述存在局限性,在物體特征復雜或處于復雜背景情況下,對其識別率造成影響。
②目標特性靜態(tài)描述,無法對運動中或產生形變的物體持續(xù)跟蹤。當同一物體展現(xiàn)不同的觀測角度或產生形變時,造成目標特性描述無效。
③傳統(tǒng)模型通常采用“離線訓練物體模型”,其被識別物體的最新特征不能自動反饋至模型,造成物體及人員的靜態(tài)模型應對物體形變,角度變化時存在局限性。
運動物體跟蹤算法主要有“減背景法”、“幀差法”、“光流法”等。其中LK光流算法為目前能較準確地檢測運動目標的算法。而在實際應用中,該算法在視頻圖像不穩(wěn)定、模糊的情況下存在錯誤預測點群,造成跟蹤效果不穩(wěn)定。
運動物體識別跟蹤技術所存在的這些問題,使其在實際應用中所面對適應性不好、魯棒性差、環(huán)境要求苛刻等諸多問題,影響其產品轉化能力及行業(yè)應用效果。該文針對目前運動物體識別跟蹤技術所存在的問題,提出了以具有實時在線更新特性的“物體多維度模型”為基礎,以四相位交叉約束的“無監(jiān)督自學習分類器”作為物體模型自更新的驅動,并結合“基于位置正負置信區(qū)域約束的跟蹤定位算法”,最終實現(xiàn)一個新穎的多運動物體實時識別跟蹤技術體系。相對于傳統(tǒng)算法,該系統(tǒng)最大的優(yōu)勢是其可以精準地實現(xiàn)對生活中普遍存在的可形變物體(如筆記本電腦的開合狀態(tài)、人臉的正側面等)的識別與跟蹤。在LK光流算法的基礎上創(chuàng)新性的添加了物體位置正負置信區(qū)(前景,背景)。
本文提出的是一種面向視頻中物體特征復雜、背景情況復雜、可形變物體的物體實時識別跟蹤技術,并基于此算法在嵌入式平臺上實現(xiàn)身份識別與網(wǎng)絡電視重點個性化推薦系統(tǒng)。算法研究方面包括“無監(jiān)督自學習分類器”、“實時更新的物體多維模型”、“基于位置正負置信區(qū)域約束的跟蹤定位算法”構成,圖1描述了整個系統(tǒng)組成。
圖1 系統(tǒng)組成
其運作方式如下:
(1)通過給定被監(jiān)控物體的初始形態(tài),“跟蹤定位算法”對視頻中的物體識別跟蹤。
(2)同時“自學習分類器”對當前最新的物體形態(tài)進行分類學習。
(3)基于分類器最新的分類及識別結果更新物體多維模型,該多維模型包括時間軸、特征點群描述、出現(xiàn)位置、正置信區(qū)、運動描述等內容。
(4)更新的物體多維模型用于進一步的識別與跟蹤。
系統(tǒng)中的三個模塊互相作用與約束,構成一個交互式自校驗更新子系統(tǒng),并對上述三個模塊之間進行交互校驗,互為添加的迭代約束條件,進而提高模型優(yōu)化水平與定位精度。
基于該算法,實現(xiàn)實時身份驗證,并構建網(wǎng)絡電視終端的個性化智能推薦系統(tǒng)。該基于身份認證的智能推薦系統(tǒng)是上述算法的驗證與實現(xiàn),系統(tǒng)主要模塊如下:
(1)視頻采集:通過微型攝像頭捕捉用戶的影像,傳輸給跟蹤識別子系統(tǒng)。
(2)人臉跟蹤:實現(xiàn)“基于位置正負置信區(qū)域約束的光流特征點群跟蹤算法”。
(3)物體模型:用于存儲和描述物體多維模型,并作為物體識別的依據(jù)。
(4)無監(jiān)督機器學習:實現(xiàn)“四相位交叉約束自學習訓練算法”,并實時更新物體模型。
(5)物體識別:基于實時更新的物體多維模型,完成對視頻中物體的識別。
(6)信息推送:根據(jù)識別的結果,推送合適的節(jié)目及信息。
(7)通信:同網(wǎng)絡電視終端后臺通信,獲得針對不同人群的節(jié)目與消息信息。
本文提出的運動物體識別跟蹤算法是對LK光流算法的改進,首次將物體位置正負置信區(qū)域約束應用到傳統(tǒng)的LK光流算法,大幅降低了原算法中錯誤預測點群前后幀匹配相似值,提高了算法在視頻模糊、前后幀匹配較差等問題上的適應性與魯棒性。
[1]楊國亮.一種改進的光流算法[J].計算機工程,2006,32(15):187-189.
[2]儲珺.基于光流的動態(tài)背景運動目標檢測算法[J].南昌航空大學學報自然科學版.2011,25(3):1-6.
[3]施家.動態(tài)場景中運動目標檢測與跟蹤[J].北京理工大學學報自然科學版,2009,29(10):858-860.
[4]張娟.運動目標跟蹤算法研究綜述[J].計算機應用研究,2009,26(12):4407-4410.