淡珊
摘 要 隨著人們維護(hù)社會治安和公共安全的意識逐漸增強(qiáng),各類公共設(shè)施中的視頻監(jiān)控系統(tǒng)也漸趨普及。隨著計算機(jī)視覺的發(fā)展,多攝像機(jī)視角下的目標(biāo)跟蹤逐漸受到重視。在多相機(jī)跟蹤中,需要在不同相機(jī)視角之間確立對應(yīng)關(guān)系。本文采用單應(yīng)性矩陣獲取目標(biāo)在地平面的投影,并將多相機(jī)視角的投影信息融合以獲取目標(biāo)足部區(qū)域的定位。
關(guān)鍵詞 單應(yīng)性約束 視角信息融合 協(xié)同追蹤
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A
計算機(jī)視覺是一門融合了多方面知識的學(xué)科,而視頻跟蹤是計算機(jī)視覺領(lǐng)域一項重要的課題。視頻跟蹤技術(shù)是通過模仿人類生理視覺系統(tǒng)對運(yùn)動的感知功能,使機(jī)器能夠辨識場景中目標(biāo)的運(yùn)動,并區(qū)分出不同的運(yùn)動目標(biāo)。視頻跟蹤通過對視頻序列中感興趣目標(biāo)進(jìn)行檢測、提取、識別和跟蹤,獲取目標(biāo)的運(yùn)動參數(shù)及其軌跡,進(jìn)而分析目標(biāo)的行為。隨著視頻跟蹤技術(shù)的快速發(fā)展和公共安全意識的日趨增強(qiáng),由攝像機(jī)網(wǎng)絡(luò)構(gòu)成的視頻監(jiān)控系統(tǒng)由于其更加智能化,對于維護(hù)社會穩(wěn)定起到的促進(jìn)作用逐漸變得舉足輕重。因此,智能化的視頻監(jiān)控系統(tǒng)漸漸取代了傳統(tǒng)的視頻監(jiān)控,對監(jiān)控視頻中圖像幀自動化處理方面的研究也逐漸受到重視。多視角協(xié)同追蹤技術(shù)的數(shù)學(xué)理論基礎(chǔ)就是單應(yīng)性矩陣。單應(yīng)性矩陣是攝像機(jī)的視角平面與的檢測目標(biāo)平面的對應(yīng)映射矩陣。由于兩個平面的相交部分為一條直線,所以每個攝像機(jī)對應(yīng)的單應(yīng)性矩陣為可逆矩陣。用數(shù)學(xué)模型解釋就是:在三維空間中,攝像機(jī)的視角平面可以由兩條三維向量線性表出,檢測目標(biāo)平面同樣可以由兩條三維向量線性表出。若該四個向量秩為3(或者滿秩),則存在一個三階映射矩陣使得兩個平面上的點(diǎn)一一對應(yīng),即在視角平面上的任意一個點(diǎn)通過該矩陣轉(zhuǎn)換,在目標(biāo)檢測平面上找到一個點(diǎn)且只有一個點(diǎn)與之對應(yīng)。因此該三階矩陣必然是可逆矩陣。滿足這些條件的矩陣被稱為該視角平面到目標(biāo)檢測平面的單應(yīng)性矩陣。兩個平面上各點(diǎn)一一映射的關(guān)系叫做單應(yīng)性約束。
當(dāng)目標(biāo)進(jìn)入攝像機(jī)檢測范圍時,將攝像頭焦點(diǎn)同攝像機(jī)平面的中心相連,形成的射線穿過參考平面,同參考平面相交于一點(diǎn),該點(diǎn)被稱作穿刺點(diǎn)。由單應(yīng)性矩陣的定義可知:目標(biāo)檢測平面上的任意一點(diǎn)都可以通過單應(yīng)性矩陣的逆矩陣映射到視角平面上?;谶@個理論,在一個有著多個視角平面的檢測系統(tǒng)里,只要某一視角檢測到的目標(biāo)并求得該目標(biāo)在檢測平面上的穿測點(diǎn),那么就可以在其他視角平面上確定這個目標(biāo)的位置。因此在檢測系統(tǒng)中只要有一個視角或者多個視角檢測到目標(biāo)的存在,通過各個視角信息的疊加融合其它視角就可以共享目標(biāo)位置信息。這樣就可以提高目標(biāo)檢測的準(zhǔn)確性進(jìn)而實(shí)現(xiàn)實(shí)時追蹤。
在實(shí)際生活中的視頻監(jiān)控環(huán)境十分復(fù)雜,存在著大量的影響因素,比如:光照,天氣,目標(biāo)姿態(tài)的不確定性以及不同環(huán)境下攝像機(jī)的參數(shù)存在不可控變化等等,這些因素均會對跟蹤結(jié)果產(chǎn)生影響。在現(xiàn)實(shí)應(yīng)用中,由于人們行走時腳會接觸到地面,一般會把平整的地面作為目標(biāo)檢測平面。攝像機(jī)作為常見的視覺信息采集設(shè)備一般是固定不動的,所以每個攝像機(jī)的與地面的單應(yīng)性矩陣也是固定不變的。目前制約單應(yīng)性約束協(xié)同追蹤算法性能的問題主要在目標(biāo)背景提取以及目標(biāo)追蹤上。圖像背景提取的方法主要是基于統(tǒng)計理論。驗(yàn)假設(shè)實(shí)驗(yàn)場景的光照等外部不發(fā)生變化的條件下,由于攝像機(jī)角度與位置是固定不變的,同一臺攝像機(jī)獲取到的視覺信息中有許多是不變的或者說只發(fā)生了細(xì)微的變化,這些差異反應(yīng)到像素值上可能就是個位數(shù)的差別。常見的背景提取算法有統(tǒng)計中值法、均值法。統(tǒng)計中值法:設(shè)備獲取到一系列的視覺信息按等步長時間差抽取圖像幀,同時把RGB轉(zhuǎn)成灰度圖像。把同一個像素點(diǎn)上的灰度值構(gòu)成一個時間序列。然后把該時間序列數(shù)值按大小排序,取其中值為該像素點(diǎn)的背景像素值。和統(tǒng)計中值法一樣,統(tǒng)計均值法也需要提取時間序列。但是對時間序列處理的方法不一樣,統(tǒng)計均值把為序列值的均值作為背景像素值。但現(xiàn)實(shí)生活中,檢測場景的光照亮度是會隨時間發(fā)生變化的,如果背景不變就會對檢測造成嚴(yán)重影響。多部攝像機(jī)的協(xié)同跟蹤,大部分算法適用于目標(biāo)步子正常、雙腳不同時觸地的理想情況。當(dāng)目標(biāo)步子過大或者雙腳同時觸地,會導(dǎo)致跟蹤結(jié)果出現(xiàn)偏差,給目標(biāo)的確認(rèn)帶來一定的困難。常見的目標(biāo)追蹤算法都不能夠很好的解決這類問題。
在外部環(huán)境光照不穩(wěn)定的檢測系統(tǒng)中,可以通過實(shí)時更新視覺背景來解決這類問題。實(shí)時背景更新就是根據(jù)設(shè)備采集的視覺信息及時提取新的視覺背景。提取背景的方法還是應(yīng)用上文提到的兩種統(tǒng)計算法。如果實(shí)施背景更新時間要求比較高,需要在短時間內(nèi)實(shí)現(xiàn)背景更新,選擇統(tǒng)計中值法比較合理。如果檢測場景中目標(biāo)數(shù)量多,可以把長時間段里的視覺信息取均值來更新背景圖像。所以對于變化的外部環(huán)境,視覺背景圖像需要實(shí)時更新,而更新的算法要根據(jù)場景的實(shí)際情況決定。對于目標(biāo)追蹤的問題,可以基于目標(biāo)所占位置的時空一致性原理,采用最短路徑優(yōu)化算法對目標(biāo)的定位信息進(jìn)行處理。即:在通常情況下,相鄰的兩幀圖像中目標(biāo)的運(yùn)動距離是非常有限的,因而在前后兩個時刻,可以取兩幀圖像間距離相距最短的兩個定位區(qū)域作為匹配區(qū)域。同時通過比較相鄰圖像幀單應(yīng)性逆映射圖像的灰度直方圖的相似性,進(jìn)一步提高目標(biāo)匹配的準(zhǔn)確性,實(shí)現(xiàn)目標(biāo)追蹤。以上方法只能適應(yīng)于個別環(huán)境不穩(wěn)定的檢測系統(tǒng)。而現(xiàn)實(shí)生活環(huán)境極其復(fù)雜,需要人們不斷提出新的算法和策略來提高協(xié)同追蹤的性能。