陳 超,楊克儉
(武漢理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,湖北 武漢 430063)
近年來(lái),隨著硬件設(shè)備成本大大降低,智能視頻監(jiān)控系統(tǒng)得到了日益廣泛的研究與應(yīng)用,智能視頻監(jiān)控技術(shù)也得到了越來(lái)越多科研工作者的關(guān)注。運(yùn)動(dòng)目標(biāo)檢測(cè)技術(shù)是智能視頻監(jiān)控技術(shù)中的核心部分,常用的運(yùn)動(dòng)目標(biāo)檢測(cè)方法有光流法、時(shí)間差分法和背景差分法。光流法[1]利用運(yùn)動(dòng)目標(biāo)隨時(shí)間變化的光流特性進(jìn)行運(yùn)動(dòng)檢測(cè),但其抗噪性能差,且計(jì)算相當(dāng)復(fù)雜 ,很難滿足視頻監(jiān)控系統(tǒng)實(shí)時(shí)性的要求。時(shí)間差分法又稱幀差法[2],它通過對(duì)相鄰幀對(duì)應(yīng)像素的差分來(lái)提取圖像中的運(yùn)動(dòng)區(qū)域,能夠很好地適應(yīng)光照的變化,對(duì)背景的變化也有很好的自適應(yīng)性。但用時(shí)間差分法提取出的運(yùn)動(dòng)區(qū)域往往會(huì)出現(xiàn)空洞現(xiàn)象,且對(duì)于運(yùn)動(dòng)緩慢的目標(biāo)很難檢測(cè)出來(lái)。背景差分法通過將輸入的每一視頻幀和通過訓(xùn)練得到的背景圖像進(jìn)行差分來(lái)檢測(cè)運(yùn)動(dòng)目標(biāo)??紤]到背景不可能完全固定,一個(gè)好的背景模型應(yīng)該能夠反映出背景隨時(shí)間的推移發(fā)生的變化。因此,背景差分法的關(guān)鍵不在于差分,而在于背景模型的建立與更新。常用的背景建模方法有單高斯模型法[3]和混合高斯模型法[4]。與混合高斯模型法相比,單高斯模型法的時(shí)間效率更高。在室內(nèi)以及背景較為穩(wěn)定的室外環(huán)境下,單高斯模型法可以很好地檢測(cè)出運(yùn)動(dòng)目標(biāo)。本文針對(duì)傳統(tǒng)的單高斯模型中的拖尾、鬼影問題,在背景的更新策略方面做了一些改進(jìn),有效地解決了這些問題。在更新率的選取方面也提出了一些自己的看法,使得高斯模型具有更好的穩(wěn)定性和收斂性。在陰影抑制方面,將基于色度畸變和一階梯度信息的陰影消除方法相結(jié)合,取得了較好的效果。
高斯模型法來(lái)源于高斯分布,其基本原理為:視頻圖像由于受到外界因素的影響,各個(gè)像素點(diǎn)的像素值隨時(shí)間的推移會(huì)有一些擾動(dòng),這個(gè)擾動(dòng)近似滿足高斯分布。當(dāng)有物體經(jīng)過時(shí),像素值的變化就會(huì)很大,物體經(jīng)過的地方像素點(diǎn)的像素值不服從高斯分布。利用某一時(shí)刻某像素點(diǎn)的像素值是否滿足高斯分布可以判斷該點(diǎn)是否為背景點(diǎn)。
單高斯分布背景模型適用于單模態(tài)背景情形,以下是利用單高斯分布背景模型進(jìn)行運(yùn)動(dòng)檢測(cè)的過程:首先,對(duì)一段時(shí)間內(nèi)的視頻序列圖像進(jìn)行訓(xùn)練,從而建立每個(gè)像素點(diǎn)的顏色分布初始高斯模型 η(x,μ0,σ0)。假設(shè)這段時(shí)間內(nèi)有0-(T-1)共T幀圖像,則有:
此后為每幀圖像的每個(gè)像素點(diǎn)建立高斯模型η(xt,μt,σt)。其中,下標(biāo) t表示幀序號(hào),xt為像素點(diǎn)的當(dāng)前像素值,μt為當(dāng)前像素點(diǎn)高斯模型的均值,σt為當(dāng)前像素點(diǎn)高斯模型的均反差。 若 η(xt,μt,σt)≤Tp(這里 Tp 為概率閾值),則該點(diǎn)被判定為前景點(diǎn),否則為背景點(diǎn)(這時(shí)又稱xt與 η(xt,μt,σt)相匹配)。 在實(shí)際應(yīng)用中,可以用等價(jià)的閾值替代概率閾值。記dt=|xt-μt|,在常見的一維情形中,則常根據(jù) dt/σt的取值設(shè)置前景檢測(cè)閾值:若 dt/σt>T(根據(jù)高斯分布的特性,T值在2到3之間,具體數(shù)值需經(jīng)過實(shí)驗(yàn)選取),則該點(diǎn)被判定為前景點(diǎn),否則為背景點(diǎn)。用公式表示為:
背景不可能是完全固定的,隨時(shí)間的推移會(huì)發(fā)生一些變化。一個(gè)好的背景模型應(yīng)該能夠反映出背景的這些變化,否則就可能產(chǎn)生誤檢。因此,需要對(duì)背景模型進(jìn)行實(shí)時(shí)更新。單高斯分布背景模型的更新即指各像素點(diǎn)高斯分布參數(shù)的更新。傳統(tǒng)的高斯模型更新方法是引入表示更新快慢的常數(shù)——更新率α,則該點(diǎn)高斯分布參數(shù)的更新可表示為:
傳統(tǒng)的高斯模型更新方法對(duì)均值和均方差采用相同的更新率,沒有考慮到高斯模型的均值和均方差各自不同的特點(diǎn)[5],是不合理的。當(dāng)更新率取值較小時(shí),模型的穩(wěn)定性好,但收斂性較差,不能很快地適應(yīng)光照的變化。當(dāng)更新率取值較大時(shí),模型的收斂性較好,能很快地適應(yīng)光照的變化,但模型的穩(wěn)定性又會(huì)變得很差。因此提出了一種新的更新策略:對(duì)于均值和均方差采用不同的更新率αμ和ασ,改進(jìn)后的高斯分布參數(shù)的更新可表示為:
對(duì)更新率的選取給出了參考意見:取αμ=0.01,當(dāng)1/t>0.001 時(shí) , 取 ασ=0.01; 當(dāng) 1/t≤0.001 時(shí) , 取 ασ=0.001。這樣,由于αμ取值始終較大,模型能夠很好地適應(yīng)光照的變化。在開始訓(xùn)練的一段時(shí)間里,ασ取值較大,模型具有很好的收斂性;在訓(xùn)練一段時(shí)間后,ασ取值又較小,使模型具有很好的穩(wěn)定性。
背景模型對(duì)運(yùn)動(dòng)目標(biāo)要有較強(qiáng)的抗干擾能力。因?yàn)樵诒尘澳P偷母逻^程中,對(duì)背景模型上的每點(diǎn)而言都是受到了一個(gè)顏色序列的“訓(xùn)練”,不論實(shí)際場(chǎng)景中該點(diǎn)是處于靜止背景還是在運(yùn)動(dòng)目標(biāo)上。靜止的背景或目標(biāo)的這種“訓(xùn)練”是我們所希望的,而運(yùn)動(dòng)目標(biāo)的“訓(xùn)練”則是不希望看到的。特別是當(dāng)運(yùn)動(dòng)物體尺度較大或運(yùn)動(dòng)較慢時(shí),這種長(zhǎng)時(shí)間的“訓(xùn)練”可能會(huì)引起錯(cuò)誤的檢測(cè)結(jié)果,如在運(yùn)動(dòng)目標(biāo)的尾部產(chǎn)生“空洞”,特別是兩個(gè)顏色相近的物體交錯(cuò)而過時(shí)更加明顯。
傳統(tǒng)的背景模型的更新策略不加判斷地將整個(gè)當(dāng)前幀用于背景的更新,而沒有考慮到運(yùn)動(dòng)目標(biāo)對(duì)于背景的影響。這樣運(yùn)動(dòng)目標(biāo)會(huì)部分地融入背景,造成更新后的背景和實(shí)際背景的誤差,造成所謂的 “拖尾”現(xiàn)象。KOLLER等人對(duì)傳統(tǒng)的高斯模型的更新策略作了一些改進(jìn),在背景模型的更新過程中剔除掉運(yùn)動(dòng)目標(biāo),而只讓背景點(diǎn)參與更新[6]。KOLLER等人的高斯分布參數(shù)的更新策略可表述為:
KOLLER等人的算法有效地避免了運(yùn)動(dòng)目標(biāo)參與更新對(duì)背景造成的干擾問題,消除了“拖尾”現(xiàn)象,但又產(chǎn)生了新的問題。由于只讓背景點(diǎn)參與更新,當(dāng)物體的運(yùn)動(dòng)狀態(tài)發(fā)生變化,即當(dāng)前景目標(biāo)從運(yùn)動(dòng)變?yōu)殪o止而融入背景或者背景目標(biāo)從靜止變?yōu)檫\(yùn)動(dòng)而轉(zhuǎn)化為前景時(shí),背景模型不能得到及時(shí)的更新,導(dǎo)致背景圖像上還保留著物體運(yùn)動(dòng)狀態(tài)發(fā)生改變前的信息,從而產(chǎn)生所謂的“鬼影”現(xiàn)象[7]。
針對(duì)該問題,本文提出一種新的背景模型更新策略:考察一段時(shí)間內(nèi)的圖像序列,記錄變化區(qū)域內(nèi)的像素點(diǎn)連續(xù)作為前景點(diǎn)的幀數(shù)。如果幀數(shù)超過一定范圍,就有理由相信,原來(lái)處于該像素點(diǎn)處的物體的運(yùn)動(dòng)狀態(tài)已經(jīng)發(fā)生變化。這時(shí),就用該像素點(diǎn)的像素值取代背景模型中對(duì)應(yīng)像素點(diǎn)的像素值。改進(jìn)后的背景模型的更新策略可具體描述為:利用式(1)判斷當(dāng)前幀的每一個(gè)像素點(diǎn)為前景點(diǎn)還是背景點(diǎn),同時(shí)為每一個(gè)像素點(diǎn)設(shè)置幀計(jì)數(shù)器C。當(dāng)像素點(diǎn)為背景點(diǎn)時(shí),將幀計(jì)數(shù)器置0,采用式(8)、式(9)的策略對(duì)背景進(jìn)行更新。當(dāng)像素點(diǎn)為前景點(diǎn)時(shí),將該像素點(diǎn)的幀計(jì)數(shù)器C加1,然后將C與預(yù)先設(shè)定的幀計(jì)數(shù)器閾值CT進(jìn)行比較 (CT的選取與運(yùn)動(dòng)目標(biāo)的大小和運(yùn)動(dòng)速度有關(guān),運(yùn)動(dòng)目標(biāo)越小,速度越快,CT取值應(yīng)越??;運(yùn)動(dòng)目標(biāo)越大,速度越慢,CT取值越大)。若C
背景差分法的缺陷是陰影點(diǎn)常常被誤檢為運(yùn)動(dòng)點(diǎn),從而嚴(yán)重干擾了運(yùn)動(dòng)目標(biāo)的分割與提取。由于陰影具有與運(yùn)動(dòng)目標(biāo)相同的運(yùn)動(dòng)特征,陰影消除成為運(yùn)動(dòng)目標(biāo)檢測(cè)與提取的難點(diǎn)。CUCCHIARA等提出了一種在 HSV顏色空間內(nèi)去除陰影的方法[8],JIANG等采用基于陰影強(qiáng)度與幾何特征的三步陰影檢測(cè)算法剪除陰影[9],KUMAR等提出基于不同彩色空間檢測(cè)前景物體及其陰影的方法[10]。本文將基于YUV顏色空間色度畸變和一階梯度模型的陰影檢測(cè)算法結(jié)合起來(lái)消除陰影,取得了較好效果。
YUV是被歐洲電視系統(tǒng)所采用的一種顏色編碼方法,其中Y表示亮度,UV代表色差,U和V是構(gòu)成彩色的兩個(gè)分量。YUV顏色空間的一個(gè)重要特性是其亮度信號(hào)Y和色度信號(hào)U、V相分離。這一特性可以很好地應(yīng)用于陰影的檢測(cè)與消除。應(yīng)用式(12)可以很容易地將圖像從RGB顏色空間轉(zhuǎn)換到Y(jié)UV顏色空間。
基于YUV顏色空間色度畸變的陰影檢測(cè)方法的原理是:陰影區(qū)域和它所對(duì)應(yīng)的背景區(qū)域的亮度會(huì)有較大變化,但其色度幾乎保持不變或有微小的變化。這樣,根據(jù)當(dāng)前幀中某像素點(diǎn)和它所對(duì)應(yīng)的背景中的像素點(diǎn)的色度變化大小就可以檢測(cè)出該像素點(diǎn)是否屬于陰影點(diǎn)。基于YUV顏色空間色度畸變的陰影檢測(cè)方法的步驟為:
(1)應(yīng)用式(12)將當(dāng)前幀圖像x從 RGB顏色空間轉(zhuǎn)換到 YUV顏色空間,記 Ix=(Yx,Ux,Vx);
(2)應(yīng)用式(12)將背景圖像b從RGB顏色空間轉(zhuǎn)換到 YUV顏色空間,記Ib=(Yb,Ub,Vb);
(3)分別計(jì)算Ix和Ib在UV平面上的投影,分別記為Ix′和 Ib′;
(4)利用式(13)計(jì)算向量 OIx′和 OIb′之間的夾角余弦cosθ;
(5)利用式(14)判斷像素點(diǎn)是否屬于陰影點(diǎn)。
[11]求出角度再與閾值進(jìn)行比較,使用了反余弦函數(shù)。本文根據(jù)兩向量之間的夾角θ∈[0,180],且θ的余弦值在該區(qū)間內(nèi)單調(diào)遞減這一性質(zhì),僅需求出兩向量夾角余弦,然后與設(shè)定的閾值T進(jìn)行比較,簡(jiǎn)化了運(yùn)算。
當(dāng)目標(biāo)和陰影的顏色差別明顯時(shí),基于YUV顏色空間色度畸變的陰影檢測(cè)方法能夠很好地分離目標(biāo)和陰影。但當(dāng)目標(biāo)和陰影的顏色幾乎相同時(shí),基于YUV顏色空間色度畸變的陰影檢測(cè)方法就不再有效了[12]。此時(shí),利用圖像的一階梯度信息可以有效地區(qū)分出陰影和目標(biāo)區(qū)域?;谝浑A梯度模型的陰影檢測(cè)方法過程如下:
(1)采用Sobel算子計(jì)算背景圖像中的每一個(gè)像素點(diǎn)在x、y方向的梯度,分別記為 bxi和 byi(i=R,G,B);
(2)計(jì)算背景圖像的像素值均方差i=R,G,B)。
(3)采用Sobel算子計(jì)算當(dāng)前幀圖像中的每一個(gè)像素點(diǎn)在 x、y方向的梯度,分別記為 ix和 iy(i=R,G,B)。(4)利用式(15)判斷像素點(diǎn)是否屬于陰影點(diǎn)。
基于YUV顏色空間色度畸變的陰影檢測(cè)方法和基于一階梯度模型的陰影檢測(cè)方法有它們各自的適用范圍,將二者結(jié)合起來(lái)使得算法具有更好的適應(yīng)性。如果某點(diǎn)同時(shí)滿足式(14)、式(15)中的第一個(gè)條件,則判定該點(diǎn)為陰影點(diǎn),否則為目標(biāo)點(diǎn)。
用基于改進(jìn)的單高斯模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法在AMD Athlon(tm)64 X2 Dual core processor 4 800+2.50 GHz、1.00 GB內(nèi)存的計(jì)算機(jī)上對(duì)視頻序列進(jìn)行處理,得到以下結(jié)果。
圖1為運(yùn)用KOLLER等人的算法消除傳統(tǒng)高斯模型中的“拖尾”現(xiàn)象的效果圖。其中圖1(a)表示視頻中某一幀的實(shí)時(shí)圖像;圖1(b)表示應(yīng)用傳統(tǒng)高斯模型得到的運(yùn)動(dòng)物體的掩膜圖像,可以看到有嚴(yán)重的“拖尾”現(xiàn)象;圖1(c)表示應(yīng)用KOLLER等人的算法得到的運(yùn)動(dòng)物體的掩膜圖像,“拖尾”問題得到了很好的解決。
圖2為運(yùn)用基于改進(jìn)的單高斯模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法去除KOLLER算法中的“鬼影”現(xiàn)象的效果圖。其中圖2(a)表示視頻中某一幀的實(shí)時(shí)圖像;圖2(b)表示應(yīng)用KOLLER算法得到的運(yùn)動(dòng)物體的掩膜圖像,可以看到有嚴(yán)重的“拖尾”現(xiàn)象;圖2(c)表示應(yīng)用基于改進(jìn)的單高斯模型運(yùn)動(dòng)目標(biāo)檢測(cè)方法得到的運(yùn)動(dòng)物體的掩膜圖像,“鬼影”問題得到了很好的解決。
圖3為基于YUV顏色空間色度畸變和一階梯度模型的陰影檢測(cè)方法去除陰影的效果圖。其中圖3(a)表示視頻中帶有明顯陰影的兩幀圖像;圖3(b)表示帶有陰影的運(yùn)動(dòng)物體的掩膜圖像;圖3(c)表示應(yīng)用本文中陰影去除算法去除陰影后得到的運(yùn)動(dòng)物體的掩膜圖像。
針對(duì)傳統(tǒng)的單高斯模型法的不足,提出了一種基于改進(jìn)的單高斯模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法。通過為每一個(gè)像素點(diǎn)設(shè)置一個(gè)幀計(jì)數(shù)器,很好地解決了應(yīng)用傳統(tǒng)單高斯模型進(jìn)行目標(biāo)檢測(cè)時(shí)的“拖尾”、“鬼影”問題。針對(duì)傳統(tǒng)高斯模型更新方法中更新率選取的不合理性,提出了一種新的更新率選取策略,使得模型在訓(xùn)練的開始階段具有良好收斂性,能夠迅速逼近最合理的模型,在訓(xùn)練一段時(shí)間后,模型又能夠保持較好的穩(wěn)定性。針對(duì)陰影對(duì)于運(yùn)動(dòng)目標(biāo)提取的干擾問題,將基于YUV顏色空間色度畸變和一階梯度模型的陰影檢測(cè)方法結(jié)合起來(lái)去除陰影,使得提取出的運(yùn)動(dòng)目標(biāo)的輪廓更為精確。算法簡(jiǎn)單有效,可以充分滿足視頻監(jiān)控系統(tǒng)實(shí)時(shí)性的要求。實(shí)驗(yàn)證明,基于改進(jìn)的單高斯模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法在室內(nèi)環(huán)境和背景較為穩(wěn)定的室外環(huán)境中都能取得良好效果。
參考文獻(xiàn)
[1]FEJES S,DAVIS L S.What can projections of flow fields tell us about the visual motion[C].Proceeding of International Conference on Computer Vision,Bombay,India.1998:979-986.
[2]PARAGIS N,DERICHE R.Geodesic active contours and level sets for the detection and tracking of moving objects[J].IEEE Transactions on Pattern Analysis and Machine Interface,2000,22(3):266-228.
[3]WREN C,AZARHAYEJANI A,DARRELL T,et al.Pfinder:real-time tracking of the human body[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):780-785.
[4]STAUFFER C,GRIMSON W.Adaptive background mixture models for real-time tracking[C].Proceedings of IEEE Conference on Computer Vision and Pattern Recognition.Fort Collins,Colorado,USA,1999:246-252.
[5]劉潔,張東來(lái).關(guān)于自適應(yīng)高斯混合背景模型的更新算法的研究[J].微計(jì)算機(jī)信息,2006,22(8):241-242.
[6]KELLER D,WEBER J,HUANG T,et al.Towards robust automatic traffic scene analysis in real-time[C].The 12th International Computer Vision&Image Processing Conference,1994:126-131.
[7]王小平,張麗杰,常佶.基于單高斯背景模型運(yùn)動(dòng)目標(biāo)檢測(cè)方法的改進(jìn)[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(21):118-120.
[8]CUCCHIARA R,GMNA C,PICCARDI M,et al.Detecting moving objects,ghosts and shadow in video streams[J].IEEE Transactions Pattern Analysis and Machine Intelligence,2003,25(10):1377-1342.
[9]JIANG C,WARD M.Shadow identification[C].IEEE Conference on Computer Vision and Pattern Recognition,1992:606-612.
[10]KUMAR P,SENGUPTA K,LEE A.A comparative study of different color spaces f or foreground and shadow detection color spaces for foreground and shadow detection for traffic monitoring system[C].The IEEE 5th International Conference.on Intelligent Transportation System,2002,3(6):100-105.
[11]劉雪,常發(fā)亮,王華杰.運(yùn)動(dòng)目標(biāo)檢測(cè)中的陰影去除方法[J].微處理機(jī),2008,10(5):116-117.
[12]王華偉,李翠華,施華,等.基于HS V空間和一階梯度的陰影剪除算法[J].計(jì)算機(jī)工程與應(yīng)用,2005,41(8):43-44.