胡雄鴿,王耀南
湖南大學 電氣與信息工程學院,長沙 410082
使用隨機策略進行運動目標檢測方法研究
胡雄鴿,王耀南
湖南大學 電氣與信息工程學院,長沙 410082
視頻序列中,運動目標檢測在視頻監(jiān)控、智能交通、汽車自動駕駛與輔助駕駛等領(lǐng)域中是一項基礎(chǔ)而又關(guān)鍵的任務。Intel公司在智能視覺監(jiān)控系統(tǒng)計算機工作量分析中表明[1],前景目標檢測所耗費的程序執(zhí)行時間約占整個智能視頻監(jiān)控程序的80%~95%,開發(fā)一種簡單高效,占用計算機資源少的算法成為很多應用項目的關(guān)鍵。在已有方法中,減背景是一種最常用的方法,它的基本思想是用當前視頻幀與背景幀相比較,如果相同位置的像素特征、像素區(qū)域特征或者其他特征之間存在一定程度區(qū)別,則當前視頻幀中的這些像素點或者像素區(qū)域就判定為運動目標。最常見的減背景方法包含兩種,一種是當前視頻幀與固定的背景幀之間進行比較,另一種是連續(xù)兩幀視頻幀之間的比較;通常設(shè)定一個閾值T,凡是大于閾值T的像素點則被判定為運動點。這種方法原理簡單,但是容易受噪聲和光照等條件影響,特別是當場景中存在諸如隨風擺動的樹枝,水面的波紋,閃爍的屏幕,突然的開燈關(guān)燈,運動物體進入場景后停留一段時間后又移出等情況時,這種方法的缺點就更加突出。均值濾波算法的中心思想是建立一個視頻序列時間窗來緩存N張視頻幀,然后把所有視頻幀同位置像素的平均值作為背景來處理該像素的值。一種改進的方法就是滑動平均算法(running average)[2],其核心想法就是引入一個學習率a,這里a通常取值為0.003~0.050,a值越小,則表明前景的變化對背景影響越小,公式(1)為其更新等式:
Friedman提出利用3個高斯分布[3]來對交通道路場景中的道路、陰影、車輛的像素進行分別建模。由Stauffer和Grimson所提出的混合高斯背景建模算法[4-5]得到了廣泛的研究,衍生出很多改進型算法[6-8],主要集中在背景模型的初始化、參數(shù)選擇、更新等式這幾個方面。其基本思想就是對每一個像素點建立混合高斯模型(高斯模型一般為3~5個),檢測過程中判斷當前像素點是否符合該分布,若符合,則判定為背景點,若不符合,則判定為運動點。
本文提出的方法不像混合高斯模型那樣依賴于具體而精確的統(tǒng)計模型,而是基于一種隨機取值的思想,主要體現(xiàn)在背景模型的初始化過程中樣本點選擇上和背景模型更新過程中對樣本點的選取與替換上。下面將詳細闡述背景模型的建立、初始化以及更新過程。在實驗部分討論了實驗參數(shù)的選擇,并且通過與滑動平均、改進的混合高斯法進行對比,驗證了本文方法的有效性。
從視頻序列中提取的像素點特征通常可以歸為3類:光譜特征、時間特征、空間特征[9]?;陔S機策略的運動目標檢測方法對每個像素所建立的樣本序列中包含這3種特征,光譜特征利用像素點的灰度值,時間特征使用同一位置像素點在不同幀的取值,空間特征使用像素點8鄰域像素值。圖1為使用隨機策略進行運動目標檢測的流程圖。下面將分3個小節(jié),詳細對背景模型的建立、初始化、更新過程進行論述。
圖1 使用隨機策略進行運動目標檢測流程圖
2.1 背景模型的建立
對每一個像素點建立一個包含N個樣本點的樣本序列(即背景模型,N≥1),記當前像素點位置為(a,b),當前像素位置(a,b)的樣本點序列記為{si(a,b)|i=1,2,…,N},xt(a,b)代表在t幀時位于(a,b)位置的像素值。當前像素點xt(a,b)的N個樣本點的取值可以分為兩類:一類是在同一位置在之前視頻幀像素值;另一類是之前視頻幀同一位置的8鄰域像素值。通過這種取值方式,使樣本點包含光譜、空間、時間3種特征信息。對在(a,b)位置的新視頻幀在t時刻灰度值xt(a,b)與它的N個樣本點相比較,Tv為灰度值閾值,如公式(2)所示:
設(shè)置另一個次數(shù)閾值Tn,用來對符合式(2)的次數(shù)進行計數(shù),通過次數(shù)判定當前像素點是背景點還是運動點,如公式(3)所示:
這個判定規(guī)則可近似用二項分布理論來加以解釋:當前像素值與樣本序列中N個樣本點進行比較,相當于做了N次實驗,|si(a,b)-xt(a,b)|≤Tv概率為p,以X記為N次比較中絕對值小于等于Tv的次數(shù),則X大于等于次數(shù)閾值Tn這個事件的概率可以用公式(4)表示:
在理想情況下認為|si(a,b)-xt(a,b)|≤Tv的概率與|si(a,b)-xt(a,b)|>Tv的概率近似相等,即p=0.5,在N取值較大及Tn取值較小的條件下,由式(4)得出P(X≥Tn)概率很大,式(5)算出P(X<Tn)概率很??;據(jù)此推斷如果xt(a,b)與它的每一個樣本點{si(a,b)|i=1,2,…,N}相比較,其絕對值小于灰度值閾值Tv的次數(shù)大于次數(shù)閾值Tn,則該點為背景點的概率很大,即被判定為背景點;反之,則被判定為運動點。通過上述特定的判定規(guī)則完成對當前像素點的判定過程;通過對當前視頻幀的每一個像素點進行判定,完成對當前幀的運動目標檢測過程。
2.2 背景模型的初始化
為了快速完成對背景模型的初始化,本文提出利用第1幀像素點的空間特征進行初始化。由于在第1幀并無時間特征可以利用,所以考慮其空間特征。在對視頻序列第1幀的(a,b)位置像素點xt=1(a,b)的N個樣本點進行初始化時,使用該像素點的4鄰域、8鄰域甚至16鄰域的像素點灰度值,在文中使用8鄰域,即xt=1(a+1,b),xt=1(a-1,b),xt=1(a,b+1),xt=1(a,b-1)這4個上下左右鄰域點,加上對角像素點xt=1(a+1,b+1),xt=1(a+1,b-1),xt=1(a-1,b+1),xt=1(a-1,b-1),構(gòu)成8鄰域像素點。通過對8個鄰域像素點灰度值和xt=1(a,b)(當前像素點灰度值)共9個像素值,進行N次概率均等(每個點被選擇的概率為1/9)的隨機取值,完成背景模型的快速初始化過程。結(jié)果可能某一像素值被選擇了幾次,有的像素值一次都沒有被選擇過,這對于整體檢測效果并無太大影響。實際上,對于一個固定測試的視頻序列,因為在2.2和2.3小節(jié)的背景模型初始化、背景模型更新中使用隨機策略,每次實驗結(jié)果都會有細微的不同,但并不妨礙運動目標檢測的精度。
2.3 背景模型的更新
背景模型的更新涉及兩個重要問題:一是對哪些樣本點進行操作;二是每一個樣本點的存在時間。本文使用一種概率均等的隨機取值更新策略,不僅隨機更新當前像素點的樣本序列,同時更新其鄰域像素點的樣本序列;對位于(a,b)位置的樣本序列{si(a,b)|i=1,2,…,N}中的哪一個樣本點進行操作并不固定,對于該像素點的8鄰域之中的哪一個像素點的樣本序列進行更新并不固定。采取這種更新策略的出發(fā)點在于已經(jīng)出現(xiàn)的背景點像素值可以保留在樣本序列中,而并非經(jīng)過一段時間即被強制替換;并且運動點像素值不能進入樣本序列來保持樣本序列的純凈。使用這種更新機制的限制條件就是當前視頻幀中被判定為運動點的像素值不能用于更新該位置的樣本序列,必須再通過公式(3)確定該像素點在t時刻為背景點之后才能用該像素值進行更新操作,如果判定為運動點則該位置的樣本序列保持不變。
在進行樣本序列更新之前,需初始化另一個參數(shù)Ts,作用是降低樣本序列更新速度。本文方法中,如果N取值較小的話,每一個位置的樣本序列的更新速度非??欤Y(jié)果使得低速運動目標被背景快速侵蝕,在運動目標內(nèi)部形成空洞,影響運動目標檢測效果;當運動目標停止運動后,迅速轉(zhuǎn)換為背景。為達到理想的檢測效果,有兩種解決途徑:一是增大樣本點個數(shù)N的取值,這樣會增大內(nèi)存的消耗量;另一種方法是增加一個參數(shù)為Ts的隨機取值判斷過程,隨機取值的范圍是[0,Ts],通過增加一次判斷過程,使得樣本序列的更新速度減緩。這種途徑可以從另一個方面來解釋,由于N個樣本點中的每一個樣本點被選擇的概率降低了1/Ts,相當于樣本序列包含的樣本點個數(shù)擴大為N×Ts,與第一種途徑擴大樣本點N個數(shù)達到同樣的效果,但并沒有增加內(nèi)存的消耗。通過上述分析,為了減少內(nèi)存消耗,本文采用第二種方式。
在對位置(a,b)的樣本點序列進行更新后,隨機選擇8鄰域像素點之一,使用xt(a,b)對其樣本點序列進行更新。每一個鄰域像素點被選擇的概率是1/8,這個被選擇的鄰域像素點的一個樣本點被更新的概率是1/N。
文獻[10]中指出,運動目標檢測主要存在以下難點:(1)現(xiàn)實情況中,由于光照條件的影響,不可避免地存在陰影的現(xiàn)象,而陰影與真正運動目標實體之間的區(qū)分是一個的難題。(2)運動目標進入場景后,經(jīng)過一段時間停止運動后,應該逐漸轉(zhuǎn)變?yōu)楸尘?。?)運動目標從靜止變?yōu)檫\動時,或者以較低速度前行時,要避免出現(xiàn)幻影現(xiàn)象,也就是運動目標離開之處應當迅速融入背景。(4)要能夠適應場景中諸如光照條件逐漸變化,隨風飄動的樹葉等情況變化。
下面闡述本文方法在復雜場景條件下,對提高運動目標檢測效果的有效性的原因:
(1)因為陰影區(qū)域像素點與周圍背景像素點灰度值差異相對較??;在更新過程中,陰影區(qū)域周邊的背景像素點灰度值快速融入陰影點的樣本點序列,根據(jù)公式(2)、(3),陰影點被判定為背景點的概率變大,在被判定為背景點后,這個陰影像素點灰度值又不斷進入它周圍的陰影像素點樣本點序列,通過不斷的擴散,最終陰影區(qū)域?qū)⒖焖偃谌氡尘啊6\動目標實體邊界像素點與周圍背景點的灰度值相差較大,即使周圍背景像素點灰度值擴散運動點樣本序列,但是根據(jù)式(2),由于與背景點灰度值差異大,仍然會被判定為運動點,這樣使得真正運動目標區(qū)域的像素點的樣本點序列并未被背景點所侵蝕,相當于起了一層保護膜的作用。通過這種機制,能夠?qū)﹃幱皡^(qū)域進行有效抑制。
(2)運動目標如果在一段時間內(nèi)的保持靜止狀態(tài),由于運動目標邊界區(qū)域像素點的樣本點序列不斷被背景點灰度值所侵蝕,當停留時間較長時,邊界像素點存在一定的被判定為背景點的可能性,加上運動目標區(qū)域內(nèi)部不可避免地出現(xiàn)噪聲點,這些噪聲點灰度值也會擴散到運動點的樣本點序列,根據(jù)公式(2)、(3),這些位置的運動點可能會被判定為背景點;這些被判定為背景點的像素點,不斷向周圍進行擴散侵蝕,最終長時間停留的運動目標區(qū)域?qū)⒈煌耆治g成為背景。
(3)當運動目標離開后,原來所停留的區(qū)域由于灰度值與周圍背景點的灰度值近似,并且整個區(qū)域都被背景點所環(huán)繞,所以背景點對所留下的幻影區(qū)域能夠進行快速地侵蝕,使得整個區(qū)域迅速變?yōu)楸尘?;對于低速運動的目標,通過同樣的方式,能夠達到抑制幻影的效果。
(4)對于場景中的光照條件變化,樹葉的搖擺等情況,處理過程與陰影、幻影的處理過程類似,也是通過周圍背景點灰度值擴散到運動點的樣本序列,從而達到抑制場景變化對運動目標檢測所帶來不利影響的效果。
為了驗證基于隨機策略運動目標檢測方法的有效性,實驗中選擇經(jīng)典的滑動平均法、混合高斯法與本文方法進行對比,為突出效果,整個實驗過程中并沒有進行諸如濾波、膨脹、腐蝕等輔助性操作。所采取的視頻為ICVS-PETS2002室外視頻序列,大小為384×288,所用電腦CPU為Intel的P7350,處理速度2 GHz,內(nèi)存2 GB,編程環(huán)境為VC++6.0結(jié)合OpenCV。實驗部分分為參數(shù)選擇與對比結(jié)果兩方面。
3.1 Tv、Tn、Ts參數(shù)的確定
基于隨機策略運動目標檢測方法涉及3個重要的參數(shù);
(1)灰度閾值Tv,與經(jīng)典的減背景方法類似,一般設(shè)置為15~45,取值過高,使正常的運動點判定為背景點,使得運動目標區(qū)域形成空洞;取值過小,會引入大量噪聲,在本實驗下,Tv取值為25。
(2)參數(shù)Ts,其作用為通過增加一次隨機取值判定來降低樣本序列更新速度,具體取值需依據(jù)實驗環(huán)境中CPU處理速度來確定取值,在本實驗中,取值設(shè)置為10,可以使得樣本序列更新速度較為適中。
(3)根據(jù)公式(4)、(5)可以看出,P(X≥Tn)的概率與樣本序列N大小及次數(shù)閾值Tn有關(guān),為使概率值較大,需N取值較大,Tn取值較小,在此處,樣本序列大小N取值固定為20可使得樣本序列大小適中,既能提高檢測精度,又減少內(nèi)存消耗。
在固定N、Tv、Ts條件下,在上述實驗環(huán)境中設(shè)置Tn的不同取值來觀察實驗結(jié)果。圖2為當Tn取不同值時,對第880幀進行檢測的情況,這一幀中人車多,場景復雜,易于對比檢測效果。
圖2 不同取值檢測情況(N=20,Tv=25,Ts=10)
從實驗結(jié)果可以看出,當Tn取值較小,如圖2(b)、(c)所示,檢測效果較好;當Tn取值變大時,噪聲點增多,甚至背景點當成運動點檢測出來,檢測效果變差,如圖2(d)、(e)、(f)所示;圖2(b)與(c)對比發(fā)現(xiàn),(c)中小車與右側(cè)行人檢測更為完整,所以實驗中選擇Tn=2較為理想。
3.2 實驗結(jié)果對比
混合高斯法采用的是文獻[6]提出的改進的混合高斯算法?;瑒悠骄ㄟx用的閾值為25,學習率a為0.003,本文方法中Tn為設(shè)置為2,Tv設(shè)置為25,Ts設(shè)置為10,每個像素點的樣本點個數(shù)N為20,改進的混合高斯模型參數(shù)設(shè)置為高斯模型個數(shù)為5,初始權(quán)值為0.05,初始方差為30,背景閾值設(shè)置為0.7。實驗結(jié)果的對比主要集中在3個方面:一是初始化情況;二是幻影校正情況;三是檢測精度情況。實驗結(jié)果如圖3、圖4、圖5所示。
從圖3中可看出,第2幀結(jié)束后,滑動平均法并未完成初始化,改進的混合高斯法背景能夠完成初始化,但檢測結(jié)果中有較明顯的白色噪聲點。本文方法在對第2幀進行檢測時,只有零星的孤立點,沒有成片的斑點,檢測效果改善明顯。
在圖4中,原始視頻從第1 601幀開始,右下角小車開始倒車,1 890幀表示該小車倒車結(jié)束,并短暫停留一段時間,2 006幀表示該小車已經(jīng)停留足夠長的時間,即將有行人從右下角進入視頻場景。從圖4(d)可看出,在滑動平均法下,第1 601幀檢測結(jié)果中有著非常明顯的幻影,在圖4(f)中,小車直到第2 006幀結(jié)束后,依然被檢測為運動目標。在混合高斯法下,圖4(h)中顯示幻影在1 890幀以前就已經(jīng)消失,圖4(i)顯示在第2 006幀時,小車部分融入背景。在本文方法下,圖4(k)顯示在第1 890幀時,小車的幻影已經(jīng)檢測不到,并且小車開始部分融入背景。在2 006幀時,圖4(l)顯示小車已經(jīng)大部分融入背景。
圖3 背景模型初始化情況對比
圖4 幻影的校正情況對比
圖5 檢測精度情況對比
從圖5可看出,第941幀中存在的人、車運動目標相對較多,且3個行人左側(cè)的小車已經(jīng)停留一段時間。從檢測結(jié)果來看,在滑動平均法下,那輛停留較久的小車依然作為運動目標被檢測出來。在混合高斯法下,運動目標的陰影被誤檢出來,陰影抑制情況不理想,導致3個行人間無隔斷,連成一整片。本文方法檢測效果下,首先陰影抑制效果非常明顯,3個行人之間并未連接起來。其次,停留的小車能夠順利融入背景。
內(nèi)存消耗方面,在當前實驗條件下,滑動平均法內(nèi)存消耗量為9.392 KB,混合高斯法的內(nèi)存消耗量為44.212 KB,本文方法的內(nèi)存消耗量為10.160 KB。通過上述實驗結(jié)果可以看出,本文方法能夠有效抑制陰影、幻影等對運動目標檢測帶來的不良影響,初始化速度快,檢測精度高,內(nèi)存消耗量較小。
本文提出一種基于隨機策略的運動目標檢測方法,能夠通過視頻序列第1幀進行背景模型的快速初始化,采用新穎的背景點、運動點判定準則,在背景模型的更新過程中兼顧樣本點的光譜、時間、空間特征;相對于混合高斯法和滑動平均法,本文方法易于編程實現(xiàn),降低了算法的復雜程度和內(nèi)存消耗量,具有較強的可操作性和實用性。通過實驗證明該方法有著良好的檢測效果,能夠有效抑制陰影、幻影,對場景變化具有較強的適應性。
[1]Chen T P,Haussecker H.Computer vision workload analysis:case study of video surveillance systems[J].Intel Technology Journal,2005,9(2):109-118.
[2]Cucchiara R,Grana C,Piccardi M,et al.Detecting moving objects,ghosts,and shadows in video streams[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2003,25:1337-1342.
[3]Friedman N,Russell S.Image segmentation in video sequences:a probabilistic approach[C]//Proceedings of the 13th Conference on Uncertainty in Artificial Intelligence,1997.
[4]Stauffer C,Grimson W E L.Adaptive background mixture models for real-time tracking[C]//Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition,1999.
[5]Stauffer C,Grimson W E L.Learning patterns of activity using real-time tracking[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(8):747-757.
[6]Kaewtrakulpong P,Bowden R.An improved adaptive background mixture model for real-time tracking with shadow detection[C]//Proceedingsofthe2ndEuropeanWorkshop on Advanced Video Based Surveillance Systems,2001.
[7]Lee D S.Effective gaussian mixture learning for video background subtraction[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(5):827-832.
[8]Zivkovic Z.Improved adaptive Gaussian mixture model for background subtraction[C]//Proceedings of the 17th International Conference on Pattern Recognition,2004,2:28-31.
[9]Li L,Huang W,Gu I Y,et al.Statistical modeling of complex backgrounds for foreground object detection[J].IEEE Transactions on Image Processing,2004,13(11):1459-1472.
[10]Piccardi M.Background subtraction techniques:a review[C]// Proceedings of the IEEE International Conference on Systems,Man and Cybernetics,2004.
HU Xiongge,WANG Yaonan
College of Electrical and Information Engineering,Hunan University,Changsha 410082,China
A method for finding moving objects by using random strategy is discussed.There are several innovations:firstly,the background model is initialized by the first frame of the video sequence;secondly,a unique decision rule is established to discriminate the moving pixels and the background pixels;thirdly,when updating the background model,not only updates the sample sequence of the current pixel,but also updates the neighborhood’s sample sequence.The random strategy is used in the process of initialization and updating.The spectral,spatial and the temporal features of pixels are exploited.The proposed method, compared with the running average method and the improved Gaussian mixture model method,is proved to be simple but efficient with lower computational cost and higher accuracy.
sample selecting;decision rule;background updating;random strategy
提出一種基于隨機策略進行運動目標檢測的方法。方法的主要創(chuàng)新點:(1)利用視頻序列第1幀完成背景模型的初始化;(2)建立特定的運動點與背景點判定規(guī)則;(3)背景模型更新過程中不僅更新當前像素點的樣本序列,同時更新其鄰域的樣本序列。在背景模型初始化與更新過程中,使用隨機策略進行樣本序列的更新。該方法利用了像素點的光譜、空間和時間特征,從而提高了檢測效果。通過與滑動平均算法、改進的混合高斯模型算法進行實驗比較,結(jié)果證明該方法是一種運算量小,準確率高,簡單高效的運動目標檢測方法。
樣本選擇;判定規(guī)則;背景更新;隨機策略
A
TP391.41
10.3778/j.issn.1002-8331.1110-0601
HU Xiongge,WANG Yaonan.Research on moving objects detection by using random strategy.Computer Engineering and Applications,2013,49(13):128-132.
國家自然科學基金(No.60835004);國家高技術(shù)研究發(fā)展計劃(863)(No.2007AA04Z244)。
胡雄鴿(1985—),男,碩士研究生,主要研究領(lǐng)域為計算機視覺;王耀南(1957—),男,教授,博士生導師。E-mail:278409580@qq.com
2011-11-02
2012-01-02
1002-8331(2013)13-0128-05
CNKI出版日期:2012-03-21http://www.cnki.net/kcms/detail/11.2127.TP.20120321.1735.050.html