于明杰
(武漢理工大學(xué) 汽車工程學(xué)院,湖北 武漢430070)
隨著信息技術(shù)的發(fā)展,基于視覺(jué)的運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤,已逐漸滲透到人們生活的方方面面,其重要性日益突出,吸引了越來(lái)越多的海內(nèi)外學(xué)者及研究機(jī)構(gòu)參與到此領(lǐng)域的研究[1]。目前,視頻監(jiān)控系統(tǒng)在金融、交通、軍事等領(lǐng)域得到廣泛應(yīng)用[2],其中,運(yùn)動(dòng)目標(biāo)檢測(cè)也顯得尤為重要。運(yùn)動(dòng)目標(biāo)檢測(cè)根據(jù)背景區(qū)域運(yùn)動(dòng)與否可分為靜態(tài)背景檢測(cè)和動(dòng)態(tài)背景檢測(cè),靜態(tài)背景檢測(cè)是指攝像機(jī)鏡頭位置固定、動(dòng)態(tài)背景檢測(cè)是指攝像機(jī)鏡頭位置隨運(yùn)動(dòng)物體變化。而背景更新一般用于靜態(tài)背景下的運(yùn)動(dòng)目標(biāo)檢測(cè)[3]。對(duì)于動(dòng)態(tài)背景下的目標(biāo)檢測(cè),由于存在背景與攝像機(jī)的相對(duì)運(yùn)動(dòng),如果使用傳統(tǒng)的背景差分方法,背景變化使得畫(huà)面抖動(dòng)。針對(duì)此問(wèn)題,本文提出一種背景提取方法,運(yùn)用新的前景與背景疊加方式,使得能提取出動(dòng)態(tài)背景下的目標(biāo)特征。
Surendra算法的核心思想是:利用指定閾值計(jì)算方法對(duì)前一幀圖像與背景對(duì)比,如果超過(guò)指定的閾值,則用前一幀圖像與原來(lái)的背景進(jìn)行有比例的圖像疊加;如果未超過(guò),則背景不變。其算法步驟如下:
第一步,創(chuàng)建初始背景圖像B1。通常以第一幀圖像作為初始背景圖像。
第二步,設(shè)立循環(huán),并設(shè)置背景更新的閾值T。
第四步,如果大于閾值T,進(jìn)行背景更新;如果不大于閾值T,則背景不更新,即:
在靜態(tài)背景圖像中,背景在進(jìn)行更新時(shí),通常選取較小的前景權(quán)重和較大的背景權(quán)重,這樣的權(quán)重使得背景在更新時(shí),對(duì)原來(lái)圖像的參考較多,通常選取α=0.1、β=0.9時(shí)能得到較好的背景圖像[4],而背景中變化的物體在更新時(shí)逐漸弱化。但在靜態(tài)背景圖像中,由于每幀圖像背景都有區(qū)別,在更新時(shí),圖像的抖動(dòng)比較大,因此,將背景的權(quán)重降低,保留一部分原先的信息,這些信息在更新過(guò)程中被逐漸淡化,而升高前景的權(quán)重,使得保留前景的大部分信息,較為明顯的信息保留下來(lái),而不明顯的信息被過(guò)濾掉。這樣在后續(xù)的差分過(guò)程中,有利于區(qū)別與背景區(qū)別較大的區(qū)域或物體。
在文獻(xiàn)[5]中,劉鑫等人提出,α取得較小,適應(yīng)能力較差,且時(shí)間足夠長(zhǎng)才能適應(yīng)環(huán)境的變化;如果α取得較大,適應(yīng)變化能力強(qiáng),但容易引入噪聲。這為更新系數(shù)的選取提供了依據(jù)。
經(jīng)多次實(shí)驗(yàn)驗(yàn)證,當(dāng)α=0.91、β=0.31時(shí)能夠得到適合于動(dòng)態(tài)背景的背景圖像。由于背景不斷變化,這就使得背景圖像要隨之不斷變化,所以,在應(yīng)用于動(dòng)態(tài)背景的背景更新不需要進(jìn)行上述第三步的判斷而直接進(jìn)行背景更新。
在進(jìn)行背景更新后,還需要對(duì)圖像進(jìn)一步處理才能得到我們需要的特征。其中,由于需要考慮實(shí)際應(yīng)用中算法的復(fù)雜度,且基于背景時(shí)時(shí)更新的情況,將Surendra算法處理步驟中的對(duì)單像素點(diǎn)的具體操作改為對(duì)圖像的整體操作。即將第四步改為
將當(dāng)前幀的灰度圖像與背景圖像減操作。由于要得到二值圖像且為了降低計(jì)算復(fù)雜度,需要將RGB彩色圖像轉(zhuǎn)換為灰度圖像進(jìn)行處理。在得到差分圖像后,設(shè)定閾值得到二值圖像。
得到二值圖像后,進(jìn)行形態(tài)學(xué)操作,將較小的噪聲點(diǎn)通過(guò)腐蝕消除或者通過(guò)膨脹將較為不連貫的區(qū)域連接起來(lái),得到較為有效的特征二值圖像,便于區(qū)分特征。使用基于連通區(qū)域的檢測(cè)算法,產(chǎn)生多個(gè)較為明顯的連通的小區(qū)域[2],這些連通域可能有噪聲干擾產(chǎn)生且形態(tài)學(xué)操作未能消除的連通集合,通常需要限制連通域的大小來(lái)去除這些連通集合。
為了驗(yàn)證上述理論,本文在python3.7開(kāi)發(fā)環(huán)境中進(jìn)行軟件實(shí)現(xiàn)。其中,視頻單幀大小為640×360像素,實(shí)驗(yàn)場(chǎng)景為攝像機(jī)運(yùn)動(dòng)普通水泥地面一個(gè)靜止物體和一個(gè)緩慢移動(dòng)物體。
原視頻某一幀原圖像序列如圖1所示,背景圖像序列如圖2所示,閾值分割后二值圖像序列如圖3所示,處理結(jié)果序列如圖4所示。
圖1原視頻某一幀原圖像序列
圖2背景圖像序列
圖3閾值分割后二值圖像序列
圖4處理結(jié)果序列
每個(gè)序列第一幅圖為通常的背景更新方式,可以看出,這種方式并不能在動(dòng)態(tài)背景下很好地進(jìn)行目標(biāo)的檢測(cè)與識(shí)別,表現(xiàn)為識(shí)別物體不完全、識(shí)別不準(zhǔn)確等問(wèn)題。每個(gè)序列的后三幅圖為新的疊加方式同一視頻不同時(shí)刻的背景更新,可以看出,該種疊加方式較為完整地提取了物體的信息,準(zhǔn)確識(shí)別和跟蹤了目標(biāo)對(duì)象。
本文采用一種新的背景更新方式,使得背景差法能適用于動(dòng)態(tài)背景下目標(biāo)的提取與跟蹤。實(shí)驗(yàn)結(jié)果表明,這種有著新的更新系數(shù)的背景更新方式在動(dòng)態(tài)背景下也能較好地進(jìn)行識(shí)別,但是由于工況的單一,該方法還不能應(yīng)用于復(fù)雜背景下的物體識(shí)別。為此,以后的工作將圍繞如何自適應(yīng)選取合適的閾值,使之能適應(yīng)多場(chǎng)景復(fù)雜工況來(lái)展開(kāi)。