宋芳琴
(紹興職業(yè)技術(shù)學(xué)院 信息工程學(xué)院,浙江 紹興312000)
智能視頻監(jiān)控技術(shù)的研究是一個(gè)具有挑戰(zhàn)性的前沿課題,涉及計(jì)算機(jī)科學(xué)、人工智能、機(jī)器視覺、圖像工程、模式識別等多個(gè)學(xué)科[1]。智能視頻監(jiān)控技術(shù)的研究包括對動態(tài)場景中的目標(biāo)定位、目標(biāo)識別和目標(biāo)跟蹤等,并在此基礎(chǔ)上分析和判斷目標(biāo)的行為,獲得對圖像內(nèi)容的理解及對客觀場景的解釋,從而對行動進(jìn)行指導(dǎo)和規(guī)劃[2-3]。
運(yùn)動目標(biāo)檢測主要是從序列圖像中將變化區(qū)域從背景中分離出來。在進(jìn)行運(yùn)動檢測時(shí),常見的一種方法是攝像設(shè)備處于靜止?fàn)顟B(tài),而且鏡頭焦距也是固定的,此時(shí),圖像中的背景區(qū)域固定不動。這種情況下通常使用以下3種方法進(jìn)行運(yùn)動檢測:光流法[4]、相鄰幀差法[5]、背景差法[6]。
光流法可以在不需要背景區(qū)域的任何先驗(yàn)知識情況下,就能夠?qū)崿F(xiàn)對運(yùn)動目標(biāo)的檢測和跟蹤,并且可以應(yīng)用在攝像機(jī)運(yùn)動的情況。但光流法計(jì)算量太大,而且對噪聲較敏感,對硬件的要求也比較高。
相鄰幀差法能適應(yīng)環(huán)境的動態(tài)變化,實(shí)現(xiàn)實(shí)時(shí)的運(yùn)動動態(tài)檢測,但分割出的運(yùn)動目標(biāo)不太完整。如果運(yùn)動目標(biāo)的速度過快,可能會檢測2個(gè)運(yùn)動目標(biāo),如果運(yùn)動目標(biāo)的速度很慢甚至在場景中停止,可能就檢測不出運(yùn)動目標(biāo)。在一個(gè)場景中如果有多個(gè)運(yùn)動目標(biāo),該方法會很難區(qū)分各個(gè)運(yùn)動目標(biāo)。
背景差法是一種最為簡單和有效的方法,此方法通過當(dāng)前幀減去背景參考幀,然后對所得圖像選擇合適的閾值二值化后,就得到完整的運(yùn)動目標(biāo),這樣,克服了相鄰幀差法的缺點(diǎn)。但背景往往會發(fā)生變化,使得檢測出的運(yùn)動目標(biāo)出現(xiàn)偏差。因此,如果背景圖像能自適應(yīng)更新,背景差法的效果會比較好。
本研究選用新近出現(xiàn)的多尺度幾何分析方法——有限線積分變換作為研究工具,再結(jié)合背景差法對運(yùn)動目標(biāo)進(jìn)行檢測。實(shí)驗(yàn)結(jié)果表明,該方法能有效檢測呈現(xiàn)出線性特征的運(yùn)動目標(biāo),且對光照變化具有一定的魯棒性。
2005年,Yang M Q等提出了有限線積分變換[7](finite line integral transform,F(xiàn)LIT)?,F(xiàn)以5×5的模板為例,對FLIT進(jìn)行介紹,如圖1所示。圖1中,相同數(shù)字的方格屬于同一條直線,方格X表示屬于任何一條直線。
從圖1可以看出:每條直線都通過模板中心的方格;所有的直線都只在模板中心方格處相交;除模板中心方格外,其余的每個(gè)方格只屬于一條直線;關(guān)于模板中心方格對稱的方格屬于同一條直線。更一般的形式,設(shè)模板尺寸為p×p(p為一奇數(shù)),按上述方式定義出的直線共2(p-1)條。(當(dāng)p≥7時(shí),定義直線的方式不唯一。)設(shè)模板中心方格的坐標(biāo)為(x,y),則在點(diǎn)(x,y)處的FLIT定義如下[7]:
圖1 5×5的模板Fig.1 5×5template
式(1)中:Lk—標(biāo)記為k的那些方格的集合,不同的k代表了不同斜率的直線集合,k的取值范圍是1≤k≤2(p-1);f(i,j)—(i,j)點(diǎn)的像素值。
對于一幅尺寸大小為m×n的圖像而言,相應(yīng)的FLIT計(jì)算步驟如下[7]:
1)確定模板尺寸p×p,p為一奇數(shù)。
2)對圖像進(jìn)行延拓操作,上、下、左、右分別加(p-1)/2行或列的零值,延拓后的圖像尺寸變?yōu)閙′×n′,其中m′=m+p-1,n′=n+p-1。像素值記為f′(i′,j′),其中0≤i′≤m′-1,0≤j′≤n′-1。
3)對滿足
的任一像素點(diǎn)f′(i′,j′),記以(i′,j′)為中心,p×p的區(qū)域?yàn)镈(i′,j′),將D(i′,j′)內(nèi)的圖像轉(zhuǎn)換為零均值的圖像。
4)計(jì)算(i′,j′)點(diǎn),共2(p-1)個(gè)方向的FLIT。
5)對滿足式(2)的所有像素點(diǎn),依次重復(fù)步驟3和步驟4。
對運(yùn)動目標(biāo)檢測的研究采用“FLIT+背景差法”,算法步驟如下:
設(shè)圖像尺寸為m×n,
1)分別對背景圖像和當(dāng)前圖像作5×5的FLIT,記作bFLIT(k,i,j)和pFLIT(k,i,j),其中0≤k≤7,0≤i≤m-1,0≤j≤n-1。
2)?k∈ {0,1,2,3,4,5,6,7},計(jì)算背景圖像FLIT和當(dāng)前圖像FLIT差值系數(shù)的絕對值
的均值mk和方差σk(共有8組均值和方差),相應(yīng)的計(jì)算表達(dá)式為,
3)對dk,k∈ {0,1,2,3,4,5,6,7}分別進(jìn)行二值化,二值化的規(guī)則如下:
式(5)中:t— 常數(shù),常取t=1;1代表運(yùn)動目標(biāo),0代表背景。
4)對代表不同方向特征的8幅二值圖像進(jìn)行綜合,綜合的原則是:突出需要的方向特征,抑制不需要的方向特征。例如,由先驗(yàn)知識知道,某序列圖像的運(yùn)動目標(biāo)主要以垂直方向?yàn)橹?,則在綜合不同方向特征的8幅二值圖像時(shí),圖1模板中1~5的方向特征則需突出(特征權(quán)重大),6~8的方向特征則需抑制(特征權(quán)重?。?。
5)采用數(shù)學(xué)形態(tài)學(xué)中的開操作來解決孤立噪聲(光噪變化引起)的問題。開操作是先腐蝕后膨脹的過程,相關(guān)的定義如下[8]:
A用B來腐蝕、膨脹,分別記做AΘB、A⊕B
式(7)中:^B = {w|w =-b,b∈B}。
實(shí)驗(yàn)數(shù)據(jù)來自文獻(xiàn)[9],實(shí)驗(yàn)環(huán)境為PC+Microsoft Visual C++6.0。圖2為背景圖像和一幀序列圖像。圖3為對背景圖像和檢測圖像分別作5×5的FLIT,并使用背景差法且二值化后的8個(gè)方向的圖像。圖4為綜合8幅圖像并進(jìn)行形態(tài)學(xué)操作后的結(jié)果。圖5是為顯示檢測結(jié)果的正確性和合理性,將圖4中的檢測結(jié)果映射到原檢測圖像上的顯示。結(jié)合圖4和圖5可以看出,除了區(qū)域1(由光照變化引起)外,區(qū)域2、3、4、5都是期望被檢測出的結(jié)果。區(qū)域2是背景圖像中交談的2個(gè)人,其相對位置發(fā)生了移動;區(qū)域3是相對于背景圖像新走進(jìn)的2個(gè)行人;區(qū)域4是遠(yuǎn)處一個(gè)行人走過引起圖像局部的變化(局部放大圖如圖6所示);區(qū)域5是一個(gè)行人走到柱子后面,露出了其腳后跟(局部放大圖如圖7所示)。區(qū)域1、2、3、4、5的共同點(diǎn)在于,它們都呈現(xiàn)出一定的線性特征,這正是它們能被FLIT檢測到的根本原因。圖8是檢測出由于行人的影子使背景(如柱子表面)呈現(xiàn)出線性特征變化的區(qū)域。
圖2 實(shí)驗(yàn)圖像Fig.2 Experiment images
圖3 不同方向上的檢測結(jié)果Fig.3 Detection results of different orientations
圖4 運(yùn)動目標(biāo)檢測結(jié)果Fig.4 Detection result of moving object
圖5 檢測結(jié)果在檢測圖像上的映射Fig.5 Mapping of detection result in dection image
總的來說,在筆者所做的實(shí)驗(yàn)圖像序列中,當(dāng)前檢測圖像中的地板、柱子表面、墻面等與參考圖像中的地板、柱子表面、墻面等相比,都存在或多或少的光照變化,而這些變化都不是實(shí)驗(yàn)所關(guān)心的。在絕大部分的檢測結(jié)果中可以看到,上述變化對感興趣運(yùn)動目標(biāo)的檢測影響較小。因此,該方法對光照變化具有一定的魯棒性。
圖6 區(qū)域4的圖像放大圖Fig.6 Enlarged images of region 4
圖7 區(qū)域5的圖像放大圖Fig.7 Enlarged images of region 5
圖8 實(shí)驗(yàn)結(jié)果Fig.8 Experiment result
本研究以新近出現(xiàn)的多尺度幾何分析方法FLIT為基礎(chǔ),結(jié)合背景差法來進(jìn)行運(yùn)動目標(biāo)的檢測。實(shí)驗(yàn)結(jié)果表明,該方法對具有線性特征的目標(biāo)能進(jìn)行有效的檢測,并對光照變化具有一定的魯棒性。同時(shí),該方法對運(yùn)動目標(biāo)的檢測還存在少量的漏檢測或過檢測的情況,因此,呈現(xiàn)出運(yùn)動目標(biāo)不完整或者是引入非感興趣的運(yùn)動目標(biāo)。這些是下一步研究需要解決的問題。
[1] 王素玉,沈蘭蓀.智能視覺監(jiān)控技術(shù)研究進(jìn)展[J].中國圖象圖形學(xué)報(bào),2007,12(9):1505-1514.
[2] 牛少平.計(jì)算機(jī)視頻監(jiān)控技術(shù)研究[D].西安:西北工業(yè)大學(xué),2006.
[3] 謝少林.智能監(jiān)控系統(tǒng)中高壓縮比視頻處理研究[D].杭州:浙江大學(xué),2006.
[4] Smith S M,Brady J M.ASSET-2:Real-time motion segmentation and shape tracking[C]∥Fifth Internation Conference on Computer Vision.Cambridge,MA:IEEE Computer Society,1995:814-820.
[5] Meier T,Ngan K N.Automatic segmentation of moving objects for video object plane generation[J].IEEE Transactions on Circuits and systems for Video Technology,1998,8(5):525-538.
[6] Stauffer C,Grimson W E L.Adaptive background mixture models for real-time tracking[C]∥Conference on Computer Vision and Patten Recognition.Fort Collins,CO:IEEE Computer Society,1999:246-252.
[7] Yang M Q,Peng Y H,Liu Y X.The algorithm and application of finite line integral transform[C]∥Microwave,Antenna,Propagation and EMC Technologies for Wireless Communications.Beijing:IEEE Computer Society,2005:411-414.
[8] Gonzalez C R,Woods R E.Digital Image Processing[M].2nd ed.Beijing:Publishing House of Electronics Industry,2005,519-527.
[9] Online Computer Computers,Inc.History of OCLC[EB/OL].[2013-12-17].http:∥homepages.inf.ed.a(chǎn)c.uk/rbf/CAVIAR/.