袁 源,樊萬梅
(1.招商局重慶交通科研設(shè)計院有限公司,重慶 400067;2.重慶大學(xué),重慶 400030)
圖像感興趣區(qū)域(region of Interest,ROI)提取技術(shù)用于提取出圖像中進一步目標(biāo)識別的至關(guān)重要的區(qū)域,主要應(yīng)用于視頻增強、理解和檢索,視頻/圖像壓縮等領(lǐng)域,是當(dāng)前圖像處理領(lǐng)域的研究熱點之一[1-6]。
目前,ROI提取技術(shù)主要分為基于視覺特征的方法和基于運動變化的方法[5]?;谶\動變化的ROI提取技術(shù)是把運動對象作為感興趣區(qū)域,如文獻[1]使用膚色提取人臉進行視頻壓縮,文獻[2]訓(xùn)練兩級神經(jīng)網(wǎng)絡(luò)分類器區(qū)分感興趣的前景和不感興趣的背景,這類方法大多都是針對娛樂視頻和視頻會議的,不適用于靜態(tài)圖像的感興趣區(qū)域的提取。而基于視覺特征的ROI提取技術(shù)從人眼的視覺特征出發(fā),通過對圖像視覺特征的分析來提取ROI,如文獻[4]利用顏色和信息熵提取ROI,雖然利用顏色和信息熵的互補作用,這種方法能提高感興趣區(qū)域檢測的準(zhǔn)確率,但也存在不足之處:當(dāng)噪聲與整幅圖像的灰度均值差值較大時,這種以引起視覺注意機制為理論基礎(chǔ)的ROI提取方法將不能抑制這些噪聲,導(dǎo)致提取出的感興趣區(qū)域包含了這些噪聲區(qū)域。
然而,在實際應(yīng)用中ROI提取算法對實時性要求較高,上述算法不能較好滿足提取要求;此外,噪聲對感興趣區(qū)域的提取具有不可忽視的影響。為此,本文考慮噪聲對ROI提取的影響,并兼顧實際應(yīng)用場景對實時性的要求。對于監(jiān)控場景背景比較單一的情況,充分利用背景區(qū)域與前景感興趣區(qū)域的不同,提出了一種基于背景統(tǒng)計的靜態(tài)圖像ROI提取算法。同時,將該算法運用于室內(nèi)監(jiān)控場景中的ROI提取,驗證了其有效性。
通常情況下,在實際應(yīng)用場景中ROI提取要求具有較好的實時性,這就要求ROI提取技術(shù)算法簡單、可靠。而在實際的應(yīng)用場景中,需要考慮噪聲對ROI提取的影響。由于監(jiān)控圖像中背景具有比較單一的特點,因此借鑒背景提取技術(shù),根據(jù)基于圖像分塊的思想對其進行處理。
首先,通過幾何方法獲取圖像的重點監(jiān)控區(qū)域。其次,對重點監(jiān)控區(qū)域進行分塊,并對分塊后的每一塊圖像計算其特征值和標(biāo)準(zhǔn)方差。然后,根據(jù)高斯分布的特性,利用在線k均值近似算法對每一塊圖像進行匹配,以此判斷其是否為背景,從而實現(xiàn)監(jiān)控區(qū)域圖像的前景和背景分離。最后,對所提取的前景目標(biāo)感興趣區(qū)域,利用形態(tài)學(xué)方法對其進行處理,以減少細小的偽前景感興趣區(qū)域,從而提高整個ROI提取算法的精度。整體算法流程如圖1所示。
圖1 基于背景統(tǒng)計的ROI提取
背景模型是以單個像素形式建立的,具有準(zhǔn)確、靈活、相對簡單等優(yōu)點,但存在抗噪能力差、執(zhí)行效率不高等問題。
針對上述不足,本文引入分塊統(tǒng)計的思想,基于圖像塊的特征建立背景模型[7]。設(shè)km(x,y)為一個m×m像素的圖像塊,(x,y)表示該圖像塊左上角的坐標(biāo)。在2×2的情況下,圖像塊中前景像素的分布組合有5種,如圖2所示。圖2(a)表示完全背景,圖2(b)有1個前景,圖2(c)有2個前景,圖2(d)有3個前景,圖2(e)為完全前景的情況。
圖2 2×2圖像塊的5種情況
為了建立基于圖像分塊的背景模型,有必要對圖像分塊數(shù)目以及所分塊后圖像的特征選擇進行闡述。圖像分塊往往具有如下特點:圖像塊越大(圖像分塊的參數(shù)越小),需要處理的圖像塊數(shù)就越少,算法的執(zhí)行效率就越高,但是也降低了對局部目標(biāo)的敏感度,導(dǎo)致目標(biāo)提取的精確度變差,這是因為目標(biāo)區(qū)域所占比例小的圖像塊的個數(shù)會增加,如圖2中(b)和(c)所示的情況,因此,在選擇m時,應(yīng)從目標(biāo)提取的敏感性、準(zhǔn)確度以及算法的執(zhí)行效率等方面綜合考慮。
為了選擇圖像塊中的特征,本文引入幾種提取圖像塊特征λ的方法:
1)以圖像塊中心點作為圖像塊的特征,即λ=中心點像素;
2)選取若干點的組合作為圖像塊的特征;
3)圖像塊的均值作為圖像塊的特征,即
4)圖像塊的行均值或圖像塊的列均值作為圖像塊的特征;
5)圖像塊的幅度值作為圖像塊的特征,即
上述特征都是圖像塊中像素的線性運算,因此,當(dāng)圖像中坐標(biāo)為(i,j)點的像素值Xij服從正態(tài)分布時,上述特征λ也將服從正態(tài)分布。
在上文提出的圖像特征中,選擇其中的1個或幾個特征 λ1,λ2,…,λs構(gòu)成特征向量,令 Λ ={λ1,λ2,…,λs}。
采用單高斯分布的形式,給出其高斯分布聯(lián)合概率密度函數(shù)
其中:Λ(i,j)表示對應(yīng)于圖像中坐標(biāo)為(i,j)圖像塊灰度值所形成的隨機變量;W代表了這一類像素;u為均值向量;Σ為灰度信息的協(xié)方差矩陣,均為高斯分布參數(shù),有訓(xùn)練樣本估計
基于像素間相互獨立的假設(shè),可以得出特征之間也是相互獨立的,為了簡化計算,可以進一步假設(shè)它們具有相同方差。式(6)和(7)表明圖像塊特征向量Λ的概率分布可由一個單高斯函數(shù)來描述,也就是說圖像塊的某種狀態(tài)可由單高斯模型的某個分量進行刻畫。
基于上述假設(shè),將所有圖像塊的特征向量值與高斯分布的特征向量進行匹配,若特征向量值落在高斯分布的標(biāo)準(zhǔn)方差的某一倍數(shù)范圍內(nèi),就認為匹配成功,具體計算方法為
若式(8)成立,則認為匹配成功,為監(jiān)控區(qū)域的背景區(qū)域,反之,則認為監(jiān)控區(qū)域的前景區(qū)域,即為目標(biāo)感興趣區(qū)域。實驗表明,對于2×2的圖像塊,τ取3比較合適。
為了驗證本文提出的基于背景統(tǒng)計的ROI提取算法的有效性,將其應(yīng)用于某室內(nèi)監(jiān)控場景,實驗平臺為Matlab7.0,實驗數(shù)據(jù)來源于某大樓室內(nèi)監(jiān)控場景中的圖像。實驗結(jié)果如圖3所示。
圖3 基于背景統(tǒng)計的處理結(jié)果
圖4 基于視覺注意機制的處理結(jié)果
由圖3可以看出,基于背景概率分布統(tǒng)計的ROI提取算法能夠提取出前景目標(biāo)的感興趣區(qū)域,處理結(jié)果較為滿意。圖4為不同k值下的感興趣區(qū)域,當(dāng)k較小時,提取出的感興趣區(qū)域(圖中小框標(biāo)記的區(qū)域)并不是我們需要監(jiān)控的目標(biāo)。隨著k取值的增大,能夠獲得監(jiān)控目標(biāo)的感興趣區(qū)域,但是當(dāng)監(jiān)控目標(biāo)的灰度值與整幅圖像均值之差小于噪聲灰度值與整幅圖像均值之差時,提取出的目標(biāo)感興趣區(qū)域?qū)肼晠^(qū)域,即引起我們視覺注意的首先是這些噪聲,其次才是監(jiān)控目標(biāo),降低了感興趣區(qū)域提取精度。通過對比實驗可以發(fā)現(xiàn),本文提出的ROI提取算法可以準(zhǔn)確地對圖像中的目標(biāo)感興趣區(qū)域?qū)嵤┨崛?,同時有效抑制了由噪聲導(dǎo)致感興趣區(qū)域的出現(xiàn),降低了誤檢率。
考慮場景中噪聲對ROI區(qū)域的影響和視覺注意機制特性,借鑒圖像分塊的思想,提出了一種基于背景統(tǒng)計的感興趣區(qū)域的提取算法。實驗結(jié)果表明:該算法不僅能夠克服基于視覺注意機制的ROI提取方法的不足,還能完成ROI提取,且提取算法相對簡單,適用于背景較單一、噪聲比ROI區(qū)域顯著情況下的感興趣區(qū)域提取。
[1]Chen M,Chi M,Hsu C,et al.ROI video coding based on H.263+with robust skin-color detection techniques[J].IEEE Transactions on Consumer Electronics,2003,49(3):724-730.
[2]Doulamis N,Doulamis A,Kalogeras D,et al.Low bit-rate coding of image sequence using adaptive regions of interest[J].IEEE Transactions on Circuits and Systems for Video Technology,1998,8(8):928-934.
[3]吳琦穎,李翠華.用于海上感興趣區(qū)域?qū)崟r分割的近似算法[J].廈門大學(xué)學(xué)報,2007,46(1):33-37.
[4]陸偉,倪林.利用顏色和熵提取感興趣區(qū)域的感性圖像檢索[J].中國圖象圖形學(xué)報,2006,11(4):492-497.
[5]鄭錦,李波.面向室外視頻監(jiān)視的感興趣區(qū)域提?。跩].中國圖象圖形學(xué)報,2010,15(9):1363-1369.
[6]何毅,陸淑娟,梅雪.基于ROI提取的多目標(biāo)圖像水平集分割[J].計算機工程,2009,35(23):214-216.
[7]楊廣林,孔令富.基于圖像分塊的背景模型構(gòu)建方法[J].機器人,2007,29(1):29-34.
[8]金濤,賈宏志.運動的目標(biāo)圓盤的輪廓和圓心提取方法研究[J].激光雜志,2010(4):24-26.
[9]范巧艷,艾斯卡爾·艾木都拉.遺傳算法優(yōu)化RBF網(wǎng)絡(luò)的圖像雜波抑制技術(shù)研究[J].激光雜志,2010(2):11-13.