向 曼
(上海大學(xué)數(shù)碼藝術(shù)學(xué)院,上海 201800)
視覺圖像是一類快速移動(dòng)的圖像,背景目標(biāo)識(shí)別技術(shù)已經(jīng)成為人們所關(guān)注的焦點(diǎn),背景信息分割目標(biāo)無效特征的存在使得背景提取無效的現(xiàn)象,導(dǎo)致目標(biāo)信息識(shí)別準(zhǔn)確率低、識(shí)別結(jié)果不完整,因此,如何高效識(shí)別視覺圖像背景,是現(xiàn)在相關(guān)研究領(lǐng)域的重要挑戰(zhàn)之一。
文獻(xiàn)[1]分析圖像背景區(qū)域內(nèi)灰度的統(tǒng)計(jì)特性,對(duì)視覺圖像背景區(qū)域進(jìn)行統(tǒng)計(jì)特性擬合,建造圖像背景區(qū)域模型,使用Kolmogorov距離誤差測評(píng)對(duì)視覺圖像背景進(jìn)行識(shí)別。但該方法在建造背景區(qū)域模型的過程中較為粗略,導(dǎo)致識(shí)別圖像背景時(shí)會(huì)出現(xiàn)識(shí)別不完整現(xiàn)象。文獻(xiàn)[2]提出非接觸指紋圖像識(shí)別算法,構(gòu)建圖像背景模型,將模型中的Cb分量和Otsu法結(jié)合,使用高頻強(qiáng)調(diào)濾波與迭代自適應(yīng)直方圖,增強(qiáng)處理圖像背景,提取圖像背景特征,識(shí)別出視覺圖像的背景反饋信息。該方法存在兩次增強(qiáng),導(dǎo)致識(shí)別圖像背景的效率較低。文獻(xiàn)[3]提出了一種基于機(jī)器視覺的實(shí)時(shí)動(dòng)態(tài)多目標(biāo)識(shí)別的方法。該方法首先根據(jù)前后幀之間像素的變化,分割出運(yùn)動(dòng)目標(biāo)和樣本圖像,然后使用Gabor濾波器提取圖像的特征,得到特征向量。最后使用Fisher判別準(zhǔn)則分類識(shí)別,將得到的分類識(shí)別結(jié)果自動(dòng)標(biāo)注在輸出圖像中,并且將其連續(xù)輸出。上述方法在特定的視覺圖像中有著較好的識(shí)別效果,但是視覺圖像種類較多,大多數(shù)圖像背景無法使用卡爾曼濾波預(yù)測和均值漂移思想,導(dǎo)致該方法在識(shí)別圖像背景中受到類型限制較嚴(yán)重。
針對(duì)上述問題,本文提出一種視覺圖像背景多目標(biāo)反饋信息自動(dòng)識(shí)別。通過歸一化處理背景目標(biāo)跟蹤與反饋信息,分類視覺圖像目標(biāo),提取多目標(biāo)分割閾值,從而實(shí)現(xiàn)反饋信息自動(dòng)識(shí)別。旨在達(dá)到有效提取信息分割閾值,在分割以后的圖像區(qū)域有效判別提取背景,準(zhǔn)確識(shí)別圖像背景多目標(biāo)反饋信息。
針對(duì)新目標(biāo)的判斷,若運(yùn)動(dòng)的目標(biāo)在進(jìn)入監(jiān)控場景后,需要檢測出與其相應(yīng)區(qū)域沒有任何目標(biāo)模板對(duì)應(yīng),就可以判定該區(qū)域內(nèi)有新的運(yùn)動(dòng)目標(biāo)出現(xiàn),為此,需要建立一個(gè)與新目標(biāo)所相應(yīng)的臨時(shí)模板信息進(jìn)行跟蹤。在對(duì)運(yùn)動(dòng)目標(biāo)的跟蹤過程中,提取運(yùn)動(dòng)目標(biāo)的位置信息和顏色等特征,識(shí)別運(yùn)動(dòng)目標(biāo)信息[4]。
圖像中的目標(biāo)離開場景區(qū)域時(shí)進(jìn)行判斷,考慮兩種情況,一是目標(biāo)本身運(yùn)動(dòng)出監(jiān)控的區(qū)域,假如運(yùn)動(dòng)目標(biāo)的矩形框觸碰到了監(jiān)控的范圍,同樣可以放棄對(duì)目標(biāo)的跟蹤;二是跟蹤的目標(biāo)沒有運(yùn)動(dòng)出監(jiān)控的范圍,不過在較長的時(shí)間里被判定為目標(biāo)丟失的情況,出現(xiàn)這種情況,就需要考慮此目標(biāo)相對(duì)的模板信息[5]。
在實(shí)際的監(jiān)控場景中,其運(yùn)動(dòng)目標(biāo)在臨近兩幀之間的距離相對(duì)較小,之后利用矩陣框的中心為跟蹤特征。將Po,i(xi,yi)設(shè)為第i個(gè)所檢測至區(qū)域中心的坐標(biāo),Pd,j(xj,yj)代表第j個(gè)所檢測至區(qū)域中心的坐標(biāo),計(jì)算兩個(gè)坐標(biāo)的歐式距離d:
(1)
若d小于閾值Th,初步判定第i個(gè)小目標(biāo)與第j個(gè)區(qū)域很有可能是相似的目標(biāo)[6]。目標(biāo)連續(xù)跟蹤的幀數(shù)在達(dá)到給定閾值時(shí),則可以判定為場景區(qū)域中的真實(shí)目標(biāo),否則就是虛假目標(biāo),應(yīng)當(dāng)放棄跟蹤,并且與要將目標(biāo)所相對(duì)應(yīng)的模板信息進(jìn)行清除。
對(duì)于目標(biāo)丟失判斷,假如某個(gè)運(yùn)動(dòng)目標(biāo)并沒有與任何所檢測到的運(yùn)動(dòng)區(qū)域進(jìn)行匹配,則可以認(rèn)為該目標(biāo)是因?yàn)樘幱谔厥鈭鼍安胖率箾]有被檢測到,這時(shí)候可以認(rèn)為該目標(biāo)已經(jīng)丟失,則需要暫時(shí)停止跟蹤,若目標(biāo)一直被判定為丟失,其幀數(shù)到達(dá)給定的幀數(shù)時(shí),就可以確認(rèn)目標(biāo)丟失[7]。
在其初步判定之后,計(jì)算相應(yīng)的多目標(biāo)模板區(qū)域和檢測區(qū)域的顏色直方圖。利用視覺一致性的HSV顏色空間,提取出S分量和H分量,并且將H分量分成30個(gè)小空間,S分量分成6個(gè)小空間,提取目標(biāo)圖像中的像素點(diǎn),統(tǒng)計(jì)各空間像素點(diǎn)數(shù)量,得到所有顏色的直方圖hist函數(shù)。
(2)
基于顏色直方圖hist函數(shù),歸一化處理圖像背景多目標(biāo)反饋信息,其公式為
(3)
式中:hist1、hist2分別代表目標(biāo)模板區(qū)域與檢測區(qū)域的顏色直方圖,而B代表兩個(gè)直方圖之間的巴氏距離,B越小,兩個(gè)顏色之間的直方圖相似程度就越高;反之,直方圖相似程度越小[8]。
第一層分類器所檢測出的是背景目標(biāo),分為行人與車輛兩種類型,而第二層則是分類器將第一層分類器所識(shí)別出來的行人進(jìn)一步分為靜止行人與車輛,運(yùn)動(dòng)行人與車輛兩種。
相對(duì)于第一層分類器,在提取出背景目標(biāo)以后,將輪廓面積ConArea作為分類判斷因子,計(jì)算離散度Dispersion,其公式表達(dá)式為
(4)
AspectRation=RHeight/RWidth
(5)
式中:CLength是輪廓的周長,RWidth和RHeight分別代表目標(biāo)輪廓矩形的高和寬,AspectRation表示目標(biāo)輪廓擬合的矩形長寬比。
對(duì)于第二層分類器,背景檢測后提取目標(biāo),引入?yún)?shù)靜止幀數(shù)sCount且初始化為零,需要判斷所有的真實(shí)目標(biāo)兩幀之間的距離,如果兩幀之間的距離閾值d小于靜止距離的閾值Th,即可以定義為此目標(biāo)是靜止的,sCount加1;假如連續(xù)靜止的幀數(shù)sCount>15,即可以說明該目標(biāo)是運(yùn)動(dòng)的。該方法能夠識(shí)別出行人從靜止到運(yùn)動(dòng)的狀態(tài),并且成功的對(duì)目標(biāo)消失以及新目標(biāo)的出現(xiàn)進(jìn)行有效并正確的處理[9]。
圖像分析處理過程,就是指圖像中某些特定的性質(zhì)區(qū)域。這些區(qū)域被稱為目標(biāo),而其它區(qū)域則被稱為背景。閾值的選取是閾值分割的關(guān)鍵技術(shù)。如果閾值的選擇過高,那么過多的目標(biāo)點(diǎn)將會(huì)被誤以為是背景;反之,閾值選擇過低,那么會(huì)出現(xiàn)一些相反的現(xiàn)象。因此,為了對(duì)目標(biāo)區(qū)域進(jìn)行識(shí)別分析,需要提取區(qū)域背景閾值。
閾值法是比較常用的一種圖像分割算法,原理算法如下:將原始灰度圖像設(shè)為f(x,y),以一定的準(zhǔn)則在f(x,y)中找出一個(gè)灰度值Th視為閾值。把圖像分割成兩部分,即分割后的二值圖像g(x,y)為
g(x,y)=Thf(x,y)
(6)
采用局部閾值法,通過圖像像素灰度與圖像像素周圍局部灰度的特性來確認(rèn)像素的閾值。對(duì)目標(biāo)的大小與像素灰度值不同的圖像均可以產(chǎn)生較好的分割效果,尤其在分割多目標(biāo)時(shí),其原理如下。
圖像的灰度值范圍時(shí)1~L,先將圖像的全部像素分成兩個(gè)大組:集灰度的范圍是(1,2,…,k)的一組與灰度范圍為(k+1,k+2,…,k)的一組,其概率如下
(7)
式中:ni代表為第i個(gè)像素點(diǎn);N代表整個(gè)圖像的像素點(diǎn);Pi代表像素點(diǎn)i出現(xiàn)的頻率;ω(k)代表像素點(diǎn)i出現(xiàn)的頻率總和。
整幅視覺圖像的分割閾值提取公式為
(8)
兩大組之間的方差為
σ2(Th)=ω0(Th)μ0+ω1(Th)μ1
(9)
式中:μ0與μ1分別是兩大組的各自平均灰度值,當(dāng)灰度從I增長至L時(shí),計(jì)算出所有的σ2(Th),尋找出使σ2(Th)達(dá)到最大值的Th值,這一灰度值就是需要尋找的閾值。
圖1 多目標(biāo)反饋信息分割流程圖
針對(duì)圖像背景區(qū)域在初始化后,都需要進(jìn)行背景的提取,然后跟蹤達(dá)到輪廓閾值的真實(shí)背景目標(biāo),其跟蹤目標(biāo)的過程中,需要先對(duì)目標(biāo)分類。對(duì)于運(yùn)動(dòng)目標(biāo),直接按照初始圖像和背景進(jìn)行更新,而對(duì)于不確定是否會(huì)運(yùn)動(dòng)的目標(biāo),則需要利用同一目標(biāo)的中心點(diǎn)距離對(duì)目標(biāo)進(jìn)行判斷是否靜止,而對(duì)于非靜止的目標(biāo)區(qū)域,既需要通過初始的參數(shù)更新高斯模型,而對(duì)于靜止目標(biāo),需要通過零學(xué)習(xí)率來進(jìn)行更新,利用這種控制方法融入背景。針對(duì)于不同的目標(biāo),要利用不同的更新率,才可以防止需要檢測的目標(biāo)背景融入背景中[10]。
視覺圖像運(yùn)動(dòng)區(qū)域和背景區(qū)域二者所采用的更新策略是相同的,統(tǒng)稱為其它區(qū)域。不過圖像中的靜止區(qū)域,將其學(xué)習(xí)率歸置零,對(duì)該區(qū)域的背景融入進(jìn)行控制[11],具體的方法如圖2所示。
圖2 測量直角坐標(biāo)系下目標(biāo)運(yùn)動(dòng)軌跡
在分割以后的圖像區(qū)域可以有效判別提取背景,即:當(dāng)圖像目標(biāo)區(qū)域處于邊緣或者是已經(jīng)被截取的情況下,這樣的目標(biāo)特征是不完整的,所以須判定為無效。使用標(biāo)志目標(biāo)基本為圓形或者是橢圓形,并依據(jù)目標(biāo)的基本判斷:目標(biāo)區(qū)域的周長、面積以及緊湊度。
圖像背景多目標(biāo)反饋信息自動(dòng)識(shí)別通過下列步驟進(jìn)行計(jì)算的:
1)利用隔行掃描的八鄰域編碼邊界跟蹤方法,構(gòu)建其目標(biāo)區(qū)域的周長鏈碼描寫;
通過上述步驟,獲取目標(biāo)識(shí)別參數(shù),完成視覺圖像背景多目標(biāo)反饋信息自動(dòng)識(shí)別。
為了驗(yàn)證所提方法的有效性,進(jìn)行仿真實(shí)驗(yàn)。圖像組為某監(jiān)控區(qū)域嚴(yán)格配準(zhǔn)的前后聚焦圖像。實(shí)驗(yàn)參數(shù)設(shè)置如表1所示。
表1 實(shí)驗(yàn)參數(shù)設(shè)置
將測量直角坐標(biāo)系下的目標(biāo)運(yùn)動(dòng)軌跡變換至測量極坐標(biāo)系下,由此得到目標(biāo)的距離、方位和俯仰角度,這些數(shù)據(jù)作為目標(biāo)測量真值數(shù)據(jù)被保存,如圖2所示。
為了驗(yàn)證多目標(biāo)反饋信息自動(dòng)識(shí)別效果,結(jié)果如圖3所示。
圖3 背景識(shí)別結(jié)果分析
通過上圖能夠看出,本文方法進(jìn)行識(shí)別過后的圖像背景,并沒用出現(xiàn)細(xì)節(jié)丟失現(xiàn)象,同樣對(duì)多個(gè)目標(biāo)的識(shí)別較為全面,通過兩者比較之下,說明本方法要優(yōu)于傳統(tǒng)方法,更加具有有效性。
由圖4可以看出,目標(biāo)的局部背景比較簡單,經(jīng)過背景閾值分割后,在分割以后的圖像區(qū)域可以有效提取背景。
圖4 圖像背景多目標(biāo)反饋信息背景分割結(jié)果
由圖5可以看出,本文方法對(duì)局部區(qū)域灰度特征突出的目標(biāo)能取得很好的分割效果,特別是在有遮擋的情況下,經(jīng)過對(duì)局部區(qū)間兩次迭代分割后,雜物背景均被有效分割出去。
圖5 直方圖結(jié)果分析
為了進(jìn)一步驗(yàn)證視覺圖像背景多目標(biāo)反饋信息自動(dòng)識(shí)別準(zhǔn)確度,進(jìn)行仿真,具體結(jié)果如圖6所示。統(tǒng)計(jì)50次實(shí)驗(yàn)的誤差均方根來衡量,即
(10)
采樣周期T設(shè)置為0.01s和0.05s,得到誤差均方根曲線如圖6所示。
圖6 濾波估計(jì)誤差結(jié)果分析
與圖2的運(yùn)動(dòng)軌跡對(duì)應(yīng)起來可以發(fā)現(xiàn),誤差增大的地方是在角運(yùn)動(dòng)軌跡拐彎變化明顯之處,在采樣周期比較大的情形下模型的準(zhǔn)確性對(duì)濾波精度具有較大的影響。主要原因在于本文方法在有效提取視覺圖像分割閾值的基礎(chǔ)上,完成視覺圖像背景多目標(biāo)反饋信息自動(dòng)識(shí)別,提高了識(shí)別準(zhǔn)確度。
在科技時(shí)代,人工智能已經(jīng)成為主流項(xiàng)目,所以圖像識(shí)別技術(shù),就順應(yīng)而生,傳統(tǒng)圖像識(shí)別技術(shù),是針對(duì)圖像目標(biāo)進(jìn)行識(shí)別,而本文所研究的是,圖像背景多目標(biāo)信息反饋?zhàn)R別,通過背景建模來對(duì)圖像中的運(yùn)動(dòng)目標(biāo)或者已經(jīng)靜止目標(biāo)進(jìn)行跟蹤和反饋,之后將圖像分割,最后使用特征計(jì)算法對(duì)分割后的圖像進(jìn)行計(jì)算,從而達(dá)到多目標(biāo)反饋信息有效識(shí)別的目的。此方法可以應(yīng)用于許多領(lǐng)域,來完成一些高難度的工作。所以受到廣泛的關(guān)注,使圖像背景識(shí)別的技術(shù)更加的完善。