樊秋月
(廣東科學(xué)技術(shù)職業(yè)學(xué)院,廣東 珠海 519090)
隨著計(jì)算機(jī)視覺技術(shù)的不斷發(fā)展,視頻處理的應(yīng)用也越加廣泛,尤其是采用圖像處理技術(shù)對(duì)特定的視頻運(yùn)動(dòng)對(duì)象的自動(dòng)檢測,識(shí)別,跟蹤等智能監(jiān)控,有著非常廣泛的應(yīng)用前景。計(jì)算機(jī)視覺監(jiān)控技術(shù)能夠利用計(jì)算機(jī)視覺和圖像處理的方法建立一個(gè)智能管理系統(tǒng),通過對(duì)攝像機(jī)拍錄的視頻序列來進(jìn)行分析來實(shí)現(xiàn)行人的定位、識(shí)別和跟蹤,從而提供了一種更加先進(jìn)和可行的智能處理方案[1]。行人人數(shù)監(jiān)視與統(tǒng)計(jì)技術(shù)是當(dāng)今世界智能視覺系統(tǒng)研究中一個(gè)十分活躍的新領(lǐng)域。人數(shù)監(jiān)視與統(tǒng)計(jì)在居民小區(qū)、地鐵、超市出入口中有著廣泛的應(yīng)用需求[2]。
傳統(tǒng)的人數(shù)統(tǒng)計(jì)方法是利用人工計(jì)數(shù)或人工電子設(shè)備觸發(fā)計(jì)數(shù),隨著信息化時(shí)代的到來,發(fā)展一種自動(dòng)化的人數(shù)統(tǒng)計(jì)方法顯得十分必要。通常采用的人數(shù)統(tǒng)計(jì)方法主要有紅外檢測法、密度檢測法以及圖像處理法[3]。紅外檢測法是一種較精確的方法,當(dāng)人通過時(shí)遮住了紅外射線,從而完成一次脈沖計(jì)數(shù),但對(duì)于較多的人同時(shí)通過的場合,則顯得無能為力,同時(shí)安裝起來比較復(fù)雜,應(yīng)用場合也受到一定的限制;而密度檢測法是一種大范圍的粗略檢測法,根據(jù)密度分布來估算人數(shù)?,F(xiàn)找到切實(shí)可行的方法,既能滿足較高的實(shí)時(shí)性要求,也可以采用現(xiàn)有的普通PC機(jī)來處理圖像數(shù)據(jù)。
模糊集使得某元素可以以一定程度屬于某集合,某元素屬于某集合的程度由0與1之間的一個(gè)數(shù)值——隸屬度來刻畫和描述[4]。把一個(gè)具體的元素映射到一個(gè)合適的隸屬度是由隸屬度函數(shù)來實(shí)現(xiàn)的。隸屬度函數(shù)可以取任意的形狀,但要簡單、方便、快速、有效,而且其值域?yàn)閇0,1]。常見的隸屬度函數(shù)有以下幾種:
示意圖見圖1(c)。三角形隸屬度函數(shù),其表達(dá)式為:
示意圖見圖1(d)。
模糊邏輯是普通二值邏輯的推廣,在模糊邏輯中,任何陳述都以一定程度的真實(shí)性表示,其取值為0與1之間的數(shù)值,對(duì)應(yīng)的模糊邏輯運(yùn)算主要有:
邏輯與:μA∩B( x) = min[μA( x) ,μB(x )],邏輯或:μA∪B(x)=max[μA( x) ,μB( x )];邏輯非:μA(x) =1 - μA(x)。模糊推理是采用模糊邏輯由給定的輸入到輸出的映射過程。其主要包括五個(gè)步驟:①輸入變量模糊化,即把確定的輸入轉(zhuǎn)化為由隸屬度描述的模糊集;②在模糊規(guī)則的前件中應(yīng)用模糊算子(與、或、非);③根據(jù)模糊蘊(yùn)含運(yùn)算由前件推斷結(jié)論;④合成每一個(gè)規(guī)則的結(jié)論部分,得出總的結(jié)論;⑤反模糊化,即把輸出的模糊量轉(zhuǎn)化為確定的輸出。
首先確定監(jiān)視區(qū)范圍,即感興趣的區(qū)域,而在監(jiān)視區(qū)范圍外的點(diǎn)不予考慮。這樣既可以減少噪聲的干擾,又可以提高處理速度。對(duì)于差減后的圖像,采用比較低的閾值,這樣可以將人物盡可能地包括進(jìn)來。人物區(qū)域相對(duì)像素?cái)?shù)較多,而噪聲則比較分散,故形態(tài)學(xué)濾波無疑是一種很好的去噪方法。理想情況下,同一個(gè)人的各個(gè)部分是連在一起的,但有時(shí)由于衣服顏色或光照條件的影響,使得人的各個(gè)部分被分離成若干塊,此時(shí)可以將面積相對(duì)較小且相距較近的連通體連接,就可以盡可能地避免多計(jì)數(shù)或少計(jì)數(shù)現(xiàn)象的發(fā)生。處理之后的連通體個(gè)數(shù)即為總的人數(shù),但們還無法分清他們的去向(即進(jìn)入還是離開)。確定去向的策略如下:首先從上到下,從左到右在形態(tài)學(xué)濾波后的圖像上找到該連通體的第一個(gè)點(diǎn),并在未進(jìn)行形態(tài)學(xué)濾波的圖像(因形態(tài)學(xué)濾波會(huì)濾除一些細(xì)節(jié))的某個(gè)鄰域內(nèi)搜尋真正的頭頂點(diǎn),找到頭頂以后,將該點(diǎn)縱向坐標(biāo)向下移動(dòng)某個(gè)數(shù)值,橫向坐標(biāo)分別向左右兩個(gè)方向移動(dòng)某個(gè)數(shù)值檢測頭寬。然后根據(jù)人頭部的比例關(guān)系(一般頭部的長度與寬度之比在1或多一點(diǎn),本文中取1.2),在一個(gè)局部矩形區(qū)中檢測頭發(fā)和膚色區(qū)域并記錄兩者的像素?cái)?shù),求出各自所占的百分比。取局部矩形區(qū)的縱向平分線,并在其中找出頭部區(qū),計(jì)算平均灰度值。將膚色所占百分比和平均灰度值作為模糊推理的前提條件件進(jìn)行模糊判決。
圖1 隸屬度函數(shù)曲線示例圖
下面對(duì)模糊推理加以較詳細(xì)地論述。膚色所占百分比的論域?yàn)閇0 0.8],分成三個(gè)隸屬度函數(shù),小、中、大,函數(shù)類型取比較簡單的三角形,隸屬度的中心點(diǎn)分別為 0.2、0.4、0.6,函數(shù)取點(diǎn)均為181,如圖2(a)所示;平均灰度值的論域?yàn)閇0 80],隸屬度的中心點(diǎn)分別為20、40、60,如圖2(b)所示;輸出變量進(jìn)入可能性的論域?yàn)閇0 1],隸屬度的中心點(diǎn)分別為0.25、0.5、0.75,如圖2(c)所示。
圖2 輸入輸出隸屬度函數(shù)示意圖
在if-then模糊規(guī)則中,if部分是規(guī)則的前提條件,then部分則是結(jié)論或后件。模糊規(guī)則為:
①if(膚色百分比?。﹐r(平均灰度值?。﹖hen(進(jìn)入可能性?。?;
②if(膚色百分比中)or(平均灰度值中)then(進(jìn)入可能性中);
③if(膚色百分比大)or(平均灰度值大)then(進(jìn)入可能性大)。
應(yīng)用模糊算子取或算子中的模糊并(max);模糊蘊(yùn)含算子取最小運(yùn)算;糊合成算子取模糊并反模糊化使用中心法。整個(gè)模糊推理過程如圖3所示。
圖3 模糊推理過程示意圖
在圖中,假設(shè)膚色百分比為0.64,平均灰度值為49,經(jīng)模糊推理后,進(jìn)入可能性為0.638,即此人應(yīng)為進(jìn)入小區(qū)。
為了盡量防止多計(jì)數(shù)和少計(jì)數(shù)現(xiàn)象的發(fā)生,采樣間隔應(yīng)根據(jù)實(shí)際情況進(jìn)行選取,可以將普通人通過監(jiān)視區(qū)域的時(shí)間作為標(biāo)準(zhǔn)。
在實(shí)際處理中,考慮了人物正向、側(cè)向和背向以及多人進(jìn)出、衣服顏色干擾等多種情況。針對(duì)監(jiān)視區(qū)域的大小,采樣頻率取為每八秒一幀。
下面以多人進(jìn)出為例加以說明。
圖4 小區(qū)監(jiān)視與人數(shù)統(tǒng)計(jì)處理示例圖
從上圖中可見,接合處理有效地防止了多計(jì)數(shù)現(xiàn)象的發(fā)生。圖中三個(gè)人的膚色百分比分別為0.6、0.64、0.44,平均灰度值分別為61、49、43,進(jìn)入可能性分別為0.75、0.6385、0.5595,均大于閾值0.5,故三人均為進(jìn)入。從這個(gè)角度來說,基于視頻圖象處理的人數(shù)統(tǒng)計(jì)方法在實(shí)際應(yīng)用中的準(zhǔn)確率是很高的,所以可以應(yīng)用于實(shí)際中。
通常模糊推理由于速度較慢、推理復(fù)雜等因素較少用于實(shí)時(shí)圖像處理中,但這里的問題較適合于其使用,因?yàn)橛赡w色百分比和平均灰度值信息判斷進(jìn)入還是離開本來就是一個(gè)不確定的問題,此時(shí)用模糊推理和模糊判別來處理比較適合,同時(shí),該應(yīng)用是每隔若干秒才拍一幀,所以模糊處理時(shí)間上也滿足條件。作為一種比較新的應(yīng)用,在嘗試和探索中還有一些需要解決的問題。彩色視頻圖像雖然具有比灰度圖像更多的信息量,但其應(yīng)用場合可能會(huì)受到一定的限制,如在夜晚效果可能較差一些。各個(gè)閾值的選取也會(huì)隨著應(yīng)用場合的變化而變化,或許在這種場合比較合適而在另一種場合效果就變得較差。這些問題需要在以后的嘗試和探索中進(jìn)一步來解決。
[1] 鮑占闊.基于視頻圖像的交通信息處理方法研究與實(shí)現(xiàn)[D].北京:北京工業(yè)大學(xué),2006.
[2] Xu Xiaowei, Wang Zhiyan, Liang Yinghong, et al. A Rapid Method for Passing People Counting in Monocular Video Sequences[C].USA:IEEE,2007:1657-1662.
[3] Valle Jr,Oliveira J D,Koerich L E S, et al. People Counting in Low Density Video Sequences. Conference[C]. Heidelberg:Springer Berlin 2007:737-748.
[4] 程科.模糊形態(tài)學(xué)技術(shù)及其在圖像處理中的應(yīng)用[D].南京:南京理工大學(xué),2005.