薛振北,李澤滔
(貴州大學(xué)電氣工程學(xué)院,貴州 貴陽 550025)
行人檢測問題是計算機視覺領(lǐng)域中研究的熱點問題,它通過計算機模擬人類的視覺系統(tǒng)來處理圖像和視頻,從而在視頻監(jiān)控方面能夠省去人為統(tǒng)計的時間[1-4]。由于一般的攝像頭只可以單面照射,不能對行人進行全面拍照,而且一般情況下判斷行人進出商場的行為需要人為去觀察,本文通過雙攝像頭對行人檢測,實驗的工具為VS2010+OpenCV,系統(tǒng)能夠?qū)崿F(xiàn)在無人監(jiān)視的情況下對行人檢測及統(tǒng)計計數(shù),搭建了雙攝像頭聯(lián)合檢測行人的實驗研究平臺,取得了良好的效果。
系統(tǒng)是由兩個攝像頭對進出商場的行人進行人臉抓拍,將得到的數(shù)據(jù)傳到PC機,由PC機進行處理并得到商場的人流量,圖1為實物模擬圖。PC機的處理流程包括調(diào)用攝像頭拍攝圖像、濾波處理、運動物體檢測、人臉檢測及人數(shù)統(tǒng)計等幾個部分。本文的總體框圖如圖2所示。
圖1 實物模擬圖Fig.1 Physical simulation diagram
圖2 系統(tǒng)總體框圖Fig.2 System block diagram
由于光照、陰影等不確定因素的影響,采用攝像頭拍攝的視頻序列總會存在噪聲,而對圖像的預(yù)處理可以對圖像的噪聲進行很好的抑制,圖像預(yù)處理的流程為讀取攝像頭拍攝到的每一幀圖像,然后將圖像灰度化,最后得到的灰度圖像進行濾波處理。圖像預(yù)處理是對圖像的邊緣信息進行過濾,使圖像更易于檢測,也就是圖像的濾波。
圖像濾波的主要目的是將光照等與檢測不相關(guān)的信息去除,這一步在圖像預(yù)處理中占有最大比重,濾波的效果也是對整個系統(tǒng)的一種重要評價。經(jīng)常使用的濾波方法有很多,本文使用的方法是高斯濾波的方法,在OpenCV中可以簡單實現(xiàn),使用的GaussianBlur函數(shù)如下:C++: void GaussianBlur(InputArray src, OutputArray dst,Size ksize, double sigmaX, double sigmaY=0, int borderType)。圖像濾波的效果圖如圖3所示。
圖3 濾波效果圖Fig.3 Filtering effect diagram
光流法和幀差法是運動物體檢測的有效且常用方法,這些方法是用來檢測運動物體的,不管如何都能夠很好地“看到”運動的物體。這些方法的核心都是利用視頻幀與幀之間的區(qū)別來判斷是否有運動物體的出現(xiàn)。在這些方法中,相鄰幀差法具有很強的魯棒性,適合商場的人流量檢測的系統(tǒng)。該方法主要是利用相鄰兩幀序列圖像對應(yīng)的像素點進行作差運算,若得到的差值大于給定的閾值,則判定當(dāng)前場景中有運動目標,否則就沒有運動目標,運算的公式如下[1]:
式中Hk(x,y)是圖像序列的像素,T是事先確定的閾值,若Dk(x,y)≥T,那么就說有運動目標的出現(xiàn);若Dk(x,y)<T,那么就說沒有運動目標的出現(xiàn)。
對行人檢測方法的研究在計算機領(lǐng)域中是一項重點,也是難點[5-7]。計算機視覺是研究如何使機器代替人眼對目標進行識別的科學(xué),在行人檢測這一塊是要研究怎樣使用PC機通過攝像頭等傳感器看到物體,并判斷是否為行人,最終進行統(tǒng)計。總體來說,目前行人檢測最好的幾種方法有以下三種:改進的HOG+改進的SVM、HOF+CSS+adaboost及HOG+LBP+SVM方法[8-11],這些方法都有各自的特點,常常都是配合著來使用。本文對于實際情況,考慮商場的特點,使用改進的HOG+改進的SVM方法。
2.3.1 HOG特征
HOG(Histogram of Oriented Gradient),中文名稱是方向梯度直方圖,這是一種挖掘圖像信息的很有效的方法,這種圖像的信息稱之為梯度信息。通過計算這些梯度信息,將這些信息用直方圖表示,就構(gòu)成了HOG特征。HOG特征檢測方法是法國研究人員Dalal在2005年的CVPR會議上提出來的,后經(jīng)過專家學(xué)者的不斷改進得到現(xiàn)在的改進HOG的特征[13]。通常的情況是使用改進的HOG特征與改進的SVM分類器對行人進行綜合檢測。
由于梯度通常都是存在于邊界的地方,所以需要用很多圖像作為樣本提取行人的HOG特征,也就相當(dāng)于對圖像中局部區(qū)域進行的描述。HOG特征的主要思想是化整為零的戰(zhàn)略,將要提取特征的一幅圖像分割成很多小的區(qū)域,在這些小的區(qū)域中統(tǒng)計HOG特征,最后將小的特征進行組合,得到整體的HOG特征圖。HOG特征的提取是在局部小的連通區(qū)域中的操作,某些區(qū)域的改變不會對整幅圖像的HOG特征造成大的影響,所以該檢測方法具有很強的魯棒性,非常適合對行人目標進行檢測。采用經(jīng)典的圖像進行試驗,得到的HOG特征提取的圖像如圖4所示。
圖4 HOG特征提取圖Fig.4 HOG feature extraction diagram
HOG特征提取的過程如下:
1)由于顏色信息的作用不大,所以對圖像進行灰度化處理,減少計算機處理的信息量。
2)使用校正法對圖像的像素進行校正,所使用的方法是Gamma校正的方法。該方法的公式見式(3),式中g(shù)amma=1/2。
3)計算圖像中每個像素的梯度,其中像素點(x,y)處的梯度計算方法如下:
梯度幅值和梯度方向分別為:
4)將整幅圖像分割成許多小的方格,這些方格稱為cells(胞元)。并將固定的一些cells連成一個塊。
5)提取每一個塊的HOG特征的信息,用9個bin統(tǒng)計圖像的HOG特征,即將0°~180°平均分成9份,每個像素的梯度方向為a(x,y),屬于哪一個bin,就將該像素的信息都放在這個bin中。
6)把小的連接成大的,也就得到圖像所有的方向梯度信息。
2.3.2 SVM分類器
SVM,即支持向量機,是一種在計算機視覺領(lǐng)域中使用的分類的方法,是由分類超平面定義的一種分類方法[15-17]。本文使用SVM分類器主要是針對行人人臉的HOG特征進行分類,也就是在提供了充足的正樣本(含有人臉的圖像)及負樣本(不含人臉的圖像),并且這些正、負樣本進行了HOG特征的提取之后,由SVM分類器進行分類識別。SVM分類器的解釋的圖如圖5所示。將預(yù)先整理好的正、負數(shù)據(jù)集找到最優(yōu)的分隔超平面,提取感興趣的區(qū)域。所提到的支持向量也就是離這個分隔超平面最近的一些數(shù)據(jù)。
圖5 SVM分類器Fig.5 SVM classifier
通過使用改進的HOG+改進的SVM方法之后,對于攝像頭所拍攝的視頻幀,我們可以直接調(diào)用這種方法對圖像進行不斷地掃描,進行模板匹配,進而判斷是否有行人的出現(xiàn)[18]。通過實驗的方法得到效果圖,如圖6所示。
圖6 行人檢測效果圖Fig.6 Pedestrian detection effect diagram
本文設(shè)計的思路如圖1所示,對兩個攝像頭拍攝的圖像中的行人分別進行統(tǒng)計計數(shù),其中攝像頭1采集和統(tǒng)計的行人的數(shù)目為進入商場的人數(shù),攝像頭2采集和統(tǒng)計的行人的數(shù)目為離開商場的數(shù)目,對這兩個數(shù)據(jù)作差即為商場中的人流量[19-20]。通過實驗仿真,采用某間教室作為模擬商場的場所,得到一天中各時段教室中的人數(shù),如表1所示,對得到的數(shù)據(jù)進行分析對比,通過本文的方法得到的數(shù)據(jù)與實際的數(shù)據(jù)相差不大,能夠很好地代替工作人員的職責(zé)。
表1 人數(shù)統(tǒng)計Table1 Number statistics
在商場應(yīng)急突發(fā)事件的應(yīng)對措施中最大程度地減少人員的傷亡,需要每時每刻都能準確掌握商場內(nèi)的人員情況。為減少人員的傷亡,本文設(shè)計了對商場內(nèi)人員進行檢測的系統(tǒng)。雖然該方法還存在一些缺陷,比如對遮擋的行人的檢測效果不是很理想,但是對商場內(nèi)人數(shù)的統(tǒng)計起到了很好的作用,能夠很好地減少商場負責(zé)監(jiān)控的人員的工作量。