崔震 靳計艷
行人檢測依據(jù)行人檢測區(qū)域的不同可以分為整體法和部分法。整體法主要是以全身信息作為判斷依據(jù),利用直方圖、小波算法等進行識別;而部分法則是將人體看作部分的組合。目前大多研究人員的重點放在人頭的檢測上,主要方法有基于模板匹配和機器學習。我們的主要研究內容是對有效區(qū)域內的運動目標進行實時檢測,然后在此基礎上對被檢測的對象進行跟蹤并統(tǒng)計該區(qū)域內的人群密度。
使用統(tǒng)計的方法實現(xiàn)背景建模及運動目標檢測是當前目標檢測方法中效果較好的一類方法。該類方法利用統(tǒng)計值表征背景,建立背景模型。不同的監(jiān)控場景有著不同的特性,背景模型因此分為單模態(tài)和多模態(tài)兩種。單模態(tài)的場景中,每個背景像素點的顏色值分布比較集中,可以用單一分布的概率模型來描述背景;而在多模態(tài)的場景中,每個背景像素點的顏色值分布非常分散,需要用多個分布的概率模型相擬合描述背景。在實際的場景中,由于光照變化、背景中輕微擾動(如戶外場景中樹枝的輕微搖擺)等因素的影響,背景模型往往是多模態(tài)的。本文主要高斯混合建模算法與幀間差分法的結合。
1.1.1 混合高斯背景建模理論
混合高斯背景建模是基于像素樣本統(tǒng)計信息的背景表示方法,利用像素在較長時間內大量樣本值的概率密度等統(tǒng)計信息(如模式數(shù)量、每個模式的均值和標準差)表示背景,然后使用統(tǒng)計差分(如3σ原則)進行目標像素判斷,可以對復雜動態(tài)背景進行建模,計算量較大。
在混合高斯背景模型中,認為像素之間的顏色信息互不相關,對各像素點的處理都是相互獨立的。對于視頻圖像中的每一個像素點,其值在序列圖像中的變化可看作是不斷產(chǎn)生像素值的隨機過程,即用高斯分布來描述每個像素點的顏色呈現(xiàn)規(guī)律:單模態(tài)(單峰),多模態(tài) (多峰)。
對于多峰高斯分布模型,圖像的每一個像素點按不同權值的多個高斯分布的疊加來建模,每種高斯分布對應一個可能產(chǎn)生像素點所呈現(xiàn)顏色的狀態(tài),各個高斯分布的權值和分布參數(shù)隨時間更新。當處理彩色圖像時,假定圖像像素點R、G、B三色通道相互獨立并具有相同的方差。對于隨機變量X的觀測數(shù)據(jù)集,為t時刻像素的樣本,則單個采樣點其服從的混合高斯分布概率密度函數(shù)。
其中k為分布模式總數(shù),為t時刻第i個高斯分布,為其均值,為其協(xié)方差矩陣,為方差,I為三維單位矩陣,為t時刻第i個高斯分布的權重。
1.1.2 算法流程
每個新像素值Xt同當前K個模型按下式進行比較,直接找到匹配新像素值的分布模型,即同該模型的均值偏差在2.5σ內:
如果所匹配的模式符合背景要求,則該像素屬于背景,否則屬于前景。
各個模式權值按如下方式進行更新,其中a是學習速率,對于匹配的模式Mk, t=1,否則Mk, t=0,然后各模式的權重進行歸一化:
未匹配模式的均值μ和標準差σ不變,匹配模式的參數(shù)按照如下更新:
如果,第一步中沒有任何模式匹配,則權重最小的模式被替換,即該模式的均值為當前像素值,標準差為初始較大值,權重為較小值。
各模式根據(jù)w/a^2按降序排列,權重大、標準差小的模式排列在前。
選前B個模式作為背景,B滿足下式,參數(shù)T表示背景所占的比例:
以下為實際運行效果圖:
圖1-1 高斯混合背景建模原始圖
該算法的主要思想檢測出相鄰兩幀圖像中發(fā)生變化的區(qū)域。用圖像序列中的連續(xù)兩幀圖像進行差分,然后二值化該灰度差分圖像來提取運動信息。由幀間變化區(qū)域檢測分割得到的圖像,區(qū)分出背景區(qū)域和運動區(qū)域,進而提取要檢測的目標。
它是通過比較圖像序列中前后兩幀圖像對應像素點灰度值的不同,通過兩幀相減,如果灰度值很小,可以認為該點無運動物體經(jīng)過;反之則認為有物體經(jīng)過。第k幀和k+1幀圖像f,之間的變化用一個二值差分圖像D(x,y)表示,如式:
二值化圖中0對應前后偽變化的地方,1對應變化的地方。如下所示:
圖1-3 幀間差分法示意圖
該算法主要線性混合了高斯混合背景建模與幀間差分法的背景建模模型。算法過程如下:
首先,同時進行高斯混合建模與幀間差分法,分別得到背景模型與運動前景。然后將運動前景進行陰影處理,形態(tài)學運算,并將其結果進行線性混合。
流程圖如下:
圖1-4 高斯混合結合幀差法背景建模流程圖
在人群密度檢測提取運動目標的過程中,在光照比較強烈的條件下,會把陰影也當做運動目標檢測出來,從而影響檢測的結果。基于高斯混合背景建模的原理,我們使用顏色空間轉換的陰影消除算法來去除陰影。
具體方法如下:首先,將目標幀從多通道圖像轉換為灰度圖像,便于進行閾值化處理,之后使用閾值化算法對灰度圖像進行閾值化處理,從而消除陰影。
由于高斯混合背景建模是基于BGR顏色空間的,轉換成灰度圖后,有部分目標由于顏色與陰影顏色差別很小而被誤檢為陰影從而導致運動目標的漏檢,因此本實驗引入幀間差分法來消除陰影處理帶來的影響。
流程如下:
圖1-5 陰影處理流程圖
陰影處理的效果如下圖所示:
圖1-6 陰影處理前
圖1-7 陰影處理后
由上圖可以看出,本實驗采用的陰影處理算法效果滿足實驗的要求。
在視頻檢測技術中,人們已經(jīng)對目標跟蹤做了大量研究,而且已經(jīng)形成一套較為成熟的理論體系。目前的行人跟蹤算法主要有CamShift跟蹤算法,Mean-Shift跟蹤算法等。
(1) Mean-Shift跟蹤算法
Mean-shift算法的本質是一個迭代過程。Mean-Shift跟蹤算法通過計算目標區(qū)域和候選區(qū)域內像素的特征值概率得到關于模型以及候選模型的描述,然后利用相似函數(shù)初始模型與當前的模型進行對比,選擇相似程度最大的模型并的得到Mean-Shift向量,這個向量就是目標的移動方向。由于Mean-Shift快速收斂的特性,不斷迭代后可以計算到目標的真實位置,完成跟蹤。
(2)CamShift跟蹤算法
CamShift跟蹤算法是對MeanShift跟蹤算法的改進,更夠自動調節(jié)搜索窗口的大小來適應目標,可以跟蹤視頻中大小發(fā)生變化的目標,是一種半自動的跟蹤算法,需要手動設定跟蹤的目標。
算法通過視頻圖像中的顏色為特征,對圖像進行Mean-Shift運算,并將上一幀的目標的位置和大小作為下一次運算的初始值。通過不斷迭代來達到跟蹤的目的。
(3) 基于區(qū)域的目標跟蹤算法
基于區(qū)域的跟蹤方法就是通過使用一塊區(qū)域代表運動目標,且每個運動目標都對應一塊區(qū)域。通過提取該區(qū)域的特征來表征感興趣的目標特征,如該區(qū)域質心,長寬等。因此只需要對區(qū)域進行匹配,便可達到跟蹤目標單位的目的。
該算法的優(yōu)點是計算量小,實時性比較好。但是當區(qū)域發(fā)生相互碰撞時,需要對連通區(qū)域進行一定的處理。處理之后便可以達到跟蹤的目的。
本項目主要使用基于區(qū)域的目標檢測算法。
如下所示是項目運行截圖:
圖3-1 行人檢測效果圖1
圖3-2 行人檢測效果圖2
圖3-3 行人檢測效果圖3
圖3-4 行人檢測效果圖4
圖3-5 行人檢測效果圖5
在第三教學樓采集視頻序列,視頻幀大小為1920*1080,為了提高算法的處理速度,將視頻幀大小縮放為640*360。設置行人最小長寬為120,80。經(jīng)過多次測試,結果如下:
表1 實驗數(shù)據(jù)
從統(tǒng)計結果可以看出,在行人較為稀疏的情況下,本文算法的準確率在90%以上,在行人較為稠密的情況下,準確率在85%以上,基本上可以達到實際應用的要求。
本項目主要研究了基于監(jiān)控視頻的人群密度統(tǒng)計技術,實現(xiàn)了對監(jiān)控視頻中行人密度以及行人流量的統(tǒng)計。
主要研究成果如下:
(1)實現(xiàn)了高斯混合背景建模與幀間差分法的結合。在進行高斯混合背景建模的同時使用幀間差分法,將兩者進行預處理之后進行線性加權混合。解決高斯混合背景建模由于光照和顏色對于檢測結果帶來的問題。而高斯混合背景建模算法同時又能夠提升幀差法的檢測準確度。
(2)陰影消除。根據(jù)陰影產(chǎn)生的原理,合理利用顏色空間的轉換算法,先將原始二值化帶陰影圖片轉化為灰度圖片,對灰度圖片進行二值化閾值處理,把灰色陰影區(qū)域去除,再轉換到原始顏色空間。然后與幀差法經(jīng)過預處理之后的效果圖進行線性混合,就能合理有效的去除陰影。
(3)行人檢測算法的優(yōu)化。使用基于面積的跟蹤方法,結合基于團塊的計數(shù)算法,加快檢測的速度提高準確度。首先利用運動區(qū)域跟蹤找出可能含有行人的目標團塊,之后使用計數(shù)算法得出結果。經(jīng)過實驗證明,這種方法能夠有效的提高系統(tǒng)的運行速度且對系統(tǒng)的準確度影響較小。
[1]吳海江等.基于視頻的行人流量統(tǒng)計技術的研究[D].云南:昆明理工大學,2010.
[2]王麗霞等.基于視頻的行人目標檢測與跟蹤算法研究[D].遼寧:大連交通大學,2012.
[3]李立宗.OpenCV編程案例詳解[M]. 北京:電子工業(yè)出版社, 2016:4-12.
[4]魏瑋,吳琪.三幀差結合改進高斯建模的運動目標檢測算法[J].計算機工程與設計, 2014, 35(3):949-952.
[5]王麗娟. 基于OpenCV與混合高斯建模的運動目標檢測[J]. 電子測試,2009(9):86-90.