鐵富珍
(1.中國人民公安大學(xué),北京 100038;2.青海警官職業(yè)學(xué)院,青海西寧 810000)
隨著公共安全和智能化的發(fā)展,視頻監(jiān)控系統(tǒng)在各個領(lǐng)域的應(yīng)用越來越廣泛[1],例如智慧城市、機場、銀行等。在這些場景中,人群異常行為檢測成為一個重要的研究課題[2]。因為一旦出現(xiàn)異常行為,如擁擠、跌倒、爭執(zhí)等,可能會引發(fā)嚴重的安全問題[3]。因此,對視頻監(jiān)控中的異常行為進行自動檢測,對于保障公共安全具有重要意義[4]。例如,文獻[5]通過輕量級網(wǎng)絡(luò)取代原始特征提取網(wǎng)絡(luò),在監(jiān)控視頻內(nèi)提取人群特征。利用可變形卷積模塊提升特征提取效果,并依據(jù)提取的特征輸出人群異常行為檢測結(jié)果。該算法具有較好的人群異常行為檢測效果。文獻[6]在雙支路共享網(wǎng)絡(luò)內(nèi)輸入原始幀和背景模型,輸出人群異常行為檢測結(jié)果。該算法可有效檢測人群異常行為,且異常行為檢測的適用性較強。但上述方法易受光照與噪聲影響,降低了人群異常行為的檢測效果。而改進光流法[7]通過計算圖像中像素點的運動矢量,實現(xiàn)對人群運動的估計,對光照和噪聲不敏感,具備較高的異常行為檢測準確性和魯棒性。為此,本文研究基于改進光流法的視頻監(jiān)控中人群異常行為檢測算法,為保障公共安全提供參考。
利用改進單高斯模型在視頻監(jiān)控的人群視頻幀內(nèi)提取角點,將其作為特征點。
將視頻監(jiān)控中各幀圖像分割成N×N個大小的塊,并展開背景建模[8]。令t時刻、第i塊圖像的像素集合是,像素數(shù)量是|,i的均值是kti,計算公式如下:
式中:Ijt是第j個像素的強度;z′ti-1、k′ti-1是經(jīng)過映射的生命值、均值;zti是生命值。
i的方差是σti,計算公式如下:
式中σ′ti-1是經(jīng)過映射后的方差。
針對視頻監(jiān)控中各幀圖像均通過兩個單高斯模型進行建模[9],得到當下與備選背景模型C、O,并依據(jù)參數(shù)更新頻率得到各幀圖像最終的真實背景模型。
t時刻,i在C、O內(nèi)的參數(shù)是;相應(yīng)的觀測均值是U it,若符合條件,那么更新C的參數(shù),其中θ是常數(shù)。若符合條件,那么更新O的參數(shù)。 若,那么以O(shè)為新的C,同時再次初始化O。參數(shù)更新后,便可得到真實背景模型C?,通過求解各像素點屬于?的概率,便可得到前景圖像,以前景圖像為掩模,提取視頻監(jiān)控中各幀圖像內(nèi)的角點[10]。令閾值為ε,利用角點響應(yīng)函數(shù)確定某像素點是否為角點,公式如下:
式中:o是候選角點;V(o)、V(j)是o與j的灰度值。如果η>ε,那么確定該像素點為角點,即特征點。
利用改進光流法[11],依據(jù)1.1 節(jié)提取的特征點,在視頻監(jiān)控的視頻幀內(nèi)提取人群運動目標。
令j的兩個光流速度矢量是、,光流場的基本方程如下:
式中:Fj,t是第j個特征點的灰度函數(shù);是Fj,t有關(guān)x軸、y軸、t軸方向的偏導(dǎo)數(shù)。
令h為迭代次數(shù),式(4)的約束方程如下:
式中α是拉格朗日乘子[12]。
對于視頻監(jiān)控中復(fù)雜場景內(nèi)的人群運動目標來說,因為人群運動目標和背景的灰階差距較小,所以人群運動目標輪廓位置較為模糊,影響人群運動目標輪廓處光流計算精度。為此,在式(5)的基礎(chǔ)上引入權(quán)函數(shù)wj(x,y)改進光流約束方程,公式如下:
wj(x,y)的計算公式如下:
式中T是閾值。
利用增加慣性項,求解式(6)得到h+1 次迭代時的光流速度矢量、,公式如下:
式中ρ(h)是迭代慣性因子。
依據(jù)與可獲取各光流點(特征點)的運動速度ν(x,y)與方向λ(x,y),公式如下:
令光流點選擇閾值是νε,當ν( )x,y>νε時,保留該光流點,反之,剔除該光流點,可有效抑制噪聲對光流點的干擾,依據(jù)保留的有效光流點完成人群運動目標提取。
以光流直方圖的形式代表提取人群運動目標內(nèi)光流點的運動方向,利用直方圖的熵[13]代表光流點運動方向的混亂程度G,G與視頻監(jiān)控中當下幀內(nèi)光流點運行方向混亂程度具有正相關(guān)關(guān)系。
令j的方向變化次數(shù)是dj,j的幅值是rj,人群運動目標圖像內(nèi)光流點的方向與幅值概率Q(dj)、Q(rj)如下:
式中:ψdj、ψrj是直方圖方向次數(shù)、幅值總和。
方向熵與幅值熵為:
式中m是人群運動目標內(nèi)有效光流點數(shù)量。
光流速度均值為:
運動混亂度的計算公式如下:
當某人的連續(xù)3 幀圖像的G超過設(shè)置閾值時,則判定該人存在異常行為。
以某商場視頻監(jiān)控為實驗對象,該商場的視頻監(jiān)控設(shè)備尺寸是1 2.5 英寸,有效像素在200 萬~400 萬之間,攝像頭的動態(tài)范圍在60 dB 左右,具備防抖功能,視頻監(jiān)控圖像的分辨率是1 920×1 080,幀率是25 f/s。
在該商場視頻監(jiān)控內(nèi),隨機選擇2 幀存在異常行為的圖像,利用所研究算法在這2 幀圖像內(nèi)提取特征點,特征點提取結(jié)果如圖1 所示。
圖1 特征點提取結(jié)果
從圖1a)和圖1b)中可以看出,該算法在視頻監(jiān)控圖像中成功地提取了特征點。雖然原始視頻幀中包含許多噪聲和其他因素,但是該算法仍然能夠準確地識別和提取特征點。這些特征點可以作為人群運動目標提取的可靠輸入,從而證明了其在視頻監(jiān)控圖像中提取特征點的有效性。
利用本文算法在原始視頻幀內(nèi)提取人群運動目標,如圖2 所示。
圖2 人群運動目標提取結(jié)果
從圖2a)可以看出,本文算法可有效提取人群運動目標,共包含5 個運動目標。從圖2b)可以看出,本文算法也可有效提取人群運動目標,共包含8 個運動目標。綜合圖2a)和圖2b)可以看出,本文算法成功地提取了人群運動目標。在兩個不同的視頻幀中,本文算法準確地提取了運動目標,從而證明了其在人群運動目標提取中的有效性和可靠性。這表明本文算法具有較高的準確性,可以處理實際場景中的視頻監(jiān)控數(shù)據(jù)。
利用本文算法計算上述兩幀圖像的運動混亂度,進行人群異常行為檢測,檢測結(jié)果如圖3 所示。
圖3 人群異常行為檢測結(jié)果
從圖3 中可以看出,本文算法成功地計算了各視頻幀的運動混亂度,并且準確地檢測出了異常行為。在實驗的前13 幀視頻中,運動混亂度均低于閾值,表明人群行為正常,沒有出現(xiàn)異常情況。這13 幀視頻中的人群處于平靜、有序的狀態(tài),沒有出現(xiàn)突然的聚集、爭執(zhí)等異常行為。然而,在第14 幀視頻中,運動混亂度突然明顯高于閾值,且高于閾值的連續(xù)視頻幀數(shù)量為7 幀,表明人群中出現(xiàn)了異常行為,在這7 幀視頻中,人群出現(xiàn)了聚集、爭執(zhí)等異常行為,導(dǎo)致運動混亂度明顯上升。實驗證明:本文算法精準檢測出了異常行為,可用于實時監(jiān)控視頻,對異常行為進行自動檢測和預(yù)警,為公共安全提供了強有力的技術(shù)支持。
本文提出了一種新的視頻監(jiān)控中人群異常行為檢測算法。利用改進單高斯模型提取視頻監(jiān)控在人群圖像的特征點,基于改進光流法提取人群運動目標,通過對比分析運動混亂度與設(shè)置閾值,完成人群異常行為檢測。實驗結(jié)果表明,本文算法的準確性較高,該研究成果對于提高視頻監(jiān)控中異常行為檢測的準確性和魯棒性具有重要意義,為實際應(yīng)用提供了新的方法和思路。未來的研究方向可增強算法的自適應(yīng)性,并研究多視角和多模態(tài)信息融合方法,提高異常行為檢測的全面性。