董瑩荷,胡國勝
(上海電子信息職業(yè)技術(shù)學(xué)院通信與信息工程學(xué)院,上海 201411)
在經(jīng)濟與社會全面發(fā)展的情況下,社會治安問題也逐漸成為社會的主要問題之一,因此,在城市里分布著大量的高清攝像監(jiān)控裝置,然而,多數(shù)的監(jiān)控設(shè)備僅起到記錄的作用,無法對異常行為進行系統(tǒng)報警[1]。傳統(tǒng)攝像監(jiān)控設(shè)備依據(jù)人工操作,無法實現(xiàn)長時間對異常行為的監(jiān)控,且此設(shè)備對于資源的浪費十分嚴(yán)重,無法做到對監(jiān)測到的行為進行分析與處理,在用途方面具有很大的局限性[2]。
相關(guān)專家和學(xué)者針對視頻監(jiān)控系統(tǒng)中異常行為檢測和識別方法進行了深入研究,致力于改善檢測率低、工作時間長的問題。李明等[3]提出基于視頻圖像處理的實驗室異常行為檢測方法,即先對視頻監(jiān)控系統(tǒng)中的多幀視頻圖像進行連續(xù)采集,利用濾波法構(gòu)建背景圖像,并在背景圖像上引入改進背景差分算法提取出完整的目標(biāo)輪廓,然后依據(jù)鏈表法將輪廓特征整合,采用SVM分類器實現(xiàn)異常行為的檢測。該方法能夠較為準(zhǔn)確地檢測出視頻監(jiān)控中的異常行為,但檢測步驟繁瑣,耗費時間較長。胡正平等[4]提出的視頻監(jiān)控系統(tǒng)異常目標(biāo)檢測與定位方法根據(jù)視頻幀提取出視頻監(jiān)控系統(tǒng)中的二維視覺特征,得到視頻幀間信息,根據(jù)信息追蹤視頻目標(biāo);采用3D時空特征學(xué)習(xí)法,對含有運動信息的時空興趣塊進行描述,采用模式分類檢測出異常行為,并定位異常行為發(fā)生的位置。該方法在上述傳統(tǒng)方法的基礎(chǔ)上提高了檢測效率,縮減了工作耗費的時間,但仍無法達到理想效果。
針對上述問題,本文設(shè)計了一種新的視頻監(jiān)控系統(tǒng)中檢測與識別異常行為的方法。該方法通過找尋一定的運動規(guī)律,利用自適應(yīng)算法對規(guī)律進行加工分析,達到對視頻監(jiān)控系統(tǒng)中異常行為進行檢測與識別的目的。
視頻圖像在被分割后無法正常表達視頻運動目標(biāo)的具體特征,因此必須要對視頻信息圖像進行預(yù)處理[5]。預(yù)處理主要包括視頻圖像基礎(chǔ)檢測、信息識別、原始圖像噪聲過濾、灰度矯正等操作。
第一步:視頻圖像噪聲過濾。
在對目標(biāo)圖像進行采集時,電子視頻圖像會遭受外界的系統(tǒng)干擾,所以需要先利用圖像處理器提高視頻圖像的清晰度,再通過加工解析提高視頻圖像的準(zhǔn)確度,最后通過圖像濾波方法,對數(shù)據(jù)進行空間域濾波與交換域濾波[5]。過濾后的圖像聲波圖如圖1所示。
第二步:圖像灰度矯正。
為減少圖像算法的計算量,并在一定程度上避免失真情況的出現(xiàn),利用雙線性插值算法對視頻圖像進行灰度矯正,獲取更加清晰的視頻信息。
圖1 圖像聲波圖
第三步:二值化處理。
對視頻圖像進行二值化處理,可簡化視頻圖像,同時減少系統(tǒng)運算數(shù)量,明確目標(biāo)輪廓信息,在此基礎(chǔ)上進行圖像的再加工處理[6]。
第四步:圖像邊緣檢測。
在圖像變化中,利用亮度明晰的圖標(biāo)標(biāo)記數(shù)字圖像,減少需解析的圖像數(shù)據(jù)數(shù)量,刪除不相關(guān)的信息內(nèi)容,同時保留圖像較為基礎(chǔ)的框架屬性,采用濾波、增強及檢測3種技術(shù)進行處理[7]。
通過統(tǒng)計計算視頻圖像的梯度直方圖,獲取明確的圖像異常目標(biāo)特征,并對運動異常目標(biāo)圖像的關(guān)鍵幀進行檢測與數(shù)據(jù)解剖。通過對視頻圖像幀的比較,解析圖像是否改變,在圖像未改變的情況下,根據(jù)JPEG標(biāo)準(zhǔn)編碼對圖像幀進行進一步的分析和處理,其處理結(jié)果如圖2所示。
圖2 圖像幀處理結(jié)果圖
通過JPEG圖像標(biāo)準(zhǔn)編碼處理后,捕捉到的是較為連續(xù)的圖像關(guān)鍵幀。對于這些關(guān)鍵幀,首先通過解碼過程將幀作為基礎(chǔ)單位,并持續(xù)放置于內(nèi)存緩沖空間,然后利用函數(shù)算法,將緩沖空間中持續(xù)存在的關(guān)聯(lián)幀轉(zhuǎn)變成位形狀的視頻圖像,并將其放置于其他空間進行對比分析,分析圖像目標(biāo)特征,并進行規(guī)律查詢[8]。
對在時間上連續(xù)的兩幀或三幀圖像信息進行差分式計算,不相同的圖像所對應(yīng)的點進行減法計算,由此計算結(jié)果可以推斷出圖像的灰度指數(shù)是否超出標(biāo)準(zhǔn)閾值,如果超出即可判斷其為運動目標(biāo)特征,并獲得相關(guān)圖像規(guī)律,進而實現(xiàn)對運動目標(biāo)圖像的查詢。兩幀差分法的結(jié)構(gòu)圖如圖3所示[9]。
圖3 兩幀差分法結(jié)構(gòu)圖
設(shè)視頻序列里第α幀圖像為fα,相對應(yīng)點的灰度值為fα(x,y);第β幀圖像為fβ,相對應(yīng)點的灰度值為fβ(x,y)。將第α幀與第β幀圖像相對應(yīng)點的灰度值相減,取絕對值后,即可得出差分圖像B(x,y):
B(x,y)=|fα(x,y)-fβ(x,y)|
(1)
設(shè)定閾值s,通過式(2)對對應(yīng)點進行二值化轉(zhuǎn)變計算,由此獲取轉(zhuǎn)變后的圖像P′。對圖像P′進行連通性的解析,即可獲取具有完整運動目標(biāo)的圖像P,并以灰度值為225的點作為圖像的前景設(shè)置點,將灰度值為零的點作為視頻圖像的背景設(shè)置點。
(2)
由于兩幀差分法無法適應(yīng)速度較快的運動目標(biāo)圖像,在運動目標(biāo)圖像速度較快時,臨近幀的圖像位置差距較大,并且會產(chǎn)生圖像重疊的情況,無法獲取較為完善的運動目標(biāo),因此采用三幀差分法進行計算。其算法結(jié)構(gòu)模擬圖如圖4所示。
圖4 三幀差分法結(jié)構(gòu)模擬圖
在三幀差分法運算過程中,應(yīng)選取合適的閾值s。閾值過小時,系統(tǒng)無法控制差分圖像中的噪聲干擾;閾值過大時,則會覆蓋差分圖像中的部分信息。針對上述情況,可根據(jù)視頻圖像場景的光線路徑O與光線路徑O1的改變情況處理差分圖像。場景中的光線值越小,則數(shù)據(jù)圖像的附加值越接近0;場景中的光線值越大,則數(shù)據(jù)圖像的附加值也會越來越大,從而可以避免視頻圖像運動目標(biāo)的檢測結(jié)果受光線影響,同時減少圖像規(guī)律的查詢獲取干擾因素[10]。
運動異常目標(biāo)識別的基本步驟如下:1)提取已獲取運動目標(biāo)的特征[11];2)構(gòu)建已獲取運動目標(biāo)的圖像數(shù)據(jù)庫;3)采用具有較強時效性的系統(tǒng)圖像處理器,提取未獲取運動目標(biāo)的特征信息;4)分析對比運動目標(biāo)的圖像數(shù)據(jù)庫[12]。
為了更好地表達運動目標(biāo)的特征表述,進行行為的高級理解,應(yīng)采取進一步的識別措施:
1)特征模型匹配。將測試的特征模型樣本和構(gòu)建的訓(xùn)練樣本運動目標(biāo)特征進行相似值的信息匹配,并以此判斷視頻中行為的所屬類型。
2)狀態(tài)空間構(gòu)建。根據(jù)參數(shù)模型隨著時間的變化趨勢推算運動目標(biāo)的運動演變過程,同時將隱形馬爾科夫模型[13]、動態(tài)貝葉斯網(wǎng)絡(luò)與條件隨機算法結(jié)合起來推算運動目標(biāo)狀態(tài)信息。圖像狀態(tài)空間模擬示意圖如圖5所示。
圖5 圖像狀態(tài)空間模擬
本文設(shè)計的識別方法以檢測算法的優(yōu)點作為基礎(chǔ)框架,兼顧視頻監(jiān)控系統(tǒng)性能以及系統(tǒng)操作時間,并使系統(tǒng)操作時間隨圖像數(shù)據(jù)輸入進行自適應(yīng)系統(tǒng)調(diào)節(jié)[14]。
異常行為識別流程如圖6所示。
圖6 異常行為識別流程
圖像數(shù)據(jù)的輸入主要由不同指數(shù)的n個可運算算法N的集合組成,獲得評估的數(shù)據(jù)集S稱為訓(xùn)練數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)集可采用數(shù)據(jù)分類方法進行分解處理,并將其與不同參數(shù)算法獲取的一組算法指數(shù)相結(jié)合,得到數(shù)據(jù)集K。
在系統(tǒng)上設(shè)定操作時間值,根據(jù)不同算法與計算指數(shù)的對應(yīng)關(guān)系,在數(shù)據(jù)集K中實現(xiàn)圖像數(shù)據(jù)參數(shù)的優(yōu)化組合,并在運算條件約束下,尋找具有相應(yīng)計算基礎(chǔ)的運算平臺。此后進行最優(yōu)算法指數(shù)組合,使其成為運算條件約束下的訓(xùn)練標(biāo)識Z。
在算法的最后階段,在性能與時間約束條件下,獲取選擇性參數(shù)圖像測試指數(shù)H的時間窗口運算指數(shù),并將指數(shù)的測試過程分為兩步優(yōu)化函數(shù)計算,最終實現(xiàn)對異常行為的檢測與識別優(yōu)化[15]。
為了驗證本文所提視頻監(jiān)控系統(tǒng)中異常行為檢測與識別方法的有效性,將該方法與傳統(tǒng)異常行為檢測與識別方法進行對比,對搶劫行為進行檢測。
對搶劫場景進行深入分析,得出的搶劫行為特征有如下3點:
1)在同一個監(jiān)控場景中,擁有兩個或兩個以上的目標(biāo)。
2)目標(biāo)和目標(biāo)之間會有相對明確的接觸。
3)在行為特征上,搶劫者和正常人有明顯區(qū)別,運動速度會超過正常人的運動速度。
圖7記錄的是正在進行的搶劫行為。
為了更好地分析犯罪嫌疑人的瞬時速度差,將搶劫過程分為跟蹤、接近和逃跑三個過程。針對搶劫異常行為設(shè)定的參數(shù)有:
1)預(yù)判參數(shù)。在監(jiān)控有效區(qū)域內(nèi)的目標(biāo)數(shù)量。
圖7 正在搶劫
2)有效目標(biāo)特征參數(shù)。嫌疑人的速度差以及嫌疑人與被害人之間的最小距離。
3)出現(xiàn)搶劫行為的條件。搶劫者與被害人之間的距離小于最小安全距離。
將基于視頻圖像處理的實驗室異常行為檢測方法(文獻[3]方法)和視頻監(jiān)控系統(tǒng)異常目標(biāo)檢測與定位方法(文獻[4]方法),作為本文所提視頻監(jiān)控中異常行為檢測與識別方法的對比方法,以臨近幀圖像位置差距大小和檢索工作時長為測試指標(biāo)進行仿真對比實驗。
臨近幀的圖像位置差距是影響檢測與識別效果的直接影響指標(biāo)。差距較大時,會產(chǎn)生圖像重疊的情況,無法獲取較為完善的運動目標(biāo)。經(jīng)過測試,得到3種方法的臨近幀圖像位置差距大小對比結(jié)果,如圖8所示。
圖8 不同方法臨近幀圖像位置差距大小對比結(jié)果
分析圖8可得,在180 s的檢測時長內(nèi),文獻[3]方法的臨近幀圖像位置差距最大值為1.00 μm,最小值為0.08 μm,平均值約為0.67 μm;文獻[4]方法的臨近幀圖像位置差距最大值為1.00 μm,最小值為0.05 μm,平均值約為0.55 μm;本文所提方法的臨近幀圖像位置差距最大值為1.00 μm,最小值為0.02 μm,平均值約為0.35 μm。對比實驗結(jié)果可得,本文所提方法的位置差距遠(yuǎn)遠(yuǎn)小于文獻[3]方法和文獻[4]方法,充分說明本文所提方法獲取的運動目標(biāo)更完善,校測效果更理想。3種不同方法的檢測工作時長對比結(jié)果如圖9所示。
圖9 不同方法的檢測工作時長對比結(jié)果
由圖可知,在經(jīng)過7次實驗后,文獻[3]方法的檢測工作時長曲線呈上升趨勢,平均檢測工作時長約為87.5 s;文獻[4]方法的檢測工作時長曲線呈大幅度上升趨勢,平均檢測工作時長約為78.4 s;本文所提方法的檢測工作時長曲線波動較小,平均檢測工作時長約為29.5 s。由對比結(jié)果可得,本文所提方法的檢測工作時長遠(yuǎn)遠(yuǎn)小于文獻[3]方法和文獻[4]方法,充分說明本文所提方法的檢測效率更高。
本文在傳統(tǒng)檢測與識別方法的基礎(chǔ)上研發(fā)的新式異常行為檢測與識別方法,在一定程度上提高了視頻異常行為的檢測效率,縮短了系統(tǒng)的檢測時間,具有較高的推廣價值,可以更好地維護社會治安,有利于社會爭端的解決。但本次實驗對異常行為數(shù)量的上限有一定的要求,未來將針對無限量的異常行為檢測與識別效果進行深入測試,以完善本文所提方法。