陳樹娟
(山東服裝職業(yè)學(xué)院,山東泰安 271000)
近年來,隨著科技的發(fā)展,數(shù)字視頻技術(shù)在不斷進(jìn)步??v觀數(shù)字視頻的發(fā)展史,其可分為三個發(fā)展階段:數(shù)字顯示視頻階段、數(shù)字壓縮視頻階段和數(shù)字智能視頻階段。在數(shù)字顯示階段中主要是解決了計算機圖像與數(shù)字化視頻影像結(jié)合的問題。但是該階段所用的視頻格式——MPEGI存在壓縮比和分辨率低的問題,且當(dāng)時PC機處理能力弱,因此在此階段中還需要借助各種圖形圖像和視頻采集壓縮卡的輔助才能達(dá)到綜合顯示的視頻效果。數(shù)字壓縮視頻階段已能夠?qū)⒂行У臄?shù)字化視頻壓縮成為實用性產(chǎn)品。此時的數(shù)字化視頻已由原來的MPEGI1升級到MPEGI2,且數(shù)字視頻產(chǎn)品本身也脫離了PC機,實現(xiàn)了一類自成一體的消費類產(chǎn)品的生產(chǎn)銷售。后來隨著數(shù)字視頻面向的市場的變化,其壓縮格式也有原來MPEGI2格式的基礎(chǔ)上又增加了MPEGI4和H.264、、WMV9、Real和On2。與此同時,國內(nèi)AVS作為具有自主產(chǎn)權(quán)的中國視頻標(biāo)準(zhǔn)格式也得到了發(fā)展。數(shù)字智能視頻又是數(shù)字視頻發(fā)展的新階段,縱觀數(shù)字智能視頻的發(fā)展史,它從最初的CCTV閉路電視時代,又經(jīng)歷了VCR模擬視頻錄像時代,DVR數(shù)字視頻錄像時代、NVR網(wǎng)絡(luò)視頻錄像時代。目前數(shù)字智能視頻已成為數(shù)字視頻技術(shù)中的領(lǐng)軍人物,且其也在視頻監(jiān)控技術(shù)上創(chuàng)造了一個新的里程碑。
數(shù)字智能視頻本身具有其他兩種數(shù)字視頻所沒有的優(yōu)勢,首先,智能數(shù)字視頻本身具有高科技自動分析數(shù)據(jù)的功能,而機器的自動數(shù)據(jù)和視頻分析處理功能不僅減輕了安防操縱人員的日常工作量也加快了數(shù)據(jù)分析的速度和效率;其次數(shù)字智能視頻具備結(jié)合需求者對視頻數(shù)據(jù)的要求從海量視頻中自動快速掃描出圖像的功能;最后,這種新型的技術(shù)智能視頻技術(shù)還增加了自動交互控制、檢測及處理等功能。這些功能能夠降低事后回放視頻時時間上的延誤同時也具備抗干擾和降低風(fēng)險的能力。
數(shù)字視頻的應(yīng)用在很多領(lǐng)域都可以看見,目前數(shù)字智能視頻應(yīng)用最多的還是在交通監(jiān)控領(lǐng)域。在交通監(jiān)控中它可以實現(xiàn)汽車牌照的自動識別、道路狀況的自動監(jiān)控和警示、交通流量的自動控制、移動式自動車牌的實時稽查等多項系統(tǒng)功能。另外其在汽車視覺上也發(fā)揮著很重要的作用,例如行人檢測技術(shù)、盲區(qū)檢測技術(shù)、泊車助理技術(shù)、車道偏離警告技術(shù)等。這些技術(shù)很多都已運動到了國際知名車型的試用中,相信很快就能夠進(jìn)入實用階段。此外如公共場所的人臉識別、商業(yè)場所的人流統(tǒng)計、公共廣告的觀眾量統(tǒng)計、超級市場的消費量統(tǒng)計等等都有數(shù)字智能視頻的用武之地??梢哉f在目前社會的發(fā)展中,只要有攝像頭的地方就有可能有數(shù)字智能視頻的身影。
目前的視頻智能分析主要是采用嵌入式設(shè)計,并采用專用DSP作為系統(tǒng)核心,系統(tǒng)外圍配置視頻解碼器、存儲器等作為輔助設(shè)備。智能數(shù)字視頻的硬件設(shè)計很精巧,通常都可以安裝在前端攝像機內(nèi)部或者監(jiān)控室里。另外嵌入式系統(tǒng)還具備多種智能分析功能,可通過RS485方式進(jìn)行遠(yuǎn)程控制,并按照中英文菜單讓用戶實現(xiàn)對設(shè)備參數(shù)和功能的設(shè)置。
嵌入式系統(tǒng)的組成很簡單,其能與攝像機完美結(jié)合并支持在線更新和在線升級等功能。其視頻分析功能的應(yīng)用也很廣泛,在實際應(yīng)用中如越線檢測、流量統(tǒng)計、滯留檢測、軌跡跟蹤等等。
3.3.1 越線檢測
實現(xiàn)越線檢測這一功能時,可以對指定的場景設(shè)置一條虛擬警戒線,報警規(guī)則可設(shè)置為單線檢測或雙線檢測,警戒線的具體位置、長度及禁止穿越方向可以隨意設(shè)置。當(dāng)前景目標(biāo)按照預(yù)設(shè)方向穿越警戒線時,系統(tǒng)會自動產(chǎn)生警報信息,同時預(yù)測目標(biāo)進(jìn)入警報區(qū)后運動方向并提醒工作人員注意。越線檢測功能一般運用在翻越墻警報、倒車檢測及交通違規(guī)等方面。
3.3.2 流量統(tǒng)計
流量統(tǒng)計即是通過智能視頻技術(shù)對前景目標(biāo)進(jìn)入某條直線或某個區(qū)域的個數(shù)綜合進(jìn)行記錄,并分別計算出特定方向上通過直線或區(qū)域的目標(biāo)流量。這種統(tǒng)計技術(shù)一般可運用于工廠門口、商店及車站等公共場所的人流量檢測或交通要道的車流量監(jiān)測。
3.3.3 滯留檢測
該種檢測功能能夠識別車輛在禁止區(qū)域內(nèi)是否長時間滯留。若車輛在某些特殊區(qū)域因交通事故、交通堵塞或非法??康仍蜷L時間停留時,該區(qū)域的檢測系統(tǒng)會自動發(fā)出異常警報。另外這種檢測系統(tǒng)也可以判斷人員是否在特定區(qū)域內(nèi)徘徊逗留,一旦識別為可以徘徊后,系統(tǒng)也會自動發(fā)出警報,一般用戶可以根據(jù)實際需求設(shè)定逗留時間以判斷目標(biāo)是否處于滯留或徘徊時間內(nèi)。
3.3.4 軌跡跟蹤
能夠自動發(fā)現(xiàn)并跟蹤出現(xiàn)在屏幕中的運動目標(biāo),并精確的對目標(biāo)實現(xiàn)運動分析,在此基礎(chǔ)上連續(xù)快速的調(diào)整云臺方向以及攝像機倍數(shù),將移動物體置于屏幕中心,并保持其所占屏幕的比例,讓監(jiān)控人員能夠看清目標(biāo)的細(xì)節(jié)。
模塊化組合是實現(xiàn)智能數(shù)字視頻輸入和輸出均為模擬復(fù)合視頻、RS485控制信號和報警信號的組合模式。該種智能視頻前端能夠與任何模擬設(shè)備相連接,后端能夠與DVR、網(wǎng)絡(luò)視頻服務(wù)器及顯示器相連接,并能夠通過鍵盤或其他控制設(shè)備來對系統(tǒng)進(jìn)行直接控制。其所帶的各種智能算法在不想沖突的前提下也能夠任意搭配,同時不同功能之間也可以實現(xiàn)相互觸發(fā)。利用模塊化組合可以將多種云臺攝像機達(dá)到完美結(jié)合,首先要對智能模塊進(jìn)行配置,其次選擇好云臺攝像機類型,而智能模塊本身則可以根據(jù)不同的云臺攝像機類型以采取不同的控制策略并進(jìn)行各類型的智能分析。這種智能模塊組合尤其是在進(jìn)行跟蹤監(jiān)測時更能夠發(fā)揮完美的匹配優(yōu)勢。
智能模塊的軟件能夠?qū)崿F(xiàn)在線升級,其只要通過RS485控制線即可實現(xiàn)在線升級,無需進(jìn)行硬件更換或其他拆卸工作。另外任何新功能也可以進(jìn)行在線升級和補充。由于能夠在線升級,因此智能模塊能夠與新產(chǎn)品的新功能和新性能達(dá)到同步。此外它還可根據(jù)現(xiàn)場進(jìn)行產(chǎn)品制定,通過在線升級來達(dá)到特殊現(xiàn)場場景及特殊智能分析需求對智能數(shù)字視頻的要求。
視頻分析技術(shù)是在分離了視頻中目標(biāo)和目標(biāo)所在場景的基礎(chǔ)上對要求目標(biāo)實行單獨的分析和追蹤,它是計算機圖像詩句分析技術(shù)的延伸發(fā)展。利用視頻分析技術(shù)可以結(jié)合不同場景中的要求預(yù)設(shè)各種報警規(guī)則,以實現(xiàn)追蹤目標(biāo)的功能。場景中一旦目標(biāo)違反規(guī)定報警規(guī)則成為既定目標(biāo),則系統(tǒng)會發(fā)起自動報警功能,通過監(jiān)控終端發(fā)出報警信息或提示音的方式引起用戶注意,或幫助用戶通過報警場景重現(xiàn)的方式及時采取必要急救措施。
視頻分析技術(shù)的處理方法很多,主要的處理方法為背景減除法和時間差分法。目前視頻分析技術(shù)采用的是后端PC服務(wù)器處理方式和前端DSP服務(wù)器處理方式。其中DSP是高速數(shù)字處理信號器,因此其可置于視頻采集前端進(jìn)行實時處理,且利用DSP視頻分析單元時僅通過攝像機或編碼器即可實現(xiàn)對原始或接近原始的圖像進(jìn)行分析。而后端PC服務(wù)器得到的圖像在經(jīng)過網(wǎng)絡(luò)編碼傳輸過程中不僅圖像精度大大降低同時也很容易丟失信息。因此采用前端DSP服務(wù)處理方式要優(yōu)于PC服務(wù)處理器方式。
DSP處理方式就是嵌入式智能視頻應(yīng)用的一種方式,這種嵌入式技術(shù)不僅能夠從巨量視頻像素數(shù)據(jù)識別出查找的目標(biāo),同時可編程,能夠接受不同算法,也能夠滿足不同方面的應(yīng)用。一般智能數(shù)字視頻的工作流程可以概括為以下幾個步驟:(1)實現(xiàn)單場景內(nèi)的場景的分離和前景目標(biāo);(2)較長的視頻序列按照需求被分割成可分析的多個單獨場景或片段。這些單獨場景相較于其他單獨場景具有不同直方圖,色彩分布頻率也會有差異,因此每個單獨場景直方圖的變化相較于前面單獨場景直方圖的突變則可視為場景的改變;(3)將分離后單獨前景目標(biāo)提取或分割,再進(jìn)行逐幀跟蹤;(4)對跟蹤目標(biāo)實現(xiàn)特征提取,并對不同特征進(jìn)行分類;(5)再進(jìn)行特種分析后,若前景目標(biāo)在與關(guān)注目標(biāo)類似的情況下,向管理人員和管理軟件發(fā)布警報。由于視頻分析在智能數(shù)字國際上并沒有相關(guān)的標(biāo)準(zhǔn),至此要想實現(xiàn)更復(fù)雜的檢測算法只能依靠可編程性能高的DSP和視頻處理器。例如利用高編程性能DSP實現(xiàn)對前景目標(biāo)和背景及可疑活動的實時監(jiān)測和監(jiān)控。
但是即使DSP服務(wù)器本身具有著高性能的可編程性,在進(jìn)行技術(shù)開發(fā)時仍然要求智能視頻處理軟件的開發(fā)人員能夠具備扎實的基礎(chǔ)模式識別技術(shù)和與DSP算法相關(guān)的開發(fā)技能。為了保證智能視頻技術(shù)的進(jìn)一步推廣與應(yīng)用,IT行業(yè)在已開發(fā)的C64+平臺的基礎(chǔ)上又研發(fā)了一套智能視頻庫——VLIB。以往的客戶,在使用智能視頻分析時,即使是國際知名智能視頻廠商也需要自主開發(fā)底層軟件,但是自從VLIB智能視頻庫問世后,客戶只需直接調(diào)用VLIB中的智能視頻基礎(chǔ)庫函數(shù)即可實現(xiàn)視頻分析。且所有VLIB庫都是免費提供,用戶只要登錄特定網(wǎng)站注冊即可實現(xiàn)調(diào)用功能。
TI的TMS320DM64x數(shù)字處理器和達(dá)芬奇系列是近年來嵌入式智能視頻分析的流行平臺,且兩類處理器都有著很好的應(yīng)用效果。國際上如 Objectvideo 、MICE、IoImage 、VCA等就是目前使用較廣泛的處理器,當(dāng)然近年來國內(nèi)在嵌入式智能分析的流行平臺開發(fā)上也有很多后起之秀。在汽車視覺方面,歐洲的CEL公司宣布已在其新系列單、多攝像汽車視覺系統(tǒng)中將DM643x作為實現(xiàn)視頻影像和系統(tǒng)控制功能的處理器,希望能夠通過這種處理器的應(yīng)用達(dá)到駕駛輔助系統(tǒng)的要求。
數(shù)字視頻監(jiān)控發(fā)展的過程中智能視頻分析技術(shù)已經(jīng)逐漸取代高級數(shù)字壓縮視頻技術(shù)成為提高產(chǎn)品附加價值的最主要因素,且智能視頻技術(shù)本身在發(fā)展的過程中也實現(xiàn)了前端實時處理代替后端處理的功能。于是擁有DSP的數(shù)字視頻產(chǎn)品不斷生產(chǎn)推出并逐漸占領(lǐng)了數(shù)字視頻產(chǎn)品市場。隨著更高性能集成DSP核心的DOC的研發(fā),智能視頻的運用又將進(jìn)入一個新的里程碑。
智能數(shù)字視頻是所有數(shù)字視頻中的“明星”,從其目前的發(fā)展及應(yīng)用范圍來看,智能數(shù)字視頻擁有著很大的發(fā)展?jié)摿鞍l(fā)展前景。本文是在分析了智能數(shù)字視頻特點的基礎(chǔ)上,從嵌入式智能數(shù)字視頻技術(shù)、嵌入式智能視頻技術(shù)的實現(xiàn)手段以及目前集成又DSP的SOC器件的應(yīng)用和后續(xù)發(fā)展趨勢三個方面進(jìn)行了簡單分析,希望讀者能夠通過本文對智能視頻技術(shù)的應(yīng)用有更進(jìn)一步的了解。
[1] 鄭小龍.智能視頻多媒體技術(shù)應(yīng)用風(fēng)光無限.電子產(chǎn)品世界.2009.(5).
[2] 李贏韜.智能視頻監(jiān)控技術(shù)及其應(yīng)用研究武漢科技大學(xué).檢測技術(shù)與自動化裝置.2011.
[3] 劉一山.智能監(jiān)控系統(tǒng)中運動目標(biāo)檢測與跟蹤技術(shù)的研究.西安科技大學(xué).電力電子與電力傳動.2007.
[4] 周波.視頻編碼與運動檢測算法研究及其在智能網(wǎng)絡(luò)攝像機中的應(yīng)用湘潭大學(xué).計算機軟件與理論.2008.
[5] 卜慶凱.基于內(nèi)容的視頻檢索與視頻摘要關(guān)鍵技術(shù)研究.東南大學(xué).信號與信息處理 .2009.