羅勇
摘? ?要:計(jì)算機(jī)視覺技術(shù)的研究一直受到全世界的廣泛關(guān)注。計(jì)算機(jī)視覺技術(shù)已經(jīng)廣泛應(yīng)用于工農(nóng)業(yè)生產(chǎn)、社會公共安全、人機(jī)交互、虛擬現(xiàn)實(shí)等領(lǐng)域,不僅給人們的生產(chǎn)生活帶來了極大方便,也對各行業(yè)管理以及整個(gè)社會產(chǎn)生極大的影響。在未來基于視頻的人體行為分析研究中,復(fù)雜場景下自然的人體行為分析將是一個(gè)重要的發(fā)展方向。文章對此展開了分析。
關(guān)鍵詞:視覺技術(shù);行為分析;智能監(jiān)控
作為一種多學(xué)科綜合應(yīng)用下的新技術(shù),計(jì)算機(jī)視覺技術(shù)的研究一直受到全世界的廣泛關(guān)注,隨著人們對該技術(shù)研究的不斷深入,其應(yīng)用領(lǐng)域也越來越廣。計(jì)算機(jī)視覺技術(shù)的應(yīng)用不僅給人們的生產(chǎn)生活帶來了極大方便,同時(shí)也對各行業(yè)管理以及整個(gè)社會產(chǎn)生了極大的影響。
1? ? 計(jì)算機(jī)視覺技術(shù)研究
人們觀察和認(rèn)知周圍環(huán)境主要是通過視覺這一途徑來完成,基于現(xiàn)階段計(jì)算機(jī)數(shù)據(jù)處理速度的大幅度提升和計(jì)算機(jī)視覺技術(shù)的不斷發(fā)展,計(jì)算機(jī)在其輔助設(shè)備的幫助下已經(jīng)具有與人類類似的部分視覺功能,能夠幫助或部分代替人眼及大腦觀察和感知外界事物?;谝曨l的人體行為分析的主要目標(biāo)是識別并且理解人的個(gè)體動(dòng)作、人和周圍環(huán)境的交互以及人和人之間的交互,在極少人為干預(yù)甚至不需要人為干預(yù)的環(huán)境下,該分析利用計(jì)算機(jī)及視頻相關(guān)技術(shù)實(shí)現(xiàn)人體檢測、跟蹤和行為理解。雖然這些不過是人體認(rèn)知系統(tǒng)最簡單的本能反應(yīng),但由于人類在運(yùn)動(dòng)習(xí)慣和形態(tài)等方面存在差異,特別是周圍環(huán)境的復(fù)雜性,對于一個(gè)計(jì)算機(jī)系統(tǒng)而言,要準(zhǔn)確分析并且理解視頻中的人體行為在目前仍然是一項(xiàng)具有挑戰(zhàn)性的工作。
人體行為分析最早可以追溯到19世紀(jì)動(dòng)物行為機(jī)械學(xué),但直到20世紀(jì)90年代,人體行為分析才真正開始受到關(guān)注。由于受到各方面條件的限制,在這個(gè)時(shí)期對人體行為的分析一般是先構(gòu)建人體模型,再匹配模型和行為序列,然后計(jì)算參數(shù),最后達(dá)到行為的分析和理解[1],該方法計(jì)算量較大,難以分析復(fù)雜的行為,因此發(fā)展較為緩慢。目前對于計(jì)算機(jī)模式識別和視覺技術(shù)領(lǐng)域的研究已經(jīng)是熱門話題,該研究涉及模式識別、計(jì)算機(jī)圖像信息處理、計(jì)算機(jī)視覺處理及人工智能等眾多學(xué)科,對于提高計(jì)算機(jī)視覺處理能力的智能化而言,這些研究有著重要的意義。
2? ? 計(jì)算機(jī)視覺技術(shù)在人體行為分析中的應(yīng)用
計(jì)算機(jī)視覺技術(shù)已經(jīng)被廣泛應(yīng)用于工農(nóng)業(yè)生產(chǎn)、社會公共安全、人機(jī)交互、虛擬現(xiàn)實(shí)等領(lǐng)域。在工業(yè)生產(chǎn)中,計(jì)算機(jī)視覺技術(shù)在工業(yè)探傷、工業(yè)檢測、生產(chǎn)自動(dòng)化等方面的應(yīng)用可以進(jìn)一步提升自動(dòng)化程度,確保產(chǎn)品質(zhì)量的一致性,避免由于人工疲勞以及注意力不集中帶來的工業(yè)生產(chǎn)損失[2];在農(nóng)業(yè)生產(chǎn)中,利用計(jì)算機(jī)視覺技術(shù)對農(nóng)作物生長過程中的病害蟲進(jìn)行監(jiān)測,對同種農(nóng)作物的形狀、大小和色澤進(jìn)行檢測達(dá)到對農(nóng)產(chǎn)品的分類、分級,對農(nóng)作物從育苗、生長、收割、管理各個(gè)環(huán)節(jié)進(jìn)行自動(dòng)化管理檢測;對有采集需求的林木等進(jìn)行圖像采集得到其所處的具體位置信息,再結(jié)合專業(yè)機(jī)械手完成采集[3]。將計(jì)算機(jī)視覺技術(shù)應(yīng)用在農(nóng)業(yè)生產(chǎn)中,不僅可以減少人力勞動(dòng),而且可以提高管理生產(chǎn)效率,實(shí)現(xiàn)農(nóng)業(yè)生產(chǎn)的自動(dòng)化[4]。社會公共安全管理中,計(jì)算機(jī)視覺技術(shù)在支票辨別、公共安全偵查、犯罪偵破、指紋配比、罪犯人臉合成與識別等方面的應(yīng)用可防止多種類型的犯罪發(fā)生,有效偵破犯罪案件,促進(jìn)社會的穩(wěn)定發(fā)展。
除了在工農(nóng)業(yè)方面的廣泛應(yīng)用外,基于計(jì)算機(jī)視覺技術(shù)的對人體行為的分析也具有廣闊應(yīng)用前景。
2.1? 視頻監(jiān)控分析
目前社會面臨的各種恐怖事件和突發(fā)性事件越來越多,對新一代的智能化監(jiān)控技術(shù)需求愈加迫切,亟需在各類監(jiān)控系統(tǒng)中應(yīng)用視頻人體行為分析技術(shù),實(shí)現(xiàn)對外部事件的實(shí)時(shí)分析,達(dá)到監(jiān)控智能化。隨著計(jì)算機(jī)技術(shù)的普及,近年來我國在大部分公共場所都安裝了視頻監(jiān)控設(shè)備,但這些監(jiān)控系統(tǒng)本身的作用僅是錄像,對視頻數(shù)據(jù)的分析和異常行為的檢測主要依靠人力在事后進(jìn)行,因此進(jìn)行的只能是事后查驗(yàn)處理。近年來計(jì)算機(jī)視覺技術(shù)的研究得到了飛速發(fā)展,制約其應(yīng)用的計(jì)算機(jī)設(shè)備也在性能上得到極大提升,讓人們距離利用計(jì)算機(jī)及相關(guān)設(shè)備替代人工實(shí)現(xiàn)智能化監(jiān)控的目標(biāo)越來越近。目前,具備簡單人體行為識別功能的智能視頻監(jiān)控系列產(chǎn)品在市面上已經(jīng)出現(xiàn),盡管這些產(chǎn)品還只能分析比較簡單的單一行為,但未來視頻監(jiān)控系統(tǒng)的發(fā)展趨勢必將是智能化的監(jiān)控系統(tǒng),而基于視頻的人體行為分析技術(shù)在該領(lǐng)域的應(yīng)用也將是行為分析領(lǐng)域研究者的研究目標(biāo)。智能監(jiān)控系統(tǒng)主要應(yīng)用于對安全要求較高的場合,及時(shí)發(fā)現(xiàn)和制止人的可疑行為。
2.2? 人機(jī)交互
人與人之間的交流、交互主要通過語音和行為實(shí)現(xiàn),雖然計(jì)算機(jī)語音識別技術(shù)發(fā)展迅速,但人與計(jì)算機(jī)的交互目前最主要的途徑還是鍵盤和鼠標(biāo)。計(jì)算機(jī)視覺技術(shù)的應(yīng)用可以讓計(jì)算機(jī)借助人的嘴唇動(dòng)作、人臉表情、手勢動(dòng)作、軀干運(yùn)動(dòng)以及這些動(dòng)作的合成測定了解人的意愿要求,從而執(zhí)行指令,不僅增加了交互的臨場感和方便性,也符合人類的交互習(xí)慣,讓計(jì)算機(jī)系統(tǒng)能夠真正理解人的行為是人機(jī)交互的最終目標(biāo),最終達(dá)到人與計(jì)算機(jī)交流像人與人的交流一樣自然。
2.3? 內(nèi)容視頻檢索
傳統(tǒng)的視頻檢索是基于文本進(jìn)行的,檢索局限性非常大?;趦?nèi)容的視頻檢索是通過計(jì)算機(jī)技術(shù)分析視頻的內(nèi)容,如通過拳擊、跳舞、射門等都包含復(fù)雜人體行為的事件來實(shí)現(xiàn)視頻檢索。另外,人樣標(biāo)本中不同的個(gè)體在行為模式上也各有特點(diǎn),因此,要實(shí)現(xiàn)視頻檢索和身份認(rèn)證,可以將人體的行為模式作為基本特征,該方法通過視頻從較遠(yuǎn)的距離觀察目標(biāo)人體并采集到相關(guān)的特征數(shù)據(jù),無需近距離對目標(biāo)人體再進(jìn)行標(biāo)準(zhǔn)化的采集。目前,基于行為模式的研究在步態(tài)識別等方面取得一定進(jìn)展,雖然現(xiàn)階段該研究還有待進(jìn)一步深入,但作為一種輔助手段,在人員搜索等特殊應(yīng)用方面,基于行為模式的身份認(rèn)證方法可以發(fā)揮一定作用。
2.4? 運(yùn)動(dòng)合成
基于計(jì)算機(jī)視覺技術(shù)的人體行為分析,在動(dòng)漫制作、游戲制作、電影制作、虛擬現(xiàn)實(shí)等方面都有重要應(yīng)用,大量動(dòng)漫和游戲中虛擬人物的運(yùn)動(dòng)不是憑空制作出來的,都是通過采集真實(shí)人體運(yùn)動(dòng)數(shù)據(jù)后再進(jìn)行合成。運(yùn)動(dòng)合成就是在采集分析人體基本行為數(shù)據(jù)的基礎(chǔ)上確定人體在不同環(huán)境下運(yùn)動(dòng)的行為軌跡,如人體四肢在不同時(shí)刻的位置和肢體角度等,并將這些數(shù)據(jù)應(yīng)用到計(jì)算機(jī)中的虛擬人物,從而使虛擬人物在運(yùn)動(dòng)表現(xiàn)形式上擁有逼真的效果。
3? ? 基于視頻的人體行為分析發(fā)展趨勢
依據(jù)目前的研究現(xiàn)狀,對視頻中人體行為分析計(jì)算復(fù)雜度高的問題,一些能夠?qū)崿F(xiàn)行為搜索的快速算法陸續(xù)出現(xiàn),同時(shí),計(jì)算機(jī)硬件設(shè)備性能的快速發(fā)展也對提高人體行為搜索速度起到了非常大的幫助,盡管如此,行為搜索的計(jì)算速度還是遠(yuǎn)遠(yuǎn)不能達(dá)到或逼近實(shí)時(shí)。因此,研究高效的行為搜索算法依然是一個(gè)非常重要的研究內(nèi)容。在未來基于視頻的人體行為分析研究中,復(fù)雜場景下自然的人體行為分析將是一個(gè)重要發(fā)展方向。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展以及計(jì)算機(jī)硬件設(shè)備的進(jìn)步,基于視頻的人體行為分析必將朝著更加智能、高效和自然的方向發(fā)展。
[參考文獻(xiàn)]
[1]郭萍.基于視頻的人體行為分析[D].北京:北京交通大學(xué),2012.
[2]岳曉峰.計(jì)算機(jī)視覺技術(shù)及其在工業(yè)中應(yīng)用的研究[D].長春:吉林大學(xué),2006.
[3]馮斌.計(jì)算機(jī)視覺信息處理方法與水果分級檢測技術(shù)研究[D].北京:中國農(nóng)業(yè)大學(xué),2002.
[4]趙曉霞.計(jì)算機(jī)視覺技術(shù)在農(nóng)業(yè)中的應(yīng)用[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2004(4):124-126.
Abstract:The research of computer vision technology has received wide attention all over the world. Computer vision technology has been widely used in industrial and agricultural production, social public safety, human-computer interaction, virtual reality and other fields. The application of computer vision technology not only brings great convenience to peoples production and life, but also has a great impact on the management of various industries and the entire society. In the future, video-based human behavior analysis research, natural human behavior analysis under complex scenes will be an important development direction. This paper analyzes it.
Key words:vision technology; behavior analysis; intelligent monitoring