鹿建國
(山東省水利職工大學(xué),山東 淄博255130)
在人體識(shí)別領(lǐng)域的眾多研究方向中,人體朝向分析一直是一個(gè)少有人涉及的領(lǐng)域。在以往的研究成果中,有一些研究者談及了人臉朝向問題,其中大多數(shù)研究者希望在人臉識(shí)別過程中去除人臉?biāo)叫D(zhuǎn)對(duì)識(shí)別過程的不良影響,也有研究者利用人臉朝向來驅(qū)動(dòng)多方位投影交互系統(tǒng)[1]。
本文涉及的是有關(guān)基于智能空間的人體監(jiān)控問題,研究人臉朝向是一件很有意義的工作,若能判斷和估計(jì)人臉朝向,便可以確定人的視野范圍及注意對(duì)象,進(jìn)而推斷其當(dāng)前的活動(dòng)狀態(tài),分析他的行動(dòng)意圖。
下面分別介紹針對(duì)多目及單目環(huán)境人體朝向分析的解決方案。
多攝像機(jī)系統(tǒng)由于能覆蓋較大的監(jiān)控區(qū)域,可有效地解決遮擋問題而成為近幾年來國內(nèi)外研究的熱點(diǎn)問題[2]。在多攝像機(jī)環(huán)境下,對(duì)于同一個(gè)目標(biāo),多個(gè)攝像機(jī)可以從不同的角度進(jìn)行拍攝,從而可以得到不同視角下的圖像。因?yàn)楦鲾z像機(jī)方位、角度已知,可以通過對(duì)各圖像的分析得到人臉的朝向信息。
在本部分內(nèi)容中,以同一人體從不同角度拍照得到的圖像模擬多攝像機(jī)的監(jiān)控環(huán)境。
本文采用的算法是將色度分析與灰度分析相結(jié)合,分別得到人體頭部的二值化圖像和人體頭部膚色區(qū)域所對(duì)應(yīng)的二值化圖像,然后分別計(jì)算每幅圖像中膚色區(qū)域占人體頭部區(qū)域的比率(一般來說,該比率越大,表示其朝向該采集攝像頭方向的可能性越大),最后,根據(jù)得到的幾幅圖像各自的比率值判斷出人體的朝向。算法流程圖如圖1所示。
圖1 算法流程圖
本文采集了兩組圖片,分別顯示了兩個(gè)人的不同視角。第1組實(shí)驗(yàn)效果如圖2所示。
圖2中,第1行為原始圖片,第 2行為利用圖像差分法得到的二值化圖像,第3行為頭部膚色區(qū)域。得到的實(shí)驗(yàn)數(shù)據(jù)如表1所示。
從表1可以看出,列1的人體基本上面向鏡頭,它所對(duì)應(yīng)的比率值最大;列3中的人體基本上背向鏡頭,它所對(duì)應(yīng)的比率值最小。
表1 圖2對(duì)應(yīng)的實(shí)驗(yàn)數(shù)據(jù)
第2組圖片中的人戴眼鏡,穿紅色上衣,實(shí)驗(yàn)效果如圖3所示。
圖3中,第 1行為原始圖片,第 2行為利用圖像差分法得到的二值化圖像,第3行為頭部膚色區(qū)域。得到的實(shí)驗(yàn)數(shù)據(jù)如表2所示。
表2 圖2對(duì)應(yīng)的實(shí)驗(yàn)數(shù)據(jù)
從表2可以看出,列1人體正面面向鏡頭,它所對(duì)應(yīng)的比率值最大;列2中的人體側(cè)面面向鏡頭,它所對(duì)應(yīng)的比率值次之;列3中的人體側(cè)背向鏡頭,它所對(duì)應(yīng)的比率值最小。
假定在一智能監(jiān)控的房間中,裝有4個(gè)攝像頭,其分布如圖4所示。
圖4中箭頭方向?yàn)槿梭w的朝向,分別對(duì)由4個(gè)攝像頭拍攝到的圖像進(jìn)行分析,可以得到4幅圖像所分別對(duì)應(yīng)的比率值,由比率值就可以得到人體的朝向。如圖4所示的情況,西攝像頭對(duì)應(yīng)的比率最大,北攝像頭的比率次之,南攝像頭的比率再次之,東攝像頭的比率最小,因此可以得到該人體的朝向是西偏北。
該方法可以推廣到分布有3個(gè)或更多攝像頭的情況,攝像頭越多,得到的人體朝向信息越準(zhǔn)確。
在真實(shí)環(huán)境空間中,人體的朝向方向可能為360°范圍內(nèi)的任何方向,用單個(gè)攝像頭很難做到實(shí)時(shí)捕獲到所有的關(guān)鍵人臉信息,所以本文設(shè)計(jì)了一個(gè)大概判斷人體朝向的方法。
單目環(huán)境下,某一時(shí)刻只能獲得智能空間中的人體的單張圖片,因而無法獲得該人體的準(zhǔn)確朝向信息。而本文的算法可以在得到人體頭部區(qū)域和人體頭部膚色區(qū)域的情況下,計(jì)算出人體頭部區(qū)域中各白色像素點(diǎn)X坐標(biāo)的均值以及人體頭部膚色區(qū)域中各白色像素點(diǎn)X坐標(biāo)的均值,通過比較這兩個(gè)均值的大小可判斷出人體朝向偏向鏡頭的左邊還是右邊,兩均值的差的絕對(duì)值越大,表明人體相對(duì)鏡頭偏轉(zhuǎn)的角度也越大,從而得到人體的大體朝向 (在攝像頭安裝位置、方位已知的情況下)。算法流程圖如圖5所示。
圖5 算法流程圖
第1組圖片測(cè)試效果如圖6所示。
圖6中,列 1為原始圖片,列2為圖像差分后得到的二值化圖像,列3為膚色區(qū)域,利用上述算法得到的數(shù)據(jù)如表3所示。
表3 圖6對(duì)應(yīng)的數(shù)據(jù)比較
下面對(duì)表3中的數(shù)據(jù)進(jìn)行進(jìn)一步的分析。先假定攝像頭的安裝方位是房間的正北方,即攝像頭鏡頭面向正南(做這樣的假定便于后續(xù)分析,在后續(xù)的兩個(gè)分析中均采用相同的假定)。因該算法采用的X軸的正方向是水平向左的,若Xf<Xh,則表示得到的圖像中人體頭部偏向左邊,在房間中人體的朝向是面向北偏東方向;反之,若Xf>Xh,則表示圖像中人體頭部偏向右邊,在房間中人體的朝向是面向北偏西方向。而|Xf-Xh|的值越大,表示頭部偏東或偏西的角度越大。
按照上述思路對(duì)表3中的數(shù)據(jù)做進(jìn)一步的整理,得到結(jié)果如表4所示。
仔細(xì)觀察行3和行4的原始圖片可以發(fā)現(xiàn),其實(shí)圖像中的人體該算是背向鏡頭的,這種情況可以借助面積比r來幫助識(shí)別,若r較大,認(rèn)為是面向鏡頭;若r較小,則認(rèn)為是背向鏡頭的。對(duì)于該組圖片,可以以r=0.4作為分界點(diǎn),若 r<0.4,則認(rèn)為人體是背向鏡頭的,所以將行3和行4對(duì)應(yīng)的人體朝向分別改為“南偏西”(即改為表4中小括號(hào)內(nèi)的結(jié)果)。比較原始圖像與上表中的結(jié)果就可以發(fā)現(xiàn),用該方法可以正確地得到大概的人體朝向和偏轉(zhuǎn)信息。
表4 圖6對(duì)應(yīng)的人體朝向分析
下面用另一組圖片對(duì)該算法進(jìn)行驗(yàn)證。該組圖片中人體遠(yuǎn)離鏡頭,頭部區(qū)域很小,而且人體伴有點(diǎn)煙、吸煙等無規(guī)律的動(dòng)作,如圖7所示。
按照前面的方法對(duì)得到的數(shù)據(jù)進(jìn)行分析得到的結(jié)果如表5所示。
表5 圖7對(duì)應(yīng)的數(shù)據(jù)比較及人體朝向分析
行3對(duì)應(yīng)的圖片中的人體有吸煙的動(dòng)作,行4對(duì)應(yīng)的圖片中的人體有點(diǎn)煙的動(dòng)作。比較原始圖片和得到的分析結(jié)果可以看出,在人體較小且存在無規(guī)律動(dòng)作的情況下,該算法仍能正確地判斷出人體的大體朝向及偏轉(zhuǎn)程度。
本文首先給出了多目環(huán)境下人體朝向的分析方法,通過分析人體頭部區(qū)域中膚色區(qū)域所占的比率來判斷人體面向該攝像機(jī)的可能性大小,并用多組圖片驗(yàn)證了該方法的有效性。隨后給出了單目環(huán)境下的人體朝向分析方法。在單目環(huán)境下無法獲得人體朝向的準(zhǔn)確信息,所以本文提出的是在攝像頭安裝位置確定的情況下,得到人體大體朝向的算法:分別計(jì)算人體頭部區(qū)域的橫坐標(biāo)均值和人體頭部區(qū)域中膚色區(qū)域的橫坐標(biāo)均值,通過比較兩個(gè)值的大小來得到人體的大體朝向。
本文介紹的是少有人涉及的領(lǐng)域——人體朝向分析,在監(jiān)控人體與跟蹤過程中研究人體的朝向,可以確定人的視野范圍及注意對(duì)象,為進(jìn)一步分析人體的行動(dòng)意圖打好基礎(chǔ)。
[1]陳銳,李輝,侯義斌.由人臉朝向驅(qū)動(dòng)的多方向投影交互系統(tǒng)[J].小型微型計(jì)算機(jī)系統(tǒng),2007,23(4):706-709.
[2]王濤,楊濤,潘泉.多攝像機(jī)環(huán)境下人臉最優(yōu)視角選擇算法[J].計(jì)算機(jī)工程與應(yīng)用,2005,17(9):49-51.