李洪安,杜卓明,李占利,惠巧娟,白佳豪
基于雙特征匹配層融合的步態(tài)識(shí)別方法
李洪安1,杜卓明2,李占利1,惠巧娟3,白佳豪1
(1. 西安科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,陜西 西安 710054;2.江蘇理工學(xué)院計(jì)算機(jī)工程學(xué)院,江蘇 常州 213001;3. 中國(guó)礦業(yè)大學(xué)銀川學(xué)院機(jī)電動(dòng)力與信息工程系,寧夏 銀川 750021)
步態(tài)識(shí)別是根據(jù)人類走路的姿態(tài)來(lái)進(jìn)行遠(yuǎn)距離的身份識(shí)別。針對(duì)輪廓不完整的圖像和關(guān)鍵幀容易造成部分信息丟失而引起的識(shí)別率下降問(wèn)題,提出一種基于雙特征匹配層融合的步態(tài)識(shí)別方法。步態(tài)既有靜態(tài)圖像特征,又有動(dòng)態(tài)速度變化特征,因此本文提出用匹配層融合方法將靜態(tài)的Hu矩6個(gè)不變矩特征和動(dòng)態(tài)的幀差百分比特征融合后進(jìn)行步態(tài)身份識(shí)別。首先對(duì)一個(gè)周期內(nèi)的歸一化步態(tài)圖像進(jìn)行Hu矩特征以及幀差百分比的特征提取,將Hu矩6個(gè)不變矩特征描述成一個(gè)特征向量,然后運(yùn)用匹配層融合算法對(duì)2個(gè)特征進(jìn)行融合;最后使用K近鄰分類器進(jìn)行身份識(shí)別。實(shí)驗(yàn)表明,該方法較單一方法能夠有效地提高步態(tài)識(shí)別正確率。
步態(tài)識(shí)別;Hu矩特征;幀差百分比特征;匹配層融合
步態(tài)識(shí)別作為一種新興的生物特征識(shí)別技術(shù),旨在根據(jù)人類走路的姿態(tài)來(lái)進(jìn)行遠(yuǎn)距離的身份識(shí)別,具有其他生物認(rèn)證技術(shù)所不具有的獨(dú)特優(yōu)勢(shì),即在遠(yuǎn)距離或低視頻質(zhì)量情況下的識(shí)別潛力[1]。步態(tài)識(shí)別技術(shù)的明顯優(yōu)勢(shì)有:①步態(tài)識(shí)別不需要被監(jiān)測(cè)人的配合,不需要強(qiáng)制接觸識(shí)別設(shè)備,應(yīng)用條件更廣泛;②步態(tài)識(shí)別技術(shù)可以對(duì)遠(yuǎn)距離的行人進(jìn)行身份識(shí)別,甚至能監(jiān)測(cè)更廣范圍的行走人的身份;③人的步態(tài)特征是身體各部位的協(xié)調(diào)動(dòng)作,具有獨(dú)特性,難以模仿和偽造[2]。在智能門(mén)禁系統(tǒng)視覺(jué)監(jiān)控系統(tǒng)以及高級(jí)人機(jī)交互等應(yīng)用中,步態(tài)成為人的重要生物信息。在公共場(chǎng)合,步態(tài)信息更容易獲取,步態(tài)識(shí)別在火車站、商場(chǎng)等場(chǎng)合下的安全識(shí)別在未來(lái)具有廣泛的應(yīng)用前景[3]。
人的行走過(guò)程不但是一個(gè)周期性的運(yùn)動(dòng),并且需要身體各個(gè)部位的配合,因此,在行走時(shí)人的手臂、腿部是呈周期性擺動(dòng)的,高度之類的人體參數(shù)也是隨著行走而周期性的變化。反映在圖像上,就是人在行走時(shí)輪廓的明顯變化。每個(gè)人的步態(tài)特征是不同的,因此人體輪廓的變化也是各有差異,找到人在行走時(shí)輪廓的變化規(guī)律就能在一定程度上區(qū)分步態(tài),同時(shí)也說(shuō)明了步態(tài)特征不僅是基于腿部的行走特征,上身的運(yùn)動(dòng)也同樣的重要。陳玲和楊天奇[4]使用質(zhì)心到頭頂和兩腳之間的距離作為特征,但未考慮行走過(guò)程中手臂的配合擺動(dòng)。HU等[5]提出了一種基于輪廓的步態(tài)識(shí)別算法,利用目標(biāo)質(zhì)心到輪廓邊緣上各點(diǎn)的距離作為特征,該方法雖然有效,但由于采用的數(shù)據(jù)過(guò)多,丟失了輪廓上的一些關(guān)鍵信息,導(dǎo)致計(jì)算量大且數(shù)據(jù)復(fù)雜,同時(shí)也丟失了部分動(dòng)態(tài)信息。趙志杰等[6]提出了基于圖像輪廓多特征的步態(tài)識(shí)別算法,從圖像輪廓的基礎(chǔ)上選取了圖像步態(tài)的3個(gè)特征。SABIR等[7]將輪廓寬度、腿部的像素幀差和小波變換的圖像統(tǒng)計(jì)特征融合,取得了較好的效果,但其中的部分輪廓寬度無(wú)法準(zhǔn)確的提取,幀差特征識(shí)別率過(guò)低。URTASUN和FUA[8]采用了時(shí)間運(yùn)動(dòng)模型來(lái)同步視頻序列,該模型可用于跟蹤,及恢復(fù)運(yùn)動(dòng)參數(shù)以便識(shí)別,但該方法僅克服了利用動(dòng)態(tài)特征的局限性。
基于輪廓特征的識(shí)別方法對(duì)輪廓有著較高的依賴,輪廓不完整的圖像或者關(guān)鍵幀,容易造成部分信息丟失以及識(shí)別率下降的影響,并且視頻步態(tài)既包含靜態(tài)圖像特征,又包含動(dòng)態(tài)的速度特征。針對(duì)以上問(wèn)題,本文采用基于輪廓多特征融合的步態(tài)識(shí)別方法,通過(guò)提取靜態(tài)關(guān)鍵幀的輪廓圖像不變矩特征與動(dòng)態(tài)的幀差百分比特征,利用匹配層特征融合方法來(lái)識(shí)別不同的個(gè)體。從而避免因輪廓不完整和僅靜態(tài)特征等因素造成識(shí)別率過(guò)低的影響,相對(duì)于單一特征的識(shí)別,有效地提高了識(shí)別率。
步態(tài)識(shí)別包括4個(gè)步驟:視頻圖像的獲取、目標(biāo)提取、步態(tài)特征的提取和分類識(shí)別[9]。圖1為步態(tài)識(shí)別的基本流程。首先,監(jiān)控設(shè)備捕捉人行走時(shí)的步態(tài)視頻,再將步態(tài)視頻分解成為一幀幀的圖像,并使用目標(biāo)檢測(cè)的方法從圖像中提取目標(biāo)圖像,然后根據(jù)提前設(shè)計(jì)好的特征提取方法進(jìn)行特征提取,最后再通過(guò)分類器進(jìn)行分類識(shí)別。
圖1 步態(tài)識(shí)別的基本流程
圖像特征是用一組數(shù)據(jù)來(lái)描述整個(gè)圖像變量,其圖像特征廣泛應(yīng)用于步態(tài)識(shí)別中。這組數(shù)據(jù)要求越簡(jiǎn)單越好,并且要有較高的代表性。在圖像識(shí)別發(fā)展過(guò)程中,不斷地有特征被提出,圖像不變矩特征就是其中之一[10]。
矩是概率與統(tǒng)計(jì)中的一個(gè)概念,是隨機(jī)變量的一種數(shù)字特征[11]。設(shè)為隨機(jī)變量,為常數(shù),為正整數(shù)。則[(–)]稱為關(guān)于點(diǎn)的階矩。
當(dāng)=0時(shí),=()稱為的階原點(diǎn)矩。
當(dāng)=()時(shí),=[(–)]稱為的階中心矩。
針對(duì)于一幅圖像,可將像素的坐標(biāo)看成是一個(gè)二維隨機(jī)變量(,),那么一幅灰度圖像可以用二維密度函數(shù)來(lái)表示,因此可以用矩來(lái)表示灰度圖像的數(shù)字特征。不變矩是一組高度濃縮的圖像特征,具有平移、灰度、尺度、旋轉(zhuǎn)不變性[12]。
Hu矩是由二階和三階中心矩推導(dǎo)得出的。廣泛的應(yīng)用于圖像匹配、識(shí)別等領(lǐng)域。
定義.對(duì)于任意非負(fù)整數(shù),,(,)為二維圖像,在平面上的+階矩為
其中,(,)為圖像灰度值,僅在有限平面上分段連續(xù);為任意非負(fù)整數(shù)。由于并不是平移不變性的,因此+階中心矩為