郭 惠, 耿寶光
(1 山西旅游職業(yè)學(xué)院, 太原 030031; 2 山西工程職業(yè)學(xué)院, 太原 030031)
隨著社會的快速發(fā)展和科技的不斷進(jìn)步,人體步態(tài)智能檢測與識別逐漸成為研究的熱點(diǎn)。 人體步態(tài)在犯罪偵查、生物識別以及健康監(jiān)督等眾多領(lǐng)域中具有廣泛的應(yīng)用價(jià)值。 因此,準(zhǔn)確、高效的人體步態(tài)智能檢測與識別方法的設(shè)計(jì)與研究成為迫切需求。 步態(tài)異??赡軙?dǎo)致許多問題,如在工業(yè)生產(chǎn)中,員工的步態(tài)異??赡軙绊懝ぷ餍屎凸ぷ靼踩?,而在體育運(yùn)動中,運(yùn)動員的步態(tài)異??赡軙绊懹?xùn)練質(zhì)量和運(yùn)動表現(xiàn)[1]。 這種異常狀態(tài)可能是由身體疾病、運(yùn)動損傷等原因?qū)е碌?,如果步態(tài)異常未及時(shí)發(fā)現(xiàn)和處理,還可能導(dǎo)致進(jìn)一步的身體損傷或惡化現(xiàn)有的健康問題,故確立一種能夠快速、精準(zhǔn)地檢測人體步態(tài)異常狀態(tài)的方法對個(gè)體生活質(zhì)量和身體健康的保障顯得尤為必要[2]。 傳統(tǒng)的人體步態(tài)檢測與識別方法受限于技術(shù)和算法的局限性,主要依賴于醫(yī)師或?qū)I(yè)機(jī)構(gòu)的手動檢測和評估,存在著測量不準(zhǔn)、主觀偏差強(qiáng)等問題[3]。 近年來,隨著機(jī)器學(xué)習(xí)算法的崛起,特別是深度學(xué)習(xí)網(wǎng)絡(luò)的成功應(yīng)用,使更加有效地探索和發(fā)掘人體步態(tài)智能檢測與識別變?yōu)榭赡埽?]。 故本文引入機(jī)器學(xué)習(xí)算法,研究人體步態(tài)異常狀態(tài)檢測方法。 通過構(gòu)建人體步態(tài)模型、進(jìn)行步態(tài)檢測和二值化后處理、提取步態(tài)運(yùn)動特征以及識別異常狀態(tài)等環(huán)節(jié),提出一種人體步態(tài)智能檢測與識別方法。 同時(shí),通過對比實(shí)驗(yàn),選擇適當(dāng)?shù)膶?shí)驗(yàn)指標(biāo),并進(jìn)行實(shí)驗(yàn)結(jié)果和分析,以驗(yàn)證所提方法在準(zhǔn)確性和實(shí)時(shí)性方面的優(yōu)勢。
本文以國家語言資源監(jiān)測與研究中心(National Language Resources Monitoring and Research Center,NLPR)創(chuàng)建和管理的視頻數(shù)據(jù)庫為數(shù)據(jù)來源,其中包含了人體步態(tài)視頻數(shù)據(jù),可用于對人體步態(tài)模型的構(gòu)建。 為了對人體步態(tài)進(jìn)行檢測,從中提取部分人體步態(tài)視頻數(shù)據(jù),針對每一個(gè)視頻數(shù)據(jù),存儲每一幀作為獨(dú)立的圖像,并按照時(shí)間順序進(jìn)行排序,形成一個(gè)圖像序列。 針對獲取到的人體步態(tài)圖像序列,構(gòu)建人體步態(tài)模型。 通過運(yùn)動檢測,結(jié)合人體輪廓特征結(jié)合的方式尋找質(zhì)心,并按照人體四肢與身高的比例,將其合理劃分為7 個(gè)不同區(qū)域。 如圖1 所示,按照比例大小以及從上到下的順序,將人體分為4 個(gè)部分,分別為頭部(A)、軀干(B、C)、大腿(D、E)和小腿(F、G);再沿著人體的重心,對人體從側(cè)影劃分為前、后兩部分(頭部除外)。
圖1 人體步態(tài)結(jié)構(gòu)劃分示意圖Fig.1 Schematic diagram of human gait structure division
利用矩形i的參數(shù)矢量進(jìn)行描述:
式中:fi表示矩形i的參數(shù)矢量,(xi,yi) 表示矩形i的中心位置,ki表示矩形i長和寬的比值,αi表示矩形i長軸的方向矢量,ji表示矩形i長軸的長度。 其中,i的取值為大于或等于1,且小于或等于7 的整數(shù)。
將上述公式作為人體步態(tài)模型,其結(jié)構(gòu)簡單易于實(shí)現(xiàn),且具有較強(qiáng)的抗噪聲能力。 通過本節(jié)的步驟,可以構(gòu)建出一個(gè)有效的人體步態(tài)模型,為后續(xù)的人體步態(tài)異常狀態(tài)檢測與識別方法提供基礎(chǔ)。 相比于僅從整個(gè)身體出發(fā)的步態(tài)描述,該模型更加細(xì)致、恰當(dāng)?shù)貏澐至松眢w的區(qū)域,能夠更加精確地刻畫出身體的姿態(tài),實(shí)現(xiàn)身體姿態(tài)的重建。 新穎的模型可以提升對步態(tài)異常的敏感性和準(zhǔn)確性,從而實(shí)現(xiàn)更精確、可靠的步態(tài)異常識別。
在人體步態(tài)異常狀態(tài)檢測和識別方法中,人體步態(tài)檢測是一個(gè)關(guān)鍵步驟。 為了使構(gòu)建的模型更加精準(zhǔn)地分析和處理人體步態(tài)數(shù)據(jù),首先檢測出人體在視頻圖像序列中存在位置。 在上文構(gòu)建人體步態(tài)模型時(shí),已將人體步態(tài)從視頻圖像序列中提取出來,則需要從視頻圖像序列中,恢復(fù)人體步態(tài)圖像中的背景圖像,使人體步態(tài)及其背景圖像構(gòu)成一個(gè)整體,進(jìn)而以整體為單位開展進(jìn)一步的步態(tài)檢測及二值化處理。 假設(shè)l表示一個(gè)包含了N幀的圖像序列,則其背景圖像可以用下述公式進(jìn)行描述:
式中:Bxy表示視頻圖像序列中的背景圖像,qxy表示某一像素點(diǎn)(x,y) 位置上的灰度計(jì)算結(jié)果。 移動像素是由背景圖像和當(dāng)前圖像的差異得到的[5]。 由于移動的像素點(diǎn)可能屬于背景圖像區(qū)域,也可能屬于前景目標(biāo)區(qū)域,故提出一種基于人類行走軌跡的像素識別算法。 引入貝葉斯規(guī)則進(jìn)行分類,其表達(dá)式為
式中:s表示像素點(diǎn),vt表示在某一時(shí)刻t時(shí)像素點(diǎn)的顏色值,f表示貝葉斯函數(shù),b表示像素點(diǎn)集合。
在上述條件基礎(chǔ)上,針對某一像素點(diǎn)在某一時(shí)刻顏色為vt時(shí)屬于前景或背景的概率進(jìn)行計(jì)算。 對統(tǒng)計(jì)結(jié)果進(jìn)行二值化處理,將步態(tài)圖像轉(zhuǎn)換為二值圖像,結(jié)果如圖2 所示。
圖2 二值化處理后人體步態(tài)圖像前后對比示意圖Fig.2 Comparison of human gait images before and after binarization
二值化是一個(gè)重要的數(shù)據(jù)預(yù)處理步驟,可以強(qiáng)調(diào)步態(tài)圖像中的形態(tài)特征,并抑制不相關(guān)的圖像信息。 從圖2 中可以看出,經(jīng)過二值化處理的人體步態(tài)圖像在一定程度上去除了與檢測目標(biāo)無關(guān)的冗余部分。 由于目前還沒有一種完全理想的檢測算法,因此二進(jìn)制探測結(jié)果中仍有少量的孔隙或小塊。 在上述過程中,逐步實(shí)現(xiàn)了人體步態(tài)模型的進(jìn)一步完善與優(yōu)化,對于后續(xù)的人體步態(tài)運(yùn)動特征提取過程來說,此步驟能夠有效降低冗余數(shù)據(jù)帶來的干擾,使特征提取和人體步態(tài)異常狀態(tài)檢測結(jié)果更加精準(zhǔn)。
以上述構(gòu)建的人體步態(tài)模型作為基礎(chǔ),便可以通過模型來重構(gòu)人體姿勢。 但考慮到人體步態(tài)本身具有一定的時(shí)空運(yùn)動特性,因此需要提取步態(tài)變化信息。 通過提取與人體步態(tài)相關(guān)的特征,可以將復(fù)雜的運(yùn)動模式轉(zhuǎn)化為一組更具表征性和易于處理的姿態(tài)變化序列。 在提取步態(tài)變化信息前首先應(yīng)當(dāng)明確的是,雖然兩個(gè)長相相似的人也可能會有幾個(gè)完全一樣的姿態(tài),但由于人體步伐中包含了個(gè)人的信息,因此姿態(tài)間的連續(xù)變化曲線也會有所不同。 隨著人體的運(yùn)動過程對人體運(yùn)動軌跡進(jìn)行分析時(shí)可以發(fā)現(xiàn),每幀間的變化信息與直接通過每幀信息提取進(jìn)行識別相比具有更高的可靠性和說服力。 因此,針對上述人體形態(tài)模型,只考慮其矩形模型的前3個(gè)作為參數(shù),由此實(shí)現(xiàn)對人體步態(tài)運(yùn)動特征的提取。
取一個(gè)周期內(nèi)的步態(tài)序列,假設(shè)其長度為L。從該序列當(dāng)中得到各個(gè)幀的人體態(tài)勢表達(dá)為Ft,構(gòu)成一個(gè)28×L的矩陣F。 通過計(jì)算,得到在某一時(shí)刻t時(shí)的人體姿態(tài)變化矢量。 由于人行走時(shí)會受到多種因素的影響,因此步速通常是不一致的,所以L的取值也不同。 針對這一特點(diǎn),對步態(tài)序列在時(shí)間域上進(jìn)行歸一化處理。 結(jié)合動態(tài)時(shí)間規(guī)整的方式,將一系列不同長度的步伐調(diào)整到長度均為N的序列。 根據(jù)上述設(shè)定,得到變化序列為
式中:Dl表示序列l(wèi)的姿態(tài)變化序列。 由于在人體步態(tài)序列中,人體距離攝像機(jī)的距離是可以隨意改變的,因此還需要結(jié)合上述邏輯,對視頻序列進(jìn)行幅度上的歸一化處理。 處理后將所有序列匯總,并構(gòu)成人體步態(tài)特征矩陣。 在得到歸一化處理后的步態(tài)特征矩陣后,利用矩陣中的特征表現(xiàn)人體步態(tài)運(yùn)動本質(zhì),并用于后續(xù)的異常狀態(tài)識別。
本節(jié)根據(jù)實(shí)際需求,選擇了適宜的特征提取方法,以提高系統(tǒng)的性能并提供更有效的異常狀態(tài)識別結(jié)果。 通過對人體步態(tài)運(yùn)動特征的提取,可以將復(fù)雜的步態(tài)信息轉(zhuǎn)化為簡化且有代表性的姿態(tài)變化序列,進(jìn)一步用于后續(xù)的人體步態(tài)異常狀態(tài)識別。
為實(shí)現(xiàn)對人體步態(tài)異常狀態(tài)的識別,引入機(jī)器學(xué)習(xí)算法,運(yùn)用其中的決策樹,實(shí)現(xiàn)對象屬性與對象值之間的映射,使得人體步態(tài)的狀態(tài)更易于理解和實(shí)現(xiàn),并在較短的時(shí)間內(nèi)實(shí)現(xiàn)對海量數(shù)據(jù)源的處理與分析。 該方法把相同人體的多個(gè)步態(tài)作為一組,利用馬氏距離來衡量人體多個(gè)步態(tài)的相似性。 相似度的測定過程可用下述公式形式表示為
式中:M(l,Gi) 表示序列與步態(tài)數(shù)據(jù)庫中序列之間的相似度測定結(jié)果,Gi表示數(shù)據(jù)庫當(dāng)中某一類步態(tài)序列,μi表示Gi的均值,∑i表示Gi的方差。
將上述測定操作導(dǎo)入機(jī)器學(xué)習(xí)算法的決策樹當(dāng)中,根據(jù)相似度測定結(jié)果對人體步態(tài)進(jìn)行決策。 決策依據(jù)為:M(l,Gi) 測定結(jié)果的數(shù)值越小,距離度量越小,相似性越高;反之,M(l,Gi) 測定結(jié)果的數(shù)值越大,距離度量越大,相似性越低,則判定人體步態(tài)處于異常狀態(tài)。 為進(jìn)一步體現(xiàn)人體步態(tài)異常狀態(tài)識別能力,引入機(jī)器學(xué)習(xí)算法中的NN 分類器(最近鄰分類器)和KNN 分類器(K-近鄰分類器)。 NN分類器就是將一個(gè)被試序列劃分為最接近其的一個(gè)步態(tài);KNN 分類器是指在距離測試序列最近的K個(gè)序列中,選擇同一類型中所占比重最大的一個(gè),將其作為測序序列的歸屬類別,則不屬于歸屬類別的序列可被判定為人體步態(tài)的異常狀態(tài)。 根據(jù)馬氏距離,將被測量的數(shù)據(jù)分成最短的兩個(gè)類別。
為實(shí)現(xiàn)對上述基于機(jī)器學(xué)習(xí)算法的識別方法應(yīng)用優(yōu)勢的檢驗(yàn),選擇將NLPR 數(shù)據(jù)庫作為此次實(shí)驗(yàn)的數(shù)據(jù)集,將基于Hopf 振蕩器的識別方法和基于步態(tài)觸覺信息的識別方法分別作為對照A 組和對照B組,將本文設(shè)計(jì)的識別方法作為實(shí)驗(yàn)組,開展對比實(shí)驗(yàn)研究。
在上述選擇的數(shù)據(jù)集當(dāng)中包含了10 個(gè)人的步態(tài)序列,針對每個(gè)人的步態(tài)序列都包含了3 種不同角度,分別為0°、45°和90°;每個(gè)人對應(yīng)的每個(gè)角度都包含5 個(gè)序列,共計(jì)150 個(gè)序列。 首先,實(shí)驗(yàn)過程中采用計(jì)算機(jī)仿真的形式,對3 種方法的識別率進(jìn)行對比。 識別率CRR的計(jì)算公式為
式中:T表示正確識別的個(gè)數(shù),W表示待識別樣本總數(shù)。
根據(jù)上述公式,計(jì)算得出3 種方法在不同角度條件下針對每組步態(tài)序列識別后得到的正確識別率,并選取最好正確識別率(CRR值最高)的結(jié)果。結(jié)果記錄見表1。
表1 3 種識別方法最好識別率對比表Tab.1 Comparison of the three recognition methods
從表1 結(jié)果可以看出,在多種不同條件下,實(shí)驗(yàn)組方法的最好識別率均高于對照A 組和對照B 組。進(jìn)一步分析得出,盡管3 種方法在識別時(shí)其性能會受到角度條件的影響,但實(shí)驗(yàn)組方法最好,識別率始終高于90%,而對照A 組方法和對照B 組方法的最好識別率明顯降低,識別結(jié)果嚴(yán)重不符合人體步態(tài)識別的高準(zhǔn)確性需要。 由此證明,本文所提方法可以實(shí)現(xiàn)對人體步態(tài)異常狀態(tài)的高準(zhǔn)確率識別,且受到人體步態(tài)觀測角度的影響較小,具備較高的應(yīng)用價(jià)值。
在此基礎(chǔ)上,針對3 種識別方法的識別精度進(jìn)行對比,選擇將識別到的人體步態(tài)步長作為識別對象。 實(shí)驗(yàn)前,明確每個(gè)人體步態(tài)序列中每步的步長,對比實(shí)際步長與通過3 種識別方法得到的結(jié)果,若誤差小,則說明識別精度高。 實(shí)驗(yàn)結(jié)果見表2。
表2 3 種方法識別精度對比表Tab.2 Comparison of recognition accuracy of three methods
從表2 中數(shù)據(jù)可見,實(shí)驗(yàn)組方法識別結(jié)果與實(shí)際步長之間誤差不超過0.05 cm,而對照A 組和對照B 組方法的誤差均超過這一范圍。 說明本文設(shè)計(jì)的識別方法不僅具備更高的正確識別率,同時(shí)能夠?qū)崿F(xiàn)對人體步態(tài)的高精度識別。
本文研究了機(jī)器學(xué)習(xí)算法在人體步態(tài)異常狀態(tài)檢測與識別中的具體應(yīng)用,并提出了一種全新的檢測與識別方法。 將該方法應(yīng)用于實(shí)際可以實(shí)現(xiàn)對人體步態(tài)異常狀態(tài)的準(zhǔn)確識別,為人體目標(biāo)狀態(tài)的跟蹤提供便利條件。 在后續(xù)的研究中,將研究重點(diǎn)集中在更好地實(shí)現(xiàn)人體步態(tài)異常檢測,克服視角變化的依賴性等方面,從而促進(jìn)該方法的應(yīng)用性能得到進(jìn)一步提升。