姜瑩礁
(武警內(nèi)蒙古總隊(duì),內(nèi)蒙古 呼和浩特010100)
本文提出基于聚類的神經(jīng)網(wǎng)絡(luò)人體行為識(shí)別算法[1]。粒子濾波基礎(chǔ)上引入具有聚類作用的MeanShift 算法,提高了粒子的利用率。采用混合特征方法表征人體特征。采用改進(jìn)的神經(jīng)網(wǎng)絡(luò)模型對(duì)人體行為進(jìn)行識(shí)別,提升了識(shí)別的準(zhǔn)確度。
利用單模態(tài)高斯背景模型對(duì)人體目標(biāo)進(jìn)行檢測(cè)和分割,獲取人體目標(biāo)在時(shí)間及空間上的變化狀態(tài)。利用該模型檢測(cè)到的人體運(yùn)動(dòng)狀態(tài),對(duì)當(dāng)前幀與背景模型的進(jìn)行差值化處理陰影去除,分割出人體的運(yùn)動(dòng)軌跡和背景。
均值偏移離子濾波算法[2]中,除了用到了粒子采用,狀態(tài)轉(zhuǎn)移,權(quán)值的修正等步驟,將均值偏移嵌入到粒子濾波算法框架,利用均值偏移算法對(duì)粒子進(jìn)行聚類,還對(duì)不同的粒子進(jìn)行種類的劃分,明確粒子的運(yùn)動(dòng)途徑和種類,能夠?qū)崟r(shí)準(zhǔn)確跟蹤粒子狀態(tài)。算法框架如圖1 所示。
圖1 兩種粒子濾波算法框架
傅里葉描述子算法把人體輪廓的點(diǎn)集轉(zhuǎn)換到平面上,對(duì)有序點(diǎn)集取傅里葉變換。圖2 為人體姿態(tài)圖中的1 幅圖像。
圖2 人體輪廓及側(cè)影提取
利用傅里葉算法[3]來選取人體外形輪廓特征,人體行為特征全部距離組成的特征矢量為
此處對(duì)R 進(jìn)行離散的傅里葉變換:
歸一化傅里葉系數(shù),計(jì)算出人體動(dòng)作特征的低頻分量部分,用連續(xù)傅立葉算子表征人體輪廓特征。
利用速率表征人體運(yùn)動(dòng)特征,圖像間位移[4]為:
設(shè)定人體運(yùn)動(dòng)視頻幀速率為25f/s,速率為:
人體運(yùn)動(dòng)速率表示為:
其中,n 是樣本的幀數(shù)。
選擇混合特征描述人體行為特征,以向量的形式輸入神經(jīng)網(wǎng)絡(luò)分類器,提取的人體外形和運(yùn)行融合特征包含的信息就越完整,人體行為識(shí)別率也會(huì)相應(yīng)的提高。
譜系聚類[6]作為一種逐次合并類的分析算法,能夠根據(jù)數(shù)據(jù)內(nèi)部的特點(diǎn)獲取最優(yōu)分類數(shù)目。
聚類算法的基本思想是在待聚類樣本集中,計(jì)算所有聚類向量?jī)蓛傻木嚯x得到一個(gè)對(duì)稱距離矩陣,在矩陣對(duì)角線一側(cè)找到距離最近的兩個(gè)聚類向量合并為一類,對(duì)稱距離矩陣階數(shù)減一。重復(fù)上述步驟,直到所有聚類向量合并為一個(gè)大類。當(dāng)然,合并成一個(gè)類就失去了聚類的意義,所以聚類過程應(yīng)該在某個(gè)類水平數(shù)停下來,最終的類就取這些未合并的類。
本文當(dāng)矩陣合并為12 個(gè)大類(T=12)時(shí)停止合并,得到12個(gè)非奇異特征向量,取每個(gè)聚類的中心幀作為關(guān)鍵姿態(tài)幀描述特征向量。取運(yùn)動(dòng)圖像序列連續(xù)視頻25 幀進(jìn)行聚類合并,從25x64 個(gè)特征中選擇25xl2 個(gè)最有效的特征分量來表達(dá)原始樣本,從而極大的降低了樣本維數(shù),減少了數(shù)據(jù)冗余,提高訓(xùn)練精度,保證了行為識(shí)別率。
首層為輸入層,有n 個(gè)輸入節(jié)點(diǎn),只起到數(shù)據(jù)傳導(dǎo)的功能,對(duì)應(yīng)輸入向量的單分量;第二層是隱含層,有p 個(gè)隱節(jié)點(diǎn),神經(jīng)元的核心函數(shù)是高斯函數(shù),對(duì)輸入信息進(jìn)行空間投影轉(zhuǎn)換;再一層是輸出層,有m 個(gè)輸出。其拓?fù)浣Y(jié)構(gòu)如圖3 所示。
圖3 RBF 神經(jīng)網(wǎng)絡(luò)
假使僅注重聚類的緊致性或聚類的分離度的單一方面,可能得出偽最優(yōu)劃分。所以,本文選取了評(píng)估參數(shù)Silhouette 寬度[5],能夠結(jié)合聚類分離性與緊致性,較好地提升識(shí)別的準(zhǔn)確度。
4.3 基于聚類RBF 神經(jīng)網(wǎng)絡(luò)的人體行為識(shí)別算法
本文選取了結(jié)合聚類緊致性和分離性的評(píng)價(jià)指標(biāo)Silhouette 寬度,對(duì)經(jīng)典RBF 神經(jīng)網(wǎng)絡(luò)中的類方法進(jìn)行改進(jìn)。算法流程[6]:
(1)人體特征組成分類器輸入矩陣X=[X1,X2…,XN],則第l個(gè)樣本為Xl=[X1l,X2l,…,Xnl]T(l=1,2,…,N),輸出矩陣為O=[O1,O2,…,ON]。
(2)設(shè)隱含層節(jié)點(diǎn)數(shù)為p0。
(3)設(shè)定聚類的目標(biāo)函數(shù)為S
全部樣本的平均值S 定義為Silhouett 寬度,樣本的寬度越大,聚類效果越好,且該取值在[-1,1]之間。
(4)定義RBF 神經(jīng)網(wǎng)絡(luò)輸出的均方根誤差RMS
采用有導(dǎo)師學(xué)習(xí)方法修正權(quán)值,多次訓(xùn)練直至RMS 小于給定的目標(biāo)誤差ε。
(5)輸入樣本到改進(jìn)的聚類RBF 神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行測(cè)試。
本文分類研究6 種類型的行動(dòng),依次是:走(walk),跑(run),跳(jump)、側(cè)走(sideways)、彎腰(bend)、單腿跳(skip)。
實(shí)驗(yàn)1 本文采用交叉驗(yàn)證的方法評(píng)價(jià)經(jīng)典神經(jīng)網(wǎng)絡(luò)和改進(jìn)的神經(jīng)網(wǎng)絡(luò)分類器。仿真實(shí)驗(yàn)證明,改進(jìn)的聚類算法識(shí)別率提高了分類器的識(shí)別率。
訓(xùn)練曲線表明,RBF 神經(jīng)網(wǎng)絡(luò)具有收斂快的特點(diǎn)。
圖4 算法訓(xùn)練誤差曲線圖
實(shí)驗(yàn)2 實(shí)驗(yàn)利用3 種方法對(duì)6 種類型的人體行為進(jìn)行識(shí)別。仿真實(shí)驗(yàn)證明,本文提出的算法性能最優(yōu)。
圖5 算法比較曲線圖
本文提出了改進(jìn)的神經(jīng)網(wǎng)絡(luò)算法,算法的優(yōu)點(diǎn)在于建立目標(biāo)模型有效,識(shí)別準(zhǔn)確性高,并且算法有效、具有魯棒性。