陳思喜, 李建微, 陳 紓
(福州大學(xué)物理與信息工程學(xué)院, 福建 福州 350116)
基于KPCA降維的運(yùn)動捕捉數(shù)據(jù)自動分割
陳思喜, 李建微, 陳 紓
(福州大學(xué)物理與信息工程學(xué)院, 福建 福州 350116)
針對運(yùn)動捕捉獲得的數(shù)據(jù)其維度通常較高, 在進(jìn)行運(yùn)動片段分割時候需要進(jìn)行大量計算, 人工方法可以對運(yùn)動捕獲數(shù)據(jù)進(jìn)行分割, 準(zhǔn)確率比較高, 但是效率偏低的問題. 提出KPCA結(jié)合PPCA對捕獲數(shù)據(jù)進(jìn)行降維處理的方法, 將56維數(shù)據(jù)映射到2維空間; 以及構(gòu)造特征函數(shù)獲得投射誤差的導(dǎo)數(shù), 分析幾何特征的變化, 探測運(yùn)動捕捉數(shù)據(jù)的分割點(diǎn)的方法, 實現(xiàn)運(yùn)動捕捉數(shù)據(jù)的自動分割.
運(yùn)動捕捉數(shù)據(jù); 降維; 自動分割; 泉州拍胸舞
近年來, 運(yùn)動捕捉技術(shù)在非物質(zhì)文化遺產(chǎn)保護(hù)和傳承方面應(yīng)用很多. 運(yùn)動捕捉技術(shù)是通過運(yùn)動捕獲設(shè)備記錄人體運(yùn)動信息以獲取運(yùn)動數(shù)據(jù), 將運(yùn)動數(shù)據(jù)與動畫角色結(jié)合, 通過骨骼綁定, 還原成虛擬的動作實現(xiàn)非物質(zhì)文化遺產(chǎn)的保護(hù)和傳承. 馮曉憲等[1]應(yīng)用動作捕捉技術(shù)對貴州少數(shù)民族民間舞蹈進(jìn)行數(shù)字化研究; 鄒虹等[2]在孔廟祀典方面深入探討, 對舞蹈動作、 孔廟祀典活動的數(shù)據(jù)進(jìn)行捕捉采集和三維虛擬重建. 民間舞蹈可以在捕獲基本動作的基礎(chǔ)上進(jìn)行創(chuàng)意編排和設(shè)計, 以生成新的舞蹈動作, 就需要對捕獲的基本動作進(jìn)行運(yùn)動分割. 人工方法可以對運(yùn)動捕獲數(shù)據(jù)進(jìn)行分割, 準(zhǔn)確率比較高, 但是效率很低.
自動分割技術(shù)應(yīng)用廣泛; 在運(yùn)動捕捉數(shù)據(jù)的方面, 2004 年, Barbic等[3]提出了基于主成分分析PCA、 混合高斯模型GMM三種算法, 實現(xiàn)了運(yùn)動捕獲數(shù)據(jù)的分割, 并且取得較好的自動分割效果, 但是它們的算法運(yùn)算效率較低. 2007年, Yamasaki 和 Aizawa[4]提出了基于改進(jìn)形狀分布的3D視頻運(yùn)動分割, 對運(yùn)動視頻自動分割的準(zhǔn)確率達(dá)到92%, 但是該算法在高維非線性捕捉數(shù)據(jù)上的自動分割準(zhǔn)確率不高. 2011年, 瞿師等[5]利用高斯過程隱變量模型實現(xiàn)數(shù)據(jù)的降維, 實現(xiàn)了基于隱空間的運(yùn)動捕獲數(shù)據(jù)自動分割, 在查準(zhǔn)率和查全率方面獲得成功, 但是該算法沒有提及舞蹈動作的噪聲分析. 2010年, Schulz和Woerner[6]用零交叉分割技術(shù)對人體運(yùn)動捕捉數(shù)據(jù)進(jìn)行分割, 該算法設(shè)置運(yùn)動和休息兩種狀態(tài), 對于運(yùn)動幅度不大的捕捉數(shù)據(jù)的自動分割準(zhǔn)確率較差. 本研究在前述文獻(xiàn)的基礎(chǔ)上改進(jìn)算法, 采用核主成分KPCA結(jié)合概率主成分分析PPCA, 進(jìn)行運(yùn)動捕捉數(shù)據(jù)的特征提取降維, 并結(jié)合噪聲分析, 核函數(shù)構(gòu)造降維模型對項目組的泉州拍胸舞運(yùn)動捕獲數(shù)據(jù)進(jìn)行自動分割. 達(dá)到簡化計算量、 提高運(yùn)算效率的目的.
運(yùn)動捕捉數(shù)據(jù)的維度通常較高, 在進(jìn)行運(yùn)動片段分割時候需要進(jìn)行大量計算. 目前通常都是采用降維技術(shù)把高維數(shù)據(jù)降維后影射到低維空間, 然后進(jìn)行數(shù)據(jù)分割.
主成分分析( principal component analysis, PCA)和核主成分分析(kernel principal component analysis, KPCA) 是常用的兩種降維技術(shù). PCA是一種線性方法, 但是人體運(yùn)動過程中數(shù)據(jù)之間是非線性的并且有關(guān)聯(lián), 比如, 當(dāng)左臀部移動左腿向前行走時, 有髖關(guān)節(jié)通常是倒退的, 因此在處理非線性問題時效果不是很好. KPCA使用核函數(shù), 把非線性變換后的特征空間內(nèi)積運(yùn)算轉(zhuǎn)換成原始空間的核函數(shù)計算, 計算量可以被簡化, 提取出更好的屬性之間的非線性關(guān)系. 常用的核函數(shù)主要包括以下幾種[7]:
線性核函數(shù):
多項式核函數(shù):
高斯徑向基核函數(shù):
神經(jīng)網(wǎng)絡(luò)核函數(shù):
由于動作捕捉數(shù)據(jù)是一個復(fù)雜的非線性過程, 并且考慮運(yùn)動過程中數(shù)據(jù)的噪點(diǎn), 經(jīng)筆者實驗分析, 本文采用核主成分KPCA進(jìn)行運(yùn)動捕捉數(shù)據(jù)的特征提取降維, 并結(jié)合概率主成分分析PPCA, 核函數(shù)構(gòu)造降維模型如公式(5)所示.
其中:xi是yi對應(yīng)的低維變量;xi∈RD;β、η為比例因子, 表示低維空間兩個點(diǎn)的關(guān)聯(lián)程度;γ表示高斯分布方差.
圖1 KPCA-PPCA算法流程Fig.1 Flow chart of KPCA-PPCA
給定N個向量{xi}, 由公式(5)可得核矩陣K,K為N×N方陣. 其中
假設(shè)各分布均服從高斯分布, 對于每個分布的概率密度函數(shù)為:
其中:θ為模型的參數(shù),
其中:x表示均值向量;C表示協(xié)方差矩陣;D為運(yùn)動數(shù)據(jù)維數(shù);Y為空間矩陣.
算法流程圖如圖1, 具體步驟如下:
1) 初始化模型參數(shù):β=1、η=1、γ=1;
2) 計算核矩陣:
3) 修正核矩陣得到KM, 公式為:
4) 進(jìn)行迭代, 求KM:v1,v2, … ,vn, 及對應(yīng)的特征向量:λ1,λ2, …,λn;
6) 計算已修正的核矩陣K, 再提取出的特征向量上的投影Y=KT·α′, 其中α=(α1,α2, …,αt);
7) 得到的投影Y即為數(shù)據(jù)經(jīng)降維處理后的數(shù)據(jù), 把序列n維數(shù)據(jù)降到t維.
運(yùn)動捕捉數(shù)據(jù)中, 不同運(yùn)動序列的運(yùn)動特征是不一樣的, 所提取的特征向量也是不同, 并且表現(xiàn)出不同的幾何特征. 通過降維技術(shù), 把運(yùn)動數(shù)據(jù)映射到低維空間, 經(jīng)過奇異值分解(SVD)獲得投射誤差e, 比較投射誤差比率Et, 根據(jù)Et的大小, 判斷運(yùn)動數(shù)據(jù)的分割點(diǎn), 實現(xiàn)運(yùn)動數(shù)據(jù)的自動分割.
以待分割的捕獲數(shù)據(jù)Y為樣本進(jìn)行降維處理, 捕捉數(shù)據(jù)從D維空間映射到t維空間:
定義運(yùn)動數(shù)據(jù)中心區(qū)域:
降維后近似幀為:
獲得特征函數(shù)
將低維空間中的每一個xi分別代入特征函數(shù), 計算運(yùn)動捕獲數(shù)據(jù)每一幀對應(yīng)的運(yùn)動特征函數(shù)值, 并轉(zhuǎn)換為一系列離散值:
同時, 可以在t維空間內(nèi)獲得投射誤差:
σ為運(yùn)動數(shù)據(jù)在t維內(nèi)經(jīng)奇異值分解SVD后的奇異值.
Et投射誤差比率, 它是一個指標(biāo), 表示經(jīng)降維后在r維空間內(nèi)保留多少信息.
利用Et的誤差比率變化, 可以探測運(yùn)動片段的分割點(diǎn), 實現(xiàn)運(yùn)動捕捉數(shù)據(jù)的自動分割, 具體分析如下:
1)t維空間內(nèi), 定義Et>τ,τ< 1,τ是一個經(jīng)驗常數(shù), 經(jīng)過實驗,τ=0.75時, 能取得較好的效果;
2)在t維空間內(nèi), 定義一段長度為k的序列幀, 并滿足Et>τ, 對于第i幀由公式(16)算出投射誤差ei;
3) 對離散值求導(dǎo), 得到di=ei-ei-l, 參數(shù)l必須足夠大, 以保證噪聲的干擾, 這里l=60;
4) 初始值設(shè)定i=k, 對于相同的運(yùn)動片段, dj的斜率是固定, 因為在t維空間特征函數(shù)值的導(dǎo)數(shù)沒有發(fā)生變化; 當(dāng)出現(xiàn)新的運(yùn)動方式時候, dj(j3 實驗結(jié)果
實驗采用數(shù)據(jù)來自福州大學(xué)課題組的項目“泉州拍胸舞動作捕捉數(shù)據(jù)庫”, 拍胸舞是泉州的民間傳統(tǒng)歌舞, 堪稱閩南文化藝術(shù)的活化石, 是國家第一批非物質(zhì)文化遺產(chǎn), 廣泛流傳于福建南部沿海泉州各縣區(qū)以及漳州、 廈門、 金門、 臺灣等地區(qū). “拍胸舞”基本動作為“打七響”: 包括雙手胸前合擊、 右手拍左胸、 左手拍右胸、 雙臂內(nèi)側(cè)夾打左脅、 雙臂內(nèi)側(cè)夾打右脅、 左手拍右腿部、 右手拍左腿部, 共得“七響”, 時值合七拍. 如圖2所示. 定義人體關(guān)節(jié)有14個層次, 每個關(guān)節(jié)用一個4元數(shù)表示, 特征向量維度D=56, 降維后t=2. 選擇待分割的泉州拍胸舞基本動作運(yùn)動捕捉數(shù)據(jù), 由7個運(yùn)動片段組成, 共1 680幀. 圖3是自動分割結(jié)果, dj隨著運(yùn)動動作的變化而產(chǎn)生的波動效果. 圖中垂直方向表示1 682幀數(shù)據(jù)經(jīng)算法檢測后得到的導(dǎo)數(shù), 黑色實線表示導(dǎo)數(shù)di, 點(diǎn)線表示導(dǎo)數(shù)的平均值, 黑色方塊是表示運(yùn)動方式發(fā)生的變化點(diǎn), 也就是運(yùn)動捕捉分割點(diǎn).共探測出7個運(yùn)動分割點(diǎn). 分別位于252, 498, 685, 945, 1 171, 1 344和1 579幀.
圖2 拍胸舞的基本動作圖
表1 不同分割方法的性能比較
Tab.1 The performance of different segmen-tation methods
方法查準(zhǔn)率/%查全率/%手動方法100100基于隱空間方法82.696.3基于KPCA-PPCA方法84.295.2
將7個運(yùn)動片段分別用手動方法、 基于隱空間方法和基于KPCA-PPCA方法進(jìn)行分割, 表1給出本文方法與其他方法的性能比較. 與手動分割的結(jié)果作比較, 參照瞿師等[5]人的性能指標(biāo), 用查準(zhǔn)率和查全率來判斷. 本文構(gòu)造的算法結(jié)合噪聲分析, 具有更高的查準(zhǔn)率, 但是查全率稍低. 實驗結(jié)果表明該算法結(jié)果具有一定可行性. 提出基于KPCA結(jié)合噪聲分析的運(yùn)動捕捉數(shù)據(jù)自動分割方法, 在降維處理中考慮噪聲因素, 在特征函數(shù)中引入投射誤差, 并通過求導(dǎo)來判斷運(yùn)動數(shù)據(jù)的分割點(diǎn), 較好完成了運(yùn)動捕捉數(shù)據(jù)的自動分割. 進(jìn)一步研究算法, 提高降維的運(yùn)算速率, 是下一步的研究內(nèi)容.
[1] 馮曉憲, 舒瑜, 彭秀英. 貴州少數(shù)民族民間舞蹈數(shù)字化保護(hù)與開發(fā)研究[J]. 貴州社會科學(xué), 2010, 243(3): 30-32.
[2] 鄒虹, 李瑩, 歐劍, 等. 基于動作捕捉技術(shù)的孔廟祀典數(shù)字化[J]. 計 算 機(jī) 系 統(tǒng) 應(yīng) 用, 2012, 21(7): 151-154, 82.
[3] Barbic J, Safonova A, Pan J Y,etal.Segmenting motion capture data into distinct behaviors[C]//Proceeding of Graphics Interface Conference.London: Canadian Human-Computer Communications Society, 2004: 185-194.
[4]Yamasaki T, Aizawa K. Motion segmentation and retrieval for 3D video based on modified shape distribution[J]. EURASIP Journal on Advances in Signal Processing, 2007 (1): 211.
[5] 瞿師, 于榮歡, 吳玲達(dá), 等. 基于隱空間的運(yùn)動捕獲數(shù)據(jù)自動分割[J]. 計算機(jī)應(yīng)用研究, 2011, 28(8): 3 128-3 130.
[6]Schulz S, Woerner A. Automatic motion segmentation for human motion synthesis[C] // Proceeding of The 6th International Conference AMDO 2010. Mallorca: Lecture Notes in Computer Science, 2010: 182-191.
[7] 李潔. 基于核主成分降維的RBF網(wǎng)絡(luò)降水預(yù)測[J]. 柳州師專學(xué)報, 2012, 27(1): 111-117.
(責(zé)任編輯: 林曉)
Automatic segmentation of motion capture data based on KPCA
CHEN Sixi, LI Jianwei, CHEN Shu
(College of Physics and Information Engineering, Fuzhou University, Fuzhou, Fujian 350116, China)
Motion capture data usually in high dimensions, which needs large amount of computation in motion clip segmentation. The accuracy of manual method is relatively high, but low efficient.In this paper, author carry out an automatic segmentate method by using Algorithm KPCA and PPCA to mapping 56 dimensional data into 2 dimensional Coordinate system,and constructing the feature function of projection error derivative to quantify geometric variables of data, and figure out the segmentate point.
motion caputure data; automatic segmentation; dimensionality reduction; Quanzhou chest-clapping dance
10.7631/issn.1000-2243.2015.04.0456
1000-2243(2015)04-0456-04
2013-12-03
陳思喜 (1975-), 講師, 主要從事數(shù)字媒體技術(shù), 虛擬互動技術(shù)研究, sxchen@fzu.edu.cn
國家自然科學(xué)基金資助項目(31100415); 福建省教育廳科技資助項目(JA10038)
TP37
A