關(guān)鍵詞:湘繡;動作識別;集成學習算法
湘繡作為中國傳統(tǒng)的手工藝品之一,具有悠久的歷史和獨特的藝術(shù)價值,湘繡的精細繡花技藝和獨特的針法動作在傳承和發(fā)展過程中是非常關(guān)鍵的[1]。然而,當前的湘繡針法動作識別和評價主要依賴于人工經(jīng)驗和主觀評定,這樣存在識別準確性低等問題[2]。為解決這些問題,設(shè)計面向湘繡針法動作監(jiān)測的可穿戴式動作捕捉系統(tǒng)對針法動作的數(shù)據(jù)進行采集、分析和量化評估,首先,對動作捕捉技術(shù)的主要研究方法進行分析,使用可穿戴式設(shè)備采集湘繡動作數(shù)據(jù),使用主成分分析方法降維對數(shù)據(jù)進行預(yù)處理操作,然后,使用集成學習算法對針法動作時相進行劃分,最后,使用不同的針法動作序列組合進行訓練,并計算其準確率,對有效地識別和評價湘繡主要針法動作具有重要的理論和實踐意義。
1 動作捕捉技術(shù)主要研究方法
1.1 基于視頻圖像的研究方法
近些年,相關(guān)研究人員設(shè)計了視頻分析軟件用來輔助動作解析[3],比如一些操作簡單,但功能豐富的開源視頻分析軟件,它可以檢測人的移動速度、位移和角度,甚至可以跟蹤運動對象的移動軌跡。視頻法作為傳統(tǒng)的動作分析方法,不需要用戶佩戴任何設(shè)備,輕松方便獲得動作數(shù)據(jù)。但是,此方法在分析過程中,需要評價人員逐幀去觀看視頻數(shù)據(jù),憑借經(jīng)驗判斷用戶的針法好壞,它受限于拍攝幀率、視頻清晰度、遮擋、拍攝角度等問題,存在測量誤差,多角度拍攝需要耗費大量的人力成本。
1.2 基于光學動捕技術(shù)的研究方法
光學動作捕捉技術(shù)也被很多研究者進行了大量的研究,它可以通過移動路徑還原受試者的動作姿態(tài),需要使用紅外高清攝像頭來捕捉移動路徑,在測試過程中,需要測試人員穿戴特制的衣服,并且在身體的某些關(guān)節(jié)部位設(shè)置若干特殊的反光標志點。例如:A.G.Kirk設(shè)計了一種算法能夠從光學動作捕捉系統(tǒng)中自動提取測試者的骨骼結(jié)構(gòu)數(shù)據(jù)模型[4]。它具有測量精度高的優(yōu)點,但是也存在缺點,比如價格昂貴,并且易受外部環(huán)境影響;比如光線、反光物和遮擋,從而導(dǎo)致使用范圍有限。
1.3 基于慣性動捕技術(shù)的研究方法
慣性動捕技術(shù)廣泛應(yīng)用于動畫、視頻制作、游戲、運動分析、康復(fù)評估等領(lǐng)域[4]。北京諾亦騰科技有限公司(Noitom Technology) 作為國內(nèi)一家從事慣性動作捕捉技術(shù)研究的公司,開發(fā)了一系列具有完全自主知識產(chǎn)權(quán)的動捕產(chǎn)品,結(jié)合遠程通信的可穿戴式設(shè)備,采樣頻率高、精度高、體積小、重量輕,滿足本文湘繡動作采集的實際需要。
2 動作姿態(tài)表示
2.1 數(shù)據(jù)采集和預(yù)處理
使用諾亦騰的動捕手套采集使用者身上的關(guān)鍵節(jié)點針法動作數(shù)據(jù),對高維特征數(shù)據(jù)需要進行預(yù)處理操作,盡管在處理高維特征數(shù)據(jù)降維中,會存在一定的信息丟失,但是可以降低計算的運算成本。因此,可以采用數(shù)據(jù)降維方法對數(shù)據(jù)進行預(yù)處理。目前常用的數(shù)據(jù)降維方法有主成分分析[5],它的算法描述如下:
2.2 骨骼模型建立
根據(jù)近似人體解剖學理論,將繡工雙手定義12段骨骼結(jié)構(gòu)(左手掌、左拇指、左食指、左中指、左無名指、左小指、右手掌、右拇指、右食指、右中指、右無名指、右小指),通過分析湘繡動作發(fā)現(xiàn),主要參與動作的骨骼有左大拇指、左食指、右大拇指、右食指,因此諾亦騰的動捕手套Hi5測量運動數(shù)據(jù)時主要采集左手掌、左大拇指、左食指、右手掌、右大拇指、右食指6個節(jié)點數(shù)據(jù)(如圖1所示)。測試前須根據(jù)繡者的實際情況測量中指骨骼長度,以便獲取更準確的信息。
2.3 姿態(tài)表示
姿態(tài)解算方法主要有方向余弦、歐拉角和四元數(shù)三種表示方法,歐拉角法在求解過程中不僅會涉及大量的三角運算計算,而且存在萬向節(jié)死鎖的現(xiàn)象。方向余弦法和四元數(shù)法兩種方法可以避免萬向節(jié)死鎖問題,但是方向余弦法在求解過程中有9個未知參數(shù),計算量大,不及四元數(shù)法簡便,因此,在本文中使用四元數(shù)法。四元數(shù)由實數(shù)及3個虛數(shù)單位i、j、k 組成,是在復(fù)數(shù)的基礎(chǔ)上形成的超復(fù)數(shù)概念,四元數(shù)主要有共軛、加減、乘法、數(shù)乘、求逆等運算操作。
3 湘繡針法動作時相劃分
3.1 湘繡針法動作周期相位定義
刺繡動作周期相位的定義是按照針尖與布面的位置、針與絲線之間的位置關(guān)系綜合確定的,本文以打子針為例采用了5相位劃分法,根據(jù)行針軌跡周期細分相位為如下:
1) 出針相:針尖朝上刺出布面。
2) 上行相:右手捏住針尖向上抽線,直至絲線全部抽出布面。
3) 繞針相:左手執(zhí)線,右手持針,使線纏繞于針腰處3圈及以上。
4) 入針相:針尖朝下刺出布面。
5) 下行相:左手捏住針尖向下抽線,直至絲線全部抽出布面。如圖2所示。
3.2 特征提取與相位標注
機器學習算法需要利用特征提取的方法,從原始數(shù)據(jù)中獲取主要信息。為了提高模型預(yù)測的準確性,需要有效的提取數(shù)據(jù)的主要信息,可以從時域或頻域著手進行特征提取,選取打子針刺繡過程中的關(guān)節(jié)角度時間序列,切割成包含若干個樣本的序列,然后從時域和頻域兩個角度提取若干個特征變量,特征提取的函數(shù)名稱和詳細描述如表1所示。
其中,每個特征元素分別來自出針相、上行相、繞針相、入針相和下行相的序列,首先按時間順序同步向量打好標簽,然后作為分類結(jié)果的真值,通過給所有的時間向量標注好標簽,最終包含訓練樣本的數(shù)據(jù)集。
3.3 集成學習算法進行相位分割
針法動作相位分割主要根據(jù)刺繡針法過程中不同動作特點來劃分,需要深入理解針法動作的特點和周期性,屬于人體動作識別。傳統(tǒng)的人工方式是采用標注法,目前最常用的相位劃分法主要是基于機器學習的相位檢測法和基于閾值設(shè)定的相位檢測法。其中閾值設(shè)定的相位分割方法存在依賴數(shù)據(jù)閾值的選擇,而且會受到外界信號噪聲的干擾,面對不同的測試人群存在適應(yīng)性較差和識別精度較低的問題。而基于機器學習的相位檢測法可以解決閾值設(shè)定的相位分割方法的缺點,它的優(yōu)點是魯棒性較高和泛化能力強,因此,采用基于機器學習的相位檢測法。
集成學習算法[7]通常組合多個機器學習算法共同來完成學習任務(wù),它的基本思想是首先按照一定的規(guī)則將訓練集劃分為多個子數(shù)據(jù)集,然后使用每個子數(shù)據(jù)集去訓練一個個體學習器,最后通過組合模塊確定好最后的模型進行輸出。集成學習模型可以通過集成各種機器學習算法的優(yōu)點,從而使模型有更高的準確率,但是在訓練過程復(fù)雜度也就增加了。如果需要使集成學習模型性能較高,則需要讓每個個體學習器盡可能相互獨立。當前常用的集成學習算法有Bagging 算法和Boosting 算法[8],本文使用Bagging算法來處理湘繡針法相位多分類問題,算法描述如下:
1: for t =1,2,...T do
2: 從原始數(shù)據(jù)集D中經(jīng)采樣得到采樣集Db 取前n個特征值所對應(yīng)的特征向量ω1,ω2,...ωn 組成
3: ht=L(Db);
4: end for
偽代碼算法中,Db變量表示經(jīng)過自助采樣后從原始的數(shù)據(jù)集中得到的采樣集,第2個步驟中需要依次循環(huán)n 次,計算得到一個采樣集,它包含了n 個樣本,第3個步驟則利用選取決策樹訓練基學習模型 L。循環(huán)T 輪后,就可以得到T 個基學習模型,再將這T 個基學習模型進行組合,利用投票的方法計算確認最終的輸出。
4 實驗結(jié)果與分析
4.1 實驗環(huán)境
本次實驗的主要硬件有網(wǎng)絡(luò)交換機、高性能計算機、諾亦騰全新一代VR交互手套等,主要軟件有Mi?crosoft Windows 10 操作系統(tǒng)、Axis Studio 開發(fā)工具、Unity 2020.3.27 編輯器工具、PyCharm 開發(fā)工具、Vi?sual Studio 2019開發(fā)工具等,算法實現(xiàn)基于開源的機器學習框架TensorFlow,編程語言主要采用python和C#語言實現(xiàn)。
4.2 評價指標
通常使用準確率(accuracy) 的參數(shù)指標來判斷模型的優(yōu)劣。準確率(accuracy) 定義公式為預(yù)測正確的樣本數(shù)與樣本總數(shù)的比值,如式(1) 所示。
4.3 結(jié)果分析
本文湘繡針法測試時要求用戶按照習慣進行刺繡操作,參考學習視頻刺繡動作做到標準,選取30名學生分成5組,每組6名學生,采集他們以打子針為例的300次刺繡數(shù)據(jù),本文使用5折交叉驗證的方法防止模型過擬合,計算平均準確率,對各相位的準確率進行統(tǒng)計分析,如表2所示。
從表2數(shù)據(jù)分析可知,5組學生在上行、入針和下行3個相位的準確率都超過了90%,在出針和繞針相位的準確率接近90%,對比實驗結(jié)果分析,本文所提的方法具有有效性和可行性,此方案在湘繡針法動作的識別與評價方面取得了較好的效果。
5 結(jié)束語
本文主要對湘繡主要針法動作的識別與評價進行了研究,為湘繡技藝的傳承與發(fā)展提供了重要的技術(shù)支持,未來的研究可以繼續(xù)完善數(shù)據(jù)集的構(gòu)建和引入更多的深度學習模型,以進一步提高識別和評價的準確性。此外,還可以將本研究方法應(yīng)用于其他手工藝品的動作識別與評價,為傳統(tǒng)手工藝品的保護和發(fā)展提供技術(shù)支持。