李曉蘭
摘 ? 要:人體運動的數據采集系統(tǒng)可實時監(jiān)測人體日?;顒?,為人體運動健康提供了更科學的輔助。利用Shimmer無線可穿戴傳感器設備采集運動數據,建立了監(jiān)測人體運動的8個部位傳感器節(jié)點模型,并構建了10個具有代表性的動作進行識別。用中值濾波算法實現(xiàn)對原始信號的過濾處理,采用固定滑動窗口分割法對數據進行分割處理,結合特征提取技術來獲取包含特性的特征向量,選擇主成分分析(PCA)技術對特征提取后的特征向量進行降維處理。同時,提出了多節(jié)點運動識別模型,利用支持向量機(SVM)、k近鄰(kNN)以及最近距離中心算法(NCC)三種不同的算法對單獨節(jié)點和組合節(jié)點的情況下的傳感器數據進行分類識別。實驗結果表明,所提出的人體運動數據采集系統(tǒng)具有良好的效果,在使用相同識別算法的前提下,多節(jié)點組合識別能獲得比單節(jié)點識別更好的效果。
關鍵詞:人體運動;數據采集;運動識別;傳感器;人工智能
中圖分類號:TP18 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A
Data Collection System and Recognition Design of Human Motion
LI Xiao-lan?覮
(College of Physical Education,Yan'an University,Yan'an,Shaanxi 716000,China)
Abstract: The data acquisition system of human motion can monitor human daily activities in real time,and provide more scientific assistance for human sports health. Shimmer wireless wearable sensor equipment is used to collect motion data,and eight sensor node models for monitoring human motion are established,and ten representative actions are constructed for recognition. The median filtering algorithm is used to filter the original signal. Fixed sliding window segmentation method is used to segment the data. Feature extraction technology is combined to obtain feature vectors containing features. Principal component analysis (PCA) technology is selected to reduce the dimension of feature vectors after feature extraction. At the same time,a multi-node motion recognition model is proposed. Three different algorithms,support vector machine (SVM),k-nearest neighbor (kNN) and nearest distance center algorithm (NCC),are used to classify and recognize sensor data with individual and combined nodes. The experimental results show that the proposed human motion data acquisition system has a good effect. Under the premise of using the same recognition algorithm,multi-node combination recognition can achieve better results than single-node recognition.
Key words: human motion;data acquisition;motion recognition;sensor;artificial intelligence
近年來受到人工智能界廣泛關注的人體運動識別技術正走進人們的日常生活中。用于測量肢體運動、姿勢和生理狀況的小型可穿戴傳感器可以產生高分辨率的定量數據,結合識別模型對運動加以判別,其極大地改善了影響運動能力的研究。在人體運動識別領域,基于可穿戴傳感器的運動識別技術己經積累了許多工作,這一類工作利用傳感器作為感知手段,通過感知得到的數據序列來識別出其人體的動作行為。文獻[1]利用微機械電子系統(tǒng)(MEMS)陀螺儀、加速度計和磁強計測量人體手臂運動狀態(tài)并進行識別。文獻[2]對基于單一傳感器與組合式傳感器的2種姿態(tài)角度測量方法及運用分別進行了闡述,探討了不同慣性測量單元組合用于姿態(tài)測量的方法及其優(yōu)缺點。但是MEMS的體積較大,在日常的人體運動數據采集中并不適用,僅可在實驗室環(huán)境中完成[3-4],同時,MEMS對精度的要求極高,龐大的采樣數據并不容易進行識別研究。
相比較而言,可穿戴設備的本質就是傳感器,各種傳感器讓一個個戴在身上的小東西實現(xiàn)運動跟蹤、數據收集、信息傳輸和互動[5],正受到越來越多學者的關注。常見的可穿戴設備可分為:運動型傳感器[6]和生物型傳感器[7]。其中,運動型傳感器由陀螺儀、加速度計、壓力傳感器和磁力計組成。主要運用在手環(huán)等設備中,它們總體的主要功能是在智能設備中完成運動監(jiān)測、導航和人機交互。通過運動型傳感器隨時隨地記錄和分析人體活動情況,用戶就可以知道自己跑步的步數、騎車的距離、睡眠時間和能量的消耗。而生物型傳感器由血糖傳感器、血壓傳感器、心電傳感器、體溫傳感器、腦電波傳感器、肌電傳感器等組成。主要用于醫(yī)療電子設備中。
利用Shimmer無線可穿戴傳感器設備搭建了人體運動的數據采集系統(tǒng)。并提出了多節(jié)點運動識別模型,使得傳感器設備能夠以組合或者單獨的方式進行運動的識別。最后,通過實驗驗證了數據采集系統(tǒng)和識別模型的有效性。
1 ? 運動數據的采集與處理
1.1 ? 傳感器節(jié)點模型
以Shimmer無線可穿戴傳感器設備平臺為基礎,重點研究人體運動數據的采集和預處理技術,以便將數據運用到后續(xù)的運動識別模型中。圖1為傳感器節(jié)點模型圖,在身體的8個部位:左右手小臂和大臂,左右小腿和大腿分別放置Shimmer無線可穿戴傳感器,每個傳感器節(jié)點對應一個傳感器設備。所開發(fā)了平衡電池壽命和數據質量要求的可穿戴傳感器。由人體佩戴的多個傳感器節(jié)點和一個基站組成,基站通過IEEE802.15.4協(xié)議傳輸。
1.2 ? 傳感器設備
Shimmer無線可穿戴傳感器設備平臺如圖2所示。
綜合考慮人體運動的分類,運動的組成和設備位置的判斷需要,在數據采集模塊,使用的傳感器設備組成部分包括:MSP430微控制器、支持802.15.4標準的CC2420無線電、MicroSD插槽、支持2GB的閃存和250mAh可充電鋰電池。同時,結合了軸向MEMS加速度計、陀螺儀、ECG、EMG和其他傳感器類型的附加接口。尺寸僅為44.5×20×13mm,重量僅為10 g,非常適合長期穿戴。其中,軸向MEMS加速度計范圍在±16 g,陀螺儀的角速度范圍在±2000°/s,角度的范圍是±180°,對常見人體運動如走路、慢跑,以及較劇烈的運動,如騎車,打籃球等,其加速度、角速度及磁力數值的范圍和精度都能夠滿足要求。另一方面,由于人體日常運動的極限頻率在100HZ內,設備采樣頻率在200HZ內,能夠滿足研究所需人體運動的采集。
1.3 ? 人體運動類型
在日常生活中,人體運動不僅隨著動作變化存在識別差異,更會因不同年齡不同習慣的人的姿態(tài)也存在著一定的差異。因此,本文根據現(xiàn)有文獻提供的人體運動類型[8-10],最終決定選擇十個具有代表性的動作進行識別,如表1所示。
1.4 ? 數據的預處理
1.4.1 ? 數據過濾
為了消除噪聲信號對人體運動識別的影響,還需對所采集的數據進行預處理。本文利用中值濾波算法[11]實現(xiàn)對原始信號的過濾處理。中值濾波技術對脈沖噪聲有良好的濾除作用,特別是在濾除噪聲的同時,仍然能夠保留傳感器原始數據的數據特征。采集到的傳感器原始加速度數據和中值濾波后的加速度數據對比效果如圖3表示。
中值濾波處理后的加速度數據波形更加平滑,消除了由噪聲信號引起的波形毛刺和抖動,同時也糾正了在樣本區(qū)間280-300中偏離很大的樣本(部分加速度值小于0,與整體波形圖偏差較大),以便進一步處理。
1.4.2 ? 數據分割
由于所用的可穿戴傳感器采集得到的原始數據是連續(xù)采樣點,并且傳感器采樣頻率較高,因此還需對數據進行分割處理。文獻[12]指出通常人體運動的識別持續(xù)時間在1~2 s范圍內,因此,本文采用固定滑動窗口分割法[13]對過濾后的數據進行分割,并且滑動窗口大小為1s,相鄰窗口覆蓋為50%,即每50個過濾后的樣本點數據組成一個窗口。對過濾后的加速度波形和角速度波形進行分割的結果如圖4所示。
由圖4可見,樣本點數量為50的窗口能夠包含較好的一段重復波形,便于下一步特征的提取以及相應運動的識別。
1.4.3 ? 特征提取
為了提取數據過濾和分割后保留下具有識別代表性的傳感器數據特征,還需對數據進行特征提取以減少數據冗余,進而提高模型的運動識別能力。本文利用特征提取技術[14]來獲取包含識別特性的特征數據向量,結合所采樣人體運動的類別,以及識別模型的特性,選用了計算量相對較低,且在相關研究中表現(xiàn)了出較好的八種特征類型:均值、方差、標準差、峰度、均方根、最大值、最小值、能量譜密度。由于傳感器節(jié)點中包含三類傳感器(加速度計、角速度計、磁力計),每類傳感器包含X、Y、Z三軸,因此經過特征提取后的特征向量共包含72維(3*3*8)。
1.4.4 ? 特征選擇
經過特征提取處理后獲得的特征向量包含72個元素,這種高維度的數據樣本進行識別模型的訓練時,會帶來許多不利的影響,甚至嚴重影響識別模型的人體運動識別能力,還需對高維特征向量再進行降維處理。
選擇主成分分析(PCA)技術[15]對特征提取后的特征向量進行降維處理。PCA不僅能夠對高維數據進行降維,而且還能利用降維去除噪聲干擾。PCA利用線性組合的形式,將r個線性不相關的特征值λi(i∈[1,r])代替原有的n個特征值λj(j∈[1,n]),其中,每個特征值都有其貢獻率,假設α代表累積貢獻率。本文取α = 0.95,則降維需滿足如下公式:
將樣本點投影到選取的特征向量上,可把原始的 維特征降低到了 維,使得樣本方差達到最大化,充分保留傳感器數據采集的原有特性。通過PCA降維處理后,將原有的72維特征向量降成了12維,這大大減少了模型的計算量。
2 ? 多節(jié)點識別模型與識別算法
2.1 ? 多節(jié)點識別模型
識別模型的數據來源由多個傳感器節(jié)點組成,通過互相組合使得數據樣本更加詳細以便對運動進行更好的識別。本文所提出的多節(jié)點運動識別模型如圖5所示。
2.2 ? 識別算法
選取了支持向量機(SVM)、 近鄰(kNN)以及最近距離中心算法(NCC)對人體運動進行識別。
SVM是一個有監(jiān)督的學習模型,通常用來進行模式識別、分類以及回歸分析,屬于一類廣義線性分類器。人體運動的采樣數據在經過預處理、分割、提取和選擇后,所保留的12維特征向量的數據量較少,且SVM基本上不涉及大數定律和概率測度,在處理只有少量數據樣本的問題時,也能獲得不錯的效果,因此支持向量機在識別運動中能取得不錯的效果[16]。
近鄰(kNN)算法是數據挖掘分類技術中最簡單的方法之一,其工作機制相對簡單,主要思路為:如果一個樣本在特征空間中的 個最相鄰(即距離排序前 )的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。由于kNN方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別,因此,降維后的人體運動采樣數據通過 kNN方法在類別決策時,只與極少量的相鄰樣本有關,處理數據樣本時速度快[17]。
最近距離中心算法(NCC)會計算訓練集中每一個類別的中心點,當進行人體運動識別時,只需要計算測試樣本到每一個中心點的距離,最近的中心點代表的類別就是識別類別。因此,其能大大節(jié)省內存空間和時間花費[18]。
3 ? 實驗與分析
3.1 ? 實驗數據集
人體運動數據集由十六位同學(4女8男)共同參與完成。為了區(qū)分采樣數據的差異性,所選取的同學存在著明顯的身高、體重以及運動習慣的差異,而不可避免的年齡相近(±4歲)因素的干擾。如圖1所示,每個實驗參與者在身體的8個部位:左右手小臂和大臂,左右小腿和大腿分別放置Shimmer無線可穿戴傳感器,參與者以自己習慣的動作和方式進行了表1所示的十個具有代表性的動作,采集頻率為50Hz,每個運動的時間約為10min。傳感器設備把運動原始數據利用IEEE802.15.4協(xié)議傳輸到識別系統(tǒng)中,系統(tǒng)將數據存入數據庫,以便之后研究。
3.2 ? 評價指標
為了說明所采集數據識別人體運動的準確性,利用精確率(Precision)與召回率(Recall)是作為模型評價指標來處理二分類問題。分類模型中,對于輸入的測試數據,模型會得出判斷后的標簽,即數據的類別,精確率(Precision)指的是模型判斷為類別Ci的所有樣本中,真正屬于類別Ci的樣本的比例;召回率(Recall)指的是數據集中,被判定為正確的樣本所占的比例。在二分類問題中,假設模型輸出的正樣本集合為 ,實際的正樣本數據集為B,那么精確率(Precision)為公式(2)所示,召回率(Recall)為公式(3)所示。
為了解決不同實驗參與者差異性引起的精確率和召回率指標相對矛盾的問題,借助F系數(F-Measure)權衡精確率和召回率。F系數是精確率和召回率的加權調和平均,此時選擇F1分數對應著模型識別方法:
當F1較高時對應著模型識別方法比較有效。準確率(Accuracy)表示數據樣本被正確分類所占的比例,假設數據域樣本總數為n,對于樣本i,yi是預測類別標簽,Yi是真實類別標簽,則準確率可定義為:
其中,l(x)是指示函數(indicator function)。準確率越大表明yi的數量越接近于Yi的數量,既整體樣本預測越準確,當樣本預測標簽與真實標簽完全相同時準確率達到最大值1。
3.3 ? 單傳感器節(jié)點識別
傳感器設備分別放置在身體8個位置,分別利用Shimmer無線可穿戴傳感器節(jié)點進行人體運動的識別。由于采樣數據經過PCA降維后的特征向量為12維,則所選取的kNN中的k取12。同時利用SVM、12NN和NCC三種算法進行實驗,通過十字交叉驗證方法,得到的識別準確率如表2所示。
從表1中可以看出,kNN算法(k取12)在整體上能獲得較高的識別準確率。同時,兩手臂部位的平均準確率最高(均大于91%),表明當利用單個傳感器進行人體運動識別時,手部能起最大作用。相反,腿部的識別準確率明顯較低??傮w而言,平均識別準確率都在85%以上,說明如本文所放置的8個傳感器節(jié)點都能較準確的識別出人體運動。
3.4 ? 組合傳感器節(jié)點識別
將8個傳感器節(jié)點作為一個整體,分別利用SVM、kNN(k取12)和NCC三種算法進行人體運動的識別實驗的識別性能指標結果如表3所示。
由表3的對比結果可以得出:SVM和kNN算法(k取12)都能獲得較好的識別性能,而NCC算法的識別表現(xiàn)有明顯差距??傮w而言,在使用相同識別算法的前提下,多節(jié)點組合識別能獲得比單節(jié)點識別更好的效果。
4 ? 結 ? 論
利用可穿戴傳感器設備搭建了人體運動數據的采集系統(tǒng),能夠完成運動數據的有效采集,相比于基于計算機視覺的方式,在隱私的保護、對外在環(huán)境的忍耐性方面都有很大的優(yōu)勢。同時,在單獨節(jié)點和組合節(jié)點的情況下,利用kNN、SVM和NCC算法對傳感器數據進行分類識別,得到了較好的效果,驗證了運動識別的可行性,也證明了提出的多節(jié)點識別模型的有效性。
參考文獻
[1] ? ?王雪梅,劉震,倪文波.基于MEMS傳感器的手臂運動測量和識別方法[J].中國慣性技術學報,2017,25(06):701—707.
[2] ? ?趙曉皓,蓋翔,謝新武,等.基于慣性傳感器的人體姿態(tài)角度測量方法研究進展[J].醫(yī)療衛(wèi)生裝備,2017,38(10):99—103+107.
[3] ? ?陳文,龍海光,陳樂.MEMS技術在現(xiàn)代醫(yī)療器械領域中的應用[J].玉林師范學院學報,2017,38(05): 29—33.
[4] ? ?郝旭歡,常博,郝旭麗.MEMS傳感器的發(fā)展現(xiàn)狀及應用綜述[J].無線互聯(lián)科技,2016(03):95—96.
[5] ? ?佟麗娜,侯增廣,彭亮,等.基于多路sEMG時序分析的人體運動模式識別方法[J].自動化學報,2014,40(05):810—821.
[6] ? ?劉歡,邱力軍,范啟富.傳感器技術在可穿戴設備中的應用[J].無線互聯(lián)科技,2017(10):133—134.
[7] ? ?張根選,張莉,石波,等.一種用于癲癇發(fā)作預測的可穿戴無線傳感器[J].中國醫(yī)療器械雜志,2016,40(04): 257—259.
[8] ? ?石敏,楊柳,毛天露,等.服裝動畫中人體運動與服裝變形的相關性學習[J].計算機輔助設計與圖形學學報,2017,29(10):1941—1951.
[9] ? ?黃建燈.紅外傳感器探測人體運動特征的分析研究[J].激光雜志,2017,38(01):65—68.
[10] ?陳莉莉.基于重心位移監(jiān)測的卡路里消耗計算算法[J].西南師范大學學報:自然科學版,2016,41(07):55—60.
[11] ?李國燕,侯向丹,顧軍華,等.快速中值濾波算法的改進及其FPGA實現(xiàn)[J].電子技術應用,2013,39(02): 137—140.
[12] ?左國玉,于雙悅,龔道雄.遙操作護理機器人系統(tǒng)的操作者姿態(tài)解算方法研究[J].自動化學報,2016,42(12):1839—1848.
[13] ?顧韻華,高寶,張俊勇,等.基于標簽速度和滑動子窗口的RFID數據清洗算法[J].計算機科學,2015,42(01):144—148.
[14] ?曹健,李海生,蔡強,等.圖像目標的特征提取技術研究[J].計算機仿真,2013,30(01):409—414.
[15] ?史加榮,周水生,鄭秀云.多線性魯棒主成分分析[J].電子學報,2014,42(08):1480—1486.
[16] ?郭明瑋,趙宇宙,項俊平,等.基于支持向量機的目標檢測算法綜述[J].控制與決策,2014,29(02): 193—200.
[17] ?耿麗娟,李星毅.用于大數據分類的KNN算法研究[J].計算機應用研究,2014,31(05):1342—1344+1373.
[18] ?趙其杰,柯震南,陶靖,等.基于密度-距離的t混合模型流式數據聚類[J].儀器儀表學報,2017,38(09): 2130—2137.