李 鋒 潘敬奎
(東華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 上?!?01620)
(lifeng@dhu.edu.cn)
?
基于三軸加速度傳感器的人體運(yùn)動(dòng)識(shí)別
李鋒潘敬奎
(東華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院上海201620)
(lifeng@dhu.edu.cn)
Human Motion Recognition Based on Triaxial Accelerometer
Li Feng and Pan Jingkui
(CollegeofComputerScienceandTechnology,DonghuaUniversity,Shanghai201620)
AbstractIn this paper, a new method is presented to realize motion detection on a mobile device. The scheme can recognize the people’s motions state according to the acceleration data as long as they simply carry a mobile device with a build-in triaxial accelerometer. The features of the motion signal are extracted in frequency domain and time domain using the method of comprehensive analysis. To enhance the adaptability of the method, the algorithm of independent direction of mobile device algorithm has been applied. The 11 major components, which have greatest contribution to the motion detection, are selected from the 21 motion’s features by principal component analysis, so the input dimension is reduced and the computational complexity of time and space of the algorithm is decreased. Based on the analysis and synthetic comparison of various classification algorithm, the J48 decision tree is accepted. According to the characteristics of the people nature motion, the hidden Markov model is introduced to improve the detection accuracy. Experiments, with different person and different motion, show that the synthesis algorithm has good accuracy and adaptability, and the highest recognition rate achieves 96.13%.
Key wordshuman motion recognition; motion analysis; principal component analysis; hidden Markov model; decision tree
摘要提出并實(shí)現(xiàn)一種基于移動(dòng)設(shè)備的用戶運(yùn)動(dòng)行為的檢測(cè)算法.在用戶隨身攜帶移動(dòng)設(shè)備的情況下,算法就可以根據(jù)移動(dòng)設(shè)備中的三軸加速度數(shù)據(jù),判別出來用戶的行為狀態(tài).算法綜合分析了加速度傳感器數(shù)據(jù)的時(shí)域和頻域特性,并通過方向無(wú)關(guān)性和步幅處理,進(jìn)一步提高算法的適應(yīng)性.算法對(duì)所抽取21個(gè)運(yùn)動(dòng)特征值進(jìn)行了主成分分析,找出了11個(gè)主要特征成分,然后使用這些主成分對(duì)運(yùn)行數(shù)據(jù)進(jìn)行識(shí)別分類.提高了算法準(zhǔn)確度,并降低了算法的時(shí)間和空間復(fù)雜度.在對(duì)分類算法綜合分析和比較后,J48判決樹算法被采納.算法還根據(jù)人類運(yùn)動(dòng)的習(xí)慣和特性,對(duì)特性分類并計(jì)算分類的結(jié)果,再采用隱式Markov模型進(jìn)行處理,進(jìn)一步提高識(shí)別的準(zhǔn)確度.對(duì)多人、多狀態(tài)數(shù)據(jù)的實(shí)驗(yàn)表明,這種綜合方法具有較高的識(shí)別準(zhǔn)確度和適應(yīng)性,在對(duì)多人多次實(shí)際運(yùn)動(dòng)數(shù)據(jù)的處理中,正確識(shí)別率可以達(dá)到96.13%.
關(guān)鍵詞人體運(yùn)動(dòng)識(shí)別;運(yùn)動(dòng)分析;主成分分析;隱Markov模型;判決樹
用戶的運(yùn)動(dòng)環(huán)境感知和識(shí)別一直是一種充滿實(shí)用價(jià)值的研究,基于運(yùn)動(dòng)識(shí)別的產(chǎn)品和服務(wù)也將會(huì)遍及到人們生活的每一個(gè)角落.用戶運(yùn)動(dòng)環(huán)境的感知是一個(gè)有趣的機(jī)器學(xué)習(xí)范疇,僅僅通過用戶運(yùn)動(dòng)產(chǎn)生的數(shù)據(jù)來識(shí)別用戶運(yùn)動(dòng)的狀態(tài),并計(jì)算出用戶的運(yùn)動(dòng)量,以后并根據(jù)這些信息給用戶一些合理的健康的運(yùn)動(dòng)建議,這將會(huì)是一個(gè)充滿意義且富有挑戰(zhàn)的工作.現(xiàn)在的手機(jī)都有很多使用傳感器,比如位置傳感器(GPS)、方向傳感器、加速度傳感器、壓力傳感器、溫度傳感器等,這將會(huì)為我們收集運(yùn)動(dòng)數(shù)據(jù)提供很多方便,為我們以后成果的推廣及實(shí)現(xiàn)提供一個(gè)巨大的平臺(tái).
文獻(xiàn)[1]中Lee和Mase提出了用5個(gè)加速度傳感器穿戴在人身體的不同位置來實(shí)現(xiàn)人體運(yùn)動(dòng)狀態(tài)的識(shí)別,不但用戶體驗(yàn)不方便而且識(shí)別精度不高.文獻(xiàn)[2]中Mizell提出了用重力在預(yù)測(cè)運(yùn)動(dòng)中加速度傳感器的方向問題,從而為后來的基于加速度傳感器的朝向無(wú)關(guān)算法提供了理論依據(jù).Yang[3]使用了手機(jī)內(nèi)嵌的加速度傳感器識(shí)別了6種人體運(yùn)動(dòng)狀態(tài),并將Markov模型用于識(shí)別結(jié)果的判別,大大地增加了識(shí)別的準(zhǔn)確性.但是其所有的處理數(shù)據(jù)都在時(shí)域范圍,沒有對(duì)運(yùn)動(dòng)的頻域信息進(jìn)行分析.Yu和Sun等人[4]提出了在視頻信號(hào)中對(duì)人體運(yùn)動(dòng)狀態(tài)的分析,對(duì)運(yùn)動(dòng)特征采用了主因素分析,并用了神經(jīng)網(wǎng)絡(luò)對(duì)運(yùn)動(dòng)狀態(tài)進(jìn)行分類.他們把運(yùn)動(dòng)狀態(tài)最終歸納為了走、跑以及其他3類運(yùn)動(dòng)狀態(tài).
本文中,我們采用了設(shè)備朝向無(wú)關(guān)的算法[2],這種方法可以利用某段時(shí)間內(nèi)收集的加速度數(shù)據(jù)來確定移動(dòng)設(shè)備的朝向,根據(jù)設(shè)備的朝向可以計(jì)算出用戶運(yùn)動(dòng)時(shí)候水平方向和垂直方向上的加速度.然后我們?cè)诩铀俣雀鱾€(gè)方向上的時(shí)域和頻域[5-6]中共獲得21個(gè)特征,之后對(duì)這些特征進(jìn)行主成分分析,去掉一些對(duì)識(shí)別結(jié)果作用不明顯的特征值.最后把最好的一個(gè)模型用于運(yùn)動(dòng)識(shí)別.為了盡可能減少錯(cuò)誤的判別結(jié)果,我們后期引用了隱Markov模型(hidden Markov model, HMM)[2,7-8]去處理初步識(shí)別結(jié)果,這樣可以提高機(jī)器識(shí)別準(zhǔn)確度.后期為了讓不同的設(shè)備能保持很好的識(shí)別效果,我們對(duì)數(shù)據(jù)采用了歸一化處理,歸一化的數(shù)據(jù)特征值在不同的環(huán)境下都能保持相對(duì)較高的識(shí)別率.
1數(shù)據(jù)收集及方法
由于人體的運(yùn)動(dòng)信號(hào)屬于低頻范疇.當(dāng)今世界上最快的人(截止到2014年)牙買加鮑威爾創(chuàng)造9.74 s的100 m世界紀(jì)錄時(shí)用了43步.但是為了收集更多的細(xì)節(jié)信息,我們將加速度傳感器的采集頻率設(shè)為20 Hz,這樣足夠采集每秒鐘小于等于10次的運(yùn)動(dòng).這樣也能給我提供更多的運(yùn)動(dòng)細(xì)節(jié)信息,這些信息將有助于我們后面的分析.
本文實(shí)驗(yàn)采用的加速度傳感器來自普通的智能手機(jī)[9-12].在智能手機(jī)上我們寫了一個(gè)只能用來收集手機(jī)加速度數(shù)據(jù)的程序[13-14],這個(gè)程序主要是用來存儲(chǔ)每50 ms的三軸加速度傳感器的加速度值.每隔10 s生成1個(gè)樣本文件,這個(gè)樣本文件存儲(chǔ)10 s內(nèi)的數(shù)據(jù).因?yàn)閯傞_始我們目前需要用到計(jì)算機(jī)去分析這些數(shù)據(jù),找到最佳的識(shí)別方法后[15-16],然后再寫程序讓手機(jī)等嵌入式設(shè)備實(shí)現(xiàn)檢測(cè).
本次實(shí)驗(yàn)收集來自于我們實(shí)驗(yàn)室其他4人的靜止、走、上樓梯、下樓梯、跑和騎車6種動(dòng)作,默認(rèn)站立和坐這2種狀態(tài)為靜止.樣本數(shù)據(jù)量達(dá)到700.運(yùn)動(dòng)狀態(tài)收集的時(shí)候,采用用戶手動(dòng)標(biāo)記的方法[17].
2數(shù)據(jù)處理和特征提取
2.1數(shù)據(jù)處理
如第1節(jié)介紹的,為了精確到用戶高達(dá)10 Hz運(yùn)動(dòng)的頻率,我們使用三軸加速度傳感器采集數(shù)據(jù)的時(shí)候使用了20 Hz的采樣頻率.圖1是對(duì)收集來的數(shù)據(jù)進(jìn)行了圖像化的表示結(jié)果.從圖1中明顯可以看出,數(shù)據(jù)比較雜亂,不利于分析,尤其當(dāng)手機(jī)朝向發(fā)生變化的時(shí)候,這時(shí)候雖然是同一種狀態(tài),但會(huì)畫出不同的圖像.如圖1和圖2所示,都是2種一樣的運(yùn)動(dòng)狀態(tài),但是畫出來的圖像相差很大.
Fig. 1 The raw data of walking.圖1 走路狀態(tài)的原始數(shù)據(jù)
Fig. 2 The raw data of walking when the orientation of phone changed.圖2 手機(jī)方向改變走路狀態(tài)下的原始數(shù)據(jù)
為了得到更好的、更有利于特征提取的形式,需要對(duì)數(shù)據(jù)進(jìn)行一次處理.我們采用手機(jī)朝向無(wú)關(guān)的算法,這樣就可以獲得鉛垂面上的加速度(平行于重力方向)和水平面上的加速度(垂直于重力方向),雖然10 s內(nèi)手機(jī)朝向可能發(fā)生變化,但是基本上可以視其穩(wěn)定不變,這樣提取出來的數(shù)據(jù)將會(huì)更加有利于我們的分析,其中思路如下:
假設(shè)在某一時(shí)刻收集的加速度數(shù)據(jù)為ai=(xi,yi,zi),其中xi,yi,zi分別是加速度X軸,Y軸和Z軸方向上的值,那么我們可以得出來重力方向上的加速度為
g=(mx,my,mz),
其中,
所以,我們可以得到鉛垂面上的某一時(shí)刻的加速度為
那么平面上某一時(shí)刻的加速度是hi=(xi,yi,zi),hi=ai- vi.
獲得水平面hi和鉛垂面vi上的加速度數(shù)據(jù)后,我們便可以得到如圖3所示的結(jié)果.
Fig. 3 The acceleration on vertical and horizontal.圖3 處理后保留水平和垂直方向上的數(shù)據(jù)后的圖
下面對(duì)這2個(gè)分量進(jìn)行處理,獲得相應(yīng)的特征值:
由于頻率成分的疊加不具有幅值疊加的特性,我們?cè)谔崛☆l率成分的時(shí)候,為了節(jié)省計(jì)算資源并加快運(yùn)算速度,可以將X,Y,Z三個(gè)軸上的分量求和取模,這時(shí)候便可以獲得如圖4所示的結(jié)果:
但是圖4中不包含水平和垂直的成分,不能直接用它進(jìn)行數(shù)據(jù)分析,不利于提高精確度,需要用到前面求出來的hi和vi.
關(guān)于頻率的提取,本文采用了快速傅里葉變換[6,18]的方法獲得.圖5是走路數(shù)據(jù)進(jìn)行快速傅里葉變化后的頻譜圖:
Fig. 5 The frequency spectrogram of walking.圖5 走路數(shù)據(jù)頻譜圖
為了減弱不同傳感器采樣數(shù)據(jù)大小的差異,并減少溫度對(duì)傳感器的影響,避免收集同一種運(yùn)動(dòng)狀態(tài),卻得到不同的數(shù)據(jù)值.我們采用了歸一化的數(shù)據(jù)處理方法,這樣就不需要保留每一個(gè)數(shù)字的單位,只要一個(gè)相對(duì)值就可以用于運(yùn)動(dòng)識(shí)別.實(shí)驗(yàn)證明這是可行的.
2.2特征提取
以往人們提取的特征值集合中有最大值、最小值、中位數(shù)、平均值、標(biāo)準(zhǔn)差、上四分位數(shù)和下四分位數(shù)等信息,但是在本文中我們放棄利用上四分位數(shù)和下四分位數(shù)這個(gè)特性,因?yàn)榍蠼馑鼈兊倪^程計(jì)算量并不低于進(jìn)行快速傅里葉變換,尤其是它們對(duì)數(shù)據(jù)分析結(jié)果貢獻(xiàn)上不如傅里葉變換貢獻(xiàn)明顯.我們也沒有利用他們的區(qū)間最大值和最小值,因?yàn)檫\(yùn)動(dòng)過程中偶爾的抖動(dòng)會(huì)造成區(qū)間內(nèi)最大值和最小值嚴(yán)重失真,這樣不利于后期的判斷.但是區(qū)間最大值和最小值是一個(gè)很重要的特性,我們又不能拋棄,所以必須用一個(gè)更好的方式既保留最大值和最小值這2個(gè)特性,又要最大可能地降低運(yùn)動(dòng)中偶爾抖動(dòng)帶來的誤差影響,如圖6所示.這時(shí)候我們需要引入平均最大值和平均最小值的概念.在引入平均最大值的時(shí)候,需要用一種算法來獲取用戶運(yùn)動(dòng)的每一步(算法1),然后計(jì)算獲得用戶每一步產(chǎn)生的加速度最大值和最小值.
Fig. 6 The max and min without footstep detection.圖6 沒有使用腳步識(shí)別算法計(jì)算的最大點(diǎn)和最小點(diǎn)
算法1. 腳步識(shí)別算法.
輸入:采樣加速度數(shù)據(jù)y和時(shí)間x;
輸出:腳步數(shù)maxCount、所有腳步中最大的腳步加速度之和tempMax和最小腳步加速度之和tempMin.
①i=1;*初次讀入的數(shù)據(jù)個(gè)數(shù)為0*
②maxCount=0;*找到最大加速度值已經(jīng)走的腳步數(shù)*
③minCount=0;*找到最小加速度值已經(jīng)走的腳步數(shù)*
④tmpMax=0.0;
⑤tmpMin=0.0;
⑥tMax=0;*腳步最大加速度值的時(shí)間位置*
⑦tMin=0;*腳步最小加速度值的時(shí)間位置*
⑧sumMax=0.0;*賦值腳步最大值中和為0*
⑨sumMin=0.0;*賦值腳步最小值總和為0*
⑩ 讀入新數(shù)據(jù)y(i)和該數(shù)據(jù)產(chǎn)生的時(shí)刻x(i);
對(duì)我們?nèi)訁^(qū)間內(nèi)(10 s)的每一步的最大值和最小值求出來后取平均:
這樣可以消除偶爾抖動(dòng)對(duì)區(qū)間的最大值和最小值的影響,獲得平均最大值和平均最小值將會(huì)更加反映真實(shí)的運(yùn)行情況,如圖7和表1所示.
經(jīng)過以上的理論分析,我們將獲得以下特性集合:
垂直特性——平均最大值、平均最小值、平均值、方差.
水平特性——平均最大值、平均最小值、平均值、方差.
矢量和特性——平均最大值、平均最小值、平均值、方差.
頻率特性——第1~6個(gè)最大能量點(diǎn)的頻域位置.
Fig. 7 The max and min on each of footsteps.圖7 每一步的最大點(diǎn)和最小點(diǎn)
m2s
m2s
FootstepDetectionMaxAccelerationMinAccelerationWithout26.030.94With18.023.70
3運(yùn)動(dòng)數(shù)據(jù)的初步處理和分析
本次實(shí)驗(yàn)數(shù)據(jù)采集自4個(gè)人的不同運(yùn)動(dòng)狀態(tài).采集數(shù)據(jù)之時(shí),需要將安裝了采集軟件的手機(jī)放在用戶褲子的口袋中.我們收集了大約700種樣本,包括了6種運(yùn)動(dòng)狀態(tài),這6種運(yùn)動(dòng)狀態(tài)分別為:走、跑、上樓梯、下樓梯、騎車和靜止,每一個(gè)動(dòng)作的數(shù)據(jù)量如表2所示:
Table 2 Accelerometer Samples Data Set
使用我們之前要提取的特征量,現(xiàn)在開始對(duì)每一種運(yùn)動(dòng)進(jìn)行可視化分析.圖8是6種運(yùn)動(dòng)的曲線圖.從0~200 s是靜止的運(yùn)動(dòng)狀態(tài),200~400 s是走路的狀態(tài),400~600 s是上樓梯運(yùn)動(dòng)狀態(tài),600~800 s是下樓梯的狀態(tài),從800~1 000 s是跑步的狀態(tài),最后,從1 000~1 200 s是騎車的狀態(tài).從圖8可以很輕松分辨跑步、騎車和靜止這3個(gè)運(yùn)動(dòng),但是我們很難分辨出上樓梯、下樓梯和走.因?yàn)樗鼈冞\(yùn)動(dòng)產(chǎn)生的圖像非常相似,甚至是相同.但是我們能不能通過統(tǒng)計(jì)的其他方法來獲得他們之間的區(qū)別呢?于是我們統(tǒng)計(jì)出這3個(gè)運(yùn)動(dòng)的平均最大值、平均最小值、平均值以及方差.計(jì)算結(jié)果如表3所示.
Fig. 8 The acceleration of six motions.圖8 6種運(yùn)動(dòng)狀態(tài)的加速度度值
m2s
m2s
LabeledActivityaverageMaxaverageMinaveragestdstillness[9.557,9.870][8.788,9.823][9.484,9.830][0.000,0.081]walking[14.441,21.339][3.599,7.659][9.905,11.812][2.169,5.519]upstairs[13.791,18.882][4.407,6.792][9.861,10.783][2.355,4.266]downstairs[15.335,19.009][4.186,6.587][9.711,10.925][3.021,4.499]running[21.694,29.054][3.310,8.158][13.156,18.451][5.742,7.767]cycling[10.233,14.035][5.265,8.724][9.703,10.133][0.345,2.602]
從表3中,我們還是不能找到一種簡(jiǎn)單又很有效的方法去識(shí)別所有的動(dòng)作.如果只使用這些特征量,仍然不能分辨出上樓梯、下樓梯和走3個(gè)相似的運(yùn)動(dòng).這時(shí)候我們需要用到頻域的一些特性.先對(duì)每一個(gè)運(yùn)動(dòng)進(jìn)行FFT變換[6-7],然后獲得頻域信息,如圖9~13所示.
Fig. 9 The time domain and frequency domain of walking.圖9 走路的時(shí)域和頻域圖
Fig. 10 The time domain and frequency domain of running.圖10 跑步的時(shí)域和頻域圖
通過獲得的時(shí)域和頻域的信息,我們發(fā)現(xiàn)跑步和靜止2種狀態(tài)是最容易識(shí)別的.因?yàn)榕懿疆a(chǎn)生的加速度數(shù)據(jù)的方差是最大的,而且它的平均最大值也是最大的.靜止?fàn)顟B(tài)的方差和加速度的平均最大值是所有狀態(tài)中最小的,我們可以使用簡(jiǎn)單的邏輯判斷就可以識(shí)別.騎車的狀態(tài)也比較容易判別,它的加速度平均值和靜止?fàn)顟B(tài)基本相同,但是它的平均最大值比靜止?fàn)顟B(tài)的平均最大值要大,而且加速度的平均最小值要比靜止?fàn)顟B(tài)的平均最小值要小.這6種狀態(tài)中只有走,上樓梯和下樓梯3種狀態(tài)最相似.但是仔細(xì)觀察后,也發(fā)現(xiàn)下樓梯產(chǎn)生的數(shù)據(jù)方差是三者中最大的,上樓梯是最小的.這是因?yàn)樯蠘翘葸^程人體有克服加速度做功的過程,所以晃動(dòng)不是很厲害,下樓梯就相對(duì)輕松很多,于是人體的抖動(dòng)就比較大.在加速度平均最小值上,上樓梯的加速度平均最小值要大于下樓梯的加速度的平均最小值.在加速度的平均最大值上,下樓梯要大于上樓梯,走的狀態(tài)居中.
Fig. 11 The time domain and frequency domain of upstairs.圖11 上樓梯的時(shí)域和頻域圖
Fig. 12 The time domain and frequency domain of downstairs.圖12 下樓梯的時(shí)域和頻域圖
Fig. 13 The time domain and frequency domain of cycling.圖13 騎車的時(shí)域和頻域圖
4主成分分析
第3節(jié)我們對(duì)所有的數(shù)據(jù)進(jìn)行了籠統(tǒng)的定性分析.但是不能直接用于實(shí)際運(yùn)動(dòng)的判別和分類.此時(shí)將介紹如何從21個(gè)特征值中找出對(duì)結(jié)果貢獻(xiàn)最大的主成分,然后將利用這些主成分對(duì)數(shù)據(jù)進(jìn)行分類,這將有利于減少分類的計(jì)算量.
設(shè)目標(biāo)函數(shù)Y由p=21個(gè)因素x1,x2,…,xp的函數(shù),令每一個(gè)xk(k=1,2,…,p)有n=672個(gè)數(shù)據(jù).將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理以后,寫成矩陣形式:
求出矩陣X的協(xié)方差矩陣R=XXT,然后求出|R-λE|=0的p個(gè)特征根,并按大小排序成:
在求出每個(gè)特征根所對(duì)應(yīng)的特征向量,特征向量矩陣C為
C為單位正交陣,既滿足CCT=CTC=E,C-1=CT.
各因素的線性組合y=cx,其中:
x=(x1x2x3…xp)T,
y=(y1y2y3…yp)T,
即
為了使識(shí)別程度大于99.18%,我們可以計(jì)算出m=11,即前m=11個(gè)主成分分別為主成分.此時(shí)我們可以得出m個(gè)主成分對(duì)應(yīng)的特征向量矩陣Cm的轉(zhuǎn)置矩陣:
m個(gè)主成分構(gòu)成m維正交坐標(biāo)系,由x1=c11y+c21y2+…+cm1ym可以求出來x1軸與主成分軸y1,y2,y3,…,yp方向余弦依次為
它們依次表示x1與主成分軸y1,y2,…,ym相關(guān)程度的大小,由此可以看作是x1分別在y1,y2,…,ym軸上的比重.
可以看作是x1通過主成分y1,y2,…,ym對(duì)總目標(biāo)函數(shù)Y的負(fù)荷率,又因?yàn)閅軸是正交的,所以各負(fù)荷率可以直接相加,故:
可以看成x1對(duì)目標(biāo)函數(shù)Y的負(fù)荷率,同理:
可以看成xk對(duì)目標(biāo)函數(shù)Y的負(fù)荷率,其中k=1,2,…,p.我們可以得到表4的結(jié)果:
Table 4 Contribution of Each Component
5數(shù)據(jù)分類和分類模型比較
從第4節(jié)我們已經(jīng)獲得了用于運(yùn)動(dòng)識(shí)別的主要特征值,根據(jù)這些特征值,我們將對(duì)樣本數(shù)據(jù)進(jìn)行分類和判別,然后找到合適的閾值對(duì)這些運(yùn)動(dòng)狀態(tài)進(jìn)行判別,并找到一種合適的判別模型來高速處理這些數(shù)據(jù).我們初期選取的模型有樸素貝葉斯模型(naive Bayes)、貝葉斯網(wǎng)絡(luò)模型(Bayesian networks)、判決樹(J48)、NB Tree(naive Bayes tree)、LWL(locally weighted learning)和Logistic.然后我們對(duì)每一個(gè)模型行了性能的評(píng)估和測(cè)試以便讓我們找到優(yōu)秀的判別模型.
從表5的計(jì)算結(jié)果我們可以發(fā)現(xiàn),識(shí)別率最高的模型是J48模型,然后是貝葉斯網(wǎng)絡(luò)和Logistic.NB Tree同樣也是一個(gè)識(shí)別度比較高的算法,但是LWL效果是最不好的一種模型.從識(shí)別準(zhǔn)確度和節(jié)省計(jì)算資源出發(fā),所以我們準(zhǔn)備對(duì)J48、貝葉斯網(wǎng)絡(luò)和Logistic三種模型進(jìn)行研究.希望在它們之中找到合適的模型用于運(yùn)動(dòng)識(shí)別.下面是這3個(gè)模型產(chǎn)生的混合矩陣,如表6~8所示.
Table 5 The Recognition Accuracy of Each Model
Table 6 Confusion Matrix for J48 Classifier
Table 7 Confusion Matrix for BayesNet Classifier
Table 8 Confusion Matrix for Logistic Classifier
從表6~8的數(shù)據(jù)我們可以發(fā)現(xiàn)每個(gè)模型識(shí)別準(zhǔn)確程度最好的都是跑步、騎車和靜止3個(gè)運(yùn)動(dòng)的識(shí)別,尤其是貝葉斯網(wǎng)絡(luò)基本完全識(shí)別出來了這3個(gè)運(yùn)動(dòng),但是對(duì)上樓梯、下樓梯和走這個(gè)3個(gè)運(yùn)動(dòng)的識(shí)別是都存在誤差的.綜合識(shí)別的準(zhǔn)確度和減少計(jì)算資源,我們最后采用的是J48判決樹.因?yàn)檫@個(gè)方法相對(duì)來說識(shí)別精度和速度都比較快.但是J48也有不足,比如下樓梯運(yùn)動(dòng)由于用戶個(gè)體之間的運(yùn)動(dòng)差異,造成某些主特征值過大,有一些人狀態(tài)被識(shí)別成跑,竟然有一個(gè)被識(shí)別為騎車,這是一個(gè)可笑的事情.所以需要用到另一種方法去減少這種低級(jí)的錯(cuò)誤.這時(shí)候我們引入使用Markov模型,因?yàn)橛脩暨\(yùn)動(dòng)的過程可以看作一種Markov過程,所有動(dòng)作的下一個(gè)動(dòng)作基本都是一個(gè)可以預(yù)測(cè)的.比如一個(gè)在上樓梯狀態(tài)的時(shí)候,下一個(gè)動(dòng)作狀態(tài)很可能是繼續(xù)上樓梯或者走,只有很小的可能是跑或者騎車.所以,我們可以根據(jù)每一個(gè)用戶的日常行為規(guī)律來建立一個(gè)狀態(tài)轉(zhuǎn)移矩陣P.然后用HMM模型去平滑輸出,過濾掉不合理的情況.這樣就可以明顯增加用戶運(yùn)動(dòng)的準(zhǔn)確度.
P=
矩陣P是我們對(duì)一個(gè)實(shí)驗(yàn)者一周的數(shù)據(jù)分析得到的,如果一個(gè)人現(xiàn)在的動(dòng)作狀態(tài)是q,上一個(gè)動(dòng)作狀態(tài)是r,q,r∈A={上樓梯,下樓梯,跑,走,騎車,靜止},那么此時(shí)的轉(zhuǎn)移系數(shù)是p{si=m|si-1=n}.在后期的訓(xùn)練中,我們可以得到,每個(gè)用戶的狀態(tài)轉(zhuǎn)移矩陣不同,因?yàn)槊總€(gè)人的生活習(xí)慣也不同.有些人可能沒有自行車,可能由其他運(yùn)動(dòng)狀態(tài)向騎車運(yùn)動(dòng)狀態(tài)的轉(zhuǎn)移系數(shù)將會(huì)變成0.所以后期的狀態(tài)轉(zhuǎn)移矩陣應(yīng)該是建立在本地的一個(gè)可以幫助提高用戶狀態(tài)識(shí)別結(jié)果的局部數(shù)據(jù).
6總結(jié)和展望
在本文中,我們用手機(jī)內(nèi)置的加速度傳感器收集用戶運(yùn)動(dòng)產(chǎn)生的樣本數(shù)據(jù),然后對(duì)樣本數(shù)據(jù)進(jìn)行一系列的時(shí)域和頻域特征值,然后利用主因素分析方法找到最重要的特征值.利用這些特征值計(jì)算出來一個(gè)合適的識(shí)別模型,利用這個(gè)模型根據(jù)用戶現(xiàn)有的實(shí)時(shí)數(shù)據(jù)推斷用戶的現(xiàn)在行為狀態(tài),并可以對(duì)用戶歷史行為進(jìn)行統(tǒng)計(jì)分析.
在數(shù)據(jù)處理過程中,我們首先對(duì)數(shù)據(jù)進(jìn)行腳步定位和特征量抽取.并利用手機(jī)朝向無(wú)關(guān)的算法,求出水平和垂直方向上各自的加速度.在求取最大值和最小值的算法上,我們拋棄了以前人們采用的整個(gè)區(qū)間數(shù)據(jù)的最大值和最小值的方法,而是采用以用戶腳步為單位的的平均最大值和平均最小值.我們又將處理領(lǐng)域拓展到頻域范圍,然后我們獲得最大的6個(gè)頻域點(diǎn),這些點(diǎn)包含運(yùn)動(dòng)產(chǎn)生的非常重要的頻率信息.我們又用了主成分分析,獲得了對(duì)結(jié)果貢獻(xiàn)最大的幾個(gè)主要特征屬性.然后討論了如何利用這些特征點(diǎn)和樣本去訓(xùn)練一個(gè)識(shí)別模型.為了增加識(shí)別的精確程度我們又采用了隱Markov過程.
本文研究可以直接應(yīng)用于移動(dòng)領(lǐng)域的用戶的運(yùn)動(dòng)識(shí)別.通過獲得用戶準(zhǔn)確的運(yùn)動(dòng)信息,給用戶一個(gè)健康的生活提示和健康守護(hù).配合我們另一個(gè)項(xiàng)目的心電檢測(cè),可以隨時(shí)獲得家中老人的運(yùn)動(dòng)狀態(tài),防止他們出現(xiàn)跌倒、昏迷等意外.
在將來我們將會(huì)縮短識(shí)別時(shí)間和取樣周期,增加系統(tǒng)的反應(yīng)時(shí)間,提供一個(gè)更靈敏的算法和服務(wù).其次,我們希望能夠拓展識(shí)別的領(lǐng)域,讓手機(jī)可以實(shí)現(xiàn)無(wú)監(jiān)督的自主學(xué)習(xí),并歸納出用戶獨(dú)特的行為,這樣可以更加靈活方便以及精確地為每一個(gè)用戶服務(wù),減少識(shí)別的誤差.
參考文獻(xiàn)
[1]Lee S W, Mase K. Activity and location recognition using wearable sensors[J]. IEEE Pervasive Computing, 2002, 1(3): 24-32
[2]Mizell D. Using gravity to estimate accelerometer orientation[C]Proc of the 7th IEEE Int Symp on Wearable Computers. Los Alamitos, CA: IEEE Computer Society, 2003: 252-252
[3]Yang Jun. Toward physical activity diary: Motion recognition using simple acceleration features with mobile phones[C]Proc of the 1st Int Interactive Multimedia for Consumer Electronics. New York: ACM, 2009: 1-10
[4]Yu H, Sun G, Song W, et al. Human motion recognition based on neural network[C]Proc of 2005 Int Conf on Communications, Circuits and Systems. Piscataway, NJ: IEEE, 2005: 27-30
[5]Welch P. The use of fast Fourier transform for the estimation of power spectra: A method based on time averaging over short, modified periodograms[J]. IEEE Trans on Audio Electroacoustics, 1967, 15(2): 70-73
[6]Gao Xiquan, Ding Yumei. Digital Signal Processing[M]. Xi’an: Xidian University Press, 2008: 75-125 (in Chinese)(高西全, 丁玉美. 數(shù)字信號(hào)處理[M]. 西安: 西安電子科技大學(xué)出版社, 2008: 75-125)
[7]Yi K, Beheshti J. A hidden Markov model-based text classification of medical documents[J]. Journal of Information Science, 2009, 35(1): 67-81
[8]Yu Yingzhuo. Detection of abnormal behavior and posture recognition based on characteristics of human motion[D]. Xi’an: Xidian University, 2011 (in Chinese)(郁映卓. 基于人體運(yùn)動(dòng)特征的異常行為檢測(cè)和姿態(tài)識(shí)別[D]. 西安: 西安電子科技大學(xué), 2011)
[9]Yi He, Li Ye, Bao Shudi. Fall detection by built-in tri-accelerometer of smartphone[C]Proc of 2012 IEEE Int Conf on Biomedical and Health Informatics (BHI). Piscataway, NJ: IEEE, 2012: 184-187
[10]Gammeter S, Gassmann A, Bossard L, et al. Server-side object recognition and client-side object tracking for mobile augmented reality[C]Proc of 2010 IEEE Computer Society Conf on Computer Vision and Pattern Recognition Workshops(CVPRW). Los Alamitos, CA: IEEE Computer Society, 2010: 1-8
[11]Mantyjarvi J, Himberg J, Seppanen T. Recognizing human motion with multiple acceleration sensors[C]Proc of 2001 IEEE Int Conf on Systems, Man, and Cybernetics. Piscataway, NJ: IEEE, 2001: 747-752
[12]Akl A, Valaee S. Accelerometer-based gesture recognition via dynamic-time warping, affinity propagation, & compressive sensing[C]Proc of 2010 IEEE Int Conf on Acoustics Speech and Signal Processing (ICASSP). Piscataway, NJ: IEEE, 2010: 2270-2273
[13]Kwapisz J R, Weiss G M, Moore S A. Activity recognition using cell phone accelerometers[J]. ACM SIGKDD Explorations Newsletter, 2011, 12(2): 74-82
[14]Yi W, Jia W, Saniie J. Mobile sensor data collector using Android smartphone[C]Proc of the 55th IEEE Int Midwest Symp on Circuits and Systems (MWSCAS). Piscataway, NJ: IEEE, 2012: 956-959
[15]Frank E, Hall M, Holmes G, et al. Data Mining and Knowledge Discovery Handbook[M]. Berlin: Springer, 2005: 1305-1314
[16]Xu J, Güting R. A generic data model for moving objects[J]. GeoInformatica, 2013, 17(1): 125-172
[17]Zhao Guoying, Li Zhenbo, Deng Yu, et al. Human motion recognition and simulation based on retrieval[J]. Journal of Computer Research and Development, 2006, 43(2): 368-373 (in Chinese)(趙國(guó)英, 李振波, 鄧宇, 等. 基于檢索的人體運(yùn)動(dòng)識(shí)別和模擬[J].計(jì)算機(jī)研究與發(fā)展, 2006, 43(2): 368-373)
[18]Yang Lijuan, Zhang Baihua,Ye Xuzhen. Fast Fourier transform and its applications[J]. Opto-Electronic Engineering, 2004, 31(Z1): 1-3 (in Chinese)(楊麗娟, 張白樺, 葉旭楨. 快速傅里葉變換FFT及其應(yīng)用[J]. 光電工程, 2004, 31(Z1): 1-3)
Li Feng, born in 1969. Professor and master supervisor at Donghua University. His main research interests include machine learning, pattern recognition, intelligent information processing and embedded operating system, etc.
Pan Jingkui, born in 1989. Master candidate in computer science and technology from Donghua University. His current research interests include machine learning, pattern recognition and embedded system (pjkui@qq.com).
中圖法分類號(hào)TP391
基金項(xiàng)目:上海自然科學(xué)基金項(xiàng)目(11ZR1401500)
收稿日期:2014-10-30;修回日期:2015-04-16
This work was supported by the Natural Science Foundation of Shanghai (11ZR1401500).