孫宇航,周建欽,張學(xué)鋒
(安徽工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,馬鞍山 243002)
隨著微型智能穿戴設(shè)備的普及與應(yīng)用,以及智能設(shè)備內(nèi)置處理器運(yùn)算能力越來(lái)越強(qiáng),人體運(yùn)動(dòng)識(shí)別成為了當(dāng)代一個(gè)很有價(jià)值的研究.很多應(yīng)用包括健康和健身監(jiān)測(cè)[1,2]、運(yùn)動(dòng)記錄等都是基于該研究.此外,通過(guò)佩戴智能手環(huán)及攜帶智能手機(jī)可以實(shí)現(xiàn)對(duì)用戶進(jìn)行不同運(yùn)動(dòng)模式的記錄,這樣可以幫助用戶及時(shí)了解運(yùn)動(dòng)的情況,及時(shí)做出調(diào)節(jié),使用戶可以更加科學(xué)地安排各類運(yùn)動(dòng)的時(shí)間.運(yùn)動(dòng)手環(huán)上配備了越來(lái)越多的傳感器,比如溫度傳感器、加速度傳感器、壓力傳感器等,可以隨時(shí)隨地采集用戶的運(yùn)動(dòng)信息,這為我們研究人體運(yùn)動(dòng)模式提供了硬件支持.同時(shí),伴隨著人工智能的發(fā)展,機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘算法為我們提供了算法支持.不過(guò)市面上的智能手環(huán)大多只局限于計(jì)步和脈搏測(cè)量等簡(jiǎn)單功能,現(xiàn)有的研究也大多只針對(duì)一些簡(jiǎn)單動(dòng)作如走路,上樓、下樓、靜止等,并沒有對(duì)球類和劃船等體育運(yùn)動(dòng)進(jìn)行識(shí)別記錄.
目前國(guó)內(nèi)外學(xué)者已經(jīng)展開對(duì)人體運(yùn)動(dòng)模式識(shí)別算法的研究,也取得了相應(yīng)的成果.張旭[3]利用表面肌電(SEMG)傳感器在相應(yīng)肌群皮膚表面捕獲的肌肉活動(dòng)信息進(jìn)行了手勢(shì)命令的檢測(cè)與識(shí)別.該方法只針對(duì)手勢(shì)動(dòng)作、頸部動(dòng)作和腿部動(dòng)作的識(shí)別進(jìn)行了研究,在運(yùn)動(dòng)識(shí)別種類上有很大的局限性,無(wú)法對(duì)一些常見戶外運(yùn)動(dòng)如球類運(yùn)動(dòng)、劃船等進(jìn)行識(shí)別.陳燕湄[4]利用計(jì)算機(jī)視覺相關(guān)算法,處理捕獲攝像機(jī)拍攝的手勢(shì)圖像并對(duì)圖像加以分析進(jìn)行手勢(shì)識(shí)別.此外,江超等[5]通過(guò)提取攝像頭動(dòng)態(tài)手勢(shì)軌跡來(lái)識(shí)別動(dòng)作,準(zhǔn)確率達(dá)到了90%以上.這兩種主要是基于圖像和視頻處理來(lái)設(shè)計(jì)運(yùn)動(dòng)識(shí)別算法,對(duì)拍攝圖片和視頻的背景要求比較苛刻,在復(fù)雜的環(huán)境中難以準(zhǔn)確捕捉人體的運(yùn)動(dòng)動(dòng)作,而且基于圖像處理算法復(fù)雜度較高.張毅等[6]通過(guò)將加速度傳感器和陀螺儀相結(jié)合,融合兩個(gè)傳感器的數(shù)據(jù),再構(gòu)建隱馬爾科夫模型實(shí)現(xiàn)日常行為的識(shí)別.這種方法需要處理兩種傳感器的數(shù)據(jù),大大增加了系統(tǒng)的開銷,而且隱馬爾科夫模型只依賴于每一個(gè)運(yùn)動(dòng)狀態(tài),而傳感器輸出的數(shù)據(jù)為長(zhǎng)序列,此模型對(duì)于長(zhǎng)期運(yùn)動(dòng)識(shí)別并不理想.
本文描述一種對(duì)走路、跑步、羽毛球正手揮拍、劃船、打乒乓球5 種運(yùn)動(dòng)模式的識(shí)別方法.只需要佩戴單個(gè)智能手環(huán)即可實(shí)現(xiàn),不需要依賴復(fù)雜的硬件設(shè)施,手環(huán)如圖1所示.首先通過(guò)手環(huán)內(nèi)嵌的MPU-9250獲取5 種運(yùn)動(dòng)產(chǎn)生的加速度數(shù)據(jù).其次經(jīng)過(guò)低通濾波后對(duì)數(shù)據(jù)分段處理,確定每一個(gè)完整動(dòng)作的開始位置和結(jié)束位置,再對(duì)每個(gè)動(dòng)作進(jìn)行特征提取.本實(shí)驗(yàn)分別在時(shí)域和頻域上提取特征,歸納了不同運(yùn)動(dòng)的不同特性,然后通過(guò)計(jì)算信息增益的方法進(jìn)行特征的規(guī)約,以去除非關(guān)鍵特征來(lái)提高整個(gè)系統(tǒng)的計(jì)算效率.最后選取支持向量機(jī)[7,8]、決策樹[9]、隨機(jī)森林算法分別對(duì)5 種模式分類,從中選取出最優(yōu)的分類模型.整個(gè)過(guò)程分為5 個(gè)模塊,各個(gè)模塊之間的流程如圖2所示.
圖1 佩戴示意圖
圖2 流程圖
MPU9250 芯片主要由三軸加速度傳感器,三軸角速度傳感器以及磁力計(jì)組成.3 個(gè)方向加速度單獨(dú)測(cè)量,輸出均為16 位的數(shù)字量.實(shí)驗(yàn)主要分析由芯片內(nèi)的加速度傳感器采集的數(shù)據(jù).由于要識(shí)別的5 種運(yùn)動(dòng)相互之間有很大差異,所以需要頻率足夠高的傳感器來(lái)收集數(shù)據(jù).將內(nèi)置MPU9250 傳感器頻率設(shè)置為200 Hz.這樣的采集頻率足夠收集到5 種運(yùn)動(dòng)模式的細(xì)節(jié),會(huì)給后續(xù)的識(shí)別算法帶來(lái)更高的識(shí)別率[10].整個(gè)軟件系統(tǒng)客戶端使用MFC 框架完成,算法部分使用Python 語(yǔ)言編寫.
本實(shí)驗(yàn)所有的數(shù)據(jù)先儲(chǔ)存在手環(huán)內(nèi)置的存儲(chǔ)卡中,以文本格式保存,文本內(nèi)的數(shù)據(jù)以向量集 <xi,yi,zi>,i=1,2,3,···的形式展現(xiàn).實(shí)驗(yàn)過(guò)程中使用讀卡器讀取所有采集的數(shù)據(jù).
因?yàn)椴煌詣e和年齡的人運(yùn)動(dòng)有很大的差異性,所以本次實(shí)驗(yàn)的數(shù)據(jù)采集一共由實(shí)驗(yàn)室5 名男性和5 名女性完成,年齡分布在20~45 歲.采集數(shù)據(jù)前統(tǒng)一規(guī)定手環(huán)的佩戴方向和位置(如圖1所示),用來(lái)消除不同穿戴方式對(duì)實(shí)驗(yàn)的干擾,這樣采集的樣本更具科學(xué)性.原始數(shù)據(jù)采集完成后進(jìn)行手動(dòng)標(biāo)記[11],用數(shù)字1,2,3,4,5 分別標(biāo)記走路、跑步、羽毛球正手揮拍、劃船以及打乒乓球動(dòng)作.
加速度信號(hào)在時(shí)域中以數(shù)據(jù)流的形式呈現(xiàn),不能直接進(jìn)行特征工程.常規(guī)的方法是設(shè)置滑動(dòng)窗口進(jìn)行處理,這種方法已經(jīng)被廣泛地應(yīng)用于人體運(yùn)動(dòng)狀態(tài)識(shí)別中.滑動(dòng)窗口是一種簡(jiǎn)潔有效的數(shù)據(jù)分割方法,這種方法的核心是確定滑動(dòng)窗口的大小.如果窗口設(shè)置太大,可能會(huì)造成運(yùn)動(dòng)識(shí)別延遲,還可能導(dǎo)致一個(gè)窗口包含不同類型動(dòng)作,造成訓(xùn)練誤差.如果窗口設(shè)置太小,會(huì)導(dǎo)致一個(gè)窗口中不能包含一個(gè)完整動(dòng)作,導(dǎo)致運(yùn)動(dòng)信息的缺失,從而影響識(shí)別結(jié)果.文獻(xiàn)[12]采用了200個(gè)采樣點(diǎn)大小的窗口,并且相鄰的窗口之間沒有重疊;文獻(xiàn)[13]則將采樣窗口設(shè)置為128 個(gè)采樣點(diǎn),相鄰窗口重疊50%.近年來(lái)許多學(xué)者經(jīng)過(guò)多次實(shí)驗(yàn)研究,發(fā)現(xiàn)將滑動(dòng)窗口重疊率設(shè)置為50%是一種比較有效的方法.
實(shí)驗(yàn)綜合分析了5 種運(yùn)動(dòng)模式的特點(diǎn)并統(tǒng)計(jì)完成每種動(dòng)作需要的時(shí)間,選用4 s 作為一段動(dòng)作的默認(rèn)時(shí)長(zhǎng),為一個(gè)滑動(dòng)窗口,寬度為800 個(gè)采樣點(diǎn),每?jī)蓚€(gè)相鄰窗口重疊50%.以走路X 方向加速度數(shù)據(jù)為例,選用4 s 作為窗口的寬度,如圖3,這樣規(guī)整了不同動(dòng)作的加速度信號(hào)的長(zhǎng)度,對(duì)接下來(lái)的特征提取和運(yùn)動(dòng)識(shí)別尤為重要.
相對(duì)于機(jī)器運(yùn)動(dòng),人體運(yùn)動(dòng)較為緩慢,主要包含低頻信號(hào),在實(shí)際應(yīng)用中,加速度信號(hào)不可避免地會(huì)受到硬件電路、傳輸噪聲、擾動(dòng)頻率噪聲和抖動(dòng)的影響,輸出的信號(hào)往往夾雜著很多無(wú)關(guān)信號(hào).當(dāng)加速度為零時(shí),輸出的結(jié)果不為零,而是一個(gè)非零向量的輸出areal,即測(cè)量值ameasured如式(1)所示.
式中,areal為真實(shí)的加速度值,aerror為傳感器的測(cè)量誤差.為了使測(cè)量的加速度信號(hào)更接近真實(shí)值,實(shí)驗(yàn)采用了自適應(yīng)的平滑濾波方法[14].
圖3 信號(hào)加窗處理示意圖
常見的平滑濾波方法有兩種:滑動(dòng)平均濾波方法以及一階慣性低通濾波方法[15].滑動(dòng)平均法雖然簡(jiǎn)單,但是實(shí)驗(yàn)證明實(shí)用性較差.在靜態(tài)情況下,一階慣性低通濾波效果明顯,但是在運(yùn)動(dòng)狀態(tài),相位滯后,所以原始的方法不適合動(dòng)態(tài)信號(hào)的處理,為了適應(yīng)信號(hào)的實(shí)時(shí)性,采用增加閾值的方式去更新濾波參數(shù).定義新的輸出值為當(dāng)前采樣值和上一次輸出值進(jìn)行加權(quán),得到本次輸出值.具體算法如式(2)所示.
式中,Y(n)為當(dāng)前濾波輸出值;m為濾波系數(shù)(通常是一個(gè)大于0 小于1 的數(shù)),它對(duì)濾波的效果影響很大;X(n)為本次采樣值;Y(n-1)為上次濾波輸出值.可以看出,本次采樣值對(duì)于本次輸出值只占很小的比例,但能夠起到一定的修正作用,這樣做使加速度數(shù)據(jù)保持較大的慣性,模擬了低通濾波的功能.接下來(lái)引入判定運(yùn)動(dòng)狀態(tài)的條件閾值 Δa,根據(jù)式(3)和式(4)進(jìn)行修改濾波系數(shù)m,即:
式中,Δ為本次濾波輸出值和上次濾波輸出值的差;Δa為運(yùn)動(dòng)狀態(tài)閾值;k0為默認(rèn)參數(shù).
選取走路模式X 方向某段8 s 原始數(shù)據(jù)為例,采用上述濾波算法進(jìn)行濾波處理,濾波前后波形圖如圖4和圖5所示.
圖4 濾波前的加速度信號(hào)
圖5 濾波后的加速度信號(hào)
對(duì)原始的加速度信號(hào)進(jìn)行分割和平滑之后,接下來(lái)從時(shí)域和頻域中提取相關(guān)的特征量[16].根據(jù)X,Y,Z 3 個(gè)方向上的加速度分別從時(shí)域和頻域中提取了34 個(gè)特征量,包括3 個(gè)方向加速度的均值、合成加速度均值、3 個(gè)方向加速度方差、3 個(gè)方向加速度最大值、3 個(gè)方向加速度最小值、3 個(gè)方向加速度兩兩相關(guān)系數(shù)、3 個(gè)方向加速度峰谷值、合成加速度峰谷值、合成加速度方差、以及頻域中通過(guò)小波變換得到的加速度信號(hào)的能量值.
式中,ax,k,ay,k,az,k為一個(gè)窗體中第k個(gè)采樣點(diǎn)得到的X,Y,Z 三軸加速度信號(hào);n為每個(gè)窗口采樣點(diǎn)數(shù).
合成加速度均值能夠體現(xiàn)某一個(gè)運(yùn)動(dòng)模式的綜合劇烈程度.計(jì)算公式如下:
式中,ak為窗口中第k個(gè)采樣點(diǎn)三軸合加速度的模.將ak帶入式(9)可得合成加速度均值aˉ.
3個(gè)方向加速度標(biāo)準(zhǔn)差,以X 方向?yàn)槔?加速度方差 σ2x計(jì)算公式如下:
同理可得σ2y,σ2z:
合成加速度方差σ2的算式為:
加速度峰谷值表示在一個(gè)窗口中,加速度的最大值和最小值的差值,用apv表示:
利用式(14)可以計(jì)算出合加速度的峰谷值以及3 個(gè)方向加速度峰谷值.
3個(gè)方向加速度兩兩相關(guān)系數(shù)分別為:
小波的組成成分是一組小波基函數(shù),它可以在局部范圍內(nèi)對(duì)信號(hào)時(shí)間(空間)域和頻率(尺度)域的特征進(jìn)行描述,這也是小波變換相對(duì)于傅里葉變換的優(yōu)勢(shì).在任意的時(shí)間域或空間域中,小波分析都能夠很有效地對(duì)信號(hào)進(jìn)行分析,自適應(yīng)信號(hào)分析的要求,有利于聚焦信號(hào)的細(xì)節(jié),而這些特性對(duì)信號(hào)分析是尤為重要的.常用的小波函數(shù)有Haar、Daubechies (dbN)小波等15 種.信號(hào)經(jīng)過(guò)小波分析之后可得到在各個(gè)層級(jí)中的能量特征.信號(hào)f(t)的二進(jìn)小波分解可表示為:
其中,A是近似信號(hào),為低頻部分;D是細(xì)節(jié)信號(hào),為高頻部分,此時(shí)信號(hào)的頻帶分布如圖6所示.
圖6 多尺度分解的信號(hào)頻帶分布
信號(hào)的總能量為:
選擇第j層的近似信號(hào)和各層的細(xì)節(jié)信號(hào)的能量作為特征,構(gòu)造特征向量[17]:
本次實(shí)驗(yàn)直接調(diào)用Python 中的PyWavelets 信號(hào)處理庫(kù),設(shè)置j為2,對(duì)加速度信號(hào)進(jìn)行特征提取,輸出特征向量:
特征選擇是一個(gè)重要的“數(shù)據(jù)預(yù)處理”過(guò)程,能夠去除與當(dāng)前學(xué)習(xí)任務(wù)無(wú)關(guān)的特征,以減輕學(xué)習(xí)負(fù)擔(dān),降低學(xué)習(xí)難度.常用的特征選擇算法可分為4 種:過(guò)濾式(filter)、包裹式(wrapper)、嵌入式(embedding)以及基于信息增益的方法.由于前三類算法比較復(fù)雜,不管是內(nèi)存開銷還是時(shí)間開銷都很大,所以實(shí)驗(yàn)采用基于信息增益(Information Gain,IG)的特征選擇算法[18],這也是一種常用且高效的特征選擇算法.
計(jì)算信息增益首先定義信息熵(information entropy).信息熵是一般用作反映樣本集合純度的一種指標(biāo).假設(shè)pk(k=1,2,···,|y|)為當(dāng)前樣本集合D中第k類樣本所占的比例,則D的信息熵定義為:
式中,|y|代表標(biāo)簽類別個(gè)數(shù),信息熵Ent(D)值越小,則集合D的純度越高.下面定義信息增益.
由于從信號(hào)中提取的特征均為連續(xù)值,連續(xù)值屬性的可取值數(shù)目不是有限的,因此不能直接根據(jù)連續(xù)值來(lái)直接計(jì)算信息增益,實(shí)驗(yàn)采用連續(xù)值離散化技術(shù).給定樣本集D和連續(xù)屬性v,假定v在D上出現(xiàn)了n個(gè)不同的取值{v1,v2,···,vn},基于劃分點(diǎn)t可將D分為子集D-t和D+t.對(duì)相鄰的屬性取值vi和vi+1來(lái)說(shuō),t在區(qū)間[vi,vi+1)中取任意值所產(chǎn)生的劃分結(jié)果相同.定義包含n-1 個(gè)元素的候選劃分點(diǎn)集合.
把區(qū)間[vi,vi+1)的中位點(diǎn)作為候選劃分點(diǎn),選取最優(yōu)的劃分點(diǎn)進(jìn)行樣本集合的劃分,即:
式中,Gain(D,v,t)是樣本集D基于劃分點(diǎn)t二分后的信息增益,這樣我們將每個(gè)特征v帶入,得到所有特征的信息增益值,從而計(jì)算出每個(gè)特征的重要性值.實(shí)驗(yàn)我們直接使用scikit-learn 中的feature_importance_庫(kù)函數(shù)計(jì)算所有特征的重要性值,根據(jù)計(jì)算結(jié)果我們從中選擇出了16 個(gè)特征,如表1所示.
由表1數(shù)據(jù)可得,Y 方向加速度標(biāo)準(zhǔn)差重要性值最大,體現(xiàn)了不同運(yùn)動(dòng)模式左右方向上的偏離程度.Z 方向加速度最大值能夠很準(zhǔn)確地區(qū)分豎直方向上加速度變化幅度較大或較小的運(yùn)動(dòng).X 方向加速度最小值能夠體現(xiàn)水平方向最小的運(yùn)動(dòng)力度.同樣的,其它13 個(gè)特征都在不同的方面對(duì)運(yùn)動(dòng)數(shù)據(jù)的分類起著至關(guān)重要的作用.以上16 個(gè)特征的重要性值都是基于訓(xùn)練樣本計(jì)算而來(lái),而訓(xùn)練樣本由不同年齡和不同性別的人產(chǎn)生的運(yùn)動(dòng)加速度數(shù)據(jù)整理而來(lái),所以通過(guò)以上16 個(gè)特征來(lái)構(gòu)建出的分類模型對(duì)于不同類型人的運(yùn)動(dòng)識(shí)別均有很強(qiáng)的泛化能力和較好的普適性.其次,本文的特征選擇算法采用了特征子集搜索和評(píng)價(jià)機(jī)制相結(jié)合的方式得出特征的重要性值并篩選出最優(yōu)特征子集,使訓(xùn)練出的分類模型擁有更高更穩(wěn)定的識(shí)別準(zhǔn)確率.
表1 特征重要性值
第3 節(jié)我們已經(jīng)提取并計(jì)算出用于分類算法的特征,并計(jì)算出特征重要性值,選擇出16 個(gè)比較重要的特征.利用被選取的特征值,制作訓(xùn)練樣本集和測(cè)試樣本集.實(shí)驗(yàn)中我們根據(jù)樣本的數(shù)量和樣本特征的特性,選取支持向量機(jī)、決策樹、隨機(jī)森林3 種分類模型進(jìn)行了比較實(shí)驗(yàn),分別調(diào)整模型參數(shù)使分類模型對(duì)于5 種運(yùn)動(dòng)模式的分類準(zhǔn)確度達(dá)到最優(yōu).對(duì)每一個(gè)分類模型進(jìn)行了性能的評(píng)估,并結(jié)合在測(cè)試樣本集上的準(zhǔn)確度來(lái)判別最優(yōu)模型.
選用支持向量機(jī)進(jìn)行分類是因?yàn)檫@個(gè)模型適用于樣本量較小的數(shù)據(jù)集,而且運(yùn)算速度快,運(yùn)算復(fù)雜度低.決策樹算法主要基于概率統(tǒng)計(jì),不需要對(duì)數(shù)據(jù)進(jìn)行歸一化,直接使用原始的數(shù)據(jù)樣本進(jìn)行計(jì)算,避免了數(shù)據(jù)的失真,且魯棒性很強(qiáng).
隨機(jī)森林是基于Bagging 的擴(kuò)展變體,是一種可以同時(shí)兼顧分類和回歸的機(jī)器學(xué)習(xí)算法.通過(guò)引入兩次隨機(jī),使得該模型在訓(xùn)練樣本較少時(shí)不容易陷入過(guò)擬合.這樣即使在實(shí)驗(yàn)中無(wú)法保證能夠整理出足夠的運(yùn)動(dòng)數(shù)據(jù)集進(jìn)行模型訓(xùn)練,也能確保最終的模型在測(cè)試數(shù)據(jù)識(shí)別上的表現(xiàn)比支持向量機(jī)和決策樹更加穩(wěn)定.其次,隨機(jī)森林在訓(xùn)練過(guò)程中能夠檢測(cè)到特征之間的影響,所以給定運(yùn)動(dòng)數(shù)據(jù)集,該模型就能夠判斷某種運(yùn)動(dòng)各個(gè)特征之間的相互影響,更加準(zhǔn)確地識(shí)別當(dāng)前運(yùn)動(dòng)的類別.最后,相比較支持向量機(jī)和決策樹,隨機(jī)森林更適合解決樣本不均衡問(wèn)題.本文中5 種運(yùn)動(dòng)模式的樣本數(shù)并不是均衡的,所以使用隨機(jī)森林能夠帶來(lái)更好的效果.圖7的柱狀圖表示3 種分類算法分別針對(duì)5 種運(yùn)動(dòng)模式進(jìn)行分類的準(zhǔn)確率以及對(duì)于5 種運(yùn)動(dòng)模式的統(tǒng)計(jì)比較.
圖7 3 種分類模型的動(dòng)作模式識(shí)別準(zhǔn)確率
由圖7可以得出結(jié)論.3 種分類模型對(duì)于劃船動(dòng)作的識(shí)別都為100%,支持向量機(jī)對(duì)于打羽毛球動(dòng)作的識(shí)別準(zhǔn)確率較高,效果好于另外兩個(gè)模型,而決策樹則是在乒乓球動(dòng)作識(shí)別中表現(xiàn)最好.總體來(lái)說(shuō),隨機(jī)森林算法對(duì)所有運(yùn)動(dòng)模式識(shí)別率都很高,且平均準(zhǔn)確率最高,達(dá)到97.37%,所以系統(tǒng)最終采用隨機(jī)森林作為分類模塊.圖8~圖10分別為3 種分類算法的混淆矩陣.
從混淆矩陣中可以看出,走路和跑步可能被誤識(shí)別為打羽毛球,少量打羽毛球數(shù)據(jù)被誤分類為走路和跑步.個(gè)別打乒乓球動(dòng)作被誤分類為走路,總體上隨機(jī)森林表現(xiàn)最佳.
圖8 支持向量機(jī)算法產(chǎn)生的混淆矩陣
圖9 決策樹算法產(chǎn)生的混淆矩陣
圖10 隨機(jī)森林算法產(chǎn)生的混淆矩陣
本文我們是對(duì)走路、跑步、打羽毛球、打乒乓球、劃船5 種運(yùn)動(dòng)模式識(shí)別的研究.首先參與采集數(shù)據(jù)的實(shí)驗(yàn)人員分別做5 種動(dòng)作并記錄數(shù)據(jù),然后對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,根據(jù)運(yùn)動(dòng)模式的特點(diǎn)提取出對(duì)分類貢獻(xiàn)比較大的特征,并通過(guò)特征選擇選取最終貢獻(xiàn)值較大的特征,之后使用分類算法進(jìn)行運(yùn)動(dòng)模式的識(shí)別.從而實(shí)現(xiàn)對(duì)用戶行為的記錄和分析.
獲取原始數(shù)據(jù)之后,首先對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,包括濾波、數(shù)據(jù)加窗等預(yù)處理.特別在加窗處理中,我們采用相鄰的兩個(gè)窗口重疊50%,以保證樣本的連續(xù)性.綜合分析了信號(hào)在時(shí)域和頻域的特征,選取了16 個(gè)最重要的特征,又保證了較高的識(shí)別率.我們將同樣的測(cè)試數(shù)據(jù)分別輸入到支持向量機(jī)、決策樹、隨機(jī)森林中,結(jié)果顯示隨機(jī)森林算法準(zhǔn)確率最高.
本文研究的人體運(yùn)動(dòng)識(shí)別算法可直接應(yīng)用于智能手環(huán)中,通過(guò)自動(dòng)分析數(shù)據(jù),識(shí)別并統(tǒng)計(jì)該用戶一天內(nèi)的各類運(yùn)動(dòng),將信息反饋給用戶,這種能識(shí)別多運(yùn)動(dòng)模式的手環(huán)比單一的計(jì)步手環(huán)提供更加豐富的運(yùn)動(dòng)信息.在接下的研究中來(lái)將繼續(xù)優(yōu)化算法,減小識(shí)別誤差,同時(shí)識(shí)別更多的運(yùn)動(dòng)模式.