陸 康,何志琴
(貴州大學(xué) 電氣工程學(xué)院,貴陽 550025)
近年來,由于下肢外骨骼在提高人體負(fù)重能力以及輔助下肢殘障人士進(jìn)行康復(fù)訓(xùn)練等方面的廣闊應(yīng)用前景,對下肢外骨骼的研究逐漸成為新的熱點(diǎn)。
下肢外骨骼在不同的步態(tài)階段使用不同的控制模式,因此,步態(tài)識(shí)別是下肢外骨骼控制系統(tǒng)中的重要環(huán)節(jié),以往的步態(tài)識(shí)別主要以足底壓力傳感器為主要信息來源,使用閾值法進(jìn)行步態(tài)識(shí)別,根據(jù)設(shè)置的閾值將腳跟和腳掌分為觸地狀態(tài)和非觸地狀態(tài)。Catalfamo 等人[1]和Lopez 等人[2]使用每次實(shí)驗(yàn)中足底壓力的最大值和最小值的計(jì)算閾值。Mariani 等人[3]將體重的5%設(shè)置為閾值。閾值法在離線分析時(shí)效果較好,但當(dāng)在線使用時(shí),不同步速或不同體重對應(yīng)的閾值不同,閾值法難以適應(yīng)這種變化。
隨著機(jī)器學(xué)習(xí)的興起,研究者們提出了各種基于學(xué)習(xí)的步態(tài)識(shí)別方法。Park 等人[4]根據(jù)GRF 訓(xùn)練了人工神經(jīng)網(wǎng)絡(luò)(ANN)來進(jìn)行步態(tài)識(shí)別。Attal等人[5]使用無監(jiān)督的多元回歸隱馬爾可夫模型(MRHMM)進(jìn)行步態(tài)識(shí)別,平均識(shí)別率為83.21%。劉薛勤等人[6]使用多個(gè)柔性薄膜壓力傳感器采集足底壓力,利用支持向量機(jī)(SVM)進(jìn)行步態(tài)識(shí)別,識(shí)別準(zhǔn)確率達(dá)到了90%。然而,由于足底壓力傳感器會(huì)經(jīng)常受到擠壓磨損,導(dǎo)致其壽命有限,并不適用于長期使用。
因此,一些研究者提出了僅使用行走時(shí)的下肢角度的步態(tài)識(shí)別方法。Liu 等人[7]建立了基于多層感知器的步態(tài)識(shí)別模型,平均相位正確率(CRP)為87.22%。Ma 等人[8]采集了髖膝關(guān)節(jié)角度,利用核遞歸最小二乘法(KRLS)實(shí)現(xiàn)了步態(tài)識(shí)別,測試平均準(zhǔn)確率為86%,但由于KRLS 無法直接完成多分類,需要訓(xùn)練多個(gè)KRLS 模型來實(shí)現(xiàn)步態(tài)識(shí)別。
基于當(dāng)前的研究現(xiàn)狀,為提高下肢外骨骼步態(tài)識(shí)別準(zhǔn)確度以及識(shí)別效率,同時(shí)減少傳感器的需求,本文僅使用IMU 測量的大腿、小腿角度和角速度,提出了基于隨機(jī)森林多分類能力的步態(tài)識(shí)別方法,避免了足底壓力傳感器的敏感性以及耐用性有限的問題,并利用隨機(jī)森林變量重要性以及皮爾遜相關(guān)系數(shù)進(jìn)行輸入特征篩選,提高了步態(tài)識(shí)別準(zhǔn)確度和算法的運(yùn)行效率。
隨機(jī)森林是一種經(jīng)典的集成學(xué)習(xí)算法,具有訓(xùn)練速度快、泛化性較好等優(yōu)點(diǎn)。該算法建立在Bagging 策略上,以大量決策樹作為基礎(chǔ)學(xué)習(xí)器,在完成分類任務(wù)時(shí),訓(xùn)練多個(gè)分類決策樹,通過投票方式確定最終的分類[9]。在本文中,隨機(jī)森林將用來根據(jù)提取的時(shí)域特征進(jìn)行步態(tài)識(shí)別。
在本文中,使用大腿、小腿IMU 測量得到的角度值作為步態(tài)識(shí)別的輸入來源,同時(shí)為了提高分類精度,使用滑動(dòng)窗口的方式將一定時(shí)間長度的歷史角度作為輸入,但此時(shí)存在輸入變量維數(shù)較高、變量冗余的問題,因此結(jié)合隨機(jī)森林的變量重要性和皮爾遜相關(guān)系數(shù)進(jìn)行輸入特征降維[10]。
隨機(jī)森林具有評(píng)估變量重要性的能力,在隨機(jī)森林的每個(gè)決策樹建立過程中,有大約1/3 的數(shù)據(jù)樣本沒有作為測試集,稱為袋外(Out-of-bag,OOB)數(shù)據(jù),這些數(shù)據(jù)可以用來評(píng)估模型,本文中根據(jù)OOB 數(shù)據(jù)采用平均準(zhǔn)確度(Mean -decrease -accuracy,MDA)下降來評(píng)估輸入變量的重要性[11],主要步驟如下:
(1)使用OOB 數(shù)據(jù)計(jì)算每個(gè)決策樹的分類準(zhǔn)確率A1。
(2)對OOB 數(shù)據(jù)中某一輸入特征加入隨機(jī)擾動(dòng),再計(jì)算分類準(zhǔn)確率A2。
(3)計(jì)算2 次分類準(zhǔn)確率的差值,即:ΔA =A1-A2。
(4)求隨機(jī)森林中所有決策樹的差值的平均值、即MDA。
MDA越大,表明對應(yīng)的輸入變量改變后,隨機(jī)森林的準(zhǔn)確率下降越大,因此該輸入變量對步態(tài)識(shí)別準(zhǔn)確率的影響越大。
計(jì)算出輸入變量的重要性后,還需要剔除其中的相關(guān)性較大的冗余特征,Pearson 相關(guān)系數(shù)是分析變量相關(guān)性常用的方法。本文根據(jù)Pearson 相關(guān)系數(shù),按照2 個(gè)變量相關(guān)性高時(shí)、保留變量重要性大的特征為原則,進(jìn)行特征變量的降維。
為了采集步態(tài)數(shù)據(jù),進(jìn)行了步態(tài)數(shù)據(jù)采集實(shí)驗(yàn)。數(shù)據(jù)采集設(shè)備如圖1 所示。由圖1 可以看到,一名實(shí)驗(yàn)者穿戴數(shù)據(jù)采集設(shè)備進(jìn)行了數(shù)據(jù)采集實(shí)驗(yàn),用粘性綁帶將4 個(gè)維特智能公司生產(chǎn)的型號(hào)為JY931的九軸陀螺儀固定在實(shí)驗(yàn)對象的大腿和小腿處,采集實(shí)驗(yàn)對象大腿、小腿的角度和角速度。實(shí)驗(yàn)對象腳底穿著足底壓力采集鞋,在每只鞋的前掌和足跟處分別安裝有一個(gè)大洋微型壓力傳感器,采集足底壓力數(shù)據(jù),傳感器的分布見圖1。數(shù)據(jù)的采樣頻率為100 Hz,使用截止頻率為20 Hz 的二階巴特沃斯低通濾波器進(jìn)行數(shù)據(jù)濾波,消除采集數(shù)據(jù)中的噪聲和干擾,數(shù)據(jù)經(jīng)過處理后被存放在SD 卡中,便于進(jìn)行后續(xù)分析。
圖1 數(shù)據(jù)采集設(shè)備Fig. 1 Data collection equipment
實(shí)驗(yàn)者在跑步機(jī)上進(jìn)行了5 次行走實(shí)驗(yàn),每次行走實(shí)驗(yàn)中按高速、中速、低速來隨機(jī)切換速度,不指定目標(biāo)速度,切換的速度以及切換時(shí)機(jī)出于實(shí)驗(yàn)者的自由選擇。為保證采集數(shù)據(jù)的有效性,每次實(shí)驗(yàn)前都要進(jìn)行傳感器位置及狀態(tài)檢查,確保IMU 牢固綁縛在同一位置,避免位置不同可能帶來的測量誤差。以右腿的步態(tài)數(shù)據(jù)為研究對象,剔除不完整的步態(tài)周期數(shù)據(jù),以及跑步機(jī)啟動(dòng)停止時(shí)的數(shù)據(jù),共獲得到104 915 個(gè)樣本點(diǎn)的數(shù)據(jù)。
在步態(tài)識(shí)別的實(shí)驗(yàn)中,需要進(jìn)行步態(tài)劃分來生成步態(tài)數(shù)據(jù)對應(yīng)的標(biāo)簽。在傳統(tǒng)的步態(tài)劃分中,一個(gè)步態(tài)周期被定義為一次足跟觸地到下一次足跟觸地的時(shí)間,隨后根據(jù)腳跟和腳掌的觸地狀態(tài)將步態(tài)劃分為腳跟著地(Heel Strike,HS)、平地站立(Flat Stance,F(xiàn)S)、腳跟離地(Heel Off,HO)和擺動(dòng)(Swing,SW),在本文中使用1、2、3、4 作為標(biāo)簽來對應(yīng)這4 個(gè)狀態(tài),步態(tài)劃分的規(guī)則見表1。
表1 步態(tài)劃分規(guī)則Tab.1 Gait division rules
劃分步態(tài)需要確定腳跟和腳掌的觸地狀態(tài),本文中根據(jù)文獻(xiàn)[2]提出的閾值方法來區(qū)分腳跟、腳掌的觸地和離地狀態(tài)。通過公式(1)計(jì)算閾值:
其中,Tmax和Tmin分別為一次實(shí)驗(yàn)中采集到的每個(gè)步態(tài)周期中足底壓力的最大值、最小值的平均值;α是一個(gè)比例因子,用于調(diào)整閾值,來補(bǔ)償足底壓力的差異性。
在Matlab R2021a 中設(shè)計(jì)了本文的步態(tài)識(shí)別模型,按照7:3 的比例將數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集和測試集。實(shí)驗(yàn)分析數(shù)據(jù)發(fā)現(xiàn)輸入窗口越大,步態(tài)識(shí)別的準(zhǔn)確率越高,考慮到算法的耗時(shí)問題以及參考文獻(xiàn)[12]的經(jīng)驗(yàn),將輸入窗口設(shè)置為17,可以較好地保持算法的實(shí)時(shí)性,提取窗口內(nèi)大腿、小腿角度和角速度的時(shí)域特征,包括:最大值、最小值、均值、方差和標(biāo)準(zhǔn)差,總共20 個(gè)輸入特征變量。隨機(jī)森林的樹的棵數(shù)和最小葉子節(jié)點(diǎn)大小經(jīng)過網(wǎng)格搜索確定為50 和1。
本文提出的步態(tài)識(shí)別方法使用準(zhǔn)確度(Precision)和召回率(Recall)來進(jìn)行評(píng)估[5],推得的數(shù)學(xué)定義公式分別見如下:
其中,Tp、Fp和Fn分別表示某一預(yù)測標(biāo)簽預(yù)測正確的數(shù)量、真實(shí)標(biāo)簽被誤分為其他類的數(shù)量以及預(yù)測標(biāo)簽預(yù)測錯(cuò)誤的數(shù)量。準(zhǔn)確度和召回率越高,表明步態(tài)識(shí)別的效果越好。
輸入變量的重要性如圖2 所示。圖2 中,輸入量編號(hào)1~5 表示大腿角度的最大值、最小值、均值、方差和標(biāo)準(zhǔn)差,6~10 表示大腿角速度的最大值、最小值、均值、方差和標(biāo)準(zhǔn)差,編號(hào)11~20 表示小腿對應(yīng)的輸入量。從圖2 中可以看出,所有輸入變量的重要性都大于1,都具有一定的重要性,最高的3 個(gè)變量編號(hào)為6、8、9 分別對應(yīng)大腿角速度的最大值、均值、方差。
圖2 輸入變量的重要性Fig. 2 Importance of input variables
對這20 個(gè)輸入變量計(jì)算Pearson 相關(guān)系數(shù),圖3 為輸入變量的相關(guān)系數(shù)的部分結(jié)果。由圖3 可以看出,部分變量之間存在較大的相關(guān)性,根據(jù)2 個(gè)變量相關(guān)性高時(shí)、保留變量重要性大的特征為原則,最終篩選出來9 個(gè)輸入變量,編號(hào)分別為1、2、4、6、7、9、13、15、19,大大降低了輸入變量的維數(shù)。
圖3 部分輸入變量的Pearson 相關(guān)系數(shù)Fig. 3 Pearson's correlation coefficient for a subset of input variables
為驗(yàn)證本文方法的性能,使用篩選前后的特征分別訓(xùn)練隨機(jī)森林,并將文獻(xiàn)[8]的一對多支持向量機(jī)(SVM)作為對比,在驗(yàn)證集上的步態(tài)識(shí)別的準(zhǔn)確率及總預(yù)測時(shí)間見表2。由表2 分析可知,本文方法的步態(tài)識(shí)別準(zhǔn)確率達(dá)到了93.2%,略低于使用全部特征的隨機(jī)森林,與一對多SVM 相比準(zhǔn)確率提高了3.8%,文獻(xiàn)[4]以90%識(shí)別率作為評(píng)價(jià)步態(tài)識(shí)別方法能否用于實(shí)際步態(tài)識(shí)別的閾值,因此本文方法可以用于步態(tài)識(shí)別。此外,本文方法在測試集上的總預(yù)測耗時(shí)也是最低,有助于提高步態(tài)識(shí)別的實(shí)時(shí)性。
表2 步態(tài)識(shí)別方法對比Tab.2 Comparison of gait recognition methods
本文方法在測試集中取得的步態(tài)識(shí)別混淆矩陣如圖4 所示。由圖4 可以看到,矩陣的最右一列為準(zhǔn)確度,最下一行為召回率。數(shù)據(jù)表明,對標(biāo)簽4、即擺動(dòng)態(tài)的識(shí)別效果最好,準(zhǔn)確度達(dá)到了97.9%,對標(biāo)簽2、即平地支撐的識(shí)別效果最差,可能是由于支撐態(tài)時(shí)大腿、小腿角度變化較大,造成識(shí)別困難,并且支撐態(tài)的樣本也較少,不利于算法識(shí)別率的提高。圖5 則為SVM 和本文方法對部分樣本的步態(tài)識(shí)別結(jié)果。
圖4 測試集步態(tài)識(shí)別的混淆矩陣Fig. 4 Confusion matrix for test set gait recognition
圖5 部分樣本的分類結(jié)果圖Fig. 5 Classification results for parts of the samples
針對足底壓力傳感器在下肢外骨骼步態(tài)識(shí)別中的耐用性較差的問題,設(shè)計(jì)了僅使用IMU 信號(hào)的步態(tài)識(shí)別方法。使用隨機(jī)森林設(shè)計(jì)了步態(tài)識(shí)別模型,并且結(jié)合隨機(jī)森林變量重要性和Pearson 相關(guān)系數(shù)進(jìn)行了輸入變量篩選。
仿真結(jié)果表明,本文方法的識(shí)別準(zhǔn)確率高、耗時(shí)少,為研究下肢外骨骼的步態(tài)識(shí)別提供了新的思路與參考。