周澤侖,戴 歡,束沁冬,史文華,石鵬展
(蘇州科技大學(xué) 電子與信息工程學(xué)院,江蘇 蘇州 215009)
隨著智能手機的普及,以及微電子行業(yè)的發(fā)展,越來越多的傳感器被集成到智能手機中。通過采集智能手機中傳感器數(shù)據(jù),進行人員室內(nèi)運動狀態(tài)的分析建模[1]引起了廣大國內(nèi)外研究人員關(guān)注。2017年,Lee S M等[2]基于加速度傳感器數(shù)據(jù),使用卷積神經(jīng)網(wǎng)絡(luò)算法進行人員室內(nèi)運動狀態(tài)識別。Dernbach S等[3]利用智能手機中的慣性傳感器,通過分析智能手機的手持方式進行運動數(shù)據(jù)進一步特征提取,識別了一些人體復(fù)雜的動作,比如烹飪與打掃衛(wèi)生。Pham C等[4]提出了一種基于動態(tài)時間扭曲的活動識別系統(tǒng),該系統(tǒng)采用智能手機中的加速度傳感器,并在使用較少樣本的情況下,識別了人在廚房中的運動狀態(tài)。Park J等[5]基于加速度傳感器,通過分析智能手機中的傳感器數(shù)據(jù)對于病人的步行速度以及運動狀態(tài)進行識別。He Z等[6]采用DCT與PCA對加速度傳感器數(shù)據(jù)進行預(yù)處理,并采用SVM分類器對人員室內(nèi)運動狀態(tài)進行識別。文獻[7]利用多傳感器在盲區(qū)邊緣實現(xiàn)了定位精度的改進。
上述方法主要存在兩種問題:
(1)單個傳感器無法有效的表征人員室內(nèi)運動狀態(tài)的所有特征,而特征提取的不充分又導(dǎo)致了識別準(zhǔn)確率不高。
(2)傳統(tǒng)的慣性傳感器無法識別室內(nèi)人員在垂直方向上的運動狀態(tài)(上下樓梯、上下電梯),這就導(dǎo)致了現(xiàn)有的運動狀態(tài)識別方法局限于只能在同一個平面樓層發(fā)揮作用,在識別人員垂直方向的運動時顯得十分不穩(wěn)定。
針對以上問題,筆者使用滑窗理論提取的傳感器數(shù)據(jù)動態(tài)時序特征能比瞬時數(shù)據(jù)更有效地表示人員運動時的過程,并利用多層神經(jīng)網(wǎng)絡(luò)充分提取了人員室內(nèi)運動狀態(tài)更高層次的特征,提升了算法的準(zhǔn)確率。在使用慣性傳感器數(shù)據(jù)的基礎(chǔ)上,融入了氣壓傳感器數(shù)據(jù)[8],根據(jù)氣壓會隨著樓層的增高而不斷下降的特性,解決了無法識別室內(nèi)人員在垂直方向上的運動狀態(tài)的問題,提升了系統(tǒng)識別各類運動狀態(tài)的穩(wěn)定性。
圖1所示運動狀態(tài)識別的整體框架,首先將采集到的陀螺儀旋轉(zhuǎn)角、受重力值、磁場強度、氣壓、加速度數(shù)據(jù)提取傳感器數(shù)據(jù)的動態(tài)時序特征[9],再使用卷積神經(jīng)網(wǎng)絡(luò)得出置信度最大的運動狀態(tài),運動狀態(tài)分別包括靜止、步行、上樓梯、下樓梯、上電梯、下電梯、跑步。
圖1 整體框架
室內(nèi)人員運動是一種不斷變化的過程,僅使用每個時刻靜態(tài)的傳感器數(shù)據(jù)作為人員室內(nèi)運動狀態(tài)的特征無法取得較好的識別效果,因此,文中使用滑窗理論提取傳感器數(shù)據(jù)在時序上的動態(tài)信息,其具體過程如下:
假設(shè)傳感器數(shù)據(jù)組成長度為n的數(shù)據(jù)集
其中三軸傳感器數(shù)據(jù)xi包含三維特征(xi1,xi2,xi3),單軸傳感器數(shù)據(jù)xi包含一維特征xi1,滑窗中的窗口長度為l,滑動窗口中的步長為s。其過程為
其中
神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置如圖2所示,其中卷積層中滑動窗口大小為 28,滑動步長為4,經(jīng)過卷積形成28×44×13的模型輸入矩陣。神經(jīng)網(wǎng)絡(luò)中第一層的卷積核尺寸為(7,7,13),共有128個卷積核。實驗過程中的池化核尺寸為統(tǒng)一大小(2,2),池化的步長為2,池化過程采用最大池化策略。
第二卷積層的卷積核大小為(7,7,128),共有 64 個卷積核,且全局網(wǎng)絡(luò)具有128個隱層節(jié)點。設(shè)置該模型的學(xué)習(xí)率為0.000 1,神經(jīng)元丟棄率為0.5。
圖2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
卷積神經(jīng)網(wǎng)絡(luò)憑借局部連接和權(quán)值共享兩種特性可以充分提取傳感器數(shù)據(jù)特征,有效避免特征提取不充分的問題。對傳感器原始數(shù)據(jù)進行卷積計算時,卷積過程為
其中:c表示卷積層輸出矩陣,l表示卷積層下標(biāo),σ表示激勵函數(shù),bj表示第j個特征組的偏置量,m為卷積核大小,表示第j個特征組與其連接的第m個神經(jīng)元的權(quán)重。表示第(i+m-1)個數(shù)據(jù)的第j維特征。
池化層采用最大池化策略[10]的思想進行特征選擇,池化過程為
其中:R為池化層大小,T為池化步長。
采用Softmax[11]來進行人員室內(nèi)運動狀態(tài)分類。Softmax位于卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型的最頂端,從原始的神經(jīng)網(wǎng)絡(luò)得到的輸出矩陣為
其中:l表示最后一個神經(jīng)網(wǎng)絡(luò)層中的單元數(shù)。Softmax計算公式為
其中:yi′為第i類結(jié)果的置信度[12],最后得到結(jié)果置信度最高的下標(biāo)為人員室內(nèi)運動狀態(tài)的識別結(jié)果。
為了取得最佳的識別效果,需要利用梯度下降法[13-14]對神經(jīng)網(wǎng)絡(luò)的參數(shù)進行不斷更新,使最后識別準(zhǔn)確度達到最優(yōu)。梯度下降法公式為
式中,E表示損失函數(shù),表示非線性映射函數(shù),其等于等于
文中源數(shù)據(jù)由16位學(xué)生使用Huawei Mate8采集得到。傳感器數(shù)據(jù)包括三軸的加速度傳感器、陀螺儀、磁力傳感器、重力傳感器和單軸的氣壓傳感器。具體參數(shù)見表1。
表1 智能手機傳感器參數(shù)
文中包括靜止、步行、上下樓梯、上下電梯、跑步7類運動狀態(tài),共采集數(shù)據(jù)36萬筆,其中靜止數(shù)據(jù)8萬筆,步行數(shù)據(jù)7萬筆,上下樓梯數(shù)據(jù)各5萬筆,上下電梯數(shù)據(jù)各2.5萬筆,跑步數(shù)據(jù)6萬筆,采樣頻率均為50 Hz。
卷積神經(jīng)網(wǎng)絡(luò)識別模型中每層的卷積核數(shù)量選取是網(wǎng)絡(luò)性能測試的重要參數(shù),通過不斷調(diào)整參數(shù)值從而獲得更好的網(wǎng)絡(luò)模型。假設(shè)其他參數(shù)默認(rèn)為最優(yōu)參數(shù)時,不同卷積核數(shù)對于最終識別率的影響如圖3所示。
圖3 不同卷積核下識別率
圖3中可以看出當(dāng)?shù)诙訁?shù)與其他參數(shù)最優(yōu)時,第一層中卷積核數(shù)在逐漸增加的情況下,運動狀態(tài)的識別率在卷積核數(shù)為128時達到最好值為89.34%,越往后識別率越低,分析實驗流程和原理可知,此時卷積核過多,出現(xiàn)了過擬合的情況。所以選擇128作為第一卷積層的核數(shù)值。當(dāng)進行第二層卷積計算時,隨著卷積核數(shù)的增加,運動狀態(tài)識別率先增加后下降。根據(jù)神經(jīng)網(wǎng)絡(luò)卷積原理可知,越復(fù)雜的特征信息越靠近底層,每上升一層,將會在原來的特征值中再次提取細節(jié)特征。在確定第一卷積層為128的情況下,第二層的卷積核數(shù)應(yīng)小于128,并且當(dāng)識別率達到極值時即為最佳的卷積核數(shù)。由圖3可知第二層卷積核數(shù)為64時獲得了最好的識別效果。
該實驗中也加入了數(shù)據(jù)是否進行歸一化的準(zhǔn)確率測試,當(dāng)確定了上述的最優(yōu)參數(shù)后,將沒有歸一化的數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)運動狀態(tài)識別模型中,獲得了45.34%的識別率。將歸一化數(shù)據(jù)輸入模型中最終獲得了89.34%的識別率。由此看出數(shù)據(jù)的歸一化在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中也具有非常重要的意義。
為了驗證該方法的性能,采用KNN、DT、SVM、LSSVM和SAE算法與該方法做對比分析。圖4顯示了在相同數(shù)據(jù)下的實驗結(jié)果(該方法簡寫為AIMB)。如圖4所示,相比于其他機器學(xué)習(xí)算法,面向多層建筑的人員室內(nèi)運動狀態(tài)識別方法在識別性能上顯著提升,獲得了最高的89.34%的識別率,與現(xiàn)在性能最好的SAE算法相比提高了4%,與在分類上性能突出的SVM算法相比提高了21%。
不同識別模型下不同運動狀態(tài)下的運動狀態(tài)識別率如圖5所示。
圖4 模型識別率對比
圖5 不同運動狀態(tài)識別率
實驗表明,該方法與其他傳統(tǒng)算法相比下,不同運動狀態(tài)識別率有較大的提高。上下樓梯,上下電梯四種運動狀態(tài)識別效果顯著提高,分別達到了74.56%、73.42%、78.66%、82.25%,相比于其他模型,上下樓梯和上下電梯的識別率提高了20%。
文中提出的面向多層建筑的人員室內(nèi)運動狀態(tài)識別方法能夠有效地識別在多層建筑內(nèi)人員室內(nèi)運動狀態(tài)。一方面算法中融入的氣壓傳感器數(shù)據(jù)可以有效反映人員在垂直方向上運動狀態(tài)的特征,提升了識別的準(zhǔn)確率。另一方面,文中使用的滑窗理論有效地提取了傳感器數(shù)據(jù)動態(tài)時序特征,提高了運算與識別效率。未來筆者將致力于研究多人運動狀態(tài)識別的方法使得運動狀態(tài)識別能夠更廣泛的運用到實際中。