孫恩澤 李宇昊
【摘 要】 隨著可穿戴智能設備走進千家萬戶,利用可穿戴智能設備進行人類識別在大數(shù)據和云計算領域有著廣泛應用前景。本文提出了一種基于長短時記憶(LSTM)型的循環(huán)神經網絡(RNN)識別方法,在標準數(shù)據集PAMAP2上構建模型進行實驗評估,取得了良好的準確率。
【關鍵詞】 深度學習 可穿戴智能設備 長短時記憶(LSTM)
1 研究背景
由于可穿戴智能設備具有價格便宜、攜帶方便、不受場地限制等優(yōu)點,在人們日常生活和健身運動中應用的越來越廣泛。并且可穿戴智能設備含有加速度計、陀螺儀、重力感應儀器等傳感器,可以與傳統(tǒng)基于視覺的運動識別方法在實際應用中互為補充,基于傳感器的人體運動識別已經被廣泛應用于體育競技,人體體力研究測量,智能家居系統(tǒng),老人和兒童監(jiān)護領域等。
2 LSTM型循環(huán)神經網絡
長短期記憶循環(huán)神經網絡,通常也被LSTM,是一種由 Sepp Hochreiter 和Jürgen Schmidhuber在提出的一種特殊循環(huán)神經網絡[1]。 LSTM擁有三個“門”結構的神經網絡結構?!斑z忘門”的可以讓循環(huán)神經網絡根據當前的輸入、上一時刻狀態(tài)個上一時刻輸出共同決定哪一部分記憶需要遺忘?!拜斎腴T”會根據、和決定那些部分進入當前時刻的狀態(tài)?!拜敵鲩T”來控制最后信息的輸出。
3 實驗驗證
3.1 數(shù)據收集
本文引用是一個由加州大學歐文分校提出的有關身體運動的公開數(shù)據集——PAMAP2。其對被要求進行12項日常生活的9個參與者進行了數(shù)據記錄,包括家庭活動和各種各樣的活動(散步,跑步,踢足球等)。最終的數(shù)據是52維度的[2]。
3.2 數(shù)據預處理
因為原始數(shù)據會包含噪音,無效數(shù)據和失蹤樣本,所以對數(shù)據預處理是不可或缺的。在真正進行訓練之前,對PAMAP2數(shù)據集進行了如下處理:移除時間戳、移除方向信息、移除過渡狀態(tài)、估計缺失值、數(shù)據分割、數(shù)據歸一化等。
3.3 構建LSTM型循環(huán)神經網絡
我們使用谷歌推出的TensorFlow開源深度學習平臺來構建所需的LSTM循環(huán)神經網絡模型。構建的LSTM循環(huán)神經網絡模型分為輸入層、LSTM層、dropout層、輸出層。TensorFlow 搭建模型中的主要訓練參數(shù)包括輸入層到隱藏層的權重和偏斜、LSTM單元 中 3 個門的權重和偏斜、以及邏輯回歸層的權重和偏斜。
3.4 度量標準
由于各個運動的樣本數(shù)較為均衡,可以采用準確率(accuracy)來評估模型最終的識別效果:
其中,者被正確識別的樣本數(shù),指樣本總量。
3.5結果分析
在訓練LSTM環(huán)神經網絡前要先把數(shù)據分為訓練數(shù)據和驗證數(shù)據。前者用于訓練 LSTM循環(huán)神經網絡以確定權值和閾值,后者用于驗證其經過訓練后的分類效果,兩者比例為8:2。
通過使用GPU訓練100次模型后得到的訓練集和驗證集的輸出如表 1所示。
從表2中我們看出,模型在8個不同的實驗對象的訓練集和驗證集上表現(xiàn)良好,準確率普遍在90%以上。通過實驗充分證明基于LSTM型循環(huán)神經網絡的識別模型對運動時間序列數(shù)據具有良好的分類預測能力。
4 結語
本文提出了一種基于LSTM型循環(huán)神經網絡的人體運動識別方法,相對于傳統(tǒng)的算法,能夠自動提取特征進行學習,并且在標準公開數(shù)據集上進行了驗證,取得了良好的識別準確度。雖然深度學習目前普遍存在黑箱問題,缺乏可解釋性,無法在出現(xiàn)錯誤之后根據輸入追蹤出錯的原因,但鑒于人體運動識別屬于低風險任務,即使發(fā)生錯誤,也不會向無人汽車、醫(yī)療手術一樣造成無法挽回的后果,以此來看將該算法應用在人體運動識別領域還是具有實際意義的。
【參考文獻】
[1] Hochreiter S, Schmidhuber J. Long Short-Term Memory[J]. Neural computation, 1997, 9(8):1735-1780.
[2] Reiss A, Stricker D. Introducing a New Benchmarked Dataset for Activity Monitoring[C]// International Symposium on Wearable Computers. IEEE Computer Society, 2012:108-109.