熊文滔 鄭建立
關(guān)鍵詞:跌倒檢測(cè);擴(kuò)展孤立森林;個(gè)性化;異常檢測(cè);可穿戴設(shè)備
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A
1引言(Introduction)
根據(jù)國(guó)家統(tǒng)計(jì)局2021 年發(fā)布的第七次全國(guó)人口普查結(jié)果顯示:全國(guó)人口共14.11億,其中60歲以上的人口為2.64億,大約占總?cè)丝诘?8.7%,與2010 年相比上升了5.44%[1],中國(guó)正逐步邁入老齡化社會(huì)。在過(guò)去的幾年里,所有與老年人健康相關(guān)的研究都得到了極大的關(guān)注,跌倒檢測(cè)就是其中的一個(gè)熱門的研究領(lǐng)域。隨著年齡的增長(zhǎng),老年人的身體機(jī)能、認(rèn)知能力和感官功能逐漸衰退,因此極易發(fā)生跌倒事件。據(jù)統(tǒng)計(jì),約1/3的老年人每年會(huì)發(fā)生一次意外跌倒[2],跌倒也成為老年人因傷致死的重要原因[3]。如果老年人在跌倒后能盡早地被發(fā)現(xiàn)并治療,將對(duì)其后期的康復(fù)有很大的幫助[4]。因此,設(shè)計(jì)一個(gè)準(zhǔn)確且高效的跌倒檢測(cè)算法十分必要。
2研究現(xiàn)狀(Research status)
目前的跌倒檢測(cè)算法主要分為三大類:基于視頻的跌倒檢測(cè)算法、基于環(huán)境傳感器的跌倒檢測(cè)算法和基于可穿戴設(shè)備的跌倒檢測(cè)算法?;谝曨l的跌倒檢測(cè)算法主要依靠安裝在屋內(nèi)或者室外的攝像頭對(duì)老年人的行為圖像數(shù)據(jù)進(jìn)行采集,并通過(guò)機(jī)器視覺(jué)的方法判斷老人出現(xiàn)的行為是否為跌倒行為[5]。該算法的優(yōu)點(diǎn)是準(zhǔn)確率高,但是運(yùn)算開(kāi)銷大,有應(yīng)用盲區(qū)?;诃h(huán)境傳感器的跌倒檢測(cè)主要是指在老年人的活動(dòng)場(chǎng)所內(nèi)安裝紅外線[6]、超聲波[7]等環(huán)境傳感器,通過(guò)判斷老年人周圍環(huán)境狀況的變化進(jìn)而判斷其是否跌倒。該算法對(duì)設(shè)備使用者的隱私侵犯風(fēng)險(xiǎn)較小,但由于需要在環(huán)境中安裝大量的傳感器,因此系統(tǒng)的便捷性不夠,使用場(chǎng)景受限?;诳纱┐髟O(shè)備的跌倒檢測(cè)算法是指通過(guò)穿戴在身體某個(gè)部位的傳感器收集原始數(shù)據(jù)后,使用跌倒檢測(cè)算法進(jìn)行處理,并判斷設(shè)備使用者是否跌倒。與基于視頻和環(huán)境傳感器的跌倒檢測(cè)算法相比,可穿戴設(shè)備易安裝、成本低,并且受應(yīng)用場(chǎng)景限制小。
基于可穿戴傳感器的跌倒監(jiān)測(cè)算法按照檢測(cè)方法的不同可以分為兩大類:閾值法和機(jī)器學(xué)習(xí)法。閾值法是通過(guò)比較特征值和選定閾值的大小關(guān)系判斷是否出現(xiàn)跌倒行為。這種方法的漏報(bào)誤報(bào)率較高,檢測(cè)結(jié)果不準(zhǔn)確?;跈C(jī)器學(xué)習(xí)的算法將跌倒檢測(cè)看作一個(gè)分類問(wèn)題,使用機(jī)器學(xué)習(xí)算法構(gòu)建跌倒檢測(cè)模型。季祥[8]基于慣性傳感器計(jì)算人體的俯仰角與橫滾角,結(jié)合足底壓力,利用支持向量機(jī)判斷是否出現(xiàn)跌倒行為。段美玲等[9]、趙舉等[10]利用加速度傳感器結(jié)合雙向長(zhǎng)短期記憶網(wǎng)絡(luò)算法進(jìn)行特征提取與分類判別。YACCHIREMA等[11]使用加速度計(jì)和陀螺儀數(shù)據(jù),設(shè)計(jì)了一個(gè)基于決策樹(shù)的跌倒檢測(cè)模型。雖然目前研究人員已基于可穿戴傳感器提出了多種跌倒檢測(cè)算法,但是這些算法仍然存在以下問(wèn)題:一是缺乏老年人的跌倒數(shù)據(jù)。目前,被大量使用的監(jiān)督學(xué)習(xí)算法主要針對(duì)跌倒行為進(jìn)行建模和檢測(cè),這對(duì)跌倒數(shù)據(jù)的質(zhì)量要求較高。老年人跌倒是一種高危的行為,因此在現(xiàn)實(shí)中很難獲取老年人真實(shí)的跌倒數(shù)據(jù),大部分實(shí)驗(yàn)都是采用年輕志愿者參與跌倒實(shí)驗(yàn)獲得的數(shù)據(jù)進(jìn)行訓(xùn)練,這必然導(dǎo)致實(shí)驗(yàn)結(jié)果與真實(shí)情況出現(xiàn)偏差。因此,被大量使用的監(jiān)督學(xué)習(xí)算法只是在理論上取得較好的結(jié)果,但是在實(shí)際應(yīng)用中的效果不佳。二是使用通用模型,不考慮不同個(gè)體之間的差異。由于不同人的身高、體重及行為習(xí)慣不同,即使在做出相同的跌倒動(dòng)作時(shí),也會(huì)有很大的差別[12]。圖1展示了三個(gè)志愿者模擬“走路時(shí)不小心向后滑倒”這一動(dòng)作時(shí)三軸合加速度的變化情況,其中橫軸表示時(shí)間,縱軸表示合加速度數(shù)據(jù),虛線框內(nèi)部為跌倒時(shí)采集的數(shù)據(jù)。從圖1中可以清晰地看出,不同的人在做出相同跌倒行為時(shí),加速度的極值、方差和跌倒持續(xù)時(shí)間具有很大的差異,如果忽略這些差異,那么跌倒檢測(cè)的準(zhǔn)確率很難得到保障。
為解決以上問(wèn)題,本文提出了一種基于擴(kuò)展孤立森林的跌倒檢測(cè)算法。針對(duì)老年人跌倒數(shù)據(jù)獲取困難的問(wèn)題,研究人員使用數(shù)據(jù)挖掘中的異常檢測(cè)技術(shù),將跌倒檢測(cè)看作一個(gè)二分類異常檢測(cè)問(wèn)題,使用擴(kuò)展孤立森林算法對(duì)大量易于采集的正常行為數(shù)據(jù)進(jìn)行建模,當(dāng)數(shù)據(jù)不符合正常行為數(shù)據(jù)特征的時(shí)候,即可判定出現(xiàn)跌倒行為。針對(duì)個(gè)性化適配問(wèn)題,本文使用無(wú)監(jiān)督的建模方式,為每個(gè)人采集到的正常行為序列數(shù)據(jù)建立不同的跌倒檢測(cè)模型,解決了不同個(gè)體的個(gè)性化適配問(wèn)題。本文在公開(kāi)數(shù)據(jù)集SisFall上驗(yàn)證了算法的可行性和優(yōu)越性。
3相關(guān)方法(Correlation method)
3.1擴(kuò)展孤立森林算法
孤立森林(Isolation Forest, IForest)算法是由TING等[13]提出的一種基于集成學(xué)習(xí)的無(wú)監(jiān)督異常檢測(cè)算法,其主要依賴于特征選擇和循環(huán)隨機(jī)分割;它并不是直接處理所有的數(shù)據(jù)點(diǎn),而是使用超平面對(duì)數(shù)據(jù)進(jìn)行隨機(jī)分割,這就使得其具有線性的時(shí)間復(fù)雜度以及較低的內(nèi)存需求。算法將異常數(shù)據(jù)標(biāo)記為“少數(shù)且容易被孤立”的數(shù)據(jù),即分布稀疏且離群的點(diǎn),這與跌倒數(shù)據(jù)發(fā)生少且與正常行為數(shù)據(jù)差異較大的特征相符。
盡管標(biāo)準(zhǔn)的孤立森林算法的計(jì)算效率很高,但由于其切割超平面是軸平行的,這就導(dǎo)致在具有多個(gè)聚類中心的數(shù)據(jù)集中,算法會(huì)因?yàn)榍懈顥l件的重疊而難以檢測(cè)到局部異常點(diǎn),從而導(dǎo)致模型的檢測(cè)精度下降[14]。HARIRI等[15]提出了一種擴(kuò)展孤立森林(Extended Isolation Forest, EIF)算法,其使用具有隨機(jī)斜率的超平面替代軸平行的超平面,克服了標(biāo)準(zhǔn)孤立森林的局限性。
在一個(gè)二維空間中的EIF算法切割方式如圖2所示。對(duì)于圖2(a)中的異常點(diǎn)x0,只需要少數(shù)幾次切割就能到達(dá)二叉樹(shù)的葉子節(jié)點(diǎn),而對(duì)于圖2(b)中的正常點(diǎn)x1,則需要更多的切割次數(shù)。
從圖5中可以看出,由于個(gè)體存在差異性(身高、體重、行為習(xí)慣等),所以使用個(gè)性化模型的分類結(jié)果要好于使用非個(gè)性化的模型。具體來(lái)說(shuō),平均準(zhǔn)確率從91.89%提升到了96.76%,平均敏感度從93.84%提升到了97.91%,平均特異度從88.44%提升到了94.72%。
表4展示了其他常見(jiàn)的無(wú)監(jiān)督異常檢測(cè)算法與本文使用的EIF算法在跌倒檢測(cè)模型中的性能對(duì)比。從表4可以看出,在跌倒檢測(cè)任務(wù)中,EIF算法的準(zhǔn)確率、敏感度和特異度均是最高的。
5 結(jié)論(Conclusion)
本文提出了一種基于擴(kuò)展孤立森林算法的跌倒檢測(cè)模型,利用佩戴在人體腰部的三軸加速度傳感器采集人的日常活動(dòng)數(shù)據(jù),使用濾波算法對(duì)原始數(shù)據(jù)進(jìn)行降噪處理,通過(guò)滑動(dòng)窗口進(jìn)行特征提取,對(duì)每一個(gè)人提取好的特征數(shù)據(jù)使用無(wú)監(jiān)督的EIF算法進(jìn)行個(gè)性化建模。解決了傳統(tǒng)監(jiān)督學(xué)習(xí)算法獲取老年人跌倒數(shù)據(jù)困難以及個(gè)性化適配的問(wèn)題。該模型在公開(kāi)數(shù)據(jù)集SisFall上進(jìn)行實(shí)驗(yàn),驗(yàn)證了算法的有效性,同時(shí)與其他算法相比具有更高的識(shí)別精度。
作者簡(jiǎn)介:
熊文滔(1998-),男,碩士生.研究領(lǐng)域:數(shù)據(jù)挖掘.鄭建立(1965-),男,博士,副教授.研究領(lǐng)域:醫(yī)學(xué)信息系統(tǒng)與集成技術(shù).