林志榕
(中國科學(xué)院福建物質(zhì)結(jié)構(gòu)研究所 泉州裝備制造研究所,福建 泉州 362216)
作為僅次于阿爾茨海默病的第二大神經(jīng)退變性疾病和繼腫瘤、心腦血管病之后的中老年“第三殺手”,帕金森?。≒arkinson"s Disease,PD)被稱為“不死的癌癥”,主要癥狀表現(xiàn)為4個(gè)運(yùn)動(dòng)障礙癥狀:震顫、運(yùn)動(dòng)遲緩、肌肉僵直和姿態(tài)步態(tài)異常[1-2]。其中,震顫和運(yùn)動(dòng)遲緩作為帕金森病最主要的運(yùn)動(dòng)癥狀,嚴(yán)重影響患者的日常工作和生活質(zhì)量。
統(tǒng)一帕金森病評分量表(Unified Parkinson"s disease rating scale,UPDRS)是當(dāng)前臨床上診斷帕金森病情程度等級使用最多的量表,其根據(jù)癥狀嚴(yán)重程度分為0~4分的5個(gè)等級,0分為正常,4分為最嚴(yán)重[3]。然而,量表的使用受限于醫(yī)生的臨床經(jīng)驗(yàn)和主觀判斷,具有個(gè)體差異性,而且對于癥狀不明顯的患者,量表評分方式不夠準(zhǔn)確,特別是缺乏診斷經(jīng)驗(yàn)的年輕醫(yī)生,存在一定局限性。因此,帕金森病運(yùn)動(dòng)癥狀嚴(yán)重程度的量化評估至今仍是PD療效反饋和病情監(jiān)測中的一個(gè)難題。
隨著可穿戴傳感器技術(shù)的發(fā)展,國內(nèi)外的一些科研人員已經(jīng)基于傳感器和計(jì)算機(jī)系統(tǒng)來量化評價(jià)帕金森病的運(yùn)動(dòng)癥狀[4-6]。在評估過程中,帕金森病患者需要演示量表中規(guī)定的若干評估動(dòng)作,并采用運(yùn)動(dòng)傳感器、光學(xué)系統(tǒng)、電磁跟蹤系統(tǒng)和肌電檢測儀等多種方式來采集相關(guān)動(dòng)作的數(shù)據(jù),在此基礎(chǔ)上進(jìn)行數(shù)據(jù)處理提取相關(guān)癥狀的量化指標(biāo),從而評估PD運(yùn)動(dòng)癥狀的嚴(yán)重程度[7-9]。但目前大多數(shù)研究都局限于傳感器信號量化特征與神經(jīng)科醫(yī)生UPDRS量表評分的相關(guān)性統(tǒng)計(jì)分析,并不能直接得到運(yùn)動(dòng)癥狀的嚴(yán)重程度等級(0~4分)。
鑒于此,本文設(shè)計(jì)了一套針對帕金森病震顫與運(yùn)動(dòng)遲緩癥狀的量化評估可穿戴式系統(tǒng),通過MEMS(micro-electro-mechanicalsystems)運(yùn)動(dòng)傳感器采集患者手部的運(yùn)動(dòng)信息,并基于運(yùn)動(dòng)傳感器數(shù)據(jù)提取與震顫和運(yùn)動(dòng)遲緩癥狀嚴(yán)重程度相關(guān)的特征,作為機(jī)器學(xué)習(xí)分類器的輸入,訓(xùn)練機(jī)器學(xué)習(xí)模型,最終得到量化的震顫與運(yùn)動(dòng)遲緩癥狀嚴(yán)重程度等級(0~4分)。在機(jī)器學(xué)習(xí)模型的選擇上,本文構(gòu)建了支持向量機(jī)(Support Vector Machine,SVM)、隨機(jī)森林(Random Forest,RF)算法和K最鄰近(K-Nearest Neighbor,KNN)這3種適合于小樣本的機(jī)器學(xué)習(xí)分類算法進(jìn)行驗(yàn)證,并進(jìn)行分類精度對比,從而得到最優(yōu)的分類評估模型。該研究工作可為PD震顫與運(yùn)動(dòng)遲緩癥狀提供了一種科學(xué)有效的量化評估方法,從而輔助神經(jīng)科醫(yī)生對PD患者的運(yùn)動(dòng)癥狀進(jìn)行臨床診斷。
如圖1所示,本研究設(shè)計(jì)的PD運(yùn)動(dòng)癥狀量化檢測系統(tǒng)包括一個(gè)佩戴在用戶手腕的可穿戴設(shè)備和上位機(jī)采集軟件??纱┐髟O(shè)備由佩戴在指尖的九軸慣性測量單元(BNO055,Bosch Sensortec GmbH,德國)、手腕的數(shù)據(jù)采集芯片(ATmega1284P,AtmelⅠnc.,美國)和WiFi數(shù)據(jù)傳送芯片(ESP-8266,Espressif Systems Pte.,Ltd.,中國)構(gòu)成,并將所有模塊集成通過彈性繃帶固定。慣性傳感模塊包括一個(gè)三軸加速度計(jì)、一個(gè)三軸陀螺儀和一個(gè)三軸磁力計(jì),可獲取原始的加速度、角速度和磁場信號,也可通過內(nèi)置的九軸融合算法獲取線性加速度、歐拉角、四元數(shù)和旋轉(zhuǎn)矩陣等姿態(tài)數(shù)據(jù)。WiFi模塊將采集的原始傳感器數(shù)據(jù)發(fā)送到上位機(jī)軟件進(jìn)行下一步處理,數(shù)據(jù)采樣頻率為100 Hz。上位機(jī)軟件采用LabVⅠEW 2014(NationalⅠnstrumentsⅠnc.,美國)平臺進(jìn)行開發(fā),接收來自可穿戴設(shè)備的原始傳感器數(shù)據(jù),進(jìn)行解析和保存,并做下一步的數(shù)據(jù)處理和算法實(shí)現(xiàn)。
圖1 PD運(yùn)動(dòng)癥狀量化評估系統(tǒng)
本研究共招募45名具有顯著性震顫與運(yùn)動(dòng)遲緩癥狀(UPDRS介于1~4分之間)的PD患者和30名年齡相仿的健康人(UPDRS評分為0)參與本次試驗(yàn),受試者的基本信息見表1。參與本試驗(yàn)的帕金森病人都來自于福建醫(yī)科大學(xué)附屬協(xié)和醫(yī)院(福州)神經(jīng)內(nèi)科,這些病人都具有較為典型的運(yùn)動(dòng)障礙癥狀,包括震顫和運(yùn)動(dòng)遲緩,并由經(jīng)驗(yàn)豐富的高年資神經(jīng)科醫(yī)生進(jìn)行了UPDRS評分。對照組由身體健康且年齡與病例組相仿的30名參與者組成。
表1 參加試驗(yàn)的病人和健康人的基本情況
標(biāo)準(zhǔn)的臨床測試動(dòng)作可以提高評估的可靠性,因此本文分別采用UPDRS量表第20、21、23項(xiàng)規(guī)定的靜坐、維持手臂平舉向前和手指開合動(dòng)作測試來評估靜止性震顫、姿勢性震顫和運(yùn)動(dòng)遲緩癥狀,評估任務(wù)的具體描述見表2,實(shí)際的試驗(yàn)場景如圖2所示。參與試驗(yàn)的PD患者需要停藥12 h,保證其處于藥效減退癥狀明顯的狀態(tài)。試驗(yàn)開始前,研究人員指導(dǎo)受試者佩戴好PD運(yùn)動(dòng)癥狀量化評估可穿戴設(shè)備,并指導(dǎo)受試者按照表2所描述的動(dòng)作要領(lǐng),熟悉各癥狀的測試動(dòng)作,之后進(jìn)行正式測試,每個(gè)評估動(dòng)作采集10 s的數(shù)據(jù),同時(shí)由一名臨床經(jīng)驗(yàn)豐富的神經(jīng)科醫(yī)生對每個(gè)測試動(dòng)作進(jìn)行UPDRS量表評分。
圖2 震顫與運(yùn)動(dòng)遲緩量化評估任務(wù)
表2 癥狀評估動(dòng)作描述
1.3.1 震顫特征提取
在新版國際運(yùn)動(dòng)障礙學(xué)會(huì)統(tǒng)一帕金森病評分量表(MDS-UPDRS)中,震顫嚴(yán)重程度的評估采用線性位移來定義,而現(xiàn)有的基于慣性傳感器的帕金森震顫量化研究通常是基于角速度、原始的加速度等信息來提取量化特征參數(shù),進(jìn)而對帕金森震顫進(jìn)行評估,該種方式可能導(dǎo)致評價(jià)結(jié)果的不統(tǒng)一和偏差。原始加速度信號中包含了重力信息,線性加速度則去除了重力分量的影響,用來獲取剛體運(yùn)動(dòng)時(shí)的線性位移信息。因此,本文將基于線性加速度提取手部發(fā)生震顫時(shí)的線性位移特征,并結(jié)合角速度提取震顫發(fā)生時(shí)手指運(yùn)動(dòng)的角度信息。
靜止性震顫和姿勢性震顫的頻率范圍通常在3.5~7.5 Hz,因此,為了排除受試者在采集數(shù)據(jù)過程中因?yàn)楹粑蛘咂渌哳l運(yùn)動(dòng)引起的噪聲信號,本文采用頻率范圍為3~10 Hz的FⅠR等波紋帶通濾波器對線性加速度和角速度信號進(jìn)行濾波,在此基礎(chǔ)上提取了H1、H2、H3和H44個(gè)量化特征,具體計(jì)算方式如下
式中:aL是線性加速度矢量;ω是角速度矢量;i=1,2,…;N代表信號的離散時(shí)間。H1和H2分別表示線性加速度和角速度矢量的平方和。H3表示線性加速度向量第i次和i+1次之間差異的平方和,反映了線性加速度信號的波動(dòng)情況。wk(ξ)是角速度矢量ω(i)的快速傅里葉變換(FFT)。H4表示在3.5~7.5 Hz頻率范圍之間的角速度矢量FFT振幅的最大值。這里,H1和H3基于線性加速度進(jìn)行計(jì)算得到的,能夠表示運(yùn)動(dòng)過程中的線性位移情況;而H2和H4是通過角速度計(jì)算得到的,能夠表示運(yùn)動(dòng)過程中的旋轉(zhuǎn)情況。
1.3.2 運(yùn)動(dòng)遲緩特征提取
臨床上對運(yùn)動(dòng)遲緩癥狀的評估主要通過觀察患者做手指拍打動(dòng)作時(shí)的幅度和頻率,并根據(jù)UPDRS量表進(jìn)行評分,但該評估方式具有較強(qiáng)的主觀性,不同醫(yī)生的評估結(jié)果相差較大。因此,本文采用九軸運(yùn)動(dòng)傳感器對帕金森病患者手指拍打動(dòng)作進(jìn)行高精度運(yùn)動(dòng)跟蹤,基于運(yùn)動(dòng)傳感器融合輸出的姿態(tài)角度信息提取手指拍打動(dòng)作的角度幅度、拍打頻率及角度幅度變化情況,以此作為運(yùn)動(dòng)遲緩的量化特征參數(shù)來評估癥狀嚴(yán)重程度。
傳統(tǒng)的姿態(tài)表示方式通常為三維歐拉角,為了減少特征維度,我們采用軸-角表示方法來提取手指拍打動(dòng)作中的幅度信息。三維空間中剛體的姿態(tài)信息可用繞特定旋轉(zhuǎn)向量的角度θ來表示,這就是軸-角表示方法,而該旋轉(zhuǎn)角度θ可以寫成下式
式中:q4是四元數(shù)矢量q=[q1q2q3q4]的實(shí)部分量。θ的角度范圍為0~180°。
為了進(jìn)一步地提取與UPDRS手指開合動(dòng)作特點(diǎn)(速度、幅度和幅度波動(dòng))密切相關(guān)的特征,我們定義了3個(gè)特征參數(shù)來表示手指開合時(shí)的狀態(tài),具體包括頻率、幅度和波動(dòng)情況。
首先,通過計(jì)算10 s任務(wù)期間手指開合次數(shù)N來得到手指開合運(yùn)動(dòng)的頻率f
在手指開合動(dòng)作評估過程中,θ代表了每次手指開合的幅度范圍,在整個(gè)評估周期內(nèi),我們通過計(jì)算峰值角度的平均值φ來得到周期內(nèi)手指開合幅度,具體如下
式中:θmax和θmin代表的是在第i個(gè)手指開合周期中張合角度的波峰值和波谷值。
為了描述評估周期內(nèi)手指拍打幅度的波動(dòng)特征,本文通過計(jì)算標(biāo)準(zhǔn)差(SD)進(jìn)行描述
為了直觀上對震顫和運(yùn)動(dòng)遲緩癥狀進(jìn)行量化評估,得到癥狀嚴(yán)重程度等級(0~4分),本文基于上述提取的震顫(H1、H2、H3和H4)和運(yùn)動(dòng)遲緩特征參數(shù)(f、φ和σ|φ|)進(jìn)行分類研究,將特征參數(shù)作為分類模型的輸入變量,而醫(yī)生的UPDRS評分作為真值標(biāo)簽,建立機(jī)器學(xué)習(xí)分類模型,通過訓(xùn)練模型評估癥狀的嚴(yán)重程度等級。在分類器的選擇上,因?yàn)閿?shù)據(jù)樣本規(guī)模較小,本文分別采用了支持向量機(jī)(SVM)、K最鄰近(KNN)和隨機(jī)森林(RF)3種適合于小樣本的多分類器,通過試驗(yàn)進(jìn)行精度驗(yàn)證和對比,得到精度最高的量化評估模型。
支持向量機(jī)是一種有監(jiān)督的機(jī)器學(xué)習(xí)模型,其通過核函數(shù)將輸入?yún)?shù)映射到高維特征空間,然后采用超平面來判斷不同類別的特征。SVM本身為一個(gè)二值分類器,當(dāng)面對多類問題時(shí),需要構(gòu)造合適的多類分類器。本文處理的癥狀嚴(yán)重程度等級(0~4分)是一個(gè)五分類問題,因此通過組合多個(gè)SVM二分類器來實(shí)現(xiàn)多分類器的構(gòu)造。本文通過“一對一”(one-versus-one,OVO SVMs)方式來設(shè)計(jì)多分類器,隨機(jī)選取數(shù)據(jù)集中的2個(gè)樣本設(shè)計(jì)一個(gè)二分類的SVM分類器,因此,如果數(shù)據(jù)集中的樣本有N個(gè)類別的話,則需要設(shè)計(jì)N(N-1)/2個(gè)SVM分類器。實(shí)際對一個(gè)測試樣本進(jìn)行分類測試時(shí),則通過統(tǒng)計(jì)得票最多的類別作為測試樣本的類別。
KNN是通過測量不同特征值之間的距離進(jìn)行分類,可以采用Euclidean(歐幾里得)、Manhattan(曼哈頓)、Mahalanobis(馬氏距離)等距離用于計(jì)算。KNN算法思想是在數(shù)據(jù)集中找到與測試樣本最相似的K個(gè)樣本,假如找到的這些鄰居中大部分都?xì)w于同一個(gè)類別,那么該測試樣本則判斷為同屬一個(gè)類型。實(shí)際測試中,K的選取通常是不超過20的整數(shù),并根據(jù)實(shí)際測試效果進(jìn)行調(diào)整。
RF算法本質(zhì)上是基于決策樹算法來實(shí)現(xiàn)分類的,它的基本單元是決策樹,通過集成學(xué)習(xí)的思想將多棵樹集成隨機(jī)森林。具體做法是,通過bootstrap重采樣技術(shù),從原始樣本集中隨機(jī)重復(fù)提取樣本,生成新的訓(xùn)練樣本集來訓(xùn)練決策樹模型,然后重復(fù)生成決策樹,形成隨機(jī)森林。根據(jù)分類樹中投票數(shù)形成的分?jǐn)?shù)確定數(shù)據(jù)分類結(jié)果。單個(gè)樹的分類能力較弱,但在隨機(jī)生成多數(shù)決策樹后,測試樣本可以根據(jù)統(tǒng)計(jì)后每棵樹的分類結(jié)果選擇最可能的分類。
本文采用分類精度來評判各分類算法的性能,通過計(jì)算正確判斷類別的人數(shù)占所有參與人數(shù)的百分比來得到分類精度,而數(shù)據(jù)的真實(shí)類別則通過UPDRS量表來得到,量表評分邀請來自福建醫(yī)科大學(xué)附屬協(xié)和醫(yī)院神經(jīng)內(nèi)科具有豐富臨床診斷經(jīng)驗(yàn)的高年資醫(yī)師進(jìn)行。
為了驗(yàn)證分類算法的性能,本文采用了留一法交叉驗(yàn)證(Leave-one-out cross validation)對試驗(yàn)數(shù)據(jù)進(jìn)行測試。具體做法是,抽取數(shù)據(jù)集中的某個(gè)樣本作為測試樣本,剩余的全部數(shù)據(jù)則作為訓(xùn)練樣本,通過訓(xùn)練樣本訓(xùn)練分類算法來驗(yàn)證測試樣本的精度,直到所有的數(shù)據(jù)都被作為一次測試樣本后則結(jié)束,而最終的分類精度為所有樣本驗(yàn)證后精度的平均值。
表3給出了震顫特征參數(shù)(H1,H2,H3和H4)與臨床醫(yī)生的UPDRS評分之間的相關(guān)性分析結(jié)果。r表示相關(guān)性系數(shù),p<0.01表示統(tǒng)計(jì)結(jié)果具有明顯的顯著性。從表3可以看出,本文提取的4個(gè)特征參數(shù)均與臨床UPDRS具有高度相關(guān)性,相關(guān)性系數(shù)r都大于0.8。因此,該特征參數(shù)可以用來表示震顫嚴(yán)重程度,并作為癥狀分類模型的輸入特征,進(jìn)行算法訓(xùn)練,并得到量化的震顫等級。
表3 震顫特征參數(shù)與UPDRS評分的相關(guān)分析結(jié)果
運(yùn)動(dòng)遲緩特征參數(shù)與臨床醫(yī)生的UPDRS評分之間的相關(guān)性分析結(jié)果見表4。從皮爾遜相關(guān)系數(shù)r和相應(yīng)的p值來看,手指開合動(dòng)作頻率f和開合幅度φˉ都與量表評分有顯著的相關(guān)性(|r|>0.9,p<0.01),幅度的波動(dòng)特征σ|φ|則不存在明顯相關(guān)性(r=0.28)。因此,在分類器的輸入?yún)?shù)選擇上,本文優(yōu)選f和來構(gòu)造分類模型。
表4 運(yùn)動(dòng)遲緩特征參數(shù)與癥狀評分的相關(guān)性
表5給出了3種機(jī)器學(xué)習(xí)分類算法(SVM、KNN和RF)的測試結(jié)果對比,包括敏感性、特異性和分類精度,表中所有測試結(jié)果都是基于留一法交叉驗(yàn)證的結(jié)果。分類精度通過正確判斷類型的人數(shù)占總?cè)藬?shù)的百分比進(jìn)行計(jì)算(真值依據(jù)UPDRS量表評分),敏感性表示在患有帕金森病的參與人中,診斷正確的人所占的百分比,特異性表示在未患帕金森病的參與人中,診斷正確的人所占的百分比。從表中可以看出,3種機(jī)器學(xué)習(xí)分類模型的測試結(jié)果都比較好,敏感性、特異性和分類精度都高于90%。其中,SVM算法的分類結(jié)果最好,分類精度優(yōu)于96%,證明了該模型對于PD震顫與運(yùn)動(dòng)遲緩癥狀等級量化評估的有效性。
表5 3種機(jī)器學(xué)習(xí)分類模型的結(jié)果對比 (%)
針對帕金森病運(yùn)動(dòng)癥狀量化評估的難題,本文采用基于運(yùn)動(dòng)傳感器的可穿戴設(shè)備采集帕金森病患者手部運(yùn)動(dòng)信息,通過信號處理方法提取量化特征,并基于特征訓(xùn)練多分類算法,輸出震顫與運(yùn)動(dòng)遲緩癥狀的病情程度等級。試驗(yàn)結(jié)果表明,SVM分類模型對震顫和運(yùn)動(dòng)遲緩癥狀的嚴(yán)重程度分類準(zhǔn)確率高達(dá)96%以上,優(yōu)于KNN和RF算法,驗(yàn)證了基于運(yùn)動(dòng)傳感器和機(jī)器學(xué)習(xí)的帕金森病量化評估方法的可行性。本文提出的帕金森病運(yùn)動(dòng)癥狀量化檢測方法可以為臨床上診斷PD病情嚴(yán)重程度提供一種有效的技術(shù)輔助工具。