徐 偉,姜羅羅
(溫州大學(xué)數(shù)理與電子信息工程學(xué)院,浙江溫州 325035)
大腦對身體的其它器官集中控制,控制著人類的行為活動,本身也在連續(xù)不斷地發(fā)生變化.大腦通過產(chǎn)生肌肉活動的模式和驅(qū)動被稱為激素的化學(xué)物質(zhì)的分泌而作用于身體其它部位,這種集中控制可以對環(huán)境變化做出快速而協(xié)調(diào)的反應(yīng).人體由各個器官系統(tǒng)組成,人體的機能會受到器官的影響,尤其是大腦,它的脆弱性會隨著年齡的增長而迅速增加,并且有很多的臨床表現(xiàn).腦電圖(Electroencephalogram,EEG)是一種記錄大腦活動的電生理監(jiān)測方法.
大腦活動是幾個大腦區(qū)域之間的各種相互作用的動態(tài)過程[1],它是由隨機和確定性過程組成的[2].非線性動態(tài)腦電圖(EEG)活動的量化是理解大腦隨著老化而發(fā)生的活動模式變化的一個有效方法[2-3].腦-機接口(BCI)系統(tǒng)為人類大腦和外部設(shè)備提供溝通橋梁和控制渠道,用于腦電行為分析.在大腦年齡層面,Pierce T W等人檢測了EEG因子結(jié)構(gòu)的年齡差異,發(fā)現(xiàn)老年人的EEG信號記錄比年輕人的產(chǎn)生了更多的因子[4].張夢夢利用EEG技術(shù)收集12名老年人和12名年輕人的靶刺激 EEG信號,分析了老年人和年輕人視聽覺整合加工過程中的差異,其結(jié)論為,整合成分的年老化差異在 alpha頻段最顯著[5].此外,杜飛等人通過多尺度符號熵分析法對少年和中年beta腦電信號進行區(qū)分,發(fā)現(xiàn)隨著尺度的增加,少年的符號序列熵均高于中年[6].在研究方法層面,張夢使用深度學(xué)習(xí)方法對不同年齡的EEG腦電信號進行識別[7],Gaudreau H等人研究了受試者從兒童到中年不同年齡段的NREM睡眠腦電圖,結(jié)果表明兒童和中年人的NREM睡眠腦電圖信號主要變化并不僅限于慢波活動(SWA),而且還包含theta、alpha、sigma和beta頻率波段[8].在信號表征層面,Wang等人提出了一個用于癲癇發(fā)作檢測的分層腦電分類系統(tǒng),該系統(tǒng)主要使用小波包系數(shù)表示原始腦電信號,并使用基于最佳基的小波包熵方法進行特征提取,對獲得信號用機器學(xué)習(xí)方法進行分類,準(zhǔn)確率很高[9].我們從大腦年齡、研究方法、信號表征等三個層面討論分析了不同年齡段的大腦通過EEG顯示出來的腦電信號存在的明顯差異.
如何提取腦電信號的相關(guān)特征來表征腦狀態(tài),實現(xiàn)對不同腦力工作的正確識別是目前很多研究者關(guān)注的問題之一.如何快速、可靠地提取 EEG信號特征是精確分類和翻譯腦電信號任務(wù)的關(guān)鍵因素.近年來,提取不同腦電信號特征的方法很多,如功率譜估計、AR模型[10-11]和小波變換[12]等.通過功率譜估計提取波段能量需要確定主體特定的頻率波段,AR模型需要確定模型的適當(dāng)順序,小波分析需要選擇適當(dāng)?shù)哪感〔ǎ虼?,為了提取可以最好地反?yīng)不同的行為特征,本文提出了一種功率譜熵(Power Spectral Entropy,PSE)的腦電波年齡特征提取方法.由于不同年齡的腦電功率譜熵的腦電信號特征存在差異,所以通過對不同年齡的功率譜熵信號進行分類,能夠獲得較好的分類效果.基于香農(nóng)信息理論的PSE是一個不確定系統(tǒng)的復(fù)雜性度量指標(biāo),它對非線性動態(tài)的變化具有很好的計量效果,并且只需要很少的數(shù)據(jù)就能夠表征受試者的行為決策特征,所以該方法非常適合用于EEG腦電信號的分析[13-14].
目前已有很多研究者提出,可以使用多種信息熵(小波熵、近似熵和功率譜熵等)方法去提取腦電信號,然后再使用機器學(xué)習(xí)方法對具有信息熵特征的 EEG信號進行分類,然而,目前很少有研究人員去探索研究腦電波在不同年齡之間的差異,基于此,本文使用傅里葉變換方法計算腦電信號的頻域信息,并且計算腦電波年齡信號的傅里葉成分的功率譜密度和功率譜熵,最后,使用Logistic Regression(LR)和XGBoost等機器學(xué)習(xí)分類方法[15]得到功率譜熵數(shù)據(jù)集(二分類:年輕人類別為1,中老年人類別為0).
傅里葉變換(Fast Fourier Transform,F(xiàn)FT)是計算序列的離散傅里葉變換(Discrete Fourier Transform,DFT).傅里葉分析把原始的腦電波信號從時域轉(zhuǎn)變到可表示的頻域[16].假設(shè)原始腦電信號序列是定義 x0, … ,為N個點的長序列,這里序列長度是700(反應(yīng)靶刺激前后的時間范圍為-199 – 500 ms),則DFT的公式如下:
其中Xk是計算得到的傅里葉成分,共有N個輸出.通過傅里葉成分計算功率譜密度(P):
其中 Pk是計算得到的功率譜密度,共有N個輸出.
將 Pk按總的譜功率進行歸一化后得到功率譜密度分布函數(shù)為:
其中pki表示總共N個輸出中的第i個功率譜密度.
若用一個隨機變量X表示信息熵系統(tǒng)的狀態(tài),X的取值假設(shè)為:
對應(yīng)的取值概率為:
且:
則該系統(tǒng)的信息熵表示為:
因此,計算功率譜熵通過把式(3)代入式(7)所得.
1.2.1 XGBoost方法
為了區(qū)分年輕人和中老年人的功率譜熵腦電波信號,本文使用XGBoost分類器[15],XGBoost也稱為Extreme Gradient Boosting,是從梯度提升算法的概念衍生出來的一個有監(jiān)督的可擴展的樹形提升算法[17].與梯度提升算法相比,XGBoost提出以正則化的形式來防止模型過擬合,以推動提升樹算法實現(xiàn)更好性能的計算資源限制的工程目標(biāo).
XGBoost模型是一組分類和回歸樹(CART)的集成,每棵樹都有葉子和相應(yīng)的分數(shù).集成樹的最終結(jié)果是所有個體樹的總和.對于K′樹集成模型的預(yù)測輸出:
XGBoost的目標(biāo)函數(shù)包括損失函數(shù)和正則化.損失函數(shù)評估每個真實類別yi和診斷類別y?i的差異,損失函數(shù)如交叉熵(Cross-Entropy),邏輯斯特(Logistic)和均方誤差等.正則化是XGBoost最突出的貢獻,如果模型越復(fù)雜,它的懲罰就越大.
目標(biāo)函數(shù)定義如下:
正則化項有利于提供簡單的模型結(jié)構(gòu)和函數(shù).更具體地說,第一項Ω,懲罰樹的復(fù)雜結(jié)構(gòu)(葉子越少則Ω越小),然而,第二項懲罰項則懲罰單棵樹過重,以防失去平衡的樹去支配模型.因此,第二項有利于平滑學(xué)習(xí)樹的權(quán)重,以避免過擬合.
1.2.2 特征重要性
不同于使用特征向量計算診斷和歷史日之間的相似性,梯度提升構(gòu)建了提升樹以智能的方式獲得特征分數(shù),從而表明了每個特征對訓(xùn)練模型的重要性.如果一個特征在提升樹中對關(guān)鍵決策越重要,那么它的得分就越高,算法主要通過“Gain(增益)”、“Frequency(頻率)”和“Cover(覆蓋)”來計算其重要性[18].Gain是樹分支特征重要性的主要參考因子,F(xiàn)requency是Gain的一個簡單版本,它是所有構(gòu)造樹的特征數(shù)量,Cover是特征觀測的相對值.本文中,特征重要性為“Gain”.假設(shè)單棵決策樹為T,Loh W Y等人[19]提出:)
每個分類器特征Xl都有一個重要性分數(shù),決策樹有J-1個內(nèi)部節(jié)點,并且通過分類特征Xl將該區(qū)域每個節(jié)點t處劃分成兩個子區(qū)域.計算J-1個節(jié)點的特征Xl的重要性平方值并求和,選擇它作為分類特征.加和的M棵樹的重要性計算公式如下:
公式(12)是對M 棵樹的重要性計算,而公式(11)是對單棵決策樹的計算.
特征的重要性取決于當(dāng)這種特征被隨機噪聲取代時,分類性能是否發(fā)生顯著變化.而XGBoost算法中帶有特征重要性度量,XGBoost算法訓(xùn)練過程中,可以得到每個特征如何,有助于診斷性能.
2.1.1 實驗流程
本次實驗中,選擇了18個健康的受試者,其中6女12男.根據(jù)文獻[4-6],可以定義小于30歲的受試者為年輕類(共9人,8男1女,男的年齡分別為20歲、25歲、26歲、26歲28歲、28歲、29歲、30歲,女的年齡為25歲),大于45歲的受試者為中老年類(共9人,4男5女,男的年齡分別為48歲、48歲、53歲、63,女的年齡分別為46歲、46歲、50歲、50歲、54歲).本文的目的是通過功率譜熵提取受試者的腦電波特征得到功率譜熵的數(shù)據(jù)集并且用 XGBoost分類方法區(qū)分年輕類和中老年類的腦電波,此外用XGBoost特征選擇方法對數(shù)據(jù)集的特征重要性進行排序,實驗流程如圖1所示.原始信號收集過程:1)EEG信號的采樣率設(shè)置為1 000 Hz,共有36個通道,即36個特征;2)在整個實驗過程中,受試者需要一直穿戴電極帽,同時,受試者需要根據(jù)電腦上的提示做出反應(yīng)選擇,做出選擇的代碼會傳輸?shù)搅硗庖慌_電腦上的記錄軟件上,并且保存下來.
圖1 決策實驗流程圖.Fig 1 The Experiment Flow Diagram of Decision-making (DM)
2.1.2 數(shù)據(jù)描述
通過決策實驗獲得的原始腦電信號需要做分析處理:1)使用記錄軟件預(yù)處理,基線校準(zhǔn)、濾波、直流漂移預(yù)調(diào)和去除眼電和偽跡等;2)為了能夠覆蓋研究成分的潛伏期,當(dāng)靶刺激出現(xiàn)時,原始腦電信號保留刺激前后-199 – 500 ms的時間序列數(shù)據(jù);3)通過FFT方法把原始腦電信號的時域信號變換到頻域信息,從而獲得功率譜密度成分,然后計算功率譜概率分布,最后計算得到功率譜信息熵,功率譜信息熵數(shù)據(jù)集用來作為XGBoost分類器的輸入數(shù)據(jù)集.
分類數(shù)據(jù)集中共有36個特征,表1是這36個特征在大腦空間的具體位置描述.原始腦電信號共有36.5萬左右的數(shù)據(jù)樣本,通過功率譜熵特征提取后的數(shù)據(jù)集中共有553個樣本,其中295個是正類,即年輕類,標(biāo)記為1,258個是負類,即中老年類,標(biāo)記為0.553個樣本按照20%的比例劃分為測試集和訓(xùn)練集,訓(xùn)練集442個,測試集111個.
為了估計XGBoost和LR兩個分類模型的性能,本文使用了四個模型性能評價標(biāo)準(zhǔn):Accuracy(ACC)、Precision、Area under the receiver operating characteristic(ROC)curve(AUC)和F1-score.表2給出了算法性能的混淆矩陣.在表2中,結(jié)合我們的數(shù)據(jù)集定義如下:TP是把年輕類診斷為年輕類;TN是把中老年類診斷為中老年類;FP是把中老年類診斷為年輕類;FN是把年輕類診斷為中老年類.
根據(jù)混淆矩陣,性能評價標(biāo)準(zhǔn)計算如下:
在分析處理原始腦電信號之前,對年輕人和中老年人的腦電信號可視化,如圖2所示.從18個受試者中隨機選擇了三個不同的年輕人和中老年人,比較發(fā)現(xiàn),在做決策實驗時,年輕人產(chǎn)生的電壓值普遍低于中老年人的,這表明中老年人在受到靶刺激時腦電信號比年輕人的波動更大.
圖2 年輕人和中老年人原始EEG信號對比圖Fig 2 The Comparison Diagram of Original EEG Signal Between the Young and the Middle-aged or the Elderly
在分析年輕人和中老年人的原始腦電信號后,發(fā)現(xiàn)年輕人和中老年人在行為決策時所產(chǎn)生的腦電波存在著明顯差異.為了更好地分析腦電時間序列信號,我們使用FFT方法把原始信號轉(zhuǎn)變到頻域,并計算其功率譜熵,獲得功率譜熵數(shù)據(jù)集.同時,選擇機器學(xué)習(xí)中常見的泛化能力強的兩種分類器(LR和XGBoost)區(qū)分年輕人和中老年人的功率譜熵數(shù)據(jù)集.在計算模型分類精度之前,先對這兩個模型進行調(diào)參操作,在獲得最佳參數(shù)后,再計算模型區(qū)分功率譜熵數(shù)據(jù)集的分類精度.為了比較兩個模型在功率譜熵數(shù)據(jù)集的分類性能,本文使用如表3所示的5種模型評價標(biāo)準(zhǔn).從表3可以明顯看出,XGBoost的ACC為91%,比LR的高了7.22%.比較其它四個評價指標(biāo),可知XGBoost模型比LR能更準(zhǔn)確地區(qū)分年輕人和中老年人的腦電波.因此,從整體上看,對于功率譜熵數(shù)據(jù)集XGBoost比LR模型有更好的區(qū)分能力和泛化能力.
表3 LR和XGBoost分類器的不同評價標(biāo)準(zhǔn)Table 3 The Different Evaluation Criterion with LR and XGBoost Classifiers
LR和XGBoost分類器的受試者工作特征曲線(ROC)如圖3所示,圖中橫坐標(biāo)表示分類器錯認為正類的負實例占所有負實例的比例,縱坐標(biāo)表示分類器識別出正實例占所有正實例的比例.從圖3中可以發(fā)現(xiàn),XGBoost的ROC比LR的更接近左上角,所以 XGBoost曲線下的面積比 LR的要大.因此,總體上說,XGBoost的分類性能要優(yōu)于LR模型的.
為了分析功率譜熵數(shù)據(jù)集的特征重要性,本文提出使用XGBoost增益方法計算數(shù)據(jù)集的特征重要性,并且以其重要性從大到小排序,如圖4所示,可以看出得分最高的兩個特征分別是C3和FC4.結(jié)合表1可發(fā)現(xiàn)年輕人和中老年人在做行為決策時,在大腦中央?yún)^(qū)域和大腦的顳位置處他們的反應(yīng)差異較大,而分類器更容易在這些特征區(qū)域?qū)?shù)據(jù)集做出更好的分類.
圖3 受試者工作特征曲線(ROC)Fig 3 The Receiver Operating Characteristic Curve (ROC)
圖4 特征重要性排序圖Fig 4 The Ordination Diagram of Weight of Feature
此外,為了更好地說明特征重要性在分類過程中所起的重要作用,給出了前兩個得分最高的特征C3和FC4下的功率譜熵數(shù)據(jù)樣本的分類過程,如圖5所示.對比兩幅圖可以看出,右邊的分類界面能更好地區(qū)分正負樣本,而LR模型雖然將大部分正負樣本通過一條直線區(qū)分開來,但也有很多正樣本跑到負樣本中和負樣本跑到正樣本中的現(xiàn)象,這也是LR模型分類精度不是很高的原因.LR模型考慮了所有樣本,試圖把所有樣本區(qū)分開,顯然這是不現(xiàn)實的.對比XGBoost的分類界面,就會發(fā)現(xiàn)有很多中小的分類界面,不限制與一條直線,而是多條直接交叉在一起,這樣就會出現(xiàn)很多的分類界面,從而提升了其分類精度.顯然,不管從精度還是從分類過程來看,在診斷腦電波年齡時XGBoost比LR的效果更好.
圖5 腦電波年齡的模型分類過程圖Fig5 The Procedure Chart of Model Classification for Brain
本文利用功率譜信息熵方法提取年輕人和中老年人在做決策實驗時所產(chǎn)生的腦電信號特征,并用LR和XGBoost機器學(xué)習(xí)分類方法對提取到的功率譜信息熵數(shù)據(jù)集進行分類,診斷大腦年齡,并使用XGBoost增益指標(biāo)對數(shù)據(jù)特征重要性進行分析.結(jié)果表明,在診斷年輕人和中老年人的行為決策腦電波時,XGBoost模型具有精度高、區(qū)分度高和泛化能力強等優(yōu)點.在診斷不同年齡的腦電波時,增加樣本數(shù)據(jù)集、信號特征提取、算法改進和提升精度是我們接下來的工作.