張軍鵬,施玉杰,蔣睿,董靜靜,邱昌建
基于腦電信號的認(rèn)知功能障礙識(shí)別與分類進(jìn)展綜述
張軍鵬1,施玉杰1,蔣睿1,董靜靜2,邱昌建3*
(1.四川大學(xué) 電氣工程學(xué)院,成都 610065; 2.中國人民解放軍海軍特色醫(yī)學(xué)中心 空勤科,上海 200052; 3.四川大學(xué)華西醫(yī)院 心理衛(wèi)生中心,成都 610041)( ? 通信作者電子郵箱qiuchangjian@wchscu.cn)
認(rèn)知功能障礙的早期檢測和及時(shí)干預(yù)對減緩病情發(fā)展至關(guān)重要。腦電(EEG)信號具有時(shí)間分辨率高、易采集等優(yōu)點(diǎn),目前已成為研究認(rèn)知疾病生物標(biāo)志物的重要工具。相較于傳統(tǒng)的生物標(biāo)志物識(shí)別方法,機(jī)器學(xué)習(xí)方法對于基于EEG信號的認(rèn)知功能障礙的識(shí)別分類的準(zhǔn)確率更高,穩(wěn)定性更好。對于近三年基于EEG信號的認(rèn)知功能障礙識(shí)別分類的相關(guān)研究,首先,從認(rèn)知功能障礙識(shí)別分類中常用的時(shí)域、頻域、時(shí)頻域結(jié)合、非線性動(dòng)力學(xué)、功能連接和腦網(wǎng)絡(luò)這五類EEG特征出發(fā),尋找更具代表性的EEG特征;其次,總結(jié)目前使用較多的支持向量機(jī)(SVM)、線性判別分析(LDA)、-近鄰(NN)和人工神經(jīng)網(wǎng)絡(luò)(ANN)等機(jī)器學(xué)習(xí)和深度學(xué)習(xí)分類方法和這些方法的性能;最后,分析各類研究中目前存在的問題,并展望此領(lǐng)域未來的研究方向,從而為后續(xù)基于EEG信號的認(rèn)知功能障礙識(shí)別分類的研究提供參考。
腦電信號;機(jī)器學(xué)習(xí);認(rèn)知功能障礙;深度學(xué)習(xí);特征提取
認(rèn)知能力指人腦加工、儲(chǔ)存和提取信息的能力,是人們成功完成活動(dòng)最重要的心理?xiàng)l件,主要包括記憶、注意、思維和想象能力等。隨著年齡增長,老年人的認(rèn)知能力逐漸下降,極易患上認(rèn)知功能障礙疾病,尤其是阿爾茲海默癥(Alzheimer’s Disease, AD)的概率大幅增加。輕度認(rèn)知功能障礙(Mild Cognitive Impairment, MCI)指思維、記憶等認(rèn)知能力下降和輕度的其他認(rèn)知功能障礙,但對個(gè)體的社會(huì)職能或日常生活不會(huì)造成較大的阻礙,介于正常衰老和癡呆之間的一種臨床過渡狀態(tài)。每年有15%~20%的MCI患者會(huì)發(fā)展成AD,目前針對MCI和AD并沒有有效的治愈手段。如果能夠在早期診斷出病情,對患者及時(shí)干預(yù)可以大幅減緩MCI和AD的進(jìn)展。
目前MCI和AD的診斷主要通過心理量表測試、血液檢測、脊髓液檢測、神經(jīng)學(xué)檢查和磁共振成像等多種手段綜合進(jìn)行。而腦電(ElectroEncephaloGraphy, EEG)信號由于它具有的非侵入性、低成本、便攜化和高時(shí)間分辨率等優(yōu)點(diǎn),開始廣泛應(yīng)用于MCI和AD的識(shí)別,成為有效的篩查工具之一。
同時(shí),隨著人工智能技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)在醫(yī)療輔助診斷上表現(xiàn)出巨大的潛力,可通過機(jī)器學(xué)習(xí)分類提取的生理特征,實(shí)現(xiàn)對疾病的預(yù)測和診斷。目前針對MCI和AD,已有不少研究從不同特征、不同分類算法入手,得到了較好的分類效果。
本文檢索并總結(jié)了近三年通過腦電信號對認(rèn)知功能障礙識(shí)別分類的文獻(xiàn),首先歸納了認(rèn)知功能障礙識(shí)別分類中的常用腦電特征,包括時(shí)域、頻域、時(shí)頻域、非線性動(dòng)力學(xué)以及功能連接和腦網(wǎng)絡(luò)五大類;其次,總結(jié)了目前使用較多的支持向量機(jī)(Support Vector Machine, SVM)、線性判別分析(Linear Discriminant Analysis, LDA)、-近鄰(-Nearest Neighbor,NN)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)等分類方法及其分類效果;最后,提出目前認(rèn)知功能障礙識(shí)別分類研究中存在的不足并展望未來的研究方向,期望為認(rèn)知功能障礙識(shí)別分類的后續(xù)研究提供科學(xué)的參考與建議。
認(rèn)知功能受損會(huì)導(dǎo)致大腦的結(jié)構(gòu)和功能發(fā)生變化,如內(nèi)側(cè)顳葉存在一定程度的萎縮,宏觀白質(zhì)出現(xiàn)病變,區(qū)域灰質(zhì)萎縮,導(dǎo)致靜息網(wǎng)絡(luò)功能連接改變[1]。組織病理學(xué)分析顯示,在患有AD的人類和動(dòng)物模型中,多個(gè)腦區(qū)域均存在淀粉樣斑塊和神經(jīng)纖維纏結(jié),尤其是在基底前腦、額葉、海馬和大腦皮層[2]。腦電信號可以在毫秒級記錄由于大腦皮層活動(dòng)導(dǎo)致的頭皮電信號變化,有助于識(shí)別AD患者。
基于腦電信號的認(rèn)知功能障礙識(shí)別分類過程一般分為腦電信號采集、預(yù)處理、腦電特征提取、特征選擇和識(shí)別分類,如圖1所示。目前常用的腦電信號采集方式主要是在頭皮放置電極,電極分為濕電極和干電極兩種:濕電極通過導(dǎo)電介質(zhì)降低頭皮與電極之間的電阻,信號更加穩(wěn)定,但是采集過程更加復(fù)雜,且采集時(shí)長十分受限;干電極更加簡單方便,但是信號質(zhì)量較低。腦電信號采集實(shí)驗(yàn)主要分為靜息態(tài)實(shí)驗(yàn)和事件相關(guān)電位(Event-Related Potentials, ERP)實(shí)驗(yàn):靜息態(tài)實(shí)驗(yàn)采集被試者保持平靜狀態(tài)下睜眼或閉眼時(shí)的腦電數(shù)據(jù),反映自發(fā)的腦電活動(dòng);ERP實(shí)驗(yàn)采集被試者進(jìn)行認(rèn)知刺激實(shí)驗(yàn)時(shí)的腦電數(shù)據(jù),反映認(rèn)知加工過程中的腦電信號變化。腦電信號活動(dòng)非常微弱(微伏級別),也極易受到外界干擾,所以需要對腦電信號預(yù)處理,去除噪聲得到干凈的腦電數(shù)據(jù),減少外界對腦電數(shù)據(jù)的干擾。腦電信號預(yù)處理主要包括無用電極和壞段的剔除、重參考、濾波、偽跡剔除和分段等步驟。
圖1 基于腦電信號的認(rèn)知功能障礙識(shí)別分類框架
預(yù)處理后,通過各種分析方法提取包含不同維度信息的特征,通過特征選擇降低特征的維度,將最優(yōu)特征輸入分類算法,實(shí)現(xiàn)認(rèn)知功能障礙識(shí)別分類。本文主要從腦電特征提取和分類方法兩個(gè)方面,總結(jié)分析當(dāng)前基于機(jī)器學(xué)習(xí)的認(rèn)知功能障礙識(shí)別研究進(jìn)展。
特征提取是基于腦電信號進(jìn)行認(rèn)知功能障礙識(shí)別分類的關(guān)鍵步驟。不同分析方法提取包含不同維度的腦電信號的深層特征,不同特征影響分類算法的性能。在認(rèn)知功能障礙識(shí)別分類中提取的腦電特征一般分為時(shí)域、頻域、時(shí)頻域結(jié)合、非線性動(dòng)力學(xué)以及功能連接和腦網(wǎng)絡(luò)五類。
時(shí)域特征指在時(shí)域上對腦電信號分析提取的特征,主要是將腦電時(shí)間序列信號(包括均值、方差、振幅等)的統(tǒng)計(jì)結(jié)果作為特征。ERP是常用的時(shí)域特征,指大腦對刺激信息認(rèn)知加工時(shí)通過疊加和平均技術(shù)記錄的電位。ERP反映認(rèn)知過程中大腦的電生理變化,認(rèn)知功能障礙患者因?yàn)檎J(rèn)知能力受損導(dǎo)致ERP成分的潛伏期延長,振幅降低,因此ERP可以有效幫助認(rèn)知功能障礙的識(shí)別。Khatun等[3]從聽覺刺激實(shí)驗(yàn)采集的腦電信號中提取了Pa、P1、N1和P2等ERP成分區(qū)間的波峰、潛伏期和相關(guān)成分區(qū)間的平均振幅作為特征,并對特征進(jìn)行了非參數(shù)統(tǒng)計(jì),以完成特征排序,N1成分(區(qū)間為90~110 ms)的平均振幅和波峰兩個(gè)特征排在最前。Williams等[4]利用ERP數(shù)據(jù)的稀疏性,將同一刺激下的不同通道的腦電信號串聯(lián)后,輸入針對高維生物數(shù)據(jù)的集成稀疏分類器,實(shí)現(xiàn)了95%的分類準(zhǔn)確率。
Hjorth參數(shù)可以在時(shí)域上顯示腦電信號的統(tǒng)計(jì)屬性,包括活動(dòng)參數(shù)、移動(dòng)參數(shù)和復(fù)雜性參數(shù)?;顒?dòng)參數(shù)表示腦電數(shù)據(jù)中的高頻分量的數(shù)量,復(fù)雜性參數(shù)表示對腦電數(shù)據(jù)與正弦波相似性的估計(jì)。Li等[5]從腦電信號中提取方差、均方根振幅、Hjorth參數(shù)、零交叉、偏態(tài)和峰度等時(shí)域特征,與頻域特征結(jié)合輸入后續(xù)分類模型,準(zhǔn)確率達(dá)到了98.1%。Safi等[6]計(jì)算腦電信號的Hjorth參數(shù),并加入其他特征子集,證明Hjorth參數(shù)是有效特征,可以提高所有分類器的性能。
時(shí)域特征的提取主要針對ERP實(shí)驗(yàn)的腦電數(shù)據(jù)集,因?yàn)镋RP成分的時(shí)間依賴性高,它的時(shí)間序列中含有豐富的認(rèn)知變化的信息。時(shí)域特征的優(yōu)點(diǎn)是計(jì)算簡單、易于獲取、結(jié)果直觀,無需要復(fù)雜的濾波處理,具有更高的時(shí)間精度;但是,時(shí)域特征容易受到干擾,除ERP外,沒有其他特別有效的時(shí)域信息,所以大多數(shù)研究會(huì)把時(shí)域特征與其他特征結(jié)合進(jìn)行特征選擇,增加特征信息的豐富度,提升模型穩(wěn)定性。
頻域特征主要為腦電各頻段的功率特征。一般的腦電頻段分為5個(gè):δ(0.5~3 Hz)、θ(4~7 Hz)、α(8~13 Hz)、β(14~30 Hz)和γ(30~80 Hz),部分研究會(huì)將β頻段細(xì)分為β1(14~20 Hz)和β2(20~30 Hz)。頻段功率是認(rèn)知功能障礙識(shí)別分類的常用特征,不同頻段的功率改變與大腦的神經(jīng)同步性受損有關(guān),研究表明,與健康人群相比,AD和MCI患者的腦電信號的α頻段活動(dòng)減少,θ和δ頻段活動(dòng)增加。α頻段活動(dòng)的減少被認(rèn)為與疾病的嚴(yán)重程度和認(rèn)知缺陷密切相關(guān)[1],因此功率特征能夠有效區(qū)分AD、MCI患者與健康人群,大部分研究主要提取各頻段相對功率和絕對功率作為特征反映神經(jīng)同步性。Ruiz-Gómez等[7]還提取了感興趣頻段的中值頻率、個(gè)體α頻段的頻率和譜熵作為特征值。Bi等[8]將各通道的腦電功率通過空間映射和插值轉(zhuǎn)換成二維圖像,圖像的顏色通道代表不同頻段,將二維腦電頻率圖像作為特征輸入,同時(shí)保留腦電信號的頻域信息和空間信息。Trinh等[9]使用頻譜功率的運(yùn)行間相似性量化兩次靜息態(tài)腦電信號之間的內(nèi)部可變性,它的分類性能優(yōu)于其他廣泛使用的特征,如功率、相干性等。Hsiao等[10]也提出一種新的腦電特征——核特征相對功率(Kernel Eigen-Relative-Power, KERP)特征,引入2 Hz寬度的21個(gè)不同子帶電極對之間的相對功率作為特征,再利用Fisher類別可分性準(zhǔn)則確定最佳電極對并提取最優(yōu)相對功率特征的頻帶,進(jìn)一步采用核主成分分析從最優(yōu)相對功率特征中提取更多具有判別性的非線性主成分,構(gòu)成KERP特征向量。
不同節(jié)律反映不同的認(rèn)知功能狀態(tài),與認(rèn)知功能障礙密切相關(guān)。頻域分析基于腦電信號是穩(wěn)態(tài)的這一基本假設(shè)進(jìn)行,只考慮腦電信號的頻域信息,而忽略了時(shí)間信息。不同研究由于個(gè)體數(shù)據(jù)或環(huán)境差異,針對分析的頻段存在較大的差異??傮w上,頻域特征的不同節(jié)律特性可以有效區(qū)分認(rèn)知功能障礙患者,成為進(jìn)行認(rèn)知功能障礙識(shí)別最常用的特征提取方法之一。
時(shí)頻特征可以反映任意一個(gè)時(shí)刻上和任意頻率上信號的功率,在分析腦電信號特征時(shí)同時(shí)給出了頻域信息和時(shí)域信息,更加直觀有效[11],被廣泛應(yīng)用在認(rèn)知功能障礙識(shí)別分類中。常用的時(shí)頻分析算法是小波變換和短時(shí)傅里葉變換。短時(shí)間傅里葉變換不能平衡頻率和時(shí)間分辨率,針對需要高時(shí)間分辨率的非平穩(wěn)腦電信號,小波變換更適合。小波變換作為一種數(shù)學(xué)工具,廣泛用于在多種不同的數(shù)據(jù)中提取信息。小波變換提供了一種靈活表示時(shí)頻信號的方法,特別適用于腦電、腦磁等不平穩(wěn)的信號。小波是具有不同頻率和有限持續(xù)時(shí)間的函數(shù),可以通過多種分辨率分解時(shí)域和頻域中的信號。短時(shí)傅里葉變換將信號劃分為連續(xù)的時(shí)間窗,并在信號的每個(gè)時(shí)間窗應(yīng)用傅里葉變換,因此需要考慮時(shí)間窗的長度,較小的窗口可以得到更高的時(shí)間分辨率,但同時(shí)也會(huì)導(dǎo)致較低的頻率分辨率。Fiscon等[12]比較上述兩種特征提取方法的性能后,發(fā)現(xiàn)小波分析的分類性能優(yōu)于傅里葉分析。Durongbhan等[13]在整個(gè)信號長度的特定頻帶內(nèi),使用選定母小波獲得的所有連續(xù)小波變換系數(shù)的平均幅值作為特征輸入,發(fā)現(xiàn)顳區(qū)、頂區(qū)和枕區(qū)具有較高的分類精度。Ieracitano等[14]將小波變換后的5種腦電節(jié)律子帶的均值、標(biāo)準(zhǔn)差、偏度、峰度和熵作為特征,在區(qū)分AD患者和健康人群時(shí)準(zhǔn)確率達(dá)到了95.76%。Rodrigues等[15]提出了一個(gè)新的特征計(jì)算方法,得到對腦電信號離散小波變換系數(shù)的對數(shù)逆變換后的平方值與倒譜之間的距離,該特征值的分類準(zhǔn)確率最高達(dá)到了95.55%。
時(shí)頻分析方法在時(shí)域和頻域上都具有較好的局部分析能力,當(dāng)信號不穩(wěn)定時(shí),時(shí)頻特征可以提供基于動(dòng)態(tài)波動(dòng)的額外信息。由于腦電信號是非平穩(wěn)的,可能存在時(shí)域或頻域特征量不足,時(shí)頻分析方法可以解決這一難題。因此針對非穩(wěn)態(tài)的腦電信號,時(shí)頻分析相較于單純的頻域更為有效。
人腦是一個(gè)典型的非線性系統(tǒng),僅使用傳統(tǒng)的時(shí)頻域分析方法很難全面分析腦電信號,通過非線性動(dòng)力學(xué)方法對腦電信號的時(shí)間序列進(jìn)行相空間重構(gòu),可以提取相關(guān)的非線性度量指標(biāo),刻畫人腦這一非線性系統(tǒng)的自由度、復(fù)雜度和混亂程度等特征[16],更能反映腦電信號的內(nèi)在特征,而AD和MCI患者大腦的改變會(huì)導(dǎo)致腦電信號活動(dòng)的復(fù)雜性、變異性和不規(guī)則性改變。常用的非線性特征有排列熵、樣本熵、小波熵、LempelZiv復(fù)雜度和模糊熵等。Ding等[17]采用排列熵、樣本熵、小波熵和LempelZiv復(fù)雜度這4個(gè)指標(biāo)衡量腦電信號的復(fù)雜度,發(fā)現(xiàn)隨著AD的進(jìn)展,患者腦電信號復(fù)雜性有降低的趨勢,LempelZiv復(fù)雜度可以較好地區(qū)分MCI和AD患者。Rutkowski等[18]將多尺度熵,即腦電信號時(shí)間窗口內(nèi)所有分析尺度上樣本熵值的總和作為特征輸入,分類準(zhǔn)確率超過了80%。Siuly等[19]通過排列熵和自回歸模型階數(shù)特征區(qū)分MCI患者和健康對照受試者,準(zhǔn)確率達(dá)到98.78%。?eker等[20]也證明排列熵可以作為AD研究的一個(gè)實(shí)用的診斷性神經(jīng)標(biāo)志物。Amezquita-Sánchez等[21]通過基于集成多信號分類和經(jīng)驗(yàn)小波變換的算法對腦電信號進(jìn)行自適應(yīng)頻帶分解,再提取分形維數(shù)和赫斯特指數(shù),并將這兩個(gè)非線性特征輸入增強(qiáng)概率神經(jīng)網(wǎng)絡(luò),準(zhǔn)確率達(dá)到90.3%,可以有效區(qū)分MCI和AD。
非線性特征具有較小的特征維度,可以降低后續(xù)模型的計(jì)算量。此外,非線性動(dòng)態(tài)分析可以提供時(shí)頻域等傳統(tǒng)腦電信號分析方法無法獲得的信息,并且這些信息對腦電時(shí)間序列信號中異常值或偽影的影響不敏感,可重復(fù)性高。因此,非線性特征越來越多地被應(yīng)用到認(rèn)知功能障礙識(shí)別。
認(rèn)知功能需要不同腦區(qū)相互協(xié)調(diào)和交互整合完成,不同腦區(qū)的功能連接可以反映腦區(qū)之間的相互作用[22]。功能連接主要通過測量兩個(gè)信號之間的相關(guān)程度表示。認(rèn)知功能障礙識(shí)別分類中常用的功能連接指標(biāo)有鎖相值、相關(guān)系數(shù)和相干系數(shù)等。Su等[23]通過前額葉腦電信號的多尺度模糊熵和5個(gè)頻段的鎖相值結(jié)合的多維度特征區(qū)分遺忘性MCI患者,準(zhǔn)確率達(dá)到83.34%,證實(shí)前額葉腦區(qū)的腦電特征能夠有效診斷遺忘性MCI患者。Song等[24]發(fā)現(xiàn)AD患者額葉與腦區(qū)的連接顯著降低,也表明AD患者與額部中樞相關(guān)的信號傳輸受到損害。
腦網(wǎng)絡(luò)以采集的通道和溯源的腦區(qū)作為網(wǎng)絡(luò)節(jié)點(diǎn),根據(jù)功能連接矩陣構(gòu)建。對腦網(wǎng)絡(luò)圖論分析,以小世界屬性、全局效率等描述腦網(wǎng)絡(luò)的全局屬性,以節(jié)點(diǎn)聚類系數(shù)、節(jié)點(diǎn)效率等特征描述腦網(wǎng)絡(luò)的節(jié)點(diǎn)屬性。Vecchio等[25]通過腦區(qū)之間的滯后線性相干性構(gòu)建腦網(wǎng)絡(luò),計(jì)算腦網(wǎng)絡(luò)的小世界參數(shù)作為特征輸入分類器,得到了95%±3%的準(zhǔn)確性。Yu等[26]利用加權(quán)水平可視圖將多通道腦電信號轉(zhuǎn)化為多層復(fù)雜網(wǎng)絡(luò),計(jì)算聚類系數(shù)、平均加權(quán)度、圖索引復(fù)雜度、網(wǎng)絡(luò)熵、度分布指數(shù)、模塊度、局部效率和平均路徑長度這8種網(wǎng)絡(luò)拓?fù)涮匦?,通過Takagi-Sugeno-Kang模糊模型分類,最高準(zhǔn)確率為97.12%。Li等[27]基于腦電信號構(gòu)建相位同步指數(shù)無向網(wǎng)絡(luò)和定向傳遞函數(shù)有向網(wǎng)絡(luò)兩種腦網(wǎng)絡(luò)模型,并計(jì)算網(wǎng)絡(luò)聚類系數(shù)、全局效率、平均節(jié)點(diǎn)度作為特征輸入后續(xù)的SVM分類模型,發(fā)現(xiàn)有向網(wǎng)絡(luò)的準(zhǔn)確率(80.0%±2.2%)高于無向網(wǎng)絡(luò)(66.6%±1.7%),所以引入基于有向網(wǎng)絡(luò)的改進(jìn)的效率密度網(wǎng)絡(luò)參數(shù)使分類準(zhǔn)確率提高至86.6%±2.6%。
人腦是以各個(gè)功能區(qū)聯(lián)合協(xié)作的方式工作。功能區(qū)內(nèi)部以及功能區(qū)之間都有廣泛的協(xié)作關(guān)系。功能連接和腦網(wǎng)絡(luò)特征可以描述不同通道之間的關(guān)系,進(jìn)一步理解大腦功能,可以反映大腦系統(tǒng)之間的功能整合聯(lián)系,增加大腦不同腦區(qū)如何協(xié)同合作的信息,加深對大腦功能的理解。而認(rèn)知功能障礙患者腦區(qū)之間的信號傳輸出現(xiàn)障礙,連接性增加或者降低,因此可以通過功能連接和腦網(wǎng)絡(luò)特征有效區(qū)分腦區(qū)功能連接能力降低的認(rèn)知功能障礙患者;并且功能連接和腦網(wǎng)絡(luò)特征保留了更多的空間結(jié)構(gòu)信息,這是其他分析方法所缺乏的。功能連接計(jì)算的是不同通道之間的相關(guān)性,它的特征維度較大,實(shí)踐中通常通過腦網(wǎng)絡(luò)分析提取功能鏈接矩陣中的網(wǎng)絡(luò)特征作為特征空間。腦網(wǎng)絡(luò)分析作為前沿的分析方法在認(rèn)知功能障礙識(shí)別領(lǐng)域逐漸流行,但它的可靠性,特別是當(dāng)與其他類別的特征相結(jié)合時(shí)的可靠性,仍需要進(jìn)行更多深入的研究證實(shí)。
常用于認(rèn)知功能障礙識(shí)別分類的5種腦電特征總結(jié)如圖2所示。時(shí)域因計(jì)算方便在早期研究中被使用較多,通過它計(jì)算得到的特征維度較低,更有利于后續(xù)的分類計(jì)算,但由于它受干擾的影響大、包含的信息較少導(dǎo)致應(yīng)用范圍受限。而頻域特征和時(shí)頻特征能夠有效地區(qū)分AD、MCI患者,目前應(yīng)用范圍較廣,它的計(jì)算的特征維度隨腦電通道數(shù)量的增加而逐步增大,相鄰?fù)ǖ腊男畔⑾嗨?,因此選擇不同腦區(qū)代表性通道的腦電信號分析可有效減少特征冗余。非線性動(dòng)力學(xué)特征能夠反映腦電信號的變異性和復(fù)雜度,功能連接和腦網(wǎng)絡(luò)特征能夠反映腦區(qū)之間的相互關(guān)系,兩者提供了腦電信號更多維度的信息,也逐步被應(yīng)用。單一的腦電特征能夠提供的信息有限,分類精度較低,所以大多數(shù)研究都選擇提取更多維度的腦電特征進(jìn)行綜合,根據(jù)研究假設(shè)或數(shù)據(jù)驅(qū)動(dòng)的問題選擇合適的腦電特征,再通過特征選擇選出最優(yōu)特征,以此提高分類模型的性能。
通過分析基于不同特征所構(gòu)造的分類模型的精度,有助于在認(rèn)知功能障礙識(shí)別分類中搜尋更具代表性的腦電特征。從Ding等[17]的研究中可以發(fā)現(xiàn),熵和譜功率特征能較好地區(qū)分正常認(rèn)知(Normal Cognition, NC)和AD,LempelZiv復(fù)雜度則能較好地區(qū)分MCI和AD。Nobukawa等[28]分別構(gòu)造了基于相位滯后指數(shù)和樣本熵的分類模型,通過比較兩個(gè)模型的識(shí)別精度,發(fā)現(xiàn)相較于樣本熵,選擇相位滯后指數(shù)為特征可以獲得更高的識(shí)別精度,并且功能連通性的變化表現(xiàn)出顯著的區(qū)域特異性。Tzimourta等[29]比較了大腦不同區(qū)域腦電特征的分類效果,發(fā)現(xiàn)基于顳葉后部和中央?yún)^(qū)域的腦電信號的分類準(zhǔn)確率高于額葉區(qū)和顳葉右側(cè)。Fan等[30]研究發(fā)現(xiàn)顳葉和枕頂葉腦區(qū)的腦電信號在嚴(yán)重AD與正常對照(Health Controls, HC)組的分類上更具有區(qū)別性。使用大腦精準(zhǔn)區(qū)域的腦電信號分類可以減少信號冗余,優(yōu)化分類特征,獲得更高分類效率。
由于各個(gè)研究的實(shí)驗(yàn)方法存在差異性,提取的特征難以進(jìn)行橫向比較,無法得到可以區(qū)分認(rèn)知功能障礙的最優(yōu)特征組合??梢悦鞔_的是多維度的腦電特征融合是未來認(rèn)知功能障礙識(shí)別的發(fā)展趨勢。Ieracitano等[31]證實(shí)將時(shí)域特征和雙譜特征拼接作為輸入特征的模型分類性能優(yōu)于僅將時(shí)域特征或雙譜特征作為輸入特征的模型。單一維度的特征相似性高,容易導(dǎo)致過擬合,出現(xiàn)梯度消失的情況。多維度腦電特征可以有效避免這一問題,并且包含更多神經(jīng)活動(dòng)變化的信息,大幅提高分類準(zhǔn)確率;但需要注意的是多維度特征容易導(dǎo)致維度災(zāi)難,需要進(jìn)行特征工程,在保證包含關(guān)鍵信息的同時(shí),有效降低特征維度。
圖2 常用于認(rèn)知功能障礙識(shí)別分類的腦電特征
多通道采集和多維度分析的腦電信號能夠提供更為豐富的信息,但在提取特征時(shí)容易導(dǎo)致特征維度過大。高維度的腦電特征中通常存在冗余的特征,導(dǎo)致計(jì)算復(fù)雜度高和過擬合等問題。通過特征工程提取出腦電信號中最有價(jià)值的特征,可以有效減少數(shù)據(jù)維度,也可以更好地理解模型的決策過程,提高模型的性能和泛化能力,增加可解釋性。在認(rèn)知功能障礙識(shí)別分類中,特征工程主要包括特征選擇和特征提取兩個(gè)方面。
特征選擇是指從原始的腦電特征中選擇具有代表性的特征,從而減小數(shù)據(jù)的維度,使機(jī)器學(xué)習(xí)模型更好地理解數(shù)據(jù)的內(nèi)在結(jié)構(gòu),并提高分類效率。常用的特征選擇方法包括過濾法、包裝法和嵌入法。
3.1.1過濾法
過濾法主要是通過計(jì)算每個(gè)特征與目標(biāo)變量的相關(guān)性或者發(fā)散性選擇重要性更高的特征。過濾法主要針對單個(gè)特征評估,缺乏對特征之間相互關(guān)系的考慮,不一定能選出最優(yōu)的特征集,但它實(shí)現(xiàn)簡單,能夠快速找到具有代表性的特征,因此被廣泛應(yīng)用。在認(rèn)知功能障礙識(shí)別分類中,特征選擇主要通過計(jì)算相關(guān)系數(shù)、卡方檢驗(yàn)和Fisher評分等方法實(shí)現(xiàn)。Khatun等[3]使用Spearman秩相關(guān)系數(shù)公式排序ERP特征,90~110 ms的平均振幅排在最前。Song等[24]通過計(jì)算各個(gè)腦區(qū)功能連接特征的Fisher評分選擇特征,發(fā)現(xiàn)左額葉的Fisher評分最高,額葉相關(guān)的連接是AD診斷最有力的特征。Trambaiolli等[32]將各頻段特征作為輸入,比較相關(guān)系數(shù)、卡方檢驗(yàn)等8種特征選擇方法,發(fā)現(xiàn)α頻段的特征在所有算法中具有最高的選擇頻率,其次是β和γ波段,并且所選特征大多分布在左半球。
3.1.2包裝法
包裝法主要是通過不斷加入或刪除特征到選定的分類模型,根據(jù)模型的分類表現(xiàn)確定最優(yōu)特征子集。相較于過濾法,包裝法考慮特征之間的相互作用;但是最優(yōu)特征子集的選擇取決于選定的分類算法,通常需要多次嘗試才能得到最優(yōu)結(jié)果,而且計(jì)算復(fù)雜度較高,時(shí)間成本高。Rodrigues等[15]采用熵判據(jù)的遺傳算法搜索每個(gè)通道5~12個(gè)顯著距離測量值的組合尋找最優(yōu)特征子集。Tavares等[33]通過后向包裝法選擇各頻段的特征,發(fā)現(xiàn)高頻特征被選擇在額葉、額顳葉和顳葉區(qū)域,而低頻特征被選擇在中央和頂葉區(qū)域,這些是典型受AD影響的皮層區(qū)域。
3.1.3嵌入法
嵌入法與過濾法類似,區(qū)別是嵌入法通過訓(xùn)練分類模型得到各特征的權(quán)值比重選擇對模型貢獻(xiàn)更高的特征。嵌入法同樣考慮了特征之間的相互關(guān)系,可以有效提高模型分類性能,但同樣計(jì)算復(fù)雜,并且需要多次嘗試。Cai等[34]采用最小絕對收縮選擇算子邏輯回歸算法選擇最顯著的預(yù)測特征,去除冗余特征。Khatun等[35]采用隨機(jī)森林算法排序ERP特征、時(shí)域特征和頻域特征,使用前25個(gè)特征的分類準(zhǔn)確率最高,其中ERP特征最多。
在認(rèn)知功能障礙的分類研究中,特征選擇有助于找到對區(qū)分認(rèn)知功能障礙和正常對照最有價(jià)值的特征。與前額葉區(qū)域有關(guān)的特征評估分?jǐn)?shù)更高,被選擇的概率更大。這可能是因?yàn)榍邦~葉區(qū)域與認(rèn)知功能密切相關(guān),而AD患者這一區(qū)域會(huì)出現(xiàn)萎縮[36]。α頻段的特征選擇頻率高,也進(jìn)一步證實(shí)α頻段活動(dòng)與認(rèn)知功能的衰退密切相關(guān)[1]。通過特征選擇找到最有價(jià)值的特征,可以構(gòu)建具有更好解釋力的模型。這有助于更好地理解認(rèn)知功能障礙的潛在原因,并找到潛在的治療或干預(yù)方案。此外,具有良好解釋力的模型還可以提高研究結(jié)果的普適性和可靠性。
特征提取主要是將原有的特征轉(zhuǎn)換為一個(gè)新的特征空間,使得新的特征空間中的特征數(shù)目更少,同時(shí)盡量保留盡可能多的信息。在認(rèn)知功能障礙識(shí)別分類中,常用的特征提取方法為主成分分析(Principal Component Analysis, PCA)。PCA主要通過計(jì)算數(shù)據(jù)協(xié)方差矩陣的特征值和特征向量選擇具有最大方差的特征向量作為新的特征,將原始數(shù)據(jù)投影到這些新的特征向量上,形成新的特征空間。Ding等[17]將PCA應(yīng)用于特征矩陣,提取代表所有變異性95%的潛在成分。Vecchio等[25]通過PCA提取特征,將閾值從0.1增加到0.9,發(fā)現(xiàn)閾值選擇0.8時(shí)獲得分類的最佳性能。
特征選擇注重特征篩選,選擇更有價(jià)值的特征,去除冗余特征,以此減小特征維度,提升模型的泛化能力和可解釋性。特征提取注重特征保留,通過對原有特征變換得到一組新的關(guān)系更為簡單的特征,在降低特征維度的同時(shí)盡可能保留更多原有特征的信息。特征選擇和特征提取在降低維度、提升模型性能的同時(shí)也會(huì)損失部分信息,所以在使用時(shí)需要結(jié)合實(shí)際情況選擇合適的方法。
將提取好的腦電特征輸入模型訓(xùn)練,學(xué)習(xí)特征與標(biāo)簽之間的關(guān)聯(lián),通過訓(xùn)練好的模型分類新的腦電信號。不同的特征和算法對模型的準(zhǔn)確率影響較大,因此選擇正確的分類算法可以有效提高模型的性能。在認(rèn)知功能障礙識(shí)別分類中,常用的分類算法包括SVM、LDA、決策樹、NN和樸素貝葉斯等經(jīng)典機(jī)器學(xué)習(xí)算法,以及極端學(xué)習(xí)機(jī)(Extreme Learning Machine, ELM)、多層感知機(jī)(Multi-Layer Perceptron, MLP)、ANN、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)等深度學(xué)習(xí)算法。相關(guān)研究選用的特征和算法總結(jié)如表1所示,通過區(qū)分AD、MCI和HC的準(zhǔn)確率比較各個(gè)研究的效果。
表1 認(rèn)知功能障礙識(shí)別分類相關(guān)文獻(xiàn)的總結(jié)
4.1.1SVM
SVM是認(rèn)知功能障礙識(shí)別分類中最常用的傳統(tǒng)機(jī)器學(xué)習(xí)方法,它的主要思想是找到最佳的分類超平面,既處理線性問題,也處理非線性問題。SVM通過核函數(shù)將原始的非線性不可分離的特征空間映射到更高維的線性可分離空間,從而有效解決非線性問題。線性核函數(shù)、徑向基核函數(shù)是認(rèn)知功能障礙識(shí)別分類中應(yīng)用最多的核函數(shù)。Nobukawa等[28]證實(shí)基于功能連接性和復(fù)雜度的SVM模型可以有效識(shí)別AD和HC。SVM在認(rèn)知功能障礙識(shí)別分類中被廣泛應(yīng)用,表2總結(jié)了使用SVM進(jìn)行認(rèn)知功能障礙識(shí)別分類的研究采用的特征、核函數(shù)和準(zhǔn)確率。SVM結(jié)構(gòu)簡單,分類表現(xiàn)良好,兼容性好,并且能穩(wěn)定處理維數(shù)災(zāi)難問題,在處理高維的特征向量時(shí)不需要大量的訓(xùn)練集就可以獲得良好的結(jié)果。
表2 使用SVM進(jìn)行認(rèn)知功能障礙識(shí)別分類的研究總結(jié)
4.1.2NN
正常情況下,屬于不同類的要素通常會(huì)在特征空間中形成單獨(dú)的聚類,所以NN的分類原則為推定近鄰屬于同一類。它的基本思想是將測試樣本特征與周圍最近類的特征進(jìn)行相似性比較后再分類。相似性指標(biāo)通過測試樣本的特征與每個(gè)類的特征之間的度量距離定義,常用的有歐氏距離和馬氏距離等。NN在分類中會(huì)考慮到個(gè)相鄰節(jié)點(diǎn),因此可以降低決策中的錯(cuò)誤概率。其他分類方法如果遇到部分訓(xùn)練樣本存在噪聲干擾,分類結(jié)果可能會(huì)被嚴(yán)重影響。而NN因?yàn)闆Q策涉及多個(gè)相鄰節(jié)點(diǎn)時(shí),發(fā)生錯(cuò)誤的可能性大幅減小。Durongbhan等[13]構(gòu)建基于NN的AD患者分類框架,利用睜眼數(shù)據(jù)作為特征,模型訓(xùn)練后分類準(zhǔn)確率最高達(dá)到99%。NN的問題在于是如果數(shù)據(jù)集中的數(shù)據(jù)量過大,計(jì)算復(fù)雜性會(huì)過高,因此NN適合樣本量適度的數(shù)據(jù)集。
4.1.3LDA
線性判別分析作為經(jīng)典的線性學(xué)習(xí)方法之一,在認(rèn)知功能障礙識(shí)別的研究領(lǐng)域應(yīng)用十分廣泛。它的思想主要是給定訓(xùn)練樣本集,設(shè)法將樣本投影到一條直線上,使得同類樣本的投影點(diǎn)盡可能接近,異樣樣本的投影點(diǎn)盡可能遠(yuǎn)離,使來自不同類的所有樣本能夠很好地被分開;在分類新樣本時(shí),將它們投影到同樣的直線上,再根據(jù)投影點(diǎn)的位置確定新樣本的類別[50]。LDA簡單,通常無須大量計(jì)算即可獲得預(yù)期的分類效果,但由于它的線性性質(zhì),導(dǎo)致在非線性腦電信號上表現(xiàn)不好。
4.1.4樸素貝葉斯分類
作為典型的生成模型,樸素貝葉斯分類主要根據(jù)貝葉斯定理構(gòu)造基于概率的類。它的核心思想是條件獨(dú)立性假設(shè),即假設(shè)所有屬性相對獨(dú)立?;谶@一前提假設(shè)學(xué)習(xí)輸入到輸出的聯(lián)合概率分布模型,基于此模型,利用貝葉斯定理估計(jì)輸入特征與每個(gè)類相關(guān)的概率,從而確定樣本類別。樸素貝葉斯分類器具有較高的可擴(kuò)展性和較低的計(jì)算成本,但它主要的局限性是在實(shí)際應(yīng)用中并無法保證數(shù)據(jù)集屬性的獨(dú)立性。
4.1.5決策樹
決策樹是由樹狀結(jié)構(gòu)節(jié)點(diǎn)組成的分類模型,結(jié)構(gòu)包含根節(jié)點(diǎn)、葉節(jié)點(diǎn)和內(nèi)部節(jié)點(diǎn)。內(nèi)部的每個(gè)節(jié)點(diǎn)都表示一個(gè)基于輸入變量的決策函數(shù),對應(yīng)一個(gè)屬性測試,每個(gè)分支表示屬性可以獲取的值,即節(jié)點(diǎn)問題的答案,葉節(jié)點(diǎn)表示分配的最終類標(biāo)簽。決策樹的主要優(yōu)點(diǎn)為簡單和易理解,以及能夠模擬復(fù)雜的相互作用和非線性關(guān)系。決策樹相較于其他機(jī)器學(xué)習(xí)方法的優(yōu)勢點(diǎn)是它不是黑箱模型,更容易被理解和解釋,訓(xùn)練需要的數(shù)據(jù)少,但是產(chǎn)生的模型容易復(fù)雜化,導(dǎo)致穩(wěn)定性和泛化性較差。
綜上所述,常用的機(jī)器學(xué)習(xí)算法中,SVM簡單且魯棒性好,可以處理非線性數(shù)據(jù),但是當(dāng)數(shù)據(jù)規(guī)模較大時(shí),建模能力可能會(huì)降低;NN對于重疊較多的特征集有優(yōu)勢,但計(jì)算量大,可解釋性低;LDA計(jì)算速度快,成本低,參數(shù)少,但當(dāng)數(shù)據(jù)很少且非線性時(shí),性能較差;樸素貝葉斯更適用于小規(guī)模數(shù)據(jù)。決策樹可解釋性強(qiáng),需要的數(shù)據(jù)規(guī)模小,但是穩(wěn)定性較差。
4.1.6多算法比較
如表1所示,多數(shù)研究一般不會(huì)選擇單一分類器進(jìn)行認(rèn)知功能障礙的分類,而是會(huì)將不同的特征組合后和多個(gè)分類器進(jìn)行比較,最后選出準(zhǔn)確率最高的特征組合和分類器。Betrouni等[38]使用在低電極密度下的相對功率特征分類帕金森患者的認(rèn)知障礙程度,發(fā)現(xiàn)NN的分類準(zhǔn)確率比SVM高4%。而Yin等[42]采用SVM、決策樹和NN這3種算法在最優(yōu)特征子集上進(jìn)行MCI的識(shí)別,SVM的準(zhǔn)確率略高于決策樹和NN。Cai等[34]計(jì)算基于頻率和時(shí)間的多層腦網(wǎng)絡(luò)的參與系數(shù)特征和聚類系數(shù)特征分類AD和HC,在線性SVM、NN、樸素貝葉斯和LDA分類器中,SVM和LDA的平均準(zhǔn)確率最高,達(dá)到了92.5%。Ieracitano等[39]將小波變換和雙譜分析得到的特征串聯(lián)后輸入分類模型,MLP的分類性能高于自動(dòng)編碼器、邏輯回歸和SVM。Oltu等[47]計(jì)算腦電信號各頻段的功率譜特征和相干性特征輸入SVM、NN、決策樹、袋裝樹這4種模型中分類AD、MCI和健康人,袋裝樹為最佳分類算法,準(zhǔn)確率為96.5%。Siuly等[19]分析了ELM、SVM和NN的性能,ELM的性能最好,準(zhǔn)確率高于其他兩種,運(yùn)算速度也最快。主要原因是ELM無須迭代調(diào)優(yōu),無須用戶干預(yù),泛化性能有所提高;而SVM和NN等需要手動(dòng)調(diào)參,比較麻煩且更容易產(chǎn)生過擬合結(jié)果。
4.2.1隨機(jī)森林
隨機(jī)森林是一種基于決策樹的集成學(xué)習(xí)方法,每次迭代時(shí)從數(shù)據(jù)的一個(gè)隨機(jī)子集中產(chǎn)生一個(gè)不同的分類樹,并且在樹的每個(gè)節(jié)點(diǎn)上,選擇一個(gè)預(yù)測變量的隨機(jī)子集,由此構(gòu)造多棵樹,將這些樹的分類結(jié)果結(jié)合得到最終的預(yù)測結(jié)果。隨機(jī)森林結(jié)合了決策樹的簡單性與靈活性,顯著提高了準(zhǔn)確性,有效解決了決策樹過擬合的問題;并且隨機(jī)森林的學(xué)習(xí)過程快,對缺失數(shù)據(jù)和不平衡的數(shù)據(jù)表現(xiàn)比較穩(wěn)健,能夠很好地預(yù)測較多的解釋變量[51]。Tzimourta等[29]評估了MLP、NN、SVM、樸素貝葉斯、隨機(jī)森林和決策樹這5種分類器,將腦電信號的時(shí)域、頻域和非線性特征作為輸入分類AD和HC,隨機(jī)森林在多個(gè)分類任務(wù)中的平均準(zhǔn)確率最高。與決策樹相比,隨機(jī)森林泛化性更好,但是由于計(jì)算過程的性質(zhì),擁有大量的樹結(jié)構(gòu),因此處理速度慢,實(shí)時(shí)應(yīng)用效率低。
4.2.2梯度提升樹
梯度提升樹是一類基于決策樹的梯度提升算法,利用增強(qiáng)算法校正單個(gè)決策樹的低預(yù)測能力,以迭代的方式結(jié)合多個(gè)弱決策樹的結(jié)果。與隨機(jī)森林相比,梯度增強(qiáng)樹的每個(gè)決策樹按順序串行而非獨(dú)立并行訓(xùn)練,它的思想是讓每個(gè)連續(xù)的決策樹從前面的決策樹預(yù)測錯(cuò)誤中學(xué)習(xí),再通過適當(dāng)選擇權(quán)重進(jìn)行加權(quán)求和,聚合每個(gè)決策樹生成的預(yù)測結(jié)果;因此它的學(xué)習(xí)過程比隨機(jī)森林更慢,但在實(shí)踐中的準(zhǔn)確率更高[51]。Tavares等[33]基于腦電信號各頻段的功率譜特征比較了邏輯回歸、SVM、隨機(jī)森林、決策樹和梯度提升樹等8個(gè)機(jī)器學(xué)習(xí)算法,發(fā)現(xiàn)梯度提升樹針對高維度特征時(shí)表現(xiàn)最好,準(zhǔn)確率可以達(dá)到97.14%??梢园l(fā)現(xiàn),梯度提升樹相較于隨機(jī)森林,更適用于高維度特征,準(zhǔn)確率更高,但是它的參數(shù)調(diào)整復(fù)雜,無法并行訓(xùn)練,訓(xùn)練時(shí)間更長。
4.2.3集成稀疏學(xué)習(xí)器
Williams等[4]提出了一種集成稀疏分類器(Ensemble Sparse Classifier, ESC)處理高維數(shù)據(jù)特征。ESC是許多弱線性分類器的集合,其中每個(gè)線性分類器的性能僅略優(yōu)于隨機(jī)選擇。每個(gè)線性分類器通過在給定的樣本子集中搜索最優(yōu)特征集作出分類決策,ESC對所有線性分類器所做的決策線性組合進(jìn)行準(zhǔn)確的分類。ESC可以有效利用高維生物信號數(shù)據(jù)的稀疏性,無須手動(dòng)選擇任何特征。與傳統(tǒng)的SVM、LDA等分類方法相比,ESC利用數(shù)據(jù)的稀疏性為每個(gè)弱學(xué)習(xí)者識(shí)別一組次優(yōu)特征,能夠有效解決特征稀疏以及統(tǒng)計(jì)不顯著的問題。隨著特征向量維數(shù)的增加,ESC算法的有效性更加突出。
為了進(jìn)一步比較算法分類性能優(yōu)劣,通過自行實(shí)驗(yàn)進(jìn)行基于上述5類經(jīng)典機(jī)器學(xué)習(xí)算法和隨機(jī)森林算法的認(rèn)知功能障礙分類,得到各分類算法的分類性能如表3所示。實(shí)驗(yàn)數(shù)據(jù)來自自行采集的輕度認(rèn)知功能障礙患者和相同條件的健康受試者的靜息態(tài)閉眼腦電信號,經(jīng)過數(shù)據(jù)預(yù)處理后以10 s一段的數(shù)據(jù)為一個(gè)樣本,得到330個(gè)樣本(患者169個(gè)和正常161個(gè))。研究結(jié)果表明,枕頂葉腦區(qū)可以有效區(qū)分認(rèn)知功能障礙患者,由于訓(xùn)練樣本數(shù)的限制降低特征維度,實(shí)驗(yàn)選擇的特征為枕葉Pz單通道δ、θ、α、β這4個(gè)頻段的相對功率[13]。分類指標(biāo)主要為準(zhǔn)確率、精確率、召回率和F1值??梢园l(fā)現(xiàn),經(jīng)典機(jī)器學(xué)習(xí)算法中SVM的總體表現(xiàn)最好,這也和大多數(shù)研究表現(xiàn)結(jié)果一致,說明了它具有良好的適用性和泛化性;其次是NN、樸素貝葉斯分類和決策樹,LDA表現(xiàn)最差,說明針對本數(shù)據(jù)集這幾個(gè)方法并沒有較強(qiáng)的適用性。與其他經(jīng)典機(jī)器學(xué)習(xí)方法相比,SVM在認(rèn)知功能障礙識(shí)別中應(yīng)用最為廣泛,主要原因是它具有良好的分類性能、魯棒性和泛化性,對腦電信號這類高維特征有更好的適用性。而集成學(xué)習(xí)方面,選擇隨機(jī)森林訓(xùn)練,效果優(yōu)于SVM,說明集成學(xué)習(xí)可以有效提高分類性能。
表3 經(jīng)典機(jī)器學(xué)習(xí)算法和隨機(jī)森林算法的分類準(zhǔn)確率 單位:%
但是,并沒有某個(gè)算法是絕對的最優(yōu)選擇。因?yàn)閿?shù)據(jù)采集和特征選擇不一樣,導(dǎo)致各個(gè)分類算法在不同研究中的性能表現(xiàn)有差異。即便是同一種算法,也可能因?yàn)閰?shù)設(shè)置導(dǎo)致分類效果不同。因此,越來越多的研究應(yīng)用多個(gè)算法進(jìn)行比較,以得到分類效果最佳的算法。
由于腦電信號存在空間分辨率和信噪比較低的缺點(diǎn),對機(jī)器學(xué)習(xí)的分類準(zhǔn)確性提出了較高的挑戰(zhàn),導(dǎo)致經(jīng)典機(jī)器學(xué)習(xí)算法在認(rèn)知功能障礙識(shí)別中的應(yīng)用存在一些局限性。例如,在傳統(tǒng)的機(jī)器學(xué)習(xí)算法中,特征提取和特征分類是分開的兩個(gè)步驟,并且需要研究人員具備更多的經(jīng)驗(yàn)和先驗(yàn)知識(shí)。深度學(xué)習(xí)則可以結(jié)合特征分類和提取,利用深度神經(jīng)網(wǎng)絡(luò)直接提取相關(guān)特征,一步完成腦電信號處理。直接處理原始數(shù)據(jù)并自動(dòng)提取和選擇特征的能力是深度學(xué)習(xí)方法應(yīng)用越來越廣泛的原因之一。此外,深度學(xué)習(xí)算法適應(yīng)性和可移植性好,有著超強(qiáng)的學(xué)習(xí)能力和表征能力。ANN、RNN和CNN是認(rèn)知功能障礙識(shí)別中被廣泛使用的深度學(xué)習(xí)方法。
4.3.1人工神經(jīng)網(wǎng)絡(luò)
除了傳統(tǒng)的機(jī)器學(xué)習(xí)方法外,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)在認(rèn)知功能障礙的分類應(yīng)用上也越來越廣泛。深度學(xué)習(xí)模型可以挖掘數(shù)據(jù)更多的潛在特征,提高分類性能。ANN從信息處理角度抽象人腦神經(jīng)元網(wǎng)絡(luò),按不同的連接方式組成不同的網(wǎng)絡(luò),具有強(qiáng)大的自學(xué)習(xí)和自適應(yīng)能力,以及較高的容錯(cuò)性。Rutkowski等[18]將4個(gè)通道的多尺度熵特征輸入基于密集連接的全連接深度神經(jīng)網(wǎng)絡(luò)分類MCI和HC,平均準(zhǔn)確率超過80%。Santos等[48]計(jì)算相對功率和非線性特征輸入由多項(xiàng)式核SVM和兩層神經(jīng)網(wǎng)絡(luò)組成的三項(xiàng)分類器中,總體準(zhǔn)確率達(dá)到了92.6%。Rodrigues等[15]將時(shí)頻特征通過遺傳算法進(jìn)行特征選擇后輸入代理決策樹、SVM和ANN分類器,ANN分類器的性能最好,準(zhǔn)確率為95.55%,并有較好的泛化性能。
4.3.2循環(huán)神經(jīng)網(wǎng)絡(luò)
RNN包含的循環(huán)層可以記憶之前的信息,并基于這些信息預(yù)測當(dāng)前的輸入,而腦電信號中可能存在重復(fù)出現(xiàn)的模式或特征,因此RNN在處理腦電時(shí)間序列信號上有良好表現(xiàn)。此外RNN可以學(xué)習(xí)序列數(shù)據(jù)的長期依賴關(guān)系,而腦電信號是人腦活動(dòng)的反映,其中包含大量的長期依賴關(guān)系,使用RNN可以學(xué)習(xí)并預(yù)測這些長期依賴關(guān)系。常見的用于認(rèn)知功能障礙分類中的RNN主要是長短期記憶(Long Short-Term Memory, LSTM)網(wǎng)絡(luò)和門控循環(huán)單元(Gated Recurrent Unit, GRU)。Sridhar等[44]將多個(gè)刺激試驗(yàn)的腦電信號通過PLA降維,輸入深度雙向LSTM神經(jīng)網(wǎng)絡(luò),發(fā)現(xiàn)大多數(shù)特征在40~60歲年齡段的分類準(zhǔn)確率最高。Alvi等[52]設(shè)計(jì)了20個(gè)不同的LSTM模型進(jìn)行MCI患者的識(shí)別,準(zhǔn)確率最高為96.41%。Alvi等[53]又比較GRU、LSTM、SVM和NN對MCI的分類效果,GRU的分類效果最好,LSTM接近,而SVM和NN較差。
4.3.3卷積神經(jīng)網(wǎng)絡(luò)
CNN作為圖像分類和識(shí)別的研究熱點(diǎn)之一,在圖像分類上表現(xiàn)良好。通過與圖像像素卷積,直接從圖像像素中提取圖像特征,能夠有效處理輸入的二維數(shù)據(jù)的復(fù)雜性。不少研究者嘗試將腦電信號特征轉(zhuǎn)換成二維圖像輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別分類,并得到較好的分類效果。Bi等[8]提出了基于多任務(wù)框架下的判別式收縮脈沖實(shí)值深層卷積玻爾茲曼機(jī)用于AD的早期診斷,二維功率譜圖像作為特征輸入,達(dá)到95.04%的準(zhǔn)確性。Huggins等[43]將腦電信號進(jìn)行小波變換后轉(zhuǎn)換為時(shí)頻圖,將多個(gè)通道的時(shí)頻圖拼接后輸入改進(jìn)的AlexNet模型中,AD的分類準(zhǔn)確率達(dá)到99.3%±0.4%,MCI和健康人群分別為98.3%±0.6%和98.8%±0.5%。Ieracitano等[39]計(jì)算各通道的功率譜密度并轉(zhuǎn)換為二維灰度圖像,輸入設(shè)計(jì)的CNN中對AD、MCI和HC分類,二分類的平均準(zhǔn)確率為89.8%,三分類的準(zhǔn)確率為83.3%。Mazrooei等[40]提取腦電信號Pz、Cz和Fz這3個(gè)通道的線性和非線性特征,輸入LDA、Elman神經(jīng)網(wǎng)絡(luò)和CNN這3種模型識(shí)別輕度AD患者,CNN的性能優(yōu)于LDA和Elman,而且Pz通道的準(zhǔn)確率較高。Wei等[37]構(gòu)建一個(gè)引入混合注意模塊CBAM(Convolutional Block Attention Module)的CNN模型對MCI和HC分類,采用卷積核提取腦電信號特征,通過混合注意模塊充分利用特征的潛在信息,此外保留卷積層的原始特征,以增加網(wǎng)絡(luò)的豐富性,實(shí)驗(yàn)結(jié)果表明,它比現(xiàn)有算法具有明顯的優(yōu)越性,具有更高的識(shí)別精度。Fouladi等[45]提出了改進(jìn)CNN和基于自編碼器的CNN用于AD、MCI和HC分類,所提的改進(jìn)CNN比基于自編碼器的CNN表現(xiàn)得更準(zhǔn)確。Drage等[49]計(jì)算不同時(shí)間長度的腦電信號的基于相關(guān)系數(shù)和復(fù)雜度的灰度圖,并輸入AlexNet模型,使用5 s的相關(guān)系數(shù)圖像作為輸入特征時(shí),分類準(zhǔn)確率最高可達(dá)98.13%。
CNN不僅具有良好的分類性能,而且易于進(jìn)行迭代訓(xùn)練,因此越來越受到腦電研究人員的青睞。但是CNN可能由于過度置信存在高假陽性率的問題,而且訓(xùn)練CNN可能需要大量的數(shù)據(jù)支撐,一個(gè)簡單的模型訓(xùn)練就需要消耗大量時(shí)間;此外,CNN包含許多超參數(shù),導(dǎo)致計(jì)算復(fù)雜性增加和參數(shù)調(diào)整困難。
總體地,深度學(xué)習(xí)較傳統(tǒng)的機(jī)器學(xué)習(xí)方法有著更好的分類性能,無須進(jìn)行復(fù)雜的特征工程,可以對缺少標(biāo)簽的數(shù)據(jù)進(jìn)行無監(jiān)督學(xué)習(xí),盡可能挖掘數(shù)據(jù)的潛在特征,在處理腦電這一復(fù)雜生理信號時(shí)有明顯優(yōu)勢。但是與非深度學(xué)習(xí)模型相比,深度學(xué)習(xí)模型的正確訓(xùn)練需要更多的數(shù)據(jù)支撐,因此研究人員需要收集盡可能多的真實(shí)腦電數(shù)據(jù),以確保數(shù)據(jù)集的多樣性,和減少腦電信號中個(gè)體間差異的影響,使模型更加健壯。其次,深度學(xué)習(xí)算法高度復(fù)雜,對硬件設(shè)施要求高,并且作為黑箱模型,可解釋性差。在基于腦電信號的認(rèn)知功能障礙識(shí)別分類研究中,并不只追求高準(zhǔn)確性這一目標(biāo),更希望通過模型獲取有關(guān)疾病狀態(tài)的信息,通過腦電特征揭示神經(jīng)機(jī)制。因此,深度學(xué)習(xí)需要繼續(xù)提高可解釋性,成為研究神經(jīng)機(jī)制的強(qiáng)大工具。
目前,腦機(jī)接口作為一種利用實(shí)時(shí)的腦電信號提高、復(fù)原或者替代身體和認(rèn)知能力的技術(shù),具有實(shí)時(shí)反饋性,可以改善神經(jīng)認(rèn)知功能,逐漸被應(yīng)用于認(rèn)知康復(fù)領(lǐng)域。將神經(jīng)反饋訓(xùn)練和腦機(jī)接口結(jié)合,可以提供基于腦電信號的實(shí)時(shí)反饋,能夠可視化識(shí)別受試者當(dāng)前估計(jì)的認(rèn)知狀態(tài)。因此,受試者可以通過腦機(jī)接口學(xué)習(xí)如何調(diào)節(jié)他們的大腦腦電信號活動(dòng),以完成不同的認(rèn)知訓(xùn)練任務(wù),從而達(dá)到改善認(rèn)知功能的目的。McLaughlin等[54]通過具有神經(jīng)反饋訓(xùn)練的腦機(jī)接口系統(tǒng),使用P300的拼寫范式實(shí)驗(yàn)干預(yù)輕度AD患者,初步證明可行性。Jirayucharoensak等[55]提出的基于游戲的神經(jīng)反饋訓(xùn)練系統(tǒng),證實(shí)在改善健康老年婦女和MCI女性認(rèn)知功能的特定領(lǐng)域和持續(xù)注意力能力方面具有臨床療效,可以作為一種增強(qiáng)MCI患者和健康老年受試者認(rèn)知表現(xiàn)的替代療法。
基于腦電信號的認(rèn)知功能障礙分類識(shí)別看重分類算法的準(zhǔn)確率,高準(zhǔn)確率保證分類模型的臨床實(shí)用性;而腦機(jī)接口更看重分類算法的運(yùn)算速度,可以相對犧牲部分準(zhǔn)確率以保證高效的實(shí)時(shí)反饋。高精度和高速率的統(tǒng)一是腦機(jī)接口不斷追求的方向;不僅如此,可以開發(fā)多元的反饋訓(xùn)練,幫助受試者在訓(xùn)練中加強(qiáng)更多認(rèn)知技能,有益于改善多個(gè)認(rèn)知領(lǐng)域的功能。
本文檢索了近年來通過腦電信號對認(rèn)知功能障礙患者進(jìn)行識(shí)別分類的文獻(xiàn),對常用的腦電特征和分類方法進(jìn)行了歸納總結(jié)。大部分研究都達(dá)到滿意的分類效果,尤其對AD患者,腦電信號完全可以成為AD患者早期診斷強(qiáng)有力的工具之一。在腦電信號的特征提取上,除了傳統(tǒng)分析方法提取的五類特征外,研究者們嘗試不同的特征組合以及提出新的腦電特征提高性能。在機(jī)器學(xué)習(xí)分類方法上,SVM被廣泛應(yīng)用,分類表現(xiàn)不錯(cuò)。而深度學(xué)習(xí)也因?yàn)椴恍枰卣鞴こ碳胺夯芰?qiáng)等優(yōu)點(diǎn)逐漸被應(yīng)用于認(rèn)知功能障礙患者的識(shí)別分類研究領(lǐng)域。
1)實(shí)驗(yàn)研究方法差異性高,橫向比較困難。
由于腦電信號的高便攜性和可及性,研究人員更傾向于自行獲取數(shù)據(jù),這導(dǎo)致存在大量不同的實(shí)驗(yàn)設(shè)置[56]。從被試篩選,到腦電信號采集,再到數(shù)據(jù)預(yù)處理都顯著不同。被試的篩選標(biāo)準(zhǔn)并不統(tǒng)一,人口學(xué)和臨床特征也存在差異。腦電信號記錄的時(shí)間長度跨度大,從幾秒到幾分鐘,并且電極數(shù)量和位置等硬件設(shè)備也各不相同。而預(yù)處理過程中需要人工剔除偽影,該過程存在不可復(fù)制性[57]。所有細(xì)微的差異都會(huì)影響實(shí)驗(yàn)結(jié)果,直接后果是大多數(shù)研究只能在本研究的數(shù)據(jù)集上進(jìn)行分析,實(shí)驗(yàn)結(jié)果橫向比較存在困難,并不能保證該結(jié)果的真實(shí)性和可推廣性,因此無法分析在認(rèn)知功能障礙識(shí)別上最優(yōu)的特征組合和分類器。
2)樣本量太少,存在過擬合和泛化性低等問題。
大多數(shù)研究都存在樣本量太少的問題。腦電信號樣本數(shù)量是限制分類性能的重要因素。基于更大范圍的樣本可以得出更可靠的結(jié)論,尤其是通過深度學(xué)習(xí)訓(xùn)練更有效的分類模型時(shí),需要更多的腦電數(shù)據(jù)進(jìn)行支撐。雖然腦電信號采集與功能核磁共振等相比較為方便,但是采集腦電信號過程中也存在一些限制,對被采集者和周圍環(huán)境等有一定的要求,導(dǎo)致腦電信號樣本數(shù)量受到限制。此外,采集過程中不可控的環(huán)境因素會(huì)對腦電信號造成不同程度的干擾,預(yù)處理步驟尤為關(guān)鍵。雖然已經(jīng)能夠?qū)崿F(xiàn)腦電信號自動(dòng)預(yù)處理,但為了得到更加干凈的腦電信號,仍需要手動(dòng)對腦電信號進(jìn)行篩查,這也導(dǎo)致采集腦電信號的工作量增加。并且大多數(shù)研究分類模型的高分類準(zhǔn)確率僅針對該研究的小樣本數(shù)據(jù)集,難以保持穩(wěn)定的泛化能力,腦電信號的個(gè)體差異也使得很難獲得普遍適用的一般模型,各個(gè)研究的模型效果也無法進(jìn)行有效的對比分析[58]。
3)缺乏分類模型的創(chuàng)新。
可以觀察到檢索的文獻(xiàn)中對特征提取階段的重視程度較高,而對分類階段的重視程度較低,并且缺乏對分類模型的創(chuàng)新。大部分都是基于目前常有的分類方法進(jìn)行應(yīng)用,只是對模型的參數(shù)進(jìn)行修改,并未提出更好的分類模型解決目前的分類方法存在的弊端。
本文認(rèn)為基于腦電信號的認(rèn)知功能障礙識(shí)別分類研究未來將在以下方面繼續(xù)展開。
1)希望未來研究者們能夠共同創(chuàng)建一個(gè)免費(fèi)公開共享的、數(shù)據(jù)量大的認(rèn)知功能障礙患者腦電數(shù)據(jù)庫,基于多中心、多實(shí)驗(yàn)條件的腦電信號展開進(jìn)一步研究,并且在腦電信號數(shù)據(jù)收集和實(shí)驗(yàn)方案方面開展標(biāo)準(zhǔn)化工作,減少腦電信號受其他因素的干擾。
2)優(yōu)化特征提取和分類方法。各個(gè)研究在特征處理和分類方法上各有優(yōu)點(diǎn)和不足,還需要繼續(xù)通過更多的腦電信號分析方法挖掘更具代表性的腦電特征,尋找更適配的分類方法,并在大數(shù)據(jù)庫進(jìn)行模型優(yōu)化。
3)進(jìn)行多模態(tài)特征融合。目前將腦電信號和其他生理數(shù)據(jù)特征融合的應(yīng)用較少,需要更進(jìn)一步的探索。將腦電信號與核磁共振成像以及功能性近紅外光譜等數(shù)據(jù)進(jìn)行多模態(tài)融合[59-61],互補(bǔ)特征信息,可增大時(shí)間和空間分辨率,有效提升識(shí)別分類精度。
4)結(jié)合不同的認(rèn)知刺激范式,以更好地探索認(rèn)知變化[62]。由于認(rèn)知功能障礙會(huì)影響大腦的多個(gè)認(rèn)知區(qū)域,單一的靜息態(tài)腦電信號無法全面體現(xiàn)患者的認(rèn)知功能變化。根據(jù)患者的疾病發(fā)展程度采用不同的實(shí)驗(yàn)范式,精確反映患者的認(rèn)知變化。
5)進(jìn)行縱向研究,挖掘能夠反映疾病進(jìn)展的敏感特征,對認(rèn)知功能障礙的進(jìn)展程度進(jìn)行預(yù)測。目前的研究都是針對MCI和AD患者的可分性展開,屬于橫向的比較和分類。認(rèn)知功能障礙的嚴(yán)重程度是在不斷發(fā)展的,未來可以對認(rèn)知功能障礙的嚴(yán)重程度進(jìn)行預(yù)測,實(shí)現(xiàn)對患者當(dāng)前的認(rèn)知損害程度的精確評估,從而更加有針對性地進(jìn)行干預(yù),并對干預(yù)措施的有效程度進(jìn)行評價(jià)。
6)開發(fā)更加先進(jìn)的深度學(xué)習(xí)方法,除優(yōu)化常見的模型架構(gòu)之外,可以通過集成學(xué)習(xí)的方法對目前研究中表現(xiàn)良好的分類器進(jìn)行組合,得到更全面泛化性更好的分類模型,更能適應(yīng)各種規(guī)模的數(shù)據(jù)集。隨機(jī)子空間集成方法適用特征維度遠(yuǎn)大于樣本數(shù)量的情況,很適合腦電信號這類高維度特征,Rao等[63]在基于腦電信號的疲勞檢測中利用隨機(jī)子空間判別集成學(xué)習(xí)模型得到最高的準(zhǔn)確率和最好的魯棒性。除此之外,可利用深度Q網(wǎng)絡(luò)等算法這類深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合的算法,進(jìn)行未來腦機(jī)接口應(yīng)用場景下的模型優(yōu)化,Ming等[64]基于深度Q網(wǎng)絡(luò)設(shè)計(jì)的關(guān)于疲勞估計(jì)模型證實(shí)能夠較好地根據(jù)測試腦電信號追蹤到大腦狀態(tài)的變化。其次,深度學(xué)習(xí)算法的改進(jìn)需要不斷匹配腦科學(xué)機(jī)制的進(jìn)步。無監(jiān)督或半監(jiān)督深度學(xué)習(xí)方法也需要不斷開發(fā),以應(yīng)用于缺失或不準(zhǔn)確標(biāo)記的腦電數(shù)據(jù)。通過綜合利用不同算法的優(yōu)勢,充分挖掘腦電信號的潛力,實(shí)現(xiàn)更高的分類性能,逐步應(yīng)用于臨床實(shí)踐中。
本文從腦電特征提取和分類方法兩方面出發(fā),總結(jié)基于腦電信號的認(rèn)知功能障礙識(shí)別分類的研究進(jìn)展,同時(shí)指出現(xiàn)有研究中的不足,提出未來發(fā)展方向。在目前已有的研究成果之上,未來繼續(xù)深入研究,優(yōu)化分類模型,探索增加泛化性和穩(wěn)定性的有效方法,并逐步應(yīng)用于臨床進(jìn)行輔助診斷,實(shí)現(xiàn)腦電信號在認(rèn)知功能障礙識(shí)別研究上的臨床應(yīng)用價(jià)值。
[1] UHLHAAS P J, SINGER W. Neural synchrony in brain disorders: relevance for cognitive dysfunctions and pathophysiology[J]. Neuron, 2006, 52(1): 155-168.
[2] FERREIRA-VIEIRA T H, GUIMARAES I M, SILVA F R, et al. Alzheimer’s disease: targeting the cholinergic system[J]. Current Neuropharmacology, 2016, 14(1): 101-115.
[3] KHATUN S, MORSHED B I, BIDELMAN G M. Single channel EEG time-frequency features to detect Mild Cognitive Impairment[C]// Proceedings of the 2017 IEEE International Symposium on Medical Measurements and Applications. Piscataway: IEEE, 2017: 437-442.
[4] WILLIAMS P, WHITE A, MERINO R B, et al. Facial recognition task for the classification of mild cognitive impairment with ensemble sparse classifier[C]// Proceedings of the 41st Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Piscataway: IEEE, 2019: 2242-2245.
[5] LI Y, XIAO S, LI Y, et al. Classification of Mild Cognitive Impairment from multi-domain features of resting-state EEG[C]// Proceedings of the 42nd Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Piscataway: IEEE, 2020: 256-259.
[6] SAFI M S, SAFI S M M. Early detection of Alzheimer’s disease from EEG signals using Hjorth parameters[J]. Biomedical Signal Processing and Control, 2021, 65: No.102338.
[7] RUIZ-GóMEZ S J, GóMEZ C, POZA J, et al. Automated multiclass classification of spontaneous EEG activity in Alzheimer’s disease and mild cognitive impairment[J]. Entropy, 2018, 20(1): No.35.
[8] BI X, WANG H. Early Alzheimer’s disease diagnosis based on EEG spectral images using deep learning[J]. Neural Networks, 2019, 114: 119-135.
[9] TRINH T T, TSAI C F, HSIAO Y T, et al. Identifying individuals with mild cognitive impairment using working memory-induced intra-subject variability of resting-state EEGs[J]. Frontiers in Computational Neuroscience, 2021, 15: No.700467.
[10] HSIAO Y T, TSAI C F, WU C T, et al. MCI detection using kernel eigen-relative-power features of EEG signals[J]. Actuators, 2021, 10(7): No.152.
[11] 武俠,鐘楚鵬,丁玉瓏,等. 利用時(shí)頻分析研究非相位鎖定腦電活動(dòng)[J]. 心理科學(xué)進(jìn)展, 2018, 26(8): 1349-1364.(WU X, ZHONG C P, DING Y L, et al. Application of time-frequency analysis in investigating non-phase locked components of EEG[J]. Advances in Psychological Science, 2018, 26(8): 1349-1364.)
[12] FISCON G, WEITSCHEK E, CIALINI A, et al. Combining EEG signal processing with supervised methods for Alzheimer’s patients classification[J]. BMC Medical Informatics and Decision Making, 2018, 18: No.35.
[13] DURONGBHAN P, ZHAO Y, CHEN L, et al. A dementia classification framework using frequency and time-frequency features based on EEG signals[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2019, 27(5): 826-835.
[14] IERACITANO C, MAMMONE N, BRAMANTI A, et al. A time-frequency based machine learning system for brain states classification via EEG signal processing[C]// Proceedings of the 2019 International Joint Conference on Neural Networks. Piscataway: IEEE, 2019: 1-8.
[15] RODRIGUES P M, BISPO B C, GARRETT C, et al. Lacsogram: a new EEG tool to diagnose Alzheimer’s disease[J]. IEEE Journal of Biomedical and Health Informatics, 2021, 25(9): 3384-3395.
[16] 曹銳. 非線性與復(fù)雜網(wǎng)絡(luò)理論在腦電數(shù)據(jù)分析中的應(yīng)用研究[D]. 太原:太原理工大學(xué), 2014: 4-5.(CAO R. Nonlinear and complex network theory in the Application of EEG data analysis research[D]. Taiyuan: Taiyuan University of Technology, 2014: 4-5.)
[17] DING Y, CHU Y, LIU M, et al. Fully automated discrimination of Alzheimer’s disease using resting-state electroencephalography signals[J]. Quantitative Imaging in Medicine and Surgery, 2022, 12(2): 1063-1078.
[18] RUTKOWSKI T M, ABE M S, KOMENDZI?SKI T, et al. Older adult mild cognitive impairment prediction from multiscale entropy EEG patterns in reminiscent interior image working memory paradigm[C]// Proceedings of the 43rd Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Piscataway: IEEE, 2021: 6345-6348.
[19] SIULY S, AL?IN ? F, KABIR E, et al. A new framework for automatic detection of patients with mild cognitive impairment using resting-state EEG signals[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2020, 28(9): 1966-1976.
[20] ?EKER M, ?ZBEK Y, YENER G, et al. Complexity of EEG dynamics for early diagnosis of Alzheimer’s disease using permutation entropy neuromarker[J]. Computer Methods and Programs in Biomedicine, 2021, 206: No.106116.
[21] AMEZQUITA-SáNCHEZ J P, MAMMONE N, MORABITO F C, et al. A novel methodology for automated differential diagnosis of mild cognitive impairment and the Alzheimer’s disease using EEG signals[J]. Journal of Neuroscience Methods, 2019, 322: 88-95.
[22] 李莉,陳靜靜,鄭旭媛. 基于同步似然分析的阿爾茨海默癥靜息態(tài)腦電功能連接特性的研究[J]. 生物醫(yī)學(xué)工程學(xué)雜志, 2015, 32(5):952-957.(LI L, CHEN J J, ZHENG X Y. Study on brain functional connectivity using resting state electroencephalogram based on synchronization likelihood in Alzheimer’s disease[J]. Journal of Biomedical Engineering, 2015, 32(5): 952-957.)
[23] SU R, LI X, LI Z, et al. Constructing biomarker for early diagnosis of aMCI based on combination of multiscale fuzzy entropy and functional brain connectivity[J]. Biomedical Signal Processing and Control, 2021, 70: No.103000.
[24] SONG Z, DENG B, WANG J, et al. Biomarkers for Alzheimer’s disease defined by a novel brain functional network measure[J]. IEEE Transactions on Biomedical Engineering, 2019, 66(1): 41-49.
[25] VECCHIO F, MIRAGLIA F, ALù F, et al. Classification of Alzheimer’s disease with respect to physiological aging with innovative EEG biomarkers in a machine learning implementation[J]. Journal of Alzheimer’s Disease, 2020, 75(4): 1253-1261.
[26] YU H, ZHU L, CAI L, et al. Identification of Alzheimer’s EEG with a WVG network-based fuzzy learning approach[J]. Frontiers in Neuroscience, 2020, 14: No.641.
[27] LI X, YANG C, XIE P, et al. The diagnosis of amnestic mild cognitive impairment by combining the characteristics of brain functional network and support vector machine classifier[J]. Journal of Neuroscience Methods, 2021, 363: No.109334.
[28] NOBUKAWA S, YAMANISHI T, KASAKAWA S, et al. Classification methods based on complexity and synchronization of electroencephalography signals in Alzheimer’s disease[J]. Frontiers in Psychiatry, 2020, 11: No.255.
[29] TZIMOURTA K D, GIANNAKEAS N, TZALLAS A T, et al. EEG window length evaluation for the detection of Alzheimer’s disease over different brain regions[J]. Brain Sciences, 2019, 9(4): No.81.
[30] FAN M, YANG A C, FUH J L, et al. Topological pattern recognition of severe Alzheimer’s disease via regularized supervised learning of EEG complexity[J]. Frontiers in Neuroscience, 2018, 12: No.685.
[31] IERACITANO C, MAMMONE N, HUSSAIN A, et al. A novel multi-modal machine learning based approach for automatic classification of EEG recordings in dementia[J]. Neural Networks, 2020, 123:176-190.
[32] TRAMBAIOLLI L R, SPOLA?R N, LORENA A C, et al. Feature selection before EEG classification supports the diagnosis of Alzheimer’s disease[J]. Clinical Neurophysiology, 2017, 128(10): 2058-2067.
[33] TAVARES G, SAN-MARTIN R, IANOF J N, et al. Improvement in the automatic classification of Alzheimer’s disease using EEG after feature selection[C]// Proceedings of the 2019 IEEE International Conference on Systems, Man and Cybernetics. Piscataway: IEEE, 2019: 1264-1269.
[34] CAI L, WEI X, LIU J, et al. Functional integration and segregation in multiplex brain networks for Alzheimer’s disease[J]. Frontiers in Neuroscience, 2020, 14: No.51.
[35] KHATUN S, MORSHED B I, BIDELMAN G M. A single-channel EEG-based approach to detect mild cognitive impairment via speech-evoked brain responses[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2019, 27(5): 1063-1070.
[36] DeTURE M A, DICKSON D W. The neuropathological diagnosis of Alzheimer’s disease[J]. Molecular Neurodegeneration, 2019, 14: No.32.
[37] WEI J, XIAO W, ZHANG S, et al. Mild cognitive impairment classification convolutional neural network with attention mechanism[C]// Proceedings of the IEEE 16th International Conference on Control and Automation. Piscataway: IEEE, 2020: 1074-1078.
[38] BETROUNI N, DELVAL A, CHATON L, et al. Electroencephalography-based machine learning for cognitive profiling in Parkinson’s disease: preliminary results[J]. Movement Disorders, 2019, 34(2): 210-217.
[39] IERACITANO C, MAMMONE N, BRAMANTI A, et al. A Convolutional Neural Network approach for classification of dementia stages based on 2D-spectral representation of EEG recordings[J]. Neurocomputing, 2019, 323: 96-107.
[40] MAZROOEI RAD E, AZARNOOSH M, GHOSHUNI M, et al. Diagnosis of mild Alzheimer’s disease by EEG and ERP signals using linear and nonlinear classifiers[J]. Biomedical Signal Processing and Control, 2021, 70: No.103049.
[41] ZHANG J, GAO Y, HE X, et al. Identifying Parkinson’s disease with mild cognitive impairment by using combined MR imaging and electroencephalogram[J]. European Radiology, 2021, 31(10): 7386-7394.
[42] YIN J, CAO J, SIULY S, et al. An integrated MCI detection framework based on spectral-temporal analysis[J]. International Journal of Automation and Computing, 2019, 16(6): 786-799.
[43] HUGGINS C J, ESCUDERO J, PARRA M A, et al. Deep learning of resting-state electroencephalogram signals for three-class classification of Alzheimer’s disease, mild cognitive impairment and healthy ageing[J]. Journal of Neural Engineering, 2021, 18(4): No.046087.
[44] SRIDHAR S, MANIAN V. EEG and deep learning based brain cognitive function classification[J]. Computers, 2020, 9(4): No.104.
[45] FOULADI S, SAFAEI A A, MAMMONE N, et al. Efficient deep neural networks for classification of Alzheimer’s disease and mild cognitive impairment from scalp EEG recordings[J]. Cognitive Computation, 2022, 14(4):1247-1268.
[46] KASHEFPOOR M, RABBANI H, BAREKATAIN M. Supervised dictionary learning of EEG signals for mild cognitive impairment diagnosis[J]. Biomedical Signal Processing and Control, 2019, 53: No.101559.
[47] OLTU B, AK?AHIN M F, KIBARO?LU S. A novel electroencephalography based approach for Alzheimer’s disease and mild cognitive impairment detection[J]. Biomedical Signal Processing and Control, 2021, 63: No.102223.
[48] SANTOS TOURAL J E, MONTOYA PEDRóN A, MARA?óN REYES E J. Classification among healthy, mild cognitive impairment and Alzheimer’s disease subjects based on wavelet entropy and relative beta and theta power[J]. Pattern Analysis and Applications, 2021, 24(2): 413-422.
[49] DRAGE R, ESCUDERO J, PARRA M A, et al. A novel deep learning approach using AlexNet for the classification of electroencephalograms in Alzheimer’s Disease and Mild Cognitive Impairment[C]// Proceedings of the 44th Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Piscataway: IEEE, 2022: 3175-3178.
[50] 周志華. 機(jī)器學(xué)習(xí)[M]. 北京:清華大學(xué)出版社, 2016:60.(ZHOU Z H. Machine Learning[M]. Beijing: Tsinghua University Press, 2016: 60.)
[51] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[52] ALVI A M, SIULY S, WANG H. A long short-term memory based framework for early detection of mild cognitive impairment from EEG signals[J]. IEEE Transactions on Emerging Topics in Computational Intelligence, 2023, 7(2): 375-388.
[53] ALVI A M, SIULY S, WANG H, et al. A deep learning based framework for diagnosis of mild cognitive impairment[J]. Knowledge-Based Systems, 2022, 248: No.108815.
[54] McLAUGHLIN D, KLEE D, MEMMOTT T, et al. Methodology and preliminary data on feasibility of a neurofeedback protocol to improve visual attention to letters in mild Alzheimer’s disease[J]. Contemporary Clinical Trials Communications, 2022, 28: No.100950.
[55] JIRAYUCHAROENSAK S, ISRASENA P, PAN-NGUM S, et al. A game-based neurofeedback training system to enhance cognitive performance in healthy elderly subjects and in patients with amnestic mild cognitive impairment[J]. Clinical Interventions in Aging, 2019, 14: 347-360.
[56] TANVEER M, RICHHARIYA B, KHAN R U, et al. Machine learning techniques for the diagnosis of Alzheimer’s disease: a review[J]. ACM Transactions on Multimedia Computing, Communications and Applications, 2020, 16(1s): No.30.
[57] CASSANI R, ESTARELLAS M, SAN-MARTIN R, et al. Systematic review on resting-state EEG for Alzheimer’s disease diagnosis and progression assessment[J]. Disease Markers, 2018, 2018: No.5174815.
[58] LAW Z K, TODD C, MEHRARAM R, et al. The role of EEG in the diagnosis, prognosis and clinical correlations of dementia with Lewy bodies — a systematic review[J]. Diagnostics, 2020, 10(9): No.616.
[59] JESUS B, Jr., CASSANI R, McGEOWN W J, et al. Multimodal prediction of Alzheimer’s disease severity level based on resting-state EEG and structural MRI[J]. Frontiers in Human Neuroscience, 2021, 15: No.700627.
[60] CICALESE A C, LI R, AHMADI M B, et al. An EEG-fNIRS hybridization technique in the four-class classification of Alzheimer’s disease[J]. Journal of Neuroscience Methods, 2020, 336: No.108618.
[61] HO T K K, KIM M, JEON Y, et al. Improving the multi‐class classification of Alzheimer’s disease with machine learning‐based techniques: an EEG-fNIRS hybridization study[J]. Alzheimer’s and Dementia, 2021, 17(S7): No.e057565.
[62] YANG S, BORNOT J M S, WONG-LIN K, et al. M/EEG-based bio-markers to predict the MCI and Alzheimer’s disease: a review from the ML perspective[J]. IEEE Transactions on Biomedical Engineering, 2019, 66(10): 2924-2935.
[63] RAO S, LI K, WU J, et al. Application of ensemble learning in EEG signal analysis of fatigue driving[J]. Journal of Physics: Conference Series, 2021, 1744(4): No.042193.
[64] MING Y, WU D, WANG Y K, et al. EEG-based drowsiness estimation for driving safety using deep Q-learning[J]. IEEE Transactions on Emerging Topics in Computational Intelligence, 2021, 5(4): 583-594.
Review on advances in recognition and classification of cognitive impairment based on EEG signals
ZHANG Junpeng1, SHI Yujie1, JANG Rui1, DONG Jingjing2, QIU Changjian3*
(1,,610065,;2,’,200052,;3,,610041,)
Early detection and timely intervention of cognitive impairment are crucial to slow down the progress of the disease. The ElectroEncephaloGraphy (EEG) signal has become an important tool for the investigation of biomarkers of cognitive diseases due to its high temporal resolution and easy acquisition. Compared with the traditional biomarker recognition method, the machine learning method has higher accuracy and better stability for the recognition and classification of cognitive impairment based on EEG signals. Aiming at the relevant research literature on the recognition and classification of cognitive impairment based on EEG signals in the past three years, firstly, from the perspectives of five categories of EEG features commonly used in the recognition and classification of cognitive impairment, including time domain, frequency domain, combination of time and frequency domains, nonlinear dynamics, functional connectivity and brain network, more representative EEG features were found. Then, the currently commonly used classification methods based on machine learning and deep learning, such as Support Vector Machine (SVM), Linear Discriminant Analysis (LDA),-Nearest Neighbor (NN) and Artificial Neural Network (ANN), as well as their performance were summarized. Finally, the current problems in different kinds of studies were analyzed, and the future research directions in this field were prospected, thereby providing reference for the follow-up research on the recognition and classification of cognitive impairment based on EEG signals.
ElectroEncephaloGraphy (EEG) signal; machine learning; cognitive impairment; deep learning; feature extraction
This work is partially supported by Key Project of Mathematics Tianyuan Foundation of National Natural Science Foundation of China (12126606), Key Research and Development Project of Department of Science and Technology of Sichuan Province (2022YFS0345).
ZHANG Junpeng, born in 1975, Ph. D., associate professor. His research interests include ElectroEncephaloGraphy (EEG) based cognitive impairment assessment, electroencephalogram based individual recognition, electroencephalogram assisted diagnosis of mental disorders.
SHI Yujie, born in 1998, M. S. candidate. Her research interests include EEG data analysis.
JIANG Rui, born in 1998, M. S. candidate. His research interests include brain-computer interface, target tracking.
DONG Jingjing, born in 1984, Ph. D., deputy chief physician. Her research interests include diagnosis and treatment of secret service personnel, occupational prevention and treatment as well as cognitive assessment.
QIU Changjian, born in 1975, Ph. D., chief physician. His research interests include neuropathological mechanism and neurocognition of emotional disorders.
1001-9081(2023)10-3297-12
10.11772/j.issn.1001-9081.2022101471
2022?10?08;
2023?01?23;
國家自然科學(xué)基金數(shù)學(xué)天元基金重點(diǎn)專項(xiàng)(12126606);四川省科技廳重點(diǎn)研發(fā)項(xiàng)目(2022YFS0345)。
張軍鵬(1975—),男,陜西韓城人,副教授,博士,主要研究方向:基于腦電(EEG)的認(rèn)知障礙評估、腦電圖個(gè)體識(shí)別、腦電圖輔助精神障礙診斷; 施玉杰(1998—),女,四川瀘州人,碩士研究生,主要研究方向:EGG數(shù)據(jù)分析; 蔣睿(1998—),男,江西南康人,碩士研究生,主要研究方向:腦機(jī)接口、目標(biāo)跟蹤; 董靜靜(1984—),女,陜西大荔人,副主任醫(yī)師,博士,主要研究方向:特勤人員診療、職業(yè)性防治及認(rèn)知評估; 邱昌建(1975—),男,四川眉山人,主任醫(yī)師,博士,主要研究方向:情緒障礙的神經(jīng)病理機(jī)制及神經(jīng)認(rèn)知。
TP18
A
2023?02?03。