董寅冬,任福繼,李春彬
1 合肥工業(yè)大學(xué)計(jì)算機(jī)與信息學(xué)院,安徽 合肥 230601;
2 情感計(jì)算與先進(jìn)智能機(jī)器安徽省重點(diǎn)實(shí)驗(yàn)室,安徽 合肥 230601;
3 德島大學(xué)工學(xué)部,德島770-8509,日本
人機(jī)交互(Man-machine interface,MCI)在近年來(lái)影響著我們生活的方方面面,如人與人的交流與溝通、購(gòu)物、求職、教育、醫(yī)療和娛樂(lè)等[1-2]。在交互的過(guò)程中機(jī)器可以理解人的情感狀態(tài)并加以應(yīng)用,我們把這種表達(dá)方式稱之為情感計(jì)算(affective computing,AC)[2-4]。情感計(jì)算可以讓機(jī)器具備一定的情感表達(dá)能力,并能夠在系統(tǒng)和智能設(shè)備之間識(shí)別、解釋和處理人類的情感。目前,情感識(shí)別已經(jīng)成為情感計(jì)算的重要研究熱點(diǎn),人臉表情[5-6]、語(yǔ)音[7]、姿態(tài)[8]、文本[9-10]以及人類自發(fā)神經(jīng)系統(tǒng)產(chǎn)生的生理信號(hào)可以用來(lái)進(jìn)行情感認(rèn)知的表達(dá)[11-14]。腦電信號(hào)(Electroencephalogram,EEG)的采集直接來(lái)源于中樞神經(jīng)系統(tǒng),它作為一種有效的生理表達(dá)能夠真實(shí)地反應(yīng)大腦的情感變化。由于在連續(xù)音樂(lè)視頻激勵(lì)下產(chǎn)生的EEG 信號(hào)較為穩(wěn)定和持續(xù),本文使用DEAP 數(shù)據(jù)庫(kù)對(duì)腦電情感狀態(tài)進(jìn)行識(shí)別和分析。
眾多學(xué)者對(duì)腦電情感識(shí)別的研究主要集中在特征層面和模型分類層面。在特征層面上,時(shí)域特征主要有事件相關(guān)電位EPR,統(tǒng)計(jì)特征(能量、均值、標(biāo)準(zhǔn)差、一、二階差分等)、Hjorth 參數(shù)、分形維度FD 以及高階交叉參數(shù)HOC 等;時(shí)頻特征主要包括頻帶能量、小波(包)能量、高階譜,希爾伯特黃譜HHS 和離散小波變換等;非線性特征包括一些基于熵的特征值(香濃熵、小波包熵、差分熵等)、C0 復(fù)雜度、相關(guān)維、李雅普諾夫指數(shù)等[15-16]。文獻(xiàn)[17]針對(duì)經(jīng)驗(yàn)?zāi)B(tài)分解得到功率譜密度(power spectral density,PSD)特征,并采用高斯核的SVM 單獨(dú)對(duì)每個(gè)被試進(jìn)行識(shí)別,取得平均68.3%的分類準(zhǔn)確率。文獻(xiàn)[18]采用IMF 結(jié)合對(duì)應(yīng)的能量和幅值差使得在積極與消極情緒之間的識(shí)別率獲得了近10%的提升。文獻(xiàn)[19]使用非線性特征差分熵(differential entropy,DE)結(jié)合圖規(guī)則化極端學(xué)習(xí)機(jī)(graph regularized extreme learning machine,GELM)在情感的四分類上獲得了69.67%的準(zhǔn)確率。文獻(xiàn)[20]提出了一種基于PCA 融合小波能量特征、近似熵和Hurst 指數(shù)的腦電特征提取算法,針對(duì)八種情感的兩兩分類取得了平均85%的準(zhǔn)確率。但這些文獻(xiàn)在對(duì)腦電信號(hào)提取特征后沒(méi)有進(jìn)行非線性核的變換,且識(shí)別性能會(huì)因一些相關(guān)性較弱的特征以及特征之間的冗余而下降。從模型層面上來(lái)說(shuō),文獻(xiàn)[21]使用自編碼神經(jīng)網(wǎng)絡(luò)和LSTM 相結(jié)合的方法在四分類情感上取得了最高76.23%的分類準(zhǔn)確率。文獻(xiàn)[22]利用時(shí)頻特征結(jié)合深度卷積神經(jīng)網(wǎng)絡(luò)(deep CNN)使腦電特征相對(duì)于傳統(tǒng)BT 分類模型在valence 和dimension 維度上分別提高了3.58%和3.29%。文獻(xiàn)[23]使用granger 因果關(guān)系作為腦電特征,并結(jié)合 lasso 算法進(jìn)行特征選擇,最后通過(guò)SVM 識(shí)別在二維情感維度上分別取得87.15%和86.60%的平均準(zhǔn)確率。文獻(xiàn)[24-25]使用最小冗余度最大相關(guān)(minimum redundancy maximum relevance,mRMR)對(duì)PSD 進(jìn)行特征選擇,在一定程度上提升了分類效果。但這些文獻(xiàn)中特征選擇過(guò)程和分類模型算法是相互孤立的,無(wú)法在算法上形成優(yōu)勢(shì)的互補(bǔ)。因此,一個(gè)合適的分類模型對(duì)腦電信號(hào)實(shí)現(xiàn)特征的選擇和情感狀態(tài)的識(shí)別尤為重要。
XGBoost 是在2014 年被Chen 提出[26]的一種集成學(xué)習(xí)算法,它具有運(yùn)行速度快、計(jì)算復(fù)雜度低、易于調(diào)參、可控性強(qiáng)以及識(shí)別性能高等優(yōu)勢(shì)。一方面,該算法作為識(shí)別模型在工業(yè)、機(jī)器學(xué)習(xí)以及各種科研競(jìng)賽中都具有優(yōu)異的表現(xiàn)[27];另一方面,此算法能夠在樣本訓(xùn)練的過(guò)程中統(tǒng)計(jì)各個(gè)特征的重要性度量,實(shí)現(xiàn)特征的選擇[28-29]。因此XGBoost 能夠被廣泛應(yīng)用于各種模式的識(shí)別和事件的預(yù)測(cè)任務(wù)等[30-32],但是針對(duì)生理信號(hào)的識(shí)別領(lǐng)域卻鮮有研究。本文提出了一種線性核(linear kernel)核主成分分析(KPCA)結(jié)合XGBoost 模型的分類識(shí)別算法。首先,對(duì)每位被試的腦電信號(hào)在32 個(gè)通道上提取了不同頻段的PSD 特征,然后使用XGBoost 對(duì)樣本進(jìn)行訓(xùn)練,并在樹(shù)學(xué)習(xí)的過(guò)程中通過(guò)特征重要性指標(biāo)weight 選出和情感相關(guān)的腦電特征后,經(jīng)linear 核的KPCA 進(jìn)行特征處理,最后利用XGBoost 對(duì)處理后的特征進(jìn)行分類識(shí)別。該算法不但使腦電情感樣本在高維空間變得更加線性可分,又充分利用了XGBoost 在特征選擇和模式識(shí)別上的優(yōu)勢(shì),從而可以達(dá)到較好的情感識(shí)別效果。
集成學(xué)習(xí)是一種使用多個(gè)學(xué)習(xí)模型組成具有更強(qiáng)泛化能力的學(xué)習(xí)方法,對(duì)于大小規(guī)模數(shù)據(jù)的處理都會(huì)呈現(xiàn)出不錯(cuò)的學(xué)習(xí)效果。XGBoost 是對(duì)boosting 算法進(jìn)行改進(jìn)的一種有監(jiān)督集成學(xué)習(xí)模型,它實(shí)際上是一個(gè)附加訓(xùn)練(additive training)的過(guò)程,通過(guò)迭代對(duì)預(yù)測(cè)函數(shù)增加一棵新的分類回歸樹(shù)f t(xi)去優(yōu)化目標(biāo)函數(shù)
式(1)為模型的函數(shù)定義,k為樹(shù)的數(shù)目,F(xiàn)則為分類回歸樹(shù)(CART)的所有可能性集合,fk是F空間的子函數(shù)。q表示樹(shù)的結(jié)構(gòu)函數(shù),Ω(f)為定義為樹(shù)的復(fù)雜度,它是由樹(shù)的葉子結(jié)點(diǎn)數(shù)T以及每個(gè)葉子結(jié)點(diǎn)的得分w的L2 模平方?jīng)Q定的,用來(lái)作為正則化項(xiàng)的懲罰模型,γ和λ為需要調(diào)參的系數(shù)。
使用二階泰勒展開(kāi)對(duì)目標(biāo)函數(shù)進(jìn)行近似定義:
式中Ij為第j個(gè)葉子結(jié)點(diǎn)的樣本集合。
在樹(shù)的生成過(guò)程中,通過(guò)在特征上枚舉所有可能性劃分,然后使用精確貪心算法(exact greedy algorithm)得到最佳切分點(diǎn),從而尋找出一棵最優(yōu)結(jié)構(gòu)的樹(shù),這樣可以通過(guò)計(jì)算結(jié)點(diǎn)分裂前后的增益值G作為是否進(jìn)行分裂的依據(jù)。由下式(8),一個(gè)結(jié)點(diǎn)被分解得到左葉子結(jié)點(diǎn)分?jǐn)?shù)和右葉子結(jié)點(diǎn)分?jǐn)?shù)。對(duì)于某一特征,找到增益值最大的結(jié)點(diǎn)作為分裂結(jié)點(diǎn)。
根據(jù)特征在葉子結(jié)點(diǎn)的分割過(guò)程,可以看出每個(gè)特征在結(jié)點(diǎn)處的分裂次數(shù)weight 影響著整個(gè)樹(shù)模型的構(gòu)建,因此,本文選取weight 作為特征重要性度量。另外,和XGBoost 相關(guān)的特征重要指標(biāo)還包括gain、cover、total gain 和total cover。Gain 表示的是特征在切割樹(shù)的結(jié)點(diǎn)過(guò)程中產(chǎn)生的平均增益。Cover 表示特征在樹(shù)中的平均覆蓋范圍。Total gain 表示特征在所有樹(shù)中每次分裂節(jié)點(diǎn)所產(chǎn)生的總增益,Total cover 則表示特征在所有樹(shù)中每次分裂節(jié)點(diǎn)所覆蓋的全部樣例的數(shù)目。
本文采用大多數(shù)研究中使用頻段能量特征提取方法對(duì)腦電信號(hào)提取功率譜密度(PSD),PSD 是單位頻域內(nèi)信號(hào)功率的分布。具體過(guò)程是在不同的子頻段采用短時(shí)傅里葉變換(STFT)并結(jié)合漢明(Hamming)窗口函數(shù)對(duì)信號(hào)進(jìn)行分解。4 Hz~45 Hz 的頻段被分成了五個(gè)頻段,分別是theta:4 Hz~8 Hz,alpha:8 Hz~12 Hz,beta low:12 Hz~18 Hz,beta high:18 Hz~25 Hz 以及gamma:25 Hz~45 Hz,本文取各個(gè)子頻段的PSD 特征。
本文對(duì)PSD 特征進(jìn)行正則化(normalization)處理,以便后面使用核來(lái)規(guī)范樣本間的相似性。Normalization 是先按照式(9)計(jì)算每個(gè)樣本的p-范數(shù),再?gòu)臉颖局械拿總€(gè)元素除以此范數(shù),從而使得每個(gè)樣本縮放到單位范數(shù)。本文使用L2-norm 進(jìn)行正則化。
當(dāng)樣本在特征空間中難以進(jìn)行線性分割時(shí),可以試圖通過(guò)選擇特定的核函數(shù)對(duì)特征進(jìn)行升維,使之在高維空間變得線性可分,然后使用PCA 算法對(duì)高維空間的特征分量進(jìn)行降維。本文通過(guò)實(shí)驗(yàn)對(duì)比,選取線性核進(jìn)行KPCA 處理可以達(dá)到最佳的識(shí)別效果。
本文使用兩種實(shí)施方案來(lái)驗(yàn)證腦電情感識(shí)別效果。第一種方案是在每個(gè)被試內(nèi)部先進(jìn)行3-Fold 交叉驗(yàn)證,最后取所有被試情感識(shí)別的平均準(zhǔn)確率。這種方案一般可以得到較高的準(zhǔn)確率,但是僅僅是針對(duì)每個(gè)被試的內(nèi)部特征進(jìn)行訓(xùn)練,模型無(wú)法學(xué)習(xí)到所有被試的共性特征,本文把這種方案稱為被試單獨(dú)依賴(subject single dependent,SSD)。第二種方案是對(duì)所有被試的腦電信號(hào)段樣本進(jìn)行隨機(jī)打亂,然后使用XGBoost 進(jìn)行5-Fold 的交叉驗(yàn)證,這種處理方式使用多個(gè)被試樣本參與模型的訓(xùn)練和測(cè)試,更適用于情感腦機(jī)接口的分析和應(yīng)用,本文把這種實(shí)施方案稱為所有被試參與(subjects all participation,SAP)。
文中對(duì)腦點(diǎn)信號(hào)進(jìn)行窗口大小為1 s 的PSD 特征提取,窗口之間非重疊,這樣做可以避免數(shù)據(jù)樣本的重復(fù)。本文在SAP 的情況下,由于樣本數(shù)目較多,使用5 折交叉運(yùn)算;在SSD 的情況下,使用的是3 折交叉運(yùn)算。在特征選擇方面,本文使用XGBoost 隨機(jī)選擇70%比例的樣本特征進(jìn)行訓(xùn)練,并根據(jù)特征重要性指標(biāo)weight 統(tǒng)計(jì)每個(gè)特征在每棵樹(shù)上的分裂次數(shù),把每棵樹(shù)在此特征上的分裂次數(shù)的總和作為特征的得分,當(dāng)閾值(threshold)被固定為某一數(shù)值,得分排名靠前的特征將會(huì)被選擇,然后利用線性核主成分分析(KPCA)方法在高維空間進(jìn)行特征處理,最后使用XGBoost 模型對(duì)4 類情感狀態(tài)進(jìn)行分類。訓(xùn)練過(guò)程中主要參數(shù)有:生成樹(shù)的最大數(shù)目(n_estimator),學(xué)習(xí)率(learning_rate),結(jié)點(diǎn)分裂需要最小損失函數(shù)的下降值(gamma),權(quán)重L2 的正則化項(xiàng)(reg_lambda)和樹(shù)的最大深度(max_depth),另外,使用softmax 做多分類,分類數(shù)目設(shè)置為 4。本文使用網(wǎng)格搜索法GridSearchCV 對(duì)XGBoost 進(jìn)行調(diào)參,最終參數(shù)設(shè)為n_estimators:1080(SAP),n_estimators:500(SSD),learning_rate:0.05,gamma:0.1,reg_lambda:0.05,max_depth:9(SAP),max_depth:4(SSD),objective:'multi:softmax',num_class:4。圖1 為本文的算法流程圖。
圖1 算法整體流程圖Fig.1 Overall flow chart for the algorithm
本文在DEAP 數(shù)據(jù)庫(kù)[33]中對(duì)腦電情感信號(hào)進(jìn)行研究。32 名身心健康的被試者(男女比例各占50%,平均年齡為26.9 歲)被邀請(qǐng)參與實(shí)驗(yàn)數(shù)據(jù)的采集。一共有40 導(dǎo)的數(shù)據(jù)被記錄,其中腦電信號(hào)為32 導(dǎo),其余8導(dǎo)為外周生理信號(hào)。收集的信號(hào)以512 Hz 的采樣頻率被記錄,預(yù)處理后被降采樣到128 Hz,經(jīng)濾波到4 Hz到45 Hz 的頻段范圍內(nèi)。32 名被試被安排在40 段不同情感狀態(tài)的音樂(lè)視頻前進(jìn)行生理信號(hào)的記錄,每段視頻時(shí)長(zhǎng)為1 min。每段視頻開(kāi)始前,被試會(huì)有3 s 的基線準(zhǔn)備時(shí)間,這時(shí)被試者處于平和狀態(tài)。在每個(gè)視頻播放完畢后,被試將會(huì)有足夠的時(shí)間對(duì)剛播放的視頻在三維模型(效價(jià)、喚醒度、優(yōu)勢(shì)度)上進(jìn)行1 到9的離散評(píng)估。本文選擇了效價(jià)和喚醒度兩個(gè)情感維度,并把情感維度評(píng)估分?jǐn)?shù)大于等于5 的劃分為高(High),分?jǐn)?shù)小于5 的情況指定為低(Low)。因此可以劃分四種情感類別,包括HVHA(high valence high arousal),LVHA(low valence high arousal),HVLA(high valence low arousal)和LVLA(low valence low arousal),分別對(duì)應(yīng)著歡樂(lè)/高興、生氣/厭惡、放松/平靜、抑郁/悲傷四種情感。
本文在對(duì)樣本進(jìn)行訓(xùn)練的過(guò)程中,使用閾值(threshold) 對(duì)腦電特征維度進(jìn)行選擇,當(dāng)threshold∈[0.004,0.011],所選擇的特征數(shù)則由160 逐漸減少到0。實(shí)驗(yàn)中圖2 分別給出了SAP 下閾值的變化對(duì)識(shí)別效果的影響,當(dāng)特征數(shù)目選擇較少時(shí),無(wú)法全面地表征情感的變化;當(dāng)特征數(shù)目選擇過(guò)多,特征之間將會(huì)出現(xiàn)過(guò)多的冗余,進(jìn)而影響到模型的泛化性。當(dāng)threshold=0.0072 時(shí),情感分類的準(zhǔn)確率最高達(dá)到78.38%。圖3 給出了SAP 情況下特征重要程度排名前50 的特征,縱坐標(biāo)如7_(25-45)是通道編號(hào)為7,頻率在25 Hz 到45 Hz 之間的PSD 特征表示,橫坐標(biāo)則為特征的得分表示。從圖中可以看出,重要性度量靠前的特征在頻段上基本都集中在gamma 頻段,這說(shuō)明gamma 頻段能量變化對(duì)腦電情感識(shí)別具有較大的區(qū)分度,這和文獻(xiàn)[19]的研究結(jié)果是一致的。同時(shí),在gamma 頻段下基本所有的通道特征都在樹(shù)的模型學(xué)習(xí)過(guò)程中進(jìn)行了多次的分裂,這說(shuō)明gamma 頻段下每個(gè)通道對(duì)情感的識(shí)別都具有一定的貢獻(xiàn)。結(jié)合圖4 可以看出,gamma 頻段下(紅色數(shù)字)中央、頂葉以及右枕區(qū)在gamma 頻段的特征尤為重要,可以給腦電的情感分類提供更多的有效信息;另外,顳區(qū)(藍(lán)色圈)左右兩側(cè)、頂葉和中央左處的特征分別在alpha、beta、gamma 頻段和theta、beta、gamma 頻段保持活躍,這些特征不僅對(duì)分類很重要,同時(shí)每次在隨機(jī)選取的樣本進(jìn)行訓(xùn)練中表現(xiàn)的較為穩(wěn)定,從而有利于在多人被試中借助模型進(jìn)行共性學(xué)習(xí)。
圖2 SAP 下準(zhǔn)確率在不同閾值下的趨勢(shì)Fig.2 Accuracy under different thresholds in SAP
圖3 SAP 情況下特征重要性排序Fig.3 Ranking of feature importance in SAP
圖4 腦電信號(hào)整體分布和特征重要性分布圖Fig.4 Overall distribution and feature importance distribution of EEG signals
圖5 和圖6 是在SSD 下分別選出被試中識(shí)別效果最好(01,23)和最差(04,22)的四個(gè)被試的部分重要特征排名和每個(gè)被試的識(shí)別結(jié)果,對(duì)應(yīng)的這四個(gè)被試的準(zhǔn)確率分別是96.24%、94.62%和84.81%、86.07%。從圖5 中可以觀察到不同的被試所表現(xiàn)的特征重要性排序是不同的,這說(shuō)明不同的被試所呈現(xiàn)的個(gè)性表達(dá)存在較大的差異性。分析發(fā)現(xiàn),01 號(hào)被試和23 號(hào)被試名靠前特征也都集中在gamma 頻段,這和SAP 情況下的分析相一致,從而進(jìn)一步說(shuō)明gamma 頻段的能量特征是腦電情感識(shí)別的一個(gè)很重要的指標(biāo)。從通道空間上看,通道3、11 和32 能夠同時(shí)在識(shí)別性能最好的兩個(gè)被試和SAP 下的多人被試中呈現(xiàn)的特征重要程度保持基本一致,說(shuō)明三個(gè)通道在情感特征的共性識(shí)別方面是穩(wěn)定的;編號(hào)04 和22 相對(duì)于其他被試得到的識(shí)別效果較差,從圖5 中可以看出,他們的頻率和通道重要性度量排序都較為混亂,可能是特征的無(wú)規(guī)則性對(duì)被試個(gè)體的識(shí)別效果產(chǎn)生了負(fù)影響,不同被試所具有的個(gè)性化通道和頻段特征在多人被試中不能有效的區(qū)分情感狀態(tài),因此很難被應(yīng)用針對(duì)腦機(jī)的情感系統(tǒng)中。
圖5 部分被試(01,04,22,23)特征重要性排序Fig.5 Features’ importance ranking for selected subjects(01,04,22,23)
圖6 32 名被試的識(shí)別準(zhǔn)確度對(duì)比Fig.6 Comparison of recognition accuracy for 32 subjects
圖7 給出了各種組合算法在固定主成分?jǐn)?shù)目(n_components)后的識(shí)別效果對(duì)比。圖中SVM(RBF,Linear)表示支持向量機(jī)分類模型采用徑向基核或者線性核。圖7(a)顯示的是SAP 情況下選擇的特征個(gè)數(shù)為30,可以看出,當(dāng)n_components 在100 到150 的范圍內(nèi),本文算法分類效果最佳且識(shí)別效果相對(duì)穩(wěn)定。圖7(b)是SSA 情況下各個(gè)算法識(shí)別情況,由于每個(gè)被試下樣本數(shù)目相對(duì)較少,這里統(tǒng)一把閾值設(shè)置為‘1.4×mean’,mean 為訓(xùn)練過(guò)程中有效閾值范圍的平均值,選擇的特征數(shù)目將會(huì)在14 到35 的范圍波動(dòng)。從圖7(b)可以看出,當(dāng)n_components 在70 到160 的范圍內(nèi),算法的識(shí)別效果也會(huì)達(dá)到穩(wěn)定和最佳狀態(tài)。綜合發(fā)現(xiàn),無(wú)論是SAP還是SSD 情況下,n_components個(gè)數(shù)在70 以內(nèi),隨著n_components 的增加,識(shí)別準(zhǔn)確率呈明顯上升的趨勢(shì),然后逐漸趨于穩(wěn)定;另外,相對(duì)于PCA 和徑向基RBF 核KPCA 對(duì)特征的處理,線性Linear 核的KPCA 處理可以使識(shí)別性能得到較大的提升,這說(shuō)明KPCA 處理以及核的選擇對(duì)識(shí)別效果影響較大。最后,可以看出要取得較好的識(shí)別效果,n_components 的數(shù)目應(yīng)大于所選擇的特征數(shù)目,這可能是因?yàn)槟X電情感信號(hào)在低維度無(wú)法有效地表征非線性特征。
圖7 不同方法下主成分個(gè)數(shù)的識(shí)別性能對(duì)比Fig.7 Recognition performance comparison for different components
為了進(jìn)一步證明本文算法的有效性,表1 給出了本文算法與其他模型及一些相關(guān)文獻(xiàn)的識(shí)別效果對(duì)比。從表中可以看出,本文提出的Linear 核KPCA 特征處理結(jié)合XGBoost 腦電情感識(shí)別方案在SAP 的情況下的準(zhǔn)確率為78.376%,分別比文獻(xiàn)[19,21]提高了8.71%和1.56%,識(shí)別性能遠(yuǎn)高于各單一模型的分類方案;同時(shí)在SSD 的情況下,文中算法獲得了92.583%的準(zhǔn)確率,相對(duì)于文獻(xiàn)[17]提高了24.28%。文獻(xiàn)[23]分別是在Valence 和Arousal 進(jìn)行二分類識(shí)別,本文在四分類識(shí)別也取得了相對(duì)更高的準(zhǔn)確率。
表1 各種算法識(shí)別效果的比較Table 1 Comparison of recognition performance for various algorithms
本文對(duì)腦電信號(hào)情感的識(shí)別方法進(jìn)行研究,針對(duì)腦電信號(hào)情感識(shí)別效果較低并且每個(gè)被試的情感表達(dá)差異性問(wèn)題,設(shè)計(jì)了一種使用線性核主成分分析進(jìn)行特征處理,并結(jié)合XGBoost 算法的情感分類識(shí)別模型。實(shí)驗(yàn)結(jié)果證明,通過(guò)線性核的主成分分析可以在高維空間實(shí)現(xiàn)特征向量的非線性變換,進(jìn)而更有利于腦電情感的分類,和XGBoost 的結(jié)合可以發(fā)掘出情感相關(guān)的共性特征。在SAP 和SSD 的情況下,與其他文獻(xiàn)相比,識(shí)別準(zhǔn)確率得到了較大的提升。因此,本算法對(duì)于改善腦電情感識(shí)別系統(tǒng)的性能是有效的。另外,本文提取的腦電信號(hào)特征使用的是傳統(tǒng)的PSD,但這種特征僅僅反映了被試在大腦不同區(qū)域所呈現(xiàn)的能量變化,忽略了腦電信號(hào)在空間各個(gè)不同區(qū)域之間的非線性聯(lián)系,如何探究腦區(qū)之間的非線性關(guān)系并進(jìn)一步改進(jìn)情感分類模型的性能是本研究要關(guān)注的下一個(gè)方向。