張金輝,鄭宇博,鄒 冰,申 牧,羅瑩瑩,李 蕾
(1.解放軍總醫(yī)院服務(wù)保障中心裝備保障室,北京 100853;2.北京郵電大學(xué)人工智能學(xué)院,北京 100876)
腦機(jī)接口(brain-computer interface,BCI)利用計(jì)算機(jī)與人的中樞神經(jīng)系統(tǒng)進(jìn)行交流和控制,是結(jié)合了神經(jīng)科學(xué)、信息科學(xué)等眾多學(xué)科的重要研究方向[1]。一個(gè)完整的BCI系統(tǒng)的工作流程包括腦電(electroencephalogram,EEG)信號(hào)采集、信號(hào)預(yù)處理、特征提取、分類和反饋控制[2],如圖1所示,其中特征提取和分類是BCI研究的重點(diǎn)[3]。運(yùn)動(dòng)想象(motor imagery,MI)是BCI研究中非常重要的實(shí)驗(yàn)范式之一[4],MI過程中,受試個(gè)體想象某種肢體運(yùn)動(dòng)而不進(jìn)行真實(shí)的動(dòng)作,其大腦感覺運(yùn)動(dòng)區(qū)域的EEG會(huì)發(fā)生變化[5]。BCI采集MI過程中的EEG信號(hào),并通過MI分類模型進(jìn)行特征提取和分類,可以將受試者的MI意圖轉(zhuǎn)化為指令,利用此方法,運(yùn)動(dòng)障礙患者經(jīng)過訓(xùn)練,可以通過想象肢體的運(yùn)動(dòng)來控制外部的機(jī)械設(shè)備,對(duì)改善其生活水平具有重要意義[6]。
圖1 運(yùn)動(dòng)想象BCI示意圖
數(shù)據(jù)之間存在的差異大大地降低了MI分類模型的分類效果,該差異主要體現(xiàn)在兩方面:一方面,EEG是一種非線性、非平穩(wěn)的信號(hào),不同采集個(gè)體之間表現(xiàn)出很強(qiáng)的個(gè)體性差異[7-9];另一方面,不同的采集方式和實(shí)驗(yàn)環(huán)境會(huì)導(dǎo)致不同研究團(tuán)隊(duì)采集的EEG數(shù)據(jù)存在系統(tǒng)性差異[10-11]。已有的多個(gè)公開數(shù)據(jù)集之間也存在這兩方面的差異[12-14],使得研究人員難以同時(shí)利用多個(gè)數(shù)據(jù)集進(jìn)行訓(xùn)練和測試。
最近,有研究人員針對(duì)個(gè)體性差異提出了一種在歐氏空間中進(jìn)行數(shù)據(jù)對(duì)齊的策略[15],該策略可以增強(qiáng)模型在跨個(gè)體之間的泛化能力。然而,由于不同的EEG采集方式和實(shí)驗(yàn)環(huán)境所導(dǎo)致的系統(tǒng)性差異,模型的泛化能力仍然亟待提升[16]。針對(duì)2種差異問題,2021年神經(jīng)信息處理系統(tǒng)大會(huì)(Conference and Workshop on Neural Information Processing Systems,NuerIPS)提出了跨數(shù)據(jù)集的MI分類問題[17],需要利用競賽提供的包含數(shù)百名個(gè)體且采集方式和采集環(huán)境有差異的多個(gè)源數(shù)據(jù)集訓(xùn)練模型,并在新數(shù)據(jù)集中進(jìn)行MI分類,新數(shù)據(jù)集的個(gè)體、采集方式和采集環(huán)境與源數(shù)據(jù)集均不相同。
目前,已有的基于EEG的分類方法主要有2類:
第一類方法針對(duì)EEG的特點(diǎn),設(shè)計(jì)算法提取特征,再利用機(jī)器學(xué)習(xí)方法分類[18-19]。針對(duì)MI,有研究人員根據(jù)EEG的不同頻率計(jì)算頻帶能量密度[20],或進(jìn)行短時(shí)傅里葉變換[21](short time Fourier transform,STFT),從時(shí)頻譜圖的角度進(jìn)行特征提??;為了保留EEG信號(hào)的空間相關(guān)性,有研究人員提出共空間模式(common spatial pattern,CSP)特征[22],該方法通過計(jì)算空間濾波器來最大化不同MI類別間的判別度,以提高模型的分類能力;有研究人員提出濾波器組共空間模式[23](filter bank common spatial pattern,F(xiàn)BCSP),該方法利用帶通濾波器將數(shù)據(jù)劃分為多個(gè)子頻帶,計(jì)算各頻帶對(duì)應(yīng)的CSP特征,然后利用機(jī)器學(xué)習(xí)的分類器進(jìn)行分類。CSP和FBCSP方法對(duì)MI分類的研究產(chǎn)生了深遠(yuǎn)影響,被廣泛應(yīng)用在MI分類的研究中[24-25]。正則化共空間模式(regularized common spatial pattern,RCSP)[26]通過參數(shù)規(guī)范化空間濾波器,減小CSP的估計(jì)偏差。子帶共空間模式[27](sub-band common spatial patterns,SBCSP)通過改進(jìn)FBCSP方法的特征選擇方式來提升MI分類任務(wù)的效果。此類利用固定算法提取特征的分類模型多針對(duì)個(gè)體性差異而采用歸一化方法[28-29],對(duì)于解決系統(tǒng)性差異的研究較為欠缺。
第二類方法利用神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取和分類。用于EEG的小型卷積神經(jīng)網(wǎng)絡(luò)EEGNet是一種可應(yīng)用于多種范式的卷積神經(jīng)網(wǎng)絡(luò)[30],EEGNet利用時(shí)域卷積、空間卷積提取EEG信號(hào)的時(shí)空特征,利用可分離卷積,在時(shí)域上整合每個(gè)特征映射,優(yōu)化合并輸出并分類。卷積循環(huán)注意力模型(convolutional recurrent attention model,CRAM)是一種用于跨個(gè)體EEG信號(hào)分析的神經(jīng)網(wǎng)絡(luò)方法[31],包括一個(gè)卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)注意力網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)用于提取EEG信號(hào)空域和時(shí)域特征,長短期記憶(long shortterm memory,LSTM)網(wǎng)絡(luò)和注意力模型組成的循環(huán)注意力網(wǎng)絡(luò)用于提取不同切片之間的時(shí)域動(dòng)態(tài)信息并分類。也有研究人員基于大量圖像數(shù)據(jù)預(yù)訓(xùn)練的InceptionResnetV2來提取EEG信號(hào)特征,并修改網(wǎng)絡(luò)的最后幾層以適配MI分類[32]。這類方法需要大量數(shù)據(jù)進(jìn)行訓(xùn)練,由于數(shù)據(jù)集之間的個(gè)體、采集方式和實(shí)驗(yàn)環(huán)境存在差異,難以在跨數(shù)據(jù)集的MI分類任務(wù)中有所突破。
基于上述研究,本文改進(jìn)傳統(tǒng)的FBCSP,對(duì)EEG子頻帶的時(shí)域信號(hào)進(jìn)行切分,使提取的特征具備時(shí)域的動(dòng)態(tài)信息,以提升單個(gè)數(shù)據(jù)集和跨數(shù)據(jù)集的MI分類準(zhǔn)確率,降低數(shù)據(jù)集之間的系統(tǒng)性差異對(duì)模型的影響。
針對(duì)數(shù)據(jù)集間的系統(tǒng)性差異,本文提出切片濾波器組共空間模式(slice filter bank common spatial pattern,SFBCSP),基于SFBCSP的MI分類方法流程圖如圖2所示。具體流程如下:首先對(duì)原始信號(hào)進(jìn)行預(yù)處理,通過一組帶通濾波器在頻域上切分信號(hào)頻帶;其次利用滑動(dòng)窗口對(duì)時(shí)域信號(hào)進(jìn)行切分,以體現(xiàn)不同MI類別之間存在子進(jìn)程的差異;然后再利用空間濾波器提取EEG不同電極通道之間的空域特征;最后對(duì)多維度特征進(jìn)行篩選和分類。下面將對(duì)各部分進(jìn)行具體介紹。
注:EA為歐氏空間對(duì)齊。
本文使用NuerIPS競賽中提供的5個(gè)數(shù)據(jù)集,其中包括3個(gè)公開數(shù)據(jù)集和2個(gè)非公開數(shù)據(jù)集。3個(gè)公開數(shù)據(jù)集主要用于模型訓(xùn)練,分別為Cho2017[11]、BNCI2014001[12]和Physionet[13]。競賽為該任務(wù)單獨(dú)設(shè)置2個(gè)非公開數(shù)據(jù)集,分別記為NIPS1和NIPS2,主要用于測試和輸出。這5個(gè)數(shù)據(jù)集的采集設(shè)備、實(shí)驗(yàn)環(huán)境、受試者數(shù)量、MI范式類別、采樣率、通道和時(shí)間窗口等不盡相同,具體信息見表1。
表1 MI數(shù)據(jù)集基本信息
由于各個(gè)數(shù)據(jù)集的采樣率、范式類別、電極位置和順序、時(shí)間窗口等存在較大的不同,無法直接進(jìn)行合并,本文對(duì)5個(gè)數(shù)據(jù)集進(jìn)行了統(tǒng)一的預(yù)處理,具體步驟如下:
(1)對(duì)5個(gè)數(shù)據(jù)集中的所有樣本重采樣為128 Hz。
(2)將所有樣本的標(biāo)簽重新標(biāo)為3類,分別為左手、右手和其他,分別標(biāo)為0、1、2。雙腳、舌頭和雙手等MI范式都統(tǒng)一歸為其他類。
(3)選取5個(gè)數(shù)據(jù)集中所有通道的交集,并且按照BNCI2014001數(shù)據(jù)集中的順序進(jìn)行統(tǒng)一排序。最終選取17個(gè)通道的EEG數(shù)據(jù),包括Fz、FC1、FC2、C5、C3、C1、C2、C4、C6、CP3、CP1、CPz、CP2、CP4、P1、Pz、P2,確保通道順序一致。
(4)截取每個(gè)樣本后3 s的數(shù)據(jù),統(tǒng)一所有樣本的采樣點(diǎn)數(shù)為384(128 Hz×3 s)個(gè)。
(5)歐氏空間對(duì)齊(Euclidean space data alignment,EA)是對(duì)原始EEG信號(hào)在歐氏空間內(nèi)進(jìn)行變換[14],該變換不改變數(shù)據(jù)維度、運(yùn)算成本低,且不需要數(shù)據(jù)標(biāo)簽,被廣泛應(yīng)用在EEG的遷移學(xué)習(xí)任務(wù)中[33-35]。本文根據(jù)EA方法,通過協(xié)方差矩陣進(jìn)行參考矩陣的構(gòu)建和計(jì)算,并對(duì)每名個(gè)體的原始EEG信號(hào)進(jìn)行矩陣變換和對(duì)齊。至此,來自5個(gè)數(shù)據(jù)集的所有樣本數(shù)據(jù)維度被統(tǒng)一為x∈R17×384,標(biāo)簽y∈{0,1,2}。
神經(jīng)系統(tǒng)的預(yù)期聯(lián)想機(jī)制是MI的關(guān)鍵[5],使得MI在時(shí)間尺度上呈現(xiàn)出一種動(dòng)態(tài)特性。MI是一種對(duì)運(yùn)動(dòng)行為的編碼,需要皮層神經(jīng)元事件的連續(xù)組織串聯(lián),形成“行動(dòng)計(jì)劃”,這種順序處理可能包括幾個(gè)單獨(dú)且并行的子過程[36]。因此,對(duì)一個(gè)完整的MI過程進(jìn)行拆分,利用滑動(dòng)窗口對(duì)EEG切片,分段提取特征,不僅能夠區(qū)分子進(jìn)程,還可以體現(xiàn)“并行”的特點(diǎn)。將一個(gè)想象左手或右手動(dòng)作的過程分為不同的階段,能夠減少因個(gè)體不同、實(shí)驗(yàn)環(huán)境不同而在子進(jìn)程關(guān)聯(lián)方式上產(chǎn)生的個(gè)體性差異和系統(tǒng)性差異的影響。而且,通過尋找最優(yōu)的切分方式,可以進(jìn)一步提升模型的泛化能力。
本文提出的SFBCSP方法,利用滑動(dòng)窗口對(duì)帶通濾波后的數(shù)據(jù)在時(shí)域上進(jìn)行切分,以刻畫具體的MI范式在單個(gè)試次中的子進(jìn)程關(guān)聯(lián)性,具體的特征提取算法如下:
(1)利用濾波器組對(duì)EEG信號(hào)進(jìn)行帶通濾波。設(shè)3類MI范式對(duì)應(yīng)的EEG信號(hào)為首先對(duì)進(jìn)行帶通濾波,根據(jù)頻帶λ的上、下截止頻率和采樣率fs,由公式(1)計(jì)算帶通濾波后的信號(hào)
式中,BP代表帶通濾波。
(3)通過CSP方法計(jì)算空間濾波器,對(duì)切分的數(shù)據(jù)片段進(jìn)行空間濾波,設(shè)輸出特征值的個(gè)數(shù)為m,由公式(2)分別計(jì)算各頻帶的混合空間協(xié)方差矩陣Rλ:
(4)通過對(duì)混合空間協(xié)方差矩陣進(jìn)行特征值分解,得到特征向量矩陣Uλ,并計(jì)算對(duì)應(yīng)的白化值矩陣Pλ:
式中,Λλ為特征值構(gòu)成的對(duì)角陣;(Λλ)-1為該對(duì)角陣的逆。
(6)根據(jù)推算,3個(gè)MI范式對(duì)應(yīng)的特征值對(duì)角陣之和為單位陣,即Λ1+Λ2+Λ3=I,且它們的特征向量矩陣是相等的,即B1=B2=B3=B。根據(jù)參數(shù)m選擇特征,根據(jù)公式(7)計(jì)算λ頻帶對(duì)應(yīng)的空間濾波矩陣wλ,根據(jù)公式(8)可計(jì)算任意樣本每個(gè)時(shí)間切片的CSP特征Γλ,即獲得該樣本的SFBCSP特征張量Γλ:
(7)利用分類模型對(duì)特征張量進(jìn)行降維和分類,至此,來自不同數(shù)據(jù)集的EEG數(shù)據(jù),經(jīng)過數(shù)據(jù)預(yù)處理、帶通濾波、時(shí)間切片、空間濾波和分類,縮減了系統(tǒng)性差異,從而完成MI分類任務(wù)。
已有的MI分類方法中,由于CSP和FBCSP方法在EEG特征層面深入挖掘而得到了最為廣泛的應(yīng)用。在基于神經(jīng)網(wǎng)絡(luò)的分類方法中,EEGNet是一種可應(yīng)用于多種范式的卷積神經(jīng)網(wǎng)絡(luò),也被廣泛應(yīng)用于EEG信號(hào)分類。CRAM是一種用于跨個(gè)體EEG信號(hào)分析的神經(jīng)網(wǎng)絡(luò)模型,在EEG數(shù)據(jù)差異問題上具有一定的泛化能力。本文將基于SFBCSP的MI分類方法與這4種方法進(jìn)行對(duì)比,以研究和分析各個(gè)方法的特點(diǎn)和優(yōu)劣。
在數(shù)據(jù)方面,對(duì)于單數(shù)據(jù)集評(píng)估實(shí)驗(yàn),為對(duì)比各方法在非遷移學(xué)習(xí)場景下的分類準(zhǔn)確率,使用Cho2017作為數(shù)據(jù)集,隨機(jī)劃分70%作為訓(xùn)練集,剩余30%作為測試集,且各模型數(shù)據(jù)集劃分采用相同的隨機(jī)種子,以保證劃分方式相同。對(duì)于跨數(shù)據(jù)集評(píng)估實(shí)驗(yàn),選取數(shù)據(jù)集BNCI2014001、Physionet和NIPS2分別作為訓(xùn)練集和測試集進(jìn)行一對(duì)多的實(shí)驗(yàn)。針對(duì)綜合數(shù)據(jù)集的驗(yàn)證,本研究將3個(gè)公開數(shù)據(jù)集合并,并與部分非公開數(shù)據(jù)集NIPS1和NIPS2中的部分?jǐn)?shù)據(jù)結(jié)合作為訓(xùn)練集,目標(biāo)數(shù)據(jù)集中剩余的數(shù)據(jù)作為測試集。所使用的數(shù)據(jù)均經(jīng)過數(shù)據(jù)均衡。
經(jīng)過預(yù)處理的數(shù)據(jù)具有17個(gè)通道,為保留通道間的空間關(guān)系,CSP的輸出維度小于通道數(shù)的一半,取整為8。在劃分頻帶時(shí),在4~40 Hz的頻帶內(nèi)進(jìn)行滑動(dòng)濾波,窗口為4 Hz,步長為2 Hz,共劃分為17個(gè)頻帶。在進(jìn)行時(shí)間切片時(shí),將滑動(dòng)窗口大小和步長作為超參數(shù)進(jìn)行實(shí)驗(yàn)。經(jīng)過SFBCSP方法的提取,單個(gè)樣本對(duì)應(yīng)的特征為Γ∈R8×17×2。
定義交叉熵?fù)p失作為損失函數(shù),利用自適應(yīng)矩估計(jì)優(yōu)化器進(jìn)行參數(shù)優(yōu)化,以測試集平均分類準(zhǔn)確率(Acc)作為評(píng)價(jià)指標(biāo),如公式(9)所示,其中TP為真正例,F(xiàn)N為假負(fù)例,TN為真負(fù)例,F(xiàn)P為假正例。所有準(zhǔn)確率結(jié)果均為5次實(shí)驗(yàn)的平均結(jié)果。
表2為SFBCSP方法在不同窗口長度(window length,WL)和步長(step size,SS)下的分類準(zhǔn)確率對(duì)比結(jié)果,以選擇最佳的WL和SL搭配,每組數(shù)據(jù)均進(jìn)行5組訓(xùn)練和測試取平均結(jié)果。為了不丟失任何的數(shù)據(jù),應(yīng)滿足公式(10)。因部分搭配不滿足該要求,表中對(duì)應(yīng)部分結(jié)果為空。
從表2可以看出,選擇窗口長度在256、步長為128時(shí)可以達(dá)到最好的效果,此時(shí)每段EEG數(shù)據(jù)被切分為2段,分別為0~2 s和1~3 s。該結(jié)論與神經(jīng)生物學(xué)的理論結(jié)果相吻合,在MI編碼的時(shí)序過程中,存在獨(dú)立且并行的子任務(wù)。
表2 SFBCSP方法在不同窗口長度和步長下的分類準(zhǔn)確率單位:%
為驗(yàn)證本文提出方法的效果,分別對(duì)EEGNet、CRAM、CSP、FBCSP方法以及本文提出的SFBCSP方法進(jìn)行實(shí)驗(yàn)與評(píng)估。在數(shù)據(jù)集Cho2017上,三分類準(zhǔn)確率如圖3所示,圖中結(jié)果說明,在單個(gè)數(shù)據(jù)集上,基于神經(jīng)網(wǎng)絡(luò)模型的方法獲得的準(zhǔn)確率優(yōu)于FBCSP方法,而SFBCSP方法達(dá)到最高平均分類準(zhǔn)確率(74.14%),相較于FBCSP方法提升了7.26%,具備更好的區(qū)分MI行為的能力。FBCSP和SFBCSP方法的準(zhǔn)確率相較于基于神經(jīng)網(wǎng)絡(luò)模型的方法有更小的方差,意味著基于特征的方法在單個(gè)數(shù)據(jù)集上的分類效果更穩(wěn)定,受隨機(jī)因素的影響較小。
圖3 各方法在單一MI數(shù)據(jù)集上的平均分類準(zhǔn)確率
圖4為各方法在不同數(shù)據(jù)集上進(jìn)行跨數(shù)據(jù)集測試的結(jié)果。由圖4中的結(jié)果可知,SFBCSP方法在數(shù)據(jù)集之間的遷移效果要優(yōu)于FBCSP方法和神經(jīng)網(wǎng)絡(luò)模型,相較于FBCSP方法平均提升了5.16%。各方法在從BNCI2014001向Physionet遷移時(shí)均有更好的效果,但從Physionet向BNCI2014001遷移時(shí)效果較差,F(xiàn)BCSP方法失去了對(duì)MI的分類能力。相較于Physionet來說,BNCI2014001中可能存在更普遍的特征,系統(tǒng)性差異的影響較小,使得訓(xùn)練出的模型具有更強(qiáng)的泛化能力。從圖4中還可以看出,F(xiàn)BCSP方法和SFBCSP方法在使用BNCI2014001作為訓(xùn)練集時(shí)達(dá)到相近似的效果,但在Physionet做訓(xùn)練集時(shí)相差較大,表明BNCI2014001的主要特征在時(shí)域動(dòng)態(tài)性上不夠顯著,而Physionet具備更為明顯的時(shí)域動(dòng)態(tài)特性。
圖4 各方法在跨MI數(shù)據(jù)集上的平均分類準(zhǔn)確率
圖5為各方法在混合MI數(shù)據(jù)集的平均分類準(zhǔn)確率。在跨混合數(shù)據(jù)集的MI分類中,F(xiàn)BCSP方法分類效果相較于神經(jīng)網(wǎng)絡(luò)模型有所提升,而CSP特征的效果有明顯的下降。本文提出的SFBCSP方法在對(duì)比實(shí)驗(yàn)的模型中達(dá)到了最優(yōu),平均分類準(zhǔn)確率達(dá)到54.40%,相較于FBCSP方法提升了1.96%,此結(jié)果進(jìn)一步說明了經(jīng)過滑動(dòng)窗口分割MI特征能夠提升特征的泛化能力。圖5中的EEGNet和CRAM均低于FBCSP方法和本文提出的方法,說明基于特征的方法在混合數(shù)據(jù)集的MI分類中更具有泛化能力;SFBCSP方法充分利用了時(shí)間切片之間的連續(xù)性動(dòng)態(tài)信息,降低了系統(tǒng)性差異對(duì)分類模型的影響,具有一定的可解釋性。此外,各方法之間的差距與單個(gè)數(shù)據(jù)集和跨數(shù)據(jù)集相比有所減少,隨著問題的難度進(jìn)一步增大,數(shù)據(jù)和預(yù)處理方法的局限性對(duì)分類的準(zhǔn)確率產(chǎn)生了限制,基于神經(jīng)網(wǎng)絡(luò)和基于特征的方法均不易達(dá)到更好的分類效果。
圖5 各方法在混合MI數(shù)據(jù)集的平均分類準(zhǔn)確率
本文針對(duì)跨數(shù)據(jù)集的MI分類任務(wù),提出了基于SFBCSP模型的MI分類方法。首先,本文將多個(gè)數(shù)據(jù)集中的不同采集環(huán)境、通道、采樣率、時(shí)間窗口等系統(tǒng)性差異的數(shù)據(jù)匹配,并通過EA方法將帶有個(gè)體性差異的EEG數(shù)據(jù)在歐氏空間中對(duì)齊。然后,根據(jù)神經(jīng)生理學(xué)理論,將MI過程看作并行子進(jìn)程,在時(shí)域上進(jìn)行拆解,通過帶通濾波、滑動(dòng)窗口和空間濾波器分別提取EEG信號(hào)的頻域、時(shí)域和空域的特征。最后,利用全連接網(wǎng)絡(luò)進(jìn)行特征降維和分類。根據(jù)實(shí)驗(yàn)結(jié)果可知,本文提出的基于SFBCSP特征的分類方法相較于FBCSP、EEGNet和CRAM在單個(gè)數(shù)據(jù)集、跨數(shù)據(jù)集和混合數(shù)據(jù)集的MI分類任務(wù)中均有所提升,并且具有一定的可靠性和可解釋性,說明本文提出的方法能降低跨數(shù)據(jù)集的系統(tǒng)性差異對(duì)分類模型的影響,對(duì)MI和BCI的研究具有重要意義。本文還驗(yàn)證了切片滑動(dòng)窗口長度和步長對(duì)模型效果的影響,選擇窗口長度為256、步長為128時(shí)可以達(dá)到最高的分類準(zhǔn)確率。本文提出的方法和訓(xùn)練代碼將公開在Github上。
本文部分實(shí)驗(yàn)的訓(xùn)練集和測試集來源于不同的數(shù)據(jù)集,為了解決可能存在的過擬合問題,通過提出的切片濾波器組共空間模式來減少訓(xùn)練集和測試集的特征空間差異,從而間接地緩解跨數(shù)據(jù)集場景的過擬合問題。從跨數(shù)據(jù)集分類結(jié)果來看,本文提出的方法與其他方法進(jìn)行橫向?qū)Ρ刃Ч茫匀粺o法達(dá)到與單一數(shù)據(jù)集相似的分類準(zhǔn)確率,表明由于系統(tǒng)性差異導(dǎo)致的過擬合問題是值得深入研究的復(fù)雜問題。后續(xù),將在數(shù)據(jù)量和范式對(duì)模型結(jié)構(gòu)和參數(shù)影響上作進(jìn)一步研究,以進(jìn)一步提升模型的泛化能力和分類準(zhǔn)確率。