覃慧怡 丁麗洪 段 威,2 雷 旭
腦電的重測信度:在多項靜息態(tài)和任務(wù)態(tài)實驗中的對比*
覃慧怡1丁麗洪1段 威1,2雷 旭1
(1西南大學(xué)心理學(xué)部, 重慶 400715) (2中國科學(xué)院心理研究所, 北京 100101)
基于腦電探討心理過程的認(rèn)知神經(jīng)機制, 需要信號本身具有良好的重測信度。本研究多角度對比了睜眼、閉眼兩種靜息態(tài)腦電以及精神運動警覺任務(wù)、Oddball兩種任務(wù)態(tài)事件相關(guān)電位的重測信度。發(fā)現(xiàn)靜息態(tài)的重測信度普遍優(yōu)于任務(wù)態(tài), 其中閉眼靜息態(tài)又比睜眼靜息態(tài)的重測信度更高, alpha頻段的重測信度在所有頻段中最高。對于兩種任務(wù)態(tài), 在時域上均表現(xiàn)為刺激出現(xiàn)后200 ms左右較高的重測信度。在空間上, 5種狀態(tài)的結(jié)果都表明中央?yún)^(qū)域比外周區(qū)域的重測信度更高, 這可能與外周區(qū)域更容易出現(xiàn)偽跡有關(guān)。本研究涉及多個靜息態(tài)和任務(wù)態(tài)腦電實驗, 在頻域、時域、空域三個維度的特征上, 較為全面地對比了重測信度并分析了可能的原因, 為后續(xù)研究腦電信號重測信度選擇合適的實驗范式和指標(biāo)提出了建議, 對于基礎(chǔ)和臨床領(lǐng)域的腦電應(yīng)用都具有重要參考價值。
腦電, 事件相關(guān)電位, 重測信度, 靜息態(tài)
神經(jīng)影像技術(shù)的發(fā)展和應(yīng)用是腦科學(xué)研究的重要基礎(chǔ), 包括功能磁共振成像(functional magnetic resonance imaging, fMRI)、腦電圖(electroencephalography, EEG)和腦磁圖(magnetoencephalogram, MEG)等在內(nèi)的多項腦成像技術(shù)受到了心理學(xué)、認(rèn)知神經(jīng)科學(xué)、生物醫(yī)學(xué)工程等領(lǐng)域的廣泛關(guān)注。相比于fMRI和MEG等腦成像技術(shù), EEG因其時間分辨率高、操作簡單、無創(chuàng)、便攜和價格低廉等多種優(yōu)勢, 成為了認(rèn)知神經(jīng)科學(xué)等領(lǐng)域最常用的研究工具。基于頭表腦電信號探討心理過程的認(rèn)知神經(jīng)機制, 需要腦電信號具有良好的重測信度(Elliott et al., 2020)。
靜息態(tài)(通常為睜/閉眼靜息態(tài)腦電, 即resting- state EEG, rsEEG)和任務(wù)態(tài)腦電(通常為事件相關(guān)電位, 即event related potential, ERP)是頭表腦電研究中最常用的兩種形式。rsEEG通常是指人在清醒休息的狀態(tài)下, 在頭表記錄到的有節(jié)律的、反映大腦內(nèi)在連接的自發(fā)神經(jīng)電活動, 它能提供個體有關(guān)認(rèn)知和人格特征差異的相關(guān)信息(Deco et al., 2011)。因此, 許多研究將rsEEG擴展到臨床研究領(lǐng)域作為識別神經(jīng)精神疾病的生物標(biāo)志物(Newson & Thiagarajan, 2019), 例如阿爾茨海默病(Bonanni et al., 2008)、癲癇(Rotondi et al., 2016)、精神分裂癥(Siebenhühner et al., 2013)、失眠(Zhao et al., 2021)等。與靜息態(tài)腦電不同, 任務(wù)態(tài)腦電一般為記錄一段認(rèn)知任務(wù)過程中的腦電, 也可以是由多個試次疊加后的事件相關(guān)電位, 即ERP (Wang et al., 2022)。它反映了人腦在認(rèn)知過程中的神經(jīng)電生理的變化, 用于探討個體的認(rèn)知功能的特點及動態(tài)過程, 并被應(yīng)用在腦機接口上(Lugo et al., 2020)。EEG分析技術(shù)包括波形分析、頻譜分析、時頻分析和源定位等(趙文瑞等, 2020)。頻譜分析采用的頻段劃分標(biāo)準(zhǔn)通常為:delta (0.5~4 Hz), theta (4~8 Hz), alpha (8~13 Hz), beta (13~30 Hz)和gamma (30~80 Hz) (Tatum et al., 2016)。本研究重點關(guān)注常用的分析技術(shù)中的頻譜信息和波形特征, 前者提供了rsEEG在特定頻段的功率譜信息, 后者關(guān)注ERP在特定時段腦電成分的振幅和潛伏期等信息。
EEG在不同場景和時間間隔下的穩(wěn)定性和一致性一直受到關(guān)注。理論計算表明, 信度決定了最大可檢測到的效度大小, 而在心理研究領(lǐng)域中, 信度、樣本量和效應(yīng)量之間的相互作用經(jīng)常被低估(Zuo et al., 2019)。重測信度(test-retest reliability)的研究顯得尤為重要。用于評估重測信度的常用統(tǒng)計量是組內(nèi)相關(guān)系數(shù)(intra-class correlation coefficients, ICC), 通常被定義為個體的方差與總方差的比率。一般情況下, ICC值小于0.5表示信度差, 介于0.5和0.75之間的值表示中等信度, 介于0.75和0.9之間的值表示信度良好, 大于0.9的值表示信度優(yōu)良(Koo & Li, 2016)。
近年來多個研究在不同場景中對比了rsEEG和ERP的重測信度, 發(fā)現(xiàn)兩者各具優(yōu)勢。與ERP相比, rsEEG實驗設(shè)計簡單, 易于在特殊疾患群體、特定認(rèn)知狀態(tài)中實施。而ERP可以設(shè)計更有針對性的行為任務(wù), 提供更準(zhǔn)確的認(rèn)知過程電生理指標(biāo)。然而, 目前對于EEG重測信度的研究大多關(guān)注其中一個類別。比如, 一些研究者主要關(guān)注靜息態(tài), 探討在不同的預(yù)處理條件、數(shù)據(jù)長度下的重測信度, 發(fā)現(xiàn)閉眼條件下的重測信度普遍高于睜眼條件(Duan et al., 2021), 特定頻段如alpha和theta具有更好的重測信度(Corsi-Cabrera et al., 2007; McEvoy et al., 2000)。另一些研究則關(guān)注任務(wù)態(tài)的重測信度, 發(fā)現(xiàn)在聽覺Oddball任務(wù)中ERP重測相關(guān)性高于0.9, 在12~16周的時間間隔內(nèi)相關(guān)性稍低, 但是也達(dá)到了0.8 (Salinsky et al., 1991)。在精神運動警覺任務(wù)(psychomotor vigilance task, PVT)中, 發(fā)現(xiàn)ERP無論是間隔幾小時還是幾天, 重測信度都很好(r大于0.9) (McEvoy et al., 2000)??傮w來說, 已有研究在重測指標(biāo)、實驗設(shè)計、數(shù)據(jù)處理、間隔時長、被試群體等方面有很大的差異, 這降低了不同實驗范式之間的可比性。例如, 盡管以往大多數(shù)研究已經(jīng)發(fā)現(xiàn)rsEEG中的閉眼狀態(tài)具有更高的重測信度, 但是并未將其與同樣測試條件下的ERP進行對比。在尋找ERP中的最優(yōu)重測指標(biāo)時, 大多數(shù)研究也著力于橫向?qū)ふ夷骋粋€或幾個任務(wù)中的最優(yōu)成分, 缺少對這幾個任務(wù)的縱向比較以獲得更具普遍參考價值的意見。在空間指標(biāo)上, 對于電極位置的重測信度的研究則更少。對于靜息態(tài)MEG的研究發(fā)現(xiàn), 頂葉區(qū)域顯示出最高的信度(Lew et al., 2021), 但尚不確定將其推廣到頭表以及EEG中的情況。
盡管目前已有多項研究檢驗了EEG的可靠性, 但EEG在不同實驗條件下的可靠性仍缺乏系統(tǒng)的橫向比較(Bennett & Miller, 2010; Elliott et al., 2020)。亟待通過實驗設(shè)計, 在同一批被試上對不同任務(wù)、不同分析方法進行直接對比。同時, 可靠性也取決于預(yù)處理步驟和腦功能指標(biāo)選擇, 通過橫向比較, 有利于找到最適合探討個體差異的指標(biāo)(Zuo et al., 2019)。在本研究中, 我們從更全面的角度討論了靜息態(tài)、任務(wù)態(tài)EEG在頻域、時域、空域三個維度上的重測信度。我們記錄了42名健康成年被試分別在間隔1.5小時、一個月的三次測試中的rsEEG和ERP, 并對兩類EEG的重測信度進行全方位的比較, 試圖找出幾種實驗條件下的總體重測信度分布、最優(yōu)頻段、最優(yōu)時間點以及最優(yōu)頭表區(qū)域。基于先前的研究, 我們假設(shè):(1) rsEEG可能比ERP總體重測信度更好; (2) EEG的信噪比影響重測信度, 信噪比越高重測信度越好, 因此rsEEG的alpha頻段, ERP的任務(wù)相關(guān)成分(時段、腦區(qū)), 以及受眼電等偽跡影響少的頂葉區(qū)域具有更高的重測信度。本研究試圖在不同維度的特征上對比重測信度并提出可能的原因, 從而為后續(xù)腦電實驗在選擇合適的實驗范式和指標(biāo)提出建議。
2.1.1 被試
本實驗招募健康被試42人, 其中男生14人, 均為右利手, 年齡范圍18~26歲, 平均年齡19.5 ± 1.4歲。視力正?;虺C正正常, 無神經(jīng)系統(tǒng)疾病, 頭部無創(chuàng)傷。無睡眠障礙, 無心理障礙及精神病史, 最近一周睡眠質(zhì)量較好。在腦電實驗當(dāng)天, 禁止食用含酒精、含咖啡因的食物或飲料。每個被試在試驗后都將得到補償, 在主試向被試詳細(xì)解釋研究方案后, 所有被試均簽署了知情同意書。這項研究得到了作者所在單位倫理委員會的批準(zhǔn), 所有實驗都符合赫爾辛基宣言。
2.1.2 實驗設(shè)計
每個被試被邀請到實驗室兩次共進行3次腦電實驗。被試在第一次來實驗室期間接受了兩次腦電實驗測試, 兩次測試間隔90分鐘。一個月后, 被試第二次來實驗室, 接受第三次測試。在每次腦電實驗過程中, 所有被試均完成了4種狀態(tài), 包括兩種靜息態(tài)(睜眼和閉眼)和兩種任務(wù)態(tài)(PVT和Oddball任務(wù))。在每次測試期間, 被試首先完成靜息態(tài), 然后是任務(wù)態(tài), 兩個任務(wù)在所有被試中以隨機順序呈現(xiàn)。具體來說, 在靜息態(tài)腦電記錄過程中, 被試被要求觀看屏幕中間的一個白色十字注視點5 min (EO); 然后閉眼休息5 min (EC), 他們需要盡可能地保持靜止、安靜和放松。在PVT任務(wù)期間, 被試需要對屏幕中間出現(xiàn)的計時器以盡可能快的速度做出按鍵反應(yīng), ERP分析以計時器出現(xiàn)時間為基點(0時刻)截取腦電信號。在Oddball任務(wù)期間, 被試需要對高頻或低頻聲音進行計數(shù), 聲音被隨機選定為高概率(75%)的標(biāo)準(zhǔn)刺激和低概率(25%)的偏差刺激, ERP分析以聲音刺激出現(xiàn)的時間為基點截取腦電信號。
EEG由安裝在彈性帽內(nèi)的63個Ag/AgCl電極記錄, 基于擴展的國際10-20系統(tǒng)(Brain Products Gmbh, Steingrabenstr, Germany)。其中兩個電極用于記錄眼電, FCz用作在線參考電極。采樣頻率為500 Hz, 采用腦電膏調(diào)整電極和頭皮間的電阻, 所有電極的電阻保持在5 kΩ以下。最后, 5種條件被納入分析, 分別是2個靜息態(tài):睜眼和閉眼, 3個任務(wù)態(tài)ERPs:Oddball的標(biāo)準(zhǔn)條件, 偏差條件, 以及PVT。
原始rsEEG數(shù)據(jù)的預(yù)處理包含4個步驟, 使用EEGLAB (版本2019_1, http://sccn.ucsd.edu)實現(xiàn)。第一步, 將原始腦電數(shù)據(jù)在0.3~45 Hz頻段范圍內(nèi)進行帶通濾波。第二步, 人工判讀腦電信號識別壞道, 然后使用線性插值法來重建被去除的導(dǎo)聯(lián)信號(替換為周圍最近鄰?fù)ǖ赖钠骄?。對于所有被試每次腦電實驗的數(shù)據(jù), 壞道的平均數(shù)目為1.61 (±1.96, 范圍0~14)個。第三步, 對數(shù)據(jù)進行全腦平均重參考, 并將其分割成4秒為單位的段(epoch), 人工識別篩選并去除壞段。最后保留的分段數(shù)量, 對于閉眼為:72.56 ± 4.30段, 睜眼為:71.44 ± 5.47段。第四步, 進行獨立成分分析(ICA)去除眼動對應(yīng)的偽跡成分。
對于預(yù)處理后的rsEEG數(shù)據(jù)集, 我們使用Welch方法進一步計算了每個電極的頻譜。每個電極的絕對功率進行對數(shù)轉(zhuǎn)換以計算功率譜(1 dB = 10 × logμV2)。
對于ERP數(shù)據(jù)的預(yù)處理步驟和軟件同rsEEG。ERP分段的事件長度為1500 ms, 包括刺激前500 ms和刺激后1000 ms。對于所有被試的數(shù)據(jù), 壞道的數(shù)目為1.82 (±1.73, 范圍0~9)個。后期分析中, –200 ~ 0 ms用來進行基線校正, 一共提取了3種ERP腦電, 即PVT、Oddball偏差刺激和Oddball標(biāo)準(zhǔn)刺激。最后保留的分段數(shù)量, 對于3個條件分別為:36.13 ± 8.71段; 12.83 ± 4.40段和51.13 ± 12.62段。3個條件分別進行疊加平均得到ERP腦電。
我們使用了類內(nèi)相關(guān)系數(shù)(ICC)來評估5種實驗條件下信號的重測信度。ICC將被試間變異性與總變異性進行比較, 以評估個體重復(fù)測量的可靠性(Koo & Li, 2016)。較高的ICC值表明被試內(nèi)部的變異性較低, 并且大部分變異性是由被試之間的差異引起的。經(jīng)過頻譜分析, 我們計算了5種條件(靜息態(tài)兩種, 任務(wù)態(tài)三種)的ICC值。ICC計算方法基于:
我們使用方差分析(ANOVA)驗證了電極位置和實驗任務(wù)的交互作用。值小于0.05被認(rèn)為具有統(tǒng)計學(xué)意義。所有分析中使用Shapiro-Wilk檢驗, Greenhouse-Geisser校正用于調(diào)整任何違反球形檢驗的影響。
我們首先選取Cz電極的信號進行平均, 并計算所有被試的平均值和標(biāo)準(zhǔn)差。圖1A分別顯示了在三次實驗測量中, 睜閉眼rsEEG在0.3~45 Hz范圍內(nèi)的頻譜活動情況??梢婇]眼狀態(tài)下的絕對功率普遍高于睜眼狀態(tài), 兩種狀態(tài)的rsEEG的最大功率都集中在低頻范圍內(nèi)(0.3~13 Hz左右), 并在10 Hz左右出現(xiàn)峰值。這對應(yīng)于alpha頻段, 符合前人的研究結(jié)果。圖1B分別顯示了在三種ERP中的幅度情況??梢奝VT任務(wù)相比Oddball任務(wù)誘發(fā)了更大的ERP成分。PVT任務(wù)在100 ms左右誘發(fā)了第一個正向波, 在300~700 ms左右具有最大的幅值。Oddball任務(wù)的兩類刺激在250 ms前基本重合, 均在130 ms左右誘發(fā)了N1波, 但是偏差刺激誘發(fā)的幅值略大; 在250 ms左右誘發(fā)了P2波, 偏差刺激的幅值也略大。在250 ms之后, 兩類刺激的ERP波形出現(xiàn)較大差異, 偏差刺激比標(biāo)準(zhǔn)刺激具有更大的幅度。在300~400 ms左右, 偏差刺激比標(biāo)準(zhǔn)刺激多出現(xiàn)一個顯著的P3波。對比三次測試結(jié)果可發(fā)現(xiàn), rsEEG頻譜圖和ERP波形圖相似度均較高, 且前兩次重合度更高。這意味著這5種信號的EEG在三次實驗中都具有良好的重測信度, 且短期重測信度優(yōu)于長期重測信度。
圖1 兩種靜息態(tài)EEG和三種任務(wù)態(tài)ERP在3次實驗(session)中的頻譜圖(A)和波形圖(B)。電極位置均為Cz, 實線表示均值, 淺色陰影表示標(biāo)準(zhǔn)誤。(A)靜息態(tài)兩種條件的頻譜圖, 橫軸代表頻率, 縱軸代表絕對功率值, 紫色線條代表睜眼靜息態(tài)(EO), 綠色線條代表閉眼靜息態(tài)(EC)。(B)任務(wù)態(tài)三種條件的波形圖, 橫軸代表時間, 縱軸代表幅值, 黑色線條代表PVT范式, 黃色線條代表Oddball范式中的偏差刺激(Oddball-D), 藍(lán)色線條代表Oddball范式中的標(biāo)準(zhǔn)刺激(Oddball-S)。彩圖見網(wǎng)絡(luò)版。
注:EO: eyes-open; EC: eyes-close; PVT: psychomotor vigilance task; Oddball-D: deviant stimulus of oddball task; Oddball-S: Standard stimulus of oddball task.
對數(shù)據(jù)質(zhì)量進行初步檢查后, 對兩種rsEEG和三種ERP計算類內(nèi)相關(guān)系數(shù)ICC。結(jié)果發(fā)現(xiàn)(如圖2), rsEEG的重測信度整體優(yōu)于ERP。其中, 兩種靜息態(tài)的ICC值都集中在0.5周圍。EO狀態(tài)下主要在0.45和0.6有聚集, EC狀態(tài)下在0.4和0.6有聚集, 兩者的ICC范圍大體相似(圖2A), EC狀態(tài)下的ICC值在均值、最大值、中值三個指標(biāo)上均優(yōu)于EO狀態(tài)(表1), 配對樣本檢驗差異顯著(= –2.71,= 0.007)。而在ERP中, PVT的重測信度在均值、最大值、中值三個指標(biāo)上均優(yōu)于Oddball范式(表1)。PVT的ICC值集中在0.5左右且整體分布更集中, Oddball下的ICC值集中在0.35左右(圖2B)。對三種ERP信號的ICC值進行單因素方差分析, 結(jié)果顯示差異顯著(= 753.16,< 0.001), 事后檢驗結(jié)果顯示PVT條件的ICC值與Oddball兩種條件的ICC值差異顯著, Oddball兩種條件的ICC值差異不顯著。
在靜息態(tài)頻域范圍內(nèi)和任務(wù)態(tài)時域范圍內(nèi)所有電極的ICC進行平均, 以分別評估rsEEG和ERPs的重測信度在頻、時域上的變換趨勢。結(jié)果發(fā)現(xiàn), 在靜息態(tài)條件下兩種rsEEG的最大ICC值都出現(xiàn)在alpha (8~12 Hz)頻段(ICC > 0.8), 其他頻段的ICC值集中在0.6和0.4左右。同時值得注意的是, 在0~23 Hz頻率范圍內(nèi)EC的ICC值更大, 在23~45 Hz頻率范圍內(nèi)EO的ICC值更大(圖3A)。在任務(wù)態(tài)條件下, 兩種實驗范式下的最大ICC值都出現(xiàn)在200 ms左右(200 ± 20 ms) (ICCPVT> 0.6, ICCOddball-S> 0.5, ICCOddball-D> 0.4), 其他時間點的ICC值略有降低??紤]到在計算ERP成分時, 通常按頂點的幅值來進行分析, 因而我們又對PVT中的N1成分(130~200 ms) (Hoedlmoser et al., 2011)和Oddball任務(wù)中的P200成分(150~275 ms) (趙文瑞等, 2020)分別計算了ICC值。從結(jié)果可見, 對成分的ICC計算結(jié)果與本研究中200 ms左右的結(jié)果基本一致。PVT、Oddball-D和Oddball-S分別得到的ICC為:0.67、0.40和0.28。同時值得注意的是, 在所有時間范圍內(nèi), PVT范式的ICC值均大于Oddball范式。在Oddball范式的兩類刺激中, 0~400 ms范圍內(nèi)標(biāo)準(zhǔn)刺激誘發(fā)的ICC更大, 400 ms之后偏差刺激誘發(fā)的ICC更大(圖3B)。
圖2 ICC值在5種條件的功率(A)和幅值(B)中的分布情況, 包括所有電極、頻率點(rsEEG)和時間點(ERPs)。橫軸代表條件, 縱軸代表ICC值。黑色參考線代表平均值, 紅色參考線代表中值。(A)靜息態(tài)兩種條件下ICC值的分布情況。(B)任務(wù)態(tài)三種條件下ICC值的分布情況。彩圖見網(wǎng)絡(luò)版。
注:EO: eyes-open; EC:eyes-close; PVT: psychomotor vigilance task; Oddball-D: deviant stimulus of oddball task; Oddball-S: Standard stimulus of oddball task.
注:差異檢驗對靜息態(tài)和任務(wù)態(tài)分別進行統(tǒng)計比較, 對靜息態(tài)兩種條件下的ICC均值進行配對樣本檢驗, 對任務(wù)態(tài)三種條件下的ICC均值進行單因素被試內(nèi)ANOVA分析, “ > ”表示有顯著差異 (< 0.05), “/”表示無顯著差異 (> = 0.05).
圖3 所有電極ICC值在5種條件中的變化情況。實線表示均值, 淺色陰影表示標(biāo)準(zhǔn)誤。(A)靜息態(tài)兩種條件下ICC值的變化, 橫軸代表頻率, 縱軸代表ICC值, 紫色線條代表睜眼靜息態(tài)(EO), 綠色線條代表閉眼靜息態(tài)(EC)。(B)任務(wù)態(tài)三種條件下ICC值的變化, 橫軸代表時間, 縱軸代表ICC值, 黑色線條代表PVT范式, 黃色線條代表Oddball范式中的偏差刺激(Oddball-D), 藍(lán)色線條代表Oddball范式中的標(biāo)準(zhǔn)刺激(Oddball-S)。彩圖見網(wǎng)絡(luò)版。
注:EO: eyes-open; EC: eyes-close; PVT: psychomotor vigilance task; Oddball-D: deviant stimulus of oddball task; Oddball-S: Standard stimulus of oddball task.
從上面的分析中可以看到, 靜息態(tài)最大的ICC值出現(xiàn)在alpha頻段(8~12 Hz), 任務(wù)態(tài)最大的ICC值出現(xiàn)在200 ms左右( ± 20 ms)。在進行空間位置的對比時, 為了減小其他因素的影響, 更直觀地對比不同實驗狀態(tài)、條件下的ICC值, 我們分別選取了5種信號在時頻域中最大ICC值出現(xiàn)的范圍(alpha頻段、200 ms左右)。如圖4所示, 對于靜息態(tài), EO條件下較高的ICC值集中出現(xiàn)在中央?yún)^(qū)和頂葉, EC條件下的ICC值總體更大、分布也更廣。同時, 靜息態(tài)的兩種條件對應(yīng)的高ICC值區(qū)域都集中在中央?yún)^(qū)(圖4)。對于任務(wù)態(tài), PVT的高ICC值區(qū)域出現(xiàn)在額葉、中央?yún)^(qū)和頂葉, Oddball標(biāo)準(zhǔn)刺激的ICC值更大, 兩種刺激下的高ICC值區(qū)類似, 都集中在額葉、中央?yún)^(qū)和顳葉(圖4)。
對比5種條件最大ICC值頭表拓?fù)浞植? 可以發(fā)現(xiàn)前三種條件下的最大ICC值均主要集中出現(xiàn)在中央?yún)^(qū)域。而在Oddball除了中央?yún)^(qū)域?qū)?yīng)更大的ICC值外, 顳葉的ICC值也高于其他區(qū)域?;谛旁氡鹊睦碚? 我們假設(shè)前三種條件之所以中央?yún)^(qū)域ICC更大, 是因為這一區(qū)域受到更少的噪聲偽跡(眼電、心電、肌電等)影響, 從而具有更高的信噪比。而Oddball條件下, 顳葉有更多激活, 使顳葉區(qū)域的電極采集到的EEG幅度更大, 因而信噪比更高、ICC更大。為了驗證這個假設(shè), 我們將頭表電極劃分為受噪聲影響少的中央?yún)^(qū)域和影響多的外周區(qū)域。如圖5, 外周區(qū)域包括(AFz, FPz, FP1等)共30個電極, 其余為中央?yún)^(qū)域。分別計算了兩個區(qū)域的平均ICC值(圖5), 將電極位置與實驗條件進行兩因素ANOVA分析, 再進行獨立樣本檢驗。ANOVA分析結(jié)果顯示, 區(qū)域位置因素的主效應(yīng)顯著((1, 23) = 18.58,< 0.001), 中央比外周的ICC高0.068 (< 0.001)。條件因素對ICC的影響也具有統(tǒng)計學(xué)意義((4, 92) = 260.01,< 0.001)。因為條件因素有5個水平, 所以對5個水平條件下的ICC進行兩兩比較, 發(fā)現(xiàn)所有條件下ICC的差異均具有統(tǒng)計學(xué)意義(< 0.001)。ANOVA分析的結(jié)果證明了電極區(qū)域位置和實驗條件主效應(yīng)顯著, 但交互作用對ICC值無顯著的影響。之后進行事后檢驗, 獨立樣本檢驗結(jié)果顯示, EO、EC、PVT、Oddball-D四種條件下中央?yún)^(qū)域和外周區(qū)域電極的ICC值差異顯著, 但Oddball-S條件下差異不顯著(表2)。
圖4 rsEEG的alpha頻段和ERP的P2成分對應(yīng)的ICC值在頭表的分布
注:EO: eyes-open; EC: eyes-close; PVT: psychomotor vigilance task; Oddball-D: deviant stimulus of oddball task; Oddball-S: Standard stimulus of oddball task. 彩圖見網(wǎng)絡(luò)版。
圖5 5種條件(EO, EC, PVT, Oddball-D, Oddball-S)下2個感興趣區(qū)(中央和外周區(qū)域)的ICC平均值。橫軸代表條件, 縱軸代表ICC值。藍(lán)條代表中央?yún)^(qū)域, 橙條代表外周區(qū)域。
注:插入圖為中央與外周區(qū)域電極劃分情況, 藍(lán)色為中央?yún)^(qū)域, 橙色為外周區(qū)域。彩圖見網(wǎng)絡(luò)版。
表2 5種條件下2個感興趣區(qū)的ICC值及其獨立樣本t檢驗結(jié)果
注:EO: eyes-open; EC: eyes-close; PVT: psychomotor vigilance task; Oddball-D: deviant stimulus of oddball task; Oddball-S: Standard stimulus of oddball task.
通過采用多種任務(wù)態(tài)和靜息態(tài)實驗, 本研究對比了5種條件的EEG數(shù)據(jù)在時域、頻域、空域的重測信度。我們發(fā)現(xiàn)rsEEG比ERP的ICC值普遍更高。靜息態(tài)閉眼狀態(tài)的ICC比睜眼狀態(tài)更高, 這與前人的研究結(jié)果一致(Corsi-Cabrera et al., 2007; Duan et al., 2021)。無論是在睜眼還是閉眼狀態(tài)下alpha頻段的重測信度均優(yōu)于其他頻段。任務(wù)態(tài)條件下PVT的ICC比Oddball都高, 并且兩種實驗范式誘發(fā)的最大ICC值均在200 ms左右。在空間位置上除了Oddball標(biāo)準(zhǔn)刺激條件, 其他條件下的最大ICC值都分布在中央?yún)^(qū)域。據(jù)我們所知, 本研究是首次從時域、頻域、空域多維度對比腦電重測信度的研究, 并發(fā)現(xiàn)多個有利于提高重測信度的條件。
從rsEEG的頻譜圖中可以看出, 對于兩種rsEEG而言alpha頻段的功率值都最大, 而alpha的活動主要反映了對任務(wù)無關(guān)神經(jīng)活動的抑制(Klimesch et al., 2007; Uusberg et al., 2013), 這與以alpha頻段為主的閉眼靜息態(tài)具有的高重測信度的結(jié)果一致。
對比兩種rsEEG, 發(fā)現(xiàn)其ICC分布范圍較大且比較相似, 最大值均大于0.9。對于30天定量EEG的研究也發(fā)現(xiàn)靜息狀態(tài)下有良好的重測信度, 其中閉眼狀態(tài)的ICC平均值達(dá)到了0.81 (Cannon et al., 2012)。在我們的結(jié)果中, 閉眼條件相比于睜眼條件重測信度更高, 這一結(jié)果與之前的研究一致(Corsi- Cabrera et al., 2007)。我們根據(jù)影響數(shù)據(jù)質(zhì)量的信噪比理論分析(Zuo et al., 2019), 除了這兩種條件間EEG活動的固有差異外, 還有兩個重要因素影響其重測信度。首先, 從信號的角度, 閉眼條件下alpha頻段的活動比睜眼條件更大, 在功率譜上信號能量更大。同時, alpha節(jié)律與來自全腦的認(rèn)知活動有關(guān), 可以在廣泛區(qū)域的電極中被檢測到, 而其他高頻活動(如beta和gamma節(jié)律)更多地與大腦局部活動有關(guān)(Martín‐Buro et al., 2016), 其在全腦的影響被削弱了。其次, 從噪聲的角度這兩種情況受眼動偽跡影響的程度不一樣, 閉眼狀態(tài)下眼動偽跡明顯少于睜眼狀態(tài), 噪聲的能量更小(Ding et al., 2022)。
對ERP成分的分析發(fā)現(xiàn), 在PVT范式中P1(在刺激開始后約100 ms達(dá)到峰值的正向成分)和N1(在刺激開始后約160 ms達(dá)到谷峰值的負(fù)向成分)是與選擇性、反射性、視覺空間注意以及特征檢測密切相關(guān)的成分(Hoedlmoser et al., 2011)。在Oddball范式中, 標(biāo)準(zhǔn)刺激誘發(fā)N1、P2波, 而偏差刺激誘發(fā)N1、P2、N2、P3和N4波(圖1)。我們的ERP波形圖與先前的研究基本一致(Cassidy et al., 2012), 初步證實了數(shù)據(jù)的可靠性。
基于以往對于腦電重測信度的研究, 我們最初假設(shè)幅度值較大的成分在重測信度上表現(xiàn)更好, 然而結(jié)果并不完全支持該假設(shè)。對于三種ERP信號而言, 重測信度最好的成分都出現(xiàn)在200 ms左右。從圖1的波形圖中可以看出, 三種信號都在200 ms左右出現(xiàn)了任務(wù)相關(guān)成分(PVT范式誘發(fā)的N1成分, Oddball范式誘發(fā)的P2成分), 這部分結(jié)果符合基于信噪比理論提出的:有效信息占比更大重測信度更高的假設(shè)(Zuo et al., 2019)。先前對于多種任務(wù)的研究也發(fā)現(xiàn), 潛伏期較短的成分(P1、N1、N170、ERN)的峰值振幅最穩(wěn)定(Cassidy et al., 2012)。所以基于腦電采集方式和信噪比理論分析, 在ERP早期成分中來自全腦的信號反應(yīng)了更加同步的少數(shù)心理認(rèn)知過程。這種信號同步在之后多個心理認(rèn)知加入的過程中被削弱, 因此ERP中越晚期的成分所反應(yīng)的全腦神經(jīng)活動越復(fù)雜, 在重測時可能就難以保持一致性。
在尋找最優(yōu)重測性的電極位置時, 目前主要有兩種方法:第一種是選擇受眼電、肌電等偽跡影響較小的電極位置, 第二種是選擇與任務(wù)更相關(guān)的大腦區(qū)域?qū)?yīng)的電極位置。這兩種方法分別從減少噪音和增加信號兩個方面提高了數(shù)據(jù)的信噪比, 從而提高了重測信度。我們基于“信噪比”理論提出假設(shè), 旨在對比信息和噪聲兩者對于重測信度影響的差異。從減少噪聲的角度而言, 因為中央?yún)^(qū)域采集的EEG相比于外周區(qū)域更少受到來自眼動、頭動、心跳以及電極連接不牢固的影響, 所以信噪比更高。
我們發(fā)現(xiàn)所有實驗條件下最大ICC值都集中地分布在中央?yún)^(qū)域, 且中央電極比外周電極的重測信度都高(除了Oddball標(biāo)準(zhǔn)刺激條件), 初步證實了目前實驗中噪聲偽跡對于重測信度的影響較大。Oddball標(biāo)準(zhǔn)刺激條件是個例外, 從圖1B的波形圖可以看到, 該條件僅在200 ms左右誘發(fā)了一個顯著波峰, 而P3a (220~280 ms)成分反映了聽覺刺激驅(qū)動的自下而上的前腦區(qū)注意加工機制, 激活腦區(qū)位于初級聽覺皮質(zhì)和前額葉(Vanhaudenhuyse et al., 2008), 意味著Oddball標(biāo)準(zhǔn)刺激條件的ERP信號更多地分布在外周區(qū)域。因此, 除了選擇受偽跡干擾小的電極外, 考慮實驗任務(wù)本身誘發(fā)的ERP成分以提高信號強度也是提高重測信度的有效手段。值得注意的是, 隨著電極性能的提高和預(yù)處理技術(shù)的進步, 目前發(fā)現(xiàn)的周邊區(qū)域相對中央?yún)^(qū)域的劣勢在未來可能會得到改善。
為了得到更普遍適用的指標(biāo), 本研究選擇的實驗是在大多數(shù)腦電實驗中采用的靜息態(tài)睜眼、閉眼狀態(tài), 以及兩種練習(xí)效應(yīng)較小的任務(wù)態(tài)范式, 以確保在多次重復(fù)測量的過程中認(rèn)知心理活動的一致性。雖然結(jié)果發(fā)現(xiàn)靜息態(tài)腦電比任務(wù)態(tài)腦電的ICC值更高(圖2), 但結(jié)果的推廣需要謹(jǐn)慎。有學(xué)者提出rsEEG的可靠性低于ERP, 原因是靜息態(tài)下的注意力和警惕性水平比任務(wù)執(zhí)行時的變化更大, 而執(zhí)行任務(wù)過程時的精神狀態(tài)通常更為統(tǒng)一, 因此對EEG有穩(wěn)定作用(Burgess & Gruzelier, 1993)。但近些年越來越多的研究發(fā)現(xiàn), rsEEG的特定頻段有比ERP更高的重測信度(Shirk et al., 2017)。我們推測這可能基于某些頻段代表了某種恒定的認(rèn)知神經(jīng)活動(Feyissa & Tatum, 2019)。另外近年來rsEEG預(yù)處理技術(shù)的進步也大大減少了來自偽跡的干擾(Duan et al., 2021)。
值得注意的是, PVT的ICC集中在0.5左右, 最大值約為0.8, 這個結(jié)果與靜息態(tài)條件接近(圖2)。早期的研究表明PVT具有高可靠性, 在某些電極和頻段中甚至高于靜息態(tài)(McEvoy et al., 2000)。盡管有研究對Oddball范式下的ERP進行了測量并得到了較高的重測性(Salinsky et al., 1991), 但是本研究發(fā)現(xiàn)Oddball的ICC結(jié)果最差, 中值在0.35左右。從實踐的角度來看, 研究人員所能做的就是盡最大努力測量和消除非感興趣信號(如運動偽跡等)來提高信噪比, 并使用更優(yōu)的方法提高信效度(Zuo et al., 2019)。
此外, 在本研究還發(fā)現(xiàn)試次數(shù)似乎和重測信度相關(guān):閉眼rsEEG試次數(shù)最多, 對應(yīng)了最大的ICC, Oddball偏差條件的試次數(shù)最少對應(yīng)了最小的ICC。與先前的研究一致(Cassidy et al., 2012; Ding et al., 2022; Duan et al., 2021), 我們推測試次數(shù)可能通過影響信噪比間接影響重測信度。在任務(wù)態(tài)和靜息態(tài)EEG實驗中增加試次數(shù)也許是提高重測信度的有效方式。
本研究廣泛對比了多種任務(wù)態(tài)和靜息態(tài)的腦電重測特性, 但是在某些方面仍存在缺陷。第一, 選擇了傳統(tǒng)的數(shù)據(jù)處理方法, 這雖然使得結(jié)果在更多的研究中具有可比性, 但考慮到目前對于預(yù)處理方法和參數(shù)影響腦電信號重測信度的結(jié)論尚不一致(Duan et al., 2021; Suarez-Revelo et al., 2016)。本研究的結(jié)論對于區(qū)別較大的預(yù)處理策略和許多新方法(如功能連接, 腦網(wǎng)絡(luò)等)的參考意義有限, 未來的研究也應(yīng)更多著眼于新策略新方法, 推動腦電數(shù)據(jù)處理和分析流程的標(biāo)準(zhǔn)化(Cohen, 2017)。第二, 對EEG的分析僅局限在頭表水平, 并沒有對其進行源分析, 這可能削弱了其認(rèn)知神經(jīng)方面的理論支持, 源分析角度的重測情況可以參考最新的研究報告(Ding et al., 2022; Duan et al., 2021)。第三, 在對比靜息態(tài)與任務(wù)態(tài)時, 時長和試次數(shù)也是需要被考慮的問題, 而兩種狀態(tài)中實驗時長和壞段比例通常不同, 導(dǎo)致兩種狀態(tài)的試次數(shù)并不統(tǒng)一。第四, 兩種狀態(tài)的難度也有差異, 而本研究局限于靜息態(tài)以及與注意力、警惕性相關(guān)的兩種任務(wù)態(tài), 將此結(jié)論推廣到更廣泛的自然刺激實驗、任務(wù)態(tài)實驗范式時需謹(jǐn)慎。第五, 本實驗被試群體僅限于健康青年人, 尚需在更加多樣化的群體中進行驗證。
綜上所述, 腦電重測性在多個實驗條件、時頻域指標(biāo)、空間位置上都具有一定的可比性, 平均ICC重測信度維持在0.33到0.55之間。靜息態(tài)比任務(wù)態(tài)具有更高的重測信度, 其中閉眼rsEEG的重測信度最好, PVT任務(wù)所反應(yīng)的精神警覺性也有較高重測穩(wěn)定性, 這些都可以用試次數(shù)的增加和穩(wěn)定的認(rèn)知狀態(tài)帶來的高信噪比來解釋。在頻域上, 靜息態(tài)alpha頻段的重測信度最高; 在時域上, 任務(wù)態(tài)200 ms左右的成分最穩(wěn)定; 在空間上, 中央?yún)^(qū)域的重測信度普遍優(yōu)于外周區(qū)域, 時頻空三個維度的證據(jù)初步支持了信噪比對重測信度的決定作用??傊? 我們的研究結(jié)果在更廣泛的因素上討論了重測信度。這些結(jié)果對研究人員選擇實驗范式和指標(biāo)提出了建議, 對于基礎(chǔ)和臨床領(lǐng)域的腦電應(yīng)用都具有重要參考價值。
Bennett, C. M., & Miller, M. B. (2010). How reliable are the results from functional magnetic resonance imaging?(1), 133–155.
Bonanni, L., Thomas, A., Tiraboschi, P., Perfetti, B., Varanese, S., & Onofrj, M. (2008). EEG comparisons in early Alzheimer's disease, dementia with Lewy bodies and Parkinson's disease with dementia patients with a 2-year follow-up.(3), 690–705.
Burgess, A., & Gruzelier, J. (1993). Individual reliability of amplitude distribution in topographical mapping of EEG.(4), 219–223.
Cannon, R. L., Baldwin, D. R., Shaw, T. L., Diloreto, D. J., Phillips, S. M., Scruggs, A. M., & Riehl, T. C. (2012). Reliability of quantitative EEG (qEEG) measures and LORETA current source density at 30 days.(1), 27–31.
Cassidy, S. M., Robertson, I. H., & O'Connell, R. G. (2012). Retest reliability of event-related potentials: Evidence from a variety of paradigms.(5), 659–664.
Cohen, M. X. (2017). Rigor and replication in time-frequency analyses of cognitive electrophysiology data., 80–87.
Corsi-Cabrera, M., Galindo-Vilchis, L., del-Río-Portilla, Y., Arce, C., & Ramos-Loyo, J. (2007). Within-subject reliability and inter-session stability of EEG power and coherent activity in women evaluated monthly over nine months.(1), 9–21.
Deco, G., Jirsa, V. K., & McIntosh, A. R. (2011). Emerging concepts for the dynamical organization of resting-state activity in the brain.(1), 43–56.
Ding, L., Duan, W., Wang, Y., & Lei, X. (2022). Test-retest reproducibility comparison in resting and the mental task states: A sensor and source-level EEG spectral analysis., 20–28.
Duan, W., Chen, X., Wang, Y.-J., Zhao, W., Yuan, H., & Lei, X. (2021). Reproducibility of power spectrum, functional connectivity and network construction in resting-state EEG., 108985.
Elliott, M., Knodt, A., Ireland, D., Morris, M., Poulton, R., Ramrakha, S., ... Hariri, A. (2020). What is the test-retest reliability of common task-fMRI measures? New empirical evidence and a meta-analysis.(7), 792–806.
Feyissa, A. M., & Tatum, W. O. (2019). Adult EEG., 103–124.
Hoedlmoser, K., Griessenberger, H., Fellinger, R., Freunberger, R., Klimesch, W., Gruber, W., & Schabus, M. (2011). Event-related activity and phase locking during a psychomotor vigilance task over the course of sleep deprivation.(3), 377–385.
Klimesch, W., Sauseng, P., & Hanslmayr, S. (2007). EEG alpha oscillations: The inhibition-timing hypothesis.(1), 63–88.
Koo, T. K., & Li, M. Y. (2016). A guideline of selecting and reporting intraclass correlation coefficients for reliability research.(2), 155–163.
Lew, B. J., Fitzgerald, E. E., Ott, L. R., Penhale, S. H., & Wilson, T. W. (2021). Three-year reliability of MEG resting-state oscillatory power., 118516.
Lugo, Z. R., Pokorny, C., Pellas, F., Noirhomme, Q., Laureys, S., Müller-Putz, G., & Kübler, A. (2020). Mental imagery for brain-computer interface control and communication in non-responsive individuals.(1), 21–27.
Martín-Buro, M. C., Garcés, P., & Maestú, F. (2016). Test- retest reliability of resting-state magnetoencephalography power in sensor and source space.(1), 179–190.
McEvoy, L. K., Smith, M. E., & Gevins, A. (2000). Test-retest reliability of cognitive EEG.(3), 457–463.
Newson, J. J., & Thiagarajan, T. C. (2019). EEG frequency bands in psychiatric disorders: A review of resting state studies., 521.
Rotondi, F., Franceschetti, S., Avanzini, G., & Panzica, F. (2016). Altered EEG resting-state effective connectivity in drug-na?ve childhood absence epilepsy.(2), 1130–1137.
Salinsky, M. C., Oken, B. S., & Morehead, L. (1991). Test-retest reliability in EEG frequency analysis.(5), 382–392.
Shirk, S. D., McLaren, D. G., Bloomfield, J. S., Powers, A., Duffy, A., Mitchell, M. B., ... Atri, A. (2017). Inter-rater reliability of preprocessing EEG data: Impact of subjective artifact removal on associative memory task ERP results., 322.
Siebenhühner, F., Weiss, S. A., Coppola, R., Weinberger, D. R., & Bassett, D. S. (2013). Intra-and inter-frequency brain network structure in health and schizophrenia.(8), e72351.
Suarez-Revelo, J., Ochoa-Gomez, J., & Duque-Grajales, J. (2016). Improving test-retest reliability of quantitative electroencephalography using different preprocessing approaches., 961–964.
Tatum, W. O., Olga, S., Ochoa, J. G., Munger Clary, H., Cheek, J., Drislane, F., & Tsuchida, T. N. (2016). American Clinical Neurophysiology Society guideline 7: Guidelines for EEG reporting.(4), 285–293.
Uusberg, A., Uibo, H., Kreegipuu, K., & Allik, J. (2013). EEG alpha and cortical inhibition in affective attention.(1), 26–36.
Vanhaudenhuyse, A., Laureys, S., & Perrin, F. (2008). Cognitive event-related potentials in comatose and post- comatose states.(2), 262–270.
Wang, Y., Duan, W., Dong, D., Ding, L., & Lei, X. (2022). A test-retest resting, and cognitive state EEG dataset during multiple subject-driven states.(1), 566.
Zhao, W. R., Li, C. Y., Chen, J. J., & Lei, X. (2020). Insomnia disorder and hyperarousal: Evidence from resting-state and sleeping EEG.(3), 270–286.
[趙文瑞, 李陳渝, 陳軍君, 雷旭. (2020). 失眠障礙與過度覺醒:來自靜息態(tài)腦電和睡眠腦電的證據(jù).(3), 270–286.]
Zhao, W., van Someren, E. J. W., Li, C., Chen, X., Gui, W., Tian, Y., ... Lei, X. (2021). EEG spectral analysis in insomnia disorder: A systematic review and meta-analysis., 101457.
Zuo, X. N., Xu, T., & Milham, M. P. (2019). Harnessing reliability for neuroscience research.(8), 768–771.
Test-retest reliability of EEG: A comparison across multiple resting-state and task-state experiments
QIN Huiyi1, DING Lihong1, DUAN Wei1,2, LEI Xu1
(1Faculty of Psychology, Southwest University, Chongqing 400715, China) (2Institute of Psychology, Chinese Academy of Sciences, Beijing 100101, China)
Owing to its advantages in time resolution, electroencephalography (EEG) provides an important basis for studying the dynamic cognitive process of the human brain. To explore the electrophysiological mechanism of psychological processes, scalp EEG must have good test-retest reliability. Most studies explore the reliability of the resting-state EEG (rsEEG) or event-related potentials (ERP), lacking a comprehensive comparison of multiple states. We comprehensively compared the test-retest reliability of the two rsEEG with eyes-open (EO) and eyes-close (EC) states, and the ERPs of PVT and oddball tasks, from frequency, time, and spatial domains to identify more widely applicable indicators.
A total of 42 healthy adults (age range = 18–26 years old; mean = 19.5 ± 1.4 years old; 14 males) underwent all three EEG recording sessions, including the present (Session 1), 90 mins later (Session 2), and one month later (Session 3). During each EEG recording session, all the participants completed the same five states including two resting states (eyes-open, eyes-closed, each with 5 minutes) and two task states (PVT and oddball task). Intra-class correlation coefficients (ICC) were computed to assess the test-retest reproducibility of the five states.
This study compares and analyses the test-retest reliability of two resting-state and three task-state EEG from the perspectives of time, frequency, and spatial domains. Results revealed the following: (1) The test-retest reliability of rsEEG was generally better than that of ERP. (2) For rsEEG, the test-retest reliability of the EC resting-state was higher than that of the EO, with the ICC median value of approximately 0.6. Furthermore, the test-retest reliability of the alpha band was the highest in all frequency bands. (3) For the two task-states ERP, the overall ICC of the PVT paradigm was higher than that of the oddball paradigm, and the test-retest reliability was highest at about 200 ms after the stimulus onsets. (4) In the spatial domain, the test-retest reliability is higher in the central region than in the peripheral region, which may be related to the signal-to-noise ratio (SNR).
Our research involves multiple resting-state and task-state experiments. Based on the characteristics of frequency, time, and space domains, we comprehensively compared the optimal retest characteristics of multiple EEG and suggest the possible reasons. Some suggestions for the selection of appropriate experimental paradigms and indicators for the follow-up study of EEG test-retest reliability are provided and guide the application of EEG in the basic and clinical fields.
EEG, event-related potential, test-retest reliability, resting-state EEG
B845
https://doi.org/10.3724/SP.J.1041.2023.01587
2022-09-06
*國家重點研發(fā)計劃重點專項(2021YFC2501502)、國家自然科學(xué)基金面上項目(NSFC31971028)資助。
雷旭, E-mail: xlei@swu.edu.cn