王金海 賈亞茹,2 陳小剛 王 瑤 李 坤,2 孟 佳,2
1(天津工業(yè)大學(xué)電子與信息工程學(xué)院,天津 300387)2(中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院生物醫(yī)學(xué)工程研究所,天津 300192)
腦-機接口(brain-computer interface, BCI)是一種能夠讓使用者通過大腦活動來控制計算機與外部設(shè)備的裝置,它不依賴于周邊神經(jīng)和任何肌肉活動,適用于嚴重神經(jīng)系統(tǒng)疾病或損傷而無法自由移動或控制其身體特定部位的患者。近幾年來,基于穩(wěn)態(tài)視覺誘發(fā)電位(steady-state visual evoked potentials, SSVEP)的BCI技術(shù)發(fā)展迅速,然而許多患有閉鎖綜合征的患者視力也受到很大程度的影響。因此,對于這類患者來說,基于聽覺誘發(fā)電位的BCI系統(tǒng)是一個比較有前景的選擇。
聽覺穩(wěn)態(tài)響應(yīng)(auditory steady state response, ASSR)是由周期性的持續(xù)聲音誘發(fā)的穩(wěn)態(tài)腦電響應(yīng)[1],具有與刺激頻率相同的基頻和諧波成分,已被用于聽力檢測和腦-機接口的研究。雖然可以誘發(fā)ASSR的刺激頻率范圍可達1~200 Hz,但是在成人研究中ASSR在40 Hz附近響應(yīng)最強[1-2]。
ASSR可以通過各種周期性重復(fù)的聲音來誘發(fā),如短純音(tone bursts)[3]、短聲(click)[4-8]、正弦調(diào)幅音(sinusoidal amplitude modulation, SAM)[9-10]、白噪聲(white noise)[7-8]、顫振調(diào)幅音(flutter-amplitude modulated tones, FAM)[5]和音樂般的刺激[11-12]。目前,click聲、SAM聲和白噪聲是3種常見的誘發(fā)ASSR的刺激聲。click聲已被證明能夠產(chǎn)生最強且穩(wěn)定的ASSR響應(yīng)[7,13],并廣泛應(yīng)用于臨床研究,特別是被用于測試精神病患者的局部皮層網(wǎng)絡(luò)產(chǎn)生gamma頻率活動的能力[5,14]。SAM聲也是臨床ASSR應(yīng)用最常選擇的刺激聲。聽力評估通常是在受試者睡覺時進行[2,15],所以可能無需注意力相關(guān)響應(yīng)調(diào)制。換言之,即使受試者無意識時,SAM聲依舊能誘發(fā)較強的ASSR。而基于ASSR的BCI系統(tǒng)需要受試者能夠選擇性地注意目標和非目標刺激,SAM聲是否適合構(gòu)建基于ASSR的BCI系統(tǒng)仍需進一步研究。白噪聲也可以誘發(fā)ASSR,它是一種功率譜密度為常數(shù)的隨機信號或隨機過程,聲音比較穩(wěn)定、平和。雖然這3種常見的刺激聲均可用于誘發(fā)ASSR,但鮮有研究比較這3種刺激聲誘發(fā)的ASSR響應(yīng)。
本研究利用典型相關(guān)分析,通過計算3種常見的誘發(fā)ASSR的刺激聲的分類正確率和信息傳輸率,以期為基于ASSR的BCI系統(tǒng)尋求合適的刺激聲,為BCI的后續(xù)研究打下基礎(chǔ)?;贏SSR的BCI系統(tǒng)主要是根據(jù)聽覺響應(yīng),不受限于視覺,有望為視覺障礙患者提供一種新的與外界交流通道。為此,實驗過程中要求受試者清醒閉眼,根據(jù)聽覺提示聲將注意力集中于相應(yīng)的刺激聲。
共有14名健康受試者參與了實驗,其中男性8名、女性6名,年齡在22~30歲之間。受試者均無可能影響實驗結(jié)果的神經(jīng)性疾病,認知功能正常,聽力正常,均為右利手。所有受試者自愿參加實驗,在實驗過程中處于清醒狀態(tài)。實驗之前,所有受試者均簽署書面知情同意書并獲得一定報酬。
本研究采用3種不同的刺激聲(click、SAM和white noise)誘發(fā)ASSR。第一種click聲由相同的矩形脈沖響應(yīng)組成,如圖1(a)所示,離散矩形脈沖幅值是-1~1。在本研究中,click頻率定義為調(diào)制頻率(左耳38 Hz,右耳42 Hz),以便與其余ASSR刺激類型進行比較,有
S1(t)=square(2πft,D)
(1)
式中,t為時間,f為頻率,D表示占空比。
第二種SAM聲與先前研究類似[5],示例波形如圖1(b)所示,有
S2(t)=sin(2πfct)sin(πfmt)
(2)
式中,t為時間,fc為載波頻率,fm為包絡(luò)調(diào)制頻率。
最后一個white noise聲是一種功率譜密度在整個頻域內(nèi)均勻分布的噪聲,所有頻率處能量密度相同,有
S3(t)=sin(2πft)+rand(1,length(t))
(3)
式中,t為時間,f與SAM包絡(luò)調(diào)制頻率fm一致,與click聲頻率相同,方便與click聲和SAM聲進行比較。white noise聲波形如圖1(c)所示。
由于在成人研究中ASSR在40 Hz附近響應(yīng)最大[1-2],因此本研究選用40 Hz附近的兩種頻率,38和42 Hz,分別作為左、右耳刺激頻率。不同的刺激頻率會引起不同頻率的ASSR,這可以在記錄的EEG頻譜中觀察到。SAM聲左右耳的載波頻率分別是左耳1 000 Hz、右耳2 500 Hz,由于載波頻率不同,可以幫助受試者區(qū)分左右刺激并且集中注意在目標刺激上[9]。SAM聲左、右耳的正弦脈沖寬度分別為26.3和23.8 ms。本實驗所使用的3種刺激聲均由Matlab合成,采樣率為44 100 Hz。各刺激聲的持續(xù)時間為20 s,聽覺刺激的呈現(xiàn)是通過基于Matlab的Psychtoolbox工具包來實現(xiàn)的[16]。
圖1 刺激聲波形(上為38 Hz,下為42 Hz)。 (a)click聲;(b)SAM聲;(c)白噪聲Fig.1 Waveform of the auditory stimuli (38 Hz on the top and 42 Hz on the bottom). (a)Click stimulation;(b)SAM stimulation;(c) White noise stimulation
圖2 刺激聲播放序列Fig.2 Time-series stimulus signals
受試者舒適地靜坐在屏蔽室的椅子上,并戴上Etymotic公司的ER-3C型氣導(dǎo)插入式耳機。刺激聲通過RME Fireface 802聲卡從電腦輸出,左耳刺激聲的調(diào)制頻率為38 Hz,右耳刺激聲的調(diào)制頻率為42 Hz,刺激播放序列如圖2所示。在刺激聲播放前會播放2 s的提示聲,以提示受試者接下來刺激聲會出現(xiàn)在左耳或右耳(左右耳刺激的順序是隨機的);緊接著播放20 s的刺激聲,之后為2 s的休息時間,隨后開始下一個trial。在實驗過程中,受試者保持清醒閉眼狀態(tài)。
實驗包含3種刺激聲(click、SAM、white noise),每種刺激聲有2個block,且每個block包含20個trials,分別對應(yīng)于左右耳各10個trials。3種刺激聲出現(xiàn)的順序是隨機的。
腦電數(shù)據(jù)的采集采用Neuroscan公司的Synamps2放大器,采樣率為1 000 Hz,并進行在線50 Hz陷波。記錄64電極,電極分布符合國際10-20系統(tǒng),接地電極位于左乳突,參考電極為右乳突,所有電極阻抗低于10 kΩ。
根據(jù)刺激程序的事件觸發(fā)信號,將EEG數(shù)據(jù)分割成多個事件相關(guān)的數(shù)據(jù)段,然后對分段EEG數(shù)據(jù)進行250 Hz降采樣處理。本研究首先分析了ASSR的幅值譜,其是通過快速傅里葉變換(FFT)計算得來的[17]。利用數(shù)據(jù)長度為20 s的分段數(shù)據(jù),計算ASSR的幅值譜。對于每種實驗條件,首先進行時域平均,以提高ASSR的信噪比。
典型相關(guān)分析(canonical correlation analysis, CCA)已廣泛應(yīng)用于檢測穩(wěn)態(tài)視覺誘發(fā)電位(steady-state visual evoked potential, SSVEP)[18-21]。由于ASSR具有與SSVEP相類似的頻率特性,本研究嘗試利用CCA方法檢測ASSR。CCA是一種度量兩組信號之間線性相關(guān)性的多變量統(tǒng)計方法。假定兩組信號X和Y,CCA的核心是通過求解式(4)的優(yōu)化問題,找到兩個線性組合WX和WY,使得式(5)和式(6)之間的相關(guān)系數(shù)最大,即
(4)
x=XTWX
(5)
y=YTWY
(6)
式中:ρ為相關(guān)系數(shù),最大的ρ值對應(yīng)于x和y之間具有最大的相關(guān)性;X為多導(dǎo)EEG信號;Y為與X具有相同數(shù)據(jù)長度的正余弦參考信號。
正余弦參考信號Yf被設(shè)置為
(7)
式中,f為刺激頻率,Nh為諧波次數(shù),fs為采樣率。
在本研究中,fk(k=1,2)為第k個刺激頻率。為了檢測ASSR的頻率成分,CCA計算了多導(dǎo)EEG信號與各刺激頻率對應(yīng)的正余弦參考信號的典型相關(guān)系數(shù),具有最大典型相關(guān)系數(shù)的正余弦參考信號的頻率被認為是ASSR的頻率。
圖3 各實驗條件下ASSR的幅值譜(上為38 Hz,下為42 Hz,圓圈表示刺激頻率的基頻和諧波成分)。 (a)Click聲;(b)SAM聲;(c)白噪聲Fig.3 Amplitude spectrum of ASSR for each condition (38 Hz on the top, 42 Hz on the bottom and the circles indicate the fundamental and harmonic frequencies of the stimulation frequencies). (a)click stimulation;(b)SAM stimulation;(c) White noise stimulation
分類正確率和信息傳輸率(information transfer rate, ITR)被用于評估各刺激聲的左右耳刺激分類。在本研究中,ITR通過下式計算得出,有
(8)
式中:N為目標數(shù)量,在本研究中為2;p為分類正確率;T為發(fā)送每個命令所需時間,包括注意時間和注意切換時間。在本研究中,注意切換時間為0.5 s。
本研究利用SPSS進行統(tǒng)計分析。在進行重復(fù)測量方差分析時,對不符合Mauchly球形檢驗的數(shù)據(jù)采用Greenhouse-Geisser法矯正P值,并用Bonferroni多重比較檢驗統(tǒng)計分析,以P<0.05為顯著性標準。
圖3顯示了不同刺激聲、不同調(diào)制頻率下FCz電極處ASSR幅值譜??梢钥闯?,ASSR幅值譜在調(diào)制頻率的基頻和諧波處有明顯的峰值,并且基頻成分表現(xiàn)出最高的幅值,諧波的幅值隨著響應(yīng)頻率的增加而顯著下降。
圖4顯示了不同刺激聲、不同調(diào)制頻率下ASSR幅值的地形圖。可以看出,ASSR響應(yīng)最大的區(qū)域主要集中在額中央?yún)^(qū)。因此,后續(xù)的分析都是基于平均額中央?yún)^(qū)4個電極(FC1、FCz、FC2、Cz)的ASSR信號。
圖4 各實驗條件下ASSR幅值的地形圖(上為38 Hz,下為42 Hz)。 (a)click聲;(b)SAM聲;(c)白噪聲Fig.4 Topographies of ASSR amplitudes for each condition (38 Hz on the top and 42 Hz on the bottom). (a)Click stimulation;(b)SAM stimulation;(c) White noise stimulation
圖5 各實驗條件下ASSR的平均幅值(誤差棒為標準誤差)Fig.5 Averaged ASSR amplitudes of each condition(The error bars indicate standard errors)
圖5顯示了不同刺激聲、不同調(diào)制頻率下ASSR的平均幅值。click聲誘發(fā)的ASSR幅值最高,而SAM聲誘發(fā)的ASSR幅值最低。對ASSR幅值進行2(刺激頻率為38、42 Hz)×3(刺激聲為click、SAM、white noise)兩因素重復(fù)測量方差分析:刺激聲的主效應(yīng)差異顯著(F(2,26)=32.09,P<0.001),表明不同刺激聲所誘發(fā)的ASSR的幅值有顯著差異;刺激頻率的主效應(yīng)差異不顯著(F(1,13)=0.84,P>0.05),刺激聲和刺激頻率的交互作用不顯著(F(2,26)=0.10,P>0.05)。多重比較結(jié)果顯示,click聲誘發(fā)的ASSR幅值顯著高于SAM聲和white noise誘發(fā)的ASSR幅值(P<0.001)。
圖6 各刺激聲在不同數(shù)據(jù)長度下的分類正確率和信息傳輸率。(a)分類準確率;(b)信息傳輸率Fig.6 Classification accuracy and ITR for each stimulation sounds using different data lengths. (a)Classification accuracy;(b)ITR
本研究還利用CCA方法對不同刺激聲下的兩種調(diào)制頻率進行分類,圖6顯示了不同數(shù)據(jù)長度(2.5~20 s,間隔0.5 s)下CCA方法的分類正確率和信息傳輸率。隨著數(shù)據(jù)長度的增加,分類正確率不斷增加,直至達到一個穩(wěn)定的水平。click聲的分類性能最高,white noise聲的分類性能次之,SAM聲的分類性能最低。各刺激聲的信息傳輸率達到峰值所對應(yīng)的數(shù)據(jù)長度不同(click:4 s,SAM:12.5 s,white noise:10 s),各刺激聲對應(yīng)的最高信息傳輸率也不同(click:6.69 bit/min,SAM:0.76 bit/min,white noise:1.65 bit/min)。這些結(jié)果表明,click聲獲得最高的分類性能,提示它更適合于開發(fā)高速的BCI系統(tǒng)。對于各數(shù)據(jù)長度,對刺激聲(click、SAM、white noise)單因素3個水平下的分類正確率和信息傳輸率進行重復(fù)測量方差分析。方差分析結(jié)果表明:刺激聲之間的分類正確率存在顯著差異(P<0.001),刺激聲之間的信息傳輸率也有顯著差異(P<0.001)。
本研究基于14名健康受試者的腦電數(shù)據(jù),對3種刺激聲的性能和特點進行了比較,研究了刺激聲對ASSR響應(yīng)的影響。實驗結(jié)果表明,3種刺激聲均可誘發(fā)出ASSR,先前已有研究分別驗證了這3種刺激聲可以誘發(fā)ASSR[4-10],本研究的結(jié)果與其一致。本研究還發(fā)現(xiàn),這3種刺激聲誘發(fā)的ASSR響應(yīng)最大區(qū)域主要集中在額中央?yún)^(qū),與Herdman等的調(diào)幅聲刺激ASSR[22]以及Voicikas等研究中顫振調(diào)幅音(FAM)和click聲誘發(fā)ASSR的腦電地形圖[5]基本一致。從ASSR響應(yīng)的地形圖和幅值可以看出,click聲誘發(fā)的ASSR響應(yīng)最強,白噪聲次之,SAM聲誘發(fā)的ASSR響應(yīng)最弱,這進一步驗證了click聲能夠誘發(fā)出較強的ASSR。另外,本研究還利用CCA方法,分別對3種刺激聲的左右耳調(diào)制頻率進行二分類。研究發(fā)現(xiàn):click聲的分類性能最高,white noise聲的分類性能次之,SAM聲的分類性能最低;click聲的最高信息傳輸率可達6.69 bit/min。上述結(jié)果表明,click聲更適合于構(gòu)建高速的BCI系統(tǒng)。
本研究所使用的范式具有幾個適用于實際BCI系統(tǒng)的優(yōu)點:首先,實驗之前不需要對受試者進行訓(xùn)練;其次,由于范式簡單直觀,受試者可以很容易地理解目標任務(wù),只要將注意力集中在左或右聲源上;再次,在整個實驗過程中沒有使用任何視覺信息,這點最重要,因為聽覺BCI系統(tǒng)的主要目標是患有晚期肌萎縮側(cè)索硬化(amyotrophic lateral sclerosis, ALS)的患者,這類患者難以控制眼球運動。
但是,在本研究中,左右耳并非同時給音,與實際應(yīng)用的BCI系統(tǒng)仍存在一定的差距。下一步的研究將考慮左右耳同時給音,要求受試者選擇性注意特定刺激。本研究的結(jié)果為離線數(shù)據(jù)分析結(jié)果,接下來的研究將考慮利用click聲構(gòu)建基于ASSR的在線BCI系統(tǒng),以進一步驗證系統(tǒng)的可行性。雖然視覺和運動障礙患者是基于ASSR的BCI系統(tǒng)應(yīng)用的主要用戶,但目前少有研究利用患者驗證BCI系統(tǒng)的可行性,下一步的研究將嘗試利用患者對基于ASSR的BCI系統(tǒng)進行測試。另外,在本次實驗中,受試者普遍反映實驗所用的刺激聲單調(diào)枯燥,基于這一點,今后將在不影響刺激聲分類性能的基礎(chǔ)上,進一步尋找使刺激聲更為舒適的方法,嘗試尋找?guī)в斜尘耙魳返拇碳ぢ暋?/p>
本研究比較了click、SAM和white noise 3種刺激聲所誘發(fā)的ASSR。結(jié)果表明,這3種刺激聲均能誘發(fā)出穩(wěn)定的ASSR,并且click聲誘發(fā)出的ASSR響應(yīng)最強。基于CCA方法的二分類結(jié)果也顯示,click聲獲得最高的分類性能(click:6.69 bit/min,SAM:0.76 bit/min,white noise:1.65 bit/min)。這些結(jié)果表明,click聲適合于開發(fā)高速的BCI系統(tǒng)。