摘" 要" 大腦可以快速地加工信息以應(yīng)對(duì)不斷變化的環(huán)境, 其典型范例之一是快速言語識(shí)別。自然言語的瓶頸速率約為8~12音節(jié)/秒, 與神經(jīng)振蕩的alpha速率相近。此外, 已有研究表明alpha振蕩可以調(diào)控知覺過程的時(shí)間分辨率。那么, alpha振蕩速率是否影響快速言語識(shí)別的時(shí)間瓶頸?其作用機(jī)制是什么?本研究利用心理物理學(xué)方法和認(rèn)知神經(jīng)科學(xué)方法, 從現(xiàn)象和機(jī)制兩個(gè)方面考察alpha振蕩如何影響快速言語識(shí)別的時(shí)間瓶頸。在現(xiàn)象方面, 本研究將驗(yàn)證快速言語識(shí)別的時(shí)間瓶頸與alpha振蕩速率的一致性。在機(jī)制方面, 本研究將研究alpha振蕩速率如何影響快速言語識(shí)別的行為表現(xiàn), 又如何調(diào)控大腦對(duì)言語信號(hào)的神經(jīng)加工過程。本研究希望找到快速言語識(shí)別的神經(jīng)機(jī)制, 從而更深入地理解大腦的快速加工過程, 并進(jìn)一步探討神經(jīng)振蕩調(diào)控大腦時(shí)間分辨率的相關(guān)機(jī)制。
關(guān)鍵詞" 聽知覺, 言語識(shí)別, 快速言語, 時(shí)間分辨率, alpha波
分類號(hào)" B842.2
1" 問題提出
在日常生活中, 大腦需要在短時(shí)間內(nèi)快速處理大量信息, 如駕駛汽車在車流中穿梭, 如快速瀏覽音視頻并實(shí)時(shí)獲取信息。這種快速信息處理的能力讓我們能夠適應(yīng)不斷變化的環(huán)境。大腦如何快速地處理信息?其速率瓶頸來自于何處?這是心理學(xué)與神經(jīng)科學(xué)的前沿?zé)狳c(diǎn)問題, 至今尚未被完全破解。
快速言語的識(shí)別是快速信息處理的一個(gè)典型例子。人類的自然語速大約為每秒2~5個(gè)音節(jié)(Reynolds amp; Givens, 2001; Greenberg et al., 2003; Hyafil et al., 2015; Ding et al., 2017; Molinaro et al., 2021)。即使將語速提高到原來的3倍, 即每秒8~12個(gè)音節(jié)左右, 人們?nèi)匀豢梢岳斫庋哉Z含義。但如果語速提高到原來的3倍以上, 對(duì)言語的識(shí)別將顯著下降(Dupoux amp; Green, 1997; Peelle et al., 2004; Nourski et al., 2009)。這一時(shí)間瓶頸與神經(jīng)振蕩alpha振蕩速率相一致。那么, 快速言語識(shí)別的時(shí)間瓶頸與大腦的alpha振蕩頻率有何關(guān)聯(lián)?這一關(guān)聯(lián)如何解釋了大腦實(shí)時(shí)加工的基本機(jī)制?
本研究擬使用腦電圖、腦磁圖和經(jīng)顱電刺激, 考察快速言語識(shí)別的時(shí)間瓶頸是否取決于大腦的alpha振蕩頻率, 并進(jìn)一步揭示大腦處理信息的時(shí)間分辨率及其背后的神經(jīng)機(jī)制。本研究將從三個(gè)方面考察alpha振蕩影響快速言語識(shí)別的機(jī)制: (1) Alpha振蕩的速率是否與快速言語識(shí)別的時(shí)間瓶頸相一致?(2) Alpha振蕩的速率如何調(diào)控快速言語的識(shí)別行為?(3) Alpha振蕩的速率如何影響快速言語的神經(jīng)加工過程?
2" 國內(nèi)外研究現(xiàn)狀
2.1" Alpha振蕩調(diào)控大腦的時(shí)間分辨率
近年來的研究表明, alpha振蕩的速率影響大腦處理過程的時(shí)間分辨率(Mathewson et al., 2009; Dugué et al., 2011; Cecere et al., 2015; Keitel et al., 2019; Grabot amp; Kayser, 2020)。例如, 前人研究表明, 兩個(gè)相鄰的視覺光點(diǎn)有時(shí)會(huì)被感知為分隔的兩個(gè)光點(diǎn), 有時(shí)則會(huì)被感知為連續(xù)的一個(gè)光點(diǎn)。這種雙光點(diǎn)知覺融合的臨界間隔約為90~130 ms左右, 換算到頻域約為8~12 Hz, 與alpha頻率范圍一致。并且, 對(duì)于每個(gè)被試來說, 其知覺融合的臨界間隔與自身alpha振蕩的頻率一致。即被試自身alpha振蕩頻率越高, 或者說一個(gè)alpha振蕩周期時(shí)間越短, 雙光點(diǎn)知覺融合的臨界間隔就越小; 反之, 若被試自身alpha振蕩頻率越低, 即一個(gè)alpha振蕩周期時(shí)間越長, 則雙光點(diǎn)知覺融合的臨界間隔就越大(Samaha amp; Postle, 2015; Ronconi amp; Melcher, 2017)。同時(shí), 通過經(jīng)顱電刺激調(diào)整alpha振蕩的速率, 也可以改變知覺融合的臨界間隔。對(duì)于兩個(gè)相同時(shí)間間隔的刺激, 當(dāng)alpha振蕩較快時(shí), 兩個(gè)相鄰刺激的間隔會(huì)超過一個(gè)alpha周期, 則被試可以分辨其為兩個(gè)刺激; 反之, 如果alpha振蕩較慢, 兩個(gè)刺激都落在同一個(gè)alpha周期內(nèi), 被試便難以分辨這兩個(gè)刺激。
此外, alpha振蕩的頻率同樣影響了其他瞬時(shí)知覺的時(shí)間分辨率。例如, 時(shí)間相近的視覺和聽覺信號(hào)可能會(huì)被知覺為前后獨(dú)立或同時(shí)發(fā)生的信號(hào), 這取決于視覺和聽覺兩信號(hào)呈現(xiàn)的間隔時(shí)間。研究表明這一間隔時(shí)間的閾限也與alpha振蕩的速率有關(guān), 即間隔短于一個(gè)alpha周期的視覺和聽覺信號(hào), 得以在同一周期內(nèi)被加工, 更容易被知覺為同時(shí)發(fā)生(Cecere et al., 2015)。又例如兩點(diǎn)的閃爍可能被知覺為不同的運(yùn)動(dòng)模式, 也取決于閃爍前后幀的間隔時(shí)間是否長于一個(gè)alpha周期, 從而導(dǎo)致前后兩幀是否在同周期內(nèi)被整合(Shen et al., 2019)。這意味著, alpha振蕩的頻率會(huì)影響大腦如何處理時(shí)間相近的信息, 即落在一個(gè)alpha周期內(nèi)的多個(gè)刺激難以被分辨。
特別要說明的是, alpha振蕩速率對(duì)時(shí)間分辨率的影響不僅限于視覺過程。如上所述, 視聽整合的閾限時(shí)間也與alpha振蕩的周期時(shí)間有關(guān)(Cecere et al., 2015)。這意味著, alpha振蕩的影響可能不僅限于知覺過程, 而是涉及到更高級(jí)的識(shí)別整合過程。那么, 各感覺通道, 包括聽覺通道, 其時(shí)間分辨率都會(huì)受到alpha振蕩的調(diào)控。此外, 已有研究也表明, 聽覺通道的識(shí)別過程也會(huì)受到alpha振蕩的影響。比如, alpha振蕩的相位會(huì)影響聽者在噪音下的聲音識(shí)別(Neuling et al., 2012), 或影響聽者對(duì)不同聲音信號(hào)的差異辨別(Hansen et al., 2019)。又比如, alpha振蕩會(huì)幫助連續(xù)言語信號(hào)的分割過程(Shahin amp; Pitt, 2012), 從而為言語識(shí)別打好基礎(chǔ)。因此, 言語識(shí)別的時(shí)間瓶頸很可能也取決于alpha 振蕩的速率。
2.2" Alpha振蕩影響快速言語識(shí)別的機(jī)制
Alpha振蕩影響快速言語識(shí)別的機(jī)制是一個(gè)復(fù)雜過程。上述研究已經(jīng)表明, alpha振蕩影響大腦時(shí)間分辨率的關(guān)鍵在于不同刺激是否落在同一個(gè)alpha振蕩周期內(nèi)。也就是說, 大腦可以充分加工間隔超過一個(gè)alpha周期的相鄰兩刺激, 而難以同時(shí)加工落在一個(gè)alpha周期的兩個(gè)刺激。這意味著大腦知覺識(shí)別的時(shí)間瓶頸與alpha振蕩的頻率有關(guān)(Samaha amp; Postle, 2015; Ronconi amp; Melcher, 2017)。因此, 在快速言語識(shí)別領(lǐng)域, 相鄰音節(jié)是否落在同一個(gè)alpha振蕩周期內(nèi), 很可能是識(shí)別行為的關(guān)鍵。
此外, 另一個(gè)需要解決的重要問題是, alpha振蕩主要調(diào)控快速言語識(shí)別的哪個(gè)過程, 是初級(jí)的感覺過程, 還是更高級(jí)的知覺組織過程?,F(xiàn)有的研究證據(jù)大多支持alpha振蕩的調(diào)控并不基于初級(jí)感覺過程。原因有如下兩點(diǎn)。其一, 有研究發(fā)現(xiàn), 在言語加速到難以理解的4倍速情形下, 聽皮層的神經(jīng)振蕩與言語包絡(luò)仍然有很高的相關(guān)性。換言之, 即使言語速度加快到不可理解的程度, 初級(jí)聽皮層仍可以很好地追隨語音包絡(luò)。這說明初級(jí)感覺皮層可以很好地追隨快速言語信號(hào)的波動(dòng)(Nourski et al., 2009; Mukamel et al., 2011)。這種簡(jiǎn)單的言語-神經(jīng)追隨不受語速的影響, 并不是快速言語識(shí)別的時(shí)間瓶頸。因此, alpha振蕩對(duì)快速言語識(shí)別的調(diào)控更可能是一種高層的、后期的調(diào)控, 會(huì)影響信息的后期整合。其二, 根據(jù)認(rèn)知神經(jīng)方向的現(xiàn)有研究, 并不只有初級(jí)感覺皮層能夠表征言語信號(hào)的時(shí)間信息。在其他皮層, 例如聽覺皮層和運(yùn)動(dòng)皮層都能捕捉到對(duì)言語包絡(luò)的追隨(Wilson et al., 2004; Du et al., 2014; Cheung et al., 2016; Assaneo amp; Poeppel, 2018; Park et al., 2018)。而左側(cè)額下回廣泛參與言語加工過程, 也可能是快速言語處理的關(guān)鍵腦區(qū)之一(Adank amp; Devlin, 2010; Peelle et al., 2010; Vagharchakian et al., 2012)。這些研究結(jié)果都說明alpha振蕩影響快速言語識(shí)別的調(diào)控機(jī)制應(yīng)當(dāng)是涉及高級(jí)認(rèn)知腦區(qū)的復(fù)雜過程。
最后要說明的是, 當(dāng)前對(duì)alpha振蕩調(diào)控刺激分辨的神經(jīng)機(jī)制的研究中存在一定不足。由于現(xiàn)有研究其刺激都是光點(diǎn)或短音, 持續(xù)時(shí)間過短, 因此無法得知alpha振蕩如何影響對(duì)刺激本身的神經(jīng)表征(Cecere et al., 2015; Samaha amp; Postle, 2015; Ronconi amp; Melcher, 2017; Shen et al., 2019; Grabot amp; Kayser, 2020)。即是說, 在研究過程中首先需要描繪刺激本身的神經(jīng)表征, 之后才能探究alpha振蕩怎樣對(duì)此神經(jīng)表征產(chǎn)生影響。那么, 對(duì)于言語這種長時(shí)程信號(hào), 可以很方便地記錄并解碼其相應(yīng)的神經(jīng)表征。此外, 已有研究表明, 言語的神經(jīng)表征可受調(diào)節(jié)并體現(xiàn)言語可懂度(Ding amp; Simon, 2012; Mesgarani amp; Chang, 2012; Brodbeck et al., 2018; Zou et al., 2019)。因此, 后續(xù)研究應(yīng)當(dāng)利用長時(shí)程言語信號(hào)及其神經(jīng)表征, 可以進(jìn)一步闡釋alpha振蕩如何調(diào)控刺激自身的神經(jīng)表達(dá), 從而影響知覺過程的時(shí)間分辨率。
3" 研究構(gòu)想
為了深入研究alpha振蕩影響快速言語識(shí)別的神經(jīng)機(jī)制, 我們提出了以下三個(gè)相互關(guān)聯(lián)且層層深入的研究內(nèi)容: (1)研究1驗(yàn)證大腦alpha振蕩是否影響快速言語識(shí)別的時(shí)間瓶頸, 即兩者是否一致。(2)若研究1已經(jīng)證實(shí)alpha振蕩影響了言語識(shí)別的時(shí)間瓶頸, 研究2將詳細(xì)闡述alpha振蕩如何調(diào)控快速語言識(shí)別的行為表現(xiàn), 并重點(diǎn)考察這種調(diào)控是否基于高級(jí)認(rèn)知過程。(3)在研究1、研究2的基礎(chǔ)上, 研究3將進(jìn)一步在腦活動(dòng)層面上考察, alpha振蕩的調(diào)控作用如何反映在言語的神經(jīng)表征中。
3.1" 研究1: 快速言語識(shí)別的時(shí)間瓶頸與alpha振蕩頻率的一致性
已有研究表明, 自然語速約2~5字/秒, 而大腦最快可以識(shí)別約3倍語速的快速言語(Dupoux amp; Green, 1997; Ghitza amp; Greenberg, 2009; Vagharchakian et al., 2012; Borges et al., 2018)。即是說, 言語識(shí)別的時(shí)間瓶頸約為每秒8~12個(gè)音節(jié)(字), 恰好與alpha振蕩的頻率區(qū)間相重合。如果個(gè)體快速言語識(shí)別的時(shí)間瓶頸與其固有的alpha振蕩的頻率相一致, 則這一結(jié)論能夠?yàn)閍lpha振蕩是否可以調(diào)控言語識(shí)別行為提供核心證據(jù)。因此, 研究1設(shè)計(jì)了兩個(gè)實(shí)驗(yàn)來驗(yàn)證快速言語識(shí)別的時(shí)間瓶頸是否與alpha振蕩的頻率相一致。
研究1的子實(shí)驗(yàn)1假設(shè)快速言語識(shí)別的時(shí)間瓶頸與大腦alpha振蕩的頻率相一致, 且具有相關(guān)關(guān)系。研究1預(yù)計(jì)招募較大規(guī)模被試, 分別測(cè)量被試對(duì)快速言語識(shí)別行為的時(shí)間瓶頸(即言語識(shí)別的閾限速率)和被試自身固有的alpha振蕩頻率, 并考察這兩個(gè)變量是否具有相關(guān)性。即個(gè)體固有的alpha振蕩頻率越快, 是否其言語識(shí)別的閾限速率就越快。研究1使用不同語速(8~12 Hz)的言語材料, 記錄被試在不同語速下的識(shí)別率, 并計(jì)算50%識(shí)別率對(duì)應(yīng)的閾限語速。同時(shí), 將使用腦電圖記錄并提取每個(gè)被試的alpha振蕩峰值頻率。將行為與電生理數(shù)據(jù)相結(jié)合, 子實(shí)驗(yàn)1考察被試的行為閾限與alpha振蕩頻率是否相一致。
研究1的子實(shí)驗(yàn)2考察大腦alpha振蕩的頻率是否能實(shí)時(shí)預(yù)測(cè)言語識(shí)別的時(shí)間瓶頸。即是說, 在每個(gè)被試內(nèi), 試次前的alpha振蕩頻率應(yīng)可以預(yù)測(cè)該試次的行為結(jié)果。對(duì)于每個(gè)被試, 使用10Hz的快速言語進(jìn)行多次實(shí)驗(yàn), 并記錄其言語識(shí)別正確率。根據(jù)行為結(jié)果, 不同試次分為不同正確率的幾組, 分別計(jì)算并比較各組試次前的alpha振蕩頻率。子實(shí)驗(yàn)2想考察, 是否行為成績?cè)胶玫脑嚧危?其alpha振蕩的頻率就越快。研究1的兩個(gè)實(shí)驗(yàn)都希望證實(shí)alpha振蕩的速率與被試快速言語識(shí)別的時(shí)間瓶頸一致。
3.2" 研究2: Alpha振蕩調(diào)控快速言語識(shí)別的行為表現(xiàn)
研究2旨在具體考察alpha振蕩如何調(diào)控快速言語識(shí)別的行為表現(xiàn)。具體而言, 研究2將使用較慢(8 Hz)和較快(12 Hz)的alpha振蕩頻率, 記錄快速言語識(shí)別的行為成績, 考察更快的alpha振蕩是否帶來更好的快速言語識(shí)別表現(xiàn)。同時(shí), 研究2也將考察alpha振蕩對(duì)時(shí)間瓶頸的調(diào)控是否基于高層認(rèn)知過程。如前所述, alpha振蕩對(duì)快速言語識(shí)別的影響, 更可能是一種不基于感覺皮層的、高層的、后期的調(diào)控。為了驗(yàn)證這種高層調(diào)控的假設(shè), 研究2設(shè)計(jì)了兩個(gè)實(shí)驗(yàn)來考察alpha振蕩是否不需要基于聽皮層就可以調(diào)控快速言語的識(shí)別過程。
研究2的子實(shí)驗(yàn)1想探究, 操控被試的alpha振蕩頻率, 是否可以調(diào)控快速言語識(shí)別的行為表現(xiàn)。具體來講, 子實(shí)驗(yàn)1在10 Hz的快速言語前, 使用聽覺純音操控被試的alpha振蕩頻率, 呈現(xiàn)更快(12 Hz)或更慢(8 Hz)頻率的純音, 并測(cè)試被試對(duì)快速言語的識(shí)別成績。子實(shí)驗(yàn)1想考察更快的alpha振蕩(12 Hz)是否幫助言語識(shí)別, 使其行為表現(xiàn)更好?子實(shí)驗(yàn)1希望證實(shí), 改變alpha振蕩頻率的確可以調(diào)控快速言語識(shí)別的行為表現(xiàn)。
在子實(shí)驗(yàn)1的基礎(chǔ)上, 研究2的子實(shí)驗(yàn)2進(jìn)一步考察alpha振蕩頻率如何從高層級(jí)調(diào)控快速言語識(shí)別的行為表現(xiàn)。子實(shí)驗(yàn)2使用經(jīng)顱電刺激來誘發(fā)alpha振蕩, 考察不同腦區(qū), 即聽皮層與非聽皮層, 其alpha振蕩調(diào)控言語識(shí)別的效果。具體而言, 在10 Hz的快速語音前, 使用更快(12 Hz)或更慢(8 Hz)的alpha振蕩來電刺激被試。刺激腦區(qū)選擇4個(gè)腦區(qū), 中心電極根據(jù)腦電系統(tǒng)放置于左聽皮層(T7)、右聽皮層(T8)、中央運(yùn)動(dòng)區(qū)(Cz)、前額葉(FPz) 4個(gè)位置。子實(shí)驗(yàn)2想探索: 1)同子實(shí)驗(yàn)1, 更快的alpha振蕩(12 Hz)是否帶來更好的言語識(shí)別成績?2)不同腦區(qū)的alpha振蕩是否都可以達(dá)到此調(diào)控效果, 如前額葉的alpha振蕩是否也可以調(diào)控言語識(shí)別行為?子實(shí)驗(yàn)2希望證明alpha振蕩的速度調(diào)控了大腦快速言語識(shí)別的行為表現(xiàn), 且這種調(diào)控基于高級(jí)的認(rèn)知過程。
3.3" 研究3: Alpha振蕩調(diào)控大腦對(duì)言語加工的神經(jīng)過程
前兩個(gè)研究證實(shí)alpha振蕩調(diào)控快速言語識(shí)別的行為表現(xiàn), 接下來, 研究3將在神經(jīng)層面討論alpha振蕩如何影響大腦對(duì)快速言語的加工過程。如前所述, 即使加快到不可理解的言語, 初級(jí)聽皮層仍可以很好地追隨其語音包絡(luò)(Nourski et al., 2009; Mukamel et al., 2011)。因此, alpha 振蕩對(duì)言語神經(jīng)表征的調(diào)控應(yīng)基于高級(jí)認(rèn)知過程而影響信息的后期整合, 更可能體現(xiàn)在言語神經(jīng)表征上。解碼言語的神經(jīng)表征, 可以體現(xiàn)言語可懂度、言語理解等高級(jí)過程(Zion Golumbic et al., 2013; Leonard et al., 2016; Brodbeck et al., 2018; Zou et al., 2019)。在此基礎(chǔ)上, 研究3將從兩方面進(jìn)行分別考察: 1)對(duì)于快速言語識(shí)別的神經(jīng)過程, alpha振蕩是影響對(duì)語音信號(hào)的簡(jiǎn)單時(shí)間追隨, 還是影響更高級(jí)的認(rèn)知過程, 以更復(fù)雜的方式體現(xiàn)在言語神經(jīng)表征上?2)Alpha振蕩對(duì)快速言語神經(jīng)表征的調(diào)控在初級(jí)聽覺皮層, 還是在更高級(jí)功能的腦區(qū)如運(yùn)動(dòng)皮層和前額葉皮層?
研究3將在神經(jīng)層面探討alpha振蕩如何影響大腦對(duì)快速言語的加工過程。同之前的研究, 研究3同樣使用10 Hz的快速言語刺激, 記錄被試對(duì)言語的識(shí)別成績。同時(shí), 研究3使用腦磁圖記錄被試對(duì)言語信號(hào)的神經(jīng)響應(yīng), 并使用時(shí)間響應(yīng)函數(shù)解碼言語信號(hào)的神經(jīng)表征。將所有試次隨機(jī)分為兩集合, 作為訓(xùn)練集和測(cè)試集。對(duì)于訓(xùn)練集的各試次, 根據(jù)試次前alpha振蕩的快慢, 分為高頻組和低頻組, 并訓(xùn)練分類器對(duì)不同組別的神經(jīng)表征進(jìn)行分類。接下來, 用訓(xùn)練好的分類器將測(cè)試集試次根據(jù)其神經(jīng)表征進(jìn)行再分組, 考察兩組的言語識(shí)別成績是否有差異。研究3想探尋: 1)神經(jīng)表征過程如何受alpha振蕩調(diào)控, 即alpha振蕩頻率分類的神經(jīng)表征在波形、峰值、潛伏期等指標(biāo)上有哪些差異。2)這種調(diào)控是否與快速言語識(shí)別相關(guān), 即高頻alpha組對(duì)應(yīng)的神經(jīng)表征特征, 是否可以預(yù)測(cè)更好的識(shí)別成績。3)考察這種alpha振蕩對(duì)言語神經(jīng)表征的調(diào)控, 在不同腦區(qū)是否有所差別。研究3希望說明, alpha振蕩如何影響言語信號(hào)的神經(jīng)編碼方式, 從而幫助快速言語的識(shí)別。
4" 理論建構(gòu)
本研究提出alpha振蕩影響快速言語識(shí)別時(shí)間瓶頸的模型假設(shè)(圖1)。在一個(gè)alpha振蕩周期內(nèi), 大腦難以同時(shí)加工兩個(gè)刺激(Samaha amp; Postle, 2015; Ronconi amp; Melcher, 2017)。因此, 當(dāng)語速慢于alpha振蕩頻率時(shí), 多個(gè)alpha振蕩周期加工一個(gè)字/音節(jié), 則言語可以被充分加工并識(shí)別。然而, 當(dāng)語速逐漸加快, 直至快于alpha振蕩頻率時(shí), 則在一個(gè)alpha振蕩周期內(nèi)同時(shí)存在多個(gè)字/音節(jié), 此時(shí)多個(gè)字/音節(jié)互相搶占認(rèn)知資源, 從而均無法被充分加工, 言語難以被大腦識(shí)別。
本研究有三點(diǎn)創(chuàng)新之處。第一, 本研究以大腦alpha振蕩為切入點(diǎn)考察快速言語識(shí)別的時(shí)間瓶頸。對(duì)于快速言語識(shí)別的時(shí)間瓶頸, 已有研究更多地集中于快速言語識(shí)別的行為成績曲線(Dupoux amp; Green, 1997; Vagharchakian et al., 2012; Pefkou et al., 2017), 或線索等外界條件對(duì)快速言語識(shí)別的影響(Borges et al., 2018)。本研究明確了快速言語識(shí)別的本質(zhì)屬于知覺加工的時(shí)間分辨率問題。因此, 本研究突破性地以大腦alpha振蕩為切入點(diǎn), 提出“alpha振蕩是快速言語識(shí)別的關(guān)鍵”的理論假設(shè)。本研究考察alpha振蕩如何調(diào)控快速言語識(shí)別的時(shí)間瓶頸, 為快速言語的識(shí)別行為相關(guān)研究提供了新的視角。
圖1" Alpha振蕩調(diào)控快速言語識(shí)別的模型假設(shè)。當(dāng)alpha振蕩頻率較快時(shí)(上), 不同字/音節(jié)落在不同alpha振蕩周期, 言語可以被充分加工識(shí)別, 并未到時(shí)間瓶頸。當(dāng)alpha振蕩頻率較慢時(shí)(下), 多個(gè)字/音節(jié)爭(zhēng)奪一個(gè)alpha振蕩周期內(nèi)的認(rèn)知資源, 言語無法被識(shí)別, 存在時(shí)間瓶頸。
本研究以alpha振蕩為例考察了神經(jīng)振蕩如何作用于認(rèn)知過程。以往考察alpha振蕩對(duì)行為表現(xiàn)的影響(Samaha amp; Postle, 2015; Ronconi amp; Melcher, 2017; Ho et al., 2019; Grabot amp; Kayser, 2020), 但對(duì)于這種調(diào)控的具體機(jī)制并不清楚。本研究創(chuàng)新性地考察alpha振蕩調(diào)控言語識(shí)別的機(jī)制是否基于高級(jí)過程, 即高級(jí)腦區(qū)如額葉的alpha振蕩能否也調(diào)節(jié)快速言語識(shí)別。本研究可以更好地理解大腦神經(jīng)振蕩如何調(diào)控知覺的時(shí)間分辨率, 驗(yàn)證神經(jīng)振蕩的調(diào)控是否基于高級(jí)認(rèn)知過程。
第三, 本研究可以觀測(cè)神經(jīng)振蕩如何調(diào)控刺激自身的神經(jīng)表征。雖然以往研究已經(jīng)探索了alpha振蕩調(diào)控時(shí)間分辨率的機(jī)制, 但這些研究中刺激都是簡(jiǎn)單的光點(diǎn)或似動(dòng)現(xiàn)象(Samaha amp; Postle, 2015; Ronconi amp; Melcher, 2017; Shen et al., 2019)。這類刺激持續(xù)時(shí)間很短, 難以觀測(cè)到刺激自身的神經(jīng)表征, 因此無法推測(cè)alpha振蕩如何調(diào)控刺激自身的神經(jīng)表征。本研究創(chuàng)新性地在材料上使用了言語這種長時(shí)程的復(fù)雜信號(hào)作為研究對(duì)象。由于言語信號(hào)持續(xù)時(shí)間長且復(fù)雜, 其神經(jīng)表征可以被觀測(cè)及解碼。因此本研究可以更深入地了解alpha振蕩影響瞬時(shí)加工的神經(jīng)機(jī)制。
綜上, 本研究使用快速言語序列, 考察alpha振蕩如何調(diào)控其識(shí)別的時(shí)間瓶頸, 驗(yàn)證alpha振蕩的作用是否基于高級(jí)認(rèn)知過程, 并探究這種alpha振蕩的作用如何體現(xiàn)于大腦對(duì)刺激的神經(jīng)表征。本研究旨在更好地理解神經(jīng)振蕩如何調(diào)控知覺的時(shí)間分辨率, 進(jìn)而探索神經(jīng)振蕩影響快速加工的通用機(jī)制。
參考文獻(xiàn)
Adank, P., amp; Devlin, J. T. (2010). On-line plasticity in spoken sentence comprehension: Adapting to time-compressed speech. Neuroimage, 49(1), 1124–1132.
Assaneo, M. F., amp; Poeppel, D. (2018). The coupling between auditory and motor cortices is rate-restricted: Evidence for an intrinsic speech-motor rhythm. Science Advance, 4(2), Article eaao3842. https://doi.org/10.1126/sciadv.aao3842
Borges, A. F. T., Giraud, A. L., Mansvelder, H. D., amp; Linkenkaer- Hansen, K. (2018). Scale-free amplitude modulation of neuronal oscillations tracks comprehension of accelerated speech. Journal of Neuroscience, 38(3), 710–722.
Brodbeck, C., Hong, L. E., amp; Simon, J. Z. (2018). Rapid transformation from auditory to linguistic representations of continuous speech. Current Biology, 28(24), 3976–3983.
Cecere, R., Rees, G., amp; Romei, V. (2015). Individual differences in alpha frequency drive crossmodal illusory perception. Current Biology, 25(2), 231–235.
Cheung, C., Hamiton, L. S., Johnson, K., amp; Chang, E. F. (2016). The auditory representation of speech sounds in human motor cortex. Elife, 5, Article e12577. https://doi. org/10.7554/eLife.12577
Ding, N., Patel, A. D., Chen, L., Butler, H., Luo, C., amp; Poeppel, D. (2017). Temporal modulations in speech and music. Neuroscience and Biobehavioral Reviews, 81(Pt B), 181–187.
Ding, N., amp; Simon, J. Z. (2012). Emergence of neural encoding of auditory objects while listening to competing speakers. Proceedings of the National Academy of Sciences of the United States of America, 109(29), 11854– 11859.
Du, Y., Buchsbaum, B. R., Grady, C. L., amp; Alain, C. (2014). Noise Differentially impacts phoneme representations in the auditory and speech motor systems. Proceedings of the National Academy of Sciences of the United States of America, 111(19), 7126–7131.
Dugué, L., Marque, P., amp; VanRullen, R. (2011). The phase of ongoing oscillations mediates the causal relation between brain excitation and visual perception. Journal of Neuroscience, 31(33), 11889–11893.
Dupoux, E., amp; Green, K. (1997). Perceptual adjustment to highly compressed speech: Effects of talker and rate changes. Journal of Experimental Psychology: Human Perception and Performance, 23(3), 914–927.
Ghitza, O., amp; Greenberg, S. (2009). On the possible role of brain rhythms in speech perception: Intelligibility of time-compressed speech with periodic and aperiodic insertions of silence. Phonetica, 66(1-2), 113–126.
Grabot, L., amp; Kayser, C. (2020). Alpha activity reflects the magnitude of an individual bias in human perception. Journal of Neuroscience, 40(17), 3443–3454.
Greenberg, S., Carvey, H., Hitchcock, L., amp; Chang, S. Y. (2003). Temporal properties of spontaneous speech-a syllable-centric perspective. Journal of Phonetics, 31(3-4), 465–485.
Hansen, N. E., Harel, A., Iyer, N., Simpson, B. D., amp; Wisniewski, M. G. (2019). Pre-stimulus brain state predicts auditory pattern identification accuracy. Neuroimage, 199, 512–520.
Ho, H. T., Burr, D. C., Alais, D., amp; Morrone, M. C. (2019). Auditory perceptual history is propagated through alpha oscillations. Current Biology, 29(24), 4208–4217.
Hyafil, A., Fontolan, L., Kabdebon, C., Gutkin, B., amp; Giraud, A. L. (2015). Speech encoding by coupled cortical theta and gamma oscillations. Elife, 4, Article e06213. https:// doi.org/10.7554/eLife.06213
Keitel, C., Keitel, A., Benwell, C. S. Y., Daube, C., Thut, G., amp; Gross, J. (2019). Stimulus-driven brain rhythms within the alpha band: The attentional-modulation conundrum. Journal of Neuroscience, 39(16), 3119–3129.
Leonard, M. K., Baud, M. O., Sjerps, M. J., amp; Chang, E. F. (2016). Perceptual restoration of masked speech in human cortex. Nature Communications, 7, Article 13619. https://doi.org/10.1038/ncomms13619
Mathewson, K. E., Beck, D. M., Ro, T., Fabiani, M., amp; Gratton, G. (2009). Illuminating awareness: Investigating the temporal and spatial neural dynamics of metacontrast masking using the event-related optical signal. Journal of Vision, 9(8), 765.
Mesgarani, N., amp; Chang, E. F. (2012). Selective cortical representation of attended speaker in multi-talker speech perception. Nature, 485(7397), 233–236.
Molinaro, N., Lizarazu, M., Baldin, V., Pérez-Navarro, J., Lallier, M., amp; Ríos-López, P. (2021). Speech-brain phase coupling is enhanced in low contextual semantic predictability conditions. Neuropsychologia, 156, 107830.
Mukamel, R., Nir, Y., Harel, M., Arieli, A., Malach, R., amp; Fried, I. (2011). Invariance of firing rate and field potential dynamics to stimulus modulation rate in human auditory cortex. Human Brain Mapping, 32(8), 1181–1193.
Neuling, T., Rach, S., Wagner, S., Wolters, C. H., amp; Herrmann, C. S. (2012). Good vibrations: Oscillatory phase shapes perception. Neuroimage, 63(2), 771–778.
Nourski, K. V., Reale, R. A., Oya, H., Kawasaki, H., Kovach, C. K., Chen, H., ... Brugge, J. F. (2009). Temporal envelope of time-compressed speech represented in the human auditory cortex. Journal of Neuroscience, 29(49), 15564–15574.
Park, H., Ince, R. A. A., Schyns, P. G., Thut, G., amp; Gross, J. (2018). Representational interactions during audiovisual speech entrainment: Redundancy in left posterior superior temporal gyrus and synergy in left motor cortex. PLoS Biology, 16(8), Article e2006558. https://doi.org/10.1371/ journal.pbio.2006558
Peelle, J. E., McMillan, C., Moore, P., Grossman, M., amp; Wingfield, A. (2004). Dissociable patterns of brain activity during comprehension of rapid and syntactically complex speech: Evidence from fMRI. Brain and Language, 91(3), 315–325.
Peelle, J. E., Troiani, V., Wingfield, A., amp; Grossman, M. (2010). Neural processing during older adults' comprehension of spoken sentences: Age differences in resource allocation and connectivity. Cerebral Cortex, 20(4), 773–782.
Pefkou, M., Arnal, L. H., Fontolan, L., amp; Giraud, A. L. (2017). θ-band and β-band neural activity reflects independent syllable tracking and comprehension of time-compressed speech. Journal of Neuroscience, 37(33), 7930–7938.
Reynolds, M. E., amp; Givens, J. (2001). Presentation rate in comprehension of natural and synthesized speech. Perceptual and Motor Skills, 92(3 Pt 2), 958–968.
Ronconi, L., amp; Melcher, D. (2017). The role of oscillatory phase in determining the temporal organization of perception: Evidence from sensory entrainment. Journal of Neuroscience, 37(44), 10636–10644.
Samaha, J., amp; Postle, B. R. (2015). The speed of alpha-band oscillations predicts the temporal resolution of visual perception. Current Biology, 25(22), 2985–2990.
Shahin, A. J., amp; Pitt, M. A. (2012). Alpha activity marking word boundaries mediates speech segmentation. European Journal of Neuroscience, 36(12), 3740–3748.
Shen, L., Han, B., Chen, L., amp; Chen, Q. (2019). Perceptual inference employs intrinsic alpha frequency to resolve perceptual ambiguity. PLoS Biology, 17(3), Article e3000025. https://doi.org/10.1371/journal.pbio.3000025
Vagharchakian, L., Dehaene-Lambertz, G., Pallier, C., amp; Dehaene, S. (2012). A temporal bottleneck in the language comprehension network. Journal of Neuroscience, 32(26), 9089–9102.
Wilson, S. M., Saygin, A. P., Sereno, M. I., amp; Iacoboni, M. (2004). Listening to speech activates motor areas involved in speech production. Nature Neuroscience, 7(7), 701–702.
Zion Golumbic, E. M., Ding, N., Bickel, S., Lakatos, P., Schevon, C. A., McKhann, G. M., ... Schroeder, C. E. (2013). Mechanisms underlying selective neuronal tracking of attended speech at a \"cocktail party\". Neuron, 77(5), 980–991.
Zou, J., Feng, J., Xu, T., Jin, P., Luo, C., Zhang, J., ... Ding, N. (2019). Auditory and language contributions to neural encoding of speech features in noisy environments. Neuroimage, 192, 66–75.
Abstract: Humans can understand speech presented at extremely fast rates. In essence, the temporal bottleneck for speech comprehension occurs at a rate of 8~12 syllables per second, which closely aligns with the alpha band of neural oscillations. Moreover, previous studies suggest that alpha oscillation plays an important role in the temporal resolution of perception. Thus, the current study aims to investigate whether and how the speed of alpha oscillation predicts the temporal bottleneck in accelerated speech comprehension. Firstly, we will test whether the temporal bottleneck of accelerated speech comprehension is consistent with the speed of alpha oscillation. Secondly, we will investigate the underlying neural mechanisms of how alpha oscillation modifies speech comprehension. This study aims to uncover the fundamental mechanisms behind accelerated speech comprehension, providing valuable insights into ongoing brain activity and the role of neural oscillations in facilitating temporal integration.
Keywords: auditory perception, accelerated speech comprehension, temporal resolution, alpha band