王穗蘋, 黃 健
(華南師范大學 心理學院/心理應用研究中心,廣東 廣州 510631)
在人類心智發(fā)展中,語言理解是一項十分重要的能力,人類通過對抽象的形狀符號的加工實現(xiàn)人與人之間的交流,以及古代與現(xiàn)代的交流。雖然語言理解表面上看起來似乎是一項相當簡單的技能,其過程和機制卻十分復雜,自從19世紀Broca和Wernicke失語癥患者被發(fā)現(xiàn)以來,對人類語言加工大腦機制的探索就從未停止過。然而,由于技術手段不足,直到20世紀末,隨著以事件相關電位、功能磁共振為代表的腦功能成像技術的成熟應用,對正常人語言大腦機制的研究才蓬勃開展起來,而關于閱讀理解大腦機制的研究更是取得了長足的進步(Hagoort, 2008)[1]。
研究者普遍同意,閱讀理解的根本目的是獲得意義的聯(lián)貫性表征,具體來說,不僅包括單純的字詞意義識別,還包括對按一定規(guī)則進行的詞匯排列(如短語和句子)所想表達的豐富意圖、思想、情感和情緒進行理解。意義的單元從小到大可直觀地分為字、詞、短語、句子、語段幾個層面,其中,句子作為聯(lián)貫性意義表征的最小載體,其理解過程可以最集中地反映人類語言加工的本質機制,因而受到研究者的高度重視。本文將首先對這一領域比較重要的理論和研究進行回顧,在此基礎上討論目前研究的熱點問題,并對未來這一研究領域的發(fā)展趨勢進行展望。
在句子理解的加工過程中,小的信息塊除了得到加工、獲得意義之外,信息之間還將通過整合而形成更大的、意義更完整的意義單元。語義信息的提取和整合的機制如何,它對應的大腦機制又有什么樣的模式和特點?這是語言理解研究的基本問題和核心問題。從認知神經科學的角度來看,對這些問題可以具體化到“when”(何時)與“where”(何處)兩個問題上。when關注的是提取和整合的時間進程如何,where關注的是這些過程發(fā)生在哪里,兩方面探討的結合才能形成對語義加工回路的完整認識。
在語義加工的時間進程方面,高時間分辨率的技術,例如ERP的研究發(fā)現(xiàn)N400是一個經典的跟語義加工有關的成分(Kutas, Federmeier, 2011)[2],這一負走向的成分從詞匯呈現(xiàn)之后250ms左右出現(xiàn),400ms左右到達峰值。研究者們發(fā)現(xiàn),無論是詞匯的語義通達(Kutas, Federmeier, 2000; Lau, Phillips, Poeppel, 2008)[3-4],還是語義之間的整合機制(Brown, Hagoort, 1993; Friederici, 2002; Hagoort, Baggio, Willems, 2009)[5-7],主要都反映在N400左右的時間窗內。
而在語義加工大腦功能定位的研究中,研究者們較為一致地發(fā)現(xiàn)詞匯的語義信息通達和提取與左側顳中回后部密切相關(Hickok, Poeppel, 2007; Lau, Phillips, Poeppel, 2008; Hagoort, Baggio, Willems, 2009)[8][4][7]。至于通達之后的語義整合加工,研究者們發(fā)現(xiàn)它跟左側額下回,尤其是左側額下回的前部密切相關(Hagoort, Baggio, Willems, 2009; 朱祖德, 王穗蘋,馮剛毅等,2010)[7][9]。
在相關研究的基礎上, Hagoort(2005)[10]提出了一個較具影響力的MUC(memory, unification and control)模型,用以解釋語義加工的大腦加工機制。他認為詞匯的語義通達發(fā)生在顳葉的廣大區(qū)域,尤其集中在左側顳中回后部,而詞匯語義信息激活之后將會進入左側額下回、尤其是該區(qū)域前部進行整合加工,這一整合加工就發(fā)生在N400的時間窗內。
MUC模型為這一領域的研究提供了一個重要的框架,也引發(fā)了后繼對語義加工回路的一些爭論,這些爭論尤其集中在左側額下回在語義加工中所起的作用這一問題上。例如,BAIS (Bilateral activation, integration and selection) 模型(Jung-Beeman, 2005)[11]同意雙側的顳葉,尤其是Wernicke區(qū)是負責詞匯語義信息的激活,但認為語義整合加工是發(fā)生在顳葉前部而非左側額下回,左側額下回的功能其實只是負責語義信息的選擇和抑制。而另一個模型——N400產生源模型(Lau, Phillips, Poeppel, 2008)[4]與BIAS理論較為相似,它同樣認為顳中回后部負責提取語義信息,但語義信息的整合加工是發(fā)生在顳葉前部和角回,而左側額下回的功能是一般化的認知加工,其中左側額下回的前部負責控制性地提取詞匯語義信息,后部則負責對合適的語義信息進行選擇。
隨著對這一領域廣泛而深入的探討,研究者們發(fā)現(xiàn)語義加工不論在發(fā)生的具體時間進程及功能定位問題上都表現(xiàn)得比想象的更為復雜,以下從時間進程、大腦功能定位以及不同腦區(qū)的交互等幾方面,對當前研究的熱點問題進行梳理和總結。
在語義加工的時間進程方面,由于N400這一語義加工標志性指標的發(fā)現(xiàn),近二十年的語義加工理論普遍在N400的框架下開展。然而,近期來自不同研究技術所獲得的輻合性證據(jù)越來越多地表明,語義的通達和提取可能是一個始于更早時間窗,并且持續(xù)時間更長的動態(tài)過程。
大量行為學和眼動的研究均發(fā)現(xiàn),語義信息的通達和整合表現(xiàn)得非常迅速,在N400的潛伏期250ms之前甚至就可以完成(Marslen-Wilson, Tyler, 1975; Marslen-Wilson, 1987; Rayner, 1998; Sereno, Rayner, 2003)[12-15]。最近一些研究者采用更加側重于自動化加工的實驗技術,例如odd-ball設計,使用ERP技術,嘗試探討自動化語義通達和語義整合加工(Shtyrov, Pulvermüller, 2007)[16]的進程,結果發(fā)現(xiàn),上述過程同樣出現(xiàn)在N400之前。盡管如此,語義變量所導致的效應在常規(guī)的ERP的研究中,卻極少在早期的腦電成分例如N1、P2上顯現(xiàn)出現(xiàn)。一些研究者認為,這或許是在大多數(shù)語言理解的ERP研究中,為更好地提高研究的生態(tài)效度,研究者往往會從更大的范圍內來選取關鍵詞匯的物理變量,例如詞長(類似中文的筆劃數(shù))、詞頻等,這些物理變量的差異有可能加大項目之間腦電信號的變異,使波峰非常狹窄的N1和P2等早期成分受到干擾,而無法敏感地反映出語義變量本身所造成的效應(Penolazzi, Hauk, Pulvermuller, 2007)[17]。
除了N400之外,與語言加工密切相關的ERP成分還包括晚期正波,這一成分先前通常被認為反映了句法加工(Hagoort, Brown, Groothusen, 1993; Osterhout, Holcomb, 1992)[18-19],然而近年越來越多的研究發(fā)現(xiàn),操縱純粹的語義變量常常也可以檢測到晚期成分的變化(Bornkessel-Schlesewskya, Schlesewsky, 2008; Kuperberg, 2007)[20-21]。例如,研究者發(fā)現(xiàn),語義上生命性的違背(Kuperberg, Sitnikova, Caplan, et al., 2003)[22],動詞與題元之間的語義違背(Kim, Osterhout, 2005)[23],主賓反轉等(Kolk, Chwilla, van Herten, et al., 2003)[24],甚至僅僅只是目標詞不符合句子的語境(Federmeier, Kutas, 1999; Federmeier, Wlotko, De Ochoa-Dewald, et al., 2007; Delong, Urbach, Groppe, et al., 2011;Van Petten, Luka, 2012)[25-28],都可以觀察到晚期正波的出現(xiàn)。因此,晚期正波的實質到底是什么,目前研究者仍有爭論。事實上,由于相同的成分不但在語義和句法加工中出現(xiàn),同時在非語言加工任務,如數(shù)字規(guī)則違背(Nunez-Penz, Honrubia-Serrano, 2004)[29]、音樂規(guī)則違背(Patel, Gibson, Ratner, et al., 1998)[30]的檢測中也可以發(fā)現(xiàn),因此,這一晚期正成分也有可能是由領域普遍性的、由沖突而導致的一般認知控制加工所引發(fā),反映著個體在語言理解中沖突的檢測和解決,以及對特定語義加工任務的執(zhí)行(Kolk, Cwilla, 2007; van de Meerendonk, Kolk, Chwilla, et al., 2009; Ye, Zhou, 2009)[31-33]。
總體來說,在語義加工的時間進程方面,傳統(tǒng)的以N400為框架的語義加工模型似乎需要拓展,研究者不僅需要考慮早期的語義加工在模型中的重要作用,還要考慮晚期認知控制系統(tǒng)在語義加工過程中的參與、及其與語義加工可能的相互作用,這樣才能更全面地了解語義加工的動態(tài)過程。
在語義加工大腦功能定位的研究中,較為一致的發(fā)現(xiàn)是詞匯的語義信息通達、提取與左側顳中回后部密切相關。然而通達之后的語義整合加工在何處進行,在這一問題上,經典的MUC模型主要強調額葉的參與,它把左側額下回作為一個核心的整合區(qū),認為詞匯信息在左側顳中回后部大腦區(qū)域激活后,將進入左側額下回進行整合加工。的確,以往相關的fMRI文獻中有90%以上均報告了這一區(qū)域的激活,MCU模型把這一區(qū)域作為語義整合的核心區(qū)。
然而,除了上述提到的左側顳中回與左側額下回,另一個時有報告的相關區(qū)域是左側顳葉前部(LATL)。雖然這一區(qū)域在過去句子的fMRI研究中較少報告,目前卻受到研究者越來越多的重視,甚至有研究者把它擺到了語義整合加工的核心地位(Lau, Phillips, Poeppel, 2008)[4]。一些研究者認為,顳葉前部是作為一個非模塊化的功能而存在的,它負責整合概念中的各種特征屬性,以便更好地組織我們的語義系統(tǒng)(參見 Patterson, Nestor, Rogers, 2007提出的distributed-plus-hub view)[34]。支持這種觀點的證據(jù)來自語音加工的一些研究,這些研究發(fā)現(xiàn)這一部位作為語言加工腹側通路的一個重要終端,可能與整合有一定的關系,在語音加工中負責整合音素而獲得整體語音的信息(Hickok, Poeppel, 2007)[8]。然而,目前關于顳葉前部在聯(lián)貫性語言理解中的作用尚不明確。假如左側顳葉前部的主要功能真的與語義整合有關,一個重要的問題就是,它的功能與額下回的整合功能有何區(qū)別?
如果把發(fā)現(xiàn)左側顳葉前部激活的文獻與那些發(fā)現(xiàn)左側額下回激活的文獻進行比較,可以看出,從所加工的語義特征來看,在短語/句子層面的研究中,報告顳葉前部出現(xiàn)激活的研究,多數(shù)是在對比語義合理句與位置被隨機打亂的詞串、或者正常句與休息狀態(tài)時發(fā)現(xiàn)的。而將語義違背句與正常句進行對比的研究,則基本上發(fā)現(xiàn)的都是左側額下回的激活(朱祖德,王穗蘋,馮剛毅等,2011)[9]。因此,顳葉前部的激活與語義正常句的加工關系可能更為密切,而左側額下回的激活可能與加工語義被破壞而形成違背的句子有關。正常句與違背句中語義整合性質的本質區(qū)別到底是什么?對這一問題的深入思考,將有助于認識顳葉前部在語義整合中的獨特作用。
綜合以往的文獻,兩者的差異至少表現(xiàn)在以下幾個方面:
首先,正常句與違背句中語義整合的時間進程可能有所不同。正常句的語義整合加工通??梢赃M行得十分迅速與自動化,因此,應該在較早的時間窗觀察得到。而違背句中由于語義信息被破壞,這種整合可能需要更多的注意加工資源參與來完成,這就可能導致相關區(qū)域的激活出現(xiàn)得較晚。確實,相應的文獻表明,顳葉前部的激活出現(xiàn)的時間似乎相當早,MEG的研究發(fā)現(xiàn),當采用合理的短語跟假詞短語進行對比,左側顳葉前部會在很早的時間內出現(xiàn)持續(xù)時間很短的激活,約發(fā)生在184至255ms這短短的70ms左右(Bemis, Pylkkanen, 2011)[35]。相比之下,ERP和fMRI結合的研究表明,違背句子跟正常句子的對比可以觀察到左側額下回出現(xiàn)激活,但這一區(qū)域激活的時間發(fā)生在N400時窗內(Hagoort, Hald, Bastiaansen,et al., 2004)[36]。這些證據(jù)似乎表明這兩個區(qū)域雖然都與語義整合加工相關,但是它們可能存在著不同的語義整合機制。其中,顳葉前部所負責的語義整合在早期的時窗內出現(xiàn)并且持續(xù)時間短,很可能反映一種自動化的整合加工。而左側額下回負責的語義整合似乎出現(xiàn)得更晚,持續(xù)時間更長,需要更多意識的參與,可能與控制性的加工過程有關。
其次,從整合的內容來看,正常句與違背句也有所區(qū)別。Hagoort等人(2009)[7]對整合加工進行了分類,根據(jù)整合信息的新舊,他們認為可以將整合加工分成兩種不同的類型。一類整合最終形成的信息塊對語言加工者來說非常熟悉,這種知識塊已經儲存于長時記憶中,因此整合這種信息可以很快地實現(xiàn)。而另外一種整合形成的信息塊要么是陌生的,要么是意義不合理的,因此需要花費更長的時間,需要更多的資源來進行。根據(jù)這種分類,結合上述對左側顳葉前部與左側額下回相關文獻的分析,似乎可以推論,顳葉前部所負責的語義整合通常在合理句中出現(xiàn),很可能與熟悉信息塊的整合有關,而左側額下回所負責的整合加工常在違背句中出現(xiàn),很可能與陌生信息塊的整合關系更為密切。
最后,正常句和違背句的語義整合,不僅在整合過程和內容上有所不同,在結果上也不一樣。一般的正常句整合所需的努力小,最終卻可以建立起相當聯(lián)貫的語義表征,而違背句的加工,雖然讀者在自然閱讀理解中會努力去整合和建構文本的意義,但詞匯與語境或常識的違背最終卻導致讀者無法形成一個正常、合理的表征。由于先前的研究發(fā)現(xiàn)顳葉的激活通常出現(xiàn)在正常句的研究中,因此,存在的一種可能是,整合的過程與整合的存儲反映在大腦不同的區(qū)域上,顳葉前部的功能只是一種聯(lián)貫性表征的動態(tài)存儲。也就是說,只有在當前加工的信息整體聯(lián)貫而有意義時,這個區(qū)域的加工才會參與。相比之下,整合的努力和加工的過程是由另外的區(qū)域,如額下回來進行的。
上述這些分析,在一定程度上反映出語義整合這一概念的界定仍然需要進一步精細化,事實上,不同的加工內容可能產生不同的整合進程和結果,只有精細而系統(tǒng)化對整合過程進行多維度的探索,才有望獲得更加清晰的結論。
語言理解是一個系統(tǒng)而復雜的過程,需要大腦多個區(qū)域的協(xié)同參與才能得以完成。目前已有越來越多的證據(jù)支持,即便是負責簡單視覺加工的初級視覺皮層,在運作時也需要通過系統(tǒng)內部的各子區(qū)域交互活動來實現(xiàn)。高級的語言加工更加需要高級聯(lián)合區(qū)域間的交互才能實現(xiàn),單個區(qū)域無法獨自完成。一方面,從信息加工的角度來看,語言信息的加工需要經歷“輸入—加工—輸出”的一系列過程,這個過程需要經歷多個在結構或功能上相互聯(lián)結的大腦區(qū)域,最終才能實現(xiàn)語言理解或生成這樣復雜的功能。另一方面,從腦功能定位研究來看,雖然目前已發(fā)現(xiàn)與語言加工相關的大腦區(qū)域包括額下皮層、顳上回、顳中回和頂葉等大范圍區(qū)域,這些區(qū)域構成了語言網絡的主要組成部分(Vigneau, Beaucousin,et al., 2006)[37],但一系列研究也表明,語言加工并不僅僅依賴于大腦皮質區(qū)域的參與,還需要連接它們的白質纖維束,才能使大量的信息在區(qū)域間進行快速傳遞(Friederici,2009)[38]。事實上,早期腦損傷的案例就已經表明,單個區(qū)域的損傷或病變并不會引起某一語言功能的全部喪失,但某些腦區(qū)間結構或功能聯(lián)結的損傷可能會導致嚴重的功能障礙(Lichtheim,1885; Geschwind,1970)[39-40]。這些證據(jù)都無一例外地說明功能的實現(xiàn)需要腦區(qū)內神經元的活動,同時也需要腦區(qū)間信息的傳遞和相互作用。
腦聯(lián)結與語言加工的關系近期已受到越來越多研究者的關注,這方面的研究對我們建構和修正語言加工理論有著極為重要的價值。從文獻來看,對腦聯(lián)結的分析不僅包括研究大腦結構之間的連接,還包括研究不同皮層之間如何隨加工時程而發(fā)生相應的動態(tài)變化。
在腦結構聯(lián)結方面,擴散張量成像(diffusion tensor imaging, DTI)由于可以較好地對聯(lián)系皮層之間的白質走向進行很好的追蹤,被認為是大腦結構聯(lián)接方面一個非常突出的技術。早期DTI的研究發(fā)現(xiàn),從負責詞匯通達的左側額中回出發(fā),存在著兩條通路到達左側額下回,一條是通過弓狀束(arcuate fasciculus, AF),從顳葉后部出發(fā),經由運動區(qū)到達額下回,另外一條是通過極外囊(extreme capsule,EC),直接從顳葉后部連接額下回(Catani, Jones, Ffytche, 2004; Catani, Mesulam, 2008)[41-42]。進一步的研究發(fā)現(xiàn),從顳葉后部直接連接到額下回的極外囊,跟語言理解最為密切相關(Saur, Kreher, Schnell, 2008)[43]。上述顳葉后部與額下回在結構上的聯(lián)接很好地支持了Hgoort(2005)[10]提出的MUC模型。此外,DTI的研究還發(fā)現(xiàn),從負責詞匯通達的顳中回出發(fā)至大腦前部,除了左側額下回是一個非常重要的終端之外,顳葉前部是另外一個非常重要的終端,存在一條經由下縱束(inferior longitudinal fasciculus)從顳葉后部到達顳葉前部的重要通路(Catani, Jones, Ffytche, 2004; Catani, Mesulam, 2008)[41-42],最近的研究發(fā)現(xiàn)這個通路跟語言理解、語言學習的關系同樣非常密切(Wong, Chandrasekaran, Garibaldi, et al, 2011)[44]。因此,未來在語義加工大腦聯(lián)結這一主題上,還需要考慮怎樣將顳葉前部的功能引入到模型中,才能更全面地認識整個語義理解網絡。
除了DTI技術之外,靜息態(tài)功能聯(lián)結技術通過考察不同大腦皮層自發(fā)活動之間的一致性,也可以研究不同皮層之間的連接關系。跟DTI結果類似的是,近年來靜息態(tài)功能聯(lián)結技術的研究發(fā)現(xiàn),額葉和顳葉的語言相關皮層及其子區(qū)域間存在很強的功能聯(lián)結(Hampson, Peterson, Skudlarski, et al. 2002; Xiang, Fonteijn, Norris, et al., 2010)[45-46],并且其聯(lián)結強度與語言能力或語言加工有很強的相關(Koyama, Kelly, Shehzad, et al., 2010; Koyama, Di Martino, Zuo, et al. 2011)[47-48]。這些結果都進一步說明各種重要的語義加工區(qū)域之間不僅僅存在著纖維結構的聯(lián)系,其活動的同步性也緊密相關。
由上可見,在閱讀理解語義加工回路及其功能分析問題上當前存在著一些亟待解決的重要爭論與分歧,根據(jù)這些爭論與分歧,未來的研究可從以下幾個方面進行豐富與完善。
閱讀理解中語義的加工是一個復雜的過程,包含了提取和整合兩個階段,雖然對提取的概念相對較為明確,但對整合的理解,目前不同的理論在界定上卻明顯不夠深入,這是造成研究結果出現(xiàn)沖突的最主要原因之一。在語義整合問題上,傳統(tǒng)的研究都是通過破壞句子的語義信息,或者通過操縱句子的語境而造成語境違背的條件,然后跟語義合理句或符合語境的句子進行對比,來研究語義整合加工。這樣研究語義的前提假設之一,是讀者對語義破壞句與語義合理句的加工在語義整合加工層面上存在著單一的量的差異,然而這種假設很可能是過于簡單化了。事實上,語義加工的最終目的是為了理解意義,這種意義的追尋加工在我們日常的生活中時時出現(xiàn),使得語言理解成為一個極為快速和自動化的加工過程。由于在日常生活中我們較少有機會加工意義被破壞的句子,因此一旦面臨語義破壞句時,自動化語言加工的過程會在某種程度上被阻斷,換而言之,語義破壞句所經歷的加工過程和實質很可能與理解正常句的加工過程存在著質上的差異。因此,更系統(tǒng)地去分離不同類型的語義加工過程,例如從加工的內容、方式、進程等多個層面來系統(tǒng)地考察可能存在著的語義整合形式以及可能需要的不同神經通路,這將有助于我們更全面和精細地理解語義整合的本質,以及語義整合的大腦功能。
由于N400跟語義加工非常密切,因此,之前關于語義加工的研究主要均集中在研究N400如何受各種語義變量操縱的影響,或以N400作為語義加工的指標對語義加工與其他非語義加工過程之間的交互進行研究。N400幾乎成為了語義加工的代名詞,并引發(fā)了許多關于N400到底是代表著具體何種語義加工過程的爭論。例如,一些研究者強調N400是代表著語義通達開始的指標(Kutas, Federmeier, 2000)[3];而另一些研究者則認為N400代表著語義的整合(Brown, Hagoort, 1993)[5]。這一爭論持續(xù)至今,依然未得到滿意的結論。然而從前述的分析可以知道,自然狀態(tài)下的語義加工進行得非常自動化和快速,無論是語義通達和語義整合都可以發(fā)生在非常早的時間窗,甚至在N400的潛伏期250ms之前。此外,從N400的實質來看,越來越多的證據(jù)也表明N400所代表的語義加工非常復雜,一方面它是一個相對較晚的成分,其次它又是一個長時間持續(xù)的成分。從最近我們剛完成的研究來看(Huang, Wang, Jia, et al., 2012)[49],不同的語義操縱雖然可以看到相似的N400的效應,相應的大腦激活模式差別卻很大,唯一的共同點就是都表現(xiàn)出一個多腦區(qū)協(xié)同激活的模式。可見,以N400這一成分簡單地代替語義加工,可能會影響對語義加工本身精細過程的深入挖掘。后續(xù)的研究或許應該以更加開放的態(tài)度去分析各種早期成分跟語義加工的關系,以及更晚的如P600成分跟語義加工的關系,并通過系統(tǒng)的實驗來動態(tài)考察不同成分對不同維度、不同層次語義變量的敏感程度,以更好地描繪語義加工的動態(tài)加工過程。
研究者不但要關注某一特定的大腦區(qū)域,還要從整體分析的角度來考察某一區(qū)域作為一個網絡的結點如何與其他重要的腦區(qū)進行交互作用。盡管現(xiàn)有結構和靜息態(tài)功能聯(lián)結的研究增加了我們對神經網絡在語言加工中起著重要作用的認識,但直到目前對其具體運作機制的研究卻仍然相當缺乏。因此,如何采用更新的方法與技術從腦網絡和功能聯(lián)結的角度來研究語言加工的神經機制是一個十分迫切并且有望產生重要突破的課題。最近幾年發(fā)展起來的動態(tài)因果建模技術(Friston, Harrison, Pennya, 2003)[50]能夠挖掘腦區(qū)間交互機制的信息,為上述問題的探索提供了新的方法和手段。這種分析模型中包含著三種成分,一種成分是考察感興趣區(qū)間的固有聯(lián)結(intrinsic connectivity),即沒有任何外界刺激的情況下,所選定區(qū)域間的有效聯(lián)結情況;第二種是考察這些區(qū)域如何受到刺激或實驗條件的影響,稱為聯(lián)結的調節(jié)(modulation of connectivity);第三個成分是刺激的輸入(direct input),即哪個腦區(qū)負責刺激的直接輸入。定義好三個成分后,結合貝葉斯模型選擇(BMS)的方法,對比不同的加工模型,可以得出符合數(shù)據(jù)的最優(yōu)模型。動態(tài)因果建模技術的引入,有助于探討語義整合加工的相關區(qū)域如何相互協(xié)同的。例如,利用動態(tài)因果建模技術,研究者已經發(fā)現(xiàn),不同語言操作下大腦區(qū)域的交互通路是不同的,而且存在正饋與反饋等不同方式(Mechelli, Crinion Long, et al., 2005; Nakamura, Kouider, Makuuchi, et al., 2010)[51-52]。雖然這一分析方法在語言研究領域中的應用仍然處在起步階段,然而通過系統(tǒng)地考察不同的語言刺激、語言任務以及實驗條件如何影響語言區(qū)域間的聯(lián)結,這將對語言理解這一復雜的認知操作在大腦中通過何種聯(lián)結機制來實現(xiàn)這一問題的解決提供新的視角和突破。
除了語義加工內部各區(qū)域間的關系以外,語義加工跟其他非語言加工的交互也是未來研究的一個重要方向。由于語義的研究經常采用破壞語義結構的范式來進行,而語義的破壞常導致被試需要更多的心理加工資源來完成語義加工,這勢必誘發(fā)非特異性認知加工,如控制性的抑制和提取加工的參與。讓這一問題顯得更加錯綜復雜的是,以往的研究證實,非特異性認知加工的大腦區(qū)域也是定位在左側額下回,與傳統(tǒng)語義加工模型中語義整合加工的大腦區(qū)域非常相似。因此,如何有效地分離語義整合加工與一般化的認知加工,進而研究兩者如何相互作用就成為研究的難點。我們實驗室最近使用外顯和內隱的實驗范式探討語義整合加工的大腦區(qū)域(Zhu, Hagoort, Zhang, et al., 2012)[53],結果發(fā)現(xiàn),內隱的語義整合加工顯著地激活左側額下回的前部,而外顯的語義整合加工由于會引起一般化的認知加工,不僅在左側額下回前部出現(xiàn)激活,后部也同樣出現(xiàn)顯著的激活。這可能表明左側額下回存在不同的亞區(qū),前部與模塊化的語言加工,例如語義整合加工相關更高,而后部與一般化認知加工的關系更為密切??梢灶A見的是,未來在這一領域的研究還會更加深入,因為語義加工網絡與其他網絡之間的差異及其交互這一問題直接牽涉到語言理解網絡的模塊化特性,相關領域的探索對理解人類語言加工的本質具有極其重要的價值。
除了研究思路需要系統(tǒng)化之外,還需要留意目前應用較廣的幾種腦成像技術,如fMRI、ERP以及MEG技術局限性在研究這一問題時可能造成的影響,在堅持現(xiàn)有研究技術的同時,應努力引入同時具有較好時間和空間分辨率、新的成像技術對不同時間窗下語義加工的機制,以及一些關鍵腦區(qū)(例如顳葉前部)的機制進行深入而系統(tǒng)地檢驗。
近年來,伊利諾斯大學厄爾本—香檳分校貝克曼研究所的Gratton 和Fabiani教授等研究者開發(fā)的事件相關光學成像技術(Event-Related Optical Signal, EROS)在認知研究領域引起了研究者越來越多的關注。這一技術與傳統(tǒng)的近紅外光成像技術(Near-infrared spectroscopy, NIRS)具有較大的差異。其基本原理是,認知活動一旦發(fā)生,與該認知活動相關的大腦區(qū)域神經元也會同時激活,神經組織的活動會使得它本身的光感受能力發(fā)生變化,突出地表現(xiàn)在對近紅外光散射率的增大上。近紅外光進入活動的神經元,由于散射率變大,光反射回到探測器上的時間會變慢。通過神經活動和近紅外光的這種關系,可以檢測特定大腦區(qū)域和認知活動之間的關系。目前這個技術已具備跟ERP相媲美的時間分辨率(30ms左右),空間分辨率也可達到5-10mm。由于這一技術在時間和空間分辨率上均有優(yōu)勢,目前已應用于認知研究的許多領域,獲得一些極有價值的研究結果(Gratton, Fabiani, 2010)[54]。最近,我們利用ERP結合EROS技術完成了一項句子語義整合的研究(Huang, Wang, Jia, et al., 2012)[49],發(fā)現(xiàn)該技術可以較好地檢測到跟語言相關的大腦關鍵區(qū)域,例如左側額下回、顳葉前部。同時借助EROS的高時間和空間分辨率,研究結果能很好地展現(xiàn)語言加工在不同大腦區(qū)域的動態(tài)變化過程。
值得注意的是,雖然本文提到多種技術,如ERP、fMRI、EROS等,這些技術對大腦機制的探討卻都停留在相關研究的基礎上。然而,心理學研究不但希望了解某一腦區(qū)與心理行為之間是否有關,更希望知道這些腦區(qū)與心理加工過程之間的因果關系,從而達到控制行為的最終目的。以往對這類因果關系的探索基本上只能利用臨床腦損傷的病人進行,由于損傷的不可預見性,相關的研究進展相當緩慢。隨著TMS技術的引入,近期這一領域得到了迅猛發(fā)展。TMS是經顱磁刺激 (Transcranial Magnetic Stimulation) 技術的簡稱,是通過強電流產生磁場再在顱內皮層內引發(fā)電流回路的技術,其引發(fā)的電流回路能夠干擾到局部大腦皮層的活動,這種干擾是暫時性和無損的,因而為研究者提供了一個能夠進行因果推斷的重要方法(Walsh, Cowey, 2000)[55]。最初,經顱磁刺激用來研究皮層神經元環(huán)路結構、個體認知、運動以及行為機制,然而,目前已開始較廣泛地應用于認知神經科學各領域的研究。在我們最近完成的一項TMS研究中(Zhu, Gold, Chang, et al., submitted)[56],我們采用TMS技術刺激大腦顳中回,觀察刺激是否影響到語義提取的時間進程。結果發(fā)現(xiàn)TMS影響了不同SOA下的反應時,在短的SOA條件下,刺激顳中回會對語義啟動效應產生干擾,而在長的SOA內刺激這一區(qū)域,影響則不明顯,這一結果更清楚地說明左側顳中回的作用主要是與早期的語義提取有關,而非晚期的控制性語義提取??梢灶A見的是,隨著對腦區(qū)與心理行為之間相關性研究證據(jù)的積累,研究者能越來越清晰地認知不同腦區(qū)在心理加工中起作用的時間進程,這將為TMS研究的開展墊定堅實的基礎,未來也將有越來越多具開創(chuàng)性的、令人興奮的相關成果面世。
語言理解對人類的重要性毋庸置疑,因此,正如19世紀初著名心理學家Huey所談到的那樣,心理學家最重要的貢獻之一就是能對閱讀進行完整而透徹的探討,這不但可以探索人類心理活動中許多極端復雜的內在動作,也可以為解釋人類文明的發(fā)展提供重要的啟示(陳烜之,1997)[57]。然而因為篇幅與作者視野所限,本文只是管窺一豹。可以確定的是,盡管語言理解的過程相當復雜,但作為人類認知加工的一個重要部分,它總會在大腦留下相應的時空痕跡。而隨著當前認知神經科學技術的不斷發(fā)展,研究者已經能越來越好地把握語言理解加工在大腦中留下的時空信息。這些多角度、多層面更為豐富的信息在未來一定能幫助人類更好地認識語言理解加工的本質,并建構起更完整和全面的語言認知模型。
參考文獻:
[1] P.Hagoort.ShouldPsychologyIgnoretheLanguageoftheBrain?. Current Directions in Psychological Science, 2008, 17(2): 96-101.
[2] M.Kutas, K.D.Federmeier.ThirtyYearsandCounting:FindingMeaningintheN400ComponentoftheEvent-relatedBrainPotential(ERP). Annual Review of Psychology, 2011, 62: 621-647.
[3] M.Kutas, K.D.Federmeier.ElectrophysiologyRevealsSemanticMemoryUseinLanguageComprehension. Trends in Cognitive Sciences, 2000, 4: 463-470.
[4] E.F.Lau, C.Phillips, D.Poeppel.ACorticalNetworkforSemantics: (de)ConstructingtheN400. Nature Reviews Neuroscience, 2008, 9: 920-933.
[5] C.M.Brown, P.Hagoort.TheProcessingNatureoftheN400:EvidencefromMaskedPriming. Journal of Cognitive Neuroscience, 1993, 5: 34-44.
[6] A. D.Friederici.TowardsaNeuralBasisofAuditorySentenceProcessing. Trends in Cognitive Sciences, 2002, 6(2): 78-84.
[7] P.Hagoort, G.Baggio, R.M.Willems.SemanticUnification∥M.S.Gazzaniga (Ed.). The New Cognitive Neurosciences, 4th ed. Landon:MIT Press, 2009:819-836.
[8] G.Hickok, D.Poeppel.TheCorticalOrganizationofSpeechProcessing. Nature Reviews Neuroscience, 2007, 8(5): 393-402.
[9] 朱祖德, 王穗蘋, 馮剛毅, 等.左側額下回在句子語義整合加工中的作用. 心理科學進展, 2011, 19: 1147-1157.
[10]P.Hagoort.OnBroca,Brain,andBinding:ANewFramework. Trends in Cognitive Sciences, 2005, 9: 416-423.
[11]M.Jung-Beeman.BilateralBrainProcessesforComprehendingNaturalLanguage. Trends in Cognitive Sciences, 2005, 9: 512-518.
[12]W.D.Marslen-Wilson, L.K.Tyler.ProcessingStructureofSentencePerception. Nature, 1975, 257:784-786.
[13]W.D.Marslen-Wilson.FunctionalParallelisminSpokenWordRecognition. Cognition, 1987, 25:71-102.
[14]K.Rayner.EyeMovementsinReadingandInformationProcessing: 20YearsofResearch. Psychological Bulletin, 1998, 124:372-422.
[15]S.C.Sereno, C.C.Brewer, P.J. O’Donnell.ContextEffectinWordRecognition:EvidenceforEarlyInteractiveProcessing. Psychological Science, 2003, 14:328-333.
[16]Y.Shtyrov, F.Pulvermuller.LanguageintheMismatchNegativityDesign:Motivations,BenefitsandProspects. Journal of Psychophysiology, 2007, 21:176-187.
[17]B.Penolazzi, O.Hauk, F.Pulvermuller.EarlySemanticContextIntegrationandLexicalAccessasRevealedbyEvent-relatedBrainPotentials. Biological Psychology, 2007, 74:374-388.
[18]P.Hagoort, C.M.Brown, J.Groothusen.TheSyntacticPositiveShift(SPS)asanERPMeasureofSyntacticProcessing. Language and Cognitive Processing, 1993, 8: 439.
[19]L.Osterhout, P.J.Holcomb.Event-relatedBrainPotentialsElicitedbySyntacticAnomaly. Journal of Memory and Language, 1992, 31: 785-806.
[20]I.Bornkessel-Schlesewskya, M.Schlesewsky.AnAlternativePerspectiveon“SemanticP600”EffectsinLanguageComprehension. Brain Research Review, 2008, 59: 55-73.
[21]G.R.Kuperberg.NeuralMechanismsofLanguageComprehension:ChallengestoSyntax. Brain Research, 2007, 1146:23-49.
[22]G.R.Kuperberg, T.Sitnikova, D.Caplan, et al.ElectrophysiologicalDistinctionsinProcessingConceptualRelationshipswithinSimpleSentences. Brain Research, 2003, 17: 117-129.
[23]A.Kim, L.Osterhout.TheIndependenceofCombinatorySemanticProcessing:EvidencefromEvent-relatedPotentials. Journal of Memory and Language, 2005, 52: 205-225.
[24]H.H.J.Kolk, D.J.Chwilla, M.Van Herten, et al.StructureandLimitedCapacityinVerbalWorkingMemory:AStudywithEvent-relatedPotentials. Brain and Language, 2003, 85: 1-36.
[25]K.D.Federmeier, M.Kutas.ARosebyanyotherName:Long-termMemoryStructureandSentenceProcessing. Journal of Memory and Language, 1999, 41: 469-495.
[26]K.D.Federmeier, E.W.Wlotko, E.De Ochoa-Dewald, et al.MultipleEffectsofSententialConstraintonWordProcessing. Brain Research, 2007, 1146: 75-84.
[27]K.A.DeLong, T.P.Urbach, D.M.Groppe, et al.OverlappingDualERPResponsestoLowClozeProbabilitySentenceContinuations. Psychophysiology, 2011, 48: 1203-1207.
[28]Petten C.Van, B.J.Luka.PredictionduringLanguageComprehension:Benefits,Costs,andERPComponents. International Journal of Psychophysiology, 2012, 83: 176-190.
[29]M.I.Nunez-Pena, M.L.Honrubia-Serrano.P600RelatedtoRuleViolationinanArithmeticTask. Brain Research, 2004, 18: 130-141.
[30]A.D.Patel, E.Gibson, J.Ratner, et al.ProcessingSyntacticRelationsinLanguageandMusic:AnEvent-relatedPotentialStudy. Journal of Cognitive Neuroscience, 1998, 10: 717-733.
[31]H.H.J.Kolk, D.J.Chwilla.LatePositivitiesinUnusualSituations. Brain and Language, 2007, 100: 257-261.
[32]N.Van de Meerendonk, H.H.J.Kolk, D.J.Chwilla, et al.MonitoringinLanguagePerception. Language and Linguistics Compass, 2009, 3: 1211-1224.
[33]Z.Ye, X.Zhou.ExecutiveControlinLanguageProcessing. Neuroscience and Biobehavioral Reviews, 2009, 33: 1168-1177.
[34]K.Patterson, P.J.Nestor, T.T.Rogers.WhereDoYouKnowWhatYouKnow?TheRepresentationofSemanticKnowledgeintheHumanBrain. Nature Reviews Neuroscience, 2007, 8: 976-987.
[35]D.K.Bemis, L.Pylkkanen.SimpleComposition:AMagnetoencephalographyInvestigationintotheComprehensionofMinimalLinguisticPhrases. Journal of Neuroscience, 2011, 31: 2801-2814.
[36]P.Hagoort, L.Hald, M.Bastiaansen, et al.IntegrationofWordMeaningandWorldKnowledgeinLanguageComprehension. Science, 2004, 304: 438-441.
[37]M.Vigneau, V.Beaucousin, P.Y.Hervéa, et al.Meta-analyzingLeftHemisphereLanguageAreas:Phonology,Semantics,andSentenceProcessing. NeuroImage, 2006, 30(4): 1414-1432.
[38]A.D.Friederici.PathwaystoLanguage:FiberTractsintheHumanBrain. Trends in Cognitive Sciences, 2009, 13(4): 175-181.
[39]L.Lichtheim.OnAphasia. Brain, 1885, 7: 433-484.
[40]N.Geschwind.TheOrganizationofLanguageandtheBrain. Science, 1970, 170(3961): 940-944.
[41]M.Catani, D.K.Jones, D.H.Ffytche.PerisylvianLanguageNetwoksoftheHumanBrain. Annals of Neurology, 2004, 57: 8-16.
[42]M.Catani, M.Mesulam.TheArcuateFasciculusandtheDisconnectionThemeinLanguageandAphasia:HistoryandCurrentState. Cortex, 2008, 44: 953-961.
[43]D.Saur, B.W.Kreher, S.Schnell, et al.VentralandDorsalPathwaysforLanguage. Proceedings of the National Academy of Sciences of the United States of America, 2008, 105: 18035-18040.
[44]F.C.K.Wong, B.Chandrasekaran, K.Garibaldi, et al.WhiteMatterAnisotropyintheVentralLanguagePathwayPredictsSound-to-wordLearningSuccess. Journal of Neuroscience, 2011, 31: 8780-8785.
[45]M.Hampson, B.S.Peterson, P.Skudlarski, et al.DetectionofFunctionalConnectivityUsingTemporalCorrelationsinMRImages. Human Brain Mapping, 2002, 15(4): 247-262.
[46]H.D.Xiang, H.M.Fonteijn, D.G.Norris, et al.TopographicalFunctionalConnectivityPatterninthePerisylvianLanguageNetworks. Cerebral Cortex, 2010, 20(3): 549-560.
[47]M.S.Koyama, C.Kelly, Z.Shehzad, et al.ReadingNetworksatRest. Cerebral Cortex, 2010, 20(11): 2549-2559.
[48]M.S.Koyama, A.D.Martino, X.N.Zuo,et al.Resting-stateFunctionalConnectivityIndexesReadingCompetenceinChildrenandAdults. Journal of Neuroscience, 2011, 31(23): 8617-8624.
[49]J.Huang, S.Wang, S.W.Jia, et al.TheDynamicsofBrainActivationinSemanticIntegration:AStudyCombiningERPandEvent-relatedOpticalSignals. Presented in 19th Annual Cognitive Neuroscience Meeting. Chicago, USA,2012.
[50]K.J.Friston, L.Harrison, W.Pennya.DynamicCausalModelling. NeuroImage, 2003, 19(4): 1273-1302.
[51]A.Mechelli, J.T.Crinion, S.Long, et al.DissociatingReadingProcessesontheBasisofNeuronalInteractions. Journal of Cognitive Neuroscience, 2005, 17(11): 1753-1765.
[52]K.Nakamura, S.Kouider, M.Makuuchi, et al.NeuralControlofCross-languageAsymmetryintheBilingualBrain. Cerebral Cortex, 2010, 20(9): 2244-2251.
[53]Z.Zhu, P.Hagoort, J.X.Zhang, et al.TheAnteriorLeftInferiorFrontalGyrusContributestoSemanticUnification. Neuroimage, 2012, 60: 2230-2237.
[54]G.Gratton, M.Fabiani.FastOpticalImagingofHumanBrainFunction. Frontiers in Human Neuroscience, 2010, 4: 52.
[55]V.Walsh, A.Cowey.TranscranialMagneticStimulationandCognitiveNeuroscience. Nature Reviews: Neuroscience, 2000, 1: 73-79.
[56]Zude Zhu, Brian T Gold, Chi-Fu Chang, Suiping Wang, Chi-Hung Juan, (submitted). The Roles of the Left Posterior Temporal and Inferior Frontal Gyri in Word Recognition: A TMS Study.
[57]陳烜之.中文閱讀的認知歷程∥彭聃齡, 舒華, 陳烜之,編.漢語認知研究. 濟南:山東教育出版社, 1997:159-194.