鹿士義 黃韻
[關鍵詞] 詞語切分;韻律模式;語素位置概率;基本加工單位
[摘 ?要] 在中文文本閱讀過程中,讀者如何對詞語進行分詞和識別,基本加工單位是什么,一直存在著爭論。本文采用線上詞匯命名任務,以漢語母語者和高級水平的二語者為被試,研究韻律模式和語素位置概率對漢語詞語切分和識別的影響,并在此基礎上探討基本加工單位的大小問題。研究發(fā)現(xiàn):韻律因素和語素位置概率顯著影響詞語的切分和識別;漢語母語者和二語者最大的差異在于二語者加工單位的長度小于母語者,這可能是由于二語者的知覺廣度范圍較窄導致的。漢語的基本加工單位大小基本遵循“長詞優(yōu)先”原則,同時受韻律特征、語素特征、語言水平等因素的影響。
[中圖分類號]H195.3 ?[文獻標識碼]A ?[文章編號]1674-8174(2023)01-0043-09
1. 引言
由于漢語的書寫系統(tǒng)缺乏詞間空格,詞邊界不清晰,詞語的識別與切分會導致以下三種情況:一、詞語的識別和切分是同時進行的,是統(tǒng)一的過程(Li等,2009);二、由于缺乏詞間空格等低水平視覺信息,需要更多地運用高水平的語言特征進行詞語切分和識別;三、在漢語文本中,漢字比詞更加突顯。在漢語的基本加工單位這個問題上,學界暫未形成一致看法。因此,本文暫且跳過加工單位是什么的問題,從加工單位的大小切入,探討漢語詞語切分和識別過程會受到哪些高水平的語言特征的影響。
關于漢語基本加工單位的大小問題,目前已有的模型均預測更大的詞匯單位更容易被識別出來,即長詞優(yōu)先(Inhoff et al,2005;Li et al,2009)。在知覺廣度范圍內(nèi),長詞(如ABC)優(yōu)先被選擇和識別,內(nèi)嵌詞(即AB)的激活程度較弱。也就是說,人們更加傾向于切分出較大的單位作為基本加工單位。
Zhou等(2018)采用了長度為三個字符的組合型歧義材料進行實驗,如“藝術家”,發(fā)現(xiàn)內(nèi)嵌詞(藝術)先于整詞(藝術家)激活。這一結果可能表明,即使存在長詞(多于兩音節(jié)的詞匯),讀者可能仍會將兩音節(jié)相結合并首先激活和識別,不一定存在長詞優(yōu)先激活的現(xiàn)象。相應地,Perfetti等(1999)則提出另一種預測——漢語母語者在閱讀時會采用“二字結合策略”,加工單位的大小默認為兩個音節(jié)的長度。“二字結合策略”得到來自于韻律的支持。馮勝利(2002:78)認為雙音節(jié)音步是漢語最基本的“標準音步”,雙音節(jié)化是現(xiàn)代漢語的主要節(jié)奏傾向(周有光,1961)。因此,“二字結合策略”是具有理論基礎的。
值得注意的是,“二字結合策略”采用的實驗材料是長度為三字符、鏈長為1的歧義字符串,如“照顧客”,因為ABC不成詞,在切分上僅存在兩字結合的可能性。因此,雖然不能否認“二字結合”策略的運用,但也同樣不能否認,只要條件允許,也可能做出三字、四字結合的切分選擇。Zang等(2015)的研究結果和“二字結合策略”的預測不一致。當語素A獨立成詞時,讀者更少地把A和其右側的B結合在一起加工。這意味著二字結合策略的運用會受到語素特性的調(diào)節(jié)。在一定條件下,漢語的基本加工單位可能小于兩個音節(jié)。
總的來說,在現(xiàn)有的實驗中,歧義字符串長度較小,切分可能性不多,不能很好地驗證漢語基本加工單位的大小問題。而出現(xiàn)不同研究結論相左的情況,可能是由于影響加工單位大小的因素尚未厘清,如上文提到的韻律因素和語素特征信息。因此,為了更好地探究漢語基本加工單位的大小及其影響因素,本文擬以歧義字符串ABC和ABCD為材料進行實驗,其中AB成詞,ABC亦成詞,后者CD亦成詞。這一類型的歧義字符串存在多種切分的可能性,切分后單位大小不一,能夠更充分地考察漢語詞語的識別和切分以及切分后加工單位的大小。
2. 影響因素
影響詞語切分和識別的因素眾多,主要分為低水平視覺信息和高水平語言因素等,前者包括詞間空格、詞長等,后者包括詞頻、熟悉度、可預測性等。但本文主要關注韻律信息和語素特征,因為這兩個因素關系著“二字結合策略”的應用,影響詞語的識別和切分,從而影響基本加工單位的大小。
韻律(prosody),指的是語流中的超音段成分,在聲學上表現(xiàn)為基頻、時長、強度等(Wagner & Watson,2010)。在漢語中,雙音節(jié)化是現(xiàn)代漢語的主要韻律節(jié)奏傾向(周有光, 1961),漢語韻律對單雙音節(jié)的組合搭配有特殊要求。漢語的四音節(jié)序列絕大多數(shù)是按[2+2]這種節(jié)奏形式來切分直接成分的(Chao,1975)。四字字符串的自然韻律是[2+2](馮勝利,2002:101)。[2+2]的韻律組配模式可能影響漢語母語者的詞語識別和切分,但漢語學習者是否習得[2+2]的韻律模式,并利用這一模式進行詞語的識別和切分還有待進一步探討。
語素特征同樣影響漢語閱讀中詞匯識別和切分。在眾多的語素特征中,位置概率在詞語識別和切分中有著非常重要的作用(Kasisopa 等,2013、2016;Sainio等,2007;Yen等,2012;Liang等,2017;高淇,2018)。在以漢語二語者為對象的研究中,同樣發(fā)現(xiàn)語素位置對其詞匯的識別和切分造成影響(洪煒等, 2010; 陳琳等, 2016; 邢濱鈺等, 2018)。但是,語素位置概率對漢語二語者詞匯識別或切分影響的研究目前還很少見到。因此,本研究擬操縱語素位于不同位置的概率大小,探究其對漢語學習者詞語加工的影響。
本研究擬以歧義詞組ABC和ABCD為實驗材料,采用線上詞匯命名任務,探討二語者能否利用韻律信息和語素位置概率信息進行詞語識別和切分,從而探究漢語加工單位的大小問題。其中,韻律信息具體指[2+2]組配模式,語素位置概率指的是一個語素在詞中位于詞首或詞尾的概率。研究的具體問題如下:
第一,漢語學習者是否受韻律模式的影響,將歧義四字字符串ABCD按照[2+2]的組配模式進行加工,切分出較小的單位——雙音節(jié)詞語,而非“長詞”三音節(jié)詞語?而未有優(yōu)勢韻律模式的歧義詞語ABC會出現(xiàn)怎樣的切分結果呢?兩類歧義詞語的切分結果是否不同?
第二,漢語學習者在加工字符串ABC和ABCD時,C的語素位置概率是否會影響切分結果?即,學習者是否會根據(jù)C位于詞首或詞尾的位置概率高低,做出不同的切分呢?
3. 實證研究
3.1 實驗設計
本實驗采用三因素混合設計。三因素分別為:(1)母語背景:漢語母語者和母語非漢語的二語者;(2)歧義字符串ABC和ABCD中第三個字符C的語素位置概率;(3)歧義字符串的韻律組配模式:字符串ABCD存在[2+2]優(yōu)勢韻律模式,而ABC缺乏優(yōu)勢韻律模式。其中母語背景為被試間因素,后兩者為被試內(nèi)因素。
本實驗采用詞匯命名任務,要求被試在字符串呈現(xiàn)后快速報告第一個看到的包含在歧義字符串的詞語,因變量為被試所報告的雙音節(jié)詞或三音節(jié)詞的情況。
3.2 被試
被試為漢語母語者和漢語二語者各18名。其中,漢語母語者被試中,男、女各9人,均為在校學生;二語被試中,男7人,女11人,平均年齡為25歲,HSK等級為五級到六級,漢語學習的平均時長為6.1年。
3.3 實驗材料
本實驗以歧義字符串ABC和ABCD為實驗材料。從《漢語水平詞匯與漢字等級大綱》挑選AB且ABC成詞的詞語,并根據(jù)C挑選詞語CD。所選取的詞語大多屬于甲級詞或乙級詞。邀請未參與實驗的高級水平漢語學習者15名,采用4點量表對歧義詞組中所包含的詞AB、ABC、CD進行熟悉度評定。共得到32組歧義詞組ABCD和32組歧義詞組ABC,熟悉度平均值為3.60。
詞AB的平均詞頻約為6.62萬 ?(SD = 1.07),詞ABC的平均詞頻為5.56萬 ?(SD = 0.83),詞CD的詞頻為7.63萬(SD = 1.88)。方差分析表明,三者的平均詞頻沒有顯著差異,F(xiàn)(2,93) = 0.195 (p > 0.05),事后分析表明,詞AB和詞ABC之間(p = 0.752 > 0.05)、詞AB和詞CD(p = 0.759 > 0.05)、 詞ABC和詞CD (p = 0.534 > 0.05)之間均沒有顯著差異。
詞AB的平均筆畫數(shù)為6.569(SD = 1.84),詞ABC的平均筆畫數(shù)為6.64(SD = 1.73),詞CD的平均筆畫數(shù)為6.88(SD = 2.12)。方差分析表明,三者的平均筆畫數(shù)不存在顯著性差異,F(xiàn)(2,93) = 0.236,p > 0.05),詞AB和詞ABC(p = 0.878 > 0,05)、詞AB和詞CD(p = 0.513 > 0.05)、詞ABC和詞CD(p = 0.616 > 0.05)之間均沒有顯著差異。
在兩類歧義字符串中,第三個漢字C作為詞首或詞尾的位置概率在BCC語料庫《漢語常用詞詞頻表》(荀恩東等,2016)中計算。C位于詞首的位置概率P (CI)等于C位于詞首的詞數(shù)除以首尾包含語素C的所有詞數(shù)(Yen et al,2012),公式為:P(CI) = N(Cinitial) / N(Cinitial + Cending) ×100%。同理,C位于詞尾的位置概率P (CE) 計算公式為: P (CE) = N(Cending)/N(Cinitial+Cending)×100%或P(CE) = 100%-N(Cinitial)/N(Cinitial+Cending) × 100%。
本實驗材料中,漢字C位于詞首的概率范圍為2.72%至78.35%,平均值為30.92%(SD ?= 15.09)。
將64組材料分為兩個版本,每個版本32組材料。每個版本中,同一個語素C所對應的歧義字符串的韻律組配模式只出現(xiàn)一次,即被試只閱讀ABCD和其對應的ABC中的其中一個。另外加入2倍左右的填充詞組,共58組。每個版本的實驗材料和填充材料經(jīng)過完全隨機排列后分為3個板塊,每個板塊包含30組詞語。另外挑選包含上述所有類型的詞組34組,隨機分為兩個部分,作為練習階段的材料。
3.4 實驗儀器與程序
本文采用線上視頻形式進行實驗,使用E-prime 2.0軟件編程,通過Bandicam軟件將其錄制成視頻。主試將2個練習視頻和3個正式實驗視頻發(fā)送給被試,被試在電腦上全屏播放,進行實驗。實驗參考Ma等 (2014) 的模糊詞報告范式。
首先呈現(xiàn)注視點“+”500ms,接著呈現(xiàn)500ms的空屏,然后快速呈現(xiàn)歧義詞組。之后出現(xiàn)一個持續(xù)3000ms的空屏,要求被試在空屏出現(xiàn)時又快又準確地報告第一個看到的包含在歧義詞組中的詞語。3000ms之后出現(xiàn)下一次注視點“+”。通過前測,確定漢語母語者實驗時歧義詞組的呈現(xiàn)時間為100ms,漢語二語者為600ms。視頻實驗結束后,漢語二語者被試需要填寫兩份調(diào)查問卷,分別是交際語言能力自評表和實驗材料的熟悉度評定問卷,而漢語母語者僅需要完成后者。整個實驗大約持續(xù)30分鐘。
4. 實驗結果與分析
詞語命名的具體情況見表2。刪去命名錯誤的數(shù)據(jù)50條,占全部數(shù)據(jù)的4.34%,有效數(shù)據(jù)為1102條。
實驗數(shù)據(jù)在R語言(version 3.6.3)軟件上分析。本實驗的因變量為5個水平的類別變量,分別為單音節(jié)詞、雙音節(jié)詞、三音節(jié)詞、先二后三、先二后加一,原始數(shù)據(jù)及調(diào)整后數(shù)據(jù)均不符合正態(tài)分布,且程度上無先后順序分布,因此本研究利用nnet數(shù)據(jù)包(version 7.3-13)中的multinom函數(shù),即采用無序多分類logistic回歸模型,分析實驗數(shù)據(jù)。
本研究關注的解釋變量為:被試的語言背景(母語者、漢語二語者,編碼為group0和group1)、韻律組配模式(有/無優(yōu)勢韻律模式,即字符串ABCD和ABC,編碼為type4和type3)、語素C位于詞首的位置概率(編碼為LP)。本文的結果變量為詞匯命名情況。在對數(shù)據(jù)進行編碼和整理后,采用最大似然法(Maximum Likelihood Technique)建模。最優(yōu)模型包含母語背景、韻律組配模式和詞首位置概率的固定效應,以及韻律和位置概率的交互效應,統(tǒng)計輸出結果如表3所示。
4.1 詞匯報告結果:單音節(jié)詞/三音節(jié)詞
通過模型可以得知,在單音節(jié)詞和三音節(jié)詞的發(fā)生概率對比上,語言背景、韻律模式和詞首位置概率的主效應顯著,韻律模式和位置概率的交互效應不顯著。
語言背景的回歸系數(shù)為7.373,即相比于母語者,二語者報告單音節(jié)詞的概率增加,EXP(B) 為1592.855,即二語者報告單音節(jié)詞的概率約為母語者的1593倍,表明二語者比母語者更有可能報告單音節(jié)詞。就韻律組配模式而言,相比于無優(yōu)勢韻律模式的詞組ABC,詞組ABCD的回歸系數(shù)為2.970,優(yōu)勢比為19.508,即被試在面對四音節(jié)字符串時,報告單音節(jié)詞的可能性更高,約是報告三音節(jié)詞的19.5倍。語素C的詞首位置概率對被試報告單音節(jié)詞或三音節(jié)詞有顯著影響。詞首位置概率的回歸系數(shù)為0.051,優(yōu)勢比為1.052,表明隨著詞首位置概率的提高,被試報告單音節(jié)詞的概率增加,具體為詞首位置概率每提高1%,被試報告單音節(jié)詞的概率提高5.2%。
但值得注意的是,被試產(chǎn)出單音節(jié)詞的情況非常少,占比不到總數(shù)據(jù)的1%,而且母語者被試未報告單音節(jié)詞。
4.2 詞匯報告結果:雙音節(jié)詞/三音節(jié)詞
被試報告雙音節(jié)詞或三音節(jié)詞的結果受到語言背景、韻律模式和詞首位置概率的顯著影響,韻律模式和位置概率的交互作用不顯著。
相比于母語者,二語者報告雙音節(jié)詞的概率更高,回歸系數(shù)為0.631,優(yōu)勢比是1.880,即報告雙音節(jié)詞的可能性比報告三音節(jié)詞增加88%。在韻律組配模式上,字符串ABCD的回歸系數(shù)為1.798,即相比于歧義字符串ABC,被試在遇到ABCD時,報告雙音節(jié)詞的可能性更高,具體為三音節(jié)詞的6.037倍。
相比于報告三音節(jié)詞,語素位置概率在被試報告雙音節(jié)詞上同樣有顯著影響。位置概率的回歸系數(shù)為0.023,優(yōu)勢比為1.023,這意味著位置概率每提高1%,相比于報告三音節(jié)詞,被試報告雙音節(jié)詞的可能性增加2.3%。即在面對歧義字符串ABCD時,語素C位于詞首的概率越高,被試報告雙音節(jié)詞AB或CD的概率越高。
4.3 詞匯報告結果:先二后三/三音節(jié)詞
以報告三音節(jié)詞為參照,被試先報告雙音節(jié)詞再改口為三音節(jié)詞的情況,不受語言背景、韻律模式和詞首位置概率等因素的固定效應和交互效應的影響,上述解釋變量的顯著性水平均大于0.05。
這一類的詞匯報告結果不僅不是本研究關注的目的,而且是實驗中應該避免出現(xiàn)的情況——實驗正式開始前,被試都被告知應該報告自己第一個看到的詞語。因此這類數(shù)據(jù)極少,僅有7條,占比0.61%。
4.4 詞匯報告結果:先二后加一/三音節(jié)詞
相比于三音節(jié)詞,影響被試先報告雙音節(jié)詞再加語素C情況的因素中,語言背景、韻律模式的主效應顯著。和母語者比較,二語者報告“先二后加一”的概率增加,回歸系數(shù)為1.026,發(fā)生概率約為母語者的16.9倍。在存在[2+2]的優(yōu)勢韻律的字符串ABCD上,被試產(chǎn)出“先二后加一”的可能性更低,其概率僅有面對字符串ABC時的2.5%。韻律模式和語素位置概率的交互效應顯著。被試在面對[2+2]韻律模式的字符串時,隨著詞首位置概率的提高,先報告雙音節(jié)詞再加語素C組成三音節(jié)詞的情況發(fā)生概率增加,是報告三音節(jié)詞的1.105倍;但面對ABC字符串時,詞首位置概率對被試的詞匯報告結果沒有顯著影響。
不過同樣需要注意,這也是本實驗需要避免出現(xiàn)的情況,產(chǎn)出的數(shù)據(jù)非常少,僅有14條,占總數(shù)據(jù)的1.22%。
5. 討論
從實驗數(shù)據(jù)的結構來看,被試報告單音節(jié)詞、“先二后三”和“先二后加一”類型的數(shù)據(jù)較少,因此下文的討論主要基于雙音節(jié)詞和三音節(jié)詞的統(tǒng)計結果,兼以上述三類數(shù)據(jù)為輔助。
5.1 語素位置概率的影響
根據(jù)表3的總模型,語素位置概率主效應顯著,且和語言背景無交互效應,說明無論母語者還是二語者都能夠根據(jù)語素C位于詞首概率的不同,報告不同的詞匯——在歧義詞組ABC或ABCD中,若C位于詞首的概率高,被試傾向于報告雙音節(jié)詞,即AB或CD。因為C位于詞首概率高,C作為詞n+1的起始語素的可能性更高,即詞匯邊界更有可能位于語素C的前面,隨著語素詞首概率的提高,被試將ABC和ABCD切分為AB或CD的意愿更加強烈。
在以母語者為實驗對象的研究上,本實驗的結果與前人的研究結果一致。無論是在有“詞間空格的拼音文字”芬蘭語(Bertram等,2004),還是“無詞間空格的拼音文字”泰語(Kasisopa等,2013、2016),或是“無詞間空格的、兼有表音文字和象形文字”的日語(Sainio等,2007),或是“無詞間空格的象形文字”的漢語(Yen等,2012;Liang等,2017;高淇,2018),母語者都能夠利用語素位于詞首或詞尾的概率進行詞匯切分和識別。
本實驗中,二語者也成功運用了語素位置概率這一特征進行詞匯的切分和識別。前人的研究發(fā)現(xiàn)語素位置概率信息的利用程度和語言水平相關,對這一線索的熟練運用是逐漸習得的(Kasisopa等,2016;梁菲菲,2015)。而在語素位置信息提取的研究上,邢濱鈺等(2018)的研究同樣表明,漢語學習者的語言水平越高,提取語素位置信息的速度越快。
5.2 韻律組配模式的影響
韻律組配模式的主效應顯著,相比于歧義字符串ABC,在遇到字符串ABCD時,被試報告雙音節(jié)詞AB或CD的可能性更高,約為報告三音節(jié)詞的6倍。在四音節(jié)詞組中,存在[2+2]優(yōu)勢韻律模式,排斥三音節(jié)詞ABC的產(chǎn)出;而在三音節(jié)詞組中,沒有穩(wěn)定的優(yōu)勢韻律模式,因此被試既不拒絕整詞ABC的產(chǎn)出,也不拒絕雙音節(jié)詞AB的產(chǎn)出。所以和字符串ABC相比,在面對字符串ABCD時,報告雙音節(jié)詞的可能遠高于三音節(jié)詞。同時韻律模式與母語背景無顯著的交互效應,即說明上述結果同時適用于母語者和二語者。這一實驗結果與前人研究成果一致(Chao,1975;張輝等,2012、2013)。[2+2]確實是漢語四音節(jié)詞組的強勢韻律模式。
根據(jù)前人的研究,三音節(jié)詞語并非沒有優(yōu)勢韻律模式。呂叔湘(1963)發(fā)現(xiàn)漢語三音節(jié)詞語主要存在[1+2]和[2+1]兩種組配模式,而且存在韻律信息和句法信息的交匯:[1+2]模式以動賓式(如“讀報紙”)為主,[2+1]模式以偏正式(如“熱水器”)占絕對優(yōu)勢。本實驗中所使用的三音節(jié)歧義字符串均為偏正結構,存在較為穩(wěn)定的[2+1]韻律模式。根據(jù)這一韻律模式,在詞匯識別和切分過程中,雙音節(jié)詞AB存在優(yōu)先于整詞ABC產(chǎn)出的可能性。但實驗中實際的產(chǎn)出結果并非如此。這可能是因為,根據(jù)漢語韻律句法理論研究的成果,漢語母語者只有在結合句法信息之后,才能判斷出三音節(jié)詞語的優(yōu)勢韻律組配模式。而漢語韻律與句法交互的眼動和ERP研究結果表明,漢語韻律信息作用于詞匯加工的早期階段,句法信息作用于中晚期(Ren等,2010;于澤,2011;張輝等,2013)。在本實驗中,字符串ABC呈現(xiàn)時間僅為100ms,且被試需要盡快報告首先識別出的第一個詞,因此被試可能來不及加工整個字符串的句法信息,從而得出韻律模式,再綜合句法和韻律的全部信息來決定報告的詞匯。而四音節(jié)詞組[2+2]的韻律模式存在絕對優(yōu)勢,不需要考慮句法結構 (Ren等, 2010; 張輝等, 2013)。所以,本文最終的實驗結果仍然是兩類歧義詞組相比,在ABCD中報告雙音節(jié)詞的可能性高于三音節(jié)詞。
對于本實驗的研究結論,可能還存在另一種質疑,認為是對語義相對獨立和相對完整的要求,而并非韻律因素,才導致現(xiàn)在的數(shù)據(jù)情況。從語義相對獨立和相對完整的角度來說,在字符串ABC中,若切分為AB和C,那么C可能并不是獨立成詞語素,即C無法獲得獨立性;而將其處理為ABC一個詞則不會有這種擔憂;而在ABCD中,將其切分為AB+CD,那兩者都是具有獨立意義的詞語;若切分為ABC+D即產(chǎn)生D可能無法獲得獨立性的擔憂。在其它因素一致的情況下,若是考慮語義因素,在字符串ABC中報告整詞ABC(即意義相對獨立)的比例,應該和在字符串ABCD中報告AB或CD(即意義相對獨立)的比例相當。但是,母語者的總體數(shù)據(jù)結構并不支持這個解釋,前者占比89%,后者約為41%。而且,同樣地,與句法信息相同,語義信息的加工在詞匯識別和切分加工的時間進程里處于中晚期(Ren等,2010;于澤,2011),被試可能來不及加工整個字符串的語義信息。因此本實驗中的詞匯識別和切分,語義因素并非主要的影響因素,而是韻律因素導致這一實驗結果。
對于二語者來說,統(tǒng)計結果顯示,韻律信息同樣在詞匯切分和識別中具有顯著作用,這表明高級水平二語者能夠運用[2+2]的韻律組配模式來確定詞邊界,已經(jīng)基本習得漢語四音節(jié)詞組的[2+2]韻律模式。
5.3 母語者和二語者的加工差異
實驗結果顯示,加工的最大差異表現(xiàn)在二語者比母語者更多報告雙音節(jié)詞。母語者報告雙音節(jié)詞的比例約為25%,二語者則為33%;從統(tǒng)計結果來看,與母語者相比,二語者報告雙音節(jié)詞是三音節(jié)詞的1.88倍。這是否意味著二語者比母語者更加熟練和高效地運用[2+2]韻律組配模式呢?
一部分二語者在實驗后的訪談提到,當呈現(xiàn)四音節(jié)詞組時,無法把四個漢字全部辨認清楚,多數(shù)情況下能識別出三個漢字,有時候甚至只能識別出兩個或一個漢字。這樣的說法也得到實驗數(shù)據(jù)的佐證:總體詞匯報告情況中,有11個單音節(jié)詞,均由二語者產(chǎn)出。漢語韻律單位的組織遵循“二常規(guī),三可容,一四受限”的規(guī)則(王洪君,2005),單音節(jié)詞的出現(xiàn)在韻律上受到非常多的限制。若存在韻律上更加合理的雙音節(jié)詞或三音節(jié)詞,被試就極少會產(chǎn)出單音節(jié)詞。母語者的詞匯報告結果與這一觀點是一致的。二語者報告單音節(jié)詞,說明其可能無法識別音節(jié)更長的詞匯單位。因此,二語者比母語者報告音節(jié)長度更短的詞語可能是由于不能完全識別歧義詞組ABCD導致的,而非[2+2]的韻律模式。
和母語者相比,二語者無法完整識別歧義詞符串ABC或ABCD里的所有漢字,原因可能是二語者的閱讀時知覺廣度范圍較窄。語言水平對知覺廣度存在顯著影響,漢語水平較低的二語者在閱讀知覺廣度為右側1-2個字,比母語者的稍窄(段力令,2016;楊朔,2019)。而且,閱讀材料的難易程度對知覺廣度范圍存在明顯影響。當材料較難時,知覺廣度范圍縮小一到三個漢字(閆國利等,2008;伏干,2012)。而本文所用的歧義字符串的加工更困難。因此,漢語二語者本就較窄的知覺廣度范圍可能進一步縮小。
在語言水平和閱讀材料的難度兩個因素的共同作用下,和母語者相比,漢語二語者的知覺范圍較窄,可能僅能識別歧義字符串中某部分漢字,最終產(chǎn)出更多的單音節(jié)詞和雙音節(jié)詞。
5.4 基本加工單位的大小
從整體的詞語報告數(shù)據(jù)結構來看,三音節(jié)詞的數(shù)量最多,占比達63%,雙音節(jié)詞數(shù)量次之,占比29.6%。其中母語者的數(shù)據(jù)中,報告三音節(jié)詞的比例更高,達到72.9%。由此看來,讀者傾向識別和切分出較長的單位——三音節(jié)詞,即讀者在詞匯識別和切分時采用“長詞優(yōu)先”原則。這一實驗結果與Inhoff 等(2005)的單向切分假說和Li等(2009)的平行激活交互模型所預測的結果一致。
模型的預測同樣可以解釋本實驗中被試改變報告結果的情況。在實驗中,無論是母語者還是二語者,都存在改變自己初始詞匯報告的情況,均為先報告雙音節(jié)詞再更改為三音節(jié)詞,共有21例。這一詞匯報告過程與模型預測一致,音節(jié)長度較短的詞語首先被識別,但最終時音節(jié)長度更大的詞語在競爭中勝出。
因此,一般來說,和音節(jié)數(shù)量較少的單位相比,漢語的基本單位是音節(jié)長度更大的單位。但是,這并不意味著總是遵循“長詞優(yōu)先”原則。Liu等(2014)和閆國利等(2016)認為漢語閱讀過程中,讀者并不以固定的單位進行加工,而是綜合運用各種信息,隨時調(diào)整自己的加工單位,以獲取更多的信息。本文研究發(fā)現(xiàn)下列因素對讀者調(diào)整加工單位產(chǎn)生影響。
首先是語素特征對其存在調(diào)節(jié)作用。從前文的討論可以得出,語素位置概率信息幫助讀者劃分單位邊界,如果語素位于詞首的概率更高,則讀者更有可能認為詞匯邊界出現(xiàn)在語素的前面;反之則認為邊界出現(xiàn)在語素的后面。其次,韻律特征也會影響閱讀基本加工單位的大小。本文研究發(fā)現(xiàn),在加工四音節(jié)詞組時,即使存在音節(jié)長度更大的單位,漢語[2+2]的韻律組配模式讓讀者偏好音節(jié)長度為2的詞語。即韻律信息會在一定程度上限制“長詞優(yōu)先”原則的運用,改變基本加工單位的大小。
總的來說,“長詞優(yōu)先”原則、漢語的語素特征、韻律信息和學習者的語言水平均對漢語基本加工單位的大小產(chǎn)生調(diào)節(jié)作用。
6. 結語
本研究采用線上詞匯命名任務,研究語素位置概率和韻律組配模式對詞匯識別和切分的影響,并探究了漢語基本加工單位的大小。結果發(fā)現(xiàn),語素位置概率和[2+2]的韻律組配模式均對母語者和二語者的詞匯識別和切分存在顯著影響。和母語者相比,二語者產(chǎn)出更多的單音節(jié)詞和雙音節(jié)詞,加工單位長度小于母語者,這可能是由于二語者的知覺廣度范圍比母語者較窄導致的。漢語的基本加工單位大小基本遵循“長詞優(yōu)先”原則,但同時,語素特征、韻律特征、語言水平等會影響基本加工單位的大小。
基于上述研究結論,本文對漢語作為二語教學提出以下的建議:
第一,以語素為基礎的詞匯教學值得重視,同時需要拓展和擴充語素教學的內(nèi)容。以往語素教學可能多集中在整詞拆分后各語素的意義上,但本文發(fā)現(xiàn)語素的位置信息在漢語閱讀中也非常重要。在給漢語二語者拓展某一語素的詞族(word family)時,可以引導學習者關注語素所在位置的分布情況,即傾向詞首位置或詞尾位置。
第二,要強化韻律教學,在課堂上針對漢語的韻律模式進行訓練。無論是在口語表達還是書面語表達上,引導二語者重視音節(jié)數(shù)量上的組配形式,如四音節(jié)詞組中的[2+2]形式、偏正式三音節(jié)詞的[2+1]形式、動賓式三音節(jié)詞的[1+2]形式等。同時馮勝利(2006)指出漢語書面語中“話要典雅必雙”,要強化學習者的語體意識,引導其注意在漢語書面語中的雙音節(jié)傾向。
[參考文獻]
陳 琳,翁斐斐,夏天生 2016 語素位置對中級漢語學習者并列式復合詞識別的影響[J]. 心理學探新(4).
段力令 2016 蒙古族大學生蒙古語和漢語閱讀知覺廣度的眼動研究[D].西北民族大學碩士論文.
馮勝利 2002 漢語的韻律、詞法與句法[M].北京:北京大學出版社.
伏 干 2012 材料難易度對漢語閱讀活動影響的眼動研究[J]. 心理研究(5).
高 淇 2018 詞素位置概率在句子閱讀及詞匯命名中作用的研究[D].天津師范大學碩士論文.
洪 煒,馮 聰 2010 漢語二語學習者與漢語母語者的雙字合成詞識別過程差異研究[J].現(xiàn)代外語(4).
梁菲菲 2015 新詞學習中詞切分線索的運用:詞素位置概率[R].第十八屆全國心理學學術會議摘要集——心理學與社會發(fā)展(天津)(10).
呂叔湘 1963 現(xiàn)代漢語單雙音節(jié)問題初探[J].中國語文(1).
王洪君 2005 普通話節(jié)律與句法語用關聯(lián)之再探[R].全國人機語音通訊學術會議(北京)(10).
邢濱鈺,江 新 2018語素位置信息對漢語二語學習者閱讀影響的眼動研究[R]. 第二十一屆全國心理學學術會議(北京)(11).
荀恩東,饒高琦,肖曉悅,臧嬌嬌 2016 大數(shù)據(jù)背景下BCC語料庫的研制[J].語料庫語言學(1).
閆國利,伏 干,白學軍 2008 不同難度閱讀材料對閱讀知覺廣度影響的眼動研究[J]. 心理科學(6).
閆國利,何立媛,宋子明 2016 中文閱讀的基本信息加工單元初探[J]. 心理與行為研究(1).
楊 朔 2019 新疆維吾爾族學生漢語學習的問題及教育建議[D].天津師范大學碩士論文.
于 澤,韓玉昌 2011 書面韻律邊界與語境對歧義句歧義消解的影響[J]. 心理科學(6).
張 輝,孫和濤,顧介鑫 2012 非成語四字格詞組加工中韻律與句法互動的ERP研究——熟語表征和理解的認知研究之六[J]. 外語與外語教學(6).
——— 2013 成語加工中韻律與句法互動的事件相關電位研究[J]. 外國語(1).
周有光 1961 漢字改革概論[M]. 北京:文字改革出版社.
Bertram, R., A. Pollatsek & J. Hy?n? 2004 Morphological parsing and the use of segmentation cues in reading Finnish compounds[J]. Journal of Memory and Language (3).
Yuanren, Z. 1975/2006 Rhythm and structure in Chinese word conceptions[A]. 原載臺灣大學考古人類學刊,中譯文收錄于趙元任語言學論文集[C].北京: 商務印書館.
Inhoff, A. W. & W. Caili 2005 Eye movements and the identification of spatially ambiguous words during Chinese sentence reading[J]. Memory & Cognition (8).
Kasisopa, B., R. G. Reilly, S. Luksaneeyanawin & D. Burnham 2013 Eye movements while reading an unspaced writing system: The case of Thai[J]. Vision research (86).
——— 2016 Child readerseye movements in reading Thai[J]. Vision Research (123).
Li, X., K. Rayner & K. R. Cave 2009 On the segmentation of Chinese words during reading[J]. Cognitive Psychology (4).
Liang, F., H. I. Blythe, X. Bai, G. Yan, C. Zang & S. Liversedge 2017 The role of character positional frequency on Chinese word learning during natural reading[J]. Plos One (11).
Liu Y., E. D. Reichle & L. Xingshan 2014 Parafoveal processing affects outgoing saccade length during the reading of Chinese[J]. Journal of Experimental Psychology: Learning, Memory, and Cognition(4).
Ma G., X. Li, & K. Rayner 2014 Word segmentation of overlapping ambiguous strings during Chinese reading[J]. Journal of Experimental Psychology-Human Perception and Performance (3).
Perfetti, C. A. & T. Lihai 1999 The constituency model of Chinese word identification[A]. In J. Wang & A. W. Inhoff (eds.), Reading Chinese script: A cognitive analysis[C]. Hillsdale, NJ: Lawrence Erlbaum Associates.
Ren, G., & Y. Yang 2010 Syntactic boundaries and comma placement during silent reading of Chinese text: Evidence from eye movements[J]. Journal of Research in Reading (2).
Sainio, M., J. Hy?n?, K. Bingushi & R. Bertram 2007 The role of interword spacing in reading Japanese: An eye movement study[J]. Vision Research (20).
Wagner, M. & D. G. Watson 2010 Experimental and theoretical advances in prosody: A review[J]. Language & Cognitive Processes (7-9).
Yen, M. H., R. Radach, J. L. Tzeng & J. L. 2012 Tsai Usage of statistical cues for word boundary in reading Chinese sentences[J]. Reading & Writing (5).
Zang, L., W. Y. Bai, X. G. Yan, D. Drieghe & S. Liversedge 2015 The use of probabilistic lexicality cues for word segmentation in Chinese reading[J]. Quarterly Journal of Experimental Psychology (3).
Zhou, J., G. Ma, M. Taft & X. Li 2018 The time course of incremental word processing during Chinese reading[J]. Reading & Writing (3).
Effects of prosodic patterns and the morpheme position probability on word segmentation and recognition in overlapping ambiguous ?strings by learners of Chinese
LU Shiyi1.2,HUANG Yun2
(1. School of liberal Arts, Guangxi University, Nanning, Guangxi 530004, China; 2. School of Chinese as
Second Language, Peking University, Beijing 100871, China)
Key words: word segmentation; prosodic pattern; morpheme position probability; basic processing unit
Abstract: There is an ongoing debate on how readers segment and recognize words during Chinese text reading and what the basic processing unit is. This study explores the impacts of prosodic pattern and morpheme position probability on readers word segmentation and recognition, and discusses the size of basic processing units. Using online word naming tasks, ambiguous three-character strings ABC and four-character strings ABCD are briefly shown to native Chinese speakers and learners of Chinese. We conclude that prosodic factors and the morpheme position probability significantly affect Chinese word segmentation and recognition. Importantly, the biggest difference between native Chinese speakers and learners of Chinese is that the basic processing unit of learners Chinese is shorter than that of native speakers, which is probably due to the narrower perceptual span of Chinese learners. Moreover, the size of basic processing unit in Chinese reading generally follows the principle that long words get priority, and prosody features, morpheme features and language ability will affect the size of the basic processing unit as well.
【責任編輯 匡小榮】