王淑華 朱伊苓
摘? 要:以99篇韓國漢語學習者的新HSK5看圖寫作文本為研究對象,從詞匯和語法兩個維度,設立7個特征項、33個區(qū)別性指標,考察不同指標與寫作文本質量的相關性。研究顯示,詞匯維度、語法維度均有多個指標與看圖寫作文本質量強相關或中度相關。使用語法維度指標建立的方程解釋力優(yōu)于詞匯維度建立的方程;結合詞匯和語法維度建立的方程雖然解釋力更強,但使用的預測變量較多,操作難度增加。
關鍵詞:韓國漢語學習者;看圖寫作;質量評估;詞匯維度;語法維度;預測方程
在第二語言能力評估中,聽和讀的評估可以通過選擇、判斷、填空等客觀性試題來進行,但說和寫的評估一般只能通過主觀性試題來完成。因此,近些年來,關于口語和寫作能力的評估在第二語言能力評估研究中逐漸成為熱點話題[1]-[5]。由于評估者個人的興趣、情緒、意志以及光環(huán)效應、位置效應等,均會引起評分誤差,學界雖然盡力使用各種手段來提高評分者信度,如規(guī)定標準化評分細則、對評分員進行崗前培訓、配備評分仲裁等,但人工評估的客觀性和準確性仍一直飽受爭議,因此,學界在多年前就開始了對機器自動評估的探索[6]-[8]。機器自動評估技術的發(fā)展,主要是依賴于口語測試、寫作測試中各項區(qū)別性特征的正確選擇和不同特征的權重設置[9]-[12]。這些探索為漢語二語能力評估研究作出了很大貢獻,但仍有一些問題值得繼續(xù)深入探討。
就漢語寫作質量評估來說,前人多單獨考察詞匯維度或語法維度對寫作質量的影響,綜合考察兩個維度的研究較少;同時,前人考察的文本或來自于老HSK,或是自建語料庫,對新HSK的寫作文本關注不夠。實際上,不同長度、任務的寫作文本,其質量評估因素也有一定差異。有鑒于此,本文擬從詞匯和語法兩個維度出發(fā),對韓國漢語學習者的寫作質量進行綜合考察,以期能為漢語作為第二語言的寫作教學和質量評估工作提供參考。
一、研究問題和語料選取
本文以韓國漢語學習者的新HSK5看圖寫作文本為研究對象,在Read的詞匯豐富性框架[11]和Wolfe- Quintero等學者的CAF框架[13]指導下,從詞匯和語法兩個維度,考察不同區(qū)別性指標與寫作質量的相關性,并結合詞匯和語法維度的指標,建立看圖寫作自動評分方程。
(一)研究問題
本文所探討的問題主要包括三個方面:
1.詞匯維度和語法維度的不同區(qū)別性指標,與看圖寫作文本質量的相關性如何?
2.詞匯和語法維度具體有哪些區(qū)別性指標,它們以何種方式預測看圖寫作文本的質量?
3.影響新HSK5看圖寫作文本質量和影響漢語其他類型寫作任務質量的因素有何不同?
(二)語料選取
為了較為全面地考察學習者的寫作質量,我們首先選擇了3幅在場景、人物、行為等方面具有較大差異的圖片作為考察范圍,其整卷編號分別為H51445、H51552、H51560。然后再依據成績,將文本分為高(24—30分)、中(18—23分)、低(12—17)三個組別。需要說明的是,由于得分低于11分的作文錯誤較多,研究價值較低,因此,未納入本文的研究范圍。最后,每組選定33篇、一共99篇文本作為本文的具體考察對象。3幅圖片分別如圖1、圖2、圖3所示:
二、詞匯、語法維度的區(qū)別性指標
與寫作質量的相關性
一般認為,寫作質量評估主要涉及語言表現(xiàn)和內容質量兩個方面??紤]到內容質量方面的標準較難實現(xiàn)客觀化且不易操作,在二語寫作中尤其是篇幅較短的情況下,考察點大多集中在學生是否能使用規(guī)范的目的語,而立意構思和謀篇布局更多是母語寫作中的考察點[14]。也有學者將漢字正確性作為一個獨立維度,考慮到機考在不斷普及且在漢字正確方面的表現(xiàn)優(yōu)于紙筆考,故本文未將漢字正確性作為獨立指標。因此,本文僅從詞匯和語法兩個維度來考察其區(qū)別性指標與寫作文本質量之間的相關性。
(一)詞匯維度區(qū)別性指標與寫作質量的相關性
Read的詞匯豐富性框架包括5個特征:詞匯多樣性、詞匯復雜性、詞頻概貌、詞匯錯誤和詞匯密度,其中,詞匯密度不太適合考察寫作質量,故本文不把這一指標列入考察范圍。本文中的詞匯多樣性包括實詞數(總詞數減去副詞、介詞、連詞、助詞、嘆詞、擬聲詞后的數量)、詞種數、自然文本長度TTR(Type-Token Ratio)、控制文本長度TTR等4個指標①。詞匯復雜性包括復雜詞數和占比、復雜詞種數和占比等4個指標,這里的復雜詞語是指新HSK詞匯大綱5級詞語以外的詞語,即6級詞和超綱詞。詞頻概貌包括常用詞數和占比、次常用詞數和占比、非常用詞數和占比等6個指標,這里的常用詞是指新HSK詞匯大綱中的1—2級詞,次常用詞是指大綱中的3—4級詞,非常用詞是指大綱中的5—6級詞和超綱詞。詞匯錯誤包括詞語混用數和占比、生造詞數和占比等4個指標。
1.詞匯多樣性與寫作質量的相關性
我們對韓國漢語學習者看圖寫作文本的詞匯多樣性進行了歸納、統(tǒng)計,具體如表1所示:
從表1可以看出,從低分組到中分組,實詞數和詞種數分別增加了340個和246個,增幅分別為33.1%和25.1%;從中分組到高分組,實詞數和詞種數分別增加了83個和159個,增幅分別為6.1%和13.0%。低分組到中分組的增幅明顯高于中分組到高分組的增幅。從低分組到高分組,實詞數、詞種數、控制文本長度TTR均與文本成績成正比,但自然文本長度TTR呈“U”型,中分組最低,低分組略高于高分組。
我們使用spss25.0來計算看圖寫作文本質量與以上4個指標之間的Spearman相關系數。其中,|0.8|≤r<|1.0|為非常強的相關,|0.6|≤r<|0.8|為強相關,|0.4|≤r<|0.6|為中度相關,|0.2|≤r<|0.4|為弱相關,r<|0.2|為不相關。統(tǒng)計結果顯示,看圖寫作文本質量與詞種數(r=0.619,p<0.01)強相關,與實詞數(r=0.499,p<0.01)中度相關,與控制文本長度TTR(r=0.394,p<0.01)弱相關,與自然文本長度TTR(r=-0.061,p=0.546>0.05)不相關。詞匯多樣性主要反映了詞匯使用的廣度,詞種數越多,詞匯量越大;實詞數越多,文本信息越豐富。
2.詞匯復雜性與寫作質量的相關性
我們對韓國漢語學習者看圖寫作文本的詞匯復雜性進行了歸納、統(tǒng)計,具體如表2所示:
從表2可以看出,復雜詞數、復雜詞占比、復雜詞種數、復雜詞種占比等4個指標,均與文本成績成正比。低分組復雜詞數和復雜詞種數之間的差別遠高于中分組和高分組的對應差別,這主要是因為低分組的學習者詞匯量較小,同一個詞常常多次使用造成的。從低分組到高分組,復雜詞數、詞種數均有較大幅度的增長,其中,低分組到中分組的增幅分別為70.8%、129.2%,中分組到高分組的增幅分別為58.5%、53.9%。
進一步的統(tǒng)計顯示,看圖寫作文本質量與復雜詞數(r=.574,p<.01)、復雜詞種數(r=.571,p<.01)為中度相關,與復雜詞占比(r=.278,p<.01)和復雜詞種占比(r=.356,p<.01)為弱相關。這說明,隨著學習者漢語水平的提高,詞匯量也逐漸增大,他們對復雜詞的使用也越發(fā)嫻熟。
3.詞頻概貌與寫作質量的相關性
我們對韓國漢語學習者看圖寫作文本的詞頻概貌進行了歸納、統(tǒng)計,具體如表3所示:
一般來說,寫作水平從低到高,常用詞的使用應該呈遞減狀態(tài),次常用詞、非常用詞的使用呈遞增狀態(tài)。但從表3可以看出,不同組別的詞頻概貌呈現(xiàn)出比較復雜的情況。在常用詞的使用方面,中分組的常用詞總數和占比均為最高,但低分組比例和中分組差別不大;次常用詞的數量雖然從低分組到高分組逐漸遞增,但其占比呈U型;非常用詞的使用和文本質量呈正比,從低分組到高分組逐漸遞增。從總體上來說,低分組和中分組的詞頻概貌較為接近,中分組和高分組之間的差距遠大于它與低分組的差距。
進一步的統(tǒng)計顯示,次常用詞數(r=.547,p<.01)和非常用詞數(r=.574,p<.01),均與文本質量中度相關;常用詞數(r=.265,p<.01)、常用詞占比(r=-.277,p<.01)、次常用詞占比(r=.211,p<.05)和非常用詞占比(r=.285,p<.01),均與文本質量弱相關。這說明,盡量使用更多的次常用詞和非常用詞,有助于提升寫作文本的質量。
4.詞匯錯誤與寫作質量的相關性
我們對韓國漢語學習者看圖寫作文本中的詞匯錯誤進行了歸納、統(tǒng)計,具體如表4所示:
從表4可以看出,就不同組別來說,低分組最明顯的錯誤是生造詞,而中分組和高分組最明顯的錯誤是詞語混用。就詞語混用來說,從低分組到中分組,數量有一定增加;但從中分組到高分組,降幅明顯。就生造詞來說,其數量和占比均與文本質量高低呈反比關系,從低分組到中分組再到高分組,降幅明顯。
進一步的統(tǒng)計發(fā)現(xiàn),生造詞數(r=-.544,p<.01)和生造詞占比(r=-.584,p<.01)與文本質量中度負相關,混用數(r=-.282,p<.01)和混用占比(r=-.371,p<.01)與文本質量弱負相關。這說明,生造詞的錯誤會隨著寫作水平的提高而逐漸減少,但詞語混用是寫作中一個需要長期關注的問題,易混淆詞語的辨析在相當長的時間內都會是教學的重點與難點。
(二)語法維度區(qū)別性特征與寫作質量的相關性
Wolfe-Quintero等學者的CAF框架包括文本復雜性(Complexity)、準確性(Accuracy)和流利性(Fluency)三個指標。本文中的句法復雜性包括復句數量和占比、特殊句式數量和占比、平均句長、T單位平均小句數等6個指標。其中,特殊句式包括“把”字句、被動句、雙賓句、連動句、比較句、兼語句、“是……的”強調句、“得”字句、存現(xiàn)句、主謂謂語句等10種,同一小句出現(xiàn)兩種句式特征則統(tǒng)計兩次。特殊句式占比的計算方法是特殊句式數除以所有小句數。平均句長是指文章總字數除以小句數。T單位的計算采用安福勇的方法[3],單句算作一個T單位;聯(lián)合復句分句間沒有主從關系,地位平等,因此,各算一個T單位;偏正復句有一個分句承擔主要信息,另一個分句為補充,所以算一個T單位。T單位平均小句數的計算方法是小句總數除以T單位總數。準確性包括虛詞錯誤數、有誤特殊句式數、有誤句子數、有誤句子占比等4個指標。流利性包括總句數、總字數四次方根[15]、T單位平均長度(總字數除以T單位的個數)、無誤T單位(沒有任何詞匯或語法方面錯誤)個數和占比等5個指標①。
1.句法復雜性與寫作質量的相關性
我們對韓國漢語學習者看圖寫作文本的句法復雜性進行了歸納、統(tǒng)計,具體如表5所示:
從表5可以看出,句法復雜性特征下的6個指標,均與文本質量呈正比關系。從低分組到中分組,復句和特殊句式數量增幅分別為51.9%、147.8%,平均句長增幅為33.6%,T單位平均分句數增幅為12.0%。從中分組到高分組,復句和特殊句式數量增幅分別為25.3%、29.8%,平均句長增幅為25.6%,T單位平均分句數增幅為3.5%。可見,低分組和中分組之間的差距要大于中分組和高分組之間的差距。
進一步的統(tǒng)計表明,特殊句式數量(r=.603,p<.01)和文本質量強相關,復句數量(r=.538,p<.01)、平均句長(r=.590,p<.01)、復句占比(r=.485,p<.01)、特殊句式占比(r=.471,p<.05),均與文本質量中度相關;T單位平均分句數(r=.294,p<.01)與文本質量弱相關。這說明,在寫作中增加句子長度、較多使用特殊句式和復句,有助于提升文本質量。
2.句法準確性與寫作質量的相關性
句法準確性這一特征,這里主要是通過句法錯誤來描述。也就是說,錯誤越少,準確性越高,文本質量相應也越高。我們對韓國學習者看圖寫作文本中的句法錯誤進行了歸納、統(tǒng)計,具體如表6所示:
從表6可以看出,除了有誤特殊句式數這一指標是中分組數值最高外,其余3個指標即虛詞錯誤數、有誤句子結構數、有誤句子結構占比,均與文本質量呈反比關系。相對而言,中分組在句法準確性方面的表現(xiàn)更接近于低分組,從低分組到中分組的變化幅度遠遠小于從中分組到高分組的變化幅度。
進一步的統(tǒng)計表明,句法準確性特征下有誤句子結構的占比(r=-.444,p<.01)和文本質量中度負相關,虛詞錯誤(r=-.201,p<.05)、有誤句子結構的數量(r=-.320,p<.01)和文本質量是弱負相關,有誤特殊句式數(r=-.161,p>.05)和文本質量無關??梢?,相對而言,評分者對虛詞和特殊句式使用錯誤的容忍度,要高于普通句子發(fā)生錯誤的容忍度。
3.句子流利性與寫作質量的相關性
我們對韓國漢語學習者看圖寫作文本的句子流利性進行了歸納、統(tǒng)計,具體如表7所示:
從表7可以看出,除了總句數這一指標呈拋物線形態(tài)(高分組最低、中分組最高)外,其他各項指標均與文本質量呈正比關系。進一步的統(tǒng)計表明,句子流利性特征中與看圖文本質量達到強相關的指標有總字數四次方根(r=.664,p<.01)、無誤T單位個數(r=.643,p<.01)和無誤T單位個數占比(r=.679,p<.01),平均T單位長度與文本質量中度相關(r=.447,p<.01),總句數(r=-.0.043,p>0.05)和文本質量不相關。也就是說,對學習者而言,文章篇幅長一些,多用長句,句子結構正確,有利于取得更好的成績。
三、不同維度下看圖寫作文本質量的
評估方程
為了進一步了解詞匯維度和語法維度下不同區(qū)別性指標對新HSK5看圖寫作文本質量的影響,我們在回歸分析的基礎上,分別從詞匯維度、語法維度、詞匯和語法相結合的維度,建立了3個看圖寫作文本質量的評估方程。
(一)詞匯維度下看圖寫作文本質量的評估方程
我們將詞匯豐富性框架中的4個特征、20個區(qū)別性指標設為參數項,進行回歸分析,并建立模型。具體數據如表8所示:
在表8中,a.預測變量:(常量),詞種數;b.預測變量:(常量),詞種數,生造詞占比;c.預測變量:(常量),詞種數,生造詞占比,次常用詞數;d.預測變量:(常量),詞種數,生造詞占比,次常用詞數,復雜詞數;e.預測變量:(常量),詞種數,生造詞占比,次常用詞數,復雜詞數,常用詞數;f.預測變量:(常量),生造詞占比,次常用詞數,復雜詞數,常用詞數。統(tǒng)計顯示,在多元線性回歸分析中,生造詞占比、次常用詞數、復雜詞數和常用詞數4個參項進入回歸模型,聯(lián)合復相關系數為R=0.791,四者聯(lián)合的R2決定系數為0.626,即可以聯(lián)合解釋作文成績62.6%的方差,模型對數據的擬合情況較好。
我們又進行了自變量回歸系數的顯著性t檢驗,具體數據如表9所示:
從表9可以看出,生造詞占比、次常用詞數、復雜詞數和常用詞數均為有效預測參項,可以據此建立方程:
寫作成績=11.266+0.111×常用詞數+0.339×復雜詞數+0.342×次常用詞數-38.633×生造詞占比
以上四者的標準化回歸系數由大到小為:0.355>|-0.345|>0.334>0.314,即次常用詞數>生造詞占比>復雜詞數>常用詞數。這說明,次常用詞數對寫作成績的影響最大,其次是生造詞占比和復雜詞數,常用詞數影響最小。
(二)語法維度下看圖寫作文本質量的評估方程
考慮到無誤T單位的確定同時也涉及詞匯錯誤的指標,為了使語法維度建立的預測方程指標更為純粹,我們將這兩個指標予以剔除。然后,將剩下的13個指標設為參項進行回歸分析,并建立模型。具體數據如表10所示:
在表10中,a.預測變量:(常量),總字數四次方根;b.預測變量:(常量),總字數四次根,特殊句式占比;c.預測變量:(常量),總字數四次方根,特殊句式占比,總句數;d.預測變量:(常量),總字數四次方根,特殊句式占比,總句數,有誤句子數。統(tǒng)計顯示,總字數四次根、特殊句式占比、總句數、有誤句子數4個參項進入回歸模型,聯(lián)合復相關系數為0.670,即可以聯(lián)合解釋作文成績67%的方差,模型擬合情況較好。
我們又進行了自變量回歸系數的顯著性t檢驗,具體數據如表11所示:
從表11可以看出,總字數四次方根、特殊句式占比、總句數、有誤句子數等均為有效預測參項,可以據此建立方程:
寫作成績=-22.218+14.506×總字數四次方根+7.248×特殊句式占比-0.549×總句數-0.455×有誤句子數
四者的標準化回歸系數由大到小依次為:0.757>0.251>|-0.229|>|-0.129|,即總字數四次方根>特殊句式占比>總句數>有誤句子數。這說明,總字數四次方根對寫作成績的影響最大,其次是特殊句式占比和總句數,有誤句子數影響最小。
(三)結合詞匯和語法維度建立的看圖寫作文本質量評估方程
按照上述程序,我們將詞匯和語法維度下的33個指標設為參數項,進行回歸分析并建立模型,得出方程如下:
寫作成績=-16.635+11.441×總字數四次方根+3.221×特殊句式占比+0.222×次常用詞數-27.654×生造詞占比-0.696×虛詞錯誤數+4.944×復句占比-0.443×有誤句子數-復句數×0.862
這個方程結合了詞匯和語法兩個維度,一共有8個指標項進入了回歸模型。其中,詞匯維度有3個區(qū)別性指標,語法維度有5個區(qū)別性指標。這幾個指標與前文僅僅依據詞匯維度和語法維度進入模型的指標略有不同,主要是因為詞匯維度和語法維度中有些指標之間互相關聯(lián)。這8個指標項的聯(lián)合復相關系數為0.768,即可以解釋作文成績76.8%的方差。這一方程的解釋力要優(yōu)于單用詞匯維度或語法維度建立的方程,但是由于進入模型的指標項較多,進行評估時相應地需要進行更多的前期準備。
需要指出的是,除了詞匯和語法維度的指標外,寫作文本的內容質量、上下文的連貫性和邏輯性、標點符號的使用等其他因素,也會對寫作文本的質量產生一定影響。
四、討論與建議
本文的研究語料來自新HSK5看圖寫作文本,在寫作任務、文本長度和具體要求等方面,和漢語作為第二語言的其他寫作任務體現(xiàn)出一定的差異。下面,我們就以本文的研究結果為基礎,結合其他學者的相關研究,探討影響寫作文本質量評估的指標和不同方程對寫作文本質量的解釋度問題,并針對韓國漢語學習者的寫作,提出一些切實可行的建議。
(一)影響寫作文本質量評估的指標
通過上文的分析,可以發(fā)現(xiàn),在詞匯維度的4個特征18個指標中,有17個指標與看圖寫作成績呈現(xiàn)出強弱不同的相關性。相關系數較高的6個指標項分別是:詞種數、生造詞占比、非常用詞數、次常用詞數、復雜詞數和生造詞數。結合王藝璇的相關研究[11],我們發(fā)現(xiàn),寫作文本體裁、題材、長度和任務不同,影響寫作質量的詞匯因素也有一定差異。
就詞匯多樣性特征而言,兩項研究中,寫作成績與各因素的相關性序列趨勢基本相同,詞種數是與寫作文本相關性最高的指標,實詞數/詞數居于第二位,自然文本長度TTR與文本質量不相關。
就詞匯復雜性特征而言,在王文中,復雜詞種數和占比均優(yōu)于復雜詞數和占比的相關性;我們統(tǒng)計的結果是,復雜詞和詞種數量與寫作質量的相關性均優(yōu)于復雜詞和詞種的占比,這應該與看圖寫作文本普遍較短有關。
就詞頻概貌特征而言,表面上看兩個統(tǒng)計相關性指標有較大不同。王文的統(tǒng)計結果顯示,無論是詞形數還是詞種數,均是最常用詞與寫作文本的相關性最高,為負相關,最常用詞用得越多,文本質量越低。本文的統(tǒng)計結果是,次常用詞數和非常用詞數相關性最高,為正相關,這兩類詞用得越多,文本質量越高。這個結論,一方面,反映了硬幣的正反兩面,在文本中,常用詞使用越多,相對而言,次常用詞和非常用詞則使用越少;另一方面,也與兩篇論文的詞頻等級分類標準不同有較大關系,新HSK詞表不僅數量較少,而且難度較低,它的次常用詞、非常用詞有較多屬于王文中的最常用詞、常用詞或次常用詞等級。
就詞匯錯誤特征而言,王文發(fā)現(xiàn),詞匯錯誤占比與寫作成績的相關性高于詞匯錯誤數量,但未討論每種錯誤與寫作成績的相關性;我們發(fā)現(xiàn),詞匯錯誤中,生造詞占比、生造詞數與寫作質量相關性最高。此外,王文統(tǒng)計的指標相關系數明顯高于我們的統(tǒng)計結果,這可能與其樣本量更大、文本更長有一定的關系。
在語法維度的3個特征15個指標中,有13個指標與寫作文本質量呈現(xiàn)出強弱不同的相關性。強相關因素有4個,分別是無誤T單位占比、總字數四次方根、無誤T單位個數、特殊句式數量。其中,有3個指標都居于流利性特征之下,并且2個指標均與無誤T單位有關,這說明能夠正確地輸出T單位是寫作水平較高的主要標志??紤]到T單位測量框架內的指標實際上是兼顧了復雜性和正確性的復合型指標,因此,它和寫作質量相關性比較強是可以預見的結果。特殊句式數量指標為本文首次單獨設立,它和寫作文本質量也是強相關的關系。吳繼峰等學者曾以語言特征和內容質量為測量維度,對韓語母語者漢語二語寫作質量進行了評估研究,該研究顯示,語法正確性和句法復雜性均與寫作成績相關,相關系數分別為0.439和0.415[5]。我們的研究結果和吳繼峰等學者的研究結果大體一致。
(二)不同方程對寫作文本質量的解釋度
如前所述,我們分別從詞匯維度、語法維度、詞匯和語法相結合的維度出發(fā),構建了三個質量評估方程,以預測看圖寫作文本的質量。通過對這三個方程以及與其他學者所建立的方程的比較,我們得出三點結論:
第一,就單個維度來說,語法維度的方程優(yōu)于詞匯維度的方程。詞匯維度使用4個預測指標,可以解釋寫作成績總變異的62.6%;語法維度同樣使用4個指標,卻可以解釋寫作成績總變異的67%。這是因為詞匯和語法常常界限模糊,難以截然分開。如HSK語法大綱中的部分條目其實就是屬于詞匯范圍的;同時,由于一個句子是由多個詞語按照特定的規(guī)則組合生成的,所以語法維度中的無誤T單位這一指標,實際上同時反映了學習者正確選用詞語和組合詞語的能力。語法維度主要是綜合能力的考察,因此,根據其區(qū)別性指標建立的方程自然要優(yōu)于詞匯維度建立的方程。
第二,在可操作性和使用便利度方面,三個方程體現(xiàn)出一定的差異性。結合詞匯和語法維度所建立的方程,雖然解釋力明顯高于僅僅依據詞匯或語法單一維度建立的方程,但后兩者使用的指標數量較少,相對來說,具有更強的可操作性。在計算機自動評分時,可以根據實際情況的需要,在評分的有效性和操作的便利性之間進行權衡。
第三,本研究根據詞匯維度建立的方程解釋力,跟王藝璇構建的方程有較大差別[11]。王文認為,詞種數、詞匯錯誤比重、常用詞數三者聯(lián)合的R2,可以解釋作文成績92.8%的方差。我們對此持懷疑態(tài)度,因為即使一篇作文在這3個指標上表現(xiàn)良好,但如果偏離主題或邏輯性不強,也很難得到高分。決定寫作質量的除了詞匯方面的指標之外,還有語法表現(xiàn)、內容質量和標點符號的使用等因素。雖然我們與吳繼峰等學者的考察對象不同[5]、[12],具體指標設置和計算方法也有一定差異,但在研究結果方面,表現(xiàn)出較強的一致性。
(三)面向韓國漢語學習者的寫作建議
從上文的分析可以看出,低分組的學習者由于詞匯量有限,導致寫作中出現(xiàn)詞種總數較少而生造詞較多的現(xiàn)象,生造詞和句子結構雜糅是造成作文得分較低的主要原因。因此,學習者除了努力擴大詞匯量、提升正確運用詞匯的能力以外,還需要將句子寫長,并有意識地使用特殊句式,提高語法的復雜度。
中分組的學習者文章篇幅基本達標,有明確的使用復雜詞和特殊句式的意識,但語法錯誤較多,這是被高分組拉開差距的主要原因。這一水平的學習者,應該有意識地加強復雜詞語和特殊句式的使用,并通過多種途徑提高正確率,盡量減少語法錯誤。
高分組的學習者在詞匯使用的廣度和深度方面表現(xiàn)良好,會使用多種類型的復句,特殊句式使用的準確率也較高,其錯誤主要集中在詞語混用方面。這說明對學習者而言,掌握了基本的語法規(guī)則以后,詞匯學習仍然任重道遠。
(本文在撰寫時曾得到漢考國際教育科技[北京]有限公司的數據支持,謹致謝忱?。?/p>
參考文獻:
[1]翟艷.漢語口語成績測試評估標準[J].華文教學與研究, 2012,(1).
[2]Jiang,Wenying.Measurements of development in L2 written production:The case of L2 Chinese[J].Applied Linguistics,2013,(1).
[3]安福勇.不同水平CSL學習者作文流暢性、句法復雜度和準確性分析——一項基于T單位測量法的研究[J].語言教學與研究,2015,(3).
[4]金檀,劉力,郭凱.口語測試評分標準研究與實踐三十年[J].現(xiàn)代外語,2016,(6).
[5]吳繼峰,周蔚,盧達威.韓語母語者漢語二語寫作質量評估研究——以語言特征和內容質量為測量維度[J].世界漢語教學,2019,(1).
[6]李亞男.漢語作為第二語言測試的作文自動評分研究[D].北京:北京語言大學碩士學位論文,2006.
[7]梁茂成.中國學生英語作文自動評分模型的構建[D].南京:南京大學博士學位論文,2005.
[8]徐昌火,陳東,吳倩,謝沚藍.漢語作為第二語言作文自動評分研究初探[J].國際漢語教學研究,2015,(1).
[9]王佶旻.三類口語考試題型的評分研究[J].世界漢語教學,2002,(4).
[10]陳默,李侑璟.韓語母語者漢語口語復雜度研究[J].語言文字應用,2016,(4).
[11]王藝璇.漢語二語者詞匯豐富性與寫作成績的相關性——兼論測量寫作質量的多元線性回歸模型及方程[J].語言文字應用,2017,(2).
[12]吳繼峰.韓語母語者漢語書面語句法復雜性測量指標及與寫作質量關系研究[J].語言科學,2018,(5).
[13]Wolfe-Quintero,K.,Inagaki,S.& Kim,H.-Y.Second language development in Writing:Measures of fluency, accuracy and complexity[M].Honolulu:University of Hawai‘i Press,1998.
[14]陳賢純.對外漢語教學寫作課初探[J].語言教學與研究,2003,(5).
[15]陳東.基于文本特征提取的漢語L2作文電子評分系統(tǒng)初探[D].南京:南京大學碩士學位論文,2013.
A Study on the Quality Assessment of the Korean Chinese-Learners Writing
——A Discussion Based on the Writing Texts of Picture-Reading-and-Writing in New HSK5
Wang Shuhua1,Zhu Yiling2
(1.College of Liberal Arts, Shanghai University, Shanghai 200444;
2.English Teaching and Research Group, Seven-Color Flower Elementary School, Shanghai 200020, China)
Abstract:This paper takes Korean Chinese-learners 99 writing texts of Picture-Reading-and-Writing in new HSK5 as the research object. It sets up 7 characteristic items and 33 distinguishing indicators from the two dimensions to examine the correlations between these indicators and the quality of the writing texts. The study show that multiple indicators of both the vocabulary dimension and the grammar dimension are strongly or moderately related to the quality of the writing texts. The explanatory power of the equation established using the grammar dimension indicators is better than that of the equation established using the vocabulary dimension indicators. Although the equations built combining the vocabulary and grammatical dimensions have stronger explanatory power, more predictive variables are used and thus the difficulty of operation is increased.
Key words:Korean Chinese-learners;Picture-Reading-and-Writing;quality assessment;vocabulary dimension;grammar dimension;prediction equation
基金項目:國家社會科學基金項目“英語和漢語作為外語的綜合性寫作測評研究”(17BYY108)
作者簡介:1.王淑華,女,上海大學文學院副教授,文學博士;
2.朱伊苓,女,上海七色花小學英語教研組小教二級,教育學碩士。
①Read采用TTR來計算詞匯多樣性,計算方法是文本中詞種數與總詞數之比。一個詞在文本中出現(xiàn)多次僅計為1個詞種,但每次出現(xiàn)均計入詞數。為了減少文本長度的影響,同時考慮到99篇文本中字數最少的1篇為33字,因此,我們將33字設為控制文本長度,其他篇目均從第二個任意標點符號開始截取33個字作為控制文本,這部分文本中的詞種數和總詞數的比例即為控制文本TTR。
①陳東指出,短文長度、短文長度的四次方根和詞類型的數目,是測量語言流利性的3種最普遍的指標;但他采用回歸模型實驗后發(fā)現(xiàn),短文長度的四次方根的指標的預測結果優(yōu)于其他兩項[15]。因此,本文也采用了文本總字數四次方根這個指標。