——以L2SCA和D-level Analyzer為工具"/>
  • 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      中國EFL學(xué)習(xí)者句法復(fù)雜度自動測量研究
      ——以L2SCA和D-level Analyzer為工具

      2016-06-22 07:36:09張麗麗

      張麗麗

      (1.貴州大學(xué) 外國語學(xué)院,貴州 貴陽 550025;2. 浙江大學(xué) 外國語學(xué)院,浙江 杭州 310058)

      中國EFL學(xué)習(xí)者句法復(fù)雜度自動測量研究

      ——以L2SCA和D-level Analyzer為工具

      張麗麗1,2

      (1.貴州大學(xué) 外國語學(xué)院,貴州 貴陽 550025;2. 浙江大學(xué) 外國語學(xué)院,浙江 杭州 310058)

      [摘要]以L2SCA(二語句法復(fù)雜度分析器)和D-level Analyzer(句法發(fā)展水平分析器)為工具,對某省高校間英語寫作競賽作文語料進(jìn)行句法復(fù)雜度的自動測量實驗研究,所測15個指標(biāo)中有4項顯示與作文整體得分相關(guān)。作文句法復(fù)雜度人工分組單因素方差分析發(fā)現(xiàn),議論文10個指標(biāo)、記敘文7個指標(biāo)呈顯著差異,工具對于議論文體裁的測量表現(xiàn)總體優(yōu)于記敘文。研究結(jié)果證實,體裁是影響中國EFL學(xué)習(xí)者句法復(fù)雜度的重要因素。絕大部分指標(biāo)測量值表現(xiàn)為組間線性發(fā)展趨勢,數(shù)據(jù)分析結(jié)果顯示支持L2SCA和D-level Analyzer用作中國EFL學(xué)習(xí)者句法復(fù)雜度自動測量工具。

      [關(guān)鍵詞]句法復(fù)雜度;自動測量;EFL;二語作文

      二語句法復(fù)雜度研究始于20世紀(jì)70年代,至今已積累各種測量指標(biāo)40有余,但由于語料、方法以及指標(biāo)定義差別等原因,有關(guān)各指標(biāo)的測量效度,此前多項研究結(jié)果不一致。進(jìn)入21世紀(jì),國外興起開發(fā)或借助計算工具對大規(guī)模語料進(jìn)行一次性多個指標(biāo)測量的研究,有效避免了上述因素造成的研究結(jié)果不具可比性的問題。相比之下,國內(nèi)相關(guān)研究大都停留在手工測量階段,缺乏采用自動工具的嘗試性研究。

      鑒于此,本文介紹兩種句法復(fù)雜度測量專門工具——L2SCA(L2 syntactic complexity analyzer)和D-level Analyzer①*[收稿日期] 2015-10-25[基金項目] 貴州省教育廳高校人文社科研究項目“大學(xué)英語多媒體教學(xué)策略整合研究”(11ZC037)[作者簡介] 張麗麗(1974- ),女,貴州湄潭人,貴州大學(xué)副教授,浙江大學(xué)博士研究生,研究方向:語料庫語言學(xué)、二語習(xí)得。①兩項測量工具均由美國賓夕法尼亞州立大學(xué)應(yīng)用語言系陸小飛開發(fā)。下載網(wǎng)址:http://www.personal.psu.edu/xxl13/downloads(Syntactic developmental level analyzer),報告其應(yīng)用于某省高校間英語作文競賽語料句法復(fù)雜度測量研究的結(jié)果,希望對國內(nèi)本領(lǐng)域相關(guān)研究發(fā)揮一些拋磚引玉的作用。

      一、研究背景

      句法是決定語言輸出形式的重要方面,是決定語言總體水平和質(zhì)量的基礎(chǔ),一直是二語習(xí)得領(lǐng)域的研究熱點。句法復(fù)雜度,又稱句法復(fù)雜性或句法成熟度,被定義為 “語言產(chǎn)出形式的范圍和形式復(fù)雜化的程度”,[1][2]主要考查句法的變化和結(jié)構(gòu)的復(fù)雜性。[3]

      句法復(fù)雜度指標(biāo)大致可分為兩類,即以T單位*T單位是一個句子能夠被縮減、表達(dá)完整意義的最短單位,包括一個主句及它所附帶的任何從句。最初Hunt(1965)用于研究兒童母語句法復(fù)雜度,后被廣泛用于二語句法復(fù)雜度研究。為代表的表層指標(biāo)和以名詞短語結(jié)構(gòu)為代表的深層指標(biāo)。由于深層指標(biāo)的測量計算不如表層指標(biāo)直觀便捷,研究者們使用的二語常用指標(biāo)以表層指標(biāo)為主,缺乏對深層指標(biāo)的測量研究,對語料整體句法結(jié)構(gòu)等級的量化研究幾近為零。

      目前國外句法復(fù)雜度研究領(lǐng)域興起自動測量研究,并漸成風(fēng)尚。[4][5][6]自動測量克服了以往由于人工和時間成本太高、研究廣度受限的不足,但國內(nèi)相關(guān)研究大都停留在手工測量階段集中于英語專業(yè)學(xué)習(xí)者議論文語料,未見針對中國EFL學(xué)習(xí)者整體、對多種體裁語料進(jìn)行的研究。[2][7][8][9][10][11]

      大數(shù)據(jù)時代,研究者可以輕松建立自己的語料庫,通往國外語料庫也只需幾次鏈接,但材料和工具缺一不可。如今國外學(xué)者紛紛借助計算機(jī)帶來的先進(jìn)研究方法捷足先登,在二語習(xí)得多個研究領(lǐng)域游刃有余,包括句法復(fù)雜度測量研究。國內(nèi)公開發(fā)表的學(xué)術(shù)論文已有利用Coh-Metrix進(jìn)行的研究,但重點都不在句法復(fù)雜度研究。[12][13][14][15]此外,Coh-Metrix是以語篇連貫和詞匯指標(biāo)為主,意在文本易讀性測量,句法復(fù)雜度指標(biāo)主要有句長、主動詞前單詞數(shù)、否定表達(dá)密度和句子句法相似度等??梢姡溟L以外,均非嚴(yán)格意義上的句法復(fù)雜度指標(biāo),因此,不適于用作專門句法復(fù)雜度測量工具。

      除Coh-Metrix以外,可用于句法復(fù)雜度自動測量的工具還有MacWhinney 開發(fā)的CLAN(Computerized Language Analysis Program)[16],Long et al.開發(fā)的Computerized Profiling[17],但句法復(fù)雜度測量在上述工具中都不占主要地位,所以該功能的使用通常較為復(fù)雜。相比之下,L2SCA和D-level Analyzer專注于句法復(fù)雜度測量,近年來在國外相關(guān)研究中表現(xiàn)出色;[4][5][6][18][19][20]國內(nèi)未見運用上述兩種工具開展的相關(guān)研究。

      二、 工具介紹及相關(guān)研究

      (一) L2SCA

      L2SCA是Lu在兩位學(xué)者的研究成果[1][3]基礎(chǔ)上自主開發(fā)的二語句法復(fù)雜度測量工具,集成5類、共14個常用指標(biāo)(見表1)。[5]兩位學(xué)者綜合比較了共40余項二語寫作研究結(jié)果,“盡管已是十年前,但即便今天也足以代表二語或外語研究者們所使用的大部分句法復(fù)雜度測量指標(biāo)”。[21]

      表1 L2SCA所測句法復(fù)雜度指標(biāo)信息

      測量指標(biāo)所涉概念均采用開發(fā)者使用的定義[21],其重要概念簡單介紹如下:

      小句(Clause):任何帶有一個主語和一個限定性謂語動詞的結(jié)構(gòu),包括獨立句,形容詞性、副詞性或名詞性子句,不包括非限定性動詞短語。

      復(fù)雜T單位(Complex T-unit):有一個或多個從句的T單位。

      并列短語(Coordinate phrase):僅限并列形容詞短語、名詞短語或動詞短語。

      復(fù)雜名詞性短語(Complex nominal):被形容詞、物主代詞、介詞詞組、定語從句或分詞所修飾的名詞;帶有同位語的名詞;名詞性小句;充當(dāng)主語的動名詞或不定式。

      動詞短語(Verb phrase):限定性或非限定性動詞短語。

      L2SCA基于Stanford Parser*斯坦福大學(xué)自然語言處理研究所于2003年研制開發(fā)的句法分析器;下載網(wǎng)址:http://nlp.stanford.edu/software/lex-parser.shtml。自動句法標(biāo)注技術(shù),內(nèi)置有斷句、分詞、詞性賦碼等程序,使用方便,無需對文本進(jìn)行預(yù)處理,以純文本格式輸入即可。在類UNIX操作系統(tǒng)下,用命令行方式運行,除UNIX外, 還適用于Linux和Mac OS等操作系統(tǒng)。

      L2SCA自動計算9個語言單位的頻數(shù):單詞、句子、子句、從句、T單位、復(fù)雜 T單位、并列詞組、復(fù)雜名詞性短語、動詞短語,以此為依據(jù)計算14個指標(biāo)測量值。工具使用效度報告稱語言單位識別準(zhǔn)確率達(dá)83%-100%,自動測量與人工測量相關(guān)度達(dá)83.4%-94.1%,系統(tǒng)可靠。[21]每篇作文14個指標(biāo)的人工時間成本報告約2小時,而L2SCA的速度,不計前期處理時間,每秒大約400個平均長度14詞的句子,相當(dāng)于20多篇作文。[5]經(jīng)研究者試驗,實際處理平均長度500詞的作文時間不超過10秒/篇。

      就本文研究者所知,L2SCA是目前最高效的二語句法復(fù)雜度測量工具,但其開發(fā)者同時指出,該系統(tǒng)是針對二語高級學(xué)習(xí)者句法研究設(shè)計,不能應(yīng)用于有大量語法錯誤、不規(guī)范嵌套結(jié)構(gòu)或不完整句子的語料,如初級學(xué)習(xí)者語料。[21]Lu的研究語料也取自WECCL 1.0英語專業(yè)大學(xué)生作文。[6]使用該工具的另兩項研究,一項以TOEFL iBT為語料[19],另一項測量口語,僅以其測量值為參照,檢驗另一測量方法的效果。[20]目前未見L2SCA用于有少量語法錯誤的二語作文測量,標(biāo)點、大小寫、單詞拼寫、限定詞、單復(fù)數(shù)、主謂一致、搭配等語法錯誤不會影響分析結(jié)果。

      (二)D-level analyzer

      從表1可見,L2SCA測量指標(biāo)大都從傳統(tǒng)單位入手,如單詞、句子、T單位、子句,3項深層指標(biāo)觸及復(fù)雜名詞短語和動詞短語密度,但并未做到對句子結(jié)構(gòu)模式的量化,因此,L2SCA仍然只是對表層結(jié)構(gòu)的測量,我們需要深入句子結(jié)構(gòu)內(nèi)部的測量,D-level analyzer(以下簡稱D分析器)可以幫助我們嘗試。

      D分析器原本用于兒童語言句法發(fā)展水平測量,將其用于二語測量實驗主要有如下幾點考慮:1)二語句法復(fù)雜度測量研究,源自對母語的相關(guān)研究,既然兩者采用同樣的表層測量單位(如句子、T單位和子句等),也可以采用同樣的深層測量單位;2)雖然二語習(xí)得與兒童語言習(xí)得遵循不同的發(fā)展規(guī)律,但本研究焦點不在習(xí)得發(fā)展,而是該工具能否區(qū)分不同句法復(fù)雜度語料;3)國內(nèi)學(xué)者曾指出,我國英語學(xué)習(xí)者造句水平還停留在語言學(xué)習(xí)初級階段[22],桂詩春先生更認(rèn)為我們的學(xué)生在寫口語[23]。

      D分析器的測量基準(zhǔn)是D-level Scale——兒童語言習(xí)得發(fā)展量表,最初由Rosenberg & Abbeduto提出,后經(jīng)Covington等學(xué)者進(jìn)一步完善 (見表2),被認(rèn)為是“目前使用的唯一基于習(xí)得的句子復(fù)雜度量表”[4]。因此,D分析器學(xué)習(xí)者語料測量所得值并非對應(yīng)其二語習(xí)得水平,但可以大致對應(yīng)母語為英語者的不同年齡階段。

      表2 Covington et al. (2006) 兒童語言習(xí)得發(fā)展量表(修訂版)

      D分析器不計算文本表面指標(biāo),而是根據(jù)句子結(jié)構(gòu)分類,每個句子對應(yīng)一個等級值,最后綜合所有句子得出樣本均值,代碼為ML。D分析器的實驗報告稱對來自CHILDES和賓州樹庫華爾街日報語料測量準(zhǔn)確率分別高達(dá)93.2%和94%,實驗結(jié)果顯示4-5歲兒童語言句法結(jié)構(gòu)均值為1.156,測量值與兒童年齡相關(guān)系數(shù)為0.648。[4]D分析器的使用相對L2SCA較為復(fù)雜,語料須經(jīng)Stanford POS tagger*斯坦福大學(xué)自然語言處理研究所于2004年研制開發(fā)的詞性賦碼器;下載網(wǎng)址:http://nlp.stanford.edu/software/lex-parser.shtml。賦碼后,用Collins’Parser*Collins, M. 1999年在賓夕法尼亞州州立大學(xué)為寫作博士論文而開發(fā)的自然語言句法分析統(tǒng)計模型。進(jìn)行句法標(biāo)注,之后才能交由D分析器處理。輸出結(jié)果除樣本均值外,還有0-7各級結(jié)構(gòu)所含句子數(shù)量。

      三、 研究設(shè)計

      (一) 研究對象

      所用語料為某省高校間英語寫作大賽決賽作文,不限專業(yè)、層次,49名學(xué)生兩小時內(nèi)電腦輸入完成兩種體裁寫作各一篇,得到98篇作文語料。5位作文閱卷經(jīng)驗豐富的教師參與了評分,其中1名是英語為母語的外籍教師。評委按如下比例用百分制打分:思想內(nèi)容(40%)、寫作技巧(30%)、語言質(zhì)量(30%),去掉最高分和最低分,取其余三個分?jǐn)?shù)平均分為作文整體質(zhì)量最終得分。

      本研究僅關(guān)注句法復(fù)雜度測量,因此,為避免學(xué)生計算機(jī)操作不熟而導(dǎo)致“問題”語料,對數(shù)據(jù)結(jié)果造成影響,研究者對語料作了預(yù)處理,統(tǒng)一文本輸入格式,包括全半角等技術(shù)問題,標(biāo)點、大小寫、單詞拼寫等不影響句法測量結(jié)果的錯誤被糾正。

      檢驗工具的測量效度是本研究的重要內(nèi)容,須關(guān)注工具對語料句法復(fù)雜度的識別效能。作文得分受諸多因素影響,不能作為檢驗工具效能的唯一參照。因此,研究者根據(jù)主觀經(jīng)驗判斷,將預(yù)處理后的兩種體裁語料分別按句法復(fù)雜度歸入高、中、低3組;有爭議的作文經(jīng)討論后達(dá)成一致,最終議論文各組份數(shù)為17、21、11,記敘文各組份數(shù)為17、17、15。

      (二)研究問題

      本研究主要回答以下問題:

      1) 中國EFL學(xué)習(xí)者句法復(fù)雜度自動測量數(shù)據(jù)結(jié)果呈現(xiàn)什么特點?哪些測量值與作文質(zhì)量相關(guān)?

      2) 體裁因素對中國EFL學(xué)習(xí)者句法復(fù)雜度的影響如何?哪些指標(biāo)測量值在高、中、低3組間呈顯著差異?兩種體裁結(jié)果是否一致?

      (三) 研究方法

      用SPSS 20.0對15個指標(biāo)測量值與作文整體得分作皮爾遜相關(guān)分析;以體裁為變量,對15個指標(biāo)測量值作均值差異顯著性分析;控制體裁變量,分別對議論文和記敘文高、中、低3組測量值進(jìn)行描述統(tǒng)計及ANOVA分析;對D分析器1-7級測量值進(jìn)行描述統(tǒng)計及組間ANOVA分析。

      四、 研究結(jié)果與討論

      所有數(shù)據(jù)分析結(jié)果見表3至表6。

      表3  作文整體質(zhì)量與測量值皮爾遜相關(guān)分析結(jié)果

      說明:** 在 0.01 水平(雙側(cè))上顯著相關(guān);* 在 0.05 水平(雙側(cè))上顯著相關(guān)。

      15個句法復(fù)雜度測量值與作文整體得分的皮爾遜相關(guān)分析結(jié)果見表3,至少4個指標(biāo)表現(xiàn)為正相關(guān):平均句長MLS、子句密度C/S、復(fù)雜名詞密度CN/T和平均句法結(jié)構(gòu)等級ML,前兩項是表層指標(biāo),后兩項是深層指標(biāo)。ML為 D分析器測量所得,相關(guān)系數(shù)最大,初步顯示支持D分析器在二語測量中的應(yīng)用。此前的研究大多顯示作文整體質(zhì)量與句法復(fù)雜度沒有統(tǒng)計意義上的相關(guān)關(guān)系[3],本研究結(jié)果與之相反,證明作文整體得分與句法結(jié)構(gòu)確實存在關(guān)系,這一現(xiàn)象或與評分標(biāo)準(zhǔn)中“語言質(zhì)量”強調(diào)句法結(jié)構(gòu)多樣性和準(zhǔn)確性有關(guān)。該研究結(jié)果初步表明L2SCA的測量范圍不應(yīng)限于高級英語學(xué)習(xí)者語料。

      表4  兩種體裁15個指標(biāo)描述統(tǒng)計與差異檢驗結(jié)果

      兩種體裁獨立樣本T檢驗(見表4)發(fā)現(xiàn),平均句子結(jié)構(gòu)等級值ML出現(xiàn)明顯差異,已超過1,說明體裁對學(xué)習(xí)者句子結(jié)構(gòu)的影響非常大,與L2SCA測量結(jié)果一致,再次表明D分析器適用于二語句法復(fù)雜度測量。L2SCA測量所得句法復(fù)雜度14個指標(biāo),除C/S和T/S外,均呈顯著差異。Lu用L2SCA對中國英語專業(yè)學(xué)習(xí)者的作文開展的同類研究發(fā)現(xiàn)T/S也呈顯著差異[6];本研究中T/S指標(biāo)的體裁間差異檢驗值為0.067,接近邊緣顯著,因此,兩項研究結(jié)果趨于一致,支持該工具用于中國EFL學(xué)習(xí)者句法復(fù)雜度測量。研究結(jié)果再次證明子句密度指標(biāo)之一C/S對體裁變量不敏感,考慮其與作文質(zhì)量的相關(guān)關(guān)系,研究者認(rèn)為C/S不失為一個較穩(wěn)定的句法復(fù)雜度測量指標(biāo)。

      鑒于對同一組數(shù)據(jù)進(jìn)行了15次重復(fù)測量,句法復(fù)雜度人工分組自動測量值A(chǔ)NOVA分析(見表5)顯著水平調(diào)整為0.05/15≈0.003。兩種體裁均表現(xiàn)出顯著差異的4個指標(biāo)如下:平均句法結(jié)構(gòu)等級ML、平均句長MLS、平均T單位長MLT和復(fù)雜名詞密度CN/T,與表3分析結(jié)果相似,側(cè)面說明句法復(fù)雜度與作文整體質(zhì)量得分的相關(guān)關(guān)系。

      表5 句法復(fù)雜度人工分組組間測量值A(chǔ)NOVA分析結(jié)果

      續(xù)表5

      DC/C議論文0.4460.0880.3510.0720.3040.09111.3780.000記敘文0.3580.1120.3070.0900.2560.0914.2720.020DC/T議論文0.9520.4410.5950.1960.4950.2668.8970.001記敘文0.6760.4380.5000.2190.3850.1793.7250.032T/S議論文1.1100.1031.0630.0501.0880.0991.4800.238記敘文1.1190.1091.0950.0741.1470.1091.1390.329CT/T議論文0.5990.1320.4410.1050.3900.15211.3940.000記敘文0.4630.1300.3910.1450.3160.1224.8050.013CP/T議論文0.4970.2740.3520.1710.3560.3361.8000.177記敘文0.3510.1790.1710.0990.1610.1638.4020.001CP/C議論文0.2450.1360.2140.1080.2550.2920.2560.775記敘文0.1950.0850.1110.0640.1090.0916.2340.004CN/T議論文3.0111.5341.9120.4641.6280.8347.7580.001記敘文1.8231.0371.0120.3570.8810.3169.5610.000CN/C議論文1.4080.3561.1610.2841.0800.6932.4100.101記敘文0.9820.3150.6390.1740.6040.17613.2370.000

      除上述4個指標(biāo)外,議論文另有6個、記敘文另有3個呈顯著差異,工具對議論文測量的整體表現(xiàn)優(yōu)于記敘文。此前對英語專業(yè)學(xué)習(xí)者的相關(guān)研究認(rèn)為單位長度能較好地反映句法復(fù)雜度[2][10][24],與本研究結(jié)論大致吻合。國內(nèi)手工測量關(guān)于常用單位密度指標(biāo)C/T和DC/C的研究結(jié)論不盡相同,鮑貴認(rèn)為兩指標(biāo)對不同句法復(fù)雜度區(qū)別力有限[2],本研究結(jié)果支持秦曉晴、文秋芳和徐曉燕等的研究結(jié)論,認(rèn)為C/T和DC/C能有效區(qū)分中國EFL學(xué)習(xí)者議論文語料句法復(fù)雜度。[24] [10]

      兩種體裁并列度指標(biāo)T/S及議論文另兩個并列度指標(biāo)CP/T和CP/C均呈非線性發(fā)展趨勢,句法復(fù)雜度中級組出現(xiàn)谷值,說明用并列度指標(biāo)測量中國EFL學(xué)習(xí)者句法復(fù)雜度效果不佳,與Lu的研究結(jié)論不合[6];或因本研究語料取自競賽語料,學(xué)習(xí)者經(jīng)過初賽選拔,大致處于同一句法習(xí)得水平,并列結(jié)構(gòu)的使用頻率和習(xí)慣趨于同質(zhì)性。

      除上述3個指標(biāo)以外,其余各指標(biāo)雖未呈組間顯著差異,但均呈線性發(fā)展,Lu用L2SCA對英語專業(yè)學(xué)習(xí)者議論文進(jìn)行的同類研究也僅發(fā)現(xiàn)7個指標(biāo)呈顯著線性發(fā)展。[6]本研究議論文大部分指標(biāo)、記敘文近一半指標(biāo)呈顯著差異,研究結(jié)果支持兩種自動測量工具對中國EFL學(xué)習(xí)者句法復(fù)雜度研究的應(yīng)用。

      D分析器測量結(jié)果(見表6)發(fā)現(xiàn)大部分句子落入0級和7級,其次是2、3、5級,這一結(jié)果與Lu對該工具的實驗研究報告基本一致。[4]報告稱D分析器在識別0、1、3、5、7級結(jié)構(gòu)上面表現(xiàn)最佳,2級次之,4級和6級表現(xiàn)不佳。該工具對難以判定的中間等級結(jié)構(gòu),處理方法是僅區(qū)分為簡單句或復(fù)雜句,分別歸入0級或7級,所以本研究測量值呈兩極分化。另外,研究語料雖取自全省高校間寫作大賽,但競賽條件下,學(xué)習(xí)者對較為復(fù)雜的句式使用回避策略,采用熟悉的簡單句式也是導(dǎo)致相當(dāng)量的句子落入0級的原因之一。綜上所述,本研究顯示,D分析器對二語語料的測量實驗效果總體令人滿意。

      表 6 D分析器測量值組間描述統(tǒng)計數(shù)據(jù)

      續(xù)表6

      Level21171.531.62173.181.782211.671.28172.181.513111.271.35152.601.92Level31172.711.53173.062.112214.482.27173.411.803113.363.01152.672.23Level41170.350.61170.350.612210.670.91170.941.033110.450.93150.871.13Level51172.121.05172.181.632212.951.88172.411.423111.912.26151.931.16Level61170.590.87170.531.072210.901.09170.240.443110.550.69150.530.83Level711713.062.14178.412.9622111.103.03175.942.753117.003.44153.872.92ML1174.920.78173.741.072213.810.69172.840.803113.041.00152.380.86

      組間ANOVA分析發(fā)現(xiàn),議論文0級、7級和平均等級結(jié)構(gòu)值ML呈顯著差異,記敘文7級和ML呈顯著差異。高級組的中間等級結(jié)構(gòu)測量值大都居中,而中級組卻往往出現(xiàn)峰值,這并非表明中級組句法復(fù)雜度強于高級組,而是印證了此前關(guān)于二語學(xué)習(xí)者句法發(fā)展次序的討論[3][22][25],支持高水平學(xué)習(xí)者更多使用緊縮句的研究結(jié)論。[10]

      五、 結(jié)論

      應(yīng)用兩種工具L2SCA和D分析器對中國EFL學(xué)習(xí)者句法復(fù)雜度自動測量實驗研究的結(jié)果顯示,15項測量指標(biāo)中有4項與作文質(zhì)量相關(guān):平均句長MLS、子句密度C/S、復(fù)雜名詞密度CN/T和平均句子結(jié)構(gòu)等級ML。兩種體裁獨立樣本T檢驗結(jié)果發(fā)現(xiàn),除C/S外,所有指標(biāo)均呈顯著或臨界顯著差異,體裁對學(xué)習(xí)者語料句法復(fù)雜度的影響非常明顯。句法復(fù)雜度人工分組的單因素方差分析顯示,議論文10個指標(biāo)、記敘文7個指標(biāo)呈顯著差異,4項指標(biāo)出現(xiàn)交集:平均句法結(jié)構(gòu)等級ML、平均句長MLS、平均T單位長MLT和復(fù)雜名詞密度CN/T,與測量值和作文分?jǐn)?shù)相關(guān)分析的結(jié)果非常接近,側(cè)面說明句法復(fù)雜度與作文整體質(zhì)量的相關(guān)關(guān)系。D分析器測量值顯示,句法復(fù)雜度高級組僅有最高等級(7級)和平均句子結(jié)構(gòu)等級出現(xiàn)峰值,其余峰值大多出現(xiàn)于中級組,說明高級學(xué)習(xí)者更多使用緊縮句,與此前的研究結(jié)論一致。如不考慮顯著水平,則除并列結(jié)構(gòu)指標(biāo)以外,組間所有指標(biāo)測量值均呈線性發(fā)展趨勢。實驗結(jié)果顯示兩種測量工具應(yīng)用于議論文測量的整體效果優(yōu)于記敘文,研究結(jié)果支持L2SCA和D分析器用作中國EFL學(xué)習(xí)者語料句法復(fù)雜度測量工具或二語句法復(fù)雜度測量工具。

      [參考文獻(xiàn)]

      [1]Ortega, L. Syntactic complexity measures and their relationship to L2 proficiency: A research synthesis of college-level L2 writing[J].Applied Linguistics, 2003(24):492.

      [2]鮑貴.英語學(xué)習(xí)者作文句法復(fù)雜性變化研究[J].外語教學(xué)與研究,2009(4):291-297.

      [3]Wolfe-Quintero, K., Inagaki S. & H. Y. Kim. Second Language Development in Writing: Measures of Fluency, Accuracy, and Complexity[M].Honolulu:University of Hawaii Press,1998:69-73.

      [4]Lu, X. Automatic measurement of syntactic complexity in child language acquisition[J]. International Journal of Corpus Linguistics,2009(14): 3-28.

      [5]Lu, X. Automatic analysis of syntactic complexity in second language writing[J].International Journal of Corpus Linguistics, 2010(15): 474-496.

      [6]Lu, X. A corpus-based evaluation of syntactic complexity measures as indices of college-level ESL writers’ language development[J].TESOL Quarterly ,2011(45):36-62.

      [7]紀(jì)小凌.英語學(xué)習(xí)者書面語發(fā)展研究[J].現(xiàn)代外語,2009(2):178-185.

      [8]鮑貴.英語學(xué)習(xí)者語言復(fù)雜性變化對比研究[J].現(xiàn)代外語,2010(2):166-176.

      [9]曾祥敏.英語專業(yè)學(xué)生限時作文與平時作文句法復(fù)雜性之比較[J].解放軍外國語學(xué)院學(xué)報,2011(5): 69-74.

      [10]趙俊海,陳慧媛.英語學(xué)習(xí)者書面語語法復(fù)雜度的測量研究[J].外語教學(xué)理論與實踐,2012(1): 27-32.

      [11]徐曉燕,王維民,等.中國英語專業(yè)學(xué)生英語議論文句法復(fù)雜性研究[J].外語教學(xué)與研究,2013(2): 264-275.

      [12]梁茂成.學(xué)習(xí)者書面語語篇連貫性的研究[J].現(xiàn)代外語,2006(3): 284.

      [13]桂林.基于計算機(jī)評估的L1和L2語言詞匯水平對比研究[J].外語教學(xué)與研究,2010(6): 445.

      [14]鮑貴.不同課程水平英語學(xué)習(xí)者詞匯復(fù)雜性研究[J].解放軍外國語學(xué)院學(xué)報,2011(2): 55.

      [15]杜慧穎,蔡金亭.基于Coh-Metrix的中國英語學(xué)習(xí)者議論文寫作質(zhì)量預(yù)測模型研究[J].現(xiàn)代外語,2013(3): 293.

      [16]MacWhinney, B. The CHILDES Project: Tools for Analyzing Talk[CP].Mahwah NJ: Lawrence Erlbaum Associates, 2000.

      [17]Long, S. H., Fey M. E. & R. W. Channell. Computerized Profiling (Version 9.7.0)[CP]. Cleve- land, OH: Case Western Reserve University, 2008.

      [18]Steven, L., Thorne I. F. & X. Lu. The semiotic ecology and linguistic complexity of an online game world[J].ReCALL, 2012(24):279-301.

      [19]Yang, W., Lu X. & S. Weigle. Different topics, different discourse: Relationships among writing topic, measures of syntactic complexity, and judgments of writing quality[J].Journal of Second Language Writing, 2015(28):53-67.

      [20]Bhat, S. & S.-Y. Yoon. Automatic assessment of syntactic complexity for spontaneous speech scoring[J].Speech Communication,2015(67):42-57.[21]Lu, X. Computational Methods for Corpus Annotation and Analysis[M].Dordrecht: Springer, 2014:95-142.

      [22]徐曉燕,王維民,等.子句成分與名詞詞組成分——評測二語學(xué)習(xí)者英語句法復(fù)雜性的兩個新視角[J]. 中國外語教育,2014(2): 49-57.

      [23]孫有中.英語專業(yè)寫作教學(xué)與思辨能力培養(yǎng)座談[J].外語教學(xué)與研究,2011(4):605.

      [24]秦曉晴,文秋芳.中國大學(xué)生英語寫作能力發(fā)展規(guī)律與特點研究[M].北京:中國社會科學(xué)出版社,2007:27-53.

      [25]Biber, D., Gray B. & K. Poonpon. Should we use characteristics of conversation to measure grammatical complexity in L2 writing development?[J]. TESOL Quarterly ,2011(45): 5-35.

      [責(zé)任編輯劉文俊]

      Automatic Measurement of Syntactic Complexity for Chinese EFL Learners:L2SCA and D-level Analyzer as the Tools

      ZHANG Li-li1,2

      (1.School of Foreign Languages,Guizhou University, Guiyang 550025; 2. School of International Studies,Zhejiang University, Hangzhou 310058, China)

      Abstract:This article reports the experimental automatic measurement for syntactic complexity of L2 written data from a provincial between-college English writing contest with L2SCA and D-level analyzer as the tools. 4 out of the 15 indices are found related to holistic essay score. ANOVA analysis shows significant difference on 10 indices in argumentative essays and 7 in narrative ones, suggesting the tools’ general better performance on argumentative writing. It confirms that genre is an important factor influencing syntactic complexity for Chinese EFL learners. Almost all the indices present linear progression tendency, which shows the support of using L2SCA and D-level as tools for syntactic complexity measurement.

      Key words:syntactic complexity; automatic measurement; Chinese EFL learners; L2 writing

      doi:10.16088/j.issn.1001-6597.2016.02.019

      [中圖分類號]H319

      [文獻(xiàn)標(biāo)識碼]A

      [文章編號]1001-6597(2016)02-0128-08

      通山县| 万州区| 内黄县| 涪陵区| 黔西| 湘阴县| 全南县| 康保县| 从化市| 漯河市| 通江县| 许昌县| 永昌县| 高青县| 绥江县| 科尔| 留坝县| 高邑县| 铜陵市| 清远市| 原平市| 闻喜县| 珠海市| 新疆| 丁青县| 武城县| 西城区| 蕲春县| 辛集市| 齐河县| 丹江口市| 太和县| 佛山市| 昭通市| 仁怀市| 札达县| 河间市| 潜山县| 临清市| 娱乐| 邢台县|