原蓉 田興斌
摘要:閱讀理解因其占據(jù)較大的分?jǐn)?shù)比例,在語言測(cè)試中一直占有重要的地位。作為選拔高質(zhì)量研究生的語言測(cè)試和目前國內(nèi)最為廣泛的檢驗(yàn)大學(xué)生英語能力的全國性統(tǒng)一標(biāo)準(zhǔn)化考試,研究生入學(xué)考試英語一和大學(xué)英語六級(jí)的重要性不言而喻。本研究運(yùn)用語料庫軟件Range和Readability analyzer從詞匯、句長、語篇長度以及可讀性層面對(duì)這兩類考試的閱讀語篇進(jìn)行對(duì)比分析。
關(guān)鍵詞:研究生入學(xué)考試英語一;大學(xué)英語六級(jí);語篇復(fù)雜度
一、引言
據(jù)統(tǒng)計(jì),2021年全國考研人數(shù)已突破400萬,而研究生英語入學(xué)考試(下文稱為英語一)在考研中占據(jù)著重要的地位。英語一適用于全部學(xué)術(shù)型碩士研究生以及部分專業(yè)型碩士,如法律、漢語國際教育、建筑學(xué)、臨床醫(yī)學(xué)、口腔醫(yī)學(xué)、護(hù)理和公共衛(wèi)生等專業(yè)型碩士。英語一試卷共包括英語知識(shí)運(yùn)用、閱讀理解、英譯漢和寫作四種題型。其中,閱讀理解所占分值最多,比重最大,同時(shí)也是考生們最為關(guān)注的部分之一。那么,在英語一的閱讀理解部分中所需要的詞匯量和語篇理解能力與大學(xué)英語六級(jí)的閱讀理解有什么異同呢?
目前,關(guān)于研究生英語入學(xué)考試閱讀部分的研究很多,如王立陽和申如冰于2019年對(duì)比分析了考研英語一和英語二閱讀語篇的難易度,分析出考研英語一的閱讀語篇要難于考研英語二。李鵬和趙妍于2014年通過評(píng)估研究生入學(xué)英語試卷一,探討其中存在的問題并提出解決的建議,為準(zhǔn)備考研的學(xué)生提供了一定的參考。楊旭和裴學(xué)梅于2018年對(duì)研究生入學(xué)考試英語一與托福閱讀語篇的復(fù)雜度進(jìn)行了對(duì)比研究,研究發(fā)現(xiàn)無論是在單詞長度、句法、深度銜接還是相鄰段落之間的潛在語義交叉,二者都存在著顯著性的差異。但是研究者們很少研究中國大學(xué)生英語六級(jí)考試的閱讀理解與考研英語一閱讀理解之間的聯(lián)系。中國大學(xué)生英語六級(jí)考試是由國家統(tǒng)一出題的全國性考試,用于評(píng)定已修完大學(xué)英語六級(jí)的學(xué)生是否達(dá)到了教學(xué)大綱的要求。那么,學(xué)生在準(zhǔn)備大學(xué)英語六級(jí)考試時(shí)所習(xí)得的詞匯和英語知識(shí)是否能為其考研英語一服務(wù)呢?因此,為探討這一問題,本研究運(yùn)用語料庫工具readability analyzer和range,以大學(xué)英語六級(jí)考試的英語閱讀為參照,分析研究生入學(xué)考試英語一閱讀語篇在詞匯、句長、語篇和可讀性層面上的復(fù)雜度,探討二者之間的異同。
二、閱讀語篇的可讀性和測(cè)量方式
閱讀語篇的可讀性或者易讀性指的是閱讀語篇的難度,即語篇難以理解的程度。影響閱讀語篇難度的因素主要是語言的詞匯復(fù)雜度、句子復(fù)雜度、語篇的長度以及文本復(fù)雜度等。
詞匯復(fù)雜度可從平均詞長、詞目比率、詞的形符類符比和標(biāo)準(zhǔn)形符類符比、詞目的形符類符比和標(biāo)準(zhǔn)形符類符比六個(gè)維度來衡量。詞匯復(fù)雜度將通過語料庫軟件Range進(jìn)行測(cè)量,并搭配readability analyzer軟件一起使用。Range軟件是一個(gè)用于分析文本中詞匯廣度和深度的語料庫工具,它自帶若干個(gè)基礎(chǔ)詞表,也就是高頻詞表,可以統(tǒng)計(jì)出語篇中的詞數(shù)、詞目數(shù)、詞群以及這些詞在不同的詞表中所出現(xiàn)的頻率和占比情況等指標(biāo)。
兩項(xiàng)考試閱讀語篇中句子的復(fù)雜度、語篇長度以及文本可讀性便從由賈云龍和許家金開發(fā)的語料庫語篇分析軟件readability analyzer中獲取。這一軟件能計(jì)算一組傳統(tǒng)的可讀性數(shù)值,像弗萊士易讀度和金凱德難度等級(jí)以及一些其他測(cè)試語篇詞匯復(fù)雜度的指標(biāo),如形符類符比、標(biāo)準(zhǔn)化的形符類符比、平均單詞長度、平均句長以及詞或形符的描述性統(tǒng)計(jì),其中弗萊士易讀度數(shù)值越小,易讀度越高,而金凱德難度級(jí)數(shù)越大,難度越高。
三、分析和討論
本研究使用的語篇有兩組,分別包括2005年到2020年考研英語一的閱讀理解語篇和大學(xué)英語六級(jí)考試的閱讀理解語篇60篇和66篇。為了使研究結(jié)果具有可比性,排除了選詞填空、快速閱讀和考研英語一中的新題型,僅保留了閱讀之后需要做單項(xiàng)選擇題的語篇。隨后,運(yùn)用語篇整理器統(tǒng)一兩組語篇的格式,如刪除兩組語篇中閱讀的標(biāo)題、標(biāo)注、英語釋義、漢語釋義以及更改標(biāo)點(diǎn)符號(hào)為英文輸入等。接下來將從詞匯特征、平均句子長度、語篇長度和可讀性四個(gè)方面對(duì)兩組語篇的特征進(jìn)行分析:
(一)詞匯特征
考研英語一和大學(xué)英語六級(jí)閱讀語篇中的詞匯特征主要從詞匯覆蓋率、詞頻分布、平均詞長以及詞匯密度四個(gè)層面來體現(xiàn)。其中,詞頻和詞匯覆蓋率的數(shù)據(jù)由range語料庫軟件進(jìn)行統(tǒng)計(jì)分析,得出如下結(jié)果:
大學(xué)英語六級(jí)的閱讀語篇共計(jì)30382個(gè)詞,可分為6016個(gè)詞類,這些詞類來源于1754個(gè)詞組。其中,在基礎(chǔ)詞表一中,大學(xué)英語六級(jí)閱讀共有21620個(gè)詞,這21620個(gè)詞占閱讀文中總詞量的71.16%,而在基礎(chǔ)詞表一里有1960個(gè)詞類,占語篇總詞類的32.58%。除此之外,這些詞類又可劃分成一些詞群,如care,careful,careless等詞同屬于一個(gè)詞群。從基礎(chǔ)詞表一的統(tǒng)計(jì)結(jié)果來看,這1960個(gè)詞類來源于864個(gè)詞群。且在這一詞表中,詞匯覆蓋率達(dá)到71.16%。
同樣,在基礎(chǔ)詞表二中,六級(jí)閱讀有1698個(gè)詞,占總詞數(shù)的5.59%,有763個(gè)詞類,占總詞類的12.68%,從屬于472個(gè)詞群。而在詞表三中,有2108個(gè)詞,占總詞量的6.94%,共有816個(gè)詞類,占總詞類的13.56%,從屬于418個(gè)詞群。此時(shí)的詞匯覆蓋率為基礎(chǔ)詞表一的詞匯覆蓋率加上基礎(chǔ)詞表二和三的詞匯覆蓋率,即為83.69%。
此外,大學(xué)英語六級(jí)的閱讀語篇中有4956個(gè)詞不在上述三個(gè)基礎(chǔ)詞表中,占總詞量的16.31%。而在這一詞表中的詞匯共分為2477個(gè)詞類,占總詞類的41.17%。
Range軟件的三個(gè)基礎(chǔ)詞表是按詞匯頻率由高到低統(tǒng)計(jì)而成的,由此前三個(gè)詞表是使用頻率最高的詞。正如上文對(duì)統(tǒng)計(jì)數(shù)據(jù)的分析,83.69%的詞來自于前三個(gè)基礎(chǔ)詞表,而低頻詞的詞匯覆蓋率僅有16.31%。
考研英語一在基礎(chǔ)詞表一、二和三中分別有 19774、1502和2140個(gè)詞,占總詞量的比例分別為71.81%、5.45%和7.77%。由此看來,前三個(gè)詞表的詞匯覆蓋率為85.03%,而低頻詞的共計(jì)4121,占14.97%。
綜上,在大學(xué)英語六級(jí)考試的閱讀語篇和考研英語一的閱讀語篇中,高頻詞分別占據(jù)83.69%和85.03%,而低頻詞分別占16.31%和14.97%。因此,大學(xué)英語六級(jí)的閱讀理解比考研英語一的閱讀語篇含有更多的低頻詞和較少的高頻詞,那么可以粗略地說,考研閱讀理解的詞匯復(fù)雜度更高,更難,且詞匯豐富度更高。此外,前人研究中指出高頻詞的覆蓋率達(dá)到95%是能基本理解語篇全文的一個(gè)閾值。而兩組語篇均未達(dá)到這一閾值,說明無論是六級(jí)閱讀語篇還是考研英語一的閱讀語篇對(duì)于考生來說都有一定難度,且考研閱讀要更難一些,擁有更廣泛的詞匯覆蓋率和詞匯復(fù)雜度。
然而,為了得到關(guān)于詞匯復(fù)雜度或詞匯豐富度更詳細(xì)的信息,需要使用readability analyzer語料庫工具對(duì)兩組語篇的平均詞長、詞目比率、詞的標(biāo)準(zhǔn)形符類符比、詞目的形符類符比以及詞目的標(biāo)準(zhǔn)形符類符比進(jìn)行進(jìn)一步的分析,隨后使用SPSS軟件進(jìn)行獨(dú)立樣本T檢驗(yàn),結(jié)果如下:
兩組語篇在以上幾個(gè)指標(biāo)中均無顯著性差異,即P值大于0.05,但是兩組語篇在某些層面中仍有差異。具體分析如下:兩組語篇中AWL的平均值相等,沒有差異,說明六級(jí)閱讀語篇和考研閱讀語篇的平均詞長一致。而六級(jí)中的Word TTR、Word STTR和Lemma TTR略高于考研閱讀語篇,也就是說六級(jí)閱讀語篇的詞的形符類符比和標(biāo)準(zhǔn)形符類符比以及詞目的形符類符比均要略高于考研英語閱讀語篇。其中詞目比率、詞的形符類符比和標(biāo)準(zhǔn)形符類符比以及詞目的形符類符比和標(biāo)準(zhǔn)形符類符比常用于測(cè)量詞匯密度的,在這幾個(gè)指標(biāo)中六級(jí)閱讀語篇略高,就說明六級(jí)閱讀語篇中詞匯的重復(fù)率要高于考研英語一閱讀,即六級(jí)閱讀語篇詞匯豐富度略低。同時(shí),這也證實(shí)了Range統(tǒng)計(jì)分析出的結(jié)果,考研英語一的閱讀語篇擁有更廣的詞匯覆蓋率,詞匯豐富度更高。
總之,在詞匯特征方面,六級(jí)閱讀有更多的低頻詞匯,更少的高頻詞匯,而考研閱讀詞匯量更廣泛,詞匯豐富程度更高。
(三)平均句長和語篇長度
平均句長影響句子的難度,并且與閱讀語篇的易讀度相關(guān)。從readability analyzer的統(tǒng)計(jì)結(jié)果來看,與考研英語一相比,從2005年到2020年六級(jí)閱讀中平均句長的整體變化趨勢(shì)較為平穩(wěn)且句子長度略短。但在經(jīng)過獨(dú)立樣本T檢驗(yàn)之后發(fā)現(xiàn),二者平均句長P值大于0.05,因此二者的平均句長并沒有顯著地差異,但總體來講,考研英語一閱讀語篇的句子長度要略長于大學(xué)英語六級(jí)閱讀。
在2005至2020年間,英語六級(jí)的語篇長度在1592至1801間波動(dòng),最低的是在2009年,最高的是在2010年,波動(dòng)幅度比較小,僅有209個(gè)字。而考研英語一閱讀語篇的長度在888至7521間波動(dòng),最低的是在2008年,最高的在2017年,波動(dòng)幅度極大,高達(dá)6633個(gè)字。從變化趨勢(shì)來看,英語六級(jí)閱讀語篇的較為平穩(wěn),而考研英語一閱讀語篇的波動(dòng)幅度較大,特別是從2005年至2008年字?jǐn)?shù)極劇銳減,雖2008年至2016年逐漸平穩(wěn)過渡,但到2017年又攀至頂峰,而從2017至2020年又逐漸下降且趨于平緩??傮w來看,考研英語一的閱讀語篇要長于六級(jí)閱讀,且每年的語篇長度變化較大。
然而,在進(jìn)行獨(dú)立樣本T檢驗(yàn)之后發(fā)現(xiàn),英語六級(jí)閱讀語篇的長度與考研英語一的閱讀語篇長度雖有差異但并沒有顯著差異。
(四)可讀性
為了分析兩組閱讀語篇的可讀性,本研究運(yùn)用readability analyzer軟件分別計(jì)算了兩組語篇的弗萊士易讀度和金凱德難度級(jí)別。正如上文中提到的,弗萊士易讀度數(shù)值越小,語篇越難。數(shù)值在0-59之間為難,60-69為標(biāo)準(zhǔn),70-100為簡(jiǎn)單。金凱德難度等級(jí)與句子中的詞數(shù)和每個(gè)詞的音節(jié)數(shù)有關(guān)。它與弗萊士易讀度相反,金凱德難度等級(jí)越高,語篇越難。
同樣的,在可讀性方面,大學(xué)英語六級(jí)閱讀和考研英語一閱讀并沒有顯著性差異,但是二者存在差異。具體來看,大學(xué)英語六級(jí)的易讀度常在40-50之間波動(dòng),2010年有一篇易讀值非常接近30,而考研英語的易讀度多在30-50之間波動(dòng),2012-2015年間有兩篇閱讀易讀值低于30,2016年有兩篇非常接近50。根據(jù)弗萊士易讀度的規(guī)定,低于30為非常難,30-50之間為較難,因此無論是大學(xué)英語六級(jí)閱讀還是考研英語一閱讀的平均難度均為較難,有個(gè)別年份為特別難,總體來看,考研英語一的閱讀要比大學(xué)英語六級(jí)的閱讀要難。且從金凱德難度等級(jí)來看,考研英語一的閱讀語篇和大學(xué)英語六級(jí)的閱讀語篇的難度等級(jí)基本一致,但是考研英語一閱讀難度略高一些,這一結(jié)果與弗萊士易讀度的結(jié)果一致。
結(jié)語
本研究運(yùn)用語料庫工具Range和Readability Analyzer從詞匯特征、句子長度、語篇長度和可讀性四個(gè)方面對(duì)大學(xué)英語六級(jí)閱讀語篇和研究生入學(xué)考試英語一閱讀語篇的語篇復(fù)雜度進(jìn)行了對(duì)比分析。研究發(fā)現(xiàn),二者在這四個(gè)方面均有一定差異但沒有顯著差異。在詞匯層面,六級(jí)閱讀和考研閱讀平均詞長是一致的,但六級(jí)閱讀語篇中詞的形符類符比和標(biāo)準(zhǔn)形符類符比以及詞目的形符類符比均要略高于考研英語閱讀語篇,這說明考研英語一閱讀語篇中詞匯的重復(fù)率要低于大學(xué)英語六級(jí)閱讀,且擁有更廣泛的詞匯量。在平均句長和語篇長度方面,考研英語一閱讀語篇的平均句長要略長于大學(xué)英語六級(jí)的閱讀語篇,語篇長度亦是如此,但考研英語一閱讀語篇的語篇長度波動(dòng)比較大,語篇復(fù)雜度變化較大。在可讀性方面,考研英語一的可讀性要略低一些,有幾篇閱讀的難度值甚至接近30,為非常難。
總之,考研英語一的閱讀難度在以上四個(gè)層面均要略高于大學(xué)英語六級(jí)閱讀,但同時(shí)二者的閱讀難度也非常的相近,所以在準(zhǔn)備大學(xué)英語六級(jí)時(shí)所習(xí)得的英語知識(shí)對(duì)考研英語一來說是有一定幫助的。需要注意的是,考研英語一的詞匯量要更廣泛,句子長句要更長,語篇也要略長一些,在準(zhǔn)備考研英語一的過程中,考生定要重視擴(kuò)大詞匯量,加強(qiáng)對(duì)句法知識(shí)的練習(xí),提高分析句子的能力,并通過記時(shí)練習(xí)閱讀以適應(yīng)其語篇長度。
參考文獻(xiàn):
[1]黃娟,虞程遠(yuǎn),彭瑩瑩.全國碩士研究生入學(xué)考試(英語一)閱讀理解測(cè)試內(nèi)容效度研究(2012-2016)[J].考試研究,2017(05):64-71.
[2]曹琳爽.基于語料庫的雅思作文Task 2詞匯復(fù)雜度研究[J].英語教師,2017,17(14):23-25+30.
[3]許智堅(jiān).信息技術(shù)環(huán)境下的文本易讀性分析及其工具[J].龍巖學(xué)院學(xué)報(bào),2014,32(06):44-51.
1.貴州大學(xué)外國語學(xué)院 貴州省 貴陽市 550025
2.銅仁學(xué)院 國際學(xué)院 貴州省 銅仁市 554300