摘 要: 英語文章的難度是存在等級的,而難度的劃分有很多原則。本文基于詞匯層次來區(qū)分文章的難度,如果文章中常用的詞匯出現(xiàn)百分比多,文章就可能簡單,反之,文章就有可能偏難?;谏鲜鲈瓌t,利用軟件來分析詞匯等級,從而確定文章難度,旨在幫助學(xué)習(xí)者選擇適合的材料進(jìn)行學(xué)習(xí)。
關(guān)鍵詞: 英語文章 難度 詞匯等級
目前英語單詞的詞匯總量已經(jīng)超過200萬(汪榕培,1999),有專家估計,英語現(xiàn)每年至少以850個左右的新詞的速度增加(王文斌,2005)。在英語學(xué)習(xí)過程當(dāng)中,這樣海量的單詞,無疑是攔路虎。幸運的是,雖然英語有這么多的單詞,但是它們在語篇中的作用不一樣,據(jù)Francis和Kucera(1982)統(tǒng)計,在一百多萬詞的Brown語料庫中,頻率居前1000單詞就可以覆蓋72%的語料庫;頻率居前2000單詞可以覆蓋79.7%;頻率居前3000單詞可以覆蓋84%;頻率居前4000單詞可以覆蓋86.8%;頻率居前5000單詞可以覆蓋88.7%;頻率居前6000單詞可以覆蓋89.9%;頻率居前15851個單詞才覆蓋97.8%。從上面的數(shù)據(jù)我們可以發(fā)現(xiàn)常用的單詞(詞頻在前2000個單詞)大約占語篇的80%,這樣我們在學(xué)習(xí)英語過程中,首先掌握這兩千個左右的單詞,就可以基本了解一般文章的大意。反過來,我們根據(jù)這些單詞的覆蓋率也可以確定文章的難度,也就是說,如果一個文章含有常用的單詞少,文章就越難,反之就容易。
日本早稻田大學(xué)的Anthony,Laurence教授根據(jù)上面的詞控理論原則,編寫了AntWordProfiler軟件,不過他選擇的單詞不是上面統(tǒng)計出來的單詞,他使用的是West(1953)的General Service List和Coxhead(2000)的Academic Word List,前者有2000個左右的詞族,在一般語篇中的覆蓋率是81.3%;后者有570個左右的詞族。在科技語篇中的覆蓋率是8.5%。這2000個詞族可以再細(xì)分為前1000個詞族和后詞族。
實例分析:
我們以新視野大學(xué)第二版第二冊的第一和第二單元的A課文為例。
此軟件的主界面如下圖:
圖1中的左下中的nation_basewords_1.txt,nation_basewords_2.txt和nation_basewords_3.txt 分別就是West的2000個詞族和Coxhead的570個詞族。
從表1我們可以發(fā)現(xiàn),第一課的課文單詞總數(shù)是685個,其中包含在詞表1中的單詞有553個,占整個課文單詞的80.73%;在詞表2中的單詞有47個,占整個課文單詞的6.86%;在詞表3中的單詞有42個,占整個課文單詞的6.13%;未包含在上述詞表中的單詞有43個,占整個課文單詞的6.28%。第一課的課文單詞形符總數(shù)是357個,其中包含在詞表1中的形符有239個,占整個課文形符的66.95%;在詞表2中的形符有41個,占整個課文形符的11.48%;在詞表3中的形符有37個,占整個課文形符的10.36%;未包含在上述詞表中的形符有40個,占整個課文形符的11.2%。第一課總共有308個詞族,其中包含在詞表1中的詞族有200個,占整個詞族的64.94%;其中包含在詞表2中的詞族有36個,占整個詞族的11.69%;其中包含在詞表3中的詞族有32個,占整個詞族的10.39%;未包含在上述詞表中的詞族有40個,占整個課文單詞的12.99%。
從表2我們可以發(fā)現(xiàn),第二課的課文單詞總數(shù)是822個,其中包含在詞表1中的單詞有653個,占整個課文單詞的79.44%;在詞表2中的單詞有61個,占整個課文單詞的7.42%;在詞表3中的單詞有96個,占整個課文單詞的1.46%;未包含在上述詞表中的單詞有96個,占整個課文單詞的11.68%。第二課的課文單詞形符總數(shù)是383個,其中包含在詞表1中的形符有254個,占整個課文形符的66.32%;在詞表2中的形符有50個,占整個課文形符的13.05%;在詞表3中的形符有11個,占整個課文形符的2.87%;未包含在上述詞表中的形符有68個,占整個課文形符的17.75%。第二課總共有308個詞族,其中包含在詞表1中的詞族有200個,占整個詞族的64.94%;其中包含在詞表2中的詞族有36個,占整個詞族的11.69%;其中包含在詞表3中的詞族有32個,占整個詞族的10.39%;未包含在上述詞表中的詞族有40個,占整個課文單詞的12.99%。
對比表1和表2,就會發(fā)現(xiàn)課文2無論在詞形總數(shù)上還是在詞符總數(shù)上都比課文1多;在各個級別的詞表上,除第一、三級別外,課文2都比課文1所占的百分比高,但第一級別所占的比例高正好說明文章越簡單。所以從總體上考察,課文2比課文1難,這樣的安排符合循序漸進(jìn)的原則。
為了直觀地觀察課文中的詞匯分級壯況,點擊圖1上方的“view”后,再點擊圖最下方的“l(fā)evel list words”,得到如下的圖3界面。
從圖3中我們可以清晰地看到,課文1中的詞匯標(biāo)上了不同的顏色,分別代表不同的等級,即紅色代表等級1的詞匯;綠色代表等級2的詞匯;藍(lán)色代表等級3的詞匯;沒有顏色的則是詞表中沒有出現(xiàn)的詞匯。這樣讓學(xué)習(xí)者一目了然,方便學(xué)習(xí)和選擇適合自己的讀物,如果顯示后三種或后兩種色占多數(shù),說明文章偏難,要降低難度,否則就要增加難度。
參考文獻(xiàn):
[1]汪榕培.英語詞匯探索[M].上海:上海外語教育出版社,1999.
[2]王文斌.英語詞法概論[M].上海:上海外語教育出版社,2005.
[3]Anthony,Laurence. AntWordProfiler.
[4]Coxhead,A.A new academic word list[A].Tesol Quarterly 2000. 34 (2):213-238.
[5]Francis,W.N.and Kucera,H.Frequency Analysis of English Usage[M].Boston: Houghton Mifflin Company.1982.
[6]West.M.A General Service List of English Words[M].London: Longman,Green, Co.1953.