摘 要:分析比較了雅思作文評分標準和專業(yè)八級作文評分標準。通過研究專業(yè)八級傳統(tǒng)寫作評分體系所存在的問題,從信度、操作性以及反撥作用三個角度指出相較于雅思寫作評分標準,專業(yè)八級考試寫作部分所存在的主要問題,并由此提出了改進的方向,提高考試信度,增強閱卷人可操作性,促進英語專業(yè)寫作實踐和教學發(fā)展。
關鍵詞:專業(yè)八級寫作;雅思;信度;反撥作用
寫作測試是外語能力綜合測試,特別是大規(guī)模的標準化測試的一個必要組成部分和評價指標。語言能力測試專家和測試者,試卷研究和開發(fā)人員都對此愈加重視。英語專業(yè)八級考試(TEM-8)作為唯一針對綜合性大學英語專業(yè)學生所設立的語言能力綜合測試,具有專門性、高難度、高權威等特點。而寫作所占的20%的比重也直接關系到受試者最后綜合得分。
一、整體評分與分項評分
整體評分(holistic scoring)或者印象法(impression method)是大規(guī)模寫作測試中最常用的評分方法。 所謂整體評分,就是評分者在通讀待評作文的基礎上,根據(jù)評分量表(scoring scale)或者評分細則(scoring rubric)評分。評分過程中,沒有分項分,而是在1至5、1至10或1至15區(qū)間內(nèi)整體評分。英語專業(yè)八級考試中,評分者通讀后,憑借對文章的整體印象在四個分數(shù)段位(6~8,9~11,
12~14, 15~17, 18~20)進行打分。正如Cooper(1977)所說,整體評分過程實際上是一個根據(jù)評分要求對學生作文進行“排隊”的要求。
分項評分(analytic scoring)或者分析法(analytical method)是將測試語言劃分為幾個組成部分,根據(jù)考試要求賦予各部分不同
的權重。雅思的寫作評分標準(band descriptors)將寫作能力劃分為了四個部分,分別是寫作任務回應情況(Task Response),連貫與銜接(Coherence and Cohesion),詞匯豐富程度(Lexical Resource)與語法多樣性及準確性(Grammatical Range and Accuracy)。評分者通過對各個部分分別在1~9分區(qū)間打分,然后將四個部分累加后
再進行平均,所得到的平均值就是該評分員所給評分。
二、當前專業(yè)八級寫作評分體系問題
1.信度飽受爭議
整體評分的信度如何歷來飽受學界爭議?,F(xiàn)有研究結果表明,使用整體評分法時評分員之間的信度相關系數(shù)通??蛇_到0.86,0.90,或0.721~0.932,中數(shù)為0.880。評分員自身的信度相關系數(shù)可達到0.874~0.936(鄒申,2002)。然而,Vaughan(1991)根據(jù)其所做的調(diào)查指出,“評分員雖然事先所接受的訓練相同,但評分員的個體差異使得他們在評改作文當中仍會側重作文的不同方面,并且更有可能采用個人的閱卷方式。由此看出,整體評分方法事實上是一種個人獨立思考后作出決定的行為?!边@一主觀性和其帶有的不穩(wěn)定性體現(xiàn)在評閱人評閱方式多樣性。Vaughan(1991)曾經(jīng)對評分員的風格做過一個調(diào)查。調(diào)查結果表明評分員各有其鮮明的評閱方式。例如,有的采用“單一側重點”方式(The Single—Focus Approach),側重作文的及格與否。有的是靠“第一印象”評閱(The“First Impression Dominates”Approach),作文所給予的最初印象決定了分數(shù)的等級。有的采用“雙重類別”策略(The“Two—Category”Strategy),在評閱中既側重作文的組織又側重作文的語法。還有的則采用“語法為中心”的方法(The Grammar—Oriented Approach)。既然整體評分方法相較其他評分方法更多變,其信度自然更具不
穩(wěn)定性。
2.缺乏反撥作用
無論是測驗寫作還是課堂寫作,其評估的目的是對學生的能力進行診斷分析,讓學生明確其寫作中存在哪些問題,在哪些方面能力有待加強。因此,評價標準中的描述必須對提高學生的寫作能力起到指導作用。有研究者調(diào)查發(fā)現(xiàn),絕大多數(shù)學科負責人熟悉TEM8考試大綱,但對考試評分標準熟悉程度不夠(約14.7%),對評分標準選擇“不清楚”的人數(shù)也是最多的(約13.7%)(徐倩,2012)。在探討反撥作用對日常寫作實踐之間關系之前,首先需要了解當前英語寫作,尤其是ESL學生在寫作中集中體現(xiàn)的問題。首先,英語專業(yè)八級考試測試的是英語專業(yè)高年級學生的英語水平。因此作文時要充分調(diào)動創(chuàng)造性和寫作技巧(王馥芳,劉險峰
2003)。以2003年TEM8考試作文題目為例:2003年TEM8作文部分的題目如下:An English newspaper is currently running a discussion on whether young people in China today are(not) more selfcentred and unsympathetic than previous generations were. And the newspaper is inviting contributions from university students.You have been asked to write a short article for the newspaper to air your views. 在對考生試卷統(tǒng)計中,有研究者調(diào)查得出,考生的主要問題,并不是來源于文章篇章結構,相反,考生文章結構組織得比較好,也就是說,文章普遍做到了開篇亮出觀點、層次較清晰、論據(jù)與主題關系較密切、論述較合情理、結尾點題等。這些都在專八評分標準有所描述。而考生主要的問題出現(xiàn)在以下幾個方面:(1)觀點和內(nèi)容普遍缺乏新意。絕大多數(shù)考生審題時非肯定即否定,持部分肯定或者“無可比性”的考生比例極低,辯證思維不強。(2)語氣鮮明性不夠,體現(xiàn)在文章感染力不強和讀者意識不強。
3.缺乏可操作性
尤其對于缺乏經(jīng)驗的評分人員尤其如此,在對TEM8寫作考試評分員差異性研究中發(fā)現(xiàn),缺乏經(jīng)驗的評分人員評分寬松,個別評分人員對評分標準的把握有偏差(張艷莉,彭康洲,2012)。專家和學科負責人都希望分數(shù)報告能夠更為具體,不僅提供總分,也要有單項分和各分數(shù)段對應語言能力的描述(徐倩,2012)。這都要求寫作評改當中,評分標準和評分描述要更為具體。在TEM8評分標準中,評分標準共分為五檔,而雅思評分標準中卻分為了九檔,在檔位上更為細致。在組織(organization)上,TEM8評分描述顯得缺乏操作性,評分描述從well developed, a generally well developed, an adequately developed, an inadequate organizational structure到最低的has neither an organizational structure nor coherence.我們可以看出這五個檔位的描述差異細微、籠統(tǒng),讓缺乏經(jīng)驗的評分人員感到茫然。相比之下,雅思在結構中評價中凸顯了cohesion或cohesive devices(銜接手段)、paragraphing (分段)、clear progression(清晰的行文推進),central topic within each paragraph(每段的核心主題)等一系列顯性指標,使評分員操作性更強。
三、關于專業(yè)八級寫作評分標準與雅思寫作評分標準的幾點
思考
1.鼓勵在評分標準中體現(xiàn)創(chuàng)新,提倡學生日常寫作逆向思維
寫作本身是一個創(chuàng)造性和批判思維的過程。而專業(yè)八級寫作中普遍反映出觀點和內(nèi)容缺乏新意,只有從專業(yè)八級寫作評分標準這一“指揮棒”上進行改造,最大程度調(diào)動學生寫作創(chuàng)造性和教師教學創(chuàng)造性。
2.培養(yǎng)讀者意識,與中文“讀者責任型”寫作思維不同,英語提倡“作者責任型”寫作思維
所謂“作者責任型”是指英語作者在使讀者理解文章內(nèi)容方面得承擔大部分的責任??ㄆ仗m曾說,與漢語作者相比,英語作者認為自己對讀者負有更大的責任(尤澤順,2002)。這就要求評價英文作文時首先要看本文作者是否具有讀者意識,而相應的考試評分標準也必須把讀者意識納入考量。只有這樣,才能促進學生實踐和教師教學中最大程度地重視讀者意識的培養(yǎng)。Moffett(見鄧志勇,2002)曾說:“任何教寫作的人,其首要任務是培養(yǎng)讀者意識,如果不培養(yǎng)讀者意識,教學難有什么效果?!?/p>
3.引入和借鑒雅思分項評分標準
不斷細化和量化評分指標的描述,要避免像“adequately”“relatively”“effectively”等模糊不清的評分描述。增強評分指標的操作性。只有這樣才可以減少不同評閱人所帶來的誤差,最大限度增加專八寫作部分考試的信度。
評分標準的制定是評分效度的基礎,做到如何科學、全面、便于操作不是件簡單的事情。
英語作文作為一種英語技能的測試方式,可以考查考生的寫作能力,能較如實地反映其綜合應用英語的能力,因而,各種英語考試中作文題常常是必要的項目,在國外一些考試中甚至是唯一的項目。只有不斷借鑒包括IELTS在內(nèi)的國外標準化英語水平測試寫作評分標準,取其精華,去其糟粕。改善專業(yè)八級寫作評價信度,操作性以及對于寫作實踐與教學的反撥作用,才能真正將專業(yè)八級考試作為英語專業(yè)高年級水平測試的公信力和權威性樹立起來,指導我國英語專業(yè)學科發(fā)展。
參考文獻:
[1]鄒申,楊任明.他們?nèi)绾问褂脤懽髟u分標準?:TEM4新老評分員調(diào)查[J].國外外語教學(FLTA),2002(3):1-6.
[2]張艷莉,彭康洲.TEM8寫作考試評分員差異性研究[J].外語電化教學,2012(143):42-46.
[3]徐倩.英語專業(yè)八級考試的反撥作用研究:對外語專家和英語學科負責人的一次調(diào)查[J].外語界,2012(3):21-31.
(作者單位 福建農(nóng)林大學金山學院)
編輯 王 輝