鐘偉軒
(河池學院外語系廣西宜州546300)
探析網考下英語四級聽力測試的效度
鐘偉軒
(河池學院外語系廣西宜州546300)
自從大學英語四級考試改革后,網考測試中的聽力部分顯得舉足輕重,本文先闡述效度在英語測試中的作用,概述影響效度的因素,在此基礎上試探析聽力測試的效度,并對聽力教與學的反撥效應進行概括分析。
英語四級;聽力測試;測試效度;反撥效應
大學英語四級考試作為對大學生英語水平考核的重要衡量標準,也是學生和社會普遍公認的資格考試,自1996年的最初嘗試改革到1998年大刀闊斧的變革,最主要表現(xiàn)為大學英語四級考試由原來的傳統(tǒng)筆紙答題方式轉變?yōu)榫W考測試,即利用計算機來作答考試。從考試中各題型所占的百分比來看,聽力測試部分占據(jù)了70%,其中包括25%的聽力理解和45%的綜合聽力部分。無論從出題角度、題型設置還是考察核心無不看出聽力比重在逐步增加,聽力的重要性尤其凸顯。[1]不容置疑,大學英語等級考試的網考趨勢是在當今計算機時代背景下的大勢所趨,而側重考察學生對英語聽說等實際應用方面的考察也是考試的重中之重。網考中圖、聲、文并貌無疑為考試帶來了難度,對提高我國目前學生普遍聽力水平較低的現(xiàn)狀無非起到刺激和促進作用。但是,改革的過程同時是一個逐步完善的過程,對于改革中好的成果應該給予肯定和發(fā)揚,而對于不合理的問題應該及時發(fā)現(xiàn)并反思。效度作為測試的重要質量指標,測試只有具有較高的效度,才可以正確地解釋和使用測試的分數(shù),測試才具有意義。[2]本論文試分析效度在大學英語四級考試中的作用及其影響因素,試探網考下英語四級聽力測試的效度,并對聽力教與學的反撥效應進行初步分析。
效度又稱有效性,指測試的有效程度,即測試的內容和方法是否能測出預定要測量的東西。比如說,本想要測量聽力理解能力,但采用的卻是筆頭回答問題的方法。其結果,所測量的是受試者的筆頭表達能力,而不能反映其聽力理解能力。這就好像用秤來量高度,其結果只能測出重量,不能達到測量的目的。效度又分表面效度、內容效度、結構效度、經驗效度和效標關聯(lián)效度。表面效度是指某個測試或考試從表面看來是否測了旨在測量的東西,有沒有缺漏的部分,有沒有偏離標題。這是觀察者靠主觀評價得來的效度。內容效度指測試的內容是否是應該考查的,是否反映了這項測試的要求,或者說試題所包含的內容代表性、準確度和覆蓋面如何。在成績測試中更需要注意是否包括了教學的主要內容。比如在聽力測試中不能包括典型的口語會話,則這一考試的內容效度不高。評價內容效度主要采用邏輯方法進行定性分析。結構效度,又稱理論效度,即是否以有效的語言觀為測試依據(jù),指考試的結果在多大程度上符合我們根據(jù)某種理論做出的預測,而用這種理論來解釋測試的成績。效標關聯(lián)效度,是指確定一種能反映測試效度的參照標準,然后參考某一考試與該標準之間的關聯(lián)程度。這種效度標準通常是其他效度高的考試,尤其是大規(guī)模的標準化考試。這種效度本身要有效。標準效度又分共時效度和預測效度。共時效度指這次考試與時隔不久的作為標準的另一次考試相比較,看兩者的相關程度。預測效度指這次考試與未來的考試相關的程度。比如某校的英語聽力考試與大學英語四級網考聽力部分考試的相關系數(shù)很高,如果學校的考試成績高,就可以預計大學英語四級考試聽力的成績也會高。再如某一水平考試是評定學生的英語聽力能力是否能繼續(xù)深造的一個更高的聽力水平,那么學生入學后在學習中所表現(xiàn)的實際聽力能力,就是對這一水平考試預測效度的判定。通常一項考試不太可能同時具有上述四種效度。成績測試和診斷測試要求有較高的內容效度,學能測試應有較高的理論效度和預示效度,水平測試則要求有較高的共時效度和預測效度,大學英語四級考試就屬于典型的水平測試,因此對共時效度和預測效度就會有較高的要求。
首先,測試的目的不明確,考核內容不清楚會影響效度。如測試聽力能力,就不能讓內容過于簡單口語化。其次,命題方面的技術性問題也會影響效度。試題要清楚明了,不能用太多的生僻詞匯,太復雜的句式結構。試題不能太多或者太少,太多做不完,太少不足以反映受試者的全面情況。也不能太難或者太容易,太難太易都不能測出受試者的真實水平。試題要避免歧義或試題之間相互暗示。試題編排順序要由易到難,要防止排列有規(guī)律而可能對答案產生暗示。最后,組織管理方面的問題會影響效度。指導語不清楚或太難,受試者不能正確理解題目的要求。場地設備條件差或者臨時出現(xiàn)故障,影響了考試??紙鼋M織、紀律問題,監(jiān)考者不按時開考或給受試者以提示都會影響到考試效度。
4.1結構效度
結構效度是最重要的效度,是效度的核心問題。所謂的結構并不是對考試內容的題型的分析,而是考試的理論基礎。如果考試所測的內容與考試原理相吻合,那么測試結構效度就是好的。英語四級網考的語言觀是結構主義語言觀,重視共時語言即口語的研究。對于聽力是否是核心關鍵,語言測試界還沒有界定,有待網考的進一步發(fā)展加以證實或證偽。
4.2共時效度
以一次測試成績就作為判定結果難免有失公平性與準確性,共時效度的分析可與上次考試時隔不久的再次考試相比較,這就大大確保了評估的科學性。四級網考聽力測試在共時上相對有保障。筆紙考試滿足了效度、信度、區(qū)分行、可行性等原則,網考則很好地遵循保留著這些原則,在此基礎上和筆考對比驗證共時效度。
4.3內容效度
四級網考聽力包括試聽理解和試聽綜合兩大部分,其考試形式包括音頻新聞、對話、跟讀和視頻新聞、聽寫、寫作。依照考試大綱,一般從三方面檢驗某次測試的內容效度。1測試內容是否和測試目標有關。2.測試內容是否具有代表性。3.測試內容是否適合測試對象,既不太難也不太易。從這三方面考慮可做如下分析:1.課上能聽懂老師所講的主旨,并進行討論。四級網考的試聽寫作即這樣測評學生的能力。學生通過視頻聽取材料,聽懂后發(fā)表闡明自己觀點。貌似這樣做是合情合理的,可是學生的能力并不是均衡的水平,可能他的聽力能力強,但他的寫作能力卻相對薄弱,即使聽懂了材料內容卻無法正確寫出答案。相反,即使學生的寫作能力強,如果沒有好的聽力能力同樣無濟于事,不會得到高分。所以,這樣測量寫作能力可能是無效的。網考中基于視聽的寫作其內容效度是值得懷疑的。2.英語網考的聽力來源一般都是BBC、VOA等英美廣播電視節(jié)目中的新聞、報告等真實視頻、音頻材料。而原來的考試都是命題人有目的地把要考查的語言知識加入到考題中,如今的網考聽力恐怕沒有足夠來源能包含想要考查的方方面面知識點,所以考查內容的代表性減弱了,內容效度也會有所降低。3.教育部公布的《大學英語課程教學要求》對聽力理解能力的一般要求是能聽懂英語授課,能聽懂日常英語談話和一般性英語題材的講座,能聽懂語速較慢(每分鐘130-150詞)的英語廣播和電視節(jié)目,能掌握其中心大意,抓住要點。能運用基本的聽力技巧。VOA的正常語速是每分鐘130-160詞,慢速則約為95,相比之BBC語速稍快150-180每分鐘。如果選用BBC的語速則高于或等于國家規(guī)定的要求,如果選用VOA慢速又低于要求水平。無論快慢都與內容效度要求的測試目標的相關性測試對象的適合性有出入。綜上可知,英語四級網考聽力還是偏向有難度的,這點又不符合大綱要求的既不太難也不太易的規(guī)定,內容效度降低。
“反撥效應”是指測試對教和學所產生的影響。隨著網考聽力分值的大幅增加,教師更加重視聽力的教學,學生也更注意日常的聽力學習。無論教師還是學生已都無法忽視網考聽力的重要性了。同時,這種突出的變化也帶來了正反兩方面的影響。從積極的角度來看,教師需要大量學習,為自己的知識注入新鮮血液以便可以改進教學方法,提高自身的教學水平,更好地教授知識給學生。其次,利用網絡媒體圖聲文并貌的教學,建立真實的英語語言學習環(huán)境,使教學更加新穎生動活潑,提高學習外語的實際應用能力,也促進了學生對于電腦等多媒體使用方面的綜合能力的提高。這種教學方式,課下也是需要大量的時間學習的,這就增強了學生自主學習英語口語的能力,培養(yǎng)了學習的樂趣,減少了像傳統(tǒng)教學的對教師的依賴。從消極方面來看,英語網考畢竟還處于發(fā)展的初級階段,沒有相對成熟的教學模式來支撐。僅過分強調英語口語的發(fā)展,其實違背了語言學習的認知規(guī)律。只重視口語學習的學生,對他們而言也是違背了大學生學習英語的目的,因為英語學習閱讀和寫作也是尤為重要的,不能單方面重視聽力而忽視了其他能力的培養(yǎng)。從學校的角度看,學??赡転榱颂岣哌^級率過分重視對口語教學的投入,大量資金打造硬件設施這都是不明智的。[3]我國不同地區(qū)基礎教育有差距,教育資源基礎設施都不能達到同一高度,參差不齊。待網考的進一步全國式的普及后方可知道最終會產生什么效應。
對于英語四級網考聽力測試的結構效度要根據(jù)語言觀的有效性確定,有待進一步的驗證。網考遵循筆考的原則,共時效度保障的較好。網考的內容效度有超綱的嫌疑,試題材料也缺少多樣性,內容效度有受損。因此,大學英語四級網考聽力測試的效度有待進一步地探究。
[1]教育部辦公廳.大學英語課程教學要求,2007.7
[2]蔡基剛.大學英語四六級網考:意義和反撥作用[J].外語電化教學,2009,(5).
[3]尹揚帆.中國高校英語教學與研究[M].復旦大學出版社,2007.
(責任編輯:陸遐)
H319.9
A
1671-6469(2012)02-0072-03
2011-11-06
鐘偉軒(1976-),男,廣西鐘山人,河池學院外語系,講師,研究方向:大學英語教學。