朱音爾 張肖瑩
摘要:隨著計算機(jī)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,語言測試的介質(zhì)(medium)也在發(fā)生變化,基于計算機(jī)的語言測試將逐漸成為語言測試的主流。未來大學(xué)英語四、六級考試將借鑒托福、雅思向機(jī)考或網(wǎng)考的方向發(fā)展。在復(fù)旦大學(xué)等院校進(jìn)行大學(xué)英語機(jī)考嘗試的基礎(chǔ)上,我校進(jìn)行了為期一年多的小規(guī)模聽說和讀寫機(jī)考實踐。本文結(jié)合測試?yán)碚摻榻B了我校進(jìn)行的大學(xué)英語機(jī)考探索與實踐,通過對實踐結(jié)果、學(xué)生問卷調(diào)查等進(jìn)行分析,并結(jié)合國外(IBT)現(xiàn)狀,對機(jī)考提出了一些建議,希望對大學(xué)英語教學(xué)和考試的改革有所推進(jìn)。
關(guān)鍵詞:大學(xué)英語;機(jī)考;聽說;讀寫
中圖分類號:H319文獻(xiàn)標(biāo)識碼:B文章編號:1001-5795(2009)02-0063-0005
教育部頒發(fā)的《大學(xué)英語課程教學(xué)要求(試行)》規(guī)定,大學(xué)英語課程的教學(xué)目標(biāo)是:培養(yǎng)學(xué)生的英語綜合應(yīng)用能力,特別是聽說能力,使他們在今后工作和社會交往中能用英語有效地進(jìn)行口頭和書面的信息交流。但在以往的教學(xué)中,對學(xué)生的聽、說、讀、寫綜合能力重視不夠,特別是聽說能力。在新托??荚囍幸卜从吵鲋袊鴮W(xué)生的英語綜合能力不夠均衡,口語和寫作方面相對薄弱。為此大學(xué)英語四、六級考試也在不斷進(jìn)行改革,聽力權(quán)重加大、復(fù)合聽寫作為必考題型,多層次、多角度考核,以提高學(xué)生的英語綜合應(yīng)用能力。大學(xué)英語四、六級考試將借鑒托福、雅思,未來將向機(jī)考或網(wǎng)考的方向發(fā)展。我校作為全國大學(xué)英語教學(xué)改革試點院校,從2006年開始進(jìn)行小規(guī)模機(jī)考實踐,本文將結(jié)合測試?yán)碚搶C(jī)考實踐結(jié)果進(jìn)行分析討論。
1測試?yán)碚?/p>
測試?yán)碚撌且环N解釋測試資料間實證關(guān)系的理論學(xué)說。目前考試指導(dǎo)理論主要有兩種:以真分?jǐn)?shù)理論為代表的經(jīng)典測試?yán)碚摵鸵苑蔷€性的概率模型為代表的項目反應(yīng)理論。經(jīng)典測試?yán)碚摰幕舅枷胧前褱y試的得分看作真分?jǐn)?shù)和誤差分?jǐn)?shù)的線性組合,即線性的定性模型,包括平均分、標(biāo)準(zhǔn)差、難度、區(qū)分度、信度和效度等。其中平均分是用得最多的一種集中量數(shù)(所謂集中量數(shù)是指反映分?jǐn)?shù)集中位置特征的數(shù)值,常用它進(jìn)行不同分?jǐn)?shù)組之間的比較)。而標(biāo)準(zhǔn)差則是最重要的量數(shù),即一批分?jǐn)?shù)的離散程度。難度是指試題的難易程度。信度和效度是評價大學(xué)英語測試的兩個重要依據(jù),信度為“測試結(jié)果的一致或穩(wěn)定的程度”,即測試是否對學(xué)生的語言水平提供可靠的度量,通常以相關(guān)系數(shù)為數(shù)據(jù)指標(biāo),稱為信度系數(shù),信度系數(shù)越大測試信度越高。效度則涉及測試的有效性或測試結(jié)果的正確程度,作為衡量測試者水平的一種尺度,測試本身必須可靠有效。由于測試的目標(biāo)不同,效度也分為內(nèi)容效度、結(jié)構(gòu)效度等。隨著計算機(jī)技術(shù)的發(fā)展和計算機(jī)自適應(yīng)測試的發(fā)展,項目反應(yīng)理論越來越引起語言測試工作者的重視,該理論是經(jīng)典測試?yán)碚摰睦^承和發(fā)展,代表了語言測試領(lǐng)域的發(fā)展方向。項目反應(yīng)理論所采用的是非線性的概率模型,由許多數(shù)學(xué)模型構(gòu)成,每種模式都是建立在一定假設(shè)基礎(chǔ)之上的,既適用常模參照性測驗,又適用于標(biāo)準(zhǔn)參照性測驗,由于具有參數(shù)不變性等優(yōu)點,可編制出“因人施測”的自適應(yīng)測驗等新型測驗。但該理論雖然嚴(yán)謹(jǐn)卻艱深難懂,僅適用于大樣本測試資料的分析。本文所作的研究是小規(guī)模校內(nèi)機(jī)考測試,不需要十分精確,以經(jīng)典測試?yán)碚摓橹笇?dǎo)是實用的,比較簡單,易于操作。
2大學(xué)英語機(jī)考實踐
大學(xué)英語四、六級考試已實施多年,對培養(yǎng)大學(xué)生英語應(yīng)用能力起到了顯著的推動作用。隨著考生規(guī)模的不斷擴(kuò)大,機(jī)網(wǎng)考已被廣泛關(guān)注,我校為提高大學(xué)生英語綜合能力,增加了聽說課的授課時間,要求學(xué)生在網(wǎng)絡(luò)語音室、多媒體教室進(jìn)行自主聽、說、讀、寫訓(xùn)練,并于06年開始進(jìn)行小規(guī)模機(jī)考實踐,機(jī)考實踐包括聽說機(jī)考實踐(聽力與口語測試的結(jié)合)和讀寫機(jī)考實踐(閱讀與寫作測試的結(jié)合),以適應(yīng)大學(xué)英語教學(xué)與考試改革的需要。
2.1大學(xué)英語聽說機(jī)考實踐
我校大學(xué)英語聽說機(jī)考是在2005級實驗班中進(jìn)行的,其中A、B級學(xué)生3個班和c、D級學(xué)生3個班(學(xué)生根據(jù)入學(xué)英語成績高低被分成A~D四級),06年進(jìn)行了兩次考試。時間安排在2006年3月第二學(xué)期開學(xué)初和2006年7月學(xué)期末,地點在多媒體語言實驗室,軟、硬件設(shè)備全部使用我校教育設(shè)備有限公司生產(chǎn)的多媒體數(shù)字語言實驗系統(tǒng)。時間安排在第二學(xué)期進(jìn)行主要是考慮A、B級學(xué)生經(jīng)過一個學(xué)期的自主學(xué)習(xí)和教師輔導(dǎo),對聽說課程和多媒體語言實驗設(shè)備逐步熟悉,c、D級學(xué)生在自主學(xué)習(xí)和教師的強(qiáng)化訓(xùn)練后,聽說水平都有所提高,此時進(jìn)行機(jī)考,學(xué)生都能達(dá)到較好狀態(tài)。A、B級和c、D級聽說機(jī)考分別進(jìn)行,借鑒金艷(2002)等學(xué)者的研究和復(fù)旦大學(xué)等高校的做法,以及大學(xué)英語四、六級口語考試的內(nèi)容設(shè)計考題,對口語機(jī)考中需要注意和改進(jìn)的地方,如效度不夠、形式有限(邱東林等,2005:4)等不足之處,在命題中盡量彌補(bǔ),以英語的溝通、交流能力為出題思路進(jìn)行命題,測試學(xué)生的聽力水平和口語表達(dá)能力。A、B級考試內(nèi)容包括:第一部分熱身練習(xí),這部分考題要求考生聽到錄音后做簡短回答,即考生先聽一段廣播電視節(jié)目或外臺英語新聞報道,要求考生聽到錄音提問后做簡短回答,主要目的是讓學(xué)生盡量放松進(jìn)入應(yīng)考狀態(tài)。第二部分圖片描述并回答問題,要求考生在一分鐘的準(zhǔn)備后,對圖片進(jìn)行描述,在概括給出圖片內(nèi)容的基礎(chǔ)上發(fā)表自己的觀點和看法。第三部分是在第二部分的基礎(chǔ)上,由計算機(jī)編成二人組(同桌)進(jìn)行交流討論(任一幅圖片均可),以此來彌補(bǔ)機(jī)考形式有限的不足??荚囬_始,考生根據(jù)教師安排進(jìn)入多媒體語言實驗室,按指定位置就座,考題隨機(jī)選定,每場考試用2套試題,以保證相鄰的考生之間題目各不相同。c、D級學(xué)生因起點較低,故試題相對簡單,考試內(nèi)容包括:①課文朗讀:要求發(fā)音清晰,語調(diào)正確,朗讀流暢。朗讀的段落顯示在電腦屏幕上,學(xué)生準(zhǔn)備時間為一分鐘,考試時間為兩分鐘。朗讀是聽說的基礎(chǔ),以此來提高學(xué)生的聽說能力。②即興發(fā)言:要求學(xué)生在一分鐘準(zhǔn)備后,描述圖片內(nèi)容并發(fā)表個人的觀點。第三部分二人組交流、討論與A、B級相同??荚嚨攸c也在多媒體語言實驗室,其它要求與A、B級相同??荚嚱Y(jié)束后,學(xué)生的答卷收集到實驗室主機(jī)中或移動硬盤上,統(tǒng)一評分標(biāo)準(zhǔn)后教師各自閱卷。閱卷結(jié)束后,將成績上交。
評分標(biāo)準(zhǔn)如下(總分100分):
從考試結(jié)果看,第一、第二部分學(xué)生發(fā)揮較正常,第三部分交流較差,有的只是一人講,而另一人講得很少,有的則長時間停頓。在后來的自主學(xué)習(xí)中,我們在語音室利用電話交流、聊天室等功能加強(qiáng)了這方面的訓(xùn)練。
第二次聽說機(jī)考還是A、B級和C、D級分開進(jìn)行??荚囶}型與第一次考試有所不同,增加了一定難度。A、B級除增加兩人組辯論外,第一部分聽說內(nèi)容中考生聽到的是VOA STAND英語新聞報道,語速明顯加快,第一遍聽音后,電腦屏幕上顯示出與所聽內(nèi)容相關(guān)
的問題,停30秒后再聽第二遍,再停30秒后考生回答問題,時間為2分鐘,要求不僅要聽懂、記牢,還要說出來,這樣就把聽力和口語表達(dá)有機(jī)地結(jié)合起來。第二部分還是圖片描述:要求與第一次相同。第三部分是二人組辯論,二人組辯論是新題型,目的是考查學(xué)生就某一問題發(fā)表自己看法的能力和在辯論中的應(yīng)變能力,從而提高他們的英語交際能力??荚囬_始,由計算機(jī)自動為學(xué)生配對。辯論的題目出現(xiàn)在屏幕上,并標(biāo)明正方(side A)反方(side B)兩方的觀點。每位學(xué)生的屏幕右上方會顯示出candidate 1或candidate 2,分別代表side A和side B。準(zhǔn)備時間為1分鐘,辯論時間為4分鐘(每人辯論的累計時間為2分鐘)。辯論的題目共8套,都是學(xué)生比較熟悉、與所學(xué)課程相關(guān)的內(nèi)容,學(xué)生會覺得有話可說。這部分評分標(biāo)準(zhǔn)為滿分50分(表達(dá)思想30分,與對手的交流20分),如果各人講各人的,沒有與對方辯論,將扣除20分。評分標(biāo)準(zhǔn)參考第一次考試。例如:
Topic : Should there be a compulsory blackout in college dormitories during sleeping hours?
Side A : There should be...Side B : Side B : There should not be ...
c、D級題型也有變化,第一部分為聽說:要求先聽一段英語新聞(special English),第一遍聽音后,停一分鐘,電腦屏幕上出現(xiàn)所要回答的問題,然后聽第二遍,停一分鐘后回答相關(guān)問題。第二部分為即興發(fā)言,第三部分二人組交流,要求與第一次相同。
第二次考試成績?nèi)缦?總分100分):
因為第二次考試題型有所變化,學(xué)生對辯論題型不熟悉,所以A、B級分?jǐn)?shù)沒有提高,但由于題型難度加大,實際水平已提高。c、D級因題型沒有太大變化,再加上教師在課堂上對學(xué)生進(jìn)行了訓(xùn)練,分?jǐn)?shù)都有提高。
第三學(xué)期對以上班級用類似題型又進(jìn)行了兩次考試(期中和期末),學(xué)生的測試成績都有較大提高(表略)。
3.1.1大學(xué)英語聽說機(jī)考實踐結(jié)果分析
通過一年多的機(jī)考實踐,學(xué)生的英語聽說能力都有較大提高,我們對參加機(jī)考實踐的學(xué)生分別做了問卷調(diào)查、訪談等,并結(jié)合測試?yán)碚撨M(jìn)行分析討論。
信度分析:
信度的高低與題目的難易度、考生的成績分布以及題目的區(qū)分度是相關(guān)的。從整體上看,四次的機(jī)考成績呈正態(tài)分布規(guī)律,平均值與第一學(xué)期直接式口試成績(AB級80.3分;CD級70.1分)比較,成績呈上升趨勢,標(biāo)準(zhǔn)差也在正常范圍。本測試的目的是考察學(xué)生對于真實語言材料掌握的熟練程度以及運(yùn)用語言知識組織口頭交流的能力,把握“有用性”原則,測試中使用了真實的測試任務(wù)。兩套試題難易程度相當(dāng),試題難度逐步加深,間接提高區(qū)分度,評分一致,從而提高了考試信度。
效度分析
效度即測試的有效性或測試結(jié)果的正確程度,是經(jīng)典測試?yán)碚摰囊豁椫匾笜?biāo),分為表面效度、內(nèi)容效度、結(jié)構(gòu)效度等。
表面效度:我們通過訪談、問卷等方式了解學(xué)生對測試的態(tài)度、反映和感覺。調(diào)查顯示:學(xué)生對機(jī)考的態(tài)度是積極的,反映是好的,機(jī)考可以利用屏幕展現(xiàn)真實交流情景,刺激思維。機(jī)考的表面效度似乎不及直接面試,但仔細(xì)分析機(jī)考的過程,就會發(fā)現(xiàn)其表面效度并不比SET低(蔡基剛,2005)。通過對考生適應(yīng)度調(diào)查發(fā)現(xiàn),學(xué)生對口語機(jī)考是適應(yīng)的,但CD級學(xué)生對話交流的適應(yīng)度則較低。也有學(xué)生認(rèn)為描述圖片時對著計算機(jī)說話感覺不自然,辯論的效果也不理想,還有設(shè)備故障問題等。
從AB級和CD級學(xué)生對機(jī)考的態(tài)度看,AB級要好于CD級。
內(nèi)容效度:是指考試內(nèi)容對欲測內(nèi)容的代表性的程度。在本測試中,測試類型從非交際類聽說:模仿朗讀、熱身提問等考察語音語調(diào)的單向交流,到半交際類聽說:即興發(fā)言、圖片描述、簡短回答等需要通過思維活動(主要是受試者單方面的)交流,再到交際類聽說;人機(jī)對話、兩人辯論、小組討論等更接近于真實的交際環(huán)境,基本覆蓋了所要考察的內(nèi)容。采用復(fù)本法和再測法相結(jié)合分析四次測試成績,學(xué)生成績提高較大,這說明測試具有較高的內(nèi)容效度。
結(jié)構(gòu)效度:是用以衡量在測試中的表現(xiàn)在多大程度上能被有意義地解釋為某特征或素質(zhì)的指標(biāo)。測試的內(nèi)部關(guān)聯(lián)性是結(jié)構(gòu)效度的一種度量,是測試各組成成分之間的相互關(guān)聯(lián)性,即測試之所以包含不同組成部分,是因為各部分測試的是不同的素質(zhì),一起構(gòu)成測試的全部。從測試任務(wù)看,測試包含表面效度高的任務(wù)(小組討論)或小組討論+圖片描述,從訪談和測試成績看,二人組辯論和對話交流是學(xué)生認(rèn)為能反映口頭交際能力、難度適中的任務(wù),也是表面效度最高的試題,課文朗讀形式由于信息加工程度較低而被認(rèn)為容易,圖片描述CD級學(xué)生認(rèn)為較難,這與金艷(2002)和呂長茲(2006)等學(xué)者的研究結(jié)論一致。
間接考試表面看效度雖不很高,但由于評分與考試分開,其信度又高于直接型考試,可減輕任務(wù)因素對考生成績的影響。
3.1.2大學(xué)英語聽說機(jī)考實踐的啟示
本次實踐是非常有益的嘗試,它把聽力和口頭表達(dá)有機(jī)結(jié)合,使學(xué)生對聽說更加重視,學(xué)習(xí)興趣高漲,特別是c、D級學(xué)生,自信心大大增強(qiáng),報考大學(xué)生英語競賽的學(xué)生明顯增多。大學(xué)英語聽說機(jī)考與傳統(tǒng)口語考試相比省時、省力,如以上三個實驗班在傳統(tǒng)口語考試中,每人約6分鐘需要十幾小時,而采用機(jī)考在語音室中48臺電腦只需一位老師,每場15~20分鐘,三個班只需45~60分鐘。但在機(jī)考前教師要花很多時間準(zhǔn)備考題,當(dāng)然如果有合適的題庫,這部分時間可以不計。所以從長遠(yuǎn)角度考慮,口語機(jī)考是省時省力、簡便易行的,避免了傳統(tǒng)口語考試中的主觀因素??谡Z機(jī)考客觀公正、資料易于保管,閱卷時可回聽、比較,增加了考試的信度。
3.2大學(xué)英語讀寫機(jī)考實踐
大學(xué)英語讀寫機(jī)考是閱讀與寫作相結(jié)合的綜合能力測試。我校從學(xué)生的個性特長出發(fā),培養(yǎng)學(xué)生的英語綜合能力,決定對大學(xué)英語課程體系進(jìn)行調(diào)整,“綜合測試”由原來的必修課改為選修課,學(xué)生可根據(jù)自己的興趣和志向選修。此次參加實驗的是選了“綜合測試”課程的A、B級學(xué)生,先后進(jìn)行了兩次閱讀與寫作機(jī)考實踐,第一次機(jī)考在2006年9月第三學(xué)期開學(xué)初,主要測試學(xué)生閱讀理解與寫作相結(jié)合的英語綜合能力??荚噧?nèi)容由三部分組成:閱讀理解(包括仔細(xì)閱讀和快速閱讀),仔細(xì)閱讀測試題型是多項選擇和選詞填空,除測試篇章閱讀理解外,還包括對篇章語境中詞匯理解的測試??焖匍喿x測試題型為是非判斷+句子填空等,測試各種快速閱讀技能。綜合測試由兩部分組成:第一部分為完型填空或改錯(多項選擇、錯誤辨認(rèn)并改正),第二部分為短句問答或句子(簡短回答、中譯英)。第三部分為短文寫作。本次機(jī)考為兩套試
題,基本上選自大學(xué)英語四、六級考試真題的內(nèi)容,考試隨堂進(jìn)行,全部安排在多媒體數(shù)字語言實驗室。因為學(xué)生對題型相對熟悉,前兩部分發(fā)揮比較正常,但也存在一些問題,如部分題目理解不夠正確等,第三部分作文是在計算機(jī)上寫作,有部分學(xué)生不太習(xí)慣,發(fā)揮不夠理想。
針對第一次讀寫機(jī)考實踐中存在的問題,我們在平時作業(yè)中除了加強(qiáng)課外閱讀外,還加強(qiáng)了學(xué)生在計算機(jī)上的寫作訓(xùn)練,鼓勵學(xué)生在網(wǎng)上交流,并通過電子郵件形式遞交寫作訓(xùn)練,以此提高學(xué)生的寫作興趣,增加練習(xí)機(jī)會。
第二次機(jī)考是在2007年1月第三學(xué)期末,題型與考試地點與上次相同,還是隨堂測試。這次成績比上次稍好些,但作文成績還是不夠理想,這與多種因素有關(guān),如:時間不夠、對寫作沒有緊迫感、不重視、提不起興趣(王懿等,2006:5)等。
3.2.1大學(xué)英語讀寫機(jī)考結(jié)果分析
在大學(xué)英語各項能力中,寫作能力的培養(yǎng)一直是比較難以解決的問題(黃勇等,2006:2),可以利用計算機(jī)和網(wǎng)絡(luò)來提高學(xué)生的寫作能力。閱讀與寫作相結(jié)合不僅有利于寫作能力的提高,而且有利于學(xué)生整體語言能力的提高。從對學(xué)生的問卷調(diào)查和訪談中,學(xué)生對讀寫機(jī)考還是持肯定態(tài)度的。但也存在一些問題如:有些學(xué)生不善于在計算機(jī)上閱讀、寫作,有的閱讀較慢,長時間盯著顯示器眼睛容易疲勞等。
大學(xué)英語讀寫機(jī)考是閱讀與寫作相結(jié)合的綜合能力測試,因測試較少本文對此不做詳細(xì)分析。
3大學(xué)英語機(jī)考存在的主要問題
(1)試題庫建設(shè):語言測試的題庫不同于一般的數(shù)據(jù)庫,決不僅僅只是若干試題的簡單組合(田文燕,2006:5),試題庫中的試題不僅要考慮題目的難度值,還須考慮區(qū)分度以及答案的可猜測度,題庫建設(shè)是一項系統(tǒng)工程,是實現(xiàn)機(jī)考的先決條件。
(2)人機(jī)互動問題:在機(jī)考口語測試中,應(yīng)解決好人機(jī)互動問題,口語是一種交際性很強(qiáng)的語言能力,目前這種機(jī)考方式還不能體現(xiàn)真實的語言交際能力。
(3)設(shè)備問題:機(jī)考對軟、硬件設(shè)備都有較高的要求(如電腦、聲卡、麥克風(fēng)、顯示器分辨率等),評分系統(tǒng)也需不斷完善,隨著評分系統(tǒng)的完善,測試題型的綜合性才能越來越強(qiáng),測試精度才能提高。
(4)考生計算機(jī)操作的熟練程度,可能會對測試效度產(chǎn)生一定影響。
4結(jié)語
隨著語言教學(xué)手段及方法的進(jìn)步,語言測試的手段也在不斷發(fā)展,新TOEFL全面實行機(jī)考,對我國這一考試大國是一個觸動,盡管基于紙筆的測試在相當(dāng)長的時期內(nèi)仍不會退出歷史舞臺,但在遠(yuǎn)程教育、證書考試等大規(guī)模測試和分班測試、成績測試等小規(guī)模測試中,基于計算機(jī)的語言測試已顯示出巨大的優(yōu)勢(李清華,2006:4),基于計算機(jī)的語言測試將逐漸成為測試的主流,我們會在今后的機(jī)考實踐中不斷進(jìn)行探索與研究。