易娜伊(東北師范大學(xué)外國語學(xué)院,吉林長春,130024)
高春明(長春理工大學(xué)外國語學(xué)院,吉林長春,130022)
關(guān)于考試成績正態(tài)分布絕對化的悖論
——基于長春市某理工類高校大學(xué)英語四級考試成績的個案分析
易娜伊(東北師范大學(xué)外國語學(xué)院,吉林長春,130024)
高春明(長春理工大學(xué)外國語學(xué)院,吉林長春,130022)
通過對長春市某理工類高校本科生及研究生大學(xué)英語四級考試成績分布樣態(tài)以及相關(guān)數(shù)據(jù)的量化分析,探究考試成績正態(tài)分布絕對化在該校大學(xué)英語四級考試成績分布評價中的不合理性。指出應(yīng)辯證地看待正態(tài)分布在教學(xué)質(zhì)量評價體系中的作用,尤其還應(yīng)當(dāng)重視考試成績呈偏態(tài)分布的情況,并從中挖掘教育潛在資源和信息,從而切實提高大學(xué)英語教學(xué)水平。
大學(xué)英語四級考試成績;正態(tài)分布;絕對化;偏態(tài)分布
大學(xué)英語四級考試,作為教育部高等教育司組織的全國統(tǒng)一標準化教學(xué)考試,要求考試成績分數(shù)分布盡可能地呈正態(tài)分布曲線。這與考試質(zhì)量檢查的第一準則相符,即標準化考試結(jié)果分數(shù)分布在多大程度上符合正態(tài)分布的常模。[1]大學(xué)英語四級考試一貫采用“尺度相關(guān)——常模參照”的計分體制,追求考試成績分布的的正態(tài)化,并以此作為教與學(xué)效果評價的指標以及借此評價大學(xué)英語四級考試的改革成效等。然而,考試成績一定要服從正態(tài)分布嗎?事實并非如此,正態(tài)分布需辯證地看待。為此,采集了長春市某理工類高校本科生及研究生參加2009年上半年大學(xué)英語四級考試取得的成績,對此進行量化分析得出:考試成績正態(tài)分布絕對化在大學(xué)英語四級考試成績分布評價中存在不合理性,應(yīng)辯證地看待正態(tài)分布在教學(xué)質(zhì)量評價體系中的作用,不過分追求考試成績的正態(tài)分布在提高教學(xué)質(zhì)量當(dāng)中的意義所在。
正態(tài)分布有其嚴格的數(shù)學(xué)定義:一個以均數(shù)為中心,中間頻數(shù)眾多,兩側(cè)逐漸減少,左右基本對稱的頻數(shù)或頻率分布,稱為“正態(tài)分布”或“近似正態(tài)分布”。[2]正態(tài)分布在統(tǒng)計學(xué)中是最基本、最重要的一種分布,是一種連續(xù)性隨機變量的概率分布,在其次數(shù)分配中,中間的次數(shù)多,由中間往兩邊的次數(shù)逐漸減少,兩邊的次數(shù)多少相等,呈一種“兩頭小、中間大”的分布形態(tài)。[3]
正態(tài)分布是自然界和人類社會中大量隨機現(xiàn)象的一種常態(tài)性分布。經(jīng)研究證實,在考試領(lǐng)域內(nèi),人的能力高低、學(xué)生成績優(yōu)劣等評價結(jié)果基本上符合正態(tài)分布。但是,在客觀實際中,正態(tài)曲線不是單個一條,而是一簇,且各曲線的位置和形狀也不盡相同。它們受具體資料的參數(shù)值,即受表示總體變量的集中趨勢的平均值()和表示變量離散程度的標準差( )所制約。當(dāng)平均值固定,標準差發(fā)生變化時,曲線位置不變,形狀卻發(fā)生變化;當(dāng)標準差固定,而平均值變化時,曲線形狀不變,但其位置產(chǎn)生相應(yīng)的平移。可見,正態(tài)曲線能夠描述大量各種各樣的總體,只是它們的平均值或標準差有所不同而已。[3]
合理的服從正態(tài)分布的成績,為我國各級各類人才選拔提供了迄今為止最有說服力的參考依據(jù)。正態(tài)分布在學(xué)生課業(yè)成績考評中,作為測驗分數(shù)總體分布的一種極為可靠的數(shù)學(xué)模型長期占據(jù)統(tǒng)治地位,甚至很多高校一度將“考試成績正態(tài)分布”視為絕對化的標準。[4]
人們普遍認為,測試學(xué)生總體學(xué)習(xí)成績分布可以對試題質(zhì)量進行粗略的評價。當(dāng)考試成績分布呈現(xiàn)正態(tài)分布時,測量效果符合自然分布規(guī)律,因此認為測量編制得比較成功,試題質(zhì)量較好。[5]因此,大學(xué)英語四級考試也不例外。鑒于各校的辦學(xué)條件不同,生源不同,地區(qū)不同等因素,大學(xué)英語四級考試中心采用正態(tài)分布將每個考生原始分數(shù)經(jīng)過加權(quán)、等值處理后進行調(diào)整,從而得出一個考試成績的正態(tài)分布。但是,我們不得不考慮到成績分布曲線在教學(xué)實踐中將受到許多因素的影響,這與大學(xué)生群體的大小、基礎(chǔ)、學(xué)習(xí)能動性和教師群體的教學(xué)能動性等因素密切相關(guān)。所以,正態(tài)分布理論在教育評價中的應(yīng)用有待進一步討論和研究。
采集長春市某高校本科生及研究生參加2009年上半年大學(xué)英語四級考試取得的成績,該成績來自該校文、理、工三大類中47個專業(yè)的2008級非英語專業(yè)5576名本科生及六個非英語專業(yè)學(xué)科的1268名研究生。
本檢驗采用的主要工具為數(shù)學(xué)軟件Matlab 7.1,通過該軟件對數(shù)據(jù)集進行簡單統(tǒng)計分析,計算該成績分布的偏態(tài)系數(shù)值。
首先,對該數(shù)據(jù)進行數(shù)據(jù)篩選:利用Excel軟件進行數(shù)據(jù)整理,過濾掉缺考和總成績?yōu)榱愕臄?shù)據(jù);其次,通過數(shù)學(xué)軟件Matlab 7.1對數(shù)據(jù)集進行簡單統(tǒng)計分析,生成表1和表2。此外,依靠該軟件強大的統(tǒng)計功能,編輯程序,得出該成績分布直方圖及曲線圖,生成圖1和圖2。
表1 2008級本科生大學(xué)英語四級考試成績統(tǒng)計分析表
表2 2008級研究生大學(xué)英語四級考試成績統(tǒng)計分析表
圖1 2008級本科生大學(xué)英語四級考試成績分布圖
圖2 2008級研究生大學(xué)英語四級考試成績分布圖
對比表1和表2得出:該校大學(xué)英語四級考試成績普遍偏低,且研究生遠低于本科生。本科生和研究生的成績標準差分別為62.09、67.94,總分分布區(qū)域為220-601。
一方面,由于各方面主客觀因素的影響,實際成績分布的標準差比理想值稍小是合理的。此實際成績標準差不僅反映出大學(xué)英語四級考試拉開了學(xué)生之間的差距,還說明其具有一定的普適性。即在保證一般水平學(xué)生能及格的情況下,給出了拉開成績差距的重點及難點題。另一方面,實際成績平均分僅為388.84、346.73,與理想平均分500相距甚遠,進一步說明了該校作為理工類普通高校,學(xué)生英語成績整體水平較低。
此外,表1和表2還顯示出,大學(xué)英語四級考試四個分項的測試成績中以閱讀成績最高??梢耘袛啵@可能是因為閱讀一直是測試的重點,出題編制方面也已趨成熟,且閱讀是學(xué)生獲得英語知識的重要手段之一,大學(xué)英語教學(xué)向來重視學(xué)生閱讀能力的培養(yǎng)和訓(xùn)練。因此,閱讀成績展示出它的優(yōu)勢在情理之中。
圖1和圖2顯示:該校本科生及研究生的大學(xué)英語四級考試成績分布直方圖都呈現(xiàn)明顯的“兩頭小,中間大”的“鐘型”,且有單一峰值的正態(tài)分布。圖1和圖2中曲線a和曲線a′所指的正態(tài)分布曲線圖都是以相應(yīng)的平均分及標準差為參數(shù)值的理論上的正態(tài)分布(此分布是根據(jù)正態(tài)分布的性質(zhì)理論得出的,可視為眾分布的一個折中)。而曲線b和曲線b′則是依據(jù)大學(xué)英語四級考試體制中的常模參數(shù)值(平均分500,標準差70)得出的常模分布曲線。通過比較實際成績分布直方圖與理論上的正態(tài)分布圖,并結(jié)合正態(tài)分布理論可知:此成績分布基本服從正態(tài)分布,測試效果符合自然分布規(guī)律。而在正常教學(xué)情況下,這反映出了該試題考核的知識面全、試題難度程度適中、且學(xué)生對知識結(jié)構(gòu)的掌握和能力發(fā)展等方面一定程度上達到了教學(xué)目標的要求。換言之,該試題編制得還是比較成功的,試題質(zhì)量較好。
以上結(jié)果證實了大學(xué)英語四級考試試題質(zhì)量較高,拉開了學(xué)生差距,基礎(chǔ)較差、水平較低的學(xué)生考試成績不太理想也在意料之中。此外,對比該校本科生與研究生成績,不難發(fā)現(xiàn)其研究生大學(xué)英語四級成績較本科生更低。實際上,通過調(diào)查發(fā)現(xiàn),該校學(xué)生對英語學(xué)習(xí)不夠重視,研究生尤其如此。這也反映出英語基礎(chǔ)薄弱的本科生讀研之后,英語對于他們依然是弱項。另外,該校為理工類學(xué)校,對于大多數(shù)理工科學(xué)生來說,英語本就是他們最頭痛的科目,就更談不上興趣了。因此教師在教學(xué)當(dāng)中應(yīng)注意教學(xué)方式的調(diào)整,側(cè)重激發(fā)學(xué)生的學(xué)習(xí)興趣,因材施教。
B.S.布魯姆(1987)曾這樣說道:“事實上我們甚至可以斷言:成績的分布接近正態(tài)分布時,說明我們的教育努力是不成功的?!保?]而且,通過上述對四級考試成績的統(tǒng)計分析可以發(fā)現(xiàn),將考試成績正態(tài)分布絕對化的不合理性還表現(xiàn)在以下兩方面:
一方面,它掩蓋了學(xué)生群體中存在的“為應(yīng)試而學(xué)”的現(xiàn)象。[4]目前,大學(xué)英語四級考試校外輔導(dǎo)班比比皆是,花樣繁多。大部分學(xué)生都是臨時抱佛腳,往往在臨考前報個所謂的“沖刺班”,甚至死記硬背輔導(dǎo)老師給出的“押題”內(nèi)容?!盀閼?yīng)試而學(xué)”之情可見一斑。因此,成績正態(tài)分布的絕對化就掩蓋了考生中存在的“應(yīng)試”現(xiàn)象,從而使檢驗學(xué)生是否已全面系統(tǒng)地掌握全部知識點出現(xiàn)盲點和變得模糊。
另一方面,追求成績正態(tài)分布絕對化有違教育方針政策,過度追求正態(tài)分布有悖素質(zhì)教育思想,有礙大學(xué)英語四級考試對大學(xué)英語教學(xué)的正確指導(dǎo)。由于大學(xué)英語四級逐漸轉(zhuǎn)變成一個社會性、應(yīng)試型考試,被冠以就業(yè)的“生死符”和學(xué)校評估評獎的“硬指標”之名,扭曲和異化了考試設(shè)計者的初衷,違背了教學(xué)考試的目的。大學(xué)英語四級考試客觀上沖擊了正常的教學(xué)秩序,對造成我國明顯應(yīng)試型英語教學(xué)和學(xué)習(xí)負有責(zé)任。[7]因此,大學(xué)英語四級考試于2006年進行了較大的制度改革,其中就有該考試不設(shè)及格線,不頒發(fā)合格證書,只發(fā)成績單這一針對計分體制的變革舉措。充分體現(xiàn)了大學(xué)英語四級考試改革促進英語教學(xué)中價值觀的回歸。
事實上,正態(tài)分布和偏態(tài)分布的功能是互補的。所以測驗評價時,應(yīng)有效整合兩者,兼取兩者之長以達到合理的評價效果。正態(tài)分布在測驗中的功能主要是:對學(xué)生進行比較、確定人數(shù)和分數(shù)線以及確定測驗難度。它常被用于學(xué)生考試成績的分析,人們習(xí)慣認為學(xué)生的考試成績呈“正態(tài)分布”是成功的。[8]而偏態(tài)分布在測驗中的功能則是:簡單探查測驗難度、初步評估教師教學(xué)效果以及提高更多學(xué)生學(xué)習(xí)的主觀能動性。由于生源不同,各校間的差距很大,學(xué)生基礎(chǔ)水平差異性較大等因素,大學(xué)英語四級考試成績往往偏離“正態(tài)分布”,從圖1也可看出該成績正態(tài)分布出現(xiàn)了一定偏差。美國著名教育學(xué)家B.S.布魯姆就認為:“學(xué)生成績的正態(tài)分布曲線事實上并非什么神圣不可動搖的東西,它是一種最適合于機遇和隨機活動的分布,而教育是一種有目的、有意圖的活動,如果我們的教學(xué)是富有成效的話,學(xué)生的成績分布應(yīng)該是與正態(tài)分布完全不同的?!辈剪斈愤€指出:“學(xué)生成績的正態(tài)分布已成了一種‘條件反射’,這樣做的必然結(jié)果是:教學(xué)只能使少數(shù)學(xué)生真正掌握學(xué)習(xí)內(nèi)容?!保?]從某種意義上說,這種偏差是合理的,而一味地追求考試成績正態(tài)分布絕對化是不符合實際的。
凡事過猶不及,對正態(tài)分布在考試成績分布中的應(yīng)用要把握適度原則。成績分布的樣態(tài)曲線是受諸多因素影響的動態(tài)曲線。在要求其達到正態(tài)的過程中,還需考慮學(xué)生、教師、試卷評判標準等各方面的影響因素,實事求是地得出一組科學(xué)合理的反饋信息,才能真正有效地指導(dǎo)教學(xué)工作。
由對大學(xué)英語四級考試成績的個案檢驗可知,高考擇優(yōu)錄取的原則以及理工類高校學(xué)生群體的特殊性,在全國統(tǒng)一考試的大學(xué)英語四級考試上取得的成績偏離正態(tài)分布是可想而知的,然而這種教育潛在資源和信息還沒有得到足夠的重視。為此,我們不應(yīng)過分強調(diào)學(xué)生的個體差異,相反應(yīng)看到大學(xué)生相對整齊的素質(zhì)和基礎(chǔ)能力,這里還有很多潛力等待挖掘和發(fā)揮。如配合有效的教育方針和行之有效的教學(xué)方法,某些“低端”學(xué)生是有可能趕上大多數(shù)學(xué)生的。教學(xué)活動是對隨機變量的強有力的人為干預(yù)因素,我們有理由相信,通過人的主觀能動性是有可能改變這種分布模型的。
因此,應(yīng)辯證地看待考試成績的分布,重視考試成績正態(tài)分布與偏態(tài)分布的互補性功能,不過分追求成績的正態(tài)分布絕對化。實事求是地對待不同學(xué)生群體的英語水平,激發(fā)學(xué)生的學(xué)習(xí)積極性和教師的教學(xué)主動性,改進教法,構(gòu)建科學(xué)的評價體系,切實提高教學(xué)質(zhì)量才是大學(xué)英語教學(xué)的當(dāng)務(wù)之急。
[1] 李筱菊.語言測試科學(xué)與藝術(shù)[M].長沙:湖南教育出版社,1997.
[2] 凌云.考試統(tǒng)計學(xué)[M].武漢:華中師范大學(xué)出版社,2002.
[3] 喻曉莉.學(xué)生成績偏離正態(tài)分布的原因分析[J].重慶科技學(xué)院報:社會科學(xué)版,2006.
[4]李晴,李門樓.“對考試成績正態(tài)分布絕對化的理性思考”[J].黑龍江高等研究,2008(12):158-161.
[5] 劉應(yīng)成.考試系統(tǒng)中成績正態(tài)分布檢驗的設(shè)計與實現(xiàn)[J].重慶工學(xué)院學(xué)報,2004(6).
[6] B.S.布魯姆.教育評價[M].邱淵,等,譯.上海:華東師范大學(xué)出版社,1987.
[7] 張國華.評大學(xué)英語四、六級考試改革——兼論我國的英語教學(xué)和測試[J].理工高教研究,2005(5).
[8] 賀愛萍.用中位數(shù)考察考試成績更合理[J].西北醫(yī)學(xué)教育,2007(2).
On the Paradox of Absolutization to Normal Distribution of Test Results——A Case Study Based on CET-4 Results Collected from a University of Science and Engineering in Changchun
YI Na-yi,GAO Chun-ming
Through quantitative analyses to both related data and distribution styles of CET-4 results of undergraduates and graduates collected from a university of science and engineering in Changchun,this paper reveals the irrationality of absolutization to normaldistribution in theaccessingsystemof CET-4 results distribution.Therefore,itpointsout thatthe function of normaldistribution in the assessment system of teaching quality should be treated dialectically.Particularly,the partial distribution of test results should also be paid attentionfor exploring thepotential educational resourcesandinformation inorder to improvecollege English teaching level effectively.
CET-4 results;normal distribution;absolutization;partial distribution
H319
A
易娜伊(1985-),女,碩士,研究方向為英語測試學(xué)。