(空軍航空大學航空作戰(zhàn)勤務學院 吉林·長春 130022)
考試是根據(jù)考核的目的,讓考生在規(guī)定的時間內(nèi),按規(guī)定的方式,完成事先所編制的題目,并按解答的結(jié)果給予評分的過程??荚囃戤吅筮M行的試卷分析,是教學過程中的一個重要環(huán)節(jié),是教學考核與評估中的內(nèi)容之一。試卷分析就是在輸入試卷基本信息及分析樣本數(shù)據(jù)后,由計算機進行數(shù)據(jù)處理,直接輸出分析及評價結(jié)果。通過結(jié)果,一方面相當于建立了教學系統(tǒng)中的信息反饋渠道,可以了解學生學習效果和教學中的薄弱環(huán)節(jié),教師可以及時地調(diào)整和改進教學內(nèi)容和方法,學生可以及時地加強薄弱環(huán)節(jié)的學習內(nèi)容、改進學習方法。另一方面,根據(jù)結(jié)果可以發(fā)現(xiàn)試卷命題及組卷中的問題,對于試卷命題本身具有評價作用,客觀反映出試卷命題的好壞,對于評價教學、規(guī)范命題等都具有現(xiàn)實指導意義。所以,進行試卷分析包含有兩個方面的內(nèi)容:試題質(zhì)量分析和考試成績分析。
一般考試中最常見的是學業(yè)成就測驗,它依據(jù)教育目標進行考試命題,命題水平的高低直接影響能否正確的評價學生的學習質(zhì)量和教師的課堂教學水平。對于選拔考試來說,甚至于直接決定了能否客觀公平的鑒定考生資格、篩選人才。進行客觀的試題質(zhì)量分析是試卷分析的必要環(huán)節(jié),也是教育教學評價的重要內(nèi)容之一。試題質(zhì)量分析包含以下若干內(nèi)容:
試卷命題的一致性是命題的基本要求,它要求試題不偏離課程標準或考試大綱,符合對知識點的認知要求和學生素質(zhì)能力培養(yǎng)要求,體現(xiàn)教學過程和方法,間接蘊含情感態(tài)度與價值觀。通??梢詮脑嚲砩戏磻臏y試內(nèi)容、認知要求、價值取向等幾方面考察命題一致性的質(zhì)量。
命題一致性優(yōu)秀的試卷有助于師生在教學中注重對于課程目標的明確,有目的的教學有助于教師教學中圍繞課程標準,有的放矢,具有針對性;有目的的學習有助于學生學習積極性的調(diào)動,提高學習效率,事半功倍。
試卷命題的科學性,是指試題包含的知識點的分布合理性,包括知識點的覆蓋度、題目難度分布,題型選擇,題量大小等內(nèi)容。一套科學性較好的考試試題,應該是課程標準中知識點的覆蓋度高,并且是一個有機的整體。要根據(jù)試卷的知識點分布和對知識點要求掌握程度的高低,來合理分布單個試題的難度系數(shù),不可機械的堆砌大量試題、更不能出現(xiàn)知識點和計算方法與計算技巧重復的現(xiàn)象。
命題科學性高的試卷更能公平、公正的反映學生的客觀成績,有助于客觀衡量學生學習質(zhì)量與反應教師教學水平。
反映科學性的一個分析指標就是信度。信度就是指試卷的可靠性和穩(wěn)定性程度。由于試卷分析多用于期末測試,不可能重復測試,所以目前試卷分析多為計算內(nèi)部一致性信度。內(nèi)部一致性信度是同一試卷的兩個部分,例如分為奇數(shù)題和偶數(shù)題,通過計算得分的相關(guān)程度。計算方法有分半法、庫德理查森公式法及克龍巴赫所創(chuàng)的系數(shù)公式法。
試卷有效性分析是指試卷的準確性程度,它反映了測量結(jié)果與被測量的二者之間的符合程度,也就是指在命題組卷時選取的具有代表性的樣本組成的考試內(nèi)容,是否能夠恰當?shù)拇斫虒W內(nèi)容總體。有效性的評估有助于客觀、真實的反應學生的整體學習水平,特別是在選拔考試中,準確度高的甄選出優(yōu)秀可塑性人才。
實際上到目前為止,還沒有一種切實可行的統(tǒng)計方法可以用來合理地評價試題取樣的恰當程度。大多采取的辦法是由有經(jīng)驗的老師或者專家依據(jù)考試大綱對每道試題進行比較分析來作出估計?;蛘卟捎猛ǔP岁P(guān)聯(lián)效度來評估,也就是說用公認的比較客觀的一次同類標準考試成績來評估,兩者之間的相關(guān)系數(shù)就是效標關(guān)聯(lián)效度,具體計算可以采用積差相關(guān)法。
1.4.1 難度分析
難度分析指對試題的難易程度的分析,在經(jīng)典教育測量理論中,通常采用通過率和平均得分率這兩種辦法。通過率的難度計算公式為P=M/N,M為對某題作出正確答案的考生數(shù),N為參加測試的總?cè)藬?shù)。平均得分率的難度計算公式為P=X/W,X為全體被試者在某題上得分的平均值,M為該題的滿分。
試題難度系數(shù)的大小可以根據(jù)命題人的意圖進行確定和調(diào)整。難度系數(shù)一方面可以體現(xiàn)出試卷的指導思想,難度系數(shù)大可以嚴格控制高分數(shù)的出現(xiàn),可抑制學生驕傲浮躁情緒出現(xiàn);而難度系數(shù)小又可以讓學生相對容易地得到較高分數(shù),有鼓勵學生增強自信心的作用。另一方面可以為篩選試題、確定難度建立試題題庫做準備。
1.4.2 區(qū)分度分析
試題的區(qū)分度能充分體現(xiàn)學生的學習水平及應用知識的能力。區(qū)分度較好的試卷,學習能力強的學生實際得分就高,真實反映了學生的實際情況。試題的區(qū)分度是測驗試題否具有效度的指標,用來評價試題質(zhì)量、篩選試題。
公式中,D為區(qū)分度指數(shù),XH為高分組(總?cè)藬?shù)的25%)的得分總數(shù),XL為低分組(總?cè)藬?shù)的25%)的得分總數(shù),H為這試題或試卷的最高得分,L為這試題或試卷的最低得分,高分組人數(shù)與低分組人數(shù)相等,用N表示。
一般認為區(qū)分度大的為優(yōu)秀試題,區(qū)分度較小試題較差,應進行適當?shù)母倪M,區(qū)分度過小的為“劣題”,必須淘汰。通常難度系數(shù)和區(qū)分度是緊密聯(lián)系,難度過高或過低都會降低區(qū)分度。要出一套完整合理而又科學的試題,就要充分考慮其難度系數(shù)和區(qū)分度。
如果試卷質(zhì)量優(yōu)良的基礎上,對試卷成績進行匯總分析,既有助于教與學的反饋輪回,在這其中教師可以不斷改進教學方法,提高教學水平。分析考試成績的常用的指標有平均成績、正態(tài)分布、兩極差、方差、標準差等,這些方法可以分為集中量和差異量兩類。
一個是利用平均成績,平均成績是這個學生集體考試成績的平均分數(shù),是該集體學習成績集中趨勢和典型水平的代表值,其計算公式為
其中,M為平均成績,Xi為第i個學生的考試成績,N為參加考試的學生人數(shù)。平均成績反映了整體水平,例如一個班的整體水平,能夠局部反映一個班的學習狀況。
另一個指標是成績的正態(tài)分布,如圖所示。正態(tài)分布又稱分布是數(shù)理統(tǒng)計學的一種很重要的連續(xù)型分布,正態(tài)分布的主要特征是對稱性,以平均數(shù)為中心左右呈現(xiàn)對稱。
為了保證判斷分布是否成正態(tài)分布的準確性,樣本的抽取應該盡量多。如果樣本呈現(xiàn)正態(tài)分布,能夠發(fā)現(xiàn)學習優(yōu)異生和特困生,可以在在教學過程中給予特殊關(guān)照。如果樣本不服從正態(tài)分布,例如呈現(xiàn)偏態(tài)分布或多峰分布,則需做相應的深入分析。如果分布曲線高峰向左偏,則反映低分較多,平均分較低,試題偏難。如果曲線高峰向右偏,則反映高分較多,平均分較高,試題偏簡單。如果學生學習情況兩極分化情況嚴重,試卷會出現(xiàn)成績分布畸形的情況,如出現(xiàn)雙峰值狀態(tài)。
進一步還可以計算出樣本的均值 X和方差 Sn2。其中 x為樣本平均分,可以用來近似地表示全年級各學科的平均分。而Sn2反映了數(shù)據(jù)的分散情況,Sn2越大表示考試成績的波動性較大,Sn2越小表示考試成績的波動性較小。
差異量通常有兩極差R和標準差 來表示。
兩極差R指最大數(shù)與最小數(shù)之差??荚嚦煽兂槿〉臉颖局械臉O差反映了最高成績與最低成績的差異,對這個差異的分析希望在排除偶然因素的情況下,可以具體追蹤到個人,分析出現(xiàn)成績低的原因,反饋指導以后的教學。
標準差 的計算公式為:
其中,M為平均成績,Xi為第i個學生的考試成績,N為參加考試的學生人數(shù)。
標準差反映了一組數(shù)據(jù)離散程度最常用的一種量化形式。例如兩個期班的平均成績可能一樣,可是標準差并不一樣,標準差越大,說明樣本的離散程度越高,也就是說高分與低分的越多,兩極分化越大。
從收集到的大量文獻分析看,目前試卷分析實踐的理論基礎還是基于經(jīng)典教育測量理論為主,也就是試題的難度和區(qū)分度分析以及試卷的信度和效度分析。大量文獻可以看出,許多高校在試卷分析研究與實踐中僅針對難度、區(qū)分度和信度三個指標進行了有效性分析,效度由于其不容易采用有效的指標進行衡量,效標的選擇是計算試卷效度的難點,所以很少見有涉及效度研究文獻。
從文獻中也發(fā)現(xiàn),我國研究著開發(fā)的試卷分析系統(tǒng)多以Windows作為操作平臺,包括Windows95/98/NT/2000/XP/7,前臺開發(fā)工具包括面向?qū)ο蟮目梢暬绦蛟O計語言VisualFoxPro、Delphi5.0、VisualBasic6.0等。后臺采用的數(shù)據(jù)庫包括Microsoft Access97/2000、FoxPro、Excel等。大部分系統(tǒng)功能單一,僅僅算是涉及到了試卷分析,只有部分系統(tǒng)功能強大,既包括試卷分析,還包括題庫建設和維護,部分系統(tǒng)還增加考務分析等功能。單一系統(tǒng)工作范圍十分局限,綜合系統(tǒng)大都可在網(wǎng)上運行。
大多數(shù)高校的試卷分析僅僅出于經(jīng)典理論框架下的應用探討,雖然部分研究者在實踐中對計算公式進行了優(yōu)選和改進,但都沒有取得太大突破。甚至于有些高校試卷分析研究還停留在手工統(tǒng)計,尚未利用計算機技術(shù)??梢钥闯鲫P(guān)于試卷分析工作研究的任務很艱巨,急需大量人力物力的投入研究。
通過綜合試卷各項指標信息,對試卷質(zhì)量進行定量化分析,從難度、區(qū)分度、信度和效度等方面進行研究,以便確定試卷結(jié)構(gòu)是否合理。另外,通過分析試卷的應試結(jié)果,可以得到考生群體的成績分布,用來評估學生對于知識的掌握和運用情況,診斷出學生在學習過程中遇到的疑難點,教師可以以此為依據(jù)進行相應的教學反饋,開展因材施教的個性化教學。目前許多高校對試卷分析的工作已逐漸加以重視,但是由于前期投入有限,急待大量工作者的研究并付諸于實踐。