■天津市和平區(qū)教研室 劉增生
利用實測數(shù)據(jù)反饋教學(xué),促進學(xué)生學(xué)業(yè)成長
■天津市和平區(qū)教研室 劉增生
為準(zhǔn)確了解本區(qū)學(xué)生學(xué)業(yè)水平狀況,幫助各學(xué)校尋找到教學(xué)的薄弱點并用以改進學(xué)校的管理和教師的教學(xué)行為,2007年和平區(qū)教研室確立了利用考試實測數(shù)據(jù)開展評價工作,研究教學(xué)、改進教研的發(fā)展思路,并于當(dāng)年下半年在初三、高三兩個畢業(yè)年級啟動了實測數(shù)據(jù)統(tǒng)計分析工作。3年來,從區(qū)域?qū)用?、學(xué)校層面、學(xué)科層面和學(xué)生個體層面多角度、多指標(biāo)展開跟蹤、分析、診斷、研究、改進、評價?,F(xiàn)把此項工作總結(jié)如下:
美國著名教育評估研究專家L.D.stuffobcam指出,“評價最主要的目的不是證明,而是改進”。我們在理念上破除了“只有難倒學(xué)生,才能體現(xiàn)評價人水平”的陳腐觀念,注重幫助學(xué)生樹立成功的信心,發(fā)現(xiàn)發(fā)展中的問題,通過反饋信息,促進學(xué)生更好地發(fā)展。反對僅僅為名次或升學(xué)率而進行的評價,使其真正成為促進學(xué)生、教師和學(xué)校全面和諧發(fā)展的工具和手段。
當(dāng)代教育心理學(xué)指出,學(xué)生個體在性格、智力、動機和認(rèn)知風(fēng)格等方面都存在差異,并對其學(xué)習(xí)結(jié)果產(chǎn)生直接的影響。因此教師在課堂教學(xué)和對學(xué)生進行評價的過程中不能“一刀切”,而應(yīng)該針對不同學(xué)生因材施教,對其學(xué)習(xí)結(jié)果進行縱向考察,實施“增值”評價。
(一)本研究與國內(nèi)外相關(guān)學(xué)生學(xué)業(yè)質(zhì)量分析系統(tǒng)最大的不同是采取整體抽樣
每次全區(qū)統(tǒng)一質(zhì)量調(diào)查后,都對九年級和高三年級所有中考和高考的紙筆測驗科目數(shù)據(jù)進行登統(tǒng),以便于正確解讀數(shù)據(jù),全方位了解數(shù)據(jù)背后所揭示的教育教學(xué)過程中的問題,合理利用數(shù)據(jù),為全區(qū)各中學(xué)教育教學(xué)改進提供依據(jù)和建議。
(二)本項研究防止了以往評價方法單一、過分注重結(jié)果而忽視學(xué)生的學(xué)習(xí)過程的問題,充分考慮最大限度調(diào)動學(xué)生學(xué)習(xí)的積極性和教師教學(xué)的積極性
尤其是學(xué)校對數(shù)據(jù)的二次開發(fā),可以幫助教師關(guān)注學(xué)生在各個方面的掌握和發(fā)展情況,而不是某一個方面甚至在某一點上的掌握和發(fā)展情況;可以讓教師幫助學(xué)生認(rèn)知自己的“長處”和需要改進的方面,幫助學(xué)生建立“我可以學(xué)得更好”的自信心,也為教研員更好地指導(dǎo)全區(qū)的教研工作提供了依據(jù)。
(三)本項研究防止了以往質(zhì)量調(diào)查評價以點帶面、以偏概全的情況的發(fā)生。
本項研究幫助我們準(zhǔn)確地了解了本區(qū)學(xué)生學(xué)業(yè)水平狀況,幫助各中學(xué)尋找到教學(xué)的薄弱點,改進了學(xué)校和教師的教學(xué)行為,通過目標(biāo)達到度和發(fā)展度兩個尺度進行綜合分析,評價的方法既考慮教師接班時的原有基礎(chǔ),又要注意到進步因素;既考慮了學(xué)生的原有基礎(chǔ),又注意到學(xué)生學(xué)習(xí)的進步提高。
本課題本質(zhì)上是教學(xué)研究項目,是基于標(biāo)準(zhǔn)的、大規(guī)模數(shù)據(jù)采集與分析基礎(chǔ)上的教學(xué)研究和教學(xué)改進項目。研究的基本流程是:系統(tǒng)軟件的研發(fā)—考試實測數(shù)據(jù)的錄入與統(tǒng)計—統(tǒng)計結(jié)果的分析與研究—考試結(jié)果的評價、反饋、改進、總結(jié)。
“實測數(shù)據(jù)統(tǒng)計與分析系統(tǒng)”研發(fā)小組負責(zé)組織記錄每次實驗數(shù)據(jù),并利用信息技術(shù)手段開發(fā)一套“天津市和平區(qū)學(xué)生綜合素質(zhì)評價之一——學(xué)生學(xué)業(yè)成長分析系統(tǒng)軟件”,為教研員、基層學(xué)校和局領(lǐng)導(dǎo)提供數(shù)字化分析報告。
1.對采集到的第一次實測數(shù)據(jù),進行本體自我分析和相對評價,分析目標(biāo)達到度。
具體而言,就是在一組評價對象內(nèi)部進行相互比較,通過比較來確定每一評價對象在組中的相對位置。教研室對第一次實測數(shù)據(jù)統(tǒng)計的結(jié)果進行了分學(xué)科、分學(xué)校、分題型的初次具體診斷,初步分析出各基層學(xué)校,在各學(xué)科、各題型、各采分點教與學(xué)的情況。通過與區(qū)常模的對比,一方面使學(xué)校比較清楚地了解到自己的長處與短板、優(yōu)勢與弱項、改進點與提升點;另一方面也使我們對全區(qū)所有參加質(zhì)量調(diào)查的學(xué)校、學(xué)科、學(xué)生有了“實證+經(jīng)驗”的了解。(注意:因為原始分?jǐn)?shù)沒有絕對的參照點,我們要尋找一個參照點,這就是常模,由于各種客觀條件的限制,我們只能通過對全區(qū)所有本年級學(xué)生的測量成績來代表總體,這就是地方常模,也就是文中提到的區(qū)常模。)隨后教研室召開全體教研員聯(lián)合會診分析會;教研員利用區(qū)域?qū)W科教研活動做得失分點分析與對策指導(dǎo);基層學(xué)校得到自己學(xué)生的實測數(shù)據(jù)統(tǒng)計后,第一次清晰地了解到教師的教與學(xué)生的學(xué)兩方面存在的不足,從而能進行有針對性的研究與改進。
2.對采集到的第二、第三次實測數(shù)據(jù),增加縱向形成性評價。
隨著第二、第三次實測數(shù)據(jù)的輸入,具備了縱向跟蹤的前提條件,我們又增加了對各學(xué)校、各學(xué)科實測數(shù)據(jù)的過程性跟蹤,及時發(fā)現(xiàn)其中的相對增長點,加以肯定鼓勵。依照木桶原理,要求學(xué)校的管理層找“問題學(xué)科”,從學(xué)科找“問題題型”;教研員(或課任教師)找“問題題型”和知識點漏洞,分析問題產(chǎn)生的原因及改進措施,通過這種跟蹤分析研究,學(xué)校和教師從中發(fā)現(xiàn)自己在管理和教學(xué)方面存在的薄弱環(huán)節(jié),并在此基礎(chǔ)上修正、調(diào)整和改進自己的工作;學(xué)生了解自己在學(xué)習(xí)方面掌握和落實的效果,看到自己的差距和出錯的“癥結(jié)”,從而及時調(diào)整自己的學(xué)習(xí)方法。
3.隨著實測數(shù)據(jù)一年之后的積累,增加橫向同期對比性評價。
隨著研究工作進入到第二年,數(shù)據(jù)庫中內(nèi)存實測數(shù)據(jù)有了量的積累,我們的實驗工作具備了橫向同期對比的前提條件,我們又增加了對各學(xué)校、各學(xué)科實測數(shù)據(jù)的同期橫向?qū)Ρ龋蠢帽容^分析法,把全區(qū)各學(xué)校歷屆同期實測數(shù)據(jù)加以對比,分析出相同點、差異點、提升點和改進點。
4.實行交接班制度,增加個體內(nèi)差異增值性評價,充分考慮發(fā)展度。
充分考慮各學(xué)校生源的差異,對各學(xué)校歷次質(zhì)量調(diào)查實測數(shù)據(jù)的跟蹤也應(yīng)該是一個多元化、動態(tài)的體系。在深層次為不同類別學(xué)校診斷分析的過程中,我們發(fā)現(xiàn),由于客觀上生源狀況不佳、編制不確定等原因,使得有的學(xué)校、有的教師存在畏難情緒;教學(xué)不能實現(xiàn)正常循環(huán),無法進行跟蹤考察;學(xué)生進步與提高幅度不明顯,直接影響了自信心的樹立和工作學(xué)習(xí)積極性的調(diào)動。根據(jù)這些因素,我們增加了個體內(nèi)差異增值性評價,即以評價對象群體中各對象自身的發(fā)展變化為參照點的一種評價,把評價對象過去和現(xiàn)在相比較或把某一對象的不同側(cè)面進行比較,看自己與自己的變化點,找自己與自己的增長值。我們以各學(xué)校、各學(xué)科交接班時的質(zhì)量調(diào)查實測數(shù)據(jù)統(tǒng)計作為起點,采用自我相對評價、縱向形成性評價、橫向同期對比評價以及個體內(nèi)差異增值性評價等方法,從不同的角度、不同的側(cè)面和不同的方法,對同一學(xué)校、同一學(xué)科進行自身歷史縱向和整體同期橫向的跟蹤、比較,最大限度地全面、客觀、公正反映學(xué)校、學(xué)科、教師及學(xué)生的實際狀況。
5.利用箱線圖對不同學(xué)生群體學(xué)習(xí)情況進行深入的再分析。
利用各學(xué)校全體考生實測數(shù)據(jù)的總平均分、最高分、最低分、第25%位置處學(xué)生的平均分及第75%位置處學(xué)生的平均分這5個特征值作為繪制箱線圖的原始數(shù)據(jù),得到“各學(xué)校試卷總分?jǐn)?shù)分布箱線圖”,可以清晰地反映出各學(xué)校學(xué)生整體成績分布的離散程度(箱體的高度)以及對稱性(箱體上下須的長短)等信息,尤其是對于相同層次學(xué)校之間可以通過“箱線圖”分析出學(xué)校學(xué)生群體之間的差異。
(1)通過箱線圖,可以清楚地看到各學(xué)校的“異常值”。
(2)利用箱線圖,可以將某個數(shù)據(jù)點放在不同群體的相應(yīng)位置進行比較。
(3)通過對標(biāo)準(zhǔn)“箱線圖”取值范圍的修改,系統(tǒng)實現(xiàn)了可將各學(xué)校學(xué)生分為若干個群體。例如對同一類型學(xué)校之間的5個不同群體學(xué)生平均分繪制“箱線圖”,這5個不同群體分別是全體學(xué)生即100%、中間80%學(xué)生 (去掉前10%高分段學(xué)生和后10%低分段學(xué)生)、中間50%學(xué)生(去掉前25%高分段學(xué)生和后25%低分段學(xué)生)、前40%學(xué)生(中上等水平)和后40%學(xué)生(中下等水平)。通過對同一類型學(xué)校之間不同學(xué)生群體的篩選、比較、診斷與分析,幫助學(xué)校發(fā)現(xiàn)不同層面學(xué)生群體的閃光點、問題點和增長點,從而科學(xué)指導(dǎo)其有針對性地選準(zhǔn)切入點,制定有效措施,采取有效方法,實施增效減負下的有效教學(xué)與強化訓(xùn)練。
6.對分?jǐn)?shù)的解釋逐步趨向標(biāo)準(zhǔn)化。
在實測數(shù)據(jù)的使用過程中,由于不同學(xué)科試卷的難易程度不盡相同,滿分值又不一樣,在對同一學(xué)校不同學(xué)科間的評價時不好把握,在對學(xué)生的分析時也不夠科學(xué)準(zhǔn)確。針對這一問題,我們將原始分?jǐn)?shù)轉(zhuǎn)化為標(biāo)準(zhǔn)分(T分?jǐn)?shù)),解決了各學(xué)科試題難易水平等價看待的問題,而且對同一類型學(xué)校之間的分析也更趨向客觀。
7.利用實測數(shù)據(jù),對試卷命題進行分析。
(1)加強對教研員命題科學(xué)化的培訓(xùn)。
優(yōu)質(zhì)的考試需要對命題的質(zhì)量進行控制,需要加強對考試效度的驗證和質(zhì)量的評價。這就要求教研員命題科學(xué)規(guī)范,題型和難度應(yīng)以課標(biāo)要求、考試說明和歷屆中、高考試卷作為參照標(biāo)準(zhǔn),并結(jié)合每年生源狀況和特點科學(xué)命題??荚嚭笠鶕?jù)實測數(shù)據(jù)統(tǒng)計分析,研究試卷結(jié)構(gòu)、題型、知識點和能力水平要求與預(yù)期的切合程度是否吻合;研究各項指標(biāo)的可調(diào)控性。因此,我們對全體教研員多次進行了如何使用實測數(shù)據(jù)的培訓(xùn),開展如何利用實測數(shù)據(jù)提高命題科學(xué)化的研討。先后提供了《天津市中、高考試卷多向細目分析表》、《中、高考試卷結(jié)構(gòu)、內(nèi)容、分值一覽表》、《天津市中、高考試卷實測數(shù)據(jù)分析報告》、《和平區(qū)自2008屆以來歷屆質(zhì)量調(diào)查學(xué)科成績與難度系數(shù)情況跟蹤統(tǒng)計表》、《各學(xué)科質(zhì)量調(diào)查試卷反饋表》、《各學(xué)科試題命題藍圖》等供教研員學(xué)習(xí)參考、探討研究。目前教研員都能較熟練地運用實測數(shù)據(jù)作分析,借助實測數(shù)據(jù)進行跟蹤,在掌控命題的難度和把握命題的質(zhì)量上均有不同程度的提高。
(2)從三個維度對試卷命題進行分析。
難度是指試題的難易程度,它是衡量試題質(zhì)量的一個重要指標(biāo)參數(shù)。命題前,根據(jù)不同年級、不同階段對教研員提出不同的試題難度指數(shù)要求;考試后,通過實測數(shù)據(jù)統(tǒng)計跟蹤觀察各學(xué)科試卷的難度系數(shù)情況。
區(qū)分度是區(qū)分應(yīng)試者能力水平高低的指標(biāo)。區(qū)分度和難度一起共同影響并決定試卷的鑒別性。
利用正態(tài)分布曲線統(tǒng)計學(xué)生的質(zhì)量調(diào)查的成績是否服從正態(tài)分布。
通過給教研員提供本學(xué)科歷次實測數(shù)據(jù)報告,一是引導(dǎo)教研員按照課程標(biāo)準(zhǔn)的考核要求,在考試內(nèi)容、知識點所占比例、覆蓋面和試題量的確定,材料的自編、改編或選用的選擇,試題難度、區(qū)分度和可信度的控制,試卷內(nèi)容、參考答案和評分標(biāo)準(zhǔn)的科學(xué)性把握等方面,就其是否恰當(dāng)、合理、科學(xué)進行深入細致的學(xué)習(xí)與研究。二是充分發(fā)揮實測數(shù)據(jù)的正導(dǎo)向作用,真正為學(xué)生的學(xué)、教師的教、學(xué)校的管起到有效管用的增效減負之目的。三是逐步積累和構(gòu)建在實測數(shù)據(jù)論證下的各學(xué)科試題庫,為今后更加科學(xué)化地做好命題工作打好基礎(chǔ)。但是由于受各方面因素的影響,對試卷信度和效度的評價還未進行,我們將在“十二五”期間繼續(xù)開展此項研究工作,使之不斷地充實與完善,更好更科學(xué)地服務(wù)于一線的教與學(xué)。
(一)創(chuàng)建了《天津市和平區(qū)學(xué)生綜合素質(zhì)評價之一——學(xué)生學(xué)業(yè)成長分析系統(tǒng)》網(wǎng)站及軟件
(二)通過三年的實踐,我們基本形成了“命題—測試—統(tǒng)計—分析—診斷—反饋—研究—改進—總結(jié)—評價”的質(zhì)量調(diào)查反饋指導(dǎo)體系。并形成了我區(qū)特有的質(zhì)量調(diào)查反饋指導(dǎo)特色
1.以強化對實測數(shù)據(jù)的研究,提升工作水平為最高追求。
質(zhì)量調(diào)查是對教學(xué)工作的一種質(zhì)量驗收,也是一種教學(xué)反饋。區(qū)教研室將科研和教學(xué)、研訓(xùn)的未來發(fā)展聯(lián)系在一起。向科研要質(zhì)量,向科研要成效。連續(xù)三年的初中、高中畢業(yè)班教學(xué)指導(dǎo)意見都是基于對初、高中畢業(yè)班實測數(shù)據(jù)分析的基礎(chǔ)上提出的,并多次召開了初、高中包括一把手校長參加的教學(xué)校長、主任全區(qū)分析會;初、高中分層推進分析會。在區(qū)教學(xué)工作會議上,還就此課題進行了研討,對評價過程的最后一個環(huán)節(jié)——評價結(jié)果的反饋做了精心安排,以達到成績說透、問題說清、措施找對、方法得當(dāng)、增效減負的目的。
2.對問題的診斷和分析,采用定性和定量的分析相結(jié)合的方式。
以對各學(xué)校的反饋為例,對于從實測數(shù)據(jù)中得到的量化評價結(jié)果,采用了通俗易懂的描述性統(tǒng)計方法,對專業(yè)的統(tǒng)計數(shù)據(jù)進行了通俗化的解讀,給所有用戶提供了最現(xiàn)實的幫助,每個人都能對數(shù)據(jù)一看就懂,對圖表一看更明。對于從觀察或訪談中得到的對各學(xué)校的質(zhì)性評價結(jié)果,采用了綜合描述,這些言語性評價,既是對數(shù)據(jù)量化結(jié)果的詳細補充和說明,又有總體性評價,對各學(xué)校下一階段的工作,也給出了明確的指導(dǎo)意見。
3.對結(jié)果的反饋,選擇了恰當(dāng)?shù)男问健?/p>
反饋結(jié)果通常是教研室服務(wù)上門,直接到基層學(xué)校與領(lǐng)導(dǎo)和教師共同分析研討,和他們一起分析成敗的原因,引導(dǎo)學(xué)?;蚪處熥鲎晕曳治?,調(diào)動其自我評價的積極性。大家一起通過深入查找問題的癥結(jié)所在,制訂出有效的解決方案。
(三)構(gòu)建與新課程相適應(yīng)的多角度分析的評價指標(biāo)
各評價指標(biāo)是在“診斷教學(xué)問題、提供反饋信息、檢驗教學(xué)效果”的思想指導(dǎo)下建構(gòu)的。根據(jù)各評價指標(biāo)可以對各學(xué)校、各學(xué)科、各個學(xué)生進行比較系統(tǒng)的評價,使評價的過程有跡可循、有法可依,使評價更加公正、科學(xué)、有效。
指標(biāo)1:對100%學(xué)生的實測數(shù)據(jù)進行評價。具體指標(biāo)有全區(qū)各學(xué)校各學(xué)科成績匯總分析圖表、各學(xué)校N科總成績及各分?jǐn)?shù)段人數(shù)匯總分析圖表、選擇題逐題或分類診斷分析圖表、非選擇題逐題診斷分析圖表等套圖表組成。
指標(biāo)2:從不同的側(cè)面和角度對實測數(shù)據(jù)進行分析。具體指標(biāo)有全區(qū)各學(xué)校各學(xué)科主要指標(biāo)自我比較分析表、總成績重點檔次比例自我比較分析表、歷屆歷次各學(xué)科質(zhì)量調(diào)查實測數(shù)據(jù)跟蹤分析報告等套表組成。
指標(biāo)3:對同一層次或不同層次學(xué)校實測數(shù)據(jù)進行深入分析。具體指標(biāo)有對各學(xué)校、各學(xué)科中間x%或前后x%(x為變量)學(xué)生平均成績診斷分析表,幫助學(xué)校深入分析和查找薄弱學(xué)科、薄弱學(xué)生群體。
指標(biāo)4:對學(xué)生個體整體學(xué)習(xí)情況、某學(xué)科知識點掌握情況、學(xué)業(yè)情況變化趨勢等進行跟蹤分析,建立學(xué)生學(xué)業(yè)成長跟蹤檔案。具體指標(biāo)有學(xué)生個體學(xué)科整體學(xué)習(xí)情況(試卷成績)對比分析(針對某次考試)、學(xué)生個體某學(xué)科知識點掌握情況(所有采分點得分率)對比分析(針對某次考試)等,并通過學(xué)生學(xué)業(yè)情況跟蹤曲線,給學(xué)生歸類并對不同類型的學(xué)生采取不同的干預(yù)方案。
通過各種評價指標(biāo),我們多角度、多方面衡量各學(xué)校教學(xué)質(zhì)量,充分發(fā)揮評價的指導(dǎo)功能,及時把握學(xué)生的變化動態(tài)并給予恰當(dāng)?shù)闹笇?dǎo);注意獲取教學(xué)中的反饋信息,及時調(diào)整教學(xué)與教研;客觀評估教與學(xué)的現(xiàn)狀,在充分肯定成績的同時,找出問題并弄清問題產(chǎn)生的原因,制定有效可行的改進措施,發(fā)揮考試評估所特有的監(jiān)督、調(diào)控、導(dǎo)向、激勵的功能作用。在評價的方法上采用定量和定性分類指導(dǎo)相結(jié)合的原則,同時充分考慮各學(xué)校生源的差異,對各學(xué)校歷次質(zhì)量調(diào)查實測數(shù)據(jù)實行一種多元化、多角度、動態(tài)的跟蹤觀察看變化評價體系。對完成目標(biāo)達到度進行檢驗時,同一類型的學(xué)校之間進行多指標(biāo)的評價,增加評價的指導(dǎo)性和有效性,為全區(qū)各中學(xué)教育教學(xué)改進提供了依據(jù)和建議。使學(xué)校、教師、學(xué)生能及時了解教與學(xué)中存在的問題和缺陷,有針對性地幫助他們改進教學(xué)和縮小差距,促進學(xué)生全面發(fā)展,促進教師專業(yè)水平提升,促進課堂教學(xué)增效減負,促進區(qū)域教育質(zhì)量的整體提高,滿足社會和家長日益增長的教育需求。同時也為教研員進行有針對性的教學(xué)研究、指導(dǎo)服務(wù)工作提供了重要的依據(jù)。隨著學(xué)校和教師對實測數(shù)據(jù)信息價值認(rèn)識的逐漸提高,利用它指導(dǎo)教學(xué)實踐的需求將會進一步深化。我們要在“十二五”期間,繼續(xù)深入學(xué)習(xí)研究,反復(fù)實踐探索,在現(xiàn)有基礎(chǔ)上進一步充實與完善,形成具有真正意義上的發(fā)展性評價理念和評價方式方法,進一步為基層學(xué)校、教師、學(xué)生及家長做好教學(xué)質(zhì)量的研究、指導(dǎo)與服務(wù)工作。