鄭方賢
“學(xué)習(xí)性評(píng)價(jià)”于1998年在國(guó)際教育界首次提出,隨后《黑箱內(nèi):通過(guò)課堂評(píng)價(jià)來(lái)提升標(biāo)準(zhǔn)》發(fā)表,國(guó)際教育界開(kāi)始了“學(xué)習(xí)性評(píng)價(jià)”的推廣應(yīng)用,掀起一場(chǎng)學(xué)校教育的革新。近十來(lái)年,“測(cè)評(píng)與學(xué)習(xí)”也受到中國(guó)教育界關(guān)注。但是,相對(duì)而言,中文里的測(cè)試、考試(或測(cè)評(píng))、評(píng)價(jià)等詞的含義,更接近英語(yǔ)單詞test、assessment、evaluation。在中國(guó)的學(xué)校教育中還難以看到“形成性評(píng)價(jià)”“以學(xué)習(xí)為導(dǎo)向的評(píng)價(jià)”等模式的實(shí)踐,更多的還是各種傳統(tǒng)的學(xué)科測(cè)驗(yàn),以及被學(xué)生戲稱為“周周爽”“月月爽”的考試。新高考推行后,逐年形成的大數(shù)據(jù),使得測(cè)評(píng)對(duì)教與學(xué)的提升成為可能。
競(jìng)爭(zhēng)性測(cè)評(píng)
推動(dòng)應(yīng)試學(xué)習(xí)模式
雖說(shuō)不斷進(jìn)步的技術(shù)保證了大規(guī)模測(cè)評(píng)的科學(xué)性、客觀性,其標(biāo)準(zhǔn)化、集約化的高效率也很好地回應(yīng)了社會(huì)與公眾的要求。但是眾所周知,這種由一次測(cè)試決定結(jié)果的終結(jié)性評(píng)估方式只能反映被測(cè)學(xué)生過(guò)去的積累,而并非全部能力,也無(wú)益于學(xué)生在學(xué)習(xí)上的自我完善與能力提升,反而會(huì)引起更大的考試焦慮,形成強(qiáng)烈的應(yīng)試學(xué)習(xí)模式。
以最近四十多年的高考為例,過(guò)去極低的錄取率使升學(xué)競(jìng)爭(zhēng)十分激烈。盡管高考是由多門科目的測(cè)試所組成,但較之單門科目分?jǐn)?shù)的得失,人們往往更關(guān)心總分,對(duì)總分的關(guān)心也是集中于其在總體中的排名是否達(dá)到了大學(xué)的錄取分?jǐn)?shù)線標(biāo)準(zhǔn)。
雖然命題專家圍繞課程標(biāo)準(zhǔn)、教學(xué)狀況和高校選拔要求對(duì)各科試卷進(jìn)行了精心開(kāi)發(fā)與設(shè)計(jì),也對(duì)考試過(guò)程和評(píng)卷質(zhì)量進(jìn)行了精確控制,但結(jié)果僅僅是各門科目總分的反映,實(shí)在令人非常無(wú)奈。由此所形成的以模擬考試代替教學(xué)的高強(qiáng)度應(yīng)試局面也是必然的結(jié)果。
新高考為測(cè)評(píng)發(fā)揮正向作用提供基礎(chǔ)。從1999年起,國(guó)家增加高等教育投入,不斷擴(kuò)大大學(xué)的招生規(guī)模,使得高考的錄取率連年提高,各地區(qū)普遍在80%左右甚至有超過(guò)90%,但是業(yè)已形成的應(yīng)試教育模式難有根本改觀,高中學(xué)生普遍是早晨7點(diǎn)踏進(jìn)教室、晚上9點(diǎn)離開(kāi)學(xué)校。
正是在這樣的背景下,國(guó)家堅(jiān)決推出了高考綜合改革方案。從測(cè)評(píng)的視角看,新高考被分成了兩個(gè)部分:即所有學(xué)生參加的語(yǔ)文、數(shù)學(xué)、外語(yǔ)科目的統(tǒng)一考試,與思想政治、歷史、地理、物理、化學(xué)、生命科學(xué)科目的高中學(xué)業(yè)水平考試。
而高中學(xué)業(yè)水平考試又根據(jù)學(xué)習(xí)的深入程度分為統(tǒng)一參加的合格性考試和選擇其中三門參加的等級(jí)性考試。即把一部分科目的測(cè)評(píng)以常模參照呈現(xiàn),作為個(gè)體學(xué)生與其他學(xué)生的比較,而另一部分科目的測(cè)評(píng)以標(biāo)準(zhǔn)參照呈現(xiàn),以期降低測(cè)評(píng)整體的競(jìng)爭(zhēng)性。因?yàn)閷W(xué)業(yè)水平考試的標(biāo)準(zhǔn)參照還是與得分率分布相聯(lián)系,依然呈現(xiàn)出高利害性。但是學(xué)業(yè)水平考試的定位與設(shè)計(jì),評(píng)價(jià)維度與指標(biāo)體系,使得評(píng)價(jià)標(biāo)準(zhǔn)的意義得到體現(xiàn),為測(cè)評(píng)對(duì)教學(xué)和學(xué)習(xí)的正向反撥奠定制度基礎(chǔ)。
測(cè)評(píng)提升高中教育質(zhì)量
就上海而言,2014年啟動(dòng)新高考,由于政策、環(huán)境的穩(wěn)定,特別是高考總分分布的穩(wěn)定可期,促使大家越來(lái)越關(guān)注如何通過(guò)測(cè)評(píng)提升高中培養(yǎng)質(zhì)量。目前,各考試科目依據(jù)不同的定位,兼顧知識(shí)學(xué)習(xí)與能力提升,輔之以系統(tǒng)的學(xué)業(yè)評(píng)價(jià)標(biāo)準(zhǔn),從內(nèi)容和能力兩個(gè)維度,通過(guò)相應(yīng)的各分項(xiàng)指標(biāo)形式得以呈現(xiàn)。因此當(dāng)學(xué)生完成考試以后,他所獲得的反饋還包括根據(jù)評(píng)價(jià)維度所描述的各分項(xiàng)指標(biāo)以及對(duì)應(yīng)的得分情況,學(xué)生可以了解自己的學(xué)習(xí)情況以及在群體中的相對(duì)位置。對(duì)于各科目的高中學(xué)業(yè)水平考試,學(xué)生更可以通過(guò)合格性考試的成績(jī)報(bào)告,發(fā)現(xiàn)自己在科目學(xué)習(xí)上的長(zhǎng)處與短處,以完善下一步的學(xué)習(xí),并爭(zhēng)取在等級(jí)性考試中取得好成績(jī)。我們通過(guò)上述方法所形成的學(xué)校和區(qū)域的成績(jī)報(bào)告,對(duì)改善學(xué)校的教育教學(xué)起到了促進(jìn)作用。
考試數(shù)據(jù)表明,上海師范大學(xué)附屬中學(xué)閔行分校在思想政治科目合格性考試上的表現(xiàn)非常突出,他們的學(xué)生在內(nèi)容領(lǐng)域和能力目標(biāo)評(píng)價(jià)維度各分項(xiàng)指標(biāo)上的得分率每年都比前一年有進(jìn)步。如果以2017年該科目平均成績(jī)的位次為基準(zhǔn),則2018年比2017年在全市提升了23名,2019年又比前一年提升了65名。閔行第三中學(xué),在思想政治、地理、化學(xué)、生命科學(xué)四門學(xué)業(yè)水平等級(jí)性考試科目上的進(jìn)步也很顯著,各科目的整體成績(jī)排位三年來(lái)實(shí)現(xiàn)了兩位數(shù)的增長(zhǎng)。閔行區(qū)很好地運(yùn)用了學(xué)校和區(qū)域的成績(jī)報(bào)告信息,區(qū)教育學(xué)院通過(guò)集體分析反饋和分學(xué)科到學(xué)校指導(dǎo)相結(jié)合的辦法,對(duì)學(xué)校的學(xué)科教學(xué)進(jìn)行了有效干預(yù),提升了學(xué)生的學(xué)習(xí)質(zhì)量。
測(cè)評(píng)的目標(biāo)指向是學(xué)習(xí)。在高考綜合改革之前,測(cè)評(píng)的功能是以科目總分的方式實(shí)現(xiàn)學(xué)生學(xué)業(yè)的評(píng)價(jià)與篩選;在新高考的推動(dòng)下,測(cè)評(píng)還能夠依據(jù)所建立的學(xué)業(yè)評(píng)價(jià)體系給予多維度多指標(biāo)的分析評(píng)價(jià),實(shí)現(xiàn)對(duì)教與學(xué)的正向反撥;未來(lái)還可通過(guò)更多分析工具、更多分析視角探索測(cè)評(píng)與教和學(xué)的深度融合,即把測(cè)評(píng)貫穿于學(xué)習(xí)過(guò)程中或者教學(xué)過(guò)程中,更有效地促進(jìn)學(xué)習(xí)、促進(jìn)學(xué)習(xí)質(zhì)量的提高。
從不同維度分析測(cè)評(píng)大數(shù)據(jù)
在前期的工作基礎(chǔ)上,我們嘗試不同的分析方法與工具,對(duì)考試數(shù)據(jù)進(jìn)行分析和挖掘,并反饋所獲得的有用信息,以促進(jìn)學(xué)校教學(xué)質(zhì)量的提高。我們采用統(tǒng)計(jì)中的聚類方法進(jìn)行評(píng)價(jià)維度的綜合聚類,結(jié)果發(fā)現(xiàn),對(duì)于學(xué)校來(lái)說(shuō),不同學(xué)科從不同維度來(lái)分析,可以得出不同的評(píng)價(jià)結(jié)果,而且對(duì)于不同的學(xué)校都有不同的需要提升之處。
僅以2019年數(shù)學(xué)科目高考學(xué)生的成績(jī)來(lái)分析各高中的數(shù)學(xué)教學(xué)情況。數(shù)學(xué)科目按照內(nèi)容領(lǐng)域和能力目標(biāo)兩個(gè)維度進(jìn)行評(píng)價(jià)設(shè)計(jì)的,150分的試卷試題中——分屬內(nèi)容領(lǐng)域維度的四個(gè)分項(xiàng)指標(biāo):方程與代數(shù)(占40分)、函數(shù)與分析(占43分)、數(shù)運(yùn)算數(shù)據(jù)整理和概率統(tǒng)計(jì)(占13分)、圖形與幾何(占54分);分屬能力目標(biāo)維度的五個(gè)分項(xiàng)指標(biāo):數(shù)學(xué)基礎(chǔ)知識(shí)與基本技能(占61分)、邏輯推理能力(占19分)、運(yùn)算能力(占19分)、空間想象能力(占19分)、數(shù)學(xué)應(yīng)用與探究能力(占32分)。
為保證分析結(jié)果的統(tǒng)計(jì)意義,我們確定204所高中學(xué)校的39000多名學(xué)生為分析對(duì)象,他們參加了2019年本市的高考數(shù)學(xué)科目考試且得分都位列前95%,并且每所學(xué)校的實(shí)際考生人數(shù)都大于或等于50。
我們以學(xué)校為單位,分析各學(xué)校的每位學(xué)生在各評(píng)價(jià)維度相應(yīng)分項(xiàng)指標(biāo)上的得分率,尋求他們的共性,以呈現(xiàn)不同學(xué)校的類型和特點(diǎn),希望能為學(xué)校的教學(xué)提供參考。
根據(jù)計(jì)算,204所高中學(xué)校從內(nèi)容領(lǐng)域維度得分上被分為了五類。這五類所含學(xué)校數(shù)目不等,分別是26所,49所,59所,41所和29所。
僅以其中兩類為例,我們可以發(fā)現(xiàn),包括上海中學(xué)等人們通常所說(shuō)的“四校八?!痹趦?nèi)的29所學(xué)校被歸為一類,這些學(xué)校都是近年來(lái)表現(xiàn)突出的優(yōu)質(zhì)高中學(xué)校。包括天山中學(xué)、復(fù)旦中學(xué)等在內(nèi)的49所中學(xué)被歸為另一類,也都是公認(rèn)的好學(xué)校。
從內(nèi)容維度來(lái)分析,可以得出的結(jié)論是——學(xué)生在試卷上的得分可以反映出這些學(xué)校的教師在數(shù)學(xué)科目?jī)?nèi)容知識(shí)的教學(xué)是成功的。
但是,如果對(duì)能力目標(biāo)維度也進(jìn)行了綜合聚類分析,同樣將學(xué)校分為五類,卻發(fā)現(xiàn)上述29所學(xué)校中有10所學(xué)校形成了單獨(dú)的一類,無(wú)疑,單單根據(jù)這一年的數(shù)據(jù)來(lái)看,這10所學(xué)校是兩個(gè)維度下綜合聚類分析表明最好的一類學(xué)校。
上述29所學(xué)校中的其他19所學(xué)校與49所學(xué)校中的22所組成了能力目標(biāo)維度綜合聚類分析結(jié)果中的單獨(dú)一類,這意味著這些學(xué)校的學(xué)生在高考答題時(shí),在這一維度上有相似性。
雖然不同的分類方法會(huì)給出不同的結(jié)果,但是通過(guò)多元的觀察視角,結(jié)合具體維度的分項(xiàng)指標(biāo),就不難發(fā)現(xiàn)教與學(xué)改善的空間。