關(guān)鍵詞教育評價,高考,歷史學(xué)科,命題
中圖分類號G63 文獻標(biāo)識碼B 文章編號0457-6241(2017)23-0026-06
作為國家基本教育制度的考試招生制度,歷來都是社會關(guān)注的焦點,目前新一輪高校招生制度改革正在穩(wěn)步推進,上海、浙江已經(jīng)完成了本輪改革的首屆高考工作。高考不但關(guān)系到國家選才和社會公平,而且又是銜接基礎(chǔ)教育和高等教育的重要環(huán)節(jié),其中考試形式和內(nèi)容的改革與基礎(chǔ)教育課程改革息息相關(guān)。2014年,國務(wù)院在《關(guān)于深化考試招生制度改革的實施意見》中就提出“改革考試形式和內(nèi)容”,但是“考什么、怎么考”并未引起教育界足夠的重視和研討。本文嘗試引入國際主流的教育評價理念,對傳統(tǒng)教育考試進行改進和提升,重點關(guān)注命題設(shè)計的理論基礎(chǔ)和實施路徑,在厘清教育評價內(nèi)涵的基礎(chǔ)上,以歷史學(xué)科為研究對象,探討學(xué)習(xí)目標(biāo)、修訂后的布盧姆教育目標(biāo)分類法和題型改革等命題設(shè)計的基礎(chǔ)性問題,著力于打造具有評價功能的教育考試,更好地發(fā)揮導(dǎo)向教學(xué)的作用。
1.教育評價理念的內(nèi)涵和新要求
教育評價(evaluation)主要是在20世紀20年代對“測量運動”進行批判的背景下開始出現(xiàn)的。19世紀末20世紀初,在美國迅速發(fā)展起來的“測量運動”給整個教育界帶來了很大影響,例如,從20世紀20年代起,一些教育家曾推廣各種教育測驗,如閱讀測驗、算術(shù)測驗等。但是,過分強調(diào)標(biāo)準(zhǔn)化考試,以及采用了較為方便的客觀測試的形式,造成學(xué)校教育理念發(fā)生較大偏差。例如,許多學(xué)校為考而教、為考而學(xué),考試與教育發(fā)展的目標(biāo)偏離越來越遠,從而引起社會越來越多人對標(biāo)準(zhǔn)化測驗以及測量運動的擔(dān)憂,也引起人們對教育及其考試發(fā)展的深入思考。
受美國進步主義教育運動的影響,泰勒在“八年研究”的基礎(chǔ)上,提出了教育評價的理念,主要是從學(xué)生的全面發(fā)展和多層次的教育目標(biāo)的需要出發(fā),進行課程、教學(xué)、評價一體的教育改革?!八^教育評價(evaluation),與測量(measurement)和考試(examination)不同,不是為了給學(xué)生排序和分組,而是為了驗證和改善教育課程,為學(xué)生的學(xué)習(xí)提供有效的信息,還需要開發(fā)和研制從多角度、多層次把握學(xué)生的學(xué)習(xí)行為的評價技術(shù)?!雹傥覀冞@里強調(diào)區(qū)分“教育評價”與“測量”“考試”的不同概念,就是要進一步明確“教育評價”的使用意義。教育評價強調(diào)的并不是僅僅從選拔排序的角度設(shè)計考試,而是要讓教育評價理念變成保障學(xué)生高水平學(xué)業(yè)的有效措施,教育評價的行為不是要暴露學(xué)生的個體差異,而是要成為服務(wù)于教育教學(xué)的診斷性工具,根據(jù)通過這種評價活動所得到的信息,來檢驗和改善教育活動。
實質(zhì)上,近年來教育評價理論和技術(shù)的發(fā)展也取得了長足的發(fā)展,更加豐富了教育評價理念的內(nèi)涵和內(nèi)容,必然會對教育教學(xué)實踐和招生考試制度產(chǎn)生重要的影響。因此,從教育評價的視角設(shè)計考試就顯得更為迫切,唯此才能充分發(fā)揮導(dǎo)向教學(xué)的作用。
2.高效教學(xué)離不開教育評價
毋庸置疑,教學(xué)與學(xué)習(xí)是不可分割的,但是課堂中的教與學(xué)只包含課程和教學(xué)指導(dǎo)是遠遠不夠的。除了要知道教什么和如何教之外,教師必須還要全面了解學(xué)生在教學(xué)過程中的學(xué)習(xí)特征以及程度,而評價正是教師觀察學(xué)生學(xué)習(xí)和教學(xué)效果的重要手段,但是這一點經(jīng)常被一線教師所忽略,“高效教學(xué)最為重要的基礎(chǔ)之一在于認識課程、教學(xué)指導(dǎo)、評估三者之間的三位一體性。然而,評估這一環(huán)節(jié)卻時常在課堂教學(xué)中被無意低估”。①怎樣才能實現(xiàn)高效的教學(xué),前提就是要了解學(xué)生的學(xué)習(xí)狀況,而具有評價功能的考試正是推動教學(xué)最有效的工具,這是因為這樣的考試能夠提供有意義和內(nèi)涵的反饋信息,幫助師生在教與學(xué)程中得到改進和提升。在新一輪普通高中歷史課程標(biāo)準(zhǔn)的修訂中,增加了考試命題的相關(guān)內(nèi)容和要求,這就是最好的例證。
正是因為教學(xué)、學(xué)習(xí)、評價具有一致性,才需要從教育評價的視角來設(shè)計考試。教育考試不能僅僅只是為了鑒別和區(qū)分,真正科學(xué)的考試,一方面在設(shè)計和實施中要有好的效度和信度,另一方面要能夠采集足夠的信息來反饋教學(xué)?;诮逃u價的理念來設(shè)計試卷,就是要將“為什么考、考什么、怎么考”置于整個教育發(fā)展這一鏈條中,通過“以評促學(xué)”來提升教育質(zhì)量,這才是考試的真正意義所在。
準(zhǔn)確認識學(xué)習(xí)目標(biāo)是教學(xué)、學(xué)習(xí)和考試的基礎(chǔ)性工作,無論是教師還是教育考試機構(gòu),當(dāng)對學(xué)生的學(xué)習(xí)情況和學(xué)習(xí)水平進行評估時,都必須確保測試的效度和信度。要保證測試的效度和信度,必須首先全面了解學(xué)習(xí)目標(biāo)。要做到這一點,比較有效的方法就是對學(xué)習(xí)目標(biāo)進行分解?!胺纸狻敝傅氖?,為了明確考試對知識內(nèi)容和認知層次的要求,對現(xiàn)有的課程內(nèi)容和目標(biāo)進一步細化、明確的過程。
那么我們究竟要分解什么?具體講,每項目標(biāo)都應(yīng)包括兩個基本要素:知識內(nèi)容和認知行為。第一,作為知識內(nèi)容來講。在教學(xué)和測試過程中,往往對知識內(nèi)容較為重視,例如,每當(dāng)問起“這份試卷考了什么?”教師常常會講,這道題考查了“工業(yè)革命”“英國君主立憲制”,等等??梢?,很多教師最為關(guān)注的是知識內(nèi)容。這并沒有什么不妥,但是如果僅僅把知識內(nèi)容等同于教學(xué)內(nèi)容或者考試的主要目標(biāo),那么就會出現(xiàn)很大的偏差。第二,認知過程維度更需得到關(guān)注。實際上,設(shè)計有效、可信的測試,除了對知識內(nèi)容要有清晰的理解,更應(yīng)充分了解認知行為。在基礎(chǔ)教育階段,認知行為能力也是較為重要的,例如根據(jù)布盧姆教育目標(biāo)分類法,我們能通過觀察學(xué)生的外在表現(xiàn)和行為來推導(dǎo)他們的認知水平,很多教師應(yīng)該對這一分類法較為熟悉。近年來,布盧姆的學(xué)生安德森對原模型進行了調(diào)整,并于2001年出版了布盧姆教育目標(biāo)分類法的修訂版。安德森一方面對認知層次作了更為詳細的解釋,另一方面也對原分類法進行了重新整理和排序,應(yīng)用起來更為有效?!罢J知過程維度取消了‘綜合,主要分為記憶、理解、應(yīng)用、分析、評價、創(chuàng)造”。②例如,美國的一位高中歷史教師在講解二戰(zhàn)后美國歷史時,對所在教學(xué)區(qū)的課程標(biāo)準(zhǔn)中的學(xué)習(xí)目標(biāo)進行了分解,主要是運用布盧姆教育目標(biāo)分類法對不同的認知行為進行了明確,如圖1①所示:endprint
如圖1所示,布盧姆教育目標(biāo)分類法能夠?qū)Σ煌恼J知行為進行合理劃分,如果將它與教學(xué)過程有效結(jié)合,當(dāng)教學(xué)觸及了知識內(nèi)容和認知過程維度兩個方面后,肯定會對教學(xué)和學(xué)習(xí)帶來更為顯著的變化。根據(jù)上述分解和解構(gòu)的方法,筆者現(xiàn)對新一輪即將實施的課程標(biāo)準(zhǔn)中的一個學(xué)習(xí)目標(biāo)——“改變世界面貌的工業(yè)革命”進行分解,下面具體加以說明。
通過了解工業(yè)革命帶來的社會生產(chǎn)力的極大發(fā)展以及所引起生產(chǎn)關(guān)系的深刻變化,理解工業(yè)革命對資本主義世界體系的形成及對人類社會生活的深遠影響。
18世紀下半葉,英國開始工業(yè)革命,它造成了人類歷史的重大變化,不僅意味著經(jīng)濟的巨大增長,而且意味著社會的整體變動。例如,“鐵路改變了英國社會,這不僅體現(xiàn)在成百倍增加的運輸量、數(shù)十倍提高的運行速度上,也不僅體現(xiàn)在把全國交織成一張鐵路網(wǎng)、從而把各地區(qū)不分遠近連成一體上;它還改變了人的思維模式,改變了人對生活的看法”。②可見,工業(yè)革命是個影響到人類命運的總體過程,最終改變了歷史前進的方向,我們在歷史學(xué)習(xí)和教學(xué)中,更需要立體化的觀察和多角度的思考。因此,為了更全面的學(xué)習(xí)工業(yè)革命這一課程內(nèi)容,我們可以這樣解讀:第一,“了解”在認知過程維度中應(yīng)屬于“記憶”層次,因此工業(yè)革命帶來的社會生產(chǎn)力的極大發(fā)展和所引起的生產(chǎn)關(guān)系的深刻變化,這一知識內(nèi)容在教學(xué)和考試過程中應(yīng)達到識記的目標(biāo);第二,在課程標(biāo)準(zhǔn)中還運用了“理解”這一行為動詞,我們應(yīng)該如何認識?我們以往遇到的很大一個困擾就是無法準(zhǔn)確說明,在教學(xué)和考試評價過程中也經(jīng)常模糊使用,甚至?xí)?dǎo)致誤用的后果?!靶抻喓蟮牟急R姆教育目標(biāo)分類學(xué)幫助我們拓展了教育目標(biāo)的范圍,尤其是對學(xué)習(xí)遷移的目標(biāo)進行了重點解讀。下面具體以‘理解這一認知目標(biāo)為例加以說明?!斫庠谌粘=虒W(xué)和考試評價過程中的應(yīng)用是最為廣泛的,但是常常被籠統(tǒng)的使用,甚至誤用,經(jīng)過安德森等人的修訂完善后,‘理解具體分為:解釋、舉例、分類、總結(jié)、推斷、比較和說明,層次更加細化,在實踐中更具操作性?!雹蹖嵸|(zhì)上,“理解”這一認知行為包含多個思維角度和指向,如果能夠更為全面地認識認知行為,還可以幫助我們拓寬試題命制的技術(shù)和方法,這一點尤其需要引起我們重視。為了更為明確地闡述這一問題,下面具體以其中的“解釋”為例,探討“解釋”這一類別的含義和思維指向,以及對應(yīng)的試題形式?!敖忉屖侵笇W(xué)生能夠?qū)⑿畔囊环N表示形式轉(zhuǎn)變?yōu)榱硪环N表示形式,它可能涉及將文字轉(zhuǎn)變?yōu)槲淖?,將圖畫轉(zhuǎn)變?yōu)槲淖?,將?shù)字轉(zhuǎn)變?yōu)槲淖郑瑢⑽淖洲D(zhuǎn)變?yōu)閿?shù)字,等等。解釋的同義詞是轉(zhuǎn)化、釋義、描述和澄清?!雹茉诟咧袣v史學(xué)習(xí)和測試中,“解釋”類別中的“釋義”“轉(zhuǎn)化”運用較多,具體說明見下頁表1。
需要注意的是,為了確保測試的是“解釋”,而不是“記憶”,情境材料的設(shè)計至關(guān)重要。我們常常會在一些模擬試題中發(fā)現(xiàn),本來是測試“理解”能級的試題,往往只能達到測試“記憶”的目標(biāo),很大原因是因為情境材料中沒有包含新信息。無論是“釋義”還是“轉(zhuǎn)化”,關(guān)鍵都在于需要考生有能力將“新知識”與已學(xué)知識建立起關(guān)聯(lián),實現(xiàn)知識鏈和思維鏈的整合。
在明確了考試目標(biāo)之后,最為重要的就是選擇測試項目需要的題型。在目前國內(nèi)的教育考試實踐中,考試題型按照評分方式的不同主要分為客觀題和主觀題,以高考歷史(全國文科綜合卷)為例,目前主要按照選擇題和非選擇題來分類。實際上,目前的命名方法只是從表面上進行概括,如果從教育測量學(xué)的角度來分類,應(yīng)分為選擇反應(yīng)式題型和建構(gòu)反應(yīng)式題型。選擇反應(yīng)式題型主要是指能夠?qū)⒋痤}過程以選項的形式來展現(xiàn)的題型,要求學(xué)生從多個選項中選擇,這類題型包括判斷題、配對題、選擇題等;建構(gòu)反應(yīng)式題型則是指需要答題者根據(jù)問題或者提示給予解答過程的題型,常用的題型有填空題、簡答題、論文等。
只有選擇了合適的測試題型才能達到教育評價的最佳功能,同時還需要考慮,測試的內(nèi)容、認知需求的層次、評估的時長,等因素,這都要求我們必須充分認識不同題型的測試功能,具體如表2所示:
表2主要介紹了不同類型的題型與認知過程維度的對應(yīng)關(guān)系,只有在準(zhǔn)確認識題型測試功能的基礎(chǔ)上,才能將之有效地應(yīng)用到命題過程中。試題在命制過程中,應(yīng)針對所學(xué)的知識內(nèi)容和認知層次進行設(shè)計,重點關(guān)注試題涉及的知識內(nèi)容是否對應(yīng)了正確的認知層次?也就是說設(shè)計的試題是否滿足了測試需求?下面具體以2016年全國Ⅱ卷第33題加以說明。
例題1:英國18世紀人口死亡率明顯下降,但1816年以后死亡率上升。1831~1841年,工廠集中的伯明翰每千人死亡率由14.6上升到27.2,利物浦由21上升到34.8。導(dǎo)致上述情況發(fā)生的重要原因是
A.城市環(huán)境極其惡化
B.化學(xué)工業(yè)污染嚴重
C.人口膨脹食物短缺
D.醫(yī)療技術(shù)水平下降
答案:A
如何理解工業(yè)革命以及城市化進程中的正負效應(yīng),這既是學(xué)習(xí)的重點也是難點。工業(yè)革命造就了城市社會,既帶來城市的諸多優(yōu)越性,也引發(fā)了嚴重的城市病,從環(huán)境惡化到犯罪猖狂,從擁擠到疾病叢生,等等。例如,“衛(wèi)生問題是‘城市病的又一頑癥。工業(yè)革命中大城市迅速擴張,但公共設(shè)施缺乏,經(jīng)常出現(xiàn)人、畜、垃圾共處的現(xiàn)象,臭水塘舉目皆是”。①該題的設(shè)計思路正是依據(jù)這一歷史背景。從知識內(nèi)容上講。該題以18~19世紀英國人口死亡率的變化設(shè)置情境材料,主要考查工業(yè)革命對人類社會生活的深遠影響,工業(yè)革命既給人類社會帶來生產(chǎn)發(fā)展和科技繁榮,同時工業(yè)化進程中的環(huán)境問題也不容忽視?!芭c18世紀死亡率明顯下降相比,顯然19世紀死亡率上升的主要是城市,工業(yè)集中地區(qū)死亡率上升也佐證了這一結(jié)論。結(jié)合所學(xué)知識,可知早期工人階級生活條件和工作條件十分惡劣”。①從認知層次上講??疾槟骋粴v史現(xiàn)象或歷史事件發(fā)生的原因在高考試題中經(jīng)常出現(xiàn),從布盧姆認知目標(biāo)分類學(xué)上講,這屬于“理解”層次中的“說明(Explaining)”,常常用于歷史學(xué)科中某一社會現(xiàn)象或歷史事件的變化將如何影響到其他部分的變化。例如,“在社會課中,目標(biāo)可能是說明18世紀重要歷史事件的原因,與之對應(yīng)的測評題要求學(xué)生閱讀與討論關(guān)于美國獨立戰(zhàn)爭的課文,然后建構(gòu)獨立戰(zhàn)爭中事件的一條因果鏈,從而對獨立戰(zhàn)爭爆發(fā)的原因作出最佳的說明”。②這里試題設(shè)計的關(guān)鍵在于:情境材料必須含有新信息,并且是歷史事件的現(xiàn)象或者特征,需要考生運用已學(xué)的歷史知識和思維構(gòu)建起認知鏈條。觀察上述這道試題的設(shè)計:一是試題情境與教材表述不具有重復(fù)性,教材知識沒有從人口死亡率的角度來講述工業(yè)革命的影響;二是選項設(shè)置也沒有使用教材語言表述。所以說,這道試題能夠?qū)崿F(xiàn)知識內(nèi)容和認知層次的結(jié)合,達到了“說明”這一能級目標(biāo)的測試目的。因此,可以說該題較好地達成了學(xué)習(xí)目標(biāo)和考試目標(biāo)的一致。endprint
根據(jù)前面的論述,我們已經(jīng)初步厘清不同題型所對應(yīng)的不同認知過程維度。以選擇題為例,該題型不但能夠考查“記憶”等低層次認知行為,而且還能較好地實現(xiàn)對“理解”“應(yīng)用”“分析”等高層次的考查;但是無法實現(xiàn)對“評價”和“創(chuàng)造”的考查,因為評價和創(chuàng)造需要學(xué)生從無到有地去建構(gòu)答案。“選擇題提供了多項答案供學(xué)生判斷,答案的內(nèi)容和形式已經(jīng)限定,無須重新填寫。鑒于此,我們所討論的選擇題主要針對理解、應(yīng)用和分析這三種高級認知層?!雹?/p>
雖然選擇題具有使用廣泛、評分客觀高效等優(yōu)勢,但是如果從教育評價的視角來審視,則會發(fā)現(xiàn)目前該題型仍有一定的不足,主要集中在作答結(jié)果只有正確和錯誤之分,無法完全展現(xiàn)考生的答題過程,同時也無法否區(qū)分出不同能力層次的考生。實際上,考生對于具有一定難度的試題,表現(xiàn)水平肯定有較大差別,不同選項的設(shè)計也代表了不同的答題水平,但是目前只有零分和滿分的賦分原則無法滿足這一要求,尤其是中等難度試題和難題,不可避免地會忽視部分中間群體的考生的答題情況。鑒于以上情況,我們可以從選項設(shè)計和調(diào)整試題賦分來進行改進設(shè)計,例如,在賦分上采用分層評價的方法,將選擇題的作答情況分為三層,完全做對是滿分,選擇次佳答案得部分分數(shù),完全錯誤為零分。實際上,這一理念和設(shè)計思路在2017年上海學(xué)業(yè)水平等級性考試(思想政治)試卷中得以驗證,具體就是:在20道選擇題中,有4道選擇題采用此類設(shè)計方法,試題作答要求是:每題各3分,每小題只能選一個答案,選出最佳答案得3分,次佳答案得2分,錯選得0分。
下面具體以2016年高考歷史(江蘇卷)第16題為例,探索分層賦分的思路和設(shè)計辦法,具體加以說明。
例題2:下表是美國制憲會議中出現(xiàn)的三個國會建設(shè)方案。
最終方案的形成過程體現(xiàn)了
A.選舉是民主原則的基本體現(xiàn)
B.國會是代議政體的權(quán)利中樞
C.妥協(xié)是現(xiàn)代政治的重要機制
D.分權(quán)是共和制度的關(guān)鍵措施
該題正確答案為C,中等難度題。該題考查的主要內(nèi)容是對美國代議制的理解。在如何創(chuàng)建新的政治體制上,1787年費城制憲會議存在較大的分歧。“弗吉尼亞方案”傾向于按照各州人口分配國會席位,如果實行此設(shè)計方案,人口居于少數(shù)的州就處于不利地位。例如,當(dāng)時作為最大州的弗吉尼亞的代表席位會是最小州的特拉華的10倍左右。“新澤西方案”提出在國會中每州不分大小都有同等的表決權(quán),但是該方案忽視了不同州規(guī)模大小的實際情況,也遭到了較大的抵制。最終,在連續(xù)爭論多日的基礎(chǔ)上形成了“康涅狄格方案”,該方案實際上是在考慮多方利益基礎(chǔ)上的妥協(xié)的方案,創(chuàng)造性地解決了代表席位的難題??梢姡讌f(xié)是西方民主政治的重要機制,所以本題正確答案為C。
根據(jù)目前的題型功能和評分標(biāo)準(zhǔn),選擇C選項才能得分,其他選項都不得分。但是,我們可以探索從教育評價的視角對該題的設(shè)計方法加以改進。具體講,將C選項設(shè)置為3分,D選項設(shè)置為1分,A、B選項設(shè)置為0分。理由如下:從干擾選項的設(shè)計中,不同的干擾選項有其自身功能,在認知層次和內(nèi)容要求上,選擇D選項的考生在學(xué)習(xí)能力和知識掌握上要優(yōu)于選擇A、B的考生。主要考慮因素有:部分考生之所以選擇D選項,主要是因為目前在實際教學(xué)中很少會涉及美國國會建設(shè)方案的論爭,教材中的主要內(nèi)容是關(guān)于分權(quán)和制衡;相比來講,部分考生選擇A、B,則能看出這些考生基本沒有讀懂材料,學(xué)習(xí)能力較低。這在考試結(jié)束后的大數(shù)據(jù)統(tǒng)計中也得到了驗證,“從考生選擇情況來看,有近30%的考生選擇了D項?!硗飧饔写蠹s14%的考生選擇了A、B選項”。①
但是,這并不意味著所有的選擇題都可以根據(jù)此類方法進行改進,前提條件必須滿足兩個:一是教育考試機構(gòu)在試卷設(shè)計的源頭上,對試題的測試指向和內(nèi)容要求有著清晰的認識;二是試題為中等難度題或難題,選項的設(shè)計能夠具有明確的指向。這樣,才能從選項設(shè)計和題目賦分上對部分選擇題加以改造,進而大幅提高其測試功能。
考試是教育的重要組成部分,考試要服務(wù)于整體教育目標(biāo)的實現(xiàn),所以應(yīng)該采取的態(tài)度就是實現(xiàn)教育考試向教育評價的躍升。目前我國教育改革發(fā)展已進入一個新的階段,招生考試制度的綜合改革已經(jīng)成為迫在眉睫的重要任務(wù)。無論是教育考試機構(gòu)還是教育教研部門,評價意識應(yīng)成為共同的理念,都應(yīng)樹立“以評促學(xué)”的教育理念,考試評價不僅是評估學(xué)生學(xué)習(xí)質(zhì)量的手段,更是促進學(xué)生學(xué)習(xí)的方法。對于教育考試機構(gòu)專業(yè)人員來講,更需要及時了解教育評價最新的發(fā)展動向,思考怎樣的考試能夠符合這一發(fā)展趨勢?如何讓考試也能成為促進學(xué)生學(xué)習(xí)的工具?因此,為了讓教育評價的理念從理論層面落到實地,需要我們統(tǒng)籌思考,尤其是在作為考試源頭的命題階段做好整體規(guī)劃和設(shè)計,致力于打造具有評價功能的教育考試,服務(wù)于整個教育質(zhì)量的提升。
【作者簡介】馬秀誼,任職于江蘇省教育考試院考試命題中心,南京大學(xué)歷史學(xué)院博士研究生,主要從事教育考試命題與評價研究等工作。
【責(zé)任編輯:王雅貞】endprint