教育評價對教育的導(dǎo)向作用十分重要,項目學(xué)習(xí)的評價改革成為推進(jìn)項目學(xué)習(xí)有效開展的重要舉措。2013年頒布的《教育部關(guān)于推進(jìn)中小學(xué)教育質(zhì)量綜合評價改革的意見》從多角度闡釋了推進(jìn)評價改革的重要性,并指出要建立健全中小學(xué)教育質(zhì)量綜合評價體系。《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010~2020年)》中也提出:“要改革教育質(zhì)量評價和人才評價制度,改進(jìn)教育教學(xué)評價,根據(jù)培養(yǎng)目標(biāo)和人才理念建立科學(xué)、多樣的評價標(biāo)準(zhǔn)?!?/p>
現(xiàn)行評價體系存在什么弊端?項目學(xué)習(xí)應(yīng)采用何種評價方式?是否可以為教育評價治痛?探討這些問題有助于我們完善對項目學(xué)習(xí)的認(rèn)識。
一、教育評價之痛分析
(一)評價目的異化于評價實施之中。
作為行政管理手段的評價的目的是什么?評價手段能否滿足現(xiàn)實的需要?評價手段是否指向并有效地服務(wù)于真實目的?評價結(jié)果在多大程度上實現(xiàn)了真實目的?所有這些問題不是被忽略就是被扭曲了。在教育評價中,人們總是有意無意地將教育視為取得良好評價結(jié)果進(jìn)而獲得物質(zhì)利益、社會地位的手段,這使得評價倒置為目的,教育倒置為手段,造就了“為了評價的教育”。
在評價實踐中,為了獲得一組可使用的行為目標(biāo),評價人員需要選擇并研制評價目標(biāo)。由于評價實施上的限制,評價目標(biāo)必須明確、細(xì)化。對目標(biāo)進(jìn)行選擇和規(guī)范是評價人員的任務(wù)之一。在目標(biāo)選擇的起始階段,應(yīng)該從學(xué)習(xí)及發(fā)展心理學(xué)的理論出發(fā),將目標(biāo)中最為重要的部分加以明確,并選擇合適的行為動詞將其表示出來,再將較為模糊不清的一般目標(biāo)具體化為可測量的行為目標(biāo),這是確定評價目標(biāo)的核心步驟。但我們注意到,用行為詞語來表示評價目標(biāo)存在一些缺陷,行為動詞只能刻畫認(rèn)知領(lǐng)域的教育目標(biāo),或者是能夠外化為行為動作、能夠被觀察和測量的目標(biāo)。僅僅如此是不夠的,這些目標(biāo)多局限于教育評價的較低層次要求,那些諸如綜合運(yùn)用、問題解決、決策和創(chuàng)造能力等較高層次的目標(biāo)往往不容易被外顯化、行為化,因而在教育評價實施過程中常被忽略。所以評價常常淪為對初級目標(biāo)的評價,或者只是對表述出的目標(biāo)進(jìn)行評價,而忽略了更多有價值的東西。
(二)崇尚數(shù)字的評價觀念成為主流。
西方的教育評價與測量理論體系傳入我國后,我國的評價技術(shù)逐漸完成了科學(xué)化改造,西方的評價理論中的工具理性也隨之被移植過來,逐漸根植于評價思想的深處。在這樣的思想影響下,不少學(xué)者認(rèn)為教育評價的本質(zhì)是教育測量,是用測驗的方式來測定學(xué)生對知識的記憶狀況或某項特質(zhì)。隨著各種統(tǒng)計方法和測量技術(shù)的發(fā)展,教育學(xué)家和心理學(xué)家傾向于將技術(shù)運(yùn)用于評價領(lǐng)域,并取得了一些成果。各種智力測驗、學(xué)力測驗和人格測驗被大量開發(fā),這影響著教育評價向定量化方向發(fā)展。教育評價強(qiáng)調(diào)客觀化和標(biāo)準(zhǔn)化,并在數(shù)理科學(xué)指導(dǎo)下表現(xiàn)出純量化的趨勢。
大多數(shù)國家都在實行大規(guī)模的標(biāo)準(zhǔn)化考試,不僅注重終結(jié)性評價的客觀性和數(shù)據(jù)的準(zhǔn)確性,還要求評價數(shù)據(jù)具有可比性和較高的信效度,以便推進(jìn)評價者對被評價者的有效管理和篩選。但是,標(biāo)準(zhǔn)化測試存在著隱患:一方面,標(biāo)準(zhǔn)化測試很難考察學(xué)生對方法和思想的理解,它過多地關(guān)注技能的掌握,讓學(xué)生強(qiáng)行記憶和再認(rèn)的成分較多,導(dǎo)致教師的教學(xué)側(cè)重點偏移,學(xué)生的思考能力下降,更難以從測試中挖掘出學(xué)生的創(chuàng)造性思維過程;另一方面,標(biāo)準(zhǔn)化測試使學(xué)生誤認(rèn)為問題的答案正確了就是學(xué)會了,或認(rèn)為問題有唯一正確的解法。
采用實證方法進(jìn)行評價雖然看似價值中立,但對其過分強(qiáng)調(diào)會導(dǎo)致評價在一定程度上走向數(shù)字被濫用的極端。若一味以量化評價排擠質(zhì)性評價,則會陷入確定性研究范式的泥沼,而難以深入解釋分析教育領(lǐng)域內(nèi)的復(fù)雜的不確定現(xiàn)象。
(三)甄別性評價與反饋缺失相矛盾。
教育選拔理念認(rèn)為教育評價可以甄別、篩選出適合接受更高級別教育的兒童,教育評價重在對兒童學(xué)力水平的鑒定和測量,目的在于篩選優(yōu)秀兒童,淘汰學(xué)力水平較低的兒童。測驗更擅長于甄別學(xué)生的紙筆作答能力,忽略了對其綜合能力的考察。更甚者,在高考等考試中,利害與風(fēng)險高度集中,為學(xué)生增加了過重的負(fù)擔(dān)。這些都是評價過度強(qiáng)調(diào)甄別功能導(dǎo)致的結(jié)果。
對于評價功能的認(rèn)識常常基于一個錯誤的假設(shè):如果學(xué)生能夠在課堂上或考試中解決書面演算的問題,自然也能夠解決現(xiàn)實生活中的問題。然而,這種遷移真的是自然而然的嗎?實際情況并不樂觀。在選拔理念中測查出的高分學(xué)生卻未必能夠?qū)⒅R應(yīng)用于實際生活中,TIMSS國際測試發(fā)現(xiàn)很少有學(xué)生能高質(zhì)量地運(yùn)用知識解決實際生活中遇到的問題。在教室里,學(xué)生似乎理解了他們所學(xué)的東西,因為他們能夠記住相關(guān)的知識,但一旦他們需要運(yùn)用所學(xué)概念、技能來處理新的問題時,就未必能學(xué)以致用了。
對評價功能的另一個錯誤的假設(shè)是,學(xué)生在評價中得到正確答案就意味著他們理解了該問題考察的知識。其實,紙筆測驗只能快速、高效地檢測學(xué)生對于知識的理解,但難以考察學(xué)生對知識的深層次理解,也很難暴露學(xué)生的思維過程,其信息反饋量是不夠的。
我們可以從下面的案例中探尋現(xiàn)行教育評價手段到底能提供多少信息量。
問題:從數(shù)字1至5中隨機(jī)抽取一個數(shù)a,再隨機(jī)抽取一個數(shù)b,如果a、b兩數(shù)的乘積是奇數(shù),那么小王贏,如果兩數(shù)的乘積是偶數(shù),那么小李贏。請問游戲公平嗎?
A. 公平 B. 不公平 C. 不確定
這類問題在紙筆測試中常以選擇題的形式出現(xiàn)。如果學(xué)生回答“不公平”,那么是否表示他已經(jīng)解決這個問題了?未必。通過和學(xué)生的訪談交流,研究者發(fā)現(xiàn)學(xué)生得出“不公平”的判斷有以下幾種理由。
(1)因為
奇數(shù)×奇數(shù)=奇數(shù)
奇數(shù)×偶數(shù)=偶數(shù)
偶數(shù)×偶數(shù)=偶數(shù)
很明顯偶數(shù)的可能性多于奇數(shù)的,所以不公平。而且我知道一定是小李贏。
(2)因為1~5中有三個奇數(shù),那么抽到奇數(shù)的可能性大,所以積是奇數(shù)的可能性也大。
(3)因為抽a的時候有5種可能,抽b的時候也有5種可能,一共是25種可能,25是奇數(shù),最后的兩種情況出現(xiàn)的可能性一定不相等,所以一定不公平。
(4)列出所有的情況之后可以算出各種結(jié)果出現(xiàn)的數(shù)量,乘積是奇數(shù)的可能有9種,乘積是偶數(shù)的可能有16種,所以不公平,小王贏的可能性小。
從上述分析可以發(fā)現(xiàn),結(jié)果性評價難以反映學(xué)生的全部思維過程。這就折射出評價體系的一個矛盾:甄別功能被過分強(qiáng)調(diào),但同時現(xiàn)行評價又很難考察學(xué)生的深層思考,有時還會出現(xiàn)判斷失察。這種矛盾必然導(dǎo)致教育參與者無法建立健全的評價觀念。
以上討論既是全球課程改革背景之下教育評價亟待完善的地方,也是教育評價理論未來發(fā)展的風(fēng)向標(biāo)。我們呼喚的項目學(xué)習(xí)評價應(yīng)當(dāng)是一種定位于學(xué)生發(fā)展的評價,凸現(xiàn)過程性,多種手段并行的活動。
二、項目學(xué)習(xí)評價治痛之道
有學(xué)者指出,對教育評價現(xiàn)狀絕不能“無奈”。在項目學(xué)習(xí)推進(jìn)過程中,反思教育評價現(xiàn)狀,變革項目學(xué)習(xí)評價方式,塑造合理健康的項目學(xué)習(xí)環(huán)境是必然的選擇。
(一)面向?qū)W生發(fā)展的評價目的。
項目學(xué)習(xí)的評價不能僅僅滿足于方法層面的改革,更重要的是要重新認(rèn)識評價的價值取向,重新認(rèn)識個人發(fā)展在教育評價中的重要地位,重新認(rèn)識教育評價的價值基礎(chǔ),思考如何評價學(xué)生才能有效促進(jìn)學(xué)生的發(fā)展,以實現(xiàn)項目學(xué)習(xí)的真正目的。
項目學(xué)習(xí)的評價要關(guān)注人的發(fā)展,關(guān)注人在社會中的價值和作用。有了這樣的認(rèn)識就有助于形成新的評價觀。要評價學(xué)生已有的能力和素養(yǎng),也要評價學(xué)生在學(xué)習(xí)過程中的表現(xiàn),還要評價學(xué)生發(fā)展性目標(biāo)的落實和達(dá)成。此外,教育評價強(qiáng)調(diào)的是學(xué)生的原有認(rèn)知與其發(fā)展現(xiàn)狀之間的比較,對學(xué)生的任何進(jìn)步和成就都要予以肯定。
從評價的導(dǎo)向功能分析,要克服多年來教育中重記憶輕理解的傾向,關(guān)注學(xué)生解決問題的能力、實踐能力和創(chuàng)新能力。從評價的診斷功能分析,不僅要正確估計學(xué)生在多大程度上實現(xiàn)了學(xué)習(xí)理解,還要在一定程度上解釋理解障礙產(chǎn)生的原因或問題的癥結(jié)所在。從評價的激勵功能分析,項目學(xué)習(xí)的評價要充分激發(fā)學(xué)生的學(xué)習(xí)積極性,喚起他們的內(nèi)在發(fā)展動力,促進(jìn)其不斷進(jìn)步。從評價的反思功能分析,在評價前組織學(xué)生對評價標(biāo)準(zhǔn)進(jìn)行討論可以促使學(xué)生進(jìn)行反思;在評價中學(xué)生的任務(wù)分析與策略選擇也是反思的有機(jī)組成部分;在評價后組織學(xué)生間相互交流并進(jìn)行原因分析等活動都推進(jìn)了學(xué)生的反思,提高了他們的自我認(rèn)識能力,在自覺內(nèi)省與反思中認(rèn)真總結(jié)前期行為,并思考下一步計劃,形成良好的反思與總結(jié)習(xí)慣。正如斯塔弗爾比姆所說:“評價最重要的意圖不是為了證明(prove),而是為了改進(jìn)(improve)?!逼鋵嵲谟⑽臉?gòu)詞法上已經(jīng)體現(xiàn)了“證明”和“改進(jìn)”的遞進(jìn)關(guān)系,證明了結(jié)論絕不是完結(jié),重要的是將結(jié)論應(yīng)用于改進(jìn)和提高,以促進(jìn)學(xué)生的發(fā)展。
(二)崇尚過程的評價指向。
項目學(xué)習(xí)的評價不能僅僅用數(shù)字來評定學(xué)生。美國學(xué)者格朗蘭德提出:評價是為了確定學(xué)生達(dá)到教學(xué)目標(biāo)的程度,收集、分析和解釋信息的系統(tǒng)過程;評價包括對學(xué)生的定量描述(測量)和定性描述(非測量)兩個方面。一個完整的評價計劃將包含測量和非測量兩種方法,用公式表示為:
評價=測量(定量描述)+非測量(定性描述)+價值判斷
在項目學(xué)習(xí)背景下,學(xué)生評價生成了新的內(nèi)涵和外延,評價的關(guān)注點聚焦在促進(jìn)學(xué)生的發(fā)展上。傳統(tǒng)的紙筆測驗需要改革,測量形式的評價和非測量形式的評價必須融合并存。
其中,非測量形式評價的主要載體是學(xué)生成長檔案。成長檔案屬于表現(xiàn)性評價方式,獲得資料的方式包括學(xué)生個人記錄、小組互評、教師觀察、談話等。其內(nèi)容包括學(xué)生在學(xué)習(xí)歷程中的過程性感悟,階段性小結(jié),階段性成果的制作經(jīng)歷、成果評價,終結(jié)性成果的制作經(jīng)歷、成果評價,展示評價等內(nèi)容。
無論項目學(xué)習(xí)評價的方式如何,其目的都是希望通過學(xué)生從事的學(xué)習(xí)活動獲知他們的學(xué)習(xí)能力。這是一種“在學(xué)習(xí)中”的評價,而不是像傳統(tǒng)的評價那樣,是一種“關(guān)于學(xué)習(xí)”的評價?!霸趯W(xué)習(xí)中”的評價更指向過程,使學(xué)生清楚自己前行的目標(biāo);“關(guān)于學(xué)習(xí)”的評價更指向結(jié)果,學(xué)生首先獲知的是自己的表現(xiàn)是否達(dá)標(biāo)、自己的排名是否提升?!霸趯W(xué)習(xí)中”的評價讓教學(xué)過程和評價過程融為一體,真正實現(xiàn)“以評促教”。
(三)多元化的評價維度。
傳統(tǒng)的評價將視線放在學(xué)生的學(xué)習(xí)成績上,關(guān)注的是教學(xué)效果在分?jǐn)?shù)上的表現(xiàn),忽視了教學(xué)對學(xué)習(xí)潛力的影響和對學(xué)生發(fā)展的改變,很容易打擊學(xué)生的學(xué)習(xí)積極性,也無助于教師對教學(xué)進(jìn)程的真切了解。項目學(xué)習(xí)評價應(yīng)著眼于學(xué)生的素養(yǎng)和學(xué)習(xí)能力,不僅要關(guān)注學(xué)生參與學(xué)習(xí)活動的積極性和全面性,還要關(guān)注學(xué)生是否具備勇于表達(dá)的愿望和清晰表達(dá)的能力,要關(guān)注學(xué)生的學(xué)習(xí)習(xí)慣、學(xué)習(xí)態(tài)度、自信心和合作交流意識等各方面。
Curriki在線課程中提供的“數(shù)學(xué)項目學(xué)習(xí)評價表”(見附表)從八個方面對學(xué)生的數(shù)學(xué)項目學(xué)習(xí)進(jìn)行評價,很好地體現(xiàn)了評價維度多元化。
教育評價方法紛繁多樣,只要是具備相應(yīng)理論基礎(chǔ)并經(jīng)過一段時間實踐論證的評價方法,都有其價值和意義,在其適用范圍內(nèi)都可以發(fā)揮一定的作用。項目學(xué)習(xí)要突破傳統(tǒng)教育評價之痛,評價方式的確立則應(yīng)當(dāng)遵循過程性、開放性和多元性的原則,將定量評價和質(zhì)性評價結(jié)合起來,將形成性評價和終結(jié)性評價結(jié)合起來,將外部評價和自我評價結(jié)合起來,發(fā)揮各種評價方式的作用,建立完善的評價體系。