潘婉茹,孔凡哲
小學(xué)數(shù)學(xué)教師評價能力現(xiàn)狀調(diào)查與改進策略研究
潘婉茹1,孔凡哲2
(1.江蘇理工學(xué)院 教育學(xué)院,江蘇 常州 213001;2.中南民族大學(xué) 教育學(xué)院,湖北 武漢 430074)
評價能力是教師專業(yè)能力的重要組成部分.教師評價能力的主要維度是經(jīng)過專家咨詢確立的.通過問卷調(diào)查,樣本小學(xué)數(shù)學(xué)教師評價能力總體水平較高,在各維度上發(fā)展不均衡;確定評價目標的能力水平最高,運用評價工具與方法的能力水平最低;不同教齡、不同地域小學(xué)數(shù)學(xué)教師評價能力水平存在顯著差異.提升小學(xué)數(shù)學(xué)教師評價能力可以從評價機智、評價方法、評價能力發(fā)展共同體、評價主題培訓(xùn)4方面著手.
小學(xué)數(shù)學(xué)教師;學(xué)生評價;評價能力;專業(yè)發(fā)展
評價能力英文為“assessment competence”或“assessment literacy”.20世紀八九十年代,美國出現(xiàn)了一股調(diào)查州教師入職資格認證與教師教育項目是否開設(shè)了評價或測量課程的研究熱潮,發(fā)現(xiàn)教師在課堂中實際所需的和教師所接受的評價培訓(xùn)內(nèi)容非常不匹配[1].1991年,斯蒂金斯[2]通過描述“評價文盲”和有評價素養(yǎng)的人的基本特征界定了評價素養(yǎng).謝弗從內(nèi)容領(lǐng)域表征教師應(yīng)具備的評價技能,即評價的基本概念與術(shù)語、評價的使用、評價的規(guī)劃與開發(fā)、評價的解釋、評價結(jié)果的描述、評價的評估與改進、反饋和評分及評價倫理[3].1995年,斯蒂金斯提出教師評價能力包括:始于清晰的目的、關(guān)注成就目標、選擇適當?shù)脑u價方法、抽樣學(xué)生的成就、避免偏見和歪曲5方面[4].也有學(xué)者從教師對學(xué)生的理答能力角度指出,教師不能只是確定正確和錯誤的答案,還應(yīng)當認識到學(xué)生是在什么樣的范圍內(nèi)展開思考.教師要能區(qū)分學(xué)生回答中的錯誤、失誤、誤解和缺失[5].評價能力包含那些有可能影響教育決策的基本評價概念和程序的個人理解,教師的評價能力與教學(xué)能力同等重要.教師評價能力培訓(xùn)的匱乏突顯教師必須具備評價能力.應(yīng)該在職前就開始培養(yǎng)師范生的評價能力,將新手教師也看作是評價專家來培育[6].
國外關(guān)于教師評價能力的研究主要針對教師評價學(xué)生的語言學(xué)習(xí)能力.2015年,澳大利亞政府、新南威爾士大學(xué)、維多利亞教育培訓(xùn)部聯(lián)合推出TEAL項目,幫助教師在“學(xué)習(xí)評估”框架內(nèi)評估和報告學(xué)生英語語言水平和學(xué)習(xí)進度[7].《為優(yōu)質(zhì)學(xué)習(xí)設(shè)計評價》一書從評價質(zhì)量、成為評價專家、教師在評價中的角色、引領(lǐng)學(xué)習(xí)和賦能的評價、數(shù)字化評價5個部分闡述為優(yōu)質(zhì)學(xué)習(xí)進行評價的基本路徑和訴求.如果要使評價能力成為AFL(為學(xué)習(xí)而評價)文化的組成部分,就需要培育學(xué)校文化中校長、教師、學(xué)生這3個主要角色的評價能力,以促進為優(yōu)質(zhì)學(xué)習(xí)的評價[8].向教師提供評價能力培訓(xùn)的若干挑戰(zhàn)之一就是,要在短時間內(nèi)傳播絕對數(shù)量的信息以及該培訓(xùn)的方法.他們設(shè)計了一項關(guān)于教師評價能力培訓(xùn)的挑戰(zhàn)、影響及教師看法的調(diào)查.調(diào)查結(jié)果顯示,教師在高風(fēng)險測試中的評價能力處于弱勢狀態(tài),因此要設(shè)計分層式的教師評價能力培訓(xùn),賦予教師自主權(quán)和決策權(quán),同時要把參與評價能力培訓(xùn)的教師看作是評價專家,而不是新手[9].隨著國際上關(guān)于評價能力研究的發(fā)展,越來越多的研究開始關(guān)注到教師作為評價者應(yīng)具備的能力及其具體內(nèi)容[10].可以在數(shù)學(xué)課堂中采用真實評價任務(wù)來提高教師的評價能力[11],也可以通過視頻分析來觀察、記錄和評價師范生職前的評價能力[12].同時,關(guān)于個別具體學(xué)科教師的評價能力的發(fā)展狀況、培訓(xùn)等研究開始出現(xiàn).
國內(nèi)關(guān)于教師評價能力的研究主要是華東師范大學(xué)部分學(xué)者[13-15],他們從評價活動過程中教師應(yīng)具備的能力進行闡釋.也有研究者[16-17]從實際操作等技術(shù)層面對教師應(yīng)具備的評價能力進行刻畫.教師評價素養(yǎng)的發(fā)展依然停滯在前專業(yè)時期——教師基本靠“試誤”的方式來掌握一些實踐性的技藝[18].評價偏見也影響教師評價能力的正確發(fā)揮,部分教師將學(xué)生視為“比自己低下”者,人為設(shè)置種種針對“差生”或弱勢群體的不當規(guī)范,在評價情境中加以貶損與壓制[19].教師評價能力的發(fā)展需考慮教師專業(yè)發(fā)展階段[20],對教師的評價素養(yǎng)和評價活動進行元評價;加強新評價理論的研究、宣傳和教育;在教師職前教育、職后培訓(xùn)和校本教研中,把教育評價或教學(xué)評價作為獨立課程和研究課題;對發(fā)展性評價的質(zhì)性評價方法要強化示范引領(lǐng)[21].
2012年,《小學(xué)教師專業(yè)標準(試行)》頒布,從專業(yè)能力層面對教師“激勵與評價”學(xué)生的能力提出了4點要求,即對小學(xué)生日常表現(xiàn)進行觀察與判斷,發(fā)現(xiàn)和賞識每一個小學(xué)生的點滴進步;靈活使用多元評價方式,給予小學(xué)生恰當?shù)脑u價和指導(dǎo);引導(dǎo)小學(xué)生進行積極的自我評價;利用評價結(jié)果不斷改進教育教學(xué)工作.2020年,《深化新時代教育評價改革總體方案》的印發(fā),標志著國家層面教育評價改革正式開端.2021年,《關(guān)于進一步減輕義務(wù)教育階段學(xué)生作業(yè)負擔和校外培訓(xùn)負擔的意見》進一步對義務(wù)教育階段學(xué)生的作業(yè)、考試等做出了明確的規(guī)定.《義務(wù)教育數(shù)學(xué)課程標準(2022年版)》在“課程內(nèi)容”中提出了“學(xué)業(yè)要求”,描述學(xué)生在經(jīng)歷數(shù)學(xué)學(xué)習(xí)后應(yīng)具備的數(shù)學(xué)能力與素養(yǎng);增加了“學(xué)業(yè)質(zhì)量內(nèi)涵”和“學(xué)業(yè)質(zhì)量描述”;“教學(xué)評價建議”中對教學(xué)評價、學(xué)業(yè)水平考試的要求更加詳實.這些都對義務(wù)教育階段數(shù)學(xué)教師的評價能力提出了較高要求.
常態(tài)化學(xué)科教學(xué)與評價中,如何關(guān)注學(xué)生核心素養(yǎng)的培育情況,并有針對性地做出適當評價,對教師的評價能力提出了挑戰(zhàn).教師專業(yè)標準和教育政策對教師評價能力的規(guī)定和闡述,從外部評價的視角對教師評價能力和行為做出了規(guī)范和制約.但具體學(xué)科教學(xué)實踐場域中,教師的評價能力如何?教師既要關(guān)注評價什么、怎么評價,也要思考怎樣才能“評價好”.“評價好”對教師自身評價能力和作用的發(fā)揮提出了挑戰(zhàn).研究在梳理6個國家教師專業(yè)標準中關(guān)于“評價”內(nèi)容的基礎(chǔ)上,進行專家咨詢,編制問卷并調(diào)試,對J省部分小學(xué)數(shù)學(xué)教師開展調(diào)查,了解其評價能力現(xiàn)狀,并提出改進策略.
正式問卷確立后,在J省發(fā)放問卷500份,回收479份,回收率95.8%.有效問卷444份,問卷有效率為92.7%.基本信息包括小學(xué)數(shù)學(xué)教師的性別、年齡、教齡、學(xué)歷、職稱、任教科目(數(shù)學(xué)單科、語數(shù)雙科)、任教年級、學(xué)校所在地8個方面,作為后續(xù)差異分析的相關(guān)變量.
2.2.1 問卷編制與調(diào)試
問卷主要是在分析中國、美國、澳大利亞、英國、法國、新西蘭6個國家教師專業(yè)標準中關(guān)于教師“評價能力”具體要求的基礎(chǔ)上[22],確立了專家咨詢的維度.根據(jù)專家咨詢結(jié)果,教師的評價能力包括確定評價目標的能力(A1)、設(shè)計評價方案的能力(A2)、運用評價方法與工具的能力(A3)、引導(dǎo)學(xué)生自評及同伴互評的能力(A4)以及處理和運用評價結(jié)果的能力(A5)5個維度30個基本要點,采用李克特5級計分法,“非常不符合”計1分,“不符合”計2分,“有點符合”計3分,“基本符合”計4分,“完全符合”計5分,確立問卷初稿.試測階段發(fā)放100份問卷,通過反向計分、試誤題等保留有效問卷90份.問卷5個維度及問卷總體的內(nèi)部一致性較高,Cronbach’s均在0.714以上.通過對教師群體高分組與低分組獨立樣本檢驗及各題目與題項總分間的相關(guān)性,刪除部分題目,最終確立正式問卷.
正式問卷主要包含42道題目,其中A1含7道題目(1~7);A2含5道題目(8~12);A3含10道題目(13~17、20、21、24、28、29);A4含7道題目(18、19、22、23、25~27);A5含13道題目(30~42).
2.2.2 問卷的信度和效度
問卷樣本為444時,Cronbach’s系數(shù)和基于標準化題目的Cronbach’s系數(shù)都為0.945,此次調(diào)查內(nèi)在信度較為理想.
問卷編制中借鑒了相關(guān)問卷的表達方法,咨詢在讀博士、一線教師、高校專家進行試填,從文字表述、字面理解等角度優(yōu)化了部分說法,其內(nèi)容效度良好;問卷各維度Pearson相關(guān)性系數(shù)在0.837~0.925之間,問卷5個一級維度與問卷總體間的Pearson相關(guān)性系數(shù)在0.926~0.965之間,問卷內(nèi)在結(jié)構(gòu)效度良好.
就樣本教師而言,其評價能力水平的標準差都小于1,均值對總體的代表性程度較高.樣本小學(xué)數(shù)學(xué)教師評價能力水平均值為3.79,處于中等偏上水平(最高值為5);“確定評價目標”能力水平均值為3.92,為5個維度和總體平均水平中最高值;“運用評價方法與工具”能力水平均值為3.70,為5個維度及總體水平中最低值.同時,A3維度標準差最小,對樣本的代表程度最高,內(nèi)部差異較小,說明樣本小學(xué)數(shù)學(xué)教師運用評價方法與工具的總體水平都比較低(表1).
表1 小學(xué)數(shù)學(xué)教師評價能力總體水平
3.2.1 確定評價目標水平最高
A1均值為3.92,為5個維度中的最高值,高于總體平均值.7道題目的均值處于3.84~3.97間,表明教師在對評價目標的理解和把握層面水平相對均衡,認為自己在實際教學(xué)和學(xué)生評價中能關(guān)注到評價目標與教學(xué)目標、課程標準、學(xué)生需要、學(xué)業(yè)評價標準等具體要求,確定評價目標的能力較高(表2).a(chǎn)3為“關(guān)注學(xué)生對教學(xué)和評價的特殊需要”,a4為“熟悉數(shù)學(xué)學(xué)業(yè)評價標準,并能貫徹其要求”,這兩道題目均值相對較小,說明教師對學(xué)生的數(shù)學(xué)學(xué)習(xí)需求的理解和數(shù)學(xué)學(xué)業(yè)評價標準的貫徹存在一定的問題.
表2 A1及各題項的描述統(tǒng)計量
3.2.2 設(shè)計評價方案和運用評價方法與工具水平最低
小學(xué)數(shù)學(xué)教師“設(shè)計評價方案”的能力水平較低,A2均值為3.71,低于總體均值,教師認為自身設(shè)計評價方案的能力較低或設(shè)計評價方案不那么重要;各題目均值處于3.19~3.87間,教師在日常教學(xué)中基本能夠根據(jù)評價目標設(shè)定相應(yīng)評價方案(表3).a(chǎn)10為“我能根據(jù)評價活動和方案的需要制定相應(yīng)的評價標準”,均值為3.19,相對較低,表明教師在日常評價活動中對評價標準的制定情況需進一步關(guān)注.
表3 A2及各題項的描述統(tǒng)計量
小學(xué)數(shù)學(xué)教師“運用評價方法與工具”的能力水平最低.A3均值為3.70,是5個維度中的最低值,也低于總體水平均值.各題目及總體均值處于3.01~4.04間,屬于中等水平,說明教師能相對合理地使用評價方法與工具對學(xué)生進行評價.
極端值出現(xiàn)在a15、a17、a29.a(chǎn)15為“我能使用非紙筆測試(口試、檔案袋等)方法考查學(xué)生”,均值為3.17,教師對非紙筆測試方法的使用頻率較低,且使用水平不佳.a(chǎn)17為“我能根據(jù)學(xué)生的特點和現(xiàn)實需要開發(fā)新的測量工具”,均值為3.01,表明教師在實際學(xué)生評價中,評價工具開發(fā)水平較低,即采用現(xiàn)成的評價工具對學(xué)生進行評價.a(chǎn)29為“我經(jīng)常使用編好的試題對學(xué)生進行測驗”(此題為17題的測謊題,也是一道反向計分題,若被試教師作答時對其符合程度選擇“5”則錄入“1”,同理,選擇“4”則錄入“2”,選擇“3”錄入“3”),均值為3.27,教師常使用編好的試題測試學(xué)生,是不能根據(jù)現(xiàn)實需要開發(fā)新測量工具的表現(xiàn)(表4).這表明,在學(xué)生評價中,教師傾向于采用省時省力的方法與工具.
表4 A3及各題項的描述統(tǒng)計量
3.2.3 引導(dǎo)學(xué)生自評及同伴互評水平較高
A4均值為3.85,高于總體均值,說明教師能注意到他評與自評在學(xué)生學(xué)習(xí)與發(fā)展中的作用,能從學(xué)生需要出發(fā)幫助學(xué)生根據(jù)相關(guān)評價信息進行自我反思與調(diào)整,建立相應(yīng)的評價機制.各題項均值在3.80~3.93間,總體水平相對良好(表5).教師在日常教學(xué)中能注意這些方式方法的使用,且自認為使用的水平尚可,但在實際學(xué)生評價過程中,學(xué)生的自我評價、同伴評價、教師評價三者結(jié)合程度如何,學(xué)生進行自我評價的能力水平如何,需聚焦具體課堂教學(xué)狀態(tài)中各種方式的使用情況和效果.
表5 A4及各題項的描述統(tǒng)計量
3.2.4 處理和運用評價結(jié)果水平居中
A5均值為3.77,略低于總體均值,處于5個維度居中水平,表明教師認為自己能很好地處理和運用評價結(jié)果,改進教師的教、學(xué)生的學(xué)及學(xué)生評價.a(chǎn)30~a42題目均值在3.08~4.07間.a(chǎn)33為“我能與同事合作/獨立檢測評價結(jié)果”,均值為3.24,與同事合作檢測評價結(jié)果水平較低.a(chǎn)41為“我有一套獨特的記錄與查詢評價結(jié)果的方法”,均值最低(3.08),教師對評價結(jié)果的保存和記錄水平相對較低,也可能是教師沒去做,并非水平較低.a(chǎn)39為“我能根據(jù)學(xué)生的作業(yè)情況反思自己的教學(xué)”,均值最高(4.07),表明教師對學(xué)生作業(yè)的利用情況較好,并能根據(jù)學(xué)生作業(yè)情況改進自己的教學(xué)(表6).但不能說明其它評價方法和評價結(jié)果的利用程度.
表6 A5及各題項的描述統(tǒng)計量
對不同教齡小學(xué)數(shù)學(xué)教師評價能力進行均值比較,首先,5個維度及總體水平上,高教齡段教師評價能力水平均值較高,教齡在20年以上時,均值最高,高于總體水平.教齡在10年以后,均值水平較高,但相鄰教齡段間能力水平均值相差較?。f明新入職教師與剛工作5年,處于專業(yè)發(fā)展初期的教師,評價能力水平較低;入職10年后,評價能力水平在教齡上差異不大(表7).其次,新入職教師(教齡為1~5年)與其他各教齡段教師評價能力水平存在顯著差異,教齡在11~20年時,教師群體評價能力水平不存在顯著差異,教齡為20年以上時,其評價能力水平最高,與各教齡段教師評價能力水平均存在顯著差異.不同教齡段小學(xué)數(shù)學(xué)教師評價能力水平間差異的具體情況,需確定方差齊性后進行多重比較,以判斷其顯著性差異的具體情況.
總體說來,教師評價能力水平與教師教齡密切相關(guān),即教師在入職初期(入職后5年內(nèi)),評價能力水平處于相對較低狀態(tài),隨著教學(xué)及評價經(jīng)驗的豐富,其評價能力水平已有提升,相對較高,并趨于平穩(wěn)狀態(tài)(教齡在11~20年).當教齡到達20年以上時,其評價能力水平開始與其他教齡段教師間存在顯著差異,尤其在一些靈活性或創(chuàng)造性評價能力方面顯著增強(評價方案的設(shè)計、評價結(jié)果的運用等).
從城市—縣城—鄉(xiāng)鎮(zhèn),小學(xué)數(shù)學(xué)教師評價能力水平總體呈現(xiàn)由高到低的趨勢(表8).“城市”小學(xué)數(shù)學(xué)教師評價能力總體均值為3.92,“縣城”小學(xué)數(shù)學(xué)教師評價能力總體均值為3.63,“鄉(xiāng)鎮(zhèn)”小學(xué)數(shù)學(xué)教師評價能力均值為3.57,教師總體評價能力均值為3.79,即鄉(xiāng)鎮(zhèn)和縣城小學(xué)數(shù)學(xué)教師評價能力水平均值都低于總體評價能力水平均值.
多獨立樣本檢驗各項值均小于0.05,表明被試小學(xué)數(shù)學(xué)教師評價能力水平在“學(xué)校所在地”上存在顯著差異.在A2維度,城市教師僅與鄉(xiāng)鎮(zhèn)教師存在顯著差異,在各個維度及總體能力水平上,城市教師與鄉(xiāng)鎮(zhèn)、縣城教師間都存在顯著差異(表9).
表8 不同地域小學(xué)數(shù)學(xué)教師評價能力水平均值比較
表9 不同地域小學(xué)數(shù)學(xué)教師評價能力水平Kruskal-Wallis檢驗匯總
注:樣本1和樣本2分布相同.顯示漸進顯著性(雙側(cè)檢驗),顯著性水平是0.05.
此外,不同性別小學(xué)數(shù)學(xué)教師評價能力水平不存在顯著差異,承擔語數(shù)雙科教學(xué)任務(wù)的教師與承擔數(shù)學(xué)單科教學(xué)任務(wù)的教師評價能力水平也不存在顯著差異.
研究從評價活動程序角度出發(fā),結(jié)合各國教師專業(yè)標準的內(nèi)容分析,確立專家咨詢維度,構(gòu)建了教師評價能力的指標,認為教師的評價能力包含確定評價目標的能力、設(shè)計評價方案的能力、運用評價方法與工具的能力、引導(dǎo)學(xué)生自評和同伴互評的能力、處理和運用評價結(jié)果的能力5方面.根據(jù)實際情況設(shè)計問卷,針對小學(xué)數(shù)學(xué)教師的評價能力進行現(xiàn)狀調(diào)查.
樣本小學(xué)數(shù)學(xué)教師的評價能力水平相對較高,其中確定評價目標的能力水平最高,但在對學(xué)生數(shù)學(xué)學(xué)業(yè)評價標準的了解及實施方面存在問題.尤其是運用評價方法與工具的能力相對較低.制定評價標準、采用非紙筆測試等評價方法、開發(fā)新測量工具、記錄評價結(jié)果等能力比較低,同時不能很好地與同事交流評價結(jié)果.
小學(xué)數(shù)學(xué)教師評價能力的群體差異主要表現(xiàn)在教齡、職稱、地域上(在性別、學(xué)歷、任教年級、任教科目層面不存在顯著差異).具體說來,樣本教師入職初期(前5年內(nèi))的評價能力水平處于相對較低狀態(tài);隨著教齡增加、教學(xué)及評價經(jīng)驗的豐富,其評價能力在一段時間內(nèi)趨于平穩(wěn);教齡到20年以上時,其評價能力水平開始與其他教齡段教師存在顯著差異,且出現(xiàn)了評價能力水平的最高值.尤其是在一些靈活性或創(chuàng)造性評價能力方面相對較高(評價方案的設(shè)計、評價結(jié)果的運用等).類似地,職稱越高,小學(xué)數(shù)學(xué)教師評價能力水平相對越高.從教師所處地域看,樣本教師評價能力水平按照城市—縣城—鄉(xiāng)鎮(zhèn)的順序呈遞減趨勢.城市小學(xué)數(shù)學(xué)教師評價能力水平在各維度(除設(shè)計評價方案能力)都與鄉(xiāng)鎮(zhèn)、縣城教師間存在顯著差異.
為有針對性解決調(diào)查中反映的相關(guān)問題,小學(xué)數(shù)學(xué)教師評價能力的提升應(yīng)聚焦教師自我改進、學(xué)校行動及各級各類培訓(xùn).
一方面,小學(xué)數(shù)學(xué)教師要借助反思性評價知識的學(xué)習(xí)不斷積累元評價知識.人類的知識主要有經(jīng)驗—分析的知識、歷史—解釋的知識、批評—反思的知識3種類型,稱為技術(shù)的認知旨趣、實踐的認知旨趣、解放的認知旨趣[23].正式任教前,教師的評價知識主要停留在經(jīng)驗—分析層面;入職后,日常教學(xué)及學(xué)生評價中,教師開始思考學(xué)生評價及意義,結(jié)合教學(xué)做出關(guān)于學(xué)生評價的認識和總結(jié),其認識水平屬于實踐的認知旨趣.
調(diào)查中,小學(xué)數(shù)學(xué)教師評價能力水平呈現(xiàn)的不均衡,主要在于反思性評價知識占有不足,小學(xué)數(shù)學(xué)教師應(yīng)根據(jù)自我認知思考評價知識及評價案例,從學(xué)科視角了解或理解評價知識.同時,更應(yīng)關(guān)注評價知識如何在實踐中應(yīng)用,已有評價知識對學(xué)生評價現(xiàn)象、問題的功用,對自身評價知識、評價行為及學(xué)生評價結(jié)果應(yīng)加強反思與批判,邁向解放的認知旨趣,促進元評價知識的積累.
另一方面,小學(xué)數(shù)學(xué)教師應(yīng)主動鍛造評價機智.評價機智是指教師在學(xué)生評價中,能根據(jù)不斷變化的情境隨機應(yīng)變地對學(xué)生做出恰當?shù)姆夏繕说脑u價的能力.對小學(xué)數(shù)學(xué)教師而言,恰當?shù)脑u價機智要滿足學(xué)生數(shù)學(xué)核心素養(yǎng)發(fā)展的需要,考慮學(xué)生知識技能、數(shù)學(xué)思考、問題解決、情感態(tài)度價值觀目標的實現(xiàn).更應(yīng)關(guān)注評價目標與教學(xué)目標間的一致性,符合數(shù)學(xué)學(xué)習(xí)情境并能照顧學(xué)生個體的情感需求.照顧學(xué)生的心理邏輯、數(shù)學(xué)學(xué)科的邏輯和數(shù)學(xué)教科書的邏輯.亦即,教師這種隨機應(yīng)變的評價能力要具備發(fā)展性、針對性和境域性.例如,針對關(guān)鍵事件,教師可采取“懸置”的評價方法.有些時候教師過度、不恰當?shù)脑u價會適得其反.這種“懸置”性的評價,恰恰發(fā)揮了評價的隱性功能.
針對樣本小學(xué)數(shù)學(xué)教師“運用評價工具與方法”和“制定評價方案”的能力水平較低的現(xiàn)狀,可結(jié)合實際嘗試新的評價方法,結(jié)合小學(xué)數(shù)學(xué)學(xué)科特點及教師教學(xué)、評價風(fēng)格凝練一套完整的評價方案,并根據(jù)考查問題側(cè)重點的差異做適當調(diào)整.
5.2.1 實施基于數(shù)學(xué)情境的問題驅(qū)動式評價
小學(xué)數(shù)學(xué)教師可借鑒PISA數(shù)學(xué)測試,嘗試問題驅(qū)動式教學(xué)與評價方法,可分為6步.(1)洞悉數(shù)學(xué)問題的本質(zhì).對學(xué)生的數(shù)學(xué)素養(yǎng)進行考查和測試,明確該數(shù)學(xué)問題在哪一領(lǐng)域,考查學(xué)生哪些數(shù)學(xué)知識與能力.必要時可將一個數(shù)學(xué)問題劃分成幾個子問題,通過程序性任務(wù)和探究活動完成.(2)根據(jù)數(shù)學(xué)問題創(chuàng)設(shè)情境.對學(xué)生測試時,教師要結(jié)合數(shù)學(xué)問題,創(chuàng)設(shè)與學(xué)生現(xiàn)實生活密切關(guān)聯(lián)的生活情境.(3)設(shè)定評價標準,包含評分細則和等級水平.測試前設(shè)定學(xué)生問題解決的等級水平,每一等級水平要描述學(xué)生在問題解決過程中不同素養(yǎng)的具體表現(xiàn).(4)測試過程聚焦學(xué)生的數(shù)學(xué)思考、數(shù)學(xué)表達、數(shù)學(xué)交流,提高情境中的知識遷移能力、發(fā)展數(shù)學(xué)核心素養(yǎng)[24].(5)科學(xué)分析評價結(jié)果,適時反饋.根據(jù)學(xué)生實際情況,對學(xué)生的問題解決水平做出客觀解釋和分析,將結(jié)果反饋給學(xué)生,遵循評價倫理.(6)根據(jù)測試結(jié)果改進課堂教學(xué).基于情境測試的教學(xué)改進,著眼于全體學(xué)生,對不同層級學(xué)生的素養(yǎng)發(fā)展有不同作用,評價的焦點從學(xué)生數(shù)學(xué)成績轉(zhuǎn)向?qū)W生數(shù)學(xué)素養(yǎng).以個體在具體情境中的表現(xiàn)為依據(jù)評價數(shù)學(xué)核心素養(yǎng),科學(xué)設(shè)計和合理構(gòu)造用于評價數(shù)學(xué)核心素養(yǎng)的任務(wù)情境是提高評價工具信效度的重要保證[25].
5.2.2 嘗試非紙筆測試等新興數(shù)學(xué)教育評價方法
評價是一個動態(tài)的發(fā)展過程,主體性應(yīng)表現(xiàn)在評價的過程中,而不僅是評價的結(jié)果上[26].小學(xué)數(shù)學(xué)教師可立足學(xué)生數(shù)學(xué)素養(yǎng)發(fā)展和評價活動經(jīng)驗,主動嘗試非紙筆測試等評價方法,逐步提高形成性評價能力[27].例如,對低年段學(xué)生采用口試進行期末評價.(1)明晰口試題目設(shè)計的意圖,根據(jù)測試對象和測試目的編制口試題目.(2)設(shè)立相應(yīng)評價標準,劃分相應(yīng)等級水平,描繪每一等級水平對應(yīng)的素養(yǎng)水平和現(xiàn)實表現(xiàn).(3)口試實施過程中要特別注意教師自身因素、物理環(huán)境、學(xué)生語言水平及心理發(fā)展狀況等對測試效果的影響.(4)測試結(jié)束后要對口試結(jié)果做成效分析,分析測試過程中的影響因素及其與紙筆測試的差別[28].可借鑒國內(nèi)外其它大型測試(TIMSS、STEAM等)及表現(xiàn)性評價等方法,著重關(guān)注學(xué)生“三會”素養(yǎng)的達成,即“會用數(shù)學(xué)的眼光觀察現(xiàn)實世界,會用數(shù)學(xué)的思維思考現(xiàn)實世界,會用數(shù)學(xué)的語言表達現(xiàn)實世界”[29-46].
小學(xué)數(shù)學(xué)教師評價能力水平在教齡、地域間存在著顯著差異,與教師注重教學(xué)能力發(fā)展、忽視評價能力發(fā)展密切相關(guān).學(xué)??山Y(jié)合實際,借助教師發(fā)展中心及小學(xué)數(shù)學(xué)教研組,構(gòu)建以校為本的教師評價能力發(fā)展共同體.第一,構(gòu)建以校為本的教師專業(yè)學(xué)習(xí)模式,彌補外出、集體學(xué)習(xí)的不足.針對教師在學(xué)校內(nèi)遇到的常態(tài)化問題開展個體、有針對性的策略性學(xué)習(xí),解決教師在實踐中遇到的問題與難題.第二,轉(zhuǎn)變學(xué)生評價方式,由統(tǒng)一走向個性化.從整齊劃一的過渡標準化評價轉(zhuǎn)向標準基礎(chǔ)上的個性、自由、全面的學(xué)生發(fā)展評價,更應(yīng)注重評價的育人價值與功能的實現(xiàn).第三,教師評價的焦點由量化評價轉(zhuǎn)向質(zhì)性評價與量化評價結(jié)合.應(yīng)變革以學(xué)生成績裁定教師業(yè)績的量化評價方式,嘗試質(zhì)性評價方法,關(guān)注教師原有基礎(chǔ)、潛能發(fā)揮、教學(xué)特色甚至是學(xué)生評價特色,關(guān)注教師作為獨立的個體、獨立的“我”與他人的差異之處,逐步探討個性化的、質(zhì)性的教師評價體系.
教師的專業(yè)成長與發(fā)展離不開在職學(xué)習(xí)與培訓(xùn),“我國教師無論是在師范教育階段,還是入職后的各種培訓(xùn)中,較少受過系統(tǒng)科學(xué)的課堂評價設(shè)計以及合理利用課堂評價結(jié)果的訓(xùn)練”[47].問卷調(diào)查中69.4%的教師表示,在參加各級教師培訓(xùn)時,沒有涉及“評價”專題,87.4%的教師表示未參與過與“評價”相關(guān)的研究課題.一位鄉(xiāng)村小學(xué)數(shù)學(xué)教師表示,有時教研課題中會談到評價,但作業(yè)批改、質(zhì)量監(jiān)測、試卷分析都沒系統(tǒng)培訓(xùn)過,教研組長、教研員也只是了解一點點,像核心素養(yǎng),村小哪有什么方法能評價?
針對調(diào)查中不同小學(xué)數(shù)學(xué)教師群體之間評價能力水平的差異,可適當增加相應(yīng)培訓(xùn).首先,應(yīng)加強各級各類培訓(xùn)組織機構(gòu)的協(xié)同,平衡培訓(xùn)內(nèi)容,避免過于寬泛和宏大的主題,可適當關(guān)注教育評價、學(xué)生評價、試題命制、質(zhì)量監(jiān)測、學(xué)生評價方法的介紹和解讀等.其次,各級教師培訓(xùn)在課程設(shè)計、專家邀請、實踐安排中應(yīng)充分考慮到“評價”這一主題,特別是介紹當前流行的大型國際測試的形式、進展、測試結(jié)果等,調(diào)動不同專業(yè)發(fā)展階段教師參與,為新入職教師提供學(xué)習(xí)機會與平臺.最后,還應(yīng)適當增加國內(nèi)外中小學(xué)常用評價新方法的操作性案例介紹,有條件可組織鄉(xiāng)村小學(xué)數(shù)學(xué)教師到全國各地評價特色學(xué)校或評價經(jīng)驗豐富學(xué)校實地參觀,培訓(xùn)專家現(xiàn)場講解,評價知識和實踐操作同時在培訓(xùn)中顯現(xiàn),實現(xiàn)培訓(xùn)效果的增值.
只有變革制度場域中的文化氛圍,從考試文化走向評價文化,才能切實提升教師的評價能力.學(xué)生評價中教師應(yīng)處理好學(xué)校、學(xué)生、家長等利益相關(guān)者之間的關(guān)系,對學(xué)生評價結(jié)果做出回應(yīng)性、協(xié)商性解釋.當然,教師在具體評價中還應(yīng)根據(jù)評價內(nèi)容的差異進行評價形式的選擇與調(diào)適.值得一提的是,教師在發(fā)展評價能力的同時,也要遵循評價倫理.
[1] Stiggins R J. Relevant classroom assessment training for teachers [J]. Educational Measurement: Issues and Practice, 1991, 10 (1): 7-12.
[2] Stiggins R J. Assessment literacy [J]. Phi Delta Kappan, 1991, 72 (7): 534-539.
[3] SCHAFER W D. Essential assessment skills in professional education of teachers [J]. Educational Measurement: Issues and Practice, 1991, 10 (1): 3-6.
[4] Stiggins R J. Assessment literacy for the 21st century [J]. Phi Delta Kappan, 1995, 76 (3): 238-245.
[5] Bennett R E. Formative assessment: A critical review [J]. Assessment in Education: Principles, Policy & Practice, 2011, 18 (1): 5-25.
[6] JAMES Popham W. Assessment literacy overlook: A teacher educator’s confession [J]. Teacher Educator, 2011, 46 (4): 265-273.
[7] 范連眾,趙娜,孔凡哲.澳大利亞教師評價素養(yǎng)發(fā)展項目的內(nèi)容、特點及啟示[J].現(xiàn)代教育管理,2019(3):69-74.
[8] Wyatt-Smith C, Klenowski V, Colbert P. Designing assessment for quality learning [M]. Dordrecht: Springer Science Business Media, 2014: 91-107.
[9] Boyd B, Donnarumma D. Teacher involvement in high-stakes language testing [M]. Switzerland: Springer International Publishing AG, 2018: 105-126.
[10] DeLuca C, LaPointe-McEwan D, Luhanga U. Teacher assessment literacy: A review of international standards and measures [J]. Educational Assessment, Evaluation and Accountability, 2016, 28 (3): 251-272.
[11] Koh K, ChapmaN O. Improving teachers’ assessment literacy in Singapore mathematics classrooms: Authentic assessment task design [M]. Switzerland: Springer International Publishing AG, 2018: 207-221.
[12] Hoth J, D?hrmann M, KaiSer G, et al. Diagnostic competence of primary school mathematics teachers’ during classroom situations [J]. ZDM, 2016, 48 (1-2): 41-53.
[13] 王少非.教育評價范式轉(zhuǎn)換中的教師評價素養(yǎng)框架[J].教師教育研究,2009,21(2):65-69.
[14] 鄭東輝.教師評價素養(yǎng)內(nèi)容框架探析[J].教育科學(xué)研究,2010(10):34-38.
[15] 趙雪晶.基于聽評課的教師評價素養(yǎng)提升策略研究[J].教師教育研究,2013,25(2):57-61.
[16] 孔凡哲.切實提高每一位中小學(xué)教師的評價素養(yǎng)[J].教育測量與評價(理論版),2011(4):1.
[17] 葉延武,張加健.教師評價素養(yǎng):概念與行動[J].中小學(xué)管理,2012(4):40-42.
[18] 王少非.我國教師評價素養(yǎng)現(xiàn)狀及歸因分析[J].當代教育科學(xué),2008(12):3-6,8.
[19] 王帥.教師評價偏見與反偏見評價構(gòu)建[J].中國教育學(xué)刊,2013(6):81-84.
[20] 周淑琪.新手教師和專家型教師評價素養(yǎng)研究——基于教師專業(yè)標準的比較[J].比較教育研究,2014,36(1):12-17.
[21] 南紀穩(wěn).教師評價素養(yǎng)的現(xiàn)狀、問題與提升策略[J].教師教育論壇,2016,29(6):21-24,32.
[22] 潘婉茹,孔凡哲.教師評價能力的要素分析及啟示:國內(nèi)外教師專業(yè)標準比較的視角[J].外國中小學(xué)教育,2017(11):57-64.
[23] 施良方.課程理論:課程的基礎(chǔ)、原理和問題[M].北京:教育科學(xué)出版社,1996:73.
[24] 鄧海英,嚴卿,魏亞楠.數(shù)學(xué)情境問題解決錯誤分析與評價[J].數(shù)學(xué)教育學(xué)報,2021,30(1):61-67.
[25] 常磊,鮑建生.情境視角下的數(shù)學(xué)核心素養(yǎng)[J].數(shù)學(xué)教育學(xué)報,2017,26(2):24-28.
[26] 龔玲梅.數(shù)學(xué)教育評價的回顧與展望[J].數(shù)學(xué)教育學(xué)報,2003,12(2):31-34.
[27] 孫立坤,鮑建生.提高數(shù)學(xué)教師形成性評價能力的設(shè)計研究[J].數(shù)學(xué)教育學(xué)報,2014,23(2):79-82.
[28] 孔凡哲,趙晶,馬麗.中小學(xué)數(shù)學(xué)口試評價設(shè)計的實踐操作要領(lǐng)[J].創(chuàng)新人才教育,2016(2):6-11.
[29] 黃榮金,曹一鳴.中國數(shù)學(xué)教師合作學(xué)習(xí)的理論和實踐:一個國際視角的審視[J].數(shù)學(xué)教育學(xué)報,2021,30(3):1-3.
[30] 郭衎,曹一鳴.知識與信念:基于學(xué)生表現(xiàn)的教師核心素養(yǎng)研究[J].數(shù)學(xué)教育學(xué)報,2021,30(4):1-5.
[31] 張岳,楊濤,辛濤,等.特困地區(qū)中小學(xué)數(shù)學(xué)教師培訓(xùn)狀況與需求調(diào)查研究[J].數(shù)學(xué)教育學(xué)報,2021,30(4):6-11.
[32] 張僑平,邢佳立,金軒竹.小學(xué)數(shù)學(xué)教學(xué)中數(shù)學(xué)推理的理論和實踐[J].數(shù)學(xué)教育學(xué)報,2021,30(5):1–7.
[33] 黃曉林,黃秦安.中國三十年來小學(xué)階段分數(shù)研究文獻的系統(tǒng)分析及啟示[J].數(shù)學(xué)教育學(xué)報,2021,30(6):39–45.
[34] 鄒學(xué)紅,周鈞.基于問題理解的學(xué)生問題解決錯誤“診斷”研究[J].數(shù)學(xué)教育學(xué)報,2021,30(6):46–51.
[35] 鄭毓信.數(shù)學(xué)思維教學(xué)的“兩階段理論”[J].數(shù)學(xué)教育學(xué)報,2022,31(1):1-6.
[36] 曹一鳴,宋宇,趙文君,等.面向教育2030的數(shù)學(xué)課堂對話人工智能評價體系構(gòu)建研究[J].數(shù)學(xué)教育學(xué)報,2022,31(1):7-12.
[37] 沈中宇,劉思璐,汪曉勤.國外專家型數(shù)學(xué)教師研究述評[J].數(shù)學(xué)教育學(xué)報,2022,31(1):79-84.
[38] 楊亞平,孔德宏.基于課堂生成資源促進數(shù)學(xué)教師專業(yè)發(fā)展的個案研究[J].數(shù)學(xué)教育學(xué)報,2022,31(1):85-90.
[39] 吳紅,王鳳.數(shù)學(xué)教師有效教學(xué)風(fēng)格對小學(xué)生課堂參與度的影響:學(xué)業(yè)自我效能感的縱向中介作用[J].數(shù)學(xué)教育學(xué)報,2022,31(2):40-45.
[40] 張莎莎,宋乃慶,蔡金法.小學(xué)數(shù)學(xué)教師“問題提出”課堂教學(xué)行為研究[J].數(shù)學(xué)教育學(xué)報,2022,31(2):46-52.
[41] 顧麗英,鄧德巍.操作延展性練習(xí)教學(xué)——在兩種推理交互作用中發(fā)展數(shù)學(xué)新知識[J].數(shù)學(xué)教育學(xué)報,2022,31(3):50-55.
[42] 劉麗哲,綦春霞,屈若男.U-S數(shù)學(xué)教師合作共同體分析:活動理論視角[J].數(shù)學(xué)教育學(xué)報,2022,31(3):64-69.
[43] 易亞利,宋乃慶,胡源艷.小學(xué)生數(shù)學(xué)邏輯推理素養(yǎng):內(nèi)涵價值表現(xiàn)形式[J].數(shù)學(xué)教育學(xué)報,2022,31(4):28-31.
[44] 孫文娟,丁銳.分數(shù)圖式進階模型有效性檢驗與學(xué)生表現(xiàn)分析[J].數(shù)學(xué)教育學(xué)報,2022,31(4):32-37.
[45] 伍春蘭.中學(xué)數(shù)學(xué)“卓越教師”培養(yǎng)的循證實踐——以教學(xué)主張?zhí)釤挒槔齕J].數(shù)學(xué)教育學(xué)報,2022,31(4):38-43.
[46] 王曉宇,武麗莎,朱立明.中國數(shù)學(xué)教師核心素養(yǎng)研究的回溯與前瞻[J].數(shù)學(xué)教育學(xué)報,2022,31(4):44-48.
[47] 許瑜函,楊向東.促進學(xué)生學(xué)習(xí)和發(fā)展的課堂評價——2011課堂評價國際研討會會議綜述[J].全球教育展望,2012,41(1):93-96.
An Investigation of Assessment Competence of the Mathematics Teachers in the Primary School and Its Improvement Strategies
PAN Wan-ru1, KONG Fan-zhe2
(1. School of Education, Jiangsu University of Technology, Jiangsu Changzhou 213001, China;2. School of Education, South-Central University for Nationalities, Hubei Wuhan 430074, China)
Assessment competence is an important part of teachers’ professional competence. The main dimensions of teacher assessment competence are established through expert consultation. The questionnaire survey shows the overall level of assessment competence of the sample primary school mathematics teachers is relatively high and the development in each dimension is unbalanced. The competence level of determining the assessment goals is the highest and the competence level of using assessment tools and methods is the lowest. There are significant differences in the assessment competence of primary school mathematics teachers in different regions and teaching ages. The assessment competence can be improved from four aspects: assessment wit, assessment methods, assessment competence development community, and assessment theme training.
primary mathematics teachers; student assessment; assessment competence; professional development
G622
A
1004–9894(2022)06–0038–07
潘婉茹,孔凡哲.小學(xué)數(shù)學(xué)教師評價能力現(xiàn)狀調(diào)查與改進策略研究[J].數(shù)學(xué)教育學(xué)報,2022,31(6):38-44.
2022–09–10
江蘇省2019年度高校哲學(xué)社會科學(xué)研究項目——利益相關(guān)者視角下鄉(xiāng)村教師本土化培養(yǎng)模式探究(2019SJA1803);國家民委2021年度高等教育教學(xué)改革項目——民族院校中華民族共同體意識培育課程資源庫建設(shè)研究(ZL21006);江蘇省教育科學(xué)“十三五”規(guī)劃2020年度課題——核心素養(yǎng)視角下課堂評價的轉(zhuǎn)型與重構(gòu)(D/2020/01/20)
潘婉茹(1989—),女,吉林松原人,博士,講師,碩士生導(dǎo)師,主要從事教師教育、教育評價及數(shù)學(xué)教育研究.孔凡哲為本文通訊作者.
[責任編校:陳雋、張楠]