張玉瑩 楊鈺雯 王晶瑩
摘? ?要:科學的評價標準有助于促進學生全面發(fā)展,指導教師改進教學。文章以全球教學洞察教學質(zhì)量框架和科學教學評估準則為例,探討構(gòu)建多維課堂評價標準的必要性。在梳理當代課堂評估與科學評價走向的基礎(chǔ)上,總結(jié)我國典型的課堂評估標準,厘清我國科學評估標準與國際標準的差異,以期為我國科學課堂評估體系的構(gòu)建提供建議。
關(guān)鍵詞:課堂教學質(zhì)量 科學評估 課堂觀察
課堂教學評價是一把“雙刃劍”,既有指導課程改革、促進教師發(fā)展、激勵學生進步的正向功用,也有加劇趨同化、導致工具化與功利化的消極影響。長期以來,在“唯分數(shù)”評價理念的導向下,科學課堂評價倚重學生學科知識的獲取,對師生情感體驗與學生關(guān)鍵能力的發(fā)展關(guān)注不夠。中國四省市(北京、上海、江蘇、浙江)15歲中學生的閱讀、數(shù)學和科學成績在PISA 2018中位居全球榜首,但是幸福感得分較低。在全球教學洞察(GTI)視頻研究中,上海仍有2/3的課堂處于低水平參與狀態(tài)。[1]提高科學課堂教學質(zhì)量,構(gòu)建多元和有效的課堂教學評價指標勢在必行。本文聚焦當代課堂評估與科學評價新趨向,系統(tǒng)分析我國當前的典型課堂評估標準,并與GTI教學質(zhì)量框架與科學教學評估準則(Instructional Quality Assessment in Science,IQA-Science)進行比較,反思我國課堂評價體系的現(xiàn)狀,以期為科學課堂評估體系的構(gòu)建提供啟示。
一、課堂教學評估范式轉(zhuǎn)型及其典型案例
(一)課堂評估范式的轉(zhuǎn)型
第一,理念轉(zhuǎn)向:由工具理性到價值理性。傳統(tǒng)意義上各國中小學課堂評價更多關(guān)注“對學習的評價”,即評價是檢測學習效果的工具。隨著認知科學的發(fā)展,學習的主動建構(gòu)性得到廣泛重視?!盀榱藢W習的評價”(形成性評價)通過外部反饋、“作為學習的評價”通過內(nèi)部反饋,共同指向?qū)W生的發(fā)展,體現(xiàn)了從“評價即甄別”到“評價促發(fā)展”的理念轉(zhuǎn)變。故國內(nèi)外研究皆以“促學評價”為導向,促進學習的評價(assessment for learning)、作為學習的評價(assessment as learning)、學習導向的評價(learning oriented assessment)等課堂評估新范式陸續(xù)出現(xiàn)。[2]
第二,目標深化:由知識獲得到素養(yǎng)提升。在全球化和數(shù)字化的時代背景下,社會對人才培養(yǎng)的要求由具備基本的知識與技能上升為具備高階思維、能健康生活。素養(yǎng)評價分別在2008年、2017年起開始先后成為國外、國內(nèi)的研究熱點,故高階思維能力和學生情感參與成為課堂評價的重點。例如,法國課程體現(xiàn)“科學素養(yǎng)、批判思維”等高階思維能力,同時采用質(zhì)性評價方式;美國提出了“基于證據(jù)的評估設(shè)計”理論以支持高階能力測評等。
第三,方法革新:由單一到整合。在我國,聽評課應用較為廣泛;在國際上,通過教師自陳式報告描述班級教學較為廣泛,主觀性較強,很難提供課堂改進所需要的信息。此外,目前國際上的大規(guī)模測評多測評“教學活動出現(xiàn)頻率”“教學策略強度”等量化維度,缺乏對“師生互動過程”的質(zhì)性刻畫。可見,無論是主觀經(jīng)驗還是量化評價,都無法兼顧課堂教學的完整性與發(fā)展性。隨著互聯(lián)網(wǎng)與大數(shù)據(jù)的發(fā)展,科技賦能重構(gòu)教育評價體系。從20世紀末的國際數(shù)學與科學趨勢研究(TIMSS)到21世紀的GTI視頻研究,視頻技術(shù)一直是課堂教學研究中重要的方法論工具,通過人工智能、機器學習等對課堂教學視頻進行動態(tài)捕捉與編碼分析,可以獲得實際教學中師生互動的豐富細節(jié),輔以教學資料與學生作業(yè)以判斷學生的認知深度,可以有效彌補定性研究與定量研究的不足。
(二)典型案例:GTI視頻研究項目
經(jīng)合組織為了彌補教師教學國際調(diào)查質(zhì)性研究的不足,于第三輪調(diào)查中加入GTI視頻研究項目?;赑ISA學生問卷中關(guān)于教學質(zhì)量的條款及TIMSS中關(guān)于學習動機的研究,GTI將課堂教學概念化為三個維度六個實踐領(lǐng)域(見表1)。[3]其中,課堂管理指教師確保課程順利開展所采取的行動;社會情感支持指積極向上的氛圍及支持性學習環(huán)境;學科內(nèi)容質(zhì)量要求學習內(nèi)容準確,師生就知識、知識的表征方式建立清晰聯(lián)系;課堂話語包括促進認知推理的師生延展性對話和生生交談;學生認知參與指學生有思考地分析、創(chuàng)造或評價;基于學生理解的評價及回應則強調(diào)教師基于學生理解調(diào)整教學以激發(fā)學生深度思考。
可以發(fā)現(xiàn),GTI視頻研究貫徹以學生為中心的發(fā)展理念,強調(diào)學生認知、行為與情感的高度參與和全面參與。具體體現(xiàn)在兩方面:一是重視學生情感體驗,將支持性課堂氛圍、師生對話有效性等不直接影響學生成績但影響學生學習興趣的“邊緣性”課堂教學維度作為一個觀察維度,以評價為導向,引導學校、教師與家長關(guān)注學生學習的情感體驗并給予支持;二是強調(diào)學生高階思維發(fā)展,如學科內(nèi)容質(zhì)量維度特別關(guān)注教師激發(fā)學生認知參與程度,學生認知參與維度強調(diào)學生是否多視角、多方法解決問題。
GTI視頻研究給我國課堂教學評價提供了新的范式,有必要將社會情感支持與基于學生深度參與的教學質(zhì)量各維度納入我國課堂評價體系。此外,教學評估受教學主題的影響較大,相較數(shù)學課堂,科學課堂更加關(guān)注學生對學科核心概念與跨學科概念的深入理解及科學實踐能力,GTI視頻分析框架并不涉及該部分的評估。因此,如果有意將GTI視頻分析框架應用于科學課堂,還需借鑒其他科學評估準則并加以完善。
二、當代科學課堂評估的走向及其典型案例
(一)當代科學評價的走向:以美國為例
隨著美國《K-12科學教育框架》(A Framework for K-12 Science Education)和《新一代科學教育標準》(Next Generation Science Standards,NGSS)的發(fā)布,美國針對科學課堂教學與評估進行了一系列改革,于2018年公布《新一代科學教育測評》。NGSS評估系統(tǒng)強調(diào)評估不僅是教學的一部分,評估本身也是一種學習,評估應該融入教與學中,即從“為學習評價”向“評價即學習”轉(zhuǎn)變。因此,NGSS評估更關(guān)注學生高階能力發(fā)展及學生對復雜知識與技能的運用。具體而言,NGSS評估系統(tǒng)具有以下特點[4]:一是強調(diào)學科核心概念、跨學科概念和科學實踐的整合;二是關(guān)注概念與思維的進階;三是通過科學與工程實踐的表現(xiàn)任務(wù)揭示學生對概念的理解及技能運用水平;四是重視科學本質(zhì);五是面對全體學生,給予劣勢群體學生更多關(guān)注。
這些特點給科學課堂教學評價帶來了啟示與挑戰(zhàn):第一,要評估學生需完成的表現(xiàn)型任務(wù)的廣度與深度;第二,要評估學生圍繞學科核心概念和跨學科概念所進行的科學實踐的表現(xiàn);第三,要評估隨著教學的深入,學生對核心概念與跨學科概念的理解進階;第四,要評估是否每個學生都得到了公平的學習機會。
(二)當代科學評價的核心:整合、進階與公平
第一,以任務(wù)為基礎(chǔ),整合科學內(nèi)容與實踐。K-12科學教育框架強調(diào)科學教學必須為所有學生提供機會,在為學生學習創(chuàng)造的機會中整合科學內(nèi)容和實踐。學習機會是指在一定教學情境下,教師為學生呈現(xiàn)的學習內(nèi)容或?qū)嵺`練習的機會[5],是國際上評估教學質(zhì)量的重要指標。學生的學習機會受課堂分配到的科學任務(wù)的限制。任務(wù)是分配給學生的以課堂為基礎(chǔ)的活動,它可以是一個項目、一項調(diào)查或一個問題,作為一堂課的一部分或跨越多堂課。學生在從事科學任務(wù)時,對學科核心思想與跨學科概念進行高水平思考并有意義地參與科學實踐??梢哉f任務(wù)創(chuàng)造了學生思考主題的情境,提供了一個可定義和解釋學生智力工作的分析視角,從而評估學生在科學實踐中的表現(xiàn)。
第二,以認知為主線,關(guān)注概念理解的進階發(fā)展??茖W學習是認知不斷豐富與深化的過程,學生基于頭腦中已有的知識與經(jīng)驗建構(gòu)新知,在新舊知識同化或順應的過程中加深對新知識的理解。評估需要反映學習的進階屬性,刻畫學生對于概念理解或?qū)嵺`能力由淺到深的個性化學習路徑。NGSS評估系統(tǒng)是基于能力進階的測評,教師會選擇不同的表現(xiàn)型任務(wù)引導學生參與科學內(nèi)容的學習,這些不同的任務(wù)需要不同層次和種類的學生思維。但是在實施過程中,這些任務(wù)對學生思維的需求往往會下降[6],此時教師的提問與討論就發(fā)揮著重要的作用,故教師提問與學生討論的有效性也是NGSS評估重點關(guān)注的方面。
第三,以學習機會為中心,強調(diào)教育公平。高質(zhì)量的學習機會可以揭示教學的有效性,學生獲得學習機會的均等性也可以揭示教學公平。如果部分學生沒有機會學習規(guī)定的知識、發(fā)展實踐能力或者沒有機會展示學習成果、獲得有效的評價與反饋,那么課堂評價結(jié)果的可靠性將受到質(zhì)疑。有研究表明,教師在上課前對特定學生群體有具體的看法,這些看法會影響他們分配給學生的學習機會的類型[7],調(diào)查發(fā)現(xiàn),教師往往不會把自認為較難的任務(wù)分配給成績較差的學生,但是所有學生都喜歡參與復雜的任務(wù)并且樂于挑戰(zhàn)。
(三)典型案例:IQA-Science
美國現(xiàn)有的部分教學質(zhì)量指標存在一定局限性,沒有注意到由科學探究到科學實踐的轉(zhuǎn)向。因此,美國佛羅里達州立大學的米拉伊·特庫姆魯—基薩(Miray Tekkumru-Kisa)團隊開發(fā)了IQA-Science。IQA-Science由兩個量表組成(見表2),包括5個評價維度。任務(wù)潛力的嚴格性這一維度主要評估學生在完成教學和課程材料中出現(xiàn)的科學任務(wù)時可能需要的思維水平和類型;任務(wù)啟動的嚴格性主要評估教師設(shè)定的任務(wù)所描述的學生智力工作框架,因為科學課的開始通常會向?qū)W生介紹課程目標和他們將在課程中參與的活動,所以啟動階段在確定學生完成分配的任務(wù)需要的參與水平和思維方式方面發(fā)揮關(guān)鍵作用;任務(wù)執(zhí)行的嚴格性是對大多數(shù)學生在整個課程內(nèi)所從事的思考水平和類型的整體判斷,其中激發(fā)學生思維、組織富有成效的話語、提出發(fā)人深省的問題等教學因素會維持或增加學生參與高層次思維的機會;討論的嚴格性評估學生在討論中的思維水平和類型,通過富有成效的談話,學生可以交流思想,參與基于證據(jù)的主張和論證及科學的智力實踐;教師期望的嚴格性主要評估教師在整個課程和作業(yè)中期望學生完成的智力工作的種類和水平。
橫向來看,IQA-Science以任務(wù)作為整合科學內(nèi)容與實踐的載體,評估學生的表現(xiàn)與水平;縱向則按照任務(wù)設(shè)計、任務(wù)啟動、任務(wù)實施、任務(wù)討論的邏輯展開,評估學生認知需求變化,由淺入深,環(huán)環(huán)相扣。此外,課堂觀察集與學生作業(yè)集作為證據(jù),互證互補,建立了比較的共同基礎(chǔ),教師對學生作業(yè)的分類與評估標準則為研究教師對不同學生的看法如何影響教學任務(wù)分配提供了窗口。
三、對我國科學課堂評估標準的反思
(一)評估標準分類
由于我國大部分地區(qū)實行分科教學,關(guān)于科學課堂的評價標準有限,大多是直接運用外國的科學課堂評價工具或者基于外國評價標準進行改進,也有學者基于我國科學課堂現(xiàn)狀提出符合我國學情的評估標準。按照來源,將其分為國外改進和本土構(gòu)建兩大類(見表3)。
對于國外課堂評價標準的改進,主要呈現(xiàn)兩方面的特征。一是由于國內(nèi)外課堂文化的不同,在實證研究的基礎(chǔ)上,刪除某些觀察指標,如課堂反思在我國科學課堂出現(xiàn)相對較少。二是由于課堂評價工具的一般性,考慮到理科特有的實驗活動而新增實驗維度,包括演示實驗、學生實驗及教師指導下的實驗。本土構(gòu)建比較有代表性的是劉恩山教授基于核心素養(yǎng)提出的科學課堂評估范式——內(nèi)容知識、能力、教學知識、科學和探究的性質(zhì)(content knowledge,capacity,pedagogical knowledge,nature of science and inquiry,CCPN),其中理科屬性維度強調(diào)科學探究與科學本質(zhì)的評價,是重要的學科特征維度。
(二)國際比較與不足
1.評價理念堅持素養(yǎng)導向,但對情感體驗重視不夠
整體來看,我國本土構(gòu)建的科學課堂評價指標都包含了科學探究、態(tài)度責任、活動體驗等要素,體現(xiàn)了對學生素養(yǎng)發(fā)展的關(guān)懷??梢姡抡n改以來,我國的評價理念已經(jīng)逐步發(fā)生轉(zhuǎn)變,但是整體框架方面對師生情感體驗重視不夠,雖然標準里涉及該部分的評價,但往往作為課堂文化的子維度,并不作為必須的觀察要點。
2.評價內(nèi)容局限于表面互動,而非對背后規(guī)律的探究
通過對各評價標準的二級指標分析發(fā)現(xiàn),各評價標準都更加關(guān)注學生在課堂中的主體地位,但這種關(guān)注往往停留在師生互動的頻率及教學策略的恰當與否,難以指明教學需要具體改進之處,對教學指導作用有限。故課堂評價應關(guān)注教師的教對學生的影響及影響背后的規(guī)律,關(guān)注學生在從事探索現(xiàn)象或解決問題的科學任務(wù)時,對學科核心思想與交叉概念的高水平思考及參與科學實踐的程度。
3.評價指標進一步細化,但操作性還需加強
除北京市X區(qū)小學科學課堂評價標準外,其余科學課堂評價標準皆由二級評價指標和三級觀察要點組成,明確了評價對象、評價內(nèi)容及判斷標準。但是課堂是動態(tài)發(fā)展的,課堂評價也應該體現(xiàn)這一特點,即課堂評價在一級維度構(gòu)建與二級指標劃分上應突出學生認知進階,以便捕捉教學的優(yōu)點與不足。
綜上,我國的科學課堂評估標準堅持以生為本、素養(yǎng)導向,且重視對科學探究與活動實踐的評價。但評價理念上需加大對師生情感體驗評價力度;評價內(nèi)容上需從師生互動行為進一步深入到行為背后的規(guī)律探究;評價指標需規(guī)范描述,并進一步開發(fā)評估指南設(shè)計與案例,建構(gòu)系統(tǒng)的科學課堂評估體系。
四、啟示與建議
(一)加大“育人性”評價力度,發(fā)揮科學課程的育人功能
《義務(wù)教育科學課程標準(2022年版)》進一步強調(diào),要充分發(fā)揮科學課的育人功能,提高全體學生的核心素養(yǎng)?!翱茖W觀念、科學思維、探究實踐、態(tài)度責任”正是科學課程育人價值的集中體現(xiàn)。故學生的思維發(fā)展、態(tài)度責任變化也應該成為一級觀察維度。具體來說,課前應關(guān)注課程素材是否陶冶學生情感,學生是否對項目或任務(wù)感興趣等;課中應關(guān)注學生是否善于提出觀點,勇于質(zhì)疑他人,能否獨立運用科學素材進行科學實驗,教師是否提供情感支持等;課后應關(guān)注學生是否能說出自己非認知方面的收獲,是否遵守科學技術(shù)應用規(guī)范等。
(二)強調(diào)“生成性”評價理念,突出學習進階發(fā)展
NGSS基于學習進階構(gòu)建了“確定測評目標空間—拆解表現(xiàn)期望—創(chuàng)建維度整合圖—構(gòu)造學習表現(xiàn)—確定測評工具評價特征—開發(fā)測評工具”的測評設(shè)計路徑。[13]它以大概念為核心,以表現(xiàn)性任務(wù)為視角,以學生完成任務(wù)時的學習表現(xiàn)為證據(jù)實現(xiàn)形成性評價?;诖?,筆者結(jié)合《義務(wù)教育科學課程標準(2022年版)》構(gòu)建了圖1所示的評價設(shè)計路徑。首先,依據(jù)課標中的學業(yè)要求、學業(yè)質(zhì)量等確定評價目標;其次,從科學觀念、科學思維、探究實踐、態(tài)度責任四個維度解析評價目標,明確什么知識發(fā)展什么核心素養(yǎng);最后,分析預測學生在特定問題情境中的行為表現(xiàn)和素養(yǎng)水平,選擇合適的評價工具和細化評價標準。
(三)挖掘“表現(xiàn)性”評價證據(jù),健全學習表現(xiàn)體系
IQA-Science以任務(wù)為載體、以學習表現(xiàn)為證據(jù),來評估學生在科學課堂各階段的思維類型與水平?!读x務(wù)教育科學課程標準(2022年版)》同樣強調(diào)“通過觀察學生在解答問題、實驗操作、小組合作等的表現(xiàn)判斷學生的思維投入與能力水平”。[14]故要預設(shè)學生的學習表現(xiàn),結(jié)合學習目標與表現(xiàn)性任務(wù),細化評價標準?!读x務(wù)教育科學課程標準(2022年版)》中的學習活動建議幫助教師明確學生必要的學習活動路徑與基本學習方式,學業(yè)質(zhì)量標準幫助教師明確學生學業(yè)成就具體表現(xiàn)特征;但還需進一步進行科學研究,建立全面細致的學習表現(xiàn)評價標準體系以支持科學課堂評價。
參考文獻:
[1]徐瑾劼.以學生為主體的“參與式”課堂教學水平的跨國比較——基于 OECD全球教學洞察視頻研究數(shù)據(jù)的聚類分析[J].全球教育展望,2021(1):117-128.
[2]楊莉芳,王婷婷.國內(nèi)外外語教學課堂評價研究可視化分析(2008—2020)[J].外語教育研究前沿,2022,5(2):34-41,92.
[3]朱雁.從視頻研究透視課堂教學對學生學習的影響及其路徑——基于GTI視頻研究上海數(shù)據(jù)的實證分析[J].全球教育展望,2021(1):104-116.
[4]周丐曉,劉恩山.如何設(shè)計核心素養(yǎng)評估系統(tǒng):美國NGSS評估系統(tǒng)的國際經(jīng)驗與啟示[J].教育科學研究,2019(1):69-75.
[5]BYRNES J P,MILLER D C.The relative importance of predictors of math and science achievement: an opportunity-propensity analysis[J].Contemporary educational psychology,2007,32(4):599-629.
[6]TEKKUMRU-KISA M,PRESTON C,KISA Z,et al.Assessing instructional quality in science in the era of ambitious reforms: a pilot study[J]. J res sci teach,2021(58):170-194.
[7][8]TEKKUMRU-KISA M,STEIN K M,DOYLE W.Theory and research on tasks revisited: task as a context for studentsthinking in the era of ambitious reforms in mathematics and science[J].Educational researcher,2020,49(8):606-617.
[9]陳凱,馬宏佳,李丹.基于3C-FIAS的優(yōu)質(zhì)科學課堂互動研究[J].全球教育展望,2019,48(1):82-102.
[10]曹慧.STEM課堂觀察評估工具UTOP的初步應用研究——以北京市兩所國際學校的課程評估為例[J].北京教育學院學報,2017,31(3):12-18.
[11]周丐曉,劉恩山.核心素養(yǎng)視閾下的科學課堂教學質(zhì)量評估新范式:CCPN課堂觀察模式[J].生物學通報,2018(8):23-27.
[12]周月華.小學科學課堂教學質(zhì)量評價體系研究[D].曲阜:曲阜師范大學,2021.
[13]韓思思,羅瑩.科學教育研究新進展:美國新一代科學教育測評[J].課程·教材·教法,2019,39(6):131-137,30.
[14]中華人民共和國教育部義務(wù)教育科學課程標準(2022年版)[M].北京:人民教育出版社,2022:121-122.
編輯 朱婷婷? ?校對 呂伊雯