【中圖分類號】G633.51 【文獻標識碼】A【文章編號】1002-3275(2025)03-68-04
分層評價理論在教學領域的應用由來已久,如SOLO分類評價理論和PTA量表法等,這些理論對促進主觀題評價客觀化有巨大作用。然而,就初中歷史而言,這些理論的應用主要見于中考閱卷,在日常教學中運用較少。究其原因,一是分層評價量規(guī)的命制難度較大;二是依據(jù)分層評價量規(guī)開展評價,仍舊無法擺脫評價者主觀因素的影響。因此,本文基于分層評價理論,通過生成式人工智能點評學生作業(yè),探討如何用生成式人工智能命制分層評價量規(guī)、如何利用生成式人工智能評價學生歷史主觀題等。
一、分層評價理論概述與應用依據(jù)
(一)分層評價理論概述
20世紀末,比格斯提出SOLO分類評價理論,并將其運用于歷史教學評價領域。比格斯認為,人的認知思維能力在不同學科及同一學科的不同問題上的表現(xiàn)不同。因此,比格斯將人在某個問題上表現(xiàn)出的認知思維能力具體描述為“前結構層次、單點結構層次、多點結構層次、關聯(lián)結構層次、抽象拓展結構層次”。SOLO分類評價理論關注人在認識具體問題時表現(xiàn)的思維能力水平,使得人的認知思維能力可測量。因此,將其運用于初中歷史主觀題的評價,可促進主觀題評價的客觀化。PTA量表法,即基本要素特征分析法,該方法強調通過測量學生的認知思維構成要素來評價學生的認知思維水平。在具體實踐中,可以將這兩種理論結合并運用于分層評價量規(guī)的制定,把學生在某個歷史問題上的認知拆分為若干維度,并將各個維度賦予不同的水平層次。
(二)分層評價理論在初中歷史教學中的應用依據(jù)
《義務教育歷史課程標準(2022年版)》(以下簡稱課程標準)凝練了初中歷史學科的五大核心素養(yǎng),強調學科核心素養(yǎng)是學生在解決具體問題時表現(xiàn)出的正確價值觀、必備品格和關鍵能力。因此,評價學生的學科核心素養(yǎng)發(fā)展情況無法通過紙筆測試實現(xiàn)。同時,課程標準強調教學評價“主要評價學生將所學歷史知識與技能運用于解決具體問題時所體現(xiàn)的核心素養(yǎng)水平”,這一理念與SOLO分類評價理論重視評價學生在解決具體問題時表現(xiàn)出的思維能力水平的理念不謀而合。此外,教育部辦公廳印發(fā)的《教育部辦公廳關于做好2022年中考命題工作的通知》強調中考命題要“減少記憶性試題,增加探究性、開放性、綜合性試題,堅決防止偏題怪題,促進有效考查學生綜合素質”。表明中考命題趨向考查學生綜合素質,初中歷史課堂需要一種理論去指導對綜合素質的評價。因此,分層評價理論在初中歷史教學中的應用,契合學科核心素養(yǎng)培育的教學需要,也符合中考新風向。
二、基于分層評價理論編制評價量規(guī)的兩種思路
生成式人工智能的迅速發(fā)展使人工智能閱卷成為可能,為主觀題評價客觀化提供了平臺。“人工智能閱卷有諸多的優(yōu)點,但重要的前提是要提供明確詳盡的評分細則?!盵1]。因此,分層評價量規(guī)的編制是促進歷史主觀題評價客觀化的首要條件。本研究結合案例1,探討制定分層評價量規(guī)的兩種方式。
案例1從秦朝到今天,統(tǒng)一多民族國家的形成和發(fā)展過程總是波折起伏,你會用什么詞語去形容這個過程呢?為什么?
要求:請你寫出一個觀點,如:我會用xx詞形容統(tǒng)一多民族國家的形成過程。并對這個觀點進行論述,如:我之所以用這個詞,是因為(列舉具體的史實,證明你的觀點)
(一)人工編制分層評價量規(guī)
人工編制分層評價量規(guī)的思路可概括為評價維度構思、水平層次劃分、水平層次描述三個步驟。
首先,教師需依據(jù)PTA量表法的基本觀點,結合歷史學科核心素養(yǎng)在問題中的體現(xiàn),將學生的思維能力表現(xiàn)劃分為不同的評價維度。案例1旨在考查學生提煉觀點并據(jù)此運用知識(史實)論證觀點的思維能力。從思維能力看,涉及史料實證和歷史解釋等歷史學科核心素養(yǎng)。從學情看,初中生的主觀題論述容易出現(xiàn)邏輯思維混亂的問題,考查學生的實證邏輯思維也是這道題的目標。因此,教師可將評價維度劃分為觀點陳述、觀點論證、論證邏輯三個維度。
其次,依據(jù)SOLO分類評價理論劃分水平層次。從觀點論證維度看,可以將觀點論證的思維層次劃分為四個層次:一是無法給出證據(jù)論述觀點;二是能夠給出一個證據(jù)論述觀點;三是能夠給出多個證據(jù)論證觀點,但角度相似;四是能夠給出不同角度的多個證據(jù)佐證自己的觀點。四個層次分別對應不同水平層次的思維能力和分值。
最后,將三個維度各個層次的思維水平結合案例1做具體化的描述,形成人工編制分層評價量規(guī)示例(見表1)。
(二)人機互動編制分層評價量規(guī)
人機互動編制分層評價量規(guī)的步驟較為簡單,主要包括輸人需求、AI生成量規(guī)、人機互動調整量規(guī)三個步驟。首先,教師輸入指示詞:假如你是一名初中歷史教師,請依據(jù)案例1,圍繞觀點陳述、觀點論證、論證邏輯三個維度,編制一套分層評價量規(guī)。其次,文心一言平臺會根據(jù)教師輸入的提示詞生成文字版分層評價量規(guī)。最后,教師可根據(jù)自己的需要,要求文心一言平臺對這一量規(guī)進行調整。例如輸入指令:請你按照以下要求修改分層評價量規(guī)一一以表格的形式呈現(xiàn)評價量規(guī)。最終文心一言平臺將分層評價量規(guī)繪制成表格,形成文心一言平臺編制分層評價量規(guī)示例(見表2)。
(三)兩種分層評價量規(guī)編制思路對比評析
以上兩種分層評價量規(guī)的編制思路可從量規(guī)區(qū)分度和操作難易度來作比較。一是從區(qū)分度看,文心一言平臺編制的分層評價量規(guī)區(qū)分度更高,并且在每個水平的描述與劃分上做得更細致。二是從操作難易度看,人工編制分層評價量規(guī)的難度大于人機互動編制分層評價量規(guī)。在教學實踐環(huán)節(jié),教師可將兩種方式結合起來,將自己編制的分層評價量規(guī)交給生成式人工智能做進一步的優(yōu)化。然而,不論哪種分層評價量規(guī)命制思路,究其本質都依賴于量規(guī)編制者對評價的理解與認知。人工編制分層評價量規(guī)需要編制者自身對評價有深刻的認知,而人機互動編制分層評價量規(guī)需要人充當提問者和把關者的角色。
三、生成式人工智能點評學生作業(yè)的案例分析
基于分層評價量規(guī)的編制,教師可將編制好的評價量規(guī)與生成式人工智能技術相結合,運用于學生主觀題的評價,在促進主觀題評價客觀化的同時對學生提供個性化的修改建議。
前文依據(jù)案例1,分別以人工和人機互動兩種方式編制了兩套針對同一問題的分層評價量規(guī)?,F(xiàn)依托文心一言平臺,分別依據(jù)這兩套分層評價量規(guī)點評同一份學生作業(yè)。
案例2我會用“反復”一詞去形容這段歷史。我之所以用這個詞去形容這段歷史,理由如下: ① 從秦朝以來,歷史總是在統(tǒng)一與分裂中交替,如三國到魏晉,分裂中孕育著統(tǒng)一的趨勢。 ② 每個王朝的覆滅都與王朝后期統(tǒng)治民不聊生,進而導致農民起義有巨大的關系。
首先,將人工編制的分層評價量規(guī)和問題放入一個文檔,并將其導人文心一言平臺。其次,教師以文字的形式將案例2的內容輸入文心一言平臺,并要求其依據(jù)導人的問題和人工編制的分層評價量規(guī)對作業(yè)進行點評賦分,可以得到依據(jù)人工編制分層評價量規(guī)的點評結果(見表3)。最后,將文心一言平臺編制的分層評價量規(guī)和問題以文檔的形式導入文心一言平臺,并讓其據(jù)此點評案例2,可以得到依據(jù)文心一言平臺編制分層評價量規(guī)的點評結果(見表4)。
這兩份由文心一言平臺生成的點評結果,差異突出表現(xiàn)在最終得分上。從點評的具體情況看,這種差異源于兩份分層評價量規(guī)的細致程度不同。人機互動編制的分層評價量規(guī)較人工編制的分層評價量規(guī)更為細致,因此在具體維度的各水平層次上的賦分也更具體。同時,兩份點評結果都存在同樣的特點。一是點評秉持“結構嚴謹”的邏輯。兩份點評結果按照先分后總的邏輯,從具體維度點評到整體情況總結。二是點評嚴格參照既定分層評價量規(guī)。兩份點評雖然依據(jù)不同的分層評價量規(guī),但是都遵循既定的得分標準,評價更為客觀公正??傊徽搮⒄漳姆N分層評價量規(guī),生成式人工智能點評學生作業(yè)都能嚴格依據(jù)既定的分層評價量規(guī)給學生的作業(yè)作出細致的點評,點評效率高。但生成式人工智能的點評缺乏能動性,其內容生成需依賴于用戶輸入的指示詞。
四、生成式人工智能分層點評學生作業(yè)的應用反思與建議
(一)生成式人工智能分層點評學生作業(yè)的應用反思
首先,不論按照哪種方式編制分層評價量規(guī),都需立足具體維度。課程標準強調教學評價應當指向學生學科核心素養(yǎng),因此評價維度的設置也要立足學科核心素養(yǎng)。上述分層評價量規(guī)的三個評價維度,都立足于史料實證和歷史解釋兩個核心素養(yǎng)。
其次,從兩套分層評價量規(guī)來看,人工編制的分層評價量規(guī)雖然較為體現(xiàn)人的意志,但是在各個維度內部不同水平的區(qū)分度和具體描述等方面稍遜色于生成式人工智能。但生成式人工智能編制的分層評價量規(guī)也可能存在具體描述和層次劃分不符合用戶需求的問題。
再次,從運用不同分層評價量規(guī)評價學生作業(yè)的結果來看,生成式人工智能在分析學生論證思維、提出個性化建議以及細化評分等方面比人更具優(yōu)勢。
最后,以往教師通過大量評閱學生的作業(yè)來了解學生作業(yè)的總體完成情況,很難實現(xiàn)對學生的個性化指導。依托生成式人工智能評閱作業(yè)的一大優(yōu)勢是能夠對每個學生的作業(yè)進行個性化的點評,這對促進學生個性化發(fā)展意義深遠。
(二)生成式人工智能分層點評學生作業(yè)的應用建議
首先,分層評價量規(guī)的編制可將人工編制和人機互動結合起來,使分層評價量規(guī)的制定更有區(qū)分度和可操作性。一是教師可先根據(jù)需要編制一個分層評價量規(guī),再由生成式人工智能完善;二是教師可先以生成式人工智能生成分層評價量規(guī),在此基礎上再由人工修訂完善。
其次,生成式人工智能在歷史教學領域的應用要由歷史教師把關。生成式人工智能依據(jù)分層評價量規(guī)評閱的學生作業(yè)和改進意見,應輔以教師的審讀和加工,使之更符合義務階段歷史教育的需要。因此,教師可將作業(yè)交由人工智能去批閱,但教師要進行審核和二次加工,以確保評價和建議聚焦主流價值理念、符合初中生實際發(fā)展需要。
最后,教師需轉變在歷史教學評價中的角色定位。面對生成式人工智能,教師應主動了解和運用它去輔助教學評價,但不能對其產生依賴,避免陷入技術依賴的誤區(qū)。教師要將自己的角色定位從教學評價的實施者轉變?yōu)樵u價過程的設計者和評價結果的把關者。
生成式人工智能立足分層理論評價學生作業(yè)有巨大的運用價值,初中歷史教學領域可將分層評價理論與生成式人工智能相結合,促進歷史教學變革。同時,當前的生成式人工智能技術是通用技術,而非專門的教育技術。因此,教師在運用該技術輔助教育教學時需注意許多問題,而這也表明教育領域需要更為專業(yè)的生成式人工智能來輔助教學。
【參考文獻】
[1]黃牧航.中學歷史核心素養(yǎng)命題的關鍵技術四:完善分層賦分[J].歷史教學(上半月刊),2024(13):33.