關(guān)鍵詞:多模態(tài)大模型;教學(xué)研究;CST2分析;差異化評(píng)課
【中圖分類號(hào)】G40-057【文獻(xiàn)標(biāo)識(shí)碼】A【論文編號(hào)】1009—8097(2025)05—0052—10【DOI】10.3969/j.is.1009-8097.2025.05.006
當(dāng)前,課堂智能分析已成為智能技術(shù)賦能教育的研究熱點(diǎn)之一[1]。2018年、2021年,教育部相繼發(fā)布開展人工智能助推教師隊(duì)伍建設(shè)行動(dòng)試點(diǎn)工作的通知[2I[3],在重點(diǎn)推進(jìn)的六項(xiàng)工作中就包括開展教師智能研修?;谌斯ぶ悄芗夹g(shù)的智能化評(píng)課是教師智能研修的重要環(huán)節(jié),盡管深度學(xué)習(xí)技術(shù)已能夠?qū)φn堂教學(xué)實(shí)現(xiàn)自動(dòng)化分析與識(shí)別,但也仍然存在訓(xùn)練數(shù)據(jù)少、分析模型擴(kuò)展難、量化結(jié)果解讀機(jī)械等不足,由此帶來了評(píng)課標(biāo)準(zhǔn)固定、靈活性不足、適切反饋缺乏等問題,難以適應(yīng)現(xiàn)代教育對(duì)教師專業(yè)發(fā)展的需求。近年來,大模型技術(shù)受到廣泛關(guān)注,由于其算力規(guī)模不斷擴(kuò)大,算法持續(xù)優(yōu)化,在處理數(shù)據(jù)類型上從單一模態(tài)走向多模態(tài)融合,能夠理解課堂中的師生發(fā)言并識(shí)別師生表情姿態(tài),通過提示詞靈活設(shè)計(jì)分析指標(biāo),因此在實(shí)施差異化的智能評(píng)課上具有巨大潛力?;诖耍狙芯繃L試借助多模態(tài)大模型對(duì)課堂音視頻的理解能力,設(shè)計(jì)兼顧文化背景、課型、學(xué)科、學(xué)段、教學(xué)主題、教師發(fā)展階段等多種因素的CST2差異化評(píng)課模型,開發(fā)基于多模態(tài)大模型的CST2差異化智能評(píng)課系統(tǒng),并以一門科學(xué)課作為案例檢驗(yàn)評(píng)課模型的應(yīng)用效果,以期為實(shí)現(xiàn)智能化、差異化、多模態(tài)融合的評(píng)課提供新路徑。
一深度學(xué)習(xí)技術(shù)在實(shí)施差異化評(píng)課上的局限
評(píng)課是提高教學(xué)質(zhì)量的重要手段,但基于觀察的傳統(tǒng)評(píng)課存在任務(wù)繁重、目標(biāo)不清晰、專業(yè)性不強(qiáng)等問題[4],導(dǎo)致評(píng)課活動(dòng)效果表面化,難以獲得深入、有效的反饋[5]。為應(yīng)對(duì)這些問題,研究者提出基于數(shù)據(jù)的課堂分析方法或系統(tǒng),并廣泛應(yīng)用于師生言語與非言語行為的定量分析,如弗蘭德斯的課堂互動(dòng)分析系統(tǒng)[、S-T分析方法[7]、基于信息技術(shù)的互動(dòng)分析編碼系統(tǒng)ITIAS[8]等。
進(jìn)入數(shù)字時(shí)代后,機(jī)器學(xué)習(xí)尤其是深度學(xué)習(xí)技術(shù)被廣泛應(yīng)用于課堂教學(xué)研究,如采用多模態(tài)機(jī)器學(xué)習(xí)方法分析課堂的積極或消極氛圍[;使用深度學(xué)習(xí)識(shí)別師生在混合同步課堂情境中的行為,由此幫助教師進(jìn)行課堂反思和總結(jié)[10];對(duì)學(xué)生的行為如舉手、站立、睡覺、打哈欠和微笑等進(jìn)行追蹤識(shí)別[11];基于AI分析系統(tǒng)進(jìn)行混合式聽評(píng)課教研[12];基于機(jī)器學(xué)習(xí)對(duì)本科STEM課堂中教師的展示、指導(dǎo)和管理三個(gè)行為類別進(jìn)行識(shí)別[13]。其中,基于深度學(xué)習(xí)的課堂分析工具包括援用大數(shù)據(jù)分析的靠譜COP[14]、醍摩豆蘇格拉底AI教師行為數(shù)據(jù)分析系統(tǒng)、新學(xué)道教師行為數(shù)據(jù)分析系統(tǒng)等。利用深度學(xué)習(xí)技術(shù)對(duì)課堂數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化分析,在一定程度上有效促進(jìn)了教學(xué)評(píng)價(jià)方式的革新并降低了評(píng)價(jià)成本[15]。然而,深度學(xué)習(xí)技術(shù)因訓(xùn)練數(shù)據(jù)有限、單一模型只能處理單一指標(biāo)、擴(kuò)展新指標(biāo)需額外的數(shù)據(jù)和開發(fā)成本,導(dǎo)致分析結(jié)果多為量化數(shù)值,僅能依據(jù)分值不同給出固定的文本解釋,存在評(píng)價(jià)標(biāo)準(zhǔn)固定、擴(kuò)展困難、結(jié)果解釋機(jī)械且難理解等問題。鑒于課堂教學(xué)環(huán)境的多維動(dòng)態(tài)特性[16],固定標(biāo)準(zhǔn)下的評(píng)價(jià)易引發(fā)教學(xué)模式同質(zhì)化并與實(shí)際需求相脫節(jié)的現(xiàn)象[17]。近期,多模態(tài)大模型發(fā)展迅速,通過大規(guī)模文本、視頻和圖片數(shù)據(jù)訓(xùn)練,該類模型不僅展現(xiàn)出廣泛的知識(shí)面和文本理解力,還能根據(jù)提示詞的不同深入解析音視頻內(nèi)容,使靈活設(shè)定評(píng)課指標(biāo)和評(píng)價(jià)細(xì)則、提供豐富貼切的教學(xué)反饋成為可能。
二CST2差異化評(píng)課模型
考慮到教學(xué)的復(fù)雜性,為提升智能評(píng)課系統(tǒng)對(duì)教師專業(yè)發(fā)展需求支持的適切性,本研究融合教師文化回應(yīng)教學(xué)理論[18]、TPCK理論[19]、教師專業(yè)發(fā)展階段理論[20],構(gòu)建了CST2差異化評(píng)課模型。這三個(gè)理論雖然都致力于提升教師的課堂教學(xué)質(zhì)量,但關(guān)注的視角不同,因此具有較強(qiáng)的互補(bǔ)性。其中,文化回應(yīng)教學(xué)理論注重課堂對(duì)文化背景的融入,突出不同國家、地區(qū)、學(xué)校在教學(xué)設(shè)計(jì)與內(nèi)容上的特色;TPCK理論強(qiáng)調(diào)教師應(yīng)整合技術(shù)、教學(xué)法和內(nèi)容方面的知識(shí),以適應(yīng)現(xiàn)代教育環(huán)境;教師專業(yè)發(fā)展階段理論主要關(guān)注教師在不同職業(yè)階段的需求和發(fā)展路徑。依托上述理論,本研究提煉了包含文化背景(Culture Background)、課型(Class Type)、學(xué)科(Subject)、學(xué)段(Student GradeLevel)、教學(xué)主題(Teaching Topic)、教師發(fā)展階段(Teacher Development Stage)共六個(gè)核心要素的CST2差異化評(píng)課模型,從教師成長、教學(xué)技術(shù)與方法、文化適應(yīng)性的角度出發(fā),系統(tǒng)性地構(gòu)建了一個(gè)全面支持差異化評(píng)課的框架,如圖1所示。
首先,文化回應(yīng)教學(xué)理論強(qiáng)調(diào),在教學(xué)中教師要充分了解學(xué)生所處的文化背景[21],因此本研究認(rèn)為文化背景可從宏觀、微觀兩個(gè)層面影響教學(xué): ① 在宏觀層面,國家政策影響教師的教學(xué),如新課程標(biāo)準(zhǔn)可用于指導(dǎo)我國中小學(xué)課堂的教學(xué)實(shí)踐與教學(xué)評(píng)價(jià),是實(shí)施差異化評(píng)價(jià)的重要引導(dǎo); ② 在微觀層面,校本文化也會(huì)對(duì)教師的教學(xué)產(chǎn)生影響,如學(xué)校所具有的特定的精神環(huán)境、文化氣氛等,會(huì)間接或直接地影響教師的教學(xué)方法和學(xué)生的學(xué)習(xí)體驗(yàn)[22]。
其次,TPCK理論強(qiáng)調(diào)教師不僅需要掌握學(xué)科知識(shí),還需要了解如何通過與學(xué)科知識(shí)適配的教學(xué)方法和教學(xué)技術(shù),將知識(shí)有效地傳授給學(xué)生[23]。因此,既要評(píng)估教師在特定學(xué)科領(lǐng)域的教學(xué)能力,也要關(guān)注教師對(duì)學(xué)科內(nèi)容的理解和依據(jù)學(xué)情所選擇的教學(xué)方法。依據(jù) TPCK 理論,課堂教學(xué)應(yīng)針對(duì)課型、學(xué)科、學(xué)段、教學(xué)主題進(jìn)行差異化評(píng)價(jià): ① 課型方面,課堂教學(xué)的類型應(yīng)根據(jù)教學(xué)目標(biāo)、內(nèi)容、方法和組織形式的不同進(jìn)行劃分,如講授課重在知識(shí)傳授,討論課強(qiáng)調(diào)學(xué)生的思考與交流,實(shí)驗(yàn)課注重實(shí)踐操作能力的培養(yǎng)。此外,不同課型的教學(xué)內(nèi)容側(cè)重點(diǎn)也不同[24]。因此,需在評(píng)課中關(guān)注不同課堂類型的評(píng)價(jià)差異。 ② 學(xué)科方面,不同學(xué)科具有各自不同的特點(diǎn)和要求,這對(duì)課堂教學(xué)的設(shè)計(jì)、實(shí)施和評(píng)價(jià)有顯著影響[25]。例如,語文學(xué)科強(qiáng)調(diào)閱讀、寫作、口語表達(dá)和文學(xué)分析技能的培養(yǎng);而科學(xué)學(xué)科強(qiáng)調(diào)實(shí)驗(yàn)操作、觀察記錄和科學(xué)探究方法,鼓勵(lì)學(xué)生通過實(shí)驗(yàn)和探索來理解自然現(xiàn)象。 ③ 學(xué)段方面,不同學(xué)段的學(xué)生在認(rèn)知發(fā)展水平、學(xué)習(xí)需求等方面具有不同的特點(diǎn),如小學(xué)生處于具體運(yùn)算階段,更依賴直觀和具體經(jīng)驗(yàn);而中學(xué)生逐漸過渡到形式運(yùn)算階段,能夠處理更抽象的概念。因此,應(yīng)充分尊重不同學(xué)段學(xué)生的認(rèn)知學(xué)習(xí)規(guī)律,促進(jìn)學(xué)生素養(yǎng)的提升[26]。④ 教學(xué)主題是指具體教學(xué)內(nèi)容的主題。教師需要根據(jù)具體的教學(xué)主題,應(yīng)用不同的教學(xué)方法和教學(xué)技術(shù)來達(dá)成教學(xué)目標(biāo)[27]。對(duì)具體教學(xué)內(nèi)容的評(píng)價(jià),可以確保教學(xué)活動(dòng)達(dá)到既定的教育標(biāo)準(zhǔn)和質(zhì)量要求[28],是反映教師進(jìn)行教學(xué)內(nèi)容設(shè)計(jì)和整合能力的體現(xiàn)。
最后,教師專業(yè)發(fā)展階段理論強(qiáng)調(diào):“教師的專業(yè)成長是一個(gè)持續(xù)不斷的過程,需要不斷地學(xué)習(xí)、反思和實(shí)踐?!盵29]有研究發(fā)現(xiàn),處于不同教師專業(yè)發(fā)展階段的教師群體,其課堂教學(xué)行為會(huì)呈現(xiàn)出群體性差異特征[30],如新手教師通常在教師素養(yǎng)方面表現(xiàn)優(yōu)秀,但在教學(xué)內(nèi)容和課堂操作兩個(gè)維度上還有待加強(qiáng)[31]。除此之外,教師因個(gè)人教學(xué)風(fēng)格不同也在課堂教學(xué)各方面存在差異,因此每位教師在不同的成長階段所關(guān)注的重點(diǎn)和需求都有所不同。
基于上述分析,結(jié)合對(duì)六個(gè)核心要素的凝練整合,本研究將CST2差異化評(píng)課模型定義如下:CST2差異化評(píng)課模型是一種旨在提供差異化、科學(xué)化、循證化教學(xué)評(píng)價(jià)的模型,該模型在文化響應(yīng)教學(xué)理論、TPCK理論和教師專業(yè)發(fā)展階段理論的指導(dǎo)下,綜合分析課堂的文化背景、課型、學(xué)科、學(xué)段、教學(xué)主題、教師發(fā)展階段六個(gè)核心信息,以助力實(shí)現(xiàn)對(duì)課堂教學(xué)的適應(yīng)性評(píng)價(jià),由此促進(jìn)教師的差異性專業(yè)成長和教學(xué)質(zhì)量的提升。與傳統(tǒng)評(píng)課模型相比,CST2差異化評(píng)課模型具有多維適應(yīng)性、發(fā)展階段針對(duì)性、動(dòng)態(tài)調(diào)整性三個(gè)關(guān)鍵特征,在評(píng)課時(shí)能夠從多個(gè)維度適應(yīng)教育環(huán)境的多樣化,并根據(jù)教師的不同發(fā)展階段動(dòng)態(tài)調(diào)整評(píng)價(jià)標(biāo)準(zhǔn),由此促進(jìn)教師的專業(yè)發(fā)展。
三基于多模態(tài)大模型的CST2差異化智能評(píng)課系統(tǒng)
1多模態(tài)大模型
近年來,ChatGPT、Llama、文心一言、星火、千帆等大模型憑借涌現(xiàn)的智能特性,引起了社會(huì)的廣泛關(guān)注,并在教育領(lǐng)域內(nèi)的教、學(xué)、評(píng)、管、研等多個(gè)環(huán)節(jié)得到了深入應(yīng)用[32][33],如利用大模型作為教師的數(shù)智分身[34],利用智能會(huì)話輔導(dǎo)進(jìn)行伴隨式、個(gè)性化的教學(xué)輔助[3],利用多種大模型構(gòu)建多智能體幫助學(xué)生學(xué)習(xí)復(fù)雜知識(shí)并解決問題[36]等。
然而,傳統(tǒng)大模型僅能處理文本這一單一模態(tài)信息,而缺乏對(duì)音頻、圖片、視頻等多種模態(tài)數(shù)據(jù)的處理,如何處理多模態(tài)信息由此成為大模型領(lǐng)域的研究熱點(diǎn)。當(dāng)前,在音頻信息理解方面,多模態(tài)大模型采用的技術(shù)主要是將語音信號(hào)轉(zhuǎn)錄為文本或?qū)σ纛l特征進(jìn)行編碼以生成多層語義向量[37][38];而在視頻信息理解方面,多模態(tài)大模型中的視覺語言模型(Vision Language Model,VLM)能夠綜合圖文的含義來進(jìn)行反饋,其主要方法包括通過大量數(shù)據(jù)進(jìn)行圖像和文本的對(duì)齊與訓(xùn)練[39]、使用目標(biāo)檢測(cè)模型和光學(xué)字符識(shí)別(OpticalCharacterRecognition,OCR)等視覺專家模型來提取圖像中的對(duì)象與文本信息[40]、根據(jù)固定的像素塊大小提取局部圖像并提煉全局視覺區(qū)域[4I、利用通行的對(duì)比語言圖像預(yù)訓(xùn)練(Contrastive Language-Image Pre-training,CLIP)模型從圖像中提取文本數(shù)據(jù)以供大模型推理[42]等。當(dāng)前,主流的視覺語言大模型包括商業(yè)的ChatGPT-4V、ChatGPT-4o等,開源的IntemVL[43]、Yi-VL[44等。憑借對(duì)海量數(shù)據(jù)預(yù)訓(xùn)練而獲取的廣泛知識(shí)面,以及對(duì)語音、文本、視頻的綜合理解能力,當(dāng)前多模態(tài)大模型已具備綜合分析課堂教學(xué)音視頻并提供豐富教學(xué)反饋的能力。
2基于多模態(tài)大模型的CST2差異化智能評(píng)課系統(tǒng)技術(shù)框架
本研究以CST2模型為指導(dǎo),設(shè)計(jì)了基于多模態(tài)大模型的CST2差異化智能評(píng)課系統(tǒng)技術(shù)框架,如圖2所示。該技術(shù)框架包括CST2分析、評(píng)課指標(biāo)體系、數(shù)據(jù)采集、預(yù)處理、提示詞生成、多模態(tài)大模型、結(jié)果分析、系統(tǒng)前端顯示等模塊。
首先,需要通過CST2分析收集差異化評(píng)課信息,并據(jù)此生成評(píng)課指標(biāo)體系。該指標(biāo)體系包含若干評(píng)課指標(biāo),每個(gè)評(píng)課指標(biāo)又含有指標(biāo)細(xì)則和打分規(guī)則,以提升差異化評(píng)課效果。所有通用指標(biāo)(如教學(xué)方法、教學(xué)效果等)和針對(duì)學(xué)科、課型等的差異化指標(biāo)(如實(shí)驗(yàn)課的實(shí)驗(yàn)表現(xiàn)等)均可存放在評(píng)價(jià)指標(biāo)池中,以方便在不同的評(píng)課指標(biāo)體系之間共享。
接著,可通過數(shù)據(jù)采集從教室錄播系統(tǒng)獲取課堂實(shí)錄音視頻材料和教師的教案文檔。之后,通過預(yù)處理將音頻轉(zhuǎn)換為文字,形成課堂對(duì)話文本材料;按固定時(shí)間間隔從課堂視頻中截取幀,形成課堂圖像材料,并將處理前后的課堂數(shù)據(jù)均保存在對(duì)象存儲(chǔ)或數(shù)據(jù)庫中。
然后,需要通過提示詞生成過程,將預(yù)處理后的文本、圖片與評(píng)價(jià)指標(biāo)體系下所有的評(píng)課指標(biāo)細(xì)則融合為多模態(tài)大模型可理解的提示詞。Wang等[45]發(fā)現(xiàn),設(shè)計(jì)多模態(tài)大模型的角色、工作流程和行為要求,有助于優(yōu)化其性能和反饋質(zhì)量。基于此,本研究設(shè)計(jì)了提示詞結(jié)構(gòu)與結(jié)果生成流程,如圖3所示。其中,“角色設(shè)定”包括評(píng)課智能體的角色設(shè)定介紹、目標(biāo)等;“評(píng)課任務(wù)流程”為智能體處理輸入、輸出的工作流程;“輸出要求與約束”對(duì)大模型輸出的內(nèi)容進(jìn)行限制并對(duì)格式進(jìn)行規(guī)范;“指標(biāo)體系及細(xì)則”包括對(duì)指標(biāo)體系中指標(biāo)項(xiàng)及評(píng)分細(xì)則的說明;“CST2差異化信息”為本堂課依據(jù)CST2模型提取的課堂背景信息;“課堂對(duì)話文本”為課堂音頻所轉(zhuǎn)的帶有時(shí)間戳的師生對(duì)話文本;“單幀圖像”為每隔一分鐘截取的帶有整分鐘時(shí)間戳的課堂圖像;“所有幀分析結(jié)果”融合了各個(gè)指標(biāo)的單幀分析結(jié)果;“輸入輸出示例”包含了說明大模型輸入輸出格式規(guī)范的示例;“系統(tǒng)輸出文檔”則代表在網(wǎng)頁上以文檔形式可視化輸出所有評(píng)課結(jié)果,包含原始音視頻、各個(gè)指標(biāo)打分結(jié)果、綜合總結(jié)和整體建議。
最后,結(jié)果分析主要將多模態(tài)大模型輸出的包括評(píng)課指標(biāo)分?jǐn)?shù)、評(píng)課解讀、循證時(shí)間戳等評(píng)課結(jié)果,解析為包含評(píng)分?jǐn)?shù)據(jù)量化分析、打分依據(jù)字符段落、視頻時(shí)間戳鏈接等結(jié)構(gòu)化數(shù)據(jù),最后通過系統(tǒng)前端顯示對(duì)上述結(jié)果進(jìn)行可視化。此外,評(píng)課數(shù)據(jù)的積累還可作為后續(xù)多模態(tài)大模型調(diào)優(yōu)的數(shù)據(jù)基礎(chǔ)。
3基于多模態(tài)大模型的CST2差異化智能評(píng)課系統(tǒng)實(shí)現(xiàn)
依托上述技術(shù)框架,本研究研發(fā)了基于多模態(tài)大模型的CST2差異化智能評(píng)課系統(tǒng),其界面如圖4所示。該系統(tǒng)實(shí)現(xiàn)了課堂視頻上傳、預(yù)處理、差異化評(píng)課指標(biāo)及指標(biāo)體系設(shè)置、基于多模態(tài)大模型的課堂音視頻分析、分析結(jié)果呈現(xiàn)等功能,在多模態(tài)大模型的接入上也提供了可靈活配置多種大模型的設(shè)置。
四基于多模態(tài)大模型的CST2差異化智能評(píng)課案例展示
為探究基于多模態(tài)大模型的CST2差異化智能評(píng)課系統(tǒng)在真實(shí)課堂評(píng)價(jià)中的效果,本研究選擇重慶市S 小學(xué)的一堂科學(xué)實(shí)驗(yàn)課作為研究案例,利用CST2分析設(shè)計(jì)了該??茖W(xué)實(shí)驗(yàn)課專用的評(píng)課體系,并采用基于多模態(tài)大模型的CST2差異化智能評(píng)課系統(tǒng)對(duì)該堂實(shí)驗(yàn)課進(jìn)行評(píng)課。
首先,本研究通過對(duì)該堂實(shí)驗(yàn)課的教案、課程標(biāo)準(zhǔn)、核心素養(yǎng)、教師發(fā)展階段、學(xué)生學(xué)段等信息的整理,形成了CST2差異化評(píng)課信息表,如表1所示。
之后,本研究將多年來S小學(xué)在教研活動(dòng)中使用的課堂教學(xué)評(píng)價(jià)表作為通用評(píng)課指標(biāo)體系;同時(shí),將CST2 差異化評(píng)課信息與通用評(píng)課體系的信息一同輸入大模型并添加提示詞,使其對(duì)通用評(píng)課指標(biāo)體系進(jìn)行優(yōu)化,由此得到CST2差異化評(píng)課指標(biāo)體系。表2列出了通用評(píng)課指標(biāo)體系與CST2差異化評(píng)課指標(biāo)體系的具體指標(biāo),可以發(fā)現(xiàn):CST2差異化評(píng)課指標(biāo)體系新增了針對(duì)學(xué)科特點(diǎn)展開的實(shí)驗(yàn)課專項(xiàng)指標(biāo),此外還對(duì)各一級(jí)指標(biāo)和二級(jí)指標(biāo)進(jìn)行了符合差異化課堂信息的優(yōu)化。
在確定差異化評(píng)課指標(biāo)體系后,本研究再一次結(jié)合CST2差異化評(píng)課信息,由大模型生成指標(biāo)細(xì)則和打分規(guī)則(參看如表3所示的通用評(píng)課指標(biāo)描述、差異化評(píng)課指標(biāo)細(xì)則和打分規(guī)則示例)。由于融合了CST2差異化評(píng)課信息,“定位準(zhǔn)確”指標(biāo)細(xì)則在教學(xué)目標(biāo)方面,包含課堂教學(xué)主題維度的詳細(xì)內(nèi)容和文化背景維度中新課標(biāo)的相關(guān)內(nèi)容;“精神狀態(tài)與情感表達(dá)”指標(biāo)細(xì)則在教姿教態(tài)與情感表達(dá)方面,更加關(guān)注教師發(fā)展階段中真實(shí)的課堂表現(xiàn)力。此外,CST2差異化評(píng)課信息在其他指標(biāo)細(xì)則中也均有體現(xiàn),如課型、教師發(fā)展階段信息更多地體現(xiàn)在“設(shè)計(jì)合理”和“策略有效”兩個(gè)指標(biāo)中。
然后,將CST2差異化評(píng)課信息、指標(biāo)細(xì)則、打分規(guī)則等作為提示詞發(fā)送給多模態(tài)大模型,最終得到評(píng)課結(jié)果。采用通用評(píng)課指標(biāo)體系(無細(xì)則)與采用CST2差異化評(píng)課指標(biāo)體系(有差異化評(píng)課指標(biāo)細(xì)則)的評(píng)價(jià)結(jié)果對(duì)比如表4所示,可以發(fā)現(xiàn):相比前者,后者可以為多模態(tài)大模型提供更多與評(píng)課有關(guān)的知識(shí),從而使反饋更加豐富合理。其中,對(duì)“定位準(zhǔn)確”指標(biāo)的評(píng)價(jià)結(jié)果解讀,結(jié)合了CST2差異化評(píng)課模型中文化背景維度下的學(xué)科核心素養(yǎng),其評(píng)價(jià)更為具體且有針對(duì)性;而對(duì)“精神狀態(tài)與情感表達(dá)”指標(biāo)的評(píng)價(jià)結(jié)果解讀,結(jié)合了課型維度下回顧學(xué)生先前調(diào)查結(jié)果的環(huán)節(jié),其評(píng)價(jià)更為系統(tǒng)、客觀。
最后,為比較基于多模態(tài)大模型的CST2差異化智能評(píng)課系統(tǒng)的實(shí)際評(píng)課效果,本研究請(qǐng)四位評(píng)課專家觀看上課視頻和兩份評(píng)課結(jié)果并進(jìn)行訪談。訪談對(duì)象為四名,均為省市級(jí)和區(qū)級(jí)賽課一等獎(jiǎng)或二等獎(jiǎng)的獲得者,具有豐富的評(píng)課經(jīng)歷。本研究對(duì)訪談文本進(jìn)行了整理與歸納,其要點(diǎn)如下:
① 經(jīng)過CST2分析優(yōu)化后的差異化評(píng)課指標(biāo)體系對(duì)具體課堂更具適用性。有3名訪談對(duì)象認(rèn)為CST2差異化評(píng)課指標(biāo)體系的指向性更明確,符合本節(jié)課的實(shí)際情況。其中,訪談對(duì)象一認(rèn)為CST2差異化評(píng)課指標(biāo)體系既全面又具體,還提出了以前未曾關(guān)注過的評(píng)課角度,如情感投入和班級(jí)文化。另外,CST2差異化評(píng)課指標(biāo)體系還關(guān)注創(chuàng)新與個(gè)性化教學(xué)維度,由此能夠明確區(qū)分出不同教師在教學(xué)上的優(yōu)勢(shì)和不足。
② 相對(duì)通用評(píng)課標(biāo)準(zhǔn)的評(píng)課結(jié)果,CST2差異化評(píng)課結(jié)果更具操作性和指導(dǎo)意義。所有訪談對(duì)象都認(rèn)為CST2差異化評(píng)課結(jié)果指出了課堂教學(xué)的優(yōu)缺點(diǎn),符合實(shí)際情況。其中,訪談對(duì)象二認(rèn)為CST2 差異化評(píng)課結(jié)果逐幀評(píng)價(jià)細(xì)致、具體,且更有針對(duì)性。
③ 在基于多模態(tài)大模型的CST2差異化智能評(píng)課系統(tǒng)的改進(jìn)建議方面,訪談對(duì)象一與訪談對(duì)象二均認(rèn)為在大模型評(píng)價(jià)中,每個(gè)指標(biāo)都有提及教師授課的優(yōu)點(diǎn)與不足,文字?jǐn)⑹鲞^多會(huì)導(dǎo)致教師在面對(duì)評(píng)課結(jié)果時(shí)有挫敗感,大模型的評(píng)價(jià)中立、客觀也顯得有些嚴(yán)苛,因?yàn)槊婷婢愕綄?dǎo)致亮點(diǎn)和關(guān)鍵點(diǎn)不突出,教師能夠有針對(duì)性地改進(jìn)但無法發(fā)現(xiàn)自己的突出優(yōu)勢(shì)。訪談對(duì)象三提出了更多的差異化評(píng)價(jià)需求,如對(duì)教學(xué)經(jīng)驗(yàn)較少的年輕教師,可重點(diǎn)提供基本教學(xué)技巧和方法;而對(duì)經(jīng)驗(yàn)豐富的老教師,則應(yīng)更多地關(guān)注其在教學(xué)創(chuàng)新和學(xué)生能力培養(yǎng)方面的表現(xiàn)。
綜上所述,經(jīng)過CST2優(yōu)化后的差異化評(píng)課指標(biāo)體系貼合實(shí)際課堂,更有針對(duì)性,且融入CST2信息的評(píng)課結(jié)果更細(xì)致具體,有助于教師改進(jìn)教學(xué)。不過,由于該指標(biāo)體系要求細(xì)致,部分教師覺得過于苛刻,后續(xù)可繼續(xù)優(yōu)化其實(shí)現(xiàn)邏輯及提示詞框架,以突出每個(gè)教師的優(yōu)勢(shì),并為教師提供更多情感支持。
五結(jié)語
為解決傳統(tǒng)評(píng)課模型中存在的標(biāo)準(zhǔn)固定、難以適應(yīng)多元教學(xué)情境、缺乏差異化等問題,本研究提出了依托教師文化回應(yīng)教學(xué)理論、TPCK 理論、專業(yè)發(fā)展階段理論的CST2 差異化評(píng)課模型,并通過應(yīng)用多模態(tài)大模型技術(shù),實(shí)現(xiàn)了基于多模態(tài)大模型的CST2差異化智能評(píng)課系統(tǒng)。之后,在實(shí)驗(yàn)學(xué)校進(jìn)行應(yīng)用后發(fā)現(xiàn),相較于傳統(tǒng)評(píng)課模型,CST2差異化評(píng)課模型能根據(jù)具體教學(xué)情境和教師的不同發(fā)展階段,靈活地給出更有針對(duì)性的評(píng)課指標(biāo)體系與評(píng)課建議,這為利用前沿人工智能技術(shù)賦能教學(xué)研究提供了新的思路與實(shí)施路徑。
然而,目前將多模態(tài)大模型應(yīng)用于差異化評(píng)課仍處于初步探索階段,本研究的應(yīng)用范圍也僅限于一所學(xué)校的一堂課例;由于研究資源的限制,模型優(yōu)化主要依賴于提示詞工程的方式,尚未深入到特定領(lǐng)域的大模型調(diào)優(yōu);當(dāng)前研究也尚未對(duì)純音頻特征進(jìn)行分析,缺乏對(duì)教師音量、語速、普通話標(biāo)準(zhǔn)等教師基本素養(yǎng)的評(píng)價(jià)。因此,后續(xù)研究計(jì)劃以此次先導(dǎo)案例的反饋為基礎(chǔ),進(jìn)一步完善差異化評(píng)課的理論框架和技術(shù)實(shí)現(xiàn)方法,并在更廣泛的范圍內(nèi)驗(yàn)證其成效;同時(shí),通過積累更多的數(shù)據(jù)進(jìn)行訓(xùn)練和模型微調(diào),結(jié)合科大訊飛公司提供的“訊飛聽見”等語音分析程序接口,對(duì)教師的音量、語速、普通話標(biāo)準(zhǔn)性等純音頻特征進(jìn)行分析,開發(fā)出更加注重差異化的評(píng)課大模型,以期為國家教育數(shù)字化戰(zhàn)略轉(zhuǎn)型提供智能化教研支撐,推動(dòng)智慧教育生態(tài)體系的創(chuàng)新發(fā)展。
參考文獻(xiàn)
[1]穆肅,陳孝然,胡小勇.教師專業(yè)發(fā)展視域下智能教研平臺(tái)功能分析[J].現(xiàn)代遠(yuǎn)距離教育,2024,(2):23-32.
[2]教師廳.教育部辦公廳關(guān)于開展人工智能助推教師隊(duì)伍建設(shè)行動(dòng)試點(diǎn)工作的通知[OL].
[3]教師函.教育部關(guān)于實(shí)施第二批人工智能助推教師隊(duì)伍建設(shè)行動(dòng)試點(diǎn)工作的通知[OL].
[4]王晴晴,楊曉哲.從傳統(tǒng)聽評(píng)課到課堂智能分析課堂研究新范式[J].上海教育,2022,(24):6-7.
[5]方潔.我國聽評(píng)課研究二十年:回顧與反思[J].西北師大學(xué)報(bào)(社會(huì)科學(xué)版),2014,(3):104-108.
[6]張海.弗蘭德斯互動(dòng)分析系統(tǒng)的方法與特點(diǎn)[J].當(dāng)代教育與文化,2014,(2):68-73.
[7]單迎杰.以S-T分析法分析教育技術(shù)專業(yè)課課堂教學(xué)問題[J].現(xiàn)代教育技術(shù),2008,(10):29-31.
[8]顧小清,王煒.支持教師專業(yè)發(fā)展的課堂分析技術(shù)新探索[J].中國電化教育,2004,(7):18-21.
[9]Ramakrishnan A, Zylich B,Ottmar E,et al. Toward automated classroomobservation: Multimodal machine learning to estimate classpositive climate and negative climate[J].IEEETransactions onAfective Computing,2021,(1):664-679.
[10]Xu T,Deng W,Zhang S,etal.Research on recognitionand analysisof teacher-student behaviorbased onablended synchronous classroom[J]. Applied Sciences, 2023,(6):3432.
[11]Zho H,JiangFSiJ,etal.StuArt:Idividualedlasroomobsevationoftudents ithutomaticbhaviooio and tracking[A].ICASSP2023-2023 IEEE Intermational Conferenceon Acoustics,SpeechandSignalProcessing(ICASSP)[C]. Rhodes Island, Greece: IEEE,2023:1-5.
[12]趙楓,李恒才.基于AI分析系統(tǒng)的混合式聽評(píng)課教研的實(shí)踐[J].教育信息技術(shù),2018,(12):53-56.
[13][30]UribeP,Schlotterbeck D,JimenezA,etal.AnautomaticteacheractivityrecognitionsystembasedonSpech Transcriptions[A]. 2021 XVI Latin American Conference on Learming Technologies (LACLO)[C]. Arequipa,Peru: IE, 2021:216-223.
[14]王陸,蔡榮嘯.課堂大數(shù)據(jù)視角下的提問傾向研究[J].電化教育研究,2016,(7):82-92.
[15]李如密.深度差異化:課堂教學(xué)評(píng)價(jià)的新趨勢(shì)[J].教育測(cè)量與評(píng)價(jià),2018,(9):1.
[16]廖偉,劉淼,毛玉琳.循證式聽評(píng)課:為何循證、循何證、如何循證[J].中國教育學(xué)刊,2023,(4):86-91.
[17]閆寒冰,林梓柔,湯猛.關(guān)注差異的信息化教學(xué)課堂評(píng)價(jià)指標(biāo)設(shè)計(jì)與應(yīng)用[J].電化教育研究,2022,(8):92-100.
[18][21]陳銀河.文化回應(yīng)性教學(xué)的內(nèi)涵、價(jià)值及實(shí)現(xiàn)[J].教學(xué)與管理,2021,(6):10-12.
[19][23]KoehlerMJ,MishraP.Whathappens henteachersdesigneducationaltechology?Thedevelopmentoftechnological pedagogical content knowledge[J]. Journal of Educational Computing Research, 20o5,(2):131-152.
[20]陸偉,葆樂心.教師專業(yè)發(fā)展階段論對(duì)教師教育工作的啟示[J].中國成人教育,2014,(24):126-128.
[22]洪金祥.構(gòu)建特色校園文化,助力特教教師專業(yè)成長[J].新課程,2020,(9):200.
[24]陳佑清,陶濤.\"以學(xué)評(píng)教\"的課堂教學(xué)評(píng)價(jià)指標(biāo)設(shè)計(jì)[J].課程·教材·教法,2016,(1):45-52.
[25]陳麗霞,陳小軍.聽評(píng)課的五個(gè)視角[J].教學(xué)與管理,2015,(19):32-34.
[26]陳立新.基于核心素養(yǎng)聽評(píng)課問題與解決路徑探究——青藍(lán)工程聽評(píng)課教研活動(dòng)反思[J].龍巖學(xué)院學(xué)報(bào),2024,(2):117-122. [27]王榮生.聽王榮生教授評(píng)課[M].上海:華東師范大學(xué)出版社,2007:16.
[28]姚賽男.基于\"教學(xué)內(nèi)容\"的評(píng)課視角與范式[J].教育理論與實(shí)踐,2010,(14):6-7.
[29]王琰春.西方教育評(píng)價(jià)觀的演進(jìn)及對(duì)我國的啟示[J].教育與現(xiàn)代化,2003,(1):74-78.
[31]金星霖,周娜.中職新手教師的教學(xué)行為特點(diǎn)研究——對(duì)評(píng)課意見表的內(nèi)容分析[J].中國職業(yè)技術(shù)教育,2018,(35):26-31. [32]劉明,郭爍,吳忠明,等.生成式人工智能重塑高等教育形態(tài):內(nèi)容、案例與路徑[J].電化教育研究,2024,(6):57-65. [33][34]廖劍,許邯鄲,劉明,等.數(shù)智分身:人工智能時(shí)代教師本位人機(jī)共教模式[J].現(xiàn)代遠(yuǎn)程教育研究,2024,(4):85-93. [35]劉華,祝智庭.大模型支持的會(huì)話輔導(dǎo)系統(tǒng)開發(fā):范式轉(zhuǎn)換、架構(gòu)設(shè)計(jì)與能力訓(xùn)練[J].現(xiàn)代遠(yuǎn)程教育研究,2024,(3):11-19. [36]翟雪松,季爽,焦麗珍,等.基于多智能體的人機(jī)協(xié)同解決復(fù)雜學(xué)習(xí)問題實(shí)證研究[J].開放教育研究,2024,(3):63-73. [37]RadfordA,KimJW,XuT,etal.Robustspeechrecognitionvialarge-scale weaksupervision[A].Proceedingsofe40th International Conference on Machine Learning[C]. Hawai: JMLR.org, 2023:28492-28518.
[38]Ghosh S, Kumar S,SethA, et al. GAMA: Alargeaudio-language model with advanced audio understanding andcomplex reasoning abilities[OL].
[39]Ghosh A,Acharya A,Saha S,etal.Exploring the frontierof vision-language models: Asurveyofcurrent methodologies and future directions[OL].
[40]Jiao Q,ChenD,HuangY,etal.Enancing multimodallarge language models with visiondetectio models: Anempirical study[OL].
[41]WuJ, Zhong M,XingS,etal.VisionLLMv2:Anend-toend generalistmultimodal arge language modelforhundreds of vision-language tasks[OL].
[42]Radford A,Kim J W, Hallacy C,et al. Learning transferable visual models from natural language supervision[A]. Procedngs ofthe 40th Intermational Conference on Machine Learing[C].Cambridge,MA,USA: PMLR,2021:8748-8763. [43]Chen Z,Wu J,WangW,etalInternvl:Scalingupvision foundation models andaligning forgenericvisual-linguistic tasks[A].Proceedings ofthe IEEE/CVFConference on Computer Visionand PatternRecognition[C].Seatle,USA: IEEE, 2024:24185-24198.
[44]Young A, Chen B,Li C, et al. Yi: Open foundation models by 01.Ai[OL]. [45]WangL,Ma C,F(xiàn)eng X,etal.Asurveyonlarge language model based autonomousagents[J].FrontiersofComputer Science,2024,(6):186345.
Research on the CST2 Differentiated Lesson Evaluation Model and Its Application Based on Multimodal Large Models LIAO Jian1 HU Yu-Li1 ZHANG Qian2 CHEN Xiao-Lang1,3 LIU Ge-Ping1
(1.Faculty of Education, Southwest University, Chongqing, China 400715;
2.Xiamen Andou Primary School,Xiamen, Fujian, China 361006;
3.Primary School Attached to Southwest University, Chongqing, China 400700)
Abstract: Inrecent years,theuseof technologiessuch asnaturallanguage processng andintellgent audioand videoanalysis forautomatedlesson evaluationhasemergedasaresearchhotspot.However,theautomatedlessonevaluationsystemsupported by deep learning technologyoftensuffers from problemssuchasrigid standards,insuficientadaptability,andinadequate appropriate fedback in practical process, making it dificult toadapt to the complex and diverse teaching environment. Moreover, the evaluationresults frequentlyfail toprovide teachers’teaching withspecificand detailed guidance.Therefore, combined the semantic comprehensionand dynamic generation advantages oflarge model technology,this paperrefined the CST2 diferentiated lessn evaluation model that included six core elementsof cultural background,lessontype,subject, teachingstage,teachingtopic,andteachers’professional developmentstage.Guidedbythis model,thepaperdesignedthe technical frameworkoftheCST2diferentiated intellgentlesson evaluationsystembasedonmultimodal large models.Relying onthis technical framework,the paper developed the CST2 differentiated inteligent lesson evaluation system basedon multimodallarge model.Thissystemcouldestablishanevaluationindexsystemanddetailedrulescontainingthediferentiated informationofCST,and integrate multimodaldatasuchas teaching textsandteacherimages inclasroomaudioandvideoto generate more targeted classroom teaching evaluationresults.Subsequently,apilotcase studyofthissystem was conducted in SPrimary School.The results showed that this system could conduct evaluation of classroom teaching that was more in accordance with specificteachingsituationsand teachers'diferentiateddevelopment goals.The theoreticalmodelconstruction and practiceonhow multimodal large models toempower diferentiated intelligent lesson evaluation inthispaper was conduciv topromotingthein-depth integratedandinnovativedevelopmentofartificialintellgenceandeducationandteaching.
Keywords: multimodal large model; teaching research; CST2 analysis; differentiated lesson evaluation