2025年1月14日,教育部辦公廳關(guān)于印發(fā)《中小學(xué)科學(xué)教育工作指南》的通知中提出:將學(xué)生平時實驗操作和參加科學(xué)探究實踐活動等表現(xiàn)納入綜合素質(zhì)評價內(nèi)容;將數(shù)字技術(shù)等智能化手段引入實驗操作考試,提高實驗考查的可行性和有效性。隨著人工智能技術(shù)和互聯(lián)網(wǎng)的發(fā)展,智能化和自動化的測評方式正逐漸成為測評領(lǐng)域研究的重要內(nèi)容,智能化和自動化不僅可以降低人工測評的重復(fù)勞動,還降低了由個體認(rèn)知、思維模式和情感態(tài)度等不同造成的評價差異,提高了評價的效率和精準(zhǔn)度。
王慧、孫可等人的研究報告《全國各地中考實驗操作考試實施現(xiàn)狀調(diào)查報告(一)》表明,當(dāng)下實施實驗操作考試的均采用人工考評的模式,即一名監(jiān)考老師對一名或多名學(xué)生同時進行監(jiān)考和打分,這樣容易導(dǎo)致教師無法同時兼顧操作細(xì)節(jié)和實驗結(jié)果,評價主觀性強,對于爭議性評分無法追溯。隨著人工智能技術(shù)和互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,基于AI(人工智能) +IoT (物聯(lián)網(wǎng))的教育測評方式融合了AI的智能分析能力和IoT的廣泛連接性,實現(xiàn)了簡單物聯(lián)到融合智聯(lián)的跨越,讓大規(guī)模進行實驗操作測評成為可能。
一、 Al+10T 測評體系構(gòu)建的邏輯思路
1.構(gòu)建 AI+IoT 測評緣起:順應(yīng)教學(xué)“測評\"工作變革的政策導(dǎo)向
教學(xué)測評內(nèi)容與測評方式的轉(zhuǎn)變是新時代面向教學(xué)“測評\"工作變革的重要領(lǐng)域,也是新時代教育評價改革政策治理關(guān)注的焦點議題3。中共中央、國務(wù)院印發(fā)的《教育強國建設(shè)規(guī)劃綱要(2024-2035年)》中明確指出:要促進人工智能助力教育變革,加強課程體系改革,打造人工智能教育大模型,建設(shè)云端學(xué)校等,建立基于大數(shù)據(jù)和人工智能支持的教育評價和科學(xué)決策制度。AI+IoT的評測體系整合了大數(shù)據(jù)感知、萬物互聯(lián)、存儲、計算等優(yōu)點,有利于形成基于證據(jù)和大數(shù)據(jù)的教育測評體系,為結(jié)果評價、過程評價、增值評價等多元評價方式賦能。
2.構(gòu)建 AI+IoT 測評基石:指向精準(zhǔn)高效的“測 評\"載體
智能化測評是突破紙筆測驗,實現(xiàn)對學(xué)習(xí)過程或作答過程數(shù)據(jù)建模的重要手段,具有自動化、高效性、實時性和動態(tài)性評價的優(yōu)點4。AI技術(shù)依托于深度學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò)模擬人腦處理復(fù)雜數(shù)據(jù))機器學(xué)習(xí)(機器通過數(shù)據(jù)學(xué)習(xí))和自然語言處理(機器理解和生成人類語言)等技術(shù),實現(xiàn)了信息的自動識別、語言翻譯和數(shù)據(jù)提取等功能,具有強大的數(shù)據(jù)分析和處理能力。IoT技術(shù)利用傳感器收集數(shù)據(jù)、通信模塊實現(xiàn)數(shù)據(jù)傳輸、數(shù)據(jù)中心存儲和處理數(shù)據(jù),實現(xiàn)了數(shù)據(jù)的實時采集和傳輸,為AI算法提供豐富的數(shù)據(jù)源。AI與IoT的融合實現(xiàn)了數(shù)據(jù)的實時采集、數(shù)據(jù)的傳輸和分析、結(jié)果的智能精準(zhǔn)評價(見表1),顯著提升了測評的效率和拓寬了測評的場域。
3.構(gòu)建 AI+IoT 測評路徑:探索多元化“測評” 場景
傳統(tǒng)教學(xué)測評依賴于紙筆測試、課堂觀察等手段,而AI+IoT技術(shù)的引入,則為教學(xué)測評帶來了全新的視角和更豐富的手段。(1)拓寬測評形式。AI+IoT 技術(shù)不再局限于傳統(tǒng)線下環(huán)境,實現(xiàn)了從線下到線上評價的突破。(2)豐富測評內(nèi)容。AI+IoT技術(shù)提供了多元化的手段,除了紙筆測試外,還可以通過智能語音識別、人臉識別、計算機視覺技術(shù)等方式進行測評,實現(xiàn)了從單一到多元評價的轉(zhuǎn)變。如可通過智能語音識別技術(shù)實現(xiàn)對學(xué)生口語表達能力的評價、通過計算機視覺技術(shù)實現(xiàn)對實驗操作技能的評價。(3)完善過程評價。 AI+IoT 技術(shù)可實時收集學(xué)生的學(xué)習(xí)數(shù)據(jù),進行過程性評估,實現(xiàn)學(xué)習(xí)情況的動態(tài)記錄和精準(zhǔn)反饋。
二、 Al+10T 測評物理實驗操作系統(tǒng)解構(gòu)
AI+IoT 測評物理實驗操作系統(tǒng)的整體架構(gòu)是一個融合人工智能(AI)與物聯(lián)網(wǎng)(IoT)技術(shù)的高度集成、智能化的復(fù)雜系統(tǒng),通過AI實現(xiàn)實驗操作的高效評價以釋放人工成本,IoT實現(xiàn)數(shù)據(jù)信息化、流程自動化、過程可視化以拓寬測評場景。我校與某科技公司建立合作關(guān)系,并承擔(dān)區(qū)域的AI實驗測評活動,通過數(shù)據(jù)分析發(fā)現(xiàn):AI評測的準(zhǔn)確率超過95% ,同時隨著樣本數(shù)據(jù)的增大,其準(zhǔn)確率會進一步提升,因此,實踐證明通過 AI+IoT 進行課堂實驗操作測評、區(qū)域考試測評均有較大的推廣性。
1.AI+IoT 核心智能硬件終端:實驗操作行為的數(shù)據(jù)采集
實驗操作評價的核心在于對實驗操作規(guī)范性的評價,因此,完整和全方位地記錄實驗操作行為是評價的關(guān)鍵。 AI+Io′T 硬件終端通過多個攝像頭實現(xiàn)了對操作行為全程、切片式的記錄,核心智能硬件終端包括全局?jǐn)z像頭、細(xì)節(jié)攝像頭、前置攝像頭、AI輔助桌布和智能化一體機(如圖1)。全局?jǐn)z像頭實現(xiàn)了俯視視角的攝像記錄,除了捕捉操作行為外,還可分析整體操作布局、空間利用、實驗器材擺放位置是否合理、也可對實驗數(shù)據(jù)進行記錄(例如俯視讀取電流表和電壓表的示數(shù));細(xì)節(jié)攝像頭提供側(cè)面視角的攝像記錄,輔助捕捉操作行為,更聚焦實驗細(xì)節(jié)的操作和側(cè)面的實驗數(shù)據(jù)記錄(例如在側(cè)面讀取測量液體溫度時溫度計的示數(shù));前置攝像頭用于人臉識別和提供正面拍攝視角,主要用于考試時的身份核查和正面的操作行為記錄;AI輔助桌布的主要功能有兩個,其一是為了限定學(xué)生的操作區(qū)域,便于攝像頭記錄操作行為,其二是為了增加桌布與實驗器材的對比度,提升AI評分的準(zhǔn)確度;智能化一體機是硬件終端的控制中心,負(fù)責(zé)數(shù)據(jù)的收集、處理和分析,以及實驗結(jié)果的展示,其可以作為顯示屏呈現(xiàn)任務(wù)單和播放內(nèi)置實驗視頻,也可以作為接收器將攝像頭或者傳感器等數(shù)據(jù)接入,還可以作為數(shù)據(jù)存儲和傳輸?shù)闹修D(zhuǎn)站。
2.架構(gòu)IoT網(wǎng)關(guān)數(shù)據(jù)傳輸網(wǎng)絡(luò)系統(tǒng):實驗數(shù)據(jù)的實時傳輸
IoT網(wǎng)關(guān)作為物聯(lián)網(wǎng)系統(tǒng)中的關(guān)鍵組件,起到了連接和控制各種設(shè)備,并將數(shù)據(jù)傳輸?shù)皆破脚_或本地服務(wù)器的作用。核心智能硬件終端將學(xué)生的實驗操作行為轉(zhuǎn)化為數(shù)字化、可視化的數(shù)據(jù)和信息,然后通過IoT網(wǎng)關(guān)數(shù)據(jù)傳輸?shù)皆破脚_或者學(xué)校終端,并利用加密技術(shù)確保數(shù)據(jù)的安全性,數(shù)據(jù)中心接收數(shù)據(jù)后進行存儲、處理和分析。依托于 lot 網(wǎng)關(guān)系統(tǒng)的數(shù)據(jù)傳輸實時性,教師的教學(xué)視頻同屏、學(xué)生實驗操作視頻即時查看均可輕易實現(xiàn),初步實現(xiàn)了集伴隨式采集、學(xué)情跟蹤和設(shè)備監(jiān)管等功能于一體的智慧實驗室構(gòu)建(如圖2)。得益于IoT網(wǎng)關(guān)系統(tǒng)的實時性和安全性,不僅可以構(gòu)建校內(nèi)的局域網(wǎng)數(shù)據(jù)傳輸系統(tǒng),也可以實現(xiàn)區(qū)級或市級IoT網(wǎng)關(guān)數(shù)據(jù)傳輸系統(tǒng)(如圖3),為實現(xiàn)區(qū)域測評提供可能。
3.AI智能測評系統(tǒng):實驗操作的高效精準(zhǔn)評價
AI智能測評系統(tǒng)內(nèi)有豐富的實驗資源,教學(xué)應(yīng)用覆蓋教材中所有必做實驗,其中包括實驗教學(xué)視頻、儀器使用規(guī)范、實驗仿真模擬、實驗挑戰(zhàn)、實驗練習(xí)等欄目,已經(jīng)形成了完備的實驗教學(xué)、實驗練習(xí)、實驗評價的教學(xué)評一體化模式。在豐富的資源庫支持下,AI智能測評系統(tǒng)通過對大量考生實驗操作和儀器使用行為的反復(fù)識別和深度學(xué)習(xí),已經(jīng)建立了考查學(xué)生實驗操作數(shù)據(jù)庫,形成了標(biāo)準(zhǔn)化的實驗操作流程5。在現(xiàn)場評測中,通過攝像頭捕捉學(xué)生的實驗操作視頻,再通過lot設(shè)備將數(shù)據(jù)傳輸至AI智能測評系統(tǒng),測評系統(tǒng)將學(xué)生實驗操作行為與標(biāo)準(zhǔn)實驗流程進行比對,賦予相應(yīng)的分值(扣分則會顯示扣分原因),并截取賦值對應(yīng)的實驗操作視頻,便于后續(xù)通過回放視頻進行成績復(fù)核(如圖4)。學(xué)生操作時攝像頭可同時捕捉正面、側(cè)面和俯視三個角度的視頻,AI根據(jù)學(xué)生操作行為進行即時的評分,對于實驗中的讀數(shù)問題則可通過對比學(xué)生填入的數(shù)值與AI識別出的示數(shù)(如圖5),進而進行賦分。
三、 Al+10T 測評物理實驗操作的實踐應(yīng)用
1.前期準(zhǔn)備,開發(fā)適配的任務(wù)單和實驗操作評價標(biāo)準(zhǔn)
實驗操作任務(wù)單是進行實驗測評的驅(qū)動性任務(wù),實驗操作評價標(biāo)準(zhǔn)是進行實驗操作的評分依據(jù),兩者必須高度適配,主要體現(xiàn)在內(nèi)容的一致性和要求的對應(yīng)性,評價標(biāo)準(zhǔn)還應(yīng)具有可操作性,便于AI智能測評系統(tǒng)進行自動化評分和人工復(fù)核。雖然AI智能測評系統(tǒng)中已有成熟的任務(wù)單和評分標(biāo)準(zhǔn),但是只有開發(fā)更多具有普遍性的實驗案例才能讓AI測評更具有推廣性和適用性。區(qū)別于系統(tǒng)中測量小燈泡電功率實驗,筆者在其基礎(chǔ)上增加了電路圖的繪制、實驗數(shù)據(jù)表記錄和實驗分析的簡述題(如圖6),以更加全面地測試學(xué)生的實驗素養(yǎng)和評測智能測評系統(tǒng)的實用性。為此,相應(yīng)的評分標(biāo)準(zhǔn)也進行了調(diào)整和優(yōu)化(見表2)。
2.關(guān)聯(lián)系統(tǒng),導(dǎo)入任務(wù)單和評分標(biāo)準(zhǔn)
使用管理員賬號登錄智能測評系統(tǒng),將指定的任務(wù)單和評分標(biāo)準(zhǔn)導(dǎo)人系統(tǒng)中,再通過智能教學(xué)終端發(fā)放到學(xué)生終端,學(xué)生便可在一體機的屏幕上看到任務(wù)單。學(xué)生的實驗操作可通過攝像頭捕捉動作的形式進行AI評分,但是涉及到電路圖的繪制、數(shù)據(jù)的填寫和實驗分析的簡述等操作之外的評價,則需要通過系統(tǒng)提供的在線編輯工具或圖片上傳功能實現(xiàn)電腦端的數(shù)據(jù)輸入或者紙質(zhì)拍照上傳。
3.系統(tǒng)測試,尋找測評優(yōu)化點
組織學(xué)生進行現(xiàn)場實驗操作測評,組織教師根據(jù)實驗操作PTA量表進行人工評分,并將AI評分與人工評分進行對比,尋找優(yōu)化點。經(jīng)過測試發(fā)現(xiàn)AI對于電路圖和簡答題的評分錯誤率最高,可能原因是學(xué)生電路圖中各元件位置與標(biāo)準(zhǔn)答案存在差異、簡答題的表述AI評分準(zhǔn)確率低導(dǎo)致。其次是表格數(shù)據(jù)的評分錯誤率,主要是學(xué)生填寫順序與所給答案順序不一致導(dǎo)致。而對于實驗操作的評分上,錯誤率最高的是電壓表和電流表的量程選擇,由于顏色對比度問題,AI未能精準(zhǔn)識別所連接電表的量程,而在更換顏色對比度更大的導(dǎo)線和電極片后,AI評分的準(zhǔn)確率大大提升。綜上分析,選擇特征更鮮明的儀器更有利于AI的評分,而對于主觀題和畫圖題的評分人工評分準(zhǔn)確率更高。因此,當(dāng)下探索AI主體 + 人工輔助評分相結(jié)合的實驗測評模式更具信度,而隨著人工智能的逐步優(yōu)化,AI的比重會逐步加大,人工才可以更大程度地得到釋放。
4.系統(tǒng)統(tǒng)計,以評促教
在測評后系統(tǒng)可自動生成參與測評的每一位學(xué)生的個性化得分報告和全體學(xué)生的整體報告,其中包括了平均分、每個操作的得分率、平均耗時等,為學(xué)生精準(zhǔn)發(fā)現(xiàn)自己的薄弱操作點和教師捕捉班級整體薄弱點提供了依據(jù),有利于以評促改、以評促教。
四、反思與成效
1.變革測評方式:客觀高效評價
傳統(tǒng)的實驗測評需要大量教師做監(jiān)考和評分工作,耗時長、評分主觀性強,且對于爭議性操作無法追溯。 AI+IoT 測評實驗操作具有高效、客觀和可追溯等特點,實現(xiàn)了實驗操作測評的實時反饋,避免了人工評分耗時長和主觀性的弊端,為爭議性操作提供回放視頻以保證公平性。該測評模式對硬件設(shè)備要求高、運行成本高,但隨著DeepSeek等國內(nèi)人工智能科技公司的迅捷發(fā)展,其成本會大大降低,測評的精準(zhǔn)度也會進一步提升, AI+IoT 測評實驗操作模式在不久的將來會更具有推廣性。
2.拓寬測評場景:探索多元評價
依托IoT的儲存和傳輸功能,測評場域?qū)崿F(xiàn)了從線下到線上的可能,學(xué)生的操作評價實現(xiàn)了從靜態(tài)到動態(tài)的突破,為過程性評價在教學(xué)中的實施提供了強有力的支撐。得益于AI強大的智能語音識別、自然語言處理、計算機視覺等技術(shù),我們不僅可以實現(xiàn)對學(xué)生知識掌握的評價,更可以實現(xiàn)口語表達能力、操作能力等評價,進一步拓寬了測評內(nèi)容和能力維度。當(dāng)下在已大面積開展人工評分下的實驗技能和科學(xué)探究能力融合測評以挑選拔尖人才,在此背景下,探索AI+IoT賦能下的實驗技能和科學(xué)探究能力融合測評具有較高的實踐價值。
3.構(gòu)建測評閉環(huán):實現(xiàn)“教一學(xué)一評\"一體化
“教一學(xué)一評”一體化旨在將教學(xué)、學(xué)習(xí)和評價有機融合,以評價促進教學(xué),以教學(xué)改進評價,最終實現(xiàn)教學(xué)質(zhì)量的提升,而構(gòu)建測評閉環(huán)是實現(xiàn)“教一學(xué)—評”一體化的關(guān)鍵環(huán)節(jié)。AI+IoT測評系統(tǒng)通過全方位收集學(xué)生的測評數(shù)據(jù),并進行多維度考情分析和可視化呈現(xiàn),幫助教師精準(zhǔn)掌握學(xué)情,從而實現(xiàn)差異化教學(xué)和動態(tài)教學(xué)調(diào)整,在測評閉環(huán)中精準(zhǔn)提升學(xué)生的實驗操作能力。
參考文獻
[1]黃華,張睿,潘鑫.AI+環(huán)境下學(xué)生科學(xué)探究能力測評研究.物理與工程,2022,32(06):49-56+65.
[2]王慧,孫可,楊凱風(fēng),等.全國各地中考實驗操作考試實施現(xiàn)狀調(diào)查報告(一)].中國現(xiàn)代教育裝備,2022(12):4-10
[3]趙國宏,蓋延,龍馬蕓,等.面向教學(xué)“測評”的智能教育軟件評估指標(biāo)體系——《2023人工智能促進教育發(fā)展報告》節(jié)選六[].中國教育信息化,2024,30(07):64-72.
[4]駱方,田雪濤,屠焊然,等.教育評價新趨向:智能化測評研究綜述[].現(xiàn)代遠程教育研究,2021,33(05):42-52.
[5]屈寶峰,田園,楊佳 .5G+ 流動推進實驗操作, AI+ 智慧助力考試公平[].教育與裝備研究,2023,39(04):76-80.
[6]高文蓓,王新福,凌一洲.基于人工智能的化學(xué)實驗現(xiàn)象評價與反饋系統(tǒng)開發(fā)[J].化學(xué)教學(xué),2024(06):63-67.