朱 珂 楊 冰
?
教學(xué)測(cè)試數(shù)據(jù)的演變、應(yīng)用及其展望*
朱 珂 楊 冰
(河南師范大學(xué) 教育學(xué)院,河南新鄉(xiāng) 453007)
教學(xué)測(cè)試數(shù)據(jù)是教育大數(shù)據(jù)的重要組成部分,對(duì)揭示教學(xué)狀態(tài)的要素特征和結(jié)構(gòu)關(guān)系具有重要意義?;诖?,文章首先從數(shù)據(jù)來(lái)源、采集技術(shù)、分析處理技術(shù)、呈現(xiàn)方式等維度進(jìn)行對(duì)比分析,梳理了傳統(tǒng)環(huán)境下和“互聯(lián)網(wǎng)+”環(huán)境下教學(xué)測(cè)試數(shù)據(jù)的演變歷程;隨后,文章分析了測(cè)試評(píng)價(jià)的轉(zhuǎn)變,并介紹了目前國(guó)內(nèi)外教學(xué)測(cè)試數(shù)據(jù)在自適應(yīng)評(píng)估、實(shí)時(shí)監(jiān)控干預(yù)、學(xué)情預(yù)測(cè)與分析、個(gè)性化學(xué)習(xí)以及輔助決策服務(wù)等方面的典型應(yīng)用案例;最后,文章針對(duì)教學(xué)測(cè)試數(shù)據(jù)的應(yīng)用進(jìn)行展望,以期為精準(zhǔn)教學(xué)模式下教學(xué)測(cè)試數(shù)據(jù)的分析與應(yīng)用提供借鑒。
“互聯(lián)網(wǎng)+”;教學(xué)測(cè)試數(shù)據(jù);教學(xué)評(píng)價(jià);教育應(yīng)用
在教學(xué)活動(dòng)中,評(píng)價(jià)扮演著調(diào)節(jié)、控制教學(xué)過(guò)程的重要角色,對(duì)喚起學(xué)生新的認(rèn)知與成就需要、提高學(xué)習(xí)興趣與信心具有獨(dú)特的激勵(lì)導(dǎo)向作用。測(cè)試是評(píng)價(jià)學(xué)生學(xué)習(xí)效果的重要手段,在此過(guò)程中生成的可量化、可記錄的測(cè)試數(shù)據(jù)蘊(yùn)含著豐富的學(xué)情信息。傳統(tǒng)的紙筆測(cè)試僅能給予教師和學(xué)生淺層信息反饋,如分?jǐn)?shù)、名次、平均分等。這樣的反饋形式既不能使學(xué)生清晰了解自己的知識(shí)點(diǎn)掌握情況,也不利于教師對(duì)學(xué)生進(jìn)行個(gè)性化指導(dǎo)。教育大數(shù)據(jù)及其分析技術(shù)的出現(xiàn)與發(fā)展,為教學(xué)測(cè)試數(shù)據(jù)的應(yīng)用帶來(lái)了新的機(jī)遇,有利于解決傳統(tǒng)教學(xué)測(cè)試分析與評(píng)價(jià)中存在的問(wèn)題。在學(xué)習(xí)分析等技術(shù)的支持下,教師可以充分挖掘和利用測(cè)試數(shù)據(jù)背后所蘊(yùn)含的海量學(xué)情信息,使教育教學(xué)過(guò)程逐步從基于常識(shí)的經(jīng)驗(yàn)推斷走向基于數(shù)據(jù)的科學(xué)決策,從而對(duì)教學(xué)各環(huán)節(jié)進(jìn)行精確診斷,實(shí)施精準(zhǔn)化教學(xué)。
實(shí)施教學(xué)評(píng)價(jià)是教育管理者和教師進(jìn)行教學(xué)干預(yù)與決策的重要前提,而有效的教學(xué)評(píng)價(jià)依賴于具有代表性的評(píng)價(jià)數(shù)據(jù)和科學(xué)、精確的評(píng)價(jià)技術(shù)。教學(xué)測(cè)試數(shù)據(jù)作為教學(xué)評(píng)價(jià)中最為客觀、準(zhǔn)確、易測(cè)量的數(shù)據(jù)來(lái)源,受到了研究者的持續(xù)、廣泛關(guān)注。如楊現(xiàn)民等[1]提出將教育大數(shù)據(jù)的分析處理分為教育數(shù)據(jù)采集、教育數(shù)據(jù)處理、教育數(shù)據(jù)分析與呈現(xiàn)三個(gè)環(huán)節(jié)。本研究從數(shù)據(jù)來(lái)源、采集技術(shù)、分析處理技術(shù)、呈現(xiàn)方式等維度對(duì)測(cè)試數(shù)據(jù)進(jìn)行了對(duì)比分析,梳理了傳統(tǒng)環(huán)境下和“互聯(lián)網(wǎng)+”環(huán)境下教學(xué)測(cè)試數(shù)據(jù)的演變歷程,如圖1所示。
在傳統(tǒng)課堂中,教師對(duì)學(xué)生的評(píng)價(jià)是以考試后的分?jǐn)?shù)統(tǒng)計(jì)和教師主觀分析評(píng)定為主。其中,考試后的分?jǐn)?shù)統(tǒng)計(jì)主要以筆試測(cè)驗(yàn)為主,測(cè)試數(shù)據(jù)來(lái)源于教師組織的周測(cè)、月考、期中考試、期末考試等測(cè)驗(yàn)的試卷分?jǐn)?shù);教師主觀分析評(píng)定則是以學(xué)生在課堂上的表現(xiàn)和日常作業(yè)為基礎(chǔ)的主觀經(jīng)驗(yàn)評(píng)價(jià)。在“互聯(lián)網(wǎng)+”環(huán)境下,以“三通兩平臺(tái)”為代表的軟硬件設(shè)施的不斷完善和教育信息化進(jìn)程的不斷推進(jìn),使得教學(xué)測(cè)試數(shù)據(jù)的來(lái)源越來(lái)越豐富,表現(xiàn)為:①微觀層面,教學(xué)測(cè)試數(shù)據(jù)來(lái)源于單個(gè)學(xué)生,這一層面的數(shù)據(jù)又可劃分為當(dāng)次測(cè)試數(shù)據(jù)和歷次測(cè)試數(shù)據(jù);②宏觀層面,測(cè)試數(shù)據(jù)可以分為課程測(cè)試數(shù)據(jù)、班級(jí)測(cè)試數(shù)據(jù)、學(xué)校測(cè)試數(shù)據(jù)和區(qū)域測(cè)試數(shù)據(jù)等[2]——課程測(cè)試數(shù)據(jù)是指圍繞課程測(cè)試而產(chǎn)生的檢驗(yàn)學(xué)習(xí)效果的數(shù)據(jù);班級(jí)測(cè)試數(shù)據(jù)是指以班級(jí)為單位采集的各類測(cè)試數(shù)據(jù),如作業(yè)數(shù)據(jù)、考試數(shù)據(jù)、課堂實(shí)錄數(shù)據(jù)和班級(jí)管理數(shù)據(jù)等;學(xué)校測(cè)試數(shù)據(jù)是指以校為單位采集的各類測(cè)試數(shù)據(jù);區(qū)域測(cè)試數(shù)據(jù)是指同一區(qū)域內(nèi)不同層次、不同類別學(xué)校的匯總測(cè)試數(shù)據(jù),用于區(qū)域內(nèi)資源的均衡調(diào)配、不同區(qū)域之間學(xué)習(xí)狀況的調(diào)查等。
圖1 不同環(huán)境下教學(xué)測(cè)試數(shù)據(jù)的演變歷程
通常情況下,傳統(tǒng)課堂采用一師對(duì)一班的授課模式,教師無(wú)法對(duì)所有學(xué)生進(jìn)行實(shí)時(shí)學(xué)情監(jiān)控與測(cè)試。課堂測(cè)試數(shù)據(jù)來(lái)自于教學(xué)過(guò)程中教師對(duì)學(xué)生的學(xué)情觀察、課堂提問(wèn)和作業(yè)檢查等;紙質(zhì)試卷類測(cè)試數(shù)據(jù)則來(lái)自于測(cè)試學(xué)前、學(xué)后知識(shí)掌握情況的測(cè)驗(yàn)考試,通過(guò)人工閱卷、人工記錄等方式采集。在“互聯(lián)網(wǎng)+”環(huán)境下,各類專業(yè)、高效的工具軟件可以實(shí)現(xiàn)對(duì)學(xué)生全方位、多維度、自動(dòng)化的數(shù)據(jù)采集。其中,智能錄播與視頻監(jiān)控技術(shù)可以對(duì)課堂教學(xué)數(shù)據(jù)進(jìn)行實(shí)時(shí)、自動(dòng)采集;圖像文字識(shí)別技術(shù)通過(guò)計(jì)算機(jī)對(duì)圖像、文字的匹配處理與分析,可以識(shí)別不同模式的目標(biāo)和對(duì)象,如用于采集學(xué)生測(cè)驗(yàn)考試類數(shù)據(jù)的網(wǎng)評(píng)網(wǎng)閱技術(shù)和用于采集各種作業(yè)、練習(xí)類測(cè)試數(shù)據(jù)的拍照搜題技術(shù);在線平臺(tái)管理、日志搜索、Web挖掘與網(wǎng)絡(luò)爬蟲等平臺(tái)采集技術(shù)可以對(duì)各種在線學(xué)習(xí)與管理數(shù)據(jù)進(jìn)行采集。
在傳統(tǒng)課堂中,課堂測(cè)試數(shù)據(jù)通常采用教師主觀劃分等級(jí)(優(yōu)、良、差)或打分的方法進(jìn)行處理與分析。利用階段測(cè)驗(yàn)中產(chǎn)生的測(cè)試數(shù)據(jù),通過(guò)對(duì)試卷得分的統(tǒng)計(jì)、排序等淺層信息分析(總分、平均分)或初步的分類聚類,可以得出學(xué)生的知識(shí)掌握情況和班級(jí)整體的認(rèn)知分層狀況。在“互聯(lián)網(wǎng)+”環(huán)境下,有預(yù)測(cè)分析、建模、聚類分析、相關(guān)性分析和可視化分析等常用的數(shù)據(jù)挖掘模型和算法,以及神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等大數(shù)據(jù)時(shí)代的前沿機(jī)器學(xué)習(xí)技術(shù)。例如,對(duì)學(xué)習(xí)過(guò)程數(shù)據(jù)進(jìn)行挖掘和預(yù)測(cè),可以分析出學(xué)生的認(rèn)知過(guò)程與情緒波動(dòng)情況;對(duì)學(xué)習(xí)成績(jī)數(shù)據(jù)進(jìn)行聚類分析,可以優(yōu)化學(xué)生分組,從而更好地指導(dǎo)分組式合作學(xué)習(xí);利用可視化和相關(guān)性分析技術(shù),可以支持管理決策人員快速了解學(xué)生的學(xué)習(xí)情況,直觀、高效地發(fā)現(xiàn)學(xué)習(xí)短板。
在傳統(tǒng)課堂中,學(xué)生測(cè)試結(jié)果的呈現(xiàn)方式以平均分、得分率和排名等淺層次數(shù)據(jù)分析結(jié)果為主,只能分析小樣本測(cè)試數(shù)據(jù)顯示學(xué)生的成績(jī)狀況及其變化趨勢(shì),強(qiáng)調(diào)甄別與選拔功能,呈現(xiàn)方式較為單一。在“互聯(lián)網(wǎng)+”環(huán)境下,測(cè)試數(shù)據(jù)的呈現(xiàn)方式重視評(píng)價(jià)的激勵(lì)與引導(dǎo)功能,強(qiáng)調(diào)對(duì)學(xué)生的全面考察,特別是對(duì)情緒、態(tài)度、習(xí)慣等綜合素質(zhì)的考察。2016年,美國(guó)發(fā)布《2016-2045年新興科技趨勢(shì)報(bào)告》,報(bào)告中預(yù)測(cè)的新興技術(shù)——數(shù)字畫像技術(shù)為測(cè)試數(shù)據(jù)呈現(xiàn)方式的發(fā)展提供了更多可能與技術(shù)支持[3]。有學(xué)者預(yù)測(cè),將分析處理后的測(cè)試數(shù)據(jù)結(jié)果以多樣態(tài)、交互式的視覺(jué)形式予以呈現(xiàn),將成為一種必然趨勢(shì)[4]。
在教學(xué)與測(cè)試動(dòng)態(tài)交織的過(guò)程中,評(píng)價(jià)過(guò)程的類型主要分為“三明治”型和“蛋糕”型兩種:①在傳統(tǒng)課堂中,測(cè)試與教學(xué)的過(guò)程主要表現(xiàn)為“三明治”型階段分層評(píng)價(jià)。在這種評(píng)價(jià)過(guò)程中,教學(xué)發(fā)生于前測(cè)和后測(cè)期間,構(gòu)成像三明治一樣的學(xué)習(xí)過(guò)程,在教學(xué)前與教學(xué)后生成測(cè)試數(shù)據(jù)。②在“互聯(lián)網(wǎng)+”環(huán)境下,測(cè)試與教學(xué)的過(guò)程主要表現(xiàn)為“蛋糕”型動(dòng)態(tài)融合評(píng)價(jià)。在這種評(píng)價(jià)過(guò)程中,教學(xué)與測(cè)試交叉融合進(jìn)行——教師設(shè)計(jì)具有針對(duì)性的測(cè)試題目,對(duì)教學(xué)內(nèi)容與教學(xué)效果進(jìn)行即時(shí)評(píng)價(jià)與反饋,同時(shí)依據(jù)測(cè)試結(jié)果,進(jìn)行教學(xué)設(shè)計(jì)、教學(xué)策略、教學(xué)活動(dòng)的自適應(yīng)調(diào)整,測(cè)試數(shù)據(jù)的生成貫穿于整個(gè)學(xué)習(xí)過(guò)程。
“三明治”型階段分層評(píng)價(jià)與“蛋糕”型動(dòng)態(tài)融合評(píng)價(jià)的主要差異是:在“三明治”型評(píng)價(jià)中,教學(xué)與評(píng)價(jià)在時(shí)空上是分離的,作用時(shí)間存在一定的滯后性;而在“蛋糕”型評(píng)價(jià)中,教學(xué)與評(píng)價(jià)緊密耦合,即時(shí)進(jìn)行反饋調(diào)整,作用時(shí)間沒(méi)有延遲。傳統(tǒng)測(cè)試由于受評(píng)價(jià)技術(shù)、數(shù)據(jù)處理能力等因素的限制,通常以“三明治”型為主。而隨著大數(shù)據(jù)、云計(jì)算、學(xué)習(xí)分析等技術(shù)的快速發(fā)展與普及應(yīng)用,測(cè)試評(píng)價(jià)逐漸從“三明治”型向“蛋糕”型轉(zhuǎn)變,如圖2所示。
圖2 “三明治”型評(píng)價(jià)向“蛋糕”型評(píng)價(jià)的轉(zhuǎn)變
圖3 教學(xué)測(cè)試數(shù)據(jù)的應(yīng)用展望
(1)實(shí)施自適應(yīng)評(píng)估
基于測(cè)試數(shù)據(jù)的自適應(yīng)評(píng)估可以檢測(cè)學(xué)生的進(jìn)步情況,為自適應(yīng)學(xué)習(xí)提供數(shù)據(jù)依據(jù)。目前,國(guó)外針對(duì)不同年齡層和不同學(xué)習(xí)需求的學(xué)生,研發(fā)了大量基于測(cè)試數(shù)據(jù)的自適應(yīng)評(píng)估工具,如表1所示。其中,ALEKS是加州大學(xué)歐文分校根據(jù)腦神經(jīng)測(cè)試和數(shù)學(xué)算法,針對(duì)數(shù)學(xué)教育而研發(fā)的一款自適應(yīng)評(píng)估工具,目前已在美國(guó)公立小學(xué)中被普遍應(yīng)用。ALEKS運(yùn)用“知識(shí)空間理論”(Knowledge Space Theory),利用人工智能的手段,通過(guò)少量的問(wèn)題便可以快速準(zhǔn)確地測(cè)評(píng)學(xué)生對(duì)所學(xué)數(shù)學(xué)知識(shí)的掌握程度,并提供自適應(yīng)指導(dǎo)[5]。Imagination Station公司研發(fā)的Istation工具則為全美和其它國(guó)家400萬(wàn)K-12階段的學(xué)生提供了閱讀和寫作的線上測(cè)評(píng),學(xué)生以可視化和游戲的方式完成課程、活動(dòng)和測(cè)試,之后系統(tǒng)將自動(dòng)生成評(píng)估報(bào)告并將其發(fā)送給老師和家長(zhǎng)[6]。
表1 基于測(cè)試數(shù)據(jù)的自適應(yīng)評(píng)估工具
(2)支持實(shí)時(shí)監(jiān)控干預(yù)
培生集團(tuán)開發(fā)的全球少兒英語(yǔ)旗艦課程引入在線學(xué)習(xí)輔導(dǎo)系統(tǒng)(My English Lab,MEL),將測(cè)試數(shù)據(jù)應(yīng)用于決策干預(yù)領(lǐng)域。MEL應(yīng)用大數(shù)據(jù)技術(shù),全程實(shí)時(shí)分析學(xué)生個(gè)體和班級(jí)整體的學(xué)習(xí)進(jìn)度,實(shí)現(xiàn)對(duì)學(xué)習(xí)過(guò)程和結(jié)果的動(dòng)態(tài)管理,為教學(xué)設(shè)計(jì)和教學(xué)活動(dòng)的動(dòng)態(tài)調(diào)整提供數(shù)據(jù)依據(jù)。MEL以學(xué)生為中心,按照教、學(xué)、測(cè)三個(gè)環(huán)節(jié)組織線上學(xué)習(xí)內(nèi)容與教學(xué)過(guò)程,最終實(shí)現(xiàn)對(duì)學(xué)生學(xué)習(xí)過(guò)程的實(shí)時(shí)監(jiān)控與干預(yù)。而布里奇沃特學(xué)院通過(guò)對(duì)比來(lái)自Edexcel、OCR(Oxford Cambridge and RSA Examinations)等第三方機(jī)構(gòu)授權(quán)的源于全國(guó)其它學(xué)校學(xué)生的測(cè)試數(shù)據(jù),獲得進(jìn)行本校學(xué)生學(xué)情監(jiān)控干預(yù)的數(shù)據(jù)依據(jù),并將數(shù)據(jù)分析結(jié)果呈現(xiàn)給教師,從而實(shí)現(xiàn)對(duì)本校學(xué)生的干預(yù),使本校學(xué)生在擁有相似入學(xué)水平的全國(guó)學(xué)生中取得更好的平均成績(jī)[7]。
(3)開展學(xué)情預(yù)測(cè)與分析
在利用測(cè)試數(shù)據(jù)實(shí)現(xiàn)學(xué)情預(yù)測(cè)方面,斯坦福大學(xué)的Piech團(tuán)隊(duì)提出了基于深度神經(jīng)網(wǎng)絡(luò)的學(xué)生知識(shí)點(diǎn)追蹤(Deep Knowledge Tracing,DKT)模型。DKT模型采用深度學(xué)習(xí)中的RNN算法,利用其在時(shí)間上的“深度”,對(duì)海量學(xué)習(xí)數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),不斷完善算法模型。Piech團(tuán)隊(duì)在用DKT模型訓(xùn)練學(xué)習(xí)了可汗學(xué)院47495名學(xué)生所做的140萬(wàn)道數(shù)學(xué)題及解答數(shù)據(jù)集后,預(yù)測(cè)學(xué)生所做習(xí)題正確與否的預(yù)測(cè)精度(即AUC值)達(dá)到0.86,遠(yuǎn)高于基于貝葉斯網(wǎng)絡(luò)的學(xué)生知識(shí)點(diǎn)追蹤(Bayesin Knowledge Tracing,BKT)模型預(yù)測(cè)的精度(AUC值=0.69)[8]。
(4)助力個(gè)性化學(xué)習(xí)
個(gè)性化學(xué)習(xí)已經(jīng)成為當(dāng)今教育的研究熱點(diǎn),各類支持個(gè)性化學(xué)習(xí)的測(cè)評(píng)方式不斷涌現(xiàn)[9]。2017年,由美國(guó)最大的教育測(cè)評(píng)機(jī)構(gòu)——西北測(cè)評(píng)協(xié)會(huì)(Northwest Evaluation Association,NWEA)研發(fā)的個(gè)性化測(cè)試方法(Measures of Academic Progress,MAP)的學(xué)生使用人數(shù)已達(dá)到700多萬(wàn)。在MAP測(cè)試過(guò)程中,測(cè)試內(nèi)容、測(cè)試題目均可以依據(jù)學(xué)生的實(shí)時(shí)答題情況進(jìn)行個(gè)性化調(diào)整,最終穩(wěn)定在學(xué)生的最近發(fā)展區(qū);同時(shí),MAP針對(duì)收集到的測(cè)試數(shù)據(jù),為每一個(gè)學(xué)生提供精準(zhǔn)、個(gè)性化的評(píng)估結(jié)果[10]。美國(guó)的個(gè)性化學(xué)習(xí)平臺(tái)Summit Learning Platform中的學(xué)習(xí)測(cè)評(píng)系統(tǒng)利用測(cè)試數(shù)據(jù)進(jìn)行深度分析后,可以精準(zhǔn)評(píng)估學(xué)生在7大方面中36個(gè)不同認(rèn)知技能的具體掌握程度[11],并能精確、具體地呈現(xiàn)每個(gè)學(xué)生的認(rèn)知發(fā)展程度,據(jù)此向?qū)W生提出清晰的學(xué)習(xí)目標(biāo),為學(xué)生的個(gè)性化學(xué)習(xí)提供支持。
(5)輔助決策服務(wù)
測(cè)試數(shù)據(jù)在教育服務(wù)、教育決策方面也發(fā)揮著巨大的作用。依據(jù)測(cè)試數(shù)據(jù),教育管理者可以發(fā)現(xiàn)問(wèn)題、找尋不足,由此規(guī)劃未來(lái)的教育決策與方針。2017年,英孚教育在上海發(fā)布全球非英語(yǔ)母語(yǔ)國(guó)家的英語(yǔ)水平排名,此排名依據(jù)的是80個(gè)非英語(yǔ)母語(yǔ)的國(guó)家地區(qū)、逾100萬(wàn)人的測(cè)試數(shù)據(jù)[12]。這些測(cè)試數(shù)據(jù)有利于教育管理者了解全球各地區(qū)英語(yǔ)水平的掌握情況,經(jīng)數(shù)據(jù)分析后得到英語(yǔ)水平高低與各地區(qū)的經(jīng)濟(jì)競(jìng)爭(zhēng)力、社會(huì)發(fā)展、創(chuàng)新能力之間的關(guān)系。同時(shí),深度分析測(cè)試數(shù)據(jù)背后的含義,教育管理者可以據(jù)此提出一系列提高英語(yǔ)水平的可行性建議,從而更加科學(xué)合理地制定未來(lái)的教育方針。
隨著教育信息化進(jìn)程的不斷推進(jìn),教育領(lǐng)域的數(shù)據(jù)量呈指數(shù)化增長(zhǎng),教育測(cè)試的“大數(shù)據(jù)”時(shí)代正在來(lái)臨。這些數(shù)據(jù)除了來(lái)自于學(xué)校測(cè)試數(shù)據(jù)系統(tǒng)(周練、月考、期中、期末等),還來(lái)自于各階段測(cè)試數(shù)據(jù)系統(tǒng)(中考、高考、研究生考試等)、各類在線課程測(cè)驗(yàn)數(shù)據(jù)系統(tǒng)(MOOC、網(wǎng)易公開課等)等。未來(lái),這些采集后進(jìn)行了深度加工的測(cè)試數(shù)據(jù),經(jīng)過(guò)各種數(shù)據(jù)挖掘技術(shù)與機(jī)器學(xué)習(xí)技術(shù)的處理與分析,可以為教育決策者和師生在學(xué)情預(yù)測(cè)、學(xué)習(xí)預(yù)警、決策分析、自適應(yīng)學(xué)習(xí)、個(gè)性化推薦、學(xué)習(xí)效果評(píng)測(cè)、學(xué)情監(jiān)控和可視化等方面提供精準(zhǔn)、及時(shí)、科學(xué)的數(shù)據(jù)支持,具體如圖3所示。
在教育教學(xué)過(guò)程中,學(xué)生學(xué)情的分析和學(xué)習(xí)效果的預(yù)測(cè)是學(xué)生了解自身學(xué)習(xí)情況、改變學(xué)習(xí)策略、調(diào)整學(xué)習(xí)狀態(tài)以及教師實(shí)施教學(xué)調(diào)整與干預(yù)的基礎(chǔ),對(duì)教育教學(xué)具有十分重要的作用。教師實(shí)時(shí)了解學(xué)生即時(shí)的學(xué)習(xí)狀態(tài),可以進(jìn)行精準(zhǔn)的教學(xué)調(diào)整和干預(yù),從而在提升教學(xué)效果的同時(shí)減少學(xué)生的認(rèn)知負(fù)荷,提高學(xué)生課程的成功率。如Pardos提出的學(xué)習(xí)預(yù)測(cè)模型能夠利用已有的各類測(cè)試數(shù)據(jù)對(duì)學(xué)生未來(lái)的考試成績(jī)進(jìn)行預(yù)測(cè),并提供具體的行動(dòng)支持和相應(yīng)的解決方案,從而為學(xué)生的個(gè)性化學(xué)習(xí)和教師的有效干預(yù)提供支持[13]。未來(lái),各類學(xué)習(xí)系統(tǒng)可以對(duì)學(xué)生的日常作業(yè)進(jìn)行自動(dòng)批改并向教師提供及時(shí)反饋,教師可以利用這些測(cè)試數(shù)據(jù)對(duì)學(xué)生進(jìn)行實(shí)時(shí)的學(xué)習(xí)預(yù)警,向?qū)W生發(fā)送將會(huì)導(dǎo)致輟學(xué)和學(xué)習(xí)成績(jī)表現(xiàn)不良的警告性信號(hào),同時(shí)進(jìn)行精準(zhǔn)的教學(xué)調(diào)整和干預(yù),以提高學(xué)生課程學(xué)習(xí)的成功率。
在“互聯(lián)網(wǎng)+”環(huán)境下,教育領(lǐng)域每天生成海量的學(xué)情數(shù)據(jù),這些數(shù)據(jù)可以幫助教育管理者更加全面、準(zhǔn)確地了解教育現(xiàn)狀,故為相關(guān)教育決策的制定提供了數(shù)據(jù)依據(jù)。在測(cè)試數(shù)據(jù)方面,傳統(tǒng)的分析方式(如總分、平均分、排名)已經(jīng)不能滿足精準(zhǔn)決策的數(shù)據(jù)支持需求。因此,研究者需以管理科學(xué)、運(yùn)籌學(xué)、教育科學(xué)、心理學(xué)等學(xué)科為理論基礎(chǔ),以數(shù)據(jù)挖掘技術(shù)、機(jī)器學(xué)習(xí)技術(shù)和可視化技術(shù)為手段,針對(duì)教育問(wèn)題,利用分析模型分析教育測(cè)試數(shù)據(jù),為教育管理者提供備選方案,并提供支持精準(zhǔn)、及時(shí)、科學(xué)決策的數(shù)據(jù)依據(jù),使教育決策從模糊走向清晰、從猜測(cè)走向證實(shí),最終提高教育決策的質(zhì)量。
個(gè)性化學(xué)習(xí)是“互聯(lián)網(wǎng)+”環(huán)境下未來(lái)教育的熱點(diǎn),滿足每個(gè)學(xué)生獨(dú)特的學(xué)習(xí)需求,讓每個(gè)學(xué)生以最高效的個(gè)性化方式學(xué)習(xí)是未來(lái)教育的必然發(fā)展趨勢(shì)[14]。深入挖掘?qū)W生的各類測(cè)試數(shù)據(jù),教學(xué)測(cè)試系統(tǒng)可以得到每個(gè)學(xué)生獨(dú)特的學(xué)情信息,為學(xué)生提供個(gè)性化定制的錯(cuò)題本、診斷報(bào)告、個(gè)性化學(xué)習(xí)包、學(xué)業(yè)信息檔案和學(xué)科內(nèi)容評(píng)價(jià)報(bào)告單等,從而形成學(xué)習(xí)和行為的相關(guān)方案,為學(xué)生的個(gè)性化學(xué)習(xí)提供支持。如Alt School的學(xué)生畫像(Learner Profile)由系統(tǒng)學(xué)習(xí)進(jìn)度(Learning Progression)、項(xiàng)目清單(Playlist)、基本信息(Basic Info)、文檔(Documents)和筆記(Notes)構(gòu)成。其中,系統(tǒng)學(xué)習(xí)進(jìn)度通過(guò)綠色(已學(xué)完)和黃色(學(xué)習(xí)中)對(duì)學(xué)習(xí)進(jìn)度進(jìn)行區(qū)分,且綠色/黃色會(huì)隨著學(xué)習(xí)的推進(jìn)而逐漸加深,由此繪制出多維度、全方位的學(xué)習(xí)者個(gè)性畫像[15]。
隨著“互聯(lián)網(wǎng)+”時(shí)代測(cè)試手段和評(píng)價(jià)觀念的轉(zhuǎn)變,測(cè)試不再只是測(cè)量學(xué)生成績(jī)的一個(gè)終結(jié)性評(píng)價(jià)工具,而成為了學(xué)習(xí)過(guò)程的一部分,使得以促進(jìn)學(xué)生學(xué)習(xí)為目的的認(rèn)知診斷評(píng)估技術(shù)得到快速發(fā)展[16]。認(rèn)知診斷是對(duì)傳統(tǒng)測(cè)試和評(píng)價(jià)的一種改進(jìn)與完善,而認(rèn)知診斷理論是認(rèn)知心理學(xué)和心理測(cè)量學(xué)的結(jié)合。運(yùn)用認(rèn)知診斷評(píng)估技術(shù),得到被試者精準(zhǔn)、及時(shí)的知識(shí)狀態(tài)和認(rèn)知結(jié)構(gòu),有助于教師在隨后的教學(xué)過(guò)程中采取相應(yīng)的補(bǔ)救或調(diào)整措施。近年來(lái),認(rèn)知診斷模型不斷發(fā)展,如認(rèn)知診斷技術(shù)和計(jì)算機(jī)自適應(yīng)測(cè)驗(yàn)相結(jié)合,可以實(shí)時(shí)獲得學(xué)生知識(shí)習(xí)得與能力提升的演變軌跡。所以,如何利用測(cè)試數(shù)據(jù)對(duì)學(xué)習(xí)者進(jìn)行更加精準(zhǔn)、高效的認(rèn)知診斷,將成為測(cè)試數(shù)據(jù)未來(lái)分析研究的重點(diǎn)方向[17]。
借助大數(shù)據(jù)獲取、大數(shù)據(jù)分析、大數(shù)據(jù)可視化等技術(shù)的發(fā)展與應(yīng)用,測(cè)試數(shù)據(jù)在教學(xué)評(píng)估、學(xué)情預(yù)警、認(rèn)知診斷等領(lǐng)域展現(xiàn)出巨大的應(yīng)用價(jià)值。本研究分析了傳統(tǒng)環(huán)境下和“互聯(lián)網(wǎng)+”教育情境下測(cè)試數(shù)據(jù)的來(lái)源、采集、分析與呈現(xiàn)環(huán)節(jié)的異同,梳理了目前國(guó)內(nèi)外運(yùn)用測(cè)試數(shù)據(jù)在自適應(yīng)性學(xué)習(xí)、實(shí)時(shí)監(jiān)控干預(yù)、學(xué)情預(yù)測(cè)與分析、個(gè)性化學(xué)習(xí)及輔助決策服務(wù)等領(lǐng)域的典型應(yīng)用案例,對(duì)測(cè)試數(shù)據(jù)在學(xué)習(xí)預(yù)警、教育決策、個(gè)性化學(xué)習(xí)、認(rèn)知診斷等場(chǎng)景的應(yīng)用進(jìn)行了展望,以期為精準(zhǔn)教學(xué)模式下教學(xué)測(cè)試數(shù)據(jù)的分析與應(yīng)用提供借鑒。
[1]楊現(xiàn)民,唐斯斯,李冀紅.教育大數(shù)據(jù)的技術(shù)體系框架與發(fā)展趨勢(shì)——“教育大數(shù)據(jù)研究與實(shí)踐專欄”之整體框架篇[J].現(xiàn)代教育技術(shù),2016,(1):5-12.
[2]楊現(xiàn)民,王榴卉,唐斯斯.教育大數(shù)據(jù)的應(yīng)用模式與政策建議[J].電化教育研究,2015,(9):54-61、69.
[3]DeepTech深科技.美國(guó)陸軍發(fā)布20項(xiàng)重大科技趨勢(shì),將在未來(lái)30年改變世界![OL].
[4]呂永峰.讀圖時(shí)代可視化及其技術(shù)分析[J].現(xiàn)代教育技術(shù),2015,(2):19-25.
[5]王碩爍,馬玉慧.國(guó)外典型自適應(yīng)學(xué)習(xí)平臺(tái)的基本框架及其關(guān)鍵技術(shù)分析[J].開放學(xué)習(xí)研究,2018,(1):48-54.
[6]Istation. About us[OL].
[7]中國(guó)教育網(wǎng)絡(luò).大數(shù)據(jù)在英國(guó)高校的應(yīng)用案例[OL].
[8]劉勇,李青,于翠波.深度學(xué)習(xí)技術(shù)教育應(yīng)用:現(xiàn)狀和前景[J].開放教育研究,2017,(5):113-120.
[9][14]孔晶,郭玉翠,郭光武.技術(shù)支持的個(gè)性化學(xué)習(xí):促進(jìn)學(xué)生發(fā)展的新趨勢(shì)[J].中國(guó)電化教育,2016,(4):88-94.
[10]360百科.MAP測(cè)試[OL].
[11]黃劍橋.Facebook個(gè)性化學(xué)習(xí)平臺(tái),有多個(gè)性?[OL].
[12]中國(guó)教育網(wǎng).英孚英語(yǔ)熟練度指標(biāo)全球排名中國(guó)人英語(yǔ)水平五年達(dá)新高[OL].
[13]李香勇,左明章,王志鋒.學(xué)習(xí)分析的研究現(xiàn)狀與未來(lái)展望——2016年學(xué)習(xí)分析和知識(shí)國(guó)際會(huì)議述評(píng)[J].開放教育研究,2017,(1):46-55.
[15]Robert老師. Alt School個(gè)性化學(xué)習(xí)系統(tǒng)揭秘[OL].
[16]趙茜,辛濤,劉雨甲.我國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)的現(xiàn)狀與趨勢(shì)——第二屆“中國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)”學(xué)術(shù)年會(huì)綜述[J].教育研究,2017,(9):154-159.
[17]張瑾.1:1數(shù)字環(huán)境下師生行為特征的比較研究[J].現(xiàn)代教育技術(shù),2016,(8):49-54.
The Evolution, Application and Prospect of Teaching Test Data
ZHU Ke YANG Bing
Teaching Test data is an important part of the big data in education, which is of great significance to reveal the features and structural relations of teaching status. Based on this, the paper firstly compared the teaching test data in the traditional environment and the “Internet +” environment from the dimensions of data sources, collection techniques, analysis techniques and presentation methods, and further summarized the evolution of teaching test data in the two environment. Then, the transformation of the test evaluation was analyzed, and the typical application cases of teaching test data at home and abroad in the aspects of adaptive evaluation, real-time monitoring and intervention, learning situation prediction and analysis, personalized learning and auxiliary decision-making service were introduced. Finally, the application of teaching test data was forecasted, excepting to provide reference for the analysis and application of teaching test data in the pricise teaching model.
“Internet +”; teaching test data; teaching evaluation; education application
G40-057
A
1009—8097(2018)07—0018—07
10.3969/j.issn.1009-8097.2018.07.003
本文為河南省哲學(xué)社會(huì)科學(xué)研究項(xiàng)目“河南推進(jìn)新型城鎮(zhèn)化進(jìn)程中均衡配置城鄉(xiāng)教育資源的方法、路徑與績(jī)效評(píng)價(jià)研究”(項(xiàng)目編號(hào):2014CJY030)、河南省教育廳2018年度教師教育課程改革研究項(xiàng)目“互聯(lián)網(wǎng)背景下中小學(xué)教師專業(yè)成長(zhǎng)的生態(tài)模型及行動(dòng)路徑研究”(項(xiàng)目編號(hào):2018-JSJYYB-018)的階段性研究成果。
朱珂,副教授,博士,研究方向?yàn)閷W(xué)習(xí)分析技術(shù)理論與應(yīng)用,郵箱為ezhuke@qq.com。
2017年11月28日
編輯:小米