關(guān)鍵詞:知識追蹤;在線課程;個(gè)性化學(xué)習(xí);深度學(xué)習(xí);智慧教育
中圖分類號:G642 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2024)28-0171-06
0 引言
近年來“互聯(lián)網(wǎng)+”教育不斷推進(jìn),在線教學(xué)平臺越來越普及,為學(xué)習(xí)者提供了開放、靈活的自主學(xué)習(xí)途徑,在線學(xué)習(xí)者的規(guī)模也逐漸增大。然而傳統(tǒng)在線教學(xué)平臺中普遍缺乏個(gè)性化教學(xué)手段,教師通常會在開課前預(yù)設(shè)好整套學(xué)習(xí)資源,包括文本講義、音視頻課件、作業(yè)測驗(yàn)等,一旦課程開啟,學(xué)生便需按照既定的學(xué)習(xí)路徑進(jìn)行,瀏覽這些預(yù)先準(zhǔn)備好的資源。教學(xué)活動(dòng)大多局限于論壇上的簡單交流、教師偶爾進(jìn)行的直播答疑等,與學(xué)生的實(shí)時(shí)互動(dòng)相對較少。這樣的模式在某種程度上限制了學(xué)生學(xué)習(xí)的自主性和深度,特別是對于成人學(xué)習(xí)者而言。大多數(shù)成人學(xué)習(xí)者學(xué)習(xí)時(shí)間靈活、學(xué)習(xí)水平和偏好存在較大差異,在線課程中靜態(tài)的學(xué)習(xí)資源、單一的教學(xué)模式、普適化的測評手段、有限的交互式學(xué)習(xí)活動(dòng)已經(jīng)不能滿足他們多樣化、個(gè)性化的學(xué)習(xí)需求。再加上教師數(shù)量遠(yuǎn)不及學(xué)生數(shù)量,教師不可能充分了解每個(gè)學(xué)生的知識狀態(tài)和學(xué)習(xí)進(jìn)度,難以為學(xué)生提供及時(shí)、有效的學(xué)習(xí)指導(dǎo)[1]。
解決上述問題的一項(xiàng)關(guān)鍵技術(shù)是知識追蹤,知識追蹤是支撐智慧教育系統(tǒng)的核心技術(shù),近年來受到研究者們的廣泛關(guān)注[2]。知識追蹤是指根據(jù)學(xué)生的歷史答題記錄來自動(dòng)追蹤學(xué)生的知識狀態(tài)隨時(shí)間的變化過程,以預(yù)測學(xué)生在未來學(xué)習(xí)中的表現(xiàn)?;谥R追蹤的結(jié)果,教育者可以及時(shí)了解學(xué)習(xí)者的知識掌握情況,學(xué)習(xí)者可以找到高效的學(xué)習(xí)路徑和恰當(dāng)?shù)膶W(xué)習(xí)資源。因此,本研究關(guān)注在大規(guī)模在線課程中如何利用知識追蹤技術(shù)輔助個(gè)性化教學(xué),為教師和學(xué)生提供個(gè)性化的學(xué)習(xí)支持服務(wù),以培養(yǎng)師生形成足夠的個(gè)性化教與學(xué)能力,為知識追蹤技術(shù)在智慧教育領(lǐng)域的應(yīng)用提供參考。
1 知識追蹤技術(shù)的相關(guān)研究概述
1.1 起源
學(xué)習(xí)者知識狀態(tài)建模是輔助個(gè)性化學(xué)習(xí)的關(guān)鍵路徑之一,早期的研究根據(jù)測試成績從宏觀角度對學(xué)生進(jìn)行評價(jià)分析,如經(jīng)典測量理論、概化理論、項(xiàng)目反應(yīng)理論等。后續(xù)有研究者進(jìn)一步提出以認(rèn)知診斷為代表的新一代測量理論,認(rèn)知診斷來源于心理測量領(lǐng)域,通過測量學(xué)生個(gè)體內(nèi)部心理對知識的加工過程分析學(xué)生的知識狀態(tài)。但上述方法通常只基于某一時(shí)刻的測驗(yàn)成績對學(xué)生知識狀態(tài)進(jìn)行評估,并假設(shè)學(xué)生知識狀態(tài)在短時(shí)間內(nèi)是固定不變的。然而,在實(shí)際場景中,學(xué)生的知識狀態(tài)跟隨學(xué)習(xí)過程動(dòng)態(tài)變化,及時(shí)追蹤學(xué)生的知識狀態(tài)對于個(gè)性化學(xué)習(xí)具有十分重要的意義?;诖?,美國卡內(nèi)基梅隆大學(xué)的Corbett和Anderson于1995年提出知識追蹤任務(wù)[3],旨在通過學(xué)生歷史的學(xué)習(xí)數(shù)據(jù),動(dòng)態(tài)跟蹤學(xué)生的知識水平的變化情況。此后,知識追蹤受到了教育領(lǐng)域和數(shù)據(jù)挖掘領(lǐng)域研究者的廣泛關(guān)注。
1.2 基本定義
知識追蹤任務(wù)可以形式化地表示為一個(gè)有監(jiān)督的序列學(xué)習(xí)任務(wù),如圖1所示,學(xué)生在學(xué)習(xí)過程中,與不同知識點(diǎn)的習(xí)題交互,產(chǎn)生一個(gè)習(xí)題歷史作答序列,包含習(xí)題信息、習(xí)題關(guān)聯(lián)的知識點(diǎn)信息以及學(xué)生作答的正確與否信息。知識追蹤模型將該序列作為輸入,通過對習(xí)題歷史作答序列建模,預(yù)測學(xué)生對下一道習(xí)題的作答結(jié)果與知識狀態(tài)。知識追蹤建模通常基于學(xué)習(xí)者學(xué)習(xí)過程中的測評性數(shù)據(jù)和特定的數(shù)學(xué)模型,隨時(shí)間的推移對學(xué)習(xí)者的知識掌握狀態(tài)進(jìn)行動(dòng)態(tài)估計(jì),同時(shí)可以對學(xué)習(xí)者的答題表現(xiàn)進(jìn)行預(yù)測。
1.3 分類
1) 基于貝葉斯的方法
貝葉斯知識追蹤模型(Bayesian Knowledge Trac?ing,BKT) 將學(xué)生的學(xué)習(xí)過程看作隱馬爾可夫過程,將學(xué)生的知識狀態(tài)表示為一組二元變量,變量取值為1 或0,分別表示學(xué)生對知識點(diǎn)的掌握與否,將學(xué)生的歷史答題情況作為觀測變量,使用貝葉斯概率公式計(jì)算在當(dāng)前觀測變量下學(xué)生的知識掌握概率。但BEUsN0y6ewVXXLYx0yrXpg==BKT模型并沒有考慮到真實(shí)學(xué)習(xí)環(huán)境中的復(fù)雜場景,如某些習(xí)題的知識狀態(tài)不能簡單地表示為二元變量、各知識點(diǎn)存在一定的關(guān)聯(lián)關(guān)系,并非相互獨(dú)立、學(xué)生在學(xué)習(xí)過程中必然會存在遺忘行為,針對這些不足,后續(xù)出現(xiàn)了對BKT的改進(jìn)模型[4-6]。
2) 基于邏輯回歸的方法
邏輯回歸是一種基于邏輯函數(shù)的預(yù)測模型,該函數(shù)輸出在[0,1]之間取值,通常用于分類任務(wù)的建模。21世紀(jì)初,研究者們提出將邏輯回歸模型用于知識追蹤任務(wù),以學(xué)生正確作答習(xí)題的概率為因變量,將學(xué)習(xí)者的能力、知識點(diǎn)難度、學(xué)習(xí)率、學(xué)習(xí)行為等因素作為參數(shù)建立邏輯回歸模型來進(jìn)行答題預(yù)測?;谶壿嫽貧w的知識追蹤模型采用項(xiàng)目反應(yīng)理論或因子分析方法[7-9],并充分利用邏輯函數(shù)易于實(shí)現(xiàn)、計(jì)算復(fù)雜度低等優(yōu)點(diǎn),將知識追蹤問題轉(zhuǎn)化為邏輯回歸中的分類問題,在模型預(yù)測準(zhǔn)確性上基本優(yōu)于基于貝葉斯的知識追蹤模型。
3) 基于深度學(xué)習(xí)的方法
深度學(xué)習(xí)是一種新興的人工智能方法,近年來在計(jì)算機(jī)視覺、語音處理、自然語言處理等領(lǐng)域中發(fā)揮著重要作用,也被逐漸應(yīng)用于知識追蹤任務(wù)。Piech 等于2015年首次將深度學(xué)習(xí)引入知識追蹤領(lǐng)域,提出深度知識追蹤(Deep Knowledge Tracing,DKT) 模型,使用循環(huán)神經(jīng)網(wǎng)絡(luò)建模學(xué)生作答交互序列的時(shí)序關(guān)系,獲得知識狀態(tài)的高維連續(xù)表征并預(yù)測學(xué)生的未來表現(xiàn)[10]。有研究者將DKT應(yīng)用于開放式的學(xué)習(xí)環(huán)境中,如編程練習(xí)[11]、發(fā)現(xiàn)知識點(diǎn)間拓?fù)漤樞騕12]、生成試卷[13]等。
后續(xù)又出現(xiàn)了DKT的擴(kuò)展模型,如增強(qiáng)的深度知識追蹤模型DKT+[14]、基于動(dòng)態(tài)學(xué)生分類的深度知識追蹤模型DKT-DSC[15]等。DKT模型取得廣泛關(guān)注后,其他基于記憶網(wǎng)絡(luò)[16-17]、注意力機(jī)制[18-19]和圖神經(jīng)網(wǎng)絡(luò)[20-21]的深度學(xué)習(xí)方法被研究者陸續(xù)應(yīng)用于KT 任務(wù)中。
綜合對比這三類方法:1) 從模型輸出結(jié)果的精細(xì)化程度來看,由于隱馬爾可夫模型本身隱狀態(tài)的限制,貝葉斯知識追蹤模型的建模結(jié)果只有掌握或未掌握兩種離散值,并不能獲得表示學(xué)生知識點(diǎn)掌握程度的連續(xù)值?;谏疃葘W(xué)習(xí)的知識追蹤模型可以通過權(quán)重參數(shù)得到學(xué)習(xí)者對知識點(diǎn)的掌握概率,其范圍為0~1之間的連續(xù)值[22]。2) 從建模能力來看,基于貝葉斯和邏輯回歸的方法一般基于單一或少量知識點(diǎn)進(jìn)行建模,難以捕獲習(xí)題序列中的長期依賴關(guān)系,而基于深度學(xué)習(xí)的知識追蹤模型具備強(qiáng)大的特征提取與表征能力,可以較好地建模多知識點(diǎn)和大規(guī)模學(xué)習(xí)者的作答序列信息。3) 從模型的應(yīng)用范圍來看,由于基于貝葉斯的知識追蹤模型簡單、可解釋性強(qiáng),已被廣泛應(yīng)用到各類智能導(dǎo)學(xué)系統(tǒng)中。而基于深度學(xué)習(xí)的方法雖然尚未廣泛應(yīng)用,但已成為當(dāng)前的研究熱點(diǎn),具有良好的應(yīng)用前景。
2 深度知識追蹤技術(shù)的實(shí)驗(yàn)過程與結(jié)果分析
由于基于深度學(xué)習(xí)的知識追蹤方法建模能力較好,輸出的預(yù)測結(jié)果更為精細(xì)化,也更契合大規(guī)模在線教學(xué)的應(yīng)用場景,因此,使用基于深度學(xué)習(xí)的知識追蹤模型在四門在線課程上開展實(shí)驗(yàn),對學(xué)生個(gè)體知識狀態(tài)變化過程和學(xué)生群體知識狀態(tài)分布進(jìn)行可視化分析。
2.1 數(shù)據(jù)說明
本研究選擇臨床中醫(yī)藥應(yīng)用、抗美援朝精神、從創(chuàng)新思維到創(chuàng)業(yè)實(shí)踐、計(jì)算機(jī)應(yīng)用基礎(chǔ)四門課程作為實(shí)驗(yàn)數(shù)據(jù),前三門課程來自開源數(shù)據(jù)集MoocCubeX[23],記錄了2020年下半年的學(xué)生作答數(shù)據(jù)。計(jì)算機(jī)應(yīng)用基礎(chǔ)課程來自某開放大學(xué)教學(xué)平臺,采集了某個(gè)分部2022年春季學(xué)期的學(xué)生、習(xí)題和作答行為數(shù)據(jù)。由于在線教學(xué)平臺的實(shí)際業(yè)務(wù)中并不存在知識點(diǎn)標(biāo)注、習(xí)題綁定知識點(diǎn)的功能,無法得知這四門課程中的習(xí)題與知識點(diǎn)的關(guān)聯(lián)關(guān)系,只能依賴教師人工標(biāo)注出知識點(diǎn)的層級結(jié)構(gòu),但習(xí)題與多層級知識點(diǎn)的關(guān)聯(lián)關(guān)系十分稀疏,因而本研究使用習(xí)題對應(yīng)的課程章節(jié)信息(可粗略認(rèn)為是一級知識點(diǎn))代替知識點(diǎn)信息,探究學(xué)生在章節(jié)上的掌握情況。
表1顯示了每門課程相關(guān)信息的統(tǒng)計(jì)情況,可以發(fā)現(xiàn)這四門課程中平均每個(gè)學(xué)生作答的習(xí)題數(shù)量和平均每道習(xí)題作答的學(xué)生數(shù)量均比較高(均占總習(xí)題和總學(xué)生數(shù)量的75%以上),說明學(xué)生的歷史作答交互序列質(zhì)量較高,可以作為實(shí)驗(yàn)對象。所有課程的習(xí)題作答交互數(shù)據(jù)按照8:1:1的比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集、測試集。
2.2 實(shí)驗(yàn)過程
1) 數(shù)據(jù)預(yù)處理
圖2是數(shù)據(jù)經(jīng)過預(yù)處理后的一個(gè)樣例,包含用戶ID、習(xí)題ID、每道習(xí)題對應(yīng)的知識點(diǎn)ID、學(xué)生對每道習(xí)題的作答是否正確以及作答序列長度。這些數(shù)據(jù)經(jīng)向量化處理后作為模型的輸入。
2) 知識追蹤方法說明
本研究利用五個(gè)基于深度學(xué)習(xí)的知識追蹤模型在四門課程上進(jìn)行實(shí)驗(yàn),分別是深度知識追蹤DKT[15]、增強(qiáng)的深度知識追蹤DKT+[24]、動(dòng)態(tài)鍵值對記憶網(wǎng)絡(luò)DKVMN[26]、自注意力知識追蹤SAKT[29]和上下文感知的注意力知識追蹤AKT[30]。這五個(gè)模型均為經(jīng)典的深度知識追蹤模型,本研究使用PyTorch對模型進(jìn)行了實(shí)現(xiàn),模型結(jié)構(gòu)不在本文中詳細(xì)展開。
DKT:使用循環(huán)神經(jīng)網(wǎng)絡(luò)對學(xué)生的習(xí)題作答記錄進(jìn)行建模,追蹤學(xué)生知識點(diǎn)掌握程度隨時(shí)間的變化過程,是首次將深度學(xué)習(xí)引入知識追蹤領(lǐng)域的模型。
DKT+:為改善DKT模型中輸入序列的重構(gòu)問題和預(yù)測結(jié)果的波動(dòng)性問題,提出增加正則項(xiàng)的方法,得到增強(qiáng)的DKT模型。
DKVMN:借鑒記憶增強(qiáng)的神經(jīng)網(wǎng)絡(luò)MANN方法,用一個(gè)靜態(tài)矩陣和一個(gè)動(dòng)態(tài)矩陣分別存儲知識點(diǎn)信息和知識點(diǎn)狀態(tài)信息,通過讀寫機(jī)制追蹤學(xué)生知識狀態(tài)的更新過程。
SAKT:利用注意力機(jī)制從學(xué)生的習(xí)題作答記錄中提取與當(dāng)前知識點(diǎn)相關(guān)的信息,是第一個(gè)基于自注意力機(jī)制的知識追蹤模型。
AKT:使用兩個(gè)基于單調(diào)注意力機(jī)制的編碼器來學(xué)習(xí)習(xí)題和回答的上下文感知表征,并使用認(rèn)知和心理測量理論中的Rasch模型來規(guī)范知識點(diǎn)和習(xí)題的表示,能夠在不引入過多參數(shù)基礎(chǔ)上捕捉同一知識點(diǎn)的習(xí)題之間的個(gè)體差異。
2.3 實(shí)驗(yàn)結(jié)果
為了評估基于深度學(xué)習(xí)的知識追蹤模型在四門課程上的表現(xiàn),大多數(shù)知識跟蹤模型研究工作均采用受試者工作特征ROC(Receiver Operating Characteris?tic) 曲線下與坐標(biāo)軸圍成的面積AUC(Area UnderCurve) 和準(zhǔn)確率ACC(Accuracy) 來評價(jià)模型的表現(xiàn),本研究遵循這一做法。AUC是衡量二分類模型優(yōu)劣的一種評價(jià)指標(biāo),表示正例位于負(fù)例之前的概率,能夠很好地描述模型整體性能的高低,ACC是模型預(yù)測正確分類的樣本數(shù)占樣本總數(shù)的比例。模型的性能與AUC和ACC的值成正比關(guān)系,取值越大表示模型預(yù)測性能越好。
表2 顯示了各知識追蹤模型在四門課程上的AUC、ACC結(jié)果,通過對比可以看出,AKT模型在所有課程上的AUC和ACC值都是最高的,尤其在數(shù)據(jù)規(guī)模較大的臨床中醫(yī)藥應(yīng)用課程中也能保持良好的效果。這得益于三個(gè)原因,這三個(gè)原因來源于認(rèn)知科學(xué)和心理測量學(xué)的經(jīng)典理論。一是認(rèn)為學(xué)習(xí)者在回答問題時(shí)理解和學(xué)習(xí)的方式取決于學(xué)習(xí)者,即對于兩個(gè)具有不同過去歷史記錄的學(xué)習(xí)者來說,他們理解同一問題的方式以及從實(shí)踐中獲得的知識可能不同?;谶@一觀點(diǎn),引入單調(diào)注意力機(jī)制對習(xí)題和回答進(jìn)行表示,將學(xué)習(xí)者未來對習(xí)題的回答與他們過去的回答聯(lián)系起來,能夠捕獲學(xué)習(xí)者上下文感知的知識狀態(tài)。二是認(rèn)為學(xué)習(xí)過程是時(shí)序的,伴隨著記憶力的衰減,不相關(guān)知識點(diǎn)的作答和太久之前的作答與當(dāng)前習(xí)題的作答相關(guān)性比較低。因而在計(jì)算單調(diào)注意力的權(quán)重時(shí)加入乘法指數(shù)衰減項(xiàng),使得當(dāng)前習(xí)題和過去習(xí)題的注意力權(quán)重不僅取決于兩者之間的相似性,還取決于它們之間的相對時(shí)間步數(shù)。三是認(rèn)為涵蓋相同知識點(diǎn)的習(xí)題密切相關(guān),但具有不容忽視的重要個(gè)體差異。因此使用心理測量學(xué)中經(jīng)典的Rasch模型構(gòu)建知識點(diǎn)和習(xí)題的表示,通過習(xí)題難度和學(xué)習(xí)者的能力來建模學(xué)習(xí)者正確作答習(xí)題的概率。
2.4 可視化分析
鑒于AKT模型在上述四門課程中均表現(xiàn)最佳,本研究對AKT模型的相關(guān)輸出結(jié)果進(jìn)行可視化分析。
1) 學(xué)生個(gè)體的知識狀態(tài)追蹤
選擇計(jì)算機(jī)應(yīng)用基礎(chǔ)課程中某位學(xué)生的所有答題預(yù)測結(jié)果,將其對知識點(diǎn)掌握程度的變化過程進(jìn)行可視化,結(jié)果如圖3所示。用不同圖案/顏色表示不同的知識點(diǎn),圓點(diǎn)的大小表示預(yù)測答題正確的概率大小,圓點(diǎn)越大,表示預(yù)測正確的概率越大。從圖中可以發(fā)現(xiàn),知識點(diǎn)1、3、7對應(yīng)的圓點(diǎn)沒有變化,且圓點(diǎn)較大,說明該學(xué)生對相應(yīng)知識點(diǎn)的掌握情況較好。知識點(diǎn)2、4、5對應(yīng)的圓點(diǎn)開始時(shí)較大,中間變小,最后又恢復(fù)開始時(shí)較大的狀態(tài),說明該學(xué)生開始對相應(yīng)知識點(diǎn)的掌握情況較好,考慮中途學(xué)習(xí)的遺忘因素,學(xué)生知識水平降低,但后續(xù)隨著持續(xù)練習(xí)又恢復(fù)了最初的水平。知識點(diǎn)6對應(yīng)的圓點(diǎn)開始時(shí)較小,后續(xù)圓點(diǎn)變大并保持較大的狀態(tài),表明該學(xué)生開始未掌握知識點(diǎn)6,隨著練習(xí)的不斷加強(qiáng)逐步掌握了知識點(diǎn)6。
2) 學(xué)生群體的知識狀態(tài)分布
選擇從創(chuàng)新思維到創(chuàng)業(yè)實(shí)踐課程的測試集(共包含430名學(xué)生),將這些學(xué)生的歷史習(xí)題作答交互序列作為AKT模型的輸入,模型的輸出結(jié)果是一個(gè)概率值,可以判斷這些學(xué)生對于相關(guān)知識點(diǎn)的掌握水平。本研究根據(jù)輸出概率值的取值范圍將知識點(diǎn)掌握水平劃分為三個(gè)檔次,概率值大于等于0.9代表優(yōu)秀掌握知識點(diǎn),概率值在區(qū)間[0.5,0.9) 內(nèi)代表良好掌握知識點(diǎn),概率值小于0.5代表不合格,未能掌握知識點(diǎn)。
針對該課程12個(gè)不同的知識點(diǎn),分別計(jì)算學(xué)生的優(yōu)秀率、良好率和不合格率,以此表示學(xué)生對各知識點(diǎn)的整體掌握情況,結(jié)果如圖4所示。從圖中可以看出,學(xué)生在所有知識點(diǎn)上的優(yōu)秀率均達(dá)到了70%以上,且不合格率均低于10%,說明在此課程中學(xué)生對各知識點(diǎn)的整體掌握情況很好,學(xué)生整體的學(xué)習(xí)效果十分明顯。綜合對比各知識點(diǎn),學(xué)生在知識點(diǎn)1、4、5、7、10、11上的優(yōu)秀率達(dá)到了90%以上,且不合格率均在5%以下,說明學(xué)生對這6個(gè)知識點(diǎn)的掌握程度很好。學(xué)生在知識點(diǎn)3、6、9、12上的優(yōu)秀率達(dá)到了80% 以上,但相比于知識點(diǎn)3和9,學(xué)生在知識點(diǎn)6和12上的不合格率超過了5%,說明學(xué)生對這兩個(gè)知識點(diǎn)的掌握程度出現(xiàn)了一定程度的分化,雖然學(xué)生的優(yōu)秀率較高,但不合格率也較高,存在學(xué)生群體掌握情況不均衡的現(xiàn)象。此外,與其他知識點(diǎn)相比,知識點(diǎn)2和知識點(diǎn)8上的優(yōu)秀率未達(dá)到80%,但知識點(diǎn)8的良好率低于知識點(diǎn)2,不合格率高于知識點(diǎn)2,學(xué)生在知識點(diǎn)8上的優(yōu)秀率低而不合格率高,因而學(xué)生對知識點(diǎn)8 的整體掌握程度是最差的。
3 在線課程中知識追蹤技術(shù)的應(yīng)用場景
基于上述實(shí)驗(yàn)過程中的可視化分析結(jié)果,本研究總結(jié)出知識追蹤技術(shù)在大規(guī)模在線教學(xué)場景中實(shí)踐應(yīng)用的整個(gè)閉環(huán)流程,如圖5所示。以知識追蹤技術(shù)為實(shí)踐路徑,智能分析學(xué)生個(gè)體的知識狀態(tài)變化過程和學(xué)生群體的知識狀態(tài)分布,進(jìn)而將建模結(jié)果應(yīng)用于學(xué)情診斷報(bào)告、學(xué)習(xí)資源推薦、學(xué)習(xí)路徑規(guī)劃、學(xué)習(xí)者畫像等個(gè)性化教學(xué)支持服務(wù)中,學(xué)生能夠及時(shí)發(fā)現(xiàn)自己學(xué)習(xí)過程中的薄弱環(huán)節(jié),從而查漏補(bǔ)缺,促進(jìn)個(gè)性化學(xué)習(xí),教師可以根據(jù)學(xué)生的薄弱環(huán)節(jié)因材施教,給予學(xué)生個(gè)性化的學(xué)習(xí)指導(dǎo)。
1) 學(xué)情診斷報(bào)告。基于深度學(xué)習(xí)的知識追蹤模型能夠輸出每個(gè)學(xué)生對不同知識點(diǎn)的掌握程度,利用這一結(jié)果生成學(xué)情診斷報(bào)告,教師可以對整體的教學(xué)效果有所把握,從而及時(shí)調(diào)整教學(xué)策略,提供針對當(dāng)前學(xué)習(xí)者群體的教學(xué)輔導(dǎo)。一方面,教師可以發(fā)現(xiàn)并關(guān)注知識掌握水平薄弱的學(xué)生,為他們提供個(gè)性化的學(xué)習(xí)輔導(dǎo);另一方面,教師可以從知識點(diǎn)層面及時(shí)調(diào)整教學(xué)方案,對于學(xué)生總體掌握較差的知識點(diǎn),教師可以有針對性地加強(qiáng)對相關(guān)章節(jié)的講解或答疑,復(fù)習(xí)鞏固該知識點(diǎn),幫助學(xué)生進(jìn)一步提高對相關(guān)知識點(diǎn)的熟練程度。
2) 學(xué)習(xí)資源推薦。根據(jù)學(xué)生的知識狀態(tài),為其自動(dòng)推薦相匹配的學(xué)習(xí)資源,能夠輔助學(xué)生提高學(xué)習(xí)效率,提高學(xué)習(xí)水平。在線教學(xué)平臺中包含多種類型的課件、習(xí)題等學(xué)習(xí)資源,將知識點(diǎn)與這些資源進(jìn)行關(guān)聯(lián)綁定,針對學(xué)生掌握程度低的知識點(diǎn),可以向其自動(dòng)推薦對應(yīng)的課件,對薄弱知識點(diǎn)加強(qiáng)學(xué)習(xí)鞏固。此外,根據(jù)學(xué)生知識狀態(tài)的不同,可以結(jié)合習(xí)題難度設(shè)置推薦策略,向?qū)W生自動(dòng)推薦合適的習(xí)題。對于學(xué)生掌握程度很低的知識點(diǎn),練習(xí)的目的是基礎(chǔ)提升,可以先推薦難度較低的習(xí)題,幫助學(xué)生先逐步掌握該知識點(diǎn)。隨著學(xué)生知識狀態(tài)水平的提升,逐步推薦難度更高的習(xí)題。而對于掌握程度較高的知識點(diǎn),練習(xí)的目的則是加強(qiáng)鞏固,避免因遺忘導(dǎo)致知識狀態(tài)水平下降,因此需要推薦難度較大的習(xí)題。
3) 學(xué)習(xí)路徑規(guī)劃。根據(jù)學(xué)生的知識狀態(tài),為其自動(dòng)規(guī)劃出最優(yōu)或較優(yōu)的學(xué)習(xí)單元序列(如學(xué)習(xí)資源、學(xué)習(xí)活動(dòng)、知識點(diǎn)等),構(gòu)成個(gè)性化的學(xué)習(xí)路徑。這一過程依賴知識圖譜技術(shù),需要確定知識點(diǎn)的屬性特征及各知識點(diǎn)之間的上下位、前序后繼關(guān)系,并綁定學(xué)習(xí)單元與知識點(diǎn)的包含關(guān)系。學(xué)習(xí)路徑的規(guī)劃可分為知識點(diǎn)路徑生成和學(xué)習(xí)單元路徑生成兩個(gè)階段,首先基于學(xué)習(xí)者對知識點(diǎn)的掌握程度得到待排序的知識點(diǎn)集合,再利用知識點(diǎn)之間的網(wǎng)絡(luò)結(jié)構(gòu)生成知識點(diǎn)路徑,以保證學(xué)習(xí)路徑滿足知識點(diǎn)之間的內(nèi)在邏輯。在此基礎(chǔ)上,根據(jù)學(xué)習(xí)單元與知識點(diǎn)之間的包含關(guān)系得到待排序的學(xué)習(xí)單元集合,并結(jié)合學(xué)習(xí)單元的內(nèi)部屬性信息對其排序,形成學(xué)習(xí)單元路徑,這樣使得學(xué)習(xí)路徑既滿足知識點(diǎn)間的依賴關(guān)系又符合學(xué)習(xí)活動(dòng)與學(xué)習(xí)資源間的對應(yīng)關(guān)系。
4) 學(xué)習(xí)者畫像?;趯W(xué)習(xí)者的基本屬性信息和學(xué)習(xí)行為數(shù)據(jù)來挖掘不同學(xué)習(xí)者的特點(diǎn),從不同維度刻畫學(xué)習(xí)者特征,構(gòu)建學(xué)習(xí)者畫像,以識別不同類型的學(xué)習(xí)者。知識追蹤模型根據(jù)學(xué)習(xí)者與習(xí)題產(chǎn)生的歷史作答記錄,診斷出學(xué)習(xí)者的知識點(diǎn)掌握程度,這一結(jié)果可以作為學(xué)習(xí)者畫像中知識水平維度的一個(gè)輸入,輔助構(gòu)建學(xué)習(xí)者畫像。
4 總結(jié)與展望
本研究以如何在大規(guī)模在線課程中利用知識追蹤技術(shù)輔助個(gè)性化學(xué)習(xí)為研究目標(biāo),通過采集、處理學(xué)生在線學(xué)習(xí)過程中產(chǎn)生的真實(shí)作答交互數(shù)據(jù),對基于深度學(xué)習(xí)的知識追蹤方法進(jìn)行了技術(shù)實(shí)現(xiàn),并對實(shí)驗(yàn)結(jié)果進(jìn)行了可視化分析。最后總結(jié)出結(jié)出在線課程中知識追蹤技術(shù)的應(yīng)用場景。根據(jù)技術(shù)實(shí)現(xiàn)和結(jié)果分析過程中的問題與不足,并結(jié)合當(dāng)前智能技術(shù)的發(fā)展趨勢,對知識追蹤技術(shù)在大規(guī)模在線課程中的應(yīng)用提出如下建議:
1) 在線教學(xué)平臺需進(jìn)行充分的數(shù)據(jù)埋點(diǎn),以采集多種類型的數(shù)據(jù),滿足知識追蹤技術(shù)應(yīng)用的需要。對教育教學(xué)過程中產(chǎn)生的真實(shí)數(shù)據(jù)進(jìn)行廣泛采集、深入挖掘、智能分析,實(shí)現(xiàn)對學(xué)習(xí)者知識水平的過程性、動(dòng)態(tài)性診斷。
2) 增強(qiáng)模型可解釋性方面的研究?;谏疃葘W(xué)習(xí)的知識追蹤方法使用大量學(xué)生作答交互數(shù)據(jù),設(shè)計(jì)一系列權(quán)重參數(shù),這些權(quán)重參數(shù)不符合人的認(rèn)知規(guī)律,模型內(nèi)部為黑盒,無法得到具體影響學(xué)習(xí)知識狀態(tài)水平的因素,也就無法給出具體而合理的建議。這是深度學(xué)習(xí)模型應(yīng)用的一個(gè)重要研究難題。
3) 綜合利用知識圖譜、生成式人工智能等技術(shù),打造人機(jī)協(xié)同的在線測評模式,構(gòu)建個(gè)性化學(xué)習(xí)應(yīng)用。利用生成式人工智能技術(shù)自動(dòng)生成題目,經(jīng)教師人工審核后加入題庫。學(xué)生剛開始練習(xí)時(shí)先隨機(jī)抽取題目,在練習(xí)過程中利用知識追蹤技術(shù)動(dòng)態(tài)診斷學(xué)生的知識狀態(tài),根據(jù)診斷結(jié)果自動(dòng)推薦合適的習(xí)題、知識點(diǎn)和學(xué)習(xí)資源,并提供學(xué)習(xí)路徑規(guī)劃、學(xué)習(xí)者畫像等個(gè)性化學(xué)習(xí)服務(wù)。