章 蕊 田菊艷 田詩揚 盧政旭
(重慶工程學(xué)院 重慶 400056)
在線學(xué)習系統(tǒng)的歷史可以追溯到20世紀80年代,近年來隨著計算機輔助技術(shù)和人工智能的發(fā)展,在線學(xué)習系統(tǒng)也得到了廣泛的發(fā)展,如大規(guī)模在線開放課程(MOOC)平臺和在線法官(OJ)系統(tǒng)。一般來說,這些平臺為學(xué)生提供了豐富的學(xué)習資源(如課程、練習、講座),為學(xué)生提供了一個開放的環(huán)境,讓他們能夠獨立學(xué)習和實踐知識。雖然自主性和便捷性的優(yōu)勢確實吸引了大量的學(xué)生,但研究人員仍然發(fā)現(xiàn),學(xué)生在實踐中容易失去學(xué)習興趣,存在較高的輟學(xué)率問題。針對這一問題,有效的解決方案是在在線學(xué)習系統(tǒng)中提供個性化服務(wù),以改善學(xué)生的學(xué)習體驗。幸運的是,隨著如今深度學(xué)習的發(fā)展,研究人員在這個教育問題上有了更多面向數(shù)據(jù)的解決方案。
其中,關(guān)鍵任務(wù)之一是知識熟練度診斷,目的是發(fā)現(xiàn)學(xué)生對每個知識概念的潛在掌握程度。知識水平診斷的任務(wù)是:通過學(xué)生的歷史練習記錄,分析他們對每個概念(即函數(shù)和不等式)的掌握程度。事實上,由于這些診斷結(jié)果有益于許多應(yīng)用,如有針對性的知識培訓(xùn)和個性化的鍛煉推薦,教育心理學(xué)和數(shù)據(jù)挖掘領(lǐng)域都在致力于這個問題:在教育心理學(xué)中,認知診斷模型通常用潛在特征值或二元技能掌握向量來表征每個學(xué)生的知識熟練程度。相比之下,矩陣分解技術(shù)將診斷任務(wù)視為分數(shù)預(yù)測的數(shù)據(jù)挖掘問題,在學(xué)生的潛在空間中投射出其隱含的知識狀態(tài)??傊@兩種類型的研究直接利用學(xué)生的鍛煉記錄進行診斷。然而,大多數(shù)學(xué)生在學(xué)習過程中忽略了一些重要的因素。
一般來說,假設(shè)在一個學(xué)習系統(tǒng)中有學(xué)生、練習題和知識的概念,學(xué)生在不同的時間做練習,記錄為練習日志。具體來說,我們可以將練習日志表示為一個分數(shù)張量。如果學(xué)生在某個時間做了練習,則該張量表示學(xué)生在練習上的成績。此外,我們還得到教育專家標注后的知識點數(shù)據(jù),它可以表示為一個知識張量。如果練習題與知識概念相關(guān),那么在我們的場景中,分數(shù)張量和知識張量就會產(chǎn)生練習。這里需要說明,在不同的時間,大多數(shù)學(xué)生只做一次相同的練習,因為一般情況下,他們通常會選擇不同的練習來學(xué)習特定的知識概念。例如,假設(shè)一個學(xué)生試圖學(xué)習概念Function,他將首先練習相關(guān)的習題,并檢查自己是否正確。如果他發(fā)現(xiàn)答案是錯的,他會繼續(xù)練習,但他就不會做同樣的習題了,因為他已經(jīng)知道答案了。因此,很自然地,他會用同樣知識點的練習題去繼續(xù)練習和學(xué)習?;谶@個原因,我們可以猜測學(xué)生通過在不同的時間做不同的練習來學(xué)習概念。
在給定分數(shù)張量和知識張量的情況下,我們的目標為:(1)跟蹤每個學(xué)生的知識熟練程度的變化,并診斷從第1次到第T次的知識點的掌握程度。(2)預(yù)測在T+1次考試中的知識點掌握水平和具體的練習成績。
具體來說,我們首先基于學(xué)生的練習記錄和對應(yīng)知識點,提出了一個基本的知識熟練度追蹤模型。該模型首先利用知識張量先驗將每個學(xué)生的熟練度向量投射到一個知識空間中,然后結(jié)合學(xué)習曲線理論和遺忘曲線理論來跟蹤學(xué)生的知識熟練度。此外,我們提出了一個改進的練習相關(guān)知識熟練度追蹤模型,并將練習的連通性納入其中。提高預(yù)測性能。然后,我們可以得到不同時間的學(xué)生熟練度向量U和練習知識向量V。其公式如下。
現(xiàn)在,我們指定如何模擬學(xué)生潛在熟練度的演化。在每個學(xué)生的動態(tài)學(xué)習過程中,有兩種被廣泛接受的教育心理學(xué)理論可以指導(dǎo)我們在建模過程中使用。(1)學(xué)習曲線[2]描述了學(xué)生所學(xué)的知識可以通過幾個練習軌跡來增強;(2)遺忘曲線[3]假設(shè)學(xué)生對所學(xué)知識的記憶會越來越少,他們對知識概念的熟練程度會隨著時間的推移而逐漸下降。結(jié)合這兩種理論作為先驗,我們假設(shè)某一學(xué)生目前的知識熟練程度主要受兩個潛在原因的影響:學(xué)生做的練習越多,對相關(guān)知識的熟練程度越高;時間流逝得越久,他忘記的知識就越多。在形式上,我們模擬了每個學(xué)生在不同時間里的知識熟練程度的兩種效應(yīng),如圖1所示。
圖1:模型圖
在上述模型中,我們已經(jīng)結(jié)合了教育學(xué)習理論(即學(xué)習曲線和遺忘曲線)來跟蹤每個學(xué)生的知識熟練程度。將學(xué)生呈現(xiàn)為顯式熟練度向量,其中每個元素反映了學(xué)生對相關(guān)知識概念(如函數(shù))的了解程度,保證了診斷結(jié)果的可解釋性。然而,在現(xiàn)實世界中,與巨大的練習空間相比,學(xué)生練習的練習可能很少。因此,如果某一學(xué)生每次只進行少量的練習,模型很難跟蹤其知識熟練程度,并預(yù)測其表現(xiàn)得分。因此,為了緩解這一問題并提高我們的模型的預(yù)測性能,我們進一步考慮了練習之間的連通性關(guān)系。如圖1所示,每個練習的張量都與一些基礎(chǔ)的知識點張量相練習,學(xué)生在這些以知識為基礎(chǔ)的練習上可能得到一致的分數(shù)。我們擴展了當前的模型,并通過將這種連通性屬性納入我們的概率模型,提出了一個新穎的與練習相關(guān)的知識熟練度模型。