中圖分類號(hào):TP391
近年來,互聯(lián)網(wǎng)信息技術(shù)的發(fā)展與普及帶來了重大社會(huì)變革,標(biāo)志著全球化、信息社會(huì)和知識(shí)時(shí)代的到來。這促使各行各業(yè)與互聯(lián)網(wǎng)技術(shù)結(jié)合發(fā)展,其中之一便是教育行業(yè),越來越多的學(xué)習(xí)資料在互聯(lián)網(wǎng)上公開,使得學(xué)生可以更加容易地獲取到自身所需的學(xué)習(xí)資料。與此同時(shí),結(jié)合教育的推薦算法也適時(shí)出現(xiàn)1,它能幫助學(xué)生從海量的學(xué)習(xí)資料中獲取自身所需內(nèi)容[2-4]。雖然這些推薦算法能夠根據(jù)每個(gè)用戶的興趣和偏好提供多種選擇[5],其針對(duì)的是學(xué)習(xí)方向與學(xué)習(xí)內(nèi)容的個(gè)性化,而不能個(gè)性化地指導(dǎo)學(xué)生怎么學(xué),也沒能幫助學(xué)生如何更快更有效地掌握學(xué)習(xí)內(nèi)容。
間隔重復(fù)學(xué)習(xí)方法是一種指導(dǎo)學(xué)生怎么學(xué)的方法,最初由艾賓浩斯(Ebbinghaus)提出[6]。它是基于間隔效應(yīng)和滯后效應(yīng)的學(xué)習(xí)方法,以提高記憶和理解。間隔效應(yīng)是指人們使用間隔重復(fù)練習(xí)有效鍛煉記憶;滯后效應(yīng)指的是人們逐漸增加練習(xí)之間的間隔時(shí)間得到更好的學(xué)習(xí)效果[7]。間隔效應(yīng)和滯后效
文獻(xiàn)標(biāo)志碼:A
應(yīng)的影響已經(jīng)在各方面研究中體現(xiàn)出來,如語言學(xué)習(xí)[8-9]、體育技能鍛煉等[10]。
在艾賓浩斯的間隔重復(fù)學(xué)習(xí)算法中,間隔是固定的;在皮姆斯勒(Pimsleur)所提出的學(xué)習(xí)方法[11]中,其間隔是以指數(shù)增加的;萊特納(Leitner)的間隔重復(fù)算法[12]中,時(shí)間間隔是遞增的:?jiǎn)卧~學(xué)習(xí)起始時(shí)位于第一個(gè)時(shí)間間隔,當(dāng)學(xué)生在規(guī)定時(shí)間間隔后能回憶起該單詞,那么它將被升級(jí)到更高時(shí)間間隔,反之則降低。近年來一些新的間隔重復(fù)學(xué)習(xí)算法被提出,如GRU-HLR[13],其使用具有馬爾科夫特性的記憶模型,將區(qū)間重復(fù)優(yōu)化問題轉(zhuǎn)化為隨機(jī)最短路徑問題,并采用值迭代法求解;還有DRL-SRS[14],其使用深度強(qiáng)化學(xué)習(xí)模型,通過循環(huán)方式訓(xùn)練策略來優(yōu)化間隔重復(fù)策略。
至今為止,間隔重復(fù)學(xué)習(xí)算法仍然面臨一些難以解決的問題,如間隔控制比較僵硬,無法動(dòng)態(tài)調(diào)整間隔,導(dǎo)致學(xué)習(xí)效率下降。若通過擬合數(shù)據(jù)集來調(diào)整學(xué)習(xí)間隔,則使得間隔重復(fù)學(xué)習(xí)算法脫離了遺忘曲線的理論基礎(chǔ)。因而,如何動(dòng)態(tài)調(diào)整學(xué)習(xí)間隔,成為了間隔重復(fù)學(xué)習(xí)算法亟待解決的問題。
ACT-R(Adaptive Control of Thought-Rational)是安德森(Anderson)在1976年提出的一種認(rèn)知架構(gòu)[15-16],已經(jīng)廣泛應(yīng)用于教育[17]、自動(dòng)駕駛[18-19]等領(lǐng)域。本文提出了一種基于ACT-R的認(rèn)知間隔重復(fù)學(xué)習(xí)方法。ACT-R旨在從過程層面對(duì)人類認(rèn)知進(jìn)行建模,并模擬人類通過大腦處理其環(huán)境信息的過程。該方法通過ACT-R體系結(jié)構(gòu)與激活機(jī)制模擬學(xué)習(xí)過程,并提取主導(dǎo)模型記憶變化的激活參數(shù);同時(shí)結(jié)合遺忘曲線,提出遺忘曲線切割算法,并提取記憶留存率與推薦復(fù)習(xí)間隔等參數(shù);結(jié)合二者的參數(shù),在保留可解釋性的基礎(chǔ)之上實(shí)現(xiàn)動(dòng)態(tài)地調(diào)整學(xué)習(xí)間隔,從而動(dòng)態(tài)地指導(dǎo)學(xué)生進(jìn)行自主學(xué)習(xí)。
1學(xué)習(xí)方法設(shè)計(jì)
結(jié)合ACT-R記憶機(jī)制與遺忘曲線切割機(jī)制,本文提出的認(rèn)知間隔重復(fù)學(xué)習(xí)方法分為3個(gè)部分:基于ACT-R的學(xué)習(xí)過程模擬、遺忘曲線切割算法和間隔重復(fù)學(xué)習(xí)規(guī)劃。
1.1基于ACT-R的學(xué)習(xí)過程模擬
基于ACT-R的學(xué)習(xí)過程模擬如算法1(表1)所示,總體分3個(gè)階段:準(zhǔn)備階段、學(xué)習(xí)階段和靜默階段。準(zhǔn)備階段:配置ACT-R運(yùn)行相關(guān)參數(shù),等待間隔重復(fù)學(xué)習(xí)規(guī)劃安排學(xué)習(xí)任務(wù),并在獲得此輪學(xué)習(xí)任務(wù);學(xué)習(xí)階段:ACT-R模擬學(xué)生學(xué)習(xí)知識(shí)點(diǎn)的完整流程,包括看到知識(shí)點(diǎn)、回憶內(nèi)容,加深印象或者進(jìn)行學(xué)習(xí),直到所有知識(shí)點(diǎn)學(xué)習(xí)完畢;靜默階段:ACT-R將學(xué)習(xí)階段激活參數(shù)的變化返回至間隔重復(fù)學(xué)習(xí)規(guī)劃,并等待間隔重復(fù)學(xué)習(xí)規(guī)劃安排,以模擬學(xué)生在完成一輪學(xué)習(xí)任務(wù)后的遺忘過程,等待新一輪學(xué)習(xí)任務(wù)安排。
在算法1中, ai 為知識(shí)點(diǎn)對(duì)象;本輪學(xué)習(xí)規(guī)劃 bi 是一個(gè)集合,包含多個(gè) ai ; n1 為本輪學(xué)習(xí)的新 ai 數(shù);n2 為本輪復(fù)習(xí) ai 數(shù)。Recognition( ai )方法為ACT-R使用視覺模塊辨識(shí)知識(shí)點(diǎn) ai ; Recall( ai )方法為ACT-R檢索陳述性模塊試圖回憶知識(shí)點(diǎn) ai :DeepenImpression( ai )方法為ACT-R在回憶成功后加深陳述性模塊對(duì)知識(shí)點(diǎn) ai 的印象; Leam(ai) 方法為 ACT-R在回憶失敗后陳述性模塊學(xué)習(xí)知識(shí)點(diǎn) ai :UpdateActivation( ai )為從陳述性模塊中獲取并更新知識(shí)點(diǎn) ai 的激活參數(shù)?;谏鲜隽鞒?,可知算法1的時(shí)間復(fù)雜度為 O(n1+n2 )。
每當(dāng)ACT-R模擬知識(shí)點(diǎn)學(xué)習(xí)時(shí),會(huì)創(chuàng)建或影響知識(shí)點(diǎn)對(duì)應(yīng)的記憶塊,其通過激活參數(shù)控制記憶塊模擬人類記憶情況;ACT-R的記憶內(nèi)容將以記憶塊(Chunk)的形式存儲(chǔ)在內(nèi)存中,與此同時(shí),對(duì)應(yīng)該塊會(huì)生成一個(gè)激活參數(shù),具體公式如下:
其中, Ai 為第 i 個(gè)記憶塊的激活參數(shù); n 是該記憶塊總共被調(diào)用的次數(shù); d 為基礎(chǔ)學(xué)習(xí)衰減參數(shù),ACT-R推薦值0.5; ?i 為第 i 個(gè)記憶塊的噪音參數(shù); tj 為第j 次調(diào)用時(shí)距離當(dāng)前計(jì)算激活參數(shù)時(shí)的時(shí)間差。
ACT-R使用冪函數(shù)來模擬記憶塊的遺忘曲線,且每一次對(duì)同一知識(shí)點(diǎn)的學(xué)習(xí)所產(chǎn)生的記憶都會(huì)生成一條遺忘曲線,而人類對(duì)該知識(shí)點(diǎn)的記憶程度則由學(xué)習(xí)該知識(shí)點(diǎn)產(chǎn)生的所有學(xué)習(xí)記憶去重加權(quán)計(jì)算。
1.2遺忘曲線切割算法
記憶遺忘曲線是由德國(guó)心理學(xué)家艾賓浩斯提出[20],基于此,研究人員提出了多種遺忘曲線[21]。在這些遺忘曲線公式中,受試者在第一次學(xué)習(xí)后進(jìn)行分組,進(jìn)而在規(guī)定時(shí)間對(duì)該知識(shí)進(jìn)行再次學(xué)習(xí),并記錄下兩次學(xué)習(xí)所耗費(fèi)時(shí)間,最終構(gòu)成了以時(shí)間點(diǎn)為橫坐標(biāo)、節(jié)約率為縱坐標(biāo)的遺忘曲線圖,然而這種遺忘曲線未考慮多次復(fù)習(xí)對(duì)學(xué)習(xí)記憶的影響。因此本文提出一種切割遺忘曲線算法,并基于該算法模擬多次學(xué)習(xí)一個(gè)知識(shí)點(diǎn)后的記憶情況,具體內(nèi)容為:首先,節(jié)約率反映知識(shí)點(diǎn)隨時(shí)間在大腦中的留存情況,因而本文將節(jié)約率作為該知識(shí)點(diǎn)的記憶留存率;記憶留存率越高,說明對(duì)該知識(shí)點(diǎn)掌握得越完整;且在完成知識(shí)點(diǎn)學(xué)習(xí)的那一刻,記憶留存率為 100% ,之后隨時(shí)間流逝而降低。其次,對(duì)一個(gè)知識(shí)點(diǎn)的復(fù)習(xí),反饋在該知識(shí)點(diǎn)對(duì)應(yīng)的遺忘曲線變化之中;遺忘曲線中的擬合參數(shù)反映了受試者一段時(shí)間內(nèi)的記憶狀態(tài),該參數(shù)的變化反映的是長(zhǎng)時(shí)間大腦機(jī)能的改變,而不會(huì)在短期內(nèi)因個(gè)別知識(shí)點(diǎn)而改變。因此,相對(duì)于調(diào)整遺忘曲線的參數(shù),本文提出當(dāng)大腦多次學(xué)習(xí)同一個(gè)知識(shí)點(diǎn)時(shí),會(huì)刺激該知識(shí)點(diǎn)對(duì)應(yīng)的記憶,從而切割部分記憶的急速遺忘階段,最終使得記憶長(zhǎng)久保持在較高留存率的狀態(tài)。具體公式如下:
Q(x)=Q(x-xi)+yi
其中, Q(x) 為記憶留存率; x 為計(jì)算留存率時(shí)刻距離上一次學(xué)習(xí)的時(shí)間差; i 為該知識(shí)點(diǎn)的復(fù)習(xí)次數(shù); xi 為切割區(qū)域偏移量,每次學(xué)習(xí)將會(huì)根據(jù)推薦復(fù)習(xí)間隔切割部分曲線; yi 修正公式偏移量,確保每次復(fù)習(xí)時(shí)記憶留存率為 100% 。隨著復(fù)習(xí)次數(shù)的增加,公式將切割越來越多的短期記憶區(qū)域,記憶留存率的下降速率逐漸由高降低。每次復(fù)習(xí)后切割的時(shí)間長(zhǎng)度參考遺忘曲線原始參數(shù),從 20min 起,直到最長(zhǎng)為30d的切割幅度,與此同時(shí)也對(duì)復(fù)習(xí)的間隔時(shí)間提出要求,每次復(fù)習(xí)的間隔時(shí)間要盡可能貼合切割幅度,具體切割幅度會(huì)因?yàn)閺?fù)習(xí)間隔時(shí)間的長(zhǎng)短做縮減,以此控制知識(shí)點(diǎn)學(xué)習(xí)的間隔幅度,具體細(xì)節(jié)如算法2(表2)所示。本文中計(jì)算的記憶留存率 Q(x) 均為自學(xué)習(xí)起時(shí)間滿30d后的記憶留存率,以保證記憶有充足的時(shí)間轉(zhuǎn)化為長(zhǎng)期記憶。
算法2為計(jì)算遺忘曲線參數(shù)的具體步驟,首先設(shè)定每次切割的初始時(shí)間長(zhǎng)度集合1,長(zhǎng)度間隔參考遺忘曲線實(shí)驗(yàn)間隔,即 20min,1h,9h,1d,2d,6d 最后的 30d 因缺乏調(diào)整靈活性,分為多個(gè)間隔為6d的時(shí)間長(zhǎng)度。 si 為推薦學(xué)習(xí)時(shí)間間隔, ti 為當(dāng)前學(xué)習(xí)次數(shù); xi 為偏移量, yi 初始值為0,隨著每一次學(xué)習(xí), xi 在基于之前的基礎(chǔ)上,結(jié)合推薦時(shí)間間隔 si 與真正時(shí)間間隔 x 計(jì)算新一輪 xi ,同時(shí)依照新的 xi 更新 yi ;最后計(jì)算知識(shí)點(diǎn) ai 的 Q(x) ,以及修正學(xué)習(xí)次數(shù) ti 和對(duì)應(yīng)的推薦學(xué)習(xí)時(shí)間間隔 si 。算法2的時(shí)間復(fù)雜度為 O(n1+n2) ,其中 n1 為本輪學(xué)習(xí)的新知識(shí)點(diǎn), n2 為本輪復(fù)習(xí)的知識(shí)點(diǎn)。
1.3 間隔重復(fù)學(xué)習(xí)規(guī)劃
間隔重復(fù)學(xué)習(xí)規(guī)劃如算法3(表3)所示。設(shè)定學(xué)習(xí)知識(shí)點(diǎn)總數(shù) N, 每輪學(xué)習(xí) n1 個(gè)新知識(shí)點(diǎn),復(fù)習(xí) n2 個(gè)已經(jīng)學(xué)習(xí)的知識(shí)點(diǎn)??傆?jì)學(xué)習(xí) N 個(gè)知識(shí)點(diǎn) {a1 a2,…,aN} ! ai={Q(x) , si , A(x) , ti , xi , yi} , i∈ {1,2,…,N} ,其中 A(x) 為知識(shí)點(diǎn) ai 的激活。將 N 個(gè)知識(shí)點(diǎn)劃分為3個(gè)集合 S0 , S1 , S2 ,其中 S0 包含未學(xué)習(xí)知識(shí)點(diǎn); S1 包含正在學(xué)習(xí)的知識(shí)點(diǎn); S2 包含完成學(xué)習(xí)的知識(shí)點(diǎn)。
在算法3中,每一輪學(xué)習(xí)會(huì)選擇 nl 個(gè)新知識(shí)點(diǎn)和 n2 個(gè)舊知識(shí)點(diǎn)進(jìn)行學(xué)習(xí)(由算法4(表4)所示),然后根據(jù)學(xué)習(xí)情況重新劃分知識(shí)點(diǎn)集合(由算法5(表5)所示),最后根據(jù)當(dāng)前學(xué)習(xí)壓力調(diào)整次輪的學(xué)習(xí)參數(shù)(由算法6(表6)所示),并將本輪學(xué)習(xí)規(guī)劃 bi 加人完整的學(xué)習(xí)規(guī)劃 M 之中,直到所有知識(shí)點(diǎn)全部學(xué)習(xí)完畢( S0 , Sl 均為空時(shí))。算法3的時(shí)間復(fù)雜度為O(T*N) ,空間復(fù)雜度為 O(N) ,其中 T 為學(xué)習(xí)知識(shí)點(diǎn)輪次, N 為知識(shí)點(diǎn)總數(shù)。
算法4是選擇知識(shí)點(diǎn)進(jìn)行學(xué)習(xí)的具體步驟,首先隨機(jī)選擇 n1 個(gè)新知識(shí)點(diǎn)加人學(xué)習(xí)規(guī)劃 bi ,對(duì)于正在學(xué)習(xí)的知識(shí)點(diǎn)集合,根據(jù)ACT-R激活參數(shù)、遺忘曲線參數(shù)、當(dāng)前時(shí)間與復(fù)習(xí)推薦時(shí)間間隔之差、噪音ξ (取值范圍(-0.5,-0.5))加權(quán)計(jì)算,依照權(quán)重從小到大選擇 n2 個(gè)需要復(fù)習(xí)的知識(shí)點(diǎn)加入學(xué)習(xí)規(guī)劃 bi ,然后計(jì)算 ai 的相關(guān)參數(shù)之后返回學(xué)習(xí)規(guī)劃。算法4的時(shí)間復(fù)雜度為 O(n1+n2) 。
算法5是根據(jù)本輪學(xué)習(xí)規(guī)劃 bi 調(diào)整知識(shí)點(diǎn)集合劃分的具體步驟,遍歷本輪學(xué)習(xí)規(guī)劃 bi ,如果是首次學(xué)習(xí),那么將 ai 從集合 S0 調(diào)整至集合 Sl ;如果是正在學(xué)習(xí)的知識(shí)點(diǎn),通過判斷該知識(shí)點(diǎn)的 Q(x) 與 A(x) 是否均高于閾值,進(jìn)而判斷該知識(shí)點(diǎn)是否被掌握,如果被掌握,則將其從 S1 調(diào)整至 S2 ,閾值可通過模擬其他學(xué)習(xí)規(guī)劃進(jìn)行動(dòng)態(tài)調(diào)整抑或設(shè)定為靜態(tài)。算法5的時(shí)間復(fù)雜度為 O(n1+n2 )
算法6是根據(jù)學(xué)習(xí)壓力調(diào)整學(xué)習(xí)參數(shù)的具體步驟,算法首先計(jì)算 S1 與 S2 中知識(shí)點(diǎn)的平均學(xué)習(xí)次數(shù),理想情況下 S1 中的平均次數(shù)是 S2 中的一半;算法6的時(shí)間復(fù)雜度為 O(N) 0
2 實(shí)驗(yàn)結(jié)果與分析
以單詞學(xué)習(xí)規(guī)劃為任務(wù),本文進(jìn)行實(shí)驗(yàn)對(duì)比分析。首先,為了與傳統(tǒng)遺忘曲線、經(jīng)典的Leitner間隔重復(fù)學(xué)習(xí)算法、以及基于ACT-R的認(rèn)知間隔重復(fù)學(xué)習(xí)方法在間隔重復(fù)學(xué)習(xí)規(guī)劃方面的區(qū)別,本文進(jìn)行了學(xué)習(xí)規(guī)劃對(duì)比:設(shè)定學(xué)習(xí)時(shí)長(zhǎng)為100d,每日學(xué)習(xí)總量為50個(gè)的單詞學(xué)習(xí)實(shí)驗(yàn)。通過該實(shí)驗(yàn)說明基于ACT-R的認(rèn)知間隔重復(fù)學(xué)習(xí)方法的穩(wěn)定性。
其次,針對(duì)大規(guī)模的學(xué)習(xí)任務(wù)規(guī)劃,本文首先進(jìn)行學(xué)習(xí)結(jié)果預(yù)測(cè),通過數(shù)據(jù)集去訓(xùn)練得出記憶留存率閥值,并計(jì)算該閾值的準(zhǔn)確性等指標(biāo);然后學(xué)習(xí)任務(wù)規(guī)劃,在基于得出閾值的基礎(chǔ)上進(jìn)行學(xué)習(xí)任務(wù)規(guī)劃,并對(duì)比均值和標(biāo)準(zhǔn)差等指標(biāo)。
2.1 實(shí)驗(yàn)設(shè)置
為了研究不同遺忘曲線對(duì)生成的間隔重復(fù)學(xué)習(xí)規(guī)劃的影響,本文在實(shí)驗(yàn)中選取了3種典型的遺忘曲線。
(1)文獻(xiàn)[22]在1880年設(shè)計(jì)的遺忘曲線(curve1880),相對(duì)于時(shí)間 t 的遺忘曲線記憶留存率公式如下:
其中, u1 為控制公式反映的短期記憶遺忘速率, a1 為控制長(zhǎng)期記憶遺忘速率。
(2)文獻(xiàn)[23]在1991年設(shè)計(jì)的遺忘曲線(curve1991),相對(duì)于時(shí)間 t 的遺忘曲線記憶留存率公式如下:
式(4)通過兩個(gè)指數(shù)函數(shù)疊加描述記憶的多階段特性。其中, 反映了短期記憶遺忘,
反映了長(zhǎng)期記憶衰減。
(3)文獻(xiàn)[24]在2015年設(shè)計(jì)的遺忘曲線(curve2015),遺忘曲線記憶留存率相對(duì)于時(shí)間的公式如下:
其中, 表示記憶在海馬體中存儲(chǔ)的情況,
表示記憶穩(wěn)定的轉(zhuǎn)移到新皮層后的存儲(chǔ)情況。
本文實(shí)驗(yàn)使用墨墨背單詞(Memo)開源的數(shù)據(jù)集,通過規(guī)劃學(xué)生背單詞的方式分析模型的動(dòng)態(tài)規(guī)劃間隔重復(fù)學(xué)習(xí)方法。首先對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,去除數(shù)據(jù)集中對(duì)于曾經(jīng)學(xué)習(xí)過或已經(jīng)掌握的單詞的復(fù)習(xí)記錄。本文的評(píng)價(jià)指標(biāo)有cMean、cVar、cVarS、sMean、sVarS、 F1 、AUC。
cMean為知識(shí)點(diǎn)平均學(xué)習(xí)次數(shù),其計(jì)算公式如下:
其中, ti 為單詞的學(xué)習(xí)次數(shù)。
cVar為知識(shí)點(diǎn)相較于平均學(xué)習(xí)次數(shù)的方差,其計(jì)算公式如下:
cVarS為知識(shí)點(diǎn)相較于平均學(xué)習(xí)次數(shù)的樣本標(biāo)準(zhǔn)差,其計(jì)算公式如下:
sMean為學(xué)習(xí)的平均間隔時(shí)間,其計(jì)算公式如下:
其中, si 為第 i 次學(xué)習(xí)相較于上一次學(xué)習(xí)的時(shí)間間隔。
sVarS 為學(xué)習(xí)間隔相較于平均間隔時(shí)間的樣本標(biāo)準(zhǔn)差,其計(jì)算公式如下:
F1 值是一個(gè)綜合考慮精確率和召回率的指標(biāo)。精確率(Precision)是指在所有被模型預(yù)測(cè)為正例的樣本中,真正為正例的樣本所占的比例;召回率(Recal1)則是在所有真實(shí)為正例的樣本中,被模型正確預(yù)測(cè)為正例的樣本所占的比例。 F1 分?jǐn)?shù)是這兩個(gè)比例的調(diào)和平均數(shù),它在兩者之間取得平衡。 F1 的計(jì)算公式如下:
AUC值代表ROC曲線下的面積(AreaUndertheROCCurve)。ROC曲線是以假正率(實(shí)際為負(fù)例樣本而被預(yù)測(cè)為正例樣本)為橫坐標(biāo)、召回率為縱坐標(biāo)
繪制的曲線。AUC的值介于0\~1之間,值越大表示模型的性能越好。AUC能夠衡量模型對(duì)正負(fù)樣本排序能力的整體表現(xiàn)。
2.2 學(xué)習(xí)規(guī)劃對(duì)比
本文對(duì)比了不同間隔重復(fù)學(xué)習(xí)算法對(duì)學(xué)習(xí)任務(wù)規(guī)劃的學(xué)習(xí)結(jié)果和穩(wěn)定程度,具體設(shè)定學(xué)習(xí)時(shí)長(zhǎng)為100d,每天可安排學(xué)習(xí)單詞數(shù)量為50,由不同間隔重復(fù)學(xué)習(xí)算法生成間隔重復(fù)學(xué)習(xí)規(guī)劃。表7中示出了Leitner提出的間隔重復(fù)學(xué)習(xí)算法(Leitner)、傳統(tǒng)靜態(tài)間隔重復(fù)學(xué)習(xí)算法的3種遺忘曲線(curve1880,curve1991,curve2015),以及基于ACT-R的認(rèn)知間隔重復(fù)學(xué)習(xí)方法結(jié)合3種遺忘曲線(ACT-Rcurve1880,ACT-Rcurvel991,ACT-Rcurve2015)。表中Num為100d 總共掌握的單詞數(shù)目。從表中可以得出,每日的學(xué)習(xí)任務(wù)量固定時(shí),傳統(tǒng)算法難以調(diào)整學(xué)習(xí)間隔,導(dǎo)致單詞無法在最佳學(xué)習(xí)間隔被規(guī)劃入學(xué)習(xí)任務(wù),所以單詞的學(xué)習(xí)次數(shù)方差較大。本文提出的學(xué)習(xí)方法可以實(shí)現(xiàn)動(dòng)態(tài)的間隔重復(fù)學(xué)習(xí)規(guī)劃,盡可能保證每個(gè)單詞在最佳學(xué)習(xí)間隔期間被規(guī)劃入學(xué)習(xí)任務(wù),以幫助學(xué)生提升學(xué)習(xí)效率。
2.3 學(xué)習(xí)結(jié)果預(yù)測(cè)
本文使用遺忘曲線切割算法對(duì)memo數(shù)據(jù)集的學(xué)習(xí)間隔歷史(t_history)進(jìn)行模擬,得出對(duì)應(yīng)的記憶留存率閾值,同時(shí)以該閾值為判斷標(biāo)準(zhǔn),對(duì)其他部分?jǐn)?shù)據(jù)集的學(xué)習(xí)間隔進(jìn)行判斷,得出是否掌握,并對(duì)結(jié)果進(jìn)行分析對(duì)比,結(jié)果如表8所示。表中,Param為不同遺忘曲線所使用的不同參數(shù),1、2、3、4分別對(duì)應(yīng)Ebbinghaus,Mack,Seitz,Dors數(shù)據(jù)集的結(jié)果[24];MQ值為遺忘曲線切割算法經(jīng)數(shù)據(jù)集訓(xùn)練后得出的記憶留存率閾值。
從表8可以看到,遺忘曲線切割算法對(duì)于單詞學(xué)習(xí)結(jié)構(gòu)的預(yù)測(cè)整體效果良好,其中ACT-Rcurve1991和ACT-Rcurve2015的第2組參數(shù)的F1值表現(xiàn)最優(yōu),而ACT-Rcurve2015第4組參數(shù)和ACT-Rcurvel880的AUC值表現(xiàn)最優(yōu)。ACT-Rcurve1880的4組參數(shù)對(duì)于實(shí)驗(yàn)的影響很低,MQ、F1與AUC每組參數(shù)之間的差異很小,這表明了這類遺忘曲線的函數(shù)體簡(jiǎn)單,同時(shí)其效果也更加受限于該函數(shù)體,不同參數(shù)的影響并不明顯,ACT-Rcurve1880未能明顯體現(xiàn)出不同數(shù)據(jù)集之間的差異性;ACT-Rcurve1991與ACT-Rcurve2015則體現(xiàn)出了不同參數(shù)之間的差異性,這兩種曲線對(duì)于4組數(shù)據(jù)集擬合出的結(jié)果非常相似,這也表明用參數(shù)調(diào)控兩個(gè)函數(shù)體可以更好地?cái)M合記憶遺忘曲線特性;curve1991與curve2015的第1組和第4組參數(shù)通過數(shù)據(jù)集訓(xùn)練得出的記憶留存率閾值不到0.9,低于其他參數(shù),可能原因是數(shù)據(jù)集收集的是20歲年輕人背誦單詞的記錄,而1、4兩組參數(shù)擬合的數(shù)據(jù)集大多來源為中年人,這使得這兩組參數(shù)擬合出的遺忘曲線認(rèn)為更高頻率的學(xué)習(xí)才能保證較高的記憶留存率,表現(xiàn)出來就是數(shù)據(jù)集中的學(xué)習(xí)軌跡不足以獲得足夠高的記憶留存率,這也導(dǎo)致基于該記憶留存率閾值的單詞學(xué)習(xí)結(jié)果預(yù)測(cè)效果不佳, F1 值較低,但更看重樣本排序的AUC值并不受到記憶留存率閾值設(shè)定的影響。另一個(gè)可能的原因是數(shù)據(jù)集的學(xué)習(xí)軌跡不規(guī)律,根據(jù)該學(xué)習(xí)軌跡獲得的記憶留存率也較低。
2.4學(xué)習(xí)任務(wù)規(guī)劃
在基于實(shí)驗(yàn)所得的記憶留存率閾值的基礎(chǔ)上,實(shí)現(xiàn)對(duì)學(xué)生學(xué)習(xí)5000個(gè)單詞任務(wù)的間隔重復(fù)學(xué)習(xí)規(guī)劃,該任務(wù)假設(shè)學(xué)生每天固定學(xué)習(xí)200個(gè)單詞,其中新舊單詞學(xué)習(xí)數(shù)目將進(jìn)行動(dòng)態(tài)調(diào)整,最終整體的學(xué)習(xí)規(guī)劃,結(jié)果如表9所示。表中,Time/d為最終需要多少天能夠完成5000個(gè)單詞的學(xué)習(xí)。
從表9中可以看到,相對(duì)于Memo數(shù)據(jù)集高達(dá)7.463726的學(xué)習(xí)次數(shù)標(biāo)準(zhǔn)差,本文提出的間隔重復(fù)學(xué)習(xí)方法能夠很好地調(diào)節(jié)學(xué)習(xí)新舊單詞的平衡,使得單詞的學(xué)習(xí)頻率較為平穩(wěn)。ACT-Rcurve1880的效果仍然受限于其單個(gè)函數(shù),難以體現(xiàn)不同參數(shù)之間的差異,且ACT-Rcurve1880對(duì)于單詞頻率學(xué)習(xí)次數(shù)的要求最低,平均間隔學(xué)習(xí)約8次即認(rèn)定掌握了該單詞。ACT-Rcurvel991和ACT-Rcurve2015參數(shù)之間的差異較為明顯,第1組與第4組參數(shù)在記憶留存率閾值低于其他參數(shù)的情況下,第4組參數(shù)的學(xué)習(xí)頻率明顯降低,說明第1組參數(shù)傾向于增加學(xué)習(xí)頻率,第4組參數(shù)認(rèn)為數(shù)據(jù)集中的學(xué)習(xí)軌跡不符合該曲線的特性。
基于ACT-Rcurve1880,ACT-Rcurve1991,ACT-Rcurve2015的間隔重復(fù)學(xué)習(xí)方法對(duì)于5000個(gè)單詞的學(xué)習(xí)規(guī)劃與Memo數(shù)據(jù)集本身的學(xué)習(xí)軌跡特征分別如圖1\~4。由于數(shù)據(jù)集中存在學(xué)習(xí)軌跡過長(zhǎng)的數(shù)據(jù),圖4選取了學(xué)習(xí)軌跡長(zhǎng)度小于20的情況。圖中橫坐標(biāo)為單詞的學(xué)習(xí)次數(shù),縱坐標(biāo)為單詞的間隔復(fù)習(xí)長(zhǎng)度。
從圖1\~4中可以看出,相對(duì)于Memo數(shù)據(jù)集的學(xué)習(xí)路徑,間隔重復(fù)學(xué)習(xí)規(guī)劃的學(xué)習(xí)間隔隨著學(xué)習(xí)次數(shù)的提升而穩(wěn)步增加,符合遺忘曲線所表示的遺忘規(guī)律,同時(shí)學(xué)習(xí)間隔的標(biāo)準(zhǔn)差保持在低水平,這表明該學(xué)習(xí)規(guī)劃有合理的學(xué)習(xí)路徑安排,使得每個(gè)單詞都在最佳時(shí)間點(diǎn)進(jìn)行學(xué)習(xí)與復(fù)習(xí),且能夠體現(xiàn)不同遺忘曲線的特性。其中,ACT-Rcurvel880和
ACT-Rcurve1991,ACT-Rcurve2015第4組參數(shù)認(rèn)為學(xué)習(xí)間隔隨著學(xué)習(xí)次數(shù)的增加,在經(jīng)過1\~2次時(shí)隔一周的學(xué)習(xí)之后認(rèn)定該單詞已被掌握,而其余的曲線表明至少要經(jīng)過4次的時(shí)隔一周的學(xué)習(xí)才能認(rèn)定為該單詞已被掌握,學(xué)習(xí)頻率根據(jù)學(xué)習(xí)軌跡而變得更多。
本文提出的基于ACT-R的認(rèn)知間隔重復(fù)學(xué)習(xí)方法可以根據(jù)不同的遺忘曲線設(shè)計(jì)不同的學(xué)習(xí)規(guī)劃,設(shè)計(jì)的學(xué)習(xí)規(guī)劃表現(xiàn)出了良好的穩(wěn)定性,并且能安排更符合遺忘曲線參數(shù)與ACT-R指標(biāo)的學(xué)習(xí)頻率與學(xué)習(xí)間隔。
3結(jié)論
本文提出了一種基于ACT-R的認(rèn)知間隔重復(fù)學(xué)習(xí)方法,基于ACT-R的學(xué)習(xí)過程模擬、遺忘曲線切割算法和間隔重復(fù)學(xué)習(xí)規(guī)劃。它通過ACT-R學(xué)習(xí)過程模擬和遺忘曲線切割算法,在設(shè)定學(xué)生學(xué)習(xí)的指標(biāo)后進(jìn)行學(xué)習(xí)規(guī)劃推演,最終根據(jù)推演結(jié)果與相關(guān)參數(shù)生成間隔重復(fù)學(xué)習(xí)規(guī)劃。通過模擬背誦單詞的實(shí)驗(yàn)可以證明,相比于Memo數(shù)據(jù)集,該方法生成的學(xué)習(xí)規(guī)劃能夠?qū)崿F(xiàn)對(duì)于各個(gè)單詞學(xué)習(xí)頻率和學(xué)習(xí)間隔的合理和穩(wěn)定,并且能夠通過ACT-R合理搭建學(xué)習(xí)流程,將遺忘曲線的不同特性反映到學(xué)習(xí)軌跡上,為學(xué)生提供一種可調(diào)整的、穩(wěn)定的自主學(xué)習(xí)方法。
參考文獻(xiàn):
[1] ALHIJAWIB,AWAJANA,F(xiàn)RAIHAT S.Survey on the objectivesof recommender systems:Measures, solutions, evaluation methodology,and new perspectives[J].ACM Computing Surveys,2022, 55(5):1-38.
[2] 云岳,代歡,張育培,等.個(gè)性化學(xué)習(xí)路徑推薦綜述[J].軟 件學(xué)報(bào),2021,33(12): 4590-4615.
[3] 董永峰,王雅琮,董瑤,等.在線學(xué)習(xí)資源推薦綜述[J].計(jì) 算機(jī)應(yīng)用,2023,43(6):1655-1663.
[4] 吳正洋,湯庸,劉海.個(gè)性化學(xué)習(xí)推薦研究綜述[J].計(jì)算 機(jī)科學(xué)與探索,2022,16(1):21-40.
[5] URDANETA-PONTE MC,MENDEZ-ZORRILLA A, OLEAGORDIA-RUIZ I. Recommendation systemsfor education:Systematic review[J].Electronics,2021,10(14): 1611.
[6] EBBINGHAUSH.Hermann Ebbinghaus:Grundzuge Der Psychologie.Band 1[M].Berlin,Germany:Walter de GruyterGmbHamp;CoKG,2020.
[7] KORNMEIER J, SOSIC-VASIC Z, JOOS E. Spacing learning units affects both learning and forgeting[J]. Trends inNeuroscienceandEducation,2022,26:100173.
[8] KARATAS N B, OZEMIR O,LOVELETTJT,et al. Improving second language vocabulary learning and retention by leveraging memory enhancement techniques:A multidomain pedagogical approach[J]. Language Teaching Research,2025,29(12):112-149.
[9] CARPENTER S K. Distributed Practice or Spacing Effect[M].Oxford,United Kingdom:Oxford Research EncyclopediaofEducation,2020.
[10] LATIMIER A,PEYRE H, RAMUS F. Ametaanalytic review ofthe benefit of spacing out retrieval practice episodes on retention[J].Educational Psychology Review, 2021,33:959-987.
[11] SHAHD P, JAGTAP N M,SHAH SS,et al.Spaced repetition for slow learners[C]//2020 IEEE Bombay Section Signature Conference (IBSSC).Mumbai, India:IEEE, 2020:146-151.
[12] ZHANG R,ZOUD,XIEH. Spaced repetition for authentic mobile-assisted word learning:Nature, learner perceptions, and factors leading to positive perceptions[J]. Computer Assisted LanguageLearning,2022,35(9):2593-2626.
[13] SU J,YE J,NIE L,et al. Optimizing spaced repetition schedule by capturing the dynamics of memory[J].IEEE Transactions on Knowledge and Data Engineering,2023, 35(10):10085-10097.
[14] XIAO Q, WANG J. DRL-SRS:A deep reinforcement learning approach for optimizing spaced repetition scheduling[J].Applied Sciences,2024,14(13): 5591.
[15] KIMN,NAMCS.Neuroergonomics:PrinciplesandPractice[M]. Berlin, Germany: Springer Nature, 2020.
[16] LANGENFELD V,WESTPHAL B,PODELSKI A.A formal operational model ofACT-R:Structure and behaviour[C]//Proceedingsof theAnnual Meetingof the CognitiveScience Society.Merced,California,America:UC Merced,2021.
[17] FISHERCR,HOUPTJW,GUNZELMANNG.Developingmemory-based models of ACT-R within a statistical framework[J].Journal ofMathematical Psychology,2020, 98: 102416.
[18] CINA M, RAD A B. Categorized review of drive simulators and driver behavior analysis focusing on ACT-R architecture in autonomous vehicles[J]. Sustainable Energy TechnologiesandAssessments,2023,56:103044.
[19] OHH,YUNY,MYUNGR.Driverbehaviorandmental workload for takeover safety in automated driving:ACT-R predictionmodeling approach[J].Traffic Injury Prevention, 2024,25(3): 381-389.
[20] SUBIRANA B,BAGIATI A, SARMA S. On the Forgetting of College Academice: At \"Ebbinghaus Speed\"?[R]. Cambridge,MA,UnitedStates:CenterforBrains,Minds andMachines (CBMM),2017.
[21] FERREIRAJA,VALMORBIDAEL, SATOBG,et al. Forgetting curve models:A systematic review aimed at consolidating the main models and outlining possibilities for future research in production[J]. Expert Systems, 2024, 41(2): e13405.
[22] MURRE JM J, CHESSA AG.Why ebbinghaus’ savings method from 1885 isa very‘pure'measure of memory performance[J].Psychonomic Bulletinamp; Review,2023, 30(1):303-307.
[23] MULBERGER A. Early experimental psychology: How did replication work before p-hacking?[J].Review of General Psychology,2022,26(2):131-145.
[24] MURRE J M J,DROS J.Replication and analysis of ebbinghaus’forgetting curve[J].PloS One,2015,10(7): e0120644.
A Cognitive Spaced Repetitive Learning Method Based on ACT-R
WU Yunchao,LUO Fei, TAO Junchen,WANG Chen, ZHANG Ziyi (School of Information Science and Engineering, East China University of Science and Technology, Shanghai 200237, China)
Abstract: The spaced repetitive learning method has played an important role in assisting students in self-directed learning. However,traditional spaced repetition algorithms are too rigid inspaced control,resulting in significant diferences in daily learning tasks for students,which in turn afect learning eficiency.Inorder to improve the eficiency of self-directed learning, we propose a cognitive spaced repetitive learning method based on ACT-R. On the one hand,by basing on ACT-R programming learning process,this paper simulates student learning behavior and extracts activation parameters for the dominant model's memory changes. On the other hand,a forgeting curve cuting algorithm is proposed, which reflects the forgeting characteristics inlearming planingand extracts parameters such as memory retention rate and recommended review interval. Finally, based on the learming parameters obtained from both approachs,this paper dynamically generates spaced repeat learning plans for specific learning tasks.Experimental analysis shows that,compared to traditional spaced repetitive learming algorithms,the cognitive spaced repetitive learning method based on ACT-Rcan arrange autonomous learning tasks more reasonably and efectively.It achieves a more balanced daily amount of learning tasks and a more reasonable distribution of learning time for each task.
Key words: cognitive architecture; ACT-R; forgetting curve; spaced repetition algorithm; learning planning
(責(zé)任編輯:王曉麗)