汪存友 趙燕飛 王亞青
(1.山西師范大學 傳媒學院,山西 臨汾 041004;2.山西師范大學 教育科學學院,山西 臨汾 041004)
信息技術的飛速發(fā)展促進了個性化學習的誕生,個性化學習依據學習者的個性特征進行教學活動,滿足每位學習者的不同學習需求和學習偏好。而個性化學習的實現(xiàn)依賴于自適應學習,自適應學習是人工智能技術在教育領域的高階表現(xiàn)形式,其基于學習者的個性特征適應性地改變所教授的學習內容(Oxman & Wong, 2015)。自適應學習實現(xiàn)的關鍵支撐則是自適應學習算法,隨著人工智能技術的不斷進步,先后出現(xiàn)許多具有不同特性的自適應學習算法,特性的不同,導致算法在自適應學習中的實現(xiàn)方式及實現(xiàn)的功能也各不相同。因此,自適應學習整體功能的實現(xiàn)需根據自適應學習算法的不同特性進行多項選擇。目前國內外對自適應學習的研究較多,對自適應學習系統(tǒng)及相關模型的構建、自適應學習平臺的比較分析等都有豐富的研究,但只有少數(shù)文獻會提到自適應學習的關鍵支撐——自適應學習算法,且缺少對自適應學習算法的系統(tǒng)性研究。有關自適應學習算法的研究中,董曉輝、楊曉宏與張學軍(2017)指出自適應學習技術對于促進個性化學習具有很大的潛力,通過內容分析法對國內外的項目反應理論算法、推薦算法、認知水平診斷算法等自適應學習技術相關文獻進行了梳理和研究,卻沒有對自適應學習技術的內容和功能進行詳細闡述。Birjali、Beni-Hssane 和 Erritali(2018)利用遺傳算法和蟻群優(yōu)化算法構建了基于大數(shù)據的自適應學習模型,利用構建的模型向學習者推薦最佳的學習資源。Sitthisak、Gilbert和Albert(2013)針對計算機自適應測試系統(tǒng)中存在的問題,提出了一種運用能力模型與知識空間理論相結合的自適應學習。馬玉慧、王珠珠、王碩爍與郭炯(2018)指出現(xiàn)有的基于行為數(shù)據實現(xiàn)的個性化學習資源推送方法存在局限性,并提出以認知診斷算法為基礎的適應性學習資源推送方法,從而彌補基于行為數(shù)據推送方法的不足,由此實現(xiàn)大規(guī)模的個性化學習。衛(wèi)文婕與付宇博(2018)對目前常用的個性化學習資源推薦算法進行了梳理和研究,并對協(xié)同過濾算法等推薦算法做了比較分析,總結出各推薦算法的優(yōu)缺點。Pliakos等人(2019)指出自適應學習系統(tǒng)存在冷啟動問題,并提出將項目反應理論算法與機器學習算法相結合的方法來緩解冷啟動問題,通過在教育數(shù)據集上的實驗表明了該方法的有效性。近年來自適應學習領域也應用了一些新的算法,如深度知識跟蹤算法、概率圖模型算法等。
當前很多教育機構利用自適應學習算法構建了自適應學習平臺,但由于自適應學習算法的復雜性及多樣化,自適應學習平臺現(xiàn)處于起步階段,很多自適應學習平臺普遍存在對自適應學習算法選擇不當?shù)那闆r,導致自適應學習平臺中出現(xiàn)對學習者知識狀態(tài)診斷不精確及在推薦學習資源及學習路徑時不夠個性化的問題。綜上所述,對自適應學習算法的系統(tǒng)性研究是必要且急切的,精準高效地利用自適應學習算法,將為學習者提供更為智能、高效的個性化學習服務。同時,對自適應學習算法的系統(tǒng)性研究,將會為自適應學習的進一步發(fā)展提供更大的可能。當前自適應學習還處在弱人工智能水平,實現(xiàn)自適應學習從弱人工智能進化到強人工智能的突破口在于對自適應學習算法的突破。本研究通過對相關文獻及目前存在的自適應學習平臺的研究,梳理出應用較多且具有較大潛力的自適應學習算法,結合已開發(fā)的自適應學習平臺,歸納出算法的應用進展,并探討未來自適應學習的發(fā)展建議。
通過對相關文獻及目前存在的自適應學習平臺的研究,梳理出八種應用較多且具有較大潛力的自適應學習算法:項目反應理論、認知診斷理論、知識空間理論、貝葉斯知識跟蹤、深度知識跟蹤、概率圖模型、協(xié)同過濾算法及遺傳算法。依據算法的實現(xiàn)原理,將自適應學習算法大致分為心理測量類和機器學習類兩類算法,如表1所示。目前諸多教育機構綜合這兩類算法構建了自適應學習平臺,主流的自適應學習平臺國外有Knewton、ALEKS等,國內有乂學教育、猿題庫、試達測評系統(tǒng)、滬江網校的Uni智能學習系統(tǒng)等。其中自適應學習算法具有領域適用性,根據算法本身的特性應用于自適應學習平臺的不同領域,此部分將自適應學習算法的應用領域分為三部分:知識狀態(tài)測量領域、預測學習者未來學習能力表現(xiàn)領域、學習資源及學習路徑推薦領域,并分別介紹了算法應用中的關鍵操作和目前已開發(fā)的自適應學習平臺。
表1 自適應學習算法的應用
知識狀態(tài)測量領域是根據學習者的個性特征及知識狀態(tài)精準測量學習者的認知能力水平及認知結構,更為客觀有效地揭示認知過程。在自適應學習中,精準的知識狀態(tài)測量是實現(xiàn)自適應的前提(王碩爍,馬玉慧,2018)。知識狀態(tài)測量領域中應用到的算法歸屬于心理測量類,心理測量類的算法更注重如何對學習者的認知結構及認知過程進行精準測量,從潛在心理特質出發(fā),通過對學習者個性特征的分析,測量學習者學習過程中的認知結構及認知過程,從而掌握學習者的知識狀態(tài),以此向學習者推薦適當?shù)难a救措施。
1. 項目反應理論
項目反應理論算法是一種用于評估學習者認知能力水平的算法,其基本思想是根據學習者的潛在心理特質及學習者對題目的作答狀況,推斷學習者的學習能力。在自適應學習平臺中,Knewton采用項目反應理論算法,根據試題級別表現(xiàn)對學習者的認知能力水平進行建模(萬海鵬,汪丹,2016)。乂學教育研發(fā)的自適應學習引擎松鼠AI,采用項目反應理論算法,對項目進行難度標簽的標定,并結合知識空間理論算法,測量學習者整體的知識狀態(tài)(薛佳怡,2018)。猿題庫采用項目反應理論算法,根據學習者的歷史學習數(shù)據,計算學習者在各個知識點的認知能力水平,通過與以往測試重點的匹對,映射到實際測試中,預測學習者實際可能取得的分數(shù)(蒙遺善,2014)。項目反應理論算法被廣泛應用于教育評估中,傳統(tǒng)的自適應學習平臺在對學習者認知能力水平進行評估時,大都采用項目反應理論算法進行實現(xiàn)。
2. 認知診斷理論
認知診斷理論算法是一種基于認知診斷模型對學習者的認知結構及認知過程進行診斷和評估的算法,算法通過定位到學習者學習過程中出現(xiàn)的認知缺陷,以此為學習者提出彌補認知缺陷的補救措施,從而提升學習效果。試達測評自適應學習平臺采用認知診斷理論算法,從知識、技能、能力、思維類型四個維度對學習者的認知結構及認知過程進行綜合立體式的多元多維診斷(張小逸,2016)。
3. 知識空間理論
知識空間理論算法由Doignon 和Falmagne(1999)提出,它提供了一種表示知識結構的方法,是一種測量學習者認知水平及認知結構的心理學理論,其通過對學習者的題目作答狀況進行有效地測量,從而得出學習者對知識的掌握狀況。ALEKS采用知識空間理論算法對學習者的認知結構及認知過程進行精確診斷,從而為學習者推薦最恰當?shù)膶W習資源及學習路徑來提高學習者的學習效率,增強學習者的學習效果,讓學習者在自適應學習的方式下高效地實現(xiàn)學習目標(ALEKS,2017)。
以上三種算法中,項目反應理論算法僅測量學習者的認知能力水平,傳統(tǒng)的自適應學習平臺在應用時會根據系統(tǒng)需求對項目反應理論算法進行適當?shù)母倪M。例如:Knewton考慮到學習者的認知能力水平參數(shù)是不斷變化的,且僅用一個參數(shù)對學習者的認知能力水平進行表示是不符合實際的,因此對項目反應理論算法進行擴展,從問題層級的表現(xiàn)對學習者的認知能力水平進行建模,利用聚焦于概念層面的知識圖譜對學習者認知能力水平進行測量和表征(萬海鵬,汪丹,2016)。認知診斷理論算法和知識空間理論算法均是多維能力測驗,不僅對學習者的認知能力水平進行測驗,且對學習者的認知結構及認知過程進行測驗。
預測學習者未來學習能力表現(xiàn)領域是通過對學習者學習行為數(shù)據的分析,發(fā)現(xiàn)學習行為數(shù)據中的潛在關系,探索建立預測模型,最終實現(xiàn)對學習者未來學習能力表現(xiàn)的預測。預測學習者未來學習能力表現(xiàn)領域中應用到的算法歸屬于機器學習類,機器學習類的算法旨在通過算法從大量歷史學習行為數(shù)據中學習規(guī)律,自動發(fā)掘模式并進行預測,能夠結合學習者的知識結構及歷史學習行為數(shù)據等信息有效地構建自適應學習。
1. 貝葉斯知識跟蹤
貝葉斯知識跟蹤算法是一種通過對學習者知識狀態(tài)進行實時跟蹤,以此預測學習者能力表現(xiàn)的算法,算法的核心是隱馬爾可夫模型(HMM),其將學習者的潛在知識狀態(tài)建模為一組二元變量,其中每個變量表示理解或不理解的單個概念,當學習者正確或不正確回答給定概念練習時,使用隱馬爾可夫模型來更新這些二元變量中的每一個概率,以此預測學習者在特定技能上的認知水平(Piech et al., 2015)。乂學教育研發(fā)的自適應學習引擎松鼠AI采用貝葉斯知識跟蹤算法判定學習者知識點掌握程度是否達標,以此預測開始下一步學習的時間節(jié)點(李詩,2018)。
2. 深度知識跟蹤
深度知識跟蹤算法隨著深度學習技術發(fā)展而來,是一種利用循環(huán)神經網絡(RNN)對學習者學習行為進行建模的先驅算法,其使用大量的人工“神經元”向量表示潛在知識狀態(tài)及時間動態(tài),通常從數(shù)據中學習知識的潛在變量并對學習者進行持續(xù)地隱式建模,以此預測學習者未來學習能力表現(xiàn)(Piech et al.,2015)。國內的滬江學習網利用人工智能技術開發(fā)出Uni智能學習系統(tǒng),該系統(tǒng)運用深度知識跟蹤算法對學習者的知識狀態(tài)進行實時跟蹤,由此預測學習者未來學習能力表現(xiàn)(王新義,2018)。在應用到自適應學習中時,深度知識跟蹤算法不僅會分析學習者當前的知識狀態(tài),還會考慮到學習者之前所有的學習表現(xiàn),綜合分析學習者整體的知識狀態(tài)及學習表現(xiàn),由此預測學習者未來學習能力表現(xiàn)。
3. 概率圖模型
概率圖模型算法是根據計算相關聯(lián)知識點之間的相互關系,以此來預測學習者未來學習能力表現(xiàn)的算法,在處理計算機領域中不確定概率關系方面有著巨大的發(fā)展?jié)摿胺浅:玫膽们熬埃≒earl, 1988)。乂學教育研發(fā)的自適應學習引擎松鼠AI采用概率圖模型算法根據學習者的學習行為數(shù)據對學習者畫像進行刻畫,分析學習者的整體知識掌握情況(李詩,2018)。Knewton采用概率圖模型算法計算鄰近知識點間的關聯(lián)度,并預測學習者在鄰近知識點上的掌握程度,對學習者的學習行為進行實時計算和預測(Ferreira, 2016)。在自適應學習的應用中,利用概率圖模型算法計算相關聯(lián)知識點之間的相互關系,以此了解學習者的知識狀態(tài),并推斷出學習者未來學習能力表現(xiàn),即根據學習者之前內容學習上的表現(xiàn),來預測之后內容學習上的表現(xiàn)。
以上三種算法中,深度知識跟蹤算法是在貝葉斯知識跟蹤算法的基礎之上發(fā)展而來,繼承了貝葉斯知識跟蹤算法的優(yōu)點,并針對貝葉斯知識跟蹤算法的不足進行改進,加入遺忘機制,可以長時間反映知識點與知識點之間的關聯(lián),進而通過對復雜知識點之間的潛在關系實行建模,以此反映學習者連續(xù)的認知能力水平變化。概率圖模型算法的核心模型是貝葉斯網絡模型和馬爾可夫隨機場模型,實際上貝葉斯知識跟蹤算法使用的核心模型隱馬爾可夫模型是結構最簡單的動態(tài)貝葉斯網絡模型。同時,隱馬爾可夫模型是有關時間次序的概率圖模型。由此可知,概率圖模型算法較為復雜,涵蓋豐富的知識關系,可以捕捉隨機變量之間的關系。
學習資源及學習路徑推薦領域是實現(xiàn)個性化學習路徑推薦的關鍵,可以基于學習者此時此刻的知識狀態(tài),推薦與之相適應的學習資源及學習路徑,并對學習資源進行優(yōu)先排序。自適應學習通過一系列的知識狀態(tài)測量和預測學習者未來學習能力表現(xiàn),最終目的在于為學習者推薦最佳學習資源及學習路徑,協(xié)助學習者根據自身的知識狀態(tài)進行高效學習。學習資源及學習路徑推薦領域中應用到的算法同樣歸屬于機器學習類,在此領域最常用的是協(xié)同過濾算法和遺傳算法。
1. 協(xié)同過濾算法
協(xié)同過濾算法是個性化推薦系統(tǒng)中最常用的推薦算法,其基本思想是根據學習者對學習資源的評分矩陣,通過相似度算法找到最鄰近的資源或用戶,根據最鄰近資源或用戶來預測未評分的目標學習資源,依據預測結果向學習者推薦較為準確的學習資源及學習路徑(衛(wèi)文婕,付宇博,2018)。Knewton采用協(xié)同過濾算法從學習者的學習目標、認知結構及學習投入度出發(fā),快速定位學習者所需信息,為學習者未來的學習呈現(xiàn)最優(yōu)的學習內容和學習路徑(Knewton Company, 2014)。
2. 遺傳算法
遺傳算法是進化算法的一種(Whitley,1994),依據初始種群,經過一系列操作,抽取出用戶的偏好屬性值,以此進行學習資源及學習路徑推薦。乂學教育研發(fā)的自適應學習引擎松鼠AI在跟蹤分析學習數(shù)據的基礎之上,運用遺傳算法為學習者在全局范圍內推薦合適的學習資源及學習路徑(李詩,2018)。猿題庫在面對海量學習資源時,同樣采用遺傳算法,根據學習者的知識狀態(tài)表現(xiàn),向學習者推薦最佳的學習資源及學習路徑(蒙遺善,2014)。
以上兩種算法中,協(xié)同過濾算法和遺傳算法各自存在優(yōu)缺點,一方面協(xié)同過濾算法在搜索效率維度上優(yōu)于遺傳算法,其因協(xié)同過濾算法能夠處理復雜的非結構數(shù)據,且具有很好的適用性,但同時協(xié)同過濾算法進行有效推薦存在前提條件,即學習系統(tǒng)要有足夠的學習行為數(shù)據及評分數(shù)據,否則就會出現(xiàn)冷啟動和數(shù)據稀疏問題,導致推薦結果不理想。另一方面遺傳算法的魯棒性優(yōu)于協(xié)同過濾算法,其因遺傳算法具備潛在并發(fā)性,可以同時進行多個項目的比較,但遺傳算法在搜索效率上低于協(xié)同過濾算法,其原因歸咎為遺傳算法的編碼實現(xiàn)過程較為復雜。
通過梳理自適應學習算法及其應用進展發(fā)現(xiàn),心理測量學和機器學習兩類算法實現(xiàn)的目標相同,都是利用技術更深入地理解學習者的學習過程,從而為學習者高效率的學習創(chuàng)造條件,打開“學習黑匣子”( Luckin,Holmes,Griffiths, & Forcier, 2016)。但同時心理測量學側重于通過知識狀態(tài)精確了解學習者的認知結構及認知過程,而機器學習更側重于通過對學習數(shù)據進行訓練學習從而進行自動建立預測模型,以此實現(xiàn)對學習者學習表現(xiàn)的預測。雖然機器學習能夠通過強大的計算能力使用相對簡單的方法實現(xiàn)傳統(tǒng)心理測量學無法達到的效果和目的,但機器學習并不能取代心理測量學。相反,它是心理測量學的延伸和拓展。機器學習不存在對測量結果進行解釋的理論基礎,而心理測量學側重于對測量結果進行描述性解釋。因此,可以說心理測量學是機器學習的理論基礎,并且心理測量學通過適應機器學習而變得更強大。在自適應學習平臺中,對學習者知識狀態(tài)進行精準測量、預測學習者未來學習能力表現(xiàn)及為學習者推薦合適的學習資源及學習路徑是其三大關鍵功能。對學習者知識狀態(tài)進行精準測量主要是采用心理測量學領域的算法,測量學習者的知識狀態(tài),定位學習者學習中的薄弱點。預測學習者未來學習能力表現(xiàn)主要是采用機器學習領域的算法,利用算法強大的計算能力,實時監(jiān)測學習者的學習狀況,以此評測學習者的知識狀態(tài),進而預測學習者未來學習能力表現(xiàn)。為學習者推薦合適的學習資源及學習路徑同樣采用機器學習領域的算法,依據學習者的學習目標及知識狀態(tài),推薦最佳學習資源,規(guī)劃最佳學習路徑。因此可以從以下兩個方面對未來自適應學習的發(fā)展提出建議。
自適應學習實質上是結合心理測量學和機器學習兩種不同領域的算法進行實現(xiàn),目前存在的自適應學習平臺均采用心理測量學和機器學習相結合的方式進行構建,如前面表1中所體現(xiàn)的,一個完整的自適應學習平臺需采用多種算法的深度結合。例如:國外著名自適應學習平臺Knewton,以心理測量學為基礎,結合先進的機器學習技術構建自適應學習平臺。其采用心理測量學領域的項目反應理論算法通過對學習者在不同級別試題上的表現(xiàn)對學習者的能力進行建模,測量學習者的知識掌握水平;在項目反應理論算法的基礎之上,采用機器學習領域中的貝葉斯知識跟蹤、概率圖模型及協(xié)同過濾算法實現(xiàn)對學習者知識狀態(tài)的持續(xù)跟蹤,并經過挖掘學習者的龐大學習行為數(shù)據,關聯(lián)分析學習者的學習行為數(shù)據信息,預測學習者的學習表現(xiàn),由此推理出最適合學習者的學習資源及學習路徑,幫助學習者提高學習效率。同時,國內乂學教育研發(fā)的自適應學習引擎松鼠AI,同樣采用心理測量學和機器學習相結合的方法構建自適應學習平臺。松鼠AI利用心理測量學領域中的項目反應理論算法和知識空間理論算法把知識根據重要性、難易度及認知層次進行等級劃分,并對學習內容建模,進而精準定位學習者的知識狀態(tài),了解每位學習者的知識薄弱點(薛佳怡,2018)。利用機器學習領域中的貝葉斯知識跟蹤、概率圖模型及遺傳算法三大算法對學習者的知識狀態(tài)進行實時跟蹤及對學習者的學習行為數(shù)據進行分析處理,在此基礎上,分析學習者當前的知識狀態(tài)及測評學習者的認知能力水平是否達到預設目標,據此為學習者推薦最佳的學習資源及學習路徑(李詩,2018)。因此,自適應學習中,心理測量學和機器學習兩個領域算法的深度結合,能夠促使自適應學習更加智能,從而推動學習者進行個性化的學習。
自適應學習平臺中,為學習者推薦合適的學習資源及學習路徑是在對學習者知識狀態(tài)進行精準測量和對學習者未來學習能力表現(xiàn)進行預測的基礎之上實現(xiàn)的,功能間的相互依存形成了一個相互循環(huán)的動態(tài)系統(tǒng),使整個自適應學習平臺更加完整,更加豐富。在對學習者知識狀態(tài)進行精準測量時,傳統(tǒng)的自適應學習平臺通常采用較為成熟且對數(shù)據樣本量要求較低的項目反應理論算法實現(xiàn),但項目反應理論算法存在用一個籠統(tǒng)的值表示學習者認知能力的缺陷,導致無法測量學習者的認知結構及認知過程。在項目反應理論算法基礎上提出的認知診斷理論算法和知識空間理論算法克服了此缺陷,認知診斷理論算法和知識空間理論算法可以對學習者的認知水平及認知結構進行雙重診斷分析,將此應用到自適應學習平臺中,可以彌補平臺中存在的對學習者認知水平及認知結構診斷模糊這一缺陷,實現(xiàn)對學習者認知水平及認知結構的精準測量。在預測學習者未來學習能力表現(xiàn)時,目前傳統(tǒng)的自適應學習平臺普遍采用貝葉斯知識跟蹤算法實現(xiàn),但隨著深度學習技術的發(fā)展,產生了優(yōu)于貝葉斯知識跟蹤算法的深度知識跟蹤算法,其能夠發(fā)現(xiàn)技能概念中的潛在結構,并利用靈活的循環(huán)神經網絡模型實現(xiàn)對學習者知識狀態(tài)的建模。深度知識跟蹤算法應用在自適應學習中,能夠自動發(fā)現(xiàn)知識點之間的相互關聯(lián),即自動建立知識圖譜,并且能夠智能設計課程,減少教育工作,對構建更智能的自適應學習有重要意義。目前眾多自適應學習平臺從機器學習領域中的協(xié)同過濾算法和遺傳算法中選擇一種方法為學習者推薦合適的學習資源及學習路徑,遺傳算法和協(xié)同過濾算法雖都具有很好的推薦效果,但也均存在不足之處,當下眾多研究者在提倡組合推薦算法(Hybrid Recommendation),即將多種算法結合在一起,彌補各自的不足。滿足各種場景的需求(Burke, 2002)。有研究者在數(shù)據集上做推薦對比實驗表明,基于遺傳算法的聚類和協(xié)同過濾算法組合成的推薦算法,能使之推薦的學習資源更加高效精準(馮智明,蘇一丹,覃華,鄧海,2014)。協(xié)同過濾算法和遺傳算法的組合推薦算法,可以利用遺傳算法的特性解決協(xié)同過濾算法中存在的效率和質量不高的問題,以此獲得更高質量的推薦內容。