摘 要 本文在學習用戶興趣模型的基礎上,利用遺傳算法在學習資源模型中推薦比較適合學習用戶的個性化學習資源,是基于遺傳算法的個性化學習資源的生成。在線學習系統(tǒng)和移動互聯(lián)網(wǎng)學習APP應運而生的“互聯(lián)網(wǎng)+”時代中,對個性化在線學習系統(tǒng)進行了基于開源軟件Sakai平臺開發(fā)的解決方案探究,給出了該系統(tǒng)的初步結構設計。
關鍵詞 Sakai平臺 個性化在線學習系統(tǒng)設計 個性化學習資源生成
中圖分類號:G642文獻標識碼:A
0引言
Sakai是由美國印地安那大學、密西根大學、斯坦福大學和麻省理工學院于2004年共同發(fā)起的一項開源CMS(課程管理系統(tǒng))計劃。目前Sakai的用戶主要是一些大學的遠程教育機構,中小學應用的還幾乎沒有。全球范圍內(nèi)超過160個教育機構在使用Sakai平臺,在我國的高校中,華東師范大學、華中師范大學、北京郵電大學、西南大學、復旦大學、上海交通大學密西根學院在Sakai基礎上開發(fā)滿足不同需求的產(chǎn)品并投入使用。與Blackboard、Moodle等課程管理系統(tǒng)相比,Sakai采用先進的技術架構(JaveEE)、企業(yè)級的應用能力(支持Orcale數(shù)據(jù)庫)、更加注重學生之間的協(xié)作學習和小組學習以及免費開源、更加適合教學和科研,Sakai在我國的網(wǎng)絡教學將會越來越受到青睞。
1 Sakai運行環(huán)境
Sakai的協(xié)作和學習環(huán)境是一個免費、共享源代碼的教育軟件平臺,它提供一組軟件工具來幫助需要開發(fā)一個共同用于協(xié)作或學習環(huán)境的研究院校、商業(yè)組織和自主群體創(chuàng)建一個用于協(xié)作的網(wǎng)站。Sakai是基于Java的系統(tǒng)平臺,利用Sakai進行二次開發(fā),其運行環(huán)境如表1。
2分析設計
2.1基于Sakai開發(fā)的個性化在線學習系統(tǒng)整體架構
(1)Sakai與圖書館資源的集合,實現(xiàn)Sakai課程管理系統(tǒng)與圖書館資源的有效整合。
(2)Sakai與教務系統(tǒng)集成,把教務系統(tǒng)的選課關系映射到Sakai中的選課。
(3)Sakai與在線錄播系統(tǒng)的整合。
(4)數(shù)字校園門戶集成,統(tǒng)一身份認證。
(5)課程管理系統(tǒng)。
(6)學習活動管理系統(tǒng)。
(7)與自行開發(fā)的個性化在線學習系統(tǒng)集成。
(8)校際合作。
Sakai提供了一些核心工具,包括有課程大綱(Syllabus)、課程通知(Announcements)、日程表(Schedule)、資源(Resources)、術語表(Glossary)等,利用Sakai平臺進行二次開發(fā),其功能設計主要包括:
(1)教學信息發(fā)布:包括發(fā)布教學通知、課表等, 所有內(nèi)容均以題目列表的形式給出,用戶可點擊相應標題查看具體內(nèi)容。
(2)教學資源共享:包括課件、視頻、參考書目的上傳、下載。
(3)教學討論區(qū):提供一個公共的課程討論空間,所有人可以對當前所關心的問題進行自由發(fā)言,每個人均可看到其他人的發(fā)言。
(4)Wiki( 創(chuàng)新功能):設置問題解答區(qū)或書籍編輯區(qū);所有與課程相關的人都可以將自己的問題發(fā)布在此處,并且可以對此區(qū)域中的所有問題進行解答或修改、補充已有的解答, 以達到認知協(xié)作、共同提高學習水平的目的。
(5)Sakai平臺里還有一個工具叫做練習與測驗,在此工具下面有一個題庫工具,教師可以建立一門課的題庫。
(6)資源推薦:利用前面所研究的開發(fā)具備個性化資源推薦的功能模塊,整合到Sakai平臺。
(7)交互功能設計:內(nèi)容交互與社會性交互。內(nèi)容交互主要是指學習者與課程內(nèi)容之間的交互。社會性交互使得學習者可以向教師或同伴學習,在一定程度上消除網(wǎng)絡課程環(huán)境下學習者個體的孤獨感。
2.2學習資源建模
個性化的在線學習系統(tǒng)模型,主要包括學習用戶興趣建模模塊和學習資源建模模塊。以下主要介紹學習資源模塊。
2.2.1學習資源的組織結構模式
傳統(tǒng)的學習資源組織的結構模式是按樹狀結構和課程的章節(jié)去劃分的,每個學生的學習路徑?jīng)]有什么區(qū)別,如圖4,學習者要學習一門學科的時候,從樹結構的左邊到右邊遍歷各個子節(jié)點。
這種結構雖然不會讓學習者遺漏章節(jié)知識點的學習,但是對于學習過程中的難點和重點是沒有很大的幫助的,考慮本文個性化學習資源的在線推薦問題,這里考慮另一種結構模式,這種模式是基于知識點和概念之間的關聯(lián)度,如圖5,例如學習者要學習Dn這個知識點,那么就要具備C1這個知識點的相關知識,而具備C1的相關知識基礎則是要具備A1到An的基礎知識,否則,就會產(chǎn)生重新學習這些知識點的個性化學習序列。
2.2.2學習資源難度系數(shù)確定
給學習者推薦的資源,要考慮到資源的難易程度有沒有和學習者的水平相適應,因此學習資源模型的因素要把學習資源的難度系數(shù)考慮在內(nèi)。computerized adaptive testing(CAT)理論有一種基于統(tǒng)計的方法,根據(jù)此方法,學習資源的難度參數(shù)通過細致的測試過程來決定。
學習資源模型里包括有測試項目數(shù)據(jù)庫和資源數(shù)據(jù)庫,測試項目數(shù)據(jù)庫里包括有前測項目和學習資源測試項目以及后測項目,前測項目是用來提供給學習者在使用該資源前衡量學習者的水平,后測項目是給予學習者鞏固學習以及衡量學習者在使用該資源以后的效果。測試項目是由多位經(jīng)驗豐富的專家組根據(jù)相應的學習概念進行設計。學習資源的測試項目里,每個測試項目與學習資源相對應。
學習者在進行前測項目后,測試項目里面的錯誤集合成相應的學習概念,通過數(shù)據(jù)采樣來測試包含這些學習概念的測試項目,根據(jù)IRT,測試數(shù)據(jù)會有統(tǒng)計的編程BILOG進行分析,以確定測試項目的相應難度系數(shù),此難度系數(shù)也就是測試項目相對應的學習資源的難度系數(shù),本文中難度系數(shù)用Di表示。
2.2.3學習資源模型表示
資源數(shù)據(jù)庫的資源遵循元數(shù)據(jù)模式的標準,元數(shù)據(jù)建模的過程就是用ECS逐個掃描,句子分離成詞,過濾掉數(shù)字符號等非文本詞和一個字術語,表示該資源特征詞語的元數(shù)據(jù)記錄在XML文件,相應的XML文件與相應的資源進行綁定。用TF-IDF統(tǒng)計方法,計算該資源元數(shù)據(jù)里的特征詞在該資源的權重。
TF:Term Frequency,關鍵詞頻,特征詞語在該資源出現(xiàn)的頻率,例如在一個M個詞的學習資源里含有N個特征詞,則
TF=N/M
IDF:Inverse Document Frequency,逆向文本頻率,以此來衡量特征詞權重權重的指數(shù)。D為資源總數(shù),DW為特征詞出現(xiàn)過的資源數(shù)。
IDF=log(D/DW)
特征詞k在資源i的權重Wik通過TF-IDF獲得。
Wik=TF*IDF
采用向量空間模型來代表每一個學習資源模型。
Xi={(Ti1,Wi1)},{(Ti2,Wi2)},…,{(Tik,Wik)}
其中,Xi表示第i個學習資源,Tik為第i個學習資源里的第k個特征詞,Wik為該特征詞在該學習資源里的重要程度。
2.3個性化在線學習系統(tǒng)結構設計
整個模型分為Online部分和Offline部分。模型結構圖如圖6。
Offline管理:數(shù)據(jù)準備將Web服務器用戶信息的log文件以及用戶訪問操作路徑信息等生成的相應文件,進行個性化特征提取,獲取學習者興趣模型,并借鑒其他用戶的信息選擇經(jīng)驗,利用遺傳算法進行用戶模型的動態(tài)更新。
Online管理:通過課程資源庫初始化種群,進行遺傳算法操作,進化后的種群與學習者興趣模型中的個體進行適應度值計算,即利用向量夾角余弦距離公式計算個體間的相似度,按適應度值大小排序,適應度值大的前N個個體構成課程資源推薦模塊,給學習者動態(tài)推薦相應的學習內(nèi)容。
其中,資源推薦模塊的資源序列生成過程如圖7。
3基于遺傳算法的個性化在線學習資源生成的遺傳算子
學習用戶模型和學習資源模型的匹配機制,實現(xiàn)個性化推薦。推薦系統(tǒng)推薦給學習者的資源,不能與學習者剛剛看過的課程資源不太相類似,或者完全不相關,也不能與學習者看過的資源完全重復,這就是模型過擬合問題或者是可擴展性問題。數(shù)據(jù)的不完全性是此問題的原因,主要方法是使用遺傳算法引入的隨機性,因此,該算法收斂到全局最優(yōu)解或全局最優(yōu),從而向學習者提供一個令人滿意的學習內(nèi)容。
3.1個體串定義
學習資源庫里的項目和資源用1到n定義序號,序號的整數(shù)代碼用以代表一個個性化串,也就是一個遺傳算法的潛在解。一個序號代表一個染色體的一個基因。染色體表示如圖8。
3.2適應度函數(shù)
為了給學習用戶生成一個高質量的學習資源序列,適應度函數(shù)作為一個性能評判指標,因此適應度函數(shù)要包括用戶興趣模型里的個性化特征項和資源的擬合程度,同時還要考慮資源的難度系數(shù)Di。
用戶興趣模型:
學習資源模型:
根據(jù)前面章節(jié)的用戶興趣模型和學習資源模型的表示,用戶興趣模型和學習資源模型擬合程度表達式:
由此,適應度函數(shù)的表達式:
3.3交叉操作
如果一個學習資源推薦序列里含有重復的資源序號或者是資源序號超過了資源的總數(shù),則這個序列為非法路徑,為了避免非法路徑的產(chǎn)生,采用兩個父節(jié)點生成子節(jié)點的交叉操作方式。交叉幾率設置為0.9(如圖9)。
3.4變異操作
此處的變異操作和用戶興趣模型進化的變異操作是同樣的。在染色體上, 根據(jù)u* W+v* G (W 為特征項權重,G 表示基因效能, u和v 表示調(diào)節(jié)的參數(shù)) 形成的比例信息,通過輪盤賭的方式隨機獲取某個基因后, 刪除該基因, 由此獲得一個新的原始后代。通過一定的變異率Pm,變異算子在染色體上選擇基因,把該基因的特征改變,種群的差異性得到了保持,適當?shù)靥岣吡薌A的搜索效率。
每迭代一次得到一個最優(yōu)個體,把進化代數(shù)范圍內(nèi)的所有最優(yōu)個體進行排序,將評價函數(shù)值排在前十位的所對應的學習資源作為一組結果指定為遺傳算法的最終結果,作為推薦。
4本章小結
本文是基于遺傳算法的個性化學習資源的生成。在學習用戶興趣模型的基礎上,利用遺傳算法在學習資源模型中尋找比較適合學習用戶的個性化學習資源,給出了該系統(tǒng)的初步結構設計,并給出了基于開源軟件Sakai平臺開發(fā)的個性化在線學習系統(tǒng)解決方案。
作者簡介:傅偉司(1987—),女,廣東羅定人,碩士,研究方向為系統(tǒng)理論信息系統(tǒng)工程。
參考文獻
[1] Gershon.Computer Adaptive Testing[J].Journal of Applied Measurement,2005,6(01):72-77.
[2] 呂琳,韓永國.多Agent的個性化學習路徑推薦系統(tǒng)設計[J].電腦知識與技術,2013,9(26):5981-5984.
[3] Bohl,O.The sharable content object reference model (SCORM) - a critical review[J].ompter in Education,2002(02):67-75.