劉煥
(太原大學(xué) 外語(yǔ)師范學(xué)院,太原 030012)
我們從過(guò)去學(xué)習(xí)推薦系統(tǒng)相關(guān)研究中發(fā)現(xiàn),學(xué)習(xí)推薦系統(tǒng)通常是分析過(guò)去學(xué)生學(xué)習(xí)記錄來(lái)為學(xué)生的未來(lái)學(xué)習(xí)推薦學(xué)習(xí)方案。但是在新生剛進(jìn)入大學(xué)的時(shí)候,幫助學(xué)生選則適合學(xué)習(xí)的課程,進(jìn)而提高學(xué)生學(xué)習(xí)的興趣與信心,是一件非常重要的工作。針對(duì)學(xué)生對(duì)于課程的認(rèn)知不明確以及表達(dá)意圖不準(zhǔn)確,我們?cè)O(shè)計(jì)了一個(gè)在線選課推薦系統(tǒng),以支持學(xué)生進(jìn)行適應(yīng)性的選課。協(xié)同過(guò)濾是應(yīng)用在決策支持及推薦上常用的工具,因此,本系統(tǒng)將運(yùn)用這些技術(shù),結(jié)合學(xué)生特點(diǎn),設(shè)計(jì)在線選課的推薦系統(tǒng)。
本系統(tǒng)使用LDAP的目錄資料庫(kù)來(lái)儲(chǔ)存搜索資料,在搜集資料的程序中,運(yùn)用JAXB來(lái)簡(jiǎn)化復(fù)雜的文字處理工作,且實(shí)作一關(guān)聯(lián)規(guī)則算法,運(yùn)用協(xié)同過(guò)濾以使搜索結(jié)果能更符合使用者需求。以下我們針對(duì)LDAP、JAXB、推薦系統(tǒng)技術(shù)做簡(jiǎn)要說(shuō)明。
協(xié)同過(guò)濾推薦(Collaborative Filtering recommendation)是信息過(guò)濾和信息系統(tǒng)中的一項(xiàng)很受歡迎的技術(shù)。與傳統(tǒng)的基于內(nèi)容過(guò)濾、直接分析內(nèi)容進(jìn)行推薦不同,協(xié)同過(guò)濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些相似用戶對(duì)某一信息的評(píng)價(jià),形成系統(tǒng)對(duì)該指定用戶對(duì)此信息的喜好程度預(yù)測(cè)。與傳統(tǒng)文本過(guò)濾相比,協(xié)同過(guò)濾有下列優(yōu)點(diǎn):
(1)能夠過(guò)濾難以進(jìn)行機(jī)器自動(dòng)基于內(nèi)容分析的信息,如藝術(shù)品、音樂(lè);
(2)能夠基于一些復(fù)雜的、難以表達(dá)的概念(信息質(zhì)量、品位)進(jìn)行過(guò)濾;
(3)推薦的新穎性。
簡(jiǎn)單來(lái)說(shuō),LDAP是一個(gè)得到關(guān)于人或者資源的集中、靜態(tài)數(shù)據(jù)的快速方式。LDAP是一個(gè)用來(lái)發(fā)布目錄信息到許多不同資源的協(xié)議,通常它都作為一個(gè)集中的地址本使用,不過(guò)根據(jù)組織者的需要,可以做得更加強(qiáng)大。輕量目錄訪問(wèn)協(xié)議主要由兩部分組成:第一部分是目錄資料庫(kù),它擁有一套完善描述資料特性的資料綱要,另一部分則是查詢和處理資料庫(kù)相關(guān)的存取協(xié)議。
本系統(tǒng)的LMS是已存在的學(xué)習(xí)管理系統(tǒng),在本系統(tǒng)中為提供教材資料的角色,算是外部實(shí)體之一,它并非主動(dòng)提供資料,而是當(dāng)教師通過(guò)LMS導(dǎo)入教材資料時(shí),教材登錄界面會(huì)將該教材的首頁(yè)路徑傳給本系統(tǒng)的Web Spider程序,程序再到LMS下特定路徑抓取資料,取得資料的方式是采用分析通過(guò)HTTP所傳回的資料,因此只要該教材是由HTTP方式存取皆可適用本系統(tǒng),最后處理完成的資料會(huì)存放于LDAP目錄資料庫(kù)中。
本研究所提出的智能型推薦學(xué)習(xí)服務(wù)步驟如下:首先判斷登錄學(xué)習(xí)者于系統(tǒng)中所有勾選的興趣項(xiàng)目,得到該學(xué)習(xí)者的所有的興趣。取出所有學(xué)習(xí)者點(diǎn)選教材的記錄并篩選出與登錄學(xué)習(xí)者興趣學(xué)科相符的前N筆數(shù)據(jù)。篩選過(guò)程以興趣學(xué)科為優(yōu)先考慮,再比對(duì)其他項(xiàng)目。取出所有學(xué)習(xí)者點(diǎn)選教材之徑串行。將所有的路徑串行區(qū)分為登錄之學(xué)習(xí)者的路徑串行與其他學(xué)習(xí)者的路徑串行。并以登錄學(xué)習(xí)者的路徑開(kāi)始進(jìn)行分析,并將大于此項(xiàng)目集之其他串行做比對(duì)。若比對(duì)出相同的路徑,則將比對(duì)出相符路徑的下一個(gè)項(xiàng)目記錄下來(lái)。當(dāng)下一個(gè)項(xiàng)目的次數(shù)超過(guò)N次,并與步驟二所得之?dāng)?shù)據(jù)進(jìn)行比對(duì)。若上步驟產(chǎn)生大于或等于N筆的數(shù)據(jù),以第二步為主進(jìn)行優(yōu)先推薦;若產(chǎn)生小于N筆的數(shù)據(jù),則以上步驟進(jìn)行優(yōu)先推薦,再以步驟二之?dāng)?shù)據(jù)補(bǔ)滿N筆推薦。
圖1 系統(tǒng)架構(gòu)圖
本系統(tǒng)的后端資料收集程序和其他搜索引擎類似,當(dāng)教師通過(guò)LMS將教材上傳的同時(shí),也執(zhí)行此模塊程序,只要給定課程內(nèi)容的連結(jié),程序便會(huì)自動(dòng)找出該課程的所有內(nèi)容,并且分析HTML Tag概略,將所得的資料分為主題和一般內(nèi)容,再將分析后的資料利用JAXB的Marshaller機(jī)制,即可將散亂的資料整理成XML文檔。最后運(yùn)用JAXB機(jī)制,可存取XML文檔,將整理后的資料存進(jìn)LDAP的目錄資料庫(kù)中。
一般協(xié)同過(guò)濾都是推薦相關(guān)信息給“使用者”,而本系統(tǒng)則是使用協(xié)同過(guò)濾,推薦相關(guān)的關(guān)鍵詞給“課程”。如欲找出文章關(guān)鍵詞,最常使用的方法為文字檢索,但此法牽涉到許多的算法與技術(shù),因此本系統(tǒng)通過(guò)分析使用者所搜索的字串,過(guò)濾出該課程可能的關(guān)鍵詞,主要步驟是從資料庫(kù)中找出使用者搜索所使用的關(guān)鍵詞,并統(tǒng)計(jì)所有關(guān)鍵詞出現(xiàn)頻率。從上述項(xiàng)目集中挑出符合門坎值的項(xiàng)目,儲(chǔ)存到目錄服務(wù)器中的課程關(guān)鍵詞。過(guò)程十分淺顯易懂,雖然說(shuō)結(jié)果可靠性有待研究,但是利用此方法,不僅能取代原本復(fù)雜的工作,也達(dá)到系統(tǒng)自動(dòng)化檢索的目的。
在教師上傳教材后,將LMS上的教材課程內(nèi)容路徑當(dāng)作參數(shù)傳給資料收集程序,以筆者所在學(xué)校網(wǎng)絡(luò)教學(xué)教材內(nèi)容為例,教材內(nèi)容大多是Power-Point文件所轉(zhuǎn)換的Html文檔,程序通過(guò)事先定義好轉(zhuǎn)換接口,通過(guò)該接口即可讓系統(tǒng)符合各類教學(xué)平臺(tái)的需求。搜索服務(wù)接口以網(wǎng)頁(yè)方式呈現(xiàn),因此Client端只需Web瀏覽器即可使用本系統(tǒng),無(wú)需額外安裝其他軟件,除了一般搜索外,也提供像“授課教師”、“單元主題”或“關(guān)鍵詞”等查詢條件設(shè)定,讓查詢結(jié)果更符合使用者需求。結(jié)果呈現(xiàn),除了有LDAP Server中的教材內(nèi)容之外,還有通過(guò)關(guān)聯(lián)規(guī)則算法所開(kāi)發(fā)的相關(guān)詞及協(xié)同過(guò)濾所得到的課程關(guān)鍵詞。
本系統(tǒng)關(guān)聯(lián)規(guī)則主要是用在搜索字串的相關(guān)詞方面;而協(xié)同過(guò)濾結(jié)果則是各個(gè)課程的關(guān)鍵詞。通過(guò)這些算法的應(yīng)用所得到的結(jié)果,讓使用者能更快速、更精確地搜索到所要的資料,在資料量越大的系統(tǒng)中,越能顯現(xiàn)其功效。目前實(shí)作上是采用當(dāng)所搜集的資料增加一定數(shù)量后就執(zhí)行一次程序,并且更新之前所產(chǎn)生的資料,這樣的做法可避免因單位時(shí)間內(nèi)增加的資料太少,導(dǎo)致結(jié)果和前次產(chǎn)生的資料相近。
如前所述,推薦操作主要是思考如何在眾多的條件因素下,對(duì)相關(guān)的信息作最佳的匹配提供。整個(gè)教材推薦流程如下:首先,當(dāng)使用者通過(guò)瀏覽器接口登錄系統(tǒng)后,系統(tǒng)會(huì)判斷使用者是否為第一次登錄,若使用者為第一次進(jìn)入本系統(tǒng),則系統(tǒng)會(huì)自動(dòng)檢索是否有適合使用者的關(guān)聯(lián)規(guī)則,如果有可用的規(guī)則,通過(guò)“關(guān)聯(lián)規(guī)則”找出推薦教材,最后檢查是否有10部教材推薦給使用者;否則假如找不到可用的規(guī)則,則直接對(duì)使用者推薦使用最多的10部教材。如果在開(kāi)始時(shí)判斷出使用者不是第一次進(jìn)入本系統(tǒng),則系統(tǒng)會(huì)自動(dòng)檢索是否有與使用者適當(dāng)?shù)年P(guān)聯(lián)規(guī)則,如果有可用的規(guī)則,通過(guò)“關(guān)聯(lián)規(guī)則找出推薦教材”,接著會(huì)由使用者的學(xué)習(xí)記錄推薦教材,如果檢索規(guī)則時(shí)找不出可用的規(guī)則,則直接由使用者的學(xué)習(xí)記錄推薦教材,最后檢查是否共有10部教材推薦給使用者。
本研究提出的基于輕量目錄訪問(wèn)協(xié)議的智能型推薦學(xué)習(xí)服務(wù)系統(tǒng)以目前多元化的網(wǎng)絡(luò)學(xué)習(xí)背景為出發(fā)點(diǎn),達(dá)到實(shí)時(shí)、準(zhǔn)確的推薦學(xué)習(xí)效果。智能型推薦學(xué)習(xí)服務(wù)將學(xué)習(xí)者的顯性評(píng)比資料與隱性評(píng)比資料加以運(yùn)用,使學(xué)習(xí)者不局限于本身知識(shí)領(lǐng)域范疇內(nèi)。我們以實(shí)驗(yàn)驗(yàn)證了智能型推薦學(xué)習(xí)服務(wù)系統(tǒng)可達(dá)到獲取準(zhǔn)確率高的教材推薦以及系統(tǒng)使用滿意度高的結(jié)果。
[1]林霜梅,汪更生,陳弈秋.個(gè)性化推薦系統(tǒng)中的用戶建模及特征選擇[J].計(jì)算機(jī)工程,2007(17):196-198.
[2]張彤,李軍懷.基于XML的Web信息系統(tǒng)中數(shù)據(jù)訪問(wèn)性能優(yōu)化方法[J].西北大學(xué)學(xué)報(bào)(自然科學(xué)),2006,36(3):398-402.
[3]黎星星,黃小琴,朱慶生.電子商務(wù)推薦系統(tǒng)研究[J].計(jì)算機(jī)工程與科學(xué),2004,26(5):78-82.