馬璐鈺
摘要:針對(duì)傳統(tǒng)網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)存在的不足,該文基于個(gè)性化推薦技術(shù)和Web日志挖掘技術(shù),提出了一種新的個(gè)性化學(xué)習(xí)資源推薦模型。該模型通過(guò)分析和研究網(wǎng)絡(luò)學(xué)習(xí)行為的特點(diǎn),挖掘并分析出不同學(xué)習(xí)者的學(xué)習(xí)特征,實(shí)現(xiàn)了在線學(xué)習(xí)的個(gè)性化推薦,有效地提高了學(xué)習(xí)質(zhì)量和學(xué)習(xí)效果。
關(guān)鍵詞:Web日志挖掘;個(gè)性化推薦;網(wǎng)絡(luò)學(xué)習(xí)模型
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)23-0023-02
Abstract: Focused on the shortcomings of the traditional network learning system, this paper proposes a personalized learning resources recommended model. Based on the personalized recommendation technology and Web log mining technology , the model searches the different learning characteristics of the users through analyzing their learning behaviors in the network, and then generates the personalized recommendation for the online learning, This recommendation model can effectively improve the quality and effect of learning .
Key words: Web log mining; personalized recommendation; network learning model
1 引言
當(dāng)前,隨著網(wǎng)絡(luò)技術(shù)和信息技術(shù)的飛速發(fā)展,社會(huì)各領(lǐng)域與互聯(lián)網(wǎng)的聯(lián)系越來(lái)越緊密,不斷地影響和改變著人們的生活方式和學(xué)習(xí)方式。網(wǎng)絡(luò)在線學(xué)習(xí)作為一種全新的知識(shí)傳遞模式和學(xué)習(xí)方式,從早期的網(wǎng)絡(luò)學(xué)習(xí)平臺(tái),到如今風(fēng)靡全球的 MOOC網(wǎng)站的興起——國(guó)外的Coursera、Udacity、edX等在線課程提供商,國(guó)內(nèi)清華大學(xué)的學(xué)堂在線和網(wǎng)易的中國(guó)大學(xué)MOOC等,都讓學(xué)習(xí)者能夠不受時(shí)空限制、隨時(shí)隨地系統(tǒng)深入地學(xué)習(xí),越來(lái)越受到人們的歡迎。
網(wǎng)絡(luò)學(xué)習(xí)的快速發(fā)展也使得一些問(wèn)題逐漸浮現(xiàn),傳統(tǒng)網(wǎng)絡(luò)教學(xué)平臺(tái)沒(méi)有考慮學(xué)習(xí)者學(xué)習(xí)需求、學(xué)習(xí)風(fēng)格等個(gè)體差異,提供給學(xué)習(xí)者的學(xué)習(xí)資源千篇一律,本文利用Web日志挖掘技術(shù),根據(jù)學(xué)習(xí)者訪問(wèn)網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)保留的日志記錄,挖掘并分析出不同學(xué)習(xí)者的初始能力、學(xué)習(xí)興趣、學(xué)習(xí)風(fēng)格、學(xué)習(xí)路徑等特征,設(shè)計(jì)出個(gè)性化的學(xué)習(xí)資源推薦模型,為學(xué)習(xí)者提供更符合學(xué)習(xí)需求的資源,將提升其學(xué)習(xí)效率和學(xué)習(xí)效果,盡可能做到因材施教。
2 Web日志挖掘
在信息時(shí)代,數(shù)據(jù)就是財(cái)富。因特網(wǎng)中的數(shù)據(jù)更是呈指數(shù)級(jí)暴增,怎樣在這樣龐大的數(shù)據(jù)集合里挖掘出有價(jià)值的信息已經(jīng)成為數(shù)據(jù)挖掘的研究熱點(diǎn)。但是Web站點(diǎn)中的數(shù)據(jù)具有數(shù)據(jù)量龐大,信息源動(dòng)態(tài)強(qiáng),數(shù)據(jù)異構(gòu)或半結(jié)構(gòu)化等特點(diǎn),傳統(tǒng)的數(shù)據(jù)挖掘很難應(yīng)對(duì)。Web挖掘是數(shù)據(jù)挖掘技術(shù)的應(yīng)用與延伸,是利用數(shù)據(jù)挖掘、文本挖掘、機(jī)器學(xué)習(xí)等技術(shù)從Web頁(yè)面數(shù)據(jù)、日志數(shù)據(jù)、超鏈接關(guān)系中發(fā)現(xiàn)感興趣的、潛在的、有用的規(guī)則、模式、領(lǐng)域知識(shí)等[1]。根據(jù)挖掘中使用的數(shù)據(jù)類型,Web挖掘一般可分為三類:內(nèi)容挖掘(Web Content Mining)、結(jié)構(gòu)挖掘(Web Structure Mining)和使用挖掘(Web Usage Mining) [2]。
Web日志挖掘?qū)儆赪eb使用挖掘的一種,主要根據(jù)用戶在訪問(wèn)系統(tǒng)留下的日志文件,提取Web日志中的有效信息,結(jié)合用戶的背景、興趣等,為用戶提供個(gè)性化的推薦服務(wù),幫助優(yōu)化改善站點(diǎn)結(jié)構(gòu),使得系統(tǒng)效率得以大幅改善。在網(wǎng)絡(luò)教育中,通過(guò)對(duì)學(xué)習(xí)者訪問(wèn)Web站點(diǎn)的信息進(jìn)行挖掘,可以實(shí)現(xiàn)按知識(shí)點(diǎn)對(duì)網(wǎng)絡(luò)課程內(nèi)容進(jìn)行分類,還可以獲取學(xué)習(xí)者的訪問(wèn)方式、訪問(wèn)行為和訪問(wèn)序列等有關(guān)信息,挖掘并分析出學(xué)習(xí)者的個(gè)性特征,既滿足了學(xué)習(xí)者對(duì)知識(shí)的需求,又可以向教師或網(wǎng)絡(luò)課程制作者提供網(wǎng)絡(luò)課程的改進(jìn)意見(jiàn)[3]。
雁過(guò)留聲,學(xué)習(xí)者在訪問(wèn)Web站點(diǎn)時(shí),會(huì)留下很多寶貴的數(shù)據(jù)信息。這些信息主要包括了學(xué)習(xí)者的IP地址、訪問(wèn)時(shí)間、用戶名、訪問(wèn)出錯(cuò)信息等。這些數(shù)據(jù)信息大都包含在Web服務(wù)器的各種日志文件中[4]。收集到的日志文件有相當(dāng)比例的是無(wú)用的或者不正確的數(shù)據(jù),需要進(jìn)行數(shù)據(jù)清洗轉(zhuǎn)換、用戶識(shí)別、用戶會(huì)話識(shí)別、訪問(wèn)路徑補(bǔ)全等數(shù)據(jù)預(yù)處理操作,得到適合挖掘的結(jié)構(gòu)化會(huì)話數(shù)據(jù)。然后利用統(tǒng)計(jì)分析、關(guān)聯(lián)規(guī)則、序列模式、聚類與分類等挖掘技術(shù)得到數(shù)據(jù)背后隱藏的有用模式集合。最后一步是模式分析,根據(jù)數(shù)據(jù)預(yù)處理和模式識(shí)別的結(jié)果,對(duì)數(shù)據(jù)做進(jìn)一步的分析,提取有價(jià)值的規(guī)則集合,即用戶的個(gè)性特征,并將其可視化。具體流程如圖1所示。
3 個(gè)性化學(xué)習(xí)資源推薦模型設(shè)計(jì)
基于Web日志挖掘的個(gè)性化學(xué)習(xí)資源推薦系統(tǒng),利用Web日志挖掘技術(shù)和個(gè)性化推薦技術(shù),在傳統(tǒng)網(wǎng)絡(luò)在線學(xué)習(xí)系統(tǒng)的基礎(chǔ)上設(shè)計(jì)了相應(yīng)模塊,使得該學(xué)習(xí)系統(tǒng)能夠?qū)eb服務(wù)器上學(xué)習(xí)者的訪問(wèn)日志進(jìn)行Web訪問(wèn)信息挖掘,挖掘并分析出學(xué)習(xí)者的訪問(wèn)序列,從而根據(jù)學(xué)習(xí)者的學(xué)習(xí)特征、學(xué)習(xí)行為和學(xué)習(xí)軌跡等分析和考慮學(xué)習(xí)者的學(xué)習(xí)風(fēng)格、學(xué)習(xí)習(xí)慣和學(xué)習(xí)興趣等,而不是僅僅考慮認(rèn)知水平和學(xué)習(xí)進(jìn)度,對(duì)學(xué)習(xí)者的后續(xù)學(xué)習(xí)行為及目標(biāo)知識(shí)進(jìn)行合理預(yù)測(cè)和個(gè)性化推薦,更好地提供個(gè)性化學(xué)習(xí)服務(wù),發(fā)揮系統(tǒng)的社會(huì)價(jià)值,有利于形成終身學(xué)習(xí)的學(xué)習(xí)型社會(huì)。
本系統(tǒng)主要由六個(gè)模塊組成:登錄模塊、Web日志挖掘處理模塊、知識(shí)庫(kù)、個(gè)性化推薦模塊、常規(guī)功能模塊和學(xué)習(xí)資源庫(kù),如圖2所示。用戶登錄時(shí)必須首先注冊(cè),并認(rèn)真填寫(xiě)系統(tǒng)管理員設(shè)計(jì)的調(diào)查問(wèn)卷,生成用戶個(gè)性化信息資料,建立初始用戶對(duì)資源的興趣矩陣,避免出現(xiàn)系統(tǒng)冷啟動(dòng)問(wèn)題。該系統(tǒng)中有傳統(tǒng)在線學(xué)習(xí)系統(tǒng)具有的功能,如用戶管理、學(xué)習(xí)資源管理、在線測(cè)試、網(wǎng)上答疑和教學(xué)評(píng)價(jià)等,同時(shí)該系統(tǒng)中也包含了一個(gè)核心的個(gè)性化的智能模塊——Web日志挖掘處理模塊,以實(shí)現(xiàn)對(duì)學(xué)習(xí)者和頁(yè)面的聚類及學(xué)習(xí)者學(xué)習(xí)規(guī)律、學(xué)習(xí)風(fēng)格的分析。當(dāng)用戶訪問(wèn)系統(tǒng)時(shí),該模塊主要完成以下兩方面操作:第一,利用K-Means聚類算法進(jìn)行分析,根據(jù)學(xué)習(xí)者和頁(yè)面兩種對(duì)象根據(jù)它們之間的相似度分為若干小組,相似對(duì)象構(gòu)成一組。如發(fā)現(xiàn)某些頁(yè)面屬于同一小組,可在學(xué)習(xí)者訪問(wèn)其中頁(yè)面時(shí)將本組其他頁(yè)面推薦給學(xué)習(xí)者。同時(shí),同一組學(xué)習(xí)者一般具有相似的學(xué)習(xí)特征,可對(duì)同組學(xué)習(xí)者提供相同的個(gè)性化推薦服務(wù)。第二,利用Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則發(fā)現(xiàn)。在數(shù)據(jù)預(yù)處理模塊中,提取了學(xué)習(xí)者訪問(wèn)的頁(yè)面路徑序列,利用關(guān)聯(lián)規(guī)則挖掘,可以得到學(xué)習(xí)者訪問(wèn)請(qǐng)求的關(guān)聯(lián)規(guī)則,發(fā)掘?qū)W習(xí)者具有潛在興趣的知識(shí)點(diǎn)之間的關(guān)聯(lián),并實(shí)時(shí)地推送給學(xué)生。例如,學(xué)生訪問(wèn)了頁(yè)面A后,又訪問(wèn)頁(yè)面B,如果完成此類操作的學(xué)生數(shù)量超過(guò)預(yù)設(shè)的值時(shí),系統(tǒng)即認(rèn)為頁(yè)面A與頁(yè)面B之間存在關(guān)聯(lián)。以后學(xué)生在訪問(wèn)頁(yè)面A時(shí),系統(tǒng)就會(huì)自動(dòng)地提供指向頁(yè)面B的鏈接[5]。經(jīng)過(guò)這兩步的操作,不僅可以達(dá)到為學(xué)習(xí)者推薦符合其學(xué)習(xí)特征的個(gè)性化學(xué)習(xí)資源目的,還可以動(dòng)態(tài)監(jiān)測(cè)學(xué)習(xí)者學(xué)習(xí)興趣和記錄學(xué)習(xí)軌跡,以便及時(shí)采取合理的推薦策略,調(diào)整推薦學(xué)習(xí)內(nèi)容,更好地突出學(xué)習(xí)者的主體地位,為學(xué)習(xí)者提供個(gè)性化特征服務(wù)。
4 結(jié)語(yǔ)
本文在傳統(tǒng)網(wǎng)絡(luò)在線學(xué)習(xí)系統(tǒng)基礎(chǔ)上,利用Web日志挖掘技術(shù),構(gòu)建了個(gè)性化學(xué)習(xí)資源推薦模型。本系統(tǒng)改變了傳統(tǒng)的教學(xué)模式和教學(xué)方法,使得學(xué)生會(huì)根據(jù)自己的學(xué)習(xí)興趣選擇學(xué)習(xí)內(nèi)容自行在線學(xué)習(xí),在一定程度上達(dá)到了因材施教,按需學(xué)習(xí)的效果,同時(shí)也有利于改善在線學(xué)習(xí)系統(tǒng)的設(shè)計(jì)以及建立個(gè)性化的學(xué)習(xí)站點(diǎn),有效提高了學(xué)習(xí)質(zhì)量和學(xué)習(xí)效果,幫助學(xué)生更好地學(xué)習(xí),有利于形成終身學(xué)習(xí)的學(xué)習(xí)型社會(huì)。
參考文獻(xiàn):
[1] 張琰,王強(qiáng),安萍.基于Web文本挖掘相關(guān)技術(shù)的研究[J]. 科協(xié)論壇, 2012(9):83-84.
[2] Yoon Ho Cho,Jae Kyeong Kim. Application of Web usage mining and product taxonomy to collaborative recommendations in e-commerce[J]. Expert Systems With Applications,2004,26(2).
[3] 趙德偉,高江錦,徐正巧. 基于K-means算法的Web日志挖掘在移動(dòng)學(xué)習(xí)中的實(shí)現(xiàn)[J].電腦編程技巧與維護(hù), 2012(16):92-94.
[4] 肖建瓊.WEB日志挖掘在個(gè)性化網(wǎng)絡(luò)課程設(shè)計(jì)中的應(yīng)用[J].福建電腦, 2007(1):148-149.
[5] 徐怡,徐汀榮.基于Web日志挖掘的個(gè)性化教育系統(tǒng)的研究與實(shí)現(xiàn)[J].福建電腦,2009, 25(6):90-90.
【通聯(lián)編輯:代影】