柯秀文
文章編號: 2095-2163(2018)03-0185-03中圖分類號: 文獻(xiàn)標(biāo)志碼: A
摘要: 關(guān)鍵詞: based on collaborative filtering technology
(Software College of Shangqiu Polytechnic ,Shangqiu 476001, Henan, China)
Abstract: Learning online based on "Internet +” technology is a new and effective way of learning, it is conducive to raise learners' knowledge and skills, but many learners finds it hard to choose the online course which they really need. Aiming at the existing problems, this paper designs an online course recommendation System based on collaborative filtering technology, and overcomes the shortcomings of collaborative filtering to provide well-directed course for learners , so as to promote the talents cultivation that based on "Internet +" technology.
Key words:
作者簡介:
收稿日期: 引言
隨著信息技術(shù)的快速發(fā)展,數(shù)字課程資源建設(shè)日益豐富,基于“互聯(lián)網(wǎng)+”[1]技術(shù)的新型學(xué)習(xí)方式得到極大的普及和推廣,這種學(xué)習(xí)方式擺脫了傳統(tǒng)學(xué)習(xí)方式在空間和時間上的限制,具有課程內(nèi)容碎片化、教學(xué)方式趣味化、學(xué)習(xí)時間(場所)自由化、學(xué)習(xí)內(nèi)容自主化等特點(diǎn)。這些特點(diǎn)符合自由學(xué)習(xí)者對學(xué)習(xí)內(nèi)容和形式的要求,使學(xué)習(xí)者具有極大的學(xué)習(xí)自由度,也吸引了越來越多的學(xué)習(xí)者參與到這種學(xué)習(xí)形式中來。
隨著基于“互聯(lián)網(wǎng)+”技術(shù)線上學(xué)習(xí)的深入發(fā)展,新的問題逐漸顯現(xiàn),學(xué)習(xí)者難以對自己的學(xué)習(xí)需要做出有效評估,面對課程平臺海量的學(xué)習(xí)資源,也難以選擇有效的方式尋找真正符合自己需要的的課程。不少學(xué)習(xí)者對線上課程的選擇出現(xiàn)了盲目性、隨意性,即通過參考別人選擇的課程隨機(jī)選擇課程,或者通過搜索引擎在課程網(wǎng)站搜索課程資源,然而這些課程選擇方式都難以保證學(xué)習(xí)者所選擇的課程真正符合自己的學(xué)習(xí)需求。
為了解決學(xué)習(xí)者線上課程選擇的問題,本文提出一種基于協(xié)同過濾算法的推薦技術(shù),從技術(shù)手段上,幫助學(xué)習(xí)者從網(wǎng)絡(luò)課程平臺上選擇符合自己需求的課程資源。
1個性化推薦技術(shù)
1.1個性化推薦技術(shù)介紹
個性化推薦技術(shù)是一種可以根據(jù)用戶已有的相關(guān)信息,為用戶提供有效的、實(shí)時的、符合個性需求服務(wù)的技術(shù),該技術(shù)和傳統(tǒng)信息檢索方式相比具有顯著的優(yōu)勢,在電子商務(wù)領(lǐng)域得到廣泛的應(yīng)用和推廣。目前,常用的個性化推薦算法主要有如下幾種:基于規(guī)則的推薦系統(tǒng)、基于內(nèi)容的推薦系統(tǒng)和基于協(xié)同過濾的推薦系統(tǒng)[2]。協(xié)同過濾算法在各類電子商務(wù)網(wǎng)站商品推薦中得到廣泛應(yīng)用,并取得了良好的個性推薦效果,因此,針對不同的線上課程學(xué)習(xí)者,選擇協(xié)同過濾算法進(jìn)行線上課程個性化推薦是可行的。
1.2協(xié)同過濾技術(shù)介紹
1992年,Goldberg等人提出協(xié)同過濾( Collaborative Filtering,CF)技術(shù),本文研究推薦的協(xié)同過濾算法主要基于學(xué)習(xí)者對一些課程的評分進(jìn)行比較,如果學(xué)習(xí)者對一些課程的評分相似,那么學(xué)習(xí)者對其他課程的評分也相似。協(xié)同過濾算法分為獲取用戶信息、相似性比較、產(chǎn)生推薦3部分[3]。
1.3協(xié)同過濾技術(shù)的應(yīng)用
1.3.1獲取線上課程用戶信息
在線課程網(wǎng)站中,可以通過學(xué)習(xí)者注冊的信息及其行為記錄為其建立個性化的推薦。注冊信息一般是用戶初始登錄課程網(wǎng)站時要填寫的相關(guān)個人信息,行為記錄方式總體上可以分為2種,一種是通過用戶對課程的評分直接獲得;另一種是通過用戶在課程頁面的停留時間、點(diǎn)擊次數(shù)轉(zhuǎn)化為評分間接獲得,2種方式各有優(yōu)缺點(diǎn)。把獲得的數(shù)據(jù)轉(zhuǎn)化為評價(jià)矩陣,見表1,Sij表示用戶i對課程j的評分。
3.2相似性比較
計(jì)算學(xué)習(xí)者目標(biāo)用戶的相關(guān)特征,并在學(xué)習(xí)者數(shù)據(jù)庫中找到與目標(biāo)用戶特征相似的用戶群,通過Pearson相關(guān)系數(shù)進(jìn)行用戶之間的相似度計(jì)算,計(jì)算公式如下:
sim(m,n)=
∑c∈Imn(Smc-Sm)(Snc-Sn)∑c∈Imn(Smc-Sm)2∑c∈Imn(Snc-Sn)2(1)
其中,sim(m,n)是2個用戶之間的相似度,Imn是2個用戶的共同評分。
1.3.3根據(jù)比較結(jié)果產(chǎn)生推薦
產(chǎn)生推薦即通過鄰居集對課程的評分來預(yù)測目標(biāo)用戶對課程的評分,從而把預(yù)測值較高的課程推薦給目標(biāo)用戶。其算法有平均加權(quán)法和評分頻度法[4]。在網(wǎng)絡(luò)課程個性化推薦中,可以根據(jù)不同的用戶,靈活地選擇合適的算法實(shí)現(xiàn)更加精準(zhǔn)的推薦。
1.4實(shí)例分析
本文以中國大學(xué)MOOC網(wǎng)絡(luò)課程推薦的實(shí)例來說明該算法的計(jì)算過程。表2示出了一個簡易的學(xué)習(xí)者課程參與表,相關(guān)課程取自中國大學(xué)MOOC網(wǎng)(https://www.icourse163.org/),其中,1表示用戶參與了該課程的學(xué)習(xí),0表示用戶沒有參與該課程學(xué)習(xí);A、B、C、D表示4名學(xué)習(xí)者用戶。
1.4.1獲取用戶信息
在本事例中可以把學(xué)習(xí)者用戶參與的課程轉(zhuǎn)化為標(biāo)量表示,即A=(1,0,1,0,0);B=(0,0,0,0,1);C=(1,0,0,1,0);D=(1,1,1,0,0)。
1.4.2相似性比較
通過相似性公式計(jì)算得到A、B、C、D這4位學(xué)習(xí)者用戶的相似性結(jié)果,見表3。
4.3產(chǎn)生推薦
通過比較得出與用戶A最為相似的學(xué)習(xí)者用戶是D,因此,可以將學(xué)習(xí)者D學(xué)習(xí)的《Enterprise Accounting》課程推薦給學(xué)習(xí)者用戶A。
1.5協(xié)同過濾算法缺陷改進(jìn)思路
利用協(xié)同過濾技術(shù)可以方便地為學(xué)習(xí)者推薦個性化的線上課程資源[5]。協(xié)同過濾技術(shù)能夠?qū)崿F(xiàn)精準(zhǔn)推薦需要用戶有足夠多的評分基礎(chǔ),用戶評分?jǐn)?shù)據(jù)越多,其推薦結(jié)果越接近于用戶實(shí)際需要。該項(xiàng)技術(shù)在實(shí)際應(yīng)用中往往存在2個問題:數(shù)據(jù)稀疏性問題和冷啟動問題[6]。
數(shù)據(jù)稀疏性問題即學(xué)習(xí)者用戶因?yàn)楦鞣N原因?qū)€上課程沒有足夠多的評分,當(dāng)評分?jǐn)?shù)量較少時很難進(jìn)行相關(guān)特征值的計(jì)算,導(dǎo)致推薦效果不理想。解決這一問題,可以采用預(yù)測填充的方法,以用戶已有課程評分為依據(jù),預(yù)判一部分相似鄰居,根據(jù)鄰居對線上課程的評分來填充用戶自己未評分的項(xiàng)目,使學(xué)習(xí)者用戶的評分?jǐn)?shù)據(jù)足夠多,產(chǎn)生推薦課程推薦給學(xué)習(xí)者用戶,并引導(dǎo)用戶對推薦課程進(jìn)行評分,逐步豐富用戶評分?jǐn)?shù)據(jù)庫,解決數(shù)據(jù)的稀疏性問題。
冷啟動問題一般是指新的學(xué)習(xí)者注冊用戶,由于初始使用線上課程,就沒有任何課程評分?jǐn)?shù)據(jù),這樣導(dǎo)致無法對其匹配鄰居用戶,無法進(jìn)行線上課程的推薦。解決冷啟動問題,可以借助課程網(wǎng)站平臺,在學(xué)習(xí)者用戶初次注冊時,讓其認(rèn)真填寫符合自己特征的相關(guān)信息,如:調(diào)查其注冊目的、學(xué)習(xí)興趣、學(xué)習(xí)目標(biāo)等等,根據(jù)用戶注冊信息,就可以直接給學(xué)習(xí)者用戶推薦相應(yīng)分類評分較高的課程。最后還要引導(dǎo)用戶對推薦課程進(jìn)行評分,獲得越來越多的真實(shí)評分?jǐn)?shù)據(jù),為更好的應(yīng)用協(xié)同過濾技術(shù)做準(zhǔn)備。
2線上課程個性化推薦系統(tǒng)模型
基于協(xié)同過濾技術(shù)的個性化課程推薦可使學(xué)習(xí)者在線上課程選擇時具有較高使用價(jià)值,可以有效地為學(xué)習(xí)者提供針對性較高的、符合個性化需求的、高質(zhì)量的線上課程。
圖1示出了基于協(xié)同過濾技術(shù)的線上課程個性化推薦系統(tǒng)設(shè)計(jì)圖。學(xué)習(xí)者用戶的相關(guān)數(shù)據(jù)信息和評分行為記錄存儲在數(shù)據(jù)庫中,需要推薦時,算法根據(jù)用戶在數(shù)據(jù)庫中的信息判斷該用戶是老用戶、新用戶、還是數(shù)據(jù)稀疏型用戶。老用戶采用普通協(xié)同過濾算法計(jì)算推薦課程;新用戶以其注冊數(shù)據(jù)信息為依據(jù)進(jìn)行課程推薦;數(shù)據(jù)稀疏型用戶首先進(jìn)行預(yù)測評分,然后再執(zhí)行普通協(xié)同過濾算法進(jìn)行課程推薦。最后要求學(xué)習(xí)者用戶對推薦課程進(jìn)行評分,并錄入數(shù)據(jù)庫,以方便系統(tǒng)為其他用戶提供更加精準(zhǔn)的推薦。
通過基于協(xié)同過濾技術(shù)線上課程個性化推薦系統(tǒng),課程網(wǎng)站可以根據(jù)學(xué)習(xí)者個性特征高效率、準(zhǔn)確地推薦符合其學(xué)習(xí)需要的網(wǎng)絡(luò)課程,解決了學(xué)習(xí)者線上課程個性化學(xué)習(xí)的問題,提升了其學(xué)習(xí)效率和學(xué)習(xí)體驗(yàn)。此外,課程網(wǎng)站還可以利用個性化推薦系統(tǒng)為學(xué)習(xí)者組建學(xué)習(xí)小組或小型學(xué)習(xí)論壇。學(xué)習(xí)小組或小型學(xué)習(xí)論壇成員均為“相似鄰居“(基于用戶“相似鄰居”產(chǎn)生推薦),相互之間有著共同的學(xué)習(xí)興趣、學(xué)習(xí)愛好、學(xué)習(xí)課程等,這樣可以有效地促進(jìn)相似用戶之間的交流討論,提高學(xué)習(xí)者學(xué)習(xí)的興趣,達(dá)到更好的學(xué)習(xí)效果。
3結(jié)束語
本文介紹了線上課程學(xué)習(xí)者在課程選擇上存在的一些問題,針對學(xué)習(xí)者難以實(shí)現(xiàn)課程個性化選擇的情況,改進(jìn)了協(xié)同過濾算法的缺陷,設(shè)計(jì)了一種基于協(xié)同過濾技術(shù)的線上課程推薦系統(tǒng),為學(xué)習(xí)者提供個性化的課程推薦。在線課程平臺在實(shí)際使用該系統(tǒng)過程中,要注重新用戶注冊數(shù)據(jù)和老用戶課程評分?jǐn)?shù)據(jù)的存儲和利用,以有效解決數(shù)據(jù)稀疏和冷啟動問題,不斷提高課程推薦精準(zhǔn)度。
參考文獻(xiàn)
[1] 中華人民共和國農(nóng)業(yè)部. "十三五"全國新型職業(yè)農(nóng)民培育發(fā)展規(guī)劃[DB/OL]. http://jiuban.moa.gov.cn/zwllm/ghjh/201701/t20170122_5461506.htm, 2017-1-22.
[2] 黃洋. 基于聚類和項(xiàng)目類別偏好的協(xié)同過濾推薦算法研究[D]. 浙江理工大學(xué),2014.
[3] You W, Shui-Sheng Y E. A Survey of Collaborative Filtering Algorithm Applied in E-commerce Recommender System[J]. Computer Technology & Development, 2006.
[4] 胡國強(qiáng),張旭虎. 基于協(xié)同過濾算法的MOOC個性化推薦系統(tǒng)[J]. 信息技術(shù),2017(6):99-103.
[5] 丁永剛,張馨,桑秋俠,等. 融合學(xué)習(xí)者社交網(wǎng)絡(luò)的協(xié)同過濾學(xué)習(xí)資源推薦[J]. 現(xiàn)代教育技術(shù),2016,26(2):108-114.
[6] 申輝繁. 協(xié)同過濾算法中冷啟動問題的研究[D]. 重慶大學(xué),2015.