喬麗娟
本文認(rèn)為盡管MOOC仍有不盡如人意的地方,但確實(shí)為許多求學(xué)無門的學(xué)子帶來了曙光。所以,基于這樣的觀點(diǎn),本文旨在分析提高學(xué)習(xí)者學(xué)習(xí)效果的方法。推薦系統(tǒng)是大數(shù)據(jù)背景下的應(yīng)用熱點(diǎn)之一,本文通過分析CanvasNetwork在2016年發(fā)布的開放數(shù)據(jù)集,設(shè)計(jì)了一個(gè)推薦系統(tǒng),根據(jù)學(xué)習(xí)者輸入的數(shù)據(jù),簡單實(shí)現(xiàn)了成績預(yù)測的功能。
【關(guān)鍵詞】MOOC 數(shù)據(jù)分析 推薦系統(tǒng)
自從2011年以來,MOOC經(jīng)歷了巨大的增長,引用《經(jīng)濟(jì)學(xué)人》的一句話就是:學(xué)術(shù)界象牙塔的基石受到了撼動(dòng)。體現(xiàn)MOOC巨大增長的一個(gè)重要方面就是注冊MOOC課程的學(xué)習(xí)者數(shù)量大大增加,達(dá)到了幾十萬甚至百萬、千萬的量級。與此同時(shí),支撐MOOC服務(wù)的后臺(tái)數(shù)據(jù)也以百萬、千萬的量級增加。這些數(shù)據(jù)真實(shí)的記錄了學(xué)習(xí)者的信息,比如學(xué)習(xí)者的年齡、學(xué)歷、參與課程原因、每周期望小時(shí)數(shù)等。除此之外,還有學(xué)習(xí)者的學(xué)習(xí)行為信息,如交互次數(shù)、訪問次數(shù)、論壇發(fā)帖數(shù)。顯而易見,MOOC數(shù)據(jù)中蘊(yùn)藏巨大的信息價(jià)值,通過MOOC數(shù)據(jù)的分析,設(shè)計(jì)MOOC推薦系統(tǒng),可以對MOOC的發(fā)展做出一定貢獻(xiàn)。
1 MOOC推薦系統(tǒng)需求分析
根據(jù)對MOOC發(fā)展現(xiàn)狀的探討,本文了解到,一方面,高校對MOOC大多報(bào)以積極的態(tài)度。有實(shí)力的高校已經(jīng)初步建設(shè)里自己的MOOC平臺(tái),他們希望通過這種大規(guī)模、開放、在線的新形式來提升教學(xué)質(zhì)量,使老師的教學(xué)、學(xué)生的學(xué)習(xí)更靈活、更有彈性。對此,高校積極組織權(quán)威教師錄制MOOC課程,但是,什么樣的課程是學(xué)生感興趣的?在分類繁雜的科目類別中,哪些課程是學(xué)生最為渴求的?另一方面,學(xué)生也活躍于各大MOOC平臺(tái)。然而,他們中大量的人僅注冊了賬號,卻未參加課程;參加了課程的,能堅(jiān)持下來的則又是少之又少。是什么原因?qū)е翸OOC的高輟學(xué)率呢?面對這些問題,對MOOC平臺(tái)數(shù)據(jù)的挖掘是具有參考價(jià)值的。
從整體需求來看,可以分為兩個(gè)層次。第一是課程資源的內(nèi)容收集,整合了各平臺(tái)的課程基礎(chǔ)信息,為用戶提供了統(tǒng)一的入口。第二是課程推薦部分,有效地利用了平臺(tái)內(nèi)部整合的信息,幫助用戶發(fā)現(xiàn)新的課程。課程資源整合收集的目的是將分散在各自平臺(tái)的課程資源聚合到一個(gè)統(tǒng)一結(jié)構(gòu)的數(shù)據(jù)庫中。課程推薦是為了幫助用戶發(fā)現(xiàn)新的課程,同時(shí)也是幫助課程發(fā)現(xiàn)新的用戶。從需求上來看,大部分用戶都有發(fā)現(xiàn)新課程的需求。課程推薦功能就是利用了平臺(tái)內(nèi)積累的用戶數(shù)據(jù),進(jìn)行合理的統(tǒng)計(jì)分析和數(shù)據(jù)分析,猜測用戶可能喜歡的課程。
2 MOOC推薦系統(tǒng)的設(shè)計(jì)及實(shí)現(xiàn)
本文的推薦系統(tǒng)設(shè)計(jì)的目的是應(yīng)用數(shù)據(jù)分析過程得出的結(jié)論。系統(tǒng)要實(shí)現(xiàn)的基本功能是用戶的注冊、登錄和系統(tǒng)的推薦。系統(tǒng)界面采用Java語言實(shí)現(xiàn),數(shù)據(jù)庫使用的是MySQL。系統(tǒng)實(shí)現(xiàn)了用戶的登錄、注冊,支持用戶添加推薦標(biāo)簽,完成了課程的推薦和成績的預(yù)測。
2.1 課程推薦設(shè)計(jì)
推薦課程設(shè)計(jì)的大致思路:首先,根據(jù)學(xué)習(xí)者添加的標(biāo)簽,依據(jù)參與課程原因、年齡、學(xué)歷和每周期望小時(shí)數(shù),根據(jù)數(shù)據(jù)分析中得出的結(jié)論可以得到適合該名學(xué)習(xí)者的學(xué)習(xí)類別。比如,學(xué)習(xí)者參與MOOC學(xué)習(xí)的目的是為了學(xué)習(xí)技能以發(fā)展新的職業(yè),那么根據(jù)前期的數(shù)據(jù)分析我們可以知道,他的首選類別會(huì)是“職業(yè)與應(yīng)用科學(xué)”。由于僅憑一個(gè)變量得到的類型既不準(zhǔn)確,也不全面,所以,作者選擇四個(gè)變量進(jìn)行分析。得到的類別是四個(gè)變量指向的科目類別的集合。其次,選擇數(shù)據(jù)庫中,類別集合里評分與關(guān)注人數(shù)的加權(quán)平均值較高的一些課程加入到推薦課程的集合。最后,將推薦課程返回界面,以列表的形式展現(xiàn)給用戶。
2.2 預(yù)測成績
類似的,成績的預(yù)測也是從學(xué)習(xí)者最初設(shè)置的標(biāo)簽出發(fā)。程序通過計(jì)算用戶輸入的交互次數(shù)、訪問天數(shù)、課程章節(jié)數(shù)、“論壇發(fā)帖數(shù)”和課程長度與“聚類結(jié)果集”之間的歐式距離,選擇歐式距離最小的結(jié)果對應(yīng)的成績分段,則可以得到用戶未來成績可能的范圍,再在該范圍中取隨機(jī)數(shù),然后返回界面顯示給用戶。
3 MOOC推薦系統(tǒng)結(jié)果分析
3.1 輸入測試用例
為直接觀察推薦的結(jié)果,輸入一組數(shù)據(jù)如表1。
3.2 輸出結(jié)果分析
返回結(jié)果如圖1所示。
4 總結(jié)
推薦系統(tǒng)的設(shè)計(jì)是當(dāng)今熱點(diǎn)之一。本文設(shè)計(jì)的推薦系統(tǒng)還有很多不足之處,將不斷吸取別人的經(jīng)驗(yàn),跟上技術(shù)創(chuàng)新的步伐,不斷學(xué)習(xí)、前進(jìn)。
參考文獻(xiàn)
[1]The Economist(2013)Theat tack of the MOOCs,TheEconomist,2013.
[2]李弘運(yùn).基于微博的在線學(xué)習(xí)資源推薦平臺(tái)核心功能設(shè)計(jì)與實(shí)現(xiàn)[D].北京郵電大學(xué),2015.
作者單位
曲阜師范大學(xué)軟件學(xué)院 山東省曲阜市 273100