游琪 陳紅玲
DOI:10.19850/j.cnki.2096-4706.2021.09.033
摘? 要:隨著移動互聯(lián)網(wǎng)的發(fā)展,人們紛紛轉(zhuǎn)向在線課程等線上學(xué)習(xí),然而海量學(xué)習(xí)資源的出現(xiàn)引發(fā)了諸如“學(xué)習(xí)迷航”和“信息過載”等問題,給學(xué)習(xí)者帶來巨大挑戰(zhàn),亟待解決。文章運(yùn)用lxml、RE等爬蟲手段獲取慕課網(wǎng)用戶和用戶學(xué)習(xí)課程相關(guān)信息,并利用Python軟件對慕課網(wǎng)在線學(xué)習(xí)者的特征進(jìn)行可視化數(shù)據(jù)分析,基于學(xué)習(xí)者特征構(gòu)建個性化學(xué)習(xí)路徑,有效解決了網(wǎng)絡(luò)迷航問題。
關(guān)鍵詞:在線學(xué)習(xí)者;特征;個性化;學(xué)習(xí)路徑
中圖分類號:TP391? ? ? 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2021)09-0127-04
Research on Personalized Learning Path Based on the Characteristics of?Online Learners
YOU Qi,CHEN Hongling
(Guangdong Polytechnic of Science and Technology,Zhuhai? 519090,China)
Abstract:With the development of mobile internet,people have turned to online courses and other online learning. However,the emergence of a large number of learning resources has caused problems such as “l(fā)earning trek” and “information overload”,which has brought great challenges to learners and need to be solved urgently. In this paper,crawling means such as lxml and RE are used to obtain the relevant information of IMOOC users and user learning courses,and Python software is used to make visual data analysis to the characteristics of IMOOC online learners,and builds a personalized learning path based on learnerscharacteristics,which effectively solves the problem of network getting lost.
Keywords:online learner;characteristic;personalized;learning path
0? 引? 言
中共中央、國務(wù)院印發(fā)的《中國教育現(xiàn)代化2035》提出,推進(jìn)教育現(xiàn)代化要“更加注重因材施教的教育理念”,并將“加快信息化時代教育變革,利用現(xiàn)代技術(shù)加快推動人才培養(yǎng)模式改革,實(shí)現(xiàn)規(guī)?;逃c個性化培養(yǎng)的有機(jī)結(jié)合”作為重要的戰(zhàn)略任務(wù)[1]。新時代以“學(xué)習(xí)者為中”的人才培養(yǎng)模式為學(xué)習(xí)者提供個性化學(xué)習(xí)環(huán)境,學(xué)習(xí)者可以根據(jù)自己的需求進(jìn)行學(xué)習(xí),激發(fā)學(xué)習(xí)的自主學(xué)習(xí)意識。隨著移動互聯(lián)網(wǎng)的蓬勃發(fā)展,在線學(xué)習(xí)已成為學(xué)生的一種常態(tài),各類在線教育平臺拔地而起,網(wǎng)絡(luò)學(xué)習(xí)資源層出不窮,人們在汲取知識的同時也面臨著新的問題,如“信息過載”、“網(wǎng)絡(luò)迷航”等,都會阻止學(xué)習(xí)者的個性化學(xué)習(xí)路徑的發(fā)展。因此,迫切需要解決制約個性化學(xué)習(xí)路徑中的諸多因素,如學(xué)習(xí)者特征、學(xué)習(xí)者需求等。
1? 學(xué)習(xí)路徑
1.1? 國外相關(guān)研究
國外對于學(xué)習(xí)路徑方面的研究側(cè)重于學(xué)習(xí)路徑的算法實(shí)現(xiàn)。例如:提出一種基于圖論的學(xué)習(xí)設(shè)計(jì)推薦系統(tǒng)的構(gòu)建模型,挖掘教育數(shù)據(jù)相關(guān)新特性,使用小團(tuán)體概念幫助學(xué)習(xí)者在學(xué)習(xí)過程中找到合適的學(xué)習(xí)對象,建立有效的學(xué)習(xí)路徑[2];基于學(xué)生學(xué)習(xí)方式的需求,應(yīng)用群體智能模型和蟻群優(yōu)化方法,在靜態(tài)和動態(tài)學(xué)習(xí)單元中尋找合適的學(xué)習(xí)路徑[3]。
1.2? 國內(nèi)相關(guān)研究
國內(nèi)則側(cè)重于通過大數(shù)據(jù)對學(xué)習(xí)者的行為習(xí)慣進(jìn)行分析,主要集中在學(xué)習(xí)行為、知識結(jié)構(gòu)、學(xué)習(xí)模式和情境推薦學(xué)習(xí)路徑。例如:單佩佩基于知識圖譜的個性化推薦研究,從知識圖譜的定義出發(fā),綜述了知識圖譜的知識提取、表達(dá)、存儲和檢索以及教育資源個性化推薦方向的應(yīng)用研究進(jìn)展[4];段玉聰?shù)然谥R圖譜的云端個性化測試推薦,將知識圖譜引入到非結(jié)構(gòu)化語義信息中來改進(jìn)搜索效率和目標(biāo)有效性,語義知識豐富了基于內(nèi)容的搜索,增強(qiáng)了所推薦內(nèi)容的正確性,降低了計(jì)算復(fù)雜度[5];姜強(qiáng)等基于AprioriAll算法,整合知識水平相當(dāng)、學(xué)習(xí)偏好接近的學(xué)習(xí)群體行為軌跡,根據(jù)學(xué)習(xí)者特征、學(xué)習(xí)的難度等級、學(xué)習(xí)的媒體類型等要素,繪制學(xué)習(xí)路徑,用以支持個性化學(xué)習(xí)[6]。
基于上述情況,個性化學(xué)習(xí)路徑已成為在線學(xué)習(xí)平臺中不可或缺的部分,研究也有很多,但是針對在線學(xué)習(xí)者特征分析的個性化學(xué)習(xí)路徑很少。
2? 在線學(xué)習(xí)者特征
據(jù)中國互聯(lián)網(wǎng)信息中心(CNNIC)發(fā)布的第47次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報告》[7]顯示,截至2020年12月,我國在線教育用戶規(guī)模達(dá)3.42億,較2020年3月減少8 125萬,占網(wǎng)民整體的34.6%;手機(jī)在線教育用戶規(guī)模達(dá)3.41億,較2020年3月減少7 950萬,占手機(jī)網(wǎng)民的34.6%,如圖1所示。
隨著教育信息技術(shù)的發(fā)展,在線學(xué)習(xí)逐漸成為人們的關(guān)注點(diǎn)。特別是2020年,受新冠肺炎疫情影響,教育信息化進(jìn)一步深化落實(shí),各類在線學(xué)習(xí)平臺也推出了五花八門的在線學(xué)習(xí)類型,一定程度上滿足了廣大用戶的個性化教育的需求。在線學(xué)習(xí)平臺的優(yōu)勢在于可以隨時隨地學(xué)習(xí)、資源重復(fù)利用、投入資金較少、每個人都可享受高質(zhì)量課程資源等,這是傳統(tǒng)教學(xué)模式無法比擬的。但是,學(xué)習(xí)者們在享受這些在線學(xué)習(xí)平臺便捷服務(wù)的同時,也面臨著信息過載等問題,如何在眾多的在線教育平臺中為學(xué)習(xí)者推薦滿意的、符合需求的課程,節(jié)省學(xué)習(xí)者時間成本、提高學(xué)習(xí)者滿意度、增加學(xué)習(xí)者黏性是在線教育平臺的關(guān)注重點(diǎn)和亟須解決的問題。為此,個性化推薦系統(tǒng)應(yīng)運(yùn)而生,該系統(tǒng)能有效地解決信息過載的問題。
在線學(xué)習(xí)平臺積累了大量的用戶學(xué)習(xí)數(shù)據(jù),包括學(xué)習(xí)者的基本信息、在線學(xué)習(xí)行為、習(xí)慣統(tǒng)計(jì)數(shù)據(jù)、在線學(xué)習(xí)效果評估等,圖2是慕課網(wǎng)某課程學(xué)習(xí)的用戶數(shù)量可視化統(tǒng)計(jì)。
3? 在線學(xué)習(xí)者數(shù)據(jù)分析
3.1? 在線學(xué)習(xí)的數(shù)據(jù)獲取
在線學(xué)習(xí)者在學(xué)習(xí)過程中產(chǎn)生的一些歷史數(shù)據(jù),如學(xué)習(xí)時間、發(fā)帖討論、在線測試和練習(xí)等。運(yùn)用lxml、RE等爬蟲手段,將慕課網(wǎng)上學(xué)習(xí)者相關(guān)在線學(xué)習(xí)信息爬取并存儲到CSV文件中。主要步驟為:
(1)請求解析課程信息,關(guān)鍵代碼為:
html = requests.get(url, headers=head)
selector = etree.HTML(html.text)
content = selector.xpath("http://html")
(2)通過XPath或RE匹配獲取課程名稱、課程URL、課程類型等信息。關(guān)鍵代碼為:
course_id = int(url.replace('http://www.imooc.com/learn/', ''))
course_name = each.xpath('//h2[@class="l"]/text()')
course_type_other = each.xpath('//div[@class="path"]/a[3]/text()')
if course_type_other:
course_type = each.xpath('//div[@class="path"]/a[2]/text()')[0] + '-' + each.xpath('//div[@class="path"]/a[3]/text()')[0]
else:
course_type = 'other-' + each.xpath('//div[@class="path"]/a[2]/span/text()')[0]
print('course_type: ' + course_type)
(3)解析學(xué)習(xí)難度關(guān)鍵代碼為:
course_difficulty = each.xpath('//div[@class="static-item l"]/span[@class="meta-value"]/text()')[0]
(4)解析學(xué)習(xí)時長關(guān)鍵代碼為:
course_time_1 = each.xpath('//div[@class="static-item l"]/span[@class="meta-value"]/text()')[1]
print('course_time_1: ' + course_time_1)
course_time_2 = course_time_1.strip().replace(u'小時', 'h').replace(u'分', 'm')
(5)打開并創(chuàng)建csv文件,將爬取到的內(nèi)容寫入到csv文件中。創(chuàng)建線程池,構(gòu)建爬取課URL,一般慕課網(wǎng)的課程URL,執(zhí)行爬蟲。將爬取的數(shù)據(jù)進(jìn)行整理,得到慕課網(wǎng)用戶的在線學(xué)習(xí)信息。該信息包括靜態(tài)特征的學(xué)習(xí)者個人基本信息和具有動態(tài)特征的相關(guān)信息。
3.2? 靜態(tài)特征數(shù)據(jù)
在線學(xué)習(xí)者的個人基本信息、歷史學(xué)習(xí)成績和學(xué)習(xí)背景,這些特征記載著學(xué)習(xí)者的基本信息,是分析學(xué)習(xí)者特征的基礎(chǔ),這類數(shù)據(jù)一般情況是沒有變化的。
3.3? 動態(tài)特征數(shù)據(jù)
該數(shù)據(jù)包含學(xué)習(xí)者的在線學(xué)習(xí)行為、學(xué)習(xí)實(shí)效等,這個數(shù)據(jù)是時刻有變化的。通過Python軟件對爬取的用戶學(xué)習(xí)課程情況數(shù)據(jù)進(jìn)行分析,如圖3所示;該圖顯示的用戶在過去一年內(nèi)的學(xué)習(xí)集中在Web前端技術(shù)的學(xué)習(xí)。
用戶數(shù)排名前10不同地區(qū)的不同性別的用戶的學(xué)習(xí)情況統(tǒng)計(jì),如圖4、圖5、圖6、圖7所示。
圖4、圖5、圖6、圖7是從用戶學(xué)習(xí)課程數(shù)、用戶學(xué)習(xí)積分、用戶學(xué)習(xí)經(jīng)驗(yàn)和用戶學(xué)習(xí)分鐘數(shù)四個方面進(jìn)行了統(tǒng)計(jì)。根據(jù)這些數(shù)據(jù),在線平臺可以重點(diǎn)推薦一些資源給用戶活躍度高的地區(qū)。
根據(jù)上述特征,慕課網(wǎng)隨機(jī)給出了視頻、作業(yè)、章節(jié)測試、討論和過關(guān)游戲等基本模塊應(yīng)用滿意度的在線問卷調(diào)查,共有254 562人填寫了問卷,調(diào)查結(jié)果顯示如圖8所示。
從圖8中可以看出,學(xué)習(xí)者對于課程模塊中的討論和過關(guān)游戲滿意程度均達(dá)到80%以上,根據(jù)該調(diào)查問卷,課程建設(shè)者可以修改相應(yīng)的學(xué)習(xí)模塊資源,既可以提高用戶的學(xué)習(xí)興趣,又能推廣課程的應(yīng)用。
4? 基于學(xué)習(xí)者特征構(gòu)建個性化學(xué)習(xí)路徑
從圖8中,可以看出在線學(xué)習(xí)者對課程模塊中的討論和過關(guān)游戲類的學(xué)習(xí)模塊滿意度較高,對于常規(guī)的視頻和作業(yè)滿意度較低。綜合學(xué)習(xí)者的靜態(tài)、動態(tài)特征和課程問卷調(diào)查結(jié)果,構(gòu)建出符合學(xué)習(xí)者特性的認(rèn)知和行為習(xí)慣的個性化學(xué)習(xí)路徑,如圖9所示。
該學(xué)習(xí)路徑的進(jìn)行模式:根據(jù)學(xué)習(xí)者的學(xué)習(xí)狀態(tài)采用不同的匹配策略向?qū)W習(xí)者推薦個性化學(xué)習(xí)列表,學(xué)習(xí)者依據(jù)自己的需求選擇一個最合適的學(xué)習(xí)列表進(jìn)行學(xué)習(xí),然后測試學(xué)習(xí)效果,這個效果可以生成學(xué)習(xí)者的動態(tài)特征。為了能向?qū)W習(xí)者精準(zhǔn)推薦個性化學(xué)習(xí)列表,因此,需要保證學(xué)習(xí)動態(tài)特征的產(chǎn)生過程是不斷迭代的;個性化學(xué)習(xí)列表推薦可以讓學(xué)習(xí)者根據(jù)每個人自己的情況自主選擇學(xué)習(xí)方式,避免了向?qū)W習(xí)者強(qiáng)制推薦學(xué)習(xí)內(nèi)容而導(dǎo)致的學(xué)習(xí)者厭煩情緒。
5? 結(jié)? 論
通過分析在線學(xué)習(xí)者特征類型,運(yùn)用lxml、RE等爬蟲手段獲取了慕課網(wǎng)用戶和用戶學(xué)習(xí)課程相關(guān)信息,并利用Python軟件對慕課網(wǎng)在線學(xué)習(xí)者的特征進(jìn)行了可視化數(shù)據(jù)分析,構(gòu)建了基于學(xué)習(xí)者特征構(gòu)建的個性化學(xué)習(xí)路徑,有效解決了在線學(xué)習(xí)中的“信息過載”“網(wǎng)絡(luò)迷航”問題。但同時是也存在一些問題,如:對于新用戶的特征,需要積累一段時間的迭代數(shù)據(jù)才能夠構(gòu)建出對應(yīng)的模型及相關(guān)學(xué)習(xí)路徑,考慮動態(tài)時間序列對所有在線學(xué)習(xí)者特征進(jìn)行建模分析,是下一步解決個性化學(xué)習(xí)路徑的關(guān)鍵。
參考文獻(xiàn):
[1] 中共中央國務(wù)院印發(fā)《中國教育現(xiàn)代化2035》 [J].人民教育,2019(5):7-10.
[2] 鐘紹春.構(gòu)建信息時代教育新模式 [J].電化教育研究,2019,40(4):23-29.
[3] 中國互聯(lián)網(wǎng)絡(luò)信息中心.CNNIC發(fā)布第47次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報告》 [R/OL].(2021-02-03).http://cnnic.cn/gywm/xwzx/rdxw/20172017_7084/202102/t20210203_713 64.htm.
[4] 唐燁偉,茹麗娜,范佳榮,等.基于學(xué)習(xí)者畫像建模的個性化學(xué)習(xí)路徑規(guī)劃研究 [J].電化教育研究,2019,40(10):53-60.
[5] 單佩佩.基于知識圖譜的個性化推薦研究 [J].電腦知識與技術(shù),2020,16(36):177-178+184.
[6] 段玉聰,邵禮旭,崔立真,等.基于知識圖譜的云端個性化測試推薦 [J].小型微型計(jì)算機(jī)系統(tǒng),2018,39(12):2743-2747.
[7] 黃立威,江碧濤,呂守業(yè),等.基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述 [J].計(jì)算機(jī)學(xué)報,2018,41(7):1619-1647.
作者簡介:游琪(1981—),女,漢族,江西九江人,講師,碩士研究生,研究方向:教育大數(shù)據(jù);陳紅玲(1980—),女,漢族,湖南邵陽人,講師,碩士研究生,研究方向:大數(shù)據(jù)挖掘。
收稿日期:2021-03-08
基金項(xiàng)目:廣東省教育科學(xué)“十三五”規(guī)劃項(xiàng)目(2018GXJK320,2019GXJK272)