劉娟 譚均翹 張靖紅 廖玉敏
摘要在新冠疫情背景下網(wǎng)絡(luò)在線教學(xué)成為“停課不停學(xué)”的主要方式,MOOC平臺被越來越被教育者和學(xué)習(xí)者所采用,平臺積累了大量的課程評論文本。將文本挖掘和數(shù)據(jù)可視化分析應(yīng)用于MOOC學(xué)習(xí)平臺,可以充分挖掘利用學(xué)習(xí)者海量的學(xué)習(xí)記錄,利用Python進行文本的情感分析和可視化方法,提取和分析平臺學(xué)習(xí)者對在線課程的學(xué)習(xí)感受,可以充分發(fā)揮教育大數(shù)據(jù)驅(qū)動課堂教學(xué)的改革與發(fā)展,并為學(xué)習(xí)者和教師提出相關(guān)建議。
關(guān)鍵詞 在線教育 情感分析 可視化
中圖分類號:G424文獻標識碼:ADOI:10.16400/j.cnki.kjdk.2021.19.026
Research on Text Analysis of Emotion Dictionary for Mathematics Courses on MOOC Platform
LIU Juan, TAN Junqiao, ZHANG Jinghong, LIAO Yumin
(School of Statistics and Mathematics, Guangdong University of Finance and Economics, Guangzhou, Guangdong 510320)
AbstractUnder the background of COVID-19, online teaching has become the main way for all kinds of schools in the country to achieve“stop classes and not stop learning”. With the wide application of online teaching, the MOOC platform has been increasingly adopted by educators and learners and accumulated a large number of curriculum evaluation texts. By applying text mining and data visualization analysis to MOOC learning platform it can make full use of massive learning records of learners. This paper uses Python to analyze and visualize the text, and extract and analyze the learning experience of online learners. By using education big data to drive the reform and development of classroom teaching, some relevant suggestions for learners, teachers are proposed.
Keywordsonline education; emotional analysis; visualization
0引言
面對突然到來的2020年新冠疫情,教育部提出的“停課不停學(xué)”的舉措,全國各類學(xué)校暫停線下教學(xué)轉(zhuǎn)為線上教學(xué),一時間各大在線教育平臺訪問量迎來爆發(fā)式增長。目前,隨著我國國內(nèi)疫情得到有效控制,線下教育得到逐步恢復(fù),但在后疫情時代在線教育將依舊持續(xù)發(fā)揮重要的作用。MOOC是中國在線教育重要平臺之一,其市場規(guī)模和用戶人數(shù)在逐年增長,截至2019年MOOC平臺的注冊用戶年超過1000萬。當前隨著人工智能、數(shù)據(jù)挖掘和機器學(xué)習(xí)等技術(shù)的飛速發(fā)展,教育領(lǐng)域的數(shù)據(jù)處理與應(yīng)用逐步走向成熟,美國在2012年10月發(fā)布《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進教與學(xué)》的報告,目的在通過對教育大數(shù)據(jù)的挖掘和分析來促進美國學(xué)校教學(xué)系統(tǒng)的變革。我國在2015年由國務(wù)院正式發(fā)布《促進大數(shù)據(jù)發(fā)展行動綱要》,其中在“公共服務(wù)大數(shù)據(jù)工程”中明確提出大力建設(shè)發(fā)展教育文化大數(shù)據(jù)。目前情感分析和觀點挖掘已經(jīng)成為自然語言處理、機器學(xué)習(xí)等多領(lǐng)域交叉關(guān)注的一個研究熱點。將文本挖掘和數(shù)據(jù)可視化分析應(yīng)用于慕課平臺在線課程的主觀評論文本,可以全面了解學(xué)生對課程的意見和建議,幫助老師和學(xué)生之間的雙向交流,提升教學(xué)質(zhì)量,也可助力MOOC平臺更好的提升服務(wù)。
隨著大數(shù)據(jù)人工智能時代的到來,情感分析已經(jīng)成為數(shù)據(jù)挖掘的一個熱門領(lǐng)域,這種方法主要是通過對文本、圖像和音頻等非結(jié)構(gòu)化數(shù)據(jù)進行分析,以此來獲取人們的觀點、態(tài)度以及看法。目前基于教育挖掘文本分析的在線教育課程評價研究相對不多,本文針對在MOOC平臺開設(shè)最多的大學(xué)數(shù)學(xué)類課程展開文本分析,可以豐富在線教育研究的范圍,也可以為全面評價教師在線教育的效果提供更多的視角。
1 MOOC平臺發(fā)展現(xiàn)狀及數(shù)學(xué)類課程介紹
根據(jù)寧夏大學(xué)現(xiàn)代教育技術(shù)所發(fā)布的《國內(nèi)高校MOOC的學(xué)科分布現(xiàn)狀研究》,我國高校MOOC的學(xué)科分布主要在理學(xué)以及工學(xué),這兩方面的課程數(shù)都在200至250區(qū)間,遠高于第三多數(shù)量的文學(xué)課程數(shù),而文學(xué)課程數(shù)只在50到100區(qū)間。MOOC平臺的學(xué)習(xí)方式充分發(fā)揮了在線學(xué)習(xí)的特點,目前已經(jīng)與北京大學(xué)、浙江大學(xué)、南京大學(xué)等共761所大學(xué)達成合作,開設(shè)了許多以大學(xué)生學(xué)習(xí)課程為主的內(nèi)容,其中包含Python語言程序設(shè)計、心理學(xué)與生活等多方面課程。MOOC平臺課程參與人數(shù)的分布,由10% 18歲以下學(xué)習(xí)者、78%的18-28歲在校學(xué)生以及12%的28歲以上的老師或?qū)W習(xí)者構(gòu)成。
MOOC上開設(shè)的公共數(shù)學(xué)類課程有高等數(shù)學(xué),線性代數(shù),概率論與數(shù)理統(tǒng)計,微積分等,其中選課人數(shù)較多的有西華大學(xué)開設(shè)的《高等數(shù)學(xué)(上)》,共112163人參與學(xué)習(xí),以及西華大學(xué)開設(shè)的《高等數(shù)學(xué)(下)》,共77671人參與學(xué)習(xí)。公共數(shù)學(xué)類課程參與人數(shù)普遍比其他數(shù)學(xué)類課程多,其中最受歡迎的線性代數(shù)課程為中國科學(xué)院大學(xué)的《線性代數(shù)》,共28780人參與學(xué)習(xí),最受歡迎的概率論與數(shù)理統(tǒng)計課程為浙江大學(xué)的《概率論與數(shù)理統(tǒng)計》,共28282人參與學(xué)習(xí)。開設(shè)數(shù)學(xué)類課程較多的學(xué)校有浙江大學(xué),電子科技大學(xué),華東師范大學(xué)等,開設(shè)的公共數(shù)學(xué)類課程中,高等數(shù)學(xué)最多,其次是線性代數(shù)。
2研究設(shè)計
2.1方法介紹
文本情感分析是指文本作者所表達的主觀信息,即作者的觀點和態(tài)度,也可以被稱為文本傾向性分析或文本觀點挖掘,其主要任務(wù)包括情感分類和屬性提取。根據(jù)MOOC平臺評論文本的特點,每條評論富有情感極性,大部分課程評論是一個句子,所以選本文選取基于情感詞典的語句級文本情感分析方法。
目前情感文本分類研究最多的是極性分類,也可以稱為褒貶分類,即判斷一篇文檔或者一個句子所包含的情感是好還是壞?,F(xiàn)在流行的情感詞典都是通過人工構(gòu)建,但人工感情詞典構(gòu)建需要大量的人力和物力,所以在文獻中更多的利用情感詞典。常用的有有BosonNLP情感詞典、知網(wǎng)Hownet情感詞典、臺灣大學(xué)NTUSD、清華大學(xué)李軍中文褒貶義詞典等等。其中,BosonNLP情感詞典是基于微博、論壇等數(shù)據(jù)來源構(gòu)建的情感詞典,這些被用于構(gòu)建BosonNLP情感詞典的基礎(chǔ)數(shù)據(jù)與本項目中MOOC平臺的課程評論數(shù)據(jù),兩者之間的形式較接近。因此,選用Bo- sonNLP情感詞典為本項目情感分析的基礎(chǔ)情感詞典。BosonNLP情感詞典包括正面情緒詞詞典、負面情緒詞詞典、否定詞詞典以及程度副詞詞典。
2.2數(shù)據(jù)采集
利用Python網(wǎng)絡(luò)爬蟲收集數(shù)據(jù),采集對象是MOOC平臺三門大學(xué)數(shù)學(xué)基礎(chǔ)課程高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計中每門開課課程的課程評論數(shù)據(jù)。爬蟲進入到每一門課程的網(wǎng)址,在該網(wǎng)址下獲取評論數(shù)據(jù),其中包括評論人、評論時間、評論內(nèi)容以及點贊數(shù)等。在爬取的過程中,考慮數(shù)據(jù)質(zhì)量,篩選評論數(shù)少于等于20條的開課課程。爬取出來的數(shù)據(jù)結(jié)果在Excel文件中展示。其中,高等數(shù)學(xué)的數(shù)據(jù)總量為17220條,線性代數(shù)的數(shù)據(jù)總量為15940條,概率論與數(shù)理統(tǒng)計的數(shù)據(jù)總量為9800條。
2.3數(shù)據(jù)預(yù)處理
將收集到的17221條高等數(shù)學(xué)課程評論數(shù)據(jù),17221條線性代數(shù)課程評價數(shù)據(jù),9801條概率論與數(shù)理統(tǒng)計的評價數(shù)據(jù)進行篩選,篩選出2020年1月1日后的評論進行分詞處理,利用python程序?qū)γ恳粭l評論進行分詞,去除停用詞,得到的是每一條評論的詞語組成的列表,再將表格導(dǎo)出,用excel進行去重以及去除列表為空的評價,得到的有效評論數(shù)為高等數(shù)學(xué)5978條,線性代數(shù)6410條,概率論與數(shù)理統(tǒng)計4962條。
2.4建立情感分析模型
在得到預(yù)處理數(shù)據(jù)的基礎(chǔ)上,首先,判斷每條評論中詞語的積極性和消極性,然后,計算每條評論的得分情況,最后,通過得分的正負性來判斷該條評論的積極性和消極性。本項目采用BonsonNLP情感詞典,該詞典中提供了否定詞詞典、程度副詞詞典、積極情緒詞詞典以及消極情緒詞詞典。假設(shè)詞語與評論得分是線性的,詞語之間相互獨立,建立評論得分模型。
2.5數(shù)據(jù)可視化
將文本數(shù)據(jù)中的所有詞語按詞頻統(tǒng)計后,利用python按評論情感正負面生成詞云圖見圖1和圖2。
從詞云圖可見,學(xué)習(xí)者對數(shù)學(xué)類課程的課程講解、課程內(nèi)容、設(shè)備使用情況、學(xué)習(xí)收獲等方面有著極高的關(guān)注度。
從高度關(guān)聯(lián)詞語可見,“講解”“好好”之間和“清晰”“詳細”反映學(xué)習(xí)者傾向于學(xué)習(xí)者傾向于講課詳細,生動,有條理的課程內(nèi)容,喜歡教師詳細地講解書本內(nèi)容以及清晰有條理的教學(xué)方注重課程學(xué)習(xí)對生活和學(xué)習(xí)的實用性式。
3研究發(fā)現(xiàn)與小結(jié)
3.1針對學(xué)生的建議
線上學(xué)習(xí)有其方便的地方,但也存在一些問題,由于缺少師生間的面對面較流,學(xué)習(xí)者在學(xué)習(xí)的過程中有難理解的地方無法及時解決,從而產(chǎn)生消極心理,學(xué)習(xí)者應(yīng)對難以理解的課程內(nèi)容應(yīng)保持平和積極的心態(tài)對待學(xué)習(xí)。由于在線課堂缺少老師的監(jiān)管,學(xué)習(xí)者容易變得懶散,所以學(xué)習(xí)者不僅要認真聽老師講課,還應(yīng)做好學(xué)習(xí)內(nèi)容的預(yù)習(xí)與復(fù)習(xí),認真完成課后內(nèi)容,課后內(nèi)容是對課上教學(xué)的有效延伸,是課堂學(xué)習(xí)的鞏固和深化,很大程度反映著學(xué)習(xí)者的學(xué)習(xí)效率和學(xué)習(xí)效果。疫情時期,學(xué)生與老師之間的交流在課后內(nèi)容上都有很大的體現(xiàn),老師布置的課后任務(wù)是教學(xué)中必不可少的一個環(huán)節(jié),起著查缺補漏的作用,學(xué)生可以通過完成課后任務(wù)鞏固知識,了解自己的學(xué)習(xí)情況,遇到不懂的及時請教老師,從而提高自身的學(xué)習(xí)效率。
3.2針對教師的建議
在線教育只是課堂的轉(zhuǎn)移,讓學(xué)生在線容易,但是做到真正在學(xué)習(xí)卻并不是很容易,在課程內(nèi)容方面,學(xué)生傾向于詳細易懂、豐富有趣、有用的課程內(nèi)容,注重課程學(xué)習(xí)對生活的實用性,而對不能理解、枯燥乏味的課程內(nèi)容有著消極的應(yīng)學(xué)心態(tài)。教師在備課時需要充分思考如何調(diào)動學(xué)習(xí)者的積極性,激發(fā)他們學(xué)習(xí)的興趣,考慮課堂的趣味性,適當增加互動來調(diào)動學(xué)習(xí)者的積極性,有針對性地設(shè)置例題檢驗學(xué)習(xí)者對知識點的掌握情況,同時可以適當準備幾道難題,供有能力的學(xué)習(xí)者課后思考。參與在線教育的學(xué)習(xí)者越來越多,聽課的不只是在校大學(xué)生,還有不少在職人員,上課的內(nèi)容應(yīng)該要讓大部分人接受。教師應(yīng)該講的盡量清晰易懂,更有條理,盡量講得生動,讓學(xué)生更能接受課程內(nèi)容。在課后方面,教師應(yīng)該加強在線教育的課后交流,力爭在學(xué)生發(fā)現(xiàn)自身弱點后能夠及時幫助他改進。
參考文獻
[1]王林梅.Web用戶評價的自動情感分析[D].哈爾濱工業(yè)大學(xué),2009.
[2]曹斌.互聯(lián)網(wǎng)上旅游評論的情感分析及其有用性研究[D].哈爾濱工業(yè)大學(xué),2012.
[3]張英杰.基于Blackboard平臺的在線學(xué)習(xí)行為分析與預(yù)測[D].內(nèi)蒙古師范大學(xué),2017.
[4]李艷紅.基于在線教育數(shù)據(jù)挖掘的個性化學(xué)習(xí)策略研究[J].微型電腦應(yīng)用,2020,36(08):45-57.