毛燁,許建林
(江蘇農牧科技職業(yè)學院,江蘇泰州 225300)
隨著國家“新基建”的深入開展和教學信息化的不斷普及,不但推動了大數(shù)據(jù)、云計算、物聯(lián)網、人工智能等新技術的發(fā)展,也更新了傳統(tǒng)的教育教學觀念,正在逐漸改變一些教育教學行為。特別是2021年7月,教育部等部門專門發(fā)布了《教育部等六部門關于推進教育新型基礎設施建設構建高質量教育支撐體系的指導意見》[1],要求“促進信息技術與教育教學的深度融合”“普及教育應用”“創(chuàng)新評價應用”“拓展研訓應用”“深化管理應用”等。2020年初,為應對新冠肺炎疫情,幾乎所有學校都開展“停課不停學”的在線教學。經過近2年的建設,各類網絡教學平臺已日漸完善,基本實現(xiàn)“從專用資源向大資源轉變”[2],師生信息素養(yǎng)不斷提高,相關課程也逐漸形成“線上與線下相結合”的教學模式,教師和學生的平臺使用情況產生了豐富的在線教學數(shù)據(jù)和在線資源使用記錄。然而如此海量的教學行為數(shù)據(jù)對學校決策、學生學習規(guī)劃和老師教學方案制定都有重大作用,基于大數(shù)據(jù)的在線教學數(shù)據(jù)分析也愈發(fā)重要[3]。
論文以《平面設計》課程為例,采用各種大數(shù)據(jù)技術,對該課程的在線教學數(shù)據(jù)進行分析,并對結果進行可視化展示,以指導學生和教師調整學習與教學行為。
基于大數(shù)據(jù)的數(shù)據(jù)分析與展示主要包括6個流程。技術流程圖如圖1所示:
圖1 基于大數(shù)據(jù)的數(shù)據(jù)分析與展示技術流程圖
(1)Hadoop平臺部署安裝。作為一個開源平臺,用戶可以在不了解Hadoop底層分布細節(jié)的情況下,開發(fā)分布式的程序,以充分利用廉價機器集群的運算速度和分布存儲的數(shù)據(jù)。
(2)數(shù)據(jù)采集。使用Python語言,輔以強大的軟件工具包,編寫爬蟲腳本,自動解析網頁,獲取數(shù)據(jù)。采集的離線數(shù)據(jù),輸出保存到Hadoop的HDFS目錄中。
(3)數(shù)據(jù)清洗。使用MapReduce對HDFS中的數(shù)據(jù)進行預處理,將數(shù)據(jù)轉換成便于統(tǒng)計和分析的相對結構化的數(shù)據(jù)。
(4)數(shù)據(jù)分析。數(shù)據(jù)清洗后的仍在MapReduce中進行統(tǒng)計、分析,在HDFS中生成數(shù)據(jù)輸出目錄。
(5)數(shù)據(jù)可視化。用Python+echarts來進行數(shù)據(jù)可視化展示,并在HTML頁上呈現(xiàn)。
(6)綜合分析。結合數(shù)據(jù)分析和數(shù)據(jù)可視化結果,發(fā)現(xiàn)學生學習行為規(guī)律,及時讓老師調整教學策略,提醒學生學習重點和難點,提升教學的效率。
大數(shù)據(jù)平臺搭建于VMware Workstation Pro上,選用Cent OS7作為系統(tǒng),安裝全分布Hadoop,其中一臺為管理節(jié)點,其他四臺為數(shù)據(jù)節(jié)點。依次安裝好JDK、Hadoop、Hive、Zookeeper、Hbase、Spark等軟件。通過FileZilla上傳至hadoop1目錄下的ope中。
安裝5臺Centos系統(tǒng)。安裝好后需修改主機名,設置靜態(tài)IP和hosts,創(chuàng)建普通用戶,配置好SSH。先安裝cent os7系統(tǒng),將主機名改為hadoop1修改命令:vim/etc/sysconfig/network,然后保存:wq。然后使用命令:cd/etc/sysconfig/network-scripts/ifcfg-eth33修改IP地址:172.16.1.41。如圖2所示。
圖2 IP映射關系圖
配置Hadoop{“hadoop.env.sh,core-site.xml,hdfssite.xml,mapred-site.xml,yarn-site.xml,slaves”},共配置6個文件。
依次配置完上述6個文件后,將hadoop1復制到其他計算機,修改機器名為hadoop2,hadoop3,hadoop4,hadoop5,最后輸入命令hdfs namenode-format進行格式化一下,在虛擬機hadoop1中進入目錄/usr/local/src/hadoop-2.6.0/sbin/,輸入start-all.sh,啟動Hadoop集群。
其余各軟件的安裝步驟與hadoop相類似,不再重復,安裝路徑及部署位置如表1所示:
表1 各軟件安裝路徑及部署位置
基于大數(shù)據(jù)的在線課程教學數(shù)據(jù)分析流程如圖3所示。在線教學平臺的教學大數(shù)據(jù)經過預處理后,導入Hadoop平臺進行處理并建立HBase數(shù)據(jù)表。最后經過Mapreduce清洗后得到最終用于可視化展示的數(shù)據(jù)。
圖3 數(shù)據(jù)分析流程圖
為了對學生劃分等級和教學重點規(guī)劃,論文采集了江蘇某高職學校2019級的計算機網絡技術三個班的《平面設計》課程教學數(shù)據(jù),一共獲得109名學生的數(shù)據(jù),將獲取的數(shù)據(jù)導入組件Hadoop平臺,按表2和表3的字段命名規(guī)則在HBase建立數(shù)據(jù)表,以對這部分學生數(shù)據(jù)進行分析。
表2 學生樣本基本信息數(shù)據(jù)表
表3 學生登錄信息表
表4 當日人均登錄時長
表5 學生章節(jié)得分表
將預處理后的109名學生的在線學習平臺數(shù)據(jù)存儲到HBase中,使用大數(shù)據(jù)技術與數(shù)據(jù)查詢技術提取學習者特征信息和章節(jié)特征信息,對學生進行學習行為統(tǒng)計和分析,將上課的學生成績與教學任務相聯(lián)系,以便科學建立學習者行為習慣、學習績效及教學任務重難點之間的聯(lián)系[4]。
3.3.1 教學平臺活躍度
(1)學生每日登錄人數(shù)統(tǒng)計
通過MySQL查詢學生登錄信息表,來統(tǒng)計每天登錄教學平臺人數(shù)和平均每天登錄平臺的人數(shù)。
表6 每天登錄教學平臺人數(shù)
表7 平均每天登錄平臺人數(shù)
(2)可視化展示
圖4 每日(部分日期)登錄人數(shù)可視化展示
(3)數(shù)據(jù)分析
一個時間周期內,教學平臺登錄人數(shù)在3月4日達到了頂峰,間隔一周后在3月10日又達到了高峰。根據(jù)授課計劃,每周二和周三為上課的日期,學生會在上課前完成課前預習任務和課后任務。其余每個非周末的時間,也有將近半數(shù)的學生會登錄平臺,而登錄人數(shù)較低的日期為周末。
3.3.2 學習登錄次數(shù)與時長統(tǒng)計
(1)學習登錄次數(shù)、時長統(tǒng)計
通過建立0-24時全時段數(shù)據(jù)表來保存學生每次登錄平臺和離開平臺時間,并通過關聯(lián)查詢來統(tǒng)計每個登錄號十天內的累計學習時長。
表8 連續(xù)10天學生累計學習時長前10名登錄次數(shù)及時長
?
(2)可視化展示
圖5 連續(xù)10天學生累計學習時長(前10名)可視化展示
圖6 連續(xù)10天學生累計學習時長(前10名)登錄次數(shù)可視化展示
圖7 學習時長前10名學生成績圖
(3)數(shù)據(jù)分析
結合學生登錄的次數(shù),由可視化結果可以看出,10天內累積學習時長排名前10的同學,每天都會登錄學習平臺,并且每天在線時長約1小時,其學習成績也均達到優(yōu)良。
3.3.3學生學習成績等級劃分
(1)學生學習成績等級劃分
統(tǒng)計平臺中90-100、80-89、70-79、60-69、0-59數(shù)據(jù)區(qū)間的人數(shù)。
表9 各分數(shù)段人數(shù)統(tǒng)計長
(2)可視化展示
圖8 各分數(shù)段人數(shù)可視化展示
(3)數(shù)據(jù)分析
此部分統(tǒng)計的是學期末學生的總評學習成績,圖表中明顯看出學生成績基本呈正態(tài)分布,除了2名學生不及格外,其他學生均完成課程學習,到達合格要求,70%以上的學生期末成績能達到良好及以上。
3.3.4 教學任務分析
(1)教學任務平均得分
預設9個教學任務的權重,統(tǒng)計所有學生在每個教學任務的平均得分,得到每個教學任務的直觀教學成果。
表10 9個教學任務的平均得分
(2)可視化展示
圖9 9個教學任務的平均得分可視化展示
(3)數(shù)據(jù)分析
此部分展示的是《平面設計》課程9個教學任務的學生平均得分,此中可以看出學生在AI基本編輯工具和圖形編輯工具的使用上有所欠缺,特別是路徑工具的掌握。
根據(jù)以上統(tǒng)計和可視化展示的結果,結合日常教學實際,可總結出以下規(guī)律和建議:
(1)筆者所在學校,平均每天登錄人數(shù)接近總人數(shù)的70%,尤其是在有課的當天,學生登錄頻次較高,學生在教師的引導下能利用平臺開展學習。
新冠疫情爆發(fā)到現(xiàn)在,學生已經習慣開展線上與線下相結合的教學,線上教學在培養(yǎng)學生自主學習方面是有一定成效的。但教師也要強化以網絡資源的建設,爭取以內容吸引和留住學生,提供與課程內容配套的價值、質量、趣味性等均有較高質量的資源[5]。
(2)學習成績優(yōu)良的學生,平均每日都能登錄平臺開展自主學習,學習成績優(yōu)良。說明花費在學習上的時間長度與學習成績是成正比的。
教師應督促學生多利用教學平臺開展學習,以提升學習主動性和教學效果。對于學習主動性較強的學生,教師要鼓勵這部分學生堅持并持續(xù)自主學習[6]。而學習主動性較弱的學生,則要幫助他們樹立正確的學習態(tài)度,加大學習監(jiān)管,引導其主動轉變學習觀念。
(3)每個教學任務的平均得分可以直觀地看出學生哪些知識點有欠缺,也可以及時修正教師主觀主義上認定的重難點、“優(yōu)差生”及目標達成與否。
大數(shù)據(jù)分析的結果可以為教師科學地掌握重難點提供依據(jù),修正主觀主義的偏差,以及時調整教學策略和補充資源。針對不同學生群體,提供不同的指導與幫助,“因材施教”,最終提升教學質量和人才培養(yǎng)質量[7]。