楊杉
摘要:為深入了解高校學生網絡學習行為特征,以四川省某高校網絡學習平臺的數據為研究對象,對學生學習行為進行了深入分析和研究,利用多維度的網絡測評數據對學生的學習狀況進行了聚類分析,利用任務點完成情況的數據學生測驗分數的影響進行了聚類挖掘,并對不同學習狀況下學生作業(yè)成績是否及格進行了決策樹挖掘。通過以上分析來判定各類學生的在線學習特征和學習效果,從而為學生分類培養(yǎng)及個性化教育提供信息支撐,也為高校在線教育質量的改進提供借鑒。
關鍵詞:聚類算法;決策樹;網絡學習;數據挖掘;行為研究
中圖分類號:TP311.13? ? ?文獻標識碼:A
文章編號:1009-3044(2021)10-0213-04
Abstract: Taking the data of a university's online learning platform in Sichuan Province as the research object, we conducted in-depth analysis and research on students' learning behavior, using multi-dimensional network evaluation data to cluster the students' learning status, and using data on the completion of task points Cluster mining is carried out on the influence of students' test scores, and decision tree mining is carried out on whether students pass or not under different learning conditions. Through the above analysis, the online learning characteristics and learning effects of various types of students are determined, so as to provide information support for student classification and personalized education, and also provide a reference for improving the quality of online education in universities.
Keywords: clustering algorithm; decision tree; network learning; data mining;behavioral research
隨著互聯網教育的發(fā)展,各種網絡媒體也日新月異。新時代、新技術、新趨勢使在線教育形式也越來越豐富,同時也成為未來教育的重要組成部分[1]。尤其是2020年疫情以來,網絡教學成為各大高校疫情期間教學的主要形式[2],在特殊時期發(fā)揮了不可忽視的作用,同時也累積了大量的學生在線學習數據,為研究學生的在線學習行為提供了豐富的素材[3]。通過對學生在線學習數據的分析和挖掘[5],可以了解學生的在線學習完成情況、影響因素和完成效果,評判在線學習與線下學習的優(yōu)劣等[6],并依據分析結論對高校的教學改革提出意見與建議[7]。此外,還可以通過對學生的聚類[8],來判定各類學生的在線學習特征,為學生分類培養(yǎng)及個性化教育提供信息支撐。
1研究思路
以四川省某高校的網絡教學平臺為研究對象,對該平臺于2020.3.1-2020.6.30的學生在線學習數據進行聚類分析、決策樹分析,其中包括對大學生學習的課程中的在線任務點、視頻學習時長、作業(yè)分數、考試分數和在線互動進行分析統(tǒng)計。通過分析得到學生在線學習行為判斷,為教師改進教學、學校改進管理提供有價值的信息,從而做出相應的改進。依據樣本數據各個字段,主要以SPSS為工具,進行數據挖掘,主要運用聚類分析、決策樹對樣本數據中的字段進行挖掘;最后給出建議,為學校提供更多的借鑒與參考。
2數據說明
2.1 數據來源
樣本數據來源于四川省某高校網絡教學平臺,包含2020.3.1-2020.6.30各個學院的學生在線學習數據。
2.2數據清洗
刪除無效字段:該字段列值為空或字段值一樣或對分析幫助和影響不大。
刪除異常記錄:作業(yè)完成數數量極少,但平均分過高的異常值。
3數據挖掘
3.1基于網絡測評數據對學生學習狀況的聚類挖掘
使用聚類的方法]將學生網絡測評數據(章節(jié)測驗平均分、作業(yè)平均分、考試平均分)聚類分析,從而得出網絡學習效果好和網絡學習效果差的類別。
將聚類種類分為兩類,共有三個輸入變量,可以看出其模型效果好,達到了0.8,如圖1所示;聚類的大小分別為55.2%和44.8%,兩者大小比較相近,如圖2所示。從預測變量的重要性來看可以看出輸入的三個變量對聚類來說都是比較重要的變量,其重要性系數都達到了1,如圖3所示。
從聚類結果(圖4)來看:
聚類2占比55.2%,該類學生屬于網絡學習效果較差的學生,其考試平均成績幾乎為0,且大部分數據較低水平,在章節(jié)測驗成績上平均分數為18分,其數據大部分屬于低分,少部分高分,而在作業(yè)平均分上則是50分左右,且數值偏高。
聚類1占比44.8%,該類學生屬于網絡學習效果較好的學生,其考試平均成績?yōu)?7,且大部分數據較高水平,在章節(jié)測驗成績上平均分數為45.5分,其數據大部分屬于中等,而在作業(yè)平均分上則是69.9分左右,且數值偏低。
各項網絡測驗偏高的學生比各項網絡測驗偏低的學生其網絡學習效果更好,當然不排除部分課程幾乎不會布置網絡測驗等情況。
從網絡學習效果好壞對比來看,網絡學習效果不好的學生其考試平均分趨近于0,而網絡學習效果較好的同學其考試平均分更高,大部分屬于80、90分上下。學習效果不好的0分居多的情況中不排除其課程較少采用網絡考試的方式進行測驗。
從章節(jié)測驗成績來看,其網絡學習效果較差的成績0分較多而少部分數據較好成績,而相比較于前者,網絡學習較好的類別章節(jié)測驗成績特點為0分的較少,而成績在80-100分的居多。
從作業(yè)平均成績上比較來看,可以看出網絡學習效果較差的同學的數據更偏向于0,而效果較好的同學成績比較來看則更向高分的部分偏。
與總體相比較,其網絡學習效果差的學生其考試平均分、章節(jié)測驗平均分的中位數與總體中位數相比都屬于非常低,而作業(yè)平均分與總體相比略低于總體的中位數。
網絡學習好的學生的網絡測驗成績與總體相比較,其考試平均分明顯高于總體水平,章節(jié)測驗平均分與總體相比其差距更大且中位數高于總體,其作業(yè)的平均分中位數與總體中位數相比,略高于總體且數據更向高分集中。
從其聚類結果來看各項網絡測驗偏高的學生比各項網絡測驗偏低的學生其網絡學習效果更好,當然不排除部分課程幾乎不會布置網絡測驗等情況。
3.2基于任務點完成情況對章節(jié)測試平均分影響的聚類挖掘
使用SPSS Statistics對章節(jié)測試平均分進行排序,數據過濾(選擇任務點完成數、視頻任務點完成數、視頻任務點觀看時長、作業(yè)平均分與章節(jié)測驗平均分),建立聚類模型。聚類數為4,凝聚和分離的輪廓測量值為0.7,聚類效果較好,如圖5所示。聚類1的大小占比為81.3%;聚類2的大小占比為0%,聚類3的占比大小為0;聚類4的占比大小為18.6%,如圖6所示。作業(yè)平均分、視頻任務點觀看時長、視頻任務點完成數以及任務點完成數,對聚類來說都是比較重要的,變量重要性都為1,如圖7所示。
由聚類結果可知(圖8):
聚類1是特點為任務點(視頻)完成質量較差、作業(yè)平均分較低、章節(jié)測驗平均分低的學生。
聚類2是特點為任務點(視頻)完成質量較差、作業(yè)平均分高、章節(jié)測驗平均分低的學生。聚類2這類學生雖然平時的任務點完成比較差,章節(jié)測驗的平均分比較低,但是作業(yè)平均分卻比較高,說明可能存在平時作業(yè)抄襲或者使用同組的作業(yè)上交的情況,學校需要對這類學生進行一個監(jiān)督,管理。
聚類3是任務點(視頻)完成質量較好、作業(yè)平均分較高、章節(jié)測驗平均分高的學生。聚類3這類學生是平時上課的任務點完成的比較認真,作業(yè)完成質量比較好,章節(jié)測驗成績也比較高的三好學生,但是人數很少只有一個,則學校需要注重這類學生的培養(yǎng)。
聚類4是任務點(視頻)完成質量較好、作業(yè)平均分低、章節(jié)測驗平均分較高的學生。
這說明,學生任務點、視頻任務點完成情況對章節(jié)測試平均分的影響程度較大;作業(yè)平均分的影響程度較小。因此需要督促學生對于任務點的學習和完成,保證其他學習指標的完成及質量。
3.3不同學習狀況下學生作業(yè)成績是否及格的決策樹挖掘
采用決策樹的方法,在不同的網絡學習狀況下(主要包含:任務點完成數、視頻觀看時長、章節(jié)學習次數、課程專題閱讀時長、討論總數、發(fā)帖總數以及回帖總數)對學生作業(yè)是否及格進行分析。
將作業(yè)是否及格作為目標變量可以看出預測變量中最重要的是章節(jié)學習次數(0.18),其次任務點完成數(0.17),再次是課程專題閱讀時長(0.14),如圖9所示。
從生成的部分規(guī)則集(圖10)可以看出任務點完成數大于107小于等于145且任務點觀看時長大于125分鐘,沒有回帖則為沒有及格;任務點完成數大于107且視頻觀看時長大于334分鐘,沒有回帖則為沒有及格;而任務點完成數大于107且章節(jié)學習次數小于等于68也為不及格。
在結果為作業(yè)成績及格的部分規(guī)則中可以看出:任務點完成數大于89小于等于107、視頻觀看時長小于等于364、章節(jié)學習次數大于34且發(fā)帖總數為0的則作業(yè)成績及格;任務點完成數大于102小于等于105且章節(jié)學習次數大于136的則作業(yè)成績及格。從圖11中可以看出模型的正確率達到了90.5%,錯誤率為9.5%,模型的正確率較高,模型效果較好。
從而得出結論:從其生成的規(guī)則中我們可以明顯看出作業(yè)成績是否及格與其網絡學習的狀況沒有明顯的關系,其中可以看到,任務點完成數大于107且章節(jié)學習次數小于等于68的這類學生,其作業(yè)成績?yōu)椴患案?任務點完成數大于102小于等于105且章節(jié)學習次數大于136的這類學生,其作業(yè)成績?yōu)榧案?。這充分說明,章節(jié)學習次數不是過大就是過小的狀態(tài)是一種常態(tài),任務點完成數為中等程度的學生,普遍作業(yè)成績?yōu)榧案?,除此而外的其他情況均為不及格。這也間接說明該高校網絡在線學習平臺上,學生對于老師設置的任務點可能存在掛機的現象,或該門課程老師不太習慣于使用網絡在線學習平臺來布置學習任務。
4結論及建議
網絡學習情況對學生的考試成績具有顯著性影響,網上學習情況良好的學生的考試成績比網上學習情況較差的學生好。
建議老師在網上布置任務時系統(tǒng)能夠及時通知學生結束時間;認真批改學生網上作業(yè)與考試,避免統(tǒng)一批改造成的數據不真實。目前網絡在線學習平臺利用率參差不齊,大部分課程要提高其利用率,并完善網絡測評的環(huán)境以便能夠更好地進行網絡測驗。此外還應加強對學生平時任務點完成質量的監(jiān)督與管理。
參考文獻:
[1] 蔣雯音,張穎,童亞琴.數據挖掘方法在網絡學習行為研究中的應用[J].電腦知識與技術,2020(6):17-21.
[2] 白雪.基于網絡學習行為聚類分析的在線課堂優(yōu)化策略研究[J].吉林化工學院學報,2020(8):44-48.
[3] 肖自乾,陳經優(yōu).基于數據挖掘聚類算法的網絡學習平臺學生成績分析[J].電腦知識與技術,2020(7):28-29.
[4] 王堅,張媛媛,柴艷妹.基于因子分析和聚類分析的學生網絡學習行為研究[J].中國教育技術裝備,2019(11):3-5.
[5] 趙建偉,彭成圓.教育大數據背景下大學生網絡學習行為實證研究[J].當代教育實踐與教學研究,2019(8):34-35.
[6] 程澤凱,佘星星,謝寧宇.網絡教學平臺學生學習數據分析[J].常州工學院學報,2019(4):77-80.
[7] 王川芳,姚苗苗.基于知識圖譜的網絡學習評價研究綜述[J].軟件導刊,2019(3):9-12.
[8] 吳林靜,勞傳媛,劉清堂,等.網絡學習空間中的在線學習行為分析模型及應用研究[J].現代教育技術,2018(6):46-53.
【通聯編輯:王力】