林龍 沈海青
摘 要:學生在在線學習平臺上的學習表現(xiàn)數(shù)據(jù)類型較多,不能從單一角度對學生學習狀況進行評價監(jiān)測,需要綜合多維度評價學生的學習狀況,從而給出相對全面客觀的學習表現(xiàn)評價。建立基于SVDD算法的監(jiān)測模型,將直播觀看時長、作業(yè)完成狀況、課堂參與互動次數(shù)、出勤率等多維數(shù)據(jù)作為考量指標,對所有數(shù)據(jù)進行PCA分析,通過SVDD算法進行學習行為和效果異常監(jiān)測,從而實現(xiàn)表現(xiàn)異常學生的學業(yè)預警。
關(guān)鍵詞:SVDD算法 學業(yè)預警 大數(shù)據(jù) 線上教育
Construction and Research of Early Academic Warning Monitoring Model based on SVDD Algorithm[
Lin Long,Shen Haiqing
Abstract:There are many types of students' learning performance data on online learning platforms, and it is not possible to evaluate and monitor students' learning status from a single perspective. It is necessary to comprehensively evaluate students' learning status from multiple dimensions to give a relatively comprehensive and objective learning performance evaluation. The paper establishes a monitoring model based on the SVDD algorithm, which takes multidimensional data such as live viewing time, homework completion status, classroom participation and interactions, and attendance rate as consideration indicators, and performs PCA analysis on all data, and monitors learning behavior and effect abnormalities through SVDD algorithm so as to realize the academic warning of abnormal students.
Key words:SVDD algorithm, academic warning, big data, online education
在信息化浪潮沖擊下,教育與信息技術(shù)走向深度融合,在線教育大規(guī)模興起。與此同時,大數(shù)據(jù)(big data)理論與方法被逐步應用到教育領域,學習分析、數(shù)據(jù)挖掘等分析方法為在線學習過程、學習效果等提供了有效分析手段[1]。
尤其在疫情期間,教學方式發(fā)了翻天覆地的變革,所有課堂被迫從線下搬到線上,教師從現(xiàn)場授課化身網(wǎng)絡主播,學生從教室學習變成打開手機等移動端屏幕學習。信息技術(shù)已經(jīng)全面融入教師教學和學生管理的日常。
每個學生在學習過程中的行為數(shù)據(jù)和學習效果數(shù)據(jù)通過網(wǎng)絡教育技術(shù)被完整的記錄保存下來,這些信息組成了學生的學業(yè)表現(xiàn)。每個學生的個性不同,網(wǎng)絡課堂的參與度、學習表現(xiàn)也不盡相同,對于學生的評價數(shù)據(jù)往往是立體多維度的,各個學生的維度長短板也不太,如何實現(xiàn)網(wǎng)課表現(xiàn)異常學生的學習行為綜合評價和監(jiān)測,是現(xiàn)階段的教育數(shù)據(jù)挖掘和學習分析存在的一大難點。王常青[2]提出基于數(shù)據(jù)驅(qū)動的學情分析預警機制研究與實踐,但其數(shù)據(jù)分析需要人工進行,較為繁瑣;于繁華等人[3]提出基于離群檢測的教學預警模型,通過規(guī)則檢測與離群檢測建立了交互式教學系統(tǒng)中的預警模型,實現(xiàn)了基于學習行為分析的自動干預和主動干預。廖鵬等[4]構(gòu)建了一個檢測、統(tǒng)計學生課堂異常行為的輔助教學管理系統(tǒng),通過基于VGG預訓練網(wǎng)絡模型遷移學習,來提取學生課堂異常行為特征,實現(xiàn)對玩手機、睡覺等異常行為的檢測分析。湖北第二師范學院楊鶴等人[5]發(fā)明一種異常網(wǎng)絡學習行為的方法,對網(wǎng)絡學習行為進行采樣,計算不同學習行為的變化作為危險信號,構(gòu)造人工抗原提呈細胞對多種學習行為的變化進行融合,檢測學習行為的異常。陳彥釗等[6]基于深度學習技術(shù)建立了大學生課堂行為分析模型,并構(gòu)建了大學生課堂行為分析系統(tǒng),實現(xiàn)了課堂考勤和課堂專注度分析。
本文基于機器學習的支持向量描述(SVDD)算法,綜合網(wǎng)課平臺的多維度評價數(shù)據(jù),構(gòu)建學習表現(xiàn)模型,對異常表現(xiàn)的學生進行監(jiān)測分析,從而實現(xiàn)學業(yè)表現(xiàn)異常學生的及時預警。
1 指標構(gòu)建及數(shù)據(jù)采集
基于釘釘直播平臺進行教學,基于藍墨云平臺進行學習行為數(shù)據(jù)監(jiān)測及收集。利用因子分析方法構(gòu)建多維度學習表現(xiàn)監(jiān)測模型,具體包括學習行為指標和學習效果指標。按照線上和線下完成時間為界限,進行劃分,構(gòu)建指標并設置權(quán)重如下表1。
以《汽車售后服務接待》課程為例,收集該課程網(wǎng)課教學過程中8個教學項目的學生學習行為和學習效果數(shù)據(jù),學習行為數(shù)據(jù)包括:釘釘直播觀看時長、藍墨云課堂參與互動次數(shù)、出勤率。學習效果數(shù)據(jù)包括:藍墨云作業(yè)完成次數(shù)、作業(yè)完成分數(shù)。每個學生可形成5個維度的學業(yè)模型數(shù)據(jù)。下表1為售后服務課程里篩選的5位學生的學習行為數(shù)據(jù),該數(shù)據(jù)從藍墨云和釘釘上導出獲取并進行了簡單的處理。其中學習行為和結(jié)果數(shù)據(jù)正常的用綠色標記,與正常偏離較大通過紅色進行標記。由表1可知,一方面,對各個指標進行分析,發(fā)現(xiàn)統(tǒng)計的五類指標存在關(guān)聯(lián)和冗余,需要通過PCA提取主成分進行分析。例如,出勤率和直播觀看時間是成正相關(guān)的,基本上出勤率100%的學生其直播觀看時長也達標,少數(shù)學生存在看了直播沒簽到的現(xiàn)象,分析原因,這部分學生可能存在掛線播放,人離開或者開小差的情況,需要進行提醒;作業(yè)參與次數(shù)和成績總分也成正相關(guān),特殊情況是參與次數(shù)多但是成績總分低的學生,這種現(xiàn)象說明學生存在有積極性但是知識點掌握不好,或者應付答題情況。另一方面,對表現(xiàn)情況進行分析,對于表現(xiàn)優(yōu)秀的學生其各類狀態(tài)指標數(shù)據(jù)均較好,而表現(xiàn)良好的學生主要是其中某個數(shù)據(jù)指標不夠理想,而對于表現(xiàn)一般的學生存在1-2項的數(shù)據(jù)指標未達標準,表現(xiàn)較差的學生其大部分的數(shù)據(jù)指標均較差,而表現(xiàn)異常的學生則各項指標均與正常偏離較大,因此需要對這類學生進行重點關(guān)注和預警。
2 基于SVDD算法的學習狀態(tài)異常監(jiān)測模型構(gòu)建
2.1 數(shù)據(jù)預處理
學習行為和學習效果數(shù)據(jù)屬性不同,需要對各個指標維度類別的數(shù)據(jù)進行統(tǒng)一度量,因此,對采集的大數(shù)據(jù)進行歸一化處理。為了數(shù)據(jù)處理方便,歸一化時把數(shù)據(jù)映射到0~1范圍之內(nèi)處理。
本文采用的歸一化方法通過遍歷feature vector里的每一個數(shù)據(jù),將Max和Min的記錄下來,并通過Max-Min作為基數(shù)(即Min=0,Max=1)進行數(shù)據(jù)的歸一化處理:
2.2 支持向量描述算法
支持向量描述(SVDD)是一種單分類器,常用于數(shù)據(jù)的離群或者野值點檢測。支持向量描述的基本思想是可以找出一個超球體來描述給定的目標數(shù)據(jù)集{xi,i=1,2,…,N},該超球可以以最小的半徑包含所有的目標數(shù)據(jù)。落在超球面上的數(shù)據(jù)點就稱為支撐向量。
由于這種描述方法對目標數(shù)據(jù)集中偏離大部分數(shù)據(jù)較遠的野值點比較敏感,這些點的存在可能使描述數(shù)據(jù)的球體過大,增加了異類點落入球內(nèi)的機會,從而影響分類的效果。為此引入一個松弛變量ξi ,允許部分野點落在球外。根據(jù)以上思想,給出SVDD的目標函數(shù):
R和a分別為最小超球的半徑和球心,P為懲罰參數(shù),起到控制對錯分樣本懲罰程度的作用。ξi 為松弛因子,ξi≥0( ξi≥0 對應位于超球體外部的非目標類對象) 。
這是一個二次優(yōu)化問題,結(jié)合約束條件,構(gòu)造拉格朗日函數(shù),可以得到該優(yōu)化問題的對偶形式:
ai為拉格朗日乘子,l為樣本數(shù)。
通過引入核函數(shù)K(x,y),實現(xiàn)樣本從低維空間映射至高維空間,就可以將非線性問題轉(zhuǎn)化為線性問題。當核函數(shù)滿足Mercer條件時,它就對應于某一變換空間的內(nèi)積[9]:K(x,y)=φ(x)Tφ(y),φ為核映射;核函數(shù)滿足:K(x,y)=exp{-//x-y//2/σ}。
引入核函數(shù)后,上述公式轉(zhuǎn)變?yōu)槿缦滦问剑?/p>
根據(jù)Kuhn-Tucker條件,可求解以上優(yōu)化問題得到ai的值。通過分析ai的大小來判斷樣本點的位置:當0 計算球心至任意一個支持向量點的距離就能求得球體的半徑R。 對應新來的樣本Z,如果滿足 則Z屬于目標樣本,否則為非目標樣本。 2.3 建立學習狀態(tài)異常監(jiān)測模型 基于SVDD算法,可以建立學習狀態(tài)離群監(jiān)測模型,如下圖1所示。首先收集學生的網(wǎng)課學習行為和效果數(shù)據(jù),然后進行人工篩選,獲取一批表現(xiàn)良好的學生數(shù)據(jù),對多維度數(shù)據(jù)進行PCA分析,將這些學生的數(shù)據(jù)作為已知訓練集,在訓練過程中得到處于SVDD超球邊界狀態(tài)下的支持向量數(shù)據(jù),以此即可建立基于學習表現(xiàn)良好的學生樣本的數(shù)據(jù)描述模型。此后,針對表現(xiàn)未知的學生數(shù)據(jù),可將其輸入學習狀態(tài)監(jiān)測模型進行判定,當其數(shù)據(jù)處于描述邊界內(nèi)時,則判定為正常,當其數(shù)據(jù)處于描述邊界外時,則對其進行學業(yè)預警,提醒班主任、任課老師、輔導員三方進行干預跟蹤。 3 學業(yè)預警監(jiān)測實例分析 將上述方法運用《汽車售后服務接待》課程中3個班級的學生的學習行為數(shù)據(jù)分析和然后對其中某個班級的學生學業(yè)表現(xiàn)進行預測。首先根據(jù)歷史數(shù)據(jù),人為篩選出該門課程所有班級中表現(xiàn)中等以上的學生數(shù)據(jù),篩選的方法是將學生按照觀看時長、藍墨云課堂參與互動次數(shù)、出勤率、作業(yè)完成次數(shù)、作業(yè)完成分數(shù)進行排序,統(tǒng)計出30人作為正常的測試數(shù)據(jù)集合。設置核函數(shù)中的參數(shù)σ=2.5,將這些學生的數(shù)據(jù)先進行PCA降低維數(shù)至2維,進行訓練得到正常的超球模型,最后選擇其中一個班級中的6位未知學業(yè)表現(xiàn)的學生,將其數(shù)據(jù)導入進行訓練,得到結(jié)果如下圖所示。圖中標有三角符號的為異常點(-5.6,0.03),查看其標簽為34號學生,其網(wǎng)課數(shù)據(jù),見表3。 4 總結(jié) 學生在網(wǎng)課學習過程中積累的學習行為和學習效果數(shù)據(jù)維度較多,較難進行人為判斷區(qū)分,根據(jù)SVDD 的單值分類特點,利用大量已知的學習表現(xiàn)正常的學生行為數(shù)據(jù)構(gòu)建訓練樣本集,則最小超球體邊界將包含大部分的正常樣本點。接著通過正常的描述邊界對未知學習狀態(tài)的數(shù)據(jù)樣本進行預判斷,得出落在超球體之外的樣本,即偏離正常群體的學生學習數(shù)據(jù),然后針對異常數(shù)據(jù)進行信息指標分析判斷。因此本文所提方法可應用于學習行為異常的學生學業(yè)預警監(jiān)測。 基金項目:2019年臺州市教育規(guī)劃課題“教育大數(shù)據(jù)整合理念下的學生學業(yè)表現(xiàn)模型研究”階段性成果(gg20054);2019年度校級高等教育教學改革研究項目(Tkyjg201920);2020年臺州科技職業(yè)學院基于“云班課”信息化教學課程項目(Tkbk2020047)。 參考文獻: [1]宋平平,孫皓.基于大數(shù)據(jù)的在線學習監(jiān)測預警模型構(gòu)建研究[J].管理觀察,2018(32):108-109. [2]王常青,于欣. 基于數(shù)據(jù)驅(qū)動的學情分析預警機制研究與實踐——以浙江大學寧波理工學院為例[J]. 現(xiàn)代職業(yè)教育, 2018(2):18-19. [3]于繁華,姚亦飛,逯啟榮.教育大數(shù)據(jù)下基于離群檢測的教學預警模型[J].吉林大學學報(信息科學版),2018,36(04):459-464. [4]廖鵬,劉宸銘,蘇航,李啟芳,韓延巾.基于深度學習的學生課堂異常行為檢測與分析系統(tǒng)[J].電子世界,2018(08):97-98. [5]楊鶴,鄭幸.基于人工免疫危險模式理論的異常學習行為發(fā)現(xiàn)方法[P]. 中國專利:CN105787555A,2016-07-20. [6]陳彥釗,朱雪穎,黃瑾,莊涵智,郭春婷,劉家浩.基于深度學習的大學生課堂行為分析系統(tǒng)研究[J].齊魯工業(yè)大學學報,2020,34(01):13-18. [7]馬漢達,劉相濤. 基于Bagging_BP算法的在線學習行為分析方法 [P]. 中國專利:CN110751289A,2020-02-04.