曹洪江,謝金
(武漢理工大學(xué) 經(jīng)濟(jì)學(xué)院,湖北 武漢 430000)
學(xué)習(xí)成績(jī)預(yù)測(cè)被公認(rèn)為是教育領(lǐng)域中的重點(diǎn)與難點(diǎn)。隨著信息技術(shù)廣泛應(yīng)用于教育領(lǐng)域,利用信息技術(shù)對(duì)學(xué)習(xí)成績(jī)進(jìn)行預(yù)測(cè)成為教育領(lǐng)域研究的熱點(diǎn)。學(xué)習(xí)成績(jī)預(yù)測(cè)不僅可以幫助老師及時(shí)修正教學(xué)策略,提高學(xué)生最終學(xué)習(xí)成績(jī),降低不及格學(xué)生比例,還能在一定程度上對(duì)學(xué)生起到監(jiān)督和預(yù)警作用。
目前,成績(jī)預(yù)測(cè)的研究方法主要是三類(lèi)[1]:(1)基于傳統(tǒng)機(jī)器學(xué)習(xí)的成績(jī)預(yù)測(cè)研究;(2)基于推薦方法的成績(jī)預(yù)測(cè)研究;(3)基于深度學(xué)習(xí)的成績(jī)預(yù)測(cè)研究。不同研究方法中研究者所采用的數(shù)據(jù)維度也各不相同。
Al-Barak等[2]人基于學(xué)生其他課程的成績(jī)數(shù)據(jù),應(yīng)用決策樹(shù)的方法對(duì)學(xué)生的成績(jī)進(jìn)行預(yù)測(cè)。Umair等[3]人基于學(xué)生的行為數(shù)據(jù),采用支持向量機(jī)對(duì)學(xué)生成績(jī)進(jìn)行預(yù)測(cè)。申航杰等[4]在二者的基礎(chǔ)上,綜合考慮學(xué)生的歷史成績(jī)數(shù)據(jù)和行為數(shù)據(jù),首先利用模糊C均值算法對(duì)歷史成績(jī)屬性做聚類(lèi),接著對(duì)每個(gè)聚類(lèi)簇單獨(dú)進(jìn)行支持向量回歸,該方法明顯提升了成績(jī)預(yù)測(cè)的精度。目前,基于深度學(xué)習(xí)的成績(jī)預(yù)測(cè)研究越來(lái)越受到關(guān)注。張麒增等[5]基于學(xué)生行為數(shù)據(jù)和歷史成績(jī)數(shù)據(jù),采用過(guò)采樣技術(shù)配合神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)學(xué)習(xí)成績(jī)。葉俊民等[6]人考慮學(xué)習(xí)社區(qū)短文本情感特征、學(xué)生行為等方面的影響,采用深度學(xué)習(xí)模型對(duì)成績(jī)進(jìn)行預(yù)測(cè)。
從獲取數(shù)據(jù)的維度上來(lái)看,大多數(shù)成績(jī)預(yù)測(cè)研究基于學(xué)生行為數(shù)據(jù)[7-9],少量研究基于學(xué)生知識(shí)結(jié)構(gòu)(歷史成績(jī))[10-11]、學(xué)習(xí)情感[12]、學(xué)習(xí)態(tài)度[13]等一維或兩維學(xué)習(xí)數(shù)據(jù)。數(shù)據(jù)維度單一限制了從多維度分析學(xué)生成績(jī)影響因素的可能性。從研究方法上來(lái)看,現(xiàn)有的成績(jī)預(yù)測(cè)模型大多是線性的淺層學(xué)習(xí)器,無(wú)法捕獲學(xué)生學(xué)習(xí)的復(fù)雜互動(dòng),例如,線性回歸或者低階矩陣分解。部分研究采用深度學(xué)習(xí)模型預(yù)測(cè)學(xué)習(xí)成績(jī),取得了較好的效果,但由于深度學(xué)習(xí)模型的黑箱效應(yīng),無(wú)法識(shí)別影響因素的權(quán)重大小。針對(duì)上述問(wèn)題,本文提出基于長(zhǎng)短期記憶時(shí)間網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)的學(xué)習(xí)成績(jī)預(yù)測(cè)模型及其影響因素的判斷方法:
(1)從學(xué)生知識(shí)結(jié)構(gòu)、學(xué)生情感、學(xué)生行為多特征對(duì)學(xué)習(xí)成績(jī)進(jìn)行預(yù)測(cè),數(shù)據(jù)維度更加多元;
(2)用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)對(duì)知識(shí)結(jié)構(gòu)狀態(tài)進(jìn)行建模,模擬學(xué)生學(xué)習(xí)記憶過(guò)程;
(3)提出成績(jī)決定因素的判斷方法,識(shí)別成績(jī)不及格影響因素的權(quán)重大小。
LSTM解決了循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks, RNN)的梯度消失問(wèn)題,并通過(guò)建立門(mén)的機(jī)制使舊時(shí)刻輸出與新時(shí)刻輸入之間達(dá)到一種平衡,保存重要的歷史信息,忘記不重要的,具備存儲(chǔ)、讀取更新和重置長(zhǎng)距離信息的功能,從而能很好地處理學(xué)生的學(xué)習(xí)記憶過(guò)程。基于以上理論,設(shè)計(jì)了融合知識(shí)結(jié)構(gòu)狀態(tài)特征、情感特征和行為特征的LSTM學(xué)習(xí)成績(jī)預(yù)測(cè)模型,其框架結(jié)構(gòu)如圖1所示。該預(yù)測(cè)模型包含以下四個(gè)核心內(nèi)容:(1)根據(jù)原始的歷史成績(jī)數(shù)據(jù)集、學(xué)生評(píng)分?jǐn)?shù)據(jù)集和學(xué)生行為數(shù)據(jù)集,分別構(gòu)造歷史成績(jī)特征向量、學(xué)習(xí)情感特征向量和學(xué)習(xí)行為特征向量,其中,學(xué)生評(píng)分?jǐn)?shù)據(jù)集來(lái)源于教務(wù)系統(tǒng)中學(xué)生對(duì)課程的評(píng)分,學(xué)生行為數(shù)據(jù)集來(lái)源于教師對(duì)課程的記錄數(shù)據(jù),包括簽到表、回答問(wèn)題記錄及學(xué)生平時(shí)成績(jī);(2)針對(duì)每個(gè)時(shí)間步,將學(xué)生的歷史成績(jī)表征作為L(zhǎng)STM模型的輸入,該模型得到學(xué)生在不同時(shí)刻的知識(shí)結(jié)構(gòu)狀態(tài);(3)將學(xué)生的最終知識(shí)結(jié)構(gòu)狀態(tài)特征向量與學(xué)習(xí)情感特征向量、學(xué)習(xí)行為特征向量融合,得到學(xué)生特征向量;(4)將學(xué)生特征向量通過(guò)全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行成績(jī)預(yù)測(cè)。
定義1:學(xué)習(xí)成績(jī)表征。設(shè)y∈[0,1]為學(xué)生的課程成績(jī)。將課程成績(jī)映射到[0,1]的區(qū)間,如y=0.88表示學(xué)生的課程成績(jī)?yōu)?8。
定義2:學(xué)習(xí)情感表征。設(shè)sentiment∈[0,1]為學(xué)生的情感。根據(jù)學(xué)生對(duì)課程的評(píng)分表征學(xué)習(xí)情感,評(píng)分越高,學(xué)生越表示出積極情感,評(píng)分為[0,10],將其映射到[0,1]。如sentiment=0.8表示學(xué)生對(duì)課程的評(píng)分為8。
x′=(x-Xmin)/(Xmax-Xmin)
(1)
定義4:學(xué)生歷史成績(jī)表征。設(shè)Gt=[Gt,1,Gt,2,…,Gt,m]T,表示學(xué)生在學(xué)期中t課程1到課程m的成績(jī),Gt,m∈[0,1]。將歷史成績(jī)數(shù)據(jù)通過(guò)LSTM訓(xùn)練,得到學(xué)生知識(shí)結(jié)構(gòu)結(jié)構(gòu)狀態(tài)的最終表征ZT。
根據(jù)以上定義,可以得到學(xué)生s情感特征向量Q(s)和學(xué)習(xí)行為向量E(s),并基于歷史成績(jī)向量Gt(s)和LSTM模型,得到最終知識(shí)結(jié)構(gòu)狀態(tài)特征向量ZT(s),通過(guò)多元特征融合函數(shù)Fuse得到學(xué)生s的完整特征表示X(s),具體做法如公式2所示
X(s)=fuse(ZT(s),Q(s),E(s))
(2)
Fuse函數(shù)可以有多重選擇形式,本文采用向量拼接進(jìn)行融合,即X(s)=[ZT(s);Q(s);E(s)],符號(hào)“;”表示向量按行序進(jìn)行拼接。
學(xué)生的歷史成績(jī)具有時(shí)序特征,之前學(xué)習(xí)的課程可能會(huì)對(duì)本學(xué)期的課程產(chǎn)生重要的影響。為了表示這種長(zhǎng)期依賴(lài)關(guān)系,采用LSTM對(duì)歷史成績(jī)進(jìn)行建模,以表示學(xué)生在不同時(shí)刻的知識(shí)結(jié)構(gòu)狀態(tài)。圖2表示對(duì)學(xué)生的歷史成績(jī)進(jìn)行建模的LSTM方法:起初,學(xué)生存在一些先驗(yàn)知識(shí);隨著課程學(xué)習(xí)的發(fā)展,學(xué)生的知識(shí)結(jié)構(gòu)狀態(tài)不斷變化,顏色深淺的不同表示每個(gè)時(shí)間步長(zhǎng)的知識(shí)結(jié)構(gòu)狀態(tài)。
根據(jù)LSTM的網(wǎng)絡(luò),在特定時(shí)間步t,會(huì)受到學(xué)生前一時(shí)間步的實(shí)際知識(shí)結(jié)構(gòu)狀態(tài)Zt-1(s)和當(dāng)前時(shí)間步的知識(shí)結(jié)構(gòu)特征Gt(s)的影響,當(dāng)前時(shí)間步學(xué)生的隱藏知識(shí)結(jié)構(gòu)狀態(tài)c′t(s)可表示為
c′t(s)=tanh(Wc[Zt-1(s),Gt(s)]+Bc)
(3)
輸入門(mén)將決定哪些信息會(huì)添加到記憶單元,其計(jì)算公式為
it(s)=σ(Wi[Zt-1(s),Gt(s)]+Bi)
(4)
遺忘門(mén)決定記憶單元中的哪一部分信息將會(huì)被遺忘。例如,學(xué)生參加兩個(gè)不同課程而獲得相同的知識(shí)時(shí),第一門(mén)課程獲得的知識(shí)可以被丟棄,而第二門(mén)課程所獲得的知識(shí)將會(huì)用來(lái)更新知識(shí)結(jié)構(gòu)狀態(tài)。遺忘門(mén)的計(jì)算公式為
ft(s)=σ(Wf[Zt-1(s),Gt(s)]+Bf)
(5)
通過(guò)考慮學(xué)生學(xué)習(xí)的記憶與遺忘過(guò)程,更新當(dāng)前時(shí)間步學(xué)生的隱含知識(shí)結(jié)構(gòu)狀態(tài),具體公式為
ct(s)=ft(s)?ct-1(s)+it(s)?c′t(s)
(6)
最后,考慮學(xué)生的隱含知識(shí)結(jié)構(gòu)狀態(tài)并不能完全展示出來(lái),通過(guò)計(jì)算輸出門(mén)ot(s)得到當(dāng)前時(shí)間步學(xué)生的實(shí)際知識(shí)結(jié)構(gòu)狀態(tài)zt(s),即神經(jīng)元的輸出ht(s),可得
ot(s)=σ(Wo[Zt-1(s),Gt(s)]+Bo)
(7)
ht(s)=ot(s)?tan h(ct(s))
(8)
式(3)~(8)中,W*是權(quán)值矩陣,B*是偏置向量,?表示逐點(diǎn)乘積。
為了度量學(xué)生在學(xué)習(xí)目標(biāo)課程時(shí)的知識(shí)結(jié)構(gòu)狀態(tài),首先提取帶有時(shí)間戳的先修課程的學(xué)生成績(jī)。由于一個(gè)學(xué)期可以同時(shí)學(xué)習(xí)多個(gè)課程,學(xué)期t的成績(jī)用向量Gt表示。Gt中的值對(duì)應(yīng)于學(xué)期t中的課程成績(jī),0表示未學(xué)習(xí)相應(yīng)的課程,若學(xué)生取得的成績(jī)是0,則用一個(gè)較小的數(shù)0.01來(lái)表示,以區(qū)分未學(xué)習(xí)的課程。將編碼的向量G1,G2,…,GT輸入到模型,則最后一步隱藏層hT的輸出ZT為學(xué)生學(xué)習(xí)目標(biāo)課程時(shí)的知識(shí)結(jié)構(gòu)狀態(tài);其中,T表示最后一個(gè)時(shí)間步。
將學(xué)生的知識(shí)結(jié)構(gòu)狀態(tài)特征、情感特征及行為特征融合,得到學(xué)生的完整特征表示X(s)?;趯W(xué)生的特征向量X(s)預(yù)測(cè)學(xué)生的課程成績(jī),即利用全連接神經(jīng)網(wǎng)絡(luò)層預(yù)測(cè)學(xué)生課程成績(jī),具體預(yù)測(cè)方法如下
y(s)=sigmoid(WXT(s)+B)
(9)
其中,y(s)表示第s個(gè)學(xué)生的預(yù)測(cè)成績(jī),W為線性變換的權(quán)重向量,B是偏置。成績(jī)預(yù)測(cè)模型的損失函數(shù)為
(10)
其中,yr(s)是學(xué)生真實(shí)的課程成績(jī),n為學(xué)生總數(shù)。
模型的可解釋性有利于人們對(duì)模型產(chǎn)生信任,解釋數(shù)據(jù)中的因果關(guān)系,同時(shí)獲取更多有用的信息[14]。本文提出的基于LSTM的成績(jī)預(yù)測(cè)模型,其本質(zhì)目的是能夠在學(xué)生的學(xué)業(yè)管理系統(tǒng)中起到監(jiān)督和預(yù)警作用。對(duì)于一個(gè)預(yù)警系統(tǒng)而言,不僅需要進(jìn)行成績(jī)預(yù)測(cè),還需要識(shí)別影響學(xué)生成績(jī)的決定因素。本文的預(yù)測(cè)模型假定,學(xué)生學(xué)習(xí)的過(guò)程將會(huì)積累知識(shí),這些知識(shí)的掌握程度會(huì)影響學(xué)生在之后課程的成績(jī)或表現(xiàn);同時(shí),學(xué)生參與課程的行為投入、情感狀態(tài)等也會(huì)對(duì)課程中的成績(jī)有所影響。通過(guò)以下方式計(jì)算先修課程成績(jī)、行為、情感等因子的影響權(quán)重大小。
(11)
同理,f代表目標(biāo)課程c行為因子的數(shù)值,將行為因子值調(diào)整到最大值f得到預(yù)測(cè)成績(jī)對(duì)于學(xué)生s來(lái)說(shuō),行為因子f的影響力記作Ic(s,f),計(jì)算公式為
(12)
q表示學(xué)生對(duì)目標(biāo)課程c的情感值,將情感值調(diào)整到最大值q得到預(yù)測(cè)成績(jī)對(duì)于學(xué)生s來(lái)說(shuō),情感q對(duì)目標(biāo)課程c的影響力記作Ic(s,q),計(jì)算公式為
(13)
該方法假定,如果學(xué)生能在先修課程取得更高的成績(jī),他將在目標(biāo)課程中表現(xiàn)得更好。相應(yīng)地,若學(xué)生在目標(biāo)課程中行為投入更多或者以更積極的情感學(xué)習(xí)課程,他也能取得更好的成績(jī)。根據(jù)計(jì)算出的各因子的權(quán)重大小,可以建議學(xué)生在目標(biāo)課程的學(xué)習(xí)中進(jìn)行更有效地投入,如復(fù)習(xí)較高影響力的先修課程內(nèi)容,抱有更積極的情感態(tài)度等。
同時(shí),這一方法還能為教師調(diào)整課程結(jié)構(gòu)。假設(shè)一門(mén)先修課程對(duì)目標(biāo)課程的影響力在多個(gè)學(xué)生中都很高,那么在學(xué)習(xí)該課程的過(guò)程中就有必要對(duì)先修課程的內(nèi)容進(jìn)行復(fù)習(xí)。由于不同學(xué)生的先修課程成績(jī)不一樣,此處在考慮先修課程對(duì)目標(biāo)課程的影響力時(shí),計(jì)算提高0.1單位的成績(jī)所帶來(lái)的影響,公式如下
(14)
(15)
其中,p表示先修課程的成績(jī),s表示學(xué)習(xí)目標(biāo)課程c的所有學(xué)生,y*(p+0.1)表示當(dāng)先修課程的成績(jī)提高0.1時(shí)模型預(yù)測(cè)出來(lái)的成績(jī)。
實(shí)驗(yàn)的數(shù)據(jù)集來(lái)源于武漢理工大學(xué)教務(wù)管理系統(tǒng)中的2010級(jí)—2017級(jí)學(xué)生課程成績(jī)數(shù)據(jù)、學(xué)生評(píng)分?jǐn)?shù)據(jù)及教師的課堂記錄數(shù)據(jù);分別從學(xué)生課程成績(jī)數(shù)據(jù)、學(xué)生評(píng)分?jǐn)?shù)據(jù)及教師的課程記錄數(shù)據(jù)中提取歷史成績(jī)數(shù)據(jù)、情感數(shù)據(jù)及行為數(shù)據(jù)。選取了學(xué)校具有較多人數(shù)的四個(gè)專(zhuān)業(yè):材料科學(xué)與工程(MS)、計(jì)算機(jī)科學(xué)與技術(shù)(CS)、土木工程(CE)和信息工程(IE),并根據(jù)各專(zhuān)業(yè)的培養(yǎng)方案進(jìn)行待預(yù)測(cè)的課程和先修課程的初步篩選。由于每個(gè)專(zhuān)業(yè)的學(xué)生選擇同一通識(shí)選修課及個(gè)性課的人數(shù)較少,此類(lèi)課程的選課情況存在較大的差異,實(shí)驗(yàn)只對(duì)專(zhuān)業(yè)課程和學(xué)科大類(lèi)課程展開(kāi)研究,并刪除所有學(xué)生成績(jī)都通過(guò)或者都未通過(guò)的課程。利用2010—2016級(jí)的學(xué)生數(shù)據(jù)作為訓(xùn)練集,2017級(jí)的學(xué)生數(shù)據(jù)作為測(cè)試集,預(yù)處理后的數(shù)據(jù)統(tǒng)計(jì)信息如表1所示。
表1 實(shí)驗(yàn)數(shù)據(jù)統(tǒng)計(jì)信息
1.對(duì)比模型
為了驗(yàn)證所提出的基于LSTM的成績(jī)預(yù)測(cè)模型的精確度優(yōu)于目前常用的成績(jī)預(yù)測(cè)模型,選取如下模型作為對(duì)照模型。
(1)多變量線性回歸(Multivariable Linear Regression,MLR)[15]:將先修課程的成績(jī)、學(xué)生的行為、評(píng)分等數(shù)據(jù)作為模型的自變量,目標(biāo)課程的成績(jī)作為因變量,利用最小二乘函數(shù)對(duì)自變量之間的關(guān)系進(jìn)行建模。
(2)矩陣分解(Matrix Factorization,MF)[16]:構(gòu)造學(xué)生-課程/評(píng)分/行為矩陣,將學(xué)生在對(duì)應(yīng)課程的成績(jī)、評(píng)分、行為作為矩陣元素。利用矩陣分解的方法得到學(xué)習(xí)者的特征向量,基于特征向量預(yù)測(cè)學(xué)生的成績(jī)。
(3)多層感知機(jī)(Multilayer Perceptron,MLP)[17]:不考慮學(xué)生歷史成績(jī)的時(shí)間特性,將歷史成績(jī)、學(xué)習(xí)情感與學(xué)習(xí)行為等數(shù)據(jù)作為輸入層向量,輸入層與隱藏層相連,輸出層得到結(jié)果的輸出,層與層之間全連接,利用梯度下降法更新各個(gè)層之間的權(quán)重和偏置。
2.評(píng)價(jià)指標(biāo)
為了對(duì)比各數(shù)據(jù)維度及模型的預(yù)測(cè)效果,采用評(píng)價(jià)方法中常用的平均絕對(duì)值誤差(Mean Absolute Error, MAE)和刻度精度(Percentage of Tick Accuracy, PTA)[18]作為模型的評(píng)估標(biāo)準(zhǔn)。
MAE的計(jì)算公式為
(15)
在學(xué)生成績(jī)管理系統(tǒng)中,將成績(jī)分為優(yōu)秀(90分以上)、良好(80~90分)、中等(70~80分)、及格(60~70分)、不及格(50~60分)和危險(xiǎn)(50分以下)六個(gè)等級(jí)。一個(gè)刻度代表兩個(gè)相鄰等級(jí)的誤差,例如,如果學(xué)生的真實(shí)成績(jī)?yōu)榱迹到y(tǒng)的預(yù)測(cè)成績(jī)也為良時(shí),此次預(yù)測(cè)為0刻度;而當(dāng)系統(tǒng)的預(yù)測(cè)成績(jī)?yōu)閮?yōu)時(shí),則此次預(yù)測(cè)存在一個(gè)刻度,以此類(lèi)推,如表2所示。PTA是通過(guò)計(jì)算預(yù)測(cè)成績(jī)與真實(shí)成績(jī)相差的刻度數(shù)進(jìn)行模型評(píng)估。首先需要將所預(yù)測(cè)的數(shù)值成績(jī)轉(zhuǎn)換為相應(yīng)的等級(jí),計(jì)算預(yù)測(cè)值與真實(shí)值的誤差,用刻度進(jìn)行衡量,然后計(jì)算每個(gè)刻度的占比。PTA0表示預(yù)測(cè)結(jié)果誤差為0刻度的比例,PTA1表示預(yù)測(cè)結(jié)果誤差為1刻度的比例。
表2 刻度誤差
對(duì)于這兩個(gè)評(píng)價(jià)指標(biāo),MAE的值越小,預(yù)測(cè)精度越高;PTA越大,預(yù)測(cè)精度越高。
3.實(shí)驗(yàn)方案設(shè)計(jì)
(1) 基于LSTM的學(xué)習(xí)成績(jī)預(yù)測(cè)
該實(shí)驗(yàn)主要是為了驗(yàn)證所提模型的有效性。本文設(shè)計(jì)了1個(gè)實(shí)驗(yàn)組和15個(gè)對(duì)照組,對(duì)照組除了要設(shè)計(jì)模型的對(duì)比,還要進(jìn)行數(shù)據(jù)維度的對(duì)比,以驗(yàn)證所提方法及數(shù)據(jù)維度是否具有優(yōu)越性。具體內(nèi)容與區(qū)別如表3所示。其中,HD表示歷史成績(jī)數(shù)據(jù),GD表示評(píng)分?jǐn)?shù)據(jù),ED表示學(xué)生行為數(shù)據(jù)。
表3 實(shí)驗(yàn)方案設(shè)計(jì)
其中,實(shí)驗(yàn)組按照基于LSTM的學(xué)習(xí)成績(jī)預(yù)測(cè)模型設(shè)計(jì)思路進(jìn)行。共設(shè)置了15組對(duì)照組,第1組到第3組主要是為了測(cè)試不同數(shù)據(jù)維度下LSTM模型的表現(xiàn)情況;第4組、第8組和第12組主要是為了驗(yàn)證在三維數(shù)據(jù)下LSTM模型的有效性;其余對(duì)照組為了測(cè)試在不同數(shù)據(jù)維度不同模型的表現(xiàn)情況,從而說(shuō)明基于LSTM的成績(jī)預(yù)測(cè)模型在數(shù)據(jù)維度和模型選擇上都是最優(yōu)。
為了避免實(shí)驗(yàn)的偶然性,選取了4個(gè)專(zhuān)業(yè)的數(shù)據(jù)分別進(jìn)行獨(dú)立實(shí)驗(yàn),具體數(shù)據(jù)見(jiàn)前文實(shí)驗(yàn)數(shù)據(jù)描述。
(2)成績(jī)影響因素判斷
① 個(gè)體分析
該實(shí)驗(yàn)的目的是為了對(duì)學(xué)生個(gè)體成績(jī)(主要對(duì)不及格的學(xué)生)的決定因素做出判斷,以促進(jìn)學(xué)生更高效地學(xué)習(xí)。
取出預(yù)測(cè)成績(jī)低于60分的學(xué)生,根據(jù)成績(jī)影響因素的計(jì)算方法計(jì)算各因子的影響權(quán)重,將影響權(quán)重進(jìn)行排序,取前5名的影響因子并將權(quán)重歸一化。
② 群體分析
該實(shí)驗(yàn)的目的是為了對(duì)學(xué)生群體成績(jī)的決定課程做出判斷,從而可以幫助教師調(diào)整課程結(jié)構(gòu)。
根據(jù)前文所述,將所有先修課程成績(jī)加0.1,輸入到訓(xùn)練好的模型中,得到預(yù)測(cè)課程的增加值;再對(duì)所有學(xué)生的成績(jī)?cè)黾又颠M(jìn)行加權(quán)平均,得到預(yù)測(cè)課程的最具影響力的5個(gè)先修課程。
4.實(shí)驗(yàn)參數(shù)設(shè)置
采用Grid Search方法來(lái)確定模型的參數(shù),從而找到準(zhǔn)確率最高的參數(shù)組合。表4是通過(guò)網(wǎng)格搜索法確定的最優(yōu)參數(shù)組合,采用Adam算法進(jìn)行模型訓(xùn)練[19]。
表4 實(shí)驗(yàn)參數(shù)設(shè)置
1.基于LSTM的學(xué)習(xí)成績(jī)預(yù)測(cè)
對(duì)1組實(shí)驗(yàn)組和15組對(duì)照組進(jìn)行實(shí)驗(yàn),由于每個(gè)專(zhuān)業(yè)包含多個(gè)待預(yù)測(cè)課程,各個(gè)專(zhuān)業(yè)的實(shí)驗(yàn)結(jié)果取本專(zhuān)業(yè)預(yù)測(cè)課程的平均值,實(shí)驗(yàn)結(jié)果的數(shù)據(jù)如表5所示。再計(jì)算各個(gè)專(zhuān)業(yè)實(shí)驗(yàn)結(jié)果的平均值,得到實(shí)驗(yàn)結(jié)果的圖形如圖3、圖4所示。圖4中,A圖表示在所有數(shù)據(jù)維度下不同模型的結(jié)果,B圖表示使用歷史成績(jī)數(shù)據(jù)和情感數(shù)據(jù)的結(jié)果,C圖表示使用歷史成績(jī)數(shù)據(jù)和學(xué)習(xí)行為數(shù)據(jù)的結(jié)果,D圖表示使用歷史成績(jī)數(shù)據(jù)的結(jié)果。
表5 實(shí)驗(yàn)結(jié)果展示
圖3表明,從MAE指標(biāo)來(lái)看,全數(shù)據(jù)模型中表現(xiàn)最差的是MF,四個(gè)專(zhuān)業(yè)預(yù)測(cè)結(jié)果的誤差均值為12.71,表現(xiàn)最好的是LSTM,誤差均值8.39,誤差減少了33.99%。實(shí)驗(yàn)組中預(yù)測(cè)效果最差的是CE專(zhuān)業(yè),誤差結(jié)果為9.63。除實(shí)驗(yàn)組之外,CE專(zhuān)業(yè)的預(yù)測(cè)中表現(xiàn)最好的為對(duì)照組12,誤差為10.89,使用LSTM模型誤差減少了11.57%。從PTA0和PTA1指標(biāo)來(lái)看,實(shí)驗(yàn)組的精度均值為0.645和0.895,對(duì)照組中表現(xiàn)最好的全數(shù)據(jù)模型是對(duì)照組12(使用MLP),精度均值為0.478和0.835,分別提高了34.94%和7.19%。
除此之外,LSTM模型在各個(gè)數(shù)據(jù)組合中都表現(xiàn)得最好,其次為MLP,這一結(jié)論證明了深度學(xué)習(xí)模型的有效性。具體而言,相較于MLP,LSTM模型在四組數(shù)據(jù)組合中誤差均值分別減少了15.15%、7.82%、13.66%、5.80%;PTA0提高了35.08%、13.94%、16.08%、14.05%;PTA1提高了7.19%、4.49%、21.81%、3.62%。原因在于,LSTM可以捕獲學(xué)生知識(shí)發(fā)展的動(dòng)態(tài)過(guò)程,MLP等傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)無(wú)法表征這一過(guò)程;同時(shí),LSTM還能建立知識(shí)間的長(zhǎng)期依賴(lài)關(guān)系,如幾個(gè)學(xué)期前的先修課程可能會(huì)對(duì)預(yù)測(cè)的課程產(chǎn)生重大的影響。
圖4表明,基于歷史成績(jī)數(shù)據(jù)、情感數(shù)據(jù)和行為數(shù)據(jù)的全數(shù)據(jù)模型在MAE、PTA0、PTA1等3個(gè)指標(biāo)上都優(yōu)于其他三組數(shù)據(jù)模型(歷史成績(jī)數(shù)據(jù)和情感數(shù)據(jù)、歷史成績(jī)數(shù)據(jù)和行為數(shù)據(jù)、歷史成績(jī)數(shù)據(jù)),證明了所提數(shù)據(jù)維度的可行性。從LSTM模型的實(shí)驗(yàn)結(jié)果來(lái)看,相較于對(duì)照組中表現(xiàn)最好的其余三組數(shù)據(jù)模型(對(duì)照組1),實(shí)驗(yàn)組的MAE減少了15.60%,PTA0、PTA1提高了37.23%和9.82%;相較于對(duì)照組中表現(xiàn)最差的其余三組數(shù)據(jù)模型(對(duì)照組3),實(shí)驗(yàn)組的MAE減少了38.13%,PTA0、PTA1提高了86.96%和56.33%。
綜上可以發(fā)現(xiàn),實(shí)驗(yàn)組的預(yù)測(cè)效果在整體上明顯優(yōu)于其他15個(gè)對(duì)照組,證明了基于歷史成績(jī)數(shù)據(jù)、情感數(shù)據(jù)和行為數(shù)據(jù)的LSTM模型的有效性。
2.成績(jī)影響因素判斷
(1)個(gè)體分析
從材料科學(xué)與工程(MS)、計(jì)算機(jī)科學(xué)與技術(shù)(CS)、土木工程(CE)、信息工程(IE)專(zhuān)業(yè)中各選出一名成績(jī)被預(yù)測(cè)60分以下的學(xué)生,計(jì)算成績(jī)影響因子的權(quán)重大小,計(jì)算后的結(jié)果如圖5所示。
其中,橫軸表示影響力數(shù)值,左邊的縱軸表示最有影響力的5個(gè)因素,右邊的縱軸表示該因素的模型的輸入值(先修課程的成績(jī)、情感值、行為值)。
圖A中,預(yù)測(cè)的課程是材料工程基礎(chǔ),該學(xué)生的真實(shí)成績(jī)?yōu)?8,預(yù)測(cè)成績(jī)?yōu)?6;將各影響因素的輸入值提高到最高值,并代入預(yù)測(cè)的模型,比較預(yù)測(cè)值提高的程度,進(jìn)而得到最具影響力的五個(gè)因素。對(duì)于該學(xué)生來(lái)說(shuō),物理化學(xué)課程的成績(jī)對(duì)預(yù)測(cè)課程的影響最大,其次是情感、回答問(wèn)題次數(shù)、分析化學(xué)、高等數(shù)學(xué)上;物理化學(xué)、分析化學(xué)、高等數(shù)學(xué)上都為先修課程。從圖中可以看到,物理化學(xué)的課程成績(jī)最低,其次是分析化學(xué),但是這并不表明先修課程的成績(jī)?cè)降停瑢?duì)預(yù)測(cè)課程的影響力越高。如圖D所示,電路分析基礎(chǔ)下的分?jǐn)?shù)為72,大學(xué)物理上的分?jǐn)?shù)為63,電路分析基礎(chǔ)下的影響力高于大學(xué)物理的影響力。B圖中,預(yù)測(cè)的課程是編程類(lèi)的課程,最具影響力的因素也是一個(gè)編程類(lèi)的課程,由于該課程的成績(jī)極低(只有35分),影響也最大。
從上述圖中還能發(fā)現(xiàn),不太積極的情感往往會(huì)對(duì)課程產(chǎn)生較大的影響,如圖A~圖C;而同一情感值對(duì)不同課程的影響程度也不一樣(如圖B和圖C)。同時(shí),課程成績(jī)表現(xiàn)較差的學(xué)生幾乎不在課堂上回答問(wèn)題,這也會(huì)對(duì)課程成績(jī)有較大的影響(如圖A和圖B)。
(2)群體分析
從各專(zhuān)業(yè)中選出一個(gè)預(yù)測(cè)課程,根據(jù)前文描述,計(jì)算各先修課程的影響力,結(jié)果如表6所示。
表6 最有影響力的課程
表6中,加黑的課程為培養(yǎng)計(jì)劃中預(yù)測(cè)課程的先決條件??梢钥闯觯瑢?duì)于以上課程,它們的先決條件是最有影響力的五門(mén)課程之一,這表明所提出的成績(jī)影響因素識(shí)別方法能夠識(shí)別最有影響力的先修課程。除了課程的先決條件,還有一部分課程會(huì)對(duì)目標(biāo)課程產(chǎn)生較大的影響,通過(guò)該方法計(jì)算出與目標(biāo)課程相關(guān)的先修課程,可以幫助教師調(diào)整課程結(jié)構(gòu),有效提高學(xué)生成績(jī)。
五、結(jié)束語(yǔ)
學(xué)習(xí)成績(jī)是學(xué)習(xí)效果的直接體現(xiàn)。通過(guò)對(duì)學(xué)習(xí)成績(jī)進(jìn)行預(yù)測(cè),為教師的課前教學(xué)活動(dòng)設(shè)計(jì)、課中教學(xué)活動(dòng)的及時(shí)調(diào)整提供參考依據(jù)。各高校通過(guò)網(wǎng)絡(luò)教學(xué)平臺(tái)能夠更直觀、更廣泛地即時(shí)獲取每個(gè)學(xué)生的各項(xiàng)學(xué)習(xí)數(shù)據(jù)(情感,行為,知識(shí)結(jié)構(gòu)等)。對(duì)學(xué)習(xí)數(shù)據(jù)所具有的豐富內(nèi)涵進(jìn)行不同維度的挖掘,能為教師的教學(xué)模式、教學(xué)方法以及教學(xué)活動(dòng)的設(shè)計(jì)提供有力的支撐,從而有效地提升教學(xué)效果。
針對(duì)學(xué)習(xí)過(guò)程的復(fù)雜性和學(xué)生知識(shí)發(fā)展的時(shí)間動(dòng)態(tài)特征,提出了基于LSTM的學(xué)習(xí)成績(jī)預(yù)測(cè)模型。首先基于學(xué)生歷史成績(jī)數(shù)據(jù),利用LSTM對(duì)學(xué)生知識(shí)結(jié)構(gòu)狀態(tài)進(jìn)行建模;然后與情感信息、行為信息融合,進(jìn)行學(xué)習(xí)成績(jī)預(yù)測(cè)。通過(guò)與不同的數(shù)據(jù)維度和方法對(duì)比,該方法具有較好的預(yù)測(cè)結(jié)果。針對(duì)神經(jīng)網(wǎng)絡(luò)的黑箱效應(yīng),還提出了成績(jī)主要影響因素的識(shí)別方法,從而能更好地指導(dǎo)學(xué)生學(xué)習(xí)及教師教學(xué)。
該研究在以下方面的還有一定的提升空間:(1)探索在線教育的學(xué)業(yè)預(yù)警研究。本文的研究對(duì)象是傳統(tǒng)高校課程,還可將所提出的方法應(yīng)用于在線教育領(lǐng)域,以探索目前在線課程完成率低的影響力因素。(2)所提取的學(xué)生情感指標(biāo)主要基于學(xué)生評(píng)分,并且只從積極-消極兩個(gè)方面進(jìn)行情感衡量;而學(xué)生情感是豐富的,還應(yīng)結(jié)合社交媒體等數(shù)據(jù)進(jìn)行情感分析,探索學(xué)生情感與學(xué)習(xí)成績(jī)之間的關(guān)系。
北京郵電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2020年6期